GPT-4o, Gemini und Co: Was die Künstliche Intelligenz inzwischen kann

Die Software verführt den Mann im Film mit ihren menschenähnlichen Qualitäten; sie flirtet und führt tiefsinnige Gespräche mit ihm; er gesteht ihr, er habe noch nie jemanden so sehr geliebt wie sie. Die Geschichte hat kein Happy-End. Samantha verlässt den Mann, und er bleibt mit gebrochenem Herzen zurück. Altman hat den Film „prophetisch“ genannt. Und mit dem neuen KI-Modell GPT-4o, das fortan im Chatbot ChatGPT zum Einsatz kommt, hat er die Vision von „Her“ nur etwas mehr als ein Jahrzehnt später ein großes Stück näher an die Wirklichkeit gebracht.

Denn bei diesem System fällt nicht an erster Stelle auf, welche Aufgaben es erledigen kann, sondern wie es über seine Sprechfunktion mit seinen Nutzern kommuniziert. Ob nun beim Übersetzen von Texten in andere Sprachen, bei der Nachhilfe in Mathematik oder beim Erzählen von Gute-Nacht-Geschichten: Die Produktdemonstrationen ähnelten natürlichen Unterhaltungen, und die Frauenstimme ließ an Samantha aus „Her“ denken – sogar die Schauspielerin selbst.

Die Stimme sprach, als ob sie emotionale Intelligenz hätte. Mal flirtete sie, mal sprach sie mit Sarkasmus. Sie war mal lauter und mal leiser, räusperte sich und verwendete Füllwörter wie „Mmh“. Ähnlich wie in einem gewöhnlichen Gespräch unter Menschen konnte man sie auch unterbrechen. Es ist ein dramatischer Unterschied zu roboterhaften und oft auch nicht allzu hilfreichen Sprachassistenten wie Siri von Apple oder Alexa von Amazon. Altman sagte über GPT-4o: „Mich überrascht es immer noch ein bisschen, dass es real ist.“

Zuverlässigkeit und mögliche Schattenseiten von KI

Das gegenwärtige KI-Wettrüsten in der Technologiebranche hat in den vergangenen Wochen eine neue Dimension erreicht. Open AI und Google, zwei der wichtigsten Unternehmen auf dem Gebiet, haben sich einen Showdown mit Produktneuheiten geliefert, und beide vermittelten die Botschaft, KI mit Macht im alltäglichen Leben etablieren zu wollen. Open AI tat das zu Wochenbeginn mit seinem menschenähnlicher gewordenen Chatbot, Google nur einen Tag danach mit einer auf KI ausgerichteten Weiterentwicklung seiner Suchmaschine. Der Konzern will künftig bei vielen Anfragen eine direkte Antwort in den Vordergrund rücken, die von seiner KI-Technologie geliefert wird, die traditionellen Links zu anderen Internetseiten rutschen nach unten.

Noch gibt es zwar viele Pannen. Dennoch bekommt das Herzstück von Googles Geschäft, das für viele Menschen die erste Anlaufstelle im Internet ist, eine neue Gestalt. Das Unternehmen führte auch KI-Assistenzprogramme vor, an denen es arbeitet. Sie wirkten zwar in der Unterhaltung mit Nutzern um einiges maschineller als das neue Modell von Open AI. Vorstandschef Sundar Pichai sagte aber, manche Menschen würden künftig eine emotionale Verbindung zu solchen Diensten aufbauen.

Die Ankündigungen von Open AI und Google haben ein besonderes Gewicht. Aber im Windschatten dieser Branchengiganten zeigen auch immer mehr andere Unternehmen den Weg in eine neue KI-Welt auf, die tiefgreifende Veränderungen in den Alltag bringt. Wir stellen hier einige Beispiele vor. Fragen nach der Zuverlässigkeit und möglichen Schattenseiten dieser Technologien stellen sich damit umso dringlicher. Und für manche Menschen dürfte es eine beunruhigende Vorstellung sein, wenn der KI-Vorreiter Open AI die Zukunft, wie sie in „Her“ beschrieben wird, als Inspiration für seine Arbeit empfindet.

KI-Gefährten: Freundschaft, Rat und Liebe

KI-Systeme können mehr sein als neutrale Informationslieferanten. Viele Dienste ermöglichen es, Chatbots Persönlichkeiten zu geben und sie dann für soziale Zwecke zu nutzen, ob als virtuelle Freunde, Ratgeber oder auch romantische Partner. Replika zum Beispiel bietet seinen Nutzern einen „KI-Gefährten, der sich kümmert“, Candy.ai verspricht eine „interaktive erotische Erfahrung“ mit einer KI-Freundin, die „jede Fantasie“ erfüllen kann.

Auf Character.ai tummeln sich diverse KI-Figuren. Besonders beliebt ist ein Chatbot mit dem Namen „Psychologist“, der vorgibt, bei „Schwierigkeiten im Leben“ zu helfen. Die Onlinepublikation „The Verge“ schrieb, dass viele Teenager die Plattform nutzten, etwa als Mittel gegen Einsamkeit, oder um KI-Charakteren Dinge zu erzählen, die sie echten Freunden vorenthalten. Solche Angebote sind freilich nicht unumstritten. Ratschläge von KI-Systemen können fragwürdig oder gar gefährlich sein, nicht umsonst weist Character.ai ausdrücklich darauf hin, dass alles, was seine Figuren sagten, „erfunden“ sei.

Es gibt die Sorge, dass solche Dienste süchtig machen und Nutzer verführen, noch mehr Zeit in der virtuellen statt der realen Welt zu verbringen. Eine unlängst veröffentlichte Studie an der kalifornischen Stanford-Universität unter jungen Nut­zern von Replika legte aber auch den Schluss nahe, dass virtuelle Gefährten gerade bei Personen, die sich einsam fühlen, einen positiven Effekt haben könnten. Einige der Befragten gaben sogar an, der KI-Dienst habe gegen Selbstmordgedanken geholfen. In jedem Fall scheint der Markt für KI-Gefährten jeder Art zu wachsen, und er ist offenbar auch lukrativ – gerade wenn es Angebote romantischer Natur geht. In einem Bericht der „New York Post“ war kürzlich von einem Mann die Rede, der 10.000 Dollar im Monat für KI-Freundinnen ausgibt.

Musik: Songs auf Knopfdruck

KI-generierte Stimmen sind längst auch in der Musikwelt angekommen. Der Song „Heart On My Sleeve“ gelangte im April vergangenen Jahres so zu zweifelhafter Berühmtheit, da sein Urheber ihn mit den KI-generierten Stimmen von Drake und The Weeknd singen ließ – ohne deren Genehmigung. Breit anwendbare Tools, auf denen Stars ihre Stimmen zur Verfügung stellen, gibt es bislang noch nicht. Youtube testet derzeit aber die Anwendung „Dream Track“, mit der Nutzer Songschnipsel mit Stimmen von ausgewählten Künstlern erstellen können. Nicht nur die Vergütung, auch die Kon­trolle über die Texte, die eine KI-Stimme vertont, sind freilich komplexe Themen.

Unabhängig von Stimmen versprechen diverse Tools Hilfe in der Musikproduktion. Für Aufsehen sorgen derweil gerade Suno AI und Udio. Beide Tools generieren auf Befehl komplette Songs – in teils erstaunlich guter Qualität. Nutzer müssen lediglich Thema des Textes und Genre angeben, gegebenenfalls verfeinert mit der gewünschten Emotion oder Stimmfarbe.

Die Musikindustrie zeigt sich generell offen für KI und die sich aus der Anwendung ergebenden Möglichkeiten etwa in Hinblick auf neue Produkte. Die Branche pocht jedoch auf klare Regeln und Grenzen. Allen voran dürften KI-Modelle nicht ohne Zustimmung und in der Folge Vergütung von Rechteinhabern mit Musikstücken trainiert werden.

Sony Music unterstrich dies kürzlich in einem Brief an mehr als 700 Unternehmen und verlangte zudem, offenzulegen, ob und wenn ja welches geschützte Material schon genutzt worden sei. Weder Suno AI noch Udio haben bislang öffentlich gemacht, wie ihre Modelle trainiert wurden. Und während sich Drake seinerseits mit der Verwendung der Stimme des verstorbenen Rappers Tupac Ärger einhandelte, dürften KI-Klänge gerade im Bereich der Produktionsmusik fürs Fernsehen oder auch soziale Medien perspektivisch vermehrt genutzt werden.

Kundendienst: Fast perfekt am Telefon

Jeder kennt sie, jeden nervt sie: die Computerstimme im Callcenter, die auch im siebten Versuch mal wieder nicht versteht, welche Störung jetzt genau vorliegt. Das könnte dank der besser werdenden Sprachfähigkeiten Künst­licher Intelligenz bald Geschichte sein. Denn die neuartigen KI-Agenten sind nicht nur in der Lage, wie ein klassischer Sprachbot vorgegebenen Mustern zu folgen. Sie können auch persönlich auf Kunden eingehen.

In Nordamerika führte der Autozulieferer Bosch zum Beispiel zusammen mit dem deutschen KI-Start-up Aleph Alpha bei einem Autohersteller einen KI-basierten Sprachbot ein. Dieser soll Pannenservice-Anrufe entgegennehmen. Die KI erfasst auch Dialekte, Akzente und Stimmungen. Damit hatten frühere Spracherkennungssysteme oft Probleme. 40 Prozent der Anrufe kann die Maschine automatisiert bearbeiten. Bei komplexeren Anfragen übergibt sie noch an einen Menschen.

Das Berliner Start-up Parloa hat sich sogar auf KI für Callcenter spezialisiert, hat dafür zuletzt 66 Millionen Euro von Investoren eingesammelt und ist in die Vereinigten Staaten expandiert. Open AI setzte der Automatisierung im Kundenservice aber die Krone auf. Ein Mitarbeiter instruiert ChatGPT in einem Video per Sprachbefehl, dass er gleich seinen Mobilfunkanbieter anrufen werde und ChatGPT diesem doch bitte mitteilen möge, dass das zugeschickte iPhone defekt sei und sie ihm ein neues zusenden sollen. Daneben liegt ein anderes Smartphone mit ChatGPT, das den Kundenservice simuliert. Die beiden Chatbots führen daraufhin ein Gespräch untereinander und klären das Problem – von KI zu KI.

Sollte diese Fähigkeit je Marktreife erlangen, dann müssten Menschen sich jedenfalls nicht mehr selbst mit etwaigen mäßig funktionierenden Roboterstimmen herumschlagen – sondern mit einer KI.

Übersetzung: Fremdsprachen ohne Lernen

Eine Fremdsprache sprechen, ohne dafür lernen zu müssen? Die Künstliche Intelligenz macht es möglich – zumindest mit etwas Zeitverzögerung. Im vergangenen Jahr erregte das amerikanische Start-up Hey Gen im Netz Aufsehen. Nutzer laden in der Anwendung des Unternehmens einfach ein Video hoch, in dem sie in ihrer Muttersprache reden. Dann wählen sie die Sprache aus, in die die Software das Video übersetzen soll. Die Ergebnisse sind verblüffend gut.

Die KI passt auch die Lippenbewegungen der Sprecher an die neue Sprache an, sodass auf den ersten Blick nicht auffällt, dass eine Künstliche Intelligenz am Werk war. Die Anwendung kann inzwischen in mehr als 40 Sprachen übersetzen. Schnell fluteten Videos von Nutzern das Internet, die Hey Gen ausprobierten. Womöglich könnte derartige Technik künftig die Arbeit von Übersetzungsstudios und Synchronsprechern übernehmen. Allerdings funktioniert die Übersetzung bei Hey Gen bislang noch nicht in Echtzeit.

Der Internetkonzern Google stellte im vergangenen Jahr mit dem „Universal Translator“ ein Programm vor, das lippensynchron live übersetzen kann. Solche Anwendungen bergen allerdings die Gefahr von politisch oder kriminell motivierten Fälschungen. Stattdessen können Urlauber künftig wohl auf den Sprachassistenten von ChatGPT setzen. Dank den neuen Fähigkeiten des KI-Modells GPT-4o kann ChatGPT jetzt den Dolmetscher spielen, wie Open AI zuletzt demonstrierte.

Ein Mitarbeiter fragte die KI-Stimme, ob sie seine Äußerungen von Englisch auf Italienisch übersetzen könne und die Äußerungen seiner Gesprächspartnerin von Italienisch auf Deutsch. Das klappte einwandfrei. Wer es lieber klassisch mag, kann auf die Text-zu-Text-Übersetzungen des Kölner Start-ups Deep L zurückgreifen, die sich dank KI in den vergangenen Jahren ebenfalls deutlich verbessert haben und inzwischen mit zwei Milliarden Dollar bewertet wird.

Fan-Fiction: Alte Literatur in neuen Stories

Was ist eigentlich aus Familie Hagenström geworden, jener aufsteigenden Familie, die die Buddenbrooks in Thomas Manns gleichnamigen Werk wirtschaftlich und sozial verdrängte? Wo baute sich der Wallstreet-Broker Sherman McCoy aus Tom Wolfs Roman „Fegefeuer der Eitelkeiten“ sein neues Leben auf? Wird der geläuterte Geldverleiher Ebenezer Scrooge aus Charles Dickens „Weihnachts-Geschichte“ sein Vermögen auf Tiny Tim Cratchit überschreiben, und was macht der Sohn seines jahrelang gemobbten und gedemütigten Angestellten mit dem vielen Geld?

Charaktere, die von ihren Autoren einst lediglich als Nebenfiguren angelegt worden waren, erhalten seit einigen Jahren schon neue Bühnen – Dank sogenannter Fan-Fiction. Dabei fantasieren faszinierte Leser die Lebenswege ihrer Lieblingsfiguren einfach weiter. Von literarischen Klassikern bis hin zu Star Wars und japanischen Animes. Die Geschichten des Meisterdetektivs Sherlock Holmes waren schon nach dem Tod seines Erschaffers Arthur Conan Doyles 1930 von seinen Lesern weitergeschrieben worden. Bis heute haben Fans von Harry Potter mit dem Segen seiner Erschafferin J.K. Rowling nicht weniger als 800.000 eigenständige Geschichten zu den Figuren und Nebenfiguren an der Seite des Zauberlehrlings geschrieben.

Dieser Trend wird seit Monaten von KI-Sprachmodellen weiter befeuert. So gibt es neben KI-erstellter Literatur aus der Feder künstlicher Systeme wie Squibler AI oder Sudowrite auch Fan-Fiction-Tools wie AI Fanfic Generator oder Holo AI. Nahm der Dramatiker Tom Stoppard vor einem halben Jahrhundert noch Shakespeares „Hamlet“, erhob die Nebenfiguren Rosenkranz und Güldenstern zu seinen Hauptakteuren und gab ihnen kurz vor ihrer Ermordung noch mal einen ganz großen Auftritt, so entschied sich die KI für eine völlig überraschende Wendung der Geschichte von „Ros und Guild“.

AltmanAmazonAngeboteAppleArbeitAutomatisierungAutozuliefererBoschCharlesChatGPTDollarEuroFälschungenFansFernsehenFilmFreundschaftGeldGeschichteGoogleHarryIntelligenzInternetiPhoneJKKIKünstliche IntelligenzLlebenLernenLiteraturMANMannMathematikMedienMusikNaturPersonenPostRomaneSelbstSoftwareSoziale MedienSpracheSprachenStar WarsStart-upsTechnikThomasTimTodTomÜbersetzungenUnterhaltungUnternehmenVermögenVideoWELTZeit