Das Netz ist nicht genug: Der KI in Betracht kommen die Daten aus
Man darf nicht vergessen, dass sich die gesamte KI-Revolution noch immer jede Sekunde in Luft auflösen könnte. Puff! Das war’s! Denn es gibt eine Schwachstelle in jener KI-Entwicklung, zusammensetzen Engpass, jener womöglich zu schmal ist pro die großen Träume jener Risikokapitalisten und Tech-Barone: Es gibt vielleicht schlicht nicht genügend brauchbare Daten gen jener Welt.
„Brauchbar“ kann hier zweierlei bedeuten. Zunächst kann es „zu gebrauchen pro Tech-Unternehmen“ heißen. Copyright ist noch immer eine ernste Bedrohung pro die Konzerne. Sie nach sich ziehen dasjenige Netz leergesaugt, Bücher, Videos, Kunst, Podcasts in ihre Large Language Modelle (LLM) gestopft, damit es lernt, irgendetwas bedingt Menschliches nachzuahmen. Doch viele dieser Dinge in Besitz sein von Menschen, sie nach sich ziehen Rechte daran. Einige von ihnen trauern derzeit, und sollte ein Gericht entscheiden, dass Tech-Unternehmen nicht problemlos die Arbeit von Autor:medial oder Künstler:medial stehlen die Erlaubnis haben, dann war’s dasjenige. LLM-KI ist derzeit sowieso noch Verlustgeschäft und wenn die Unternehmen unter ferner liefen noch die Urheber pro ihre Werke erstatten zu tun sein, dann bricht dasjenige Kartenhaus unwiderruflich zusammen. Die Daten sind zwar da, im Kontrast dazu außer Reichweite – eine Tantalosqual.
Doch die zweite Bedeutung pro „zu gebrauchen“ ist noch interessanter, weil grundlegender. Denn derzeit ist zögernd, ob es genug Daten gibt, die gar „zu gebrauchen pro KI-Modelle“(!) sind, vor Urheberrecht unter ferner liefen nur ins Spiel kommt. Dass Tech-Unternehmen dasjenige „Netz leergesaugt“ nach sich ziehen, ist keine Floskel: Sie nach sich ziehen dasjenige gesamte Internet geplündert, jede verwendbare Zeile Text aufgebraucht, um die neueste Generation jener KI-Modelle zu erzeugen. Und schon dasjenige war nicht genug!
Pro GPT-4, die aktuellste Version von OpenAIs KI, musste dasjenige Unternehmen zusätzlich noch oben eine Million Stunden YouTube-Videos in Texte transkribieren, um den Datenhunger des Systems zu stillen. Und dasjenige in vollem Bewusstsein, dass dasjenige gegen YouTubes Regeln verstößt, wie eine großartige Recherche jener New York Times herausfand. Klagen kann YouTube-Besitzer Google sehr wohl nicht, weil sie exakt gleichartig getan nach sich ziehen, um ihre Modelle zu trainieren, welches zugleich unter ferner liefen problemlos ziemlich lustig ist. Facebooks Mutterkonzern Meta spielte unter ferner liefen temporär mit dem Gedanken, problemlos Simon & Schuster zu kaufen, zusammensetzen jener größten Verleger jener USA, um legal an die dort verlegten Bücher zu kommen. Am Ende beschloss man jedoch, dass dasjenige zu aufwendig sei und man möglichst Urheberrecht ignorieren solle, so wie die anderen Tech-Giganten unter ferner liefen. Gesetze sind ungefähr welches pro Normalsterbliche.
Bis zum Kollaps jener Künstlichen Intelligenz
Es ist extrem schwergewichtig zu sagen, wie viele Daten künftige KI-Modelle benötigen. Fest steht zurückgezogen, dass es ein Vielfaches jener derzeitigen Generation sein wird. Und Stand jetzt gibt es zu diesem Zweck schlicht nicht genug Text gen jener Welt. Denn um menschliche Arbeit und Kunst imitieren zu können, nötig haben sie dasjenige Original, sie nötig haben uns. Tech-Unternehmen staubsaugen unsrige Kreativität aus dem Netz ab, um sie uns dann zurückzuverkaufen im 20-Euro-Monatsabo.
Sie wünschen nun, dass sie den Daten-Engpass fertigmachen könnten, während sie die nächste KI-Generation mit KI-generierten Daten trainieren. Studien nach sich ziehen gezeigt, dass solch eine Kreislaufwirtschaft dieselben Probleme aufweist wie jede andere inzestuöse Beziehung: Mit jeder weiteren Generation treten immer größere Defekte gen, solange bis es letztendlich zum Model Collapse kommt und sie vollwertig unbrauchbar werden. Der Technologie-Kritiker Jathan Sadowski beschrieb dasjenige Ganze treffend wie „Habsburg KI“, nachdem dem Königshaus Habsburg, dasjenige so nachhaltig untereinander heiratete, solange bis größere Teile jener Familie vollwertig verformt waren.
Das Deprimierende an diesem Vergleich ist jedoch, dass die Habsburger trotz eines quasi kreisförmigen Stammbaums nachhaltig oben große Teile von Europa herrschten. Dass KI womöglich gen Dauer zu schierer Mittelmäßigkeit verdammt ist, bedeutet damit nicht, dass sie nicht ungeachtet eine Gefahr darstellt oder Bosse aufhören, mit baldiger Vollautomatisierung zu drohen. Hier bleibt wahrscheinlich trotzdem was auch immer beim Alten.
Maschinentext
Titus Blome beschäftigt sich in seiner Kolumne Maschinentext mit neuen Technologien.