Datenklau im Zusammenhang Spotify: Füttern die Robin Hoods dieser Musik am Ende die KI?

Aktivisten der Plattform „Anna’s Archive“ geben an, 86 Millionen Songs von Spotify heruntergeladen zu haben. Sie wollen ein „Archiv zur Bewahrung von Musik“ schaffen. Doch am Ende könnten vor allem KI-Firmen profitieren


Eine Gruppe namens Anna’s Archive behauptet, 86 Millionen Musikdateien von Spotify heruntergeladen zu haben

Grafik: der Freitag


Eine Gruppe namens Anna’s Archive behauptet, 86 Millionen Musikdateien von Spotify und 256 Millionen Zeilen Metadaten wie Künstler- und Albumnamen heruntergeladen zu haben. Spotify, das mehr als 100 Millionen Titel hostet, bestätigte, dass das Datenleck nicht seinen gesamten Bestand umfasst. Das in Stockholm ansässige Unternehmen, das weltweit mehr als 700 Millionen Nutzer hat, erklärte, es habe „die böswilligen Benutzerkonten, die sich an dem unrechtmäßigen Download beteiligt haben, identifiziert und deaktiviert“.

„Eine Untersuchung des unbefugten Zugriffs ergab, dass Dritte öffentliche Metadaten heruntergeladen und illegale Taktiken angewendet haben, um den DRM-Schutz (Digital Rights Management) zu umgehen und auf einige der Audiodateien der Plattform zuzugreifen“, erklärte Spotify. Das Unternehmen gehe bisher nicht davon aus, dass die von Anna’s Archive entwendete Musik bereits veröffentlicht wurde.

Anna’s Archive, das dafür bekannt ist, Links zu raubkopierten Büchern bereitzustellen, erklärte in einem Blogbeitrag, es wolle ein „Archiv zur Bewahrung von Musik“ schaffen. Die Gruppe behauptete, die Audiodateien machten 99,6 Prozent aller von Spotify-Nutzern gehörten Musikstücke aus und würden über „Torrents“ geteilt, eine Methode zum Austausch großer digitaler Dateien im Internet. „Natürlich hat Spotify nicht die gesamte Musik der Welt, aber es ist ein guter Anfang“, erklärte Anna’s Archive, das seine Mission als „Bewahrung des Wissens und der Kultur der Menschheit“ beschreibt. „Mit eurer Hilfe wird das musikalische Erbe der Menschheit für immer vor Zerstörung durch Naturkatastrophen, Kriege, Budgetkürzungen und andere Katastrophen geschützt sein“, so die Gruppe.

Spotify: Trainiert bald Zuckerberg mit den Daten?

Ed Newton-Rex, Komponist und Aktivist für den Schutz der Urheberrechte von Künstlern, sagte, die durchgesickerten Musikdateien würden wahrscheinlich für die Entwicklung von KI-Modellen verwendet werden. „Das Training mit raubkopiertem Material ist in der KI-Branche leider weit verbreitet, daher ist es fast sicher, dass diese gestohlenen Musikdateien letztendlich für das Training von KI-Modellen verwendet werden. Deshalb müssen Regierungen darauf bestehen, dass KI-Unternehmen die von ihnen verwendeten Trainingsdaten offenlegen“, sagte er.

Die Website „Anna’s Archive“ funktioniert ähnlich wie LibGen, ein riesiges Online-Archiv mit raubkopierten Büchern, das mutmaßlich von Mark Zuckerbergs Meta zum Training seiner KI-Modelle verwendet wurde. Laut einer US-Gerichtsakte genehmigte Zuckerberg, Gründer und Geschäftsführer von Meta, die Verwendung des LibGen-Datensatzes, obwohl das KI-Führungsteam des Unternehmens davor gewarnt hatte, dass es sich um einen Datensatz handele, „von dem wir wissen, dass er raubkopiert ist“. Meta verteidigte sich erfolgreich gegen eine Klage wegen Urheberrechtsverletzung durch Autoren, aber die Kläger versuchen derzeit, ihre Forderung zu modifizieren.

Der Mitbegründer eines KI-Startups schrieb auf LinkedIn, dass die Öffentlichkeit theoretisch „ihre eigene persönliche kostenlose Version von Spotify erstellen“ könnte. Yoav Zimmerman, Mitbegründer der Rechte-Verwertungsfirma Third Chair, sagte, dass dies auch Technologieunternehmen ermöglichen könnte, „in großem Umfang mit moderner Musik zu trainieren“. Er fügte hinzu: „Das Einzige, was sie daran hindert, sind das Urheberrecht und die abschreckende Wirkung der Strafverfolgung.“

KI und Urheberrecht: Die Bedenken sind groß

Spotify erklärte, dass es seit der Mitteilung von Anna’s Archive neue Sicherheitsvorkehrungen „für diese Art von Angriffen gegen das Urheberrecht“ getroffen habe und „aktiv auf verdächtiges Verhalten achte“.

Das Urheberrecht ist zu einem Streitpunkt zwischen Künstlern, Autoren und Kulturschaffenden auf der einen Seite und KI-Unternehmen auf der anderen Seite geworden. KI-Tools wie Chatbots und Musikgeneratoren werden mit riesigen Datenmengen aus dem offenen Internet trainiert, darunter auch urheberrechtlich geschützte Werke.

In Großbritannien haben Kulturschaffende gegen einen Vorschlag der Regierung protestiert, der es KI-Unternehmen erlauben würde, urheberrechtlich geschützte Werke ohne Genehmigung zu verwenden, sofern der Urheberrechtsinhaber nicht ausdrücklich erklärt, dass er nicht möchte, dass seine Daten verwendet werden. Fast alle Befragten einer Regierungskonsultation zu diesem Vorschlag haben die Bedenken der Künstler geteilt.

Liz Kendall, Staatssekretärin für Wissenschaft, Innovation und Technologie, erklärte diesen Monat vor dem Parlament, es gebe „keinen klaren Konsens“ zu diesem Thema und fügte hinzu, die Minister würden „sich die Zeit nehmen, um eine richtige Lösung zu finden“. Die Regierung hat zugesagt, bis zum 18. März nächsten Jahres politische Vorschläge zu KI und Urheberrecht vorzulegen.

AktivistenAnnaArchiveAutorenDie ZeitDigitalEdEndeEntwicklungFirmenFreitagGrafikGroßbritannienInternetKatastrophenKIKriegeKulturLinkedInMarkMetaMusikNaturkatastrophenParlamentRegierungRobinSSpotifyStockholmUnternehmenUrheberrechtUSVerhaltenWELTWissenWissenschaftZeitZuckerberg
Comments (0)
Add Comment