„Das Format der Zukunft”, sagt Mikey Shulman, „ist nicht Musik, die man einfach spielt, sondern mit der man spielt.“ Als CEO und Mitgründer des KI-Musik-Generators Suno befindet sich Shulman derzeit in der aufregenden, wenn auch vielleicht nicht beneidenswerten Lage: Wird er doch gleichzeitig als Architekt der Zukunft der Musik und als ihr Totengräber angesehen.
Suno wurde vor etwas mehr als zwei Jahren gegründet und ermöglicht es Nutzern, mit nur wenigen Textvorgaben ganze Songs oder Musikstücke zu erstellen. Derzeit lässt sich noch kein Popstar-Namen als Prompt eingeben. Aber wenn man nach „stadiontauglichem, emotionalem Pop-Country“ fragt, der „auf vergangene Beziehungen“ oder „öffentliche Rivalitäten“ Bezug nimmt, erhält man möglicherweise einen Song im Stil von Taylor Swift.
Im Juni 2024 verkündete der Musikindustrie-Verband RIAA , dass die großen US-amerikanischen Plattenfirmen Sony, Universal und Warner gegen Suno klagen. Im darauffolgenden Januar reichte auch die deutsche Verwertungsgesellschaft GEMA, die Songwriter vertritt, eine eigene Klage ein. Der Vorwurf war jeweils, dass Suno seine Systeme ohne Genehmigung oder Lizenz mit Hilfe von Musik geschult habe, deren Urheberrecht bei ihnen liege.
Zwischen Utopie und Dystopie
Generative-KI-Musikdienste haben eine existenzielle Krise in der Musikindustrie ausgelöst. Die utopische Interpretation lautet, dass sie die Kreativität demokratisieren werden. Die dystopische ist, dass die Kunst von KI-Slop erstickt wird, während Menschen, die Musik machen, überflüssig werden. Schließlich haben viele Musiker:innen schon jetzt Probleme, von ihren Streaming-Einnahmen zu leben.
Das Musikformat der Zukunft wird interaktiv sein. Es sollte sozial sein, man macht es gemeinsam mit Anderen. Wir arbeiten daran, dafür die beste digitale Version zu entwickeln
Dave Stewart von der Gruppe Eurythmics bezeichnete die KI-Musikgeneratoren als „unaufhaltsame Kraft“. Musiker:innen sollten sie, ob widerwillig oder begeistert, akzeptieren, findet er. Catherine Anne Davies, alias The Anchoress, dagegen sagte mir kürzlich, sie halte sie für „dystopisch“. Derweil weist der Musikrechtsanwalt Gregor Pryor darauf hin, dass bereits jetzt eine Menge Hintergrundarbeit bei der Musikproduktion wegfällt.
„Ich stelle mir gerne vor, dass wir versuchen, das nächste Format für Musikaufnahmen zu entwickeln“, erklärt Shulman seine Vision. „Das Format der Zukunft wird interaktiv sein.“ Was meint er damit? „Es sollte sozial sein, das heißt, man macht es gemeinsam mit Anderen. Wir arbeiten daran, dafür die beste digitale Version zu entwickeln.“
Die Investoren ließen sich bisher jedenfalls nicht abschrecken. Im November sammelte Suno 250 Millionen US-Dollar (213 Millionen Euro) an Finanzmitteln ein, wodurch sich sein Wert auf 2,45 Milliarden Dollar (2,09 Milliarden Euro) erhöhte. Generative KI ist das heißeste Thema im Silicon Valley. Einem Bericht der Stanford University zufolge wurden 2024 private Investitionen in Höhe von 34 Milliarden Dollar (29 Milliarden Euro) in das Feld getätigt.
Jede neue Technologie löst Empörung aus
Es gibt zwar auch die Sorge, insbesondere bei der Bank of England, dass auf diesen glänzenden Boom nur ein bitterer Abschwung folgen kann. Derzeit glauben die Investoren jedoch, dass Generative KI ein zu großes Ding ist, um zu scheitern. Dabei sind die Risiken für den Erfolg von Suno erstaunlich hoch, insbesondere angesichts einer kürzlich durchgesickerten Investorenpräsentation, nach der das Unternehmen nur eine Million zahlende Abonnenten hat. Der monatliche Standardtarif kostet 8,50 Euro.
„Was Investoren klar werden musste“, sagt Shulman, „ist die große Bedeutung der Musik in der Welt. Sobald man ihnen die zeigt, ändern sie ihre Meinung und erkennen, dass noch viel, viel mehr möglich ist.“
Wenn sich eine neue externe Technologie in der Musikindustrie durchsetzt, geht die Reaktion in der Regel von Empörung über rechtliche Schritte bis hin zu Verhandlungen und schließlich zur Lizenzierung. Die drei größten Namen im Bereich der generativen KI-Musik befinden sich auf unterschiedlichen Stufen dieser Entwicklung.
Klay hat Vereinbarungen mit allen drei großen Musikfirmen getroffen, bevor es an den Start ging und seine Technologie mit Musik trainierte, was es zu einer raren Ausnahme macht in dieser „Start zuerst, Linzenzen später“-Welt. Udio hat Verträge mit der Universal Music Group (UMG) und Warner Music Group (WMG) abgeschlossen. Suno hat jedoch nur einen Vertrag mit WMG, und die rechtlichen Auseinandersetzungen mit den anderen großen Plattenfirmen laufen noch.
„Kein Problem, das gelöst werden muss“
Der heute 39-jährige Shulman hat früher selbst Musik gemacht. Aber ohne große Erfolgsaussichten – ein Initiator für Suno. „Ich habe in der Highschool und an der Uni in vielen Bands gespielt“, erzählt er per Video-Anruf aus seinem Zuhause in den USA und zeigt auf den Bass, der hinter ihm an der Wand hängt.
„Ich war okay, nicht großartig und es war klar, dass ich daraus keine große Karriere machen können würde.“ Der Suno-CEO ist vorsichtig und bedächtig in seiner Ausdrucksweise, ohne die Arroganz, die man manchmal bei stark gehypten Start-up-Gründern findet.
Eine berufliche Umorientierung hin zu einem Doktor in Physik brachte ihn mit den anderen Mitbegründern von Suno zusammen. Sie wollten eine Alterative zu den großen KI-Unternehmen wie OpenAI schaffen, da diese sich mit „Logik und Automatisierung zur Lösung sehr spezifischer Probleme befassen. Musik ist anders. Es gibt keine richtigen oder falschen Antworten. Es handelt sich nicht um ein Problem, das gelöst werden muss“.
Umstritten bleibt, woher Suno genau die Musik für das Training seiner Systeme bezogen hat – im Wesentlichen die Zerlegung von Musik in Datenstränge zur Katalogisierung –, bevor die Lizenzvereinbarungen abgeschlossen wurden. „Wir trainieren unsere Modelle mit Musik von mittlerer und hoher Qualität, die wir im freien Internet finden können“, schrieb Shulman in einem Blogbeitrag aus dem Jahr 2024.
Urheberrechte und Geschäftsgeheimnisse
Sunos ursprüngliche rechtliche Verteidigung lautete, das stelle eine faire Nutzung dar und die verwendete Musik bedürfe keiner vorherigen Genehmigung. Die Musikindustrie sah das anders. „Faire Nutzung,” entgegnete die RIAA, ist nicht gegeben, „wenn das Ergebnis darauf abzielt, das kopierte Werk zu ‚ersetzen‘.”
Ich frage Shulman, was er mit dem „freien Internet“ meint. Es gibt einen klaren Unterschied zwischen urheberrechtlich geschütztem Material (Aufnahmen sind in der Regel 70 Jahre lang geschützt) und Material, das gemeinfrei ist. „Das Urheberrecht ist eine andere Sache“, weicht er aus. „Ich kann nicht zu sehr ins Detail gehen, da derzeit rechtliche Schritte laufen. Teilweise ist es auch Geschäftsgeheimnis.“
Ich habe gestern mit meinem vierjährigen Sohn einen sehr lustigen Song gemacht. Sie würden ihn für KI-Slop halten – aber ich liebe ihn
Hat Sunos Philosophie der „Demokratisierung“ des Musikmachens inhärent etwas, dass sich gegen die Kunst richtet? Was früher außergewöhnlicher menschlicher Kreativität entsprang, ist nichts mehr Besonderes. Shulman sieht darin kein Problem. Genau wie bei digitalen Aufnahmen oder Sampling sei der KI-Generator nur ein weiteres Beispiel dafür, wie Technologie „die Musik vorantreibt“, wie „neue Talente entdeckt“ und „neue Genres erfunden werden“.
Das Thema von sogenanntem KI-Slop tut er als komplett subjektiv ab. „Ich habe gestern Morgen zusammen mit meinem Vierjährigen einen sehr lustigen Song gemacht. Das mag für Sie ‘Schund’ sein – Sie haben keine Beziehung dazu – aber ich liebe den Song. Er ist fantastisch.“ Gleichzeitig ist ihm wichtig zu betonen, dass die von Suno generierte Musik von extrem hoher Qualität sein kann.
Betrügerische Fluten
Und KI-gestützte Musik überschwemmt die Streaming-Dienste: Deezer gibt an, dass mehr als ein Drittel der täglich bereitgestellten Musik KI-basiert ist. Das entspricht 50.000 Titeln. Dabei sind 70 Prozent der Streams von KI-Musik laut Deezer betrügerisch. (Betrüger stellen billig produzierte KI-Titel auf solche Dienste ein und verwenden dann Bots, um die Streams in großem Umfang zu manipulieren, um Lizenzgebühren zu erhalten. Allerdings werden auch die Dienste diesbezüglich immer klüger). Deezer hat damit begonnen, KI-Titel zu kennzeichnen, um Nutzer aufmerksam zu machen. Die Musikplattform Bandcamp kündigte kürzlich an, dass sie keine Musik verbreiten werde, die „komplett oder zu bedeutenden Teilen KI-generiert sind“.
Sollten andere diesem Beispiel folgen? Shulman ist dazu nur bereit zu sagen, dass er nicht „der Schiedsrichter darüber sein möchte, was auf anderen Plattformen geschieht. Vielleicht gibt es eine Grenze, aber ich weiß nicht, wo sie liegt.“
Die – wie im Nachhinein eröffnet wurde – komplett virtuelle „Band“ Velvet Sundown, veröffentlichte vergangenen Sommer ihr Debüt-Album und kurz darauf gleich noch ein zweites Album. Die Band im 70er Jahre-Stil generierte Millionen Streams, war aber ein kurzlebiges Phänomen. „Ich weiß nicht genau, was ihre Strategie war”, sagt Shulman über Velvet Sundown. „Es war alles nur ein Scherz. Ich glaube, deshalb war es auch nur eine Eintagsfliege.”
Einige KI-gestützte Titel haben jedoch Bestand. Nach Vorwürfen, dass Suno verwendet wurde, um die Stimme der britischen Sängerin Jorja Smith zu klonen, wurde I Run von Haven aus den britischen Charts ausgeschlossen. Doch eine von der menschlichen Sängerin Kaitlin Aragon neu aufgenommene Version war chartfähig und kam in die Top 10.
Into the Blue von Sienna Rose, die weithin als KI-Künstlerin vermutet wird, schaffte es kürzlich in die Top 10 der Spotify-Charts Viral 50 Global. Und der Titel Jag Vet, Du Är Inte Min ist einer der größten Hits des Jahres in Schweden, obwohl er aus den Charts des Landes gestrichen wurde, weil er „hauptsächlich mit Hilfe von KI generiert“ ist.
Auch Hitler und Rassismus haben Platz bei Suno
Besorgniserregender war, dass Suno im vergangenen Jahr dazu verwendet wurde, Titel zu erstellen, die laut der Anti-Defamation League Adolf Hitler verherrlichten, rassistische Beleidigungen enthielten und von „White Power“ sprachen. Shulman sagt dazu: „Es handelte sich um drei Songs, die insgesamt zehn Mal abgespielt wurden. Es war eine relativ kleine Sache. Leider hat die Aufmerksamkeit, die dadurch entstanden ist, die Situation noch verschlimmert.“ Aber Suno habe seither strengere Sicherheitsvorkehrungen getroffen, um ähnliche Vorfälle in Zukunft zu verhindern.
Suno möchte, dass der Deal mit Warner als Beweis dafür gesehen wird, dass Gen-KI-Unternehmen auf für beide Seiten vorteilhafte Weise zusammenarbeiten können. Haben die 1,5 Milliarden Dollar (1,28 Milliarden Euro), die das KI-Unternehmen Anthropic im September an die Buchbranche gezahlt hat, um Ansprüche wegen des Trainings seiner KI mit Raubkopien beizulegen, Suno veranlasst, die Deals schnell abzuschließen? „Dem haben wir nicht viel Beachtung geschenkt“, behauptet Shulman. „Es gibt viel mehr zu tun, als sich gegenseitig zu bekämpfen. Und das wollen wir mit dieser Warner-Partnerschaft sehr deutlich zeigen.“
Es bleiben allerdings Fragen zum WMG-Deal offen. Hat das Label auf Änderungen am Dienst bestanden? Wurden Zahlungen geleistet, um die bisherige Nutzung seiner Musik in den Schulungen von Suno abzudecken? Hat WMG Anteile an Suno erworben? Shulman gibt keine Antwort und sagt nur, dass es „ein wenig früh“ sei, solche Informationen weiterzugeben. Möglicherweise möchte er laufende Lizenzverhandlungen nicht gefährden.
Vereinbarungen mit den großen Plattenfirmen sind eine Sache, aber Künstler zu umwerben ist eine andere. Die großen Plattenfirmen bestehen darauf, dass deren Musik nur verwendet wird, wenn sie sich für einen Vertrag entscheiden. Wenn jedoch nur ein kleiner Prozentsatz dies tut – ganz zu schweigen von ihren Namens-, Bild- und Persönlichkeitsrechten –, wird dies sicherlich die Ergebnisse beeinträchtigen.
Mikey Shulman setzt auf Charmeoffensive
In seinem Buch Überflieger: Warum manche Menschen erfolgreich sind – und andere nicht machte der US-Bestseller-Autor Malcolm Gladwell die „10.000-Stunden-Regel“ bekannt, wonach ein Künstler diese Zeit zum Üben benötigt, um eine bestimmte Meisterschaft zu erreichen. Werden Dienste wie Suno das verändern? „Ich glaube, man wird weiter 10.000 Stunden brauchen“, so Shulman. „Die Leute machen vielleicht andere Sachen und üben andere Skills, aber sie werden definitiv 10.000 Stunden investieren müssen, um die beste Musik der Welt zu machen.“
Im Zuge einer Charmeoffensive engagierte Suno den US-Produzenten Timbaland als strategischen Berater. Dieser musste sich allerdings öffentlich entschuldigen, nachdem er ohne Erlaubnis einen Titel des Produzenten K Fresh verwendet und laut K Fresh, „auf die KI-Plattform von Suno hochgeladen und einen nicht autorisierten KI-Remix veröffentlicht“ hatte.
Ich glaube, den meisten macht die Zeit, die sie mit dem Erarbeiten von Musik verbringen, keinen Spaß.
Shulman sagt, die Musiker, mit denen er über Suno spreche, betrachteten es als wichtiges neues kreatives Werkzeug und Hilfsmittel für das Songwriting. Im 20VC-Podcast hatte er dazu erklärt: „Ich glaube, den meisten macht die Zeit, die sie mit dem Erarbeiten von Musik verbringen, keinen Spaß.“ Das bedeutet nicht, dass Musiker:innen den kreativen Prozess als ganzen hassen, aber dass sie durchaus Tools zu schätzen wissen, die zumindest einen Teil der Routinearbeit übernehmen können.
Laut Shulman ist es für viele eine Art peinliches Geheimnis. „Wenn man mit den Leuten unter vier Augen spricht, fällt es ihnen leichter, es zuzugeben. Mir wurde gesagt, dass wir Ozempic, also die Abnehmspritze, der Musikindustrie sind – jeder nimmt es, aber niemand will darüber reden.“
Die Befürchtung ist natürlich, dass von der Musik nach der Behandlung mit der Abnehmspritze nicht viel übrig bleibt.