Schwarz, die DB und Aleph Alpha konstruieren Daten-Marktplatz z. Hd. KI-Startups

Schwarz und die Bahn haben eine KI-Datenplattform gegründet. Dahinter steckt – neben dem Traum von der europäischen Souveränität – eine berühmte Börsenweisheit.

Deutschland will punkten in puncto KI: Schwarz Digits, Aleph Alpha und nun auch die Deutsche Bahn mischen mit.

Deutschland will punkten in puncto KI: Schwarz Digits, Aleph Alpha und nun auch die Deutsche Bahn mischen mit.
Sean Gallup via Getty Images / picture alliance / Hubert Burda Media / Collage: Gründerszene

Das Ziel ist „KI made in Europe“. Besonders Deutschland soll „zu einem führenden Standort für die Entwicklung und Anwendung von KI-Technologien“ werden, so die Bundesregierung. Ein Unternehmen positioniert sich in diesem Vorhaben als „Katalysator“ – und erkundet nebenbei neue, potenziell hoch lukrative Business-Felder: Schwarz Digitis. Die Digitalsparte der Schwarz Gruppe (Lidl, Kaufland) stand aufgrund ihres Einflusses auf das KI-Startup Aleph Alpha zuletzt in der Kritik. Aleph Alpha wiederum wurde vorgeworfen, geringwertige KI-Modelle zu trainieren – hoher Finanzierungen zum Trotz. Kein leichter Sommer für das Startup von CEO Jonas Andrulis.

Seit vergangener Woche will man es nun alle wissen lassen: „Totgeglaubte leben länger“ – so schreibt uns ein Insider aus dem Unternehmensumfeld. Aleph Alpha verkündete zuerst einen 19-Millionen-Euro-Deal mit der Agentur für Arbeit. Jetzt soll das Startup als „KI-Partner“ bei einem Joint Venture zwischen Schwarz und der Deutschen Bahn profitieren, das die beiden Unternehmen auf dem Digital-Gipfel soeben der Bundesregierung vorgestellt haben: dem neu gegründeten „Datahub Europe“.

Verkehrs- und Digitalminister Volker Wissing (FDP) nennt es ein „dringend benötigtes“ Projekt, das für ganz Europa eine Lücke schließe. Was steckt dahinter? Wie kommen die Bahn, Schwarz und Aleph Alpha zusammen? Wir haben im Hintergrund mit jemanden gesprochen, der das Joint Venture mitinitiiert hat.

Einer der größten Kostenfaktoren für KI-Startups ist die Daten-Beschaffung

Vorstellung des DataHub Europe auf dem Digital-Gipfel der Bundesregierung mit der hessischen Digitalministerin Kristina Sinemus, Robert Habeck und Volker Wissing, Co-CEO Schwarz Digits Christian Müller, Kanzler Olaf Scholz und der Vorständin für Digitalisierung und Technik Deutsche Bahn Dr. Daniela Gerd tom Markotten (v.l.n.r).

Vorstellung des DataHub Europe auf dem Digital-Gipfel der Bundesregierung mit der hessischen Digitalministerin Kristina Sinemus, Robert Habeck und Volker Wissing, Co-CEO Schwarz Digits Christian Müller, Kanzler Olaf Scholz und der Vorständin für Digitalisierung und Technik Deutsche Bahn Dr. Daniela Gerd tom Markotten (v.l.n.r).
Schwarz Digits KG / Volker Emersleben

Der Datahub ist die neuste Ergänzung im KI-Kosmos Schwarz: eine Datenplattform für das Training von KI-Modellen. Denn „Daten sind das neue Gold“ – die Basis für das Training jeder Künstlichen Intelligenz. Der Teil mit dem „Gold“ kann wörtlich verstanden werden: Data-Labeling und -Providing gilt als einer der bisher lukrativsten Use Cases des KI-Booms. Das wohl prominenteste Beispiel ist Scale AI. Das Data-Labeling-Startup aus San Francisco hat dieses Jahr eine Milliarde Dollar geraised und ist damit auf eine Bewertung von knapp 14 Milliarden Dollar geklettert. Da finde eine „unglaubliche Wertschöpfung“ statt, sagt unser Insider, vor allem in den USA.





Data-Labeling


Data-Labeling-Unternehmen machen Daten für maschinelles Lernen nutzbar. Dahinter steht ein Prozess, bei dem Rohdaten – Bilder, Texte, Videos oder Audiodateien – mit Labels oder Tags versehen werden, die den Inhalt und Kontext der Daten beschreiben. Diese Labels sind entscheidend für das Training von KI-Modellen, da sie es den Algorithmen ermöglichen, Muster zu erkennen und Vorhersagen zu treffen.

Auch Aleph Alpha kauft seine KI-Trainingsdaten bisher im Silicon Valley ein. Das KI-Unternehmen zählt die Daten-Beschaffung demnach zu seinen größten Kostenfaktoren. Und die wenigen Data-Labeling-Firmen wie Scale AI haben die Preise aufgrund der hohen Nachfrage zuletzt weiter angezogen. Frei nach der Börsenweisheit: „Investiere bei einem Goldrausch nicht in Goldgräber, sondern in Schaufeln“, geht Schwarz Digits jetzt also an die Quelle des KI-Booms: die Trainingsdaten.

Aleph Alpha-CEO Jonas Andrulis vergleicht die neue Plattform mit dem „Schlüssel“ zu einem „Schatz“

Das hat einen weiteren Vorteil – quasi der USP, der den Datahub von der mit Milliarden gefundeten Konkurrenz aus den USA abheben soll: auf Basis von in Europa erhobenen Daten sollen KI-Firmen (die Kunden des Datahubs wie Aleph Alpha) rechtssicher KI-Modelle für die deutsche Industrie und den Mittelstand trainieren können. „Für Anwender wie Inhaber dieser Daten“ entstünde eine „Plattform für Zusammenarbeit, die langfristige Stabilität und Sicherheit“ garantiere, schwärmt Jonas Andrulis. Aleph Alpha ist nicht nur KI-Partner des Projekts, sondern auch erster Kunde des Daten-Marktplatzes.

Denn es sollen ausschließlich „hochwertige“ und „rechtssichere“ Daten sein, die in den Datahub Europe eingehen. Begonnen hat das Joint Venture mit Daten der FAZ, des Handelsblatts und der Wirtschaftswoche (beide gehören zum Holtzbrinck-Verlag). Das Ergebnis klingt nach einer Form von regulierten Daten-Marktplatz – auf dem jeder ein-, aber eben nicht jeder verkaufen kann. Zudem soll es eine Möglichkeit zum Spenden von Daten geben: Damit will sich der Hub auch für die Daten der öffentlich-rechtlichen Medien öffnen. Denn diese dürfen mit ihren Daten, die Eigentum der öffentlichen Hand sind, keinen Handel betreiben. Dürfen sie dem Datahub also nicht verkaufen.

Die Idee zu einem europäischen Datahub entsteht bei der Deutschen Bahn

Die hohen Standards an Rechtssicherheit sollen den Datahub besonders für stark regulierte Segmente attraktiv machen, eben wie: die Schwarz-Gruppe als Lebensmittelhandel – oder die Deutsche Bahn als Staatskonzern. So sei die Idee zum Datahub überhaupt erst entstanden, erzählt unser Informant: Im Rahmen ihres aktuellen Sanierungsprogramms habe die Bahn ein KI-Modell gesucht, um seine Revision zu optimieren. Doch das sonst übliche Training mit Daten aus dem Silicon Valley hätte gegen die strengen Datenschutzvorgaben des Konzerns verstoßen – und die Bahn stand ohne KI-Lösung da. So sei die Idee zu einem Data-Provider aufgekommen.

Gesammelt werden alle Daten auf Stackit, dem in Deutschland ansässigen Cloud-Provider von Schwarz Digits. Das garantiere, dass die Daten den europäischen Rechtsraum „nicht für einen Moment“ verließen, beschwört das Konsortium. Man garantiere auf diesem Weg ein „Höchstmaß an Datensouveränität“. Der Aspekt digitale Souveränität ist Motto-gebend auf dem diesjährigen Digital-Gipfel in Frankfurt.

Erster Use-Case von Aleph Alpha

Hier hat der Datahub auch seinen ersten Use-Case vorgestellt: auf Basis von Daten aus dem Datahub hat Aleph Alpha in der Zwischenzeit ein rechtssicheres KI-Modell für die Bahn entwickelt. Die Revisions-KI mit dem Namen „AuditGPT“ ist demnach erfolgreich bei der Bahn und Schwarz implementiert und ermögliche eine Teilautomatisierung der Revisionsarbeit.

Die Initiative hofft, sich als einen „grundlegenden Akteur der europäischen KI“ positionieren zu können. Der Verkehrsminister stimmt ihnen schonmal zu: Wissing spricht von einer „entscheidenden Lücke in der EU“, die nun geschlossen werde. Bisher speisen sich die Mitarbeiter des Hubs aus Mitarbeitern von Schwarz Digits und der Bahn. Geschäftsführerin ist Christiane Michaela Milders aus dem Schwarz-Universum.

Lest auch

Source: businessinsider.de