LISSABON, Portugal – Technologiegiganten investieren zunehmend in die Entwicklung sogenannter „souveräner“ Modelle für künstliche Intelligenz, um die Wettbewerbsfähigkeit durch eine stärkere Konzentration auf die lokale Infrastruktur zu steigern.
Unter Datensouveränität versteht man die Idee, dass die Daten von Personen auf der Infrastruktur des Landes oder Kontinents, in dem sie leben, gespeichert werden sollten.
„Souveräne KI ist ein relativ neuer Begriff, der im letzten Jahr oder so aufgetaucht ist“, sagte Chris Gow, der in Brüssel ansässige EU-Politiker des IT-Netzwerkgiganten Cisco, gegenüber CNBC.
Derzeit nutzen viele der größten großen Sprachmodelle (LLMs), wie ChatGPT von OpenAI und Claude von Anthropic, Rechenzentren in den USA, um Daten zu speichern und Anfragen über die Cloud zu verarbeiten.
Dies hat zu Bedenken bei Politikern und Regulierungsbehörden in Europa geführt, die die Abhängigkeit von US-Technologie als schädlich für die Wettbewerbsfähigkeit des Kontinents ansehen – und, was noch besorgniserregender ist, für die technologische Widerstandsfähigkeit.
Woher kommt die „KI-Souveränität“?
Die Vorstellung von Daten und technologische Souveränität steht schon früher auf der europäischen Tagesordnung. Dies war zum Teil darauf zurückzuführen, dass Unternehmen auf neue Vorschriften reagierten.
Die Datenschutz-Grundverordnung der Europäischen Union z. B. verlangt von Unternehmen, mit Benutzerdaten sicher und konform umzugehen und dabei ihr Recht auf Privatsphäre zu respektieren. Aufsehen erregende Fälle in der EU haben auch Zweifel daran geweckt, ob Daten europäischer Bürger sicher über Grenzen hinweg übertragen werden können.
Der Europäische Gerichtshof erklärte im Jahr 2020 einen Rahmen für den Datenaustausch zwischen der EU und den USA für ungültig, mit der Begründung, dass der Pakt nicht das gleiche Schutzniveau biete, wie es innerhalb der EU durch die Datenschutz-Grundverordnung (DSGVO) garantiert wird. Letztes Jahr die EU-US-Datenschutzrahmen wurde gegründet, um sicherzustellen, dass Daten sicher zwischen der EU und den USA übertragen werden können
Diese politischen Entwicklungen haben letztendlich zu einem Vorstoß zur Lokalisierung der Cloud-Infrastruktur geführt, in der Daten für viele Online-Dienste gespeichert und verarbeitet werden.
Filippo Sanesi, globaler Leiter für Marketing und Betrieb bei OVHCloud, sagte, das französische Cloud-Unternehmen sehe eine große Nachfrage nach seiner in Europa ansässigen Infrastruktur, da es „den Wert seiner Daten in Europa versteht, die der europäischen Gesetzgebung unterliegen“.
„Da dieses Konzept der Datensouveränität ausgereifter wird und die Menschen verstehen, was es bedeutet, sehen wir, dass immer mehr Unternehmen verstehen, wie wichtig es ist, dass Ihre Daten lokal und unter einer bestimmten Gerichtsbarkeit und Governance vorliegen“, sagte Sanesi gegenüber CNBC. „Wir haben viele Daten“, fügte er hinzu. „Diese Daten sind in bestimmten Ländern unter bestimmten Vorschriften souverän.“
„Mit diesen Daten kann man nun tatsächlich Produkte und Dienstleistungen für die KI herstellen, und diese Dienstleistungen sollten dann souverän sein, vor Ort von lokalen Talenten für die lokale Bevölkerung oder Unternehmen kontrolliert, eingesetzt und entwickelt werden.“
Der Vorstoß zur KI-Souveränität wurde von den Regulierungsbehörden nicht vorangetrieben – zumindest noch nicht, so Gow von Cisco. Es komme vielmehr von privaten Unternehmen, die in Europa mehr Rechenzentren eröffnen – Einrichtungen mit riesigen Mengen an Computerausrüstung, um cloudbasierte KI-Tools zu ermöglichen, sagte er.
Souveräne KI wird „mehr von der Industrie vorangetrieben, die ihr diesen Namen gibt, als von der Seite der politischen Entscheidungsträger“, sagte Gow. „Man sieht die auf Regulierungsseite verwendete Terminologie ‚KI-Souveränität‘ noch nicht.“
Länder drängen auf die Idee der KI-Souveränität, weil sie erkennen, dass KI „die Zukunft“ und eine „enorm strategische Technologie“ ist, sagte Gow.
Regierungen konzentrieren sich auf die Förderung ihrer inländischen Technologieunternehmen und Ökosysteme sowie der überaus wichtigen Backend-Infrastruktur, die KI-Dienste ermöglicht.
„Der KI-Workload verbraucht das 20-fache der Bandbreite eines herkömmlichen Workloads“, sagte Gow. Laut Gow geht es auch darum, die Arbeitskräfte zu befähigen, da Unternehmen qualifizierte Arbeitskräfte benötigen, um erfolgreich zu sein.
Am wichtigsten sind jedoch die Daten. „Was Sie sehen, sind einige Versuche von dieser Seite, darüber nachzudenken, LLMs auf lokalisierten Daten in Sprache zu trainieren“, sagte Gow.
„Werte widerspiegeln“
In Italien ist die Erste LLM-Schulung speziell für die italienische SpracheItalia 9B genannt, kam diesen Sommer auf den Markt.
Das Ziel des Italia-Projekts besteht darin, Ergebnisse in einer bestimmten Gerichtsbarkeit zu speichern und sich auf Daten von Bürgern in dieser Region zu stützen, damit die von den dortigen KI-Systemen erzeugten Ergebnisse besser auf den lokalen Sprachen, der Kultur und der Geschichte basieren.
„Bei souveräner KI geht es darum, die Werte einer Organisation oder gleichermaßen des Landes, in dem man sich befindet, sowie die Werte und die Sprache widerzuspiegeln“, sagt David Hogan, EMEA-Vertriebsleiter für den Chiphersteller Nvidiasagte CNBC.
„Die größte Herausforderung besteht darin, dass die meisten Grenzmodelle heute hauptsächlich auf westlichen Daten im Allgemeinen trainiert wurden“, fügte Hogan hinzu.
In Dänemark zum Beispiel, wo Nvidia eine große Präsenz hat, sind die Beamten laut Hogan besorgt darüber, dass lebenswichtige Dienste wie das Gesundheitswesen und die Telekommunikation von KI-Systemen bereitgestellt werden, die nicht die lokale dänische Kultur und Werte „spiegeln“.
Am Mittwoch hat Dänemark ein wegweisendes Weißbuch vorgelegt, in dem dargelegt wird, wie Unternehmen KI im Einklang mit dem kommenden EU-KI-Gesetz – dem weltweit ersten großen KI-Gesetz – nutzen können. Das Dokument soll als Blaupause für andere EU-Staaten dienen, die es befolgen und übernehmen kann.
„Wenn Sie sich in einem europäischen Land befinden, das nicht zu den wichtigsten internationalen Sprachländern gehört, sind wahrscheinlich weniger als 2 % der Daten auf Ihre Sprache trainiert – ganz zu schweigen von Ihrer Kultur“, sagte Hogan.
Wie die Regulierung zu einem Umdenken führte
Das heißt nicht, dass Vorschriften sich nicht als wichtiger Faktor erwiesen haben, um Technologiegiganten dazu zu bewegen, mehr über den Aufbau einer lokalisierten KI-Infrastruktur in Europa nachzudenken.
Sanesi von OVHCloud sagte, Vorschriften wie die DSGVO der EU hätten das Interesse an der Auslagerung der Datenverarbeitung in einer bestimmten Region stark geweckt.
Das Konzept der KI-Souveränität findet auch bei lokalen europäischen Technologiefirmen Zustimmung.
Anfang dieser Woche gaben die in Berlin ansässige Suchmaschine Ecosia und ihr in Paris ansässiger Konkurrent Qwant ein Joint Venture bekannt einen europäischen Suchindex von Grund auf entwickelnmit dem Ziel, bessere Ergebnisse in der französischen und deutschen Sprache zu erzielen.
Inzwischen französischer Telekommunikationsbetreiber Orange hat erklärt, man befinde sich in Gesprächen mit einer Reihe grundlegender KI-Modellunternehmen über den Aufbau eines Smartphone-basierten „souveränen KI“-Modells für seine Kunden, das ihre eigene Sprache und Kultur genauer widerspiegele.
„Es würde keinen Sinn machen, eigene LLMs zu bauen. Daher wird derzeit viel darüber diskutiert, wie wir mit bestehenden Anbietern zusammenarbeiten können, um es lokaler und sicherer zu machen?“ Bruno Zerbib, Chief Technology Officer von Orange, sagte gegenüber CNBC.
„Es gibt viele Anwendungsfälle, in denen [AI data] können lokal bearbeitet werden [on a phone] statt in der Cloud verarbeitet zu werden“, fügte Zerbib hinzu. Orange hat noch keinen Partner für diese souveränen KI-Modellambitionen ausgewählt.