Technologie

EuroLingua-GPT: Europas Weg zu eigenen KI-Sprachmodellen dank MareNostrum 5

Lesezeit: 4 min
07.07.2024 08:57
Der Supercomputer MareNostrum 5 im Barcelona Supercomputing Center Europa verhilft zur Entwicklung eigener KI-Sprachmodelle. EuroLingua-GPT stärkt die digitale Souveränität und Innovationskraft in Europa.
EuroLingua-GPT: Europas Weg zu eigenen KI-Sprachmodellen dank MareNostrum 5
Europa entwickelt mit EuroLingua-GPT erstmals eigene große KI-Sprachmodelle. Diese Initiative zielt darauf ab, europäische Datensätze und ethische Standards zu nutzen. (Foto: iStock.com, FotografieLink)
Foto: FotografieLink

Mehr zum Thema:  
Benachrichtigung über neue Artikel:  

Europa hat bisher kein eigenes großes Sprachmodell für Künstliche Intelligenz. Die Datensätze zum Trainieren der Programme stammen bisher meistens aus den USA. Das soll sich dank EuroLingua-GPT nun ändern.

EuroLingua-GPT dank Supercomputer: Europa bekommt ein eigenes KI-Sprachmodell

Große Sprachmodelle revolutionieren gegenwärtig unsere Kommunikation sowie den Umgang mit Information und Wissen. Bisher werden sie jedoch hauptsächlich für die englische und chinesische Sprache durch außereuropäische Akteure wie OpenAI mit GPT entwickelt. Auch das offene Modell BLOOM ist nicht mit Daten in deutscher Sprache trainiert worden. Dies bedeutet, dass es nicht dem europäischen Rechtsraum und Datenschutz unterliegt. Ethische Regeln werden bei außereuropäischen Diensten nach den Maßstäben der anbietenden Unternehmen umgesetzt, was sich wiederum in der Auswahl der Trainingsdaten bzw. Methoden niederschlagen kann. Es ist unklar, ob deutsche und europäische Standards berücksichtigt werden. Dies kann eine Herausforderung für die Nutzung und Anwendung solcher Modelle in Deutschland und Europa darstellen. Daher war die Forderung nach modernen, offenen multilinguale Modelle sowie Modelle für die deutsche Sprache in Deutschland und Europa da.

Als Schlüsseltechnologie der Künstlichen Intelligenz sind große Sprachmodelle der Kern vieler wichtiger Anwendungen: Sie erkennen, produzieren, übersetzen und verarbeiten Sprache. Doch sie haben auch einen Haken. Große Sprachmodelle sind häufig intransparent und ihre Ergebnisse nicht immer nachvollziehbar. Sie erstellen Texte, die falsche oder unlogische Aussagen und Zusammenhänge darstellen. Sie haben deutlich mehr Parameter und damit eine bessere Vorhersage-Leistung für zahlreiche Aufgaben, sind jedoch häufig auch nicht Open Source verfügbar.

MareNostrum 5: Der Supercomputer, der Europas KI-Zukunft gestaltet

Mare Nostrum 5 ist ein Symbol für den Fortschritt und die Innovationskraft in der europäischen und globalen Supercomputing-Landschaft. Der Supercomputer steht im Barcelona Supercomputing Center (BSC) und ist aktuell auf Platz 8 der Weltrangliste und hat Anschaffungs- und Instandhaltungskosten von 151 Millionen Euro. Dazu wird er rein mit erneuerbaren Energien betrieben. Die Leistung des Superrechners ermöglicht Simulationen und Berechnungen, die vor wenigen Jahren noch undenkbar waren. Berechnungen zur Wettervorhersage, die früher Tage in Anspruch nahmen, können damit in wenigen Minuten abgeschlossen werden. Um sich das besser vorstellen zu können: Ein moderner High-End-PC erreicht eine Rechenleistung im Teraflop-Bereich (10 hoch 12 Berechnungen pro Sekunde). MareNostrum 5 ist etwa eine Million Mal leistungsfähiger als ein solcher PC. Europa hat mit Superrechnern noch viel vor. Auch die Schweiz punktet seit neuestem mit einem System unter den Superrechnern. Die Alp-Maschine des Swiss National Supercomputing belegt aktuell den sechsten Platz auf der Weltrangliste.

Supercomputer kommen bereits in vielen wissenschaftlichen und industriellen Bereichen zum Einsatz, wie zum Beispiel bei der Klimaforschung oder in der Biomedizinischen Forschung. Jetzt haben das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS und die NLU-Gruppe von AI Schweden gemeinsame Rechenzeit am neuen Hochleistungsrechner MareNostrum 5 im Barcelona Supercomputing Center erhalten. Was diese Tatsache so besonders macht?

Es handelt sich um eines der größten Kontingente, die seitens des Gemeinsamen Unternehmens für europäisches Hochleistungsrechnen (GU EuroHPC) für die Entwicklung europäischer großer KI-Sprachmodelle (LLMs) gewährt wurden. Seit Ende Mai 2024 ist das Projekt nun am Start, um die ersten multilingualen Modelle zu rechnen. Die Laufzeit des Projekts „EuroLingua-GPT“ ist für ein Jahr angesetzt.

8,8 Millionen Rechenstunden stehen zur Verfügung. Die Wissenschaftler sehen darin einen Meilenstein für Deutschland und Europa und versprechen sich durch die trainierten Modelle einen Fortschritt in Wirtschaft und Wissenschaft. Es ist die Geburtsstunde der generativen Künstlichen Intelligenz „Made in Europe“. Ziel des gemeinsamen Projektes ist es, eine Familie von großen KI-Sprachmodellen von Grund auf zu trainieren. Die neuen EuroLingua-Modelle, so der Name, bauen auf einem Trainingsdatensatz von 45 europäischen Sprachen, Dialekten und Codes auf. Der Schwerpunkt liegt damit auf europäische Sprachen und Werte, denn bisher sind multilinguale Modelle eher selten.

Offene KI-Modelle für eine transparente und souveräne digitale Zukunft

Veröffentlicht werden sollen die KI-Sprachmodelle Open Source, das bedeutet, dass der Quellcode und die Trainingsdaten dieser Modelle frei zugänglich gemacht werden. Dadurch können später Unternehmen oder Interessierte die Modelle an ihre spezifischen Bedürfnisse anpassen und eigene Produkte und Dienstleistungen umwandeln.

EuroLingua-GPT ist nur eines von drei großen laufenden EU-Projekten zu Sprachmodellen, an denen Fraunhofer IAIS und AI Sweden beteiligt sind. Die beiden anderen sind TrustLLM und Deploy AI. Beide Projekte repräsentieren zwei wesentliche Bereiche der modernen KI-Entwicklung. Während TrustLLM darauf abzielt, das Vertrauen und die Ethik in KI-Sprachmodellen zu stärken, fokussiert sich Deploy AI auf die effiziente Implementierung und den Betrieb dieser Modelle.

Weitere EU-Initiativen, wozu der Superrechner MareNostrum 5 zum Einsatz kommen soll, heißen vielversprechend „Destination Earth“ und „European Virtual Human Twin“. Bei ersterem soll ein hochpräzises digitales Modell der Erde entstehen. Letzteres soll einen digitalen menschlichen Zwilling erschaffen, um zu einem besseren Verständnis des menschlichen Organismus zu gelangen und eine personalisierte Medizin zu ermöglichen.

Künstliche Intelligenz und maschinelles Lernen sind die Schlüsseltechnologien des 21. Jahrhunderts. Europa hat eine lange Tradition in der wissenschaftlichen Forschung. Es gilt diese Tradition fortzusetzen und zu stärken. Dafür notwendig ist der Zugang zu den besten verfügbaren Technologien. MareNostrum 5 bietet diese Ressourcen und stellt sicher, dass europäische Forschungseinrichtungen weiterhin in der Weltrangliste mit vorne dabei sein können. Nicht zuletzt sichern eigene Superrechner die digitale Souveränität und Unabhängigkeit gegenüber ausländischen Mitstreitern. Dafür stehen aktuell drei EU-Supercomputer zur Verfügung, die zu den besten der Welt gehören: LEONARDO, LUMI und MareNostrum5. Zwei weitere, noch fähigere Leistungsrechner aus Frankreich mit den Namen „Jupiter“ und „Jules Werner“ sind geplant. Die Rechenkapazität dieser beiden Rechner ist schwindelerregend. Sie können mehr als eine Trillion Berechnungen pro Sekunde durchführen.

Vielversprechend klingt auch das Vorhaben von europäischen KI-Start-Ups, einen dauerhaften Zugang zu europäischen Hochleistungsrechenkapazitäten zu ermöglichen, sodass diese ihre Modelle trainieren können. Auf diese Weise sollen KI-Innovationen gefördert werden und die Abhängigkeit bezüglich Datensätzen aus anderen Nationen verringert werden.

                                                                            ***

Sofia Delgado ist freie Journalistin und arbeitet seit 2021 in Stuttgart, nachdem sie viereinhalb Jahre lang in Peking gelebt hat. Sie widmet sich gesellschaftskritischen Themen und schreibt für verschiedene Auftraggeber. Persönlich priorisiert sie die Themen Umweltschutz und Nachhaltigkeit, als dringendste Herausforderung für die Menschheit.

 


Mehr zum Thema:  

Anzeige
DWN
Finanzen
Finanzen Zu Weihnachten Zukunft schenken

Gerade zu Weihnachten wünschen sich viele Menschen, etwas von ihrem Glück zu teilen und sich für diejenigen zu engagieren, die es nicht...

DWN
Weltwirtschaft
Weltwirtschaft Clean Industrial Deal: Warum die EU jetzt handeln muss
26.12.2024

Vor fünf Jahren setzte die EU mit dem Europäischen Green Deal neue Maßstäbe im globalen Klimaschutz. Heute, angesichts wachsender...

DWN
Politik
Politik „Atomkraft? Nein Danke“: Habeck-Ministerium manipulierte wohl AKW-Studie für Atomausstieg
26.12.2024

Manipulation im Wirtschaftsministerium? Wie interne Unterlagen jetzt aufdecken, soll das Wirtschaftsministerium unter Robert Habeck gezielt...

DWN
Politik
Politik Papst eröffnet Heiliges Jahr mit Hoffnungsbotschaft
26.12.2024

Ein strammes Programm hatte der gesundheitlich angeschlagene Papst an Weihnachten zu stemmen: Er eröffnete das Heilige Jahr der...

DWN
Weltwirtschaft
Weltwirtschaft Deutschland schafft Gasspeicherumlage ab: Entlastung für Nachbarländer, Mehrkosten für Verbraucher
26.12.2024

Deutschland verabschiedet sich von der umstrittenen Gasspeicherumlage an Grenzübergangspunkten zu Nachbarländern. Mit einer Änderung des...

DWN
Immobilien
Immobilien Sechs Jahre Mietenstopp: Können Mietpreiserhöhungen gesetzlich verboten werden?
26.12.2024

Der aktuelle Wohnmarkt bereitet Volk wie Bundesregierung Kopfzerbrechen. Laut Umfragen glauben immer weniger Deutsche daran, sich den Traum...

DWN
Finanzen
Finanzen Teure Ampel-Geschenke: 2025 – das Jahr, in dem Sie von Vater Staat geschröpft werden
26.12.2024

Die Konsumstimmung ist nicht die Beste in Deutschland: Der Gabentisch wird auch dieses Weihnachten bei Vielen eher mau aussehen. Vater...

DWN
Weltwirtschaft
Weltwirtschaft Kann Automatisierung die deutsche Industrie retten?
26.12.2024

Die deutsche Wirtschaft kämpft mit Fachkräftemangel und explodierenden Kosten. Wie können Automatisierung und Robotik diese...

DWN
Politik
Politik Wahlforscher Jung: Die Union hat ein "Merz-Problem" - und Habeck eine gute Chance
26.12.2024

Es sei sehr wahrscheinlich, dass Unionskandidat Merz der nächste deutsche Bundeskanzler wird, sagt Wahlforscher Matthias Jung. Doch er...