Technologie

Neues KI-Modell von OpenAI für komplexe Aufgaben

OpenAI, der Entwickler von ChatGPT, hat ein neues KI-Modell vorgestellt, das in der Lage ist, komplexere Aufgaben als frühere Chatbots zu bewältigen. Die Software namens o1 investiert mehr Zeit in das "Nachdenken", bevor sie eine Antwort liefert - "so wie es ein Mensch tun würde".
13.09.2024 12:17
Lesezeit: 1 min

Die Künstliche Intelligenz testet dabei verschiedene Ansätze und identifiziert sowie korrigiert eigenständig ihre Fehler, erläutert OpenAI in einem Blogeintrag.

Dies zeigt sich besonders bei Mathematik und der Programmierung von Software. Das o1-Modell hat 83 Prozent der Aufgaben der Prüfung zur Internationalen Mathematik-Olympiade gelöst, während das aktuelle ChatGPT-4o nur 13 Prozent bewältigte. Allerdings fehlen dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So kann es nicht im Internet nach Informationen suchen und unterstützt weder das Hochladen von Dateien noch von Bildern - zudem ist es derzeit langsamer.

Laut OpenAI kann das neue Modell Forschern bei der Datenanalyse oder Physikern bei komplexen mathematischen Formeln unterstützen.

Auch neue Software erfindet manchmal Antworten

Aus den Unterlagen geht hervor, dass das neue Modell bei einer Testauswahl von 100.000 Anfragen in 0,38 Prozent der Fälle wissentlich falsche Antworten gab. Dies geschah insbesondere, wenn OpenAI o1 gebeten wurde, auf Artikel, Websites oder Bücher zu verweisen.

Ohne Zugang zur Internet-Suche war dies oft nicht möglich. So erfand die KI selbst plausibel wirkende Beispiele. Die Software wollte jedoch stets nur die Wünsche der Nutzer erfüllen. Die sogenannten "Halluzinationen", bei denen KI-Software Informationen einfach erfindet, bleiben ein ungelöstes Problem.

ChatGPT, der Chatbot, der vor über einem Jahr den Hype um Künstliche Intelligenz entfachte, nutzt KI, um Texte auf menschlichem Niveau zu formulieren, Software-Code zu schreiben und Informationen zusammenzufassen. Diese KI-Programme werden mit enormen Datenmengen trainiert und arbeiten nach dem Prinzip, dass sie Wort für Wort beurteilen, wie ein Satz weitergehen sollte.

Mehr zum Thema
article:fokus_txt
DWN
Wirtschaft
Wirtschaft Bundesbank: Deutsche Exportwirtschaft verliert deutlich an globaler Stärke
14.07.2025

Die deutsche Exportwirtschaft steht laut einer aktuellen Analyse der Bundesbank zunehmend unter Druck. Branchen wie Maschinenbau, Chemie...

DWN
Immobilien
Immobilien Gebäudeenergiegesetz: Milliardenprojekt für 1,4 Billionen Euro – hohe Belastung, unklare Wirkung, politisches Chaos
14.07.2025

Die kommende Gebäudesanierung in Deutschland kostet laut Studie rund 1,4 Billionen Euro. Ziel ist eine Reduktion der CO₂-Emissionen im...

DWN
Politik
Politik EU plant 18. Sanktionspaket gegen Russland: Ölpreisobergrenze im Visier
14.07.2025

Die EU verschärft den Druck auf Moskau – mit einer neuen Preisgrenze für russisches Öl. Doch wirkt die Maßnahme überhaupt? Und was...

DWN
Technologie
Technologie Datenschutzstreit um DeepSeek: Deutschland will China-KI aus App-Stores verbannen
14.07.2025

Die chinesische KI-App DeepSeek steht in Deutschland unter Druck. Wegen schwerwiegender Datenschutzbedenken fordert die...

DWN
Finanzen
Finanzen S&P 500 unter Druck – Sommerkrise nicht ausgeschlossen
14.07.2025

Donald Trump droht mit neuen Zöllen, Analysten warnen vor einer Sommerkrise – und die Prognosen für den S&P 500 könnten nicht...

DWN
Politik
Politik Wenn der Staat lahmt: Warum die Demokratie leidet
14.07.2025

Bundespräsident Frank-Walter Steinmeier warnt eindringlich vor den Folgen staatlicher Handlungsunfähigkeit. Ob kaputte Brücken,...

DWN
Politik
Politik Fluchtgrund Gewalt: Neue Angriffe in Syrien verstärken Ruf nach Schutz
14.07.2025

Trotz Versprechen auf nationale Einheit eskaliert in Syrien erneut die Gewalt. Im Süden des Landes kommt es zu schweren Zusammenstößen...

DWN
Finanzen
Finanzen Altersarmut nach 45 Beitragsjahren: Jeder Vierte bekommt weniger als 1300 Euro Rente
14.07.2025

Auch wer sein Leben lang gearbeitet hat, kann oft nicht von seiner Rente leben. Dabei gibt es enorme regionale Unterschiede und ein starkes...