Technologie

Neues KI-Modell von OpenAI für komplexe Aufgaben

OpenAI, der Entwickler von ChatGPT, hat ein neues KI-Modell vorgestellt, das in der Lage ist, komplexere Aufgaben als frühere Chatbots zu bewältigen. Die Software namens o1 investiert mehr Zeit in das "Nachdenken", bevor sie eine Antwort liefert - "so wie es ein Mensch tun würde".
13.09.2024 12:17
Lesezeit: 1 min

Die Künstliche Intelligenz testet dabei verschiedene Ansätze und identifiziert sowie korrigiert eigenständig ihre Fehler, erläutert OpenAI in einem Blogeintrag.

Dies zeigt sich besonders bei Mathematik und der Programmierung von Software. Das o1-Modell hat 83 Prozent der Aufgaben der Prüfung zur Internationalen Mathematik-Olympiade gelöst, während das aktuelle ChatGPT-4o nur 13 Prozent bewältigte. Allerdings fehlen dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So kann es nicht im Internet nach Informationen suchen und unterstützt weder das Hochladen von Dateien noch von Bildern - zudem ist es derzeit langsamer.

Laut OpenAI kann das neue Modell Forschern bei der Datenanalyse oder Physikern bei komplexen mathematischen Formeln unterstützen.

Auch neue Software erfindet manchmal Antworten

Aus den Unterlagen geht hervor, dass das neue Modell bei einer Testauswahl von 100.000 Anfragen in 0,38 Prozent der Fälle wissentlich falsche Antworten gab. Dies geschah insbesondere, wenn OpenAI o1 gebeten wurde, auf Artikel, Websites oder Bücher zu verweisen.

Ohne Zugang zur Internet-Suche war dies oft nicht möglich. So erfand die KI selbst plausibel wirkende Beispiele. Die Software wollte jedoch stets nur die Wünsche der Nutzer erfüllen. Die sogenannten "Halluzinationen", bei denen KI-Software Informationen einfach erfindet, bleiben ein ungelöstes Problem.

ChatGPT, der Chatbot, der vor über einem Jahr den Hype um Künstliche Intelligenz entfachte, nutzt KI, um Texte auf menschlichem Niveau zu formulieren, Software-Code zu schreiben und Informationen zusammenzufassen. Diese KI-Programme werden mit enormen Datenmengen trainiert und arbeiten nach dem Prinzip, dass sie Wort für Wort beurteilen, wie ein Satz weitergehen sollte.

Mehr zum Thema
Bleiben Sie über das Thema dieses Artikels auf dem Laufenden Klicken Sie auf [+], um eine E-Mail zu erhalten, sobald wir einen neuen Artikel mit diesem Tag veröffentlichen
Anzeige
DWN
Technologie
Technologie Wie Verbraucher mit Risiko umgehen – zwischen Finanzentscheidungen und digitaler Unterhaltung

Risiko ist ein Begleiter fast jeder wirtschaftlichen Entscheidung. Mal ist es größer, mal kleiner. Mal offensichtlich, mal schwer...

DWN
Wirtschaft
Wirtschaft Steigende Kerosinpreise: Europäische Fluggesellschaften reduzieren Verbindungen
26.04.2026

Steigende Kerosinpreise setzen den europäischen Luftverkehr zunehmend unter Druck und zwingen Airlines zu Anpassungen bei Angebot und...

DWN
Politik
Politik Größte Fregatte der Welt: Warum die F126 die Deutsche Marine in der Milliardenfalle hält
26.04.2026

Die Bundeswehr wartet auf ihre neuen U-Boot-Jäger. Und wartet, und wartet. Sechs Fregatten der Klasse F126, einst als größte ihrer Art...

DWN
Unternehmen
Unternehmen Azubis gesucht? Welche Benefits für Auszubildende attraktiv sind
26.04.2026

Der Ausbildungsmarkt steht unter erheblichem Druck: Fast jeder zweite Betrieb konnte letztes Jahr nicht alle Ausbildungsplätze besetzen....

DWN
Wirtschaft
Wirtschaft Energiekrise in Europa: Warum Europas Strategie zunehmend zerfällt
26.04.2026

Die Energiepreise steigen weiter und Europas Regierungen reagieren mit Milliardenhilfen, Steuererleichterungen und Notmaßnahmen. Doch...

DWN
Panorama
Panorama Leben nach Tschernobyl: Schicksal eines Liquidators zwischen Atomkatastrophe und Krieg in Kiew
26.04.2026

Mehr als drei Jahrzehnte nach der Reaktorkatastrophe von Tschernobyl kämpft ein ehemaliger Liquidator noch immer mit den Folgen. Inmitten...

DWN
Finanzen
Finanzen Kevin Warsh vor Fed-Spitze: Politischer Druck auf die US-Notenbank wächst
26.04.2026

Die Entscheidung über die künftige Führung der US-Notenbank rückt näher und bringt politische Spannungen rund um den Fed-Vorsitz...

DWN
Wirtschaft
Wirtschaft Neues EU-Grenzsystem EES belastet Flughäfen: Branche warnt vor Verzögerungen
26.04.2026

Das neue EU-Grenzsystem EES sorgt an europäischen Flughäfen für wachsende Unsicherheit im Reiseverkehr und stellt Abläufe zunehmend auf...

DWN
Technologie
Technologie Telekom testet Quantentechnologie: Glasfasernetz in Berlin im Praxiseinsatz
25.04.2026

Ein Berliner Experiment bringt Quanten-Teleportation erstmals über ein Telekom-Glasfasernetz in eine reale Infrastruktur und markiert...