Technologie

Neues KI-Modell von OpenAI für komplexe Aufgaben

OpenAI, der Entwickler von ChatGPT, hat ein neues KI-Modell vorgestellt, das in der Lage ist, komplexere Aufgaben als frühere Chatbots zu bewältigen. Die Software namens o1 investiert mehr Zeit in das "Nachdenken", bevor sie eine Antwort liefert - "so wie es ein Mensch tun würde".
13.09.2024 12:17
Lesezeit: 1 min

Die Künstliche Intelligenz testet dabei verschiedene Ansätze und identifiziert sowie korrigiert eigenständig ihre Fehler, erläutert OpenAI in einem Blogeintrag.

Dies zeigt sich besonders bei Mathematik und der Programmierung von Software. Das o1-Modell hat 83 Prozent der Aufgaben der Prüfung zur Internationalen Mathematik-Olympiade gelöst, während das aktuelle ChatGPT-4o nur 13 Prozent bewältigte. Allerdings fehlen dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So kann es nicht im Internet nach Informationen suchen und unterstützt weder das Hochladen von Dateien noch von Bildern - zudem ist es derzeit langsamer.

Laut OpenAI kann das neue Modell Forschern bei der Datenanalyse oder Physikern bei komplexen mathematischen Formeln unterstützen.

Auch neue Software erfindet manchmal Antworten

Aus den Unterlagen geht hervor, dass das neue Modell bei einer Testauswahl von 100.000 Anfragen in 0,38 Prozent der Fälle wissentlich falsche Antworten gab. Dies geschah insbesondere, wenn OpenAI o1 gebeten wurde, auf Artikel, Websites oder Bücher zu verweisen.

Ohne Zugang zur Internet-Suche war dies oft nicht möglich. So erfand die KI selbst plausibel wirkende Beispiele. Die Software wollte jedoch stets nur die Wünsche der Nutzer erfüllen. Die sogenannten "Halluzinationen", bei denen KI-Software Informationen einfach erfindet, bleiben ein ungelöstes Problem.

ChatGPT, der Chatbot, der vor über einem Jahr den Hype um Künstliche Intelligenz entfachte, nutzt KI, um Texte auf menschlichem Niveau zu formulieren, Software-Code zu schreiben und Informationen zusammenzufassen. Diese KI-Programme werden mit enormen Datenmengen trainiert und arbeiten nach dem Prinzip, dass sie Wort für Wort beurteilen, wie ein Satz weitergehen sollte.

Mehr zum Thema
article:fokus_txt
DWN
Panorama
Panorama Die spektakulärsten Weihnachtsbäume weltweit: Wenn Tradition zur Show wird
26.12.2025

Lichtermeere, Rekordhöhen und ungewöhnliche Kulissen: Rund um den Globus werden Weihnachtsbäume zu echten Spektakeln. Von italienischen...

DWN
Immobilien
Immobilien The Line: Saudi Arabiens hochgestapelte Megacity quer durch die Wüste
26.12.2025

Eines der wohl ambitioniertesten und innovativsten Infrastrukturprojekte unserer Zeit ist The Line. Die von Saudi-Arabien geplante...

DWN
Finanzen
Finanzen Dotcom-Blase der 1990er: Wie Spekulationen den Markt auf den Kopf stellte
26.12.2025

Die späten 1990er Jahre waren geprägt von einem beispiellosen Börsenboom im Technologiesektor, der als Dotcom-Blase bekannt wurde....

DWN
Politik
Politik Demokratie unter Dauerstress: Der globale Trend zur Autokratie
26.12.2025

2026 könnte zum Wendepunkt werden: Von Washington bis Berlin geraten liberale Demokratien unter Druck. Autokraten gewinnen Einfluss,...

DWN
Wirtschaft
Wirtschaft Prognose: Startet die deutsche Wirtschaft 2026 endlich durch?
25.12.2025

Drei Jahre Flaute, kaum Wachstum – doch 2026 könnte die deutsche Wirtschaft endlich drehen. Prognosen deuten auf leichte Erholung,...

DWN
Finanzen
Finanzen Bundesbank: Zahlungen per Smartphone steigen sprunghaft an
25.12.2025

Immer mehr Menschen zücken zum Bezahlen das Smartphone. Hinter den allermeisten Transaktionen stecken heute noch Debitkarten. Das könnte...

DWN
Finanzen
Finanzen Bankenpleite: Was passiert mit meinem Geld?
25.12.2025

Es ist eine tiefe Angst vieler Menschen – die eigene Bank, der man sein Erspartes anvertraut hat, geht bankrott. Erfahren Sie hier, wie...

DWN
Finanzen
Finanzen Stablecoins vs. Digitaler Euro: Wie digitales Geld den globalen Zahlungsverkehr verändert
25.12.2025

Digitale Zahlungsmittel gewinnen zunehmend an Bedeutung und verändern, wie Geld transferiert und gespeichert wird. Stablecoins dringen in...