Technologie

Neues KI-Modell von OpenAI für komplexe Aufgaben

OpenAI, der Entwickler von ChatGPT, hat ein neues KI-Modell vorgestellt, das in der Lage ist, komplexere Aufgaben als frühere Chatbots zu bewältigen. Die Software namens o1 investiert mehr Zeit in das "Nachdenken", bevor sie eine Antwort liefert - "so wie es ein Mensch tun würde".
13.09.2024 12:17
Lesezeit: 1 min

Die Künstliche Intelligenz testet dabei verschiedene Ansätze und identifiziert sowie korrigiert eigenständig ihre Fehler, erläutert OpenAI in einem Blogeintrag.

Dies zeigt sich besonders bei Mathematik und der Programmierung von Software. Das o1-Modell hat 83 Prozent der Aufgaben der Prüfung zur Internationalen Mathematik-Olympiade gelöst, während das aktuelle ChatGPT-4o nur 13 Prozent bewältigte. Allerdings fehlen dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So kann es nicht im Internet nach Informationen suchen und unterstützt weder das Hochladen von Dateien noch von Bildern - zudem ist es derzeit langsamer.

Laut OpenAI kann das neue Modell Forschern bei der Datenanalyse oder Physikern bei komplexen mathematischen Formeln unterstützen.

Auch neue Software erfindet manchmal Antworten

Aus den Unterlagen geht hervor, dass das neue Modell bei einer Testauswahl von 100.000 Anfragen in 0,38 Prozent der Fälle wissentlich falsche Antworten gab. Dies geschah insbesondere, wenn OpenAI o1 gebeten wurde, auf Artikel, Websites oder Bücher zu verweisen.

Ohne Zugang zur Internet-Suche war dies oft nicht möglich. So erfand die KI selbst plausibel wirkende Beispiele. Die Software wollte jedoch stets nur die Wünsche der Nutzer erfüllen. Die sogenannten "Halluzinationen", bei denen KI-Software Informationen einfach erfindet, bleiben ein ungelöstes Problem.

ChatGPT, der Chatbot, der vor über einem Jahr den Hype um Künstliche Intelligenz entfachte, nutzt KI, um Texte auf menschlichem Niveau zu formulieren, Software-Code zu schreiben und Informationen zusammenzufassen. Diese KI-Programme werden mit enormen Datenmengen trainiert und arbeiten nach dem Prinzip, dass sie Wort für Wort beurteilen, wie ein Satz weitergehen sollte.

Mehr zum Thema
Bleiben Sie über das Thema dieses Artikels auf dem Laufenden Klicken Sie auf [+], um eine E-Mail zu erhalten, sobald wir einen neuen Artikel mit diesem Tag veröffentlichen
Anzeige
DWN
Technologie
Technologie Wie Twitch, Kick & Co. die Unterhaltungsbranche prägen

Das Bild der Unterhaltungsbranche hat sich dramatisch gewandelt. Dabei wurde aus einer Einbahnstraße eine Autobahn mit unzähligen Spuren...

X
DWN-Wochenrückblick

Weniger E-Mails, mehr Substanz: Der DWN-Wochenrückblick liefert 1x/Woche die wichtigsten Themen kompakt als Podcast. Für alle, deren Postfach überläuft.

E-mail: *

Ich habe die Datenschutzerklärung sowie die AGB gelesen und erkläre mich einverstanden.

DWN
Finanzen
Finanzen EZB: Bedeutung des Euro an den weltweiten Finanzmärkten wächst
02.06.2026

Die Notenbank will die globale Rolle des Euro stärken, nicht zuletzt als Antwort auf Trump. Sie sieht mehr Potenzial für Europas Währung...

DWN
Politik
Politik Begeht Amerika gerade wirtschaftlichen Selbstmord?
02.06.2026

Die USA galten über Jahrzehnte als Motor der Weltwirtschaft, doch unter Trump geraten genau jene Kräfte unter Druck, die ihren Aufstieg...

DWN
Wirtschaft
Wirtschaft Iran-Krieg treibt Inflation im Euroraum auf 3,2 Prozent
02.06.2026

Der Ölpreisschock infolge des Iran-Krieges treibt die Verbraucherpreise im Euroraum weiter nach oben. Damit wächst der Druck auf die...

DWN
Finanzen
Finanzen Trade Republic attackiert Europas Banken mit sechs Prozent Zinsen
02.06.2026

Sechs Prozent Zinsen, Brad Pitt im Werbespot und ein deutscher Anbieter, der in Polen plötzlich klassische Banken herausfordert. Trade...

DWN
Unternehmen
Unternehmen Unicredit schnappt sich offenbar mehr als 30 Prozent von Commerzbank
02.06.2026

Unicredit kommt ihrem Ziel bei der Commerzbank einen entscheidenden Schritt näher. Mit dem Überschreiten der 30-Prozent-Marke stärkt die...

DWN
Wirtschaft
Wirtschaft Mythos Fachkräftemangel beendet: Deutschlands Arbeitsmarkt bricht langfristig ein
02.06.2026

Schwache Frühjahrsbelebung, keine Trendumkehr: Der deutsche Arbeitsmarkt kippt langfristig in eine neue Massenarbeitslosigkeit. Warum es...

DWN
Politik
Politik Nukleare Abschreckung wird zur Machtprobe für Europa
02.06.2026

Norwegen rückt an Frankreichs Atomschirm heran, und plötzlich wirkt Europas Sicherheitsarchitektur weniger stabil als lange behauptet....

DWN
Finanzen
Finanzen Konsumdruck im Alltag: Wie Sparen dennoch funktionieren kann
02.06.2026

Ob online oder im Alltag: Konsumreize lauern überall und machen es schwer, den Überblick über die eigenen Ausgaben zu behalten. Wer...