Technologie

Neues KI-Modell von OpenAI für komplexe Aufgaben

OpenAI, der Entwickler von ChatGPT, hat ein neues KI-Modell vorgestellt, das in der Lage ist, komplexere Aufgaben als frühere Chatbots zu bewältigen. Die Software namens o1 investiert mehr Zeit in das "Nachdenken", bevor sie eine Antwort liefert - "so wie es ein Mensch tun würde".
13.09.2024 12:17
Lesezeit: 1 min

Die Künstliche Intelligenz testet dabei verschiedene Ansätze und identifiziert sowie korrigiert eigenständig ihre Fehler, erläutert OpenAI in einem Blogeintrag.

Dies zeigt sich besonders bei Mathematik und der Programmierung von Software. Das o1-Modell hat 83 Prozent der Aufgaben der Prüfung zur Internationalen Mathematik-Olympiade gelöst, während das aktuelle ChatGPT-4o nur 13 Prozent bewältigte. Allerdings fehlen dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So kann es nicht im Internet nach Informationen suchen und unterstützt weder das Hochladen von Dateien noch von Bildern - zudem ist es derzeit langsamer.

Laut OpenAI kann das neue Modell Forschern bei der Datenanalyse oder Physikern bei komplexen mathematischen Formeln unterstützen.

Auch neue Software erfindet manchmal Antworten

Aus den Unterlagen geht hervor, dass das neue Modell bei einer Testauswahl von 100.000 Anfragen in 0,38 Prozent der Fälle wissentlich falsche Antworten gab. Dies geschah insbesondere, wenn OpenAI o1 gebeten wurde, auf Artikel, Websites oder Bücher zu verweisen.

Ohne Zugang zur Internet-Suche war dies oft nicht möglich. So erfand die KI selbst plausibel wirkende Beispiele. Die Software wollte jedoch stets nur die Wünsche der Nutzer erfüllen. Die sogenannten "Halluzinationen", bei denen KI-Software Informationen einfach erfindet, bleiben ein ungelöstes Problem.

ChatGPT, der Chatbot, der vor über einem Jahr den Hype um Künstliche Intelligenz entfachte, nutzt KI, um Texte auf menschlichem Niveau zu formulieren, Software-Code zu schreiben und Informationen zusammenzufassen. Diese KI-Programme werden mit enormen Datenmengen trainiert und arbeiten nach dem Prinzip, dass sie Wort für Wort beurteilen, wie ein Satz weitergehen sollte.

Mehr zum Thema
Bleiben Sie über das Thema dieses Artikels auf dem Laufenden Klicken Sie auf [+], um eine E-Mail zu erhalten, sobald wir einen neuen Artikel mit diesem Tag veröffentlichen
Anzeige
DWN
Technologie
Technologie Lageroptimierung als Wettbewerbsfaktor im Mittelstand

In Zeiten steigenden Wettbewerbsdrucks, globaler Lieferketten und wachsender Kundenerwartungen wird die Effizienz interner Prozesse zu...

X

DWN-Wochenrückblick

Weniger E-Mails, mehr Substanz: Der DWN-Wochenrückblick liefert 1x/Woche die wichtigsten Themen kompakt als Podcast. Für alle, deren Postfach überläuft.

E-mail: *

Ich habe die Datenschutzerklärung sowie die AGB gelesen und erkläre mich einverstanden.

DWN
Wirtschaft
Wirtschaft Experten schlagen Alarm: Straße von Hormus könnte monatelang blockiert werden
05.03.2026

Experten warnen, dass Iran die für den globalen Ölhandel zentrale Straße von Hormus über längere Zeit unter Druck setzen könnte. Wie...

DWN
Politik
Politik Bürgergeld-Reform beschlossen: Strengere Regeln für 5,5 Millionen Empfänger
05.03.2026

Der Bundestag zieht die Zügel beim Bürgergeld deutlich an: strengere Regeln, härtere Sanktionen, mehr Druck zur Arbeitsaufnahme....

DWN
Finanzen
Finanzen Renk-Aktie: Dividende und Ausblick unter Druck
05.03.2026

Die Renk-Aktie schwankt weiter trotz Rekordumsätzen und stabiler Dividende. Analysten sehen Chancen für Investoren in einem geopolitisch...

DWN
Politik
Politik Putin-Gas: EU wird der Hahn abgedreht, Russland prüft vorzeitiges Embargo
05.03.2026

Putin erwägt, Gaslieferungen an die EU vorzeitig zu stoppen. Ein solches Vorgehen könnte die Energiepreise massiv anheizen.

DWN
Unternehmen
Unternehmen Überverantwortung im Job: Wenn Engagement zur Dauerbelastung wird – diese Lösungen gibt es
05.03.2026

Überverantwortung im Job gilt oft als Tugend: engagiert, gewissenhaft, verlässlich. Doch wer dauerhaft mehr trägt, als eigentlich...

DWN
Finanzen
Finanzen Bitcoin und KI: Warum Maschinen die Cyberdevise bevorzugen
05.03.2026

Bitcoin behauptet sich als bevorzugtes Geld der Künstlichen Intelligenz – Fiatgeld verliert deutlich. Die Studie des BPI offenbart,...

DWN
Finanzen
Finanzen Bundesbank macht Verlust von 8,6 Milliarden Euro
05.03.2026

Die Bundesbank schreibt erneut Milliardenverluste, eine Auszahlung an den Bund bleibt aus. Die Geldpolitik der EZB hinterlässt tiefe...

DWN
Politik
Politik Iran-Krieg: Auswirkungen auf Russlands Krieg in der Ukraine
05.03.2026

Der Iran-Krieg überschattet den Ukraine-Konflikt und verunsichert Kiew wie Moskau. Besonders Waffenlieferungen und Drohnenstrategien...