Technologie

Neues KI-Modell von OpenAI für komplexe Aufgaben

OpenAI, der Entwickler von ChatGPT, hat ein neues KI-Modell vorgestellt, das in der Lage ist, komplexere Aufgaben als frühere Chatbots zu bewältigen. Die Software namens o1 investiert mehr Zeit in das "Nachdenken", bevor sie eine Antwort liefert - "so wie es ein Mensch tun würde".
13.09.2024 12:17
Lesezeit: 1 min

Die Künstliche Intelligenz testet dabei verschiedene Ansätze und identifiziert sowie korrigiert eigenständig ihre Fehler, erläutert OpenAI in einem Blogeintrag.

Dies zeigt sich besonders bei Mathematik und der Programmierung von Software. Das o1-Modell hat 83 Prozent der Aufgaben der Prüfung zur Internationalen Mathematik-Olympiade gelöst, während das aktuelle ChatGPT-4o nur 13 Prozent bewältigte. Allerdings fehlen dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So kann es nicht im Internet nach Informationen suchen und unterstützt weder das Hochladen von Dateien noch von Bildern - zudem ist es derzeit langsamer.

Laut OpenAI kann das neue Modell Forschern bei der Datenanalyse oder Physikern bei komplexen mathematischen Formeln unterstützen.

Auch neue Software erfindet manchmal Antworten

Aus den Unterlagen geht hervor, dass das neue Modell bei einer Testauswahl von 100.000 Anfragen in 0,38 Prozent der Fälle wissentlich falsche Antworten gab. Dies geschah insbesondere, wenn OpenAI o1 gebeten wurde, auf Artikel, Websites oder Bücher zu verweisen.

Ohne Zugang zur Internet-Suche war dies oft nicht möglich. So erfand die KI selbst plausibel wirkende Beispiele. Die Software wollte jedoch stets nur die Wünsche der Nutzer erfüllen. Die sogenannten "Halluzinationen", bei denen KI-Software Informationen einfach erfindet, bleiben ein ungelöstes Problem.

ChatGPT, der Chatbot, der vor über einem Jahr den Hype um Künstliche Intelligenz entfachte, nutzt KI, um Texte auf menschlichem Niveau zu formulieren, Software-Code zu schreiben und Informationen zusammenzufassen. Diese KI-Programme werden mit enormen Datenmengen trainiert und arbeiten nach dem Prinzip, dass sie Wort für Wort beurteilen, wie ein Satz weitergehen sollte.

Mehr zum Thema
Bleiben Sie über das Thema dieses Artikels auf dem Laufenden Klicken Sie auf [+], um eine E-Mail zu erhalten, sobald wir einen neuen Artikel mit diesem Tag veröffentlichen
Anzeige
DWN
Technologie
Technologie Das Thema Datenschutz ist als Verkaufsargument erneut in den Fokus gerückt

Nicht nur im Bankwesen oder in den sozialen Medien spielt der Datenschutz bei alltäglichen Kaufentscheidungen eine wichtige Rolle. Auch...

X

DWN-Wochenrückblick

Weniger E-Mails, mehr Substanz: Der DWN-Wochenrückblick liefert 1x/Woche die wichtigsten Themen kompakt als Podcast. Für alle, deren Postfach überläuft.

E-mail: *

Ich habe die Datenschutzerklärung sowie die AGB gelesen und erkläre mich einverstanden.

DWN
Wirtschaft
Wirtschaft Inflation steigt kurzfristig: IWF warnt vor Risiken für Märkte
09.04.2026

Der Iran-Krieg drückt auf das globale Wachstum und treibt die Preise. Selbst das optimistischste Szenario des IWF sieht jetzt eine...

DWN
Politik
Politik Waffenruhe im Golf: Straße von Hormus weiterhin eingeschränkt
09.04.2026

Die Waffenruhe im Golf sorgt weiterhin für Unsicherheit auf zentralen Handelsrouten und belastet Reedereien sowie Energiemärkte. Warum...

DWN
Politik
Politik 5 Prozent Inflation: Trotz Waffenstillstand droht erheblicher Kaufkraftverlust
09.04.2026

Es ist laut IEA die "schwerste fossile Energiekrise unserer Zeit" – und die Inflation zieht bereits spürbar an. Experten warnen vor...

DWN
Wirtschaft
Wirtschaft Firmenpleiten auf höchstem Stand seit mehr als 20 Jahren
09.04.2026

Mehr als 4.500 Firmen meldeten im ersten Quartal Insolvenz an – so viele wie seit 2005 nicht mehr. Besonders stark betroffen sind...

DWN
Politik
Politik Nach Waffenruhe: Wie ist der Stand in der Straße von Hormus?
09.04.2026

Der Iran will Maut verlangen. Was ist erlaubt, und wer könnte die Passage sichern? Antworten auf zentrale Fragen.

DWN
Wirtschaft
Wirtschaft Spritpreise fallen kaum: Ölpreis stürzt, Zapfsäule bremst
09.04.2026

Der Ölpreis bricht ein – doch an der Zapfsäule kommt davon kaum etwas an. Jetzt wächst der Druck auf Konzerne und Politik, die Preise...

DWN
Politik
Politik Streit um Rundfunkbeitrag: VGH prüft Programmvielfalt
09.04.2026

Neun Kläger vor dem VGH Baden-Württemberg weigern sich, den Rundfunkbeitrag zu zahlen. Sie bezweifeln die Ausgewogenheit der...

DWN
Panorama
Panorama Psychische Gesundheit: Was DiGAs bringen und wo es die App auf Rezept gibt
09.04.2026

Psychische Erkrankungen nehmen zu, Therapieplätze sind knapp. Digitale Gesundheitsanwendungen, sogenannte DiGAs, versprechen schnelle...