Technologie

Neues KI-Modell von OpenAI für komplexe Aufgaben

OpenAI, der Entwickler von ChatGPT, hat ein neues KI-Modell vorgestellt, das in der Lage ist, komplexere Aufgaben als frühere Chatbots zu bewältigen. Die Software namens o1 investiert mehr Zeit in das "Nachdenken", bevor sie eine Antwort liefert - "so wie es ein Mensch tun würde".
13.09.2024 12:17
Lesezeit: 1 min

Die Künstliche Intelligenz testet dabei verschiedene Ansätze und identifiziert sowie korrigiert eigenständig ihre Fehler, erläutert OpenAI in einem Blogeintrag.

Dies zeigt sich besonders bei Mathematik und der Programmierung von Software. Das o1-Modell hat 83 Prozent der Aufgaben der Prüfung zur Internationalen Mathematik-Olympiade gelöst, während das aktuelle ChatGPT-4o nur 13 Prozent bewältigte. Allerdings fehlen dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So kann es nicht im Internet nach Informationen suchen und unterstützt weder das Hochladen von Dateien noch von Bildern - zudem ist es derzeit langsamer.

Laut OpenAI kann das neue Modell Forschern bei der Datenanalyse oder Physikern bei komplexen mathematischen Formeln unterstützen.

Auch neue Software erfindet manchmal Antworten

Aus den Unterlagen geht hervor, dass das neue Modell bei einer Testauswahl von 100.000 Anfragen in 0,38 Prozent der Fälle wissentlich falsche Antworten gab. Dies geschah insbesondere, wenn OpenAI o1 gebeten wurde, auf Artikel, Websites oder Bücher zu verweisen.

Ohne Zugang zur Internet-Suche war dies oft nicht möglich. So erfand die KI selbst plausibel wirkende Beispiele. Die Software wollte jedoch stets nur die Wünsche der Nutzer erfüllen. Die sogenannten "Halluzinationen", bei denen KI-Software Informationen einfach erfindet, bleiben ein ungelöstes Problem.

ChatGPT, der Chatbot, der vor über einem Jahr den Hype um Künstliche Intelligenz entfachte, nutzt KI, um Texte auf menschlichem Niveau zu formulieren, Software-Code zu schreiben und Informationen zusammenzufassen. Diese KI-Programme werden mit enormen Datenmengen trainiert und arbeiten nach dem Prinzip, dass sie Wort für Wort beurteilen, wie ein Satz weitergehen sollte.

Mehr zum Thema
Bleiben Sie über das Thema dieses Artikels auf dem Laufenden Klicken Sie auf [+], um eine E-Mail zu erhalten, sobald wir einen neuen Artikel mit diesem Tag veröffentlichen
X

DWN-Wochenrückblick

Weniger E-Mails, mehr Substanz: Der DWN-Wochenrückblick liefert 1x/Woche die wichtigsten Themen kompakt als Podcast. Für alle, deren Postfach überläuft.

E-mail: *

Ich habe die Datenschutzerklärung sowie die AGB gelesen und erkläre mich einverstanden.

DWN
Unternehmen
Unternehmen Energie-Startup Enpal löst Kundenservice auf: Massenentlassung ohne Vorwarnung
04.04.2026

Das hoch bewertete Berliner Energie-Startup Enpal, Marktführer in Deutschland für Photovoltaik-Anlagen sowie Wärmepumpen, hat knapp 100...

DWN
Panorama
Panorama Handarbeit am Limit: Das Rätsel um die roten Roben an den obersten Gerichtshöfen
04.04.2026

Jeder kennt sie aus den Nachrichten, doch kaum jemand weiß, wie schwer sie zu bekommen sind. Die roten Roben unserer Bundesrichter sind...

DWN
Finanzen
Finanzen Wird die EZB die Zinsen anheben? Investoren und Banken sind sich uneins
04.04.2026

Die meisten Anleger sind davon überzeugt, dass die Europäische Zentralbank (EZB) die Zinsen in diesem Jahr anheben wird. Banken sind da...

DWN
Unternehmen
Unternehmen Die digitale Zwangsjacke kommt: Warum Mittelständler ihre IT umbauen müssen
04.04.2026

Von E-Rechnung über KI-Haftung bis zu strengeren Nachhaltigkeitsregeln: Auf deutsche Unternehmen kommen zahlreiche neue Vorschriften zu....

DWN
Unternehmen
Unternehmen BMW i3 im Test: Angriff auf Tesla und China mit neuer Elektrostrategie
04.04.2026

Elektroautos galten lange als Kompromiss aus Reichweite und Ladezeit. Der neue BMW i3 stellt diese Logik infrage und zeigt, wie schnell...

DWN
Unternehmen
Unternehmen Künstliche Intelligenz in der Führung: Warum Empathie zur Mangelware wird
04.04.2026

Künstliche Intelligenz schreibt E-Mails, analysiert Daten und simuliert sogar Mitgefühl. Doch ausgerechnet in der Führungsetage droht...

DWN
Panorama
Panorama WhatsApp Link-Vorschau: Verstecktes Datenschutzrisiko – was Nutzer wissen sollten
04.04.2026

Die praktische Link-Vorschau bei WhatsApp spart Zeit und Klicks im Alltag. Doch im Hintergrund könnten sensible Informationen übertragen...

DWN
Politik
Politik Referendum mit Signalwirkung: Schweiz debattiert über Bevölkerungsgrenze
04.04.2026

Die Schweiz stimmt im Juni über eine Begrenzung der Bevölkerung auf zehn Millionen Menschen ab. Ist das ein radikaler Sonderweg oder...