Technologie

Neues KI-Modell von OpenAI für komplexe Aufgaben

OpenAI, der Entwickler von ChatGPT, hat ein neues KI-Modell vorgestellt, das in der Lage ist, komplexere Aufgaben als frühere Chatbots zu bewältigen. Die Software namens o1 investiert mehr Zeit in das "Nachdenken", bevor sie eine Antwort liefert - "so wie es ein Mensch tun würde".
13.09.2024 12:17
Lesezeit: 1 min

Die Künstliche Intelligenz testet dabei verschiedene Ansätze und identifiziert sowie korrigiert eigenständig ihre Fehler, erläutert OpenAI in einem Blogeintrag.

Dies zeigt sich besonders bei Mathematik und der Programmierung von Software. Das o1-Modell hat 83 Prozent der Aufgaben der Prüfung zur Internationalen Mathematik-Olympiade gelöst, während das aktuelle ChatGPT-4o nur 13 Prozent bewältigte. Allerdings fehlen dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So kann es nicht im Internet nach Informationen suchen und unterstützt weder das Hochladen von Dateien noch von Bildern - zudem ist es derzeit langsamer.

Laut OpenAI kann das neue Modell Forschern bei der Datenanalyse oder Physikern bei komplexen mathematischen Formeln unterstützen.

Auch neue Software erfindet manchmal Antworten

Aus den Unterlagen geht hervor, dass das neue Modell bei einer Testauswahl von 100.000 Anfragen in 0,38 Prozent der Fälle wissentlich falsche Antworten gab. Dies geschah insbesondere, wenn OpenAI o1 gebeten wurde, auf Artikel, Websites oder Bücher zu verweisen.

Ohne Zugang zur Internet-Suche war dies oft nicht möglich. So erfand die KI selbst plausibel wirkende Beispiele. Die Software wollte jedoch stets nur die Wünsche der Nutzer erfüllen. Die sogenannten "Halluzinationen", bei denen KI-Software Informationen einfach erfindet, bleiben ein ungelöstes Problem.

ChatGPT, der Chatbot, der vor über einem Jahr den Hype um Künstliche Intelligenz entfachte, nutzt KI, um Texte auf menschlichem Niveau zu formulieren, Software-Code zu schreiben und Informationen zusammenzufassen. Diese KI-Programme werden mit enormen Datenmengen trainiert und arbeiten nach dem Prinzip, dass sie Wort für Wort beurteilen, wie ein Satz weitergehen sollte.

Mehr zum Thema
Bleiben Sie über das Thema dieses Artikels auf dem Laufenden Klicken Sie auf [+], um eine E-Mail zu erhalten, sobald wir einen neuen Artikel mit diesem Tag veröffentlichen
Anzeige
DWN
Finanzen
Finanzen XRP-Ledger-Transaktionsvolumen überschreitet die Marke von 1 Million

Analysten erwarten ein Aufwärtspotenzial von 100%. XRP Wie können Inhaber neue passive Einkommensquellen schaffen?

X
DWN-Wochenrückblick

Weniger E-Mails, mehr Substanz: Der DWN-Wochenrückblick liefert 1x/Woche die wichtigsten Themen kompakt als Podcast. Für alle, deren Postfach überläuft.

E-mail: *

Ich habe die Datenschutzerklärung sowie die AGB gelesen und erkläre mich einverstanden.

DWN
Finanzen
Finanzen US-Marktbericht: SpaceX fällt zum ersten Mal seit dem Börsengang, während die CME Group ihren CEO verliert
17.06.2026

Ein turbulenter Handelstag an der Wall Street bringt unerwartete Wendungen für Anleger.

DWN
Unternehmen
Unternehmen VW-Aktie vorm Dauerabsturz? Autokonzern existenzgefährdet - VW-Bosse schlagen Alarm
17.06.2026

Hiobsbotschaft vor der Hauptversammlung: Bei Volkswagen bewertet das Top-Management die Lage des Autokonzerns als schlecht – und zwar...

DWN
Panorama
Panorama Fußball-WM 2026: Welche Mannschaft bei der Weltmeisterschaft am meisten wert ist
17.06.2026

Die teuersten Teams bei der Fußball-WM 2026 kommen überwiegend aus Europa. Doch die Marktwerte zeigen vor allem eines: Geld erhöht die...

DWN
Finanzen
Finanzen Fed-Zinsentscheid: Warsh ignoriert Trump - US-Notenbank lässt Leitzins unverändert
17.06.2026

Zum vierten Mal im laufenden Jahr bleibt der US-Leitzins unverändert. Das dürfte vor allem US-Präsident Trump ärgern, der mit dem...

DWN
Unternehmen
Unternehmen Baumarktkette Hellweg meldet Insolvenz an: 2900 Mitarbeiter betroffen
17.06.2026

Hellweg meldet Insolvenz in Eigenverwaltung an: Alle Filialen und der Online-Shop des Dortmunder Unternehmens bleiben vorerst geöffnet....

DWN
Politik
Politik „Jagd auf Migranten“: ZDF streicht falsche Musk-Anmoderation aus Mediathek
17.06.2026

Das ZDF wirft Elon Musk vor, die Ausschreitungen in Belfast befeuert zu haben. Dieser wehrt sich daraufhin juristisch. Der...

DWN
Finanzen
Finanzen Fed-Zinsentscheid könnte dramatischen Wandel auslösen: Stehen wir an der Schwelle zu einer neuen Ära?
17.06.2026

Mit Kevin Warsh steht ein neuer Chef an der Spitze der US-Notenbank, der mit jahrzehntealten Traditionen brechen könnte. Seine Pläne für...

DWN
Wirtschaft
Wirtschaft Europas Drohnenmarkt Polen führt, doch die eigene Industrie wächst erst
17.06.2026

Polen ist der größte Drohnenexporteur Europas. In diesem Jahr könnte der Export von Drohnen aus Polen die Marke von einer Milliarde Euro...