Technologie

Neues KI-Modell von OpenAI für komplexe Aufgaben

OpenAI, der Entwickler von ChatGPT, hat ein neues KI-Modell vorgestellt, das in der Lage ist, komplexere Aufgaben als frühere Chatbots zu bewältigen. Die Software namens o1 investiert mehr Zeit in das "Nachdenken", bevor sie eine Antwort liefert - "so wie es ein Mensch tun würde".
13.09.2024 12:17
Lesezeit: 1 min

Die Künstliche Intelligenz testet dabei verschiedene Ansätze und identifiziert sowie korrigiert eigenständig ihre Fehler, erläutert OpenAI in einem Blogeintrag.

Dies zeigt sich besonders bei Mathematik und der Programmierung von Software. Das o1-Modell hat 83 Prozent der Aufgaben der Prüfung zur Internationalen Mathematik-Olympiade gelöst, während das aktuelle ChatGPT-4o nur 13 Prozent bewältigte. Allerdings fehlen dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So kann es nicht im Internet nach Informationen suchen und unterstützt weder das Hochladen von Dateien noch von Bildern - zudem ist es derzeit langsamer.

Laut OpenAI kann das neue Modell Forschern bei der Datenanalyse oder Physikern bei komplexen mathematischen Formeln unterstützen.

Auch neue Software erfindet manchmal Antworten

Aus den Unterlagen geht hervor, dass das neue Modell bei einer Testauswahl von 100.000 Anfragen in 0,38 Prozent der Fälle wissentlich falsche Antworten gab. Dies geschah insbesondere, wenn OpenAI o1 gebeten wurde, auf Artikel, Websites oder Bücher zu verweisen.

Ohne Zugang zur Internet-Suche war dies oft nicht möglich. So erfand die KI selbst plausibel wirkende Beispiele. Die Software wollte jedoch stets nur die Wünsche der Nutzer erfüllen. Die sogenannten "Halluzinationen", bei denen KI-Software Informationen einfach erfindet, bleiben ein ungelöstes Problem.

ChatGPT, der Chatbot, der vor über einem Jahr den Hype um Künstliche Intelligenz entfachte, nutzt KI, um Texte auf menschlichem Niveau zu formulieren, Software-Code zu schreiben und Informationen zusammenzufassen. Diese KI-Programme werden mit enormen Datenmengen trainiert und arbeiten nach dem Prinzip, dass sie Wort für Wort beurteilen, wie ein Satz weitergehen sollte.

Mehr zum Thema
article:fokus_txt
DWN
Finanzen
Finanzen Hexensabbat: Großer Verfallstag an den Terminbörsen lässt Kurse tanzen
19.12.2025

Wenn an den Terminbörsen der Hexensabbat naht, steigt die Nervosität: Kontrakte laufen aus, Volumen schießt hoch, Kurse zucken. Anleger...

DWN
Politik
Politik Venezuela-Sanktionen: Machtprobe auf See mit globalen Folgen
19.12.2025

Donald Trump greift im Machtkampf mit Caracas zu einem drastischen Mittel. Die vollständige Blockade sanktionierter Öl-Tanker soll...

DWN
Finanzen
Finanzen Aurubis-Aktie: Lieferkettenvorwürfe belasten Hamburger Kupferkonzern
19.12.2025

Gegen den Hamburger Kupferkonzern Aurubis sind neue Beschwerden nach dem Lieferkettensorgfaltspflichtengesetz eingereicht worden. Im...

DWN
Wirtschaft
Wirtschaft Erzeugerpreise sinken weiter: Energie drückt den Index
19.12.2025

Sinkende Energiepreise drücken die Erzeugerpreise in Deutschland weiter nach unten. Der Abstand zum Vorjahr wächst, während sich im...

DWN
Wirtschaft
Wirtschaft Ifo-Beschäftigungsbarometer sinkt weiter: Alarmzeichen zum Jahresende für den deutschen Arbeitsmarkt
19.12.2025

Trotz Konjunkturpaket kippt die Stimmung am Arbeitsmarkt: Das Beschäftigungsbarometer fällt weiter und signalisiert wachsende...

DWN
Politik
Politik EU sichert Ukraine-Finanzierung bis 2027 – Moskau spottet
19.12.2025

Die EU hat sich nach zähem Ringen auf eine Ukraine-Finanzierung bis 2027 geeinigt. Ein zinsloser Kredit über 90 Milliarden Euro soll...

DWN
Immobilien
Immobilien Baugenehmigungen steigen wieder: Eigenheime besonders gefragt
19.12.2025

Nach langer Flaute werden in Deutschland wieder deutlich mehr Wohnungen genehmigt. Vor allem bei Einfamilienhäusern zieht die Nachfrage...

DWN
Technologie
Technologie Lothar Schupet: Warum ich nach 23 Jahren BMW für ein chinesisches Startup verlassen habe
19.12.2025

Ein deutscher Topmanager verlässt nach 23 Jahren einen der mächtigsten Autokonzerne Europas und geht ausgerechnet zu einem chinesischen...