Technologie

Neues KI-Modell von OpenAI für komplexe Aufgaben

OpenAI, der Entwickler von ChatGPT, hat ein neues KI-Modell vorgestellt, das in der Lage ist, komplexere Aufgaben als frühere Chatbots zu bewältigen. Die Software namens o1 investiert mehr Zeit in das "Nachdenken", bevor sie eine Antwort liefert - "so wie es ein Mensch tun würde".
13.09.2024 12:17
Lesezeit: 1 min

Die Künstliche Intelligenz testet dabei verschiedene Ansätze und identifiziert sowie korrigiert eigenständig ihre Fehler, erläutert OpenAI in einem Blogeintrag.

Dies zeigt sich besonders bei Mathematik und der Programmierung von Software. Das o1-Modell hat 83 Prozent der Aufgaben der Prüfung zur Internationalen Mathematik-Olympiade gelöst, während das aktuelle ChatGPT-4o nur 13 Prozent bewältigte. Allerdings fehlen dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So kann es nicht im Internet nach Informationen suchen und unterstützt weder das Hochladen von Dateien noch von Bildern - zudem ist es derzeit langsamer.

Laut OpenAI kann das neue Modell Forschern bei der Datenanalyse oder Physikern bei komplexen mathematischen Formeln unterstützen.

Auch neue Software erfindet manchmal Antworten

Aus den Unterlagen geht hervor, dass das neue Modell bei einer Testauswahl von 100.000 Anfragen in 0,38 Prozent der Fälle wissentlich falsche Antworten gab. Dies geschah insbesondere, wenn OpenAI o1 gebeten wurde, auf Artikel, Websites oder Bücher zu verweisen.

Ohne Zugang zur Internet-Suche war dies oft nicht möglich. So erfand die KI selbst plausibel wirkende Beispiele. Die Software wollte jedoch stets nur die Wünsche der Nutzer erfüllen. Die sogenannten "Halluzinationen", bei denen KI-Software Informationen einfach erfindet, bleiben ein ungelöstes Problem.

ChatGPT, der Chatbot, der vor über einem Jahr den Hype um Künstliche Intelligenz entfachte, nutzt KI, um Texte auf menschlichem Niveau zu formulieren, Software-Code zu schreiben und Informationen zusammenzufassen. Diese KI-Programme werden mit enormen Datenmengen trainiert und arbeiten nach dem Prinzip, dass sie Wort für Wort beurteilen, wie ein Satz weitergehen sollte.

Mehr zum Thema
article:fokus_txt
DWN
Finanzen
Finanzen Halbleiter-Aktien: Wie die ASML-Aktie zur europäischen Macht im Chipsektor wird
08.12.2025

Die US-Großbank Bank of America setzt in Europa auf einen Chipkonzern, der in einem neuen Wachstumszyklus steckt und die Branche unter...

DWN
Politik
Politik EU-Staaten beschließen schärfere Migrationspolitik
08.12.2025

Die EU zieht die Zügel in der Migrationspolitik an: Abschiebungen sollen leichter, Verteilung verpflichtender werden. Doch neue Regeln zu...

DWN
Politik
Politik Russland tobt nach Interview mit ehemaligen NATO-General Rob Bauer
08.12.2025

Ein explosiver Schlagabtausch zwischen Russland und einem früheren NATO-Spitzenoffizier schürt neue Ängste vor einer Eskalation. Moskau...

DWN
Politik
Politik EU-Kommission: Vorschläge zum Verbrenner-Aus nächste Woche
08.12.2025

Die EU-Kommission legt am 16.12. neue Vorschläge zum Verbrenner-Aus vor. Nach wachsender Kritik aus Industrie, Politik und Bevölkerung...

DWN
Finanzen
Finanzen Confluent-Aktie auf Höhenflug: IBM will Dateninfrastruktur-Spezialisten Confluent kaufen
08.12.2025

Ein Mega-Deal rückt die Confluent-Aktie schlagartig ins Rampenlicht: IBM bietet Milliarden für den Datenstreaming-Spezialisten Confluent....

DWN
Wirtschaft
Wirtschaft VDA rechnet 2026 mit rund 693.000 neuen E-Autos
08.12.2025

Deutschlands Autokäufer stehen vor einem elektrischen Wendepunkt: Verbände prognostizieren deutliche Zuwächse bei Elektroautos und...

DWN
Wirtschaft
Wirtschaft Machtwechsel im Arbeitsmarkt 2025: Arbeitgeber geben wieder den Ton an
08.12.2025

Der Wind am Arbeitsmarkt 2025 dreht sich offenbar: Nach Jahren der Bewerbermacht gewinnen Unternehmen wieder Spielraum. Jan-Niklas Hustedt,...

DWN
Wirtschaft
Wirtschaft Insolvenzzahlen 2025: Warum Firmenpleiten weiter steigen
08.12.2025

Deutschlands Insolvenzzahlen klettern auf den höchsten Stand seit Jahren. Besonders Mittelstand, Handel und Autozulieferer geraten unter...