Technologie

KI-Neuerung: Neues ChatGPT führt jetzt Unterhaltungen - und singt

Die beliebte KI-App hat jetzt ein Update erhalten. Ein hilfreicher Sprachassistent, mit dem man sich wie mit einem Menschen unterhalten kann, blieb bisher Science Fiction. Doch nun kommt ChatGPT solchen Fähigkeiten näher. Die DWN berichten über die Veränderungen der App.
14.05.2024 10:09
Aktualisiert: 14.05.2024 10:09
Lesezeit: 3 min

Der populäre Chatbot ChatGPT kann jetzt auch eine Unterhaltung mit Menschen führen und deren Emotionen erkennen. Mit der natürlichen Stimme und der kurzen Reaktionszeit erinnert das neue KI-Modell GPT-4o an Sprachassistenten aus Hollywood-Filmen. Die Entwicklerfirma OpenAI wird es auch Gratis-Nutzern zur Verfügung stellen. Wie gut die Software Deutsch sprechen kann, blieb nach der Präsentation allerdings offen.

Mit Nutzern sprechen konnte ChatGPT im Prinzip schon vorher - aber mit Pausen zur Verarbeitung der Daten. Jetzt zeigte OpenAI, wie die Software den Tonfall von aufgeregt bis mitfühlend variieren kann - und auch fließend zwischen Englisch und Italienisch übersetzt. ChatGPT wird damit zu einem mächtigen Konkurrenten für die Sprachassistenten der Tech-Schwergewichte wie Amazons Alexa und Apples Siri, die im Vergleich dazu sehr schlicht wirken. Zuletzt gab es Medienberichte, Apple verhandele mit OpenAI über eine Integration von Technologie der Firma in seine Software.

Neu: Auch Infos von Smartphone werden verarbeitet

Weitere Neuerung: Gleichzeitig mit gesprochenen Befehlen kann ChatGPT auch Informationen von einer Smartphone-Kamera verarbeiten. In einem Livestream demonstrierte OpenAI unter anderem, wie das neue Modell dadurch helfen kann, eine Mathe-Gleichung zu lösen. ChatGPT gab per Stimme Ratschläge für den Rechenweg, ohne das Ergebnis zu verraten. Ein Mitarbeiter von OpenAI schrieb dafür die Gleichung auf einem Blatt Papier und richtete die Smartphone-Kamera darauf. Fragen an ChatGPT stellte er mündlich - und die Software folgte per Kamera seinem Fortschritt. Einziger Patzer: Der Chatbot behauptete erst, er sehe die Aufgabe, noch bevor er die Gleichung aufschrieb. „Oops, ich war zu aufgeregt", entschuldigte sich ChatGPT.

Auch bat ein OpenAI-Mitarbeiter den Chatbot, seine Laune an dem Gesichtsausdruck zu erkennen. Schwer machte er es ChatGPT mit einem breiten Grinsen allerdings nicht. Das gilt auch für andere Live-Demonstrationen am Montag: Sie funktionierten weitgehend reibungslos, aber man weiß nicht, wie gut die Software unter realen Alltags-Umständen agiert. Alle Interaktionen wurden mit dem Weck-Satz „Hey, ChatGPT" eingeleitet - ähnlich wie man es von heutigen Sprachassistenten kennt.

In einer weiteren Demo erfand ChatGPT eine Gute-Nacht-Geschichte und las sie vor. Dabei konnte man die Software unterbrechen und bitten, mehr Dramatik in die Stimme zu bringen oder wie ein Roboter zu sprechen. Den letzten Satz sang ChatGPT auf Wunsch sogar vor.

OpenAI-Chef Sam Altman schrieb nach der Präsentation, es sei die beste Art einen Computer zu bedienen, die er je erlebt habe. „Es fühlt sich an wie die KI aus Kinofilmen. Und es überrascht mit immer noch ein wenig, dass es real ist." Altman und andere OpenAI verwiesen zuvor schon auf den rund ein Jahrzehnt alten Film „Her", in dem sich der von Joaquin Phoenix gespielte Protagonist in eine KI-Assistenzsoftware verliebt. Die weibliche Stimme von ChatGPT in der Präsentation erinnerte tatsächlich an den Film.

Zugleich warnte die IT-Sicherheitsexpertin Rachel Tobac umgehend, dass zum Beispiel Funktionen wie die automatische Übersetzung für Betrugs-Anrufe genutzt werden können, die zuvor an Sprachbarrieren scheiterten.

ChatGPT hat weltweit 100 Millionen Nutzer

Abo-Kunden von OpenAI werden mehr Leistung in dem Modell bekommen. Zugleich machte OpenAI die Interaktionen für kommerzielle Nutzer günstiger. Man werde jede Menge Dinge finden, für die man Geld verlangen könne, schrieb Altman dazu. Und das werde OpenAI helfen, kostenlos hoffentlich Milliarden Menschen zu bedienen. Nach bisherigen Angaben kommt ChatGPT auf rund 100 Millionen Nutzer. Es dürfte einige Wochen dauern, bis das neue Modell breit verfügbar ist. Wenige Stunden nach der Präsentation meldete OpenAI eine Störung bei dem Modell, die jedoch schnell wieder behoben wurde.

Der Zeitpunkt der Präsentation ist interessant: Am Dienstag hält Google seine jährliche Entwicklerkonferenz ab, bei der auch Ankündigungen zu neuen Funktionen mit Künstlicher Intelligenz erwartet werden. Google zeigte bereits vor einigen Monaten, wie seine KI-Software Gemini gesprochene und visuelle Informationen verarbeiten kann.

Kurz vor der Konferenz Google I/O verkündete auch der OpenAI-Rivale Anthropic den Europa-Start seines KI-Assistenten Claude. Tests hätten gezeigt, dass Claude sehr gut unter anderem auf Deutsch, Französisch und Italienisch funktioniere, sagt Anthropic-Mitgründer Jack Clark. Ähnlich wie ChatGPT kann Claude mit Hilfe Künstlicher Intelligenz unter anderem Sätze auf dem Niveau eines Menschen formulieren und den Inhalt von Texten zusammenfassen. In Europa werden die Web-Version, die iPhone-App und eine Variante für Unternehmen verfügbar sein.

Anthropic brachte im März die aktuelle Generation Claude 3 heraus, die in einigen technischen Tests die Leistung des GPT-4-Modells des ChatGPT-Entwicklers OpenAI übertraf. Anthropic verweist darauf, dass Claude auch lange Texte zusammenfassen und Fragen dazu beantworten kann. Damit könne die Software besonders nützlich unter anderem für Rechtsexperten sowie in der Medizin und Finanzbranche sein, betonte Mitgründer Jared Kaplan. Die Firma sieht bislang keine Datenspeicherung in Europa vor, sei aber offen dafür, wenn Kunden sich das wünschen sollten. Zugleich seien Kundendaten stets verschlüsselt und damit nur für sie zugänglich.

„Halluzinationen" sind technisches Problem

Anthropic sei auch erfolgreich damit gewesen, sogenannte „Halluzinationen" zu reduzieren, bei denen die Software falsche Angaben macht, sagte Kaplan. Die „Halluzinationen" sind ein grundsätzliches Problem von KI-Programmen, die mit ihrer Funktionsweise zusammenhängen. Die Software wird mit riesigen Mengen an Informationen angelernt. Beim Formulieren von Texten entscheidet sie Wort für Wort, wie ein Satz wahrscheinlich weitergehen soll. Dabei können völlig falsche Angaben herauskommen, selbst wenn die KI-Modelle nur mit korrekten Informationen gefüttert wurden. Anthropic versucht bei Claude, solche Fehler durch den Abgleich mit Fakten zu minimieren. Auf ähnliche Weise werden die formulierten Sätze auch mit Grundsatz-Regeln abgeglichen, um Beleidigungen oder Diskriminierung zu verhindern.

Mehr zum Thema
Bleiben Sie über das Thema dieses Artikels auf dem Laufenden Klicken Sie auf [+], um eine E-Mail zu erhalten, sobald wir einen neuen Artikel mit diesem Tag veröffentlichen
X

DWN-Wochenrückblick

Weniger E-Mails, mehr Substanz: Der DWN-Wochenrückblick liefert 1x/Woche die wichtigsten Themen kompakt als Podcast. Für alle, deren Postfach überläuft.

E-mail: *

Ich habe die Datenschutzerklärung sowie die AGB gelesen und erkläre mich einverstanden.

DWN
Panorama
Panorama Forbes-Liste der reichsten Menschen: Elon Musk kann erster Billionär der Welt werden
15.03.2026

In der aktuellen Forbes-Liste der reichsten Menschen liegt Tesla-Chef Elon Musk quasi uneinholbar in Front. Bei einem erfolgreichen...

DWN
Politik
Politik Steuerrecht: Ehegattensplitting vorm Aus? Mehr Arbeitszeit für Frauen nicht lukrativ
15.03.2026

Für viele Frauen lohnt es sich finanziell nicht, in den Job zurückzukehren oder ihre Teilzeit auszubauen, das Ehegattensplitting entpuppt...

DWN
Wirtschaft
Wirtschaft Industrial Accelerator Act: EU-Kommission stärkt Industriepolitik – Anteil am BIP soll auf 20 Prozent steigen
15.03.2026

Die Europäische Kommission will mit dem Industrial Accelerator Act die Industriepolitik der EU neu ausrichten und die Produktion in Europa...

DWN
Immobilien
Immobilien Immobilien-Prognose 2026: Bremst das Baukreditgeschäft alles aus?
15.03.2026

Nach einem hoffnungsvollen 2025 wird die Preisentwicklung für Immobilien laut Greis-Kaufpreisindex im laufenden Jahr 2026 wieder...

DWN
Finanzen
Finanzen Mazda 6e im Vergleich: Wie wettbewerbsfähig ist das Elektromodell?
15.03.2026

Die neue Mazda 6e entsteht auf chinesischer Plattform und markiert einen strategischen Neustart für die Baureihe Mazda6. Kann das...

DWN
Technologie
Technologie Immer mehr US-Forschende zieht es nach Deutschland
15.03.2026

Aus politischen Gründen geht das Weiße Haus gegen Elite-Unis vor. Für Wissenschaftler und Studierende aus den USA wird Deutschland daher...

DWN
Wirtschaft
Wirtschaft KI trifft auf SaaS: Steht die Softwarebranche vor einem Strukturwandel?
15.03.2026

Künstliche Intelligenz verändert die wirtschaftliche Logik der Softwarebranche und setzt das klassische SaaS-Modell unter Druck. Steht...

DWN
Finanzen
Finanzen Iran-Krieg heizt Energiepreise an: Investoren suchen Absicherung
15.03.2026

Der Iran-Krieg treibt die Energiepreise nach oben und zwingt Investoren weltweit, ihre Strategien angesichts steigender Öl- und Gaspreise...