Technologie

KI in der Medizin: ChatGPT und die Grenzen der digitalen Selbstdiagnose

KI-Chatbots wie ChatGPT sind beliebt - ihren medizinischen Ratschlägen wird aber mit Skepsis begegnet, so eine neue Studie. Das könnte die Zukunft der digitalen Medizin beeinflussen.
01.08.2024 07:59
Lesezeit: 3 min
KI in der Medizin: ChatGPT und die Grenzen der digitalen Selbstdiagnose
Eine Radiologin im Unfallkrankenhaus Berlin betrachtet in einer KI-basierten App auf einem Tablet Gehirnbilder eines Patienten. Laut Studien gibt es noch große Vorbehalte gegenüber der medizinischen Kompetenz von Künstlicher Intelligenz. (Foto: dpa) Foto: Monika Skolimowska

Ein unerklärliches Ziehen im Bauch, ein hartnäckiger Husten oder ein merkwürdiger Fleck auf dem Zehennagel: Dass Menschen bei unterschiedlichsten Symptomen Google befragen, ist kein neues Phänomen – und mit der zunehmenden Beliebtheit von KI-basierten Chatbots wie ChatGPT scheinen die Möglichkeiten zur digitalen Selbstdiagnose weiter gewachsen zu sein. Tatsächlich aber wird der medizinischen Kompetenz einer solchen Künstlichen Intelligenz noch mit großen Vorbehalten begegnet, zeigt eine neue Studie, über die im Fachblatt „Nature Medicine“ berichtet wird.

Wahrnehmung von KI-Ratschlägen untersucht

Die Würzburger Wissenschaftler untersuchten die Reaktion von Menschen auf KI-generierte medizinische Ratschläge. „Uns interessierte nicht die technische Kompetenz der KI, sondern allein die Frage, wie der KI-Output wahrgenommen wird“, sagt Moritz Reis von der Julius-Maximilians-Universität.

Dafür teilte das Forschungsteam mehr als 2.000 Probanden in drei Gruppen ein, die identische medizinische Ratschläge erhielten. Die erste Gruppe bekam gesagt, dass die Empfehlungen von einem Arzt oder einer Ärztin stammten. Bei der zweiten wurde ein KI-basierter Chatbot als Urheber genannt und die dritte Gruppe ging davon aus, dass die Ratschläge zwar von einem Chatbot stammten, aber nochmal ärztlich überprüft wurden.

Die Probanden bewerteten die Empfehlungen auf Verlässlichkeit, Verständlichkeit und Empathie. Sobald sie vermuteten, dass eine KI beteiligt war, nahmen sie die Ratschläge als weniger empathisch und verlässlich wahr. Dies galt auch für die Gruppe, die glaubte, dass ein Arzt die KI-Empfehlungen überprüft hatte. Entsprechend waren sie weniger bereit, diesen Empfehlungen zu folgen. „Der Effekt der Voreingenommenheit gegen KI ist zwar nicht riesig, aber statistisch signifikant“, kommentiert Reis.

Erklärungsansätze für KI-Skepsis

Die KI-Skepsis erklärt sich der Kognitionspsychologe teilweise mit Stereotypen: „Viele glauben, eine Maschine könne nicht empathisch sein.“ Bei der Verständlichkeit bewerteten alle drei Gruppen die Ratschläge jedoch gleich.

Für die Forschungsgruppe ist die festgestellte KI-Skepsis wichtig, da KI in der Medizin eine immer wichtigere Rolle spiele. So werden derzeit zahlreiche Studien zu neuen KI-Anwendungsmöglichkeiten veröffentlicht. Umso bedeutsamer sei die öffentliche Akzeptanz, sagt Reis: „Bei der Frage nach dem künftigen Einsatz von KI in der Medizin geht es nicht nur um das technisch Mögliche, sondern auch darum, wie weit Patientinnen und Patienten mitgehen.“ Aufklärung über entsprechende Anwendungen und KI generell sei nötig. „Darüber hinaus haben andere Studien gezeigt, wie wichtig es für das Patientenvertrauen ist, dass am Ende immer der menschliche Arzt oder Ärztin gemeinsam mit den Patienten die finale Entscheidungsgewalt hat“, betont Reis.

Transparenz als Schlüsselfaktor

Für besonders relevant hält der Wissenschaftler Transparenz: „Das bedeutet zum Beispiel, dass eine KI nicht nur eine Diagnose stellt, sondern auch nachvollziehbar erklärt, welche Informationen zu diesem Ergebnis geführt haben.“

Die Qualität dieser Ergebnisse wird bereits seit längerem wissenschaftlich untersucht - mit unterschiedlichen Erfolgen. So attestierte etwa eine 2023 im „Journal of Medical Internet Research“ ChatGPT eine hohe Diagnosegenauigkeit: Getestet mit 36 Fallbeispielen stellte der Chatbot in fast 77 Prozent der Fälle die korrekte endgültige Diagnose. In Notaufnahmen reichte die Diagnosekompetenz einer niederländischen Studie zufolge gar an die von Ärzten heran. Ausgestattet mit den anonymisierten Daten von 30 Patienten, die in einer niederländischen Erste-Hilfe-Stelle behandelt worden waren, stellte ChatGPT in 97 Prozent der Fälle die richtige Diagnose (Annals of Emergency Medicine, 2023).

Im Gegensatz dazu stellte eine 2023 im Fachblatt „Jama“ veröffentlichte Studie fest, dass der Chatbot bei 70 medizinischen Fallbeispielen nur 27 Fälle richtig diagnostizierte. Das sind gerade einmal 39 Prozent. Eine im Journal „Jama Pediatrics“ präsentierte Studie kam zu dem Schluss, dass diese Trefferquote bei Krankheiten, die in erster Linie Kinder betreffen, noch schlechter ist.

ChatGPT in der medizinischen Ausbildung

Eine aktuelle im Fachblatt „Plos One“ veröffentlichte Studie hat nun untersucht, ob ChatGPT in der medizinischen Ausbildung von Nutzen sein könnte. Schließlich greife der Chatbot nicht nur auf eine riesige Wissensbasis zurück, sondern sei auch in der Lage, dieses Wissen interaktiv und verständlich zu vermitteln, so das Forschungsteam des kanadischen London Health Sciences Centre.

Die Gruppe fütterte ChatGPT mit 150 sogenannten Fallherausforderungen aus einer Datenbank mit medizinischen Fallgeschichten, in denen Symptome und Krankheitsverlauf beschrieben werden. Sowohl angehende als auch bereits im Beruf stehende Medizinerinnen und Mediziner sind aufgefordert, in einem Antwort-Wahl-Verfahren eine Diagnose zu stellen und einen Behandlungsplan zu entwickeln.

ChatGPT lag bei diesem Test in gerade einmal knapp der Hälfte der Fälle (74 von 150) richtig. Die Studie stellte fest, dass ChatGPT Schwierigkeiten bei der Interpretation von Laborwerten und bildgebenden Verfahren hat und wichtige Informationen übersehe. Entsprechend kommen die Autoren zu dem Schluss, dass ChatGPT in seiner derzeitigen Form als Diagnoseinstrument nicht genau sei und bei der Verwendung des Chatbots als Diagnosewerkzeug wie auch als Lehrmittel unbedingt Vorsicht geboten sei.

„Die Kombination aus hoher Relevanz und relativ geringer Genauigkeit spricht dagegen, sich bei der medizinischen Beratung auf ChatGPT zu verlassen, da es wichtige Informationen präsentieren kann, die möglicherweise irreführend sind“, heißt es dazu in der Studie – eine Warnung, die höchstwahrscheinlich ebenso für medizinische Laien gilt, die den Chatbot für digitale Selbstdiagnosen nutzen.

ChatGPTs eigene Einschätzung

ChatGPT selbst betont, dafür nicht geeignet zu sein. Befragt nach seiner diagnostischen Qualifikation antwortet der Bot: „Ich bin kein Arzt und habe keine medizinische Ausbildung. Ich kann Informationen über medizinische Themen bereitstellen, allgemeine Ratschläge geben und Fragen beantworten, aber ich kann keine medizinischen Diagnosen stellen oder professionelle medizinische Beratung bieten. Bei gesundheitlichen Problemen oder Fragen solltest Du immer einen Arzt oder einen qualifizierten Gesundheitsdienstleister konsultieren.“

Mehr zum Thema
article:fokus_txt
X

DWN Telegramm

Verzichten Sie nicht auf unseren kostenlosen Newsletter. Registrieren Sie sich jetzt und erhalten Sie jeden Morgen die aktuellesten Nachrichten aus Wirtschaft und Politik.
E-mail: *

Ich habe die Datenschutzerklärung gelesen und erkläre mich einverstanden.
Ich habe die AGB gelesen und erkläre mich einverstanden.

Ihre Informationen sind sicher. Die Deutschen Wirtschafts Nachrichten verpflichten sich, Ihre Informationen sorgfältig aufzubewahren und ausschließlich zum Zweck der Übermittlung des Schreibens an den Herausgeber zu verwenden. Eine Weitergabe an Dritte erfolgt nicht. Der Link zum Abbestellen befindet sich am Ende jedes Newsletters.

DWN
Technologie
Technologie Cyberkriminalität: Nur ein Klick von der Katastrophe entfernt
18.05.2025

Cyberkriminalität ist zur globalen Supermacht aufgestiegen – mit höherem Schaden als die Volkswirtschaften Deutschlands und Japans...

DWN
Panorama
Panorama Whisky – die stets liquide Luxus-Geldanlage
18.05.2025

Wein, Uhren, Schmuck, Handtaschen, Kunst, Oldtimer – es gibt viele Möglichkeiten, in alternative Geldanlagen zu investieren. Die meisten...

DWN
Wirtschaft
Wirtschaft Marokko als chinesisches Tor zur EU – doch Handelskrieg könnte Riegel vorschieben
18.05.2025

Peking investiert Milliarden in Marokkos Industrie – doch geopolitische Spannungen und der drohende Protektionismus eines möglichen...

DWN
Politik
Politik Gefängnis, Gericht, Geschichte – Stammheim 50 Jahre nach dem RAF-Prozess
18.05.2025

Vor 50 Jahren begann in Stammheim der RAF-Prozess – ein juristisches Mammutverfahren gegen den Terror. Wie viel Rechtsstaat blieb im...

DWN
Wirtschaft
Wirtschaft Analyse: „Die alte Weltordnung ist am Ende – und sie wird nicht zurückkehren“
18.05.2025

Das Zeitalter des freien Welthandels ist vorbei – die Welt wird neu vermessen. China produziert, die USA rüsten sich, und Europa...

DWN
Politik
Politik Handelskriege auf Risiko – Trumps russisches Roulette mit der US-Wirtschaft
18.05.2025

Mit Zöllen, Drohungen und Handelskriegen will Washington die Industrie heimholen. Doch was, wenn der Revolver in der Hand des Präsidenten...

DWN
Finanzen
Finanzen Greg Abel übernimmt: Der stille Stratege hinter Warren Buffetts Milliarden-Imperium
17.05.2025

Mit dem Rückzug von Warren Buffett endet eine Ära. Doch an die Stelle des legendären Investors tritt kein charismatischer Visionär,...

DWN
Panorama
Panorama In Zeiten von Trump: Bleibt das Traumziel USA für Deutsche attraktiv?
17.05.2025

Die USA galten lange als Traumziel für deutsche Urlauber. Doch politische Entwicklungen und wachsende Unsicherheit verändern das Bild....