Technologie

Wie Google Maschinen das Lesen beibringt

Lesezeit: 2 min
23.10.2015 10:47
Ein Google-Forscherteam hat eine Methode entwickelt, Maschinen das Lesen von natürlicher Sprache beizubringen. Dazu füttern die Forscher die Computer mit Unmengen von kommentierten Nachrichtenartikeln. Ziel ist es, den Maschinen beizubringen, deren Inhalt zu verstehen und dazu Fragen zu beantworten.
Wie Google Maschinen das Lesen beibringt

Mehr zum Thema:  
Benachrichtigung über neue Artikel:  

Inhalt wird nicht angezeigt, da Sie keine externen Cookies akzeptiert haben. Ändern..

Das so genannte Deep Learning ist derzeit eine der wichtigste Entwicklung auf dem Weg zu künstlicher Intelligenz. De Begriff beschreibt eine Methode, bei der Maschinen über ihre einprogrammierten Informationen hinaus selbstständig Neues lernen können, seien es spezielle Bewegung, Bilderkennung oder gar Video-Spielen. Maschinen beizubringen, Dokumente in natürlichen Sprache zu lesen bleibt eine besondere Herausforderung, der sich nun ein Forscherteam um Googles Depp Mind Projekt widmet.

Maschinelle Lesesysteme können auf ihre Fähigkeiten getestet werden, Fragen über den Inhalt der Dokumente, die sie gesehen haben,zu beantworten. Bisher fehlten jedoch groß angelegte Tests und Testdatensätze für diese Art der Auswertung. Forscher definieren nun eine neue Methode, die diesen Engpass löst und im großen Maßstab Daten über das Leseverständnis liefert. Diese Methode „erlaubt die Entwicklung einer neuen Art von Aufmerksamkeit-basierten tiefgehenden neuronalen Netzen, die lernen, echten Dokumente zu lesen und komplexe Fragen dazu mit minimalem Vorwissen der Sprachstruktur zu beantworten.“

Um Computern die natürliche Sprache beizubringen, füttern die Forscher sie mit Unmengen von kommentierten Zeitungsartikeln – und bringen Ihnen bei, deren Inhalt zu verstehen.

Das Ziel ist es laut Deep Minds Projektbeschreibung, natürliche Sprache zu verarbeiten – also ein Dokument zu lesen und dann Fragen zu  dessen Inhalt beantworten zu können. Dazu brauchen die Maschinen vor allem eins: Riesige Datenmengen, die für die Maschinen kommentiert und mit Erläuterungen versehen sind.

Eine solche Datensammlung bieten bestimmte Zeitungen, so ein Forscherteam um Karl Moritz Hermann bei Deep Mind in London. Wie der Forscher dem Magazin Technology Review erklärt, sei der spezielle Schreibstil der Online-Nachrichten von Daily Mail und CNN dazu geeignet. Also nutzt Deep Mind die Menge der Online veröffentlichten Artikel von CNN und Daily Mail dazu, Computern das Lesen beizubringen.

Praktisch könnte dies Auswirkungen auf alle Bereiche des Internets haben: So müssen Artikel nicht mehr in eine Computer-lesbare Sprache übersetzt und dazu etwa mit Schlagwörtern versehen werden: Die Maschinen verstehen Texte auch ganz ohne Hilfsmittel und können Fragen dazu in natürlicher Sprache beantworten.

Auf Daily Mail Website, Mailonline, und CNN online werden Nachrichten mit den wichtigsten Angaben darüber als Stichpunkte versehen, die unabhängig von dem Text geschrieben werden. „Von zentraler Bedeutung ist, dass diese Zusammenfassungen abstrahierender Natur sind und nicht einfach kopierte Sätze aus den Dokumenten", so Hermann. Daraus schufen die Forscher eine kommentierte Datenbank: Mit den News-Artikel als Text und den Aufzählungspunkten als Erläuterung. Die Datenbank umfasst bereits 110.000 Artikel von CNN und 218.000 Artikel der Dailymail.

Das mit den Daten gefütterte neuronale Netzwerk kann bereits 60 Prozent aller Fragen beantworten. Die Methode untersucht meist Worte, die im Zusammenhang mit der Frage am häufigsten vorkommen. Allerdings funktioniert das entsprechend bisher am Besten mit journalistischen Texten, da hier die zugrunde liegene Textstruktur immer ähnlich ist. Mit Literatur oder gar Poesie kommen die Maschinen hingegen noch nicht zurecht.

 


Mehr zum Thema:  

Anzeige
DWN
Panorama
Panorama Halbzeit Urlaub bei ROBINSON

Wie wäre es mit einem grandiosen Urlaub im Juni? Zur Halbzeit des Jahres einfach mal durchatmen und an einem Ort sein, wo dich ein...

DWN
Unternehmen
Unternehmen Tarifrunde der Chemieindustrie: Gewerkschaft fordert mehr Lohn
26.04.2024

Im Tarifstreit in Ostdeutschlands Chemieindustrie fordert die Gewerkschaft IG BCE eine Lohnerhöhung von 7 Prozent. Arbeitgeber warnen vor...

DWN
Technologie
Technologie Künstliche Intelligenz: Wie sich Deutschland im internationalen Rennen positioniert
26.04.2024

Die Deutsche Industrie macht Tempo bei der KI-Entwicklung. Das geht aus einer kürzlich veröffentlichten Analyse des Deutschen Patent- und...

DWN
Weltwirtschaft
Weltwirtschaft Automesse China 2024: Deutsche Autohersteller im Preiskrieg mit BYD, Xiaomi und Co.
25.04.2024

Bei der Automesse in China steht der eskalierende Preiskrieg bei Elektroautos im Vordergrund. Mit hohen Rabatten kämpfen die Hersteller...

DWN
Technologie
Technologie 3D Spark: Ein Hamburger Start-up revolutioniert die Bahnbranche
25.04.2024

Die Schienenfahrzeugindustrie befindet sich in einem grundlegenden Wandel, in dessen Verlauf manuelle Fertigungsprozesse zunehmend...

DWN
Unternehmen
Unternehmen Lieferdienste in Deutschland: Bei Flink, Wolt und anderen Lieferando-Konkurrenten geht es um alles oder nichts
25.04.2024

Getir, Lieferando, Wolt, UberEats - das Angebot der Essenskuriere ist kaum noch überschaubar. Wer am Markt letztlich bestehen wird,...

DWN
Politik
Politik Bericht: Habeck-Mitarbeiter sollen Kritik am Atom-Aus missachtet haben
25.04.2024

Wichtige Mitarbeiter von Bundesministern Habeck und Lemke sollen laut einem Bericht interne Zweifel am fristgerechten Atomausstieg...

DWN
Finanzen
Finanzen Feiertagszuschlag: Was Unternehmer an den Mai-Feiertagen beachten sollten
25.04.2024

Feiertagszuschläge sind ein bedeutendes Thema für Unternehmen und Arbeitnehmer gleichermaßen. Wir werfen einen genauen Blick auf die...

DWN
Finanzen
Finanzen Teurer Anlegerfehler: Wie der Blick in den Rückspiegel fehlgeht
25.04.2024

Anleger orientieren sich an den Renditen der vergangenen drei bis zehn Jahre, um Aktien oder Fonds auszuwählen. Doch laut Finanzexperten...