Technologie

Google meldet Durchbruch bei Computer mit menschlicher Stimme

Google ist offenbar ein wesentlicher Fortschritt in der Erzeugung computergenerierter Sprache gelungen. Mit Hilfe eines hochentwickelten Tools werden Computer dazu gebracht, möglichst natürlich zu klingen. Das Ziel: Eines Tages sollen sie sich wie Menschen anhören.
11.09.2016 01:34
Lesezeit: 1 min

Für die Arbeit an der menschlichen Computerstimme zeichnet Googles Künstliche Intelligenz-Abteilung DeepMind verantwortlich. Bisherige Tests hätten gezeigt, dass ihre Technologie die qualitative Lücke zwischen den heutigen Computersystemen und der menschlichen Sprache schließen könnte, so die zuständigen Forscher. Der nötige Aufwand ist jedoch gigantisch.

„Dass Menschen mit Maschinen sprechen können, ist ein langjähriger Traum der Mensch-Computer-Interaktion“, sagen die DeepMind-Forscher. Eine möglichst natürlich klingende Form wollen sie nun mit Hilfe von WaveNet realisieren.

WaveNet unterscheidet sich von den bisherigen künstlichen Spracherzeugern grundlegend. „Die meisten Programme nutzen vorab aufgenommene Töne, die geschnitten und zu Wörtern und Sätzen zusammengepackt werden. Aus diesem Grund hören sich viele Sprachprogramme meist kalt und roboterartig an“, berichtet die Internetseite Entwickler.de. Anders als etwa bei Siri oder Cortana kommen hier künstliche neuronale Netze zum Einsatz. Mit deren Hilfe werden die richtigen Tonkombinationen bestimmt, um individuell gesprochene Texte zu generieren. „WaveNet analysiert dazu die Wellenformen der menschlichen Sprache und ist in der Lage, Muster zu erkennen. Diese werden dann eingesetzt, um geschriebene in gesprochene Sprache umzusetzen.“

Um WaveNet zu trainieren, seien im Vorfeld einige Tests durchgeführt worden. Dafür habe das DeepMind-Team hunderte von Menschen, WaveNet und anderen Text-zu-Sprache-Systemen gesprochene Testsätze durch Menschen beurteilen lassen. Das Ergebnis: „WaveNet erreichte beim Englischen einen Wert von 4,21 auf einer Skala von 1-5. Das beste andere Text-zu-Sprache-System erreichte 3,86, während die von Menschen gesprochenen Sätze einen Wert von 4,55 erzielten.“

Das spezielle Text-zu-Sprache-Synthese-Tool werde bislang noch in keinem anderen Google-Produkt eingesetzt, berichtet die Financial Times. Ob es aufgrund der erforderlichen massiven Rechenleistungen so schnell in der Praxis eingesetzt werde, sei allerdings fraglich.

Google hatte die britische Firma DeepMind vor rund zweieinhalb Jahren gekauft, der Kaufpreis lag laut Medienberichten bei rund 500 Millionen Dollar. Der Software gelang es im März, in einem Match einen der weltbesten Meister im asiatischen Brettspiel Go zu schlagen, was zuvor als zu komplex für Computer galt. Dabei überraschte die Maschine an einer Stelle auch Experten mit einem kreativen Zug, den bisher nie jemand gespielt hatte.

Mehr zum Thema
article:fokus_txt
DWN
Wirtschaft
Wirtschaft Chinas Exporte überraschen - Fokus auf die USA
09.05.2025

Trotz des anhaltenden Handelskonflikts mit den Vereinigten Staaten sind Chinas Exporte überraschend robust geblieben. Der Außenhandel mit...

DWN
Wirtschaft
Wirtschaft Reiche fordert den Ausbau von Gaskraftwerken in Deutschland
09.05.2025

Bundeswirtschaftsministerin Katherina Reiche setzt auf einen schnellen Ausbau von Gaskraftwerken in Deutschland. Die Gründe dafür...

DWN
Politik
Politik Putins Parade: Moskau feiert "Tag des Sieges" – Europas Spaltung auf dem Roten Platz sichtbar
09.05.2025

Während Putin mit Pomp den „Tag des Sieges“ feiert, marschieren zwei europäische Regierungschefs an seiner Seite – trotz Warnungen...

DWN
Panorama
Panorama Der stille Anti-Trump? Internationale Reaktionen auf Papst Leo XIV.
09.05.2025

Mit der Wahl von Robert Francis Prevost zum neuen Oberhaupt der katholischen Kirche übernimmt erstmals ein Amerikaner das Papstamt. Welche...

DWN
Finanzen
Finanzen Allianz-Aktie nach Dividendenabschlag im Minus – Chance für Anleger?
09.05.2025

Die Allianz-Aktie zählt 2025 zu den Top-Performern im DAX – doch am Freitagmorgen sorgt ein deutlicher Kursrückgang für Stirnrunzeln...

DWN
Finanzen
Finanzen DAX-Rekordhoch zur Eröffnung am Freitag
09.05.2025

Zum Handelsbeginn am Freitag hat der DAX ein frisches DAX-Rekordhoch erreicht. Die im April gestartete Erholungswelle nach dem ersten...

DWN
Wirtschaft
Wirtschaft Insolvenzen in Deutschland steigen nur noch geringfügig an - ist das die Trendwende?
09.05.2025

Der Anstieg der Insolvenzen in Deutschland hat sich im April deutlich verlangsamt. Laut Statistischem Bundesamt wurden im Monatsvergleich...

DWN
Finanzen
Finanzen Commerzbank-Aktie profitiert von starkem Jahresauftakt - und nun?
09.05.2025

Die Commerzbank-Aktie hat zum Start in den Börsenhandel am Freitag leicht zugelegt. Das deutsche Geldhaus überraschte mit einem...