Technologie

Google meldet Durchbruch bei Computer mit menschlicher Stimme

Lesezeit: 1 min
11.09.2016 01:34
Google ist offenbar ein wesentlicher Fortschritt in der Erzeugung computergenerierter Sprache gelungen. Mit Hilfe eines hochentwickelten Tools werden Computer dazu gebracht, möglichst natürlich zu klingen. Das Ziel: Eines Tages sollen sie sich wie Menschen anhören.

Mehr zum Thema:  
Benachrichtigung über neue Artikel:  

Für die Arbeit an der menschlichen Computerstimme zeichnet Googles Künstliche Intelligenz-Abteilung DeepMind verantwortlich. Bisherige Tests hätten gezeigt, dass ihre Technologie die qualitative Lücke zwischen den heutigen Computersystemen und der menschlichen Sprache schließen könnte, so die zuständigen Forscher. Der nötige Aufwand ist jedoch gigantisch.

„Dass Menschen mit Maschinen sprechen können, ist ein langjähriger Traum der Mensch-Computer-Interaktion“, sagen die DeepMind-Forscher. Eine möglichst natürlich klingende Form wollen sie nun mit Hilfe von WaveNet realisieren.

WaveNet unterscheidet sich von den bisherigen künstlichen Spracherzeugern grundlegend. „Die meisten Programme nutzen vorab aufgenommene Töne, die geschnitten und zu Wörtern und Sätzen zusammengepackt werden. Aus diesem Grund hören sich viele Sprachprogramme meist kalt und roboterartig an“, berichtet die Internetseite Entwickler.de. Anders als etwa bei Siri oder Cortana kommen hier künstliche neuronale Netze zum Einsatz. Mit deren Hilfe werden die richtigen Tonkombinationen bestimmt, um individuell gesprochene Texte zu generieren. „WaveNet analysiert dazu die Wellenformen der menschlichen Sprache und ist in der Lage, Muster zu erkennen. Diese werden dann eingesetzt, um geschriebene in gesprochene Sprache umzusetzen.“

Um WaveNet zu trainieren, seien im Vorfeld einige Tests durchgeführt worden. Dafür habe das DeepMind-Team hunderte von Menschen, WaveNet und anderen Text-zu-Sprache-Systemen gesprochene Testsätze durch Menschen beurteilen lassen. Das Ergebnis: „WaveNet erreichte beim Englischen einen Wert von 4,21 auf einer Skala von 1-5. Das beste andere Text-zu-Sprache-System erreichte 3,86, während die von Menschen gesprochenen Sätze einen Wert von 4,55 erzielten.“

Das spezielle Text-zu-Sprache-Synthese-Tool werde bislang noch in keinem anderen Google-Produkt eingesetzt, berichtet die Financial Times. Ob es aufgrund der erforderlichen massiven Rechenleistungen so schnell in der Praxis eingesetzt werde, sei allerdings fraglich.

Google hatte die britische Firma DeepMind vor rund zweieinhalb Jahren gekauft, der Kaufpreis lag laut Medienberichten bei rund 500 Millionen Dollar. Der Software gelang es im März, in einem Match einen der weltbesten Meister im asiatischen Brettspiel Go zu schlagen, was zuvor als zu komplex für Computer galt. Dabei überraschte die Maschine an einer Stelle auch Experten mit einem kreativen Zug, den bisher nie jemand gespielt hatte.


Mehr zum Thema:  

DWN
Weltwirtschaft
Weltwirtschaft Deindustrialisierung: Deutsche Batterie-Industrie zeigt Auflösungserscheinungen
30.05.2024

Die deutsche Batterie-Industrie steht vor dem Aus: Immer mehr Unternehmen geben ihre Produktionsstandorte auf, um in kostengünstigere...

DWN
Politik
Politik Reich und Arm: Die Unterschiede werden größer in Deutschland
30.05.2024

Erst die Corona-Pandemie, dann der Krieg Russlands gegen die Ukraine. Beides nicht nur unerfreulich an sich, sondern auch zwei weitere...

DWN
Politik
Politik Folgen von Corona: So groß ist die Einsamkeit in Deutschland
30.05.2024

Das Gefühl von Einsamkeit war seit den 90er Jahren zurückgegangen - dann kam Corona und warf viele Menschen zurück. Unter anderem das...

DWN
Weltwirtschaft
Weltwirtschaft Deutschland und Frankreich fordern EU-Reformen für Wirtschaftswachstum
30.05.2024

Europa steht vor der Herausforderung, das Wirtschaftswachstum zu steigern. Deutschland sowie Frankreich setzen sich dafür ein. In einer...

DWN
Politik
Politik Fataler Effekt: Sauberer werdende Luft führt zu verstärkter Erwärmung
30.05.2024

Ein großer Schritt zu weniger Luftverschmutzung könnte einen fatalen Nebeneffekt haben: Mit einer neuen Verordnung für den...

DWN
Immobilien
Immobilien Transparente Mietpreise: Berlin hat wieder einen qualifizierten Mietspiegel
30.05.2024

Stadtentwicklungssenator Gaebler hat den neuen Berliner Mietspiegel vorgestellt. Demnach sind die Bestandsmieten in der Hauptstadt im...

DWN
Politik
Politik DWN-SERIE zur Europawahl (Teil 3): Das Wahlprogramm der AfD für die EU
30.05.2024

Am Sonntag, dem 9. Juni, findet in Deutschland die Abstimmung zur Europa-Wahl statt. Erstmals werden auch 16-Jährige über die...

DWN
Politik
Politik SPD-Linke warnen Lindner vor Kürzungen bei Entwicklungspolitik
30.05.2024

Ringen um den Bundeshaushalt 2025: Linke SPD-Abgeordnete schießen scharf gegen Finanzminister Christian Lindner und fordern "es dürfen...