News

Sprach-KI von Google klingt jetzt wie ein echter Mensch

Viel unterscheidet die Stimmen von Sprach-KIs nicht mehr vom Menschen.
Viel unterscheidet die Stimmen von Sprach-KIs nicht mehr vom Menschen. (©thinkstock/Zapp2Photo 2017)

Google hat bei der Weiterentwicklung von künstlichen Intelligenzen einen entscheidenden Schritt nach vorne gemacht. Der Konzern hat eine neue Sprach-KI erdacht, die sich quasi wie ein echter Mensch anhört.

Google hat eine neue Sprach-KI namens Tacotron 2 entwickelt, die Sätze so wiedergeben soll, dass sie nicht mehr von der Stimme eines echten Menschen unterschieden werden können. Beschrieben wird das System laut Bericht von Quartz in einer Forschungsarbeit von Google. Tacotron 2 ist eine Weiterentwicklung der ersten Sprachsynthese-Software Tacotron – wer sich einmal anhören möchte, wie echt das System klingt, findet bei Google einige Audio-Beispiele, die Mensch und Software gegenüberstellen. Aktuelle Sprach-Assistenten wie Siri oder Alexa klingen meist immer noch etwas steif und künstlich.

Verbesserte Sprach-KI dürfte bald im Google Assistant zum Einsatz kommen

Tacotron 2 kombiniert zwei Netzwerke für Deep Learning miteinander: Eines, das Text in ein spezielles Spektrogramm verwandelt, und WaveNet, das diese Grafik liest und in eine echte Stimme verwandelt. Die Sprach-KI kann derzeit nur mit der englischen Sprache arbeiten und besitzt auch nur eine einzige (weibliche) Stimme. Dafür erkennt die Software auch Nuancen in Texten, etwa wenn Wörter komplett in Großbuchstaben geschrieben werden. Auch kleinere Rechtschreibfehler kann Tacotron 2 selbstständig ausbügeln.

Google nutzt WaveNet bereits jetzt für die Stimme des Google Assistant. Sobald Tacotron 2 also marktreif und ohne Bugs läuft, dürfte das System ebenfalls in Google Home und Co. zum Einsatz kommen und die Sprach-KI noch lebensechter machen.

Artikel-Themen
close
Bitte Suchbegriff eingeben