Google Duplex: 9 Fragen & Antworten zur Sprach-KI

Franziska Peix1. JUNI 2018
Eine Google-Schrift in Blau.

Google

Google möchte dir die Zukunft ein Stückchen komfortabler gestalten. Wie? Indem Termine und Co. von Google Duplex arrangiert werden, einer Künstlichen Intelligenz mit Menschenstimme. Du fragst dich, wie das gehen soll? Dann findest du hier die passenden Antworten.

Zusammenfassung: Google Duplex: 9 Fragen & Antworten zur Sprach-KI

  • Google Duplex ist eine Technologie, die mit dem Google Assistant funktioniert.
  • Mit der Sprach-KI sind Telefonanrufe mit menschlicher Stimme möglich.
  • Es ist zum Beispiel möglich, einen Friseurtermin oder eine Tischreservierung in einem Restaurant zu buchen.
  • Die Sprach-KI ergibt sich bei Telefonaten immer als solche zu erkennen.
  • Aktuell ist Google Duplex noch eine Tech-Demo.

1. Was ist Google Duplex?

Google Duplex bezeichnet eine Technologie, die hinter einem neuen Feature für den Google Assistant steckt. Es ist ein komplett automatisiertes System, das in der Lage ist, Telefonanrufe mit menschlicher Stimme auszuführen. Noch handelt es sich dabei um eine Tech-Demo mit sehr speziellen Fähigkeiten, die Google erstmals auf der hauseigenen Entwicklerkonferenz Google I/O 2018 der Öffentlichkeit zeigte. Doch die Aufgaben, die von der Künstlichen Intelligenz übernommen werden können, sollen in Zukunft noch vielfältiger werden.

2. Was kann die Sprach-KI?

Wie weit diese Tech-Demo bereits ist, demonstrierte Google mit zwei aufgenommenen Telefonanrufen vom Smartphone. Zuerst wurde der Google Assistant gebeten, einen Friseurtermin zu arrangieren, im Anschluss sollte die KI einen Tisch in einem Restaurant reservieren. Die Sprach-KI wählt dafür die Nummer der Dienste, spricht mit den Menschen am anderen Ende, reagiert auf Nachfragen und erledigt die Aufgabe. Am Ende gibt es eine Bestätigung des Termins aufs Smartphone.

Externe Inhalte

Um Ihnen Video mit weiteren Informationen zu Produkten und Dienstleistungen anzeigen zu können, arbeiten wir mit Youtube zusammen. Für das Anzeigen der Inhalte benötigen wir Ihre Zustimmung.

Jeff Grubb's Game Mess

Zurzeit kann Google Duplex die folgenden Aufgaben übernehmen: einen Friseurtermin arrangieren, Tischreservierungen in einem Restaurant vornehmen und nach den Öffnungszeiten eines Geschäfts fragen. Wenn Geschäfte eine Onlinebuchung anbieten, wird diese Option genutzt. Wenn nicht, dann ruft Google Duplex bei dem Unternehmen an.

3. Was kann sie noch nicht?

Die Sprach-KI kann noch nichts, was über diese drei Aufgabengebiete hinausgeht und in irgendeiner Form komplexer ist. Die Demo auf der Google I/O zeigte schon, dass es beispielsweise dann schwierig werden könnte, wenn die Person am anderen Ende der Leitung selber kein Muttersprachler ist und die KI nicht richtig versteht. In diesem Fall war das noch kein großes Problem.

Duplex wird vielleicht eine Menge Szenarien antrainiert bekommen haben, aber nicht jedes erdenkliche. Dann wird die Künstliche Intelligenz den Smartphone-Besitzer um Hilfe bitten müssen.

4. Was macht die Künstliche Intelligenz besonders?

Was Google Duplex von einem einfachen Chatbot unterscheidet, ist die menschenähnliche, sehr natürlich klingende Stimme. Die Sprach-KI hat einen natürlichen Redefluss, nutzt Füllwörter, baut natürliche Sprechpausen ein und reagiert auf typisch menschliche Weise mit Lauten wie „Ähm“, „Mhmm“ und Co.

Menschen, die sich mit Google Duplex unterhalten, sollen nicht merken, dass sie mit einer Künstlichen Intelligenz sprechen. Voraussetzung für Gespräche dieser Art ist aber, dass sie Kontexte versteht. Das wird vor allem in dem zweiten Beispiel deutlich, in dem die Restaurant-Angestellte die KI falsch verstanden hat.

5. Wie funktioniert das?

Die Technologie, die hinter der Technologie (Google Duplex) in der Technologie (Google Assistant) steckt, basiert auf einem rekurrenten bzw. rückgekoppelten neuronalen Netz.

Das wiederum baut auf Googles TensorFlow-Technologie für maschinelles Lernen. Alle Klarheiten beseitigt? Im Grunde steckt einfach ein Training der KI auf Basis vieler gesammelter Daten dahinter. Diese Daten stammen von anonymisierten Google-Voice-Konversationen, die Google mit Einverständnis der Nutzer aufgezeichnet hat. Zudem wurde Duplex darauf trainiert, Gegebenheiten wie Zeit, Ort und den Verlauf eines Gesprächs bei Konversationen zu berücksichtigen.

Externe Inhalte

Um Ihnen Video mit weiteren Informationen zu Produkten und Dienstleistungen anzeigen zu können, arbeiten wir mit Youtube zusammen. Für das Anzeigen der Inhalte benötigen wir Ihre Zustimmung.

Google

6. Waren die Anrufe auf der Google I/O Fake?

Funktioniert Googles KI tatsächlich schon so gut? Oder waren die Anrufe, die auf der Google I/O abgespielt wurden, nur Fake? Nachdem die Tech-Demo für Aufsehen gesorgt hatte, wurde zumindest über einige Unstimmigkeiten bei der Vorstellung diskutiert.

Verdächtig sei es etwa, dass die Mitarbeiter des Friseursalons bzw. des Restaurants weder ihren Namen noch den Namen ihres Geschäfts am Telefon nannten. Außerdem war es am anderen Ende der Leitung verdächtig still, keine Hintergrundgeräusche wie Föhn, Gespräche oder Geschirrklappern zu hören. Auch fragte keiner nach den Kontaktdaten der KI, die sich als Kunde ausgab. Google wollte diese Vorwürfe nicht kommentieren.

7. Wofür könnte Google Duplex eingesetzt werden?

Gehen wir aber davon aus, dass Google Duplex so funktioniert wie demonstriert, dann ergeben sich einige praktische Einsatzmöglichkeiten. Die Sprach-KI könnte dabei helfen, Zeit zu sparen, indem sie einfache, aber mitunter lästige Aufgaben übernimmt. Sie könnte tauben/stummen Menschen assistieren und Reisenden helfen, Sprachbarrieren zu überwinden. Zudem gibt es viele Menschen, die einfach ungerne telefonieren und in Zukunft zumindest einige Anrufe an die KI abtreten könnten.

8. Welche Bedenken gibt es?

Viele Menschen sehen aber nicht nur die Vorteile, die sich durch eine solche Künstliche Intelligenz ergeben könnten. Gerade der Gedanke, dass man nicht weiß, ob man mit einem echten Menschen oder einem Computer spricht, gibt vielen zu bedenken. Eine Google-Sprecherin versicherte daraufhin, dass sich die KI in Telefongesprächen immer als solche zu erkennen geben soll. Darüber hinaus wirft die Technologie neue Fragen bezüglich der Privatsphäre und des Datenschutzes auf.

Google Duplex funktioniert nur mit einer Menge persönlicher Daten, zudem werden durch die Anrufe Dritte miteinbezogen, ohne dass sie etwas dagegen unternehmen könnten. Außer vielleicht einfach aufzulegen – wenn sie denn erfahren, dass es sich um eine KI handelt.

9. Wann ist mit Google Duplex zu rechnen?

Aktuell ist Google Duplex nur eine Tech-Demo. Auf der Google I/O 2018 kündigte der Konzern jedoch an, das Feature für den Google Assistant in einigen Wochen als Beta-Version zur Verfügung zu stellen. Wenn die bisherigen Tests gut laufen, könnte Duplex noch in diesem Jahr experimentell auf einigen Smartphones landen. Ein Datum für einen finalen Release gibt es nicht – womöglich wird es ihn auch niemals geben. Das kann derzeit vermutlich nicht einmal Google genau beantworten.

Fazit: Google Duplex – 9 Fragen & Antworten zur Sprach-KI

Google Duplex ist also eine KI-Technologie, die mit dem Google Assistant funktioniert. Im Vergleich zu einem einfachen Chatbot überzeugt Google Duplex mit einer menschenähnlichen, sehr natürlich klingenden Stimme. Dazu nutzt die Sprach-KI Füllwörter und baut natürliche Sprechpausen ein.

Beiträge zu Google