Ratgeber
Unter einem digitalen Sprachassistenten versteht man genau genommen eine Software, mit der Sprache erkannt, analysiert und semantisch interpretiert werden kann. Sprachassistenten sind in der Lage, die erfassten Sprachdaten logisch zu verarbeiten und darauf zu antworten, indem sie Sprache generieren oder die befohlene Handlung ausführen. Für die Funktionsweise eines Sprachassistenten sind also drei wesentliche Prozesse erforderlich: Spracherkennung (Erfassung der gesprochenen Sprache), Sprachanalyse (Untersuchung der Sprachdaten) und Sprachsynthese (Erzeugung eines Sprachsignals bzw. Sprachausgabe).
Früher handelte es sich bei Sprachassistenten vorwiegend um Anwendungen, die via Smartphone oder Computer bedient werden konnten. Heute erscheinen sie vermehrt in Gestalt autarker Geräte, und zwar als sogenannte intelligente Lautsprecher (engl. smart speaker). Sie werden mit dem Internet verbundenund sind somit in der Lage, auf die online zur Verfügung stehenden Informationen zuzugreifen. Smarten Lautsprechern ist es unter anderem möglich, Musik abzuspielen, Streaming-Dienste abzurufen und sogar Haushaltsgeräte zu steuern, in der Regel via WLAN oder Bluetooth. Mithilfe zusätzlicher Apps können die Assistenten noch mehr Aufgaben und neue Funktionen übernehmen.
Die menschliche Sprache ist komplex und folgt insbesondere in gesprochener Form nicht immer festen grammatikalischen Regeln. Betonungen verändern sich und Aussprachevariationen wie Dialekte oder Akzente erschweren die Datenerfassung zusätzlich. Spricht der Nutzer zu schnell oder undeutlich, besteht das Risiko, dass der Assistent die Sprachdaten nicht erkennt. Lernfähige Sprachassistenten bieten hier viel Potenzial. Sie beruhen auf KI-gestützter Spracherkennung (KI = Künstliche Intelligenz) und lernen sozusagen dauerhaft. Sie werden permanent mit Daten versorgt, erkennen darin Muster, vergleichen sie mit bestehenden Daten und leiten daraus Algorithmen ab. Dieser Vorgang wird als Machine Learning, also maschinelles Lernen bezeichnet. Je mehr Daten und Algorithmen vorliegen, desto präziser kann der Assistent die erfassten Sprachsignale erfassen, einordnen, auswerten und schließlich beantworten.
Sprachassistenten können in nahezu allen Bereichen des täglichen Lebens eingesetzt werden. Sie beantworten einfache Fragen, informieren über das Wetter, rufen Kontakte aus dem Telefonbuch an, spielen Musik und Hörbücher ab, lesen Nachrichten vor und geben sogar Bestellungen auf. Mithilfe von Sprachassistenten ist es möglich, „Smart Home“-Funktionen zu steuern und beispielsweise das Licht ein- und auszuschalten, Thermostate zu regeln, den Kaffeeautomaten zu starten und kompatible Geräte wie smarte Staubsauger- oder Rasenmähroboter in Gang zu setzen. Vor allem beeinträchtigte Personen, die beispielsweise geh- oder sehbehindert sind, können ihren Alltag mithilfe digitaler Assistenten leichter bewältigen.
Sprachassistenten erweisen sich nicht nur für Privatpersonen, sondern auch für Firmen als nützlich. Sie können zum Beispiel dazu verwendet werden, Serviceleistungen zu optimieren. Ein Anwendungsfall ist der telefonische Kundenservice. Indem der Sprachassistent erste Fragen erhebt und den Kunden gezielt zum richtigen Mitarbeiter weiterleitet, werden Ressourcen geschont und das Personal entlastet. Darüber hinaus können Sprachassistenten der Erstellung und Einhaltung von Terminen dienen. Per Sprachbefehl einen Termin einzugeben oder zu suchen und sich zu gegebenem Zeitpunkt daran erinnern zu lassen, spart Zeit und minimiert das Risiko, ein wichtiges Datum zu vergessen.
KI-gestützte Assistenten eröffnen Unternehmen zahlreiche Möglichkeiten – von der ausführlichen Kundenberatung bis zum Einsatz in der Logistik – und haben das Potenzial, Prozesse deutlich effizienter zu gestalten.
Amazons Alexa, Apples Siri, der Google Assistant und Microsofts Cortana gehören derzeit zu den bekanntesten Sprachassistenten. Dazu passend haben die großen Unternehmen smarte Lautsprecher auf den Markt gebracht: Amazon Echo, Apple HomePod, Google Home und Invoke.
Alexa und Amazon Echo:
Amazon Echo ist seit dem 26.10.2016 auf dem deutschen Markt und bietet sowohl herstellereigene Dienste als auch Dienste von Drittanbietern an, und zwar mithilfe sogenannter Skill-Erweiterungen. Damit kann Alexa ihren Funktionsumfang deutlich erweitern. Je öfter die Sprachassistentin genutzt wird, desto schneller lernt sie die Präferenzen und Sprachgewohnheiten des Nutzers kennen, um sich entsprechend anzupassen. Neben dem klassischen Amazon Echo mit großem Lautsprecher gibt es einen flacheren und kleineren Lautsprecher namens Amazon Echo Dot, der ebenfalls eine Sprachsteuerung über Alexa ermöglicht.
Siri und Apple HomePod:
Apple hat mit dem HomePod ebenfalls einen intelligenten Lautsprecher auf den Markt gebracht, der seit dem 18.6.2018 in Deutschland verkauft wird. Die Sprachdaten und Sprachbefehle werden von Siri aufgenommen, an den Apple-Server übertragen und dort verarbeitet. Das Resultat wird an das iOS-Gerät, beispielsweise iPhone oder iPad, zurückgesendet. Apple hat bei der Entwicklung des HomePods den Schwerpunkt auf die Tonqualität gelegt. Das Gerät ist in der Lage, seine Position im Raum zu erkennen und den Klang daraufhin abzustimmen. Es ist mit dem Betriebssystem audioIOS ausgestattet, einer Ableitung von iOS, und erfordert mindestens ein iPhone 5s und die Version iOS 11.2.5.
Google Assistant und Google Home:
Der Google Assistant ist der Nachfolger der Software Google Now und wurde zusammen mit dem smarten Lautsprecher Google Home erstmalig auf einer Entwicklerkonferenz am 18.5.2016 präsentiert. Er ist in der Lage, allgemeine Fragen zu beantworten und Befehle auszuführen, beispielsweise die Playlist zu starten oder das Licht im Haus zu regulieren. Dementsprechend ist er auch für die Steuerung von "Smart Home"-Anwendungen geeignet. Services von Drittanbietern können über eine spezielle Entwicklerplattform integriert werden. Videos von YouTube lassen sich mit Chromecast oder integrierter Chromecast-Technologie per Sprachbefehl auf dem Fernseher abspielen.
Kann ich Amazons Alexa auf meinem iPhone oder iPad verwenden?
Ja. Seit Juni 2018 ist es möglich, Geräte mit dem Betriebssystem iOS auch mit Alexa zu steuern. Zu diesem Zweck muss Apples herstellereigene Sprachassistentin Siri umgangen werden. Das ist mithilfe der Alexa App möglich. Hiermit aktivieren Sie Amazons Sprachassistentin und lassen sie auf das Mikrofon und die Standortdaten des iPhones oder iPads zugreifen. Nach Beendigung des Setups können Sie Alexa via Sprachbefehl steuern.
Kann ich die Stimme meines Sprachassistenten verändern?
Die meisten Sprachassistenten bieten die Möglichkeit, eine weibliche und eine männliche Stimme auszuwählen. Dazu zählen beispielsweise Apples Siri, der Google Assistant und Microsofts Cortana. Alexas Stimme ist zum aktuellen Zeitpunkt noch nicht veränderbar, wobei davon auszugehen ist, dass Amazon hier in Zukunft aufrüsten wird.
Unser Praxistipp: Spotify und YouTube mit Apple HomePod abspielen
Über Sprachbefehle kann der HomePod von Apple nur auf herstellereigene Dienste wie Apple Music zurückgreifen. Eine Playlist auf Spotify abzuspielen oder ein Video auf YouTube anzusehen, ist allein via Sprachsteuerung also nicht möglich. Eine Lösung für dieses Problem lautet AirPlay: Einfach die App von Spotify oder YouTube auf dem iOS-Gerät öffnen, den HomePod als Wiedergabegerät auswählen und mit AirPlay verknüpfen.