Sprache ist für den Menschen das natürlichste aller Kommunikationsmittel. Mit Systemen zu sprechen ist die nächste Evolutionsstufe in der Mensch-Maschine-Kommunikation. So leitet die dialogbasierte Interaktion mit intelligenten Assistenten als Informations-, Entertainment- oder Transaktions-Dienst eine neue Ära ein.
Voice Messaging ist der beste Beweis dafür, dass Nutzer die Sprachinteraktion der textuellen Eingabe vorziehen. Seit der Einführung der Sprachnachrichten-Funktion von WhatsApp nimmt deren Nutzung rasant zu, da es sich um eine intuitive, einfache und bequeme Art der Kommunikation zwischen Menschen handelt. Im Gegensatz zu einer Textnachricht über ein Graphical User Interface (GUI) erfolgt die Eingabe von Nachrichten nicht mehr über grafische Bedienelemente, sondern über natürliche, gesprochene Sprache.
Im Unterschied zu Voice Messaging erlauben es Conversational User Interfaces dem Nutzer Befehle und Anfragen an Datenbanken und Systeme zu stellen. Bekannte Anwendungen sind Chatbots und digitale Assistenten wie Google Assistant, Apples Siri und Cortana von Microsoft. Diese intelligenten dialogbasierten Oberflächen ermöglichen es dem Benutzer via natürlicher Sprache, ob gesprochen oder geschrieben, mit Systemen zu interagieren. So haben Alexa, Siri, Chatbots und Co. das Potenzial, digitale Produkte auf GUI-Basis abzulösen und hin zu kundenorientierteren Anwendungen zu entwickeln, die den menschlichen Dialog und die User Experience ins Zentrum stellen.
Chatbots verfügen über Texteingabefelder und Antwortmasken. Auf der anderen Seite des Chats antwortet entweder ein Bot oder eine natürliche Person. Basiert der Bot auf einer KI, greift diese in der Regel auf große Wissensdatenbanken mit Volltext-Analysen zu, um die User-Anfragen zu beantworten. Im Gegensatz dazu erfolgt die Eingabe von Befehlen und Anfragen bei Alexa, Siri, Google Home oder Cortana mittels gesprochener Sprache und Antworten werden mit einer KI-Komponente generiert.
Die rasante Entwicklung der Spracherkennung hat nach anfänglichen Startschwierigkeiten dazu geführt, dass die Benutzer heute bei der Verwendung eines virtuellen Assistenten damit rechnen können, verstanden zu werden und eine valide Antwort zu erhalten. Missverständnisse mit dem Navigationsgerät oder Siri werden immer seltener und die künstliche Intelligenz hat sogar Humor entwickelt. So konnte die Sprachinteraktion schnell den Kinderschuhen entwachsen.
Jedoch hat nicht nur die rasante Entwicklung im Bereich der Spracherkennung dazu beigetragen, dass sich Conversational User Interfaces immer weiter etablieren. Nahezu parallel haben sich Mobile und die Möglichkeiten der App-Entwicklung, Cloud– sowie Backend-Technologien weiter entwickelt. So ist es möglich mit gut konfigurierten API-Service-Layern sprachbasierte Interfaces schnell und einfach zu nutzen. Der Einsatz von flexiblen und gleichzeitig robusten Architekturen hat dafür gesorgt, dass Conversational User Interfaces bereits heute ihren Platz in den verschiedensten Industrien gefunden haben.
Neben den viel diskutierten Anwendungsszenarien im Bereich Smart Home, Suche oder Informationsabfragen soll in Zukunft beispielsweise auch das Auto intelligenter werden: So stellte etwa Bosch jüngst Casey – die smarte Unterstützung beim Fahren vor. Dabei spricht Casey ca. 30 Sprachen, versteht Dialekte und Akzente und kombiniert für die richtige Antwort kontextspezifische Informationen wie Standort, Gewohnheiten und Bewegungsrichtung.
Im privaten Umfeld erleben sprachbasierte Assistenten ein rasantes Wachstum. Auch im Enterprise-Umfeld finden sich die ersten Use Cases. Amazon hat unlängst mit Alexa for Business einen weiteren Vorstoß in Richtung B2B-Anwendungen gestartet. Im Unternehmenskontext wird es interessant sein zu sehen, wie die Fragen zu Datenschutz und Datensicherheit beantwortet werden und wie schnell Alexa tatsächlich in unseren Arbeitsalltag in Europa einzieht.
Unabhängig der Neuerungen durch Amazon finden sich zahlreiche Möglichkeiten Sprachassistenten im Unternehmen einzusetzen. Dies ist immer dann sinnvoll, wenn eine sprachgesteuerte Information oder Anweisung Arbeitsabläufe erleichtern kann. Neben den bekannten Anwendungsszenarien im B2C-Kontext aus Shopping, Healthcare und Smart Home sind auch viele unternehmensinterne Szenarien denkbar.
In Service und Support ist die schnelle Antwort auf Fragen einer der stärksten Effizienztreiber. Jederzeit und überall auf eine zentrale Wissensdatenbank zugreifen und direkt eine valide Antwort erhalten, kann so manchen Prozess erleichtern. Funktioniert das per Spracheingabe, muss etwa ein Reparatur-Prozess nicht unterbrochen werden, sondern der Techniker hat einfachen schnellen Zugriff auf Unterstützung.
Auch in Logistik und Fertigung ist es von Vorteil, bei der Arbeit beide Hände frei zu haben und dennoch auf alle relevanten Informationen zugreifen zu können. Status, Schwellwertinformationen oder Standorte können einfach erfragt werden. Gleichzeitig ist es möglich per Spracheingabe diese zu reporten ohne die eigentliche Tätigkeit zu unterbrechen.
Zusammenfassend sind Conversational User Interfaces nicht nur ein Feature oder ein Trend. Bereits heute wird davon ausgegangen, dass bereits 2020 über 50 % der Google-Anfragen über Voice eingehen werden. Es ist ein Meilenstein, der eine nahtlose Interaktion zwischen Mensch und Technologie ermöglicht. Sprachbasierte Mensch-Maschine-Interaktion wird Dienstleistungen und Produkte hervorbringen, die jede Facette des Lebens erleichtern.
DATAGROUP hat seit über 15 Jahren Erfahrung in der Entwicklung von Sprachanwendungen. Dabei entstanden zahlreiche einfach und intuitiv zu bedienende Voice User Interfaces in den Bereichen Prozessoptimierung, Kundenservice, Security, Shopping und Vertrieb.
Marcia Bohn
T +49 711 62030 433
marcia.bohn@datagroup.de