Benötigte Lesezeit: 2 Minuten
Der Begriff Sprachsuche bezeichnet das Finden von Informationen oder Produkten im Internet durch Sprachkommandos. Nutzer kommunizieren auf diese Weise mit intelligenten Geräten. Die Eingabe von Text entfällt.
Sprachsuche ist allgegenwärtig
Viele Nutzer integrieren die neue Art des Findens in ihr tägliches Leben und kommunizieren mobil oder Zuhause mit:
- digitalen Sprachassistenten wie Google Assistant oder Alexa, die auch auf Apps von Drittanbietern zugreifen können
- sprachgesteuerten Chatbots (z.B. von Media Markt und Otto)
- Geräten, in denen digitalen Sprachassistenten integriert sind (z.B. intelligente Lautsprecher wie Amazon Echo oder HomePod)
Das globale Forschungs- und Beratungsunternehmen Ovum erwartet, dass bis 2021 weltweit mehr als 7,5 Milliarden Geräte mit digitalen Assistenten ausgestattet sein werden. Anders ausgedrückt: es wird bis 2021 mehr Geräte mit integrierten Sprachassistenten geben als Menschen auf der Welt leben.
Der technologische Hintergrund
Die Technologie, die dies möglich macht, heißt Maschinelles Lernen. Genauer genommen sind drei Unterformen von Maschinellem Lernen für diese Art der Mensch-Maschine-Kommunikation notwendig:
- das Erkennen,
- das Verstehen und
- die Synthese von Sprache (Sprachausgabe).
In den letzten Jahren haben Technologiekonzerne wie Google, Amazon, Baidu, Microsoft und Apple massiv in ihre Abteilungen für Künstliche Intelligenz und Maschinelles Lernen investiert. Forschungen und Entwicklungen in diesem Bereich haben dazu geführt, dass immense Fortschritte auf dem Gebiet der Spracherkennung erzielt werden konnten. Im Oktober 2016 verkündete beispielsweise Microsoft, dass seine Spracherkennungs-Fehlerrate innerhalb von einem Monat von 6,3 Prozent auf 5,9 Prozent reduziert werden konnte. Seit August 2017 liegt sie bei 5,1 Prozent. Im Mai 2017 erreichte Google mit einer noch geringeren Fehlerrate in der Spracherkennung von 4,9 Prozent einen neuen Meilenstein.
Maschinen können das gesprochene Wort nun genauso gut verstehen wie Menschen. Doch das Nutzererlebnis kann mit einer noch höheren Genauigkeit in der Spracherkennung weiter verbessert werden. Andrew Ng, KI-Experte und ehemaliger Chief Scientist des chinesischen Suchmaschinengiganten Baidu, erwartet, dass eine Steigerung der Genauigkeit der Spracherkennung auf 99 Prozent eine vollwertige Integration von Spracherkennungssoftware in das alltägliche Leben ermöglichen wird. Bis dahin müssen Herausforderungen wie Hintergrundgeräusche, Dialekte, Akzente und interpretatives Zuhören gemeistert werden.
Sprachsuche überwindet Schmerzpunkte in der Kundenreise
Warum wächst Sprachsuche gerade jetzt so rasant? Der Grund liegt in der Schnelligkeit und im Komfort von gesprochenen Wörtern. Im Vergleich zur herkömmlichen Textsuche überwindet die Suche per Spracheingabe elementare Schmerzpunkte in der Kundenreise. Ein Mensch kann durchschnittlich 150 Wörter pro Minute sprechen, aber nur 40 Wörter pro Minute tippen. Sprachsuche ist weniger anstrengend und wesentlich komfortabler als Textsuche, denn sie beansprucht weniger Hirnareale und ist natürlicher Bestandteil unseres täglichen Lebens. Ein weiterer Vorteil liegt darin, dass sie (fast) barrierefrei ist. Bei der Kommunikation mit Sprachassistenten entfällt die Notwendigkeit von Schreib- und Lesekenntnissen genauso wie ein unmittelbares physisches Bedienen der Geräte (bei intelligenten Lautsprechern). Sprachsuche ermöglicht somit Sehbehinderten, Blinden, Legasthenikern, Analphabeten und körperlich eingeschränkten Menschen einen einfacheren Zugang zu Web-Inhalten und ein Stück Autonomie im alltäglichen Leben.
Mein Fazit: Sprachassistenten werden uns in Zukunft verstärkt lästige Aufgaben im alltäglichen Leben abnehmen. Für Unternehmen birgt die neue Technologie großes Potenzial. Um sich auf eine sprachgesteuerte Welt vorzubereiten, sollten Unternehmen überlegen, wie Sprachtechnologie die Berührungspunkte der Kundenreise bereichern kann.
Titelbild von Jonas Barre, www.smartvizual.com
Quellen:
azure.microsoft.com/en-us/blog/from-a-pc-on-every-desktop-to-deep-learning-in-every-software/
blogs.microsoft.com/ai/historic-achievement-microsoft-researchers-reach-human-parity-conversational-speech-recognition/#sm.000006gmppudtudy7yojksy7pwee5
www.microsoft.com/en-us/research/blog/microsoft-researchers-achieve-new-conversational-speech-recognition-milestone/
ovum.informa.com/resources/product-content/virtual-digital-assistants-to-overtake-world-population-by-2021
www.mindshareworld.com/sites/default/files/Speak_Easy_Global_Report.pdf
de.slideshare.net/purnavirji/tangible-audible-visual-digital-olympus-2016-purna-virji