fbpx
KI-Pedia, Sprachsuche

Was ist Sprachsuche?

19. April 2018
sprachsuche
Lass dir den Text vorlesen
Subscribe

Benötigte Lesezeit: 2 Minuten

Der Begriff Sprachsuche bezeichnet das Finden von Informationen oder Produkten im Internet durch Sprachkommandos. Nutzer kommunizieren auf diese Weise mit intelligenten Geräten. Die Eingabe von Text entfällt.

Sprachsuche ist allgegenwärtig

Viele Nutzer integrieren die neue Art des Findens in ihr tägliches Leben und kommunizieren mobil oder Zuhause mit:

  • digitalen Sprachassistenten wie Google Assistant oder Alexa, die auch auf Apps von Drittanbietern zugreifen können
  • sprachgesteuerten Chatbots (z.B. von Media Markt und Otto)
  • Geräten, in denen digitalen Sprachassistenten integriert sind (z.B. intelligente Lautsprecher wie Amazon Echo oder HomePod)

Das globale Forschungs- und Beratungsunternehmen Ovum erwartet, dass bis 2021 weltweit mehr als 7,5 Milliarden Geräte mit digitalen Assistenten ausgestattet sein werden. Anders ausgedrückt: es wird bis 2021 mehr Geräte mit integrierten Sprachassistenten geben als Menschen auf der Welt leben.

Der technologische Hintergrund

Die Technologie, die dies möglich macht, heißt Maschinelles Lernen. Genauer genommen sind drei Unterformen von Maschinellem Lernen für diese Art der Mensch-Maschine-Kommunikation notwendig:

  • das Erkennen,
  • das Verstehen und
  • die Synthese von Sprache (Sprachausgabe).

In den letzten Jahren haben Technologiekonzerne wie Google, Amazon, Baidu, Microsoft und Apple massiv in ihre Abteilungen für Künstliche Intelligenz und Maschinelles Lernen investiert. Forschungen und Entwicklungen in diesem Bereich haben dazu geführt, dass immense Fortschritte auf dem Gebiet der Spracherkennung erzielt werden konnten. Im Oktober 2016 verkündete beispielsweise Microsoft, dass seine Spracherkennungs-Fehlerrate innerhalb von einem Monat von 6,3 Prozent auf 5,9 Prozent reduziert werden konnte. Seit August 2017 liegt sie bei 5,1 Prozent. Im Mai 2017 erreichte Google mit einer noch geringeren Fehlerrate in der Spracherkennung von 4,9 Prozent einen neuen Meilenstein.

google fehlerrate bei spracherkennung

Maschinen können das gesprochene Wort nun genauso gut verstehen wie Menschen. Doch das Nutzererlebnis kann mit einer noch höheren Genauigkeit in der Spracherkennung weiter verbessert werden. Andrew Ng, KI-Experte und ehemaliger Chief Scientist des chinesischen Suchmaschinengiganten Baidu, erwartet, dass eine Steigerung der Genauigkeit der Spracherkennung auf 99 Prozent eine vollwertige Integration von  Spracherkennungssoftware in das alltägliche Leben ermöglichen wird. Bis dahin müssen Herausforderungen wie Hintergrundgeräusche, Dialekte, Akzente und interpretatives Zuhören gemeistert werden.

Sprachsuche überwindet Schmerzpunkte in der Kundenreise

Warum wächst Sprachsuche gerade jetzt so rasant? Der Grund liegt in der Schnelligkeit und im Komfort von gesprochenen Wörtern. Im Vergleich zur herkömmlichen Textsuche überwindet die Suche per Spracheingabe elementare Schmerzpunkte in der Kundenreise. Ein Mensch kann durchschnittlich 150 Wörter pro Minute sprechen, aber nur 40 Wörter pro Minute tippen. Sprachsuche ist weniger anstrengend und wesentlich komfortabler als Textsuche, denn sie beansprucht weniger Hirnareale und ist natürlicher Bestandteil unseres täglichen Lebens. Ein weiterer Vorteil liegt darin, dass sie (fast) barrierefrei ist. Bei der Kommunikation mit Sprachassistenten entfällt die Notwendigkeit von Schreib- und Lesekenntnissen genauso wie ein unmittelbares physisches Bedienen der Geräte (bei intelligenten Lautsprechern). Sprachsuche ermöglicht somit Sehbehinderten, Blinden, Legasthenikern, Analphabeten und körperlich eingeschränkten Menschen einen einfacheren Zugang zu Web-Inhalten und ein Stück Autonomie im alltäglichen Leben.

Mein Fazit: Sprachassistenten werden uns in Zukunft verstärkt lästige Aufgaben im alltäglichen Leben abnehmen. Für Unternehmen birgt die neue Technologie großes Potenzial. Um sich auf eine sprachgesteuerte Welt vorzubereiten, sollten Unternehmen überlegen, wie Sprachtechnologie die Berührungspunkte der Kundenreise bereichern kann.

 

Titelbild von Jonas Barre, www.smartvizual.com

Quellen:

azure.microsoft.com/en-us/blog/from-a-pc-on-every-desktop-to-deep-learning-in-every-software/
blogs.microsoft.com/ai/historic-achievement-microsoft-researchers-reach-human-parity-conversational-speech-recognition/#sm.000006gmppudtudy7yojksy7pwee5
www.microsoft.com/en-us/research/blog/microsoft-researchers-achieve-new-conversational-speech-recognition-milestone/
ovum.informa.com/resources/product-content/virtual-digital-assistants-to-overtake-world-population-by-2021
www.mindshareworld.com/sites/default/files/Speak_Easy_Global_Report.pdf
de.slideshare.net/purnavirji/tangible-audible-visual-digital-olympus-2016-purna-virji

Diese Beiträge dürften dir gefallen

Kein Kommentar

Jetzt kommentieren