Alexa, verstehst du Deutsch?

Leftshift OneLesezeit: 15 Minuten

Der Platzhirsch unter den kommunikationsfreudigen, smarten Lautsprechern ist Amazon mit Alexa. Doch wieviel versteht das Tool wirklich?

Wer schon einmal damit oder Services wie Google Assistent, Cortana oder Siri Bekanntschaft gemacht hat, merkt schnell, dass das Sprachverständnis seine Grenzen hat. Vor allem in der deutschen Sprache. Über das smarte digitale Ecosystem G.A.I.A. finden sich Lösungen, die Alexas Defizite bereinigen könnten.

Was steht zwischen den Zeilen, Alexa?

Wir sprechen hier in erster Linie vom deutschen Sprachraum. Geräte, die Alexas beherbergen, haben es schon in relativ viele Haushalte geschafft.Deutsch ist zwar nicht die komplizierteste Sprache der Welt, aber schwieriger als Englisch allemal. Gerade auch deswegen haben die aktuellen Systeme so ihre Probleme mit demVerständnis des Gesprochenen.Dabei geht es in erster Linie gar nicht um Übersetzung geschriebenen Texts, sondern dassemantische Verständnis des Inhalts einer Aussage. Wer schon einmal mit Dialekt und Alexa experimentiert hat weiß, dass viele Wörter auch verstanden werden, obwohl sie nur entfernt an tadelloses Hochdeutsch erinnern. Von tieferem Dialekt mit eigenen Wörtern, völlig andersartiger Aussprache und irrwitzigen Satzstellungen sprechen wir gar nicht.Im Allgemeinen kann man sagen, dass das bewusst deutsch-österreichische Gemurmel in mehreren Fällen im Sinne von Speech-to-Text funktioniert. Dabei ist beispielsweise die Ausprache von „Å“ statt „A“ oder auch das Verschlucken von Wortendungen gemeint. Das Verständnis der Sprache jedoch, und hier reden wir von “Language” und nicht von “Speech”, dem sogenanntenNatural Language Understanding (NLU),lässt im Deutschen stark zu wünschen übrig. Das merkt man schnell, wenn man Skills für Alexa entwickelt. Amazons NLU ist dabei so tolerant, dass ähnliche Beispielsätze, mit denen man Alexa trainieren kann, das Verständnis komplett zunichte machen. In diesem Fall gibt Alexa dann für verschieden Fragen immer die gleiche Antwort.

Amazon steht sich selbst im Weg

Die Liste der Skills, die derzeit für Alexa verfügbar sind, offenbart bereits deutlicheSchwierigkeiten,wenn es darum geht, wirklich smarte Lösungen zu bauen. Smarte Lösungen, die beweisen, dass das Textverständnis auch zwischen den Zeilen lesen kann. Smarte Lösungen, die Kontext richtig erkennen und zum wirklichen Verständnis beitragen.Alle Skills müssen mit der Alexa-eigenen NLU erstellt werden. Amazon bietet ein einfaches User Interface dafür an. Was allerdings nicht angeboten wird, ist die mögliche Anbindung an externe Systeme, die eine bessere NLU für den jeweiligen Use Case bieten. In so einem Fall wäre Alexa nur mehrreines Interfaceund der gesprochenen Text würde an das ausgelagerte System weitergegeben werden.Amazon ist dabei jedoch sehr restriktiv und lässt nur über Umwege zu, den gesprochenen Text zu verarbeiten.Vor einigen Jahren erschienen bereits Artikel dazu, wie man die Restriktion von Amazon umgehen kann.Mittlerweile funktioniert dieser Workaround jedoch nicht mehr.

Wo Alexa aufhört, fängt G.A.I.A. an

Wir mussten sehr kreativ werden, um einen neuen Workaround zu finden. Unsere Lösung basiert nun darauf, dass man Alexas NLU aushebelt. Amazon versucht mit Beispielsätzen und Beispielwörtern, die eine gewisse Ähnlichkeit aufweisen, das Language Understanding für einen Skill zu optimieren. Mit den 500 häufigsten deutschen Wörtern und einemZufallsalgorithmushaben wir genau diese Optimierung ausgetrickst. Nach der Zugabe von zufälligen, sinnlosen Sätzen und Wörtern konnten wir schließlich die gesprochene Benutzereingabe auslesen. Das wiederum ermöglicht, den gesprochenen Text in unserem System zu verarbeiten.Unser AI-Produkt G.A.I.A. verarbeitet die Anfragen von Alexa und generiert durch prozessgesteuerte Konversationen passende Antworten, die durch Alexa zum End User gelangen. Die Prozesse werden mit Hilfe derBusiness Process Modelling Notation (BPMN) definiert und im System ausgeführt. Da wir in G.A.I.A. das deutsche Sprachmodell Use-Case-spezifisch anpassen und nachtrainieren können, ist es uns möglich,qualitativ sehr hochwertige und auch unerwartet-intelligente Antworten zu liefern. So werden zum Beispiel für die Tourismusbranche alle spezifischen Wörter und Synonyme in unser Sprachmodell aufgenommen, um genaue Antworten geben zu können.Die Tatsache bleibt, dass es sich beim beschrieben Workaround um eben einen solchen handelt. In der Vergangenheit ist es bereits passiert, dass Workarounds nach Umstellungen seitens Alexa nicht mehr funktionieren, was das ganze Unterfangen relativ mühsam macht. Erschwerend kommt hinzu, dass Amazon unseren Skill mit dem beschrieben Workaround abgelehnt hat, weil für eine Zertifizierung unter anderem sinnvolle Beispielsätze notwendig sind.
#startup#ai#bigdata#privacy

Ähnliche Artikel

INSIGHTS

Auch ohne Big Data zur KI-Lösung

INSIGHTS

Von der Idee zum perfekten Startup-Team

INSIGHTS

1. AI Styria Stammtisch

Das könnte Sie auch interessieren: