Wissenspool-Beitrag

Toolkits zur Erstellung intelligenter Sprachassistenten

22.11.2022
Lesezeit: ca. 4 min
Beitrag teilen

Technologie-Steckbrief

Einleitung

Wie in einem Wissenspool-Beitrag zu Chatbots dargestellt, können sprachgesteuerte Assistenten vor allem in der Kundenkommunikation wichtige Dienste leisten, nicht zuletzt, weil sie rund um die Uhr zur Verfügung stehen und ein niederschwelliges Serviceangebot darstellen, das mit der natürlichsten Kommunikationsform bedient werden kann. In diesem Steckbrief werden verschiedene Strukturen (Frameworks) vorgestellt, die zur Erstellung solcher Sprachassistenten genutzt werden können.  

Wichtige Aspekte bei der Erstellung eines Assistenten

Zunächst muss geklärt werden, was der Assistent genau leisten soll. Wenn er nur zum Informationsabruf dient, also als reiner Chatbot fungiert, müssen keine Nutzerinformationen erhoben und eventuell gespeichert werden. Wenn weitergehende Funktionen, wie z.B. Terminvereinbarungen oder das Abfragen von Informationen für die Vorbereitung eines direkten Kontakts in Planung sind, ist es wichtig, sich über eine DSGVO-konforme Erhebung und Sammlung der Daten Gedanken zu machen. Weitere Use Cases könnten hier z.B. auch telefonische Vorbestellungen für eine spätere Abholung, das teilweise Vorausfüllen eines Formulars über (Sprach-)Abfragen oder eine Fragengesteuerte Analyse des Kundenwunsches/-bedarfs sein.

Wichtige Aspekte bei der Auswahl des Frameworks

Hier sollen als Anregung einige wichtige Fragen gelistet werden, die die Auswahl der passenden Lösung bzw. des richtigen Frameworks unterstützen können: 

  • Soll der Assistent selbst erstellt werden oder wird auf eine (anpassbare) fertige Branchenlösung zurückgegriffen?
  • Wie groß ist der Aufwand, die gewünschten Funktionalitäten zu beschreiben? 
  • Welche und wie viele Daten muss ich erheben (z.B. Beispielkonversationen)? 
  • Wie kann die fertige Lösung in bestehende Abläufe integriert werden? 

Wenn der Assistent selbst erstellt werden soll

  • Wie einfach ist das Training der Erkennung der Benutzerabsichten (Intents)?
  • Wieviel “Programmierung” ist für die Entwicklung der Dialoge nötig und wie kompliziert ist diese (z.B. grafisches Werkzeug zur Ablaufdefinition im Gegensatz zu von Programmcode gesteuerten Aktionen)? 
  • Ist es möglich, Information aus vorhergehenden Interaktionen zu nutzen (Wiedererkennung wird von Benutzern üblicherweise sehr positiv bewertet)? 
  • Bleiben die Daten (inklusive der Trainingsdaten) lokal, oder kann ausschließlich in der Cloud gearbeitet werden (eventueller Datenverlust bei Wechsel des Frameworks)? 
  • Wie einfach ist es, den Assistenten mit Hilfe neuer Daten, die während der Nutzung anfallen, zu verbessern und zu erweitern?