Spracherkennung. - Computerprogramme können mittlerweile nicht nur Sprachbausteine sprechen. Ausgefeilte Systeme sind auch in der Lage, Texte besser zu verstehen. Und sie können mittlerweile sogar Geschlecht und Alter der Anrufer erkennen. Die jüngsten Entwicklungen wurden auf den Voice Days in Bonn vorgestellt.
Sprachportale, bei denen Computer am anderen Ende der Leitung sitzen, kennt mittlerweile jeder, der telefonischen Kundendienst nutzt. "Drücken Sie 1 für Rechnung, 2 für technische Fragen und 3 für sonstige Anliegen" bekommt der Anrufer beispielsweise zu hören, wenn er auf eine der vielen älteren Anwendungen trifft. Doch das ist eigentlich schon längst nicht mehr Stand der Technik. Moderne Programme nudeln nicht mehr ihre Standardtexte bis zum Ende ab, sie lassen sich zum Beispiel unterbrechen.
"Sie steuern mich indem sie mit mir sprechen. Unterbrechen Sie mich einfach. Tarife…"
Und sie sind in der Lage, zwei Dinge auf einmal zu verstehen. So können gute sprachgesteuerte Reiseportale aus der Anfrage: "Ich möchte im Oktober nach München reisen!" Datum und Reiseziel herausfiltern.
"Wir haben festgestellt, dass die Dialoge kürzer werden, dass der Kunde schneller zur Sache kommen kann, sein Anliegen in kompakten Sätzen vortragen kann so dass der Computer nicht schrittweise ihm die Informationen aus der Nase zieht, sondern er kann in einem Satz sein Anliegen vortragen",
resümiert Professor Wolfgang Wahlster, Leiter des Deutschen Forschungszentrums für Künstliche Intelligenz. Er ist die Koryphäe in Deutschland für Forschung bei Sprachanwendungen und deshalb auch Vorsitzender einer Jury, die jedes Jahr den Voice Award vergibt. Das ist eine Auszeichnung für Lösungen, die Sprachanwendungen mit Technologien entwickeln, die up-to-date und kundenfreundlich sind. Sie wurde diese Woche in Bonn verliehen. Preisträger waren beispielsweise ein Hotelreservierungssystem, bei dem die Kunden schnell zum Ziel kommen oder ein Preisvergleichsdienst, der sich einfach per Handy abrufen lässt. Manche Lösungen können sogar bei der Auswertung der Stimme mehr über den Anrufer oder die Anruferin herauszufinden. Ausgezeichnet wurde in Bonn auch das Portal eines Mobilfunkanbieters, dessen Computer Geschlecht, Alter, Sprache und sogar Stimmung des Anrufenden heraushört. Dabei weiß der Rechner natürlich kein genaues Geburtsdatum, teilt aber die Anrufer in vier Altersgruppen ein. Damit lasse sich der Service optimieren, hofft Wahlster:
"Wir können dadurch den Dialogstil der Zielgruppe anpassen. Wir können die Altersklasse erkennen und natürlich spricht man einen älteren Herren anders an als ein junges Mädchen, schon vom Jargon beginnend, also ich verabschiede mich vielleicht mit 'Tschüß' bei einem Jugendlichen, aber bei einem Erwachsenen oder Senior sollte ich vielleicht doch lieber 'Auf Wiederhören' sagen als Sprachcomputer. Übrigens macht das ja ein Mensch, der geschult wird, um im Call Center zu arbeiten, genauso."
Der Datenschutz werde dabei natürlich eingehalten, so Wahlster, die Daten seien ja nicht personenbezogen. Die Erkennung der Stimmung hat aber auch durchaus Charme: Wer keinen Bock mehr hat auf den Dialog mit einer Maschine kann ordentlich Dampf ablassen und wird dann vielleicht mit einem menschlichen Mitarbeiter verbunden. Doch vor allem die automatische Kategorisierung kann durchaus diskriminierend sein. Denkbar ist, dass zum Beispiel bei einer Versicherung nicht allen die gleichen Produkte angeboten werden. Und nicht jeder über 60 wird es schätzen, wenn Sprachcomputer ganz langsam sprechen und Dinge wiederholen, damit auch die Omi das auch kapiert. Während ein gut geschulter Verkäufer das vielleicht erkennt, ist das bei einer Maschine schon fraglich. Unternehmen, die wirklich serviceorientiert denken, werden den Kunden aber die Wahl lassen zwischen automatischer Einsortierung und Standardansprache. Doch Sprachcomputer können noch mehr als Stimmung und Alter erkennen. Sie können Stimmen auch so gut auswerten, dass sich die biometrischen Stimm-Muster als Passwörter verwenden lassen. Dazu müssen die Benutzer die Wörter, die später erkannt werden sollen, zunächst aufsprechen. Also zum Beispiel eine Liste von Namen einlesen. Bei der Einwahl gibt ihnen dann die Maschine vor, welchen Namen oder welche Kombination von Namen sie hören möchte. Das wird mit den abgelegten Dateien verglichen, so Christian Pereira von "D&S Solutions":
"Wir sehen, dass das zunehmend auch bei großen Sprachportalen zur Legitimierung eingesetzt wird. Ich gehe davon aus, dass innerhalb der nächsten 18 bis 24 Monate das Thema Biometrie gerade im Bereich des Banking eine entscheidende Bedeutung gewinnen wird."
Mehr zur Sendung:
Beiträge zum Nachhören
Computer und Kommunikation
Sternzeit 11. Februar 2012
Sendezeit: 11.02.2012, 16:57
Das Digitale Logbuch - Wasserspiele
Sendezeit: 11.02.2012, 16:50
Auf dem Orbit abgehört
Sendezeit: 11.02.2012, 16:45
dradio-Recorder
im Beta-Test: