Mit Siri kam der Hype: Der persönliche Assistent auf dem Smartphone – bedienbar auch per gesprochener Sprache – ist wohl einer der mobilen Trends der letzten Monate. Mittlerweile gibt es zahlreiche sprachgesteuerte Dienste für iOS, Android & Co. Und mit Google Now, Samsungs S Voice und Apples Siri auch diverse “persönliche Assistenten”.
Zwar war HTCs Ankündigung eines eigenen Sprachassistenten nichts als ein Gerücht, doch neben Apple und Google mischen auch die Smartphone-Hersteller kräftig mit auf dem Assistenten-Markt.
Mit Quick Voice präsentierte LG kürzlich seinen koreanischen “Siri-Konkurrenten”. Der Dienst verfügt über Spracherkennung und soll derzeit elf verschiedene Smartphone-Anwendungen (Telefon, Kontakte, Kalender, Suchfunktion usw.) unterstützen, doch zunächst wird er wohl nur in Korea gelauncht und es gibt noch keinen europäischen Starttermin.
Ein persönlicher digitaler Assistent – gern auch eine Assistentin – die uns und unsere Bedürfnisse kennt, uns rund um die Uhr zur Seite steht, uns informiert, an Termine erinnert, uns weckt oder gekonnt an einem Stau vorbei manövriert – so die Versprechungen von Apple, Samsung und Google:
Doch was leisten die digitalen Privatsekretäre wirklich?
Mit der Erkennung der Spracheingabe gehen wohl alle Systeme mehr oder weniger gleich und mehr oder weniger gut um. Hinter Apples Siri steckt der Sprachtechnologie-Gigant Nuance, Samsung greift auf Vlingo zurück, das mittlerweile ebenfalls zu Nuance gehört, und Google arbeitet mit dem eigenen Erkenner. Dabei tut Google es jetzt auch offline und schickt nicht mehr alle Sprachdaten zur Verarbeitung auf die eigenen Server.
Allerdings gibt es noch große Unterschiede bei den einzelnen Sprachen. So fallen die Erkennerergebnisse für das Englische deutlich besser aus als für die deutsche Sprache. Und auch die eingebundenen und via gesprochener Sprache erreichbaren Dienste sind für deutsche Anwender weniger umfangreich – was die Qualität der Assistenten natürlich schmälert. Denn nicht die Erkennung macht den Unterschied, sondern die cleveren Antworten, Vorhersagen und Hilfestellungen – kurzum die Fähigkeiten des digitalen Privatsekretärs:
Im Netz kursieren zahlreiche Tests und Vergleiche der einzelnen Assistenten. Wer macht das Rennen?
IT-Analyst Gene Munster vom US-Analysedienst Piper Jaffray vergab in seinem Vergleichstest an Siri die Schulnote Vier. Google dagegen erhielt eine Zwei Plus: “Siri hängt Google gefühlte zwei Jahre hinterher”, kommentierte Munster die Ergebnisse seiner Testreihe, bei der seine Assistenten und er auf den belebten Straßen der Innenstadt von Minneapolis Fragen an die digitalen Assistenten richteten und die Antworten auswerteten.
Siri gilt als schlagfertig und charmant und ist in der Lage auch absurde Anfragen oder romantische Liebeserklärungen überzeugend zu parieren. Man hat sich bei Apple also auch an der (sprachlichen) Oberfläche um eine angenehme User-Experience bemüht. Google Now dagegen präsentiert sich als schlau, mitdenkend und lernfähig.
Und S Voice … hat den “woodchuck-Test” erfolgreich bestanden und auf die Frage “How much wood could a woodchuck chuck if a woodchuck could chuck wood?” geantwortet: “A woodchuck would chuck all the wood he could chuck if a woodchuck could chuck wood.”:
Aber braucht wirklich jeder seinen eigenen Sprachassistenten? Und was tun die eigentlich genau? Und vor allem: Was tun sie mit unseren Daten?
Kein persönlicher Assistent ohne persönliche Daten! Ein Privatsekretär aus Fleisch und Blut kann auch nicht arbeiten, ohne auf den Terminkalender zurückzugreifen oder die Namen, Telefonnummern oder E-Mail-Adressen von Partnern, Mitarbeitern oder Familie zu kennen. Und wenn er oder sie sich unaufgefordert um Zahnarzt-, Friseur- oder Partytermine kümmert, nehmen wir diese Hilfe gerne an. Wir vertrauen hier auf Loyalität und Verschwiegenheit.
“Damit Google Now überhaupt so schlau sein kann wie beschrieben, also erahnen kann, was wir machen oder wollen, muss das System schon eine Menge über uns und unsere Gewohnheiten wissen… – nur dann sind Empfehlungen möglich, die sich auf die aktuelle Situation beziehen. Kurzum: Je mehr Google Now über uns weiß, desto besser wird es funktionieren.
Aber ein persönlicher Assistent wird von mir selbst eingestellt und ist zu Verschwiegenheit verpflichtet. Das ist bei Google Now natürlich komplett anders: Da steckt ein großer, amerikanischer Onlinedienst dahinter, der Millionen von Menschen betreut. Und was mit den anvertrauten Daten letztlich passiert, wie und wie lange sie gespeichert werden …, all das ist bestenfalls schwammig formuliert.”, schreibt Jörg Schieb in seinem Blog.
Und auch Apple gegenüber wird Datenschutz-Kritik laut: “Siris großer Bruder – Spracherkennungssysteme auf Smartphones ermöglichen Stimmprofile”, lautete die Schlagzeile bei heise online. In dem Artikel heißt es: “Jedes gesprochene Wort wird auf den Servern von Apple für unbestimmte Zeit gespeichert. Forscher mahnen nun, dass diese Aufzeichungen Stimmprofile ermöglichen, die Strafverfolgern und Hackern zur biometrischen Identifizierung einer Person verhelfen.”
Und die Kritik ist berechtigt. Transparenter Datenschutz und mehr Kontrolle in den Händen der Anwender wären wünschenswert.

19. Juli 2012 








Trackbacks/Pingbacks
[...] Manja Baudis hat das gestern im Smart Service Blog thematisiert: Her mit den Sprachassistenten! [...]
[...] mit Nina einen eigenen sprachgesteuerten Assistenten an, der im Unterschied zu den verwandten Sprachassistenten von Google, Apple und Samsung einen völlig neuen Ansatz verfolgt: Nina richtet sich an Entwickler [...]
[...] Unterschied zu den verwandten Sprachassistenten von Google, Apple und Samsung richtet sich Nina vordergründig an App-Entwickler und nicht direkt [...]