Für verbesserte Erkennung : Amazon-Mitarbeiter werten Unterhaltungen mit Alexa aus

Der Lautsprecher Amazon Echo auf der Internationalen Funkausstellung in Berlin.
Der Lautsprecher Amazon Echo auf der Internationalen Funkausstellung in Berlin.

Wenn man sich mit Amazons Sprachassistentin Alexa unterhält, werden Aufnahmen in die Cloud gesendet. Das ist klar. Neu für die meisten Nutzer dürfte allerdings sein, dass die Mitschnitte manchmal auch von Menschen gehört werden könnten - um die Software zu verbessern.

nnn.de von
11. April 2019, 19:10 Uhr

Amazon lässt Mitarbeiter aufgezeichnete Befehle von Nutzern an seine Assistenzsoftware Alexa anhören und abtippen, um die Spracherkennung zu verbessern. Der Konzern bestätigte die Vorgehensweise.

«Wir versehen nur eine extrem geringe Anzahl von Interaktionen einer zufälligen Gruppe von Kunden mit Anmerkungen, um die Nutzererfahrung zu verbessern.»

Bloomberg zufolge wird diese Arbeit an diversen Standorten rund um die Welt erledigt, unter anderem in Boston, Costa Rica, Indien und Rumänien. Laut zwei Mitarbeitern in Bukarest schlagen sie dort pro Schicht jeweils bis zu 1000 Mitschnitte um. Ein Mitarbeiter aus Boston sagte, er habe zum Beispiel Aufzeichnungen mit den Worten «Taylor Swift» analysiert und sie mit der Anmerkung versehen, dass die Nutzer die Sängerin meinten.

«Im Rahmen dieses Workflows haben Mitarbeiter keinen direkten Zugriff auf Informationen, die die Person oder das Konto identifizieren können», betonte Amazon. Der Finanzdienst berichtete zugleich, auf einem Screenshot zu einem solchen Transkriptions-Auftrag seien eine Account-Nummer, der Vorname des Nutzers sowie die Seriennummer des Geräts aufgeführt gewesen. Der Konzern erklärte, alle Informationen würden streng vertraulich behandelt und es werde mit Zugangseinschränkungen und Verschlüsselung gearbeitet.

Aus Amazons öffentlichen Informationen zu Alexa geht bisher nicht explizit hervor, dass unter Umständen auch Menschen die Aufzeichnungen anhören könnten. «Zum Beispiel verwenden wir Ihre Befehle an Alexa, um unsere Systeme zur Spracherkennung und zum Verstehen natürlicher Sprachen zu trainieren», heißt es allgemein in Fragen und Antworten auf einer Amazon-Seite. Zugleich können Nutzer in den Einstellungen die Nutzung ihrer Aufnahmen zur Weiterentwicklung des Dienstes ablehnen sowie bisherige Aufnahmen löschen.

Einige der Mitarbeiter hätten die Aufgabe, sich die Sprachbefehle anzuhören und nachzuprüfen, ob Alexa die Worte richtig erkannt hatte, schrieb Bloomberg. In anderen Fällen werde eine Unterhaltung mit der Software angehört, um zu sehen, wie gut sie mit dem Nutzer interagierte.

In einigen Fällen hätten die Mitarbeiter vertrauliche Informationen wie Namen oder Bankkonto-Informationen gehört, berichtete Bloomberg. In diesen Fällen sollten sie ein Häkchen im Menüpunkt «kritische Daten» setzen und sich die nächste Aufnahme vornehmen. Bloomberg nannte auch weitere Beispiele für von den Mitarbeitern gehörte private Aufnahmen: Ein Frau, die in der Dusche singt, ein Kind, das nach Hilfe ruft. Zwei Beschäftigte sagten Bloomberg, sie hätten auch etwas gehört, was ein sexueller Übergriff gewesen sein könnte. Laut zwei Mitarbeitern aus Rumänien seien sie in solchen Situationen angehalten, nichts zu unternehmen, schrieb der Finanzdienst.

Geräte mit der Assistenzsoftware wie Amazons Echo-Lautsprecher beginnen die Aufnahme grundsätzlich erst, wenn sie das festgelegte Weck-Wort wie «Alexa» hören. Zugleich passiert es immer wieder mal, dass die Funktion fälschlicherweise aktiviert wird, weil die Software glaubt, das Wort gehört zu haben. Auch versehentlichen Aufnahmen würden abgetippt, berichtete Bloomberg. Den Mitarbeitern zufolge würden pro Tag bis zu 100 solcher Aufnahmen durchgearbeitet.

Grünen-Politiker Konstantin von Notz betonte, Amazon müsse den Aufsichtsbehörden erklären, «warum es die Nutzerinnen und Nutzer über diese Praktiken nicht informiert und Einwilligungen der Betroffenen eingeholt hat».

Google erklärte, bei seiner Alexa-Konkurrenzsoftware Assistant könnten unter Umständen Spezialisten auf kurze Audiofragmente zugreifen, um den Dienst zu verbessern, dabei würden aber keine Informationen zur Identifizierung übermittelt und der Ton werde verzerrt. Bei Apple heißt es in einem Sicherheitspapier, bei Aufzeichnungen werde nach sechs Monaten eine Kopie ohne persönliche Informationen gespeichert, die bis zu zwei Jahre lang für die Verbesserung des Dienstes verwendet werden könne. Auch eine geringe Anzahl von Transkriptionen könne dafür eingesetzt werden.

zur Startseite

Gefällt Ihnen dieser Beitrag? Dann teilen Sie ihn bitte in den sozialen Medien - und folgen uns auch auf Twitter und Facebook:

Diskutieren Sie mit.

Leserkommentare anzeigen