Die meisten Experten gehen davon aus, dass technische Geräte zukünftig in der Regel per Sprachsteuerung bedient werden. Fast alle großen Unternehmen der Branche arbeiten daher inzwischen an entsprechender Software. Diese ist bei weitem noch nicht perfekt, wird aber schon in vielen Geräten verbaut, um Erfahrungswerte zu sammeln. Dieses Vorgehen bringt aber auch ein Problem mit sich. Denn die Unternehmen bauen jeweils eigene und geschlossene Datenbanken auf. Fremde Entwickler und Startups können darauf nicht zugreifen. Dies hemmt zum einen die Innovationskraft, kann zum anderen zukünftig aber auch zu einem unfairen Wettbewerbsvorteil werden. Die gemeinnützige Mozilla Foundation will diese Problematik daher mit einem Open Source Ansatz lösen.


Bild: Screenshot Project Common Voice

Nutzer können auf zwei Arten aktiv werden

Dafür soll eine Stimmdatenbank mit mehr als 10.000 Stunden Audiomaterial aufgebaut werden. Wer möchte, kann bei diesem Projekt ganz einfach mithelfen. Auf der Webseite des Project Common Voice kann jeder zufällig präsentierte englische Sätze einsprechen und speichern. Nutzer von Apple-Produkten müssen dafür allerdings eine eigene App herunterladen, ansonsten funktioniert die Aufnahme direkt im Browser. Wer seine Stimme lieber nicht dauerhaft zur Verfügung stellen möchte, kann zudem auch in der Qualitätssicherung aktiv werden. In diesem Schritt muss lediglich überprüft werden, ob die gespeicherte Audiodatei tatsächlich mit dem vorgegebenen Text übereinstimmt. Die Experten von Mozilla gehen davon aus, dass auf diese Weise ausreichend Material gesammelt werden kann, um eine Spracherkennung mit hoher Genauigkeit zu entwickeln.

Entwickler und Wissenschaftler können die Dateien beliebig nutzen

Unklar ist allerdings noch, wer diese Arbeit verrichten wird. Denn die Datenbank steht ab Mitte dieses Jahres allen interessierten Entwicklern zur Verfügung. Diese bekommen allerdings keine Vorgaben, was sie mit den Stimmaufnahmen zu machen haben. Die eingesprochenen Sätze können also theoretisch für jedes beliebige Produkt verwendet werden. Auch für die Wissenschaft und Grundlagenforschung könnte ein solch großer Datensatz von Interesse sein. Mozilla selbst denkt zudem darüber nach, eine Sprachsteuerung in den Firefox-Browser zu integrieren. Bisher handelt es sich dabei aber lediglich um eine Idee, ein konkreter Umsetzungsbeschluss wurde noch nicht gefasst. Die Nutzer um Hilfe zu bitten, ist jedenfalls kein neuer Ansatz: Das sogenannte Crowd Sourcing wurde in der Vergangenheit beispielsweise bereits im Rahmen von Google Translate genutzt – inzwischen setzt der Konzern dort aber verstärkt auf den Einsatz von künstlicher Intelligenz.


Teile den Artikel oder unterstütze uns mit einer Spende.
PayPal SpendeAmazon Spendenshopping

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.