Berlin (dpa/tmn) - Die Mozilla-Stiftung hat eine frei zugängliche Sprachdatenbank (Common Voice) und ein quelloffenes Programm zur Spracherkennung (DeepSpeech-Engine) veröffentlicht. Beides darf jedermann für eigene Dienste zur Spracherkennung und -steuerung nutzen oder weiterentwickeln.

Die aus dem Common-Voice-Projekt resultierende Sprachsammlung enthält derzeit rund 400 000 Aufnahmen von 200 000 unterschiedlichen Menschen, was ungefähr 500 Stunden an Sprachaufnahmen entspricht - und wächst weiter. Es handelt sich nach Angaben von Mozilla um den zweitgrößten offenen Sprachdatensatz nach dem LibriSpeech-Projekt.

Nutzer können via iPhone-App und Browser weiter zum Anwachsen der Common-Voice-Datenbank beitragen, indem sie Sätze vorlesen, die dann aufgezeichnet werden - in der Hoffnung, dass daraus datenschutzfreundliche Dienste rund um die Spracherkennung und Sprachsteuerung erwachsen. Aktuell laufen die Projekte nur auf Englisch, andere Sprachen sollen den Angaben zufolge aber schon bald unterstützt werden.

Positiv unter Datenschutzaspekten: Die Mozilla-Entwicklungen funktionieren auch ohne ständige Internetverbindung.

Mozilla selbst gibt an, darüber nachzudenken, Sprachschnittstellen auf Basis von Common Voice und DeepSpeech in vielen Mozilla-Produkten einzusetzen, darunter auch im Firefox-Browser. © dpa