Technologie na rozpoznávání přirozené lidské řeči by mohly od základu změnit způsob, jakým ovládáme počítače a další zařízení. Jenže většina z nich patří konkrétním firmám a jejich používání není levné – pro řadu začínajících firem tak vůbec nemusí být dostupné.
Mozilla proto spustila ambiciózní projekt Common Voice, jehož cílem je vytvořit opensourcovou databázi řečových vzorků, která má v budoucnu umožnit komukoli vytrénovat hlasem ovládané aplikace.
Na začátku je crowdsourcingový sběr vzorků. Na webu projektu může kdokoli namluvit předložené věty, které se pak zařadí do datasetu. Pokud nechcete „darovat svůj hlas“, můžete také pomoci s validací vzorků – poslechnete už nahranou větu a potvrdíte, zda odpovídá předloženému textu.
Podle Mozilly by výsledná databáze měla být veřejně k dispozici v průběhu letošního roku. K jejímu vybudování potřebuje alespoň 10 tisíc hodin nahrávek. „To je přibližné množství, které je nutné k vytrénování reálného STT (speech-to text) systému,“ vysvětluje.
Do budoucna také Mozilla uvažuje o začlenění hlasové technologie do svého prohlížeče Firefox. Z hlediska českého uživatele je tu jen jeden problém: vše se samozřejmě týká zatím jen anglického jazyka.