Odborníci ze Západočeské univerzity v Plzni vytvořili digitální kopii hlasu Karla Gotta. Hlasovou syntézu pak využil Český rozhlas při natáčení autobiografické knihy zesnulého zpěváka. Hlas nakonec vznikl v šesti verzích, ze kterých si mohl Český rozhlas vybírat.
Rozhlas se na tým syntézy řeči, který na katedře kybernetiky a ve výzkumném centru NTIS Fakulty aplikovaných věd ZČU vede Jindřich Matoušek, obrátil koncem loňského roku. „Byla to výzva. Jsme sice perfekcionisté a asi nikdy nebudeme úplně spokojeni, ale myslím, že v podmínkách a časových možnostech, jaké byly, jsme dosáhli výborného výsledku,“ říká Jindřich Matoušek.
Při vytváření hlasu Karla Gotta využil tým zkušenosti s automatickou konzervací hlasu, která vznikla pro potřeby nemocných, jimž hrozí, že přijdou o hlas. Základem se staly nahrávky Gottova pořadu Zpátky si dám tenhle film, který v letech 2011–2015 uváděl na stanici Dvojka.
„Dostali jsme k dispozici velké množství nahrávek v délce kolem 200 hodin. Pro syntézu řeči je běžně potřeba několik desítek, ale to jde o člověka, který text načítá přímo za tímto účelem, a nahrávání je pod kontrolou. Tentokrát byla situace jiná, po prostříhání zbylo asi 20 hodin záznamu bez šumu, slov v cizím jazyce nebo písní v podkresu. Díky nim jsme vyrobili první ukázku, již Český rozhlas představil paní Ivaně Gottové, a ta pak rozhodla, že se bude pokračovat. To bylo někdy v prosinci 2022, v lednu a únoru jsme už odevzdávali první a začátkem června poslední kapitolu,“ popisuje Jindřich Matoušek.
Souhlas rodiny Karla Gotta byl klíčovou podmínkou, aby projekt mohl vzniknout. Český rozhlas si nechal zpracovat právní analýzu, protože klonování hlasu zesnulé osoby pro potřeby rozhlasového natáčení je v našich podmínkách novinka.
Na rekonstrukci hlasu Karla Gotta pracoval šestičlenný tým. Kromě těch, kteří se zabývali zvukem, se zapojili i anotátoři společnosti SpeechTech, jelikož nezbytnou součástí byl i text. „Na základě nahrávek a odpovídajících přepisů jsme pak mohli natrénovat model syntézy řeči založený na moderních hlubokých neuronových sítích tak, že hlasem Karla Gotta přečte zadaný psaný text,“ vysvětluje Jindřich Matoušek.
Umělá inteligence načetla hlasem populárního zpěváka zhruba 16 000 slov. Výsledný zvuk prošel postprodukcí. „Doufám, že jsme i tímto projektem ukázali, že v ČR umíme dělat výzkum a vývoj řečových technologií a potažmo umělé inteligence na světové úrovni,“ podotýká Jindřich Matoušek.
Četbu na pokračování Má cesta za štěstím odvysílá ČRo Dvojka během prázdnin, bude mít 49 dílů. Celkem je však dílů 73 a v nezkrácené podobě vyjdou v audioknize na podzim. Pasáže čtené hlasem Karla Gotta jsou zpestřením profesionální četby v podání herce Igora Bareše.
Projekt Gott navždy vznikl pod vedením šéfrežiséra Českého rozhlasu Aleše Vrzáka a kreativního producenta Lukáše Sapíka. Tým, který pracoval s takzvanou hlasovou syntézou, se po celou dobu držel striktních interních pravidel. Z nich například vyplývá, že hlas vytvořený umělou inteligencí může být použit jen pro načtení textu, který dotyčná osoba napsala nebo pronesla, a nebude zneužit v nesprávném kontextu.