Google na nás bude mluvit lepší češtinou. Poslechněte si ji
Stále častěji se v našem životě setkáváme s hlasovými asistenty, ať už v GPS navigacích, mobilech či počítačích. Cílem mnoha technologických společností je, aby se tento umělý hlas stal natolik přirozený pro lidské ucho, že by nikdo vlastně nepoznal, že to není člověk.
základní parametrický model češtiny
Jednou z předních společností zabývajících se tímto problémem je Google, který pověřil svoji společnost DeepMind řešením tohoto problému. DeepMind se již před pár měsíci vytasil s novou technologií zvanou WaveNet. Aby výzkumníci ještě vylepšili model syntézy hlasu, využívají vlastní neuronové sítě, které mají vygenerovat takové zvukové vlny, které by odpovídaly daným hláskám.
čeština z WaveNetu
Princip je teoreticky jednoduchý, dostat co největší množství psaného textu a jeho namluvené podoby a snažit se vygenerovat nějaký model zvukových vln, který by odpovídal běžnému standardu. Samotná technologie WaveNet a nově upravené hlasy nejsou žádnou novinkou, protože některé státy ji používají již přes rok.
Nyní Google použil WaveNet i na češtinu a slovenštinu, takže od letošního února se můžeme těšit z lepších hlasů, které k nám promlouvají z našeho mobilu. Postupně chce společnost Google tyto nové hlasy využít ve všech svých službách, prozatím ho však můžeme slýchat např. v předčítání Google Go. Najdou se však i jedinci, kterým předchozí, strojová verze vyhovovala více z důvodu srozumitelnosti.