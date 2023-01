Zdroj fotografie: Shutterstock

Každý jistě zná různé hlasové generátory a syntezátory, které mluví většinou nějakým univerzálním počítačovým hlasem, málokdy přirozeným. Prozatím asi nejpoužívanější hlasový generátor byl ten, který integrovala společnost Google do svého překladače.

Nyní ale přichází nová technologie od společnosti Microsoft nazvaná VALL-E, která se již nyní v testovací verzi představila v pár ukázkách na Githubu. Tato technologie by totiž měla umožnit analyzovat váš hlas z tří sekundového záznamu a následně ho použít v hlasovém generátoru. Jinými slovy by VALL-E měl umět mluvit vaším hlasem.

Zdroj fotografie: Shutterstock

VALL-E však umí ještě více, protože by měl umět upravit váš hlas tak, jak byste pravděpodobně mluvili v emočním zabarvení nebo pod tlakem. K tomu, aby toto dokázala musela projít databázi obsahující 60 000 hodin nahrávek v anglickém jazyce s využitím LibriLight a EnCodec z dílny společnosti Meta Platforms.

Spolu s novou technologií ale vyvstává i obvyklá otázka z oblasti etiky. Stejně, jak může být VALL-E užitečná, tak může být i nebezpečná a zneužitelná jako fake news, obzvláště v kombinaci s deepfake videem. V praxi by tak mohli útočníci „nadabovat“ video známé osobnosti a do úst vložit něco, co vlastně vůbec neřekl.

Je ale jisté, že své využití určitě najde, ať už se jedná o namlouvání audioknih nebo rozhlasovou práci. František Filipovský by tak ku příkladu mohl nadabovat nový film, i když již není mezi námi. VALL-E ale nebude možné využívat jen jako hlasový generátor, ale také pro dodatečnou zvukovou editaci, kdy je zapotřebí opravit přeřeknutí, které se jednoduše vygeneruje znovu. V tuto chvíli je vše ale pořád v testovací verzi, a proto se prozatím nejedná o reálně využitelný produkt.