Google a OpenAI využívají k tréninku AI přepis videí z YouTube

9. 4. 2024 | Francesco | Novinky

Zdroj: Shutterstock

Ve světě umělé inteligence se stále více spoléhá na masivní množství dat k trénování sofistikovaných modelů. Nicméně nedávná zpráva od The New York Times (NYT) zdůrazňuje temnou stránku tohoto procesu. Údajně společnosti jako OpenAI a Google využívaly přepisy videí z YouTube k výcviku svých modelů umělé inteligence, což mohlo vést k porušení autorských práv tvůrců na této platformě.

Přidejte si CDR do oblíbených na Google News

Zpráva, která vyšla nedávno, odhalila, že OpenAI použila svůj nástroj pro rozpoznávání řeči Whisper k přepisu více než jednoho milionu hodin videí z YouTube. Tyto přepisy byly poté použity k trénování modelů umělé inteligence, včetně známého modelu GPT-4. Podle informací od The Information dokonce OpenAI využila videa a podcasty z YouTube k trénování svých systémů. Zpráva dále uvádí, že mezi lidmi, kteří se údajně podíleli na tomto procesu, byl i prezident OpenAI Greg Brockman.

Podobné praktiky měla podle zprávy provádět i společnost Google. Přestože jeho zástupci tvrdí, že používají videa z YouTube pouze se souhlasem tvůrců, zpráva tvrdí, že Google v červnu 2023 aktualizoval své zásady ochrany osobních údajů tak, aby šířeji pokrývaly používání veřejně dostupného obsahu, včetně Dokumentů Google a Tabulek Google, k výcviku svých modelů a produktů AI.

Zdroj: Shutterstock

Reakce na tato obvinění jsou rozporuplné. Zástupci OpenAI se k obviněním zatím nevyjádřili. Google na druhou stranu zdůrazňuje, že jejich používání obsahu z YouTube je v souladu s pravidly platformy a že používají data pouze se souhlasem uživatelů.

Tato kontroverze vyvolává otázky ohledně etiky využívání veřejně dostupného obsahu pro trénování modelů umělé inteligence. Zatímco zástupci obou společností tvrdí, že jednají v souladu s pravidly, mnozí se obávají potenciálního porušení autorských práv a nedostatečné transparentnosti ohledně toho, jak jsou data získávána a používána.

Tato situace naznačuje nutnost přehodnocení regulací a pravidel týkajících se využívání veřejně dostupného obsahu pro účely trénování umělé inteligence. Je důležité zajistit, aby vývojáři dodržovali etické standardy, respektovali práva autorů, a zároveň umožnili pokrok v oblasti umělé inteligence.

Diskuze

Tagy: