Google a OpenAI využívají k tréninku AI přepis videí z YouTube
Zpráva, která vyšla nedávno, odhalila, že OpenAI použila svůj nástroj pro rozpoznávání řeči Whisper k přepisu více než jednoho milionu hodin videí z YouTube. Tyto přepisy byly poté použity k trénování modelů umělé inteligence, včetně známého modelu GPT-4. Podle informací od The Information dokonce OpenAI využila videa a podcasty z YouTube k trénování svých systémů. Zpráva dále uvádí, že mezi lidmi, kteří se údajně podíleli na tomto procesu, byl i prezident OpenAI Greg Brockman.
Podobné praktiky měla podle zprávy provádět i společnost Google. Přestože jeho zástupci tvrdí, že používají videa z YouTube pouze se souhlasem tvůrců, zpráva tvrdí, že Google v červnu 2023 aktualizoval své zásady ochrany osobních údajů tak, aby šířeji pokrývaly používání veřejně dostupného obsahu, včetně Dokumentů Google a Tabulek Google, k výcviku svých modelů a produktů AI.
Zdroj: Shutterstock
Reakce na tato obvinění jsou rozporuplné. Zástupci OpenAI se k obviněním zatím nevyjádřili. Google na druhou stranu zdůrazňuje, že jejich používání obsahu z YouTube je v souladu s pravidly platformy a že používají data pouze se souhlasem uživatelů.
Tato kontroverze vyvolává otázky ohledně etiky využívání veřejně dostupného obsahu pro trénování modelů umělé inteligence. Zatímco zástupci obou společností tvrdí, že jednají v souladu s pravidly, mnozí se obávají potenciálního porušení autorských práv a nedostatečné transparentnosti ohledně toho, jak jsou data získávána a používána.
Tato situace naznačuje nutnost přehodnocení regulací a pravidel týkajících se využívání veřejně dostupného obsahu pro účely trénování umělé inteligence. Je důležité zajistit, aby vývojáři dodržovali etické standardy, respektovali práva autorů, a zároveň umožnili pokrok v oblasti umělé inteligence.
Diskuse ke článku Google a OpenAI využívají k tréninku AI přepis videí z YouTube