Google stvořil AI, která rozumí delfínům. Arabela už není jediná
Projekt Wild Dolphin Project (WDP) sleduje už od roku 1985 konkrétní populaci delfínů skvrnitých atlantických. Vědci při své práci spoléhají na nenásilné metody, sbírají rozsáhlé audio i video záznamy a pečlivě je doplňují o podrobné poznámky k chování jednotlivých jedinců. Cílem je jediné: pochopit, jak mezi sebou tito mořští savci skutečně komunikují.
Díky desetiletím práce už badatelé například zjistili, že delfíni mají „podpisové hvizdy“, které připomínají jména. Každý jedinec má svůj charakteristický zvuk, kterým se identifikuje ostatním – a ti na něj dokážou reagovat. Při konfliktech zase opakovaně zaznívají specifické „skřeky“, podobně jako když se lidé hádají.
Ale jde o jazyk v pravém slova smyslu? Podle zakladatelky WDP Denise Herzing na to zatím nemáme jasnou odpověď: „Nevíme, jestli zvířata mají slova.“
DolphinGemma: první krůčky k „řeči delfínů“
Odpověď by mohla přinést umělá inteligence. Google se rozhodl využít vlastní open-source AI modely Gemma a vycvičit jejich variantu zvanou DolphinGemma právě na akustickém archivu WDP. Výsledkem je systém, který funguje podobně jako běžné jazykové modely – jen místo lidských vět zpracovává a generuje zvuky delfínů.
Klíčovým prvkem je technologie SoundStream. Ta umožňuje převést delfíní zvuky na tzv. tokeny – tedy malé stavební kameny, které může model analyzovat a předvídat stejně jako slova ve větě. Po zadání konkrétního hvizdu model odhaduje, jaký zvuk by mohl následovat. Cílem je vytvořit srozumitelný vzorec a třeba i „slovník“, kterému by rozuměli jak lidé, tak i samotní delfíni.
Při testování už DolphinGemma zvládla generovat zvuky, které svým spektrogramem připomínají přirozené delfíní signály. Pokud by se ukázalo, že tyto zvuky skutečně delfíni chápou a reagují na ně, šlo by o obrovský průlom.
Zdroj: Shutterstock
Pixel jako nástroj pro vědu: miniaturní laboratoř do kapsy
Zásadním prvkem celého výzkumu je také použití běžných smartphonů – konkrétně Pixelů od Googlu. Už několik let WDP využívá zařízení zvané CHAT (Cetacean Hearing Augmentation Telemetry), které vzniklo ve spolupráci s Georgia Institute of Technology. Jde o podvodní mikrofonní systém založený právě na telefonech Pixel, konkrétně dnes už na modelu Pixel 6 – a nově přechází na výkonnější Pixel 9.
CHAT nejen nahrává zvuky delfínů, ale také je v reálném čase analyzuje a může zkoušet vytvářet syntetické odpovědi. Cílem je asociovat určité zvuky s předměty nebo situacemi – a pozorovat, zda delfíni na „umělou mluvu“ reagují.
Google ale upozorňuje, že zatím nemá v plánu přímo přehrávat zvuky z DolphinGemma zpět delfínům v přírodě. Oba směry výzkumu – DolphinGemma a CHAT – jsou vedeny samostatně, byť se vzájemně doplňují.
Model pro všechny: otevřená cesta pro vědu
Na rozdíl od některých firemních nástrojů je DolphinGemma open-source model, což znamená, že bude dostupný pro výzkumníky po celém světě. Google plánuje uvolnit model už v létě 2025. A i když je nyní trénovaný výhradně na delfíny skvrnité atlantické, existuje potenciál pro jeho doladění i na jiné druhy kytovců.
DolphinGemma má podle Googlu přibližně 400 milionů parametrů – což je na jazykové modely relativně málo, ale díky tomu je možné jej provozovat i na méně výkonných zařízeních, jako jsou chytré telefony. To je klíčové právě pro terénní výzkum, kde nelze nosit výkonné servery na zádech.
Mluvit s delfíny? Ještě ne dnes, ale možná zítra
Nikdo neočekává, že by DolphinGemma během pár měsíců umožnila lidem skutečný rozhovor s delfíny. Ale první krůčky směrem k „překladu“ zvuků už začaly. A co je důležité – poprvé v historii má věda nástroj, který dokáže zpracovávat miliony zvukových dat bez potřeby ruční analýzy.