Soukromé chaty uživatelů ChatGPT skončily v nástroji pro webmastery
Na první pohled to vypadalo jako drobná chyba. Správci webů si všimli, že se jim v Google Search Console objevují zvláštní, někdy až třísetznakové dotazy, které nedávaly smysl. Nebyly to běžné klíčové fráze, ale celé věty typu: „Pomoz mi zjistit, jestli mě ten kluk má rád“ nebo „Jak říct zaměstnancům o návratu do kanceláře“.
Jenže tyto věty nebyly vyhledávací dotazy, ale výstupy z ChatGPT - přesněji řečeno, části konverzací, které uživatelé zadali do umělé inteligence. A právě tam začala jedna z nejzvláštnějších kauz letošního roku.
Jak se chaty z ChatGPT dostaly do Google
Na problém upozornil analytik Jason Packer z firmy Quantable, který se dlouhodobě zabývá webovou analytikou. Spolu s odborníkem Slobodanem Manićem zjistili, že za únikem stojí kombinace chyby v rozhraní ChatGPT a způsobu, jakým OpenAI zajišťuje doplňování informací z internetu.

Zdroj: Shutterstock
Jejich testy naznačují, že ChatGPT v určitých případech prováděl skutečné vyhledávání na Googlu, aby získal aktuální informace - a část těchto dotazů odesílal přímo do systému Google Search. Tím se útržky soukromých konverzací nechtěně ukládaly do statistik stránek, které se v daném vyhledávání objevily.
Reakce OpenAI: Problém vyřešen, ale otázky zůstávají
OpenAI uznala, že o chybě ví, a uvedla, že ji „rychle opravila“. Společnost tvrdí, že šlo pouze o malý počet dotazů, které se omylem „špatně směrovaly“. Packer i Manić ale zůstávají skeptičtí. Nikdo totiž přesně neví, kolik lidí bylo zasaženo, jak dlouho problém trval a zda se skutečně týkal jen malé části uživatelů.
Podle Packerova vyjádření jde o zásadní rozdíl oproti dřívějším únikům ChatGPT, kdy uživatelé museli ručně povolit zveřejnění chatu. Tentokrát se obsah dostal ven bez jejich vědomí - a bez možnosti ho odstranit.
Co přesně se mohlo stát
Z analýzy vyplývá, že k úniku vedla drobná, ale významná chyba. Stránka s parametrem „hints=search“ mohla způsobit, že se celý dotaz odeslal do Googlu, včetně adresy s částí URL ChatGPT. Když Google stránku indexoval, dotazy se dostaly do Search Console těch webů, které se v daném výsledku objevily vysoko.
To znamená, že nejen Google, ale i někteří správci webů mohli v rámci svých statistik zahlédnout části skutečných uživatelských dotazů - často velmi osobních.
Otázky ochrany soukromí
Z pohledu ochrany dat je problém zásadní. Konverzace s umělou inteligencí často obsahují citlivé informace: Vztahové rady, pracovní tajemství nebo osobní problémy. Pokud se takové věci, byť v nepatrné míře, dostanou do systémů třetích stran, jde o vážný zásah do důvěry uživatelů.
Packer i Manić varují, že uživatelé by měli počítat s tím, že jejich dotazy nejsou nikdy stoprocentně soukromé - obzvlášť pokud model využívá internetové vyhledávání.



















