CDR.cz - Vybráno z IT

Soukromé chaty uživatelů ChatGPT skončily v nástroji pro webmastery

Zdroj: Shutterstoc

V nástroji Google Search Console, který má správcům webů pomáhat s analýzou návštěvnosti, se v posledních měsících objevily stovky zvláštních dotazů. Podle analytiků šlo o uniklé části skutečných konverzací z ChatGPT – včetně osobních zpráv a firemních dat. Jak k tomu došlo a co to znamená pro ochranu soukromí?
Přidejte si CDR do oblíbených na Google News

Na první pohled to vypadalo jako drobná chyba. Správci webů si všimli, že se jim v Google Search Console objevují zvláštní, někdy až třísetznakové dotazy, které nedávaly smysl. Nebyly to běžné klíčové fráze, ale celé věty typu: „Pomoz mi zjistit, jestli mě ten kluk má rád“ nebo „Jak říct zaměstnancům o návratu do kanceláře“.

Jenže tyto věty nebyly vyhledávací dotazy, ale výstupy z ChatGPT - přesněji řečeno, části konverzací, které uživatelé zadali do umělé inteligence. A právě tam začala jedna z nejzvláštnějších kauz letošního roku.

Jak se chaty z ChatGPT dostaly do Google

Na problém upozornil analytik Jason Packer z firmy Quantable, který se dlouhodobě zabývá webovou analytikou. Spolu s odborníkem Slobodanem Manićem zjistili, že za únikem stojí kombinace chyby v rozhraní ChatGPT a způsobu, jakým OpenAI zajišťuje doplňování informací z internetu.

Zdroj: Shutterstock

Jejich testy naznačují, že ChatGPT v určitých případech prováděl skutečné vyhledávání na Googlu, aby získal aktuální informace - a část těchto dotazů odesílal přímo do systému Google Search. Tím se útržky soukromých konverzací nechtěně ukládaly do statistik stránek, které se v daném vyhledávání objevily.

Reakce OpenAI: Problém vyřešen, ale otázky zůstávají

OpenAI uznala, že o chybě ví, a uvedla, že ji „rychle opravila“. Společnost tvrdí, že šlo pouze o malý počet dotazů, které se omylem „špatně směrovaly“. Packer i Manić ale zůstávají skeptičtí. Nikdo totiž přesně neví, kolik lidí bylo zasaženo, jak dlouho problém trval a zda se skutečně týkal jen malé části uživatelů.

Podle Packerova vyjádření jde o zásadní rozdíl oproti dřívějším únikům ChatGPT, kdy uživatelé museli ručně povolit zveřejnění chatu. Tentokrát se obsah dostal ven bez jejich vědomí - a bez možnosti ho odstranit.

Co přesně se mohlo stát

Z analýzy vyplývá, že k úniku vedla drobná, ale významná chyba. Stránka s parametrem „hints=search“ mohla způsobit, že se celý dotaz odeslal do Googlu, včetně adresy s částí URL ChatGPT. Když Google stránku indexoval, dotazy se dostaly do Search Console těch webů, které se v daném výsledku objevily vysoko.

To znamená, že nejen Google, ale i někteří správci webů mohli v rámci svých statistik zahlédnout části skutečných uživatelských dotazů - často velmi osobních.

Otázky ochrany soukromí

Z pohledu ochrany dat je problém zásadní. Konverzace s umělou inteligencí často obsahují citlivé informace: Vztahové rady, pracovní tajemství nebo osobní problémy. Pokud se takové věci, byť v nepatrné míře, dostanou do systémů třetích stran, jde o vážný zásah do důvěry uživatelů.

Packer i Manić varují, že uživatelé by měli počítat s tím, že jejich dotazy nejsou nikdy stoprocentně soukromé - obzvlášť pokud model využívá internetové vyhledávání.

Tagy: 
Zdroje: