Anonymní účet už nemusí být anonymní. AI dokáže spojovat digitální stopy
Dlouhé roky platilo jednoduché pravidlo. Pokud člověk vystupoval pod přezdívkou a neuváděl osobní údaje, mohl se na internetu pohybovat relativně anonymně. Diskusní fóra, sociální sítě nebo technologické komunity tak často fungovaly jako prostor, kde lidé oddělovali svůj veřejný život od online identity.
Nové výzkumy ale naznačují, že tato hranice se začíná rozplývat. Moderní jazykové modely dokážou analyzovat texty a hledat v nich vzorce, které jsou pro každého člověka typické. Styl psaní, slovní zásoba nebo témata, ke kterým se autor vrací, vytvářejí poměrně unikátní podpis.
Právě tyto signály dokáže umělá inteligence porovnávat napříč různými platformami. Pokud někdo píše na diskusním fóru pod přezdívkou a jinde vystupuje pod skutečným jménem, algoritmus může oba účty propojit.
V některých testech výzkumníci zjistili, že takový přístup může být překvapivě přesný. V části experimentů se podařilo správně přiřadit anonymní účet ke konkrétní osobě v přibližně devadesáti procentech případů. Celkově se identitu podařilo určit zhruba u dvou třetin analyzovaných uživatelů.
Styl psaní jako digitální otisk
Princip, na kterém tyto systémy fungují, není ve skutečnosti nijak složitý. Každý člověk má při psaní určité návyky. Používá podobné obraty, vrací se k určitým tématům a často má i charakteristický způsob formulování myšlenek.
Umělá inteligence dokáže tyto detaily zachytit a porovnat je s texty z jiných veřejných zdrojů. Výzkumníci například pracovali s příspěvky z technologické komunity Hacker News a porovnávali je s informacemi dostupnými na profesní síti LinkedIn. Z profilů odstranili přímé identifikační údaje a nechali model pracovat pouze s textem.
Algoritmus pak hledal osoby, jejichž profesní zaměření nebo styl vyjadřování odpovídal anonymním příspěvkům. Pokud se několik podobných stop překrylo, vznikla poměrně silná shoda.
Podobné experimenty probíhaly také s diskusemi na Redditu nebo s historickými anonymizovanými daty z filmové služby Netflix. V některých případech stačilo, že uživatel opakovaně zmiňoval úzký okruh témat nebo konkrétní filmy. I taková drobná vodítka dokázala algoritmus dovést ke správnému přiřazení.




















