CDR.cz - Vybráno z IT

Bezpečnost ChatGPT lze prolomit skotským dialektem a dalšími méně známými jazyky

Zdroj: Shutterstock

Cílem společnosti OpenAI, která je autorem ChatGPT, je, aby byla jeho umělá inteligence co možná nejbezpečnější. Problém ale je v tom, že díky málo používaným jazykům, jako například skotský dialekt, je možné bezpečnostní limity tohoto nástroje prolomit.

Společnost OpenAI, autor technologie ChatGPT, se snažila zajistit, aby její umělá inteligence byla co možná nejvíce bezpečná. Hlavní obavou je, aby ChatGPT nevydávala nebezpečné rady nebo nešířila dezinformace a pomluvy. Jejich snahy vedly k vytvoření bezpečnostního opatření, které mělo tento druh obsahu zamezit.

Nicméně, výzkumníci z Brownovy univerzity objevili způsob, jak obejít tyto stanovené hranice. Stačí jednoduše použít méně studované jazyky, jako je zuluština nebo skotská gaelština, pro komunikaci s ChatGPT. Přeložením nebezpečných rad nebo příkazů do těchto jazyků pomocí Google Překladače lze dosáhnout toho, aby ChatGPT ignorovalo svá bezpečnostní opatření a reagoval na škodlivé vstupy.

Zdroj: Shutterstock

Pro toto chování se používá anglický výraz „jailbreaking“ a týká se manipulace s programem či zařízením, aby cíleně fungovalo jinak, než je jeho zamýšlená funkce. Nicméně OpenAI se snaží nějak vyškolit svou umělou inteligenci, aby byla ještě více odolná i proti tomuto způsobu manipulace.

Výsledky studie ukazují, že celý průmysl kolem umělé inteligence je spíše zaměřen na větší jazyky a poněkud zanedbává ty méně rozšířené. Tím ale vzniká ono bezpečnostní riziko. Jedním způsobem je získávání zpětné vazby od jednotlivých uživatelů. Jelikož tu s námi má umělá inteligence být, je nezbytné, aby zohlednila všechny jazyky a kultury. Společnosti jako OpenAI pak musejí jednoduše přijmout taková opatření, aby používání umělé inteligence bylo bezpečné pro všechny.

Zdroje: 

Diskuse ke článku Bezpečnost ChatGPT lze prolomit skotským dialektem a dalšími méně známými jazyky

Pátek, 3 Listopad 2023 - 07:26 | Hugo Hugo | Mě to přišlo vtipné, ale asi je to problém....
Středa, 1 Listopad 2023 - 12:30 | DRK | "Jejich snahy vedly k vytvoření...
Středa, 1 Listopad 2023 - 09:48 | maruširi | Zkryplená AI, s polovinou slovníku zakázanou, aby...

Zobrazit diskusi