ChatGPT odpovídá na více než polovinu programátorských otázek špatně

14. 8. 2023 | Francesco | Novinky

Zdroj: Shutterstock

Pro někoho je možná ChatGPT zdánlivě velké usnadnění, když nemusí provádět velké rešerše nebo trávit pracovní dobu vyhledáváním vhodného kódu na Stack Overflow. Výzkum ovšem prokázal, že v oblasti programování odpovídá ChatGPT ve více než 50 % otázek špatně. Jelikož však ChatGPT podává softistikované a uvěřitelné odpovědi, nezkušení programátoři tyto chyby těžko odhalí.

Mezi programátory panuje mnoho vtipů, které poukazují na fakt, že většina jejich práce je vyhledávání stejného problému na Stack Overflow. Tam jste ale museli buď dlouze vyhledávat nebo zadat svůj problém a čekat i týden, než vám někdo vhodný odpověděl nebo než se rozvinula diskuze.

To už dnes není tak úplně pravda, což se zásadně změnilo s příchodem technologie ChatGPT. Pro programátory je daleko jednodušší poslat do ChatGPT kus kódu, napsat požadavky, co to má dělat a nechat si vygenerovat odpověď. Nyní přichází ale druhá otázka, jsou výsledky ChatGPT správné a pravdivé?

Doposud neexistovala žádná věrohodná studie, která by jednoznačně prokázala pravdivost a účinnost výsledků generovaných ChatGPT. Nyní se do této výzvy pustil tým z Purdue University. Chatbotu ChatGPT položili 512 otázek ze Stack Overflow a následně hodnotili přesnost a kvalitu odpovědí.

Výsledky pak překvapili každého, protože se ukázalo, že z 512 otázek bylo 259 otázek zodpovězených ChatGPT nesprávně, což je 52 %. Pouze 248 otázek bylo správných, což dělá zbývajících 48 %. V 77 % případů byly odpovědi velice podrobné až vyčerpávající a snažili se odpovědět na různé aspekty týkající se dané otázky.

Dále tým výzkumníků předložil odpovědi ChatGPT 12 programátorům s různou úrovní znalostí, aby se k daným otázkám vyjádřili. Zde pak nastal problém, kdy velice sofistikované formulované odpovědi dokonale zmátli programátory, takže velice často přehlédli nesprávné informace a odpovědi.

Podle vyjádření autorů studie pak dochází k přehlížení nesprávných odpovědí vygenerovaných ChatGPT v 39,34 %, právě z důvodu komplexnosti a velice dobře formulovaným odpovědím. Nejde však o problém jen ChatGPT, ale všech chatbotů. To je i důvod, proč používání tohoto typu umělé inteligence může významně přispět k šíření dezinformací. Nicméně autoři doufají, že nízké procento věrohodnosti přiměje uživatele se zamyslet nad mírou používání ChatGPT.

Tagy:

ChatGPT, umělá inteligence, AI

Zdroje:

ZDNet.com

nahlásit chybu

Lukáš "Francesco" Čihák

více článků, blogů a informací o autorovi

Diskuse ke článku ChatGPT odpovídá na více než polovinu programátorských otázek špatně

Pondělí, 21 Srpen 2023 - 10:37 | eXponencial | takze vlastne je to celkom slusny a sofistikovny...

Úterý, 15 Srpen 2023 - 11:26 | maruširi | ChatGPT i na úplně jednoduché otázky dává...

Úterý, 15 Srpen 2023 - 10:51 | iferdai | Ta studie je k dispozici zde: https://arxiv.org/...

Úterý, 15 Srpen 2023 - 10:41 | Jan Smetana | .. a je mozne ty otazky+odpovedi videt? Takhle...

Úterý, 15 Srpen 2023 - 08:03 | iferdai | přesně tak. Prostě je to jen další zdroj...

Pondělí, 14 Srpen 2023 - 19:51 | Princik | Asi jako u spuosty sofistikovaných nástrojů i zde...

Pondělí, 14 Srpen 2023 - 16:49 | Arctia | "byly odpovědi velice podrobné až...

Zobrazit diskusi

CDR.cz - Vybráno z IT

ChatGPT odpovídá na více než polovinu programátorských otázek špatně

Lukáš "Francesco" Čihák

Diskuse ke článku ChatGPT odpovídá na více než polovinu programátorských otázek špatně

Komerční sdělení

CDR Hry

Tchaj-wan označil požadavky USA za loupež, TSMC chce vrátit zálohy CHIPS Act

Levnější Lunar Lake Core Ultra 7 254V, je slabší než nejnižší Core Ultra 5 226V

Chcete desku s čipsetem B650? Neotálejte, výroba končí

Po Intelu chce Trump investovat i do Micronu, Samsungu a TSMC. Moc ale nezískají

Aktualizace Windows 11 může poškodit SSD a způsobit ztrátu dat

Aktuálně z blogů

Patriot Burst Elite 240GB SATA SSD [Čtenářský blog] - Potřetí

Patriot Burst Elite 240GB SATA SSD [Čtenářský blog] - Pokračování

Testujeme nižší cenovou: Patriot Burst Elite 240GB SATA SSD [Čtenářský blog]

Jsou SMS po smrti? Jak šel čas s mobilními zprávami a kam zmizelo jejich kouzlo

Co si přeji od předělávky Mafia? Vyplnění mezer a čtvrtý díl s Tommyho dcerou