OpenAI se baží: Nový moderátor sociálních sítí nebude člověk, ale ChatGPT-4
Tvrdí, že GPT-4 dokáže číst a interpretovat pravidla v dlouhých dokumentech o politice obsahu a okamžitě se přizpůsobit jejím změnám. Tím by mělo dojít k eliminaci nežádoucích zkreslení, která mohou být zavedena během trénování modelu, a k ulehčení duševní zátěže velkého počtu lidských moderátorů.
Moderování obsahu je důležitá a náročná úloha, která vyžaduje pečlivou práci, citlivost, hluboké porozumění kontextu a také rychlou adaptaci na nové případy. Tradičně je tato úloha svěřena lidským moderátorům, kteří procházejí velkým množstvím obsahu a likvidují ten toxický a škodlivý. Je však pravdou, že to není úplně rychlý proces a může vést k duševnímu stresu.
OpenAI se snaží řešit tyto problémy pomocí velkých jazykových modelů (LLM), jako je právě GPT-4, které dokážou porozumět a generovat přirozený jazyk. Tyto modely mohou dělat rozhodnutí o moderování obsahu na základě pokynů k politice obsahu, které jim jsou poskytnuty. S tímto systémem se proces vytváření a přizpůsobování politiky obsahu zkrátí z měsíců na hodiny.
Zdroj: Shutterstock
Jakmile je pokyn k politice obsahu napsán, odborníci na politiku mohou vytvořit zlatou sadu dat tím, že identifikují malý počet příkladů a přiřadí jim štítky podle ní. Poté GPT-4 přečte politiku a přiřadí štítky téže sadě dat, aniž by viděl odpovědi. Pak mohou odborníci požádat, aby model vysvětlil své důvody za svými štítky, analyzoval nejasnosti v definicích politiky, vyřešil veškeré nesrovnalosti a poskytl další objasnění v politice.
Tento nový přístup má také několik dalších výhod oproti současné manuální metodě moderování obsahu. Jednou z nich je snížení nekonzistentního štítkování a rychlejší zpětná vazba pro zlepšení politiky. Lidé mohou interpretovat politiku různými způsoby, než si osvojí nové změny, což často vede k nekonzistentním štítkům. Naproti tomu LLM jsou citlivé na drobné rozdíly ve formulaci a mohou se okamžitě přizpůsobit změnám politiky, což rozhodně vede ke konzistentnějšímu zážitku z obsahu pro uživatele.