CDR.cz - Vybráno z IT

Grok 4.20 míří na start. Musk slibuje AI upgrade, který může vše změnit

Zdroj: Shutterstock

Elon Musk oznámil, že Grok 4.20 dorazí během několika týdnů. Podle prvních testů má jít o výrazně výkonnější verzi, která v simulacích reálných trhů porazila konkurenci a naznačila rychlé tempo vývoje celé platformy xAI.
Přidejte si CDR do oblíbených na Google News

O Groku se mluví často, ale tentokrát se kolem něj něco opravdu hnulo. Musk potvrdil, že nová verze je téměř hotová a ven půjde už během několika týdnů. Na poměry xAI jde o poměrně krátký odstup a podle všeho to není náhoda. Uvnitř firmy se zjevně rozhodli, že tempo vývoje zrychlí, a zatím to vypadá, že to nebyl nerozvážný tah.

Pozornost vzbudily hlavně výsledky z Alpha Areny. Místa, které vzniklo jako jakási herní burza pro AI modely. Nejsou tam připravené, předvídatelné scénáře. Modely dostanou stejný startovní kapitál a pak se ukáže, kdo umí reagovat a kdo jen papouškuje naučené patterny. Kdo to někdy viděl v provozu, ví, že tam není moc prostoru na hezké dlouhé úvahy. Jde o sekundy.

Co se v testech vlastně stalo

Grok 4.20 tam dorazil tiše, bez jména, aby si neodnesl žádnou výhodu ani zátěž. Jen další model na startovní čáře. Jenže během pár dní si ostatní všimli, že má trochu jiné tempo. V situacích, kde se ostatní modely zasekávaly, šel Grok dál. A když se data měnila rychleji, než by bylo příjemné komukoliv, kdo si potrpí na přesné podmínky, držel se překvapivě jistě.

Zdroj: Shutterstock

Po dvou týdnech skončil v plusu. Ne jen o pár procent. Přes deset procent čistého zisku v prostředí, kde jiné modely končily v červených číslech. To už není náhoda, ale viditelná změna. Testeři si všimli i toho, že model reagoval rychleji a méně váhal, což bývá přesně ta oblast, kde se jazykové modely často trápí. Dlouhé texty zvládají všichni, ale okamžitá reakce je úplně jiný sport.

Do celého obrazu navíc zapadá i to, jak si vede starší varianta Groku 4.1 Fast. Ta se v posledních týdnech stala jedním z nejpoužívanějších modelů na nezávislých platformách. Nejde o oficiální měření, ale potvrzuje to, že vývoj v xAI se poslední měsíce nepříjemně dobře trefuje do toho, co lidé skutečně používají.

A jaká by měla být ta nová verze? O nové verzi se zatím ví pouze to, že má být rychlejší a jistější v situacích, kde se mění podmínky tak rychle, že se v nich tradiční modely obvykle ztrácejí. Tým kolem xAI je v detailech tradičně skoupý, ale z reakcí lidí, kteří se k testům dostali, je vidět, že tentokrát nejde jen o kosmetickou úpravu.

Diskuze