Google Gemini a Imagen 3: Nová éra generování AI obrázků

30. 8. 2024 | Francesco | Novinky

Zdroj: Shuttestock

Google opět posouvá hranice technologií umělé inteligence, tentokrát s vylepšeným generátorem obrázků Imagen 3 a novými funkcemi pro svého chatbota Gemini. Tyto novinky přicházejí po kontroverzi, která se objevila začátkem tohoto roku, kdy Google musel stáhnout možnost generování obrázků lidí z důvodu problémů s kvalitou a etickými otázkami.

Přidejte si CDR do oblíbených na Google News

Nový standard v generování obrázků: Imagen 3

Imagen 3 představuje nejnovější verzi generátoru obrázků od společnosti Google, který se nyní stává součástí chatbota Gemini. Tato vylepšená verze se pyšní „nastavením nového standardu pro kvalitu obrazu“, jak uvádí produktový manažer Gemini, Dave Citron. Jednou z klíčových změn je přidání ochranných opatření, která mají zabránit přehnaným úpravám obrazů, jež by mohly vést k bizarním nebo nevhodným výsledkům, jaké se v minulosti staly virálními.

Citron také zdůrazňuje, že Imagen 3 je navržen tak, aby dosahoval lepších výsledků v široké škále benchmarků v porovnání s jinými dostupnými modely generování obrázků. Uživatelé nyní mají možnost vést generování obrázků pomocí dalších výzev, pokud výstup neodpovídá jejich očekáváním, což dává větší kontrolu nad finálním výsledkem.

Bezpečnost na prvním místě

Jednou z nejvýznamnějších novinek je opětovné zavedení možnosti generování obrazů lidí, která byla dočasně stažena kvůli problémům s kvalitou a etickým rizikům, včetně obav z možného zneužití této technologie k tvorbě deepfakeů. S návratem této funkce Google implementoval přísná pravidla, která mají zabránit vytváření „fotorealistických, identifikovatelných jedinců“, čímž se snižuje riziko zneužití. Funkce je navíc dostupná pouze pro placené uživatele, což je další krok k zajištění jejího bezpečného a odpovědného používání.

Zdroj: Shutterstock

V novém systému jsou také zakázány určité typy obsahu, včetně obrázků dětí a jakýchkoli krvavých, násilných nebo sexuálních scén. Google tak dává jasně najevo, že se snaží o maximální bezpečnost a ochranu uživatelů před potenciálně škodlivým obsahem.

Revoluce v personalizaci chatbotů

Kromě vylepšení v oblasti generování obrázků přináší Google novinky i v oblasti personalizace chatbotů. S funkcí „drahokamy“ (Gems) se uživatelé mohou těšit na chatboty, kteří budou fungovat podle specifických pokynů vytvořených samotnými uživateli. Tyto drahokamy jsou obdobou „vlastních GPT“ od OpenAI, což naznačuje pokračující rivalitu mezi těmito dvěma technologickými giganty.

Gemy umožňují uživatelům vytvářet týmy odborníků, kteří jim mohou pomoci s různými úkoly – od plánování projektů až po tvorbu textů na sociální sítě. Kromě toho jsou k dispozici i předem připravené drahokamy, které mohou inspirovat nové nápady a usnadnit práci s chatbotem. Mezi tyto předem připravené drahokamy patří například:

Learning coach – Pomůže porozumět složitým tématům.
Brainstormer – Inspiruje nové nápady.
Průvodce kariérou – Provádí vylepšením dovedností a kariérním rozhodováním.
Psací editor – Poskytuje zpětnou vazbu ohledně gramatiky, tónu a struktury textu.
Partner pro kódování – Podporuje rozvoj dovedností v oblasti kódování a inspiruje nové projekty.

Tyto funkce se od tohoto týdne postupně stávají dostupnými na počítačích a mobilních zařízeních, přičemž jejich využití je omezeno na uživatele s placeným předplatným Gemini Advanced, Business a Enterprise.

Google pokračuje ve svém úsilí posouvat hranice možností umělé inteligence, ať už jde o generování obrázků s Imagen 3 nebo personalizaci chatbotů pomocí drahokamů. Tyto inovace nejenže přinášejí nové nástroje pro uživatele, ale také kladou důraz na bezpečnost a etické použití technologie. Jak se AI vyvíjí, je jasné, že Google se snaží být na čele této revoluce, přičemž stále více zohledňuje potřeby a obavy svých uživatelů.

Diskuze

Tagy: