Google představil první verzi Gemini loni v prosinci a o rok později je zde zákonitě verze 2.0 Flash. Čím se odlišuje o svých předchůdců? Google samozřejmě tvrdí, že jde o její nejvyspělejší model, který přináší vyšší výkon, více multimodality a nové možnosti využití nativních nástrojů.

V této souvislosti také často padl výraz „agentní umělá inteligence“, která označuje roboty nebo nástroje s umělou inteligencí, kteří mohou plnit úkoly vaším jménem. Gemini 2.0 Flash navazuje na úspěch verze 1.5 Flash a nabízí vyšší výkon při stejně rychlé odezvě. Je pozoruhodné, že verze 2.0 Flash dokonce překonává verzi 1.5 Pro v klíčových benchmarcích, a to při dvojnásobné rychlosti. Flash 2.0 přichází také s novými možnostmi. Kromě podpory multimodálních vstupů, jako jsou obrázky, video a zvuk, podporuje nyní Flash 2.0 také multimodální výstupy, jako jsou nativně generované obrázky smíchané s textem a vícejazyčný zvuk s možností řízení převodu textu na řeč (TTS). Může také nativně volat nástroje, jako je vyhledávání Google, spouštění kódu i uživatelsky definované funkce třetích stran.

Introducing Gemini 2.0, our most capable AI model yet designed for the agentic era. Gemini 2.0 brings enhanced performance, more multimodality, and new native tool use. pic.twitter.com/C90FXCEDBV