Google představil první verzi Gemini loni v prosinci a o rok později je zde zákonitě verze 2.0 Flash. Čím se odlišuje o svých předchůdců? Google samozřejmě tvrdí, že jde o její nejvyspělejší model, který přináší vyšší výkon, více multimodality a nové možnosti využití nativních nástrojů.
V této souvislosti také často padl výraz „agentní umělá inteligence“, která označuje roboty nebo nástroje s umělou inteligencí, kteří mohou plnit úkoly vaším jménem. Gemini 2.0 Flash navazuje na úspěch verze 1.5 Flash a nabízí vyšší výkon při stejně rychlé odezvě. Je pozoruhodné, že verze 2.0 Flash dokonce překonává verzi 1.5 Pro v klíčových benchmarcích, a to při dvojnásobné rychlosti. Flash 2.0 přichází také s novými možnostmi. Kromě podpory multimodálních vstupů, jako jsou obrázky, video a zvuk, podporuje nyní Flash 2.0 také multimodální výstupy, jako jsou nativně generované obrázky smíchané s textem a vícejazyčný zvuk s možností řízení převodu textu na řeč (TTS). Může také nativně volat nástroje, jako je vyhledávání Google, spouštění kódu i uživatelsky definované funkce třetích stran.
Introducing Gemini 2.0, our most capable AI model yet designed for the agentic era. Gemini 2.0 brings enhanced performance, more multimodality, and new native tool use. pic.twitter.com/C90FXCEDBV
— Google (@Google) December 11, 2024
Gemini 2.0 Flash je nyní k dispozici vývojářům jako experimentální model prostřednictvím rozhraní Gemini API v aplikacích Google AI Studio a Vertex AI. Všeobecná dostupnost bude následovat v lednu spolu s dalšími velikostmi modelu. Od dnešního dne mají uživatelé Gemini po celém světě přístup k verzi 2.0 Flash experimental optimalizované pro chat, a to výběrem v rozbalovacím seznamu modelu na počítači a mobilním webu, a brzy bude k dispozici i v mobilní aplikaci Gemini.