Jak se dalo očekávat a jak někteří s nadsázkou poznamenávají, Google I/O by se mohlo přejmenovat na Google AI, protože prakticky celé úvodní vystoupení této vývojářské konference bylo věnováno jejím schopnostem. Google postupně integruje svůj model Gemini do mnoha svých nástrojů.
Typickým příkladem je služba Google Photos. Ta už je od svého vzniku známá tím, že zde můžete snadno vyhledávat pomocí slov. S nasazením Gemini můžete jít ještě dál a ptát se fotek na nejrůznější věci. V ukázce to byl dotaz na registrační značku vlastního auta. Fotky nově nejen že najdou snímky všech aut s čitelnou značkou, ale poznají mezi nimi i to vaše. Stejně snadno můžete pomocí fotografií vzpomínat nebo dělat různé přehledy pomocí frází jako byla ta ukázková „ukaž nám, jak se naše dcera učila plavat“.
Ask Photos, a new feature coming to @GooglePhotos, makes it easier to search across your photos and videos with the help of Gemini models. It goes beyond simple search to understand context and answer more complex questions. #GoogleIO pic.twitter.com/OsYXZLo5S1
— Google (@Google) May 14, 2024
Vedle toho Google představil, i kudy se bude vývoj AI ubírat do budoucna. Působivá byla prezentace Projektu Astra. Pokroky ve vývoji AI umožnily, že i na mobilním telefonu může být model AI multimodální: můžete na něj mluvit, kreslit prstem na displej, psát nebo reagovat přímo tím, že něco ukážete. Model v reálném čase pak řeší programátorské problémy na tabuli, stačí mu pohled z okna, aby poznal, kde se člověk nachází a dokonce si pamatuje, kde před chvílí viděl odložené brýle! Už teď je jasné, proč OpenAI naplánovala představení GPT-4o na včerejší den, protože oba dva modely míří stejným směrem: k dokonalé syntéze všech vstupů i výstupů.
Něco pro tvůrce
Další velká část byla věnována nástrojům, které nejrůznějším umělcům pomohou s vyjádřením. Samotné přednášce předcházela zajímavá show Marca Rebilleta, který nástroj Music AI Sandbox využíval ve svém vystoupení. Wyclef Jean později ve studiu ukázal, jak to funguje: na kytaru vybrnkal jednoduchou melodii a počítači zadal příkaz, jaké chce pro svou skladbu aranžmá, ve stylu „něco brazilského s bubny“. Výsledkem byl komplexní zvuk, se kterým mohl dále pracovat.
Samozřejmě nesmí chybět služba pro generování obrázků Imagen 3 a také Veo pro generování videí, tedy něco podobného, jako slibuje Sora.
To byly asi ty nejzajímavější nástroje skutečně zevrubné přednášky, při které nevynechal nic, a to včetně hardwaru, cloudových služeb a všeho, co s umělou inteligencí více nebo méně souvisí. Samozřejmě největší potenciál má integrace se službami, které jsou jádrem Google služeb – u vyhledávání a také v integraci do Androidu a jeho aplikací.