Google představil celou řadu AI nástrojů, s většinou však jen dohání zpoždění

14. 05. 2024

Google představil celou řadu AI nástrojů, s většinou však jen dohání zpoždění

Fotografie: Google

Google věnoval celý úvod konference I/O představování nástrojů umělé inteligence
Některé z nich rozšíří schopnosti stávajících služeb
Jiné pomohou s tvorbou hudby, grafiky nebo videa

Jak se dalo očekávat a jak někteří s nadsázkou poznamenávají, Google I/O by se mohlo přejmenovat na Google AI, protože prakticky celé úvodní vystoupení této vývojářské konference bylo věnováno jejím schopnostem. Google postupně integruje svůj model Gemini do mnoha svých nástrojů.

Typickým příkladem je služba Google Photos. Ta už je od svého vzniku známá tím, že zde můžete snadno vyhledávat pomocí slov. S nasazením Gemini můžete jít ještě dál a ptát se fotek na nejrůznější věci. V ukázce to byl dotaz na registrační značku vlastního auta. Fotky nově nejen že najdou snímky všech aut s čitelnou značkou, ale poznají mezi nimi i to vaše. Stejně snadno můžete pomocí fotografií vzpomínat nebo dělat různé přehledy pomocí frází jako byla ta ukázková „ukaž nám, jak se naše dcera učila plavat“.

Ask Photos, a new feature coming to @GooglePhotos, makes it easier to search across your photos and videos with the help of Gemini models. It goes beyond simple search to understand context and answer more complex questions. #GoogleIO pic.twitter.com/OsYXZLo5S1
— Google (@Google) May 14, 2024

Vedle toho Google představil, i kudy se bude vývoj AI ubírat do budoucna. Působivá byla prezentace Projektu Astra. Pokroky ve vývoji AI umožnily, že i na mobilním telefonu může být model AI multimodální: můžete na něj mluvit, kreslit prstem na displej, psát nebo reagovat přímo tím, že něco ukážete. Model v reálném čase pak řeší programátorské problémy na tabuli, stačí mu pohled z okna, aby poznal, kde se člověk nachází a dokonce si pamatuje, kde před chvílí viděl odložené brýle! Už teď je jasné, proč OpenAI naplánovala představení GPT-4o na včerejší den, protože oba dva modely míří stejným směrem: k dokonalé syntéze všech vstupů i výstupů.

Něco pro tvůrce

Další velká část byla věnována nástrojům, které nejrůznějším umělcům pomohou s vyjádřením. Samotné přednášce předcházela zajímavá show Marca Rebilleta, který nástroj Music AI Sandbox využíval ve svém vystoupení. Wyclef Jean později ve studiu ukázal, jak to funguje: na kytaru vybrnkal jednoduchou melodii a počítači zadal příkaz, jaké chce pro svou skladbu aranžmá, ve stylu „něco brazilského s bubny“. Výsledkem byl komplexní zvuk, se kterým mohl dále pracovat.

Samozřejmě nesmí chybět služba pro generování obrázků Imagen 3 a také Veo pro generování videí, tedy něco podobného, jako slibuje Sora.

To byly asi ty nejzajímavější nástroje skutečně zevrubné přednášky, při které nevynechal nic, a to včetně hardwaru, cloudových služeb a všeho, co s umělou inteligencí více nebo méně souvisí. Samozřejmě největší potenciál má integrace se službami, které jsou jádrem Google služeb – u vyhledávání a také v integraci do Androidu a jeho aplikací.

Přečtěte si také

Multimodální Gemini Nano vás zachrání před vyluxováním bankovního účtu

Google, umělá inteligenceFacebook Twitter

Související články