Google ukázal neuvěřitelné výkony Imagenu 4 a Veo 3

21. 05. 2025

Google ukázal neuvěřitelné výkony Imagenu 4 a Veo 3

Fotografie: Google

Google představil Imagen 4, který zlepšuje složité detaily
Veo 3 umí pracovat i se zvukem
SynthID se postará o označení a detekci takto vytvořeného obsahu

Prakticky celá dvouhodinová show na úvod letošní konference Google I/O patřila umělé inteligenci a jejím schopnostem. Tím pádem nemohly chybět ani modely zaměřené na generování jak statického obrazu, tak videí, respektive působivé ukázky jejich schopností.

Náš nejnovější model Imagen podle Googlu kombinuje rychlost s přesností a vytváří úžasné snímky. Imagen 4 má se zaměřuje na čistotu jemných detailů, jako jsou složité látky, kapky vody a zvířecí srst, a vyniká jak ve fotorealistickém, tak v abstraktním stylu. Imagen 4 dokáže vytvářet snímky v různých poměrech stran a v rozlišení až 2k, ještě lépe se tak hodí pro tisk nebo prezentace. Má být také lepší v pravopisu a typografii, což usnadňuje tvorbu vlastních přáníček, plakátů a dokonce i komiksů.

Imagen 4 je již k dispozici v aplikacích Gemini, Whisk, Vertex AI a v aplikacích Slides, Vids, Docs a dalších v Workspace. Google také slibuje již brzy uvést rychlou variantu Imagenu 4, která je až 10× rychlejší než Imagen 3.

Veo 3 má být nejmodernější model generování videa, nejenže zlepšuje kvalitu Veo 2, ale poprvé dokáže generovat videa i se zvukem. Nabídne zvuky dopravy v pozadí městské ulice, zpěv ptáků v parku, dokonce i dialogy mezi postavami.

Veo 3 vyniká ve všech oblastech, od textových a obrazových podnětů až po fyziku reálného světa a přesnou synchronizaci rtů. V promptu mu můžete vyprávět krátký příběh a model vám vrátí klip, který ho oživí. Veo 3 je od k dispozici pro předplatitele služby Ultra ve Spojených státech v aplikaci Gemini a ve službě Flow. K dispozici je také pro podnikové uživatele v aplikaci Vertex AI.

Takto kvalitní obrazy a videa samozřejmě vzbuzují obavy, že by bylo možné je zneužít pro šíření dezinformací. Proto souběžně s jejich schopnostmi Google rozvíjí i nástroje na jejich označení a detekci. Od svého spuštění v roce 2023 opatřila služba SynthID vodoznakem více než 10 miliard obrázků, videí, zvukových souborů a textů, které pomáhají identifikovat, že je vytvořila umělá inteligence, a snižují pravděpodobnost dezinformací a chybného připsání autorství. Výstupy generované aplikacemi Veo 3, Imagen 4 a Lyria 2 budou i nadále opatřeny vodoznaky SynthID.

Nově je spuštěn SynthID Detector, ověřovací portál, který pomáhá lidem identifikovat obsah vytvořený umělou inteligencí. Nahrajete sem část obsahu a detektor SynthID určí, zda je v celém souboru nebo jen v jeho části obsažena technologie SynthID.

Google I/Oumělá inteligence, GoogleFacebook Twitter

Související články