Prakticky celá dvouhodinová show na úvod letošní konference Google I/O patřila umělé inteligenci a jejím schopnostem. Tím pádem nemohly chybět ani modely zaměřené na generování jak statického obrazu, tak videí, respektive působivé ukázky jejich schopností.
Náš nejnovější model Imagen podle Googlu kombinuje rychlost s přesností a vytváří úžasné snímky. Imagen 4 má se zaměřuje na čistotu jemných detailů, jako jsou složité látky, kapky vody a zvířecí srst, a vyniká jak ve fotorealistickém, tak v abstraktním stylu. Imagen 4 dokáže vytvářet snímky v různých poměrech stran a v rozlišení až 2k, ještě lépe se tak hodí pro tisk nebo prezentace. Má být také lepší v pravopisu a typografii, což usnadňuje tvorbu vlastních přáníček, plakátů a dokonce i komiksů.









Imagen 4 je již k dispozici v aplikacích Gemini, Whisk, Vertex AI a v aplikacích Slides, Vids, Docs a dalších v Workspace. Google také slibuje již brzy uvést rychlou variantu Imagenu 4, která je až 10× rychlejší než Imagen 3.
Veo 3 má být nejmodernější model generování videa, nejenže zlepšuje kvalitu Veo 2, ale poprvé dokáže generovat videa i se zvukem. Nabídne zvuky dopravy v pozadí městské ulice, zpěv ptáků v parku, dokonce i dialogy mezi postavami.
Veo 3 vyniká ve všech oblastech, od textových a obrazových podnětů až po fyziku reálného světa a přesnou synchronizaci rtů. V promptu mu můžete vyprávět krátký příběh a model vám vrátí klip, který ho oživí. Veo 3 je od k dispozici pro předplatitele služby Ultra ve Spojených státech v aplikaci Gemini a ve službě Flow. K dispozici je také pro podnikové uživatele v aplikaci Vertex AI.
Takto kvalitní obrazy a videa samozřejmě vzbuzují obavy, že by bylo možné je zneužít pro šíření dezinformací. Proto souběžně s jejich schopnostmi Google rozvíjí i nástroje na jejich označení a detekci. Od svého spuštění v roce 2023 opatřila služba SynthID vodoznakem více než 10 miliard obrázků, videí, zvukových souborů a textů, které pomáhají identifikovat, že je vytvořila umělá inteligence, a snižují pravděpodobnost dezinformací a chybného připsání autorství. Výstupy generované aplikacemi Veo 3, Imagen 4 a Lyria 2 budou i nadále opatřeny vodoznaky SynthID.
Nově je spuštěn SynthID Detector, ověřovací portál, který pomáhá lidem identifikovat obsah vytvořený umělou inteligencí. Nahrajete sem část obsahu a detektor SynthID určí, zda je v celém souboru nebo jen v jeho části obsažena technologie SynthID.