ChatGPT vylepšil generování obrázků, Madonna tak v Praze obhlíží pečená kuřata

ChatGPT vylepšil generování obrázků, Madonna tak v Praze obhlíží pečená kuřata
Fotografie: vygenerováno pomocí AI ChatGPT
  • ChatGPT výrazně vylepšuje dovednosti generování obrázků
  • Prozatím se nebrání ani generování obrázků se známými osobnostmi
  • Výsledky nově působí mnohem realističtějším dojmem

ChatGPT se pochlubí vylepšenými dovednostmi při generování obrázků, a to v rámci svého modelu GPT-4o. Nese označení „4o Image Generation“ a posouvá hranice toho, co bylo doposud možné. My jsme se rozhodli vylepšené generování obrázků hned otestovat a musíme uznat, že výsledky jsou opravdu velmi zajímavé. Prozradíme, že se ChatGPT nebrání ani generování obrázků, kde hlavní roli hrají slavné osobnosti, i když i to je možná jen dočasné...

Vytvořit a upravit? Není problém

ChatGPT teď mnohem lépe chápe, co od něj chcete – navíc, pokud se vám výsledek líbí, ale chcete upravit jen konkrétní část, není problém, stačí svůj požadavek upřesnit a počkat, než se obrázek vygeneruje. To si můžete prohlédnout na ukázce níže. Po ChatGPT jsme chtěli následující: „Generuj širokoúhlý obrázek zpěvačky Madonny, která kráčí po Staroměstském náměstí. V ruce má kávu ze Starbucks a dívá se na stánek s pečenými kuřaty. V pozadí je její ochranka.“ Jakmile byl obrázek hotov, poprosili jsme o to, aby měla Madonna na čele stejnou jizvu, jakou má i Harry Potter.

Je Madonna Harry Potter, nebo se jen stydí za svoji zálibu v pečených kuřatech?

S diakritikou už problém nemá

Doposud platilo, že pokud jste chtěli v obrázku i nějaký text, výsledky byly spíše žalostné – diakritika na obrázcích totiž ChatGPT dělala velký problém. Nově už to takový problém není. Pokud přeci jen na chybu narazíte, můžete ji opravit novým zadáním. Nutno podotknout, že tentokrát jsme ChatGPT opravdu nešetřili, zadání bylo poměrně komplikované: „Generuj širokoúhlý obrázek. Mladý muž sedí na lavičce v parku, pohled zezadu. My vidíme název knihy v češtině, který lze zřetelně přečíst – píše se tam: Ponorky z vesmíru.“

ChatGPT 4o Image Generation

Něco přidat? Proč ne

Pokud nahrajete již hotovou scénu, ChatGPT ji může doplnit, a to tak, že prakticky nepoznáte, co je originál. Nebo se pleteme? Do této fotografie jsme chtěli přidat padající meteorit.

Vylepšení je mnohem více, na další ukázky se můžete těšit už brzy. ChatGPT si například nově mnohem lépe poradí s generováním více tvarů v jednom obrázku – zatímco běžně dokážou modely (i konkurence) generovat maximálně 8 tvarů, ChatGPT by si měl nově poradit až s 20. My jen dodáme, že nové schopnosti generování si mohou vyzkoušet i ti, kteří nemají předplatné – obvykle se však podaří vygenerovat maximálně 3 obrázky, což je limit pro neplatící uživatele.

openai.com/4o-image-generation