Když se v únoru představil model umělé inteligence Sora, vyvolalo to opravdové pozdvižení. Stačí pár jednoduchých textových příkazů a model pro vás vygeneruje video v realistické kvalitě, kde bez bližšího zkoumání nepoznáte, že se nikdy neodehrálo. Prozatím tomuto tvrzení musíme věřit, protože tvůrci odkládají uvedení mezi širší veřejnost. Hájí se tím, že jejich produkt ještě není v dokonalém stavu, ale na místě jsou také obavy ze zneužití v roce, kdy se mají odehrát důležité volby.
Přístup ke generování videí tak má jen úzký okruh kreativních profesionálů, kteří mají zkoumat schonosti systému a také se tak starat o jeho propagaci. To byl původně záměr studia Shy Kids, které přišlo s vtipným klipem zachycujícím muže, který má místo hlavy nafukovací balón.
V rozhovoru pro fxguide.com ale odhalili, že celá práce rozhodně nebyla jen o napsání několika propmtů, tedy příkazů pro AI. Patrick Cederberg z týmu Shy Kids prozradil, že museli sáhnout po tradičních technikách VFX, aby odstranili problémy s konzistencí záběrů generovaných nástrojem OpenAI. Doslova řekl: „Je to velmi, velmi mocný nástroj, který už teď vymýšlíme, jak ho zapojit do našeho stávajícího procesu. Ale myslím, že s jakýmkoli generativním nástrojem umělé inteligence; ovládání je stále věc, která je v tomto okamžiku nejžádanější a také nejnepolapitelnější.“
Remember that 'air head' video made with Sora? Turns out it used a ton of rotoscoping and manual VFX.
— Bilawal Sidhu (@bilawalsidhu) April 25, 2024
A 'head' would pop back on, and the balloon colors would keep changing from generation to generation. TL;DR researchers and developers of generative AI tools really need to… pic.twitter.com/nHP5nCe0PP
Co konkrétně tím myslí, vysvětlil na případech. AI měla například problém udržet balón v jedné barvě a často ho generovala jako červený. V mnoha případech se pak na balónu objevoval lidský obličej, protože byl součástí těla. Všechny tyto nedostatky pak museli tvůrci řešit pomocí tradiční digitální editace.
Všechno navíc komplikuje fakt, že vygenerování nových záběrů trvá velice dlouho. „AI filmaři“ tak strávili celý den vymýšlením velice podrobného a specifického promptu, ale ani tak nebyla Sora schopna dodat konzistentní výsledky. I proto nakonec vzdali tvorbu fiktivního dokumentu a udělali ze snímku krátkou grotesku.