OpenAI představuje model umělé inteligence Sora. Z textového zadání vygeneruje video

OpenAI představuje model umělé inteligence Sora. Z textového zadání vygeneruje video
Fotografie: OpenAI
  • Sora umí generovat až minutové video, stačí ji prostý textový příkaz
  • Videa mají své nedostatky, ale lze je snadno zaměnit za skutečná
  • Proto není nástroj dostupný širší veřejnosti a odborníci zkoumají rizika jeho zneužití

Jakmile se objevily první modely, které na základě textového zadání dokázaly generovat přesvědčivé fotografie, bylo jen otázkou času, než se totéž povede i po video. A ani jsme na to nemuseli čekat moc dlouho. Podle OpenAI její Sora umí vytvářet realistické a nápadité scény z textových instrukcí. Model převodu textu na video umožňuje uživatelům vytvářet fotorealistická videa o délce až jedné minuty, a to vše pouze na základě napsaných pokynů.

Podle OpenAI dokáže Sora vytvářet složité scény s více postavami, specifickými typy pohybu a přesnými detaily objektu a pozadí. Společnost také uvádí, že model dokáže pochopit, jak objekty existují ve fyzickém světě, a také přesně interpretovat rekvizity a vytvářet přesvědčivé postavy, které vyjadřují živé emoce. Model může také generovat video na základě statického snímku, stejně jako doplnit chybějící snímky ve stávajícím videu nebo jej rozšířit.


K modelu se prozatím běžní uživatelé nedostanou. Něco takového je zcela oprávněně vnímáno jako nebezpečná zbraň, a tak jej zatím zkoumají odborníci, kteří vyhodnocují možná rizika a i to, jak jim zabránit. Začátkem tohoto měsíce společnost OpenAI oznámila, že do svého nástroje pro převod textu na obraz DALL-E 3 přidává vodoznaky, ale upozorňuje, že je lze snadno odstranit. Stejně jako její další produkty AI se i OpenAI bude muset potýkat s důsledky záměny falešných fotorealistických videí s umělou inteligencí za skutečná.


Kvalitu generovaných videí tak můžeme posoudit pouze z několika krátkých snímků uvedených při představení. Pokud v nich v plném rozlišení záměrně hledáte chyby, pak některé najdete: občas úplně nesedí objekt a jeho pozadí, a jak přiznávají samotní tvůrci, složitá fyzika s řadou interakcí bude ještě problém. Nicméně při zběžném pohledu je každé z videí nerozpoznatelné od skutečnosti.

Diskuze ke článku
V diskuzi zatím nejsou žádné příspěvky. Přidejte svůj názor jako první.
Přidat názor

Nejživější diskuze