OpenAI překonává hranice představitelného. Ukázala nástroj, který převádí text na video

Záběr z videa, které vygeneroval nástroj Sora od společnosti OpenAI

Záběr z videa, které vygeneroval nástroj Sora od společnosti OpenAI Zdroj: OpenAI

Americká společnost OpenAI potvrdila, že trendy v oblasti umělé inteligence drží velmi pevně v rukou. Představila totiž nový nástroj nazvaný Sora, který umí na základě krátkého textového zadání vytvořit realistické video. Novou službu zatím společnost vedená Samem Altmanem nevypustila na veřejnost, je zatím ve fázi testů. 

„Učíme umělou inteligenci chápat a simulovat fyzický svět v pohybu s cílem trénovat modely, které pomáhají lidem řešit problémy vyžadující interakci s reálným světem,“ uvedla společnosti při oznámení o vývoji nového nástroje umělé inteligence. „Sora dokáže generovat složité scény s více postavami, specifickými typy pohybu a přesnými detaily objektu a pozadí. Model rozumí nejen tomu, o co uživatel požádal v zadání, ale také tomu, jak tyto věci existují ve fyzickém světě,“ doplnila společnost na svém blogu.

Konkrétní příklad vygenerovaných videí zveřejnila americká společnost, do které investuje například technologický gigant Microsoft, na svém blogu. Další sérii příkladů umístil na svůj účet na sociální síti X šéf OpenAI Sam Altman, který videa vytvářel na základě tipů od svých sledujících. Jedním z nich bylo například video dvou psů, kteří nahrávají podcast na vrcholku hory.

S AI nástrojem v současné době pracuje vybraná skupina testerů, která má za cíl vychytat možné mezery či nedodělky. Open AI přiznává, že Sora má zatím slabiny, například může mít problémy s přesnou simulací fyziky nebo nemusí plně rozumět principu příčin a následků. „Například člověk si může ukousnout sušenku, ale poté na sušence nemusí být stopa po kousnutí,“ uvádí společnost příklad. 

Videa ze Sory mohou být až 60 sekund dlouhá, nový nástroj také umí prodloužit již existující video sekvence nebo rozpohybovat do té doby statické obrázky. Open AI říká, že generátor videí by měl mít takové bezpečnostní záruky, aby nedošlo k jeho zneužití například k šíření dezinformací nebo nenávistného a sexuálního obsahu. 

Sama společnost ale přiznává, že všem případům nelze předejít. „Navzdory rozsáhlému výzkumu a testování nemůžeme předvídat všechny prospěšné způsoby, jakými budou lidé naši technologii používat, ani všechny způsoby, jak ji budou zneužívat. Proto věříme, že učení se z reálného používání je zásadní součástí vytváření a uvolňování stále bezpečnějších systémů umělé inteligence v průběhu času,“ naznačuje společnost. Open AI neuvedla, kdy, jakým způsobem a za jakých podmínek Soru zpřístupní veřejnosti.