Přichází Sora. Uměle generovaný obsah bude brzy k nerozeznání od toho skutečného. Máme se bát?
V roce 2023 byl konverzační chatbot ChatGPT od americké firmy OpenAI jedním z nejdiskutovanějších fenoménů světa informačních technologií. Letos má tato společnost slušnou šanci, že bude znovu určovat klíčové téma celosvětové mediální krajiny. Její nový produkt, generátor videí nazvaný Sora, fascinuje i děsí.
Elegantní dáma se prochází deštivým centrem japonského Tokia a v zrcadlových slunečních brýlích se jí efektně odráží svit neónů. Skupina astronautů míří k létajícímu talíři, který přistál uprostřed zářivě bílé solné pouště. Dron prolétá kalifornským městečkem v době vrcholící zlaté horečky v druhé polovině devatenáctého století. Zvířátka jedou na kole na vodní hladině. Tato videa a desítky dalších, jimiž firma OpenAI zaplavila před několika dny digitální prostor, mají jedno společné: Nikdo je nenatočil ani nevyrobil v grafickém programu, účinkují v nich lidé i zvířata, jež nikdy neexistovala. Pro vytvoření minutových videí stačilo udělit pár textových pokynů službě Sora, novému produktu kalifornské společnosti OpenAI. Sora není první produkt tohoto druhu. Pravděpodobnostní modely, schopné z textového zadání vygenerovat video, existovaly již před ní. Rozdíl je však v délce a kvalitě. Časový rozsah dřívějších počítačově generovaných videí se počítal na sekundy. A kvalita byla nevalná. Známé je například necelý rok staré video vytvořené přes službu Stable Diffusion. Zadání tehdy znělo: „Vygeneruj video, v němž herec Will Smith jí špagety.“ Stable Diffusion následně „vyplivla“ kratičký záběr na děsivého mutanta, vzdáleně podobného slavnému americkému herci, který si do rozličných tělních otvorů cpe těstoviny. Videa generovaná dnešní Sorou už mají minutu a působí na první pohled fotorealisticky. Firma OpenAI zase předběhla konkurenci o parník a stále kraluje oboru, pro nějž se vžil mediálně vděčný, ale nesprávný termín Umělá inteligence (AI).
Možná rizika
Současná AI je totiž všechno, jen ne inteligentní. Pokročilé modely, jako je Sora, jsou velmi efektivní na poli strojového učení, musí je ovšem někdo stále krmit novými daty. Bez nich je AI bezmocná. Modely umělé inteligence, ať už jde o jazykové platformy, jako známý ChatGPT, či aplikace pro vizuální řešení, jako nyní Sora, jen remixují existující materiály. Což brzy omrzí. Již minulý rok se po opadnutí původní vlny nadšení ukázalo, že bot ChatGPT umí vcelku dobře komunikovat s lidským uživatelem na základní témata, ale v podrobnější komunikaci často generuje nesmyslné nebo zjevně nepravdivé výroky. Se Sorou to není jiné. Model umí vyrobit krátké video na zadané téma a v zadaném stylu, ale výsledný videoprodukt je i tak sterilní, neživotný. Je ostatně otázkou, jak moc reálné schopnosti Sory odpovídají tomu, co samotná OpenAI prezentuje. Firma zatím Soru neuvolnila k všeobecnému užití. K modelu mají přístup jen betatestři, kteří generativní model prověřují jak co do schopností a slabin (společnost sama přiznává, že Sora má zatím rezervy se simulací komplexních situací s velkým množstvím aktérů a také s pochopením principu kauzality), tak co do rizik možného zneužití. Těch se pochopitelně se Sorou pojí celá řada.
Tento článek je součástí balíčku PREMIUM.
Odemkněte si exkluzivní obsah a videa!