美國(guó)《綜藝》近日稱(chēng),美國(guó)人工智能公司OpenAI最新發(fā)布的生成式人工智能模型Sora,近日在業(yè)內(nèi)外引發(fā)極高關(guān)注度,其可以按照文字指令生成長(zhǎng)達(dá)1分鐘視頻的強(qiáng)大能力,令I(lǐng)T界、藝術(shù)界和普通愛(ài)好者興奮不已,同時(shí)也讓包括好萊塢在內(nèi)的娛樂(lè)產(chǎn)業(yè)感到擔(dān)心,電影《我,機(jī)器人》中AI和機(jī)器人取代人類(lèi)工種的預(yù)言和相關(guān)風(fēng)險(xiǎn)再次成為熱門(mén)話題。
視頻質(zhì)量和逼真度更高
“自從上周OpenAI發(fā)布文本生成視頻模型Sora以來(lái),人們對(duì)于這種AI功能的預(yù)測(cè)越來(lái)越‘惶恐’,畢竟與之前的同類(lèi)工具相比,OpenAI似乎帶來(lái)巨大的飛躍”?!毒C藝》評(píng)論稱(chēng),單純從目前的視頻輸出樣本來(lái)看,Sora是迄今為止最令人印象深刻的視頻生成模型,其“現(xiàn)實(shí)主義效果”將有望在高端娛樂(lè)中發(fā)揮作用,只是因?yàn)槟承┓矫娴南拗?,目前還無(wú)法勝任好萊塢電影這樣的制作規(guī)模。人工智能公司Metaphysics的首席執(zhí)行官湯姆·格拉漢姆認(rèn)為:“如今創(chuàng)意工作者要求對(duì)表演、場(chǎng)景進(jìn)行全面把控,Sora這樣的模型要想生成好萊塢電影,還有很長(zhǎng)的路要走”。
事實(shí)上,在Sora橫空出世之前,業(yè)內(nèi)已經(jīng)存在Runway和Pika等功能相似的AI視頻生成、視頻編輯模型。這些模型可以基于文本提示、2D圖片生成短視頻,由靜態(tài)圖像衍生出動(dòng)畫(huà),修復(fù)、替換或插入新的視覺(jué)元素,以及將鏡頭擴(kuò)展到原始幀之外,填充上下文相關(guān)內(nèi)容的“畫(huà)外畫(huà)”,這些都豐富了人們所需的視頻內(nèi)容。
《財(cái)富》報(bào)道稱(chēng),目前已有好萊塢公司將Runway技術(shù)應(yīng)用在項(xiàng)目之中,并獲得奧斯卡獎(jiǎng)。相比之下,Sora又取得一些明顯的升級(jí)和突破,譬如視頻的質(zhì)量和逼真度更高,更像真實(shí)世界,視頻長(zhǎng)度也達(dá)到1分鐘,能夠呈現(xiàn)文本需要的相關(guān)信息。要知道,Sora的競(jìng)爭(zhēng)對(duì)手Runway去年8月推出的第二代模型,每次還只能生成最高18秒的視頻。
此外,Sora還實(shí)現(xiàn)了“時(shí)空一致性”,也就是即便對(duì)視頻進(jìn)行擴(kuò)展,它也能夠賦予模型“前瞻性”,確保視頻主題在畫(huà)幅外也能保持不變。Sora之前發(fā)布的“時(shí)尚女性走在繁華街頭”的視頻示例,就很像是一部廣告短片或電影片段,人物和場(chǎng)景基本上挑不出明顯問(wèn)題,身體的運(yùn)動(dòng)、頭發(fā)的細(xì)節(jié)、霓虹燈反光顯得尤其逼真,這在幾年前是不可想象的。
“人工智能故事”
《綜藝》認(rèn)為,擁有強(qiáng)大功能的Sora已然具備了通過(guò)AI創(chuàng)建電影的可能性,這些輸出的視頻可以作為“鏡頭”縫合成一部電影,但關(guān)鍵還要保持角色和場(chǎng)景的連續(xù)性。不過(guò)這種使用文本提示和條件參數(shù)生成的視頻,只有保持角色在下一場(chǎng)戲中連續(xù)一致,才能創(chuàng)造更長(zhǎng)時(shí)間的“人工智能故事”。
目前看來(lái),Sora在好萊塢的大規(guī)模應(yīng)用還面臨不少阻礙,除了連續(xù)性不足,這款模型還會(huì)“誤解”現(xiàn)實(shí)世界里的造型和行為,在圖像和視頻輸出中出現(xiàn)肉眼可見(jiàn)的“物理性失敗”。近日網(wǎng)絡(luò)上也在熱傳一個(gè)Sora模型的“失敗案例”,鏡頭中的椅子仿佛有了生命般走動(dòng),完全超出真實(shí)世界的物理可能,畫(huà)面中還有人甚至“憑空消失”,此類(lèi)“失誤”除了讓人啞然失笑,也說(shuō)明Sora想要?jiǎng)?chuàng)作出電影還有很多問(wèn)題要解決。
由于Sora的視頻輸出是基于渲染,而非物理性建模,因此暫時(shí)無(wú)法提供足夠可控性,目前好萊塢的電影創(chuàng)作者也無(wú)法掌握并控制。短期來(lái)看,如果想要在創(chuàng)作中引入這種AI模型,反而會(huì)遭遇更多問(wèn)題,這還需要OpenAI的開(kāi)發(fā)人員添加更多的軟件控制參數(shù),根據(jù)這些暴露出來(lái)的缺陷進(jìn)行改進(jìn),呈現(xiàn)出的視頻才能與人類(lèi)拍攝的鏡頭相媲美。
此外,版權(quán)等法律方面問(wèn)題也是好萊塢目前無(wú)法直接使用Sora的一大原因,將AI生成的素材輸出到銀幕有可能引發(fā)版權(quán)糾紛,哪怕AI只是用相關(guān)素材進(jìn)行訓(xùn)練,也有潛在的侵權(quán)風(fēng)險(xiǎn)。去年好萊塢編劇和演員大罷工的關(guān)鍵談判點(diǎn)就是人工智能的適用范圍,這一問(wèn)題尚未真正得到解決。如果Sora作為創(chuàng)作輔助工具,其生成視頻的版權(quán)是否受到保護(hù),訓(xùn)練素材是否存在侵權(quán)責(zé)任,這些疑問(wèn)會(huì)讓擔(dān)心卷入糾紛的好萊塢片方采取謹(jǐn)慎態(tài)度。
目前看來(lái),包括Sora在內(nèi)的AI工具有可能還是在項(xiàng)目前期使用,例如快速生成概念圖、角色造型和分鏡動(dòng)畫(huà),幫助創(chuàng)作者挑選方向,但如果某個(gè)有趣的概念角色、場(chǎng)景真的被選中用于實(shí)拍,無(wú)論是電影、電視還是游戲制作,依然面臨侵權(quán)索賠和版權(quán)保護(hù)追溯的風(fēng)險(xiǎn)。
“好戲開(kāi)場(chǎng)了”
目前Sora還沒(méi)有正式對(duì)所有用戶開(kāi)放,一些嘗試過(guò)的業(yè)內(nèi)人士在感慨其強(qiáng)大創(chuàng)造力的同時(shí),也發(fā)現(xiàn)各種漏洞和被濫用的風(fēng)險(xiǎn)。就像之前Deepfake(深度偽造)在網(wǎng)絡(luò)上引發(fā)的假信息和謠言,對(duì)斯威夫特等明星和普通人造成的傷害,都是OpenAI公司必須面對(duì)的質(zhì)疑。今年1月谷歌發(fā)布AI視頻模型Lumiere時(shí),就坦承“使用這一技術(shù)時(shí),的確有創(chuàng)建虛假或有害內(nèi)容并被濫用的風(fēng)險(xiǎn)”。
未來(lái)Sora向普通用戶和社交媒體創(chuàng)作者開(kāi)放后,必然會(huì)誕生海量視頻內(nèi)容,但并非所有人都會(huì)像創(chuàng)意或廣告專(zhuān)業(yè)人士那樣注意法律問(wèn)題。目前OpenAI承諾會(huì)從全球的藝術(shù)家、教育工作者和政策制定者那里獲得反饋,以了解人們對(duì)該技術(shù)的擔(dān)憂。
雖然Sora、Runway等AI產(chǎn)品仍有不少需要改進(jìn)的地方,但這種“指數(shù)級(jí)的飛躍速度”顯而易見(jiàn),《人工智能革命:超級(jí)智能之路》的作者、著名科技作家蒂姆·厄本據(jù)此預(yù)測(cè):“21世紀(jì)將實(shí)現(xiàn)20世紀(jì)1000倍的進(jìn)步。”
Sora的出現(xiàn)也讓AI同行和科技企業(yè)摩拳擦掌,Runway公司首席執(zhí)行官克里斯托巴·瓦倫祖拉在社交媒體上表示:“好戲開(kāi)場(chǎng)了”。
