12月10日消息,當(dāng)?shù)貢r(shí)間周一,OpenAI宣布正式向用戶開放其AI視頻生成模型Sora。該系統(tǒng)可根據(jù)文本提示生成視頻。Sora將于當(dāng)天晚些時(shí)候向美國(guó)及其他市場(chǎng)ChatGPT付費(fèi)用戶開放。新版工具Sora Turbo可生成最長(zhǎng)20秒視頻,并且可以提供這些視頻的多種變體。
5月15日消息,谷歌DeepMind首席執(zhí)行官宣布,該公司將推出AI視頻生成模型Veo,對(duì)標(biāo)OpenAI的文生視頻模型Sora。
4月27日消息,在2024中關(guān)村論壇年會(huì)未來人工智能先鋒論壇上,生數(shù)科技聯(lián)合清華大學(xué)發(fā)布中國(guó)首個(gè)長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)性視頻大模型 Vidu。Vidu不僅能夠模擬真實(shí)物理世界,還擁有豐富想象力,具備多鏡頭生成、時(shí)空一致性高等特點(diǎn),這也是自Sora發(fā)布之后全球率先取得重大突破的視頻大模型,性能全面對(duì)標(biāo)國(guó)際頂尖水平,并在加速迭代提升中。
OpenAI首席技術(shù)官M(fèi)ira Murati日前受訪時(shí)表示,Sora將于今年晚些時(shí)候正式向公眾推出,“可能需要幾個(gè)月”。OpenAI將在Sora中支持配備音效,并允許用戶編輯Sora生成的視頻內(nèi)容。此前Sora的測(cè)試資格只開放給了視覺藝術(shù)家、設(shè)計(jì)師和電影制作人。
在抖音個(gè)人直播間中,360創(chuàng)始人周鴻祎表示對(duì)OpenAI文生視頻應(yīng)用Sora的逼真效果十分驚訝。據(jù)其推測(cè),Sora生成逼真的視頻背后應(yīng)該沒有靠3D建模訓(xùn)練。如果Sora也只用3D建模再進(jìn)行渲染,那么這和傳統(tǒng)的電影工業(yè)走的是一樣的路。他認(rèn)為,Sora應(yīng)該是模擬人類智能理解真實(shí)世界規(guī)律,掌握了人類觀察、描繪、表現(xiàn)世界的方法。人類的大腦里不需要3D建模,因?yàn)槿祟悓?duì)真實(shí)世界的物理規(guī)律有基本認(rèn)知,可以控制自己所想。
近日,市場(chǎng)有消息稱,在Sora引爆文生視頻賽道之前,國(guó)內(nèi)的字節(jié)跳動(dòng)也推出了一款新型視頻模型Boximator,與Gen-2、Pink1.0等既有模型相比,Boximator的獨(dú)特之處在于,它能夠通過文本輸入精確地控制視頻中人物或物體的運(yùn)動(dòng)。2月20日,字節(jié)跳動(dòng)相關(guān)人士回復(fù)北京商報(bào)記者稱,Boximator是視頻生成領(lǐng)域控制對(duì)象運(yùn)動(dòng)的技術(shù)方法研究項(xiàng)目,目前還無法作為完善的產(chǎn)品落地,距離國(guó)外領(lǐng)先的視頻生成模型在畫面質(zhì)量、保真率、視頻時(shí)長(zhǎng)等方面還有很大差距。