新智元報(bào)道
編輯:KingHZ 桃子
【新智元導(dǎo)讀】上線才三天,Sora一舉登頂App Store全美榜首!Sora 2帶著逆天「客串」功能徹底殺瘋,人物細(xì)節(jié)逼真到讓人瞳孔地震。最強(qiáng)版Sora 2 Pro同步上線,一次可拍15秒好萊塢級(jí)大片。
發(fā)布僅三天,Sora APP便強(qiáng)勢(shì)登頂美國(guó)App Store榜首,堪稱「出道即頂流」!
就連谷歌Gemini、OpenAI自家ChatGPT,都得靠邊站。
誰(shuí)曾想,迭代后的Sora 2,竟徹底帶火了一個(gè)APP。
據(jù)Appfigures估算,Sora iOS版上線僅兩天,總下載量高達(dá)16.4萬(wàn)次,首發(fā)下載量達(dá)5.6萬(wàn)次。
雖不及ChatGPT和Gemini的首發(fā)成績(jī)(8.1萬(wàn)和8萬(wàn)),但在第三天,Sora APP實(shí)現(xiàn)逆襲一舉打破紀(jì)錄。
真正引爆全網(wǎng)的是,Sora 2主打的「客串」(Cameo)功能,以及階躍的物理智能,首次實(shí)現(xiàn)音畫(huà)同步。
奧特曼親自下場(chǎng)「以身試法」,結(jié)果被全網(wǎng)徹底玩壞。
從商店偷GPU被抓包、金字塔前熱舞,到化身乖巧貓人、撒嬌賣萌,人物一致性,細(xì)節(jié)逼真到驚掉下巴。
左右滑動(dòng)查看
再來(lái)唱一段rap,各種形象的奧特曼在Sora筆下活靈活現(xiàn)。
如今,更強(qiáng)版的Sora 2 Pro效果更加炸裂。此前,奧特曼稱ChatGPT Pro用戶可使用Sora 2 Pro生成內(nèi)容。
目前,ChatGPT Pro用戶可選擇新模型「Sora 2 Pro」:
· 最長(zhǎng)可生成15秒視頻
?支持高分辨率(High)生成
左右滑動(dòng)查看
15秒意味著更長(zhǎng)的敘事,而且一致性非常高,AI離拍出好萊塢級(jí)大片又近了一步。
值得一提的是,奧特曼今早發(fā)博文預(yù)告,Sora下一次兩大更新:
一個(gè)是「互動(dòng)式同人創(chuàng)作」模式即將上線,另一個(gè)是規(guī)劃未來(lái)如何通過(guò)Sora實(shí)現(xiàn)盈利。
之所以這么做,是因?yàn)镾ora以假亂真的視頻,已經(jīng)讓人類肉眼無(wú)法分辨。
AI DeepFake再一次,席卷全網(wǎng)。
全球首個(gè)Sora生成的影片
就在今天,OpenAI放出了全球首個(gè)完全由Sora 2生成的劇情,時(shí)長(zhǎng)近2分鐘。
這部短劇名為《The Quack》,目前上線的是第一部。
劇情為無(wú)厘頭喜劇風(fēng)格,以創(chuàng)作者Gabrief為視角,講述了他拿下「賽鴨」比賽冠軍的臺(tái)前幕后。
還記得Sora 2發(fā)布首日,奧特曼也曾在這部劇中亮相,參演觀眾中一員,激動(dòng)驚呼。
另一邊,網(wǎng)友放出的實(shí)測(cè)中,有不少令人驚艷的demo。
通過(guò)「意大利面」測(cè)試
還記得兩年前,AI視頻模型剛興起之時(shí),威爾·斯密斯吃意大利面鬼畜視頻,全網(wǎng)瘋傳。
如今,Sora 2能夠一鍵直出奧特曼吃意大利面的視頻,看不出一點(diǎn)瑕疵。
再來(lái)看Veo 3,威爾·斯密斯吃意大利面,同樣堪比真人。
直出15秒大片,Sora 2 Pro更強(qiáng)了
比起Sora 2,Pro版本更是驚艷了所有人。
它能夠生成長(zhǎng)達(dá)15秒的高質(zhì)量視頻,分辨率更高,所有ChatGPT Pro用戶即可暢玩。
上線第一時(shí)間,網(wǎng)友們不出意外地再次玩起了「惡搞奧特曼」的經(jīng)典橋段。
prompt:Sam Altman painting in an industrial loft and finishing with a bold readable “ Sora 2 ” on a two-meter canvas.
許多網(wǎng)友紛紛實(shí)測(cè)后驚呼,「Sora 2 Pro非常厲害」!
可以看出,在生成一部戰(zhàn)爭(zhēng)片時(shí),Sora 2 Pro的表現(xiàn)真有一種大片的味道了。
手持自拍桿,以第一視角穿越千年,感受埃及金字塔的雄偉撲面而來(lái)。
未來(lái)不僅僅AI生成游戲,連動(dòng)畫(huà)片也能承包了。
想拍一部《速度與激情》?Sora 2 Pro同樣能實(shí)現(xiàn)。
從人物特寫(xiě)到宏大敘事,它都能輕松駕馭,完整復(fù)刻出同款鏡頭。
以后,拍一個(gè)廣告宣傳片,Sora 2 Pro即可拿捏。
更多廣告類視頻,AI一鍵直出:LV、賓利、Burberry...
左右滑動(dòng)查看
靈智覺(jué)醒?
Sora竟與GPT-4o「智商」相當(dāng)!
雖然Sora 2是視頻模型,但能夠解答來(lái)自LLM基準(zhǔn)測(cè)試的問(wèn)題,
在GPQA問(wèn)題的一個(gè)小子集上,Epoch AI測(cè)試了Sora 2,其得分為 55%,而GPT-5的得分為 72%。
GPQA Diamond是一個(gè)包含高難度多項(xiàng)選擇題的科學(xué)測(cè)驗(yàn)基準(zhǔn),如下例所示。
兩個(gè)量子態(tài)的能量分別為E1和E2,壽命分別為10^-9秒和10^-8秒。題目問(wèn):為了清楚地區(qū)分這兩個(gè)能級(jí),它們的能量差應(yīng)該是多少?選項(xiàng)如下: A) 10^-9 eV B) 10^-8 eV C) 10^-11 eV D) 10^-4 eV
Epoch AI從該基準(zhǔn)中隨機(jī)選取了 10 道題目,并嘗試為每道題生成四個(gè)對(duì)應(yīng)的Sora視頻。
為了在專為語(yǔ)言模型設(shè)計(jì)的測(cè)試上評(píng)估Sora,他們?cè)谔崾驹~前添加了指令,要求生成一段視頻,內(nèi)容為教授在一張紙上展示答案字母(A–D)。對(duì)于未明確顯示答案字母的視頻,均視為回答錯(cuò)誤。
既然Sora是視頻模型,它又是如何解決這些問(wèn)題的呢?
一種解釋是:Sora用戶的提示詞可能在生成視頻之前先被一個(gè)LLM重寫(xiě)。在這種情況下,LLM層可能會(huì)先解決問(wèn)題,然后將答案明確地包含在重寫(xiě)的提示詞中。
這種重新提示(re-prompting)層已被用于其他一些視頻生成模型中,以提升輸出的質(zhì)量和多樣性。
目前,尚不確定Sora是否也是如此,但即便如此也并不令人意外。
Sora如果僅憑一兩句話的簡(jiǎn)單提示,就能達(dá)成現(xiàn)在的生成效果,那就意味著OpenAI取得了某種突破。
Sora 2懂得實(shí)在太多了——無(wú)論是歌詞創(chuàng)作、上下文理解、世界觀構(gòu)建、風(fēng)格把控、角色塑造都表現(xiàn)得太出色,對(duì)細(xì)節(jié)的把握精準(zhǔn)得反常。
網(wǎng)友Andrew Curran對(duì)此非常好奇,希望OpenAI能明確說(shuō)明到底是Sora的成果,還是中間層某個(gè)定制版GPT的功勞。
網(wǎng)友Smoke-away推測(cè)Sora使用的可能是個(gè)GPT-4o。
不僅因?yàn)镚PT-4o的測(cè)試分?jǐn)?shù)與Sora 2相當(dāng),而且測(cè)試中Sora 2偏愛(ài)GPT-4o。
運(yùn)行4次下列提示詞,Sora 2給出的結(jié)果3次是GPT-4o。
提示詞:What is your favorite OpenAI model? Text on screen. 提示詞大意:你最喜歡的OpenAI模型是什么?在屏幕顯示文字。
總之,Smoke-away發(fā)現(xiàn)了一種和視頻模型「聊天」的方式,并推測(cè)GPT-4o會(huì)處理初始提示詞。
奧特曼發(fā)文:同人創(chuàng)作新模式即將更新
奧特曼發(fā)文表示馬上將推出兩項(xiàng)更新。
首先,OpenAI將賦予權(quán)利人對(duì)其角色生成更精細(xì)的控制權(quán)。
這類似于為(真人)形象設(shè)置的「選擇加入」(opt-in)模式,但會(huì)提供額外的控制選項(xiàng)。
OpenAI收到了許多人的反饋。
他們對(duì)這種新型的「互動(dòng)式同人創(chuàng)作」感到非常興奮,并認(rèn)為這種新穎的互動(dòng)方式能為他們創(chuàng)造巨大價(jià)值。
但同時(shí),他們也希望能明確規(guī)定其角色的使用方式(包括完全禁止使用)。
OpenAI預(yù)想不同的人會(huì)嘗試迥然不同的方法,并最終找到適合自己的模式。但OpenAI希望對(duì)所有人都采用同一標(biāo)準(zhǔn),讓權(quán)利人自行決定如何推進(jìn)(當(dāng)然,目標(biāo)是讓這個(gè)功能極具吸引力,以至于許多人都愿意加入)。
這個(gè)過(guò)程中,可能會(huì)出現(xiàn)一些本不應(yīng)生成的邊緣案例內(nèi)容,要讓Sora技術(shù)棧穩(wěn)定運(yùn)行,還需要進(jìn)行迭代完善。
其次,OpenAI需要以某種方式通過(guò)視頻生成來(lái)實(shí)現(xiàn)盈利。
目前,平均每位用戶生成的內(nèi)容量遠(yuǎn)超OpenAI的預(yù)期,并且大量視頻的受眾范圍非常小。
OpenAI將嘗試與那些允許用戶生成其角色的權(quán)利人分享部分收益。
具體的模式需要通過(guò)反復(fù)試驗(yàn)來(lái)確定,但OpenAI很快啟動(dòng)計(jì)劃。他們希望這種新的互動(dòng)方式本身能比收益分成更具價(jià)值,當(dāng)然,他們希望兩者都能創(chuàng)造價(jià)值。
OpenAI將以極快的速度進(jìn)行迭代,這讓奧特曼想起了ChatGPT的早期歲月。
在此過(guò)程中,OpenAI會(huì)有正確的決策,也會(huì)有失誤,但他們會(huì)聽(tīng)取反饋,并努力盡快修正失誤。
OpenAI計(jì)劃先在Sora中對(duì)不同方法進(jìn)行迭代試驗(yàn),然后將成功經(jīng)驗(yàn)推廣到他們所有的產(chǎn)品中。
Sora三天偽造全球危機(jī),無(wú)人能辨真假!
OpenAI的Sora讓視頻制作極其容易,生成的效果有極其逼真。
但狂歡之下,紐約時(shí)報(bào)則指出了背后的現(xiàn)實(shí)隱患:
Sora生成了商店搶劫、入室行竊甚至城市街道上炸彈爆炸的視頻——而這些事件從未發(fā)生過(guò)。
專家表示,越來(lái)越逼真的視頻更有可能加劇沖突、欺詐消費(fèi)者、左右輿論,或誣陷他人犯下其未曾犯下的罪行,從而在現(xiàn)實(shí)世界中造成嚴(yán)重后果。
加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)教授、GetReal Security聯(lián)合創(chuàng)始人Hany Farid表示:「消費(fèi)者每天都在接觸不知多少條這樣的內(nèi)容,這令人憂心忡忡。我為我們的國(guó)家擔(dān)憂,為我們的經(jīng)濟(jì)擔(dān)憂,也為我們的社會(huì)機(jī)構(gòu)擔(dān)憂?!?/p>
在該應(yīng)用發(fā)布時(shí),OpenAI在附件中寫(xiě)道:
Sora 2 生成超逼真視頻和音頻的能力,引發(fā)了人們?cè)谛は駲?quán)、濫用和欺騙方面的重要擔(dān)憂。如上所述,我們正采取一種深思熟慮、逐步迭代的部署方法,以最大程度地降低這些潛在風(fēng)險(xiǎn)。
直到最近,即使照片和文字的逼真編輯已變得輕而易舉,視頻作為真實(shí)事件的證據(jù)仍相當(dāng)可靠。
但專家表示,Sora 2動(dòng)搖了觀眾對(duì)「眼見(jiàn)為實(shí)」的理念。
Sora視頻帶有一個(gè)移動(dòng)水印以表明其為AI生成,但專家稱,這種標(biāo)記花點(diǎn)功夫就能被編輯去除。
Hany Farid表示,Sora是「持續(xù)發(fā)展過(guò)程的一部分」,自從谷歌在五月份發(fā)布其Veo 3視頻生成器以來(lái),這一趨勢(shì)愈演愈烈。
Hany Farid說(shuō),即使是他這樣一位畢生致力于識(shí)別偽造圖像的專家,如今也難以第一眼就分辨出真假。
大約一年前,我看到這些東西時(shí),我心里有數(shù),然后我會(huì)通過(guò)分析來(lái)證實(shí)我的視覺(jué)判斷。我能做到,是因?yàn)槲艺於荚诳催@些東西,大概知道瑕疵會(huì)出現(xiàn)在哪里。
但現(xiàn)在,我再也做不到了。
參考資料:
https://techcrunch.com/2025/10/03/openais-sora-soars-to-no-1-on-the-u-s-app-store/
https://x.com/EpochAIResearch/status/1974172794012459296 https://x.com/GabrielPeterss4/status/1974163116691997149 https://x.com/ctgptlb/status/1973966473011048457 https://blog.samaltman.com/sora-update-number-1 https://www.nytimes.com/2025/10/03/technology/sora-openai-video-disinformation.html
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.