網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

三天逆襲，Sora登頂美榜！15秒大片玩瘋奧特曼，全網(wǎng)直呼真假難辨

2025-10-04 13:21:53　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：KingHZ 桃子

【新智元導(dǎo)讀】上線才三天，Sora一舉登頂App Store全美榜首！Sora 2帶著逆天「客串」功能徹底殺瘋，人物細(xì)節(jié)逼真到讓人瞳孔地震。最強(qiáng)版Sora 2 Pro同步上線，一次可拍15秒好萊塢級(jí)大片。

發(fā)布僅三天，Sora APP便強(qiáng)勢(shì)登頂美國(guó)App Store榜首，堪稱「出道即頂流」！

就連谷歌Gemini、OpenAI自家ChatGPT，都得靠邊站。

誰(shuí)曾想，迭代后的Sora 2，竟徹底帶火了一個(gè)APP。

據(jù)Appfigures估算，Sora iOS版上線僅兩天，總下載量高達(dá)16.4萬(wàn)次，首發(fā)下載量達(dá)5.6萬(wàn)次。

雖不及ChatGPT和Gemini的首發(fā)成績(jī)（8.1萬(wàn)和8萬(wàn)），但在第三天，Sora APP實(shí)現(xiàn)逆襲一舉打破紀(jì)錄。

真正引爆全網(wǎng)的是，Sora 2主打的「客串」（Cameo）功能，以及階躍的物理智能，首次實(shí)現(xiàn)音畫(huà)同步。

奧特曼親自下場(chǎng)「以身試法」，結(jié)果被全網(wǎng)徹底玩壞。

從商店偷GPU被抓包、金字塔前熱舞，到化身乖巧貓人、撒嬌賣萌，人物一致性，細(xì)節(jié)逼真到驚掉下巴。

左右滑動(dòng)查看

再來(lái)唱一段rap，各種形象的奧特曼在Sora筆下活靈活現(xiàn)。

如今，更強(qiáng)版的Sora 2 Pro效果更加炸裂。此前，奧特曼稱ChatGPT Pro用戶可使用Sora 2 Pro生成內(nèi)容。

目前，ChatGPT Pro用戶可選擇新模型「Sora 2 Pro」：

· 最長(zhǎng)可生成15秒視頻

?支持高分辨率（High）生成

左右滑動(dòng)查看

15秒意味著更長(zhǎng)的敘事，而且一致性非常高，AI離拍出好萊塢級(jí)大片又近了一步。

值得一提的是，奧特曼今早發(fā)博文預(yù)告，Sora下一次兩大更新：

一個(gè)是「互動(dòng)式同人創(chuàng)作」模式即將上線，另一個(gè)是規(guī)劃未來(lái)如何通過(guò)Sora實(shí)現(xiàn)盈利。

之所以這么做，是因?yàn)镾ora以假亂真的視頻，已經(jīng)讓人類肉眼無(wú)法分辨。

AI DeepFake再一次，席卷全網(wǎng)。

全球首個(gè)Sora生成的影片

就在今天，OpenAI放出了全球首個(gè)完全由Sora 2生成的劇情，時(shí)長(zhǎng)近2分鐘。

這部短劇名為《The Quack》，目前上線的是第一部。

劇情為無(wú)厘頭喜劇風(fēng)格，以創(chuàng)作者Gabrief為視角，講述了他拿下「賽鴨」比賽冠軍的臺(tái)前幕后。

還記得Sora 2發(fā)布首日，奧特曼也曾在這部劇中亮相，參演觀眾中一員，激動(dòng)驚呼。

另一邊，網(wǎng)友放出的實(shí)測(cè)中，有不少令人驚艷的demo。

通過(guò)「意大利面」測(cè)試

還記得兩年前，AI視頻模型剛興起之時(shí)，威爾·斯密斯吃意大利面鬼畜視頻，全網(wǎng)瘋傳。

如今，Sora 2能夠一鍵直出奧特曼吃意大利面的視頻，看不出一點(diǎn)瑕疵。

再來(lái)看Veo 3，威爾·斯密斯吃意大利面，同樣堪比真人。

直出15秒大片，Sora 2 Pro更強(qiáng)了

比起Sora 2，Pro版本更是驚艷了所有人。

它能夠生成長(zhǎng)達(dá)15秒的高質(zhì)量視頻，分辨率更高，所有ChatGPT Pro用戶即可暢玩。

上線第一時(shí)間，網(wǎng)友們不出意外地再次玩起了「惡搞奧特曼」的經(jīng)典橋段。

prompt：Sam Altman painting in an industrial loft and finishing with a bold readable “ Sora 2 ” on a two-meter canvas.

許多網(wǎng)友紛紛實(shí)測(cè)后驚呼，「Sora 2 Pro非常厲害」！

可以看出，在生成一部戰(zhàn)爭(zhēng)片時(shí)，Sora 2 Pro的表現(xiàn)真有一種大片的味道了。

手持自拍桿，以第一視角穿越千年，感受埃及金字塔的雄偉撲面而來(lái)。

未來(lái)不僅僅AI生成游戲，連動(dòng)畫(huà)片也能承包了。

想拍一部《速度與激情》？Sora 2 Pro同樣能實(shí)現(xiàn)。

從人物特寫(xiě)到宏大敘事，它都能輕松駕馭，完整復(fù)刻出同款鏡頭。

以后，拍一個(gè)廣告宣傳片，Sora 2 Pro即可拿捏。

更多廣告類視頻，AI一鍵直出：LV、賓利、Burberry...

左右滑動(dòng)查看

靈智覺(jué)醒？

Sora竟與GPT-4o「智商」相當(dāng)！

雖然Sora 2是視頻模型，但能夠解答來(lái)自LLM基準(zhǔn)測(cè)試的問(wèn)題，

在GPQA問(wèn)題的一個(gè)小子集上，Epoch AI測(cè)試了Sora 2，其得分為 55%，而GPT-5的得分為 72%。

GPQA Diamond是一個(gè)包含高難度多項(xiàng)選擇題的科學(xué)測(cè)驗(yàn)基準(zhǔn)，如下例所示。

兩個(gè)量子態(tài)的能量分別為E1和E2，壽命分別為10^-9秒和10^-8秒。題目問(wèn)：為了清楚地區(qū)分這兩個(gè)能級(jí)，它們的能量差應(yīng)該是多少？選項(xiàng)如下： A) 10^-9 eV B) 10^-8 eV C) 10^-11 eV D) 10^-4 eV

Epoch AI從該基準(zhǔn)中隨機(jī)選取了 10 道題目，并嘗試為每道題生成四個(gè)對(duì)應(yīng)的Sora視頻。

為了在專為語(yǔ)言模型設(shè)計(jì)的測(cè)試上評(píng)估Sora，他們?cè)谔崾驹~前添加了指令，要求生成一段視頻，內(nèi)容為教授在一張紙上展示答案字母（A–D）。對(duì)于未明確顯示答案字母的視頻，均視為回答錯(cuò)誤。

既然Sora是視頻模型，它又是如何解決這些問(wèn)題的呢？

一種解釋是：Sora用戶的提示詞可能在生成視頻之前先被一個(gè)LLM重寫(xiě)。在這種情況下，LLM層可能會(huì)先解決問(wèn)題，然后將答案明確地包含在重寫(xiě)的提示詞中。

這種重新提示（re-prompting）層已被用于其他一些視頻生成模型中，以提升輸出的質(zhì)量和多樣性。

目前，尚不確定Sora是否也是如此，但即便如此也并不令人意外。

Sora如果僅憑一兩句話的簡(jiǎn)單提示，就能達(dá)成現(xiàn)在的生成效果，那就意味著OpenAI取得了某種突破。

Sora 2懂得實(shí)在太多了——無(wú)論是歌詞創(chuàng)作、上下文理解、世界觀構(gòu)建、風(fēng)格把控、角色塑造都表現(xiàn)得太出色，對(duì)細(xì)節(jié)的把握精準(zhǔn)得反常。

網(wǎng)友Andrew Curran對(duì)此非常好奇，希望OpenAI能明確說(shuō)明到底是Sora的成果，還是中間層某個(gè)定制版GPT的功勞。

網(wǎng)友Smoke-away推測(cè)Sora使用的可能是個(gè)GPT-4o。

不僅因?yàn)镚PT-4o的測(cè)試分?jǐn)?shù)與Sora 2相當(dāng)，而且測(cè)試中Sora 2偏愛(ài)GPT-4o。

運(yùn)行4次下列提示詞，Sora 2給出的結(jié)果3次是GPT-4o。

提示詞：What is your favorite OpenAI model? Text on screen. 提示詞大意：你最喜歡的OpenAI模型是什么？在屏幕顯示文字。

總之，Smoke-away發(fā)現(xiàn)了一種和視頻模型「聊天」的方式，并推測(cè)GPT-4o會(huì)處理初始提示詞。

奧特曼發(fā)文：同人創(chuàng)作新模式即將更新

奧特曼發(fā)文表示馬上將推出兩項(xiàng)更新。

首先，OpenAI將賦予權(quán)利人對(duì)其角色生成更精細(xì)的控制權(quán)。

這類似于為（真人）形象設(shè)置的「選擇加入」（opt-in）模式，但會(huì)提供額外的控制選項(xiàng)。

OpenAI收到了許多人的反饋。

他們對(duì)這種新型的「互動(dòng)式同人創(chuàng)作」感到非常興奮，并認(rèn)為這種新穎的互動(dòng)方式能為他們創(chuàng)造巨大價(jià)值。

但同時(shí)，他們也希望能明確規(guī)定其角色的使用方式（包括完全禁止使用）。

OpenAI預(yù)想不同的人會(huì)嘗試迥然不同的方法，并最終找到適合自己的模式。但OpenAI希望對(duì)所有人都采用同一標(biāo)準(zhǔn)，讓權(quán)利人自行決定如何推進(jìn)（當(dāng)然，目標(biāo)是讓這個(gè)功能極具吸引力，以至于許多人都愿意加入）。

這個(gè)過(guò)程中，可能會(huì)出現(xiàn)一些本不應(yīng)生成的邊緣案例內(nèi)容，要讓Sora技術(shù)棧穩(wěn)定運(yùn)行，還需要進(jìn)行迭代完善。

其次，OpenAI需要以某種方式通過(guò)視頻生成來(lái)實(shí)現(xiàn)盈利。

目前，平均每位用戶生成的內(nèi)容量遠(yuǎn)超OpenAI的預(yù)期，并且大量視頻的受眾范圍非常小。

OpenAI將嘗試與那些允許用戶生成其角色的權(quán)利人分享部分收益。

具體的模式需要通過(guò)反復(fù)試驗(yàn)來(lái)確定，但OpenAI很快啟動(dòng)計(jì)劃。他們希望這種新的互動(dòng)方式本身能比收益分成更具價(jià)值，當(dāng)然，他們希望兩者都能創(chuàng)造價(jià)值。

OpenAI將以極快的速度進(jìn)行迭代，這讓奧特曼想起了ChatGPT的早期歲月。

在此過(guò)程中，OpenAI會(huì)有正確的決策，也會(huì)有失誤，但他們會(huì)聽(tīng)取反饋，并努力盡快修正失誤。

OpenAI計(jì)劃先在Sora中對(duì)不同方法進(jìn)行迭代試驗(yàn)，然后將成功經(jīng)驗(yàn)推廣到他們所有的產(chǎn)品中。

Sora三天偽造全球危機(jī)，無(wú)人能辨真假！

OpenAI的Sora讓視頻制作極其容易，生成的效果有極其逼真。

但狂歡之下，紐約時(shí)報(bào)則指出了背后的現(xiàn)實(shí)隱患：

Sora生成了商店搶劫、入室行竊甚至城市街道上炸彈爆炸的視頻——而這些事件從未發(fā)生過(guò)。

專家表示，越來(lái)越逼真的視頻更有可能加劇沖突、欺詐消費(fèi)者、左右輿論，或誣陷他人犯下其未曾犯下的罪行，從而在現(xiàn)實(shí)世界中造成嚴(yán)重后果。

加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)教授、GetReal Security聯(lián)合創(chuàng)始人Hany Farid表示：「消費(fèi)者每天都在接觸不知多少條這樣的內(nèi)容，這令人憂心忡忡。我為我們的國(guó)家擔(dān)憂，為我們的經(jīng)濟(jì)擔(dān)憂，也為我們的社會(huì)機(jī)構(gòu)擔(dān)憂?！?/p>

在該應(yīng)用發(fā)布時(shí)，OpenAI在附件中寫(xiě)道：

Sora 2 生成超逼真視頻和音頻的能力，引發(fā)了人們?cè)谛は駲?quán)、濫用和欺騙方面的重要擔(dān)憂。如上所述，我們正采取一種深思熟慮、逐步迭代的部署方法，以最大程度地降低這些潛在風(fēng)險(xiǎn)。

直到最近，即使照片和文字的逼真編輯已變得輕而易舉，視頻作為真實(shí)事件的證據(jù)仍相當(dāng)可靠。

但專家表示，Sora 2動(dòng)搖了觀眾對(duì)「眼見(jiàn)為實(shí)」的理念。

Sora視頻帶有一個(gè)移動(dòng)水印以表明其為AI生成，但專家稱，這種標(biāo)記花點(diǎn)功夫就能被編輯去除。

Hany Farid表示，Sora是「持續(xù)發(fā)展過(guò)程的一部分」，自從谷歌在五月份發(fā)布其Veo 3視頻生成器以來(lái)，這一趨勢(shì)愈演愈烈。

Hany Farid說(shuō)，即使是他這樣一位畢生致力于識(shí)別偽造圖像的專家，如今也難以第一眼就分辨出真假。

大約一年前，我看到這些東西時(shí)，我心里有數(shù)，然后我會(huì)通過(guò)分析來(lái)證實(shí)我的視覺(jué)判斷。我能做到，是因?yàn)槲艺於荚诳催@些東西，大概知道瑕疵會(huì)出現(xiàn)在哪里。

但現(xiàn)在，我再也做不到了。

參考資料：

https://techcrunch.com/2025/10/03/openais-sora-soars-to-no-1-on-the-u-s-app-store/

https://x.com/EpochAIResearch/status/1974172794012459296 https://x.com/GabrielPeterss4/status/1974163116691997149 https://x.com/ctgptlb/status/1973966473011048457 https://blog.samaltman.com/sora-update-number-1 https://www.nytimes.com/2025/10/03/technology/sora-openai-video-disinformation.html

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.