夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

李飛飛發(fā)布全新世界模型,單GPU就能跑!

0
分享至

時(shí)令 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

李飛飛的世界模型創(chuàng)業(yè),最新成果來(lái)了!

剛剛,教母親自宣布對(duì)外推出全新模型RTFM(A Real-Time Frame Model),不僅具備實(shí)時(shí)運(yùn)行、持久性和3D一致性,更關(guān)鍵的是——

單張H100 GPU就能跑。



此外,RTFM的設(shè)計(jì)遵循三大核心原則:

效率:僅需單張H100 GPU,RTFM便能以交互級(jí)幀率實(shí)時(shí)完成推理運(yùn)算。

可擴(kuò)展性:該架構(gòu)具備隨數(shù)據(jù)量與算力增長(zhǎng)而持續(xù)擴(kuò)展的能力。它通過(guò)端到端的通用架構(gòu)從海量視頻數(shù)據(jù)中自主學(xué)習(xí),無(wú)需依賴顯式3D表征即可構(gòu)建三維世界模型。

持久性:用戶可無(wú)限時(shí)長(zhǎng)與RTFM交互,所有場(chǎng)景將永久留存。該系統(tǒng)構(gòu)建的持久化3D世界不會(huì)因視角轉(zhuǎn)換而消失。

下面具體來(lái)看。

世界模型需要大量計(jì)算資源

強(qiáng)大的世界模型能夠?qū)崟r(shí)重建、生成并模擬具有持久性、可交互且物理精確的世界。這類模型將徹底改變從媒體到機(jī)器人技術(shù)等各行各業(yè)。

過(guò)去一年,生成式視頻建模的進(jìn)展已成功應(yīng)用于生成式世界建模領(lǐng)域。

隨著技術(shù)發(fā)展,一個(gè)事實(shí)愈發(fā)清晰:生成式世界模型對(duì)算力的需求將遠(yuǎn)超當(dāng)今的大型語(yǔ)言模型。

若直接套用現(xiàn)有視頻架構(gòu),生成60幀的4K交互視頻流每秒需產(chǎn)生超過(guò)10萬(wàn)個(gè)token(約等于《弗蘭肯斯坦》或首部《哈利·波特》的篇幅)。

而要維持一小時(shí)以上的持續(xù)交互,需處理的上下文token更將突破1億大關(guān)?;诋?dāng)前計(jì)算基礎(chǔ)設(shè)施,這既不可行也不具備經(jīng)濟(jì)性。

李飛飛團(tuán)隊(duì)深信“慘痛教訓(xùn)”揭示的規(guī)律:

  • 那些能隨算力增長(zhǎng)優(yōu)雅擴(kuò)展的簡(jiǎn)潔方法終將在AI領(lǐng)域占據(jù)主導(dǎo),因?yàn)樗鼈兡芟硎軘?shù)十年來(lái)推動(dòng)技術(shù)發(fā)展的算力成本指數(shù)級(jí)下降紅利。生成式世界模型正處在絕佳位置,必將從持續(xù)降低的算力成本中獲益。

這也就引出一個(gè)關(guān)鍵問(wèn)題:生成式世界模型是否會(huì)被當(dāng)前硬件條件所限制?能否現(xiàn)在就預(yù)覽這項(xiàng)技術(shù)的雛形?

于是,李飛飛團(tuán)隊(duì)設(shè)定了一個(gè)明確目標(biāo):設(shè)計(jì)一款足夠高效、可立即部署,并能隨算力提升持續(xù)擴(kuò)展的生成式世界模型。

他們的目的是打造僅需單張H100 GPU即可驅(qū)動(dòng)的模型,在保持交互幀率的同時(shí),確保虛擬世界永不消散。實(shí)現(xiàn)這些技術(shù)指標(biāo),將讓他們提前窺見(jiàn)未來(lái)——在當(dāng)下硬件上體驗(yàn)明日模型可能達(dá)到的高度。

這一目標(biāo)深刻影響著他們從任務(wù)設(shè)定到模型架構(gòu)的整個(gè)系統(tǒng)設(shè)計(jì)。通過(guò)精心優(yōu)化推理堆棧的每個(gè)環(huán)節(jié),融合架構(gòu)設(shè)計(jì)、模型蒸餾與推理優(yōu)化的前沿突破,他們致力于在當(dāng)今硬件上呈現(xiàn)對(duì)未來(lái)模型最高保真度預(yù)覽。

世界模型作為學(xué)習(xí)渲染器

傳統(tǒng)的3D圖形管線采用顯式3D表征(如三角網(wǎng)格、高斯?jié)姙R)構(gòu)建世界模型,再通過(guò)渲染生成2D圖像。這些管線依賴人工設(shè)計(jì)的數(shù)據(jù)結(jié)構(gòu)與算法來(lái)模擬3D幾何、材質(zhì)、光照、陰影及反射等效果。

數(shù)十年來(lái),這類方法始終是計(jì)算機(jī)圖形學(xué)領(lǐng)域的中流砥柱,但其難以隨數(shù)據(jù)量與算力增長(zhǎng)實(shí)現(xiàn)線性擴(kuò)展。

RTFM則另辟蹊徑?;谏墒揭曨l建模的最新突破,研究團(tuán)隊(duì)通過(guò)訓(xùn)練單一神經(jīng)網(wǎng)絡(luò),輸入場(chǎng)景的單張或多張2D圖像,即可從全新視角生成該場(chǎng)景的2D圖像,全程無(wú)需構(gòu)建任何顯式3D表征。

RTFM還采用作用于幀序列的自回歸擴(kuò)散變換器架構(gòu),通過(guò)海量視頻數(shù)據(jù)進(jìn)行端到端訓(xùn)練,實(shí)現(xiàn)基于歷史幀的后續(xù)幀預(yù)測(cè)。

RTFM 可以被視為一種可學(xué)習(xí)的渲染器(learned renderer)。它首先將輸入的圖像幀轉(zhuǎn)換為神經(jīng)網(wǎng)絡(luò)中的激活(即KV cache),這些激活以隱式方式表示整個(gè)世界,在生成新幀的過(guò)程中,網(wǎng)絡(luò)通過(guò)注意力機(jī)制從這種表示中讀取信息,從而根據(jù)輸入視角生成與之保持一致的世界新視圖。

從輸入視圖轉(zhuǎn)換為世界表示,以及再?gòu)脑摫硎局袖秩拘聨臋C(jī)制,并不是通過(guò)手工設(shè)計(jì)的,而是通過(guò)端到端的數(shù)據(jù)訓(xùn)練自動(dòng)學(xué)得的。

RTFM只需在訓(xùn)練過(guò)程中觀察到這些現(xiàn)象,就能夠?qū)W會(huì)建模諸如反射、陰影等復(fù)雜效果。

可以說(shuō),RTFM模糊了“重建”(在已有視角之間進(jìn)行插值)與“生成”(創(chuàng)造輸入視角中不可見(jiàn)的新內(nèi)容)之間的界限,而這兩者在計(jì)算機(jī)視覺(jué)中歷史上一直被視為兩個(gè)獨(dú)立的問(wèn)題。

當(dāng)RTFM被提供大量輸入視角時(shí),由于任務(wù)約束更強(qiáng),它更傾向于執(zhí)行重建;當(dāng)輸入視角較少時(shí),它則被迫進(jìn)行超出已有視角的外推生成。

將姿態(tài)幀作為空間記憶

現(xiàn)實(shí)世界的一個(gè)關(guān)鍵特性是持久性(persistence):當(dāng)你移開(kāi)視線時(shí),世界不會(huì)消失或完全改變,無(wú)論你離開(kāi)多長(zhǎng)時(shí)間,你總是可以回到之前去過(guò)的地方。

這對(duì)自回歸幀模型來(lái)說(shuō)一直是一個(gè)挑戰(zhàn)。世界僅通過(guò)二維圖像幀被隱式表示,因此,實(shí)現(xiàn)持久性要求模型在用戶探索世界的過(guò)程中,對(duì)不斷增長(zhǎng)的幀集合進(jìn)行推理。這意味著每生成一幀的成本都比前一幀更高,因此模型對(duì)世界的記憶實(shí)際上受到其計(jì)算資源預(yù)算的限制。

RTFM通過(guò)將每一幀建模為在三維空間中具有一個(gè)姿態(tài)(位置和方向)來(lái)規(guī)避這一問(wèn)題。他們通過(guò)向模型提供待生成幀的姿態(tài)來(lái)生成新幀。

模型對(duì)世界的記憶(包含在其幀中)具有空間結(jié)構(gòu)。它將帶有姿態(tài)的幀作為空間記憶使用。這為模型提供了一個(gè)弱先驗(yàn)——即它所建模的世界是三維歐幾里得空間——而無(wú)需強(qiáng)制模型顯式預(yù)測(cè)該世界中物體的三維幾何形狀。

RTFM的空間記憶使得持久性不受限制。在生成新幀時(shí),他們會(huì)從已姿態(tài)幀的空間記憶中檢索附近幀,以為模型構(gòu)建一個(gè)定制的上下文。

團(tuán)隊(duì)將這一技術(shù)稱為上下文切換(context juggling):模型在不同空間區(qū)域生成內(nèi)容時(shí)會(huì)使用不同的上下文幀。這使得RTFM能夠在長(zhǎng)時(shí)間交互中保持對(duì)大型世界的持久記憶,而無(wú)需對(duì)不斷增長(zhǎng)的幀集合進(jìn)行推理。

最后,該模型即日起以預(yù)覽版形式開(kāi)放體驗(yàn),現(xiàn)在就可以試起來(lái)了…

試完歡迎回來(lái)補(bǔ)個(gè)反饋評(píng)論哦,筆芯~

參考鏈接:
[1]https://x.com/drfeifei/status/1978840835341914164
[2]https://x.com/theworldlabs/status/1978839175320186988
[3]https://www.worldlabs.ai/blog/rtfm

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
突發(fā),中美再傳新消息

突發(fā),中美再傳新消息

風(fēng)風(fēng)順
2025-10-20 06:28:11
REDMI K90 Pro Max搭載6.9英寸超級(jí)像素屏幕:小米17 Pro Max同款!

REDMI K90 Pro Max搭載6.9英寸超級(jí)像素屏幕:小米17 Pro Max同款!

快科技
2025-10-20 17:12:19
還差51球!40歲C羅明年10月前將打進(jìn)1000球:概率94.9% 歷史第1人

還差51球!40歲C羅明年10月前將打進(jìn)1000球:概率94.9% 歷史第1人

風(fēng)過(guò)鄉(xiāng)
2025-10-19 20:40:46
楊振寧走了!18億遺產(chǎn)傳言背后,藏著更動(dòng)人的答案

楊振寧走了!18億遺產(chǎn)傳言背后,藏著更動(dòng)人的答案

鄉(xiāng)下客
2025-10-20 16:04:07
全網(wǎng)淚崩!“跳河新郎”后續(xù):女方退還彩禮,未領(lǐng)證真相令人心碎

全網(wǎng)淚崩!“跳河新郎”后續(xù):女方退還彩禮,未領(lǐng)證真相令人心碎

百里杜鵑
2025-10-19 23:13:36
四野老兵口述實(shí)錄:3個(gè)師編入朝鮮人民軍,打完仗只回來(lái)了12000人

四野老兵口述實(shí)錄:3個(gè)師編入朝鮮人民軍,打完仗只回來(lái)了12000人

音樂(lè)時(shí)光的娛樂(lè)
2025-10-18 06:37:53
103歲楊振寧走了!最后時(shí)刻意識(shí)清醒,翁帆含淚翻譯他的詩(shī)

103歲楊振寧走了!最后時(shí)刻意識(shí)清醒,翁帆含淚翻譯他的詩(shī)

有范又有料
2025-10-19 17:12:21
太勵(lì)志了!只用了2年,他的合同翻了36倍,成現(xiàn)役最強(qiáng)第六人!

太勵(lì)志了!只用了2年,他的合同翻了36倍,成現(xiàn)役最強(qiáng)第六人!

大衛(wèi)的籃球故事
2025-10-20 11:52:34
1971年,楊振寧發(fā)愁先去臺(tái)灣還是大陸,杜致禮:還是先去大陸吧

1971年,楊振寧發(fā)愁先去臺(tái)灣還是大陸,杜致禮:還是先去大陸吧

歷史縱觀
2025-10-18 15:59:44
太火爆,漲幅已超黃金,突發(fā)公告:限購(gòu)升級(jí)

太火爆,漲幅已超黃金,突發(fā)公告:限購(gòu)升級(jí)

極目新聞
2025-10-20 08:10:59
龍洋紫外套配綠褲驚艷亮相,手提蟹籃的樣子,讓人越看越喜歡

龍洋紫外套配綠褲驚艷亮相,手提蟹籃的樣子,讓人越看越喜歡

暖心萌阿菇?jīng)?/span>
2025-10-20 15:37:55
曼聯(lián)客場(chǎng)2-1力克利物浦,這場(chǎng)對(duì)決著實(shí)精彩

曼聯(lián)客場(chǎng)2-1力克利物浦,這場(chǎng)對(duì)決著實(shí)精彩

華山輪車
2025-10-20 14:58:07
兩千院士無(wú)諾獎(jiǎng),一人諾獎(jiǎng)非院士

兩千院士無(wú)諾獎(jiǎng),一人諾獎(jiǎng)非院士

濤哥銳評(píng)
2025-10-13 06:40:13
梅根面相變了:臉又瘦又尖,鼻子大嘴巴凸,結(jié)婚7年眼里也沒(méi)光了

梅根面相變了:臉又瘦又尖,鼻子大嘴巴凸,結(jié)婚7年眼里也沒(méi)光了

照見(jiàn)古今
2025-10-11 17:34:03
1985年,F(xiàn)BI特工因航班延誤發(fā)現(xiàn)破綻,致潛伏37年的紅色諜王被捕

1985年,F(xiàn)BI特工因航班延誤發(fā)現(xiàn)破綻,致潛伏37年的紅色諜王被捕

干史人
2024-10-02 07:40:03
陽(yáng)光電源“驚魂日”:歐盟新政“拿捏”了中國(guó)儲(chǔ)能的七寸?

陽(yáng)光電源“驚魂日”:歐盟新政“拿捏”了中國(guó)儲(chǔ)能的七寸?

阿爾法工場(chǎng)
2025-10-20 10:57:34
U17女足世界杯小組賽第一輪結(jié)束了所有比賽,最新積分榜如下!

U17女足世界杯小組賽第一輪結(jié)束了所有比賽,最新積分榜如下!

薇說(shuō)體育
2025-10-20 17:22:30
勇士揭幕戰(zhàn)前遭打擊,23歲后衛(wèi)確定休息,兩鋒線大將也有傷

勇士揭幕戰(zhàn)前遭打擊,23歲后衛(wèi)確定休息,兩鋒線大將也有傷

謝說(shuō)籃球
2025-10-20 12:31:14
拾荒父親供兒子上大學(xué),兒子婚禮叫父親上臺(tái),岳父聽(tīng)到竟直接跪下

拾荒父親供兒子上大學(xué),兒子婚禮叫父親上臺(tái),岳父聽(tīng)到竟直接跪下

今天說(shuō)故事
2024-09-24 18:07:26
廣東一租客下水道被堵,竟掏出12米樹(shù)根,房東:8樓的小樹(shù)根系穿到2樓

廣東一租客下水道被堵,竟掏出12米樹(shù)根,房東:8樓的小樹(shù)根系穿到2樓

瀟湘晨報(bào)
2025-10-20 09:38:22
2025-10-20 18:08:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11529文章數(shù) 176308關(guān)注度
往期回顧 全部

科技要聞

雙11涼涼了?大主播退場(chǎng),無(wú)AI不賣貨

頭條要聞

夫婦盯上2‰自然損耗規(guī)則 上千噸糧食遭盜賣價(jià)值500萬(wàn)

頭條要聞

夫婦盯上2‰自然損耗規(guī)則 上千噸糧食遭盜賣價(jià)值500萬(wàn)

體育要聞

年薪百萬(wàn)的球星,穿二手鞋騎自行車上下班

娛樂(lè)要聞

明星進(jìn)豪門并沒(méi)有想象中的光鮮?

財(cái)經(jīng)要聞

第三季度GDP,4.8%!

汽車要聞

被騙上騰勢(shì)N8L干到200公里魚(yú)鉤測(cè)試 下車吐了但值了

態(tài)度原創(chuàng)

家居
數(shù)碼
時(shí)尚
公開(kāi)課
軍事航空

家居要聞

詩(shī)意好宅 探索審美意蘊(yùn)

數(shù)碼要聞

雙十一期間享優(yōu)惠,華為WATCH GT 6 Pro正式開(kāi)售,2438元起

伊姐周日熱推:電視劇《依依向北風(fēng)》;電視劇《水龍吟》......

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍在高速公路實(shí)彈軍演 萬(wàn)斯安保車遭炮彈碎片擊中

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 99久久99这里只有免费费精品| 淫荡的人妻AV| 国产精品免费精品自在线观看| 综合久久/av| 最近2018中文字幕2019视频| 无码中文字幕在线播放2| 乱人伦中文无码视频在线观看| 七月婷婷五月丁香| 久久国产精品娇妻素人| 波多野结衣连续被躁57分钟| 玩成熟老熟女视频| 亚洲五月丁香综合视频| 亚洲一线免费看| 亚洲AV成人片无码精品| 国产乱人乱偷精品视频网站| 一级老熟女乱伦| 国产精品有码在线观看| 激情图片激情小说| 欧美日本一区二区| 亚洲欧美尹人综合网站| 欧美色图视频在线观看| 极品美女综合网| 伊人色综合一区二区三区| 强壮公让我夜夜高潮| 文字日产幕日产区| 国产做受XXXXX| 实拍女处破www免费看| 宅男99网站| 日本卡一卡二卡乱码三卡四码| 日本亚洲欧洲无免费码在线| 亚玖玖视频热播| 少妇人妻大乳在线视频不卡| 亚洲精品日韩中文字幕| 免费看高朝视频| 久久中文字幕无码专区| 国产自产精品露脸刺激91在线| 亚洲成a人片在线观看久| 久久久精品影视| 6080久久| 欧美精品国产综合久久| av中文在线观看|