夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

世界模型有了開源基座Emu3.5!拿下多模態(tài)SOTA,性能超NanoBanana

0
分享至

允中 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

最新最強(qiáng)的開源原生多模態(tài)世界模型——

北京智源人工智能研究院(BAAI)的悟界·Emu3.5來炸場了。

圖、文、視頻任務(wù)一網(wǎng)打盡,不僅能畫圖改圖,還能生成圖文教程,視頻任務(wù)更是增加了物理真實(shí)性。

先感受一下它的高精度操作:一句話消除手寫痕跡。



第一視角漫游動態(tài)3D世界:



要知道,現(xiàn)在AI迭代的速度,正在刷新所有人的認(rèn)知。

尤其是在文生視頻這條賽道上,幾乎每個(gè)月都有新技術(shù)出來“搞事情”。

肉眼可見,AI視頻一個(gè)比一個(gè)真,一個(gè)比一個(gè)長。

but,先別急著鼓掌——

真正的賽點(diǎn),早已不是“像不像”,而是“懂不懂”。

它知道桌子上的蘋果被拿走后,那里應(yīng)該變空嗎?它明白你轉(zhuǎn)身之后,背后的場景依然存在嗎?如果答案是否定的,那再逼真的視頻,也不過是“高級的GIF”。

現(xiàn)在,致力于攻克這一終極難題的玩家,終于帶著悟界·Emu3.5來了。

從官方放出的demo來看,Emu3.5生成的作品展現(xiàn)出極強(qiáng)的連貫性、邏輯性,尤其讓AI模擬動態(tài)物理世界的能力又雙叒增強(qiáng)了。

它能讓你以第一人稱視角進(jìn)入它所構(gòu)建的虛擬世界。你的每一次移動、每一次轉(zhuǎn)身,它都能動態(tài)構(gòu)建出你下一步應(yīng)該看到的場景,全程保持空間一致性。

除了上面展示的探索3D游戲世界,還能第一視角參觀陽光下的客廳:



在火星上開卡丁車也很絲滑:



由于掌握了世界運(yùn)行的內(nèi)在規(guī)律,它不僅能像專業(yè)設(shè)計(jì)師一樣,進(jìn)行高精度、可控的圖像編輯:



還能像拍電影一樣,生成圖文并茂的視覺故事:



從測評成績來看,悟界·Emu3.5的表現(xiàn)也極其亮眼——在多項(xiàng)權(quán)威基準(zhǔn)上,性能媲美甚至超越了Gemini-2.5-Flash-Image,沒錯(cuò),就是那個(gè)Nano Banana,在文本渲染和多模態(tài)交錯(cuò)生成任務(wù)上優(yōu)勢尤其顯著。



Emu3.5的命名,就揭示了它的定位:世界模型基座

顧名思義,它要做的是世界模型的基礎(chǔ)模型,這等于是在AI領(lǐng)域開辟了一條全新的賽道。

那么,這樣一個(gè)被寄予厚望的模型究竟有多強(qiáng)?來看更多案例。

像智能體一樣理解長時(shí)序
核心能力:世界探索與具身操作

這是Emu3.5最核心、最能體現(xiàn)其“世界模型基座”本質(zhì)的能力。它能像一個(gè)智能體(Agent)一樣,理解長時(shí)序、空間一致的序列,模擬在虛擬世界中的探索和操作。

比如下面這個(gè)“整理桌面”的任務(wù),就是通過以下指令一步步實(shí)現(xiàn)的:

  1. 先把桌上所有東西清空。
  2. 把所有線纜解開并分類。
  3. 用扎帶把線纜捆好。
  4. 用理線槽把線纜隱藏在桌下。
  5. 最后把桌面物品擺放整齊。



進(jìn)階能力:視覺指導(dǎo)與復(fù)雜圖像編輯

正因?yàn)檎莆樟藙討B(tài)世界演變規(guī)律,Emu3.5尤為擅長提供具有連貫性和指導(dǎo)意義的視覺內(nèi)容。

當(dāng)給了Emu3.5一張狐貍的草圖,并給出一系列指令“把它變成3D模型、3D打印出來、再上色”后,它直接一步步生成了從草圖到最終手辦形態(tài)的完整視覺流程。整個(gè)過程中,狐貍的核心特征和神態(tài)都得到了完美保留,扛住了長時(shí)程創(chuàng)作的挑戰(zhàn)。



這種能力讓它還能生成分步教學(xué)指南,手把手教你做菜、畫畫、種菜:



同時(shí),它也支持多圖、多輪指令的復(fù)雜圖像編輯,主體一致性、風(fēng)格保持能力達(dá)到業(yè)界頂尖水平。

敲黑板,由于Emu3.5本身就在海量的互聯(lián)網(wǎng)視頻上進(jìn)行預(yù)訓(xùn)練,所以它天生就具備理解時(shí)空連續(xù)性的能力,能夠生成長時(shí)序、邏輯一致的序列,而不會出現(xiàn)風(fēng)格漂移或事實(shí)錯(cuò)亂。

為了構(gòu)建Emu3.5,智源這次在技術(shù)方面也是進(jìn)行了一系列創(chuàng)新和突破。

背后技術(shù)原理

Emu3.5參數(shù)量僅34B,整個(gè)模型以標(biāo)準(zhǔn)的Decoder-only Transformer為框架,單一模型能夠同時(shí)完成視覺敘事、視覺引導(dǎo)、圖像編輯、世界探索、具身操作等多種任務(wù)。

它將所有任務(wù)都統(tǒng)一為下一State預(yù)測(Next-State Prediction)任務(wù),無論是文本還是圖像,都被一個(gè)強(qiáng)大的多模態(tài)分詞器(Tokenizer)轉(zhuǎn)換成離散的Token序列。

  • 海量視頻數(shù)據(jù)預(yù)訓(xùn)練
  • 模型在超過10萬億Token的多模態(tài)數(shù)據(jù)上進(jìn)行訓(xùn)練,其中主力是來自互聯(lián)網(wǎng)視頻的連續(xù)幀和轉(zhuǎn)錄文本。這使得模型從一開始就沉浸式學(xué)習(xí)時(shí)空連續(xù)性和因果關(guān)系。
  • 強(qiáng)大的分詞器
  • 視覺分詞器(Tokenizer)基于IBQ框架,擁有13萬的視覺詞匯表,并集成了擴(kuò)散解碼器,能實(shí)現(xiàn)高達(dá)2K分辨率的高保真圖像重建。
  • 多階段對齊
  • 在預(yù)訓(xùn)練之后,模型經(jīng)過了大規(guī)模的有監(jiān)督微調(diào)(SFT)和大規(guī)模多模態(tài)強(qiáng)化學(xué)習(xí)(RL),使用一個(gè)包含通用指標(biāo)(如美學(xué)、圖文對齊)和任務(wù)特定指標(biāo)(如故事連貫性、文本渲染準(zhǔn)確率)的復(fù)雜獎(jiǎng)勵(lì)系統(tǒng)進(jìn)行優(yōu)化。
  • 推理加速黑科技
  • 為了解決自回歸模型生成圖像慢的問題,團(tuán)隊(duì)提出了離散擴(kuò)散適配(DiDA)技術(shù),它能將逐個(gè)Token的生成方式轉(zhuǎn)變?yōu)椴⑿械碾p向預(yù)測,在不犧牲性能的前提下,使每張圖像的推理速度提升近20倍。
One More Thing

這么強(qiáng)的模型,智源選擇——開源



全球的開發(fā)者、研究者,不用再從零開始,就能直接上手一個(gè)懂物理、有邏輯的世界模型。

從生成更逼真的視頻,到構(gòu)建更聰明的智能體,再到賦能千行百業(yè)的實(shí)際應(yīng)用……想象空間拉滿了。

對了,如果想要體驗(yàn)科研內(nèi)測版,可戳下方鏈接申請~

體驗(yàn)鏈接:https://jwolpxeehx.feishu.cn/share/base/form/shrcn0dzwo2ZkN2Q0dveDBSfR3b

項(xiàng)目主頁:https://zh.emu.world/pages/web/landingPage
技術(shù)報(bào)告:https://zh.emu.world/Emu35_tech_report.pdf

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
小酒窩陳思誠聊天正面照曝光!稱呼對方陳叔叔!網(wǎng)友:有最好資源

小酒窩陳思誠聊天正面照曝光!稱呼對方陳叔叔!網(wǎng)友:有最好資源

丁丁鯉史紀(jì)
2025-11-01 23:02:37
劉宏偉律師:大范圍失業(yè)的律師行業(yè)令人心痛

劉宏偉律師:大范圍失業(yè)的律師行業(yè)令人心痛

網(wǎng)際風(fēng)行
2025-10-30 07:18:43
有點(diǎn)意思!吳宗憲復(fù)播,先表態(tài)自己是中國人,后又隔空稱贊大小S

有點(diǎn)意思!吳宗憲復(fù)播,先表態(tài)自己是中國人,后又隔空稱贊大小S

娛圈小愚
2025-11-01 13:16:20
男人老了的標(biāo)志是什么?網(wǎng)友:一天三次變成一天一次,逃避義務(wù)

男人老了的標(biāo)志是什么?網(wǎng)友:一天三次變成一天一次,逃避義務(wù)

帶你感受人間冷暖
2025-10-30 00:05:13
安世立下規(guī)矩,日本歐洲全線停產(chǎn),荷蘭承認(rèn)誤判:強(qiáng)搶是無奈之舉

安世立下規(guī)矩,日本歐洲全線停產(chǎn),荷蘭承認(rèn)誤判:強(qiáng)搶是無奈之舉

華庭講美食
2025-11-01 07:35:28
柬埔寨官方喊話:網(wǎng)絡(luò)詐騙是跨國問題,這鍋不能只讓我背

柬埔寨官方喊話:網(wǎng)絡(luò)詐騙是跨國問題,這鍋不能只讓我背

策略述
2025-11-01 13:28:34
西德妮·斯威尼透視裙惹爭議,梅根·凱莉直言欣賞但拒絕裸露尺度

西德妮·斯威尼透視裙惹爭議,梅根·凱莉直言欣賞但拒絕裸露尺度

可樂談情感
2025-11-02 06:30:05
86歲老人隨口亂說代號,兒子上報(bào)后,國安領(lǐng)導(dǎo):馬上接通中央部委

86歲老人隨口亂說代號,兒子上報(bào)后,國安領(lǐng)導(dǎo):馬上接通中央部委

知鑒明史
2025-10-23 14:01:49
江一燕這腰非得要露出來嗎?腰上這一圈肉還挺讓人出戲的

江一燕這腰非得要露出來嗎?腰上這一圈肉還挺讓人出戲的

TVB的四小花
2025-11-01 14:36:44
6比0!劉誠宇帽子戲法!

6比0!劉誠宇帽子戲法!

五星體育
2025-11-01 20:00:35
降薪后被消費(fèi)者避雷,昔日鞋王會怕嗎?

降薪后被消費(fèi)者避雷,昔日鞋王會怕嗎?

36氪
2025-11-02 09:22:09
馮唐女性覺醒:女人最愚蠢的是在底層找愛情,讀書上進(jìn)才是真出路

馮唐女性覺醒:女人最愚蠢的是在底層找愛情,讀書上進(jìn)才是真出路

杏花煙雨江南的碧園
2025-10-27 08:30:03
這才是真正的大白天鵝,豐腴才是審美的最高標(biāo)準(zhǔn),才是女神的樣子

這才是真正的大白天鵝,豐腴才是審美的最高標(biāo)準(zhǔn),才是女神的樣子

喜歡歷史的阿繁
2025-10-28 06:31:52
最可能對俄開戰(zhàn)的10國,大鵝的世仇占一半,前三名和大鵝必有一戰(zhàn)

最可能對俄開戰(zhàn)的10國,大鵝的世仇占一半,前三名和大鵝必有一戰(zhàn)

黑洞觀星
2025-11-01 16:10:09
48歲曾黎回老家種地!滿臉褶頭發(fā)花白斷崖衰老,徒手摘黃瓜像農(nóng)婦

48歲曾黎回老家種地!滿臉褶頭發(fā)花白斷崖衰老,徒手摘黃瓜像農(nóng)婦

金風(fēng)說
2025-11-01 15:41:57
你的生日尾數(shù)是多少,就是什么命!

你的生日尾數(shù)是多少,就是什么命!

大禹小城
2025-11-01 20:36:49
倪妮方發(fā)聲明回應(yīng)王家衛(wèi)錄音內(nèi)容,否認(rèn)有“后臺”“靠山”:嚴(yán)重侵犯名譽(yù)權(quán),已委托律師取證并追責(zé);相關(guān)錄音涉唐嫣劉詩詩等多位明星

倪妮方發(fā)聲明回應(yīng)王家衛(wèi)錄音內(nèi)容,否認(rèn)有“后臺”“靠山”:嚴(yán)重侵犯名譽(yù)權(quán),已委托律師取證并追責(zé);相關(guān)錄音涉唐嫣劉詩詩等多位明星

揚(yáng)子晚報(bào)
2025-11-01 12:06:33
林俊杰、楊丞琳發(fā)文悼念!網(wǎng)友不舍屠穎:他前段時(shí)間還曾回復(fù)我微博私信

林俊杰、楊丞琳發(fā)文悼念!網(wǎng)友不舍屠穎:他前段時(shí)間還曾回復(fù)我微博私信

極目新聞
2025-11-01 22:47:08
小米冬測惹怒全網(wǎng)!雷軍這次玩砸了

小米冬測惹怒全網(wǎng)!雷軍這次玩砸了

李東陽朋友圈
2025-10-30 14:49:07
總冠軍功臣又挨刀!二次手術(shù)+無限期休戰(zhàn),6勝0負(fù)也笑不出啊

總冠軍功臣又挨刀!二次手術(shù)+無限期休戰(zhàn),6勝0負(fù)也笑不出啊

球童無忌
2025-11-01 23:41:54
2025-11-02 09:59:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11614文章數(shù) 176319關(guān)注度
往期回顧 全部

科技要聞

10月零跑突破7萬輛,小鵬、蔚來超4萬輛

頭條要聞

牛彈琴:高市早苗上臺后 中國作出第一次強(qiáng)烈抗議

頭條要聞

牛彈琴:高市早苗上臺后 中國作出第一次強(qiáng)烈抗議

體育要聞

NBA球員,必須吃夜宵

娛樂要聞

王家衛(wèi)這波錄音,撕爛了遮羞布

財(cái)經(jīng)要聞

段永平捐了1500萬元茅臺股票!本人回應(yīng)

汽車要聞

神龍汽車推出“發(fā)動機(jī)終身質(zhì)?!闭?/h3>

態(tài)度原創(chuàng)

本地
房產(chǎn)
教育
數(shù)碼
健康

本地新聞

全網(wǎng)圍觀,到底多少人被這個(gè)野人大學(xué)生笑瘋了

房產(chǎn)要聞

實(shí)力破圈!這個(gè)豪宅交付,正在定義??谄焚|(zhì)樣本!

教育要聞

讓教育回歸生活本質(zhì):西安浐灞三小跨學(xué)科課程的七年實(shí)踐與蛻變

數(shù)碼要聞

英偉達(dá)推 Blackwell 機(jī)器人處理器 IGX Thor,AI 算力 5581 TFLOP

核磁VS肌骨超聲,誰更勝一籌?

無障礙瀏覽 進(jìn)入關(guān)懷版 国产成人综合欧美精品久久| 强行交换配乱婬bd免费观看| 亚洲精品无码久久不卡| 精品精品自在现拍国产2021| 熟女少妇一二区| 国产乱子伦精品免费女| 亚洲精品成人av观看| 国产精品一区二区黑人粗大 | 四虎影视91| 色综合色狠狠天天综合网| 国产精品久久久久久久久久久久午衣片| 女人天堂av| 色橹橹欧美在线观看视频高清| 人妻共享h系列| 精品不卡一区二区| 亚洲AV永久无码榴莲| 97欧美精品91久久久久久| 久久婷婷五月综合尤物色国产| 精品人妻码一区二区三区剧情| av.av电影天堂| av中文字幕潮喷人妻系列| 真人做人试看60分钟免费| 亚洲无码一二三四区| 囯产精品一区二区三区线| 加勒比精品久久一区二区三区| 爱爱无码视频| 少妇极品熟妇人妻200片| 狠狠色噜噜狠狠狠狠色综合久av| 亚洲国产精品无码中文LV| 国产精品无码午夜免费影院| 天堂网在线www| 欧美精品亚洲精品日韩专区| A级毛片一区二区三区 | 琪琪电影午夜理论片八戒八戒| 黑人巨屌爆操白人| 亚洲热线99精品视频| 自拍av网站大全| 精品久久久久久无码中文字幕漫画| 久久久久 国产精品| 色五月婷婷俺也去| 偷拍精品一区二区三区|