夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepMind打造多游戲通用智能體SIMA 2,讓AI在虛擬世界中自我訓(xùn)練

0
分享至

《山羊模擬器 3》(Goat Simulator 3)這款以混亂、荒誕著稱的游戲,其物理引擎的不可預(yù)測性曾讓無數(shù)玩家啼笑皆非。如今,谷歌成功讓這款游戲成為了他們最新 AI Agent 泛化能力的試驗場。

11 月 13 日,DeepMind 正式發(fā)布 SIMA 2(Scalable Instructable Multiworld Agent,可擴展的可指令多世界智能體),這個集成了 Gemini 大語言模型的新一代智能體,不僅能在《無人深空》的浩瀚星際中導(dǎo)航,也能在《山羊模擬器 3》的混亂世界里完成任務(wù)。這種跨越虛擬環(huán)境的能力,被 DeepMind 稱為“邁向通用人工智能的重要一步”。

2024 年 3 月,DeepMind 首次發(fā)布了 SIMA 的初代版本。當(dāng)時的 SIMA 1 已經(jīng)算是一個突破——它能夠跨越《無人深空》《山羊模擬器 3》等八款商業(yè)游戲執(zhí)行基本指令,僅通過觀察屏幕像素和使用虛擬鍵鼠操作,無需訪問游戲的底層代碼。但其 31% 的復(fù)雜任務(wù)完成率暴露了根本性的瓶頸:這個系統(tǒng)更像一個執(zhí)行器而非思考者,面對“找到營火”這樣簡單的目標(biāo)時,它只能機械地嘗試各種操作,缺乏真正的理解和規(guī)劃能力。

SIMA 2 的核心改變是整合了 Gemini 2.5 flash-lite 模型作為推理引擎。Gemini 的語言理解和推理能力與 SIMA 的 embodied skills(具身技能)深度融合,使得 Agent 能夠理解高層目標(biāo)、制定多步計劃,并在執(zhí)行過程中與用戶對話解釋自己的思路。在新的基準(zhǔn)測試中,SIMA 2 在訓(xùn)練過的游戲環(huán)境中達到了 65% 的成功率,幾乎是前代的兩倍,與人類玩家 75% 的基準(zhǔn)線已經(jīng)相當(dāng)接近。

這種性能提升的背后是架構(gòu)層面的重新設(shè)計。SIMA 2 的訓(xùn)練數(shù)據(jù)不再完全依賴人類游戲演示錄像,而是混合了人類標(biāo)注和 Gemini 生成的任務(wù)描述。當(dāng)智能體觀察到游戲畫面中的某個場景時,Gemini 模型會同時生成對該場景的語義理解和可能的行動方案。這種訓(xùn)練方式的一個直接結(jié)果是,SIMA 2 現(xiàn)在能夠用自然語言描述它的意圖和推理過程。在《無人深空》的演示中,當(dāng)被要求“前往看起來像成熟番茄的房子”時,智能體會明確說明:“成熟的番茄是紅色的,所以我應(yīng)該去紅色的房子”——這種顯式推理正是 Gemini 帶來的質(zhì)變。

多模態(tài)交互能力也有提升。SIMA 2 可以理解文字、語音、手繪草圖,甚至 emoji。當(dāng)用戶發(fā)送斧頭和樹木的 emoji 時,智能體能理解這意味著“砍樹”。這種能力來自 Gemini 的多模態(tài)架構(gòu),但關(guān)鍵是 DeepMind 找到了將抽象符號與游戲動作連接的方法,系統(tǒng)理解斧頭是工具、樹木是可交互對象、兩者組合意味著特定行動序列。

SIMA 2 最重要的創(chuàng)新之一是其自我改進機制。與 SIMA 1 完全依賴人類游戲數(shù)據(jù)不同,SIMA 2 在獲得初始的人類演示基線后,能夠轉(zhuǎn)向自主學(xué)習(xí)。當(dāng)團隊將智能體放入新環(huán)境時,系統(tǒng)會調(diào)用另一個 Gemini 模型來生成新任務(wù),并使用單獨的獎勵模型對智能體的嘗試進行評分。

通過這些自生成的經(jīng)驗作為訓(xùn)練數(shù)據(jù),智能體能從自己的錯誤中學(xué)習(xí),逐步提升性能,本質(zhì)上是在 AI 反饋而非人類反饋的引導(dǎo)下,像人類一樣通過試錯來教會自己新行為。這種自我改進循環(huán)在與 Genie 3(DeepMind 的世界生成模型)結(jié)合時能發(fā)揮更大的作用:在 Genie 3 實時生成的全新 3D 環(huán)境中,SIMA 2 展現(xiàn)出了前所未有的適應(yīng)能力,能夠在從未見過的世界中理解用戶指令并采取有意義的行動。

在從未訓(xùn)練過的 MineDojo(Minecraft 的研究實現(xiàn)版本)和 ASKA 游戲中,SIMA 2 的成功率相較第一代分別提升了 13% 和 12%。雖然仍然只有不到 15% 的水平,但考慮到智能體此前從未見過這些游戲的任何畫面或機制,這個表現(xiàn)已經(jīng)相對可觀。


(來源:Google)

更重要的是,它展示了概念遷移的能力——在《無人深空》中學(xué)到的“采集資源”概念可以遷移到 MineDojo 中的“挖礦”,在《英靈神殿》中學(xué)到的“使用工具”可以應(yīng)用到 ASKA 的“裝備武器”。這種跨環(huán)境的知識遷移,對于提升 AI 的真正智能來說至關(guān)重要。

DeepMind 在游戲 AI 上有長期積累,從 AlphaGo 到 AlphaStar,每一步都在推進 AI 的邊界。不過,讓單一系統(tǒng)掌握多種游戲一直是個難題。紐約大學(xué)的 AI 研究員 Julian Togelius 提到,之前的嘗試效果不太理想,因為僅通過觀看屏幕來實時控制多個游戲本身就很困難。他特別指出 DeepMind 之前的 GATO 系統(tǒng),當(dāng)時宣傳力度很大,但實際上未能在足夠多的虛擬環(huán)境中轉(zhuǎn)移技能。

現(xiàn)在的問題是,SIMA 2 能否避免重蹈覆轍?目前來看,它仍有幾個比較明顯的限制。它在需要多步驟和長時間的復(fù)雜任務(wù)上仍有困難。為了提高響應(yīng)速度,團隊削減了長期記憶,它只記得最近的交互。在使用鼠標(biāo)鍵盤方面,它還是遠不如人類。阿爾伯塔大學(xué)的 Matthew Guzdial 向《麻省理工科技評論》表示:大多數(shù)游戲的鍵鼠控制很相似,學(xué)會一個就學(xué)會了全部,“如果給它一個輸入方式怪異的游戲,我認為它表現(xiàn)不會好?!彼€質(zhì)疑這些技能能否遷移到機器人上——游戲視覺是為人類設(shè)計的、易于解析,真實世界的攝像頭輸入要復(fù)雜得多。

這觸及了具身智能(Embodied AI)領(lǐng)域的核心難題:模擬到現(xiàn)實的鴻溝(sim-to-real gap)。虛擬環(huán)境提供了安全、可控、低成本的訓(xùn)練場所,但它與現(xiàn)實世界有本質(zhì)差異。Togelius 對此持更開放的看法。他認為真實世界既更難也更容易。更難是因為物理交互的復(fù)雜性——你不能按個鍵就開門。但同時,真實世界的機器人清楚知道自己身體的能力邊界,而游戲里每個虛擬世界的規(guī)則都不同。

DeepMind 的研究工程師 Frederic Besse 在新聞發(fā)布會上給出了他們的思路:將機器人系統(tǒng)分為兩層:上層是 SIMA 2 這樣的“認知層”,負責(zé)理解任務(wù)、推理和規(guī)劃;下層是專門的運動控制系統(tǒng),負責(zé)關(guān)節(jié)運動、力控制等底層執(zhí)行。這種分層架構(gòu)在工業(yè)界已有先例,如 NVIDIA 的 Isaac 機器人平臺就采用類似設(shè)計。理論上,SIMA 2 學(xué)到的“找到紅色物體”“使用工具”“導(dǎo)航到目標(biāo)”等高層技能是跨越虛擬和現(xiàn)實的,而關(guān)鍵是如何將這些抽象能力映射到物理動作上。對此,我們尚保持謹慎的樂觀。

但無論如何,SIMA 2 所展示的研究方向還是非常具有價值的:用多樣化的虛擬環(huán)境訓(xùn)練、用大語言模型增強推理、用自我改進減少對人類數(shù)據(jù)的依賴。這個方向的可行性和上限值得期待,但也還需要更多研究來驗證。它是具身 AI 領(lǐng)域的一個重要節(jié)點,但不是終點。虛擬世界與真實世界之間的鴻溝,在可預(yù)見的未來仍然存在。

目前,SIMA 2 僅作為“有限研究預(yù)覽”發(fā)布,只向小范圍的學(xué)術(shù)機構(gòu)和游戲開發(fā)者開放訪問。



參考資料:

1.https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

2.https://www.technologyreview.com/2025/11/13/1127921/google-deepmind-is-using-gemini-to-train-agents-inside-goat-simulator-3/

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
校運動會上高中女生被弓箭射中面部,校方:已妥善救治,情況穩(wěn)定

校運動會上高中女生被弓箭射中面部,校方:已妥善救治,情況穩(wěn)定

大風(fēng)新聞
2025-11-14 19:22:32
藍色起源打破SpaceX壟斷,火箭成功回收,發(fā)射NASA探測器

藍色起源打破SpaceX壟斷,火箭成功回收,發(fā)射NASA探測器

DeepTech深科技
2025-11-14 13:10:20
現(xiàn)在高價賣掉房子的人,都將后悔?中央定調(diào),2026年房產(chǎn)開啟洗盤

現(xiàn)在高價賣掉房子的人,都將后悔?中央定調(diào),2026年房產(chǎn)開啟洗盤

小談食刻美食
2025-11-14 16:22:22
校園餐蟲蝦仁告破,綠捷吊銷雙證、8人被捕,市區(qū)分管領(lǐng)導(dǎo)獲處分

校園餐蟲蝦仁告破,綠捷吊銷雙證、8人被捕,市區(qū)分管領(lǐng)導(dǎo)獲處分

薇微笑語
2025-11-14 19:31:21
商務(wù)部新聞發(fā)言人就荷經(jīng)濟大臣卡雷曼斯就安世半導(dǎo)體問題表態(tài)答記者問

商務(wù)部新聞發(fā)言人就荷經(jīng)濟大臣卡雷曼斯就安世半導(dǎo)體問題表態(tài)答記者問

界面新聞
2025-11-14 21:42:06
副省長與乒乓球前世界冠軍貪腐細節(jié)曝光

副省長與乒乓球前世界冠軍貪腐細節(jié)曝光

中國新聞周刊
2025-11-14 18:45:03
一條狗引發(fā)的命案后續(xù):案發(fā)當(dāng)晚視頻曝光,律師透露一審重大進展

一條狗引發(fā)的命案后續(xù):案發(fā)當(dāng)晚視頻曝光,律師透露一審重大進展

吭哧有力
2025-11-13 15:13:22
上海通報“綠捷食安事件”:已查明違法犯罪事實,公司8名責(zé)任人被依法執(zhí)行逮捕

上海通報“綠捷食安事件”:已查明違法犯罪事實,公司8名責(zé)任人被依法執(zhí)行逮捕

澎湃新聞
2025-11-14 14:08:43
他突然被傳死亡了?

他突然被傳死亡了?

奮斗在韓國
2025-11-14 14:12:10
今年就業(yè)形勢總體穩(wěn)定 全國城鎮(zhèn)調(diào)查失業(yè)率下降

今年就業(yè)形勢總體穩(wěn)定 全國城鎮(zhèn)調(diào)查失業(yè)率下降

看看新聞Knews
2025-11-14 14:08:03
11月14日俄烏最新:F-16擊落蘇-30?

11月14日俄烏最新:F-16擊落蘇-30?

西樓飲月
2025-11-14 18:05:03
這誰受得了,全球最大航母004已成70%!外媒:挑戰(zhàn)美國主導(dǎo)地位!

這誰受得了,全球最大航母004已成70%!外媒:挑戰(zhàn)美國主導(dǎo)地位!

青青子衿
2025-11-15 00:09:56
日本通告全球,中國不認栽,就驅(qū)逐外交官,話音剛落空軍王炸來了

日本通告全球,中國不認栽,就驅(qū)逐外交官,話音剛落空軍王炸來了

蘭妮搞笑分享
2025-11-14 15:45:42
從想再生一胎到法庭對峙,鐘嘉欣的婚姻碎得太突然

從想再生一胎到法庭對峙,鐘嘉欣的婚姻碎得太突然

述家娛記
2025-11-14 20:47:46
利潤全球第一!全年暴賺8000億,反超沙特阿美,相當(dāng)于6個阿里

利潤全球第一!全年暴賺8000億,反超沙特阿美,相當(dāng)于6個阿里

簡易科技
2025-11-14 12:54:01
真假?大批媒體曝吳亦凡獄中絕食去世?家人也失聯(lián),知情者發(fā)聲

真假?大批媒體曝吳亦凡獄中絕食去世?家人也失聯(lián),知情者發(fā)聲

180視角
2025-11-12 12:05:43
2-0完勝!日本又殺瘋了,連贏2大南美+非洲強隊,進世界杯8強有戲

2-0完勝!日本又殺瘋了,連贏2大南美+非洲強隊,進世界杯8強有戲

侃球熊弟
2025-11-14 19:51:35
駕駛證不再是12分?車輛將不再年檢?交警:有車沒車都需要了解下

駕駛證不再是12分?車輛將不再年檢?交警:有車沒車都需要了解下

李博世財經(jīng)
2025-11-14 14:23:08
美媒公開中國轟炸計劃:日本若敢走錯半步,將被萬枚導(dǎo)彈轟炸成渣

美媒公開中國轟炸計劃:日本若敢走錯半步,將被萬枚導(dǎo)彈轟炸成渣

不似少年游
2025-11-14 07:06:54
林高遠/劉詩雯4-2逆轉(zhuǎn)戰(zhàn)勝陳垣宇/蒯曼,奪得全運會混雙金牌

林高遠/劉詩雯4-2逆轉(zhuǎn)戰(zhàn)勝陳垣宇/蒯曼,奪得全運會混雙金牌

懂球帝
2025-11-14 23:41:05
2025-11-15 02:32:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15860文章數(shù) 514299關(guān)注度
往期回顧 全部

科技要聞

京東“失去的五年”后,找到新增長了嗎?

頭條要聞

懷疑19.9元"原切牛肉卷"是合成肉消費者送檢 多方回應(yīng)

頭條要聞

懷疑19.9元"原切牛肉卷"是合成肉消費者送檢 多方回應(yīng)

體育要聞

7-0狂勝!15萬人口小島離世界杯只差1分

娛樂要聞

王家衛(wèi)讓古二替秦雯寫劇情主線?

財經(jīng)要聞

財政部:加強逆周期和跨周期調(diào)節(jié)

汽車要聞

小鵬X9超級增程動態(tài)評測全網(wǎng)首發(fā) 高速實測車內(nèi)65分貝

態(tài)度原創(chuàng)

手機
房產(chǎn)
時尚
教育
健康

手機要聞

華為Mate80 Pro Max突然曝光:定制20GB大內(nèi)存,雙長焦也來了!

房產(chǎn)要聞

共話產(chǎn)業(yè)變革下的投資新思維與新機遇|藍灣財富論壇精華

“羽絨服+半身裙”,混搭風(fēng)太好看了!保暖又氣質(zhì)!

教育要聞

獨家!小初高貫通部正式成立!朝陽家長的福氣還在后頭

金振口服液助力科學(xué)應(yīng)對呼吸道疾病

無障礙瀏覽 進入關(guān)懷版 日本中文字幕亚洲乱码| 久热国产区二三四| av无码免费一区二区三区 | 女人天堂av| 欧美激情性爱精品| 亚洲AV无码片在线播放| 国产熟女一区| 偷自拍亚洲视频在线观看| 浪潮av色综合久久天堂| 国产熟女高潮流白浆视频| av免费在线无码| 国产中文成人精品久久久| 青草影院内射中出高潮| 高潮19AV| 国产午夜片无码区在线播放| GOGO全球啪啪大胆无码二宫光| 久久久久久久蜜桃| 任你躁欧美一级在线精品免费| 爆乳熟妇一区二区三区蜜臀Av| 全部毛片免费观看| 亚洲大尺度无码无码专区| 亚洲少妇视频一区二区| 精品偷拍被偷拍在线观看| 日本边添边摸边做边爱喷水| 一本色道久久HEZYO无码,久久 | 日本久久久久久久久久加勒比 | 夜夜操夜夜人| 国产激情av| 99久久久无码国产精品果冻| 超踫人人操人人操| 欧美一区二区三区精品免费| 98亚洲无码在线观看| 天天摸天天做天天爽2019| 青春草视频在线播放| 国产国产成人精品久久蜜| 熟女一区乱伦| 欧美第一次开笣破瓜| 女班长裸体扒开两腿让我桶| 亚洲av综合avav中文| 国产精品尤物在线观看| 99久久免费精品国产72精品九九 |