夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

27萬小時的真實數(shù)據(jù),終于驗證了機器人領域的Scaling Law?

0
分享至

去年年底 Physical Intelligence 發(fā)布機器人基礎模型 π0 時,其團隊成員將其比作“機器人領域的 GPT-1”。就像 OpenAI 在 2018 年推出第一代語言模型時開啟了一個時代,π0 預示著機器人智能也許會走上類似的路:模型越大、數(shù)據(jù)越多,能力就越強。但在那個時候,這更多還只是個愿景。機器人領域的 Scaling Law 始終沒有被明確建立。

2025 年 11 月 4 日,由前 Google DeepMind 高級研究員 Pete Florence 創(chuàng)立的初創(chuàng)公司 Generalist AI 為這一問題給出了迄今為止最有力的答案。該公司發(fā)布的 GEN-0 模型不僅展示了機器人基礎模型的擴展能力,更重要的是,首次在機器人領域觀察到了一個此前只在語言模型訓練中出現(xiàn)的關鍵現(xiàn)象:模型僵化(ossification)。這一發(fā)現(xiàn)表明,機器人領域的智能確實存在可量化的擴展定律,但其運作方式比我們想象的更加復雜。

物理智能的閾值之謎

在計算機視覺和自然語言處理領域,scaling laws 已經(jīng)成為一個被廣泛接受的現(xiàn)象。但在機器人領域,這樣的規(guī)律一直未能建立,主要原因是缺乏足夠規(guī)模的高質(zhì)量數(shù)據(jù),以及足夠大的模型來驗證這種關系。

盡管 MIT 和慕尼黑工業(yè)大學的研究人員在 2024 年通過對 327 篇論文的元分析發(fā)現(xiàn)機器人基礎模型確實存在 scaling laws,但這些研究都是基于相對較小規(guī)模的模型和數(shù)據(jù)集。如果我們將模型規(guī)模推向數(shù)十億參數(shù),將訓練數(shù)據(jù)推向數(shù)十萬小時時,會發(fā)生什么?


圖丨相關論文(來源:arXiv)

GEN-0 的實驗給出了一個意外的答案。研究團隊發(fā)現(xiàn),當將模型從 1B(十億)參數(shù)擴展到 7B 參數(shù)的過程中,存在一個明顯的相變點。1B 參數(shù)的模型在訓練過程中很快就表現(xiàn)出僵化現(xiàn)象,即模型權重變得無法吸收新的信息,訓練損失不再下降。這種現(xiàn)象此前只在語言模型的特定訓練場景中被觀察到,但那些模型的參數(shù)規(guī)模要小得多,大約在 10M(百萬)量級。


(來源:Generalist AI)

而當模型規(guī)模達到 6B 參數(shù)時,情況開始改變。這些模型能夠有效地從預訓練中受益,展現(xiàn)出強大的多任務能力。到了 7B 參數(shù)及以上,模型不僅能夠內(nèi)化大規(guī)模的機器人預訓練數(shù)據(jù),還能夠僅通過幾千步的后訓練就遷移到下游任務。Generalist AI 已經(jīng)將 GEN-0 擴展到 10B+ 參數(shù)規(guī)模,觀察到隨著規(guī)模增加,模型對新任務的適應越來越快,需要的后訓練越來越少。

研究團隊認為這一發(fā)現(xiàn)與人工智能史上一個著名的 Moravec 悖論(Moravec's Paradox)相呼應。1988 年,機器人學家 Hans Moravec 指出,對人類來說輕而易舉的事情,比如感知和靈巧操作,對機器來說需要巨大的計算復雜度,而抽象推理這種人類覺得困難的事情,對機器反而相對簡單。GEN-0 的實驗結果為這個悖論提供了定量證據(jù):物理世界的常識(physical commonsense)確實有更高的“激活閾值”,需要更大規(guī)模的計算才能涌現(xiàn)。


(來源:Generalist AI)

這種可預測的擴展關系對工程實踐有重要意義。研究團隊可以用冪律公式預測:給定特定規(guī)模的預訓練數(shù)據(jù),在某個下游任務上投入固定的微調(diào)預算,最終能達到什么樣的性能水平。以服裝處理任務為例,他們可以估算需要多少預訓練數(shù)據(jù)才能將動作預測誤差降到特定閾值。這種預測能力讓資源分配不再是賭博式的探索,而是有明確回報預期的投資。

Harmonic Reasoning:協(xié)調(diào)思考與行動

如果說擴展規(guī)律解決了能不能學的問題,那么 GEN-0 引入的 Harmonic Reasoning 則回答了“怎么學”。這是一個針對物理世界特性設計的訓練機制,核心在于協(xié)調(diào)“思考”與“行動”之間的時間關系。

在語言模型中,讓系統(tǒng)“多想一會兒再回答”相對容易,只需在生成回復前多運行幾步推理。但物理世界不會暫停等待。當機器人面對需要精細操作的任務時,它既要實時響應環(huán)境變化,又要進行更高層次的規(guī)劃。

傳統(tǒng)的 System 1-System 2 架構試圖將這兩種過程分離,用快速反應系統(tǒng)處理即時響應,用慢速規(guī)劃系統(tǒng)處理長期決策。但這種分離帶來了接口設計的復雜性,也限制了系統(tǒng)的靈活性。

Harmonic Reasoning 采用了不同的思路。它將感知、思考和行動都視為在連續(xù)時間軸上異步發(fā)生的 token 流,通過訓練讓模型學會在這些流之間建立協(xié)調(diào)的相互作用。

模型在處理視覺輸入的同時,可以生成“內(nèi)部推理”的 token,這些 token 不會直接轉化為動作,而是影響后續(xù)的決策;同時,模型持續(xù)輸出動作 token 來控制機器人的關節(jié)。這種設計讓模型可以在執(zhí)行當前動作的同時思考未來步驟。

從展示的案例來看,這種能力在長程任務中表現(xiàn)明顯。在組裝相機套件的演示中,機器人需要完成一系列精細操作:將清潔布放入盒子、折疊紙板托盤、從塑料袋中取出相機、放入盒中、合上盒蓋并插入細小的固定卡扣,最后丟棄塑料袋。整個過程持續(xù)超過一分半鐘,模型從未依賴顯式的子任務分解,而是在一個統(tǒng)一的推理流中完成全部步驟。

這種訓練方式不依賴推理時的額外引導(inference-time guidance)。許多現(xiàn)有系統(tǒng)需要在部署時引入啟發(fā)式規(guī)則或外部規(guī)劃器來輔助決策,但 GEN-0 的所有能力都內(nèi)化在預訓練模型中。團隊認為,這種端到端的學習路徑是實現(xiàn)真正通用性的前提。就像語言模型不需要為每個應用場景單獨設計提示一樣,機器人模型也應該通過大規(guī)模預訓練自然涌現(xiàn)出適應性。

二十七萬小時的真實數(shù)據(jù)

長期以來,數(shù)據(jù)稀缺一直是機器人學習的主要瓶頸。相比于語言模型可以從互聯(lián)網(wǎng)上獲取數(shù)萬億 tokens 的文本數(shù)據(jù),機器人數(shù)據(jù)的收集需要真實的硬件在物理世界中執(zhí)行操作,成本高昂且難以擴展。

Generalist AI 在這個問題上的答案是:建立工業(yè)級的數(shù)據(jù)收集基礎設施。GEN-0 在一個前所未有的數(shù)據(jù)集上進行預訓練:270,000 小時的真實世界操作軌跡,收集自全球數(shù)千個家庭、倉庫和工作場所。這個數(shù)據(jù)規(guī)模比目前公開的最大機器人數(shù)據(jù)集大了好幾個數(shù)量級。


(來源:Generalist AI)

二十七萬小時的數(shù)據(jù)意味著什么?如果一個機器人一周工作七天、每天二十四小時不間斷運行,也需要超過三年才能積累這么多經(jīng)驗。Generalist AI 通過在全球范圍內(nèi)部署數(shù)千個數(shù)據(jù)收集設備和機器人,實現(xiàn)了并行化的數(shù)據(jù)獲取。

團隊甚至為此鋪設了專用網(wǎng)絡線路,以支持從各個站點到云端的高帶寬數(shù)據(jù)上傳。在訓練端,他們動用了數(shù)萬個核心進行持續(xù)的多模態(tài)數(shù)據(jù)處理,壓縮了數(shù)十 PB 的原始數(shù)據(jù),使得訓練系統(tǒng)每天能夠消化相當于 6.85 年的真實世界操作經(jīng)驗。

但規(guī)模只是一方面,質(zhì)量與多樣性同樣關鍵。團隊進行了大規(guī)模的消融實驗,對比了來自不同數(shù)據(jù)源和收集策略的預訓練數(shù)據(jù)集對模型性能的影響。他們將數(shù)據(jù)分為三類:Class 1 是針對特定任務的演示數(shù)據(jù),Class 3 是“什么都做”的開放式數(shù)據(jù),Class 2 介于兩者之間。實驗結果顯示,不同數(shù)據(jù)混合會導致模型呈現(xiàn)出不同的特性。

一些數(shù)據(jù)配置訓練出的模型在預測誤差和反向 KL 散度上都較低,這類模型更適合后續(xù)的監(jiān)督微調(diào)。而另一些數(shù)據(jù)配置雖然預測誤差較高,但反向 KL 散度低,表明模型的輸出分布具有更高的多模態(tài)性,這對強化學習后訓練更有利。

這些發(fā)現(xiàn)對數(shù)據(jù)收集策略有直接指導意義。Generalist AI 與多家“數(shù)據(jù)鑄造廠”(data foundry)合作,在不同環(huán)境中采集數(shù)據(jù)。通過持續(xù)的 A/B 測試,他們可以評估各個合作伙伴的數(shù)據(jù)質(zhì)量,并據(jù)此調(diào)整數(shù)據(jù)采購比例。

在博文附帶的可視化工具中,研究人員展示了一個內(nèi)部開發(fā)的數(shù)據(jù)探索系統(tǒng)。用戶可以輸入文本描述,系統(tǒng)會在預訓練數(shù)據(jù)集的語義嵌入空間中定位到相關區(qū)域,并隨機采樣展示相關視頻片段。這個工具不僅用于數(shù)據(jù)質(zhì)量檢查,也幫助團隊理解“操作的宇宙”究竟包含哪些任務類型。從削土豆到穿針引線,從在面包店打包食品到在洗衣房整理衣物,GEN-0 的訓練數(shù)據(jù)試圖覆蓋人類日常操作的全部光譜。

“讓通用機器人成為現(xiàn)實”

Generalist AI 由三位來自 Google Deepmind 和波士頓動力的資深研究員成立。Pete Florence、Andy Zeng 和 Andrew Barry 雖然學術背景各異,但研究軌跡在過去幾年中逐漸交匯,最終聚焦于讓機器人學習像大語言模型那樣規(guī)?;?。

Pete Florence 在麻省理工學院攻讀博士期間專注于視覺引導的操作,提出了 Dense Object Nets 等開創(chuàng)性工作,強調(diào)從原始感知到動作的端到端學習。加入 Google 后,他迅速轉向大模型與機器人的融合,參與了 RT-2、PaLM-E、Code as Policies 等多個項目,探索用統(tǒng)一的大模型框架處理感知、理解和控制。


圖丨 Pete Florence(來源:Pete Florence)

Andy Zeng 則從機器人抓取和物體理解起步。他的代表作 TossingBot(一個能自主學習投擲不同物體的系統(tǒng))曾獲得了 RSS 2019 最佳系統(tǒng)論文獎提名。在 Google 期間,Andy 與 Pete 密切合作,聯(lián)合發(fā)表了超過十七篇論文,研究覆蓋從低層操作控制到高層語言推理的全鏈路問題。

Andrew Barry 帶來了硬件與系統(tǒng)集成的經(jīng)驗。他在 MIT 期間專注于高速自主無人機導航,畢業(yè)后在波士頓動力工作了五年,參與 Spot 機器狗的機械臂項目研發(fā)。

三人見證了具身智能研究從分散突破走向系統(tǒng)化的過程,自大模型被引入機器人領域后,他們愈發(fā)認為創(chuàng)造通用機器人的時機在逐漸成熟,而真正需要的是重新關注數(shù)據(jù)、模型和硬件的交匯點。單靠從互聯(lián)網(wǎng)上下載任何數(shù)據(jù),都無法創(chuàng)造出能夠與物理世界交互的快速、流暢、精確、反應靈敏的智能層。出于這一共識,他們決定成立 Generalist AI。而他們的目標就是“讓通用機器人成為現(xiàn)實?!?/p>

正如團隊在博客中指出的,GEN-0 或許標志著一個新時代的開始:具身基礎模型的能力可以通過物理交互數(shù)據(jù)可預測地擴展。

不過,這項工作也留下了許多待解答的問題。Generalist AI 尚未公開 GEN-0 模型的架構細節(jié)、訓練算法或代碼。Harmonic Reasoning 的具體實現(xiàn)方式也仍然未知。數(shù)據(jù)收集的具體方法、質(zhì)量控制流程、標注策略等關鍵細節(jié)也未披露。此外,雖然團隊展示了一些表現(xiàn)出色的演示視頻,但沒有提供系統(tǒng)的成功率統(tǒng)計或與其他方法的詳細對比,這使得很難準確評估模型的實際性能水平。

但無論如何,GEN-0 證明,通過持續(xù)擴大模型規(guī)模和高質(zhì)量物理交互數(shù)據(jù),機器人智能可以遵循與語言模型類似但又獨特的發(fā)展軌跡。Moravec 悖論提醒我們,物理智能的激活閾值更高,但 GEN-0 證明了這個閾值是可以跨越的。

參考資料:

1.https://generalistai.com/blog/nov-04-2025-GEN-0

2.https://x.com/GeneralistAI/status/1985742083806937218

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
三位勇士以一身傷痕,為14億人辟出法治生路

三位勇士以一身傷痕,為14億人辟出法治生路

深度報
2025-11-07 22:56:16
拒絕說明取款用途銀行報警,最終行長道歉,維權還得是律師

拒絕說明取款用途銀行報警,最終行長道歉,維權還得是律師

Mr王的飯后茶
2025-11-07 11:02:44
開撕!王傳君老板發(fā)聲反擊,言辭犀利,真是一點臉面都不給對方留

開撕!王傳君老板發(fā)聲反擊,言辭犀利,真是一點臉面都不給對方留

喵喵娛樂團
2025-11-07 16:31:26
副院長祖雄兵被停職!他口中所謂的“純潔婚外戀”,是自欺欺人

副院長祖雄兵被停職!他口中所謂的“純潔婚外戀”,是自欺欺人

鋭娛之樂
2025-11-07 12:47:00
隊記質(zhì)疑開拓者:未給楊瀚森創(chuàng)造成功環(huán)境 考沃德更適配目前打法

隊記質(zhì)疑開拓者:未給楊瀚森創(chuàng)造成功環(huán)境 考沃德更適配目前打法

羅說NBA
2025-11-08 07:45:09
買房驚遇“非正常死亡”事件:房子我不要了,雙倍賠錢!上海法院判了

買房驚遇“非正常死亡”事件:房子我不要了,雙倍賠錢!上海法院判了

環(huán)球網(wǎng)資訊
2025-11-08 08:21:02
開拓者2K評分更新:阿夫迪亞84,克林根漲至80,楊瀚森仍為70

開拓者2K評分更新:阿夫迪亞84,克林根漲至80,楊瀚森仍為70

懂球帝
2025-11-08 09:22:13
代入鄭智化視角去上了個班,我終于知道:八千萬殘障人士去哪了?

代入鄭智化視角去上了個班,我終于知道:八千萬殘障人士去哪了?

新住家居
2025-11-07 19:05:12
中國健走團攻陷漢江,韓國人炸毛了!

中國健走團攻陷漢江,韓國人炸毛了!

天真無牙
2025-11-07 12:52:04
40歲女醫(yī)生曾琦的日常工作被披露!一天“精準卡點”的戰(zhàn)斗模式…

40歲女醫(yī)生曾琦的日常工作被披露!一天“精準卡點”的戰(zhàn)斗模式…

火山詩話
2025-11-07 11:46:47
突然崩盤!火箭0-12攻勢被反超:杜蘭特9中3低迷,謝潑德小爆發(fā)

突然崩盤!火箭0-12攻勢被反超:杜蘭特9中3低迷,謝潑德小爆發(fā)

體壇小李
2025-11-08 09:50:16
馬姆達尼們會毀掉紐約甚至美國么?是的

馬姆達尼們會毀掉紐約甚至美國么?是的

東亞財評V
2025-11-07 21:23:14
“DNA之父”詹姆斯·沃森逝世,享年97歲, 因發(fā)現(xiàn)DNA雙螺旋結構獲諾貝爾獎,多次到訪中國,稱贊中國人科研能力很突出

“DNA之父”詹姆斯·沃森逝世,享年97歲, 因發(fā)現(xiàn)DNA雙螺旋結構獲諾貝爾獎,多次到訪中國,稱贊中國人科研能力很突出

極目新聞
2025-11-08 10:46:33
郭美美,一個“自信而努力”的前科人員

郭美美,一個“自信而努力”的前科人員

關爾東
2025-11-07 16:28:15
中方拒買巴西高價大豆,巴西 3 天就報復,結果自己先慌了?

中方拒買巴西高價大豆,巴西 3 天就報復,結果自己先慌了?

阿器談史
2025-11-08 05:34:40
朝鮮網(wǎng)吧開業(yè)人滿為患,都能玩什么游戲?打使命召喚?

朝鮮網(wǎng)吧開業(yè)人滿為患,都能玩什么游戲?打使命召喚?

軍武次位面
2025-11-07 14:52:12
突然爆火!深圳街頭大排長龍!緊急提醒

突然爆火!深圳街頭大排長龍!緊急提醒

深圳晚報
2025-11-07 22:04:59
后天,廣州部分地鐵站暫停對外服務!繞行指引→

后天,廣州部分地鐵站暫停對外服務!繞行指引→

魯中晨報
2025-11-07 21:39:06
“胸部造型”機器人惹爭議,小鵬天塌了!

“胸部造型”機器人惹爭議,小鵬天塌了!

廣告創(chuàng)意
2025-11-07 18:07:23
正式?jīng)Q定!交易克萊!再見了,獨行俠

正式?jīng)Q定!交易克萊!再見了,獨行俠

籃球教學論壇
2025-11-08 09:58:51
2025-11-08 11:24:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15837文章數(shù) 514273關注度
往期回顧 全部

科技要聞

美股“AI八巨頭”單周市值損失8000億美元

頭條要聞

媒體:福建艦入列 中國航母實力世界第二位置毫無爭議

頭條要聞

媒體:福建艦入列 中國航母實力世界第二位置毫無爭議

體育要聞

邵佳一準備好了,但中國足球準備好了嗎?

娛樂要聞

梁婷為辛芷蕾發(fā)聲:沒什么可質(zhì)疑的

財經(jīng)要聞

小馬、文遠回港上市 但自動駕駛還沒贏家

汽車要聞

美式豪華就是舒適省心 林肯航海家場地試駕

態(tài)度原創(chuàng)

藝術
時尚
健康
公開課
軍事航空

藝術要聞

390米!山東日照“第一高樓”,塔吊怎么拆了?!

“這條圍巾”才是今年的頂流單品,時髦的女人都有它

超聲探頭會加重受傷情況嗎?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

中國第三艘航空母艦福建艦入列

無障礙瀏覽 進入關懷版 午夜福利片1000无码免费| 久久久精品人妻一区二区三区色秀 | 日韩成人无码影院| 男女作爱在线播放免费网站| 99re热精品视频| 日本一区二区在免费观看喷水| 天天做天天爱天天做天天吃中| 人97人妻人人澡人人爽| 国产一区二区不卡在线视频| 亚洲性爱在线观看| 波多野结衣在线高清视频| 色偷偷亚洲女人的天堂| 亚洲亚洲人成网站77777| 精品香蕉久久久午夜福利| 亚洲熟妇在线| 色AV一区二区三区| 欧美丰满熟妇xxxx| 男人的天堂免费a级毛片无码| 亚洲视频色色色| 国产做受XXXXX| 电影天堂网av二区| 摸丰满大乳奶水www免费| 北条麻妃av高清无码| 国产97公开成人免费视频| 操逼.com| 野花香社区在线观看| 欧美制服丝袜人妻另类 | 精品国产一区二区三区香| 亚洲精品在看在线观看高清 | 久久国产精品一区二区| 熟女有码视频专区| 色吧网站在线播放| 九色poRny国模私拍Av| 国产欧美色一区二区三区| 久久99精品久久久久久噜噜| 国产精品午夜剧场免费观看| 欧美性爱视频三级大片| 日韩精品99| 国产91小视频在线观看| 美国俄罗斯毛片| 97国产超碰一区二区三区|