夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

單張4090跑到30fps,范浩強團隊讓VLA實時跑起來了

0
分享至



VLA(Visual-Language-Action)大模型到底能跑多快?在這篇 RT-VLA(Real-time VLA)論文中,來自 Dexmal 原力靈機(由范浩強等人聯(lián)合創(chuàng)立的具身智能公司)的研究者公布了一個反直覺的發(fā)現(xiàn):它可以非???!

具體而言,對于常用的 Pi0 級別的模型(30 億參數(shù)),在單張消費級顯卡 RTX 4090 上最快可以跑到 30fps。這和大家對于 VLA 模型動輒要幾十甚至上百毫秒的刻板印象形成鮮明對比。

為實現(xiàn)這點,研究者深入分析 Pi0 的模型結(jié)構(gòu),通過一系列優(yōu)化把用時從開始的 100+ ms 進行數(shù)倍縮減(針對雙視角,甚至已經(jīng)達到 27ms),顯著強于 openpi 里采用的基于 jax 的自動優(yōu)化的結(jié)果。

此外,研究者基于現(xiàn)有結(jié)果探討了未來的“實時”運行的 VLA 結(jié)構(gòu),設(shè)計出一個有潛力最高實現(xiàn) 480Hz 閉環(huán)控制的算法框架。目前,優(yōu)化后的代碼已在 GitHub 開源,全部實現(xiàn)均打包為一個只依賴于 torch 和 triton 的單一文件,大家可在自己的項目里 “開箱即用”。這是Dexmal 原力靈機繼開源一站式 VLA 工具箱 Dexbotic之后的又一開源代碼工作。



  • 論文名稱:Running VLAs at Real-time Speed
  • 論文鏈接:https://arxiv.org/abs/2510.26742
  • GitHub:https://github.com/Dexmal/realtime-vla

解決什么痛點?

現(xiàn)在機器人 VLA 大模型動輒幾十億參數(shù),雖然有不錯的泛化能力,但是延遲問題總是繞不過。即使是在高端推理顯卡上,高達百毫秒級別的推理時間讓機器人的實時控制困難重重,就像一個人看見東西后要愣一下才做出動作。

如果我們能夠把模型運行到和相機一樣快的頻率(25fps、30fps 甚至 50fps),那么就可以在完全不丟幀的情況下處理視覺信息,讓 VLA 模型的實時運行成為可能。

如何實現(xiàn)?



Pi0 模型計算流程圖示,它主要包括 1 個視覺編碼器,1 個編碼器和 1 個解碼器;所有這些又可進一步分解為一系列的矩陣乘法和標量運算。

對于 Transformer 這類模型,當它進行單次推理(比如只處理一個問題或一張圖片)時,其內(nèi)部計算過程實際上是由一長串零碎的 “矩陣計算小任務(wù)” 組成;而像 Pi0 這種采用 “流匹配” 技術(shù)的模型,需要反復(fù)迭代十次才能得出最終結(jié)果,每一次迭代本身就包含幾十層計算。這樣算下來,整個推理過程涉及數(shù)百層、上千個操作。任務(wù)如此零碎,讓計算優(yōu)化變得異常困難。

本文研究者通過深入分析模型推理過程中的計算問題,融合和并行優(yōu)化每一個計算步驟,清除了推理方面的大部分障礙,再加上其他方面的優(yōu)化,最終把整個 VLA 模型跑進了所需的時間之內(nèi)。

這就像給了 VLA 大模型一份 “高性能 AI 大腦調(diào)校指南” ;它通過一系列深入的底層優(yōu)化,把笨重的 AI 大模型變成能跑實時任務(wù)的 “閃電俠”,并在此基礎(chǔ)上,構(gòu)想出一個能同時具備條件反射、視覺反饋和智能思考的下一代機器人控制系統(tǒng)。

效果展示



上圖所示的任務(wù)是抓取一支自由下落的筆。 這個任務(wù)對反應(yīng)時間的要求極為苛刻。機器人觀察到筆開始下落后,必須在極短的時間內(nèi)做出反應(yīng)并在正確的時間啟動抓取動作,快一點或者慢一點都會導致任務(wù)失敗。

最終呈現(xiàn)的效果是 從 “看到筆” 到 “執(zhí)行抓取” 的端到端總反應(yīng)時間被縮短到 200 毫秒以內(nèi),這大概對應(yīng)到一個 30 cm 左右的最短下落距離。而人類在這個任務(wù)上的一般表現(xiàn)也不過如此。

下一步規(guī)劃



基于上述取得的成果,研究者設(shè)計了一套完整的、圍繞 GPU 打造的機器人控制框架,它能驅(qū)動 VLA 大模型,像 “直播” 一樣對機器人進行流式的實時控制,讓機器人擁有 3 種不同速度的 “反應(yīng)神經(jīng)”:

  • 超快反應(yīng)(480Hz):處理來自力傳感器等高速信號。就像你的手一碰到燙的東西會瞬間縮回,不需要經(jīng)過大腦思考。這部分由模型的 “解碼器” 負責,能每秒生成 480 次控制指令。
  • 視覺反應(yīng)(30Hz):處理來自攝像頭的畫面。就像你看著球飛過來,用眼睛跟蹤并判斷落點。這部分由模型的 “編碼器” 負責。
  • 智能思考(<1Hz):處理語言理解和任務(wù)規(guī)劃。就像你在執(zhí)行任務(wù)時,還能分心聽一下隊友的指令或者自己琢磨一下策略。這部分速度最慢,但賦予了機器人更高的智能。

通過分析與實驗,這個框架下一步規(guī)劃最高能以 480Hz 的頻率生成機器人控制信號;這個速度,已經(jīng)摸到了實現(xiàn)基于力反饋進行控制的門檻。

未來展望

機器人有沒有可能達到 “又聰明又快” 的效果?這篇文章只是一個起點。針對未來不斷增加中的邊緣計算算力,研究者展望了更進一步的可能性:

  • “眼睛” 最快能有多快?從 30fps 到 60fps,甚至 120fps,是否有更多的任務(wù)變得可行?
  • “大腦” 最大能有多大?在實時性約束下,我們是否可以從 3B 模型,走向 7B,13B 模型,甚至更大模型?
  • “反應(yīng)” 速度的極限在哪里?在 VLA 框架下,我們是否還可以建立亞毫秒、甚至微秒級的反饋回路?

從這篇文章出發(fā),一個能夠參與實時控制 VLA 的世界的大門正在被打開。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“舉報的家長們后悔了?”學校不打印課后作業(yè),家長不滿老師冷笑

“舉報的家長們后悔了?”學校不打印課后作業(yè),家長不滿老師冷笑

熙熙說教
2025-11-01 20:36:25
7年雪藏8億罰款,范冰冰用《地母》殺回東京電影節(jié),但翻身仍無望

7年雪藏8億罰款,范冰冰用《地母》殺回東京電影節(jié),但翻身仍無望

電影票房預(yù)告片
2025-11-06 15:40:49
鄭麗文:尊重2300萬臺灣人意愿,絕不能武統(tǒng)!洪秀柱:當然可以打

鄭麗文:尊重2300萬臺灣人意愿,絕不能武統(tǒng)!洪秀柱:當然可以打

剛哥說法365
2025-11-01 17:15:20
中國顏值巔峰的6個AAAAA景區(qū),去過3個很幸福,去過6個此生無悔!

中國顏值巔峰的6個AAAAA景區(qū),去過3個很幸福,去過6個此生無悔!

戶外釣魚哥阿勇
2025-10-21 08:15:56
終于見到莎莎了,在香港轉(zhuǎn)機,跟哥是一前一后,兩人這距離好安心

終于見到莎莎了,在香港轉(zhuǎn)機,跟哥是一前一后,兩人這距離好安心

黃小仙的搞笑視頻
2025-10-11 10:40:27
上海地鐵驚現(xiàn)“廢話”廣告!Canva這波操作太懂年輕人

上海地鐵驚現(xiàn)“廢話”廣告!Canva這波操作太懂年輕人

侃故事的阿慶
2025-11-07 02:00:49
1976年,華國鋒做的一個決定影響至今,毛主席沒有看錯人

1976年,華國鋒做的一個決定影響至今,毛主席沒有看錯人

南書房
2025-11-06 16:55:03
恥辱3連敗,西部倒數(shù)第1!拿門面擔當換最脆超巨,3方交易虧大了

恥辱3連敗,西部倒數(shù)第1!拿門面擔當換最脆超巨,3方交易虧大了

毒舌NBA
2025-11-07 09:59:38
副院長出軌眼科主任后續(xù),部門介入調(diào)查,雙方停診,網(wǎng)友維護說話

副院長出軌眼科主任后續(xù),部門介入調(diào)查,雙方停診,網(wǎng)友維護說話

鋭娛之樂
2025-11-06 13:36:07
山姆會員,再也忍不下去了

山姆會員,再也忍不下去了

冰川思想庫
2025-11-07 11:01:47
國安亞冠3比0完勝大埔,王子銘為何一分鐘都沒上,引發(fā)熱議

國安亞冠3比0完勝大埔,王子銘為何一分鐘都沒上,引發(fā)熱議

張麗說足球
2025-11-07 10:43:46
汪小菲真寵女兒,八萬元的外套一下買兩件,小玥兒穿上很顯貴氣

汪小菲真寵女兒,八萬元的外套一下買兩件,小玥兒穿上很顯貴氣

鋭娛之樂
2025-11-05 08:44:46
聯(lián)合國前主席稱:中國人的風俗,世界上沒有一個國家能夠?qū)W得來

聯(lián)合國前主席稱:中國人的風俗,世界上沒有一個國家能夠?qū)W得來

小鬼頭體育
2025-11-07 10:15:43
五角大樓沒想到,大陸對臺使出最絕的一招:邀請日本自衛(wèi)隊到北京

五角大樓沒想到,大陸對臺使出最絕的一招:邀請日本自衛(wèi)隊到北京

頭條爆料007
2025-11-06 19:04:22
馬塔:我想繼續(xù)證明我依然能享受足球,并且保持高水平狀態(tài)

馬塔:我想繼續(xù)證明我依然能享受足球,并且保持高水平狀態(tài)

懂球帝
2025-11-07 09:25:12
馬斯克說對了!繼芯片后又一東西全球瘋搶,中國或成最大受益者

馬斯克說對了!繼芯片后又一東西全球瘋搶,中國或成最大受益者

史紀文譚
2025-11-06 15:46:54
東風就緒!神舟二十號3人乘組準備回家,神二十二1人將飛行超1年

東風就緒!神舟二十號3人乘組準備回家,神二十二1人將飛行超1年

古事尋蹤記
2025-11-06 10:11:15
中國首善李春平離世,13年軟飯換268億遺產(chǎn),大39歲女星身份曝光

中國首善李春平離世,13年軟飯換268億遺產(chǎn),大39歲女星身份曝光

壹月情感
2025-10-31 15:08:21
小米巨省電空調(diào),能效比倒數(shù)第一*,空調(diào)高管不懂空調(diào)術(shù)語?

小米巨省電空調(diào),能效比倒數(shù)第一*,空調(diào)高管不懂空調(diào)術(shù)語?

小小河
2025-11-06 01:34:24
紅軍城爭奪戰(zhàn)結(jié)束,俄軍進行最后清剿,大量烏軍投降

紅軍城爭奪戰(zhàn)結(jié)束,俄軍進行最后清剿,大量烏軍投降

兵國大事
2025-11-04 17:30:59
2025-11-07 11:35:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11666文章數(shù) 142499關(guān)注度
往期回顧 全部

科技要聞

75%贊成!特斯拉股東同意馬斯克天價薪酬

頭條要聞

荒野求生第30天 "奪冠熱門"退伍特種兵退賽:已瘦25斤

頭條要聞

荒野求生第30天 "奪冠熱門"退伍特種兵退賽:已瘦25斤

體育要聞

送走兩位全明星,公牛成了東部第一

娛樂要聞

白百何回應(yīng)東京電影節(jié)爭議

財經(jīng)要聞

老登們的社交貨幣全崩了

汽車要聞

小鵬X9增程版綜合續(xù)航1606公里 有底氣挑戰(zhàn)賽那?

態(tài)度原創(chuàng)

游戲
房產(chǎn)
旅游
手機
公開課

被吉尼斯內(nèi)涵!《GTA6》開發(fā)都多少年了?

房產(chǎn)要聞

錨定居住新趨勢!廣佛新世界重構(gòu)灣區(qū)“理想生活投資學”

旅游要聞

大理又要開“濾鏡”了

手機要聞

午時已到 第五代驍龍8至尊版如何顛覆游戲畫質(zhì)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 99热最新国产| 色偷偷人人干| 国产精品国产对白熟妇| 无码人妻一区二区三区免费看视频 | 精品国产福利在线| 国产成人亚洲综合A∨婷婷| 性无码大片在线观看| 亚洲国产精品一区二区www| 人妻少妇精品无码一区二区三区| 亚洲自慰国产| 欧美做受 高潮6| 无遮挡1000部拍拍拍免费| 综合久久av一区二区三区| 丰满成熟少妇A级毛片| 亚洲中文字幕一区二区| 久久久久亚洲精品无码英国-成人A| 亚洲欧美日韩国产制服另类| 在教室被老师添下面好爽| 国精产品一区二区三区有限| 久久人人妻人人人人妻性色aV| 五月丁香六月综合激情在线观看| 中国熟女视频| 欧美精品一区在线发布| 丰满少妇被猛男猛烈进入久久| 超碰人人做人人爱| 国产精品白嫩| 欧美性大战久久久久久| 日韩精品久久久| 黑人大战中国少妇XXX| 欧美黑人性暴力猛交| 婷婷丁香五月深爱憿情网| 毛片无摭无码在线免费观看| 成人电影777| 国产成人无码一区二区在线播放| 午夜无码蜜桃| 午夜精品大屁股区二区人妻| 67194熟妇在线观看线路| 国产一区二区免费在线观看 | 特黄 做受又硬又粗又大视频| 日本家庭乱伦中文字幕| a天堂在线资源|