夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

JanusVLN:雙重隱式記憶解耦語(yǔ)義與空間,開(kāi)創(chuàng)視覺(jué)語(yǔ)言導(dǎo)航記憶新范式

0
分享至


JanusVLN通過(guò)雙重隱式記憶解耦語(yǔ)義與空間,實(shí)現(xiàn)高效視覺(jué)語(yǔ)言導(dǎo)。

01

引言

視覺(jué)-語(yǔ)言導(dǎo)航(Vision-and-Language Navigation, VLN)作為具身智能的關(guān)鍵研究領(lǐng)域,旨在賦予智能體根據(jù)自然語(yǔ)言指令在未知三維環(huán)境中導(dǎo)航的能力。近期,多模態(tài)大語(yǔ)言模型(MLLM)憑借其卓越的語(yǔ)義理解與推理能力,極大地推動(dòng)了VLN領(lǐng)域的發(fā)展。然而,當(dāng)前主流方法普遍依賴于構(gòu)建**顯式記憶**(如文本拓?fù)涞貓D或存儲(chǔ)歷史圖像序列),這一范式面臨三大核心挑戰(zhàn):

1. 空間信息損失:基于文本的記憶難以精確表征復(fù)雜的空間幾何關(guān)系。

2. 計(jì)算效率低下:重復(fù)處理歷史觀測(cè)數(shù)據(jù)導(dǎo)致巨大的計(jì)算冗余與推理延遲。

3. 記憶無(wú)限膨脹:記憶體積隨導(dǎo)航步數(shù)線性增長(zhǎng),阻礙了模型在長(zhǎng)時(shí)序任務(wù)中的有效信息提取。

更根本的矛盾在于,現(xiàn)有模型大多沿用為2D圖文任務(wù)設(shè)計(jì)的視覺(jué)編碼器,未能充分利用RGB圖像中蘊(yùn)含的豐富3D空間線索(如透視、遮擋),從根本上限制了其三維空間感知能力。為突破這些瓶頸,我們從人類認(rèn)知科學(xué)中獲得啟發(fā)——人腦在導(dǎo)航時(shí),左右半球分別處理語(yǔ)義與空間信息,并形成高效的隱式表征。

基于此,我們提出了一種全新的VLN框架——JanusVLN。該框架首次引入雙重隱式神經(jīng)記憶(Dual Implicit Neural Memory),將視覺(jué)語(yǔ)義與空間幾何信息解耦,并將其建模為兩個(gè)獨(dú)立的、緊湊的、固定大小的神經(jīng)表征(neural representation)。JanusVLN僅需單目RGB視頻流,便能賦予模型強(qiáng)大的3D空間推理能力,并通過(guò)高效的增量式更新機(jī)制,在實(shí)現(xiàn)卓越性能的同時(shí),顯著降低了計(jì)算開(kāi)銷(xiāo)。

論文標(biāo)題:JanusVLN: Decoupling Semantics and Spatiality with Dual Implicit Memory for Vision-Language Navigation

論文鏈接:https://arxiv.org/abs/2509.22548

項(xiàng)目主頁(yè):https://miv-xjtu.github.io/JanusVLN.github.io/

代碼地址:https://github.com/MIV-XJTU/JanusVLN

02

JanusVLN:雙重隱式記憶框架


JanusVLN的核心創(chuàng)新在于其雙重隱式記憶框架,它將導(dǎo)航記憶從顯式、高維的原始數(shù)據(jù),轉(zhuǎn)變?yōu)殡[式、緊湊的神經(jīng)網(wǎng)絡(luò)內(nèi)部表征。

核心設(shè)計(jì)理念

1.**解耦的視覺(jué)感知:語(yǔ)義與空間**

為實(shí)現(xiàn)全面的環(huán)境理解,JanusVLN采用雙編碼器架構(gòu),分別處理“是什么”(語(yǔ)義)與“在哪里”(空間)的問(wèn)題:

- **2D視覺(jué)語(yǔ)義編碼器**:采用Qwen2.5-VL的視覺(jué)編碼器,提取圖像中的高級(jí)語(yǔ)義特征。

- **3D空間幾何編碼器**:引入預(yù)訓(xùn)練的3D視覺(jué)幾何基礎(chǔ)模型(VGGT),僅從RGB視頻中便可推斷出蘊(yùn)含深度、遮擋等豐富3D結(jié)構(gòu)的幾何特征,賦予模型無(wú)需昂貴深度傳感器的3D感知能力。

2.**雙重隱式神經(jīng)記憶:以KV緩存為載體**

我們創(chuàng)新地將神經(jīng)網(wǎng)絡(luò)注意力模塊的鍵值對(duì)(Key-Value, KV)緩存作為記憶的載體。這種經(jīng)網(wǎng)絡(luò)深度處理的KV對(duì)是環(huán)境信息的高度抽象和濃縮,構(gòu)成了緊湊且高效的隱式記憶。JanusVLN分別為語(yǔ)義與空間編碼器維護(hù)獨(dú)立的KV緩存,形成了互補(bǔ)的雙重記憶。

3.**高效的混合增量更新**

為維持記憶的固定大小并兼顧全局與局部信息,我們?cè)O(shè)計(jì)了一種混合緩存更新策略:

- **滑動(dòng)窗口**:緩存最近幾幀的KV,確保對(duì)即時(shí)環(huán)境的敏銳感知。

- **初始窗口**:永久保留任務(wù)初始幾幀的KV。研究表明,這些初始幀如同“注意力接收器”,為長(zhǎng)期任務(wù)提供關(guān)鍵的全局錨點(diǎn)。

該機(jī)制使得模型在每一步僅需處理當(dāng)前幀,并通過(guò)與固定大小的隱式記憶交互來(lái)復(fù)用歷史信息,徹底避免了對(duì)歷史幀的重復(fù)計(jì)算,從而解決了記憶膨脹問(wèn)題并大幅提升了推理效率。


03


實(shí)驗(yàn)驗(yàn)證

1.定量性能對(duì)比

我們?cè)跈?quán)威的VLN-CE基準(zhǔn)上進(jìn)行了全面評(píng)估。實(shí)驗(yàn)結(jié)果表明,JanusVLN在各項(xiàng)指標(biāo)上均取得了SOTA性能。



- **超越SOTA方法**:與同樣僅使用RGB輸入的SOTA方法(如NaVILA, StreamVLN)相比,JanusVLN在成功率(SR)上取得了**3.6至10.8個(gè)點(diǎn)**的顯著提升,且使用了更少的外部訓(xùn)練數(shù)據(jù),驗(yàn)證了雙重隱式記憶范式的優(yōu)越性。

- **超越多模態(tài)輸入方法**:相較于依賴全景圖、深度圖等昂貴多模態(tài)輸入的方法,JanusVLN僅憑單目RGB輸入,便在SR指標(biāo)上實(shí)現(xiàn)了**10.5至35.5個(gè)點(diǎn)**的巨大優(yōu)勢(shì)。

- **強(qiáng)大的泛化能力**:在更具挑戰(zhàn)性的多語(yǔ)言RxR-CE數(shù)據(jù)集上,JanusVLN同樣刷新了SOTA記錄,展現(xiàn)了其卓越的泛化性能。

2.計(jì)算效率優(yōu)勢(shì)


*圖3:隨著序列長(zhǎng)度增加,JanusVLN(Cached Memory)與基線方法(VGGT)的單幀推理時(shí)間對(duì)比*

如圖所示,JanusVLN的增量式更新機(jī)制使其推理時(shí)間幾乎不受導(dǎo)航步數(shù)影響,而VGGT由于需要重復(fù)處理整個(gè)序列,其計(jì)算成本呈指數(shù)級(jí)增長(zhǎng)。這證明了JanusVLN在實(shí)現(xiàn)長(zhǎng)時(shí)序?qū)Ш椒矫娴木薮鬂摿Α?/p>

3.空間推理能力定性分析


我們選取了幾個(gè)對(duì)空間理解要求極高的導(dǎo)航任務(wù),例如:

- **深度感知**(定位到“最遠(yuǎn)的”黃色凳子)

- **相對(duì)方位理解**(停在盆栽“旁邊”而非“前方”)

- **空間關(guān)聯(lián)推理**(找到橙色柜子“旁邊”的凳子)

實(shí)驗(yàn)表明,得益于空間幾何記憶提供的3D感知能力,JanusVLN能夠準(zhǔn)確理解這些復(fù)雜的空間指令,并成功完成任務(wù),而這正是傳統(tǒng)VLN模型面臨的主要挑戰(zhàn)。

04


總結(jié)與展望

本文提出的**JanusVLN**框架,通過(guò)引入開(kāi)創(chuàng)性的**雙重隱式神經(jīng)記憶**,成功將視覺(jué)語(yǔ)義與空間幾何信息解耦,從根本上解決了傳統(tǒng)VLN方法在記憶機(jī)制上的核心瓶頸。該框架不僅實(shí)現(xiàn)了僅依靠RGB輸入進(jìn)行精確的3D空間感知,還通過(guò)高效的增量式更新大幅提升了計(jì)算效率。

全面的實(shí)驗(yàn)結(jié)果驗(yàn)證了JanusVLN的卓越性能與泛化能力。我們相信,這項(xiàng)工作將推動(dòng)VLN研究從“2D語(yǔ)義主導(dǎo)”的范式,邁向“3D空間與語(yǔ)義協(xié)同”的新階段,為構(gòu)建下一代具備高級(jí)空間認(rèn)知能力的具身智能體鋪平了道路。

未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁(yè)、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來(lái)源并插入本公眾號(hào)名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
太幻滅了!章小蕙參加呂良偉70歲生日宴,真人又老又胖,頸紋好深

太幻滅了!章小蕙參加呂良偉70歲生日宴,真人又老又胖,頸紋好深

娛圈小愚
2025-12-25 14:15:00
平安夜奇跡!18億美元大獎(jiǎng)一票獨(dú)得!中彩票巨獎(jiǎng)后,有人站在超市門(mén)口免費(fèi)發(fā)錢(qián),見(jiàn)人就送

平安夜奇跡!18億美元大獎(jiǎng)一票獨(dú)得!中彩票巨獎(jiǎng)后,有人站在超市門(mén)口免費(fèi)發(fā)錢(qián),見(jiàn)人就送

華人生活網(wǎng)
2025-12-26 02:53:35
維拉本賽季英超對(duì)陣“BIG6”取勝5場(chǎng),僅負(fù)于利物浦

維拉本賽季英超對(duì)陣“BIG6”取勝5場(chǎng),僅負(fù)于利物浦

懂球帝
2025-12-28 04:00:01
豆瓣9.6分!Netflix怒砸4.8億美元的懸疑王炸,結(jié)局封神

豆瓣9.6分!Netflix怒砸4.8億美元的懸疑王炸,結(jié)局封神

極客電影
2025-12-27 17:59:38
Lisa在圣誕節(jié)二登瘋馬秀,由男友三公子陪同,直接打臉洗白的粉絲

Lisa在圣誕節(jié)二登瘋馬秀,由男友三公子陪同,直接打臉洗白的粉絲

芊手若
2025-12-26 15:32:19
12月31日,新能源充電服務(wù)補(bǔ)貼停止,網(wǎng)約車(chē)司機(jī):天塌了

12月31日,新能源充電服務(wù)補(bǔ)貼停止,網(wǎng)約車(chē)司機(jī):天塌了

用車(chē)指南
2025-12-25 10:00:59
姜昆風(fēng)波再升級(jí)!拍攝者硬剛,視頻不是拼接也不在美國(guó),行程被扒

姜昆風(fēng)波再升級(jí)!拍攝者硬剛,視頻不是拼接也不在美國(guó),行程被扒

阿纂看事
2025-12-27 11:02:48
C羅梅開(kāi)二度!利雅得勝利3-0,沙超開(kāi)局10連勝!總裁14次年度40球

C羅梅開(kāi)二度!利雅得勝利3-0,沙超開(kāi)局10連勝!總裁14次年度40球

萬(wàn)花筒體育球球
2025-12-28 03:37:50
里夫斯重傷!沒(méi)了,全都沒(méi)了!雷迪克暴怒!湖人天塌了

里夫斯重傷!沒(méi)了,全都沒(méi)了!雷迪克暴怒!湖人天塌了

五姑娘臺(tái)球
2025-12-27 11:57:01
李嘉誠(chéng):有正常的政治氛圍良好的商業(yè)環(huán)境,就不存在跑不跑的問(wèn)題

李嘉誠(chéng):有正常的政治氛圍良好的商業(yè)環(huán)境,就不存在跑不跑的問(wèn)題

紫京講談
2025-12-26 16:59:51
看2026|博原資本朱璘:聚焦新質(zhì)生產(chǎn)力,加碼機(jī)器人賽道

看2026|博原資本朱璘:聚焦新質(zhì)生產(chǎn)力,加碼機(jī)器人賽道

貝殼財(cái)經(jīng)
2025-12-27 10:35:04
周薪 11 萬(wàn)鎊中場(chǎng)鎖定曼聯(lián)!實(shí)力遠(yuǎn)超烏加特

周薪 11 萬(wàn)鎊中場(chǎng)鎖定曼聯(lián)!實(shí)力遠(yuǎn)超烏加特

瀾歸序
2025-12-28 01:15:06
霍思燕這次真的把我笑到了。別人參加活動(dòng)不是曬娃、秀恩愛(ài),

霍思燕這次真的把我笑到了。別人參加活動(dòng)不是曬娃、秀恩愛(ài),

小光侃娛樂(lè)
2025-12-26 07:55:03
埃梅里豪取11連勝!維拉2-1切爾西,替補(bǔ)21分鐘雙響,差阿森納3分

埃梅里豪取11連勝!維拉2-1切爾西,替補(bǔ)21分鐘雙響,差阿森納3分

萬(wàn)花筒體育球球
2025-12-28 04:12:04
中俄通婚劇增,若不了解俄羅斯女性生理缺陷,婚后可能會(huì)很痛苦。

中俄通婚劇增,若不了解俄羅斯女性生理缺陷,婚后可能會(huì)很痛苦。

百態(tài)人間
2025-12-14 05:15:04
梅根在Netflix新節(jié)目開(kāi)始回味英國(guó)生活,對(duì)英國(guó)貴族化念念不忘!

梅根在Netflix新節(jié)目開(kāi)始回味英國(guó)生活,對(duì)英國(guó)貴族化念念不忘!

聰明的橙子hj
2025-12-26 16:37:49
湖北一男子持槍截停過(guò)往車(chē)輛?警方通報(bào)→

湖北一男子持槍截停過(guò)往車(chē)輛?警方通報(bào)→

深圳晚報(bào)
2025-12-27 23:26:27
舒淇在節(jié)目里第一次承認(rèn),她和馮德倫為了要孩子已經(jīng)折騰了九年。

舒淇在節(jié)目里第一次承認(rèn),她和馮德倫為了要孩子已經(jīng)折騰了九年。

歲月有情1314
2025-11-29 15:40:25
日本絕密文件曝光:要在華駐軍100年!若東南亞忠心,可網(wǎng)開(kāi)一面

日本絕密文件曝光:要在華駐軍100年!若東南亞忠心,可網(wǎng)開(kāi)一面

科普100克克
2025-12-27 16:41:10
武漢一警花嫁給“副局長(zhǎng)”,結(jié)婚3年后,偶然發(fā)現(xiàn)丈夫的真實(shí)身份

武漢一警花嫁給“副局長(zhǎng)”,結(jié)婚3年后,偶然發(fā)現(xiàn)丈夫的真實(shí)身份

五元講堂
2024-09-02 09:45:42
2025-12-28 05:19:00
AI科技評(píng)論 incentive-icons
AI科技評(píng)論
點(diǎn)評(píng)學(xué)術(shù),服務(wù)AI
7025文章數(shù) 20717關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂(lè)要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開(kāi)始拉物價(jià)了!

汽車(chē)要聞

好音響比大屏更重要?車(chē)企開(kāi)始“聽(tīng)”用戶的

態(tài)度原創(chuàng)

藝術(shù)
健康
本地
房產(chǎn)
軍事航空

藝術(shù)要聞

驚艷!這件木雕美得讓人心動(dòng),絕對(duì)不容錯(cuò)過(guò)!

這些新療法,讓化療不再那么痛苦

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬(wàn)年史書(shū)

房產(chǎn)要聞

年銷(xiāo)20億+!中交·藍(lán)色港灣用好房子致敬好生活

軍事要聞

俄稱已控制庫(kù)皮揚(yáng)斯克 正清繳烏軍

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 天堂在线观看免费视频| www.日韩av.com| 国产精品一区二区av| 天天躁人人躁人人躁狂躁| 欧美拍拍视频免费大全| AV成人午夜无码一区二区| 成人国产精品| 亚洲日本一区二区| 中文字幕av无码不卡| 日日干夜夜被操| 欧美成人理论片乱| 激情的图片与小说| 免费在线成人黄色视频观看| 国产精品久久无码不卡黑寡妇| 久久夜色精品国产网站| 亚洲熟女综合色一区二区三区| 国产午夜亚洲精品国产成人 | 在线无码视频| 亚洲男人的天堂av手机在线观看| 无码av永久免费专区网站 | GOGO熟女少妇大尺度AⅤ| 日韩免费视频一一二区| 久久精品人成免费| 精品无码久久久久久国产| 人人操人人看人人鲁| 亚洲人成无码区在线观看| 天堂中文8资源在线8| 岛国丝袜高跟儿人妻| 亚洲精品女女久久久久久| 亚洲无码综合在线视频| 国产无遮挡又黄又爽不要vip软件| 熟女亮丝肥臀| 人轮片无码中文字幕| 国产麻豆福利av在线播放| 亚洲成人无码影片| 国产成人亚洲精品狼色在线| 亚洲精品自偷自拍无码| 国产乱人内谢69XXXX亚洲| 被男狂揉吃奶胸60分钟视频| 国产成人无码一区二区三区| 日本免费一区二区三区中文字幕 |