夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

NeurIPS 2025 | 港科大&上交大提出HoloV:剪掉近90%視覺Token,性能不掉點,多模態(tài)大模型推理“大瘦身”

0
分享至

文章來源:我愛計算機視覺(ID:aicvml)

多模態(tài)大語言模型(MLLMs)雖然功能強大,但處理高分辨率圖片時,海量的視覺Token(可以理解為圖像的“像素塊”信息)帶來了巨大的計算開銷,讓推理速度變得很慢。為了給這些“臃腫”的模型“瘦身”,學術界一直在研究視覺Token剪枝(Token Pruning)技術,也就是丟掉那些不重要的視覺信息。

最近,一篇被 NeurIPS 2025 接收的論文《Don't Just Chase "Highlighted Tokens" in MLLMs: Revisiting Visual Holistic Context Retention》對現(xiàn)有的剪枝方法提出了挑戰(zhàn),并帶來了一個簡單又高效的解決方案—— HoloV。這項研究由香港科技大學、INSAIT、索非亞大學和上海交通大學等機構的研究者們共同完成。HoloV這個名字源于“Holistic Vision”,強調(diào)了它在剪枝時所采用的“全局視覺”策略。



  • 論文標題 : Don't Just Chase "Highlighted Tokens" in MLLMs: Revisiting Visual Holistic Context Retention

  • 作者 : Xin Zou, Di Lu, Yizhou Wang, Yibo Yan, Yuanhuiyi Lyu, Xu Zheng, Linfeng Zhang, Xuming Hu

  • 機構 : 香港科技大學(廣州)、香港科技大學、INSAIT 索非亞大學、上海交通大學

  • 錄用會議 : NeurIPS 2025

  • 論文地址 : https://arxiv.org/abs/2510.02912

  • 項目地址 : https://github.com/obananas/HoloV

現(xiàn)有方法的困境:只追“高光”,丟失全局

以往的Token剪枝方法,如FastV,大多采用一種“注意力優(yōu)先”(Attention-First)的策略。它們通過計算文本和視覺之間的交叉注意力,或者利用特殊的[CLS] Token的注意力得分,來判斷哪些視覺Token最“重要”,然后保留這些“高光”Token。

這種方法看似合理,但論文作者發(fā)現(xiàn)了一個致命缺陷:注意力機制傾向于關注那些語義相似的Token。比如,一張圖里有一只貓,那么很多高注意力的Token可能都集中在描述這只貓的不同部位。在高比例剪枝(比如剪掉90%)的情況下,模型保留下來的可能是一堆關于“貓”的冗余信息,而圖片中的背景、其他物體等全局上下文信息則被完全丟棄了。這導致模型性能急劇下降。


上圖清晰地展示了這個問題,隨著剪枝率的提高,基于注意力的方法(虛線)性能急劇惡化,而HoloV(實線)則能在高剪枝率下依然保持強大的性能。


上圖右側的可視化案例更直觀,F(xiàn)astV保留的Token(綠色點)高度集中,存在大量冗余,而HoloV保留的Token則分布更均勻,覆蓋了更豐富的上下文信息。

HoloV:從全局視角保留視覺上下文

為了解決上述問題,HoloV放棄了只追逐“高光”Token的思路,而是從一個更宏觀、更整體的視角(Holistic Perspective)來重新思考Token的保留策略。


HoloV的核心機制可以概括為:

  1. 劃分區(qū)域 :將輸入的圖片看作由多個空間區(qū)塊(Spatial Crops)組成。

  2. 預算分配 :不再將所有“保留名額”都給注意力最高的Token,而是 自適應地將剪枝預算分配到不同的空間區(qū)塊中

  3. 全局保留 :通過對高亮Token進行重新排序,確保最終保留下來的Token能夠覆蓋全局的視覺上下文,而不是僅僅聚集在少數(shù)幾個顯著特征上。

通過這種方式,HoloV避免了“表征崩潰”(Representational Collapse)的現(xiàn)象,即使在極高的剪枝率下,也能有效地保留與任務相關的重要信息,實現(xiàn)了局部顯著性和全局上下文的平衡。

實驗結果:極致的效率-精度權衡

HoloV作為一個即插即用的框架,在多種任務、多種MLLM架構和不同剪枝率下都展現(xiàn)了卓越的性能。

最驚人的結果是,在LLaVA-1.5模型上,HoloV 在剪掉了88.9%的視覺Token后,依然保留了原始模型95.8%的性能,實現(xiàn)了頂尖的效率-精度權衡。



從上面兩個性能對比表中可以看到,無論是在哪個基準測試上,HoloV(藍色字體)的平均性能都遠超其他SOTA方法,尤其是在高剪枝率(如87.5%)下,優(yōu)勢更為明顯。

在推理速度上,HoloV也帶來了實打實的提升。



該方法不僅適用于圖像任務,在視頻問答(Video QA)任務上同樣有效。


下面的可視化案例生動地對比了FastV和HoloV在不同剪枝率下的表現(xiàn)??梢钥吹?,HoloV更好地保留了圖片中的關鍵對象和場景信息(如路標、遠處的建筑等),而FastV則丟失了大量重要上下文。





此外,作者還對不同的模型(如Qwen2.5-VL)、不同的剪枝率、不同的超參數(shù)(如區(qū)塊數(shù)量)進行了廣泛的實驗和消融研究,均驗證了HoloV的有效性和魯棒性。




總結

CV君認為,HoloV的思路為多模態(tài)大模型的效率優(yōu)化提供了一個全新的、有價值的方向。在追求效率、進行信息壓縮時,不能僅僅關注局部的顯著性,更要保留信息的完整性和多樣性?!叭钟^”在AI的世界里同樣至關重要。HoloV的提出,無疑為實現(xiàn)更高效、更實用的MLLM應用鋪平了道路。

大家對這個“全局觀”的剪枝方法怎么看?歡迎在評論區(qū)留下你的看法!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
鏡報:曼聯(lián)高層與多名一線球員進行了會談,討論俱樂部的現(xiàn)狀

鏡報:曼聯(lián)高層與多名一線球員進行了會談,討論俱樂部的現(xiàn)狀

懂球帝
2025-10-13 03:25:06
吳石就義,陳誠自覺愧對故人,暗中幫助吳家,2000年后細節(jié)才披露

吳石就義,陳誠自覺愧對故人,暗中幫助吳家,2000年后細節(jié)才披露

小港哎歷史
2025-10-13 08:40:03
建議中老年人:早餐少吃饅頭和稀飯,多吃這4樣,營養(yǎng)又健康

建議中老年人:早餐少吃饅頭和稀飯,多吃這4樣,營養(yǎng)又健康

小童歷史
2025-10-09 11:35:07
廣州的廖一帆爸爸火了,因為他揭開了家委會的真相

廣州的廖一帆爸爸火了,因為他揭開了家委會的真相

清暉有墨
2025-09-05 19:24:18
蒸螃蟹幾分鐘?冷水還是熱水?很多人都錯,難怪螃蟹散黃不鮮美

蒸螃蟹幾分鐘?冷水還是熱水?很多人都錯,難怪螃蟹散黃不鮮美

阿龍美食記
2025-10-03 20:19:02
力拓與必和必拓對人民幣結算的截然不同態(tài)度背后的股權戰(zhàn)爭分析。

力拓與必和必拓對人民幣結算的截然不同態(tài)度背后的股權戰(zhàn)爭分析。

丹徒生
2025-10-07 09:34:15
反擊美國“變臉” 普京即將公布神秘新武器是什么?

反擊美國“變臉” 普京即將公布神秘新武器是什么?

環(huán)球網(wǎng)資訊
2025-10-12 15:44:02
東莞市公安局黨委委員、副局長肖漢華接受紀律審查和監(jiān)察調(diào)查

東莞市公安局黨委委員、副局長肖漢華接受紀律審查和監(jiān)察調(diào)查

極目新聞
2025-10-13 09:19:04
江蘇這條高速將于年底開工,計劃2027年建成,可為江宜高速分流!

江蘇這條高速將于年底開工,計劃2027年建成,可為江宜高速分流!

白淺娛樂聊
2025-10-13 01:28:07
54歲突然發(fā)現(xiàn),許多中產(chǎn)家庭漸漸窮回去了,以下兩個征兆,要警惕

54歲突然發(fā)現(xiàn),許多中產(chǎn)家庭漸漸窮回去了,以下兩個征兆,要警惕

雪雪呀
2025-08-11 08:41:29
楊蘭蘭是誰?10層迷霧揭開后,她可能根本就不是人

楊蘭蘭是誰?10層迷霧揭開后,她可能根本就不是人

吃瓜盟主
2025-09-11 14:48:46
任家萱為友人慶生,抱著兒子腹部好凸似懷二胎,男友露面變好看了

任家萱為友人慶生,抱著兒子腹部好凸似懷二胎,男友露面變好看了

小咪侃娛圈
2025-10-13 09:17:57
45歲大姐在國外當保姆15年,雇主臨別塞信封,她拆開一看竟不是錢

45歲大姐在國外當保姆15年,雇主臨別塞信封,她拆開一看竟不是錢

蘭姐說故事
2025-09-23 05:05:07
全球熱議!外媒回過神集體報道殲-16鎖定F-22A,基本都沒人相信?

全球熱議!外媒回過神集體報道殲-16鎖定F-22A,基本都沒人相信?

軍機Talk
2025-10-11 14:35:41
中美之間到底在爭奪什么?

中美之間到底在爭奪什么?

流蘇晚晴
2025-08-25 21:37:04
舉重世錦賽中國3金收官,女隊0金,朝鮮狂攬17金破10項世界紀錄

舉重世錦賽中國3金收官,女隊0金,朝鮮狂攬17金破10項世界紀錄

米修體育
2025-10-12 15:41:27
吹噓澤連斯基是英雄、最偉大的政治家,你們的良心不會痛嗎

吹噓澤連斯基是英雄、最偉大的政治家,你們的良心不會痛嗎

素衣讀史
2025-10-12 18:11:33
古人指出北平建都有巨大弊端,毛主席也猶豫,一高人幫他下定決心

古人指出北平建都有巨大弊端,毛主席也猶豫,一高人幫他下定決心

沈言論
2025-09-25 13:45:03
冰火兩重天!華為路測L3自動駕駛,288萬輛特斯拉FSD被美國大規(guī)模調(diào)查

冰火兩重天!華為路測L3自動駕駛,288萬輛特斯拉FSD被美國大規(guī)模調(diào)查

大白聊IT
2025-10-13 00:10:46
通脹之下你的錢正在 “蒸發(fā)”!這3種資產(chǎn)才是普通人最好的保護傘

通脹之下你的錢正在 “蒸發(fā)”!這3種資產(chǎn)才是普通人最好的保護傘

小白鴿財經(jīng)
2025-10-10 09:16:17
2025-10-13 09:56:49
算法與數(shù)學之美 incentive-icons
算法與數(shù)學之美
分享知識,交流思想
5157文章數(shù) 64593關注度
往期回顧 全部

科技要聞

海外子公司被荷蘭凍結 聞泰科技:堅決反對

頭條要聞

美防長稱外國要在美國本土建軍事基地 惹怒特朗普擁躉

頭條要聞

美防長稱外國要在美國本土建軍事基地 惹怒特朗普擁躉

體育要聞

表兄弟決賽相遇,他們在上海創(chuàng)造黑馬奇跡

娛樂要聞

娜扎被搶休息室,網(wǎng)友扒出疑似林允

財經(jīng)要聞

三大指數(shù)均大幅低開 創(chuàng)業(yè)板指跌4.44%

汽車要聞

1.5T動力/尺寸越級 國民家轎第5代帝豪首秀亮相

態(tài)度原創(chuàng)

時尚
本地
旅游
藝術
軍事航空

60歲阿姨靠穿搭火了!“簡約款”穿出高級感,自然老去也很美

本地新聞

“閩東利劍·惠民安商”首期緝車聯(lián)動執(zhí)行

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

軍事要聞

金正恩連續(xù)八次深夜閱兵 "大殺器"亮相

無障礙瀏覽 進入關懷版 亚洲AV无码专区一级婬片毛片| 亚洲av无码影院| 国产精品美女久久久| 亚洲Va中文字幕久久无码一区| 亚洲国产成人一区二区精品区| 免费久久99精品国产自在现线| 国产精品毛片完整版视频| 男女真人真事多人啪啪视频| 久久燥狠狠色| 久久久久欠精品国产毛片国产毛生 | 黄色视频xxxx| 亚洲熟女偷窍久久综合征| 精品爆乳一区| 精品一区二区不卡无码AV| 日韩不卡一区二区三区四区| 国产精品久久久久无码AV网页丶| 亚洲一区二区精品偷拍| 后入大屁股少妇视频在线观看| 小雪第一次尝到又大又粗| 亚洲A V乱码| 国产精品午夜性视频| 免费看午夜福利专区| 人妻无码aⅴ中文系列久久免费| 欧美一厂区二厂区三厂区| 精品国产午夜理论片不卡精品| 色综合久久88色综合天天6| 在线中文一区字幕对白| 亚洲丰满熟女乱一区二区三区| 手机免费在线看av| 人妻中文AV| 精品国产_亚洲人成在线| 一区二区三区视频在线播放| 婷婷六月丁香缴 清| 少妇做爰免费视频网站| 人人操人人妻人人操人人| 天天做天天爱夜夜爽导航| 亚洲AV永久精品| 日本美女人妻乱码中文字幕视频在线播放| 天天日狠狠操| 一二三四在线观看免费高清视频| 麻豆蜜桃国产精品无码视频综艺|