夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

NeurIPS 2025 Spotlight | NYU提出QSVD數(shù)學(xué)壓縮讓模型輕、快、穩(wěn)

0
分享至



本工作由紐約大學(xué) NYU SAI Lab 的碩士生王宇彤與博士生王海宇合作完成。本文的通訊作者為張賽騫,他是紐約大學(xué)(New York University)計(jì)算機(jī)科學(xué)系助理教授、SAI Lab 負(fù)責(zé)人,其研究方向涵蓋多模態(tài)大模型(Vision-Language Models)壓縮與加速、低比特量化、高效推理以及可信智能系統(tǒng)。

在多模態(tài)智能浪潮中,視覺語(yǔ)言模型(Vision-Language Models, VLM)已成為連接視覺理解與語(yǔ)言生成的核心引擎。從圖像描述、視覺問答到 AI 教育和交互系統(tǒng),它們讓機(jī)器能夠「看懂世界、說(shuō)人話」。

然而,強(qiáng)大的性能也帶來(lái)了沉重的代價(jià)——模型動(dòng)輒上百億參數(shù),顯存和計(jì)算壓力巨大。以 LLaVA-13B 為例,推理時(shí) Key-Value 緩存(KV cache)體積極大,速度慢、資源耗盡,這讓多模態(tài)/大模型的「落地」之路異常艱難。

面對(duì)這一瓶頸,來(lái)自紐約大學(xué)的研究團(tuán)隊(duì) SAI Lab 在 NeurIPS 2025 上提出了一項(xiàng)突破性工作——QSVD(Efficient Low-rank Approximation for Unified Query-Key-Value Weight Compression in Low-Precision Vision-Language Models)。它通過(guò)「聯(lián)合低秩分解 + 量化」的創(chuàng)新策略,為多模態(tài)模型找到了一條「輕量化而不減智」的新路徑。



  • 論文標(biāo)題:QSVD: Efficient Low-rank Approximation for Unified Query-Key-Value Weight Compression in Low-Precision Vision-Language Models
  • 論文地址:https://arxiv.org/abs/2510.16292
  • Github:https://github.com/SAI-Lab-NYU/QSVD

讓多模態(tài)模型「減負(fù)」:

從 Key-Value 緩存出發(fā)

視覺語(yǔ)言模型的強(qiáng)大來(lái)自 Transformer 中的注意力機(jī)制,但這也帶來(lái)巨大的 KV 緩存壓力?,F(xiàn)有方案如 Grouped-Query Attention、Multi-Query Attention、DeepSeek 的 MLA 等雖能降低計(jì)算開銷,卻要么精度受損,要么需要重新訓(xùn)練。

QSVD 的目標(biāo)很明確:不改架構(gòu)、不重新訓(xùn)練,只通過(guò)數(shù)學(xué)壓縮就讓模型更輕、更快、更穩(wěn)。

核心思想:

聯(lián)合 QKV 奇異值分解(Joint SVD over QKV)

傳統(tǒng)做法是分別對(duì) Q、K、V 矩陣進(jìn)行奇異值分解(SVD),而 QSVD 首創(chuàng)聯(lián)合分解(Joint SVD)







這帶來(lái)三大優(yōu)勢(shì):

  • 計(jì)算更少:降維乘法減少矩陣乘法;
  • 顯存更?。?/strong>只緩存一個(gè)中間表示,KV 緩存量減半;
  • 表示更穩(wěn):聯(lián)合分解保持 Q/K/V 之間的語(yǔ)義耦合,不損失信息。

自適應(yīng)秩分配:

讓壓縮更聰明

QSVD 進(jìn)一步提出跨層秩分配策略(Cross-layer Rank Allocation)。不同層的重要性不同,不能「一刀切」地壓縮。研究者通過(guò)梯度近似計(jì)算每個(gè)奇異值對(duì)模型損失的影響,得到重要性評(píng)分,并在全模型范圍內(nèi)排序與截?cái)唷?/p>



這樣,模型可以智能決定「該減多少秩、留多少精度」,實(shí)現(xiàn)全局最優(yōu)的壓縮配置。

低比特量化 + 異常值平滑

僅靠低秩近似還不夠。為了進(jìn)一步提升硬件效率,QSVD 結(jié)合了后訓(xùn)練量化(PTQ)與異常值平滑(Outlier Smoothing)。







實(shí)驗(yàn)結(jié)果:

更輕、更快、更準(zhǔn)

研究團(tuán)隊(duì)在 LLaVA-v1.5(7B/13B)、LLaVA-Next 和 SmolVLM 等模型上進(jìn)行了系統(tǒng)評(píng)估,結(jié)果令人驚喜:

  • FP16 比 ASVD 與 SVD-LLM 精度高 10% 以上;
  • W8A8(8 位量化)下幾乎無(wú)精度損失,W4A4 極低比特條件下依然穩(wěn)定工作
  • 推理速度最高提升 13 倍。

這些結(jié)果說(shuō)明,QSVD 不僅壓縮模型,還讓模型更「聰明」。

技術(shù)總結(jié):

三步實(shí)現(xiàn)高效多模態(tài)推理

  • Joint SVD over QKV

拼接 Q/K/V 矩陣,統(tǒng)一做低秩分解;

  • Cross-layer Rank Allocation

按重要性分配秩,全局最優(yōu)壓縮;

  • Quantization with Outlier Smoothing

旋轉(zhuǎn)量化 + 可學(xué)習(xí)奇異值分配,抑制異常值。

三步即可打造出低顯存、高精度、快速響應(yīng)的多模態(tài)大模型。

結(jié)語(yǔ)

在這項(xiàng)工作中,我們提出了QSVD—— 一個(gè)將奇異值分解(SVD)與量化(Quantization)結(jié)合的統(tǒng)一框架,用于高效壓縮視覺語(yǔ)言模型(VLM)。通過(guò)對(duì) Q、K、V 權(quán)重矩陣的聯(lián)合分解,并引入跨層自適應(yīng)秩分配策略,QSVD 在幾乎不損失精度的前提下,顯著降低了計(jì)算開銷、KV 緩存規(guī)模與模型存儲(chǔ)成本。

雖然量化操作應(yīng)用于整個(gè)模型,但壓縮的核心集中在自注意力層(Self-Attention Layers)的 QKV 權(quán)重上,這正是影響推理效率的關(guān)鍵環(huán)節(jié)。未來(lái),我們計(jì)劃將優(yōu)化范圍擴(kuò)展至跨模塊聯(lián)合壓縮與自適應(yīng)優(yōu)化,進(jìn)一步推動(dòng)多模態(tài)模型的系統(tǒng)級(jí)輕量化。

值得注意的是,提高模型效率也意味著更強(qiáng)的可部署性與普惠性。當(dāng)更強(qiáng)大的模型能夠被更廣泛地使用時(shí),它們將有潛力加速教育、醫(yī)療、創(chuàng)意與人機(jī)交互的發(fā)展——但同時(shí)也可能帶來(lái)監(jiān)控、隱私與虛假信息傳播等風(fēng)險(xiǎn)。如何在開放與安全之間取得平衡,是下一階段研究必須正視的問題。

論文與代碼均已公開,歡迎感興趣的同學(xué)閱讀、復(fù)現(xiàn)以及深入討論。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
80后已經(jīng)有1100萬(wàn)人提前下車了。

80后已經(jīng)有1100萬(wàn)人提前下車了。

愛吃糖的貓cat
2025-11-16 18:27:38
捅完琉球窩!中國(guó)再掀北海道老底,日本80年前埋的雷,炸了

捅完琉球窩!中國(guó)再掀北海道老底,日本80年前埋的雷,炸了

南宮一二
2025-11-17 07:17:39
“日本與中國(guó)交惡有百害而無(wú)一利” 日本網(wǎng)友聲討高市早苗涉臺(tái)錯(cuò)誤言論

“日本與中國(guó)交惡有百害而無(wú)一利” 日本網(wǎng)友聲討高市早苗涉臺(tái)錯(cuò)誤言論

環(huán)球網(wǎng)資訊
2025-11-18 15:09:28
84年黃克誠(chéng)應(yīng)要求談一談林彪,黃老發(fā)言震驚四座:這話只能黃老講

84年黃克誠(chéng)應(yīng)要求談一談林彪,黃老發(fā)言震驚四座:這話只能黃老講

春秋硯
2025-11-18 10:00:19
三大指數(shù)均跌逾1% 下跌個(gè)股近4400只

三大指數(shù)均跌逾1% 下跌個(gè)股近4400只

財(cái)聯(lián)社
2025-11-18 14:22:20
留學(xué)生回國(guó)第一頓飯有多離譜?網(wǎng)友:簡(jiǎn)單說(shuō),國(guó)外沒有真正的美食

留學(xué)生回國(guó)第一頓飯有多離譜?網(wǎng)友:簡(jiǎn)單說(shuō),國(guó)外沒有真正的美食

解讀熱點(diǎn)事件
2025-11-17 00:20:02
空警-3000橫空出世,B-21或未服役即落后,全球無(wú)對(duì)手!

空警-3000橫空出世,B-21或未服役即落后,全球無(wú)對(duì)手!

阿淫記錄生活日常
2025-11-10 18:17:35
場(chǎng)均14+11!楊瀚森重返巔峰,開拓者官宣決定,爭(zhēng)取輪換地位

場(chǎng)均14+11!楊瀚森重返巔峰,開拓者官宣決定,爭(zhēng)取輪換地位

阿泰希特
2025-11-18 09:36:32
被員工吐槽后,俞敏洪連發(fā)數(shù)條南極游視頻,此前在南極旅游發(fā)全員信引爭(zhēng)議

被員工吐槽后,俞敏洪連發(fā)數(shù)條南極游視頻,此前在南極旅游發(fā)全員信引爭(zhēng)議

紅星新聞
2025-11-18 12:21:08
惡劣!汪士欽拉倒對(duì)手后再猛推一把+被紅牌罰下 6天2次成為罪人

惡劣!汪士欽拉倒對(duì)手后再猛推一把+被紅牌罰下 6天2次成為罪人

風(fēng)過(guò)鄉(xiāng)
2025-11-18 21:42:02
北京市房山區(qū)人大常委會(huì)原副主任穆建山被查

北京市房山區(qū)人大常委會(huì)原副主任穆建山被查

新京報(bào)
2025-11-18 21:44:27
“與克林頓有性行為”滿世界瘋傳,特朗普態(tài)度急轉(zhuǎn):檔案公開,我倆是清白的

“與克林頓有性行為”滿世界瘋傳,特朗普態(tài)度急轉(zhuǎn):檔案公開,我倆是清白的

艾米手工作品
2025-11-18 13:17:28
一旦爆發(fā)核戰(zhàn)爭(zhēng),只有10分鐘自救!14億中國(guó)人,必須學(xué)會(huì)自救方法

一旦爆發(fā)核戰(zhàn)爭(zhēng),只有10分鐘自救!14億中國(guó)人,必須學(xué)會(huì)自救方法

扶蘇聊歷史
2025-10-26 11:35:03
高市拒絕認(rèn)錯(cuò),6國(guó)為日本撐腰,中方措辭變了,我軍穿過(guò)大隅海峽

高市拒絕認(rèn)錯(cuò),6國(guó)為日本撐腰,中方措辭變了,我軍穿過(guò)大隅海峽

卷史
2025-11-17 17:08:23
高市早苗一手炮制日本外交天崩開局:同時(shí)得罪四國(guó),制造罕見被動(dòng)局面

高市早苗一手炮制日本外交天崩開局:同時(shí)得罪四國(guó),制造罕見被動(dòng)局面

上觀新聞
2025-11-18 00:28:13
愛潑斯坦郵件再爆大瓜!特朗普給克林頓吹過(guò)簫,二人私下照片被扒

愛潑斯坦郵件再爆大瓜!特朗普給克林頓吹過(guò)簫,二人私下照片被扒

派大星紀(jì)錄片
2025-11-18 16:24:36
別被新聞給誤導(dǎo)了,這才是高市早苗的真相

別被新聞給誤導(dǎo)了,這才是高市早苗的真相

少年一白
2025-11-18 12:03:56
小天才電話手表驚爆“大瓜”:孩子的孤獨(dú),正在被偷偷賣錢…

小天才電話手表驚爆“大瓜”:孩子的孤獨(dú),正在被偷偷賣錢…

媽咪OK
2025-11-17 15:43:33
防止規(guī)模性返鄉(xiāng)滯鄉(xiāng)?未來(lái)最難的一批人是他們

防止規(guī)模性返鄉(xiāng)滯鄉(xiāng)?未來(lái)最難的一批人是他們

財(cái)話連篇
2025-11-17 18:41:50
氣場(chǎng)強(qiáng)大!陳夢(mèng)暫停時(shí),教練和隊(duì)員全都閉口不言,沒有人敢指導(dǎo)

氣場(chǎng)強(qiáng)大!陳夢(mèng)暫停時(shí),教練和隊(duì)員全都閉口不言,沒有人敢指導(dǎo)

鳳幻洋
2025-11-18 16:23:49
2025-11-18 22:31:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11747文章數(shù) 142507關(guān)注度
往期回顧 全部

科技要聞

谷歌CEO警告:若AI泡沫破裂,沒公司能幸免

頭條要聞

被問對(duì)中日外交官員磋商是否滿意 劉勁松:當(dāng)然不滿意

頭條要聞

被問對(duì)中日外交官員磋商是否滿意 劉勁松:當(dāng)然不滿意

體育要聞

結(jié)束最后一次對(duì)決,陳夢(mèng)和朱雨玲笑著相擁

娛樂要聞

宋佳奪影后動(dòng)了誰(shuí)的奶酪

財(cái)經(jīng)要聞

中美機(jī)器人爆發(fā)了一場(chǎng)論戰(zhàn)

汽車要聞

硬核配置旗艦氣場(chǎng) 嵐圖泰山售37.99萬(wàn)起

態(tài)度原創(chuàng)

本地
教育
時(shí)尚
房產(chǎn)
公開課

本地新聞

這檔古早綜藝,怎么就成了年輕人的哆啦A夢(mèng)?

教育要聞

12年義務(wù)教育能治標(biāo)治本嗎?

秋天穿衣暫時(shí)沒靈感?趕緊看看這27套穿搭,舒適自然又大方

房產(chǎn)要聞

29.4億!海南“地王”片區(qū),要賣超級(jí)宅地!

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 最新无码天堂| 亚洲老师熟妇色XXXXX无码| 六月丁香五月婷婷| 国产美女内谢| 国产爆乳无码一区二区麻豆| 国产精品一区在线蜜臀| 五月丁香六月狠狠爱综合| 日欧一区二区三区| 中文字幕99国产精品| 99久热re在线精品99 6热视频| 日本老妇一区| 国产色在线 | 日韩| GOGO熟女人妇大尺度| 亚洲AV电影不卡在线观看| 自偷自拍亚洲综合精品| 人妻大战黑人白浆狂泄| 人妻123区| 人人澡人摸人人添| 51yanqing.cn| 精品无码久久久久国产| 成人动漫久久久| 亚洲国产精品国自产电影| 黑人成人一区二区三区| 精品自拍偷拍一区二区三区| AV天堂国产在线观看| 久久久亚洲欧洲日产国码606 | 婷婷激情六月| 亚洲有码中文一区| 亚洲国产综合一区二区精品| 国产免费一区二区三区网站免费| 亚洲精品一区二区三区大桥未久| 91肥臀大屁股熟女露脸| 欧美成人精品三级在线观看| 精品日产无码| 三級片xxxxx| 色欲综合久久久无码中文字幕波多| 青涩久久综合视频| 国精品无码AV人妻受辱系| 人人妻人人操人人乐| 高潮国产色色色色色色视频| 超碰在线男人的天堂|