夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

唯快不破:上海AI Lab 82頁綜述帶你感受LLM高效架構(gòu)的魅力

0
分享至



作者:孫偉高上海人工智能實(shí)驗(yàn)室

近年來,大語言模型(LLMs)展現(xiàn)出強(qiáng)大的語言理解與生成能力,推動(dòng)了文本生成、代碼生成、問答、翻譯等任務(wù)的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等,已經(jīng)深刻改變了人機(jī)交互方式。LLMs 的邊界也不止于語言和簡單問答。隨著多模態(tài)(VLMs)與推理能力(LRMs)的興起,LLMs 正不斷擴(kuò)展到多模態(tài)理解、生成與復(fù)雜推理場景。

但模型性能持續(xù)提升的背后,是模型尺寸、數(shù)據(jù)規(guī)模、RL 推理長度的快速 Scaling,是算力和存儲(chǔ)資源的急劇消耗。大模型的訓(xùn)練與推理的成本居高不下,成為制約其廣泛落地和應(yīng)用的現(xiàn)實(shí)瓶頸。

本文從 LLM 架構(gòu)角度出發(fā),帶你剖析大模型的效率秘訣。這一切的核心在于 Transformer 架構(gòu)。Transformer 的自注意力機(jī)制雖帶來了遠(yuǎn)距離建模的突破,卻因O(N2)的復(fù)雜度在長序列任務(wù)中成本高昂。而在 RAG、智能體、長鏈推理、多模態(tài)等新興場景下,長序列需求愈發(fā)突出,進(jìn)一步放大了效率與性能之間的矛盾。同時(shí) Transformer 的 FFN 部分采用密集的 MLP 層,同樣面臨模型規(guī)模放大后的訓(xùn)練和推理效率問題。

近年來針對(duì) Transformer 架構(gòu)改進(jìn)的創(chuàng)新工作層出不窮,卻一直缺乏一篇全面深入的綜述文章進(jìn)行總結(jié)。



圖 1:常見長序列場景

近期,上海 AI Lab聯(lián)合港科廣、澳門大學(xué)、中科院自動(dòng)化所、蘇州大學(xué)、瑞典 KTH、北大、港中文等多家機(jī)構(gòu),總結(jié) 440 余篇相關(guān)論文,深入探討了當(dāng)前LLM 高效結(jié)構(gòu)的最新進(jìn)展,形成這篇 82 頁的綜述論文:



  • 論文標(biāo)題:Speed Always Wins: A Survey on Efficient Architectures for Large Language Models
  • 論文地址:
  • https://arxiv.org/pdf/2508.09834
  • 項(xiàng)目倉庫:
  • https://github.com/weigao266/Awesome-Efficient-Arch



圖 2:大語言模型高效架構(gòu)概覽

該綜述將目前 LLM 高效架構(gòu)總結(jié)分類為以下 7 類:

  • 線性序列建模:降低注意力訓(xùn)練和推理復(fù)雜度,無需 KV Cache 開銷。
  • 稀疏序列建模:通過稀疏化注意力矩陣,降低計(jì)算與顯存需求。
  • 高效全注意力:在保持完整注意力的前提下優(yōu)化內(nèi)存訪問與 KV 存儲(chǔ)。
  • 稀疏專家模型:通過條件激活部分專家,大幅提升模型容量而不增加等比例計(jì)算成本。
  • 混合模型架構(gòu):結(jié)合線性/稀疏序列建模與全注意力,兼顧效率與性能。
  • 擴(kuò)散語言模型:利用非自回歸的擴(kuò)散模型進(jìn)行語言生成。
  • 其他模態(tài)應(yīng)用:將這些高效架構(gòu)應(yīng)用于視覺、語音、多模態(tài)模型。

這些方向的探索不僅關(guān)乎 LLM 的未來效率,也關(guān)乎如何在算力受限的條件下,持續(xù)推動(dòng) AI 走向更強(qiáng)的智能的關(guān)鍵選擇。綜述涉及的方法類別和代表性論文可見如下樹狀圖:



圖 3:綜述完整組織架構(gòu)

線性序列建模

線性序列建模是近年來研究相當(dāng)火熱的一個(gè)方向,代表性工作像Mamba、Lighting Attention、RWKV、GLA、TTT 等在模型架構(gòu)方向都引起過廣泛關(guān)注。我們將這類技術(shù)細(xì)分為以下幾個(gè)類別:

  • 線性注意力
  • 線性 RNN
  • 狀態(tài)空間模型
  • 測試時(shí)推理 RNN

并且正如在多篇文獻(xiàn)里已經(jīng)提出的,這些線性序列建模方法可以概括為統(tǒng)一建模的數(shù)學(xué)形式,并且能夠通過線性化過程將預(yù)訓(xùn)練模型權(quán)重的 Softmax Attention 架構(gòu)轉(zhuǎn)為 Linear Sequence Modeling 架構(gòu),從而獲得模型效率的大幅提升,如下圖所示。



圖 4:線性序列建模方法

我們將已有的線性序列建模方法從記憶視角和優(yōu)化器視角分別進(jìn)行梳理和對(duì)比,詳細(xì)形式可見下表:



表 1:線性序列建模方法統(tǒng)一建模的 Memory 視角和 Optimizer 視角

其中線性化技術(shù)可以進(jìn)一步細(xì)分為基于微調(diào)的線性化,和基于蒸餾的線性化,如下圖所示:



圖 5:線性化方法

綜述還進(jìn)一步總結(jié)歸納了目前在線性序列建模領(lǐng)域常見的硬件高效實(shí)現(xiàn)方法,可以歸納為 Blelloch Scan、Chunk-wise Parallel 和 Recurrent for Inferences,如下圖所示:



圖 6:線性序列建模方法的硬件高效實(shí)現(xiàn)

稀疏序列建模

稀疏序列建模是另一類有代表性的高效注意力機(jī)制,通過利用 Attention Map 天然具有的稀疏性加速注意力的計(jì)算,這類方法可以進(jìn)一步細(xì)分為:

  • 靜態(tài)稀疏注意力
  • 動(dòng)態(tài)稀疏注意力
  • 免訓(xùn)練稀疏注意力

代表性的稀疏注意力方法如 Global Attention、Window Attention、Dilated Attention 等,及其工作原理如下圖所示:



圖 7:稀疏注意力的幾種經(jīng)典形式

高效全注意力

另一類高效注意力算法可以統(tǒng)一歸納為高效全注意力,這類方法可以根據(jù)算法思路進(jìn)一步細(xì)分為如下幾類:

  • IO-Aware Attention
  • Grouped Attention
  • Mixture of Attention
  • Quantized Attention

其中 IO-Aware Attention 指代目前使用非常廣泛的Flash Attention系列工作,Grouped Attention 則包含廣為使用的 GQA、MLA等全注意力變體,幾種代表性方法如下圖所示。



圖 8:Grouped Attention 的幾種代表性方法

稀疏混合專家

稀疏混合專家是對(duì) Transformer 架構(gòu)中另一個(gè)重要模塊 FFN 做的一類重要改進(jìn),已經(jīng)逐漸成為(語言和多模態(tài))大模型架構(gòu)的事實(shí)標(biāo)準(zhǔn)。綜述中將相關(guān)文獻(xiàn)按以下三個(gè)方向進(jìn)行分類:

  • Routing Mechanisms
  • Expert Architectures
  • MoE Conversion

路由機(jī)制包括 Token-choice 和 Expert-choice 兩類,其原理如下圖所示:



圖 9:MoE 路由機(jī)制

專家結(jié)構(gòu)的創(chuàng)新工作包括:共享專家、細(xì)粒度專家、零專家、深度路由等,其作用和原理可見下圖:



圖 10:MoE 專家架構(gòu)

另外一個(gè)重要的方向是 MoE 轉(zhuǎn)換,已有的工作包括通過 Split、Copy、Merge 等手段對(duì)專家進(jìn)行構(gòu)造,如下圖所示:



圖 11:MoE 轉(zhuǎn)化機(jī)制

混合架構(gòu)

混合架構(gòu)是近年來出現(xiàn)的一種實(shí)用的新型架構(gòu),可以在線性/稀疏注意力和全注意力之間取得微妙的 Trade-off,也在效率和效果間找到了最佳甜蜜點(diǎn)。具體可細(xì)分為:

  • 層間混合
  • 層內(nèi)混合



圖 12:混合架構(gòu)形式

擴(kuò)散大語言模型

擴(kuò)散大語言模型是近期出現(xiàn)的一個(gè)熱門方向,創(chuàng)新性地將擴(kuò)散模型從視覺生成任務(wù)遷移至語言任務(wù),從而在語言生成速度上取得大幅進(jìn)步。相關(guān)工作可以細(xì)分為:

  • Non-Autoregressive Diffusion LLM
  • Bridging Diffusion LLM and Autoregressive
  • Extending Diffusion LLM to Multimodality



圖 13:擴(kuò)散大語言模型機(jī)制

應(yīng)用至其他模態(tài)

最后一個(gè)重要的部分是高效架構(gòu)在其他模態(tài)上的應(yīng)用,涵蓋視覺、音頻和多模態(tài)。以 Mamba 為代表的線性模型被廣泛應(yīng)用至多種模態(tài)任務(wù)上,并取得了優(yōu)秀的表現(xiàn),綜述將這類模型總結(jié)梳理至如下表格:



寄語

最后正如帝國時(shí)代 3 中這條神奇代碼「Speed Always Wins」能讓游戲世界「Increases build, research,shipment, and gather rates by 100 times for all players」一樣,我們希望綜述中的 Efficient Architectures 可以真被用來 100x 加速 AI 世界的構(gòu)建,更快更便宜地訓(xùn)練出更強(qiáng)更實(shí)用的大模型。請(qǐng)記住這條神奇代碼:「Speed Always Wins」

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
國安新帥曝光!歐洲名帥有望加盟,是國內(nèi)球迷老熟人,曾率隊(duì)奪冠

國安新帥曝光!歐洲名帥有望加盟,是國內(nèi)球迷老熟人,曾率隊(duì)奪冠

體壇鑒春秋
2025-12-13 11:33:35
砸50億!從網(wǎng)紅小城到摩天地標(biāo)!230米淄博第一高樓

砸50億!從網(wǎng)紅小城到摩天地標(biāo)!230米淄博第一高樓

GA環(huán)球建筑
2025-12-13 11:09:42
給人養(yǎng)了7年閑人,廣汽終于要關(guān)閉洛杉磯的研發(fā)中心

給人養(yǎng)了7年閑人,廣汽終于要關(guān)閉洛杉磯的研發(fā)中心

與車同樂
2025-12-04 10:05:02
知名女星查理茲·塞隆因近照太年輕引發(fā)爭議

知名女星查理茲·塞隆因近照太年輕引發(fā)爭議

環(huán)球網(wǎng)資訊
2025-12-10 17:28:10
傷停16天復(fù)出就轟39+6三分!庫里末節(jié)14分盡力局 勇士太需要交易

傷停16天復(fù)出就轟39+6三分!庫里末節(jié)14分盡力局 勇士太需要交易

顏小白的籃球夢(mèng)
2025-12-13 13:45:23
謝振軒現(xiàn)身深圳,父子關(guān)系成謎,星二代悄悄長大

謝振軒現(xiàn)身深圳,父子關(guān)系成謎,星二代悄悄長大

TVB的四小花
2025-12-13 14:31:45
茼蒿立大功!醫(yī)生調(diào)查發(fā)現(xiàn):茼蒿對(duì)這5種疾病有好處,建議常吃

茼蒿立大功!醫(yī)生調(diào)查發(fā)現(xiàn):茼蒿對(duì)這5種疾病有好處,建議常吃

阿纂看事
2025-10-13 15:36:03
小偷半夜溜進(jìn)單身女子家,意外撞破美女秘密……

小偷半夜溜進(jìn)單身女子家,意外撞破美女秘密……

極品小牛肉
2024-04-28 11:24:09
帶兒子獨(dú)守娘家真相大白,潘陽坦白婚姻情況,難怪看不到老公出鏡

帶兒子獨(dú)守娘家真相大白,潘陽坦白婚姻情況,難怪看不到老公出鏡

阿訊說天下
2025-12-03 16:11:43
U型場地世界杯,谷愛凌實(shí)現(xiàn)世界杯崇禮站三連冠

U型場地世界杯,谷愛凌實(shí)現(xiàn)世界杯崇禮站三連冠

澎湃新聞
2025-12-13 12:50:26
夫妻薅商場免費(fèi)停車福利轉(zhuǎn)賣,還把方法教給父親、弟弟、弟媳,致多個(gè)商場損失超50萬;一家五口全部落網(wǎng),警方披露案件詳情

夫妻薅商場免費(fèi)停車福利轉(zhuǎn)賣,還把方法教給父親、弟弟、弟媳,致多個(gè)商場損失超50萬;一家五口全部落網(wǎng),警方披露案件詳情

極目新聞
2025-12-11 20:36:01
中日若開戰(zhàn),絕非“俄烏模式”,一旦開打就是不死不休的滅國戰(zhàn)

中日若開戰(zhàn),絕非“俄烏模式”,一旦開打就是不死不休的滅國戰(zhàn)

南權(quán)先生
2025-11-28 17:10:02
美國慌了!這位中國女科學(xué)家,讓東風(fēng)-17成為反導(dǎo)系統(tǒng)的噩夢(mèng)

美國慌了!這位中國女科學(xué)家,讓東風(fēng)-17成為反導(dǎo)系統(tǒng)的噩夢(mèng)

宅家伍菇?jīng)?/span>
2025-12-08 09:00:04
北理工教授愛上男學(xué)生后續(xù)!與舉報(bào)強(qiáng)奸的學(xué)生和好,炸裂往事被扒

北理工教授愛上男學(xué)生后續(xù)!與舉報(bào)強(qiáng)奸的學(xué)生和好,炸裂往事被扒

派大星紀(jì)錄片
2025-12-10 15:41:34
涉詐百億!影視巨頭華文映像創(chuàng)始人被抓,名嘴被牽連?

涉詐百億!影視巨頭華文映像創(chuàng)始人被抓,名嘴被牽連?

文娛春秋Plus
2025-12-12 13:22:07
造紙廠儲(chǔ)罐發(fā)現(xiàn)3具女尸,法醫(yī):三人為親姐妹,生前骨盆均被破壞

造紙廠儲(chǔ)罐發(fā)現(xiàn)3具女尸,法醫(yī):三人為親姐妹,生前骨盆均被破壞

罪案洞察者
2025-10-28 15:33:21
普京智囊做出預(yù)言:下一個(gè)爆發(fā)戰(zhàn)爭的地方既不是臺(tái)海,也不是南海

普京智囊做出預(yù)言:下一個(gè)爆發(fā)戰(zhàn)爭的地方既不是臺(tái)海,也不是南海

策略述
2025-12-13 14:19:33
57歲楊瀾近照曝光!濃妝難掩老態(tài),假發(fā)痕跡明顯,臉腫了很多

57歲楊瀾近照曝光!濃妝難掩老態(tài),假發(fā)痕跡明顯,臉腫了很多

小徐講八卦
2025-12-13 09:51:13
37集諜戰(zhàn)大劇來襲,演員陣容雄厚,越看越上頭,國產(chǎn)諜戰(zhàn)劇黑馬

37集諜戰(zhàn)大劇來襲,演員陣容雄厚,越看越上頭,國產(chǎn)諜戰(zhàn)劇黑馬

阿樂樂電影v
2025-12-13 13:35:07
靠游戲搬磚日入1000!90后網(wǎng)友小縣城開超市,自白:狗不干我干!

靠游戲搬磚日入1000!90后網(wǎng)友小縣城開超市,自白:狗不干我干!

天下奇聞縱覽
2025-12-11 16:37:39
2025-12-13 15:23:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11907文章數(shù) 142509關(guān)注度
往期回顧 全部

科技要聞

比亞迪、小鵬、北汽,集體表態(tài)

頭條要聞

女子在二手平臺(tái)買到被偷走的新衣服 約定線下交易報(bào)警

頭條要聞

女子在二手平臺(tái)買到被偷走的新衣服 約定線下交易報(bào)警

體育要聞

有了風(fēng)騷白人禿頭,忘掉談了10年的前任

娛樂要聞

保劍鋒方回應(yīng)爭議,否認(rèn)出軌贈(zèng)送香水

財(cái)經(jīng)要聞

鎂信健康闖關(guān)港交所:被指竊取商業(yè)秘密

汽車要聞

表面風(fēng)平浪靜 內(nèi)里翻天覆地!試駕銀河星艦7 EM-i

態(tài)度原創(chuàng)

數(shù)碼
健康
教育
游戲
公開課

數(shù)碼要聞

PC行業(yè)的2025:形態(tài)在變,架構(gòu)在變,體驗(yàn)也在變

甲狀腺結(jié)節(jié)到這個(gè)程度,該穿刺了!

教育要聞

自家娃逆襲重點(diǎn)高中:初中三年別盯作業(yè),真正的托舉是3種能力

魔獸世界:史上公認(rèn)黑手玩家必摸的廢材裝備,90%玩家不敢要!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 最新国产精品好看的精品| 国产区图片区小说区亚洲区| 国语对白9色| 亚洲成年av天堂动漫网站| 99热在线观看精品蜜臀| 欧美精产国品一二三类产品特点| 精品国产毛片久久久| 亚洲日韩熟女| 亚洲色www成人永久网址| 亚州av综合色区无码一区| 国产成人AVXXXXX在线观看| 在线观看片免费视频无码| 夜夜澡天天碰人人爱av| 91精品网站| 欧美作爱视频| 成人无码免费一区二区三区| 性按摩xxxx在线观看| 国产一区二区福利| 色哟哟 入口国产精品| 久久国产自偷自偷免费一区| 蜜桃人妻少妇精品无码av| 久热最新地址| 色悠久久久久综合网伊| 无码人妻系列不卡免费视频| 久久精品国产亚洲AV熟女| 又爽又黄又无遮挡的激情视频| 蜜臀AV成人| 人人操人人摸人人射| 亚洲欧美中文字幕日韩一区二区 | 麻豆精品一区二区综合av| 99久久久国产精品免费动| 国产一级淫片免费播放电影| 在线 | 一区二区三区四区| Xvideos精品国产| 无码人妻精品一区二区| 无码一区二区三区av免费蜜桃 | 漂亮人妻洗澡中文字幕久久婷| 成人午夜一区二区视频网站| 亚洲香蕉网久久综合影视| 男人扒开女人腿桶到爽免费| 香蕉久久国产超碰青草|