夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Kimi開源新線性注意力架構(gòu),首次超越全注意力模型,推理加速6倍

0
分享至

聞樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

Transformer的時代,正在被改寫。

月之暗面最新發(fā)布的開源Kimi Linear架構(gòu),用一種全新的注意力機(jī)制,在相同訓(xùn)練條件下首次超越了全注意力模型



在長上下文任務(wù)中,它不僅減少了75%的KV緩存需求,還實現(xiàn)了高達(dá)6倍的推理加速。



有網(wǎng)友表示期待:這個架構(gòu)下的Kimi K2.5何時來??



不過,咱還是先來看一下Kimi Linear是如何挑戰(zhàn)傳統(tǒng)Transformer的。

讓注意力真正線性化

Transformer確實聰明,但聰明得有點太燒錢。

它的注意力機(jī)制是全連接的,每個token都要和其他所有token打交道。

計算量也隨著輸入長度呈平方增長(O(N2)),而且每生成一個新詞,還要查一遍之前的所有緩存。

這就導(dǎo)致推理階段的KV Cache占顯存極大,尤其是在128K以上的上下文中,顯卡直接崩潰警告。

模型越強(qiáng),顯卡越崩,錢包越痛。



所以,過去幾年無數(shù)團(tuán)隊都在研究線性注意力,希望把計算從 O(N2) 降到 O(N),讓模型能又快又省。

但問題是,以前的線性注意力都記不住東西,快是快了,but智商打折。

現(xiàn)在,Kimi Linear以既要又要還要的姿態(tài)登場了。



Kimi Linear的核心創(chuàng)新是Kimi Delta Attention(KDA)

它在原有線性注意力的基礎(chǔ)上,引入了細(xì)粒度遺忘門控,不再像傳統(tǒng)線性注意力那樣一刀切地遺忘,而是讓模型可以在每個通道維度上獨立地控制記憶保留,把重要信息留下,把冗余信息扔掉。

更關(guān)鍵的是,KDA的狀態(tài)更新機(jī)制是基于一種改進(jìn)的Delta Rule(增量學(xué)習(xí)規(guī)則)。

它在數(shù)學(xué)上保證了穩(wěn)定性,即使是在百萬級token序列中,梯度也不會爆炸或消失。

這也讓Kimi Linear能在超長上下文中跑得穩(wěn)。

整個模型采用3:1的混合層設(shè)計,每3層線性注意力(KDA)后加1層全注意力。這樣既保留全局語義的建模能力,又能在多數(shù)層用線性計算節(jié)省資源。

團(tuán)隊還干脆把傳統(tǒng)的RoPE(旋轉(zhuǎn)位置編碼)砍掉,讓KDA自己通過時間衰減核函數(shù)學(xué)習(xí)序列位置信息。

結(jié)果,沒有RoPE,模型反而更穩(wěn)、更泛化。



在KDA的狀態(tài)更新過程中,Kimi Linear用了一種叫Diagonal-Plus-Low-Rank(DPLR)的結(jié)構(gòu)。

核心思路是把注意力矩陣拆成「對角塊+低秩補(bǔ)丁」,這樣GPU在并行計算時能一次性處理更多內(nèi)容,吞吐率直接翻倍。

此外,團(tuán)隊還引入了分塊并行計算和kernel fusion優(yōu)化(內(nèi)核融合),極大地減少了顯存I/O開銷。

在工程部署上,它還能無縫對接vLLM推理框架,不需要改模型結(jié)構(gòu),也不需要改緩存管理,直接替換即可。

這意味著,任何基于Transformer的系統(tǒng)在理論上都能一鍵升級為Kimi Linear。

實驗結(jié)果顯示,在相同訓(xùn)練規(guī)模下,比如1.4T tokens,Kimi Linear在MMLU、BBH、RULER、GPQA-Diamond等多個基準(zhǔn)測試上全面超越Transformer。



長上下文推理中,解碼速度提升最高達(dá)6倍,KV緩存減少75%。



不僅沒丟精度,還在數(shù)學(xué)推理、代碼生成等任務(wù)上更穩(wěn)定、更高分。



One More Thing

不得不說,Transformer的地位正在被重新審視。

Mamba的作者曾用長文論述Transformer并非最終解法,狀態(tài)空間模型(SSM)在長序列建模和高效計算上展現(xiàn)出強(qiáng)大的替代潛力,這也讓人們重新思考注意力是否真的是唯一答案。

之前谷歌推出的MoR架構(gòu),探索用遞歸結(jié)構(gòu)取代部分注意力,通過動態(tài)計算深度來減少冗余推理,進(jìn)一步提升效率。

蘋果公司也在多項研究中傾向采用Mamba,而非傳統(tǒng)Transformer,理由很現(xiàn)實——SSM架構(gòu)更節(jié)能、延遲更低、適合在終端設(shè)備上部署。

現(xiàn)在,Kimi Linear則從另一條路線突圍,在線性注意力方向上取得突破。

或許這也預(yù)示著,AI架構(gòu)正在告別對傳統(tǒng)Transformer的路徑依賴,邁向多元創(chuàng)新時代。

但值得一提的是,剛剛坐上開源模型王座的MiniMax M2,卻重新用回了全注意力機(jī)制。

技術(shù)報告:https://huggingface.co/moonshotai/Kimi-Linear-48B-A3B-Instruct

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
國防部下通牒,點名收拾賴清德,美國也出手了,扣留千億售臺軍火

國防部下通牒,點名收拾賴清德,美國也出手了,扣留千億售臺軍火

南宗歷史
2025-10-31 15:59:17
專戳人肺管子!何賽飛上綜藝“治”劉嘉玲,寧靜靠邊站不敢說話

專戳人肺管子!何賽飛上綜藝“治”劉嘉玲,寧靜靠邊站不敢說話

觀察鑒娛
2025-10-26 16:45:35
降息150點后,華爾街已聞到血腥味,留給特朗普的時間或許不多了

降息150點后,華爾街已聞到血腥味,留給特朗普的時間或許不多了

三石記
2025-10-31 10:55:31
美專家:抗美援朝若讓粟裕代替彭德懷領(lǐng)兵,輸?shù)母鼞K!僅憑三點

美專家:抗美援朝若讓粟裕代替彭德懷領(lǐng)兵,輸?shù)母鼞K!僅憑三點

南書房
2025-10-26 14:22:44
一個小科員,居然“五毒俱全”……

一個小科員,居然“五毒俱全”……

槽邏輯
2025-10-31 18:53:29
楊采鈺上海辦義賣會,親媽出場比她還有氣質(zhì),一身大牌貴氣又年輕

楊采鈺上海辦義賣會,親媽出場比她還有氣質(zhì),一身大牌貴氣又年輕

一只番茄魚
2025-10-31 14:43:04
2025年終總決賽席位揭曉!中國隊主場沖5金,男雙或最不被看好?

2025年終總決賽席位揭曉!中國隊主場沖5金,男雙或最不被看好?

羅掌柜體育
2025-10-31 10:33:50
軍事上不如彭老總,政治上不及周總理,他憑什么成了國家核心領(lǐng)導(dǎo)

軍事上不如彭老總,政治上不及周總理,他憑什么成了國家核心領(lǐng)導(dǎo)

歷史龍元閣
2025-10-30 21:54:22
馬英九:若大陸統(tǒng)一臺灣的手段不和平,過程不民主,臺灣人不接受

馬英九:若大陸統(tǒng)一臺灣的手段不和平,過程不民主,臺灣人不接受

近史談
2025-08-23 14:31:59
假戲真做?趙本山“御用老伴”關(guān)婷娜至今未嫁未育,已經(jīng)步入中年

假戲真做?趙本山“御用老伴”關(guān)婷娜至今未嫁未育,已經(jīng)步入中年

普覽
2025-10-30 21:15:54
可以暫時信

可以暫時信

求實處
2025-10-31 23:20:57
最抽象的是,這事兒是真的

最抽象的是,這事兒是真的

我是歷史其實挺有趣
2025-10-31 09:13:33
竇靖童宋妍霏牽手遛狗,被曝同住2年,超多情侶款曝光,早有可循

竇靖童宋妍霏牽手遛狗,被曝同住2年,超多情侶款曝光,早有可循

胡一舸南游y
2025-10-30 19:09:53
1200人擠在大海中央生活一輩子:沒有法律、沒有婚姻,人均活90歲

1200人擠在大海中央生活一輩子:沒有法律、沒有婚姻,人均活90歲

歷史有些冷
2025-10-30 21:35:03
悉尼妹紅毯殺瘋了!銀色透視裙盡顯性感,自信氣場碾壓全場

悉尼妹紅毯殺瘋了!銀色透視裙盡顯性感,自信氣場碾壓全場

述家娛記
2025-10-31 14:04:50
張?zhí)m自曝大瓜!筱梅生了孩子親家?guī)?,她掙奶粉錢,汪小菲不讓她帶

張?zhí)m自曝大瓜!筱梅生了孩子親家?guī)?,她掙奶粉錢,汪小菲不讓她帶

小咪侃娛圈
2025-10-31 10:49:20
許紹雄后事安排公布,將于11月18日出殯,喪事帛金全數(shù)捐贈“兒童癌病基金”

許紹雄后事安排公布,將于11月18日出殯,喪事帛金全數(shù)捐贈“兒童癌病基金”

鄉(xiāng)野小珥
2025-10-31 21:45:43
警惕!這種“毒碗”已經(jīng)上黑榜了,檢查一下,家里有的趕緊扔了吧

警惕!這種“毒碗”已經(jīng)上黑榜了,檢查一下,家里有的趕緊扔了吧

削桐作琴
2025-10-24 15:45:22
謝霆鋒大兒子謝振軒,和爺爺謝賢同框,爺孫倆眉眼像一個模子刻的

謝霆鋒大兒子謝振軒,和爺爺謝賢同框,爺孫倆眉眼像一個模子刻的

八星人
2025-10-29 11:55:07
文班27+18+6創(chuàng)5大紀(jì)錄仍無緣日最佳!他遇到創(chuàng)生涯新高的勇士舊將

文班27+18+6創(chuàng)5大紀(jì)錄仍無緣日最佳!他遇到創(chuàng)生涯新高的勇士舊將

毒舌NBA
2025-10-31 12:34:05
2025-11-01 00:12:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11610文章數(shù) 176317關(guān)注度
往期回顧 全部

科技要聞

蘋果日賺22億,庫克最大的煩惱是賣斷貨

頭條要聞

媒體:中美元首在釜山談了100分鐘 向世界發(fā)出重要信號

頭條要聞

媒體:中美元首在釜山談了100分鐘 向世界發(fā)出重要信號

體育要聞

在無數(shù)明星的注視下,他們踢著“意大利最好看的足球”

娛樂要聞

和龔俊演完《暗河傳》,她終于紅了

財經(jīng)要聞

以前買不起房,現(xiàn)在賣不起房

汽車要聞

東風(fēng)日產(chǎn)“油電同智”戰(zhàn)略首車 天籟·鴻蒙座艙亮相

態(tài)度原創(chuàng)

時尚
本地
旅游
家居
軍事航空

天冷了,“彩色毛衣”這么穿美翻了!

本地新聞

全網(wǎng)圍觀,到底多少人被這個野人大學(xué)生笑瘋了

旅游要聞

寶藏小城丨博山:從舌尖到指尖,“琉璃之鄉(xiāng)”緣何讓人流連忘返

家居要聞

吸睛藝術(shù) 富有傳奇色彩

軍事要聞

俄官宣“末日魚雷”完成核動力試驗

無障礙瀏覽 進(jìn)入關(guān)懷版 狠狠骑夜夜爽| 粉嫩人妻一区| 意大利高清XXXX极品| 久久2017国产视频| 水蜜桃国产成人精品网站| 亚洲中文字幕成人在线视频| 国产性生大片免费观看性欧美| 天美传媒i少妇色哟哟视频| 97夜夜澡人人爽人人模人人喊| 中文字幕精品一区二区三区人妻| 青青草国产免费国产是公开| 日本在线小电影| JIZZJIZZ国产| 97在线拍偷自揄| 国产最好看的级SUV卡毛| 奇米这里只有精品| 久久99精品久久久久婷婷| 黑人少妇BWW性HD| 欧美三极视频| 动漫人妻H无码人妻动漫| 人妻内射一区二区在线视频| 有没有能看的免费黄色毛片| 国语精品一区二区三区| 欧美成人福利网站| 亚洲色欲大片AAA无码| 久久人人爽人人爽人人片av不| 色综合久久一区二区三区| 国产拗女一区二区三区| 天堂V亚洲国产V第一次| 欧美性受XXXX黑人猛交免费看| 免费国产午夜理论片不卡 | 国产极品白嫩| 亚洲欧美一区另类中文字幕| 一区二区三区线观看视频| 国产xxxx视频在线观看| 懂色av粉嫩av色欲av| 色婷婷久久啪啪一区二区| 精品伦子伦一区二区三区| 国产精品主播| 蜜桃成人无码| 亚洲熟女一区二区三区三|