夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

不靠英偉達(dá),中科院在國產(chǎn) GPU 上跑通 76B 類腦大模型

0
分享至



SpikingBrain:大模型的第二條進(jìn)化鏈。

作者丨鄭佳美

編輯丨馬曉寧

過去幾年,大模型幾乎都依賴 Transformer,它支撐了 GPT、Claude、Gemini 等一眾前沿模型的進(jìn)步,但也一直被詬病:一旦文本變長,計(jì)算量和內(nèi)存消耗就會成倍膨脹,百萬級 token 幾乎不可承受。與此同時,大模型訓(xùn)練幾乎完全依賴 NVIDIA 的 GPU 體系。從算力到軟件棧,整個行業(yè)被牢牢綁定在 CUDA 上,硬件自主化成了遲遲邁不過去的門檻。

正因?yàn)槿绱耍瑯I(yè)界一直在尋找“下一條路”。有人嘗試混合架構(gòu),有人研究稀疏專家,也有人試水類腦計(jì)算。但這些探索往往停留在小規(guī)模實(shí)驗(yàn),很少能真正跑到大模型層面。

直到最近,中科院團(tuán)隊(duì)拋出了一篇新論文,提出了一個全新系列的類腦大模型SpikingBrain。他們通過引入spiking 神經(jīng)元、線性注意力稀疏專家機(jī)制,不僅在超長文本處理上實(shí)現(xiàn)了百倍加速,還首次在國產(chǎn) GPU 平臺 MetaX上穩(wěn)定訓(xùn)練出 76B 規(guī)模的模型。

同時,SpikingBrain的問世也證明了大模型并不是只能依賴 Transformer + NVIDIA 的組合,另一條通往未來的道路正在被打開。


論文鏈接:https://www.arxiv.org/pdf/2509.05276

01

大模型的新答案

在實(shí)驗(yàn)中,研究團(tuán)隊(duì)在超長上下文任務(wù)上取得了突破性成果。以SpikingBrain-7B為例,當(dāng)輸入長度達(dá)到400 萬 token時,其Time-to-First-Token(首個 token 生成延遲)比傳統(tǒng) Transformer 快了100 倍。換句話說,原本需要長時間等待的超長文本任務(wù),如今幾乎可以做到即時響應(yīng)。


由于脈沖神經(jīng)元只在必要時才會“放電”,模型在推理過程中保持了69.15% 的稀疏激活率——也就是說,大多數(shù)神經(jīng)元在大部分時間處于靜默狀態(tài),不參與計(jì)算。相比始終全量激活的 Transformer,這種機(jī)制顯著降低了算力消耗和能耗。


在訓(xùn)練規(guī)模上,研究團(tuán)隊(duì)共使用1500 億 token,先后訓(xùn)練了兩個核心模型:SpikingBrain-7BSpikingBrain-76B。盡管所用數(shù)據(jù)量遠(yuǎn)少于許多主流開源大模型,這兩款模型在多項(xiàng)基準(zhǔn)測試中的表現(xiàn)依然能夠接近,甚至在部分任務(wù)上追平傳統(tǒng) Transformer。



更關(guān)鍵的是,這些訓(xùn)練完全在國產(chǎn) MetaX C550 GPU 集群上完成。實(shí)驗(yàn)結(jié)果顯示,7B 模型在該平臺上達(dá)到了23.4% 的 FLOPs 利用率,充分證明了它在非 NVIDIA 硬件環(huán)境下依舊能夠保持穩(wěn)定高效的運(yùn)行。


02

從不可微到可擴(kuò)展

為了實(shí)現(xiàn)這些結(jié)果,研究團(tuán)隊(duì)在模型結(jié)構(gòu)、訓(xùn)練方法和系統(tǒng)工程三個層面都做了實(shí)驗(yàn)探索。

架構(gòu)實(shí)驗(yàn)中,團(tuán)隊(duì)對傳統(tǒng) Transformer 做了關(guān)鍵改造。首先,他們將全連接注意力替換為 線性注意力和混合注意力,從根本上緩解了計(jì)算復(fù)雜度隨序列長度平方級增長的瓶頸。

與此同時,他們引入了spiking 神經(jīng)元,讓模型像大腦一樣“按需放電”:只有在需要時才被激活,大多數(shù)時間保持靜默。這種類腦機(jī)制帶來了天然的稀疏性,大幅降低了無效計(jì)算,是 SpikingBrain 在能效上實(shí)現(xiàn)提升的關(guān)鍵所在。


而在系統(tǒng)實(shí)驗(yàn)中,最棘手的挑戰(zhàn)來自硬件環(huán)境。團(tuán)隊(duì)沒有沿用 NVIDIA 的成熟體系,而是選擇在國產(chǎn)MetaX GPU集群上完成全部訓(xùn)練。

為了讓大模型在這一平臺穩(wěn)定運(yùn)行,他們對底層系統(tǒng)進(jìn)行了大規(guī)模優(yōu)化:重寫關(guān)鍵算子庫,改造分布式通信機(jī)制,并針對長時間訓(xùn)練中常見的內(nèi)存溢出與死鎖問題設(shè)計(jì)了專門的解決方案。

憑借這些工程改造,SpikingBrain 不僅在數(shù)百張 MetaX GPU 上成功完成了 7B 模型的穩(wěn)定訓(xùn)練,還順利擴(kuò)展到 76B 參數(shù)規(guī)模,并在此基礎(chǔ)上引入 MoE 稀疏專家機(jī)制,進(jìn)一步提升了模型的性能與效率。

到了訓(xùn)練實(shí)驗(yàn)環(huán)節(jié),為了讓新架構(gòu)真正跑通,團(tuán)隊(duì)設(shè)計(jì)了一個conversion-based pipeline,把 Transformer 成熟的訓(xùn)練經(jīng)驗(yàn)遷移到 SpikingBrain。配合事件觸發(fā)的 spike 編碼,模型中的脈沖神經(jīng)元依然可以通過反向傳播學(xué)習(xí),避免了“不可微”帶來的訓(xùn)練障礙。通過這種遷移式實(shí)驗(yàn)設(shè)計(jì),他們在保證穩(wěn)定性的同時,也逐步擴(kuò)展了模型規(guī)模。


03

一條被點(diǎn)亮的新路線

總體來看,SpikingBrain 的價值不只是跑通了一個新模型,而是用系統(tǒng)性的嘗試回應(yīng)了當(dāng)下大模型最核心的幾個痛點(diǎn)。它在百萬級 token 的長文本上實(shí)現(xiàn)了數(shù)量級的加速,說明類腦機(jī)制在大規(guī)模模型里并不是紙上談兵,而是能帶來真實(shí)收益的方向。

同時,它第一次在國產(chǎn) GPU 上完成了 76B 規(guī)模訓(xùn)練,讓人看到大模型不一定要綁死在 CUDA 上,硬件路線其實(shí)有多種可能。再加上稀疏激活機(jī)制顯著降低了能耗,SpikingBrain 給“大模型能否可持續(xù)”這個老問題提供了一個新答案。

當(dāng)然,SpikingBrain 暫時還不能取代 Transformer,它更像是給行業(yè)提供了一個全新的實(shí)驗(yàn)樣本:證明大模型還有其他路徑可走。至于它能否在更復(fù)雜任務(wù)、更大規(guī)模下保持穩(wěn)定,以及類腦機(jī)制能否發(fā)展成成熟的工具鏈,還需要時間和進(jìn)一步驗(yàn)證?!?/p>

但至少現(xiàn)在,我們已經(jīng)看到,大模型的發(fā)展并不是只有一條路,新的路徑正在一點(diǎn)點(diǎn)被點(diǎn)亮。

未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標(biāo)注來源并插入本公眾號名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
被軍演逼急了,臺當(dāng)局送大陸6個字,美日的反應(yīng)果然如我們所料

被軍演逼急了,臺當(dāng)局送大陸6個字,美日的反應(yīng)果然如我們所料

千里持劍
2025-12-29 12:10:42
姚晨發(fā)文紀(jì)念高崎機(jī)場即將關(guān)閉

姚晨發(fā)文紀(jì)念高崎機(jī)場即將關(guān)閉

韓小娛
2025-12-28 08:59:57
最后的瘋狂:許家印被抓捕的全部過程

最后的瘋狂:許家印被抓捕的全部過程

深度報
2025-12-23 22:48:57
東部戰(zhàn)區(qū)發(fā)布的AI視頻,這個細(xì)節(jié)意味深長

東部戰(zhàn)區(qū)發(fā)布的AI視頻,這個細(xì)節(jié)意味深長

環(huán)球時報國際
2025-12-29 16:51:02
【官宣】于漢超正式退役 以新的身份繼續(xù)為申花效力

【官宣】于漢超正式退役 以新的身份繼續(xù)為申花效力

體壇周報
2025-12-29 12:36:54
四十年夫妻鬧離婚?七旬大爺百萬積蓄被兒賭光,妻子還偷偷給錢……

四十年夫妻鬧離婚?七旬大爺百萬積蓄被兒賭光,妻子還偷偷給錢……

福建第一幫幫團(tuán)
2025-12-24 19:57:51
特朗普與普京通話75分鐘 克宮:俄美都不支持臨時?;鹛岚?>
    </a>
        <h3>
      <a href=特朗普與普京通話75分鐘 克宮:俄美都不支持臨時?;鹛岚?/a> 參考消息
2025-12-29 11:12:04
林徽因?yàn)楹畏磳沼每登€條?她只說了一句:去霍去病墓前看看

林徽因?yàn)楹畏磳沼每登€條?她只說了一句:去霍去病墓前看看

丞丞故事匯
2025-12-29 00:38:31
小米,突發(fā)!創(chuàng)始人減持140億元股票

小米,突發(fā)!創(chuàng)始人減持140億元股票

暴財經(jīng)
2025-12-29 09:03:08
醫(yī)生提醒:若長期一天只吃兩頓飯,用不了半年,或患上這4種疾病

醫(yī)生提醒:若長期一天只吃兩頓飯,用不了半年,或患上這4種疾病

醫(yī)學(xué)原創(chuàng)故事會
2025-12-26 23:54:11
夸張!王楚欽粉絲線下攜帶淫穢物料,聚集造孫穎莎與他人黃謠

夸張!王楚欽粉絲線下攜帶淫穢物料,聚集造孫穎莎與他人黃謠

懂球帝
2025-12-28 19:35:10
太突然了!解放軍做大動作了!宣布即行動,再次進(jìn)行“圍臺”軍演

太突然了!解放軍做大動作了!宣布即行動,再次進(jìn)行“圍臺”軍演

時時有聊
2025-12-29 10:13:57
收評:滬指微漲錄得九連陽 商業(yè)航天、人形機(jī)器人概念持續(xù)爆發(fā)

收評:滬指微漲錄得九連陽 商業(yè)航天、人形機(jī)器人概念持續(xù)爆發(fā)

財聯(lián)社
2025-12-29 15:04:07
震驚雷軍!小米創(chuàng)始人套現(xiàn)140億!

震驚雷軍!小米創(chuàng)始人套現(xiàn)140億!

EETOP半導(dǎo)體社區(qū)
2025-12-29 08:03:53
樂子大了!越南高鐵項(xiàng)目給中國挖坑,結(jié)果掉進(jìn)去了

樂子大了!越南高鐵項(xiàng)目給中國挖坑,結(jié)果掉進(jìn)去了

超級學(xué)爸蛋總
2025-12-28 23:28:22
云南玉溪一副局長被前妻舉報 稱其婚內(nèi)與異性深夜共處一室 紀(jì)檢監(jiān)察機(jī)關(guān)已受理

云南玉溪一副局長被前妻舉報 稱其婚內(nèi)與異性深夜共處一室 紀(jì)檢監(jiān)察機(jī)關(guān)已受理

紅星新聞
2025-12-29 16:46:23
長舌婦不但不討人嫌,還十分性感,島國十大長舌女神

長舌婦不但不討人嫌,還十分性感,島國十大長舌女神

吃瓜黨二號頭目
2025-12-29 10:53:54
康熙將鰲拜滿門抄斬,問其女:可知罪?女孩反問他,當(dāng)場臉色大變

康熙將鰲拜滿門抄斬,問其女:可知罪?女孩反問他,當(dāng)場臉色大變

千秋文化
2025-12-24 23:35:07
2“虎”任上落馬,2名高校領(lǐng)導(dǎo)被處理

2“虎”任上落馬,2名高校領(lǐng)導(dǎo)被處理

上觀新聞
2025-12-29 12:02:09
外交部:中方堅(jiān)決反對以色列承認(rèn)索馬里蘭

外交部:中方堅(jiān)決反對以色列承認(rèn)索馬里蘭

界面新聞
2025-12-29 15:45:35
2025-12-29 17:24:49
AI科技評論 incentive-icons
AI科技評論
點(diǎn)評學(xué)術(shù),服務(wù)AI
7026文章數(shù) 20718關(guān)注度
往期回顧 全部

科技要聞

肉搏非洲,傳音不想只當(dāng)個賣手機(jī)的

頭條要聞

澤連斯基稱未見中方有意愿協(xié)助推動和平 外交部回應(yīng)

頭條要聞

澤連斯基稱未見中方有意愿協(xié)助推動和平 外交部回應(yīng)

體育要聞

“史上最貴”的世界杯,球迷成了韭菜

娛樂要聞

譚松韻扛劇能力被質(zhì)疑 趙麗穎成女主?

財經(jīng)要聞

翁杰明:宏觀數(shù)據(jù)與居民微觀感受存在差距

汽車要聞

一汽正式“入股”零跑,總金額超37億元!

態(tài)度原創(chuàng)

旅游
藝術(shù)
房產(chǎn)
教育
親子

旅游要聞

探索銀發(fā)療養(yǎng)新范式!野鴨湖推出森林療養(yǎng)系列產(chǎn)品

藝術(shù)要聞

克里姆特風(fēng)格的女性人物畫,太美了!

房產(chǎn)要聞

中旅?三亞藍(lán)灣展示中心璀璨綻放,共鑒灣心孤品傳奇

教育要聞

“一人一籍、籍隨人走” 教育部為學(xué)前兒童建立學(xué)籍(央廣網(wǎng))

親子要聞

初三的學(xué)習(xí)壓力真不小,鄰居姐姐看到我家娃用學(xué)而思學(xué)習(xí)機(jī)學(xué)得有

無障礙瀏覽 進(jìn)入關(guān)懷版 久久777国产线看观看精品| 亚洲最大的天堂网| 少妇高潮激情一区二区三| 成人av午夜| 国产精品国产亚洲区艳妇糸列短篇 | 久爱www人成免费网站| 两个人看的www中文在线观看| 中文字幕国产精品第一页| 亚洲黄色视频小说网站| 少妇性爱网站| 欧美视频在线观看一区二区三区| 精品人妻aV无码中文字幕| 韩国无码视频一区| 亚洲av熟女国产一二三| 亚洲国产欧美在线人成AAAA| 欧美黑人巨大xxxxx| 国产肉丝一区二区| 日韩视频一二三| 国产亚洲综合欧美视频| 国产永久视频| 亚洲最大成人在线播放| 欧美激情淫荡XXXXX| 欧洲中文字幕一区二区| 亚州熟女99综合| 亚洲第一av男人的天堂| 亚洲精品成人a v无码| 国产哟交泬泬视频在线播放| 婷婷精品久久久久久久久久不卡| 7777精品久久久大香线蕉| 97一区二区国产好的精华液| 9999久久久久| 我高潮太爽忍不住大叫怎么办| 激情人妻视频| 最新免费AV网站| 国产精品人人做人人爽人人添五月台| 久久精品夜夜夜夜夜久久| 麻豆专区一区二区三区四区五区| 亚洲成人av免费一区| 亚洲色图澳美电影| 久久综合九色综合97欧美| 无码人妻一区二区三区精品不付款|