機(jī)器之心報(bào)道
機(jī)器之心編輯部
2025 年 9 月 29 日,深度求索公司發(fā)布新一代模型架構(gòu) DeepSeek-V3.2 ,引發(fā)行業(yè)廣泛關(guān)注。令人矚目的是,在該大模型發(fā)布的同時(shí),寒武紀(jì)也官宣了對(duì) DeepSeek-V3.2 的適配,并開(kāi)源大模型推理引擎 vLLM 源代碼。
深度求索公司正式發(fā)布的 DeepSeek-V3.2-Exp 模型,是一個(gè)實(shí)驗(yàn)性(Experimental)的版本。作為邁向新一代架構(gòu)的中間步驟,V3.2-Exp 在 V3.1-Terminus 的基礎(chǔ)上引入了 DeepSeek Sparse Attention(一種稀疏注意力機(jī)制),針對(duì)長(zhǎng)文本的訓(xùn)練和推理效率進(jìn)行了探索性的優(yōu)化和驗(yàn)證。
目前,DeepSeek 官方 App、網(wǎng)頁(yè)端、小程序均已同步更新為 DeepSeek-V3.2-Exp,同時(shí)API 大幅度降價(jià),歡迎廣大用戶體驗(yàn)測(cè)試并提供反饋意見(jiàn)。
同時(shí),寒武紀(jì)已同步實(shí)現(xiàn)對(duì)深度求索公司最新模型 DeepSeek-V3.2-Exp 的適配,并開(kāi)源大模型推理引擎 vLLM-MLU 源代碼。代碼地址和測(cè)試步驟見(jiàn)文末,開(kāi)發(fā)者可以在寒武紀(jì)軟硬件平臺(tái)上第一時(shí)間體驗(yàn) DeepSeek-V3.2-Exp 的亮點(diǎn)。
這一同步發(fā)布適配的“高能”操作,在業(yè)內(nèi)專家看來(lái),背后蘊(yùn)含著中國(guó)頂尖科技企業(yè)深度協(xié)同的重要信號(hào)。
從技術(shù)層面來(lái)看,這款新大模型的體量相當(dāng)可觀,達(dá)到了 671GB 。據(jù)行業(yè)測(cè)算,在帶寬充足的理想條件下,僅完成該大模型的下載,就需要耗費(fèi)約 8-10 個(gè)小時(shí)。而芯片與大模型的適配,涉及底層架構(gòu)優(yōu)化、算力資源匹配、兼容性調(diào)試等一系列復(fù)雜工作,絕非短時(shí)間內(nèi)能夠完成。
有 AI 行業(yè)資深專家分析指出:“如此快速的適配響應(yīng),充分說(shuō)明寒武紀(jì)早在 DeepSeek-V3.2 發(fā)布前就已啟動(dòng)適配研發(fā),雙方在技術(shù)層面的溝通與協(xié)作早已悄然展開(kāi)。雙方都是低調(diào)務(wù)實(shí)的公司,前期秘而不宣,估計(jì)早就已經(jīng)相向而行了?!本芙^炒作、專注技術(shù),正是當(dāng)下中國(guó)頂尖科技企業(yè)行事風(fēng)格的典型體現(xiàn)。
全球 AI 競(jìng)爭(zhēng)日趨激烈,中國(guó) AI 產(chǎn)業(yè)要想在國(guó)際舞臺(tái)上站穩(wěn)腳跟、占據(jù)優(yōu)勢(shì)地位,離不開(kāi)頭部企業(yè)間的深度協(xié)同合作。此次大模型與 AI 芯片領(lǐng)軍企業(yè)的快速聯(lián)動(dòng),正是國(guó)內(nèi)高科技企業(yè)協(xié)同創(chuàng)新的有力例證。
我們可以期待,本次產(chǎn)業(yè)鏈上下游領(lǐng)軍企業(yè)的深度協(xié)同,將大幅降低大模型用戶在長(zhǎng)序列場(chǎng)景下的訓(xùn)推成本,助力 AI 應(yīng)用的 “涌現(xiàn)”。
DeepSeek開(kāi)源模型獲取方式:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
vLLM-MLU DeepSeek-V3.2-Exp適配的源碼獲取方式:
https://github.com/Cambricon/vllm-mlu
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.