國產(chǎn)模型+國產(chǎn)芯片“蜜月期”開啟！DeepSeek、智譜密集上新華為、寒武紀(jì)芯片火速適配

2025-09-30 21:08:08　來源: 科創(chuàng)板日報

上海舉報

分享至

《科創(chuàng)板日報》9月30日訊（記者李明明）又一家國內(nèi)大模型宣布適配國產(chǎn)芯片！

今日，智譜發(fā)布及開源新一代大模型GLM-4.6，并介紹其整體性能超越DeepSeek最新模型DeepSeek-V3.2-Exp。這是繼DeepSeek-V3.2-Exp與Claude Sonnet 4.5之后，國慶節(jié)前業(yè)界的又一技術(shù)發(fā)布。

值得一提的是，智譜官宣GLM-4.6在寒武紀(jì)國產(chǎn)芯片實現(xiàn)FP8+Int4混合量化部署，為首套投產(chǎn)的該模式芯片一體方案，其基于vLLM框架，還可在摩爾線程新一代GPU原生FP8精度穩(wěn)定運行。

《科創(chuàng)板日報》記者注意到，近期國產(chǎn)大模型與國產(chǎn)芯片的協(xié)同發(fā)展取得了一定突破，核心是 DeepSeek-V3.2模型的發(fā)布與國產(chǎn)芯片的"Day 0適配"（通常指在某個新系統(tǒng)、新平臺、新設(shè)備或新功能正式發(fā)布的第一天（Day 0）就完成適配工作），以及智譜GLM-4.6模型與芯片的深度融合。

這標(biāo)志著標(biāo)志國產(chǎn)GPU具備與前沿大模型協(xié)同迭代能力，國產(chǎn)AI生態(tài)可能正從"可用"向"好用"演進。

GLM-4.6適配寒武紀(jì)、摩爾線程

智譜方面有關(guān)人士介紹，在公開基準(zhǔn)測試和真實編程任務(wù)中，GLM-4.6的代碼生成能力已全面對齊Claude Sonnet 4，成為目前國內(nèi)最強的Coding模型。同時，模型在長上下文處理、推理能力、信息檢索、文本生成及智能體應(yīng)用等方面均實現(xiàn)全面升級，整體性能超越DeepSeek最新模型DeepSeek-V3.2-Exp。

作為開源模型，GLM-4.6目前是全球開源生態(tài)中性能最強的通用大模型之一。

在適配性方面，GLM-4.6已在寒武紀(jì)的國產(chǎn)芯片上實現(xiàn)FP8+Int4混合量化部署，這是首次在國產(chǎn)芯片投產(chǎn)的FP8+Int4模型芯片一體解決方案，在保持精度不變的前提下，大幅降低推理成本，為國產(chǎn)芯片在大模型本地化運行上開創(chuàng)了可行路徑。

另外，基于vLLM推理框架部署，摩爾線程新一代GPU可基于原生FP8精度穩(wěn)定運行GLM-4.6，印證了MUSA架構(gòu)和全功能GPU在生態(tài)兼容與快速支持方面的優(yōu)勢。

GLM-4.6和寒武紀(jì)、摩爾線程國產(chǎn)芯片的組合，即將通過智譜MaaS平臺正式面向大眾和企業(yè)提供服務(wù)。未來，國產(chǎn)原創(chuàng)GLM大模型與國產(chǎn)芯片將聯(lián)合推動在模型訓(xùn)練和推理環(huán)節(jié)的性能與效率優(yōu)化。

近日，DeepSeek和智譜先后宣布推出新一代大模型，并宣布適配國內(nèi)芯片。

9月29日，DeepSeek-V3.2-Exp大模型發(fā)布，華為昇騰、寒武紀(jì)、海光信息等多家芯片廠商即宣布完成適配。

華為昇騰基于vLLM/SGLang等推理框架實現(xiàn)0day支持，并開源全部推理代碼與算子實現(xiàn)；寒武紀(jì)宣布已完成對DeepSeek-V3.2-Exp的同步適配；海光信息表示，其DCU實現(xiàn)對該模型的無縫適配與深度調(diào)優(yōu)，展現(xiàn)出優(yōu)異性能，驗證了高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢。

截至30日收盤，寒武紀(jì)報收1325元，微漲0.11%；海光信息報收252.6元，跌1.27%。

北京計算機學(xué)會AI專委會秘書長、北大人工智能博士張有魚告訴《科創(chuàng)板日報》記者，過去是模型去適配芯片，而現(xiàn)在，大模型的算法創(chuàng)新正在反向定義下一代芯片的架構(gòu)。這種‘軟件定義硬件’的協(xié)同進化模式，是中國AI芯片實現(xiàn)‘換道超車’的真正機遇所在；其次，競爭的終局將從拼算力走向拼價值。 “隨著國產(chǎn)化方案大幅拉低AI的使用門檻，算力成本將逐漸不再是企業(yè)應(yīng)用AI的核心瓶頸。競爭的主戰(zhàn)場將徹底轉(zhuǎn)移到如何利用AI創(chuàng)造獨特業(yè)務(wù)價值上，這將真正引爆千行百業(yè)的創(chuàng)新浪潮?！薄?/p>

1/7價格享受Claude Sonnet智能

隨著GLM-4.6的發(fā)布，智譜AI同步推出了一套“GLM Coding Plan”升級方案，其核心策略直指“極致性價比”，旨在重塑開發(fā)者與企業(yè)的AI成本結(jié)構(gòu)。

《科創(chuàng)板日報》記者注意到，該方案的競爭力體現(xiàn)在以下幾個層面：

首先在性價比方面，智譜打出“1/7價格享受到Claude Sonnet智能”的口號。其API價格僅為Claude Sonnet 4的1/21，套餐包模式將成本壓縮至1.99元/百萬Tokens的行業(yè)新低，降低了開發(fā)者的準(zhǔn)入門檻。

其次，在與國產(chǎn)模型的對比中，盡管價格相近，但GLM-4.6在代碼生成（SWE-bench準(zhǔn)確率超70%）、Agent工具調(diào)用等關(guān)鍵能力上展現(xiàn)了領(lǐng)先優(yōu)勢，實現(xiàn)了“低價且高性能”的精準(zhǔn)卡位。

此外，其企業(yè)版套餐在提供安全合規(guī)模塊的同時，成本相較于Claude同級方案降低了95%以上，為企業(yè)規(guī)?；瘧?yīng)用AI提供了選擇。

對于本次GLM-4.6的這套組合拳，張有魚表示，智譜的策略非常清晰，其‘1/7價格享受相似智能’的定位，本身就超越了單純的價格維度。當(dāng)前頭部廠商的低價策略，其核心目標(biāo)并非短期利潤，而是長期的‘生態(tài)圈地’。

張有魚認為，AI大模型競爭的終局，取決于誰能構(gòu)建最繁榮的開發(fā)者生態(tài)和積累最高質(zhì)量的應(yīng)用數(shù)據(jù)。較低的API價格，正是實現(xiàn)這一戰(zhàn)略目標(biāo)、搶占未來生態(tài)制高點的有效手段之一。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.