《科創(chuàng)板日報》9月30日訊(記者 李明明)又一家國內(nèi)大模型宣布適配國產(chǎn)芯片!
今日,智譜發(fā)布及開源新一代大模型GLM-4.6,并介紹其整體性能超越DeepSeek最新模型DeepSeek-V3.2-Exp。這是繼DeepSeek-V3.2-Exp與Claude Sonnet 4.5之后,國慶節(jié)前業(yè)界的又一技術(shù)發(fā)布。
值得一提的是,智譜官宣GLM-4.6在寒武紀(jì)國產(chǎn)芯片實現(xiàn)FP8+Int4混合量化部署,為首套投產(chǎn)的該模式芯片一體方案,其基于vLLM框架,還可在摩爾線程新一代GPU原生FP8精度穩(wěn)定運行。
《科創(chuàng)板日報》記者注意到,近期國產(chǎn)大模型與國產(chǎn)芯片的協(xié)同發(fā)展取得了一定突破,核心是 DeepSeek-V3.2模型的發(fā)布與國產(chǎn)芯片的"Day 0適配"(通常指在某個新系統(tǒng)、新平臺、新設(shè)備或新功能正式發(fā)布的第一天(Day 0)就完成適配工作) ,以及智譜GLM-4.6模型與芯片的深度融合。
這標(biāo)志著標(biāo)志國產(chǎn)GPU具備與前沿大模型協(xié)同迭代能力,國產(chǎn)AI生態(tài)可能正從"可用"向"好用"演進。
GLM-4.6適配寒武紀(jì)、摩爾線程
智譜方面有關(guān)人士介紹,在公開基準(zhǔn)測試和真實編程任務(wù)中,GLM-4.6的代碼生成能力已全面對齊Claude Sonnet 4,成為目前國內(nèi)最強的Coding模型。同時,模型在長上下文處理、推理能力、信息檢索、文本生成及智能體應(yīng)用等方面均實現(xiàn)全面升級,整體性能超越DeepSeek最新模型DeepSeek-V3.2-Exp。
作為開源模型,GLM-4.6目前是全球開源生態(tài)中性能最強的通用大模型之一。
在適配性方面,GLM-4.6已在寒武紀(jì)的國產(chǎn)芯片上實現(xiàn)FP8+Int4混合量化部署,這是首次在國產(chǎn)芯片投產(chǎn)的FP8+Int4模型芯片一體解決方案,在保持精度不變的前提下,大幅降低推理成本,為國產(chǎn)芯片在大模型本地化運行上開創(chuàng)了可行路徑。
另外,基于vLLM推理框架部署,摩爾線程新一代GPU可基于原生FP8精度穩(wěn)定運行GLM-4.6,印證了MUSA架構(gòu)和全功能GPU在生態(tài)兼容與快速支持方面的優(yōu)勢。
GLM-4.6和寒武紀(jì)、摩爾線程國產(chǎn)芯片的組合,即將通過智譜MaaS平臺正式面向大眾和企業(yè)提供服務(wù)。未來,國產(chǎn)原創(chuàng)GLM大模型與國產(chǎn)芯片將聯(lián)合推動在模型訓(xùn)練和推理環(huán)節(jié)的性能與效率優(yōu)化。
近日,DeepSeek和智譜先后宣布推出新一代大模型,并宣布適配國內(nèi)芯片。
9月29日,DeepSeek-V3.2-Exp大模型發(fā)布,華為昇騰、寒武紀(jì)、海光信息等多家芯片廠商即宣布完成適配。
華為昇騰基于vLLM/SGLang等推理框架實現(xiàn)0day支持,并開源全部推理代碼與算子實現(xiàn);寒武紀(jì)宣布已完成對DeepSeek-V3.2-Exp的同步適配;海光信息表示,其DCU實現(xiàn)對該模型的無縫適配與深度調(diào)優(yōu),展現(xiàn)出優(yōu)異性能,驗證了高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢。
截至30日收盤,寒武紀(jì)報收1325元,微漲0.11%;海光信息報收252.6元,跌1.27%。
北京計算機學(xué)會AI專委會秘書長、北大人工智能博士張有魚告訴《科創(chuàng)板日報》記者,過去是模型去適配芯片,而現(xiàn)在,大模型的算法創(chuàng)新正在反向定義下一代芯片的架構(gòu)。這種‘軟件定義硬件’的協(xié)同進化模式,是中國AI芯片實現(xiàn)‘換道超車’的真正機遇所在;其次,競爭的終局將從拼算力走向拼價值。 “隨著國產(chǎn)化方案大幅拉低AI的使用門檻,算力成本將逐漸不再是企業(yè)應(yīng)用AI的核心瓶頸。競爭的主戰(zhàn)場將徹底轉(zhuǎn)移到如何利用AI創(chuàng)造獨特業(yè)務(wù)價值上,這將真正引爆千行百業(yè)的創(chuàng)新浪潮?!薄?/p>
1/7價格享受Claude Sonnet智能
隨著GLM-4.6的發(fā)布,智譜AI同步推出了一套“GLM Coding Plan”升級方案,其核心策略直指“極致性價比”,旨在重塑開發(fā)者與企業(yè)的AI成本結(jié)構(gòu)。
《科創(chuàng)板日報》記者注意到,該方案的競爭力體現(xiàn)在以下幾個層面:
首先在性價比方面,智譜打出“1/7價格享受到Claude Sonnet智能”的口號。其API價格僅為Claude Sonnet 4的1/21,套餐包模式將成本壓縮至1.99元/百萬Tokens的行業(yè)新低,降低了開發(fā)者的準(zhǔn)入門檻。
其次,在與國產(chǎn)模型的對比中,盡管價格相近,但GLM-4.6在代碼生成(SWE-bench準(zhǔn)確率超70%)、Agent工具調(diào)用等關(guān)鍵能力上展現(xiàn)了領(lǐng)先優(yōu)勢,實現(xiàn)了“低價且高性能”的精準(zhǔn)卡位。
此外,其企業(yè)版套餐在提供安全合規(guī)模塊的同時,成本相較于Claude同級方案降低了95%以上,為企業(yè)規(guī)?;瘧?yīng)用AI提供了選擇。
對于本次GLM-4.6的這套組合拳,張有魚表示,智譜的策略非常清晰,其‘1/7價格享受相似智能’的定位,本身就超越了單純的價格維度。當(dāng)前頭部廠商的低價策略,其核心目標(biāo)并非短期利潤,而是長期的‘生態(tài)圈地’。
張有魚認為,AI大模型競爭的終局,取決于誰能構(gòu)建最繁榮的開發(fā)者生態(tài)和積累最高質(zhì)量的應(yīng)用數(shù)據(jù)。較低的API價格,正是實現(xiàn)這一戰(zhàn)略目標(biāo)、搶占未來生態(tài)制高點的有效手段之一。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.