記者丨趙云帆
編輯丨黃劍
8月22日,A股算力板塊再度成為“執(zhí)牛耳者”。截至收盤,本輪行情的“股王”寒武紀(jì)以20%漲停報收,總市值來到驚人的5200億人民幣;晶圓龍頭中芯國際A/H股分別上漲14.19%和10.06%,其中A股創(chuàng)下去年10月以來單日漲幅之最。光模塊“雙雄”新易盛、中際旭創(chuàng)續(xù)創(chuàng)新高,并分別上漲6.19%和5.16%;國產(chǎn)IDC龍頭中科曙光亦以漲停報收,市值接近去年11月高點(diǎn)。
引爆日內(nèi)算力行情的源點(diǎn),來自兩則消息。
8月21日晚間,杭州深度求索公司(DeepSeek)悄然于大模型資源網(wǎng)站HuggingFace上線 “DeepSeekV3.1” 版本。同時,該公司宣稱其模型版本使用適配國產(chǎn)芯片結(jié)構(gòu)的參數(shù)精度,暗示國產(chǎn)芯片未來有望得到大規(guī)模使用。
分析人士認(rèn)為,在國際貿(mào)易保護(hù)主義背景下,國際芯片產(chǎn)業(yè)鏈供應(yīng)鏈的不確定性猶存。DeepSeek-V3.1發(fā)布,以及騰訊業(yè)績會透露GPU數(shù)量足夠等信息,均利好AI算力國產(chǎn)化和本土AI芯片發(fā)展,國產(chǎn)算力板塊再度迎來催化。
國產(chǎn)芯片+模型的“彎道超車”
8月21日晚間,深度求索在官方訂閱號發(fā)布文章《DeepSeek-V3.1 發(fā)布,邁向 Agent 時代的第一步》,明確指出“DeepSeek-V3.1使用了UE8M0 FP8 Scale 的參數(shù)精度”。同時,在推文下置頂留言解釋:“UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計”,引發(fā)DeepSeek新版本帶來“國產(chǎn)AI芯片”量產(chǎn)的預(yù)期。
國產(chǎn)半導(dǎo)體的市場投機(jī)熱情高漲。截至8月22日收盤,Wind半導(dǎo)體指數(shù)收漲7.31%,創(chuàng)下2022年4月以來新高。
而日內(nèi)半導(dǎo)體的熱度泛化擴(kuò)散,Wind科技大類指數(shù)日內(nèi)上漲3.07%,續(xù)創(chuàng)歷史新高。
值得注意的是,市場此前廣泛期待深度求索公司釋放推理模型更新版本“DeepSeek-R2”。然而此次發(fā)布的DeepSeek-V3.1主要焦點(diǎn)在于實(shí)現(xiàn)深度思考和快思考融合,迎合了此前OpenAI、Qwen等新釋出模型產(chǎn)品結(jié)構(gòu)的特征。因此部分分析人士甚至認(rèn)為,DeepSeek“R系列”可能會融合在通用“V系列”版本中,不再獨(dú)立迭代。
“思考與非思考模式的融合可以說是必然的趨勢,也是大模型發(fā)展史上的一個小迭代,可以看到V3.1不是大版本,其更新值得期待,但不知道何時。 ”IDC中國研究總監(jiān)盧言霞告訴記者。
而更令人關(guān)注的則是深度求索公司釋出的信息,即“UE8M0 FP8 針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計”。
21世紀(jì)經(jīng)濟(jì)報道記者采訪并綜合各類觀點(diǎn)發(fā)現(xiàn),“UE8M0 FP8”目標(biāo)或許是建立在國產(chǎn)算力芯片能力略遜于英偉達(dá)GPU,但能最大限度發(fā)揮國產(chǎn)芯片的理論算力和能效比,并在犧牲通用性的基礎(chǔ)上,極大提升推理性能的一種參數(shù)精度模式。
而在此基礎(chǔ)上,新的專用于國產(chǎn)芯片的國產(chǎn)模型,有望在定義明確的特定場景之中發(fā)揮更高效的推理能力,實(shí)現(xiàn)挑戰(zhàn)甚至超越海外頭部大模型在特定領(lǐng)域性能的可能。
“下一代國產(chǎn)芯片”引關(guān)注
對于此番DeepSeek發(fā)布新版大模型和使用新的計算精度,部分券商也發(fā)表了看法。
中信建投指出,DeepSeek模型更新至V3.1版,新增支持FP8精度和國產(chǎn)芯片,此舉有望推動國產(chǎn)算力生態(tài)加速落地。騰訊不久前的業(yè)績會上也透露,其推理芯片供應(yīng)渠道多元化,在國際供應(yīng)鏈波動下,國產(chǎn)推理算力芯片或成助力。華為昇騰芯片近期在政府、金融等行業(yè)的應(yīng)用逐步擴(kuò)大,進(jìn)一步體現(xiàn)國產(chǎn)芯片的市場競爭力正在提升。
值得注意的是,21世紀(jì)經(jīng)濟(jì)報道記者從產(chǎn)業(yè)鏈人士處獲悉,“UE8M0 FP8”是針對特定國產(chǎn)芯片的,因此很可能是針對某一種架構(gòu),或某家Fabless(無晶圓)芯片企業(yè)的。
不過,究竟是哪家,深度求索公司并未透露更多。
從國產(chǎn)芯片研發(fā)進(jìn)度來說,去年年底,寒武紀(jì)推出了思元590芯片,應(yīng)用ASIC架構(gòu),支持7nm工藝、512TOPS的算力,在推理場景能效比上已超越國際巨頭,幾乎支持所有國內(nèi)主流大模型 。百度內(nèi)部測試結(jié)果顯示,思元590在某些大模型訓(xùn)練任務(wù)上的表現(xiàn)已非常接近英偉達(dá)A100芯片;即便在相對弱勢的場景,其性能也能達(dá)到A100的一半左右;整體性能大致可達(dá)到A100的80%水平 。
據(jù)悉,思元590芯片已經(jīng)被應(yīng)用于字節(jié)跳動、百度、阿里云等企業(yè)的云端大模型訓(xùn)練,以及省級智算中心項(xiàng)目等。
另一個“熱門選手”則是華為昇騰芯片Ascend 910D。資料顯示,Ascend 910D為從芯片設(shè)計、先進(jìn)封裝到軟件生態(tài)的原生國產(chǎn)算力芯片,采用了原生達(dá)芬奇架構(gòu)3.0、自研HBM3e存算一體技術(shù)和硅光模塊信息互聯(lián)技術(shù),其理論算力峰值有望超越英偉達(dá)H100。未來該芯片的一大賣點(diǎn)是在中文NLP(自然語言處理)、智能駕駛、智慧城市等本土化場景中進(jìn)行了專門優(yōu)化。
無論如何,DeepSeekV3.1的出現(xiàn),成為了國產(chǎn)芯片在國內(nèi)算力市場開始征程的“先兆”。但分析人士仍然指出,由于大模型適配國產(chǎn)芯片廠商的最終歸屬不清,加上研發(fā)進(jìn)度,芯片良率等各種問題均可能存在,因此投資者也應(yīng)提高風(fēng)險意識,警惕市場過度炒作的風(fēng)險。
SFC
出品丨21財經(jīng)客戶端 21世紀(jì)經(jīng)濟(jì)報道
編輯丨黎雨桐 實(shí)習(xí)生林芷儀
21君薦讀
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.