美國英偉達與中國寒武紀,或將在同一天發(fā)布最新財報。
今年以來,英偉達股價漲了30%,達到4.38萬億美元,全球第一,斷檔領先;寒武紀股價漲超105%,達到了770億美元,越來越接近老牌巨頭英特爾。高盛最近將寒武紀目標價上調50%至1835元,又預計英偉達“年底前難以跑贏大盤”。
寒武紀的暴漲,與中國上市AI芯片標的稀缺有關,也與中國與美國的AI算力競爭有關。美國掀起的“芯片戰(zhàn)”加速了中國AI芯片的國產替代,而且,越打壓、越進步,整個生態(tài)都開始協(xié)同起來,繞開或突破現(xiàn)有壁壘。壓抑許久的市場情緒突然爆發(fā)了。
英偉達在中國的訂單又丟了,市場將屬于中國芯片。機構Jefferey的調查發(fā)現(xiàn),中國臺灣的供應鏈企業(yè),已經暫停所有與H20相關的工作;B30還要再等特朗普點頭,但美國國會最近又在搗騰新的出口管制法案(編號H.R. 5022,草案階段),希望讓立法部門也摻上一腳。今年7月,機構Bernstein曾預計,H20被禁將導致183億美元市場空白,盡管國產芯片無法全部替代,但對于中國企業(yè)而言將仍然是非常龐大的數(shù)字。
整個國產AI算力生態(tài),都在為吃下這百億美元市場創(chuàng)新。近期,從V3到V3.1,DeepSeek又開始探索出了一條“”之路,UE8M0加上超低精度的沖擊,最多可以減少 75%的內存使用,加快了以國產芯片解決中國大規(guī)模訓練和推理的需求。華為剛推出UCM(統(tǒng)一計算內存),根據記憶熱度,在HBM、DRAM、SSD等存儲介質中分級緩存數(shù)據,釋放KV Cache的壓力。明天,華為還將為此發(fā)布新款AI SSD,,進一步降低對高性能HBM的依賴。
在內外局勢的變化中,寒武紀是最能給市場提供情緒價值的標的之一。它自己足夠爭氣,又是上市公司稀缺標的。在Bernstein的報告中,寒武紀是第一梯隊的,在國內廠商中市場占比第二。其他AI芯片公司,摩爾線程、沐曦、燧原、壁仞以及天數(shù)智芯,都還在上市途中。
寒武紀的市值,仍然與英偉達存在2個數(shù)量級的差距。它們的營收規(guī)模差距更大,差不多3個數(shù)量級。最近一個完整的財年,英偉達營收達到了1305億美元,而寒武紀營收約為1.65億美元。不過,在2017年,寒武紀成立與英偉達的營收差距,達到了4個數(shù)量級。
為了追回這1個數(shù)量級的落后距離,寒武紀連續(xù)8年采取了異常激進的研發(fā)戰(zhàn)略。盡管兩家公司研發(fā)投入的絕對規(guī)模,仍然相差2個數(shù)量級,去年英偉達約為129億美元,寒武紀約為1.71億美元。但自有公開數(shù)據以來,寒武紀的研發(fā)強度從來沒有低于過100%,即賺來的錢全部投入研發(fā)還不夠,還要融資倒貼去搞研發(fā);同期,英偉達的研發(fā)強度基本維持在20%左右,這也是美國領先半導體企業(yè)普遍的水平。
寒武紀仍處于資本市場輸血的狀態(tài),僅今年一季度首次季度盈利,但累計虧損額仍然無比龐大。據招股書,上市前,寒武紀共經歷6輪增資,涉及近30家不同機構,累計約46.5億元人民幣。2020年7月,寒武紀科創(chuàng)板上市,募資約25.8億元。2022年6月拋出定增計劃,最終募資16.7億元;今年6月,寒武紀再次計劃定增,擬募集資金不超過49.8億元,已獲監(jiān)管批準。據此,成立8年,寒武紀累計從社會募集將近140億元人民幣,約合20億美元;這點錢,還不夠支撐英偉達研發(fā)團隊2個月。
今年5月,在第一屆光電融合大會上,中科院計算所處理器芯片全國重點實驗室主任陳云霽(也是寒武紀聯(lián)合創(chuàng)始人,是公司董事長陳天石的哥哥)在一場主題演講中表示,與英偉達相比,中國AI芯片需要突破先進制程的“工藝壁壘”、人才與資金“資源壁壘”以及軟件與應用的“生態(tài)壁壘”。研發(fā)同樣水平的芯片,英偉達的人才與資金是寒武紀的10倍。
陳云霽稱,寒武紀自研了指令集與芯片架構,以及專門的計算電路與訪存電路,并采用了國產的7nm制程工藝?!?美國成分”,保障了中國智能產業(yè)能夠“保底運行”,目前每日支撐了1.1億次國產大模型服務,包括字節(jié)跳動的推理。
“保底運行”,意味著至少在算力水平上,終于追平了五年前的A100。寒武紀的思遠(MLU)系列,相比英偉達的GPU,更接近谷歌的TPU。谷歌首代TPU于2016年發(fā)布,同年寒武紀成立,只不過,當時寒武紀主要收入來自終端處理器IP授權,但在最大客戶轉向自研后,寒武紀也逐步轉向云端AI芯片。
在上市前,寒武紀最先進的云端AI芯片為16nm制程的MLU-270,發(fā)布于2019年,在算力層面處于英偉達前一年的推理“性價比之王”的Tesla T4水平,顯著低于首款廣泛用于訓練Transformer大模型的AI芯片V100。英特爾目前主推的訓練芯片Gaudi系列,那一年才剛從Habana Labs手里收購來。
目前,寒武紀官網披露的“最先進”的是7nm制程的MLU-370,發(fā)布于2021年。這應該也是寒武紀在進入“實體清單”前,最后一款由臺積電代工的AI服務器芯片。其中,MLU370-X8在FP16精度下的峰值算力為96 TFLOPS,仍然顯著低于英偉達的A100。后者在Tensor Core模式下稠密計算的峰值算力為312 TFLOPS。
寒武紀已于去年量產MLU-590。據陳云霽在主題演講上透露的數(shù)據,MLU-590在FP16精度下的峰值算力,達到了345 TFLOPS,已經超過了A100。不過,他沒有對比在實際訓練或推理場景中的性能;這取決于內存、帶寬等等諸多因素。臺灣有半導體科技媒體報道稱,中芯國際7nm產能也已經較去年大幅增長,并將在明年追平臺積電,為國產AI芯片大幅擴產創(chuàng)造了條件。
市場傳言寒武紀最新的MLU-690,已經可以和H100扳手腕。但這缺乏更確鑿的公開信息。分析機構Futurum集團半導體及供應鏈研究總監(jiān)Ray Wang聲稱,盡管數(shù)量仍然較少,但是這款產品已經開始銷售。不過,寒武紀在最近股價連續(xù)三個交易日大漲后,按監(jiān)管規(guī)定提示投資者,近期網上傳播的“收入預測”與“新產品情況”等為誤導市場的不實信息。
股民正在為寒武紀提供的情緒價值買單,推動市值暴漲。如果要為已經火熱的情緒,繼續(xù)添上一把火,除了中國與美國算力競爭如此宏大的敘事外,其實遠期還有一個同樣宏大的敘事:用AI設計芯片。
在5月那場演講中,陳云霽介紹,2021年全自動設計的CPU“啟蒙1號”,達到了40年前的英特爾486的水平;兩年后,“啟蒙2號”性能達到了10多年前的ARM Cortex A53水平。相當于,AI將人類20多年的努力,加速到了2年。目前,計算所正在嘗試AI自動生成芯片生態(tài)所需的高性能庫。AI會進一步拉近中國與美國代差嗎?
寒武紀的定增已經箭在弦上。如果戲稱中國軍工是煙民推動的,也許,中國的AI將是股民推動的。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.