7月26日,2025世界人工智能大會(WAIC)將正式啟幕。據(jù)悉,華為將首次線下展出昇騰384超節(jié)點真機。這無疑將成為今年WAIC上一件意味深長的“高光時刻”。
然而,根據(jù)近日多方消息報道(如媒體“The Information”),華為正內(nèi)部討論逐步淡化ASIC芯片的主導(dǎo)地位,轉(zhuǎn)向開發(fā)GPGPU產(chǎn)品,以適應(yīng)大模型訓(xùn)練需求。若傳聞屬實,不僅意味著華為AI戰(zhàn)略對ASIC路線的否定,也將對國內(nèi)AI市場和昇騰用戶造成巨大沖擊。
昇騰能力遭遇瓶頸
盡管尚無官方公告,但華為調(diào)整AI芯片戰(zhàn)略,放棄投入多年且巨大的ASIC顯然并非空穴來風(fēng)。昇騰的發(fā)展正遭遇嚴(yán)重瓶頸,除了宣稱因制裁導(dǎo)致產(chǎn)品停止迭代數(shù)年,其技術(shù)和市場也遭遇諸多問題。
首先是軟件生態(tài)受限,開發(fā)門檻長期居高不下。MindSpore、CANN等自研工具鏈尚未在主流開發(fā)者中形成足夠滲透力。即便是在國內(nèi)信創(chuàng)市場,基于PyTorch和TensorFlow的訓(xùn)練仍為絕對主流,昇騰平臺在開發(fā)側(cè)被頻繁詬病“上手難”、“生態(tài)封閉”等。而由于開發(fā)者使用門檻高,通用性不足,導(dǎo)致很多項目“部署了但用不起來”。
其次是ASIC更適用于推理,卻不適于訓(xùn)練。目前,大模型訓(xùn)練正從低精度向更高精度遷移,以昇騰910為代表的華為芯片主要面向AI推理部署場景,但其在大模型訓(xùn)練側(cè)由于缺乏TF32、BF16等訓(xùn)練關(guān)鍵算力支持,在高性能通用訓(xùn)練場景中存在“天然劣勢”,與主流GPGPU在性能和靈活性上差距明顯。不少用戶甚至選擇NVDIA消費級的4090系列GPU,也不愿意使用ASIC芯片。
再次昇騰產(chǎn)品供貨不穩(wěn)定,難以保證規(guī)?;瘧?yīng)用。昇騰芯片由于流片工藝與良率控制方面面臨極限,可能存在供貨不穩(wěn)定的問題,產(chǎn)能無法滿足大規(guī)模部署,特別在AI訓(xùn)練高并發(fā)場景中存在物理算力瓶頸。
此外,隨著英偉達H20、AMD Instinct MI300X重新解禁,在中國以定制方案形式回歸,行業(yè)企業(yè)更傾向選用生態(tài)完備、支持廣泛的GPGPU平臺。同時,國產(chǎn)GPGPU近年發(fā)展迅速,已在信創(chuàng)市場行程強大競爭力。在多方市場競爭壓力下,華為昇騰等ASIC芯片競爭力正遭遇結(jié)構(gòu)性挑戰(zhàn),純粹依賴政策紅利和區(qū)域性保護的競爭策略效力大不如前。
技術(shù)切換難度巨大
從ASIC轉(zhuǎn)向GPGPU,不僅是技術(shù)路線上的簡單調(diào)整,更意味著研發(fā)體系、生態(tài)構(gòu)建和產(chǎn)品周期的全面重構(gòu),而由于技術(shù)邏輯上的巨大差異,也會導(dǎo)致此前巨大投入打水漂,技術(shù)和商業(yè)體系基本要從零開始。
ASIC是一種為特定任務(wù)設(shè)計的高度定制芯片,比如AI推理,其優(yōu)勢在于功耗控制、單位計算效率與價格控制。華為的昇騰芯片便屬此類,自2019年以來已在多個國產(chǎn)AI算力平臺部署落地,采用頗為廣泛,是國產(chǎn)AI芯片的主要選擇之一。
相較之下,GPGPU以其高并行計算能力成為AI訓(xùn)練主力,具備更強的通用性和靈活性,尤其在大模型,如Transformer架構(gòu)中具備壓倒性優(yōu)勢。NVIDIA就是這一類型的最典型代表廠商,并因其CUDA生態(tài)深耕20年,早已成為開發(fā)者和框架的事實標(biāo)準(zhǔn)。
表面上,兩者皆為AI芯片,但底層架構(gòu)、生態(tài)適配與開發(fā)者門檻差異極大。ASIC芯片適合特定場景加速,但無法做到全場景全精度適用,而GPGPU則憑借強大生態(tài)覆蓋和全精度計算能力,承擔(dān)通用算力平臺角色,是當(dāng)前全球AI基礎(chǔ)設(shè)施的首要選擇。
倉促轉(zhuǎn)向前途未卜
雖然GPGPU是一條高度成熟的產(chǎn)業(yè)路徑,但對于華為而言,其進入門檻與轉(zhuǎn)換難度不容低估。如果華為真如傳聞的啟動GPGPU研發(fā),勢必要直面三大拷問:多久流片?多久商用?多久形成生態(tài)?
從硬件架構(gòu)上看,華為技術(shù)重構(gòu)難度巨大。GPGPU核心在于高度可并行調(diào)度的SIMD架構(gòu),以及適用于圖形+通用場景的資源分配邏輯,完全不同于昇騰系列面向固定神經(jīng)網(wǎng)絡(luò)任務(wù)的定制邏輯。兩者幾乎不存在架構(gòu)兼容或軟遷移的可能。若從頭設(shè)計SM模塊、控制單元、內(nèi)存架構(gòu),保守預(yù)計設(shè)計周期在18-24個月以上。
其次在軟件生態(tài)構(gòu)建上,眾所周知,NVDIA主導(dǎo)的GPGPU成功的核心不在芯片,而在軟件棧和開發(fā)工具鏈。不夸張的說,當(dāng)前市場體系下,CUDA生態(tài)不可替代。NVDIA在長達15年的時間里構(gòu)建了的CUDA生態(tài)壁壘,華為目前僅靠MindSpore和CANN,顯然不足以承載GPGPU通用生態(tài)的復(fù)雜性。
據(jù)2024年斯坦?!癆I Index”報告,全球90%以上的AI訓(xùn)練仍運行于CUDA GPU上。即使華為打造兼容CUDA的芯片平臺,仍需克服長期構(gòu)建的編譯器、底層算子、性能優(yōu)化庫的全棧差距,這顯然需要巨大的人力財力和時間投入,想在短期內(nèi)替代很難實現(xiàn)。
更為關(guān)鍵的是,若從零開始設(shè)計GPGPU芯片,完成從架構(gòu)設(shè)計、IP整合、EDA驗證、初代流片到驅(qū)動開發(fā)與軟件適配,行業(yè)慣例至少需要2-3年技術(shù)周期,這意味著在2027年前華為的GPGPU難以真正對市場形成產(chǎn)品輸出。
用戶市場難以交待
即便通過非常規(guī)手段能夠加快流片量產(chǎn),初代華為GPGPU在定價上也可能難以形成競爭力。根據(jù)IDC數(shù)據(jù),華為昇騰?910B的市場價格約為120,000?元/片(約合16,672?美元)。H20重返中國市場后,售價預(yù)計在86,000–110,000?元/片(12,000–15,000?美元)之間,但考慮特朗普政府的不確定性,其渠道價格可能會略有上漲。另一參照項是壁仞早前發(fā)布的國產(chǎn)通用GPU BR100,單片預(yù)售價格大概在230,000元。
若考慮流片成本、工藝良率與初期產(chǎn)量,華為首代GPGPU產(chǎn)品試圖進入市場,其價格大概率高于當(dāng)前昇騰系列,綜合來看定價不會低于200,000元/片,不僅明顯高于H20,也高于A100和H100,可能面臨性價比不足與缺乏規(guī)模優(yōu)勢的雙重壓力。
但價格的影響仍是其次,如果華為真的弱化甚至逐步退出昇騰ASIC路線,首當(dāng)其沖受到影響的將是大量政企與信創(chuàng)項目客戶。目前昇騰芯片已部署在數(shù)十個部委級平臺與信創(chuàng)項目,包括多個科研機構(gòu)、高校、政務(wù)大數(shù)據(jù)中心,甚至在一些東數(shù)西算核心節(jié)點上也有規(guī)模應(yīng)用。
轉(zhuǎn)向GPGPU后,原部署在昇騰平臺上的推理引擎與API需大規(guī)模重構(gòu),舊有系統(tǒng)無法直接遷移至GPGPU架構(gòu),推理模型、算法代碼、系統(tǒng)適配都需重寫。而一旦華為停止對昇騰生態(tài)工具鏈的支持,客戶已購買的ASIC硬件、配套板卡、開發(fā)框架可能被棄用,面臨二次投入和算力平臺重構(gòu)成本。
同時,此前不少政府采購與信創(chuàng)標(biāo)案明確要求“昇騰適配”或“華為芯片認(rèn)證”,若架構(gòu)轉(zhuǎn)變,勢必將影響原始標(biāo)的交付與審計,而政府、高校、醫(yī)院、銀行和央國企等政策驅(qū)動型項目恰恰容不得折騰。一旦華為在這種關(guān)鍵技術(shù)路線頻繁搖擺,“自主可控”的承諾和形象都將失信于客戶。
截至目前,華為并未官方回應(yīng)“放棄ASIC轉(zhuǎn)向GPGPU”的傳聞,也未有正式產(chǎn)品路線公開。但放棄ASIC、轉(zhuǎn)向GPGPU,對于華為來說無疑是一次技術(shù)路線的豪賭。如真,則必須面對產(chǎn)品重構(gòu)、生態(tài)重建、客戶信任重塑的全面挑戰(zhàn)。如假,僅僅是又一次陣仗拉滿的營銷噱頭,必然進一步拉低公眾和客戶的信任度。
畢竟,技術(shù)路線可以更迭,但信任無法多次透支。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.