1
2025年9月18日,華為在全聯(lián)接大會(huì)上正式發(fā)布“超節(jié)點(diǎn)”算力集群,引發(fā)全球科技界高度關(guān)注。
面對(duì)外部環(huán)境的持續(xù)打壓與核心技術(shù)受限的雙重挑戰(zhàn),華為并未沿襲傳統(tǒng)路徑依賴(lài)單顆芯片性能提升,而是另辟蹊徑,采用數(shù)萬(wàn)張昇騰AI加速卡進(jìn)行系統(tǒng)級(jí)集成,構(gòu)建出具備超強(qiáng)計(jì)算能力的集群體系。
這一技術(shù)躍遷是否將重塑全球算力格局,成為新一輪科技博弈的關(guān)鍵支點(diǎn)?
2
華為超節(jié)點(diǎn)算力集群
當(dāng)天發(fā)布的“超節(jié)點(diǎn)”集群被官方稱(chēng)為當(dāng)前全球最具算力規(guī)模的技術(shù)成果,其綜合性能據(jù)稱(chēng)可達(dá)同期英偉達(dá)產(chǎn)品約7倍水平。
這項(xiàng)突破不僅繞開(kāi)了單芯片物理極限的制約,更重新定義了高性能計(jì)算系統(tǒng)的演進(jìn)方向——不再執(zhí)著于單一處理器的極致算力,轉(zhuǎn)而通過(guò)海量芯片協(xié)同與創(chuàng)新架構(gòu)設(shè)計(jì),實(shí)現(xiàn)整體效能的指數(shù)級(jí)躍升。
近年來(lái),華為長(zhǎng)期承受來(lái)自美國(guó)政府的高壓制裁,尤其在高端半導(dǎo)體供應(yīng)鏈上遭遇全面圍堵。
3
受美國(guó)出口管制影響,華為難以獲取先進(jìn)制程芯片制造設(shè)備及成熟商用高端芯片資源。
典型例證是,在特朗普?qǐng)?zhí)政時(shí)期施壓下,英偉達(dá)逐步縮減對(duì)華為的GPU供貨;至2025年4月,美方進(jìn)一步要求該公司向中國(guó)出口H20型號(hào)芯片時(shí)必須逐案申請(qǐng)?jiān)S可。
這使得華為無(wú)法依靠外部采購(gòu)滿(mǎn)足日益增長(zhǎng)的算力需求,倒逼其探索自主可控的技術(shù)替代方案。
最終,華為決定跳出原有技術(shù)框架,聚焦系統(tǒng)層級(jí)的結(jié)構(gòu)性革新,以應(yīng)對(duì)算力短缺困局。
4
不同于傳統(tǒng)計(jì)算模式依賴(lài)單個(gè)核心芯片提供主要算力,華為創(chuàng)造性地將大量昇騰系列AI加速器通過(guò)高效互聯(lián)網(wǎng)絡(luò)整合為統(tǒng)一計(jì)算單元,形成名為SuperPoD的巨型算力平臺(tái)。
該大規(guī)模集群依托獨(dú)創(chuàng)的系統(tǒng)架構(gòu),充分釋放每一塊昇騰卡的運(yùn)算潛能,顯著增強(qiáng)了整體處理能力。
根據(jù)官方披露信息,一套完整的SuperPoD超節(jié)點(diǎn)由15488張昇騰卡構(gòu)成,內(nèi)部通信帶寬高達(dá)16PB/s,整體算力表現(xiàn)遠(yuǎn)超常規(guī)數(shù)據(jù)中心集群。
反觀(guān)英偉達(dá)現(xiàn)有GPU集群架構(gòu),當(dāng)接入數(shù)量超過(guò)256塊時(shí),節(jié)點(diǎn)間通信效率便出現(xiàn)明顯衰減,而華為的設(shè)計(jì)有效規(guī)避了此類(lèi)瓶頸。
5
借助自主研發(fā)的靈衢互聯(lián)協(xié)議,華為實(shí)現(xiàn)了跨節(jié)點(diǎn)間低延遲、高吞吐的數(shù)據(jù)交互機(jī)制,確保算力資源隨節(jié)點(diǎn)擴(kuò)展呈近似線(xiàn)性增長(zhǎng)趨勢(shì)。
此項(xiàng)關(guān)鍵技術(shù)突破不僅極大提升了自身在人工智能訓(xùn)練等場(chǎng)景下的競(jìng)爭(zhēng)力,也彰顯了企業(yè)在極端封鎖條件下強(qiáng)大的技術(shù)應(yīng)變與持續(xù)創(chuàng)新能力。
通過(guò)“以規(guī)模換性能”的戰(zhàn)略路徑,華為成功將算力水平推至全新維度,既沖擊了英偉達(dá)在高端芯片領(lǐng)域的主導(dǎo)地位,也為國(guó)內(nèi)其他半導(dǎo)體企業(yè)提供了可借鑒的發(fā)展范式。
6
突破單芯片的局限
長(zhǎng)期以來(lái),芯片行業(yè)的競(jìng)爭(zhēng)焦點(diǎn)集中于單顆芯片的工藝微縮與峰值算力提升,將其視為衡量技術(shù)水平的核心指標(biāo)。
然而,隨著深度學(xué)習(xí)、大模型訓(xùn)練等應(yīng)用對(duì)算力需求呈爆炸式增長(zhǎng),單一芯片已難以承載如此龐大的計(jì)算任務(wù)。
華為敏銳洞察到,單芯片性能增長(zhǎng)正逼近物理天花板,繼續(xù)追求“更小納米、更高頻率”的路線(xiàn)已難以為繼。
因此,公司果斷轉(zhuǎn)向系統(tǒng)架構(gòu)層面的根本性變革,著力破解超大規(guī)模并行計(jì)算中的關(guān)鍵難題。
7
此次推出的SuperPoD集群采用了UB-Mesh遞歸直連拓?fù)浣Y(jié)構(gòu),使每一枚昇騰芯片均可通過(guò)最優(yōu)路徑與其他節(jié)點(diǎn)直接通信,大幅降低數(shù)據(jù)傳輸延遲,提升整體協(xié)同效率。
與英偉達(dá)主流依賴(lài)CPU集中調(diào)度的傳統(tǒng)架構(gòu)不同,華為采用去中心化的全對(duì)等連接方式,實(shí)現(xiàn)NPU(神經(jīng)網(wǎng)絡(luò)處理器)與DPU(數(shù)據(jù)處理器)之間的扁平化互聯(lián)。
這種架構(gòu)讓每個(gè)計(jì)算單元具備獨(dú)立任務(wù)調(diào)度能力,避免因中心節(jié)點(diǎn)擁堵導(dǎo)致性能下降,保障集群在擴(kuò)展過(guò)程中維持高效運(yùn)行。
8
華為還在內(nèi)存子系統(tǒng)方面取得重要進(jìn)展。
在傳統(tǒng)架構(gòu)中,內(nèi)存帶寬和訪(fǎng)問(wèn)延遲常成為制約算力發(fā)揮的主要瓶頸,特別是在處理千億參數(shù)級(jí)別大模型時(shí),頻繁的數(shù)據(jù)搬運(yùn)嚴(yán)重拖慢運(yùn)算速度。
為此,華為自主研發(fā)了一種成本更低但性能更強(qiáng)的高帶寬內(nèi)存(HBM),有效緩解了“內(nèi)存墻”問(wèn)題,使海量數(shù)據(jù)能夠在芯片之間快速流轉(zhuǎn)。
9
通過(guò)深度融合內(nèi)存與計(jì)算模塊,優(yōu)化數(shù)據(jù)流動(dòng)路徑,華為系統(tǒng)不僅提升了單位時(shí)間內(nèi)的運(yùn)算吞吐量,還顯著增強(qiáng)了集群整體響應(yīng)能力。
這一系列底層技術(shù)創(chuàng)新的背后,反映出華為對(duì)未來(lái)智能計(jì)算趨勢(shì)的深刻理解。
在與國(guó)際巨頭同臺(tái)競(jìng)技的過(guò)程中,華為沒(méi)有盲目追隨單芯片性能競(jìng)賽,而是從系統(tǒng)工程視角出發(fā),顛覆了傳統(tǒng)計(jì)算架構(gòu)的設(shè)計(jì)邏輯。
這一跨越不僅鞏固了其在全球AI算力領(lǐng)域的話(huà)語(yǔ)權(quán),也為中國(guó)半導(dǎo)體產(chǎn)業(yè)開(kāi)辟了全新的發(fā)展思路。
10
國(guó)產(chǎn)芯片的崛起
華為此次成就,并非孤立的技術(shù)閃光,而是建立在整個(gè)國(guó)產(chǎn)芯片產(chǎn)業(yè)鏈協(xié)同進(jìn)步的基礎(chǔ)之上。
從芯片前端設(shè)計(jì)、后端驗(yàn)證,到制造封裝以及軟件生態(tài)建設(shè),每一個(gè)環(huán)節(jié)的進(jìn)步都離不開(kāi)國(guó)內(nèi)上下游企業(yè)的緊密配合。
尤其是在先進(jìn)制程受限背景下,華為與中芯國(guó)際等本土代工企業(yè)的深度合作,加速推動(dòng)了國(guó)產(chǎn)半導(dǎo)體制造能力的實(shí)質(zhì)性躍遷。
過(guò)去數(shù)年間,中國(guó)在高端芯片制造領(lǐng)域面臨嚴(yán)峻挑戰(zhàn),尤其在7nm及以下節(jié)點(diǎn)上與臺(tái)積電、三星存在明顯代差。
11
隨著昇騰系列芯片的大規(guī)模部署,國(guó)內(nèi)廠(chǎng)商的技術(shù)積累不斷加深。
通過(guò)與中芯國(guó)際合作優(yōu)化工藝流程,華為成功將14nm工藝性能調(diào)校至接近國(guó)際7nm水平,盡管尚未完全對(duì)標(biāo)最先進(jìn)制程,但已顯著縮小技術(shù)差距。
這一成果為國(guó)產(chǎn)芯片邁向更高能效比奠定了堅(jiān)實(shí)基礎(chǔ),標(biāo)志著我國(guó)在高端芯片自給道路上邁出關(guān)鍵一步。
與此同時(shí),寒武紀(jì)、壁仞科技等國(guó)產(chǎn)GPU廠(chǎng)商也在這一浪潮中扮演了重要角色。
12
以往,國(guó)內(nèi)多數(shù)芯片企業(yè)將重心放在單顆芯片的峰值算力提升上,忽視了多芯片協(xié)同與系統(tǒng)整合的重要性。
華為的成功案例促使業(yè)界重新審視未來(lái)競(jìng)爭(zhēng)的本質(zhì):真正的優(yōu)勢(shì)不再局限于單點(diǎn)突破,而在于整個(gè)系統(tǒng)的協(xié)同優(yōu)化能力。
在此背景下,寒武紀(jì)、壁仞等企業(yè)紛紛調(diào)整研發(fā)方向,加大對(duì)集群互聯(lián)、分布式調(diào)度等系統(tǒng)級(jí)技術(shù)的投入力度。
13
華為亦高度重視生態(tài)系統(tǒng)建設(shè)。
為打破英偉達(dá)CUDA生態(tài)的壟斷局面,華為宣布全面開(kāi)放靈衢2.0互聯(lián)技術(shù)規(guī)范,邀請(qǐng)國(guó)內(nèi)芯片廠(chǎng)商共同參與標(biāo)準(zhǔn)制定與生態(tài)共建。
此舉打破了各家企業(yè)各自為戰(zhàn)的局面,促進(jìn)了國(guó)產(chǎn)異構(gòu)計(jì)算平臺(tái)之間的互聯(lián)互通。
通過(guò)開(kāi)放共享核心技術(shù),華為不僅強(qiáng)化了自身生態(tài)粘性,更為全國(guó)芯片產(chǎn)業(yè)鏈的協(xié)同發(fā)展注入強(qiáng)勁動(dòng)力。
14
結(jié)語(yǔ)
憑借超節(jié)點(diǎn)算力集群的技術(shù)突破,華為成功突圍美國(guó)對(duì)中國(guó)高科技產(chǎn)業(yè)的層層封鎖,為國(guó)產(chǎn)芯片發(fā)展注入強(qiáng)大信心。
這一里程碑式的進(jìn)展,不僅展現(xiàn)了華為在高端算力領(lǐng)域的引領(lǐng)實(shí)力,更為中國(guó)科技自主創(chuàng)新樹(shù)立了標(biāo)桿典范。
展望未來(lái),隨著國(guó)產(chǎn)芯片技術(shù)持續(xù)迭代升級(jí),華為及其生態(tài)伙伴有望在全球科技版圖中占據(jù)更加關(guān)鍵的位置。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.