《科創(chuàng)板日?qǐng)?bào)》10月4日訊 人工智能正以史無(wú)前例的速度重塑各行業(yè),這場(chǎng)變革背后離不開海量算力的支持。當(dāng)AI模型參數(shù)從億級(jí)躍升至萬(wàn)億級(jí),“超節(jié)點(diǎn)”開始逐漸取代單機(jī)與傳統(tǒng)集群,成為新一代的“算力法寶”。
超節(jié)點(diǎn),即Superpod,是一種用于構(gòu)建大規(guī)模算力集群的技術(shù)架構(gòu)。此概念最早由英偉達(dá)提出,指將數(shù)千張GPU集成在一個(gè)邏輯單元內(nèi),形成類似“超級(jí)計(jì)算節(jié)點(diǎn)”的系統(tǒng)。與傳統(tǒng)架構(gòu)不同的是,超節(jié)點(diǎn)可以通過(guò)高速互聯(lián)技術(shù),彌補(bǔ)原先服務(wù)器間帶寬不足以及高時(shí)延等問(wèn)題,以期實(shí)現(xiàn)算力效率的優(yōu)化。
在不久前舉行的2025云棲大會(huì)上,阿里云發(fā)布了磐久128超節(jié)點(diǎn)AI服務(wù)器。據(jù)悉,該服務(wù)器集成阿里自研CIPU 2.0芯片和EIC/MOC高性能網(wǎng)卡,單柜支持128個(gè)AI計(jì)算芯片。同等算力下,相較于傳統(tǒng)架構(gòu),該服務(wù)器推理性能可提升50%。
除推理場(chǎng)景外,超節(jié)點(diǎn)亦可用于AI訓(xùn)練。今年4月,華為推出CloudMatrix 384超節(jié)點(diǎn),其通過(guò)構(gòu)建超過(guò)萬(wàn)片的大集群來(lái)提供算力。對(duì)于萬(wàn)億、十萬(wàn)億參數(shù)的大模型訓(xùn)練任務(wù),在云數(shù)據(jù)中心,可將432個(gè)超節(jié)點(diǎn)級(jí)聯(lián)成最高16萬(wàn)卡的超大集群。
在9月召開的華為全連接大會(huì)上,華為表示CloudMatrix 384超節(jié)點(diǎn)已銷售300余套,共服務(wù)20余家客戶,主要需求來(lái)自政企。未來(lái),華為還將推出Atlas 950 SuperPoD超節(jié)點(diǎn),算力規(guī)模8192卡,預(yù)計(jì)于2026年四季度上市。新一代產(chǎn)品Atlas 960 SuperPoD算力規(guī)模將達(dá)到15488卡,預(yù)計(jì)2027年四季度上市。
華龍證券指出,中美AI競(jìng)爭(zhēng)正從“單卡性能”走向“系統(tǒng)級(jí)效率”,中國(guó)正在用集群建設(shè)+開源生態(tài)+工程化交付的方式完成AI基建方面的彎道超車。事實(shí)上,當(dāng)前還有更多國(guó)產(chǎn)硬件廠商正在加速布局超節(jié)點(diǎn):
8月7日,浪潮信息發(fā)布面向萬(wàn)億參數(shù)大模型的超節(jié)點(diǎn)AI服務(wù)器“元腦SD200”。
沐曦股份已發(fā)布多種超節(jié)點(diǎn)形態(tài),包括光互連超節(jié)點(diǎn)、耀龍3D Mesh超節(jié)點(diǎn)、Shanghai Cube國(guó)產(chǎn)高密度液冷整機(jī)柜以及高密度液冷算力POD。
8月28日,百度智能云發(fā)布百舸AI計(jì)算平臺(tái)5.0版本。在算力方面,昆侖芯超節(jié)點(diǎn)正式啟用。
從技術(shù)方向看,超節(jié)點(diǎn)正在成為AI基礎(chǔ)設(shè)施建設(shè)的新常態(tài)。民生證券認(rèn)為,此前市場(chǎng)更多關(guān)注芯片算力,但伴隨Scale up產(chǎn)業(yè)趨勢(shì)崛起,超節(jié)點(diǎn)已經(jīng)重新定義AI基礎(chǔ)設(shè)施的范式。
以華為超節(jié)點(diǎn)為例,其柜間采用全光互聯(lián),具有高可靠、高帶寬、低時(shí)延等優(yōu)勢(shì);另一方面,華為的Atlas 950通過(guò)正交架構(gòu),實(shí)現(xiàn)零線纜電互聯(lián),其獨(dú)創(chuàng)的材料和工藝讓光模塊液冷可靠性提升1倍。相比英偉達(dá)將在明年下半年上市的NVL144,Atlas950超節(jié)點(diǎn)卡的規(guī)模是其56.8倍,總算力是其6.7倍,內(nèi)存容量是其15倍,互聯(lián)帶寬是其62倍,在各方面均呈領(lǐng)先。
該機(jī)構(gòu)進(jìn)一步指出,當(dāng)超節(jié)點(diǎn)速率大幅提升,AIDC功率將迎來(lái)新挑戰(zhàn)。由于包括華為CloudMatrix 384、英偉達(dá)GB200NVL72在內(nèi)的超節(jié)點(diǎn)單機(jī)柜功耗普遍突破100KW,因此在算力密度指數(shù)級(jí)增加的情況下,超節(jié)點(diǎn)機(jī)柜的溫控和電源系統(tǒng)將面臨挑戰(zhàn)。而當(dāng)Atas950超節(jié)點(diǎn)采用全液冷模式時(shí),其互聯(lián)帶寬速率和算力速率均有望迎來(lái)大幅提升。
從投資層面來(lái)看,國(guó)金證券表示,華為超節(jié)點(diǎn)等新平臺(tái)在算力、帶寬、內(nèi)存等關(guān)鍵指標(biāo)上全面領(lǐng)先,有望推動(dòng)國(guó)產(chǎn)算力基礎(chǔ)設(shè)施加速落地??春贸?jié)點(diǎn)滲透率的持續(xù)提升,帶動(dòng)光連接供應(yīng)鏈的放量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.