隨著AI技術(shù)的快速發(fā)展和大模型時代的到來,對算力集群的性能和規(guī)模提出了更高的要求。為了滿足這一需求,華為于2025年推出了昇騰超節(jié)點技術(shù),并在同年的鯤鵬昇騰開發(fā)者大會上首次展示了昇騰384超節(jié)點。昇騰384超節(jié)點實現(xiàn)了業(yè)界最大規(guī)模的384張昇騰NPU AI算力卡高速總線互聯(lián),具備超大帶寬、超低時延、超強性能三大優(yōu)勢,在AI大模型的訓練與推理等任務中展現(xiàn)出了卓越的性能表現(xiàn)。在2025世界人工智能大會上,華為首次線下展出昇騰384超節(jié)點真機,吸引了眾多參觀者的關(guān)注。這款被視為展會“鎮(zhèn)館之寶”的設備,不僅在算力等核心指標上實現(xiàn)對國際巨頭產(chǎn)品的超越,更憑借創(chuàng)新的高速互連技術(shù),讓高速銅纜及相關(guān)配套領(lǐng)域成為市場關(guān)注的焦點。
昇騰384超節(jié)點 圖/華為中國
解讀-什么是超節(jié)點技術(shù)
超節(jié)點,英文名叫SuperPod,是英偉達公司最先提出的概念。就個人理解:超節(jié)點(SuperPod)是一種通過高速互連技術(shù)將更多GPU計算單元整合為統(tǒng)一計算資源池的新型架構(gòu),目的是解決大模型訓練中的算力瓶頸和通信效率問題。處于同一個HBD(High Bandwidth Domain,超帶寬域)。英偉達將這種以超大帶寬互聯(lián)16卡以上GPU-GPU的Scale Up系統(tǒng),稱為超節(jié)點。眾所周知,GPU作為核心算力硬件,為AIGC大模型的訓練與推理提供了關(guān)鍵支撐。隨著大模型參數(shù)規(guī)模呈指數(shù)級增長,對GPU集群的規(guī)模需求也同步攀升——從早期的千卡級逐步跨越至萬卡級、十萬卡級,未來甚至可能向更龐大的規(guī)模演進。面對這一趨勢,構(gòu)建超大規(guī)模GPU集群的核心路徑可歸結(jié)為兩種策略:Scale Up(向上擴展)與Scale Out(向外擴展)。
Scale Up和Scale Out
Scale Up(縱向擴展):
通過增強單節(jié)點資源密度提升算力。在單個服務器節(jié)點內(nèi)集成更多GPU硬件。 例如,將單臺服務器的GPU配置從4卡擴展至8卡、12卡甚至更高,使單一節(jié)點具備更強的并行計算能力。優(yōu)勢在于架構(gòu)相對簡單,無需復雜的跨節(jié)點協(xié)同,適合對單機算力密度要求高的場景,如中小規(guī)模模型的高效訓練。
通過Scale UP這么多塊GPU,需要考慮服務器的內(nèi)部通信能力是否能夠支持。如果GPU互連存在瓶頸,那么就達不到Scale Up的預期效果之前計算機內(nèi)部主要基于PCIe協(xié)議,數(shù)據(jù)傳輸速率慢,時延高,根本無法滿足要求。
近年來,英偉達為了解決這個問題,專門推出自NVLink總線協(xié)議和NVLink Switch交換機,速度遠高于PCIe,時延也低得多。NVLink Switch協(xié)同NVLink釋放數(shù)據(jù)傳輸能力。NVLink Switch通過連接多個 NVLink,實現(xiàn)機架內(nèi)和機架間全速度的GPU通信,達到1.8TB/雙向直接GPU到GPU互聯(lián)速率。
Scale Out(橫向擴展):
通過增加節(jié)點數(shù)量構(gòu)建分布式算力網(wǎng)絡。通過高速網(wǎng)絡(如IB、RoCe)將多臺服務器節(jié)點互聯(lián),形成集群級算力池。例如,將數(shù)千臺搭載GPU的服務器通過網(wǎng)絡協(xié)議協(xié)同工作,實現(xiàn)算力的線性擴展。核心優(yōu)勢在于突破單機硬件限制,可支撐超大規(guī)模模型的分布式訓練,但需要解決跨節(jié)點通信延遲、負載均衡、數(shù)據(jù)同步等復雜技術(shù)挑戰(zhàn)。
華為昇騰超節(jié)點技術(shù)對未來高速銅纜發(fā)展有何影響
華為昇騰384超節(jié)點的發(fā)布,標志著國產(chǎn)算力集群架構(gòu)的重大突破,其全光互聯(lián)設計對高速銅纜產(chǎn)業(yè)既形成技術(shù)替代壓力,也倒逼高端升級。以下從技術(shù)路線、市場格局、產(chǎn)業(yè)機會三個維度分析具體影響:
昇騰384超節(jié)點采用全光互聯(lián)架構(gòu)(3168根光纖 + 6912個400G光模塊),替代傳統(tǒng)銅纜實現(xiàn)芯片間長距、高帶寬通信,核心原因在于:
1. 距離突破:銅纜機柜內(nèi)走線傳輸短距離為主,而光纖支持2米以上跨機柜部署,解決384顆芯片分散布局的散熱與供電難題。
2.帶寬與時延:單芯片需6.5TB/s數(shù)據(jù)吞吐,光纖提供392GB/s帶寬(銅纜僅26GB/s),時延 <200納秒(銅纜約2000納秒),降低90%通信延遲,確保集群協(xié)同效率。
3. 能效優(yōu)勢:線性直驅(qū)(LPO)技術(shù)降低光模塊功耗30%,而銅纜在高頻信號傳輸中功耗激增,無法滿足單機柜500kW+的散熱要求。
下表對比了兩種技術(shù)在超節(jié)點中的關(guān)鍵性能差異:
應用場景分化:銅纜退守短距連接,高端需求向224G升級
DAC采用銅線將兩端的連接器端口組裝起來,不包含任何主動組件, AEC則是含銅纜、連接器、Retimer芯片等, Retimer芯片可消除噪聲并非線性放大信號,以此來延長銅纜連接距離。 AOC則由兩端光模塊和光纖集成,通過光纜傳輸高速信號。
盡管光纖主導核心互聯(lián),銅纜在以下場景仍存空間,但技術(shù)門檻顯著提升:
1. 機柜內(nèi)短距連接:如服務器板卡間、電源接口等短距離場景。
2. 高速銅纜(DAC)升級:
- 立訊精密,沃爾核材,金信諾,新亞,藍原,神宇已量產(chǎn)單通道224G高速銅纜,應用于數(shù)據(jù)中心PCIe接口等部位,滿足英偉達GB300等國際競品需求。
- 博創(chuàng)科技子公司長芯盛的 800G/1.6T AEC(有源銅纜)支持7米傳輸,但主要供貨谷歌、AWS,未進入昇騰超節(jié)點核心鏈路。 此分化迫使國產(chǎn)銅纜廠商聚焦224G以上技術(shù),否則將喪失AI算力市場競爭力。對于銅纜本身來講,為了延長存在壽命,還可以升級到AEC,AEC可以做到32AWG ,也就是可以做到更細,減少銅纜所占空間。另一個,AEC傳輸距離更長,也更方便做超節(jié)點的擴展。這也是筆者有限看好AEC的原因之一,畢竟在滿足空間、散熱等限制的情況下,從成本、穩(wěn)定性、功耗以及復雜度等角度上講,銅纜還是具備優(yōu)勢的。所以,黃老板講的銅纜應用盡用沒錯( We should use copper as far as we can, and that's call it a meter or two. 我們應該盡可能使用銅線,大約一兩米的距離 ),只是DAC的確已經(jīng)逐步失去現(xiàn)在,AEC續(xù)命,大概率輸在未來了。大勢所趨往光連接上走更沒有問題,大概率是滲透提升,贏在未來了。為什么講大概率,就是怕有些人講萬一技術(shù)突破了,其實我也挺想可控核聚變和室溫超導立刻馬上突破的。
產(chǎn)業(yè)格局:國產(chǎn)替代窗口仍在,但頭部集中度加劇
高速銅纜廠商將開始分化,憑借224G技術(shù)卡位高端,成為英偉達鏈核心標的上述六家廠商,接下來需突破華為生態(tài)認證。繼以上六家后面的二級高速銅纜廠商若無法順利升級224G供應鏈,可能被擠出服務器供應鏈。此次華為昇騰384超節(jié)點意義重大,因為從客觀上說,無論nv的光銅混合,還是華為的全光方案都只是技術(shù)路徑之一,大家還在探索階段,沒有形成市場的共識。但相信會倒逼高速銅纜高端化。未能及時布局升級224G技術(shù)的廠商將逐步邊緣化,市場份額向頭部集中。
高速互連技術(shù)正面臨單通道224Gbps向448Gbps演進的關(guān)鍵節(jié)點。為應對信號完整性、功率損耗及供應鏈重組等核心挑戰(zhàn),高速銅纜產(chǎn)業(yè)鏈亟需在材料、精密制造工藝及測試驗證體系等維度實現(xiàn)技術(shù)突破。本次9-5日與江蘇鹽城東臺舉辦的高頻高速時代之800G/1.6T產(chǎn)業(yè)鏈推進技術(shù)研討峰會得到供應鏈頭部企業(yè)的全力支持,我們再次誠邀行業(yè)同仁開展建設性對話,以技術(shù)創(chuàng)新為驅(qū)動,以產(chǎn)業(yè)升級為目標,攜手構(gòu)建高速互連領(lǐng)域的技術(shù)生態(tài)體系。就高速互聯(lián)發(fā)展進程中的技術(shù)瓶頸突破與產(chǎn)業(yè)鏈協(xié)同創(chuàng)新展開更多的深度探討。再次誠邀您報名出席為行業(yè)發(fā)展貢獻一份力量;歡迎掃下圖二維碼報名參會.
報名后加入會議溝通交流群
本次會議將采用:東臺本地高速銅纜供應鏈企業(yè)參觀+現(xiàn)場展臺觀展+線纜技術(shù)交流+行業(yè)圓桌會議+交流晚宴幾部分組成,會場按照600人+規(guī)模布置,報滿即止.更多會議細節(jié)了解可以電話:150-1533-1777,魯總.目前已經(jīng)報名參會的名單如下(截至 到2025-08-20日已經(jīng)報名清單)
舉辦會議地點
更多關(guān)于最新的線纜行業(yè)發(fā)展訊息,請關(guān)注我們的微信公眾號!我們將第一時間搜尋到行業(yè)前沿訊息和您一起分享!不做盈利用途,文中觀點都是基于公開數(shù)據(jù)及信息,僅供交流。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.