智東西
作者 ZeR0
編輯 漠影
智東西10月13日?qǐng)?bào)道,剛剛,在圣何塞OCP全球峰會(huì)上,英偉達(dá)展示了十億瓦AI工廠的未來(lái),并宣布Meta和甲骨文將使用英偉達(dá)Spectrum-X以太網(wǎng)網(wǎng)絡(luò)交換機(jī)來(lái)增強(qiáng)其AI數(shù)據(jù)中心網(wǎng)絡(luò),加快大規(guī)模部署,實(shí)現(xiàn)AI訓(xùn)練效率的指數(shù)級(jí)增長(zhǎng)。
英偉達(dá)創(chuàng)始人兼CEO黃仁勛說(shuō),Spectrum-X不僅僅是更快的以太網(wǎng),更是“AI工廠的神經(jīng)系統(tǒng)”,使超大規(guī)模計(jì)算企業(yè)能夠?qū)?shù)百萬(wàn)張GPU連接到一臺(tái)巨型計(jì)算機(jī)中,以訓(xùn)練有史以來(lái)最大規(guī)模的模型。
專為萬(wàn)億參數(shù)模型時(shí)代而設(shè)計(jì)的英偉達(dá)Spectrum-X以太網(wǎng)平臺(tái)由Spectrum-X以太網(wǎng)交換機(jī)和Spectrum-X以太網(wǎng)超級(jí)網(wǎng)卡組成,是首個(gè)專為AI打造的以太網(wǎng)平臺(tái)。
Spectrum-X以太網(wǎng)已展現(xiàn)出創(chuàng)紀(jì)錄的效率,其擁塞控制技術(shù)使全球最大的AI超級(jí)計(jì)算機(jī)實(shí)現(xiàn)了95%的數(shù)據(jù)吞吐量。相比之下,現(xiàn)成的大規(guī)模以太網(wǎng)會(huì)遭遇數(shù)千次流量沖突,導(dǎo)致吞吐量限制在60%左右。
這一效率飛躍標(biāo)志著AI可擴(kuò)展網(wǎng)絡(luò)在經(jīng)濟(jì)性和性能方面的突破。英偉達(dá)Spectrum-XGS以太網(wǎng)技術(shù)是Spectrum-X以太網(wǎng)網(wǎng)絡(luò)平臺(tái)的一部分,能夠?qū)崿F(xiàn)跨規(guī)模擴(kuò)展,將跨城市、國(guó)家、大洲的數(shù)據(jù)中心連接成龐大的十億級(jí)AI超級(jí)工廠。
Spectrum-X基于英偉達(dá)全棧平臺(tái)(包括GPU、CPU、NVLink和軟件),提供從計(jì)算到網(wǎng)絡(luò)的無(wú)縫性能。其先進(jìn)的擁塞控制、自適應(yīng)路由和AI驅(qū)動(dòng)的遙測(cè)功能可確保大規(guī)模AI訓(xùn)練和推理集群的效率和可預(yù)測(cè)性。
甲骨文將建設(shè)通過(guò)Spectrum-X以太網(wǎng)互連的十億級(jí)AI工廠。
“通過(guò)采用Spectrum-X以太網(wǎng),我們能以突破性的效率互連數(shù)百萬(wàn)張GPU,從而使我們的客戶能夠更快地訓(xùn)練、部署并受益于下一波生成式和推理式AI?!奔坠俏脑苹A(chǔ)設(shè)施執(zhí)行副總裁Mahesh Thiagarajan說(shuō)。
Meta將把Spectrum以太網(wǎng)交換機(jī)集成到其Facebook開(kāi)放交換系統(tǒng)(FBOSS)的網(wǎng)絡(luò)基礎(chǔ)設(shè)施中。FBOSS是一個(gè)專為大規(guī)模管理和控制網(wǎng)絡(luò)交換機(jī)而開(kāi)發(fā)的軟件平臺(tái)。此次集成將加速大規(guī)模部署,從而提升AI訓(xùn)練效率并縮短洞察時(shí)間。
據(jù)Meta網(wǎng)絡(luò)工程副總裁Gaya Nagarajan分享:“Meta的下一代AI基礎(chǔ)架構(gòu)需要業(yè)界前所未有的規(guī)模的開(kāi)放高效網(wǎng)絡(luò)。通過(guò)將英偉達(dá)Spectrum以太網(wǎng)集成到Minipack3N交換機(jī)和FBOSS中,我們可以擴(kuò)展我們的開(kāi)放網(wǎng)絡(luò)方法,同時(shí)釋放訓(xùn)練更大規(guī)模模型所需的效率和可預(yù)測(cè)性,并將生成式AI應(yīng)用帶給數(shù)十億人。”
英偉達(dá)NVLink Fusion也正快速發(fā)展,使企業(yè)能夠?qū)⑵浒攵ㄖ菩酒瑹o(wú)縫集成到高度優(yōu)化且廣泛部署的數(shù)據(jù)中心架構(gòu)中,從而降低復(fù)雜性并加快產(chǎn)品上市時(shí)間。
英特爾和三星代工廠正在加入NVLink Fusion生態(tài)系統(tǒng)。該生態(tài)系統(tǒng)包括定制芯片設(shè)計(jì)者、CPU和IP合作伙伴,以便AI工廠能夠快速擴(kuò)展,以處理模型訓(xùn)練和Agentic AI推理的苛刻工作負(fù)載。
全新NVLink Fusion生態(tài)伙伴包括:
- CPU合作伙伴:富士通,英特爾,高通。
- 定制芯片合作伙伴:AIchip,Astera Labs,GUC,Marvell,聯(lián)發(fā)科,三星。
- 技術(shù)合作伙伴:楷登電子(Cadence),新思科技(Synopsys)。
作為最近宣布的英偉達(dá)和英特爾合作的一部分,英特爾將構(gòu)建使用NVLink Fusion集成到英偉達(dá)基礎(chǔ)設(shè)施平臺(tái)的x86 CPU。
三星代工廠已與英偉達(dá)合作,以滿足對(duì)定制CPU和定制XPU日益增長(zhǎng)的需求,為定制芯片提供從設(shè)計(jì)到制造的體驗(yàn)。
如今,十億瓦AI集群已經(jīng)成為AI芯片龍頭企業(yè)們共同的目標(biāo)。英偉達(dá)Spectrum-X以太網(wǎng)和Spectrum-XGS結(jié)合了OCP的開(kāi)放性和領(lǐng)先性能,被Meta和甲骨文兩大科技巨頭選用部署。
這些旨在實(shí)現(xiàn)跨規(guī)模擴(kuò)展的技術(shù),將為大規(guī)模AI訓(xùn)練及推理帶來(lái)更可觀的效率,進(jìn)而加速生成式AI應(yīng)用的開(kāi)發(fā)與普及。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.