8 月 25 日消息,英偉達(dá)近日發(fā)布博文,深入分析了其最快 AI 芯片 Blackwell Ultra GB300,比上一代 GB200 性能提升 50%。
該芯片采用雙光罩(Reticle)設(shè)計(jì)、2080 億晶體管、2 萬個(gè) CUDA 核心,并配備 288GB HBM3e 顯存,帶寬達(dá) 8TB/s。
GB300 采用雙光罩(家注:芯片光刻時(shí)單次曝光的最大尺寸單位,雙光罩設(shè)計(jì)指通過互連技術(shù)將兩顆大芯片作為一體運(yùn)行)大芯片設(shè)計(jì),通過 NV-HBI 高速互連將兩顆芯片以 10TB/s 帶寬連接為單顆 GPU。
該芯片基于臺(tái)積電 4NP 工藝制造,集成 2080 億晶體管,擁有 160 個(gè) SM 單元,每個(gè) SM 共有 128 個(gè) CUDA 內(nèi)核,總計(jì) 20480 個(gè) CUDA 核心與 640 個(gè)第五代 Tensor 核心,并具備 40MB TMEM。
在存儲(chǔ)方面,GB300 配備 288GB HBM3e 顯存,帶寬達(dá) 8TB/s,較 GB200 的 192GB 大幅提升,8 組堆疊顯存通過 8192-bit 位寬連接,可容納 3000 億以上參數(shù)模型,支持更長(zhǎng)的上下文長(zhǎng)度及更高計(jì)算效率。
互連方面,Blackwell Ultra 支持第五代 NVLink,實(shí)現(xiàn)每 GPU 1.8TB/s 雙向帶寬,最多支持 576 GPU 互連;PCIe Gen6 接口提供 256GB/s 帶寬,并支持與 Grace CPU 的 NVLink-C2C 協(xié)同。企業(yè)特性還包括多實(shí)例 GPU(MIG)分區(qū)、安全計(jì)算和 AI 預(yù)測(cè)運(yùn)維功能。
在系統(tǒng)層面,Grace Blackwell Ultra 超級(jí)芯片將一顆 Grace CPU 直連兩顆 GPU,構(gòu)成 GB300 NVL72 機(jī)架系統(tǒng),峰值算力可達(dá) 1.1 EFLOPS FP4。
安全與管理方面,GB300 搭載升級(jí)版 GigaThread 調(diào)度引擎,支持多實(shí)例 GPU(MIG)靈活分配顯存資源,并引入機(jī)密計(jì)算與 TEE-I/O 特性保障 AI 模型與數(shù)據(jù)安全。
來源:英偉達(dá)、IT之家
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.