近日,NVIDIA宣布其AI與高性能計(jì)算領(lǐng)域明星產(chǎn)品Blackwell GPU的升級(jí)版本——Blackwell Ultra,也就是B300和GB300,預(yù)計(jì)將于今年晚些時(shí)候推出。緊接著,將迎來全新的“Rubin”GPU。其中,GB300 GPU作為首次支持PCIe 6.0的GPU,將帶來高達(dá)50%的性能提升,同時(shí)功耗高達(dá)1400W。
Blackwell Ultra采用臺(tái)積電4NP工藝制造,擁有2080億個(gè)晶體管,采用兩個(gè)Die通過NV-HBI高速界面互連(帶寬10TB/s),配備了總計(jì)160個(gè)SM單元(每個(gè)包含128個(gè)CUDA核心)和640個(gè)第五代Tensor核心,共享完全一致性的二級(jí)緩存。GPU間通過1.8TB/s帶寬的第五代NVLink互連,而GPU與CPU之間的NVLink-C2C通道帶寬為900GB/s,這些技術(shù)特點(diǎn)與前代產(chǎn)品保持一致。Blackwell Ultra的亮點(diǎn)之一是首次支持PCIe 6.0,這將使可用帶寬直接翻倍,同時(shí)HBM3E內(nèi)存容量從192GB增加到288GB(帶寬8TB/s)。不過,這一升級(jí)也帶來了功耗的增加,最大功耗達(dá)到了1400W。
性能方面,Blackwell Ultra的NVFP4 dense稠密性能提升了50%,達(dá)到了15PFlops,而sparse稀疏性能保持在20PFlops。此外,SFU(特殊功能單元)EX2下的注意力加速能力也從5TF/s提升至10.7TF/s,翻了一番還多。FP8、FP16、TF16等數(shù)據(jù)格式的性能則基本沒有變化。
Blackwell Ultra的主要部署形態(tài)將是GB300 NV72服務(wù)器,采用液冷機(jī)架,每個(gè)節(jié)點(diǎn)包含兩顆B300 GPU和一顆Grace GPU。這一升級(jí)版的推出,將為AI和HPC領(lǐng)域帶來更加高效和強(qiáng)大的計(jì)算能力。
PCIe 6.0加速來了
PCIe 不僅僅是一個(gè)物理插槽標(biāo)準(zhǔn)??偩€的主力是拓?fù)?。PCIe 用于連接內(nèi)置外設(shè)、筆記本電腦和迷你 PC 的附加卡以及 SSD 存儲(chǔ)。Mini PCIe 使用相同的拓?fù)?、編碼和規(guī)格,并且與常規(guī) PCIe 電氣兼容?,F(xiàn)在常見的M.2 SSD接口也采用PCIe拓?fù)洹?/p>
PCIe 的串行數(shù)據(jù)路徑使用單向差分對(duì)來提高信號(hào)完整性。雖然這些線對(duì)需要進(jìn)行長度匹配才能消除偏斜,但每對(duì)的兩條跡線比 8、16 或 32 條跡線更容易處理。
差分信號(hào)走線的去偏技術(shù)
高速并行總線也可能受到串?dāng)_的影響,串?dāng)_是一種從一條走線到另一條走線的信號(hào)泄漏。這會(huì)導(dǎo)致數(shù)據(jù)損壞并限制帶寬。差分配對(duì)信號(hào)可消除大部分串?dāng)_并提供更清晰的信號(hào)。
PCIe 差分對(duì)的優(yōu)勢(shì)
PCIe的單向差分對(duì)由四根走線組成,作為每個(gè)方向的差分對(duì)。每組四個(gè)連接稱為一個(gè)通道,PCIe 插槽可支持 1 到 16 個(gè)通道。用于連接兩個(gè) PCIe 設(shè)備的通道組稱為互連或鏈路?,F(xiàn)代圖形加速器通常使用 16 通道插槽,有些需要兩個(gè)插槽和額外的電源連接。
差分對(duì)布置可加快傳輸速度并提高可靠性。在 PCIe 版本 1.0 和 2.0 中,數(shù)據(jù)以帶有兩個(gè)開銷位的 8 位字傳輸,稱為 8b/10b 編碼。這意味著 20% 的傳輸比特是開銷,而不是數(shù)據(jù)。PCI 3.0 將這一數(shù)字提升至 128b/130b 編碼,產(chǎn)生 98.5% 的數(shù)據(jù)率和 1.5% 的開銷。這種編碼從 PCIe 1.0 到 5.0 一直保留,表示具有不歸零(NRZ) 格式的二進(jìn)制數(shù)據(jù)。
PCIe 1.0 至 6.0:傳輸速度加倍
PCIe 1.0 每通道傳輸速度高達(dá) 2.5 GB/s,16 通道互連時(shí)最高傳輸速度為 4 GB/s。隨著協(xié)議和芯片制造能力的改進(jìn),PCIe 2.0 使這一數(shù)字翻了一番。PCIe 3.0 從 8b/10b 提升到 128b/130b,速度幾乎翻倍至每通道 8 GB/s。此后的每個(gè)新版本的數(shù)據(jù)速率都增加了一倍。2022 年推出的 PCIe 6.0 在編碼和協(xié)議方面帶來了重大變化,將速度提升至 64 GB/s。PCIe 6.0 從 NRZ 數(shù)據(jù)格式更改為脈沖幅度調(diào)制 4 級(jí)(PAM4) 信令。PAM 表示與 NRZ 中的一位相同單位間隔中的兩位,它給出四個(gè)值而不是兩個(gè)。這有效地用兩位值替換了二進(jìn)制位。PAM4 的錯(cuò)誤率要高得多,因此需要高級(jí)糾錯(cuò)。
在Blackwell Ultra之前,PCIe 6.0更多是停留在標(biāo)準(zhǔn)制定、控制器發(fā)布和早期企業(yè)級(jí)應(yīng)用的階段。Blackwell Ultra這樣的頂級(jí)GPU作為消費(fèi)市場和數(shù)據(jù)中心市場的“風(fēng)向標(biāo)”,其采用PCIe 6.0將產(chǎn)生強(qiáng)大的拉動(dòng)效應(yīng),迫使整個(gè)產(chǎn)業(yè)鏈迅速跟進(jìn)和成熟。其意義遠(yuǎn)不止于“一次接口升級(jí)”。它更像是一個(gè) “點(diǎn)火器”:
1. 對(duì)產(chǎn)業(yè):它強(qiáng)力推動(dòng)了PCIe 6.0生態(tài)的成熟,迫使CPU、主板、連接器等上下游廠商全面跟進(jìn),開啟了新一輪的硬件更新周期。
2. 對(duì)技術(shù):它為數(shù)據(jù)中心和高端工作站的異構(gòu)計(jì)算、高速互聯(lián)提供了關(guān)鍵的基礎(chǔ)設(shè)施,解決了未來AI和計(jì)算密集型應(yīng)用的潛在I/O瓶頸。
3. 對(duì)用戶:短期內(nèi)是“戰(zhàn)未來”的特性,為未來的游戲和應(yīng)用預(yù)留了巨大的帶寬空間;長期來看,它將像之前的每一次PCIe升級(jí)一樣,最終成為所有PC的基石, enabling下一代計(jì)算體驗(yàn)。
簡單來說,Blackwell Ultra和PCIe 6.0的結(jié)合,不是為了解決今天的問題,而是為了構(gòu)建明天的基礎(chǔ)。
平臺(tái)已經(jīng)舉辦的高速銅纜供應(yīng)鏈會(huì)議一覽表
線束行業(yè)參考學(xué)習(xí)資訊
更多關(guān)于最新的線纜行業(yè)發(fā)展訊息,請(qǐng)關(guān)注我們的微信公眾號(hào)!我們將第一時(shí)間搜尋到行業(yè)前沿訊息和您一起分享!不做盈利用途,文中觀點(diǎn)都是基于公開數(shù)據(jù)及信息,僅供交流,不構(gòu)成投資建議!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.