國芯網(wǎng)[原:中國半導(dǎo)體論壇] 振興國產(chǎn)半導(dǎo)體產(chǎn)業(yè)!
不拘中國、放眼世界!關(guān)注世界半導(dǎo)體論壇↓↓↓
9月18日,在上海世博中心舉辦的2025華為全聯(lián)接大會上,華為副董事長、輪值董事長徐直軍登臺發(fā)表演講,首次對外公布了昇騰AI芯片未來三年的產(chǎn)品迭代路線圖,同時明確表示2026年一季度發(fā)布的新產(chǎn)品將采用華為自研HBM(高帶寬內(nèi)存)。
根據(jù)規(guī)劃,2026年至2028年期間,華為將分階段推出四款昇騰系列芯片,具體包括:2026年第一季度推出昇騰950PR,該芯片采用華為自研HBM;2026年第四季度推出昇騰950DT;2027年第四季度推出昇騰960芯片;2028年第四季度推出昇騰970。
與英偉達(dá)基于通用集成集成電路設(shè)計(jì)的GPU有所不同,華為昇騰芯片屬于專用集成集成電路架構(gòu)的NPU(Neural Processing Unit, 神經(jīng)網(wǎng)絡(luò)處理器), 專為處理AI神經(jīng)網(wǎng)絡(luò)計(jì)算任務(wù)設(shè)計(jì)。
從2019年開始,華為已經(jīng)發(fā)布多款昇騰910系列芯片,包括910B、910C多款產(chǎn)品,大會曬出的路線圖顯示910C為今年第一季度最新發(fā)布。該系列是基于華為自研的達(dá)芬奇架構(gòu),專為云端AI訓(xùn)練和推理使用。
從芯片技術(shù)指標(biāo)來看,昇騰910C算力高達(dá)800TFLOPS(以行業(yè)衡量AI算力規(guī)模的半精度浮點(diǎn)數(shù)FP16為標(biāo)準(zhǔn)),支持業(yè)內(nèi)標(biāo)準(zhǔn)的FP32/HF32/FP16/BF16/INT8等數(shù)據(jù)格式,互聯(lián)帶寬784GB/s,HBM容量為128GB、內(nèi)存帶寬為3.2TB/s。
作為對比,英偉達(dá)最新Blackwell B300在同等標(biāo)準(zhǔn)下的算力約為3840TFLOPS(B300在FP4標(biāo)準(zhǔn)下算力為15P,1P等于1024T,即15360TTFLOPS, 在理想精度無損轉(zhuǎn)換場景下,F(xiàn)P4算力折算成FP16需除以4),配備的是288GBHBM3e,帶寬為8TB/s。
2026年將要發(fā)布的昇騰950PR/DT微架構(gòu)將升級為SIMD/SIMT,算力達(dá)到1PFLOPS(FP8)/ 2PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8 /HiF8/MXFP4/HiF4等數(shù)據(jù)格式,互聯(lián)帶寬為2TB/s。內(nèi)存容量及帶寬上,昇騰950PR為128GB和1.6TB/s;昇騰950DT為144GB和4TB/s。
徐直軍在演講中指出,由于受美國的制裁,華為不能到臺積電去投片,單顆芯片的算力相比英偉達(dá)存在差距。但華為“有三十多年聯(lián)人、聯(lián)機(jī)器”的積累,并在在超節(jié)點(diǎn)互聯(lián)技術(shù)上強(qiáng)力投資、實(shí)現(xiàn)突破,能夠做到萬卡級的超節(jié)點(diǎn),從而做到世界上算力最強(qiáng)。
半導(dǎo)體論壇百萬微信群
第一步:掃描下方二維碼,關(guān)注國芯網(wǎng)微信公眾號。
文章內(nèi)容整理自網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系溝通
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.