夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

一文看懂華為昇騰芯片

0
分享至

最近這幾年,網(wǎng)上關于華為昇騰的討論很多,關注熱度也很高。

我們經(jīng)常說的昇騰,其實有兩層定義。

一層是狹義的定義,特指華為昇騰芯片。


昇騰910芯片

另一層是廣義的定義,是指圍繞昇騰芯片的整個全棧計算生態(tài)。既包括硬件,也包括軟件、算法以及應用服務。


來自《昇騰計算產(chǎn)業(yè)發(fā)展白皮書》

今天這篇文章,小棗君主要說說昇騰芯片和硬件體系。

昇騰芯片的演進

昇騰(Ascend)芯片是華為(海思)自研的、專門面向高性能AI計算的NPU(神經(jīng)網(wǎng)絡處理器)芯片。

現(xiàn)在AI浪潮風起云涌,到處都在搞AI大模型,還有AI應用落地。這些工作涉及到巨量的AI訓練和推理計算需求,就會用到昇騰這樣的AI芯片。


昇騰的對標對象,毫無疑問就是英偉達的GPU系列。

因為眾所周知的原因,英偉達的GPU對我們禁售(現(xiàn)在連閹割版的H20都不賣給我們了),所以,昇騰作為國產(chǎn)AI芯片,就發(fā)揮了重要的替代作用,也迎來了巨大的市場機遇。

昇騰芯片是一個大系列,主要包括昇騰310和昇騰910兩個子系列。

在2018年的華為全聯(lián)接大會上,華為輪值CEO徐直軍首次闡述了他們的AI戰(zhàn)略,并正式公布了昇騰910和昇騰310兩款AI芯片。當時,實體展示的,是昇騰310。

一年后,2019年8月,華為又正式推出了昇騰910。


昇騰310是SoC小芯片,和我們手機芯片差不多,只有指甲蓋那么大,功耗僅有8W。


它集成了多個運算單元,包括CPU(8個ARM A55 Core)、AI Core、數(shù)字視覺預處理子系統(tǒng)等,主要面向邊緣計算與低功耗終端,以完成AI推理任務為主。

AI Core是計算核心,采用了華為自研的達芬奇(DaVinci)架構(gòu),復雜執(zhí)行矩陣、向量、標量計算的算子任務。CPU負責非矩陣類復雜計算。


昇騰310架構(gòu)

根據(jù)海思官網(wǎng)的披露,昇騰310的FP16算力為8TOPS,INT8算力為16TOPS,采用12nm工藝制造。



昇騰910是大芯片,和我們的掌心差不多大,功耗在300W以上,主要面向云端高性能計算。它的算力更強,既能用于AI推理任務,也能用于AI訓練任務。

華為早期發(fā)布的昇騰910,其實應該算是910A

當時,因為華為還沒有被完全禁售,所以910A仍然采用了臺積電的7nm增強版EUV工藝。

芯片內(nèi)建了32顆達芬奇Max核心(達芬奇核心分為Max/Lite/Tiny三種,Max最完整),支持混合精度計算(FP16/FP32/INT8),F(xiàn)P16算力為256TFOPs,最大功耗350W(一開始說是350W,后來變成了310W)。


達芬奇架構(gòu)參數(shù)(來自第31屆Hot Chips大會)

2020年華為被列入實體清單后,臺積電那邊的先進工藝就用不了。于是,華為與中芯國際(SMIC)合作,采用他們的N+1工藝(等效7nm),推出了910B

910B優(yōu)化了架構(gòu)設計,提升了能效比,芯片尺寸為21.32mm×31.22mm,F(xiàn)P16算力約320TFLOPS, INT8算力約640TOPS。顯存為64GB HBM2e,顯存帶寬400GB/s。

910B也分為B1/B2/B3。910B3引入了HBM3e內(nèi)存,帶寬提升至1.2TB/s,支持萬億參數(shù)模型訓練。


來自知乎(萬文友)

最近這兩年,華為又推出了昇騰910C

昇騰910C采用中芯國際的7nm(N+2)工藝,晶體管數(shù)量達到530億。

910C采用了類似B200的雙die封裝設計(將兩顆獨立的芯片die分別放置在各自的中介層,再通過有機基板將兩個中介層連接起來),通過把兩顆昇騰910B整合到一起,實現(xiàn)了性能的提升。

這種封裝方式雖然在芯片間互聯(lián)帶寬上可能低于英偉達的先進封裝方案,但具有更低的成本、更高的良率以及更快的量產(chǎn)速度。

業(yè)界估測,910C在FP16精度下的單卡算力能達到800TFLOPS左右,大概是英偉達H100芯片(2022年推出)的80%。

值得一提的是,910C的芯片邏輯面積大約比H100多60%。這意味著910C在架構(gòu)效率和設計優(yōu)化方面, 與H100依然存在差距。

910C的HBM高帶寬內(nèi)存仍然來自海外廠商(國內(nèi)DRAM制造商長鑫存儲HBM2e相關技術還需要再等等)。芯片的整體國產(chǎn)化比例據(jù)說已經(jīng)達到90%以上。

910C的各方面參數(shù)以及進展信息都比較神秘。

根據(jù)網(wǎng)絡上的不可靠信息,910C于2024年四季度推出樣片,2025年一季度開始量產(chǎn),目前已經(jīng)處于大規(guī)模出貨階段,全年銷量大概在70-80萬顆。

也有不可靠消息指出,2024年910B的出貨量約四十萬張,今年910B出貨量可能與去年持平或略低(約30萬張),而910C的出貨量預計可能超過40萬張。因此,華為今年910B+910C的整體出貨量可能是70-100萬張。

出貨量和產(chǎn)能也有很大關系。中芯國際N+2工藝良率去年只有20%,今年據(jù)說已經(jīng)達到40-50%,分配給910C的產(chǎn)能貌似是2.6萬片晶圓/月(數(shù)據(jù)不靠譜,僅供參考,與我無關)。

價格方面,910B的均價據(jù)說大約是11萬/片,910C可能是18-20萬/片。網(wǎng)上很多文章說910C價格是1800美元,我覺得不靠譜。相比之下,英偉達H100的市場價格,大約是2.5-3萬美元/張。

值得一提的是,華為前段時間推出的CloudMatrix 384超節(jié)點,由384顆昇騰910C芯片構(gòu)建,系統(tǒng)性能比英偉達的GB200 NVL72更強。


這屬于典型的“群毆”模式。雖然單芯片的性能打不過,但通過系統(tǒng)層面的創(chuàng)新,組成更大規(guī)模的集群,也能一定程度彌補差距,滿足算力需求。

在連接方面,需要提一下華為自研的HCCS高速互連接口

昇騰910集成了HCCS、PCIe 4.0和RoCE v2接口,可以靈活高效地實現(xiàn)橫向擴展(Scale Out)和縱向擴展(Scale Up)。

HCCS對標的是英偉達的NVLINK,能夠給內(nèi)核、設備、集群提供系統(tǒng)內(nèi)存的一致訪問。在單一鏈路的單向/雙向互聯(lián)帶寬上,HCCS有顯著優(yōu)勢,可以有效提升多個Al芯片協(xié)同訓練的能力。

910C之后,據(jù)說還有910D,采用5nm制程,4Die封裝,支持FP8。今年5-6月份回片,預期2026Q2-Q3大規(guī)模量產(chǎn)。這個消息的來源不可靠,同樣僅供參考。

再往后,華為可能就會推出昇騰920系列,采用下一代工藝,更先進制程,努力縮小和英偉達的差距。

哦,對了,差點忘了說,華為除了昇騰310和910之外,其實還有昇騰610

昇騰610也稱為MDC610,是智能駕駛芯片,用于華為自己的智能駕駛平臺(MDC)。根據(jù)資料顯示,昇騰610采用了7nm制程,AI算力達到200TOPS@INT8或100TFLOPS@FP16,目前已經(jīng)實現(xiàn)量產(chǎn)。


昇騰610芯片(圖片來自網(wǎng)絡)

昇騰硬件體系

基于昇騰芯片,華為開發(fā)了AI算力板卡、服務器、集群等一系列硬件產(chǎn)品,如下圖所示:


這些硬件覆蓋了邊緣推理、云端推理、云端訓練三大場景,可以滿足不同行業(yè)用戶的AI計算需求。


Atlas 200I DK A2,是面向開發(fā)者的高性能AI開發(fā)套件,集成了昇騰310芯片,內(nèi)置2個Al core,可支持128位寬的LPDDR4X,最大算力為22TOPS。


Atlas 200I DK A2

Atlas 300T訓練卡,基于昇騰910芯片,集成32個達芬奇AI核+16個TaiShan核,能夠提供280TFLOPS FP16 算力,并集成了一枚100GE RoCE v2網(wǎng)卡,支持PCIe 4.0和1*100G RoCE高速接口。內(nèi)存規(guī)格方面,包括32GB的HBM和16GB的DDR4。

Atlas 300T A2訓練卡,強化了高速接口和對PCIe 5.0的支持,集成20個AI 核、8個CPU核、1*200GE RoCE,提供280TFLOPS FP16 算力。


Atlas 300T A2訓練卡

Atlas 300I推理卡,采用了4個昇騰310,可以實現(xiàn)快速高效的推理計算、圖像識別及視頻處理等工作,支持多種規(guī)格的H.264、H.265視頻編解碼。

Atlas 300I Pro推理卡,采用24GB LPDDR4X,單卡最大提供140TOPS INT8 算力。

Atlas 300I Duo推理卡,采用48GB LPDDR4X,總帶寬 408GB/s,從表觀上看是兩顆昇騰310的組合產(chǎn)品,單卡最大提供280TOPS INT8 算力。

Atlas 500 A2智能小站,是面向邊緣應用的產(chǎn)品。


Atlas 500 A2智能小站

Atlas 800訓練服務器,采用了8顆昇騰910(NPU)+4顆鯤鵬920(CPU),廣泛應用于深度學習模型開發(fā)和訓練,

Atlas 800推理服務器,最大可支持8個Atlas 300l推理卡,廣泛應用于數(shù)據(jù)中心側(cè)的AI推理場景。


Atlas 800I A2推理服務器

Atlas 900是Al智算集群,包括了數(shù)千顆昇騰芯片,總算力達到256~1024P FLOPS@FP16,相當于50萬臺PC的計算能力。


Atlas 900智算集群

Atlas 900集群由Atlas 900 PoD集群基礎單元組成。每個單元就是一個機柜,搭載超了32顆鯤鵬920,47U高度可最大提供20.4PFLOPS@FP16的算力。機柜采用液冷散熱,最大功耗為46KW。

好啦,以上就是關于華為昇騰硬件體系的全部介紹。

歡迎糾錯,也歡迎補充更多信息!謝謝!

參考資料:

1、《昇騰計算產(chǎn)業(yè)發(fā)展白皮書》,華為&信通院;

2、《昇騰發(fā)力鑄造國產(chǎn)算力基石》,國投證券;

3、《昇騰萬里,力算未來》,華安證券;

4、《華為昇騰:國產(chǎn) AI 算力“扛旗者”》,民生證券;

5、《華為昇騰服務器研究框架》,浙商證券;

6、《“鯤鵬”展翅,“昇騰”萬里》,東莞證券;

7、科技分析師Lennart Heim (@ohlennart) 在X平臺發(fā)布的分析文章

8、《華為發(fā)布全球算力最強 AI 處理器,達芬奇架構(gòu)巨無霸芯片昇騰 910 問世!》,新智元;

9、《解讀神秘的華為昇騰910》,周博洋,知乎;

10、華為官網(wǎng)、華為云社區(qū)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
大跳水!暴跌66%,又土又貴還開遍商場,中產(chǎn)的標配,賣不動了

大跳水!暴跌66%,又土又貴還開遍商場,中產(chǎn)的標配,賣不動了

毒sir財經(jīng)
2025-09-01 21:13:26
回去上學吧,瑞典環(huán)保少女格蕾塔!

回去上學吧,瑞典環(huán)保少女格蕾塔!

關爾東
2025-10-05 18:19:47
利用公眾博同情,品牌部為保級打輿論戰(zhàn)!廣西重傷外援走上救護車

利用公眾博同情,品牌部為保級打輿論戰(zhàn)!廣西重傷外援走上救護車

中國足球的那些事兒
2025-10-06 23:45:19
河南“淫魔”富豪吳天喜的地下室,60歲卻不滿足,禽獸般的存在

河南“淫魔”富豪吳天喜的地下室,60歲卻不滿足,禽獸般的存在

紙鳶奇譚
2025-03-04 20:21:42
出事了,美國摩根、瑞銀竟同時出手,瘋狂買入稀土唯一低估大龍頭

出事了,美國摩根、瑞銀竟同時出手,瘋狂買入稀土唯一低估大龍頭

風風順
2025-10-06 15:41:06
藍瑩瑩用力過猛了,網(wǎng)友:想走章子怡的路可惜實力不允許

藍瑩瑩用力過猛了,網(wǎng)友:想走章子怡的路可惜實力不允許

楓塵余往逝
2025-10-05 23:44:39
承認了,全是演的!連夜成立調(diào)查組

承認了,全是演的!連夜成立調(diào)查組

桑葚愛動畫
2025-08-23 15:21:37
倒閉30萬家!80后集體記憶轟然崩塌,曾經(jīng)的暴利行業(yè)跌落神壇

倒閉30萬家!80后集體記憶轟然崩塌,曾經(jīng)的暴利行業(yè)跌落神壇

品牌觀察官
2025-09-13 16:58:52
四天曝3個瓜!戴呼吸機、離婚、周慧敏肉軟會玩,一個比一個意外

四天曝3個瓜!戴呼吸機、離婚、周慧敏肉軟會玩,一個比一個意外

談天談地談天地
2025-10-05 06:50:45
中國挖了個超級巨坑! 美國要氣瘋: 中國不買大豆, 多國跟進不買了

中國挖了個超級巨坑! 美國要氣瘋: 中國不買大豆, 多國跟進不買了

小鬼頭體育
2025-10-06 04:45:50
女優(yōu)瀨戶心美女排健將,喜歡用嘴巴取悅男人

女優(yōu)瀨戶心美女排健將,喜歡用嘴巴取悅男人

葫蘆哥愛吐槽
2025-10-07 00:20:03
OpenAI入股AMD,股價暴漲35%!奧特曼左手黃仁勛,右手蘇姿豐,通吃全球算力

OpenAI入股AMD,股價暴漲35%!奧特曼左手黃仁勛,右手蘇姿豐,通吃全球算力

新智元
2025-10-06 21:58:47
炸鍋了!大批游客高喊“退票,退票!”知名景區(qū)回應

炸鍋了!大批游客高喊“退票,退票!”知名景區(qū)回應

極目新聞
2025-10-05 09:07:36
你們聞過最臭的東西是什么?網(wǎng)友:婦科病的味道吧

你們聞過最臭的東西是什么?網(wǎng)友:婦科病的味道吧

帶你感受人間冷暖
2025-09-28 00:15:07
突發(fā):烏克蘭兩枚海王星導彈擊中布良斯克工廠!摧毀俄軍彈藥庫

突發(fā):烏克蘭兩枚海王星導彈擊中布良斯克工廠!摧毀俄軍彈藥庫

項鵬飛
2025-10-06 22:27:56
逮捕中方船長后,法國陸軍參謀長發(fā)出警告:做好戰(zhàn)爭準備!

逮捕中方船長后,法國陸軍參謀長發(fā)出警告:做好戰(zhàn)爭準備!

上海阿姨在南京
2025-10-05 14:58:35
陳震車禍:不負責的富人,就是窮人的瘟神

陳震車禍:不負責的富人,就是窮人的瘟神

黑糖文字局
2025-10-04 07:57:09
周也方回應被王詩齡蛐蛐,雙方背后資本被扒,李湘這次真闖了大禍

周也方回應被王詩齡蛐蛐,雙方背后資本被扒,李湘這次真闖了大禍

古希臘掌管月桂的神
2025-10-06 15:52:52
中國外長王毅訪意:意媒關注羅馬的“平衡術”

中國外長王毅訪意:意媒關注羅馬的“平衡術”

意燴
2025-10-07 00:43:29
世青賽16強全部出爐!具體對陣如下,亞洲僅2隊出線,中國隊無緣

世青賽16強全部出爐!具體對陣如下,亞洲僅2隊出線,中國隊無緣

侃球熊弟
2025-10-06 09:16:35
2025-10-07 02:23:00
鮮棗課堂 incentive-icons
鮮棗課堂
ICT知識科普。
941文章數(shù) 1255關注度
往期回顧 全部

科技要聞

2025年諾貝爾生理學或醫(yī)學獎揭曉

頭條要聞

5人進廢棄礦硐遇難 專家:廢棄礦硐如地下墳墓

頭條要聞

5人進廢棄礦硐遇難 專家:廢棄礦硐如地下墳墓

體育要聞

5天12場!王楚欽拼到低血糖 央視點贊

娛樂要聞

女星周也翻車!疑向熱巴翻白眼

財經(jīng)要聞

暴漲前夜,大國博弈找到了新戰(zhàn)場!

汽車要聞

奇瑞全新大型SUV亮相!大六座+800V平臺

態(tài)度原創(chuàng)

房產(chǎn)
游戲
教育
健康
公開課

房產(chǎn)要聞

十一直擊,三亞這個熱盤,又火了!

亞洲邀請賽:WBG零封GAM,小天狂亮TES隊標

教育要聞

窮人的原生家庭就是一個精神病院

內(nèi)分泌科專家破解身高八大謠言

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 亚洲人成人网站色| 久久婷婷五月综合色国产免费观看 | 在线播放国产不卡免费视频| 影音先锋每日资源亚洲一区| 2020高清无马视频无套内射 | 日产精品一线二线三线芒| 男人扒女人添高潮视频| 精品999日本久久久影院| 国产成人欧美日韩在线电影| 野花久久久久| 亚洲片一区二区三区| 老熟女五十路乱子交尾中出一区| 欧美日韩国产图片区一区| 奇米影视欧美性| 欧美熟妇久久久久久毛多| 精品少妇人妻一区二区三区| 亚洲日本久久久| 亚洲日韩电影久久| 色婷婷狠狠18禁| 色综合色综合久久综合频道 | 中文字幕乱码一区二区免费| 日韩精品无码一区二区三区色欲传媒| 国产精品偷伦视频免费观看国产| 久久AV导航| 日本一区二区三区专线| 亚洲熟女喷水视频一区二区| 少妇激情AV一区二区三区| 99re6这里有精品热视频| 久久精品av一区二区三| 亚洲高清最新AV网站| 中文字幕久精品免费视频| 五月丁香六月婷婷啪啪综合| 福利无码在线视频| 国产www操逼精品| 激情五月天激情小说网| xx国产一区| 欧美天天性电影院| 麻兵精品一区二区| 欧美成人高清ww| 欧美牲交a欧美牲交aⅴ一| 91精品丝袜国产高跟在线一区 |