網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

算力即國力！DeepSeek與FP8徹底激活國產(chǎn)AI芯片！最新名單～

2025-08-24 19:50:29　來源: 呼呼歷史論

遼寧舉報

分享至

算力即國力！DeepSeek與FP8徹底激活國產(chǎn)AI芯片！最新名單出爐～

DeepSeek時隔半年再次引爆算力和算法革命，并且有望全面激活國產(chǎn)算力芯片。

據(jù)《科創(chuàng)板日報》8月24日報道，國產(chǎn)大模型企業(yè)DeepSeek近期成為資本市場的焦點。

日前，DeepSeek對外宣布，其新一代模型DeepSeek-V3.1采用了UE8M0 FP8 Scale參數(shù)精度，并且明確表示這一精度標準是專門為即將推出的下一代國產(chǎn)芯片所設(shè)計。

在本周末舉辦的2025算力大會上，DeepSeek提出的FP8精度標準也被納入討論。FP8精度標準在模型訓(xùn)練、推理環(huán)節(jié)，以及生態(tài)標準化推進過程中的實際價值。

另外，據(jù)摩爾線程AI Infra總監(jiān)陳志向《科創(chuàng)板日報》記者表示，以往大模型開展訓(xùn)練與推理工作時，普遍采用FP32（32位浮點數(shù)）；之后為了減少存儲和通信的開銷，技術(shù)逐步過渡到FP16（16位浮點數(shù)）混合精度；而FP8則進一步把數(shù)據(jù)寬度壓縮到了8位。

陳志表示，F(xiàn)P8最直接的優(yōu)勢是算力效率實現(xiàn)翻倍，另一個好處則是降低大模型訓(xùn)練與推理過程中網(wǎng)絡(luò)帶寬的通信量。

他舉例說明，過去傳輸一個FP32數(shù)值需要4字節(jié)，現(xiàn)在使用FP8僅需1字節(jié)；盡管網(wǎng)絡(luò)的物理帶寬本身并未擴大，但單位時間內(nèi)可傳輸?shù)男畔⒘繒黾?，同時存儲方面的要求也會降低。

這意味著在相同功耗條件下，AI芯片要么能訓(xùn)練更大規(guī)模的模型，要么能縮短模型的訓(xùn)練時間。

簡而言之，就是FP8在多數(shù)場景下，訓(xùn)練效能直接翻倍；更重要的是DeepSeek在微信公眾號透露，F(xiàn)P8技術(shù)適配于下一代國產(chǎn)芯片。

因此，在新技術(shù)路徑下，國產(chǎn)AI芯片將發(fā)揮更大效能，國產(chǎn)AI芯片將有望從自主可控躍升為彎道超車。

值得一提的是，2025年初，DeepSeek以2048塊閹割版的英偉達H20芯片就訓(xùn)練出世界頂尖的AI大模型；這場技術(shù)革命瞬間席卷全球，甚至一度讓美股大型科技股經(jīng)歷了一天黑天鵝行情，市值一夜蒸發(fā)超10萬億元。

隨后的一段時間，DeepSeek經(jīng)歷了來自北美IP、大規(guī)模持續(xù)不斷的黑客攻擊，導(dǎo)致很長一段時間其服務(wù)器接近癱瘓狀態(tài)。

可見DeepSeek的創(chuàng)新已經(jīng)讓某些大國感覺到巨大的精神壓力。

值得一提的是，DeepSeek的技術(shù)革命雖然大幅提升了大模型訓(xùn)練的效率，但由于激活了千行百業(yè)的AI應(yīng)用場景，使得算力需求不僅沒有減少，反而與日俱增。

正如英偉達創(chuàng)始人黃仁勛所言，他認為DeepSeek的技術(shù)革命，將會催化更大的算力需求。

不過隨著DeepSeek與FP8技術(shù)的革新、國產(chǎn)AI芯片的崛起；英偉達芯片已經(jīng)不再是香餑餑，新一輪的國內(nèi)算力基建升級將帶動國產(chǎn)算力產(chǎn)業(yè)全面啟航！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.