算力即國力!DeepSeek與FP8徹底激活國產(chǎn)AI芯片!最新名單出爐~
DeepSeek時隔半年再次引爆算力和算法革命,并且有望全面激活國產(chǎn)算力芯片。
據(jù)《科創(chuàng)板日報》8月24日報道,國產(chǎn)大模型企業(yè)DeepSeek近期成為資本市場的焦點。
日前,DeepSeek對外宣布,其新一代模型DeepSeek-V3.1采用了UE8M0 FP8 Scale參數(shù)精度,并且明確表示這一精度標準是專門為即將推出的下一代國產(chǎn)芯片所設(shè)計。
在本周末舉辦的2025算力大會上,DeepSeek提出的FP8精度標準也被納入討論。FP8精度標準在模型訓(xùn)練、推理環(huán)節(jié),以及生態(tài)標準化推進過程中的實際價值。
另外,據(jù)摩爾線程AI Infra總監(jiān)陳志向《科創(chuàng)板日報》記者表示,以往大模型開展訓(xùn)練與推理工作時,普遍采用FP32(32位浮點數(shù));之后為了減少存儲和通信的開銷,技術(shù)逐步過渡到FP16(16位浮點數(shù))混合精度;而FP8則進一步把數(shù)據(jù)寬度壓縮到了8位。
陳志表示,F(xiàn)P8最直接的優(yōu)勢是算力效率實現(xiàn)翻倍,另一個好處則是降低大模型訓(xùn)練與推理過程中網(wǎng)絡(luò)帶寬的通信量。
他舉例說明,過去傳輸一個FP32數(shù)值需要4字節(jié),現(xiàn)在使用FP8僅需1字節(jié);盡管網(wǎng)絡(luò)的物理帶寬本身并未擴大,但單位時間內(nèi)可傳輸?shù)男畔⒘繒黾?,同時存儲方面的要求也會降低。
這意味著在相同功耗條件下,AI芯片要么能訓(xùn)練更大規(guī)模的模型,要么能縮短模型的訓(xùn)練時間。
簡而言之,就是FP8在多數(shù)場景下,訓(xùn)練效能直接翻倍;更重要的是DeepSeek在微信公眾號透露,F(xiàn)P8技術(shù)適配于下一代國產(chǎn)芯片。
因此,在新技術(shù)路徑下,國產(chǎn)AI芯片將發(fā)揮更大效能,國產(chǎn)AI芯片將有望從自主可控躍升為彎道超車。
值得一提的是,2025年初,DeepSeek以2048塊閹割版的英偉達H20芯片就訓(xùn)練出世界頂尖的AI大模型;這場技術(shù)革命瞬間席卷全球,甚至一度讓美股大型科技股經(jīng)歷了一天黑天鵝行情,市值一夜蒸發(fā)超10萬億元。
隨后的一段時間,DeepSeek經(jīng)歷了來自北美IP、大規(guī)模持續(xù)不斷的黑客攻擊,導(dǎo)致很長一段時間其服務(wù)器接近癱瘓狀態(tài)。
可見DeepSeek的創(chuàng)新已經(jīng)讓某些大國感覺到巨大的精神壓力。
值得一提的是,DeepSeek的技術(shù)革命雖然大幅提升了大模型訓(xùn)練的效率,但由于激活了千行百業(yè)的AI應(yīng)用場景,使得算力需求不僅沒有減少,反而與日俱增。
正如英偉達創(chuàng)始人黃仁勛所言,他認為DeepSeek的技術(shù)革命,將會催化更大的算力需求。
不過隨著DeepSeek與FP8技術(shù)的革新、國產(chǎn)AI芯片的崛起;英偉達芯片已經(jīng)不再是香餑餑,新一輪的國內(nèi)算力基建升級將帶動國產(chǎn)算力產(chǎn)業(yè)全面啟航!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.