本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)綜合
未來(lái)三到四年,人工智能數(shù)據(jù)中心加速器市場(chǎng)規(guī)模預(yù)計(jì)將膨脹至 5000 億美元。
9月17日,AMD 首席執(zhí)行官蘇姿豐在華盛頓特區(qū)舉行的 Axios AI+ 峰會(huì)上表示,我們才剛剛進(jìn)入人工智能快速發(fā)展和基礎(chǔ)設(shè)施建設(shè)“十年大周期”的第二年。
AMD對(duì)這一切抱有更大的期望,并認(rèn)為我們甚至無(wú)法想象五年后人工智能將帶來(lái)的進(jìn)步。此外,蘇姿豐還表示人工智能是她漫長(zhǎng)的科技生涯中“最具變革性”的技術(shù),甚至可能是我們一生中“最具變革性”的技術(shù)。美國(guó)必須“跑得快,跑得更快”,才能保持在人工智能技術(shù)領(lǐng)域的領(lǐng)先地位。
未來(lái)三到四年,人工智能數(shù)據(jù)中心加速器市場(chǎng)規(guī)模預(yù)計(jì)將膨脹至 5000 億美元?!安痪们?,整個(gè)半導(dǎo)體行業(yè)的規(guī)模還只有 5000 億美元。所以你可以看到它加速的速度和步伐,”她說(shuō)道。
2025年第一季度,全球數(shù)據(jù)中心資本支出實(shí)現(xiàn)了顯著增長(zhǎng),年同比增幅高達(dá)53%,達(dá)到1340億美元,成為引領(lǐng)信息技術(shù)基礎(chǔ)設(shè)施發(fā)展的重要現(xiàn)象。這一增長(zhǎng)主要得益于生成式人工智能技術(shù)的飛速發(fā)展,推動(dòng)了GPU需求的激增,特別是Nvidia Blackwell系列GPU和定制加速器的廣泛應(yīng)用。作為現(xiàn)代數(shù)據(jù)處理的核心,GPU的供應(yīng)和需求狀況直接影響著數(shù)據(jù)中心的運(yùn)營(yíng)效率和擴(kuò)展能力。
近年來(lái),隨著人工智能算法對(duì)計(jì)算力要求的不斷提升,傳統(tǒng)CPU的處理能力難以滿足需求,GPU以其并行計(jì)算優(yōu)勢(shì)成為數(shù)據(jù)中心升級(jí)和擴(kuò)容的首選硬件。AWS、Google、Meta和微軟這四大擁有最大云端市場(chǎng)份額的企業(yè),在第一季度的資本支出中貢獻(xiàn)了44%的資金。他們大舉擴(kuò)展人工智能云基礎(chǔ)設(shè)施,促進(jìn)了更高速、更智能的計(jì)算資源部署。
此外,企業(yè)級(jí)基礎(chǔ)設(shè)施建設(shè)也占據(jù)了約三分之一的投資份額,盡管部分企業(yè)因預(yù)算緊縮和關(guān)稅風(fēng)險(xiǎn)調(diào)整了資本支出計(jì)劃。盡管個(gè)別美國(guó)產(chǎn)云服務(wù)提供商取消了一些項(xiàng)目,但整體資本支出依然保持增長(zhǎng)。數(shù)據(jù)中心和云基礎(chǔ)設(shè)施的巨頭正在靈活調(diào)整容量以應(yīng)對(duì)市場(chǎng)需求,而非大幅削減投資。這一策略體現(xiàn)了對(duì)長(zhǎng)期增長(zhǎng)潛力的堅(jiān)定信心。生成式AI的興起極大激發(fā)了數(shù)據(jù)中心建設(shè)的熱潮,推動(dòng)云服務(wù)提供商爭(zhēng)分奪秒地提升算力以滿足客戶需求。亞馬遜2025年第一季度資本支出達(dá)到243億美元,主要用于擴(kuò)展AWS的AI云基礎(chǔ)設(shè)施。
微軟和谷歌緊隨其后,分別投入214億美元和170億美元。
在此前的采訪中,蘇姿豐曾表示MI300X GPU加速器是自2023年推出以來(lái),AMD增長(zhǎng)最快的產(chǎn)品線之一。MI300X具有高達(dá)192GB的內(nèi)存,集成了1530億個(gè)晶體管,其強(qiáng)大的計(jì)算能力和內(nèi)存使得該芯片能夠支持訓(xùn)練如OpenAI的ChatGPT等大語(yǔ)言模型。這一產(chǎn)品標(biāo)志著AMD正在人工智能芯片市場(chǎng)上快速崛起,未來(lái)將有實(shí)力挑戰(zhàn)長(zhǎng)期主導(dǎo)該市場(chǎng)的Nvidia。
今年6月,AMD在美國(guó)圣何塞舉辦的Advancing AI 2025大會(huì)上,正式發(fā)布了全新一代“Instinct MI350系列”GPU,包括MI350X和MI355X兩款型號(hào)。這兩款GPU在性能和技術(shù)特性上取得了重大突破,為AI計(jì)算領(lǐng)域帶來(lái)了新的活力。
MI350系列基于第四代Instinct架構(gòu)(CDNA4),采用3nm制程工藝,集成了高達(dá)1850億個(gè)晶體管。兩款GPU均配備288GB的HBM3E內(nèi)存,內(nèi)存帶寬達(dá)8TB每秒,內(nèi)存容量是英偉達(dá)B200和GB200GPU的1.6倍。在算力方面,MI350X和MI355X在FP64精度下的算力分別為72和78.6TFLOPs,約為英偉達(dá)同類產(chǎn)品的兩倍。在低精度格式(如FP16、FP8和FP4)上,MI350系列的性能與英偉達(dá)相當(dāng)或更優(yōu)。其中,MI355X在FP4精度下,相比英偉達(dá)B200,大模型推理速度快30%,在訓(xùn)練推理性能方面也相當(dāng)或更勝一籌。同時(shí),得益于芯片功耗低于英偉達(dá),在MI355X上每花費(fèi)1美元,可以比B200多跑40%的tokens。
在核心設(shè)計(jì)相同的基礎(chǔ)上,MI350X和MI355X針對(duì)不同散熱方式設(shè)計(jì)。MI350X采用風(fēng)冷,最高TBP為1000W;MI355X采用液冷,TBP達(dá)到1400W,更高的TBP使得MI355X性能高于同架構(gòu)的MI350X。
為了更好地配合MI350系列,AMD發(fā)布了全新的ROCm7軟件棧。相比ROCm6,ROCm7實(shí)現(xiàn)了3.5倍的推理性能提升和3倍的訓(xùn)練性能提升,還引入了分布式推理支持,并與VLM和SGLang等開(kāi)源推理框架深度集成,支持超過(guò)180萬(wàn)個(gè)Hugging Face模型開(kāi)箱即用。
AMD在發(fā)布會(huì)上還公布了未來(lái)產(chǎn)品路線圖。下一代GPU——MI400系列將于明年亮相,該系列由AMD和OpenAI聯(lián)合研發(fā),OpenAI為其訓(xùn)練和推理需求提供了重要反饋。MI400系列將采用下一代CDNA架構(gòu),預(yù)計(jì)速度比MI300系列快10倍,F(xiàn)P4運(yùn)行速度將達(dá)到40PFLOPs。此外,AMD計(jì)劃在2027年推出MI500系列GPU,同時(shí)還將推出代號(hào)為Verano的下一代EPYC處理器,進(jìn)一步豐富其產(chǎn)品布局,提升在AI計(jì)算市場(chǎng)的競(jìng)爭(zhēng)力。
*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個(gè)人觀點(diǎn),我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認(rèn)同,如有異議,請(qǐng)聯(lián)系后臺(tái)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.