公眾號(hào)記得加星標(biāo)??,第一時(shí)間看推送不會(huì)錯(cuò)過(guò)。
來(lái)源 : 內(nèi)容 編譯自 designnews 。
特朗普總統(tǒng)最近宣布了一項(xiàng)雄心勃勃的計(jì)劃,旨在使美國(guó)成為人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的強(qiáng)大力量。他取消了對(duì)競(jìng)相開發(fā)未來(lái)技術(shù)以處理大型語(yǔ)言模型和未來(lái)人工智能形式的美國(guó)企業(yè)的種種限制。美國(guó)企業(yè)將擺脫繁瑣的州級(jí)法規(guī),也不再受到聯(lián)邦層面的護(hù)欄和其他限制的束縛。這一消息雖然對(duì)美國(guó)電子行業(yè)來(lái)說(shuō)令人振奮,但也給下一代處理器的開發(fā)帶來(lái)了更大的挑戰(zhàn)。
過(guò)去幾年,包括市場(chǎng)領(lǐng)導(dǎo)者 Nvidia、英特爾和 AMD 在內(nèi)的主要芯片制造商都在積極開發(fā)新的處理器。然而,多項(xiàng)行業(yè)研究表明,對(duì) AI 性能的要求可能會(huì)更高,這反過(guò)來(lái)又迫使供應(yīng)商開發(fā)更多新產(chǎn)品,并對(duì)系統(tǒng)設(shè)計(jì)提出更高的要求。
雖然對(duì)創(chuàng)新處理器的需求表明人工智能芯片市場(chǎng)前景廣闊,但考慮到市場(chǎng)將會(huì)成熟和整合,新參與者的窗口可能不會(huì)永遠(yuǎn)敞開。
增長(zhǎng)正在放緩嗎?
Omdia 最近發(fā)布了一份名為《云計(jì)算和數(shù)據(jù)中心 AI 處理器預(yù)測(cè)》的報(bào)告,預(yù)測(cè)盡管 AI 數(shù)據(jù)中心芯片市場(chǎng)將繼續(xù)快速增長(zhǎng),但增長(zhǎng)速度已開始放緩。Omdia 表示, 2022 年至 2024 年間, AI 基礎(chǔ)設(shè)施的年增長(zhǎng)率超過(guò) 250%;然而,預(yù)計(jì) 2024 年至 2025 年的增長(zhǎng)率約為 67%。該公司預(yù)計(jì),AI 基礎(chǔ)設(shè)施支出在數(shù)據(jù)中心支出中的占比將在 2026 年達(dá)到峰值,屆時(shí)基本上所有增量支出都將由 AI 驅(qū)動(dòng),然后到 2030 年逐漸減少。
Omdia 還指出,GPU 的替代品正在日益流行。這些替代品既包括定制 ASIC 芯片(例如谷歌的 TPU),也包括商用 ASSP(例如華為的 Ascend 系列、Groq 或 Cerebras)。Omdia 還指出,得益于 2024 年的重大軟件投資,AMD 的 Instinct GPU 系列取得了進(jìn)展。
Precedence Research 的另一項(xiàng)市場(chǎng)研究預(yù)測(cè),人工智能芯片組市場(chǎng)規(guī)模將從 2025 年的 943.1 億美元增長(zhǎng)到 2034 年的 9312.6 億美元,復(fù)合年增長(zhǎng)率為 28%。Precedence 表示,圖形處理單元(GPU) 占據(jù)人工智能 (AI) 芯片組市場(chǎng)的主導(dǎo)地位,這主要?dú)w功于其并行處理能力。GPU 被認(rèn)為是數(shù)據(jù)中心和云環(huán)境中執(zhí)行大量訓(xùn)練和推理任務(wù)的理想選擇,可用于運(yùn)行生成模型、計(jì)算機(jī)視覺和自然語(yǔ)言處理。
與 Omdia 一樣,Precedence 預(yù)計(jì)未來(lái)增長(zhǎng)將由 ASIC(專用集成電路)領(lǐng)域推動(dòng),因?yàn)槠湓谔囟?AI 功能(尤其是在推理密集型環(huán)境中)中具有卓越的效率和性能。與通用硬件相比,這些芯片組具有更高的能效和更小的尺寸,使其成為邊緣設(shè)備和企業(yè) AI 應(yīng)用的理想選擇。
GPU 仍是王者
GPU 繼續(xù)占據(jù)各大芯片制造商的開發(fā)重心。AMD 發(fā)布了 Instinct MI350 系列 GPU,包括 Instinct MI350X 和 MI355X GPU 及平臺(tái),為各行各業(yè)的變革性 AI 解決方案提供了 4 倍的、逐代升級(jí)的方案。據(jù) AMD 稱,MI355X 顯著提升了性價(jià)比,與競(jìng)品解決方案相比,每美元可產(chǎn)生高達(dá) 40% 的代幣收益。Instinct MI350 系列在風(fēng)冷機(jī)架中最多支持 64 個(gè) GPU,在直接液冷機(jī)架中最多支持 128 個(gè) GPU,可提供高達(dá) 2.6 exaFLOPS 的 FP4/FP6 性能。
英特爾發(fā)布了英特爾至強(qiáng) 6 系列中央處理器 (CPU) 的三款新產(chǎn)品,旨在管理最先進(jìn)的圖形處理器 (GPU) 驅(qū)動(dòng)的人工智能系統(tǒng)。這些帶有性能核心 (P 核) 的新處理器包括英特爾創(chuàng)新的優(yōu)先核心睿頻 (PCT) 技術(shù)和英特爾速度選擇技術(shù) - 睿頻 (英特爾 SST-TF),可提供可定制的 CPU 核心頻率,以提升 GPU 在高要求人工智能工作負(fù)載下的性能。
至強(qiáng) 6 處理器現(xiàn)已上市,其中一款目前作為 NVIDIA 最新一代 AI 加速系統(tǒng) DGX B300 的主機(jī) CPU。NVIDIA DGX B300 集成了英特爾至強(qiáng) 6776P 處理器,該處理器在管理、編排和支持 AI 加速系統(tǒng)方面發(fā)揮著至關(guān)重要的作用。憑借強(qiáng)大的內(nèi)存容量和帶寬,至強(qiáng) 6776P 能夠滿足日益增長(zhǎng)的 AI 模型和數(shù)據(jù)集需求。
Nvidia 最近發(fā)布了 Rubin CPX,這是一款專為海量上下文處理而設(shè)計(jì)的新型 GPU。它使 AI 系統(tǒng)能夠以突破性的速度和效率處理數(shù)百萬(wàn)個(gè)令牌的軟件編碼和生成視頻。
Rubin CPX 與全新 NVIDIA Vera Rubin NVL144 CPX 平臺(tái)中的 NVIDIA Vera CPU 和 Rubin GPU 協(xié)同工作。這款集成式 NVIDIA MGX 系統(tǒng)集成了每秒 8 百億億次浮點(diǎn)運(yùn)算的 AI 計(jì)算能力,可提供比 NVIDIA GB300 NVL72 系統(tǒng)高出 7.5 倍的 AI 性能,并在單個(gè)機(jī)架中提供 100TB 的快速內(nèi)存和每秒 1.7PB 的內(nèi)存帶寬。此外,還為希望重復(fù)使用現(xiàn)有 Vera Rubin NVL144 系統(tǒng)的客戶提供了專用的 Rubin CPX 計(jì)算托盤。
云計(jì)算統(tǒng)治,邊緣計(jì)算崛起
根據(jù) Precedence Research 的數(shù)據(jù),到 2024 年,云端 AI 處理領(lǐng)域?qū)⒄紦?jù)市場(chǎng)主導(dǎo)地位,占據(jù) 52% 的份額。云端高性能 AI 基礎(chǔ)設(shè)施能夠擴(kuò)展自然語(yǔ)言處理和計(jì)算機(jī)視覺等應(yīng)用的模型訓(xùn)練和部署。包括 AWS、谷歌云和微軟 Azure 在內(nèi)的超大規(guī)模云供應(yīng)商一直在大力投資 AI 優(yōu)化數(shù)據(jù)中心。
然而,盡管云端人工智能仍占主導(dǎo)地位,但邊緣人工智能處理領(lǐng)域正在崛起。Precedence Research 的一份報(bào)告指出 ,對(duì)邊緣計(jì)算技術(shù)的大量投資也可能增加對(duì)低功耗人工智能芯片組的需求。該報(bào)告預(yù)測(cè),邊緣人工智能處理領(lǐng)域?qū)⒃谖磥?lái)幾年以最快的速度增長(zhǎng),這得益于實(shí)時(shí)應(yīng)用對(duì)低延遲、設(shè)備端智能的需求。自動(dòng)駕駛汽車、工業(yè)機(jī)器人、可穿戴設(shè)備和監(jiān)控系統(tǒng)中人工智能系統(tǒng)的邊緣處理需要高能效和不依賴外部服務(wù)器。對(duì)智慧城市基礎(chǔ)設(shè)施的投資迅速增加了交通監(jiān)控和能源管理系統(tǒng)中的邊緣部署,進(jìn)一步提振了這一市場(chǎng)。
行業(yè)整合
Jon Peddle Research 表示,隨著 AI 處理器市場(chǎng)的成熟,行業(yè)整合也有望實(shí)現(xiàn)。Jon Peddle Research 最近的一份報(bào)告預(yù)測(cè),到 2030 年,市場(chǎng)將整合至僅剩約 25 家。在 Jon Peddle 列出的五大細(xì)分市場(chǎng)(超大規(guī)模訓(xùn)練、云基礎(chǔ)設(shè)施、汽車、邊緣計(jì)算和物聯(lián)網(wǎng))中,最有可能存活下來(lái)的 AI 處理器供應(yīng)商是物聯(lián)網(wǎng)和邊緣計(jì)算領(lǐng)域的供應(yīng)商,因?yàn)檫@些市場(chǎng)的 PAM 較大,但利潤(rùn)率較低,對(duì)主要參與者缺乏吸引力。
為了發(fā)揮優(yōu)勢(shì)并幫助保持市場(chǎng)地位,供應(yīng)商之間的合作日益增多。
OpenAI 和 NVIDIA 已達(dá)成戰(zhàn)略合作伙伴關(guān)系,將為 OpenAI 的下一代 AI 基礎(chǔ)架構(gòu)部署至少 10 千兆瓦的 NVIDIA 系統(tǒng),用于訓(xùn)練和運(yùn)行其下一代模型,從而實(shí)現(xiàn)超級(jí)智能。為了支持包括數(shù)據(jù)中心和電力容量在內(nèi)的部署,NVIDIA 計(jì)劃在部署新的 NVIDIA 系統(tǒng)時(shí)向 OpenAI 投資高達(dá) 1000 億美元。第一階段預(yù)計(jì)將于 2026 年下半年使用 NVIDIA Vera Rubin 平臺(tái)上線。
Nvidia 還與競(jìng)爭(zhēng)對(duì)手英特爾合作,共同開發(fā)多代定制數(shù)據(jù)中心和 PC 產(chǎn)品,以加速超大規(guī)模、企業(yè)和消費(fèi)市場(chǎng)的應(yīng)用程序和工作負(fù)載。兩家公司將專注于使用 NVIDIA NVLink 無(wú)縫連接 NVIDIA 和英特爾架構(gòu),從而將 NVIDIA 的 AI 和加速計(jì)算與英特爾領(lǐng)先的 CPU 技術(shù)和 x86 生態(tài)系統(tǒng)相結(jié)合,為客戶提供解決方案。根據(jù)合作協(xié)議,NVIDIA 將以每股 23.28 美元的價(jià)格投資 50 億美元收購(gòu)英特爾普通股。
持續(xù)的技術(shù)挑戰(zhàn)
人工智能處理器性能提升的趨勢(shì)也對(duì)其他電子系統(tǒng)組件產(chǎn)生了連鎖反應(yīng)。Rambus 研究員 Steven Woo 表示:“現(xiàn)有的內(nèi)存配置經(jīng)常面臨帶寬和延遲限制的問(wèn)題,難以保證這些處理器完全滿足需求并以最佳性能運(yùn)行。新興的內(nèi)存設(shè)計(jì)正在被重新構(gòu)想,以支持人工智能對(duì)海量數(shù)據(jù)和速度的要求。堆疊內(nèi)存、近內(nèi)存計(jì)算、多路復(fù)用和多 PAM 信令等技術(shù)正在被采用,以克服傳統(tǒng)瓶頸,并跟上人工智能的快速發(fā)展步伐?!?/p>
封裝技術(shù)在幫助克服內(nèi)存限制方面發(fā)揮著重要作用。d-Matrix 在其 3D 堆疊數(shù)字內(nèi)存計(jì)算(稱為 3DIMC)中采用了芯片組設(shè)計(jì)。該公司預(yù)計(jì),3DIMC 芯片組架構(gòu)將通過(guò)提高數(shù)據(jù)訪問(wèn)速度,將數(shù)據(jù)密集型 AI 推理工作負(fù)載的內(nèi)存容量提升幾個(gè)數(shù)量級(jí)。
毫不奇怪,熱管理會(huì)受到數(shù)據(jù)機(jī)架中運(yùn)行溫度更高的處理器的影響。這些處理器無(wú)法使用傳統(tǒng)的散熱器和風(fēng)扇進(jìn)行充分冷卻。液冷解決方案曾被建議作為一種解決方案,但液冷雖然有效,但卻增加了成本和復(fù)雜性。
Flex 的數(shù)據(jù)中心液體冷卻器是典型的液體冷卻解決方案。Flex 最近推出了一款液體冷卻解決方案,每個(gè)機(jī)架最多可處理 6 個(gè)冷卻分配單元 (CDU),最高功率可達(dá) 1.8 MW。該解決方案的運(yùn)行速度為 1-1.5 LPM/kW,可支持各種工作負(fù)載,并根據(jù)需求匹配冷卻輸出,以減少浪費(fèi)并降低運(yùn)營(yíng)成本,并通過(guò)智能歧管支持 CDU、服務(wù)器和存儲(chǔ)的混合配置。
更高效的電力輸送可以部分解決熱管理問(wèn)題。英飛凌科技與英偉達(dá)合作,開發(fā)了新一代電力系統(tǒng),該系統(tǒng)基于一種全新架構(gòu),采用 800 V 高壓直流 (HVDC) 集中發(fā)電。新的系統(tǒng)架構(gòu)顯著提升了整個(gè)數(shù)據(jù)中心的節(jié)能配電,并允許直接在服務(wù)器主板內(nèi)的 AI 芯片(圖形處理單元,GPU)進(jìn)行電力轉(zhuǎn)換。該系統(tǒng)有望為加速計(jì)算數(shù)據(jù)中心的先進(jìn)電力輸送架構(gòu)鋪平道路。
https://www.designnews.com/electronics/processor-market-faces-challenges-meeting-data-center-needs
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對(duì)該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4181期內(nèi)容,歡迎關(guān)注。
加星標(biāo)??第一時(shí)間看推送,小號(hào)防走丟
求推薦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.