過去幾年,AI 的飛速發(fā)展讓算力成為全球爭奪的核心,但很多人忽視了一個同樣至關(guān)重要的環(huán)節(jié)——存儲。沒有存儲的支撐,算力就像沒有燃料的引擎,再強(qiáng)大也難以釋放全部潛能。尤其是在大模型和生成式 AI 的浪潮下,數(shù)據(jù)體量和推理場景不斷膨脹,存儲的需求也隨之水漲船高。
在這個關(guān)鍵節(jié)點(diǎn)上,三種存儲技術(shù)正在重新定義AI基礎(chǔ)設(shè)施的未來格局。HBM(高帶寬內(nèi)存)作為當(dāng)前高端AI芯片的標(biāo)配,已經(jīng)從技術(shù)概念走向大規(guī)模商用,成為決定AI算力上限的關(guān)鍵因素;HBF(高帶寬閃存)則試圖突破DRAM的容量限制,為超大規(guī)模模型提供全新的存儲路徑;而GDDR7的崛起,更是在成本與性能之間找到了巧妙的平衡點(diǎn),為AI推理的普及化鋪平道路。
這三種技術(shù)路線的競合演進(jìn),不僅關(guān)乎存儲產(chǎn)業(yè)數(shù)千億美元的市場格局,更決定著人工智能能否真正突破當(dāng)前的技術(shù)天花板,邁向通用人工智能的新紀(jì)元。
HBM:高帶寬的王者之戰(zhàn)
步入“后AI”時代,HBM已不僅僅是高性能AI芯片的標(biāo)配組件,更演變?yōu)榇鎯π袠I(yè)激烈角逐的戰(zhàn)略制高點(diǎn)。這種通過3D堆疊技術(shù)實(shí)現(xiàn)的超高帶寬存儲,已經(jīng)成為決定AI芯片性能上限的關(guān)鍵因素。從H100的80GB容量、3.4TB/s帶寬,到GB300的288GB容量、8.0TB/s帶寬,不到三年時間里,HBM實(shí)現(xiàn)了容量超過兩倍、帶寬約2.5倍的驚人提升。
當(dāng)前的市場格局呈現(xiàn)出明顯的分化態(tài)勢。SK海力士憑借技術(shù)和市場的雙重優(yōu)勢,穩(wěn)居霸主地位。據(jù)最新報道,SK海力士和美光已進(jìn)入第六代高帶寬存儲器(HBM4)的最終測試階段,計(jì)劃本月向英偉達(dá)供應(yīng)樣品。特別值得關(guān)注的是,SK海力士在質(zhì)量測試方面遙遙領(lǐng)先,目前已宣布完成下一代HBM4內(nèi)存開發(fā),并已具備全球首個大規(guī)模量產(chǎn)條件
相比之下,三星電子的處境略顯尷尬。盡管在HBM4性能方面頗有信心——采用4納米代工工藝應(yīng)用于邏輯芯片,相比SK海力士的臺積電12納米工藝和美光的12納米級DRAM工藝更為先進(jìn)——但在向英偉達(dá)供應(yīng)HBM方面屢遭挫折,測試進(jìn)度也落后競爭對手約兩個月。這種時間差距在快速迭代的AI市場中可能造成致命影響。
另外,一個引人注目的新趨勢是HBM的定制化發(fā)展。早在兩年前HBM初露鋒芒之際,這一趨勢就已初現(xiàn)端倪。隨著云巨頭紛紛推出自研AI芯片——從谷歌的TPU到亞馬遜的Trainium,從微軟與OpenAI的合作到Meta的自研芯片——對HBM的個性化需求成為必然。
SK海力士副總裁柳成洙去年8月透露:“所有M7(Magnificent 7)公司都來找我們,要求定制HBM。”今年6月,韓國媒體報道SK海力士已同時鎖定英偉達(dá)、微軟、博通等重量級客戶,開始根據(jù)各家公司的需求開展設(shè)計(jì)工作。從第七代HBM(HBM4E)開始,SK海力士將全面轉(zhuǎn)向定制化路線,并與臺積電展開深度合作。
定制化HBM(cHBM)的核心在于將基礎(chǔ)芯片功能集成進(jìn)由SoC團(tuán)隊(duì)設(shè)計(jì)的邏輯芯片中。這種集成賦予設(shè)計(jì)人員更大的靈活性和對HBM核心芯片堆棧訪問的控制能力,可以更緊密地集成內(nèi)存與處理器芯片,并根據(jù)具體應(yīng)用在功耗、性能與面積之間進(jìn)行優(yōu)化。這種定制化能力對于追求極致性能和能效比的AI應(yīng)用來說,具有不可替代的價值。
面對在HBM市場的落后局面,三星電子正在發(fā)起一場“背水一戰(zhàn)”。在董事長李在镕的直接支持下,三星副董事長全永鉉正為HBM業(yè)務(wù)投入全部精力。據(jù)業(yè)內(nèi)人士透露,三星正在量產(chǎn)HBM4樣品,產(chǎn)量約為10,000片晶圓——這對于樣品生產(chǎn)而言是異常高的數(shù)量。
這種“過度生產(chǎn)”策略背后有其深層考量。三星的HBM4采用了尚未完全成熟的10nm級第六代(1c)DRAM,而競爭對手仍在使用已商業(yè)化的第五代(1b)DRAM。盡管面臨良率挑戰(zhàn),三星仍利用其卓越的EUV工藝和壓倒性產(chǎn)能優(yōu)勢,搶先采用下一代DRAM技術(shù)。
更激進(jìn)的是三星的定價策略。業(yè)內(nèi)估計(jì)12層HBM4的價格將比HBM3E高出60-70%,SK海力士尋求至少30-40%的單價溢價,而三星正考慮低于20%的溢價,幾乎沒有留下利潤空間。這種近乎"自殺式"的定價策略,令人想起三星過去在內(nèi)存市場低迷時期通過“膽小鬼博弈”擊敗日本和臺灣競爭對手的歷史。
與此同時,三星正加速建設(shè)平澤第五工廠,該工廠將配備10納米第六代(1c)DRAM生產(chǎn)線,專門用于批量生產(chǎn)HBM4所需的DRAM。這一舉措顯示出三星試圖通過產(chǎn)能優(yōu)勢和成本控制重奪存儲霸主地位的決心。
HBF:NAND 閃存的新冒險
隨著AI基礎(chǔ)設(shè)施對存儲需求的指數(shù)級增長,傳統(tǒng)存儲的局限性日益凸顯。高帶寬閃存(HBF)作為一種全新的技術(shù)路徑,正試圖在帶寬與容量之間找到新的平衡點(diǎn)。與用DRAM層疊而成的HBM不同,HBF是將NAND閃存層疊而成的產(chǎn)品,利用NAND閃存的特性實(shí)現(xiàn)更大的存儲容量。
今年2月,美國閃存企業(yè)Sandisk率先宣布正在開發(fā)HBF技術(shù),將其定位為"結(jié)合3D NAND容量和HBM帶寬"的創(chuàng)新產(chǎn)品。Sandisk強(qiáng)調(diào),HBF能夠同時滿足帶寬、容量、低功耗的綜合要求,這對于需要處理海量數(shù)據(jù)的AI應(yīng)用來說具有特殊意義。
這一技術(shù)路線的提出并非偶然。當(dāng)前AI模型正在向多模態(tài)、長上下文方向發(fā)展——GPT-4V的視覺理解、Claude的100K token上下文、Gemini的多模態(tài)能力——這些應(yīng)用需要在內(nèi)存中維護(hù)龐大的中間狀態(tài)數(shù)據(jù)。傳統(tǒng)DRAM雖然速度快,但容量擴(kuò)展成本極高;而NAND閃存雖然容量大,但訪問速度相對較慢。HBF試圖通過架構(gòu)創(chuàng)新,在兩者之間找到最優(yōu)解。
今年8月,Sandisk與SK海力士簽訂了開發(fā)HBF的諒解備忘錄(MOU),標(biāo)志著這項(xiàng)技術(shù)從概念走向產(chǎn)業(yè)化的重要一步。根據(jù)計(jì)劃,Sandisk將于明年下半年向客戶提供HBF樣本,并于2027年初為推理AI提供正式產(chǎn)品。這一消息直接推動Sandisk股價從43美元飆升至86美元,翻了一番,反映出市場對這項(xiàng)技術(shù)的強(qiáng)烈期待。
然而,HBF的技術(shù)實(shí)現(xiàn)仍面臨諸多挑戰(zhàn)。半導(dǎo)體業(yè)內(nèi)人士指出,將SSD直接連接到處理器的技術(shù)長期以來一直在研究,但實(shí)際應(yīng)用中困難重重。最大的問題在于內(nèi)存與存儲角色的根本性差異——CPU等處理器為了快速運(yùn)算需要極快的數(shù)據(jù)訪問,而NAND閃存的訪問速度遠(yuǎn)低于DRAM。如果CPU將基于NAND的存儲當(dāng)作主存使用,運(yùn)算速度必然大幅下降。
值得一提的是,英偉達(dá)與IBM及多所大學(xué)合作開發(fā)的BaM(Big Accelerator Memory)技術(shù),通過新一代NVMe協(xié)議實(shí)現(xiàn)了SSD與GPU的直接連接,為HBF的實(shí)際應(yīng)用提供了技術(shù)參考。這種架構(gòu)能夠顯著降低數(shù)據(jù)搬運(yùn)的能耗成本——在現(xiàn)有架構(gòu)中,數(shù)據(jù)需要經(jīng)過"SSD→NAND閃存控制器→DRAM→處理器"的復(fù)雜鏈路,每一步都會產(chǎn)生額外的功耗和延遲。
據(jù)了解,業(yè)內(nèi)普遍認(rèn)為,HBF和HBM并非競爭關(guān)系,而是作為補(bǔ)充來發(fā)揮作用。韓國科學(xué)技術(shù)院教授鄭明秀指出,HBF處理的塊存儲單元較大,需要能夠一次性處理和傳輸大規(guī)模信息的軟件和基礎(chǔ)設(shè)施支持。這意味著HBF更適合特定的應(yīng)用場景。
未來AI將迎來超越文本或圖像、制作長視頻的時代。在這種需要超大容量的場景下,雖然比DRAM慢但容量優(yōu)勢明顯的NAND閃存將發(fā)揮關(guān)鍵作用。例如,視頻生成模型Sora需要處理數(shù)TB的中間數(shù)據(jù),傳統(tǒng)HBM的容量限制使其難以勝任;而HBF通過犧牲部分帶寬換取更大容量,恰好滿足了這類應(yīng)用的需求。
此外,HBF在成本控制方面也具有潛在優(yōu)勢。NAND閃存的每GB成本遠(yuǎn)低于DRAM,這使得HBF在需要大容量但對帶寬要求相對寬松的應(yīng)用場景中具有明顯的經(jīng)濟(jì)性。隨著AI應(yīng)用的多樣化發(fā)展,這種差異化的存儲解決方案將找到越來越多的用武之地。
GDDR7:推理架構(gòu)的“降配”與新機(jī)遇
今年9月10日,英偉達(dá)推出Rubin CPX GPU,這款專為長上下文AI工作負(fù)載設(shè)計(jì)的處理器做出了一個引人注目的選擇:采用128GB GDDR7顯存,而非更高端的HBM4。這一決定背后,體現(xiàn)了英偉達(dá)對AI推理架構(gòu)的全新思考。
英偉達(dá)提出了“解耦推理”(disaggregated inference)的創(chuàng)新理念,將推理過程拆分為兩個階段:計(jì)算型GPU負(fù)責(zé)處理龐大的“上下文階段”,高帶寬GPU則專注于"生成階段"的吞吐量密集計(jì)算。在這種架構(gòu)下,Rubin CPX主要承擔(dān)上下文構(gòu)建任務(wù),此時GDDR7的帶寬和延遲已完全足夠;而在生成階段,工作會交由配備HBM4的標(biāo)準(zhǔn)Rubin GPU執(zhí)行。
這種設(shè)計(jì)的精妙之處在于避免了資源浪費(fèi)。分析顯示,在計(jì)算密集型的預(yù)填充階段,由于并行度高,KV Cache的生成對帶寬依賴有限,HBM的額外帶寬并未被充分利用;只有在解碼階段,HBM的高帶寬價值才真正釋放??紤]到HBM在加速器BOM中已成為最昂貴的單一組件——從Hopper到Blackwell,其成本占比不斷攀升——合理配置不同類型的存儲成為優(yōu)化成本的關(guān)鍵。
GDDR7需求的激增,也對存儲供應(yīng)鏈造成了更大的影響。英偉達(dá)最初為RTX Pro 6000下達(dá)的大量GDDR7訂單,主要由三星承接。憑借靈活的產(chǎn)能調(diào)配能力,三星成功滿足了這些突發(fā)需求,而SK海力士和美光的晶圓產(chǎn)能則更多被鎖定在利潤更高的HBM訂單上。
近期,英偉達(dá)要求三星將GDDR7產(chǎn)量翻倍,三星不僅擴(kuò)大了生產(chǎn)設(shè)施,還增加了必要的材料與組件。據(jù)業(yè)內(nèi)人士透露,所有量產(chǎn)準(zhǔn)備工作已基本完成,預(yù)計(jì)本月就能啟動擴(kuò)產(chǎn)后的供應(yīng)鏈。這種快速響應(yīng)能力使三星在圖形DRAM市場占據(jù)了有利位置。
更值得關(guān)注的是,英偉達(dá)正準(zhǔn)備推出代號“B40”的新產(chǎn)品,將搭載三星GDDR7并針對中國市場銷售。該產(chǎn)品通過降低數(shù)據(jù)處理能力來規(guī)避出口限制,預(yù)計(jì)今年出貨量可能達(dá)到100萬片,僅GDDR7基板需求就高達(dá)約2000億韓元。摩根士丹利分析指出,若地緣政治不確定性持續(xù),B40的市場潛力將進(jìn)一步釋放。
GDDR7的采用不僅是成本優(yōu)化的選擇,更可能成為AI推理普及化的重要推手。通過大幅降低顯存在系統(tǒng)總成本中的比重,GDDR7使得更多企業(yè)能夠負(fù)擔(dān)得起AI推理基礎(chǔ)設(shè)施。這種成本下降帶來的連鎖反應(yīng)不容小覷。
當(dāng)token成本顯著下降,用戶對推理的需求會隨之激增。就像許多降低成本的技術(shù)創(chuàng)新一樣,需求增長往往遠(yuǎn)遠(yuǎn)抵消成本下降的影響,最終推動整個市場規(guī)模的持續(xù)擴(kuò)大。這意味著,雖然單個系統(tǒng)使用了成本更低的GDDR7,但整體市場對高端HBM的需求反而可能因?yàn)閼?yīng)用普及而進(jìn)一步增長。
此外,GDDR7在特定應(yīng)用場景中展現(xiàn)出獨(dú)特優(yōu)勢。對于那些需要大量并行處理但對單一任務(wù)帶寬要求不高的應(yīng)用——如批量圖像處理、自然語言理解的預(yù)處理階段——GDDR7提供了近乎完美的性價比。隨著AI應(yīng)用場景的不斷細(xì)分,這種差異化的存儲方案將找到更廣闊的市場空間。
把握AI存儲機(jī)遇,盡在灣芯展2025
2025年灣區(qū)半導(dǎo)體產(chǎn)業(yè)生態(tài)博覽會(簡稱“灣芯展”)將于10月15—17日在深圳會展中心(福田)盛大開幕。作為中國半導(dǎo)體產(chǎn)業(yè)的年度盛會,本屆展會規(guī)模擴(kuò)容50%,展示面積突破60,000平方米,匯聚600+全球頭部企業(yè),預(yù)計(jì)吸引60,000名專業(yè)觀眾,共同見證全球半導(dǎo)體創(chuàng)新成果與無限商機(jī)。
在AI加速進(jìn)入“存儲為王”的時代,灣芯展將重點(diǎn)展示HBM、HBF、GDDR7等前沿存儲技術(shù)及其在AI算力中心、智能汽車、超算平臺中的應(yīng)用突破。無論是高帶寬存儲推動AI大模型推理,還是新一代高速接口助力數(shù)據(jù)中心提效,都將在這里得到最直觀的呈現(xiàn)。同時,來自國內(nèi)外的存儲巨頭與創(chuàng)新企業(yè)將帶來最新產(chǎn)品與解決方案,為產(chǎn)業(yè)上下游創(chuàng)造深度合作契機(jī)。
區(qū)別于傳統(tǒng)展會,2025灣芯展首創(chuàng)“項(xiàng)目采購展”模式和全年服務(wù)體系,貫穿展前精準(zhǔn)匹配、展中高效對接、展后持續(xù)跟進(jìn),切實(shí)推動百億級產(chǎn)業(yè)合作落地。作為連接全球半導(dǎo)體生態(tài)的重要橋梁,灣芯展將助力中國半導(dǎo)體實(shí)現(xiàn)從“跟跑”到“領(lǐng)跑”的跨越,成為企業(yè)開拓市場、拓展合作的首選平臺。
半導(dǎo)體行業(yè)觀察&灣芯展
邊緣AI賦能硬件未來創(chuàng)新論壇
2025.10.15
深圳會展中心(福田)
9:00-9:50
觀眾簽到入場
9:50-10:00
開幕致辭
深芯盟
執(zhí)行秘書長 張建
10:00-10:20
面向個人智能體的端側(cè)大模型芯片
深港微電子學(xué)院
副院長 余浩教授
10:20-10:40
釋放端側(cè)AI潛力,NPU助力開啟硬件創(chuàng)新“芯”時代
安謀科技 Arm China
產(chǎn)品總監(jiān) 鮑敏祺
10:40-11:00
打造智算時代的新質(zhì)生產(chǎn)力
深圳云天勵飛技術(shù)股份有限公司
副總裁 羅憶
11:00-11:20
AI賦能,揚(yáng)帆出海
中國聯(lián)通
總監(jiān) 楊程
11:20-11:40
海外云計(jì)算與AI應(yīng)用的made in china情懷
浪潮云
高級戰(zhàn)略總監(jiān) 張晟彬
11:40-12:00
創(chuàng)新 RISC-V 架構(gòu)——鑄建新一代智算未來
阿里巴巴達(dá)摩院(杭州)科技有限公司
商務(wù)拓展負(fù)責(zé)任人 李玨
12:00-13:30
午休&抽獎
13:30-13:50
中國電信國際公司大灣區(qū)市場洞察
中國電信
信息科技客戶部總經(jīng)理 張黎明
13:50-14:10
AI新時代下的“通推一體”處理器
知合計(jì)算技術(shù)(上海)有限公司
首席科學(xué)家 蘇中
14:10-14:30
大模型部署的規(guī)?;瘜?shí)踐
魔形智能科技(上海)有限公司
創(chuàng)始人 金琛
14:30-14:50
光計(jì)算系統(tǒng)重構(gòu)智算基建新范式
光本位智能科技(上海)有限公司
產(chǎn)品與市場副總裁 姚金鑫
14:50-15:10
聯(lián)想凌拓半導(dǎo)體行業(yè)高效存儲解決方案
聯(lián)想凌拓科技有限公司
半導(dǎo)體部總經(jīng)理 余曉丹
15:10-15:30
預(yù)見未來:大模型+工程智能賦能半導(dǎo)體未來工廠“制造革命”
深圳智現(xiàn)未來工業(yè)軟件有限公司
副總裁 朱軍
15:30-15:50
AI芯片測試技術(shù)發(fā)展與挑戰(zhàn)
工業(yè)和信息化部電子第五研究所
副主任 王之哲
15:50-16:20
圓桌&抽獎
**最終議程以現(xiàn)場為主
掃描下方二維碼即可報名
結(jié)語:存儲技術(shù)的協(xié)同演進(jìn)
AI存儲的"再度爆火"并非單一技術(shù)的勝利,而是多種技術(shù)路線協(xié)同演進(jìn)的結(jié)果。HBM繼續(xù)在高端訓(xùn)練和推理領(lǐng)域保持不可替代的地位,其不斷提升的帶寬和容量仍是突破AI性能天花板的關(guān)鍵;HBF作為新興技術(shù),雖然商業(yè)化進(jìn)程仍需時日,但其在超大容量應(yīng)用場景的潛力不容忽視;GDDR7則通過精準(zhǔn)的市場定位,在成本敏感但性能要求適中的領(lǐng)域找到了自己的生態(tài)位。
這三種技術(shù)的競合關(guān)系,反映出AI產(chǎn)業(yè)對存儲需求的多樣化和精細(xì)化。沒有一種技術(shù)能夠包打天下,但每種技術(shù)都在特定領(lǐng)域發(fā)揮著不可替代的作用。對于存儲廠商而言,這意味著必須在多條技術(shù)路線上同時布局,既要在HBM的高端市場保持競爭力,也要在GDDR7的規(guī)模市場占據(jù)份額,還要為HBF等前瞻技術(shù)儲備研發(fā)能力。
展望未來,隨著AI應(yīng)用從實(shí)驗(yàn)室走向千行百業(yè),存儲技術(shù)的創(chuàng)新將繼續(xù)加速。無論是追求極致性能的科研機(jī)構(gòu),還是注重成本效益的企業(yè)用戶,都將在這個百花齊放的存儲技術(shù)生態(tài)中找到適合自己的解決方案。而這種多元化的技術(shù)演進(jìn),正是推動AI產(chǎn)業(yè)持續(xù)突破、走向更廣闊未來的堅(jiān)實(shí)基礎(chǔ)。
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4182期內(nèi)容,歡迎關(guān)注。
加星標(biāo)??第一時間看推送,小號防走丟
求推薦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.