公眾號(hào)記得加星標(biāo)??,第一時(shí)間看推送不會(huì)錯(cuò)過。
來源 : 內(nèi)容來自theregister 。
微軟從英偉達(dá)和AMD購買了大量GPU。但展望未來,其領(lǐng)導(dǎo)層希望將其大部分AI工作負(fù)載從GPU轉(zhuǎn)移到自研加速器上。
這家軟件巨頭在自研芯片領(lǐng)域起步較晚。亞馬遜和谷歌多年來一直在研發(fā)定制CPU和AI加速器,而微軟直到2023年底才首次公布其Maia AI加速器。
推動(dòng)這一轉(zhuǎn)型的核心動(dòng)力是“每美元性能”(performance per dollar),這對(duì)超大規(guī)模云服務(wù)商來說幾乎是唯一真正重要的指標(biāo)。在本周三由CNBC主持的爐邊談話中,微軟首席技術(shù)官Kevin Scott表示,到目前為止,英偉達(dá)提供的性價(jià)比最佳,但為了滿足需求,他愿意嘗試任何可能的選擇。
展望未來,Scott表示,微軟希望在其數(shù)據(jù)中心的大部分工作負(fù)載中使用自研芯片。
當(dāng)被問到“長期目標(biāo)是否是在數(shù)據(jù)中心主要使用微軟自研芯片?”時(shí),Scott回答:“是的,絕對(duì)如此?!?/p>
他隨后對(duì)CNBC補(bǔ)充道:“這涉及整個(gè)系統(tǒng)設(shè)計(jì),包括網(wǎng)絡(luò)和散熱。你必須有自由去做出各種決策,從而真正優(yōu)化計(jì)算能力以適配不同的工作負(fù)載。”
在推出首款自研AI加速器Maia 100時(shí),微軟就在2023年將OpenAI的GPT-3.5遷移到自家芯片上,從而釋放了一部分GPU產(chǎn)能。然而,該芯片僅具備800 teraFLOPS的BF16性能、64GB HBM2e內(nèi)存和1.8TB/s的內(nèi)存帶寬,遠(yuǎn)遠(yuǎn)落后于英偉達(dá)和AMD的競爭性GPU。
據(jù)報(bào)道,微軟 reportedly 正在研發(fā)第二代Maia加速器,預(yù)計(jì)將在明年推出,其在計(jì)算、內(nèi)存和互連性能上將更具競爭力。
不過,即便未來微軟數(shù)據(jù)中心中GPU與AI ASIC的占比會(huì)發(fā)生變化,也不太可能完全取代英偉達(dá)和AMD的芯片。
過去幾年,谷歌和亞馬遜已經(jīng)部署了數(shù)以萬計(jì)的TPU和Trainium加速器。雖然這些芯片幫助它們贏得了一些高端客戶(例如Anthropic),但更多時(shí)候它們還是用于加速公司自身的內(nèi)部工作負(fù)載。
因此,在這些云平臺(tái)上,我們?nèi)阅芸吹酱笠?guī)模的英偉達(dá)和AMD GPU部署,部分原因是客戶依舊需要它們。
需要指出的是,AI加速器并不是微軟唯一的自研芯片。雷德蒙德還開發(fā)了名為Cobalt的自研CPU,以及一系列平臺(tái)安全芯片,用于加速密碼學(xué)處理并保障其龐大數(shù)據(jù)中心領(lǐng)域內(nèi)的密鑰交換安全。
https://www.theregister.com/2025/10/02/microsoft_maia_dc/?td=
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對(duì)該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4185期內(nèi)容,歡迎關(guān)注。
加星標(biāo)??第一時(shí)間看推送,小號(hào)防走丟
求推薦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.