夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達鐵幕之后,谷歌AI芯片已成氣候

0
分享至


新智元報道

編輯:定慧

【新智元導(dǎo)讀】英偉達在聚光燈下狂飆,谷歌卻在幕后悄悄造出自己的AI基建帝國系統(tǒng)。當(dāng)別人還在搶GPU時,它早已自給自足、閉環(huán)生長——悶聲干大事,從未如此谷歌。

英偉達明修棧道,谷歌暗渡陳倉。

當(dāng)你回頭一看,谷歌在AI基礎(chǔ)設(shè)施的優(yōu)勢已經(jīng)無法阻擋。


這幾天,谷歌終于把憋了很久的大招放出來了,CEO劈柴官宣了自研第七代TPU Ironwood正式商用。


這是谷歌第七代TPU,單顆算力4614 TFLOPS(FP8精度),192GB的HBM3E內(nèi)存,帶寬高達7.37 TB/s。

與上一代TPU v5p相比峰值性能提升10倍!


對于Google Cloud客戶,Ironwood根據(jù)工作負載需求提供兩種尺寸:256芯片配置和9216芯片配置。

也就是一個pod可以最多塞下9216個TPU,總算力達到了驚人的42.5 ExaFLOPS。

與之相比英偉達目前主推的的GB300 NVL72系統(tǒng)只有0.36 ExaFLOPS。

這就是為啥Anthropic直接買了100萬顆TPU的根本原因。

谷歌才是那個真正低調(diào)發(fā)財?shù)墓?,有人總結(jié)AI價值鏈上所有公司涉足的領(lǐng)域。


谷歌是唯一一家,沒有之一,全棧人工智能公司:數(shù)據(jù)→算法→硬件→云服務(wù)器。

它使用自己的數(shù)據(jù)來訓(xùn)練自己的算法;這些算法在部署在自己的云上的自己的芯片上運行;然后開發(fā)了自己的應(yīng)用程序。

如果說現(xiàn)在谷歌唯一的弱點,那可能就是「蘋果」,準確的說,是客戶端設(shè)備,手機。

雖然安卓系統(tǒng)是谷歌的,但是偏偏谷歌沒有自己的手機(如果手機也有,谷歌稱得上地球上最壟斷的公司,也許沒有之一。)

雖然Pixel系列出貨量未能排在三星和國產(chǎn)等安卓機前面,但是用過Pixel的人都說好。


谷歌TPU十年進化

谷歌TPU,全稱張量處理單元 (Tensor Processing UnitT), 從早期幾代主要作為內(nèi)部優(yōu)化工具,到最新的迭代已構(gòu)成一個成熟且極具競爭力的產(chǎn)品組合。

當(dāng)英偉達在橫向擴展(scale-out) 加速器市場占據(jù)主導(dǎo)地位時,谷歌已經(jīng)構(gòu)建了全球唯一一個專為訓(xùn)練和運行前沿模型而設(shè)計的、具有高容錯性的超大規(guī)模系統(tǒng)。

2013年,谷歌面臨一個關(guān)鍵時刻。

公司意識到,神經(jīng)網(wǎng)絡(luò)日益增長的計算需求(尤其是在語音識別領(lǐng)域)可能迫使他們將數(shù)據(jù)中心的規(guī)模翻倍。

這一預(yù)測使AI計算不再是一個機遇,而是對運營支出 (OpEx) 的生存威脅。

盡管谷歌早在2006年就考慮過構(gòu)建專用集成電路 (ASIC),但直到2013年,這才真正成為一項迫在眉睫的任務(wù)。

TPU v1 的開發(fā)周期之快是前所未有的:從設(shè)計、驗證、制造到部署至數(shù)據(jù)中心僅用了15個月!

TPU v1 于2015年在谷歌內(nèi)部署,并于2016年的Google I/O大會上公開發(fā)布。


TPU v1的誕生過程極不尋常。

它并非一個循序漸進的研發(fā)項目,更像是一項緊急的「救火」措施。

據(jù)報道,谷歌在構(gòu)建芯片的同時才開始招聘團隊,這表明該項目風(fēng)險極高,但也具有最高優(yōu)先級。

這種「沖刺」塑造了TPU的DNA:實用主義和領(lǐng)域特定優(yōu)化壓倒一切。

谷歌為了成功,犧牲了所有與神經(jīng)網(wǎng)絡(luò)無關(guān)的功能。

當(dāng)AI由神經(jīng)網(wǎng)絡(luò)組成,TPU就是AI而誕生的。

架構(gòu)哲學(xué),摒棄通用性

谷歌TPU v1是一款「僅限推理」的ASIC,專為TensorFlow框架設(shè)計。 (另一個深度學(xué)習(xí)框架就是Meta的PyTorch)

它與CPU和GPU的關(guān)鍵區(qū)別在于:TPU專為高吞吐量的低精度計算(如8位整數(shù))而設(shè)計。

與CPU(通用處理器)和GPU(當(dāng)時主要為圖形渲染優(yōu)化)不同,TPU徹底摒棄了非必需的硬件,如緩存、亂序執(zhí)行和紋理映射單元。


該芯片的核心是一個龐大的矩陣乘法單元,擁有 65,536 個 (256x256) 8位MAC單元,峰值性能達到每秒92萬億次操作 (TOPS)。

v1 采用了28nm工藝,時鐘頻率為700MHz,而其熱設(shè)計功耗 (TDP) 僅為40W,遠低于同期的GPU。

它被設(shè)計為一塊PCIe卡,可安裝在SATA硬盤插槽中,以便快速集成到現(xiàn)有服務(wù)器。

早期勝利,AlphaGo與驚人的能效比

2016年,DeepMind的AlphaGo擊敗世界圍棋冠軍李世石,這一歷史性事件的背后正是TPU v1在提供算力支持。

2017年發(fā)表的一篇具有里程碑意義的論文詳細闡述了其性能。

在谷歌的生產(chǎn)工作負載(占數(shù)據(jù)中心NN推理需求的95%)中,TPU v1 的速度比同期的Intel Haswell CPU和英偉達 K80 GPU快15至30倍。


然而,更關(guān)鍵的指標是能效比 (TOPS/Watt),TPU v1 比CPU和GPU高出30至80倍。

這一數(shù)據(jù)揭示了谷歌從一開始的戰(zhàn)略意圖。

在超大規(guī)模數(shù)據(jù)中心的環(huán)境中,成本不僅由芯片的采購成本 (CapEx) 決定,更由其運行的電力成本 (OpEx) 決定。

TPU v1 的勝利不僅在于速度,更在于它解決了AI計算的總體擁有成本 (TCO) 問題。

中期規(guī)?;葸M

TPU v1 驗證了ASIC的概念,但其「僅限推理」的特性意味著谷歌在模型訓(xùn)練方面仍依賴英偉達。

TPU v2 (2017年推出) 標志著谷歌向訓(xùn)練領(lǐng)域的戰(zhàn)略轉(zhuǎn)向。

關(guān)鍵的架構(gòu)轉(zhuǎn)變是:從8位整數(shù)計算轉(zhuǎn)向浮點計算,特別是引入并推廣了由Google Brain發(fā)明的 bfloat16 (bf16) 格式。


bfloat16 是一個巧妙的工程妥協(xié):它保留了與32位浮點數(shù) (FP32) 相同的8位指數(shù),但將尾數(shù)截短至7位。

這一設(shè)計在大幅降低內(nèi)存占用和帶寬需求的同時,保留了訓(xùn)練所需的動態(tài)范圍,有效防止了梯度消失或爆炸。

規(guī)格方面,v2采用16nm工藝,搭載16GB高帶寬內(nèi)存 (HBM)(v1為DDR3),內(nèi)存帶寬飆升至600 GB/s,算力達到45 TFLOPS。

TPU v2引入了Pod(集群)概念,但在此之前與之后,GPU長期以集群/超算形態(tài)擴展

英偉達隨后在2018年推出DGX POD參考架構(gòu),2019 年起推出DGX SuperPOD并在 2020–2025 年持續(xù)更新(H200/GB200 等版本),這些都屬于標準化的GPU集群解決方案。


谷歌不再將TPU視為獨立的加速器,而是設(shè)計了4芯片模塊(180 TFLOPS)。

64個這樣的模塊被組裝成一個256芯片的Pod,總性能達到11.5 PFLOPS 6。

這是TPU歷史上最重要的時刻之一。

谷歌停止了在「芯片競賽」中追趕,轉(zhuǎn)而開辟了「系統(tǒng)競賽」的新戰(zhàn)場。

TPU v3 (2018年) 延續(xù)了這一思路。

芯片性能提升至123T-ops,HBM增加到32GB。更重要的是,Pod的規(guī)模擴大了4倍,達到1024個芯片,使每個Pod的性能增加了8倍。

為了應(yīng)對急劇增加的功率密度,液冷技術(shù)被引入并成為TPU Pod的標準配置,這使谷歌能夠進一步挑戰(zhàn)性能極限。


到了第四代,TPU v4 (2021)可以和與A100并駕齊驅(qū),實現(xiàn)規(guī)?;I(lǐng)先。

TPU v4(2021年)是一次重大飛躍。采用7nm工藝,性能提升至275T-ops(T-ops 是 tera-operations per second的縮寫,表示每秒執(zhí)行的萬億次操作。)。

Pod規(guī)模再次擴大,達到4096個芯片。

關(guān)鍵改進在于互連:v4 芯片的互連帶寬達到了上一代的10倍。

到2021年,TPU不再只是一個「高TCO效益」的選項。

它在原始性能上已經(jīng)可以與英偉達的最佳產(chǎn)品正面競爭。

現(xiàn)代TPU產(chǎn)品,多元化和專業(yè)化

TPU v5 的發(fā)布標志著谷歌從單一架構(gòu)轉(zhuǎn)向成熟、多元化的產(chǎn)品線。

v5有兩個版本TPU v5e(Efficiency)和TPU v5p(Performance),v5e針對主流推理、微調(diào)和中小型訓(xùn)練負載設(shè)計;TPU v5p是訓(xùn)練谷歌Gemini 1.0模型所使用的核心系統(tǒng)。

與TPU v4相比,TPU v5p的FLOPS提高了2倍以上,高帶寬內(nèi)存(HBM)提高了3倍。


TPU v5p專為性能、靈活性和規(guī)模而設(shè)計,可以訓(xùn)練大型LLM模型,速度比上一代TPU v4快2.8倍。

TPU v6,代號Trillium,于2024年5月宣布,并于同年10月提供預(yù)覽。

v6性能實現(xiàn)了918TFLOPS和1836TOPS (Int8) 的巨大飛躍。

這比v5e高出4.7倍,比v5p高出約2倍。規(guī)格32GB HBM,1600 GB/s帶寬。


v6引入了關(guān)鍵架構(gòu):第三代SparseCore。

SparseCore 的引入表明谷歌正在解決Transformer模型中的特定瓶頸。

SparseCore是一種專門用于處理嵌入 (embeddings) 的加速器。

嵌入在排名和推薦模型中普遍存在,并且對傳統(tǒng)的MXU來說計算效率低下。

Trillium 是一款專為訓(xùn)練Transformer和MoE(Mixture of Experts)模型而打造的芯片。

谷歌的Gemini 2.0是在Trillium (v6) 上訓(xùn)練的。


谷歌CEO劈柴明確表示:「TPU為Gemini 2.0的訓(xùn)練和推理提供了100%的動力」。

TPU v7推理時代的專業(yè)芯片

TPU v7,代號Ironwood,于2025年4月發(fā)布。

Ironwood是首款專為推理而設(shè)計的TPU,而Trillium則是訓(xùn)練冠軍。


在戰(zhàn)略和資本層面,這反映了一種鐘擺策略。谷歌使用v6 (Trillium) 來構(gòu)建前沿模型 (CapEx投入),現(xiàn)在發(fā)布v7 (Ironwood) 來規(guī)?;?wù)這些模型 (OpEx消耗)。

Ironwood 旨在優(yōu)化推理的TCO。(畢竟我們?nèi)祟愐呀?jīng)進入AI推理時代)

Ironwood達到4614 TFLOPS (FP8),比Trillium的Int8性能高出2.5倍以上。能效比是Trillium的2倍。


Ironwood將在未來幾周年內(nèi)全面上市。市場對Ironwood的早期反響極為熱烈。

比如,谷歌列出了一些已經(jīng)下訂單的企業(yè),Anthropic、Lightricks、essential AI。




CPU也造,還有最新虛擬機

除了TPU,谷歌還造了自己的第一顆通用處理器Axion。

用谷歌自己的話:構(gòu)建和運維現(xiàn)代應(yīng)用既需要高度專業(yè)化的加速器,也離不開強大高效的通用計算能力。


基于這顆CPU,谷歌還發(fā)布了最新的Axion虛擬機,N4A。

基于Arm架構(gòu)的全新Axion實例現(xiàn)已開放預(yù)覽。

與當(dāng)前同代基于x86架構(gòu)的虛擬機相比,N4A可提供高達2倍的價格性能優(yōu)勢。

除了虛擬機,還推出了裸金屬實例,C4A。

C4A裸金屬實例(即將進入預(yù)覽階段)是谷歌首款基于Arm架構(gòu)的裸金屬實例,為專用工作負載提供專屬物理服務(wù)器,適用于Android開發(fā)、汽車車載系統(tǒng)、嚴格許可要求的軟件、規(guī)?;瘻y試農(nóng)場或運行復(fù)雜模擬等場景。

谷歌的云服務(wù)在2025年3季度處于世界第3,前面是亞馬遜和微軟。


正如文章開頭所說,谷歌是現(xiàn)在AI領(lǐng)域唯一一家全棧技術(shù)公司,數(shù)據(jù)、算法、模型、云服務(wù)、CPU、GPU,需要什么就自己造什么。


雖然在很多時候,谷歌沒有排在第一,但是在任何領(lǐng)域,谷歌都榜上有名。

也許這才是真正的悶聲發(fā)大財。


2025年10月,Anthropic宣布擴大合作,獲得高達100萬個TPU芯片的使用權(quán)。

該協(xié)議價值數(shù)百億美元,并將在2026年提供超過1吉瓦 (Gigawatt)的計算容量。

雖然全球的聚光燈幾乎都照在英偉達身上,但在聚光之外,谷歌的AI基礎(chǔ)設(shè)施版圖已經(jīng)悄然成形,甚至形成了自己獨立的「氣候系統(tǒng)」。

谷歌給自己這套系統(tǒng)起了個名字:AI Hypercomputer。


英偉達是舞臺中央的光芒,谷歌則隱藏在大幕之后。

當(dāng)所有AI公司都在搶購H系列GPU時,谷歌早已在自己的TPU集群上完成了自我造血循環(huán)——訓(xùn)練、部署、推理、優(yōu)化,全都在自己的系統(tǒng)內(nèi)部完成。

谷歌AI基金(Google AIInfrastructureFund)便是在這種體系下自然誕生的產(chǎn)物。

它不僅是投資基金,更像是一個生態(tài)基金池,用以扶持所有基于谷歌云與TPU生態(tài)的AI公司。


Anthropic、Cohere、Character.AI、Essential AI……

這些名字在外界看來是獨立的創(chuàng)業(yè)公司,但它們在算力與模型底座上,都深度綁定谷歌的TPU集群與Gemini模型家族。

換句話說,谷歌的AI基金并非簡單的「投資人」,而是用資本作為粘合劑,將算力、云服務(wù)與生態(tài)綁定在一起。

當(dāng)這些公司成長、融資、甚至上市時,谷歌都在背后分得紅利。

這就是谷歌真正的護城河:

不是某一代TPU芯片的領(lǐng)先;

也不是Gemini模型的參數(shù)量;(Gemini 3馬上要發(fā)布了)

而是一個可自我進化、自我繁殖的AI生態(tài)系統(tǒng)

在未來的幾年中,當(dāng)市場仍在討論GPU的供需、算力的溢價、芯片的帶寬時,谷歌的TPU與AI基金正以穩(wěn)健的方式持續(xù)擴張。

它的節(jié)奏不快,但勢能深厚,氣候已成。

參考資料:

https://cloud.google.com/blog/products/compute/ironwood-tpus-and-new-axion-based-vms-for-your-ai-workloads

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
昨天,8名干部落馬!中紀委網(wǎng)站發(fā)布→

昨天,8名干部落馬!中紀委網(wǎng)站發(fā)布→

魯中晨報
2025-11-11 10:43:05
耿直boy+1!18歲復(fù)旦學(xué)子擊敗潘展樂孫楊奪冠,賽后回應(yīng)亮了

耿直boy+1!18歲復(fù)旦學(xué)子擊敗潘展樂孫楊奪冠,賽后回應(yīng)亮了

青春上海
2025-11-11 11:35:14
官方:亞馬爾退出國家隊,西班牙足協(xié)對其自行接受治療不滿

官方:亞馬爾退出國家隊,西班牙足協(xié)對其自行接受治療不滿

懂球帝
2025-11-11 18:01:10
全國各地醫(yī)保虧損,新鄉(xiāng)限制醫(yī)保報銷額度,統(tǒng)籌日支付限額50元!

全國各地醫(yī)保虧損,新鄉(xiāng)限制醫(yī)保報銷額度,統(tǒng)籌日支付限額50元!

你食不食油餅
2025-11-11 07:00:06
四川馬爾康市紅旗橋垮塌:系山體變形加劇滑塌造成 無人員傷亡

四川馬爾康市紅旗橋垮塌:系山體變形加劇滑塌造成 無人員傷亡

新京報
2025-11-11 20:23:08
商務(wù)部新聞發(fā)言人就美方暫停實施出口管制穿透性規(guī)則答記者問

商務(wù)部新聞發(fā)言人就美方暫停實施出口管制穿透性規(guī)則答記者問

界面新聞
2025-11-11 22:04:28
阿壩州雙江口紅旗橋引橋為何垮塌?官方:已成立專項工作組,原因尚需進一步核查

阿壩州雙江口紅旗橋引橋為何垮塌?官方:已成立專項工作組,原因尚需進一步核查

澎湃新聞
2025-11-11 19:34:26
中國銀行等多家銀行宣布將關(guān)停部分App

中國銀行等多家銀行宣布將關(guān)停部分App

每日經(jīng)濟新聞
2025-11-11 08:36:48
毒株變了,傳染性更強!專家提醒:這類冬季高發(fā)病馬上要沖高

毒株變了,傳染性更強!專家提醒:這類冬季高發(fā)病馬上要沖高

新民晚報
2025-11-11 15:35:48
留給賴清德時間不多了!大陸巷戰(zhàn)演習(xí),繁體字一出,臺媒輿論大變

留給賴清德時間不多了!大陸巷戰(zhàn)演習(xí),繁體字一出,臺媒輿論大變

時時有聊
2025-11-11 20:55:04
12月1日禁售舊電動車,新國標不能帶娃遭質(zhì)疑:懂老百姓的難嗎?

12月1日禁售舊電動車,新國標不能帶娃遭質(zhì)疑:懂老百姓的難嗎?

你食不食油餅
2025-11-11 07:30:03
全運會乒乓球!4強名單誕生,國乒核心爆冷出局,王曼昱對手出爐

全運會乒乓球!4強名單誕生,國乒核心爆冷出局,王曼昱對手出爐

知軒體育
2025-11-12 00:17:02
皮蛋再次成為關(guān)注對象!多名院士發(fā)現(xiàn):常吃皮蛋的人,有5變化!

皮蛋再次成為關(guān)注對象!多名院士發(fā)現(xiàn):常吃皮蛋的人,有5變化!

徐云流浪中國
2025-11-11 16:29:53
常州小米SU7爆燃原因曝光:改裝過的鋰電池著火

常州小米SU7爆燃原因曝光:改裝過的鋰電池著火

映射生活的身影
2025-11-11 15:48:49
闖禍了!高市早苗拒絕收回涉臺言論后,特朗普表態(tài),中國戰(zhàn)艦抵近

闖禍了!高市早苗拒絕收回涉臺言論后,特朗普表態(tài),中國戰(zhàn)艦抵近

娛樂督察中
2025-11-12 00:05:30
windows提速200%!大小僅1MB的系統(tǒng)調(diào)校神器,讓電腦快到飛起!

windows提速200%!大小僅1MB的系統(tǒng)調(diào)校神器,讓電腦快到飛起!

科技樂小天
2025-11-11 10:52:42
祖雄兵越扒越有:男方有前科,曾琦醫(yī)德很好,偷拍者身份炸裂

祖雄兵越扒越有:男方有前科,曾琦醫(yī)德很好,偷拍者身份炸裂

寒士之言本尊
2025-11-10 22:51:59
“罕見”!高市早苗凌晨3點做出一驚人舉動

“罕見”!高市早苗凌晨3點做出一驚人舉動

環(huán)球時報國際
2025-11-11 21:23:40
新華視評:一些鎮(zhèn)政府在大門口設(shè)門衛(wèi),群眾進出審查嚴格!直面群眾的鎮(zhèn)政府,為何要設(shè)“門禁”呢?

新華視評:一些鎮(zhèn)政府在大門口設(shè)門衛(wèi),群眾進出審查嚴格!直面群眾的鎮(zhèn)政府,為何要設(shè)“門禁”呢?

新京報政事兒
2025-11-10 22:28:06
雷軍堅稱小米SU7無抄襲被打臉!網(wǎng)友:不是抄,是全部搬運

雷軍堅稱小米SU7無抄襲被打臉!網(wǎng)友:不是抄,是全部搬運

麥大人
2025-11-11 20:43:26
2025-11-12 02:47:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
13845文章數(shù) 66242關(guān)注度
往期回顧 全部

科技要聞

蘋果新品慘敗,產(chǎn)線拆光、二代擱淺!

頭條要聞

攜6.1萬枚比特幣出逃英國 富婆奢靡生活披露

頭條要聞

攜6.1萬枚比特幣出逃英國 富婆奢靡生活披露

體育要聞

一個14歲的小男孩,決定了誰能晉級世界杯

娛樂要聞

古二曝秦雯多次炫耀襲警經(jīng)歷

財經(jīng)要聞

南昌三瑞智能IPO:委外代工模式存疑

汽車要聞

盈利"大考",汽車智能化企業(yè)的中場戰(zhàn)事

態(tài)度原創(chuàng)

教育
房產(chǎn)
數(shù)碼
手機
時尚

教育要聞

老師們不奢望減輕什么負擔(dān),只希望能實行8小時工作制!

房產(chǎn)要聞

??跒?,1300畝巨無霸地塊登場!

數(shù)碼要聞

機械師Mini GTR迷你主機上新:銳龍AI 9 HX 370配置,性能釋放70W

手機要聞

小米10000mAh電池量產(chǎn)落地,REDMI中端機率先搭載,你期待嗎?

舒淇,東亞女孩的恨海情天

無障礙瀏覽 進入關(guān)懷版 性做久久久久久久免费看| 亚洲色欲色欲www在线丝| 99久久国产综合精品成人网 | 极品网红福利在线视频| 自拍第一区视频在线观看| 亚洲综合色成在线播放| 婷婷午夜的生活在线| 国产精品农村妇女一区二区三区 | 国产伦精品一区二区三区无码| AV无码免费无禁网站| 久久精品夜夜夜夜夜久久| 天堂√8在线中文| 免费黄色毛片| 亚洲色无码中文字幕yy51999| 久久综合婷婷国产二区高清| 99久久精品免费看国产| 俄罗斯老妈毛毛毛片| 国产精品久久毛片老年 | 人妻出差精油按摩被中出| 国产av中文字幕精品| 天堂无码人妻精品av一区| 毛片免费在线观看| 国产成人精品a视频| 女性裸体啪啪无遮挡动态图| 国产AV无码系列| 国产成人精品无码免费看| www.无码专区| 国产又黄又爽又色又刺激视频| 欧洲一区在线观看| 午夜亚洲AV| 亚洲日韩久热中文字幕| 欧美性少妇xxxx极品高清hd| 欧美在线视频一二区| 一个色综合色综合色综合| 超碰自拍刺激| 日韩亚洲国产中文永久| 黄色不卡视频一区二区三区| 亚洲国产高清在线观看视频| 91熟妇丰满人妻刺激战场| 综合亚洲色图| 99久久这里只精品麻豆|