夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

英偉達(dá)的“狙擊者”

0
分享至


出品|虎嗅科技組

作者|陳伊凡

編輯|苗正卿

頭圖|視覺中國(guó)

在 AI 芯片領(lǐng)域,英偉達(dá)憑借強(qiáng)大的訓(xùn)練芯片性能牢牢占據(jù)市場(chǎng)霸主地位,短期內(nèi)難逢敵手。然而,隨著 AI 推理市場(chǎng)的爆發(fā)式增長(zhǎng),這塊利潤(rùn)驚人的 “蛋糕” 吸引了眾多科技巨頭與初創(chuàng)公司入局。

Rivos是其中一個(gè)。8月13日,這家位于美國(guó)加州的初創(chuàng)公司被曝正在尋求一筆4億美元到5億美元的融資。如果這筆融資敲定,那么Rivos自其2021年成立以來,融資總金額將超過8.7億美元,也是迄今為止尚未大規(guī)模量產(chǎn),卻獲得最大融資額的芯片初創(chuàng)公司之一。而這家芯片公司的背后投資者之一,是英特爾首席執(zhí)行官陳立武。

這些初創(chuàng)公司和科技巨頭,為何選擇從推理側(cè)狙擊英偉達(dá)?它們又如何憑借差異化技術(shù)與成本優(yōu)勢(shì)撕開壟斷缺口?


推理需求暴漲

在人工智能的世界里,訓(xùn)練與推理猶如驅(qū)動(dòng)行業(yè)發(fā)展的雙引擎,共同塑造著技術(shù)演進(jìn)與市場(chǎng)競(jìng)爭(zhēng)的格局。

訓(xùn)練,堪稱 AI 系統(tǒng)的 “啟蒙教育” 階段。它如同培育一個(gè)懵懂孩童,通過海量數(shù)據(jù)投喂與高強(qiáng)度的算法訓(xùn)練,讓 AI 模型從一無所知成長(zhǎng)為能夠應(yīng)對(duì)復(fù)雜任務(wù)的 “智能體”。這一過程不僅成本高昂,往往需要強(qiáng)大的算力支撐與巨額資金投入。這個(gè)過程耗時(shí)漫長(zhǎng),一次完整的訓(xùn)練周期可能長(zhǎng)達(dá)數(shù)月甚至數(shù)年。更關(guān)鍵的是,它具有明顯的一次性特征,每一次訓(xùn)練都是全新的探索,難以復(fù)用。

而推理,則是 AI 技術(shù)的 “實(shí)戰(zhàn)應(yīng)用” 環(huán)節(jié)。當(dāng) AI 模型完成訓(xùn)練、積累了足夠的知識(shí)后,推理便負(fù)責(zé)將這些知識(shí)轉(zhuǎn)化為實(shí)際生產(chǎn)力,用于解決現(xiàn)實(shí)世界中的各類問題。

在生成式 AI 時(shí)代,技術(shù)架構(gòu)迎來重大變革。以 Transformer 為代表的AI架構(gòu),讓基礎(chǔ)模型訓(xùn)練趨向穩(wěn)定和固化。就像搭建好一座堅(jiān)固的大廈,后續(xù)只需進(jìn)行局部修繕與優(yōu)化,無需頻繁重建,極大降低了重復(fù)訓(xùn)練的成本。在這種情況下,推理成為持續(xù)創(chuàng)造價(jià)值的關(guān)鍵,如同永不停歇的生產(chǎn)線,不斷調(diào)用模型能力,滿足不同的場(chǎng)景和服務(wù)。

從商業(yè)視角看,訓(xùn)練階段如同高風(fēng)險(xiǎn)的 “資本賭局”。巨額的研發(fā)投入與漫長(zhǎng)的回報(bào)周期,使得只有少數(shù)科技巨頭具備入場(chǎng)資格,且投入產(chǎn)出比充滿不確定性。

而推理階段則搖身一變,成為 AI 產(chǎn)業(yè)的 “現(xiàn)金印鈔機(jī)”。廣為人知的 AI 應(yīng)用,無一不是通過向用戶收取推理服務(wù)費(fèi)實(shí)現(xiàn)盈利。

根據(jù)第三方機(jī)構(gòu)Verified Market Research的數(shù)據(jù),AI推理芯片市場(chǎng)正在經(jīng)歷爆發(fā)式增長(zhǎng),2023年市場(chǎng)規(guī)模為158億美元,預(yù)計(jì)到2030年規(guī)模將達(dá)到906億美元。

市場(chǎng)需求與商業(yè)收入在此形成良性循環(huán),推理需求越旺盛,企業(yè)營(yíng)收越高,進(jìn)而吸引更多資源投入,推動(dòng)技術(shù)迭代升級(jí)。這也不難理解,為何英偉達(dá)數(shù)據(jù)中心 40% 的收入都源自推理業(yè)務(wù)。

推理成本的大幅下降是市場(chǎng)增長(zhǎng)的最主要驅(qū)動(dòng)力之一,根據(jù)斯坦福大學(xué)2025年AI指數(shù)報(bào)告,在短短18個(gè)月內(nèi),AI推理成本從每百萬token 20美元暴跌至0.07美元,下降了280倍。硬件層面,企業(yè)AI硬件成本每年下降30%,能源效率每年提高40%。

算法優(yōu)化技術(shù)如量化、稀疏化和蒸餾等顯著降低了模型的計(jì)算復(fù)雜度和內(nèi)存需求。有資深投資人就曾向虎嗅表示,現(xiàn)在有效的互聯(lián)網(wǎng)數(shù)據(jù)存量已經(jīng)被使用得差不多了,它的更新是有限的,最終的增長(zhǎng)肯定是推理,推理是要把訓(xùn)練好的模型應(yīng)用到不同的場(chǎng)景。再加上MOE(專家混合模型架構(gòu))出現(xiàn),對(duì)于新的信息,只需要局部訓(xùn)練。所以最終爆發(fā)的市場(chǎng)肯定是推理,推理是要把訓(xùn)練好的模型應(yīng)用到不同的場(chǎng)景。


推理市場(chǎng)利潤(rùn)驚人、巨頭爭(zhēng)搶

摩根士丹利近期發(fā)布的一份深度報(bào)告,通過構(gòu)建精細(xì)的財(cái)務(wù)模型,揭示AI推理工廠的驚人利潤(rùn),將 AI 推理工廠的盈利密碼層層解開。

以 100 兆瓦電力消耗為標(biāo)尺,涵蓋基建、硬件與運(yùn)營(yíng)的全成本核算顯示,無論采用哪家巨頭的芯片方案,AI 推理工廠的平均利潤(rùn)率竟普遍突破 50%。其中,英偉達(dá) GB200 以 77.6% 的 “恐怖” 利潤(rùn)率笑傲群雄,盡管其搭載 72顆GB200芯片和NVL72系統(tǒng)售價(jià)高達(dá)300萬美元,但超高的利潤(rùn)回報(bào),仍讓科技巨頭們“眼紅”。

“生成式AI時(shí)代,只有英偉達(dá)賺到錢了?!币晃凰惴ㄈ耸扛嬖V虎嗅。

推理,是一份可以測(cè)算得出來的生意。當(dāng)訓(xùn)練端已被英偉達(dá)銅墻鐵壁牢牢穩(wěn)住,推理,反而具備了突破英偉達(dá)的可能性。推理對(duì)生態(tài)和性能的要求沒有訓(xùn)練苛刻,重點(diǎn)是性價(jià)比,也就是成本低,關(guān)鍵的是推理的暴利。

“天下苦英偉達(dá)已久?!敝饕獊碜詫?duì)英偉達(dá)CUDA生態(tài)的依賴,但推理對(duì)于CUDA生態(tài)系統(tǒng)的依賴通常比訓(xùn)練小一些。原因是,部署靈活性,因?yàn)橥评黼A段可以使用更多樣化的硬件和軟件平臺(tái),包括CPU、邊緣設(shè)備、WebGPU等,而不一定需要英偉達(dá)的CUDA環(huán)境,另外,訓(xùn)練過程需要大量的矩陣運(yùn)算、梯度計(jì)算和反向傳播,這些操作在CUDA上有高度優(yōu)化的實(shí)現(xiàn);而推理只需要前向傳播,計(jì)算量相對(duì)較小。

因此,科技巨頭選擇在推理端逐漸滲透英偉達(dá)雄霸的市場(chǎng)。

比如說,根據(jù)The Information報(bào)道,為了減少對(duì)英偉達(dá)的依賴,AWS向其客戶推銷租用自研推理芯片——Trainium提供支持的服務(wù)器,并提供了25%的折扣,這個(gè)服務(wù)器提供的計(jì)算能力與英偉達(dá)的H100芯片相當(dāng)。

虎嗅從硅谷科技公司人士、AWS的客戶處獲知,目前這款服務(wù)還沒有在AWS的客戶中廣泛推廣,主要是針對(duì)Anthropic,2023年亞馬遜宣布向這家人工智能初創(chuàng)公司投資40億美元并獲得部分股權(quán)。Anthropic發(fā)布Claude系列模型,使其躋身全球頭部領(lǐng)先模型公司行列。

今年6月,OpenAI也開始通過租用谷歌的TPU,降低推理計(jì)算的成本以及在推理側(cè)對(duì)英偉達(dá)的依賴。

盡管,業(yè)內(nèi)人士表示這并不是一蹴而就的過程,甚至現(xiàn)階段這個(gè)舉動(dòng)從外界看來只是“隔靴搔癢”,生態(tài)依然是最大的問題,這涉及背后一整個(gè)軟件棧的適配,但對(duì)于這些科技巨頭而言,這確實(shí)不得不開始做的一件事——沒人希望自己的錢都被英偉達(dá)掙了。


初創(chuàng)公司的“蠶食”

在 AI 推理市場(chǎng)的利潤(rùn)盛宴中,科技巨頭的博弈只是冰山一角,一眾初創(chuàng)公司更是摩拳擦掌,試圖分一杯羹。

隨著人工智能推理邁入高級(jí)學(xué)習(xí)和決策階段,對(duì)算力的需求呈現(xiàn)出多元化、精細(xì)化的特點(diǎn),通用 GPU 的靈活性優(yōu)勢(shì)不再是唯一選擇,新興的芯片初創(chuàng)公司另辟蹊徑,聚焦 AI 專用芯片(ASIC)的研發(fā)。相較于通用 GPU,ASIC 以更低的成本實(shí)現(xiàn)高效運(yùn)算,盡管應(yīng)用場(chǎng)景相對(duì)單一,但其在特定推理任務(wù)中的卓越性能,成為初創(chuàng)公司撬動(dòng)市場(chǎng)的支點(diǎn)。

在這場(chǎng)初創(chuàng)勢(shì)力的突圍戰(zhàn)中,Rivos 無疑是備受矚目的 “黑馬”。從戴爾、臺(tái)積電到英特爾、聯(lián)發(fā)科,眾多行業(yè)巨頭紛紛為其注資。據(jù)The Information援引知情人士的話,Rivos正在開發(fā)軟件,該軟件可以將英偉達(dá)的CUDA軟件代碼,翻譯成在Rivos的語言,在其芯片上高效運(yùn)轉(zhuǎn)。這意味著其芯片可無縫承接英偉達(dá)生態(tài)的軟件資源,極大降低用戶遷移成本。

除了Rivos,另一家英偉達(dá)的挑戰(zhàn)者Groq也在籌集資金。

虎嗅根據(jù)公開信息以及The Information上公布的人工智能芯片初創(chuàng)公司的名單,25家英偉達(dá)的挑戰(zhàn)者,一共從投資者那里籌集了超過70億美元的資金,總估值達(dá)到290億美元。

初創(chuàng)芯片公司Groq由前谷歌TPU團(tuán)隊(duì)成員成立,開發(fā)了獨(dú)特的語言處理單元(Language Processing Unit)架構(gòu),這是其最大的技術(shù)差異化優(yōu)勢(shì),專門針對(duì)AI推理任務(wù)進(jìn)行了優(yōu)化,號(hào)稱能提供"世界最快推理"性能。Groq提供了遠(yuǎn)低于傳統(tǒng)GPU的token處理成本的解決方案,這使其在推理市場(chǎng)具有明顯的經(jīng)濟(jì)優(yōu)勢(shì)。如今,Groq已從貝萊德、思科、三星等處累計(jì)籌集超過10億美元,并與沙特阿拉伯達(dá)成了價(jià)值15億美元的芯片合作協(xié)議,在英偉達(dá)滲透率還不算高的中東市場(chǎng)開始拓展自己的芯片生意。

Groq的CEO在一次播客采訪中也表示,英偉達(dá)可以制造他們?cè)疽圃斓拿恳粋€(gè)GPU,并將其用于高利潤(rùn)的訓(xùn)練業(yè)務(wù),而他們則可以接手低利潤(rùn)但高體量的推理業(yè)務(wù)。

還有的地方是英偉達(dá)的視線尚未看到的微小角落——比如一些邊緣側(cè),小型分散的推理需求正悄然爆發(fā)。例如從智能家居設(shè)備到智能穿戴產(chǎn)品,AI 智能硬件的廣泛應(yīng)用催生海量邊緣推理場(chǎng)景。

此外,一些新型算法架構(gòu)以及與之相結(jié)合所開發(fā)的芯片正在誕生。在過去幾年里,英偉達(dá)是“算力越大越好”(Scaling Law)敘事下,最大的受益者,其依靠這套暴力美學(xué),兜售其GPU。

只是Scaling Law到底是不是真正通往通用人工智能的道路?并沒有定論,起碼Meta首席人工智能科學(xué)家楊立昆(Yann LeCun),并不這么認(rèn)為,“我們不能使用像 ChatGPT 或 GPT4這樣的技術(shù)來訓(xùn)練機(jī)器人清理桌子或者填滿洗碗機(jī),即使這對(duì)一個(gè)孩子來說是一件微不足道的任務(wù),我們還是做不到?!?/p>

對(duì)于在生成式AI時(shí)代處于絕對(duì)壟斷地位的英偉達(dá)而言,GPU的“越多算力越好”的故事還能說多久,不好說,科技界永遠(yuǎn)在上演顛覆與被顛覆的故事。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4703507.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
隊(duì)史31年首進(jìn)決賽!河南點(diǎn)球4-3淘汰蓉城 王國(guó)明屢獻(xiàn)神撲+撲點(diǎn)

隊(duì)史31年首進(jìn)決賽!河南點(diǎn)球4-3淘汰蓉城 王國(guó)明屢獻(xiàn)神撲+撲點(diǎn)

直播吧
2025-08-19 22:30:13
領(lǐng)土交換爆猛料,440換6600平方公里,外媒:俄普京還有其他要求

領(lǐng)土交換爆猛料,440換6600平方公里,外媒:俄普京還有其他要求

派大星紀(jì)錄片
2025-08-19 16:08:27
賊心不死!劣跡藝人趙薇走投無路,15歲女兒成她的最后一根稻草

賊心不死!劣跡藝人趙薇走投無路,15歲女兒成她的最后一根稻草

泠泠說史
2025-08-16 16:36:50
房地產(chǎn)釋放重要信號(hào),決定先不賣房子了

房地產(chǎn)釋放重要信號(hào),決定先不賣房子了

恪守原則和底線
2025-08-19 10:34:09
白宮對(duì)決,澤連斯基打了一場(chǎng)漂亮的外交戰(zhàn)

白宮對(duì)決,澤連斯基打了一場(chǎng)漂亮的外交戰(zhàn)

史政先鋒
2025-08-19 16:18:25
這兩件事,何止是吃相的問題

這兩件事,何止是吃相的問題

清書先生
2025-08-19 15:07:53
貴州男子在離婚冷靜期毒殺兒女,作案前帶娃吃飯稱“最后的狂歡”,孩子母親:希望法院嚴(yán)懲

貴州男子在離婚冷靜期毒殺兒女,作案前帶娃吃飯稱“最后的狂歡”,孩子母親:希望法院嚴(yán)懲

極目新聞
2025-08-19 17:33:21
71歲的美國(guó)衛(wèi)生部長(zhǎng),在6分鐘內(nèi)完成了100個(gè)俯臥撐和50個(gè)引體向上

71歲的美國(guó)衛(wèi)生部長(zhǎng),在6分鐘內(nèi)完成了100個(gè)俯臥撐和50個(gè)引體向上

爆角追蹤
2025-08-19 23:11:26
開業(yè)第一天就閉店!人多到崩潰,補(bǔ)償方案公布!網(wǎng)友炸鍋:有這個(gè)必要嗎......

開業(yè)第一天就閉店!人多到崩潰,補(bǔ)償方案公布!網(wǎng)友炸鍋:有這個(gè)必要嗎......

FM93浙江交通之聲
2025-08-19 11:07:26
被特朗普晾了40分鐘,馮德萊恩甩臉離場(chǎng),準(zhǔn)備的午飯一口沒動(dòng)

被特朗普晾了40分鐘,馮德萊恩甩臉離場(chǎng),準(zhǔn)備的午飯一口沒動(dòng)

觀點(diǎn)多一度
2025-08-19 18:04:04
曾經(jīng)紅極一時(shí)的"按輩分取名",為什么現(xiàn)在卻不流行了呢?過時(shí)了?

曾經(jīng)紅極一時(shí)的"按輩分取名",為什么現(xiàn)在卻不流行了呢?過時(shí)了?

以茶帶書
2025-08-19 14:34:41
定了!千億美元買安全,澤連斯基最終松口,普京同意做出重大讓步

定了!千億美元買安全,澤連斯基最終松口,普京同意做出重大讓步

梁訊
2025-08-19 20:49:05
中方是否認(rèn)為有可能在中國(guó)舉行普京和澤連斯基會(huì)晤?外交部回應(yīng)

中方是否認(rèn)為有可能在中國(guó)舉行普京和澤連斯基會(huì)晤?外交部回應(yīng)

環(huán)球網(wǎng)資訊
2025-08-19 15:47:01
我今年70歲,發(fā)現(xiàn)退休金高的老年人,比存款多的老年人活得自在

我今年70歲,發(fā)現(xiàn)退休金高的老年人,比存款多的老年人活得自在

蟬吟槐蕊
2025-08-19 10:31:45
我曾盼望退休享福,退休后卻發(fā)現(xiàn):50歲后的20年,才是苦難的開始

我曾盼望退休享福,退休后卻發(fā)現(xiàn):50歲后的20年,才是苦難的開始

小馬達(dá)情感故事
2025-08-19 18:20:03
鬧大了!續(xù)面飯店遭百人圍堵,警方還原真相,鍋里尿尿是冰山一角

鬧大了!續(xù)面飯店遭百人圍堵,警方還原真相,鍋里尿尿是冰山一角

娛樂看阿敞
2025-08-19 14:32:25
3個(gè)月薪資2萬!蘋果手機(jī)生產(chǎn)旺季,每天上千人進(jìn)入富士康

3個(gè)月薪資2萬!蘋果手機(jī)生產(chǎn)旺季,每天上千人進(jìn)入富士康

第一財(cái)經(jīng)資訊
2025-08-19 20:33:15
事發(fā)上海外灘!24人被抓現(xiàn)行,累計(jì)400余人被行政處罰

事發(fā)上海外灘!24人被抓現(xiàn)行,累計(jì)400余人被行政處罰

FM93浙江交通之聲
2025-08-19 17:15:49
Win10/Win11均中招,多個(gè)SSD直接“報(bào)廢”了

Win10/Win11均中招,多個(gè)SSD直接“報(bào)廢”了

電腦報(bào)
2025-08-19 18:11:58
泰國(guó)再出狠招,發(fā)現(xiàn)洪森父子立即逮捕,不到24小時(shí)洪瑪奈宣布訪華

泰國(guó)再出狠招,發(fā)現(xiàn)洪森父子立即逮捕,不到24小時(shí)洪瑪奈宣布訪華

愛史紀(jì)
2025-08-19 22:55:44
2025-08-20 04:35:00
虎嗅APP incentive-icons
虎嗅APP
個(gè)性化商業(yè)資訊與觀點(diǎn)交流平臺(tái)
24761文章數(shù) 686679關(guān)注度
往期回顧 全部

科技要聞

小米二季度營(yíng)收創(chuàng)新高至1160億元

頭條要聞

特朗普:普京已經(jīng)厭倦了 他們都厭倦了

頭條要聞

特朗普:普京已經(jīng)厭倦了 他們都厭倦了

體育要聞

河南連場(chǎng)淘汰申花蓉城 兩門將接力2戰(zhàn)5撲點(diǎn)

娛樂要聞

李雪琴和男友KTV約會(huì),笑得很甜

財(cái)經(jīng)要聞

董宇輝一年到底能賺多少錢?

汽車要聞

蔚來100kWh長(zhǎng)續(xù)航電池包價(jià)格調(diào)整 下調(diào)至10.8萬元

態(tài)度原創(chuàng)

教育
時(shí)尚
旅游
家居
藝術(shù)

教育要聞

8月16日雅思大作文示范寫作 | 久坐的成因以及解決方式

俺不中了,《生萬物》是真人版斗地主?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

家居要聞

簡(jiǎn)約風(fēng)格 享受家的安寧

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進(jìn)入關(guān)懷版 精品九九九九黑人人妻蜜臀夜夜嗨| 仑理片一区二区| 国产乱交在线播放| 成人在线毛片视频| 色欲αv一区二区三区天美传媒| H无遮挡无码| 亚洲国产精品一区二区成人片不卡| 国产精品无套视频免费观看| 国产精品免费无码二区| 亚洲国产成人乱码| 福利小视频在线免费观看| 成人网站在线进入爽爽爽 | 色咪咪肉伦AV| 99热最新网址| 噜噜高清欧美短视频| 亚洲图片欧美激情| 成年永久一区二区三区免费视频| 精品人妻子洗澡| 国产一区二区不卡91| 亚洲国产精品久久无码中文字| 久久精品国产国产精| 伊人春色免费视频| 国产老头视频| 蜜臀久久99精品久久久酒店新书| 777 中文字幕| 国产放荡AV剧情演绎麻豆| 亚洲乱伦视频| 一区二区三区免费视频播放器| 少妇大战二十8厘米黑人| 精品无码久久久久久| 熟女被干流白浆| www,欧美性爱,con| 波多野结系列18部无码观看AV| 性色av色香蕉一区二区三区| 人妻av综合天堂一区| 澳门αⅴ无码| 明星性猛交ⅹxxx乱大交| 高潮呻吟久久AV无码桃色| 日韩无乱码高清免费视频| 狠狠躁日日躁夜夜躁| 久久久久亚洲AV成人|