2025 年 9 月 25 日,英偉達創(chuàng)始人黃仁勛戴著標志性紅色眼鏡,現(xiàn)身 Bg2 Pod 播客節(jié)目,與布拉德?格斯特納、克拉克?唐展開一場超百分鐘深度對話。作為全球 AI 產(chǎn)業(yè)的 “風向標” 人物,黃仁勛此次直面行業(yè)爭議,從技術(shù)革命、市場前景到全球競爭格局,拋出諸多重磅觀點,為 AI 產(chǎn)業(yè)發(fā)展畫像。
一年前,他提出 “AI 推理增長將達十億倍” 的預判,如今卻坦言 “當時仍低估了”。對話中,他詳解預訓練、后訓練與推理三大規(guī)模定律,指出 AI 已從單一語言模型進化為多模態(tài)協(xié)同系統(tǒng),“鏈式推理” 開啟產(chǎn)業(yè)新局。對于 OpenAI,他直言其有望成為下一個萬億美元巨頭,英偉達與其合作將助力其搭建自營 AI 基礎設施,把握 “雙重指數(shù)級增長” 機遇。
面對 “2027 年增長趨緩”“2026 年產(chǎn)能過?!?等質(zhì)疑,黃仁勛態(tài)度堅決:通用計算時代已落幕,加速計算與 AI 遷移是必然趨勢,全球數(shù)萬億美元計算基礎設施待升級,5 萬億美元 AI 基礎設施年支出目標合理。他還拆解英偉達競爭壁壘,強調(diào) “極致協(xié)同設計” 與 “規(guī)模效應” 的核心作用,披露年度芯片迭代背后的技術(shù)邏輯。
談及中國科技,黃仁勛打破偏見,盛贊中國高科技產(chǎn)業(yè)活力與制造能力,稱 “中國僅慢納秒”,呼吁以開放競爭推動全球產(chǎn)業(yè)發(fā)展。最后,他描繪 AI 與機器人融合的未來圖景,警示行業(yè) “搭上指數(shù)級增長的 AI 列車,方能把握機遇”。這場對話,既是對 AI 產(chǎn)業(yè)現(xiàn)狀的深度復盤,更是對未來五年技術(shù)革命的清晰展望。以下,Enjoy:
來源:聰明投資者
排版:關鶴九
責編:艾暄
9月25日,英偉達創(chuàng)始人黃仁勛戴著顯眼的紅色眼鏡,到Bg2 Pod做了一場播客對話,時長超過100分鐘。
而去年10月4日,同樣的兩個主持人布拉德·格斯特納(Brad Gerstner)和克拉克·唐(Clark Tang)還走進英偉達總部,跟黃仁勛暢聊80分鐘。
當時黃仁勛提出了一個被廣泛引用的觀點:AI的真正爆發(fā)點不是訓練,而是推理,而且推理的增長幅度將是“十億倍”。
一年之后,他說,“其實當時還是低估了”。
這次訪談,是黃仁勛眾多頻繁演講交流中比較深入的一次,而且直面了市場近期最關心的爭議。
比如,英偉達既是OpenAI的投資者,又是其重大供應商,似乎形成了某種“循環(huán)收入”?比如,未來供給擴張過快,2026年會不會出現(xiàn)產(chǎn)能過剩?以及英偉達的護城河究竟有多深?
黃仁勛直面所有問題。
“我們的股權(quán)投資不與采購掛鉤,它只是一次押注未來巨頭的機會?!?/strong>
“我認為OpenAI很可能會成為下一個萬億美元市值的超大規(guī)模公司。如果真是這樣,那么在它成長到那個規(guī)模之前進行投資,就是我們能想到的最明智的決策之一。”
“所以如果有人告訴我,未來全球每年的AI基礎設施資本支出將達到5萬億美元,我會覺得這個數(shù)字完全合理。”
“在通用計算全面完成向加速計算和AI的遷移之前,我認為出現(xiàn)供過于求的可能性極低。這還需要幾年時間。”
“極致協(xié)同設計的核心,就是同時優(yōu)化模型、算法、系統(tǒng)和芯片。摩爾定律時代,你只要讓CPU變快,一切就會自然提速。但當芯片性能停滯,你必須跳出框架創(chuàng)新。這就是英偉達改變游戲規(guī)則的地方。”
“外界對我們有誤解,仍然停留在‘英偉達是一家芯片公司’的印象里。沒錯,我們造芯片,而且是世界最頂尖的芯片。但英偉達的本質(zhì)是一家AI基礎設施公司。”
“壁壘在于兩點:協(xié)同設計的極致性和規(guī)模的極致性。”
他還談到密切的合作伙伴埃隆·馬斯克,盛贊說,“埃隆的巨大優(yōu)勢在于,他能在一個人的大腦里整合并處理這些相互依賴的復雜系統(tǒng),甚至包括融資。他本身就是一個巨大的GPT,一臺超級計算機,是終極的GPU”。
而談到中國時,黃仁勛的贊美一如既往,明確表示:這是一個充滿活力、富有創(chuàng)業(yè)精神的高科技產(chǎn)業(yè)環(huán)境,現(xiàn)代化程度很高。他甚至說,“他們只比我們慢了‘納秒’而已”。
面向未來,黃仁勛描繪了一張藍圖:“我認為在未來五年內(nèi),會有一件特別酷的事情發(fā)生:人工智能將與機電一體化、機器人技術(shù)真正融合?!?/p>
可以想象的是,“每個人都能擁有自己的R2-D2”。是的,就是星球大戰(zhàn)中那個陪伴了多個天行者的聰明活潑的忠誠伙伴。
聽下來緊迫感很強,而這列火車正在指數(shù)級加速。黃仁勛的提醒是,“最聰明的做法,就是在它還沒快到無法企及之前,趕緊上車,和它一起加速前進?!?/p>
全文很長,認真讀了好幾遍,聰明投資者(ID: Capital-nature)把大家可能最關注的幾個話題整理出來,mark并分享下。
01
推理革命的增長將是十億倍量級
格斯特納如今你超過40%的收入來自推理業(yè)務。而真正的推理革命,也就是“鏈式推理”,才剛剛拉開序幕,對嗎?
黃仁勛它的增長將會是十億倍。我們不只是面對一個行業(yè)的增長,而是站在一場全新的工業(yè)革命前夜。
格斯特納大約一年半前,大家在預訓練領域情緒有些悲觀,很多人說:“糟了,預訓練到頭了,我們投得太多了?!笨赡銋s說:“推理的增長不是一百倍、一千倍,而是十億倍?!?/b>
黃仁勛我得承認,其實我當時還是低估了。
現(xiàn)在我們已經(jīng)清楚有三條規(guī)模定律:預訓練規(guī)模定律、后訓練規(guī)模定律,以及推理規(guī)模定律。
所謂“后訓練”,本質(zhì)上就像AI在練習一項新技能。它會不斷嘗試各種方法,直到做對為止。而要做到這一點,就必須依賴推理。
今天的強化學習,其實已經(jīng)把訓練和推理完全融合在一起,這讓整個過程變得更加復雜,而這就是所謂的“后訓練”。
過去的推理是一種“一次性”的過程。但今天我們強調(diào)的是新的推理方式,讓模型在給出答案之前先“思考”。
一個模型“思考”的時間越長,答案的質(zhì)量就越高。在這個思考過程中,它可以查資料,核實事實,學習新知識。再思考,再學習,最后生成答案。
關鍵在于,不要急于給出第一個答案。
所以,真正推動AI演進的,并不只是單一的預訓練,而是預訓練、后訓練和推理三者共同作用。
格斯特納和一年前相比,你現(xiàn)在是不是對“推理會實現(xiàn)十億倍增長”、以及“這種增長會把智能推向怎樣的新高度”更有信心了?
黃仁勛我今年的信心更足,看看如今的AI代理系統(tǒng)就知道了。
AI已經(jīng)不再是單一的語言模型,而是一個由多個模型組成的系統(tǒng)。它們可以同時運行,調(diào)用工具,做研究,處理各種任務,而且都是多模態(tài)的。
02
OpenAI很可能會成為下一個“萬億美元巨頭”
格斯特納幾天前,你宣布了與OpenAI的Stargate項目達成重大合作。能否談談這次合作對你意味著什么?以及為什么你認為這對NVIDIA來說是明智之舉?
黃仁勛我先回答最后一個問題,再展開說。
我認為OpenAI很可能會成為下一個萬億美元市值的超大規(guī)模公司。因為它和Meta、谷歌一樣,既有面向消費者的服務,又有面向企業(yè)的業(yè)務。這樣的雙重布局,讓它極有可能成為全球下一個萬億級巨頭。
如果真是這樣,那么在它成長到那個規(guī)模之前進行投資,就是我們能想到的最明智的決策之一。
投資必須投在自己熟悉的領域,而這恰好是我們的核心專長。而且他們愿意讓我們參與,這非常難得。
我們和OpenAI已經(jīng)在多個層面合作。這次新合作特別之處在于,OpenAI第一次決定自建AI基礎設施。
這意味著,我們會直接在芯片、軟件、系統(tǒng)乃至“AI工廠”層面與他們合作,幫助OpenAI成為一個完全自營的超大規(guī)模公司。
這個過程會持續(xù)相當長的時間。這背后是他們正在經(jīng)歷的“雙重指數(shù)級增長”。
第一個指數(shù)增長來自用戶數(shù)。因為AI的效果越來越好,應用場景越來越多,幾乎所有應用都在接入OpenAI,導致使用量爆炸式增加。
第二個指數(shù)增長來自單次使用的計算量。過去AI是“一次性”推理,現(xiàn)在則需要經(jīng)過“思考”才能給出答案。
格斯特納你剛才提到“OpenAI極有可能成為萬億美元公司”,在此之前,他們的數(shù)據(jù)中心建設主要依賴微軟,而現(xiàn)在,他們希望掌握完整的技術(shù)棧。
黃仁勛對,就像自己建工廠一樣。他們希望和我們建立一種類似埃隆與X的關系,走向自主建設。
03
未來屬于加速計算和人工智能
格斯特納華爾街25位負責研究英偉達的賣方分析師,他們的共識預測卻是英偉達的增長將在2027年趨緩,到2030年的年增速只有8%。
黃仁勛我們很清楚,但這沒關系。我們一直以來都能超越他們的預期。
格斯特納這種觀點部分源于擔心:當下的短缺最終會帶來未來的產(chǎn)能過剩。他們或許相信2026年的增長,但對2027年以后的情況心存疑慮,認為市場可能飽和。
黃仁勛我倒不覺得這是矛盾。我從三個角度來解釋下:
第一點,也是最根本的一點,是基于物理定律的必然趨勢:通用計算的時代已經(jīng)結(jié)束,未來屬于加速計算和人工智能。
你可以這樣想:全球價值數(shù)萬億美元的計算基礎設施,有多少需要更新?lián)Q代?
所有人都同意摩爾定律已死,通用計算的效率瓶頸已現(xiàn)。下一步必然是從通用計算轉(zhuǎn)向加速計算。我們和英特爾的合作正是基于這個共識,通用計算必須和加速計算結(jié)合,這反而給他們帶來了新機會。
第二點,人工智能的第一個落地場景其實早已無處不在,比如搜索、推薦引擎和電商。
過去,超大規(guī)模計算的基礎設施主要是CPU,用來支撐推薦系統(tǒng);未來,它將轉(zhuǎn)向GPU,為人工智能服務。
你只要看看傳統(tǒng)計算和超大規(guī)模計算的遷移方向,它們正在從CPU向加速計算與AI轉(zhuǎn)移。支持Meta、谷歌、字節(jié)跳動、亞馬遜等公司完成這一轉(zhuǎn)型,就是一個數(shù)千億美元的市場。
格斯特納光是考慮TikTok、Meta、谷歌服務的40億用戶,就已經(jīng)產(chǎn)生了巨大的算力需求。
黃仁勛沒錯,這一切都是由加速計算的變革驅(qū)動的。即便不算AI帶來的新應用,僅僅是AI改變現(xiàn)有工作方式這一點,就足夠龐大。
到目前為止我講的都只是基礎。就像煤油燈被電燈取代,螺旋槳飛機被噴氣機取代,舊模式終將被淘汰,這很簡單。
真正令人震撼的是,當我們進入AI與加速計算的時代,會誕生哪些全新的應用?這就是生成式AI的機會。
這個機會有多大?你可以類比馬達取代體力勞動,而今天我們有了人工智能。我稱之為“AI工廠”。這些AI超級計算機會不斷生成token,用來增強人類智能。
人類智能對全球GDP的貢獻有多大?大約55%到65%,差不多50萬億美元。
這50萬億美元的經(jīng)濟活動,未來都將被AI增強。
回到個人層面,假設我花1萬美元為一位年薪10萬美元的員工配一套AI系統(tǒng),能讓他的生產(chǎn)力提升一倍甚至兩倍,我會不會這么做?答案是肯定的。
在英偉達,我們的每一位軟件工程師、每一位芯片設計師,都已經(jīng)在用AI協(xié)作。覆蓋率是100%!
這意味著我們設計更多芯片,迭代更快,公司整體增長也更快。我們雇傭更多的人,效率更高,收入和利潤都更高。為什么不呢?
現(xiàn)在,把英偉達的故事放大到全球GDP。
AI和過去的IT最大的不同在于:過去軟件是提前寫好的,運行在CPU上,需要人去操作;未來,AI會持續(xù)生成“通證”,機器必須不停思考才能生成。
軟件將永遠在線運行,而不是一次性寫好。為了讓AI思考,就需要一個“工廠”。
假設未來AI生成了10萬億美元的token價值,毛利率是50%,那么就需要一個價值5萬億美元的“AI工廠”——也就是AI基礎設施來支撐。
所以如果有人告訴我,未來全球每年的AI基礎設施資本支出將達到5萬億美元,我會覺得這個數(shù)字完全合理。
這就是未來:從通用計算轉(zhuǎn)向加速計算,用AI重塑所有超大規(guī)模計算,并最終增強人類智能。
格斯特納我們估算,目前這個市場的年規(guī)模大約是4000億美元。照此計算,未來的潛在市場規(guī)模(TAM)比現(xiàn)在要高出四到五倍。
黃仁勛沒錯。阿里巴巴的吳泳銘(Eddie Wu)昨天還說,到這個十年末,他們數(shù)據(jù)中心的電力容量會增加10倍。你想想看,他們的電力翻十倍,而英偉達的收入幾乎與電力消耗成正比。
他還提到另一點:token的生成速度每隔幾個月就會翻倍。
這意味著什么?意味著每瓦性能必須持續(xù)呈指數(shù)級提升,這也是我們不斷推出更高性能產(chǎn)品的原因。同樣,每瓦帶來的收入也會隨之提升。未來,“瓦特”幾乎就等同于收入。
格斯特納你所描繪的,實際上是這樣的場景:全球GDP的增長即將再次提速,因為我們將擁有數(shù)十億AI“同事”為我們工作。如果GDP是勞動力和資本投入的產(chǎn)出,那么它必然會加速。
黃仁勛是必然的??纯?b>AI領域正在發(fā)生什么。大語言模型、AI代理的崛起,正催生一個全新的產(chǎn)業(yè)。OpenAI已經(jīng)是歷史上營收增長最快的公司,而且還在指數(shù)級增長。
因此,AI本身就是一個高速成長的產(chǎn)業(yè)。而支撐它的,是“工廠”和基礎設施,這也意味著我們的產(chǎn)業(yè)在成長。而且,下游產(chǎn)業(yè)同樣在成長。
能源行業(yè)就是一個例子。無論是核能還是燃氣輪機,正在迎來新一輪復興。
再看看我們基礎設施生態(tài)系統(tǒng)中的公司,幾乎所有人都在增長。
04
供過于求的可能性要到幾年以后
格斯特納當然,這些龐大的數(shù)字也引發(fā)了爭論——會不會出現(xiàn)“供過于求”或者“泡沫”?扎克伯格上周在播客里就說,未來某個時點很可能出現(xiàn)需求的“真空期”,Meta可能在某些領域會超投100億美元。但他認為這是可以接受的,因為這是關乎未來的必要風險。這聽起來有點像“囚徒困境”,不是嗎?
黃仁勛但他們都是“快樂的囚徒”。
格斯特納能展開說說嗎?我們估算,到2026年,AI相關收入將達到1000億美元,這還不包括Meta,也不包括推薦引擎、搜索等現(xiàn)有業(yè)務的AI化部分。
黃仁勛就算是1000億美元吧。但整個超大規(guī)模計算行業(yè)的體量是數(shù)萬億美元。而且要記住,這個行業(yè)正在全面轉(zhuǎn)向AI。
在任何人創(chuàng)造新市場之前,你必須先把這塊基數(shù)算進去。
格斯特納懷疑論者會說,要支撐你的論點,我們需要看到AI收入從2026年的1000億美元,增長到2030年至少1萬億美元。你真的認為未來五年能有這樣的速度嗎?
黃仁勛我認為我們其實已經(jīng)做到了。
超大規(guī)模公司們已經(jīng)完成了從CPU到AI的轉(zhuǎn)型,它們的收入基礎如今完全依賴AI。
沒有AI,TikTok無法運行;沒有AI,YouTube Shorts無法運行;沒有AI,Meta的個性化內(nèi)容也不可能實現(xiàn)。過去很多依賴人工的環(huán)節(jié),現(xiàn)在都交給AI了。
過去,內(nèi)容是預先寫好的,推薦引擎只是從有限的選項里挑選。而現(xiàn)在,AI能夠生成無限的可能。
格斯特納但推薦引擎正是我們經(jīng)歷CPU向GPU過渡的關鍵驅(qū)動。在過去三四年,它們也一直在演進。
黃仁勛沒錯。不過扎克伯格自己也承認,Meta在GPU應用上的確有點遲緩。GPU對Meta來說才是一兩年的新事物。
至于搜索,是不是也用上了GPU?當然,這更是全新的變革。
格斯特納所以你的意思是,到2030年AI收入達到1萬億美元幾乎是板上釘釘?shù)氖?,因為我們實際上已經(jīng)接近目標。你覺得在未來三到五年內(nèi),出現(xiàn)供過于求的概率有多大?
黃仁勛在通用計算全面完成向加速計算和AI的遷移之前,我認為出現(xiàn)供過于求的可能性極低。這還需要幾年時間。
我再補充一點:直到所有推薦引擎都基于AI,直到所有內(nèi)容生成都基于AI——而消費者內(nèi)容的生成本質(zhì)上依賴推薦系統(tǒng),這些傳統(tǒng)上屬于超大規(guī)模計算的應用,包括購物、電商等,都將被AI重塑。
格斯特納但這些新建設項目,涉及的投資是以萬億計。是不是意味著你們必須無條件地持續(xù)投入?即便經(jīng)濟放緩,或者出現(xiàn)某種過剩,你們也得繼續(xù)砸錢嗎?
黃仁勛實際情況正好相反。我們在供應鏈的最末端,是對需求做出響應?,F(xiàn)在,所有投資人都清楚,全球普遍存在算力短缺。
這并不是GPU產(chǎn)能不足,而是需求一直被低估。如果客戶下單,我們就會生產(chǎn)。
過去幾年,我們已經(jīng)全面梳理過供應鏈。從晶圓廠到封裝,再到HBM內(nèi)存,都已做好準備。如果需求翻倍,我們也能隨時翻倍產(chǎn)出。所以供應鏈不是問題。
我們現(xiàn)在只等需求信號。當云服務商、超大規(guī)模數(shù)據(jù)中心、客戶們制定年度計劃并給出預測時,我們就據(jù)此生產(chǎn)。
但迄今為止,所有的預測都被證明偏低。所以我們一直處在追趕狀態(tài)。
這種追趕已經(jīng)持續(xù)好幾年。我們收到的每份預測,都比去年顯著增加,但實際需求仍然會超過它們。
格斯特納你是否看到,一些傳統(tǒng)的超大規(guī)模數(shù)據(jù)中心運營商現(xiàn)在都在加大投入……
黃仁勛這是因為“第二波指數(shù)級增長”來了。第一波是AI的普及和使用量的指數(shù)上升;第二波則是推理的應用爆發(fā)。
一些超大規(guī)??蛻?,他們的內(nèi)部工作負載非常龐大,必須從通用計算轉(zhuǎn)向加速計算,所以消化產(chǎn)能沒問題;另一些客戶的工作負載更復雜多樣,因此一開始對需求的判斷比較猶豫。
但現(xiàn)在大家都明白了:他們嚴重低估了所需的算力。
我最看好的一類應用就是傳統(tǒng)數(shù)據(jù)處理——包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。我們很快會宣布一個重大計劃,把數(shù)據(jù)處理全面加速化。
要知道,目前全球絕大多數(shù)的數(shù)據(jù)處理還是跑在CPU上:Databricks、Snowflake的負載大部分是CPU,甲骨文的SQL處理也一樣。幾乎所有人都用CPU做SQL查詢。
未來,這些都會由AI來完成。
這是一個巨大而開放的市場。對英偉達來說,這需要一個完整的加速層,以及針對特定領域的數(shù)據(jù)處理庫和方法,我們必須把它們構(gòu)建出來。
05
英偉達股權(quán)投資只是為押注未來巨頭的機會
格斯特納也有一些反對聲音。CNBC在談論過剩和泡沫;彭博討論的是“資金循環(huán)”和“循環(huán)收入”。
所以當你們或微軟、亞馬遜投資的公司,同時又是你們的大客戶,比如你們投資了OpenAI,而OpenAI又向你們采購數(shù)百億美元的芯片……請告訴我們,分析師們擔心的“循環(huán)收入”問題,到底錯在哪?
黃仁勛10吉瓦的算力,大約價值4000億美元。而這4000億必須由他們真實的銷售和收入來支撐,而這些收入正在呈指數(shù)級增長。
資金來源無非三種:資本金、股權(quán)融資和債務融資。他們能拿到多少資金,取決于市場對他們維持收入能力的信心。聰明的投資人和貸款人會綜合考量,這就是他們的商業(yè)模式。
這和我們沒關系。
當然,我們必須與他們保持緊密聯(lián)系,確保能支持他們的持續(xù)擴張。但這屬于收入邏輯,而不是投資邏輯。
我們的股權(quán)投資不與采購掛鉤,它只是一次押注未來巨頭的機會。正如我之前說過的,這些公司極有可能成為下一個萬億美元級的超大規(guī)模企業(yè)。
誰不想投資這樣的公司呢?我唯一的遺憾是,當他們早期邀請我們投資時,我們因為資金有限,投得太少了。
真希望當時能把所有的錢都投進去。
格斯特納而現(xiàn)實是,如果你們的產(chǎn)品不夠好,比如Vera Rubin芯片性能不佳,他們完全可以去買別的芯片。他們沒有義務必須用英偉達的產(chǎn)品。而且正如你說的,這只是一次機會性的股權(quán)投資。
黃仁勛沒錯。但我們確實做了幾筆很棒的投資,比如xAI和CoreWeave。事后看,這些都非常明智。
06
英偉達的競爭壁壘
格斯特納2024年,你們從Hopper芯片開始切換到年度發(fā)布周期;2025年的Grace Blackwell帶來了大規(guī)模升級,迫使數(shù)據(jù)中心進行全面改造;2026年下半年將是Vera Rubin,2027年是Ultra,2028年是Feynman。
這個年度節(jié)奏目前進展如何?主要目標是什么?英偉達內(nèi)部的AI是否在其中發(fā)揮了作用?
黃仁勛沒有AI,英偉達不可能做到今天這樣的速度、節(jié)奏和規(guī)模。我們所有的進展都依賴AI。
為什么要采用年度發(fā)布?因為token的生成速度正在以指數(shù)級增長,客戶的使用量也在以指數(shù)級增長。像ChatGPT上線還不到兩年,周活躍用戶已經(jīng)接近8億。
格斯特納而且每個用戶都在生成更多token,因為推理時花費的思考時間更長。
黃仁勛對。這其實是兩條指數(shù)曲線疊加的結(jié)果。如果性能不能以同樣的速度提升,token生成的成本就會持續(xù)攀升。
摩爾定律已經(jīng)停滯,晶體管的成本和能效改進幾乎為零。除非有新的系統(tǒng)性創(chuàng)新,否則局面無解。
幾分點的折扣根本彌補不了性能鴻溝。唯一的辦法,就是每年實現(xiàn)數(shù)量級的性能躍遷。
晶體管的紅利已經(jīng)消失,我們必須在系統(tǒng)層面徹底重構(gòu),打破所有邊界,重新設計芯片、軟件棧和系統(tǒng)。
這就是所謂的極致協(xié)同設計。從未有人在如此高的層面上做過這樣的整合。
格斯特納能簡單解釋一下“極致協(xié)同設計”嗎?
黃仁勛極致協(xié)同設計的核心,就是同時優(yōu)化模型、算法、系統(tǒng)和芯片。
摩爾定律時代,你只要讓CPU變快,一切就會自然提速。但當芯片性能停滯,你必須跳出框架創(chuàng)新。
這就是英偉達改變游戲規(guī)則的地方。
我們做了兩件事:發(fā)明了CUDA和GPU,并提出了大規(guī)模協(xié)同設計的理念。
因此,我們進入了如此多的行業(yè),構(gòu)建了龐大的庫并進行聯(lián)合優(yōu)化。從技術(shù)棧到數(shù)據(jù)中心層面,涵蓋交換機、網(wǎng)絡、軟件、NIC、橫向擴展、縱向擴展,全都整合。
結(jié)果就是,從Hopper到Blackwell實現(xiàn)了30倍性能提升,這是任何摩爾定律都無法做到的。這就是“極致”。
而能做到這一點,還因為我們有最豐富的軟件和人才積累。
英偉達向世界貢獻的開源軟件比幾乎任何公司都多,覆蓋AI、圖形學、數(shù)字生物學、自動駕駛等領域。這些龐大的軟件資源,讓我們真正能夠執(zhí)行深度而極致的協(xié)同設計。
格斯特納我聽到你的一位競爭對手說,英偉達的年度發(fā)布周期不僅能持續(xù)降低Token生成成本,還讓對手們根本追不上。因為你們?yōu)楣溙峁┝碎L達三年的路線圖,使整個供應鏈更有黏性和信心去規(guī)劃未來的產(chǎn)能。
黃仁勛在提這個問題之前,可以先想一想:要支撐每年數(shù)千億美元的AI基礎設施建設,我們需要提前一年投入多少資源?
僅在晶圓和DRAM的采購上,就得花掉數(shù)百億美元。這個規(guī)模幾乎沒有哪家公司能做到。
格斯特納那么你會說,你們的競爭壁壘比三年前更牢固了嗎?
黃仁勛競爭比以往任何時候都激烈,但進入這個賽道的門檻也比任何時候都高。
因為晶圓成本不斷上漲,如果不進行大規(guī)模協(xié)同設計,就根本不可能實現(xiàn)數(shù)量級的性能跨越。
壁壘在于兩點:協(xié)同設計的極致性和規(guī)模的極致性。當客戶要部署1吉瓦的算力時,意味著需要40萬到50萬塊GPU。
讓幾十萬塊GPU協(xié)同運轉(zhuǎn),本身就是奇跡??蛻舯仨氃谖覀兩砩舷伦ⅰ?/p>
你要反問自己:什么樣的客戶會在一款尚未經(jīng)過市場驗證的架構(gòu)上,提前下500億美元的訂單?再問,作為供應商,你為什么要為一款剛剛完成設計的芯片,提前投產(chǎn)價值500億美元的晶圓?
對英偉達來說,這能實現(xiàn),因為我們的架構(gòu)已經(jīng)被反復驗證過。客戶的規(guī)模巨大,供應鏈也必須匹配這種規(guī)模。
沒有對我們交付能力的絕對信任,任何一家公司都不會愿意提前為你生產(chǎn)如此龐大的零部件訂單。
他們愿意一次性拉動數(shù)千億美元的生產(chǎn)計劃,這種信任和規(guī)模本身就是壁壘。
格斯特納站在第一性原理的角度,我會問:你們是在拓寬,還是在縮窄自己的護城河?
黃仁勛我會說,我們的機遇,遠比市場普遍認知的要大得多。
外界對我們有誤解,仍然停留在“英偉達是一家芯片公司”的印象里。沒錯,我們造芯片,而且是世界最頂尖的芯片。
但英偉達的本質(zhì)是一家AI基礎設施公司,我們是客戶的AI基礎設施合作伙伴。與OpenAI的合作就是明證。
我們與客戶合作方式非常靈活,不要求他們必須買全套,也不要求買整個機柜。他們可以只買一顆芯片,一個組件,或者只買我們的網(wǎng)絡設備。
有些客戶只買CPU,或者只買GPU,再配其他廠商的CPU或網(wǎng)絡設備,我們完全接受。
無論怎樣,我唯一的請求是:總得從我們這兒買點東西。(笑)
格斯特納你說過,AI不僅關乎更好的模型,更需要世界級的“建設者”。在我看來,這個國家最頂尖的建設者也許就是埃隆·馬斯克。
黃仁勛如果他第一個建成吉瓦級的超算,我一點都不會意外。
格斯特納請談談“建設者”的優(yōu)勢。
黃仁勛這些AI超級計算機是極其復雜的系統(tǒng)。
技術(shù)復雜,融資復雜,土地、電力、機房和供電同樣復雜。把所有這些整合并運行起來,這是人類歷史上最復雜的系統(tǒng)工程之一。
埃隆的巨大優(yōu)勢在于,他能在一個人的大腦里整合并處理這些相互依賴的復雜系統(tǒng),甚至包括融資。他本身就是一個巨大的GPT,一臺超級計算機,是終極的GPU。
他有強烈的緊迫感和真正的建設意愿。當意愿與能力結(jié)合時,奇跡就會發(fā)生。他確實是獨一無二的。
07
ASIC之爭與未來格局
唐說到這點,現(xiàn)在全球一個核心爭論是GPU與ASIC(專用集成電路,即為某個特定用途而設計的“定制芯片”)的對決??紤]到谷歌TPU的成功,你現(xiàn)在怎么看市場格局的演變?
黃仁勛谷歌的成功在于遠見。他們在一切開始前就推出了TPU1。
就像創(chuàng)業(yè)一樣,應該在市場爆發(fā)前就進入,而不是等到市場達到萬億美元規(guī)模時再加入。
風險投資里有個常見的謬論,只要能在大市場中拿到幾個點的份額就能成功。這完全錯誤。
真正的邏輯是:你要在一個小市場里占據(jù)100%,并隨著市場成長而成長。TPU當年就是這么做的,那時這個賽道只有我們和他們。
格斯特納但前提是,你得祈禱這個小市場最終會長大。實際上,你在創(chuàng)造一個新行業(yè)。
黃仁勛沒錯。這也是今天所有想做ASIC的公司面臨的挑戰(zhàn)。
我曾在LSI Logic工作過,那家公司最早提出ASIC概念,但現(xiàn)在已經(jīng)不復存在。
為什么?當市場還很小的時候,ASIC模式確實有效。你找個代工廠,幫你完成設計、封裝、生產(chǎn),他們抽取50%–60%的毛利。
但當市場足夠大時,模式就會轉(zhuǎn)向COT(客戶自有工具,Customer-Owned Tooling)。蘋果的智能手機就是典型案例:出貨量巨大,他們絕不會把一半利潤交給別人,而是必然采用COT。
所以,當TPU的業(yè)務規(guī)模大到一定程度時,最終也會走向COT,這是毫無疑問的。
當然,ASIC依然有它的用武之地,比如視頻轉(zhuǎn)碼器或智能網(wǎng)卡。這類市場規(guī)模有限,不會無限膨脹。
你可以用ASIC去做推薦系統(tǒng)里的嵌入式處理器,這是可行的。但要拿它作為AI的核心計算引擎,就完全不現(xiàn)實了。
AI世界變化太快,你需要應對低延遲、高吞吐、推理、Token生成、視頻生成等各種迥異的工作負載,這些需求不可能靠單一ASIC解決。
格斯特納像Trainium或一些歐洲的新創(chuàng)公司,他們的ASIC芯片更像是“大棋盤里的一枚子”。而你們已經(jīng)搭建了一個極其復雜的系統(tǒng)、一座“工廠”,而且在不斷開放,比如Grace CPU,就是把不同工作負載分配給最合適的硬件。
黃仁勛沒錯。我們剛剛開源了Dynamo,一個面向分布式AI工作負載的編排系統(tǒng),因為未來的AI工廠一定是分布式的。
格斯特納你們推出的NVLink Fusion(英偉達推出的新一代互聯(lián)技術(shù),它能把不同廠商的CPU、GPU或加速器高速連接起來,讓它們像一個整體一樣協(xié)同工作。相比傳統(tǒng)的封閉互聯(lián),NVLink Fusion更開放,允許Intel、ARM等生態(tài)無縫接入,從而擴大了英偉達“AI工廠”的影響力),甚至向英特爾——你們剛剛投資的競爭對手,敞開了大門。這說明你們希望整個行業(yè)一起來建設這座“工廠”。
黃仁勛這次合作把英特爾生態(tài)、英偉達AI生態(tài)和我們的加速計算平臺打通,就像我們和ARM已經(jīng)實現(xiàn)的那樣。未來還會有更多合作伙伴。
這是一次雙贏:我會成為他們的大客戶,而他們也為我們打開更廣闊的市場。
08
中國科技只比我們慢了“納秒”而已
格斯特納大多數(shù)人可能不知道,但我認為你對中國的了解不亞于美國任何一位領導人。
黃仁勛我們?nèi)ブ袊呀?jīng)30年了。
格斯特納能否重申一下,你認為我們國家應該怎么做,才能在全球人工智能競賽中處于最佳的獲勝位置?
黃仁勛我們和中國確實是競爭對手。但要認識到,中國希望自己的企業(yè)做大做強,這是再自然不過的事。他們理應如此,而且也應該得到盡可能多的支持,這是他們的權(quán)利。
別忘了,中國有著世界上一些最優(yōu)秀的企業(yè)家,他們大多畢業(yè)于全球頂尖的STEM學校,是全世界最渴望成功、最有沖勁的一群人。
在他們的職業(yè)文化中,“996”工作制就是一個典型例子——每周工作六天,從早上九點到晚上九點。這種方式效率極高,雖然外界爭議不少,但它已經(jīng)成為他們的文化特征之一。
整體上,這是一個充滿活力、富有創(chuàng)業(yè)精神的高科技產(chǎn)業(yè)環(huán)境,現(xiàn)代化程度很高。
我聽到過一些聲音,比如“中國永遠造不出AI芯片”。這完全是無稽之談。還有人說“中國不擅長制造”。如果非要說他們最擅長什么,那就是制造。
有人說他們比我們落后很多年——一兩年?還是三四年?事實上,他們只比我們慢了“納秒”而已,就是這么微小的差距。所以,我們別無選擇,必須直面競爭。
那么問題來了:什么才符合中國的最佳利益?
答案很清楚:維持一個充滿活力的產(chǎn)業(yè)。中國領導層也公開表示過,而且理應如此,他們希望中國成為一個開放的市場,吸引外國投資,讓國際公司進入并在市場上競爭。
我相信,也希望我們能夠回到過去的狀態(tài)。
回到你剛才提到的未來,我對此依然充滿信心。因為中國領導人就是這么說的,我對此深信不疑。我相信這是符合他們利益的做法:既讓外國企業(yè)在中國投資、競爭,同時又保證本土企業(yè)能在充滿活力的競爭中成長。
另外,他們也明確希望走向全球,參與國際競爭。這是一個相當明智的愿景。
至于我們美國,任務就是賦能我們的技術(shù)產(chǎn)業(yè)。我很榮幸能身處一個被譽為“國家寶藏”的行業(yè)。我們必須意識到,這確實是我們的國之瑰寶,是我們最頂尖、獨一無二的產(chǎn)業(yè)。
所以,我們?yōu)槭裁床蛔屵@個產(chǎn)業(yè)放手去拼,在競爭中脫穎而出?為什么不讓它走向世界,把技術(shù)傳播到各個角落,建立一個以美國技術(shù)為基礎的全球體系?
這樣,我們才能最大限度地提升經(jīng)濟成就和地緣政治影響力,讓這個在關鍵時刻至關重要的產(chǎn)業(yè)蓬勃發(fā)展。
雖然有很多討論正在進行,但我始終會回到一個基本事實。我堅信,讓英偉達能夠參與并服務中國市場的競爭,這最符合中國的利益。
同時,這也最符合美國的利益。這兩個事實完全可以同時成立,而且我相信它們都是真實的。
我一直相信智慧和真理終將勝出,這也是我一路走來的信念。
09
面對一輛正以指數(shù)級加速前進的火車
趕緊跳上去
格斯特納今天我們已經(jīng)多次提到“指數(shù)增長”。未來學家雷·庫茲韋爾(Ray Kurzweil)曾說過:在21世紀,我們體驗到的進步將不止100年,而是相當于兩萬年的進步。展望下未來?
黃仁勛我認為在未來五年內(nèi),會有一件特別酷的事情發(fā)生:人工智能將與機電一體化、機器人技術(shù)真正融合。到那時,我們每個人身邊都會有能自由活動的AI。
大家其實都能想象,我們終將迎來屬于自己的“R2-D2”。它會陪伴我們成長,記住我們的一切,成為我們的向?qū)Ш突锇椤?/p>
注:星球大戰(zhàn)中R2-D2,是一位聰明活潑的機器人,陪伴過天行者阿納金和盧克,經(jīng)常出現(xiàn)在銀河系歷史的關鍵時刻。
再想象一下:未來在云端部署80億個GPU,為全球80億人提供服務,每個人都有一個量身定制的AI模型。這完全可能實現(xiàn),也非常令人振奮。人工智能不僅存在于云端,還會無處不在:在你的汽車里,在你的機器人里,在各種設備中。
與此同時,我們還將逐步理解生命科學的復雜性。對生物系統(tǒng)的理解和預測,甚至可能讓我們?yōu)槊總€人建立一個數(shù)字孿生。
就像我們在亞馬遜有一個用于購物的“數(shù)字分身”,在醫(yī)療健康領域,我們也完全可以擁有一個。
這個系統(tǒng)能預測衰老過程、潛在疾病,甚至預警可能即將發(fā)生的重大健康事件——比如下周,甚至明天下午。這不是幻想,而是遲早會實現(xiàn)的。
很多CEO常常問我:面對這種快速演化的未來,我們該怎么辦?答案其實很簡單:在一列正以指數(shù)級加速前進的火車面前,你唯一要做的,就是跳上去。
一旦上車,問題會在途中得到解決。試圖預測這列火車最終會駛向何方,然后打算在某個路口攔截它,這是徒勞的。
最聰明的做法,就是在它還沒快到無法企及之前,趕緊上車,和它一起加速前進。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.