夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

有300億美元也未必“再造GPT-4”?尤洋長文:AI增長瓶頸的真相

0
分享至

允中 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

2026年將至,ChatGPT發(fā)布三周年,但關(guān)于“AI瓶頸期”的焦慮正達(dá)到頂峰。

當(dāng)全行業(yè)都在討論如何通過量化、蒸餾來“省錢”時(shí),新加坡國立大學(xué)校長青年教授、潞晨科技創(chuàng)始人尤洋卻提出了一個(gè)更為本質(zhì)的拷問:

如果給你300億美元預(yù)算,今天我們真的能訓(xùn)出比GPT-4強(qiáng)出幾個(gè)維度的模型嗎?

在《智能增長的瓶頸》一文中,尤洋教授一針見血地指出:

  • 當(dāng)前智能增長的瓶頸,本質(zhì)上是我們現(xiàn)有的技術(shù)范式,已經(jīng)快要“消化”不動(dòng)持續(xù)增長的算力了。

他提出了幾個(gè)顛覆常規(guī)認(rèn)知的硬核觀點(diǎn):

  • 智能的本質(zhì)是能源轉(zhuǎn)化:過去10年,AI的本質(zhì)是將電力通過計(jì)算轉(zhuǎn)化為可復(fù)用的智能,而轉(zhuǎn)化效率正面臨大考。
  • Transformer的秘密:它之所以勝出,并非因?yàn)楦袢四X,而是因?yàn)樗且慌_(tái)“偽裝成神經(jīng)網(wǎng)絡(luò)的并行計(jì)算機(jī)”,完美契合了英偉達(dá)GPU的堆料邏輯。
  • 效率不等于智能:Mamba等新架構(gòu)提升了吞吐量,但在“算力轉(zhuǎn)智能”的終極上限上,它們真的比Transformer更強(qiáng)嗎?
  • 未來的出路:拋棄Adam優(yōu)化器?回歸高精度計(jì)算(FP32/64)?

從電影制作到地震時(shí)間預(yù)測,我們離真正的AGI還有多遠(yuǎn)?……



這篇深度長文,或許能帶你穿透“降本增效”的迷霧,直達(dá)算力與智能最底層的邏輯。

一起來看。

智能的核心不是解釋,而是預(yù)測

什么是智能?

尤洋沒有照搬任何形式化或哲學(xué)化的“智能定義”。

相反,他采用了一種非常工程化、面向能力評估的處理方式,通過一組可驗(yàn)證、可實(shí)踐的判斷標(biāo)準(zhǔn)來刻畫智能的邊界:

  • 在關(guān)鍵人生決策上,是否愿意完全聽從AI;
  • 在高風(fēng)險(xiǎn)、高不確定性領(lǐng)域,是否敢讓AI替代專家;
  • 在創(chuàng)作層面,是否已經(jīng)無法分辨作品是否由AI生成;

這些例子背后,指向的是同一個(gè)核心能力:即對未來狀態(tài)進(jìn)行預(yù)測,并為預(yù)測結(jié)果承擔(dān)實(shí)際后果的能力



這一鋒利的判斷,不僅解釋了為什么Next-Token Prediction能在過去幾年成為事實(shí)上的“智能發(fā)動(dòng)機(jī)”,也解釋了為何許多“在封閉評測中表現(xiàn)出色”的系統(tǒng),一旦進(jìn)入真實(shí)世界就迅速暴露短板——

它們往往擅長組織與解釋已有信息,卻難以在不確定環(huán)境中對未來做出穩(wěn)定、可執(zhí)行的判斷。

當(dāng)然,需要強(qiáng)調(diào)的是,將智能高度凝聚為“預(yù)測”,更像是在給智能劃定一個(gè)工程上可對齊算力投入的核心能力維度,而非窮盡智能的全部內(nèi)涵。

這是一個(gè)足夠清晰也足夠有解釋力的硬核視角。而規(guī)劃、因果建模以及長期一致性等能力,是否能夠完全被還原為預(yù)測問題,仍然是一個(gè)開放議題。

但當(dāng)我們把智能簡化為預(yù)測能力時(shí),下一步的問題自然落到:算力是如何轉(zhuǎn)化為這種能力的?

預(yù)訓(xùn)練、SFT、RL之爭,本質(zhì)上是“算力分配”問題

過去幾年,行業(yè)對訓(xùn)練范式的討論,常常被“方法論優(yōu)越感”主導(dǎo);但如果把目標(biāo)限定為單位算力能換來多少智能,那么范式本身就不再神秘,而變成了一種算力使用策略。

不同于主流敘事,尤洋在文章中直接把預(yù)訓(xùn)練、微調(diào)、強(qiáng)化學(xué)習(xí)三者拉到統(tǒng)一層面,即三者本質(zhì)上都是在計(jì)算梯度,更新參數(shù)。



文章指出,當(dāng)前模型的主要智能來源,依然是預(yù)訓(xùn)練階段——不是因?yàn)樗奥斆鳌?,而是因?yàn)樗?strong>消耗了最多的能源與計(jì)算

從智能增長角度看,這三者參數(shù)更新發(fā)生的頻率與更新所消耗的算力規(guī)模確有不同,但是通過視角的轉(zhuǎn)換,智能增長的討論就從方法論之爭,轉(zhuǎn)向了一個(gè)更樸素,也更殘酷的問題——

在算力持續(xù)投入的前提下,我們是否還能穩(wěn)定地?fù)Q取能力增長?

Transformer的勝出,不只是算法勝利

為了回答這個(gè)問題,這篇文章回溯了過去十年大模型快速進(jìn)化的原因。尤洋指出,這一輪智能躍遷的成立,依賴于三件事情同時(shí)發(fā)生:

  • 一是GPU體系在硬件層面持續(xù)提供指數(shù)級增長的并行算力;
  • 二是Transformer架構(gòu)在計(jì)算結(jié)構(gòu)上天然支持大規(guī)模并行,能夠充分“吃下”這些算力;
  • 三是Next-Token Prediction這一訓(xùn)練目標(biāo)為模型提供了近乎無限、且高度統(tǒng)一的學(xué)習(xí)信號。

因此,Transformer的成功,并不僅僅是算法層面的勝利,更源于模型架構(gòu)與硬件體系高度匹配的系統(tǒng)性結(jié)果

在這三者共同作用下,算力增長、模型規(guī)模擴(kuò)大與能力提升之間形成了一條相對穩(wěn)定的正反饋鏈路。

需要注意的是,這一范式的有效性,也在一定程度上受益于語言任務(wù)本身的結(jié)構(gòu)特性:語言高度符號化、序列化,且評測體系與訓(xùn)練目標(biāo)高度一致。

這使得算力增長、模型規(guī)模擴(kuò)大與能力提升之間,在這一階段形成了一條相對穩(wěn)定的正反饋鏈路。

也正是在這一歷史條件下,從GPT-1、GPT-2到GPT-3,再到ChatGPT,智能水平得以沿著同一范式持續(xù)抬升。

這也自然引出了后文的核心問題:

當(dāng)算力繼續(xù)增長時(shí),我們是否還擁有同樣可擴(kuò)展的范式?

真正的瓶頸,并不是算力停了,而是算力“吃不動(dòng)”了

尤洋在文中提出了一個(gè)非常具體、也非??刹僮鞯臉?biāo)準(zhǔn)來判斷智能的瓶頸:

  • 當(dāng)一次訓(xùn)練的FLOPS從10^n變成10^{n+3}時(shí),我們是否還能穩(wěn)定地獲得顯著更強(qiáng)的模型?

如果答案開始變得不確定,那么問題就不在于“算力是否繼續(xù)增長”,而在于:

  • 現(xiàn)有范式對新增算力的吸收效率是否下降;
  • 計(jì)算規(guī)模的擴(kuò)大,是否被通信、同步和系統(tǒng)開銷所抵消。

這也是文章里反復(fù)強(qiáng)調(diào)FLOPS的原因:

Token數(shù)、參數(shù)量、推理速度,往往會(huì)混合效率與商業(yè)因素;而FLOPS才是最底層、也最難被包裝或美化的算力尺度

在這個(gè)意義上,所謂“瓶頸”,并不是紅利消失,而是算力增長與智能增長之間的映射關(guān)系開始松動(dòng)

更值得一提的是,尤洋在文章中刻意把討論從“效率優(yōu)化”里拎出來,換了一個(gè)更接近一線大廠決策的場景:

假設(shè)今天Google拍給你一張“300億美元預(yù)算”的支票,給你半年DDL——在這種極限訓(xùn)練目標(biāo)下,你還會(huì)優(yōu)先選擇Mamba這類“吞吐量更高”的架構(gòu)嗎?

未必。因?yàn)橥掏铝拷鉀Q的是“同等智能更便宜”,不自動(dòng)等價(jià)于“同等成本更聰明”。

真正的難點(diǎn)變成:我們到底有沒有一種擴(kuò)展性更強(qiáng)的架構(gòu)或Loss函數(shù),能把新增算力更穩(wěn)定地“吃進(jìn)去”,并把它轉(zhuǎn)換成可兌現(xiàn)的能力增量?

那么如何能在單位時(shí)間內(nèi)吃下更多算力,并真正將它轉(zhuǎn)化為智能呢?

未來未定,問題的答案可能在多個(gè)探索區(qū)間內(nèi)

在正式回答算力轉(zhuǎn)化智能的問題之前,尤洋還對硬件與基礎(chǔ)設(shè)施層面進(jìn)行了深入的探討。

他根據(jù)自身多年的從業(yè)經(jīng)驗(yàn)得出,計(jì)算開銷/通信開銷的比值,必須維持或提升,這樣才能在繼續(xù)堆疊GPU的情況下,線性地?fù)Q來更多智能。

因此,未來AI基礎(chǔ)設(shè)施的核心目標(biāo),應(yīng)該關(guān)注并行計(jì)算體系在軟硬件層面的整體擴(kuò)展性,而不僅僅是單點(diǎn)芯片性能。

在這一基礎(chǔ)上,尤洋最后提出了多個(gè)探索方向,比如更高精度、高階優(yōu)化器,更可擴(kuò)展的架構(gòu)或者Loss函數(shù),更多epoch與更深度的超參數(shù)探索。

這些探索方向,都在試圖回答同一個(gè)命題——如何讓模型在“吃掉”萬億級投入的同時(shí),吐出等比例增強(qiáng)的智能?

對于智能的進(jìn)一步增長而言,真正重要的,是在極端算力條件下持續(xù)變強(qiáng)的能力——這也意味著,預(yù)訓(xùn)練所能承載的智能增長空間,可能還遠(yuǎn)未走到盡頭。

回到最初討論的問題,算力到底還能不能繼續(xù)轉(zhuǎn)化為智能?

尤洋并未給出斷言,但邏輯已經(jīng)清晰:

  • 只要我們還能找到更高效組織計(jì)算的方式,智能的上限就遠(yuǎn)未到來。

原文傳送門:

https://zhuanlan.zhihu.com/p/1989100535295538013

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
國家又出生育新政,2026年1月1日起正式實(shí)施,但年輕人不愿生娃

國家又出生育新政,2026年1月1日起正式實(shí)施,但年輕人不愿生娃

百態(tài)人間
2025-12-31 16:30:11
突傳喜訊!古巨基官宣二胎,年過半百再獲兒子,57歲妻子居功甚偉

突傳喜訊!古巨基官宣二胎,年過半百再獲兒子,57歲妻子居功甚偉

裕豐娛間說
2026-01-01 20:27:52
僅12天丟掉冠軍,《阿凡達(dá)3》被黃曉明打敗,210億票房夢徹底碎了

僅12天丟掉冠軍,《阿凡達(dá)3》被黃曉明打敗,210億票房夢徹底碎了

影視高原說
2026-01-01 09:21:50
2026年油車新規(guī)強(qiáng)制執(zhí)行!你的愛車還能開多久?快來看看!

2026年油車新規(guī)強(qiáng)制執(zhí)行!你的愛車還能開多久?快來看看!

復(fù)轉(zhuǎn)這些年
2025-12-31 23:48:55
江蘇女子稱奶奶去世公司不批假還被逼離職,公司法人回應(yīng):“上班摸魚,害群之馬!”

江蘇女子稱奶奶去世公司不批假還被逼離職,公司法人回應(yīng):“上班摸魚,害群之馬!”

瀟湘晨報(bào)
2026-01-01 18:41:14
中日情況有變,13年來日本首次被拒,高市不服:當(dāng)眾喊出一個(gè)名字

中日情況有變,13年來日本首次被拒,高市不服:當(dāng)眾喊出一個(gè)名字

南宮一二
2026-01-01 17:55:07
長春"威哥"后續(xù):已被拘留,知情人曝身份,坑人不是一天兩天了

長春"威哥"后續(xù):已被拘留,知情人曝身份,坑人不是一天兩天了

奇思妙想草葉君
2026-01-01 09:09:38
寶馬開年引爆價(jià)格戰(zhàn)!全面降價(jià),最高降30萬!

寶馬開年引爆價(jià)格戰(zhàn)!全面降價(jià),最高降30萬!

電動(dòng)知家
2026-01-01 11:41:10
52歲朱迅主持跨年晚會(huì),被吐槽像芭比娃娃,網(wǎng)友:給整懵圈了

52歲朱迅主持跨年晚會(huì),被吐槽像芭比娃娃,網(wǎng)友:給整懵圈了

丫頭舫
2026-01-01 21:39:17
江西男孩失蹤柬埔寨!絕望母親淚崩喊話:汪大使,您能聽見嗎?

江西男孩失蹤柬埔寨!絕望母親淚崩喊話:汪大使,您能聽見嗎?

社會(huì)日日鮮
2026-01-01 12:43:09
盧卡申科:“不友好國家”曾策劃襲擊普京

盧卡申科:“不友好國家”曾策劃襲擊普京

參考消息
2026-01-01 21:37:24
“中產(chǎn)階級”及格線誕生!全國只有3320萬戶,你達(dá)標(biāo)了嗎?

“中產(chǎn)階級”及格線誕生!全國只有3320萬戶,你達(dá)標(biāo)了嗎?

李云飛Afey
2026-01-01 12:52:31
艾滋病新增130萬!很多人中招很冤枉!在外“5不碰”一定要記死

艾滋病新增130萬!很多人中招很冤枉!在外“5不碰”一定要記死

今朝牛馬
2025-12-31 19:31:04
國產(chǎn)香煙加了助燃劑?測試發(fā)現(xiàn)只能燒4分鐘,而日本煙能燒7分鐘

國產(chǎn)香煙加了助燃劑?測試發(fā)現(xiàn)只能燒4分鐘,而日本煙能燒7分鐘

回旋鏢
2026-01-01 21:00:24
聯(lián)合國報(bào)告:東京滑落為全球人口第三大城市

聯(lián)合國報(bào)告:東京滑落為全球人口第三大城市

新華社
2026-01-01 17:51:03
兩岸艦艇發(fā)生對峙,所有艦艇摘除炮衣,臺(tái)軍方已下令,可采取措施

兩岸艦艇發(fā)生對峙,所有艦艇摘除炮衣,臺(tái)軍方已下令,可采取措施

來科點(diǎn)譜
2026-01-01 08:56:24
2026年開始,為什么建議大家盡量使用現(xiàn)金支付,原因很現(xiàn)實(shí)

2026年開始,為什么建議大家盡量使用現(xiàn)金支付,原因很現(xiàn)實(shí)

李博世財(cái)經(jīng)
2026-01-01 17:03:43
中國移動(dòng)這次“不摳門”了,10年沒換號的人,將送以下4大福利

中國移動(dòng)這次“不摳門”了,10年沒換號的人,將送以下4大福利

復(fù)轉(zhuǎn)這些年
2026-01-01 17:41:37
國家級射擊教練獲刑10年,多省射擊隊(duì)購買其走私槍支配件?

國家級射擊教練獲刑10年,多省射擊隊(duì)購買其走私槍支配件?

大風(fēng)新聞
2026-01-01 19:29:10
瑞士酒吧新年慘劇致百余死傷,幸存者稱服務(wù)員不慎引燃天花板 意大使:有人放煙花爆竹

瑞士酒吧新年慘劇致百余死傷,幸存者稱服務(wù)員不慎引燃天花板 意大使:有人放煙花爆竹

紅星新聞
2026-01-01 23:19:14
2026-01-02 04:35:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11957文章數(shù) 176355關(guān)注度
往期回顧 全部

科技要聞

特斯拉Model 3車主首度全程自駕橫穿美國

頭條要聞

瑞士酒吧新年爆炸致百余死傷 有人嚴(yán)重?zé)齻y以辨認(rèn)

頭條要聞

瑞士酒吧新年爆炸致百余死傷 有人嚴(yán)重?zé)齻y以辨認(rèn)

體育要聞

2026,這些英超紀(jì)錄可能會(huì)被打破

娛樂要聞

跑調(diào)風(fēng)波越演越烈!沈佳潤被網(wǎng)友喊話

財(cái)經(jīng)要聞

巴菲特「身退,權(quán)還在」

汽車要聞

一汽-大眾2025年整車銷量超158萬輛 燃油車市占率創(chuàng)新高

態(tài)度原創(chuàng)

旅游
教育
時(shí)尚
藝術(shù)
房產(chǎn)

旅游要聞

自貢非遺花燈點(diǎn)亮江南夜!2026無錫梅里古鎮(zhèn)新年燈會(huì)璀璨啟幕

教育要聞

2026,一路向前!南京一中學(xué)子在吃喝玩樂中迎新年!

2025年,記住她們的名字!

藝術(shù)要聞

你絕對想不到,這位東方畫家竟將印象派推向巔峰!

房產(chǎn)要聞

實(shí)景暴擊!??谶@個(gè)頂流紅盤,拋出準(zhǔn)現(xiàn)房+頂級書包雙王炸!

無障礙瀏覽 進(jìn)入關(guān)懷版 国产不卡一区二区精品| 狠狠人妻精品久久久久久久| 国产精品久久久久久久网| 被拉到野外强要好爽| 日韩精品色哟哟| 成人精品一区二区三区电影| “ 内射 ” 的搜索结果| 在线观看最新av网址| ass日本风韵熟妇pics| 久久精品无码免费不卡| 欧美成人总合色| 18禁裸体动漫美女无遮挡网站| 观看美女骚屄视频在线观看| 日本亚洲欧洲无免费码在线| 久久国产欧美日韩精品| 最新中文字幕AV无码专区不| 精品国精品无码自拍自在线| 狠狠躁天天躁夜夜躁婷婷老牛影视| 欧美熟妇潮喷XXX3Tm2FR| 国精品无码一区二区三区在线| 亚洲精品一区国产精品丝瓜 | 亚洲av永久无码精品一区二区三区| 久久综合九色综合欧美狠狠| 国产91模特无码 国产在线播放| 中文字幕人妻av12| 亚洲少妇视频一区二区| 亚洲精品无码久久久久去q| 人妻丰满熟妇av无码区免| 欧美A区B区成人PA~| 成人在线免费网| 玖玖精品欧美中文字幕| 久久午夜夜伦鲁鲁片不卡| 激情都市亚洲| 久久成人精品| 国产老熟女精品久久久久影院黑人| 中文字幕无码久久一区| 亚洲AV无码国产精品红治院| 国产精品日韩色无码中出| 精品香蕉久久久午夜福利| 重庆露脸九次高潮 | 一女三黑人玩4P惨叫|