夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

前OpenAI靈魂人物Jason Wei最新演講!三大思路揭示2025年AI終極走向

0
分享至


新智元報道

編輯:定慧

【新智元導讀】在AI加持下的這一年人類突飛猛進,停下來回頭看去,似乎AI已經(jīng)無所不能,但前OpenAI靈魂研究員認為AI不可能瞬間超越人類,他還提出了三個關于AI的最新洞見。

用三句話總結下2025年AI的發(fā)展,你會想到什么?

  • 所有能被驗證的任務,最終都會被AI解決

  • 智能最后會變成商品,知識價格歸零

  • AI不會瞬間超過人類

最近,前OpenAI核心研究員、CoT(思維鏈)作者Jason Wei在斯坦福大學AI Club做了一場精彩的演講。


這是他跳槽到Meta后少有的公開分享。

我們的世界,在AI大行其道的這一年,到底發(fā)生了什么?

AI繼續(xù)發(fā)展下去是什么樣子的?


量化交易員說AI很酷,但并不能做我的工作;

頂級實驗室AI研究院:2-3年后,AI就要取代我的工作了。

那么,誰對誰錯?

智能的商品化

Jason Wei的原話是Intelligence as a Commodity

AI的智能發(fā)展可以分為兩個階段:

第一階段:前沿突破,當AI還無法很好地完成某任務時,研究的重點是「解鎖新能力」。

第二階段:能力商品化,一旦AI能完成該任務,該能力就會被快速復制、成本趨近于零。

例如在MMLU(多任務語言理解基準)上,過去幾年模型性能穩(wěn)步提升,而達到特定分數(shù)的成本卻逐年下降。


「自適應算力」的出現(xiàn)

AI的出現(xiàn),也是首次深度學習真正實現(xiàn)自適應計算AdaptiveCompute)。

過去無論任務簡單還是困難,模型都消耗相同的算力。


現(xiàn)在可以根據(jù)任務難度動態(tài)調整推理算力。

例如在o1模型中,推理時投入更多計算,就能在數(shù)學題上獲得更高準確率。

這意味著:智能的成本可以持續(xù)下降,而無需無限擴大模型規(guī)模。

同時,信息獲取越來越容易。 AI正在讓「公開知識」的獲取時間趨近于零。


Jason以「查找1983年釜山結婚人數(shù)」為例:

  • 互聯(lián)網(wǎng)時代前:去圖書館查百科,數(shù)小時

  • 互聯(lián)網(wǎng)時代:搜索網(wǎng)站、篩選資料,數(shù)分鐘

  • 聊天機器人時代:直接問AI ,即時

  • 智能體(Agent)時代:自動查找并整合數(shù)據(jù)庫,數(shù)秒到數(shù)分鐘

總結一下,Jason Wei認為智能作為一種「商品」,將越來越便宜

  • 知識民主化:編程、生物黑客等曾需高門檻知識的領域被大眾化。

  • 私有信息的相對升值:公開信息成本趨零,內幕或獨家信息的價值反而更高。

  • 個性化互聯(lián)網(wǎng):未來每個人可能擁有一套完全定制的知識入口。


驗證者法則

什么是驗證者法則?

所有能被驗證的任務,最終都會被AI解決。

所以現(xiàn)在會出現(xiàn)各種各樣的評測基準。

只要能建立「能夠被驗證的任務」,AI都會攻破這個領域。

很明顯的一點是,越容易生成的任務,越難被驗證。

這就是驗證的非對稱性。

比如數(shù)獨和造一個網(wǎng)站,都屬于中等難度和高難度的任務。

但是要驗證一個數(shù)獨題目的正確性,和驗證一個網(wǎng)站是否開發(fā)的不錯,很簡單!

許多任務存在「生成難,驗證易」的不對稱:


  • 解數(shù)獨:難求解,易驗證。

  • 寫出網(wǎng)站的全部代碼:極難生成,但驗證只需點擊瀏覽。

  • 寫事實性文章:容易生成「似是而非」的文本,但事實核查極其耗時。

  • 提出飲食法:容易斷言「只吃野牛最好」,但驗證需長期實驗。

我們可將任務放在二維平面上:X軸,生成難度;Y軸,驗證難度。


某些任務可以通過提供額外信息使其更易驗證:

例如提供答案或測試集,使「生成→驗證」更高效。

AI能否學會一項任務,與該任務的可驗證性成正比

即:任何可驗證、可量化的任務,AI終將掌握。

比如下面這種圖,在過去5年中,大部分AI基準評測都非常容易被「驗證」。


Jason Wei給出了可驗證性的五個因素:

  • 是否存在客觀真值;

  • 驗證速度是否快;

  • 能否批量驗證大量樣本;

  • 結果是否低噪聲、穩(wěn)定;

  • 是否有連續(xù)反饋(不僅是「對/錯」,還有質量梯度)。

幾乎所有AI基準(benchmarks)都具備這些特征,因此被迅速攻克。

Jason Wei重點描述一個案例:DeepMind的AlphaEvolve。


該系統(tǒng)通過大規(guī)模采樣與自我驗證,解決了大量「易驗證難求解」的任務。


核心流程是:

  • 用語言模型生成候選答案;

  • 自動打分(驗證);

  • 取最優(yōu)樣本再輸入模型,形成迭代;

  • 反復迭代后性能顯著提升。


這種策略繞過了「訓練集-測試集」的泛化問題,只針對「單個任務」持續(xù)優(yōu)化。

總結一下:

  • 可輕易驗證的任務將率先被AI自動化。

  • 新的創(chuàng)業(yè)機會:AI創(chuàng)造「可測量的目標」。

  • 即——只要你能定義一個明確的度量指標,AI就能為你優(yōu)化它。


智能的鋸齒邊緣

這個關鍵點英文叫做The Jagged Edge of Intelligence,智能的鋸齒邊緣。

直接翻譯有點抽象,但是如果看下圖就很好理解了。

簡單來說,就是AI的智能并不是「全知全能」,AI的智能水平就像鋸齒一樣,有高有低。


AI為什么不會「瞬間超越人類」

Jason認為不會出現(xiàn)「AI快速爆炸式超越人類」的「Fast Take off」。

AI的自我改進能力將是漸進的、分任務發(fā)展的。

不同任務的學習速度和上限各不相同,不會「一夜超神」。

每個任務的改進速率不同:

  • 一些任務進步快(如可驗證的數(shù)學、編程)。

  • 一些任務改進慢(如需要真實世界交互或罕見數(shù)據(jù)的語言)。

AI的發(fā)展呈「鋸齒形」曲線:某些領域突飛猛進,某些長期停滯。

那么AI在哪些任務上發(fā)展快,哪些發(fā)展的慢?

判斷任務進展速度的三條啟發(fā)式法則:

  • 數(shù)字化任務發(fā)展快:迭代速度高、實驗成本低;例如軟件開發(fā)遠快于機器人制造。

  • 對人類簡單的任務,對AI也簡單:但AI也能在某些「人類極難但有明確目標」的領域超越人類,如癌癥影像預測。

  • 數(shù)據(jù)越多,AI越強:語言模型在高頻語言上性能顯著優(yōu)于低資源語言,若任務能提供單一客觀指標,還可用強化學習生成合成數(shù)據(jù)。

比如AI代碼,現(xiàn)在基本已經(jīng)被AI攻克,競賽數(shù)學也被攻克了。

但是如果數(shù)據(jù)量很小,無法數(shù)字化的領域,AI就很難攻克。


總結一下:

  • 不存在統(tǒng)一的「AI超級智能爆發(fā)」;

  • 各任務將以不同速率演進;

  • 影響最大的領域是:數(shù)字化、人類已擅長、數(shù)據(jù)豐富的領域

Jason Wei在演講最后總結道:

智能與知識將變得快速且廉價,公共知識的獲取時間趨零。

而「驗證者法則」則預示著可度量性推動AI進步,任何可驗證的任務都會被AI征服。

智能的邊界是鋸齒狀的。各任務發(fā)展速率不同,不會出現(xiàn)瞬間的超智能崛起。

未來的信息將無摩擦地流動,而AI的邊界,將由我們能定義和驗證的事物所決定。

演講嘉賓介紹


Jason Wei,目前是Meta Superintelligence Labs的研究科學家。

他曾在OpenAI工作兩年,參與創(chuàng)建了o1模型DeepResearch項目;

在那之前,他是Google Brain的研究員,推動了Chain-of-Thought推理、InstructionTuning(指令微調)等技術的發(fā)展。

他的論文被引用超過9萬次,是現(xiàn)代AI領域最具影響力的研究者之一。

參考資料:

https://www.youtube.com/watch?v=b6Doq2fz81U

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
年輕人正在逃離上海,577萬老人占比超37%,上海究竟怎么了?

年輕人正在逃離上海,577萬老人占比超37%,上海究竟怎么了?

Hi科普啦
2025-11-02 12:05:03
開拓者宣布!再見了,楊瀚森!NBA生涯第一次下放

開拓者宣布!再見了,楊瀚森!NBA生涯第一次下放

籃球實戰(zhàn)寶典
2025-11-02 03:29:28
楊涵森下放至發(fā)展聯(lián)盟的三種結果預測:其中之一回CBA

楊涵森下放至發(fā)展聯(lián)盟的三種結果預測:其中之一回CBA

姜大叔侃球
2025-11-02 19:16:26
女人坐了28年牢,出獄去辦證,民警一查系統(tǒng),當場愣了

女人坐了28年牢,出獄去辦證,民警一查系統(tǒng),當場愣了

卡西莫多的故事
2025-10-30 11:33:46
局長去世同事疏遠,只有女副科長去吊唁,三年后女副科升正局

局長去世同事疏遠,只有女副科長去吊唁,三年后女副科升正局

秋風專欄
2025-10-30 10:44:21
你見過最離奇的案件是什么?網(wǎng)友:我一個變態(tài)都覺得這些人太變態(tài)

你見過最離奇的案件是什么?網(wǎng)友:我一個變態(tài)都覺得這些人太變態(tài)

帶你感受人間冷暖
2025-11-01 00:05:14
同房時,男生都有哪些性觀念誤區(qū)?(女生勿入)

同房時,男生都有哪些性觀念誤區(qū)?(女生勿入)

許超醫(yī)生
2025-10-31 10:08:22
LPL最大笑話誕生!官方解說爆料:TES老總在現(xiàn)場,想要把打野換了

LPL最大笑話誕生!官方解說爆料:TES老總在現(xiàn)場,想要把打野換了

天下游戲吧
2025-11-02 19:52:55
許紹雄出殯時間已定,家屬呼吁:別送花籃直接給錢,原因讓人淚目

許紹雄出殯時間已定,家屬呼吁:別送花籃直接給錢,原因讓人淚目

檸檬有娛樂
2025-11-01 13:48:49
ASML專利不保?中企對外“警告”,回購已購光刻機,荷蘭陷入兩難

ASML專利不保?中企對外“警告”,回購已購光刻機,荷蘭陷入兩難

深析古今
2025-11-01 11:08:24
有關北京供暖,最新進展!

有關北京供暖,最新進展!

BRTV新聞
2025-11-02 20:38:36
斯諾克國錦賽:丁俊暉6-0橫掃格雷斯,遺憾沖擊147失敗

斯諾克國錦賽:丁俊暉6-0橫掃格雷斯,遺憾沖擊147失敗

懂球帝
2025-11-02 21:45:31
益陽一媽媽跳廣場舞10年“喚醒”植物人女兒:醫(yī)生說舞樂能刺激神經(jīng),我就照做了

益陽一媽媽跳廣場舞10年“喚醒”植物人女兒:醫(yī)生說舞樂能刺激神經(jīng),我就照做了

瀟湘晨報
2025-11-02 21:18:29
新疆:堅決擁護黨中央決定

新疆:堅決擁護黨中央決定

新京報政事兒
2025-11-02 13:26:11
官方通報:區(qū)長馮強,酒駕、工作時間沉迷打高爾夫球

官方通報:區(qū)長馮強,酒駕、工作時間沉迷打高爾夫球

新京報政事兒
2025-11-02 15:54:27
“為了孩子吃上飯,自己只能靠喝水撐著”!政府“停擺”滿月, 4200萬美國人吃飯成問題,多少個“截止日期”被錯過了

“為了孩子吃上飯,自己只能靠喝水撐著”!政府“停擺”滿月, 4200萬美國人吃飯成問題,多少個“截止日期”被錯過了

每日經(jīng)濟新聞
2025-11-01 17:49:10
醫(yī)院抓小三后續(xù):男子年入百萬,單位電話被打爆,原配身份有來頭

醫(yī)院抓小三后續(xù):男子年入百萬,單位電話被打爆,原配身份有來頭

鋭娛之樂
2025-11-02 08:22:31
5連??!一步錯,步步錯!鵜鶘管理層頭都大了,三筆交易虧到家

5連?。∫徊藉e,步步錯!鵜鶘管理層頭都大了,三筆交易虧到家

毒舌NBA
2025-11-02 20:14:38
絕對胸猛!這不是她的膝蓋!

絕對胸猛!這不是她的膝蓋!

貴圈真亂
2025-11-02 12:14:19
烏軍空降兵支援被全殲,紅軍城5000烏軍投降,烏克蘭人徹底怒了!

烏軍空降兵支援被全殲,紅軍城5000烏軍投降,烏克蘭人徹底怒了!

海上武器雜談
2025-11-02 17:20:28
2025-11-03 00:44:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領航智能+時代
13769文章數(shù) 66236關注度
往期回顧 全部

科技要聞

10月零跑突破7萬輛,小鵬、蔚來超4萬輛

頭條要聞

和章澤天出席會議被抓拍 劉強東發(fā)文調侃稱"沒了自信"

頭條要聞

和章澤天出席會議被抓拍 劉強東發(fā)文調侃稱"沒了自信"

體育要聞

這個日本人,憑啥值3.25億美元?

娛樂要聞

陳道明被王家衛(wèi)說他是陰陽同體的極品

財經(jīng)要聞

段永平捐了1500萬元茅臺股票!本人回應

汽車要聞

神龍汽車推出“發(fā)動機終身質?!闭?/h3>

態(tài)度原創(chuàng)

旅游
家居
數(shù)碼
公開課
軍事航空

旅游要聞

“詩和遠方”并不遠!青海·海西生態(tài)旅游宣傳推介會走進廣州

家居要聞

吸睛藝術 富有傳奇色彩

數(shù)碼要聞

麒麟9030處理器突然曝光:1+4+4六核狂飆,可惜工藝不詳!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄在日本海演習擊沉假想敵潛艇

無障礙瀏覽 進入關懷版 精品中文人妻在线不卡| 天堂在线中文| 2020国产在线拍揄自揄视频| 人妻无码肉感视频| 日韩在线视频一区二区三区| 国产伦精品一区二区三区网站| 精品久久久无码中文字幕天天| 伊人天堂av无码av日韩av| 青青国产成人久久111网站| 国产成人黄网站在线观看| 国产区一区二区三区| 国产片婬乱18一级毛片视频尚| 亚玖玖视频热播| 久久人妻无码aⅴ毛片评价| 亚洲av综合久久成人网| 少妇无码一区二区二三区| 婷婷无码在线精品| 国产亚洲人成网站在线观看琪琪秋| 热久久久久久人| 亚洲色欲一区二区| 亚洲精品一区二区18禁| 狠狠艹,天天艹| 日本九九热在线观看官网| 在线亚洲精品国产二区图片欧美| 中文无码一区二区三区| 性猛交富婆╳Ⅹ乱大交| 久久不卡免费视频| 亚洲综合久久精品国产高清| 亚洲国产精品无码久久一线| 四虎影视av| 国精产品一二二线精华液| 国产成人成网站在线播放青青 | 2020AV天堂网| 无码视频一区| 日韩av无码精品人妻系列| 好爽好黄的视频| 少妇挑战三个黑人| 亚洲一区二区艹艹| 色婷婷中色婷婷| 俺去了俺去搞| 性XX色XX综合久久久XX|