Meta華人天才畢樹超「叛逃」預(yù)言：OpenAI未竟交互革命，暗藏萬億賽道

2025-08-14 17:28:06　來源: 新智元

北京舉報

分享至

新智元報道

編輯：KingHZ

【新智元導(dǎo)讀】AGI不是未來，它已到來。十年前，他嗤之以鼻；如今，他賭上職業(yè)生涯。Meta科學(xué)家畢樹超揭秘AI進化真突破：更好更快造數(shù)據(jù)。在哈佛大學(xué)的演講，他還揭秘下一個萬億級AI機會。

今年6月，華人AI研究員畢樹超在哥倫比亞大學(xué)和哈佛大學(xué)發(fā)表演講，講述了在過去十年中，他如何從懷疑AGI逐漸轉(zhuǎn)變?yōu)閷GI的日漸癡迷。

最近，他分享了在哈佛大學(xué)的演講內(nèi)容。

兩次演講主題一致，內(nèi)容類似，關(guān)于硅基智能的過去、開放問題和未來。

從OpenAI離職后，畢樹超加入了Meta的超級智能實驗室，他已經(jīng)分享過哥倫比亞大學(xué)的演講：

有趣的是，在哈佛演講最后，有人提了一個問題：

如果您在「AI原生交互」領(lǐng)域創(chuàng)業(yè)，您會押注于哪些多模態(tài)基礎(chǔ)技術(shù)？未來兩年最大的機遇在哪里？

確切的答案，畢樹超承認(rèn)自己不知道，即便知道了也不會公之于眾。

不過他還是回顧了歷史，指出了兩個歷史性突破：

（1）GUI（圖形用戶界面），催生了個人電腦；

（2）多點觸控，催生了移動設(shè)備。

如果有人能基于人工智能找到下一個人機交互方式，那將是一家價值萬億美元的公司。而且他非常肯定地給出了寶貴的洞見：

語音和視覺將成為其中的一部分。它必須非常接近人類自然的交互方式。

AI狂飆史

首先，他介紹了從2012年AI日新月異的進步，拋出一條清晰而震撼的「AI進化時間線」——十年，人工智能完成了一次從蹣跚學(xué)步到奔跑躍遷的蛻變。

2012年，AlexNet橫空出世，「大數(shù)據(jù)+算力」一擊擊碎了數(shù)十年手工特征工程的神話。

2013年，Word2Vec出現(xiàn)，引爆「萬物皆向量」革命。

單詞成了可以計算距離的向量，語義之間有了坐標(biāo)系。

推薦系統(tǒng)、搜索引擎瞬間換了玩法——YouTube的算法，也從此學(xué)會了更懂你。

2015年，兩個名字寫進了深度學(xué)習(xí)的骨骼——Adam優(yōu)化器和ResNet殘差網(wǎng)絡(luò)。

前者像是給訓(xùn)練提速的渦輪，讓模型跨數(shù)據(jù)集穩(wěn)定奔跑；

后者則打通了「神經(jīng)網(wǎng)絡(luò)的任督二脈」，讓深度從十幾層飆到上百層不再是奢望。

2017年，Transformer來了。它像一座跨領(lǐng)域的超級樞紐，不僅顛覆了NLP，更成了多模態(tài)模型的核心骨架。從此，機器開始學(xué)會「長篇大論」，并且「舉一反三」。

2019年，Rich Sutton總結(jié)了《苦澀的教訓(xùn)》：利用算力，一般的方法終將壓倒性勝過人工工程。

隨之而來的，是被畢樹超反復(fù)強調(diào)的——Scaling Law。

更多數(shù)據(jù)、更多參數(shù)、更多算力，性能就能穩(wěn)步上升。而且，不只是穩(wěn)步。

當(dāng)增長跨過某個臨界點，模型會突然「開竅」：會推理、會診斷、會用你意想不到的方式解決問題。

這不是魔法，而是數(shù)學(xué)與算力堆疊出的質(zhì)變。

過去十年，AI像嬰兒學(xué)會了走路；未來十年，它可能會跑得比任何人都快。

強化學(xué)習(xí)：DeepMind的時代

歷史回顧的第二部分，畢樹超把視線從自監(jiān)督學(xué)習(xí)轉(zhuǎn)向強化學(xué)習(xí)（RL），故事同樣驚心動魄。

2015年，DeepMind推出DQN，AI第一次能從原始像素里學(xué)會玩街機游戲。沒有規(guī)則輸入，沒有人類提示，靠獎勵信號驅(qū)動，正如孩子在不斷嘗試中學(xué)會騎車一樣。。

接著，世界震驚于AlphaGo。先從人類棋譜起步，再靠自我對弈瘋狂磨煉，最終擊敗圍棋世界冠軍。它的升級版AlphaGo Zero更狠——徹底拋開人類經(jīng)驗，從零起跑，卻跑進了人類棋史的巔峰。

那被稱為「神之一手」的第37手，成了載入史冊的AI時刻。

AlphaZero則把這一套搬到國際象棋和將棋，全面碾壓頂尖棋手。而在棋盤之外，OpenAI將強化學(xué)習(xí)的戰(zhàn)場搬到3D即時戰(zhàn)略——Dota 2。最終，他們的AI團隊擊敗了世界級職業(yè)戰(zhàn)隊。

看似風(fēng)光無限，但畢樹超直言——這些都是「單項冠軍」。

它們在特定任務(wù)上超人，卻無法遷移到更多領(lǐng)域。圍棋高手不會自動變成醫(yī)生，AI亦然。

轉(zhuǎn)折出現(xiàn)在預(yù)訓(xùn)練+人類反饋強化學(xué)習(xí)（RLHF）的結(jié)合。

ChatGPT就是這樣煉成的：

先讓模型吸收海量知識，再用人類偏好做微調(diào)，讓它不僅聰明，還更懂交流、更貼近人類思維。

結(jié)果？一場爆發(fā)。原本低調(diào)的研究預(yù)覽，迅速變成全球現(xiàn)象級產(chǎn)品，每周吸引5億+用戶。

畢樹超提醒，強化學(xué)習(xí)是AI可無限擴展的兩條路徑之一（另一條是自監(jiān)督學(xué)習(xí)）。既然預(yù)訓(xùn)練的規(guī)模已被推到極限，下一步，就是在強化學(xué)習(xí)上同樣拉滿算力。

開放問題

數(shù)據(jù)決定智能

當(dāng)話題進入演講的第二大部分，畢樹超的語氣陡然凝重——這一次，他談的不是AI的輝煌戰(zhàn)績，而是擋在前面的瓶頸。

他指出了關(guān)鍵問題：「別以為只要有更大的模型和更多的算力，AI就能無限變強。有一樣?xùn)|西，比算力更稀缺——高質(zhì)量數(shù)據(jù)。」

數(shù)據(jù)紅利，正在消耗殆盡

在過去十年里，我們喂給AI的是人類幾千年來積累的知識寶庫：書籍、論文、代碼、圖片、視頻、網(wǎng)頁……這些數(shù)據(jù)像肥沃的土壤，讓模型在短短幾年長成參天大樹。

但畢樹超警告，這塊土壤正在快速流失。

高質(zhì)量、結(jié)構(gòu)化、真實、有深度的信息，正一點點耗盡。等到庫存見底，光有更大的「樹」和更強的「陽光」（算力），也長不出新枝。

他直言，這是一個全行業(yè)即將面對的「隱形天花板」。

突破口I：讓AI自己造數(shù)據(jù)

解決之道？

畢樹超拋出第一個突破口——讓AI像人類一樣，通過與環(huán)境互動生成新數(shù)據(jù)。

人類的學(xué)習(xí)過程不是坐在教室里背完所有書，而是邊做邊學(xué)。我們在嘗試、失敗、修正中獲得經(jīng)驗，再把這些經(jīng)驗傳遞給別人。

「為什么不能讓AI也這樣做？」他問。

強化學(xué)習(xí)中的自我博弈（self-play）已經(jīng)證明了這一思路：

AlphaGo Zero就是在與自己下棋的過程中，不斷創(chuàng)造并吸收新局面，從而突破人類經(jīng)驗的邊界。

如果AI可以在虛擬環(huán)境、模擬實驗、甚至真實世界的機器人平臺上持續(xù)生成并驗證數(shù)據(jù)，它就能擺脫「吃老本」的命運。

「用算力換數(shù)據(jù)——這是我們唯一能讓曲線繼續(xù)向上的方法之一?！巩厴涑瑥娬{(diào)。

突破口II：讓學(xué)習(xí)更高效

第二個突破口，是數(shù)據(jù)效率。

人類只需看幾局棋，就能學(xué)會規(guī)則并進行策略思考；而大模型往往要消耗百萬、千萬級的樣本，才能掌握類似的技能。

原因何在？

畢樹超給出兩點：

泛化能力——人類會遷移推理模式。學(xué)會數(shù)獨的邏輯，可能幫你下棋時提前幾步預(yù)判。
學(xué)習(xí)粒度——人類學(xué)習(xí)的是「概念」，而不是逐字逐句的「下一個詞」。同一個意思有成千上萬種說法，人類不需要全部記住，而模型卻在消耗大量資源去擬合這些表述。

「這就像你要學(xué)游泳，不是去背所有水花的形狀，而是直接掌握漂浮和劃水的原理?！顾蜗蟮卣f。

如果模型能直接學(xué)習(xí)概念和關(guān)系，而非表面符號，數(shù)據(jù)需求將驟降，學(xué)習(xí)速度也會飛躍。

安全與對齊，難度最高的關(guān)口

即便解決了數(shù)據(jù)問題，畢樹超提醒，還有另一道高墻——安全與對齊。

他將其分為三層：

內(nèi)容安全：避免生成有害信息。
濫用防護：防止被惡意利用。
內(nèi)在對齊：確保AI的目標(biāo)與人類價值觀一致。

前兩層已有較成熟的技術(shù)與策略，但第三層，才是真正的硬骨頭。

未來：AI無處不在

當(dāng)演講進入展望部分，畢樹超開始描繪一幅氣勢恢宏的未來圖景——AI將全面滲透社會的每個角落，重塑我們的生活、工作與認(rèn)知。

智能體：AI時代的手機

畢樹超預(yù)言，推理能力的進步將讓AIAgent像空氣一樣無處不在。

它們會在辦公室?guī)湍阕鲅芯?、寫報告，在家中幫你管理日程、照顧孩子的學(xué)習(xí)。

「想象一下，身邊有一個隨時待命的超級助理，永不疲倦，從不忘事?！?/p>

這不是奢侈品，而會像智能手機一樣普及。

AI for Science：顛覆科研范式

他將科研形容為「在一片浩瀚的可能性海洋中尋找珍珠」。

而AI的搜索能力，將讓我們一次網(wǎng)下去，就撈起整串珍珠。

藥物研發(fā)不再耗費十年，可能幾個月就能找到候選分子；

材料科學(xué)可以在模擬中直接篩出最佳配方；

像AlphaFold這樣的突破將成為常態(tài)。

畢樹超甚至說，科學(xué)家未來可能會有屬于他們的「AlphaGo時刻」——突然看到AI給出一個人類幾代人都沒想到的解法。

AI移掉兩座大山：教育與醫(yī)療

教育領(lǐng)域的變革同樣驚人。

AI可以讓任何人無障礙進入新領(lǐng)域，也可以為頂尖學(xué)者量身打造最優(yōu)學(xué)習(xí)路線。

「也許未來，一個人5年內(nèi)可以完成10個博士課題，」畢樹超半開玩笑地說，「前提是他真的愿意學(xué)?！?/p>

這不僅意味著效率，更意味著教育公平的真正可能——偏遠地區(qū)的孩子，也能享受世界頂級的教學(xué)資源。

AI讓好醫(yī)生觸手可及。

他相信，AI能為更多人帶來高質(zhì)量的醫(yī)療服務(wù)，尤其是在醫(yī)生資源匱乏的地區(qū)。

一個普通診所可能會有AI診斷系統(tǒng)，能像經(jīng)驗豐富的醫(yī)生一樣識別病情，還能實時參考全球最新的醫(yī)學(xué)研究。

「很多人的第一位好醫(yī)生，可能會是AI?！?/p>

具身智能：人類伸向宇宙的觸角

畢樹超將目光投向更遠——具身智能（Embodied AI）。它不僅是機器人在倉庫里搬貨，更是能進入深海、火山、甚至外太空的探索者。

在那些人類無法生存的地方，它們可以代替我們采集數(shù)據(jù)、建造設(shè)施，甚至開啟跨星際的「殖民」嘗試。

「人類的觸角，會通過它們伸向整個宇宙。」

演講人簡介

目前，畢樹超是Meta超智能實驗室研究員，RL/后訓(xùn)練/智能體；之前，在OpenAI研究多模態(tài)和RL。

他聯(lián)合創(chuàng)建了GPT-4o的實時語音界面，主導(dǎo)了OpenAI的多模態(tài)后訓(xùn)練。

他的工作讓人工智能能夠像人類一樣說話——富有情感、自然且即時。

可以把他看作是未來 AGI 助手的聲音設(shè)計師。

他也曾經(jīng)在谷歌從事數(shù)據(jù)科學(xué)。

他是浙江大學(xué)理學(xué)學(xué)士（竺院工高班），加州伯克利大學(xué)理學(xué)博士，大數(shù)據(jù)資深從業(yè)者與實踐者，專注大規(guī)模機器學(xué)習(xí)和統(tǒng)計模型在互聯(lián)網(wǎng)與金融領(lǐng)域的應(yīng)用。

曾在硅谷聯(lián)合創(chuàng)立大數(shù)據(jù)公司，基于谷歌, Facebook和Twitter數(shù)據(jù)指導(dǎo)廣告投放策略與監(jiān)控廣告投放效果。實用主義的數(shù)據(jù)科學(xué)家，深層次去偽存真地理解數(shù)據(jù)價值。

參考資料：

https://www.youtube.com/watch?v=OB9AIHTP5JM

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.