新智元報道
編輯:KingHZ
【新智元導(dǎo)讀】AGI不是未來,它已到來。十年前,他嗤之以鼻;如今,他賭上職業(yè)生涯。Meta科學(xué)家畢樹超揭秘AI進化真突破:更好更快造數(shù)據(jù)。 在哈佛大學(xué)的演講,他還揭秘下一個萬億級AI機會。
今年6月,華人AI研究員畢樹超在哥倫比亞大學(xué)和哈佛大學(xué)發(fā)表演講,講述了在過去十年中,他如何從懷疑AGI逐漸轉(zhuǎn)變?yōu)閷GI的日漸癡迷。
最近,他分享了在哈佛大學(xué)的演講內(nèi)容。
兩次演講主題一致,內(nèi)容類似,關(guān)于硅基智能的過去、開放問題和未來。
從OpenAI離職后,畢樹超加入了Meta的超級智能實驗室,他已經(jīng)分享過哥倫比亞大學(xué)的演講:
有趣的是,在哈佛演講最后,有人提了一個問題:
如果您在「AI原生交互」領(lǐng)域創(chuàng)業(yè),您會押注于哪些多模態(tài)基礎(chǔ)技術(shù)?未來兩年最大的機遇在哪里?
確切的答案,畢樹超承認(rèn)自己不知道,即便知道了也不會公之于眾。
不過他還是回顧了歷史,指出了兩個歷史性突破:
(1)GUI(圖形用戶界面),催生了個人電腦;
(2)多點觸控,催生了移動設(shè)備。
如果有人能基于人工智能找到下一個人機交互方式,那將是一家價值萬億美元的公司。而且他非常肯定地給出了寶貴的洞見:
語音和視覺將成為其中的一部分。它必須非常接近人類自然的交互方式。
AI狂飆史
首先,他介紹了從2012年AI日新月異的進步,拋出一條清晰而震撼的「AI進化時間線」——十年,人工智能完成了一次從蹣跚學(xué)步到奔跑躍遷的蛻變。
2012年,AlexNet橫空出世,「大數(shù)據(jù)+算力」一擊擊碎了數(shù)十年手工特征工程的神話。
2013年,Word2Vec出現(xiàn),引爆「萬物皆向量」革命。
單詞成了可以計算距離的向量,語義之間有了坐標(biāo)系。
推薦系統(tǒng)、搜索引擎瞬間換了玩法——YouTube的算法,也從此學(xué)會了更懂你。
2015年,兩個名字寫進了深度學(xué)習(xí)的骨骼——Adam優(yōu)化器和ResNet殘差網(wǎng)絡(luò)。
前者像是給訓(xùn)練提速的渦輪,讓模型跨數(shù)據(jù)集穩(wěn)定奔跑;
后者則打通了「神經(jīng)網(wǎng)絡(luò)的任督二脈」,讓深度從十幾層飆到上百層不再是奢望。
2017年,Transformer來了。它像一座跨領(lǐng)域的超級樞紐,不僅顛覆了NLP,更成了多模態(tài)模型的核心骨架。從此,機器開始學(xué)會「長篇大論」,并且「舉一反三」。
2019年,Rich Sutton總結(jié)了《苦澀的教訓(xùn)》:利用算力,一般的方法終將壓倒性勝過人工工程。
隨之而來的,是被畢樹超反復(fù)強調(diào)的——Scaling Law。
更多數(shù)據(jù)、更多參數(shù)、更多算力,性能就能穩(wěn)步上升。而且,不只是穩(wěn)步。
當(dāng)增長跨過某個臨界點,模型會突然「開竅」:會推理、會診斷、會用你意想不到的方式解決問題。
這不是魔法,而是數(shù)學(xué)與算力堆疊出的質(zhì)變。
過去十年,AI像嬰兒學(xué)會了走路;未來十年,它可能會跑得比任何人都快。
強化學(xué)習(xí):DeepMind的時代
歷史回顧的第二部分,畢樹超把視線從自監(jiān)督學(xué)習(xí)轉(zhuǎn)向強化學(xué)習(xí)(RL),故事同樣驚心動魄。
2015年,DeepMind推出DQN,AI第一次能從原始像素里學(xué)會玩街機游戲。沒有規(guī)則輸入,沒有人類提示,靠獎勵信號驅(qū)動,正如孩子在不斷嘗試中學(xué)會騎車一樣。。
接著,世界震驚于AlphaGo。先從人類棋譜起步,再靠自我對弈瘋狂磨煉,最終擊敗圍棋世界冠軍。它的升級版AlphaGo Zero更狠——徹底拋開人類經(jīng)驗,從零起跑,卻跑進了人類棋史的巔峰。
那被稱為「神之一手」的第37手,成了載入史冊的AI時刻。
AlphaZero則把這一套搬到國際象棋和將棋,全面碾壓頂尖棋手。而在棋盤之外,OpenAI將強化學(xué)習(xí)的戰(zhàn)場搬到3D即時戰(zhàn)略——Dota 2。最終,他們的AI團隊擊敗了世界級職業(yè)戰(zhàn)隊。
看似風(fēng)光無限,但畢樹超直言——這些都是「單項冠軍」。
它們在特定任務(wù)上超人,卻無法遷移到更多領(lǐng)域。圍棋高手不會自動變成醫(yī)生,AI亦然。
轉(zhuǎn)折出現(xiàn)在預(yù)訓(xùn)練+人類反饋強化學(xué)習(xí)(RLHF)的結(jié)合。
ChatGPT就是這樣煉成的:
先讓模型吸收海量知識,再用人類偏好做微調(diào),讓它不僅聰明,還更懂交流、更貼近人類思維。
結(jié)果?一場爆發(fā)。原本低調(diào)的研究預(yù)覽,迅速變成全球現(xiàn)象級產(chǎn)品,每周吸引5億+用戶。
畢樹超提醒,強化學(xué)習(xí)是AI可無限擴展的兩條路徑之一(另一條是自監(jiān)督學(xué)習(xí))。既然預(yù)訓(xùn)練的規(guī)模已被推到極限,下一步,就是在強化學(xué)習(xí)上同樣拉滿算力。
開放問題
數(shù)據(jù)決定智能
當(dāng)話題進入演講的第二大部分,畢樹超的語氣陡然凝重——這一次,他談的不是AI的輝煌戰(zhàn)績,而是擋在前面的瓶頸。
他指出了關(guān)鍵問題:「別以為只要有更大的模型和更多的算力,AI就能無限變強。有一樣?xùn)|西,比算力更稀缺——高質(zhì)量數(shù)據(jù)。」
數(shù)據(jù)紅利,正在消耗殆盡
在過去十年里,我們喂給AI的是人類幾千年來積累的知識寶庫:書籍、論文、代碼、圖片、視頻、網(wǎng)頁……這些數(shù)據(jù)像肥沃的土壤,讓模型在短短幾年長成參天大樹。
但畢樹超警告,這塊土壤正在快速流失。
高質(zhì)量、結(jié)構(gòu)化、真實、有深度的信息,正一點點耗盡。等到庫存見底,光有更大的「樹」和更強的「陽光」(算力),也長不出新枝。
他直言,這是一個全行業(yè)即將面對的「隱形天花板」。
突破口I:讓AI自己造數(shù)據(jù)
解決之道?
畢樹超拋出第一個突破口——讓AI像人類一樣,通過與環(huán)境互動生成新數(shù)據(jù)。
人類的學(xué)習(xí)過程不是坐在教室里背完所有書,而是邊做邊學(xué)。我們在嘗試、失敗、修正中獲得經(jīng)驗,再把這些經(jīng)驗傳遞給別人。
「為什么不能讓AI也這樣做?」他問。
強化學(xué)習(xí)中的自我博弈(self-play)已經(jīng)證明了這一思路:
AlphaGo Zero就是在與自己下棋的過程中,不斷創(chuàng)造并吸收新局面,從而突破人類經(jīng)驗的邊界。
如果AI可以在虛擬環(huán)境、模擬實驗、甚至真實世界的機器人平臺上持續(xù)生成并驗證數(shù)據(jù),它就能擺脫「吃老本」的命運。
「用算力換數(shù)據(jù)——這是我們唯一能讓曲線繼續(xù)向上的方法之一?!巩厴涑瑥娬{(diào)。
突破口II:讓學(xué)習(xí)更高效
第二個突破口,是數(shù)據(jù)效率。
人類只需看幾局棋,就能學(xué)會規(guī)則并進行策略思考;而大模型往往要消耗百萬、千萬級的樣本,才能掌握類似的技能。
原因何在?
畢樹超給出兩點:
泛化能力——人類會遷移推理模式。學(xué)會數(shù)獨的邏輯,可能幫你下棋時提前幾步預(yù)判。
學(xué)習(xí)粒度——人類學(xué)習(xí)的是「概念」,而不是逐字逐句的「下一個詞」。同一個意思有成千上萬種說法,人類不需要全部記住,而模型卻在消耗大量資源去擬合這些表述。
「這就像你要學(xué)游泳,不是去背所有水花的形狀,而是直接掌握漂浮和劃水的原理?!顾蜗蟮卣f。
如果模型能直接學(xué)習(xí)概念和關(guān)系,而非表面符號,數(shù)據(jù)需求將驟降,學(xué)習(xí)速度也會飛躍。
安全與對齊,難度最高的關(guān)口
即便解決了數(shù)據(jù)問題,畢樹超提醒,還有另一道高墻——安全與對齊。
他將其分為三層:
內(nèi)容安全:避免生成有害信息。
濫用防護:防止被惡意利用。
內(nèi)在對齊:確保AI的目標(biāo)與人類價值觀一致。
前兩層已有較成熟的技術(shù)與策略,但第三層,才是真正的硬骨頭。
未來:AI無處不在
當(dāng)演講進入展望部分,畢樹超開始描繪一幅氣勢恢宏的未來圖景——AI將全面滲透社會的每個角落,重塑我們的生活、工作與認(rèn)知。
智能體:AI時代的手機
畢樹超預(yù)言,推理能力的進步將讓AIAgent像空氣一樣無處不在。
它們會在辦公室?guī)湍阕鲅芯?、寫報告,在家中幫你管理日程、照顧孩子的學(xué)習(xí)。
「想象一下,身邊有一個隨時待命的超級助理,永不疲倦,從不忘事?!?/p>
這不是奢侈品,而會像智能手機一樣普及。
AI for Science:顛覆科研范式
他將科研形容為「在一片浩瀚的可能性海洋中尋找珍珠」。
而AI的搜索能力,將讓我們一次網(wǎng)下去,就撈起整串珍珠。
藥物研發(fā)不再耗費十年,可能幾個月就能找到候選分子;
材料科學(xué)可以在模擬中直接篩出最佳配方;
像AlphaFold這樣的突破將成為常態(tài)。
畢樹超甚至說,科學(xué)家未來可能會有屬于他們的「AlphaGo時刻」——突然看到AI給出一個人類幾代人都沒想到的解法。
AI移掉兩座大山:教育與醫(yī)療
教育領(lǐng)域的變革同樣驚人。
AI可以讓任何人無障礙進入新領(lǐng)域,也可以為頂尖學(xué)者量身打造最優(yōu)學(xué)習(xí)路線。
「也許未來,一個人5年內(nèi)可以完成10個博士課題,」畢樹超半開玩笑地說,「前提是他真的愿意學(xué)?!?/p>
這不僅意味著效率,更意味著教育公平的真正可能——偏遠地區(qū)的孩子,也能享受世界頂級的教學(xué)資源。
AI讓好醫(yī)生觸手可及。
他相信,AI能為更多人帶來高質(zhì)量的醫(yī)療服務(wù),尤其是在醫(yī)生資源匱乏的地區(qū)。
一個普通診所可能會有AI診斷系統(tǒng),能像經(jīng)驗豐富的醫(yī)生一樣識別病情,還能實時參考全球最新的醫(yī)學(xué)研究。
「很多人的第一位好醫(yī)生,可能會是AI?!?/p>
具身智能:人類伸向宇宙的觸角
畢樹超將目光投向更遠——具身智能(Embodied AI)。它不僅是機器人在倉庫里搬貨,更是能進入深海、火山、甚至外太空的探索者。
在那些人類無法生存的地方,它們可以代替我們采集數(shù)據(jù)、建造設(shè)施,甚至開啟跨星際的「殖民」嘗試。
「人類的觸角,會通過它們伸向整個宇宙。」
演講人簡介
目前,畢樹超是Meta超智能實驗室研究員,RL/后訓(xùn)練/智能體;之前,在OpenAI研究多模態(tài)和RL。
他聯(lián)合創(chuàng)建了GPT-4o的實時語音界面,主導(dǎo)了OpenAI的多模態(tài)后訓(xùn)練。
他的工作讓人工智能能夠像人類一樣說話——富有情感、自然且即時。
可以把他看作是未來 AGI 助手的聲音設(shè)計師。
他也曾經(jīng)在谷歌從事數(shù)據(jù)科學(xué)。
他是浙江大學(xué)理學(xué)學(xué)士(竺院工高班),加州伯克利大學(xué)理學(xué)博士,大數(shù)據(jù)資深從業(yè)者與實踐者,專注大規(guī)模機器學(xué)習(xí)和統(tǒng)計模型在互聯(lián)網(wǎng)與金融領(lǐng)域的應(yīng)用。
曾在硅谷聯(lián)合創(chuàng)立大數(shù)據(jù)公司,基于谷歌, Facebook和Twitter數(shù)據(jù)指導(dǎo)廣告投放策略與監(jiān)控廣告投放效果。實用主義的數(shù)據(jù)科學(xué)家,深層次去偽存真地理解數(shù)據(jù)價值。
參考資料:
https://www.youtube.com/watch?v=OB9AIHTP5JM
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.