2025年秋天,麻省理工學(xué)院的答辯教室里。
這是位華人青年,剛剛完成博士論文答辯。
他叫陳博遠(yuǎn)(Boyuan Chen),不到四年拿下了MIT博士學(xué)位。
此刻,他已經(jīng)是OpenAI的研究科學(xué)家。
其實(shí),陳博遠(yuǎn)高中時(shí)還不懂Python,因?yàn)橐淮蜗牧顮I(yíng)邂逅AI。
如今,他已經(jīng)成為OpenAI GPT圖像生成的核心成員。
正在悄悄構(gòu)建,讓AI真正理解世界的模型。
而這,可能是通往通用人工智能的真正密碼。
他正在研究的世界模型,正在成為全球AI競(jìng)賽的新焦點(diǎn)。
偶然邂逅AI
然而,陳博遠(yuǎn)進(jìn)入AI 世界,純屬偶然。
時(shí)間倒回他的高中時(shí)代。
此時(shí),他沒有接觸過Python和NumPy,對(duì)它們懵懂不知。
在一次科技夏令營(yíng),他邂逅了當(dāng)時(shí)谷歌DeepMind的研究員FeiXia博士。
這位學(xué)者向一群高中生,展示了深度學(xué)習(xí)的神奇。
這次接觸,為陳博遠(yuǎn)打開了全新的大門。
“FeiXia是我在AI世界的啟蒙老師?!?/strong>
多年后,陳博遠(yuǎn)在采訪時(shí)說。
短暫的相遇,成為兩個(gè)人師徒緣分的開始。
也悄然改變了這個(gè)年輕人的一生。
進(jìn)入加州大學(xué)伯克利分校后,陳博遠(yuǎn)選擇了一條非典型路。
他除了主修計(jì)算機(jī)科學(xué)和數(shù)學(xué),還輔修了一年哲學(xué)。
文理雙修的背景,讓他的研究風(fēng)格非常獨(dú)特。
既能深入技術(shù)細(xì)節(jié),又能跳出來思考問題的本質(zhì)。
大學(xué)的時(shí)候,他創(chuàng)辦了一家機(jī)器人教育公司,主導(dǎo)開發(fā)競(jìng)賽用機(jī)器人套件。
從硬件設(shè)計(jì)到軟件編程,他全程親力親為。
這段創(chuàng)業(yè)經(jīng)歷,他明白了一個(gè)樸素卻深刻的道理。
技術(shù)再好,不能落地也是空中樓閣。
這個(gè)認(rèn)知,讓他比許多同齡人的步伐快了十年。
2021年,陳博遠(yuǎn)進(jìn)入MIT讀博士。
他師從機(jī)器人領(lǐng)域的權(quán)威Russ Tedrake教授和計(jì)算機(jī)視覺專家Vincent Sitzmann教授。
但是,天之驕子的學(xué)術(shù)之路也不順利。
博士第一年,他陷入了人生低谷。
整整一年他沒有寫出任何論文或者研究成果。
在MIT這樣的頂尖學(xué)府,這種壓力足以壓垮大多數(shù)人。
就在這個(gè)時(shí)候,F(xiàn)eiXia博士再次出現(xiàn)了。
已經(jīng)是DeepMind資深研究員的他,向陳博遠(yuǎn)伸出橄欖枝。
他邀請(qǐng)陳博遠(yuǎn),一起合作完成NLMap項(xiàng)目。
這個(gè)項(xiàng)目,是讓機(jī)器人能夠理解自然語言指令。
比如對(duì)機(jī)器人說“請(qǐng)把桌子上的紅色杯子拿過來”。
機(jī)器人聽懂指令后,能自動(dòng)掃描環(huán)境,找到目標(biāo)并規(guī)劃好路徑。
沒想到NLMap項(xiàng)目一炮而紅,這成為陳博遠(yuǎn)學(xué)術(shù)生涯的第一個(gè)爆款。
后來,他們又合作開發(fā)了SpatialVLM,讓AI更好地理解和解析物理空間。
什么是世界模型?
說到這,你可能會(huì)問,什么是世界模型?
現(xiàn)在的AI,雖然能生成圖片和視頻,但它并不真正理解。
也不懂這個(gè)世界的運(yùn)行規(guī)律。
就像一個(gè)人背會(huì)了交規(guī)手冊(cè),但從未實(shí)際上路開過車。
AI技術(shù),也只是研究員們存儲(chǔ)更多的資料,它按用戶要求找到資料。
至于用戶的真正意思,AI其實(shí)并不理解。
而陳博遠(yuǎn)研究的世界模型,就是讓AI具備理解能力。
簡(jiǎn)單來說,就是給AI一個(gè)類似人類認(rèn)知的大腦地圖。
他強(qiáng)調(diào),視覺世界模型對(duì)智能非常重要。
這就是讓機(jī)器人,理解我們生活世界的關(guān)鍵。
陳博遠(yuǎn)的研究,很快就在OpenAI的實(shí)際產(chǎn)品中,發(fā)揮了重要作用。
身為GPT圖像生成核心團(tuán)隊(duì),他的世界模型思路,融入圖像生成技術(shù)。
因此,AI生成的畫面,更符合真實(shí)世界的物理規(guī)律。
為什么Sora生成的視頻里,物體運(yùn)動(dòng)光影的變化貼近現(xiàn)實(shí)?
這背后,就是世界模型的支撐。
沒有什么比看到自己的研究,改變領(lǐng)域范式讓人興奮了。
陳博遠(yuǎn)在博士答辯后,這樣說道。
在AI研究越來越細(xì)分的今天,陳博遠(yuǎn)的跨學(xué)科背景格外珍貴。
他不僅是技術(shù)高手,還是個(gè)哲學(xué)愛好者。
他的哲學(xué)思想,讓他看問題的角度,和純技術(shù)的研究員不同。
他常說,研究AI,不僅要解決怎么實(shí)現(xiàn),更要清楚為什么這樣做。
2024年,陳博遠(yuǎn)在個(gè)人博客中寫道:
我可以負(fù)責(zé)任地告訴大家,具身智能一定是下一個(gè)一百年最令人激動(dòng)的技術(shù)。
并且,我們?cè)谟猩?,很有希望見證通用機(jī)器人的誕生。
但他同時(shí)強(qiáng)調(diào),這個(gè)過程需要細(xì)水長(zhǎng)流的投入,不能被短期熱點(diǎn)牽著走。
引用他導(dǎo)師的話,可以以結(jié)果為導(dǎo)向做科研,但不可以網(wǎng)紅視頻為導(dǎo)向。
在浮躁的AI圈,他的理性尤為珍貴。
OpenAI的野心,他的未來
現(xiàn)在,陳博遠(yuǎn)的研究方向,和OpenAI的戰(zhàn)略布局,不謀而合。
最近,OpenAI被曝出正在組建專門的人形機(jī)器人算法團(tuán)隊(duì)。
招聘信息中明確,要在動(dòng)態(tài)的真實(shí)世界環(huán)境中,推動(dòng)AGI級(jí)別的智能。
知情人士透露,新團(tuán)隊(duì)的重點(diǎn),就是開發(fā)能讓機(jī)器人理解物理世界的技術(shù)。
這幾乎是為陳博遠(yuǎn)的研究量身定制。
陳博遠(yuǎn)明確,他將在OpenAI繼續(xù)推進(jìn)世界模型,在具身智能領(lǐng)域的應(yīng)用。
他愿意用一生,推動(dòng)通用機(jī)器人的發(fā)展。
看看他過去幾年的成長(zhǎng)軌跡,誰又能說這個(gè)目標(biāo)不可能實(shí)現(xiàn)呢?
陳博遠(yuǎn)的成長(zhǎng)軌跡,打破了很多人對(duì)天才的刻板印象。
他也曾經(jīng)歷人生的低谷和焦慮。
但他堅(jiān)持深耕世界模型,相對(duì)冷門的領(lǐng)域。
這種定力,在AI圈尤其可貴。
畢竟,每天都有AI新概念、新風(fēng)口。
他的堅(jiān)持,最終迎來了回報(bào)。
GPT和Sora等模型的成功,世界模型的價(jià)值被徹底認(rèn)可。
學(xué)術(shù)界和工業(yè)界都意識(shí)到,讓AI理解世界規(guī)律,比單純堆砌數(shù)據(jù)更重要。
特斯拉推進(jìn)Optimus,谷歌深耕機(jī)器人控制算法,OpenAI組建機(jī)器人團(tuán)隊(duì)...
全球科技巨頭,都是在爭(zhēng)奪這個(gè)領(lǐng)域的制高點(diǎn)。
而陳博遠(yuǎn),在這個(gè)方向深耕多年,已經(jīng)站在了領(lǐng)跑位置。
在AI技術(shù)不斷創(chuàng)新的今天,真正的突破,從來都來自那些既懂技術(shù)又有耐心,既仰望星空又腳踏實(shí)地的研究者。
陳博遠(yuǎn)和他的世界模型,或許正是打開下一代AI大門的鑰匙。
素材來源:
1、《新智元》來自MIT最強(qiáng)AI實(shí)驗(yàn)室:OpenAI天才華人研究員博士畢業(yè)了!
2、《網(wǎng)易》中美AI競(jìng)爭(zhēng)加?。篛penAI華人博士引領(lǐng)顛覆性研究新篇章
本文作者 | 檸檬雪
責(zé)任編輯 | 淡淡翠
策劃 | 淡淡翠
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.