公司情報(bào)專家《財(cái)經(jīng)涂鴉》獲悉,9 月 11 日,香港大學(xué)計(jì)算與數(shù)據(jù)科學(xué)學(xué)院院長(zhǎng)馬毅在 2025 Inclusion·外灘大會(huì)開幕主論壇上發(fā)表主題演講。
他指出,當(dāng)前人工智能雖技術(shù)蓬勃發(fā)展,卻仍缺乏對(duì)智能本質(zhì)的科學(xué)理解,因此,“必須將AI從依賴試錯(cuò)、不可解釋的‘黑箱’系統(tǒng),轉(zhuǎn)變?yōu)榛跀?shù)學(xué)原理與閉環(huán)反饋的‘白箱’模型,才能真正實(shí)現(xiàn)機(jī)器智能”。
“智能的核心在于‘自我驗(yàn)證與自我糾錯(cuò)’的能力,而當(dāng)前的大模型僅是靜態(tài)知識(shí)的存儲(chǔ)庫(kù),因而才會(huì)出現(xiàn)基礎(chǔ)邏輯混亂和‘幻覺(jué)’問(wèn)題”。 馬毅表示,“雖然擁有海量‘知識(shí)’,但它們并不具備真正的‘智能’。”
展望未來(lái),他認(rèn)為,必須將智能作為一個(gè)嚴(yán)謹(jǐn)?shù)目茖W(xué)與數(shù)學(xué)課題來(lái)研究,聚焦于構(gòu)建具備個(gè)體記憶與閉環(huán)自治能力的系統(tǒng),在可解釋的理論框架下推動(dòng)機(jī)器智能向真正意義上的“自主智能”演進(jìn)。
以下為馬毅演講全文(根據(jù)表述需求有所刪減):
大家好!
過(guò)去十幾年人工智能的發(fā)展,令人變得既“興奮”又非常“焦慮”——作為計(jì)算學(xué)院院長(zhǎng),我在香港大學(xué)今年招生時(shí),收到了無(wú)窮多的家長(zhǎng)的電話:馬老師,到底我的小孩該學(xué)什么專業(yè)?五年畢業(yè)以后、四年畢業(yè)以后,是不是工作還在?
中國(guó)的哲學(xué)講,大道至簡(jiǎn)。很可能這些千變?nèi)f化的技術(shù)背后,只是一個(gè)非常簡(jiǎn)單、統(tǒng)一的機(jī)制在起作用。所以,遵循第一性原理,先搞清楚目的,其它的無(wú)非就是手段而已。
世界上有兩件事情最值得學(xué)習(xí),一個(gè)是宇宙怎么來(lái)的?這是物理研究的問(wèn)題;一個(gè)是生命怎么來(lái)的?這是智能要研究的問(wèn)題。
大家現(xiàn)在都在談大模型/Scaling Laws,實(shí)際上我們的DNA就是自然界最早的大模型。它學(xué)到了外部世界所有值得傳承的知識(shí),通過(guò)DNA編碼傳承記憶下去。它的迭代的方式,今年的圖靈獎(jiǎng)有一個(gè)有趣的名字,叫作Reinforcement Learning。
所以,自然界早就在做這個(gè)事情,已經(jīng)做了幾十億年。從這個(gè)角度看,現(xiàn)在智能發(fā)展的階段,就是生命發(fā)展的最早期。
但是,5億年前發(fā)生一件了不起的事情,每個(gè)個(gè)體開始出現(xiàn)了大腦、神經(jīng)系統(tǒng),出現(xiàn)了視覺(jué)。之后很快就出現(xiàn)了寒武紀(jì)/生命大爆發(fā)。此前,DNA個(gè)體是沒(méi)有智能的。一旦個(gè)體的智能、感知和記憶出現(xiàn),Learn from your feedback,Learn from your errors,將會(huì)大大提高每個(gè)個(gè)體的適應(yīng)性。
而且,智能發(fā)展是一直在擺脫這種大模型的進(jìn)化。第一個(gè)階段,是我們出生之后會(huì)逐漸想擺脫DNA,去學(xué)更多外部世界的知識(shí);第二個(gè)階段,是人發(fā)明了語(yǔ)言和文字,將文明一代代傳承下去,用文字取代了DNA的作用。
再往后,3000年前我們發(fā)明了數(shù)學(xué)和邏輯,開始對(duì)科學(xué)知識(shí)進(jìn)行編碼,導(dǎo)致了科學(xué)的發(fā)展。這才是artificial intelligence所包含的真正意義。
現(xiàn)在很多人認(rèn)為人工智能源于1956年,這是完全錯(cuò)誤的觀念,真正的起源是1940年代,一個(gè)叫Norbert Wiener的MIT教授,提出來(lái)Cybernetics,可以簡(jiǎn)要翻譯成控制論。他研究的是動(dòng)物是怎么學(xué)習(xí),如何用機(jī)器實(shí)現(xiàn)動(dòng)物層面的智能。那個(gè)時(shí)代所有跟智能相關(guān)的人都是受他的影響,比如信息論的奠基人香農(nóng)、對(duì)策論的奠基人馮·諾依曼。
不過(guò),現(xiàn)在出現(xiàn)了一個(gè)非常時(shí)髦的詞,具身智能。大家知道,剛開始人對(duì)神經(jīng)元理解之后,就急著去Networks,并聲稱可以建模型了,機(jī)器可以自己思考了,有自己的意識(shí)了,可以干所有的活了,所有工作我們都不用做了。
50年代時(shí),這種牛就已經(jīng)吹過(guò)了。當(dāng)然,是以失敗告終。但還是有很多人堅(jiān)持,2012年,數(shù)據(jù)和算力讓神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)變成可能。后面發(fā)生的事情,跟生命早期發(fā)生的事情一模一樣,大浪淘沙。
為什么我們一定要把它搞清楚呢?因?yàn)槿魏问虑橐坏┦呛诤凶樱蜁?huì)變成歷史的教訓(xùn)。我們不理解天體運(yùn)動(dòng)時(shí),就會(huì)出現(xiàn)封建迷信??茖W(xué)就是要把它們解釋清楚,告訴大家它的原因、它的機(jī)理是什么。
為什么要學(xué)習(xí)?什么是值得學(xué)習(xí)的?智能都是在看似無(wú)序的世界中找到規(guī)律,把它有用的知識(shí)形成記憶,記下來(lái)。所有可預(yù)測(cè)的信息都是我們觀測(cè)的高維數(shù)據(jù),如果它是有可預(yù)測(cè)的信息,它的內(nèi)在結(jié)構(gòu)都是低維的。牛頓第一定律說(shuō),當(dāng)一個(gè)物體不受外力的時(shí)候,它會(huì)在一條直線上運(yùn)動(dòng),不會(huì)在三維空間中任何一個(gè)維度出現(xiàn)。
所有的物理定律都是以等式的形式出現(xiàn),為什么?多一個(gè)等式對(duì)于外部世界的解空間降一維,多一個(gè)等次降一維。最新的理論告訴大家,從黑洞爆炸開始,所有的物理規(guī)律,整個(gè)宇宙世界是在一個(gè)十維的空間,它不是一個(gè)無(wú)窮維。數(shù)學(xué)上,大家都講神經(jīng)網(wǎng)絡(luò)是一個(gè)inductor,實(shí)際上第一性原理就是你只需要一個(gè)最簡(jiǎn)單的assumption。
我可以告訴大家,推導(dǎo)出過(guò)去十年所做的所有事情,只需要一個(gè)假設(shè),你的數(shù)據(jù)、值得學(xué)習(xí)的數(shù)據(jù),它的數(shù)學(xué)結(jié)構(gòu)是低維的,這是我們需要的唯一假設(shè),所有的東西可以通過(guò)嚴(yán)格的數(shù)學(xué)手段和邏輯推導(dǎo)出來(lái)。
人類花了八十年,從不可計(jì)算到可計(jì)算,從不tractable到tractable, 從tractable到scalable, 才導(dǎo)致了今天人工智能的技術(shù)。但即使用了人工智能技術(shù),到了scalable,效率離nature至少還差十個(gè)數(shù)量級(jí)——此刻可能是又該向自然界學(xué)習(xí)的時(shí)候了,不要還那么自以為是,我們還處在生命發(fā)展的極早期,剛剛開始,甚至還沒(méi)有開始。
Jeff Hinton 2022年已經(jīng)承認(rèn)了,自然界不做back propagation,太貴了,沒(méi)法做,只有埃隆馬斯克可以玩得起,我們玩不起。但是自然界有另外的一條路通向羅馬,就是similarities,反饋控制,連續(xù)學(xué)習(xí)的機(jī)理。
我們的大腦是幾十萬(wàn)個(gè)閉環(huán)系統(tǒng)聯(lián)結(jié)在一起的并行分布的事情,我們對(duì)實(shí)現(xiàn)這樣的技術(shù)還根本沒(méi)有開始。用General purpose的計(jì)算機(jī)、CPU、GPU去實(shí)現(xiàn)智能真正所需要的計(jì)算,是一條極其極其繞的彎路。大家想找的近路,自然界早就找到了。
最后,再給大家講一下,大家對(duì)智能的理解有非常多的誤區(qū),認(rèn)為一個(gè)系統(tǒng)有知識(shí)就是有智能。實(shí)際上是不對(duì)的——
GPT有知識(shí),它沒(méi)有智能,它就跟早期的DNA一樣;新生兒有智能,不一定有很多知識(shí),但卻有機(jī)會(huì)成為下一個(gè)愛(ài)因斯坦。能夠?qū)θ祟愔R(shí)有自己學(xué)習(xí)的能力,甚至糾正人類所有知識(shí)里面的缺陷,這才是智能的本質(zhì)。
大家都在談,過(guò)去是人工智能的時(shí)代,實(shí)際上不是。我們過(guò)去十年所做的事情,還僅僅局限在40年代實(shí)現(xiàn)動(dòng)物層面的,即感知、記憶、生成、預(yù)測(cè)這一層的機(jī)理,離真正的1956年人工智能的Program,還沒(méi)有開始。嚴(yán)格來(lái)講,所有的模型,包括GPT5,連基本的自然數(shù)的概念都沒(méi)有。
現(xiàn)在大家都在很籠統(tǒng)的講,什么圖靈測(cè)試都超過(guò)人了。那計(jì)算器做加減乘除早就超過(guò)人了。所以,該怎么科學(xué)的界定一個(gè)系統(tǒng)它的智能的能力?
這件事情我們要認(rèn)真的去反思。圖靈測(cè)試,到底一個(gè)系統(tǒng)它完成一個(gè)任務(wù)是基于記憶還是真正的理解了知識(shí)?現(xiàn)在經(jīng)常有人說(shuō),大模型可以取代科學(xué)家、Poster、PHD了,真的嗎?它們有沒(méi)有科學(xué)家所具備的這種能力,現(xiàn)在必須界定清楚,而不能籠統(tǒng)的討論,那不濟(jì)于事。
這是我們最近完全開源的一本書,中文、英文AI翻譯的,內(nèi)容是關(guān)于學(xué)習(xí),建立智能的數(shù)學(xué)原理,以及深度學(xué)習(xí)。完全把黑盒子打開成白盒,現(xiàn)在成為一個(gè)開源的項(xiàng)目,跟王堅(jiān)總講的很像,大家可以去試一試。
所以,有沒(méi)有可能把智能作為一個(gè)科學(xué)的問(wèn)題、數(shù)學(xué)的問(wèn)題,界定清楚,變成白盒子,連高中生大家都能知道它在做什么,這是過(guò)去很多團(tuán)隊(duì)一起在做的事情。
大家想通過(guò)一個(gè)talk就了解一個(gè)智能,這是完全異想天開,其中必須要有嚴(yán)格的、科學(xué)的、數(shù)學(xué)的證據(jù)鏈,以及實(shí)驗(yàn)的證據(jù)鏈。這是我們過(guò)去十年認(rèn)真在做的一件事情,也是學(xué)術(shù)界、科學(xué)界必須做的事情。我們必須當(dāng)成一個(gè)真正的工程來(lái)完成,這是我希望大家了解的。
謝謝大家!
作者:蘇打
編輯:tuya
出品:財(cái)經(jīng)涂鴉(ID:caijingtuya)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.