2025年7月,諾貝爾物理學(xué)獎(jiǎng)得主、“人工智能教父”杰弗里·辛頓的身影首次出現(xiàn)在中國上海。這是他多年來首次長途國際旅行,腰傷在身的他無法久坐,卻仍以站立姿態(tài)密集參與這場聚焦AI安全的跨國對(duì)話。
這次中國行,辛頓參加了閉門研討,并與圖靈獎(jiǎng)得主姚期智、UC伯克利教授Stuart Russell等頂尖學(xué)者共同促成《上海共識(shí)》,還與上海人工智能實(shí)驗(yàn)室主任周伯文展開 17 分鐘高密度對(duì)話。針對(duì) AI 意識(shí)是否存在的爭論,辛頓拋出驚人之語:今天的大模型已具備“主觀體驗(yàn)”,只是人類對(duì)“意識(shí)”一詞的理解模型本身便是錯(cuò)的。
面對(duì)潛在失控風(fēng)險(xiǎn),他首次系統(tǒng)性提出把“讓 AI 變聰明”與“讓 AI 變善良”拆分成兩條平行研究路線——各國可以像共享疫苗技術(shù)那樣共享“善良算法”,而不必泄露核心智能機(jī)密。談及科學(xué)未來,辛頓以 AlphaFold 破解蛋白質(zhì)折疊、AI 超越傳統(tǒng)方程預(yù)測(cè)臺(tái)風(fēng)為例,斷言 AI 將徹底改寫科研范式;他最后向在場平均年齡 30 歲的研究者喊話:真正的突破永遠(yuǎn)誕生于“眾人皆錯(cuò)我獨(dú)往”的領(lǐng)域,堅(jiān)持直覺、親手驗(yàn)證,才可能走出人類的“第 37 步”。以下,Enjoy:
來源丨硅星人Pro
作者丨
王兆洋 | wangzhaoyang @pingwest.com
董道力 | dongdaoli@pingwest.com
諾貝爾物理學(xué)獎(jiǎng)獲得者,被稱為人工智能教父之一的杰弗里·辛頓,只能站著。
他的腰傷是老毛病,平躺或者站立,卻不能久坐。這在人工智能圈里是人們熟知的,但耐不住AI的出圈,讓這件事有了些小風(fēng)波。
2025年7月26日,上海人工智能大會(huì)正式開幕,新晉諾貝爾獎(jiǎng)得主的辛頓第一次來到了中國。而據(jù)接近行程安排的人透露,這也是辛頓多年來第一次長途國際旅行。而作為今天少有的身份獨(dú)立但影響力巨大的AI科學(xué)家,辛頓的行程自然緊張。
其實(shí)7月22日他便已抵達(dá)上海,此行重要目的之一,是探討AI欺騙性行為帶來的關(guān)鍵風(fēng)險(xiǎn),這是“AI安全國際對(duì)話”(International Dialogues on AI Safety - IDAIS)系列的一部分,這個(gè)會(huì)議由上海期智研究院,AI安全國際論壇(SAIF),和上海人工智能實(shí)驗(yàn)室主辦。
一整個(gè)周末,他在會(huì)場和多位科學(xué)家一起討論,包括圖靈獎(jiǎng)得主及上海期智研究院院長姚期智教授、加州大學(xué)伯克利分校教授Stuart Russell、上海人工智能實(shí)驗(yàn)室主任周伯文教授等科學(xué)家,最終一起提出了AI安全的“上海共識(shí)”。
7月25日晚些時(shí)候,原本辛頓計(jì)劃出現(xiàn)在最終的發(fā)布會(huì)上,一眾媒體也為此而來,然而辛頓最終并沒有現(xiàn)身。姚期智和一眾科學(xué)家一起發(fā)布了此次倡導(dǎo)國際合作的上海共識(shí)。在這個(gè)辛頓深度參與的共識(shí)里,對(duì)于新近出現(xiàn)的關(guān)于人工智能欺騙行為的實(shí)證證據(jù),并提出了應(yīng)對(duì)策略,呼吁采取三項(xiàng)關(guān)鍵行動(dòng):
第一,要求前沿人工智能開發(fā)者提供安全保障。提出開發(fā)者在模型部署前應(yīng)先進(jìn)行全面的內(nèi)部檢查和第三方評(píng)估,開展深入的模擬攻防與紅隊(duì)測(cè)試。若模型達(dá)到了關(guān)鍵能力閾值(比如檢測(cè)模型是否有具備幫助沒有專業(yè)知識(shí)的非法分子制造生化武器的能力),開發(fā)者應(yīng)向政府等說明潛在風(fēng)險(xiǎn)。
第二,通過加強(qiáng)國際協(xié)調(diào), 共同確立并恪守可驗(yàn)證的全球性行為紅線。國際社會(huì)需要合作劃出人工智能開發(fā)不可以逾越的紅線,并應(yīng)建立一個(gè)具備技術(shù)能力、具有國際包容性的協(xié)調(diào)機(jī)構(gòu),匯聚各國人工智能安全主管機(jī)構(gòu),以共享風(fēng)險(xiǎn)相關(guān)信息,并推動(dòng)評(píng)估規(guī)程與驗(yàn)證方法的標(biāo)準(zhǔn)化。
第三,對(duì)保障安全性的開發(fā)方式進(jìn)行投資,科學(xué)界和開發(fā)者應(yīng)投入一系列嚴(yán)格機(jī)制來保障人工智能系統(tǒng)的安全性。長期需要化被動(dòng)為主動(dòng),構(gòu)建基于“設(shè)計(jì)即安全”的人工智能系統(tǒng)。
這次會(huì)議的主要參會(huì)者合影留念時(shí),辛頓獨(dú)自站在后面。這張照片在社交媒體上引發(fā)了討論:“為什么他沒有座位?!?/p>
7月26日早上,在上海人工智能大會(huì)的正式開幕式上,辛頓又上臺(tái)做了演講。PPT一左一右中英文對(duì)照。
在討論了諸多對(duì)AI與人類行為相似度的思考后,辛頓把話題引向安全。
他提到,今天幾乎所有專家都認(rèn)為會(huì)出現(xiàn)比人類更智能的AI,這些智能體是否會(huì)反過來操縱人類?
“簡單關(guān)閉它們不現(xiàn)實(shí),就像養(yǎng)老虎當(dāng)寵物,養(yǎng)大后可能被其傷害?!?/p>
這是很激進(jìn)的說法,但辛頓最近的主要公開發(fā)言,都在向人類提出類似警告。
他提出的應(yīng)對(duì)措施是,人類既然無法消除AI,那就必須找到一種訓(xùn)練AI不消滅人類的方法。他呼吁國際合作,提出要像人類預(yù)防核戰(zhàn)爭一樣,建立國際社群來預(yù)防AI操縱世界,推動(dòng)AI向善。
“我們希望能夠有一個(gè)AI安全機(jī)構(gòu)構(gòu)成的一個(gè)國際社群來研究技能,來培訓(xùn)AI,讓他們向善?!?/p>
在當(dāng)天的WAIC開幕式,以及后續(xù)的多個(gè)論壇里,安全被放在最重要的位置討論。而今天你很難找到一個(gè)如此高規(guī)格和關(guān)注度的會(huì)議上,給安全治理如此大篇幅的重視。
辛頓此前在離開Google后,開始在AI對(duì)人的安全威脅問題上不停提出警告。但這種呼吁,有時(shí)候在AI一片高速競爭里顯得不合時(shí)宜,尤其硅谷此刻正處在Meta和OpenAI們重新塑造的“Moving fast break everything ”文化之下,這樣的聲音被繼續(xù)沖散。
對(duì)于辛頓來說,這時(shí)候一個(gè)全球化的,能被更多人認(rèn)真對(duì)待的安全呼吁對(duì)他來說充滿吸引力。一個(gè)愿意花費(fèi)更高規(guī)格更多注意力在AI安全討論上的氛圍,對(duì)他來說也很重要。據(jù)一名了解辛頓此次上海行程的人士透露,他自己也對(duì)參與哪些環(huán)節(jié)有很多想法。主動(dòng)把自己的行程排的很滿。
7月26日下午,當(dāng)辛頓上午的演講和PPT在各種AI群里傳播時(shí),他本人已經(jīng)來到模速空間旁的西岸美高梅酒店,參加他此次行程里唯一一場公開對(duì)話活動(dòng)。
美高梅一樓不大的會(huì)議廳里,隨著辛頓的環(huán)節(jié)臨近,人越來越多。辛頓并沒像其他嘉賓提前到場,據(jù)透露,他從另一場高級(jí)別閉門會(huì)議趕過來,在場的工作人員每隔幾分鐘同步一下他的行程。
在缺席了一天前幾乎同一時(shí)間的見面會(huì)后,5點(diǎn)10分,在一場有三個(gè)院士的圓桌之后,辛頓終于亮相出場。全場起立鼓掌拍照。
在這場和周伯文的對(duì)話里,辛頓提出了更多的想法,也給年輕的科學(xué)家們提出更多建議。
以下是最新出爐的對(duì)話實(shí)錄。在這個(gè)對(duì)話里,辛頓提出了許多充滿智慧的建設(shè)性的提議,它們都需要國際合作,需要一些更有影響力的牽頭者。也許這也是辛頓此次到來的原因之一。
周伯文:非常感謝。Jeff,您能親臨現(xiàn)場,對(duì)我們所有人來說都是一份真正的榮幸。 非常感謝。我想從一個(gè)我們本周早些時(shí)候就該討論的問題開始,但今天上午在臺(tái)上我們沒有時(shí)間深入。這個(gè)問題是關(guān)于多模態(tài)和前沿模型的主觀體驗(yàn)(subjective experiences)。 您認(rèn)為今天的多模態(tài)和前沿模型也能發(fā)展出主觀體驗(yàn)嗎? 您能否就其可能性問題,展開談?wù)勀目捶ǎ?/p>
辛頓:這嚴(yán)格來說與科學(xué)無關(guān),這是一個(gè)關(guān)于你如何理解“主觀經(jīng)驗(yàn)”、“靈魂”或“意識(shí)”等概念的問題 。我相信,我們大多數(shù)人持有的模型是深度錯(cuò)誤的 。很多人沒有意識(shí)到,即便你能正確地使用詞語,并且擁有一套關(guān)于詞語如何運(yùn)作的理論,這套理論也可能完全是錯(cuò)的,哪怕是對(duì)于日常詞匯。所以,我想舉一個(gè)日常用語的例子,對(duì)于這些詞,你有一套自己的理論,它們看似簡單直白,但你的理論卻是錯(cuò)的 。
你需要接受這樣一種觀點(diǎn):你對(duì)于“工作”、“健康”等詞語真正含義的理論可能是錯(cuò)誤的 。我們來看看“水平(horizontal)”和“垂直(vertical)”這兩個(gè)詞。大多數(shù)人認(rèn)為他們明白這兩個(gè)詞的意思,但他們的理論其實(shí)是不正確的 。我會(huì)通過問一個(gè)人們幾乎總是答錯(cuò)的問題來證明這一點(diǎn) 。
假設(shè)我把許多小的鋁棒向空中拋撒,它們?cè)诳罩蟹瓭L碰撞 。然后我突然凍結(jié)時(shí)間,空中布滿了這些朝向各異的鋁棒 。問題是:與垂直方向夾角在一度以內(nèi)的鋁棒多,還是與水平方向夾角在一度以內(nèi)的鋁棒多,或者兩者數(shù)量差不多?幾乎所有人都回答“差不多”,這是基于他們對(duì)這兩個(gè)詞的理論 。
但他們錯(cuò)得離譜,差距超過100倍。對(duì)于這些小鋁棒來說,處于水平方向一度范圍內(nèi)的數(shù)量,大約是處于垂直方向一度范圍內(nèi)數(shù)量的114倍 。原因在于,“垂直”就是這樣(指一個(gè)方向),這也是垂直,僅此而已 。但“水平”是這樣,這也是水平,這些都是水平 。因此,水平的“桿狀物”遠(yuǎn)比垂直的要多。“垂直”是非常特殊的 。
現(xiàn)在換一個(gè)問題。我手里有一把鋁制的圓盤,我把它們拋向空中并凍結(jié)時(shí)間 。那么,是與垂直方向夾角一度以內(nèi)的圓盤多,還是與水平方向一度以內(nèi)的多?這次答案反過來了,與垂直方向一度以內(nèi)的圓盤數(shù)量,是水平方向的大約114倍 。因?yàn)閷?duì)于一個(gè)圓盤或一個(gè)平面來說,“水平”就是這樣,僅此而已 。而“垂直”是這樣,這也是垂直,這些都是垂直 。
所以在三維空間里,垂直的“桿”很特殊,而水平的“桿”很普遍;但水平的“面”很特殊,而垂直的“面”卻很普遍 。當(dāng)你形成關(guān)于這些詞的理論時(shí),你往往會(huì)取一個(gè)平均化的概念,認(rèn)為水平和垂直差不多,但這完全是錯(cuò)的 。它取決于你討論的是線還是面 。人們不了解這一點(diǎn),因此會(huì)給出錯(cuò)誤的答案 。
這看起來似乎與意識(shí)問題無關(guān),但并非如此 。它說明了我們對(duì)于詞語如何運(yùn)作的理論可能是完全錯(cuò)誤的 。我的觀點(diǎn)是,幾乎每個(gè)人對(duì)于像“主觀經(jīng)驗(yàn)”這類術(shù)語如何運(yùn)作的理論,都是完全錯(cuò)誤的 。他們持有一個(gè)非常頑固但完全錯(cuò)誤的理論 。所以這并非一個(gè)真正的科學(xué)問題,而是從一個(gè)錯(cuò)誤的心理狀態(tài)模型出發(fā)導(dǎo)致的問題 。基于錯(cuò)誤模型,你自然會(huì)做出錯(cuò)誤的預(yù)測(cè) 。
因此,我的觀點(diǎn)是:目前的多模態(tài)聊天機(jī)器人已經(jīng)具備意識(shí)了 。
周伯文:這個(gè)觀點(diǎn)可能會(huì)讓在座的許多研究者感到震驚 。但讓我想想,在早些時(shí)候,另一位加拿大科學(xué)家理查德·薩頓(Richard Sutton)也發(fā)表了演講,主題是“歡迎來到經(jīng)驗(yàn)的時(shí)代” 。我認(rèn)為他的意思是,當(dāng)人類數(shù)據(jù)耗盡時(shí),模型可以從自身的經(jīng)驗(yàn)中學(xué)習(xí) 。而您似乎從另一個(gè)角度點(diǎn)亮了這個(gè)問題:智能體或多模態(tài)大模型不僅能從經(jīng)驗(yàn)中學(xué)習(xí),還能發(fā)展出它們自己的主觀經(jīng)驗(yàn) 。理查德今天似乎沒有過多探討從主觀經(jīng)驗(yàn)中學(xué)習(xí)可能帶來的風(fēng)險(xiǎn) 。您能否就“智能體可以學(xué)習(xí)主觀經(jīng)驗(yàn)”這一事實(shí)或假說,以及它可能帶來的潛在風(fēng)險(xiǎn),談?wù)勀目捶ǎ?/p>
辛頓:是的。目前的情況是,像大型語言模型主要是從我們投喂的文檔中學(xué)習(xí) 。但一旦你擁有了像機(jī)器人這樣存在于真實(shí)世界中的智能體,它們就能從自己的經(jīng)驗(yàn)中學(xué)習(xí) 。我認(rèn)為它們最終學(xué)到的會(huì)比我們多得多 。我相信它們將擁有經(jīng)驗(yàn),但“經(jīng)驗(yàn)”不是一個(gè)實(shí)體物件 。經(jīng)驗(yàn)不像一張照片,它是一種你與客體之間的關(guān)系 。
周伯文:此外,關(guān)于我們可能討論的潛在風(fēng)險(xiǎn),還有幾件事。 幾天前和您交流時(shí)您提到,減少未來AI風(fēng)險(xiǎn)的一個(gè)可能解決方案,是設(shè)法將AI的不同能力分開對(duì)待。
辛頓:我其實(shí)不是那個(gè)意思。我的意思是,你將會(huì)有一個(gè)既聰明又不善良的AI。 但如何訓(xùn)練它變得聰明和如何訓(xùn)練它變得善良是兩個(gè)不同的問題。
所以你可以有讓它變得善良的技術(shù)和讓它變得聰明的技術(shù),這會(huì)是同一個(gè)AI,但使用了不同的技術(shù)。
因此,各個(gè)國家可以分享使AI變得善良的技術(shù),即使他們不想分享使AI變得聰明的技術(shù)。
周伯文:我對(duì)此有些疑慮。這個(gè)想法的初衷很好,我也很喜歡 。但我不確定這條路能走多遠(yuǎn) 。您認(rèn)為會(huì)存在一種普適性的、訓(xùn)練AI“善良”的方法,可以應(yīng)用于不同智能水平的AI模型嗎?
辛頓:這是我的希望。它可能無法實(shí)現(xiàn),但這是一個(gè)值得我們?nèi)ヌ剿鞯目赡苄?。
周伯文:確實(shí)。但我想用一個(gè)類比來提出我的疑問,我提出這個(gè)問題是為了激發(fā)更多人對(duì)您提到的方向進(jìn)行研究 。我的類比來自物理學(xué):當(dāng)物體低速運(yùn)動(dòng)時(shí),牛頓定律有效 ;但當(dāng)物體接近光速時(shí),牛頓定律就不再適用,我們必須求助于愛因斯坦的理論 。
順便說一句,這有點(diǎn)奇怪。我在一位諾貝爾物理學(xué)獎(jiǎng)獲得者面前講起了物理101。
辛頓:不,不奇怪。(給我頒獎(jiǎng))是個(gè)錯(cuò)誤。他們就是想要有一個(gè)給AI的諾貝爾獎(jiǎng),然后就把物理獎(jiǎng)拿出來用了。
周伯文:哈哈。不過這個(gè)類比或許說明,對(duì)于“善良”的約束,可能需要根據(jù)智能系統(tǒng)的不同層級(jí)進(jìn)行調(diào)整和改變 。我不知道這是否正確,但我希望在座或在線的聰明的年輕人們能找到實(shí)現(xiàn)它的方法。
辛頓:是的,很有可能隨著決策系統(tǒng)變得越來越智能,我們讓它保持善良的技術(shù)也需要隨之改變 。我們現(xiàn)在還不知道答案,這也是我們需要立刻開始研究它的原因之一 。
周伯文:您作為一位成就卓著的學(xué)者,卻經(jīng)常說“我不知道”,這讓人印象非常深刻 。我認(rèn)為這非常坦誠,并保持了開放的心態(tài),這是我們都想向您學(xué)習(xí)的 。今天我們這里有一半的參會(huì)者來自量子物理、生物學(xué)等不同科學(xué)領(lǐng)域 。我們之所以聚集于此,是因?yàn)槲覀兿嘈艧o論是AGI、AI還是AI與科學(xué)的交叉領(lǐng)域,都正迎來無盡的前沿機(jī)遇 。所以,關(guān)于利用AI推動(dòng)科學(xué)進(jìn)步,或者反過來利用科學(xué)助推AI發(fā)展,您有什么想說的?
辛頓:我認(rèn)為AI將極大地幫助科學(xué)發(fā)展,這一點(diǎn)非常明確 。最令人矚目的例子無疑是蛋白質(zhì)折疊,Demis Hassabis等人通過明智地運(yùn)用AI并投入巨大努力,極大地提升了預(yù)測(cè)的準(zhǔn)確性 。這是一個(gè)早期的標(biāo)志,預(yù)示著AI將在眾多科學(xué)領(lǐng)域帶來進(jìn)步 。您也提到了預(yù)測(cè)臺(tái)風(fēng)登陸點(diǎn)和天氣預(yù)報(bào)的例子,AI的表現(xiàn)已經(jīng)能比最好的傳統(tǒng)物理系統(tǒng)更勝一籌 。
周伯文:在您卓越的學(xué)術(shù)生涯中,您不僅推動(dòng)了AI技術(shù)的邊界,也深刻地影響了下一代研究者,比如Yoshua Bengio和許多更年輕的后輩 。在上海AI實(shí)驗(yàn)室,我們的研究人員平均年齡約為30歲,這清晰地表明AI的未來屬于年輕一代 。看著這些年輕的面孔,您有什么建議想與他們分享,幫助他們更快地成長嗎?
辛頓:我只有一條建議:如果你想做真正原創(chuàng)性的研究,就應(yīng)該去尋找那些你認(rèn)為“所有人都做錯(cuò)了”的領(lǐng)域 。通常,當(dāng)你這么想并開始研究自己的方法時(shí),最終你可能會(huì)發(fā)現(xiàn)大家那樣做是有原因的,而你的方法是錯(cuò)的 。但關(guān)鍵是,在你親身搞明白它為什么錯(cuò)之前,絕不要放棄 。不要因?yàn)槟愕膶?dǎo)師說“這個(gè)方法很蠢”就放棄它 。忽略導(dǎo)師的建議,堅(jiān)持你所相信的,直到你自己弄懂它錯(cuò)在哪里 。
偶爾,你會(huì)發(fā)現(xiàn)自己堅(jiān)持的東西并沒有錯(cuò),而這正是重大突破的來源 。這些突破從不屬于輕易放棄的人 。即便別人都不同意你,你也要堅(jiān)持下去 。這背后有一個(gè)簡單的邏輯:你要么直覺很好,要么直覺很差 。如果你直覺很好,顯然應(yīng)該堅(jiān)持它 。如果你直覺很差,那你做什么關(guān)系都不大,所以你同樣應(yīng)該堅(jiān)持你的直覺 。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.