7月2日,一個跨國團隊在Nature雜志發(fā)表了一項開創(chuàng)性研究,宣稱其推出的AI系統(tǒng)能夠“模擬人類心智”。該系統(tǒng)在實驗中可以“扮演”人類,生成逼真的人類行為。但在同日,Science雜志就針對這項研究刊發(fā)報道,表達了科學界對這項研究的審慎和質疑。有學者甚至用“荒謬”來評價這個模型。
撰文 | Ren
你有沒有想過,我們的大腦是如何做出各種各樣的決定的?
從早上選擇穿什么衣服,到思考宇宙的奧秘,人類的心智展現(xiàn)出令人驚嘆的靈活性和適應性。我們能從幾個簡單的例子中學會新技能,能理解因果關系,還能被好奇心驅使去探索未知。
這種無與倫比的多功能性,正是我們人類大腦的獨特之處。
隨著當前AI的飛速發(fā)展,我們審視當今的AI模型時,會發(fā)現(xiàn)它們大多是“專才”而非“通才”。它們往往被設計來解決一個特定的問題,比如圍棋高手AlphaGo,雖然在棋盤上所向披靡,但出了棋盤就一籌莫展。
我們看到了Claude 3.7 Sonnet、Gemini Pro 2.5、Grok 4等更擅長推理的模型。那么,這些AI模型可以模擬人類的推理過程嗎?
在認知科學領域,像前景理論這樣的經典模型,雖然能深刻揭示人們面臨風險如何做規(guī)避決策,卻無法告訴我們,人類是如何學習、規(guī)劃或探索的。
長期以來,心理學界一直夢想著構建一個統(tǒng)一的認知理論,一個能夠解釋人類心智全貌的框架。
最近發(fā)表在Nature雜志上的一項開創(chuàng)性研究,似乎為這個夢想點亮了新的希望。一個跨國研究團隊推出了一款名為“Centaur”的基礎模型,旨在捕捉人類認知和高準確率預測,宣稱向理解人類心智的終極目標邁出了重要一步。
Nature論文
然而,這項研究的某些方面也引起了科學界的審慎和質疑。畢竟,要宣稱一個AI系統(tǒng)能夠“模擬人類心智”,這本身就是一個極具挑戰(zhàn)性的命題,需要更深層次的探討。
當AI遇上人類行為大數(shù)據
Centaur模型的研究團隊來自德國Helmholtz AI研究計劃、谷歌DeepMind、普林斯頓大學等機構。他們稱Centaur首次實現(xiàn)了大規(guī)模認知任務中的準確預測人類行為的能力。
Centaur的基石是一個名為“Psych-101”的龐大數(shù)據庫。該數(shù)據集的規(guī)模前所未有,它涵蓋了廣泛的認知領域知識,包括多臂老虎機、決策制定、記憶、監(jiān)督學習、馬爾可夫決策過程等經典任務。
Psych-101包含的數(shù)據 | 圖源:論文
數(shù)據庫同時也囊括了160項心理學實驗中超過6萬名參與者的逐次試驗數(shù)據,他們完成了超過1000萬次選擇,共計253,597,411個文本tokens。
它就像一個巨大的圖書館,里面收藏的詳細記錄,由數(shù)萬名參與者在實驗中的每一次選擇、每一個反應組成。
研究人員將這些復雜的實驗數(shù)據全部人工轉錄成了自然語言文本,并在這個過程中將所有不同形式的實驗標準化,使得AI模型能夠像閱讀故事一樣學習與理解人類行為,包括細節(jié)。
Centaur的大致框架丨圖源:論文
Centaur的“大腦”是來自Meta的開源大模型Llama 3.1 70B。
為了讓模型學會“理解”人類行為,研究人員對其進行了微調。他們采用了量化低秩適配(QLoRA),一種高效的大模型微調技術。通過向非嵌入層(包括自注意力機制和前饋網絡的線性層)添加低秩適配器(秩為8)來工作,只需傳統(tǒng)模型Llama的0.15%參數(shù),就可以完美模擬人類在160項心理學實驗中的行為。
值得一提的是,研究人員還開發(fā)了一個名為Minitaur的小型版本,以Llama 3.1 8B為基礎模型。它雖然在性能和穩(wěn)健性上不如Centaur,但對硬件要求較低,甚至可以運行在Google Colab的免費GPU實例上。
精準的預測與較好的泛化能力
在研究團隊看來,Centaur的真正魅力,在于它能精準地預測和模擬人類行為,同時有較好的泛化能力。
研究人員讓Centaur“觀看”了一些人玩游戲的過程,然后讓它預測另一群從未見過的人會怎么玩。Centaur能夠比其他現(xiàn)有模型更準確地預測這些新參與者的行為。
他們認為,這表明Centaur不僅僅是記憶了訓練數(shù)據,更是掌握了人類行為背后的模式和規(guī)律。
在一個經典的實驗中,原本的設定是太空飛船在星球間尋找寶藏,研究人員把故事背景換成了“魔毯探險”。Centaur雖然從未見過魔毯,卻依然能準確預測故事中人們的行為。這似乎證明了它理解的是任務的內在結構,而非表面的故事。
再比如,在一個叫做“瑪吉農場”的實驗中,研究人員在原有的任務基礎上增加了一個選項。盡管Centaur從未在訓練中遇到過這種“三選一”的復雜情況,而Centaur再次展現(xiàn)了強大的適應力,其預測值幾乎碾壓了傳統(tǒng)模型。
更令人驚嘆的是,即使在全新的領域,比如邏輯推理任務中(LSAT題型),Centaur也展現(xiàn)了出色的表現(xiàn)。證明其底層的學習和推理能力也得到了“淬煉”。
在不同任務上,人類與 Centaur 模型在“獎勵值”和“信息獎勵參數(shù)”上的概率密度分布圖 | 圖源:論文
除了這些,Centaur還在其他一些完全陌生的實驗中表現(xiàn)出色,例如道德決策、經濟博弈等。研究人員指出,這進一步說明了它作為“通用認知模型”的潛力。
Centaur不僅能預測人類已經做出的選擇,還能“扮演”人類,生成逼真的人類行為。在模擬實驗中,Centaur的表現(xiàn)與真實人類驚人地相似。
例如,在探索策略任務中,Centaur的探索方式與人類如出一轍;在學習任務中,它也能像人類一樣,表現(xiàn)出不同學習策略的混合。
更有趣的是,Centaur能準確預測人類的行為,卻很難預測那些由AI生成的、統(tǒng)計上相似但內在邏輯不同的行為,這進一步證明了它捕捉的是人類特有的認知模式。
甚至,Centaur還能預測人類的反應時間,這表明它不僅理解了人們“做什么”,還理解了人們“思考多久”才能做出決定。
Centaur內部與大腦活動的共鳴
另外一個令人興奮的發(fā)現(xiàn)是,Centaur的內部運作方式,竟然與人類大腦的活動模式產生了奇妙的共鳴。
盡管Centaur在訓練時從未被明確要求去模擬大腦活動,但研究人員發(fā)現(xiàn),它的內部表征,也就是它處理信息的方式,與人類大腦在執(zhí)行任務時的神經活動更為接近。
Centaur 表征所預測的神經活動與 BOLD 數(shù)據之間的皮爾遜相關系數(shù),它在左側運動皮層的預測最為準確。| 圖源:論文
具體來說,研究人員進行了全腦分析,預測了執(zhí)行兩步任務的人類參與者的功能性磁共振成像(fMRI)測量結果。他們利用了先前一項研究中收集的數(shù)據,該研究涉及94名參與者,每人做出300次選擇。
參與者在改編的魔毯故事或另一個抽象故事下進行測試,這兩種故事均不屬于Centaur的訓練數(shù)據。研究人員從模型在每次選擇前和反饋后的殘差流中提取記錄。然后,他們整合了每個區(qū)域的人類神經活動,并對Centaur的內部表征進行回歸分析。
結果顯示,Centaur的表征在預測人類神經活動方面始終優(yōu)于Llama的表征,這表明在大型行為數(shù)據上微調模型使其內部表征與人類神經活動對齊。
這就像是,Centaur在學習人類行為的同時,無意中也學會了以一種類似人類大腦的方式來組織和處理信息。
“無心插柳柳成蔭”的現(xiàn)象,為我們理解AI與人類心智之間的深層聯(lián)系提供了新視角。這或許意味著,即使模型的內部機制與大腦不同,但其在處理信息時所形成的抽象表征,可能與大腦的某些功能性組織原則不謀而合。
助力新發(fā)現(xiàn)
在論文中,研究人員還展示了Centaur如何幫助我們更好地理解人類決策過程。
在一個涉及到多維度決策的實驗中,人們需要根據多個專家的評價,在兩個各有優(yōu)缺點的產品中二選一。研究人員利用Centaur,結合另一個語言模型DeepSeek-R1,來“詢問”人類在這種情況下是如何做出決定的。
DeepSeek-R1分析了人類的決策數(shù)據后,提出了一個初步解釋:人們可能先看哪個產品獲得多數(shù)好評,如果打平,再看最權威專家的意見。這是個很合理的發(fā)現(xiàn)。
然而,Centaur的強大之處在于,它還能進一步優(yōu)化這個發(fā)現(xiàn)。通過一種名為“科學遺憾最小化”(scientific regret minimization)的方法,研究人員讓Centaur指出DeepSeek-R1模型未能完全捕捉到的人類行為。
模型引導的科學發(fā)現(xiàn),利用 Psych-101 和 Centaur 來輔助構建一個用于多屬性決策研究的認知模型 | 圖源:論文
通過分析Centaur提出的“錯誤”,研究人員發(fā)現(xiàn),人們在決策時,并非嚴格遵循非此即彼的規(guī)則:他們也會選擇一個總體好評較少,但卻得到了最權威專家正面評價的產品。
因此,人類在決策時,權威專家的意見可能并非只在“打平”時才發(fā)揮作用,它可能在整個決策過程中都扮演著更靈活、更重要的角色。人類將兩種啟發(fā)式決策策略(看總體好評和看權威專家意見)進行了加權組合。
隨后,在Centaur的幫助下,研究人員開發(fā)了一個更靈活的加權平均機制,讓兩種啟發(fā)式策略可以同時發(fā)揮作用,只是權重不同。最后得到的新模型,不僅在預測人類行為的準確度上幾乎與Centaur一樣,而且依然是可解釋的。
核心爭議:行為匹配是否等同于心智模仿?
Centaur在預測和模擬人類行為上的出色表現(xiàn),無疑是令人欣喜的。然而,就在Nature發(fā)表這項研究的同一天,Science立即跟進一篇報道,表達了科學界對這項研究的審慎和質疑。
受訪專家認為,這篇論文以“預測和捕捉人類認知的基礎模型”為題,但這并不意味著Centaur的運行機制與人類心智、思維機制相同,即便“其內部表征與人類神經活動相似”。
加拿大麥吉爾大學的計算神經科學家Blake Richards直言,他認為科學界有相當一部分人會對這篇論文持高度懷疑的態(tài)度,甚至可能會非常嚴厲地批評它。
在他和一些同行看來,Centaur模型并未真正意義上模仿人類的認知過程,因此它能否可靠地生成與人類行為完全匹配的結果,還有待商榷。
具體來說,Centaur本質上仍是一個大模型,而大模型的核心仍是統(tǒng)計模式的“匹配機器”,即使能夠在一定程度上捕捉復雜語義和推理結構,但最后的結果依舊是根據可能性來預測下一個詞。
Science對Nature這項研究的報道
現(xiàn)階段的大模型架構,注定了它們不具備意識、真正的理解,也不具備與人類相同的因果推理能力。盡管在行為數(shù)據上進行微調可以提高預測性能,但這并未從根本上改變其統(tǒng)計關聯(lián)的底層機制。
因此,預測性大模型的功能能力與“人類認知”所隱含的機制理解之間存在顯著的概念鴻溝。
英國布里斯托大學的認知科學家Jeffrey Bowers更是用“荒謬”來評價這個模型。他和團隊親自對Centaur進行了測試,結果發(fā)現(xiàn)它展現(xiàn)出了一些“超人”般的非人類行為。
例如,在短時記憶測試中,Centaur能夠記住多達256位數(shù)字,而我們人類通常只能記住大約7位。在反應時間測試中,模型甚至可以在1毫秒內做出“超人類”反應。
Bowers由此得出結論,所謂Centaur可以在訓練數(shù)據之外進行可靠泛化的結論不可信。這些“超人”表現(xiàn),恰恰說明了模型可能只是在數(shù)據上表現(xiàn)出色,而其內部機制與人類的認知局限性大相徑庭,因此其泛化能力可能并非基于真正的人類認知理解。
更重要的是,Bowers強調,Centaur無法解釋任何關于人類認知的問題。
他打了個比方:模擬時鐘和數(shù)字時鐘都能顯示正確的時間,但它們的內部運行機制卻大相徑庭。Centaur雖然能給出類似人類的輸出,但它所依賴的機制與人類心智的機制可能根本不同。
此外,盡管Psych-101數(shù)據集規(guī)模令人印象深刻,但與“人類認知的無限海洋”相比,160項實驗仍然只是“一粒沙子”,不足以全面覆蓋人類的認知機制。這意味著,模型可能只在訓練數(shù)據覆蓋的范圍內表現(xiàn)良好,但在更廣闊、更復雜的認知領域,其表現(xiàn)可能并不穩(wěn)定。
應該說,這些質疑的聲音并非否定Centaur,而是從科學嚴謹性的角度,提醒我們應以更批判的眼光看待其宣稱的“模仿人類心智”的能力。
它們促使我們思考,僅僅是外部行為的匹配,是否就等同于內部認知過程的模擬?一個能夠展現(xiàn)“超人”能力的模型,其泛化性是否真的可靠?以及,在模型能夠“預測”人類行為之后,下一步如何讓它真正“解釋”人類行為?
這些疑問,無疑為未來的AI模型研究指明了更具挑戰(zhàn)性的方向。
參考資料
[1] https://www.science.org/content/article/researchers-claim-their-ai-model-simulates-human-mind-others-are-skeptical
[2] https://www.nature.com/articles/s41586-025-09215-4
注:本文封面圖片來自版權圖庫,轉載使用可能引發(fā)版權糾紛。
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回復四位數(shù)組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
版權說明:歡迎個人轉發(fā),任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯(lián)系后臺。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.