網易首頁 > 網易號 > 正文申請入駐

Nature刊文稱“AI可模擬人類心智”，Science同日就強烈質疑

2025-07-21 09:31:51　來源: 返樸

北京舉報

分享至

7月2日，一個跨國團隊在Nature雜志發(fā)表了一項開創(chuàng)性研究，宣稱其推出的AI系統(tǒng)能夠“模擬人類心智”。該系統(tǒng)在實驗中可以“扮演”人類，生成逼真的人類行為。但在同日，Science雜志就針對這項研究刊發(fā)報道，表達了科學界對這項研究的審慎和質疑。有學者甚至用“荒謬”來評價這個模型。

撰文 | Ren

你有沒有想過，我們的大腦是如何做出各種各樣的決定的？

從早上選擇穿什么衣服，到思考宇宙的奧秘，人類的心智展現(xiàn)出令人驚嘆的靈活性和適應性。我們能從幾個簡單的例子中學會新技能，能理解因果關系，還能被好奇心驅使去探索未知。

這種無與倫比的多功能性，正是我們人類大腦的獨特之處。

隨著當前AI的飛速發(fā)展，我們審視當今的AI模型時，會發(fā)現(xiàn)它們大多是“專才”而非“通才”。它們往往被設計來解決一個特定的問題，比如圍棋高手AlphaGo，雖然在棋盤上所向披靡，但出了棋盤就一籌莫展。

我們看到了Claude 3.7 Sonnet、Gemini Pro 2.5、Grok 4等更擅長推理的模型。那么，這些AI模型可以模擬人類的推理過程嗎？

在認知科學領域，像前景理論這樣的經典模型，雖然能深刻揭示人們面臨風險如何做規(guī)避決策，卻無法告訴我們，人類是如何學習、規(guī)劃或探索的。

長期以來，心理學界一直夢想著構建一個統(tǒng)一的認知理論，一個能夠解釋人類心智全貌的框架。

最近發(fā)表在Nature雜志上的一項開創(chuàng)性研究，似乎為這個夢想點亮了新的希望。一個跨國研究團隊推出了一款名為“Centaur”的基礎模型，旨在捕捉人類認知和高準確率預測，宣稱向理解人類心智的終極目標邁出了重要一步。

Nature論文

然而，這項研究的某些方面也引起了科學界的審慎和質疑。畢竟，要宣稱一個AI系統(tǒng)能夠“模擬人類心智”，這本身就是一個極具挑戰(zhàn)性的命題，需要更深層次的探討。

當AI遇上人類行為大數(shù)據

Centaur模型的研究團隊來自德國Helmholtz AI研究計劃、谷歌DeepMind、普林斯頓大學等機構。他們稱Centaur首次實現(xiàn)了大規(guī)模認知任務中的準確預測人類行為的能力。

Centaur的基石是一個名為“Psych-101”的龐大數(shù)據庫。該數(shù)據集的規(guī)模前所未有，它涵蓋了廣泛的認知領域知識，包括多臂老虎機、決策制定、記憶、監(jiān)督學習、馬爾可夫決策過程等經典任務。

Psych-101包含的數(shù)據 | 圖源：論文

數(shù)據庫同時也囊括了160項心理學實驗中超過6萬名參與者的逐次試驗數(shù)據，他們完成了超過1000萬次選擇，共計253,597,411個文本tokens。

它就像一個巨大的圖書館，里面收藏的詳細記錄，由數(shù)萬名參與者在實驗中的每一次選擇、每一個反應組成。

研究人員將這些復雜的實驗數(shù)據全部人工轉錄成了自然語言文本，并在這個過程中將所有不同形式的實驗標準化，使得AI模型能夠像閱讀故事一樣學習與理解人類行為，包括細節(jié)。

Centaur的大致框架丨圖源：論文

Centaur的“大腦”是來自Meta的開源大模型Llama 3.1 70B。

為了讓模型學會“理解”人類行為，研究人員對其進行了微調。他們采用了量化低秩適配（QLoRA），一種高效的大模型微調技術。通過向非嵌入層（包括自注意力機制和前饋網絡的線性層）添加低秩適配器（秩為8）來工作，只需傳統(tǒng)模型Llama的0.15%參數(shù)，就可以完美模擬人類在160項心理學實驗中的行為。

值得一提的是，研究人員還開發(fā)了一個名為Minitaur的小型版本，以Llama 3.1 8B為基礎模型。它雖然在性能和穩(wěn)健性上不如Centaur，但對硬件要求較低，甚至可以運行在Google Colab的免費GPU實例上。

精準的預測與較好的泛化能力

在研究團隊看來，Centaur的真正魅力，在于它能精準地預測和模擬人類行為，同時有較好的泛化能力。

研究人員讓Centaur“觀看”了一些人玩游戲的過程，然后讓它預測另一群從未見過的人會怎么玩。Centaur能夠比其他現(xiàn)有模型更準確地預測這些新參與者的行為。

他們認為，這表明Centaur不僅僅是記憶了訓練數(shù)據，更是掌握了人類行為背后的模式和規(guī)律。

在一個經典的實驗中，原本的設定是太空飛船在星球間尋找寶藏，研究人員把故事背景換成了“魔毯探險”。Centaur雖然從未見過魔毯，卻依然能準確預測故事中人們的行為。這似乎證明了它理解的是任務的內在結構，而非表面的故事。

再比如，在一個叫做“瑪吉農場”的實驗中，研究人員在原有的任務基礎上增加了一個選項。盡管Centaur從未在訓練中遇到過這種“三選一”的復雜情況，而Centaur再次展現(xiàn)了強大的適應力，其預測值幾乎碾壓了傳統(tǒng)模型。

更令人驚嘆的是，即使在全新的領域，比如邏輯推理任務中（LSAT題型），Centaur也展現(xiàn)了出色的表現(xiàn)。證明其底層的學習和推理能力也得到了“淬煉”。

在不同任務上，人類與 Centaur 模型在“獎勵值”和“信息獎勵參數(shù)”上的概率密度分布圖 | 圖源：論文

除了這些，Centaur還在其他一些完全陌生的實驗中表現(xiàn)出色，例如道德決策、經濟博弈等。研究人員指出，這進一步說明了它作為“通用認知模型”的潛力。

Centaur不僅能預測人類已經做出的選擇，還能“扮演”人類，生成逼真的人類行為。在模擬實驗中，Centaur的表現(xiàn)與真實人類驚人地相似。

例如，在探索策略任務中，Centaur的探索方式與人類如出一轍；在學習任務中，它也能像人類一樣，表現(xiàn)出不同學習策略的混合。

更有趣的是，Centaur能準確預測人類的行為，卻很難預測那些由AI生成的、統(tǒng)計上相似但內在邏輯不同的行為，這進一步證明了它捕捉的是人類特有的認知模式。

甚至，Centaur還能預測人類的反應時間，這表明它不僅理解了人們“做什么”，還理解了人們“思考多久”才能做出決定。

Centaur內部與大腦活動的共鳴

另外一個令人興奮的發(fā)現(xiàn)是，Centaur的內部運作方式，竟然與人類大腦的活動模式產生了奇妙的共鳴。

盡管Centaur在訓練時從未被明確要求去模擬大腦活動，但研究人員發(fā)現(xiàn)，它的內部表征，也就是它處理信息的方式，與人類大腦在執(zhí)行任務時的神經活動更為接近。

Centaur 表征所預測的神經活動與 BOLD 數(shù)據之間的皮爾遜相關系數(shù)，它在左側運動皮層的預測最為準確。| 圖源：論文

具體來說，研究人員進行了全腦分析，預測了執(zhí)行兩步任務的人類參與者的功能性磁共振成像（fMRI）測量結果。他們利用了先前一項研究中收集的數(shù)據，該研究涉及94名參與者，每人做出300次選擇。

參與者在改編的魔毯故事或另一個抽象故事下進行測試，這兩種故事均不屬于Centaur的訓練數(shù)據。研究人員從模型在每次選擇前和反饋后的殘差流中提取記錄。然后，他們整合了每個區(qū)域的人類神經活動，并對Centaur的內部表征進行回歸分析。

結果顯示，Centaur的表征在預測人類神經活動方面始終優(yōu)于Llama的表征，這表明在大型行為數(shù)據上微調模型使其內部表征與人類神經活動對齊。

這就像是，Centaur在學習人類行為的同時，無意中也學會了以一種類似人類大腦的方式來組織和處理信息。

“無心插柳柳成蔭”的現(xiàn)象，為我們理解AI與人類心智之間的深層聯(lián)系提供了新視角。這或許意味著，即使模型的內部機制與大腦不同，但其在處理信息時所形成的抽象表征，可能與大腦的某些功能性組織原則不謀而合。

助力新發(fā)現(xiàn)

在論文中，研究人員還展示了Centaur如何幫助我們更好地理解人類決策過程。

在一個涉及到多維度決策的實驗中，人們需要根據多個專家的評價，在兩個各有優(yōu)缺點的產品中二選一。研究人員利用Centaur，結合另一個語言模型DeepSeek-R1，來“詢問”人類在這種情況下是如何做出決定的。

DeepSeek-R1分析了人類的決策數(shù)據后，提出了一個初步解釋：人們可能先看哪個產品獲得多數(shù)好評，如果打平，再看最權威專家的意見。這是個很合理的發(fā)現(xiàn)。

然而，Centaur的強大之處在于，它還能進一步優(yōu)化這個發(fā)現(xiàn)。通過一種名為“科學遺憾最小化”（scientific regret minimization）的方法，研究人員讓Centaur指出DeepSeek-R1模型未能完全捕捉到的人類行為。

模型引導的科學發(fā)現(xiàn)，利用 Psych-101 和 Centaur 來輔助構建一個用于多屬性決策研究的認知模型 | 圖源：論文

通過分析Centaur提出的“錯誤”，研究人員發(fā)現(xiàn)，人們在決策時，并非嚴格遵循非此即彼的規(guī)則：他們也會選擇一個總體好評較少，但卻得到了最權威專家正面評價的產品。

因此，人類在決策時，權威專家的意見可能并非只在“打平”時才發(fā)揮作用，它可能在整個決策過程中都扮演著更靈活、更重要的角色。人類將兩種啟發(fā)式決策策略（看總體好評和看權威專家意見）進行了加權組合。

隨后，在Centaur的幫助下，研究人員開發(fā)了一個更靈活的加權平均機制，讓兩種啟發(fā)式策略可以同時發(fā)揮作用，只是權重不同。最后得到的新模型，不僅在預測人類行為的準確度上幾乎與Centaur一樣，而且依然是可解釋的。

核心爭議：行為匹配是否等同于心智模仿？

Centaur在預測和模擬人類行為上的出色表現(xiàn)，無疑是令人欣喜的。然而，就在Nature發(fā)表這項研究的同一天，Science立即跟進一篇報道，表達了科學界對這項研究的審慎和質疑。

受訪專家認為，這篇論文以“預測和捕捉人類認知的基礎模型”為題，但這并不意味著Centaur的運行機制與人類心智、思維機制相同，即便“其內部表征與人類神經活動相似”。

加拿大麥吉爾大學的計算神經科學家Blake Richards直言，他認為科學界有相當一部分人會對這篇論文持高度懷疑的態(tài)度，甚至可能會非常嚴厲地批評它。

在他和一些同行看來，Centaur模型并未真正意義上模仿人類的認知過程，因此它能否可靠地生成與人類行為完全匹配的結果，還有待商榷。

具體來說，Centaur本質上仍是一個大模型，而大模型的核心仍是統(tǒng)計模式的“匹配機器”，即使能夠在一定程度上捕捉復雜語義和推理結構，但最后的結果依舊是根據可能性來預測下一個詞。

Science對Nature這項研究的報道

現(xiàn)階段的大模型架構，注定了它們不具備意識、真正的理解，也不具備與人類相同的因果推理能力。盡管在行為數(shù)據上進行微調可以提高預測性能，但這并未從根本上改變其統(tǒng)計關聯(lián)的底層機制。

因此，預測性大模型的功能能力與“人類認知”所隱含的機制理解之間存在顯著的概念鴻溝。

英國布里斯托大學的認知科學家Jeffrey Bowers更是用“荒謬”來評價這個模型。他和團隊親自對Centaur進行了測試，結果發(fā)現(xiàn)它展現(xiàn)出了一些“超人”般的非人類行為。

例如，在短時記憶測試中，Centaur能夠記住多達256位數(shù)字，而我們人類通常只能記住大約7位。在反應時間測試中，模型甚至可以在1毫秒內做出“超人類”反應。

Bowers由此得出結論，所謂Centaur可以在訓練數(shù)據之外進行可靠泛化的結論不可信。這些“超人”表現(xiàn)，恰恰說明了模型可能只是在數(shù)據上表現(xiàn)出色，而其內部機制與人類的認知局限性大相徑庭，因此其泛化能力可能并非基于真正的人類認知理解。

更重要的是，Bowers強調，Centaur無法解釋任何關于人類認知的問題。

他打了個比方：模擬時鐘和數(shù)字時鐘都能顯示正確的時間，但它們的內部運行機制卻大相徑庭。Centaur雖然能給出類似人類的輸出，但它所依賴的機制與人類心智的機制可能根本不同。

此外，盡管Psych-101數(shù)據集規(guī)模令人印象深刻，但與“人類認知的無限海洋”相比，160項實驗仍然只是“一粒沙子”，不足以全面覆蓋人類的認知機制。這意味著，模型可能只在訓練數(shù)據覆蓋的范圍內表現(xiàn)良好，但在更廣闊、更復雜的認知領域，其表現(xiàn)可能并不穩(wěn)定。

應該說，這些質疑的聲音并非否定Centaur，而是從科學嚴謹性的角度，提醒我們應以更批判的眼光看待其宣稱的“模仿人類心智”的能力。

它們促使我們思考，僅僅是外部行為的匹配，是否就等同于內部認知過程的模擬？一個能夠展現(xiàn)“超人”能力的模型，其泛化性是否真的可靠？以及，在模型能夠“預測”人類行為之后，下一步如何讓它真正“解釋”人類行為？

這些疑問，無疑為未來的AI模型研究指明了更具挑戰(zhàn)性的方向。

參考資料

[1] https://www.science.org/content/article/researchers-claim-their-ai-model-simulates-human-mind-others-are-skeptical

[2] https://www.nature.com/articles/s41586-025-09215-4

注：本文封面圖片來自版權圖庫，轉載使用可能引發(fā)版權糾紛。

特別提示

1. 進入『返樸』微信公眾號底部菜單“精品專欄“，可查閱不同主題系列科普文章。

2. 『返樸』提供按月檢索文章功能。關注公眾號，回復四位數(shù)組成的年份+月份，如“1903”，可獲取2019年3月的文章索引，以此類推。

版權說明：歡迎個人轉發(fā)，任何形式的媒體或機構未經授權，不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯(lián)系后臺。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.