夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網易首頁 > 網易號 > 正文 申請入駐

Nature刊文稱“AI可模擬人類心智”,Science同日就強烈質疑

0
分享至



7月2日,一個跨國團隊在Nature雜志發(fā)表了一項開創(chuàng)性研究,宣稱其推出的AI系統(tǒng)能夠“模擬人類心智”。該系統(tǒng)在實驗中可以“扮演”人類,生成逼真的人類行為。但在同日,Science雜志就針對這項研究刊發(fā)報道,表達了科學界對這項研究的審慎和質疑。有學者甚至用“荒謬”來評價這個模型。

撰文 | Ren

你有沒有想過,我們的大腦是如何做出各種各樣的決定的?

從早上選擇穿什么衣服,到思考宇宙的奧秘,人類的心智展現(xiàn)出令人驚嘆的靈活性和適應性。我們能從幾個簡單的例子中學會新技能,能理解因果關系,還能被好奇心驅使去探索未知。

這種無與倫比的多功能性,正是我們人類大腦的獨特之處。

隨著當前AI的飛速發(fā)展,我們審視當今的AI模型時,會發(fā)現(xiàn)它們大多是“專才”而非“通才”。它們往往被設計來解決一個特定的問題,比如圍棋高手AlphaGo,雖然在棋盤上所向披靡,但出了棋盤就一籌莫展。

我們看到了Claude 3.7 Sonnet、Gemini Pro 2.5、Grok 4等更擅長推理的模型。那么,這些AI模型可以模擬人類的推理過程嗎?

在認知科學領域,像前景理論這樣的經典模型,雖然能深刻揭示人們面臨風險如何做規(guī)避決策,卻無法告訴我們,人類是如何學習、規(guī)劃或探索的。

長期以來,心理學界一直夢想著構建一個統(tǒng)一的認知理論,一個能夠解釋人類心智全貌的框架。

最近發(fā)表在Nature雜志上的一項開創(chuàng)性研究,似乎為這個夢想點亮了新的希望。一個跨國研究團隊推出了一款名為“Centaur”的基礎模型,旨在捕捉人類認知和高準確率預測,宣稱向理解人類心智的終極目標邁出了重要一步。



Nature論文

然而,這項研究的某些方面也引起了科學界的審慎和質疑。畢竟,要宣稱一個AI系統(tǒng)能夠“模擬人類心智”,這本身就是一個極具挑戰(zhàn)性的命題,需要更深層次的探討。

當AI遇上人類行為大數(shù)據

Centaur模型的研究團隊來自德國Helmholtz AI研究計劃、谷歌DeepMind、普林斯頓大學等機構。他們稱Centaur首次實現(xiàn)了大規(guī)模認知任務中的準確預測人類行為的能力。

Centaur的基石是一個名為“Psych-101”的龐大數(shù)據庫。該數(shù)據集的規(guī)模前所未有,它涵蓋了廣泛的認知領域知識,包括多臂老虎機、決策制定、記憶、監(jiān)督學習、馬爾可夫決策過程等經典任務。



Psych-101包含的數(shù)據 | 圖源:論文

數(shù)據庫同時也囊括了160項心理學實驗中超過6萬名參與者的逐次試驗數(shù)據,他們完成了超過1000萬次選擇,共計253,597,411個文本tokens。

它就像一個巨大的圖書館,里面收藏的詳細記錄,由數(shù)萬名參與者在實驗中的每一次選擇、每一個反應組成。

研究人員將這些復雜的實驗數(shù)據全部人工轉錄成了自然語言文本,并在這個過程中將所有不同形式的實驗標準化,使得AI模型能夠像閱讀故事一樣學習與理解人類行為,包括細節(jié)。



Centaur的大致框架丨圖源:論文

Centaur的“大腦”是來自Meta的開源大模型Llama 3.1 70B。

為了讓模型學會“理解”人類行為,研究人員對其進行了微調。他們采用了量化低秩適配(QLoRA),一種高效的大模型微調技術。通過向非嵌入層(包括自注意力機制和前饋網絡的線性層)添加低秩適配器(秩為8)來工作,只需傳統(tǒng)模型Llama的0.15%參數(shù),就可以完美模擬人類在160項心理學實驗中的行為。

值得一提的是,研究人員還開發(fā)了一個名為Minitaur的小型版本,以Llama 3.1 8B為基礎模型。它雖然在性能和穩(wěn)健性上不如Centaur,但對硬件要求較低,甚至可以運行在Google Colab的免費GPU實例上。

精準的預測與較好的泛化能力

在研究團隊看來,Centaur的真正魅力,在于它能精準地預測和模擬人類行為,同時有較好的泛化能力。

研究人員讓Centaur“觀看”了一些人玩游戲的過程,然后讓它預測另一群從未見過的人會怎么玩。Centaur能夠比其他現(xiàn)有模型更準確地預測這些新參與者的行為。

他們認為,這表明Centaur不僅僅是記憶了訓練數(shù)據,更是掌握了人類行為背后的模式和規(guī)律。

在一個經典的實驗中,原本的設定是太空飛船在星球間尋找寶藏,研究人員把故事背景換成了“魔毯探險”。Centaur雖然從未見過魔毯,卻依然能準確預測故事中人們的行為。這似乎證明了它理解的是任務的內在結構,而非表面的故事。

再比如,在一個叫做“瑪吉農場”的實驗中,研究人員在原有的任務基礎上增加了一個選項。盡管Centaur從未在訓練中遇到過這種“三選一”的復雜情況,而Centaur再次展現(xiàn)了強大的適應力,其預測值幾乎碾壓了傳統(tǒng)模型。

更令人驚嘆的是,即使在全新的領域,比如邏輯推理任務中(LSAT題型),Centaur也展現(xiàn)了出色的表現(xiàn)。證明其底層的學習和推理能力也得到了“淬煉”。



在不同任務上,人類與 Centaur 模型在“獎勵值”和“信息獎勵參數(shù)”上的概率密度分布圖 | 圖源:論文

除了這些,Centaur還在其他一些完全陌生的實驗中表現(xiàn)出色,例如道德決策、經濟博弈等。研究人員指出,這進一步說明了它作為“通用認知模型”的潛力。

Centaur不僅能預測人類已經做出的選擇,還能“扮演”人類,生成逼真的人類行為。在模擬實驗中,Centaur的表現(xiàn)與真實人類驚人地相似。

例如,在探索策略任務中,Centaur的探索方式與人類如出一轍;在學習任務中,它也能像人類一樣,表現(xiàn)出不同學習策略的混合。

更有趣的是,Centaur能準確預測人類的行為,卻很難預測那些由AI生成的、統(tǒng)計上相似但內在邏輯不同的行為,這進一步證明了它捕捉的是人類特有的認知模式。

甚至,Centaur還能預測人類的反應時間,這表明它不僅理解了人們“做什么”,還理解了人們“思考多久”才能做出決定。

Centaur內部與大腦活動的共鳴

另外一個令人興奮的發(fā)現(xiàn)是,Centaur的內部運作方式,竟然與人類大腦的活動模式產生了奇妙的共鳴。

盡管Centaur在訓練時從未被明確要求去模擬大腦活動,但研究人員發(fā)現(xiàn),它的內部表征,也就是它處理信息的方式,與人類大腦在執(zhí)行任務時的神經活動更為接近。



Centaur 表征所預測的神經活動與 BOLD 數(shù)據之間的皮爾遜相關系數(shù),它在左側運動皮層的預測最為準確。| 圖源:論文

具體來說,研究人員進行了全腦分析,預測了執(zhí)行兩步任務的人類參與者的功能性磁共振成像(fMRI)測量結果。他們利用了先前一項研究中收集的數(shù)據,該研究涉及94名參與者,每人做出300次選擇。

參與者在改編的魔毯故事或另一個抽象故事下進行測試,這兩種故事均不屬于Centaur的訓練數(shù)據。研究人員從模型在每次選擇前和反饋后的殘差流中提取記錄。然后,他們整合了每個區(qū)域的人類神經活動,并對Centaur的內部表征進行回歸分析。

結果顯示,Centaur的表征在預測人類神經活動方面始終優(yōu)于Llama的表征,這表明在大型行為數(shù)據上微調模型使其內部表征與人類神經活動對齊。

這就像是,Centaur在學習人類行為的同時,無意中也學會了以一種類似人類大腦的方式來組織和處理信息。

“無心插柳柳成蔭”的現(xiàn)象,為我們理解AI與人類心智之間的深層聯(lián)系提供了新視角。這或許意味著,即使模型的內部機制與大腦不同,但其在處理信息時所形成的抽象表征,可能與大腦的某些功能性組織原則不謀而合。

助力新發(fā)現(xiàn)

在論文中,研究人員還展示了Centaur如何幫助我們更好地理解人類決策過程。

在一個涉及到多維度決策的實驗中,人們需要根據多個專家的評價,在兩個各有優(yōu)缺點的產品中二選一。研究人員利用Centaur,結合另一個語言模型DeepSeek-R1,來“詢問”人類在這種情況下是如何做出決定的。

DeepSeek-R1分析了人類的決策數(shù)據后,提出了一個初步解釋:人們可能先看哪個產品獲得多數(shù)好評,如果打平,再看最權威專家的意見。這是個很合理的發(fā)現(xiàn)。

然而,Centaur的強大之處在于,它還能進一步優(yōu)化這個發(fā)現(xiàn)。通過一種名為“科學遺憾最小化”(scientific regret minimization)的方法,研究人員讓Centaur指出DeepSeek-R1模型未能完全捕捉到的人類行為。



模型引導的科學發(fā)現(xiàn),利用 Psych-101 和 Centaur 來輔助構建一個用于多屬性決策研究的認知模型 | 圖源:論文

通過分析Centaur提出的“錯誤”,研究人員發(fā)現(xiàn),人們在決策時,并非嚴格遵循非此即彼的規(guī)則:他們也會選擇一個總體好評較少,但卻得到了最權威專家正面評價的產品。

因此,人類在決策時,權威專家的意見可能并非只在“打平”時才發(fā)揮作用,它可能在整個決策過程中都扮演著更靈活、更重要的角色。人類將兩種啟發(fā)式決策策略(看總體好評和看權威專家意見)進行了加權組合。

隨后,在Centaur的幫助下,研究人員開發(fā)了一個更靈活的加權平均機制,讓兩種啟發(fā)式策略可以同時發(fā)揮作用,只是權重不同。最后得到的新模型,不僅在預測人類行為的準確度上幾乎與Centaur一樣,而且依然是可解釋的。

核心爭議:行為匹配是否等同于心智模仿?

Centaur在預測和模擬人類行為上的出色表現(xiàn),無疑是令人欣喜的。然而,就在Nature發(fā)表這項研究的同一天,Science立即跟進一篇報道,表達了科學界對這項研究的審慎和質疑。

受訪專家認為,這篇論文以“預測和捕捉人類認知的基礎模型”為題,但這并不意味著Centaur的運行機制與人類心智、思維機制相同,即便“其內部表征與人類神經活動相似”。

加拿大麥吉爾大學的計算神經科學家Blake Richards直言,他認為科學界有相當一部分人會對這篇論文持高度懷疑的態(tài)度,甚至可能會非常嚴厲地批評它。

在他和一些同行看來,Centaur模型并未真正意義上模仿人類的認知過程,因此它能否可靠地生成與人類行為完全匹配的結果,還有待商榷。

具體來說,Centaur本質上仍是一個大模型,而大模型的核心仍是統(tǒng)計模式的“匹配機器”,即使能夠在一定程度上捕捉復雜語義和推理結構,但最后的結果依舊是根據可能性來預測下一個詞。



Science對Nature這項研究的報道

現(xiàn)階段的大模型架構,注定了它們不具備意識、真正的理解,也不具備與人類相同的因果推理能力。盡管在行為數(shù)據上進行微調可以提高預測性能,但這并未從根本上改變其統(tǒng)計關聯(lián)的底層機制。

因此,預測性大模型的功能能力與“人類認知”所隱含的機制理解之間存在顯著的概念鴻溝。

英國布里斯托大學的認知科學家Jeffrey Bowers更是用“荒謬”來評價這個模型。他和團隊親自對Centaur進行了測試,結果發(fā)現(xiàn)它展現(xiàn)出了一些“超人”般的非人類行為。

例如,在短時記憶測試中,Centaur能夠記住多達256位數(shù)字,而我們人類通常只能記住大約7位。在反應時間測試中,模型甚至可以在1毫秒內做出“超人類”反應。

Bowers由此得出結論,所謂Centaur可以在訓練數(shù)據之外進行可靠泛化的結論不可信。這些“超人”表現(xiàn),恰恰說明了模型可能只是在數(shù)據上表現(xiàn)出色,而其內部機制與人類的認知局限性大相徑庭,因此其泛化能力可能并非基于真正的人類認知理解。

更重要的是,Bowers強調,Centaur無法解釋任何關于人類認知的問題。

他打了個比方:模擬時鐘和數(shù)字時鐘都能顯示正確的時間,但它們的內部運行機制卻大相徑庭。Centaur雖然能給出類似人類的輸出,但它所依賴的機制與人類心智的機制可能根本不同。

此外,盡管Psych-101數(shù)據集規(guī)模令人印象深刻,但與“人類認知的無限海洋”相比,160項實驗仍然只是“一粒沙子”,不足以全面覆蓋人類的認知機制。這意味著,模型可能只在訓練數(shù)據覆蓋的范圍內表現(xiàn)良好,但在更廣闊、更復雜的認知領域,其表現(xiàn)可能并不穩(wěn)定。

應該說,這些質疑的聲音并非否定Centaur,而是從科學嚴謹性的角度,提醒我們應以更批判的眼光看待其宣稱的“模仿人類心智”的能力。

它們促使我們思考,僅僅是外部行為的匹配,是否就等同于內部認知過程的模擬?一個能夠展現(xiàn)“超人”能力的模型,其泛化性是否真的可靠?以及,在模型能夠“預測”人類行為之后,下一步如何讓它真正“解釋”人類行為?

這些疑問,無疑為未來的AI模型研究指明了更具挑戰(zhàn)性的方向。

參考資料

[1] https://www.science.org/content/article/researchers-claim-their-ai-model-simulates-human-mind-others-are-skeptical

[2] https://www.nature.com/articles/s41586-025-09215-4

注:本文封面圖片來自版權圖庫,轉載使用可能引發(fā)版權糾紛。



特 別 提 示

1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。

2. 『返樸』提供按月檢索文章功能。關注公眾號,回復四位數(shù)組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。

版權說明:歡迎個人轉發(fā),任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯(lián)系后臺。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
南寧一公司火了!領導全是00后,董事長17歲,該公司發(fā)布聲明回應

南寧一公司火了!領導全是00后,董事長17歲,該公司發(fā)布聲明回應

火山詩話
2025-08-11 08:18:49
微軟怒掏17億美金,只為美國人的490萬噸屎。

微軟怒掏17億美金,只為美國人的490萬噸屎。

差評XPIN
2025-08-12 00:13:42
被王楚欽連追兩局后,張本智和緊急叫了醫(yī)療暫停!許昕:他暫停次數(shù)用完了,不知道是真是假

被王楚欽連追兩局后,張本智和緊急叫了醫(yī)療暫停!許昕:他暫停次數(shù)用完了,不知道是真是假

魯中晨報
2025-08-11 21:33:35
王思聰帶懶懶巴黎度假,頭發(fā)稀疏、下巴后縮,身體像被掏空了一般

王思聰帶懶懶巴黎度假,頭發(fā)稀疏、下巴后縮,身體像被掏空了一般

檸檬有娛樂
2025-07-01 11:33:22
重慶女孩考公差1分,調檔時領導瞥見材料備注,瞬間驚出冷汗

重慶女孩考公差1分,調檔時領導瞥見材料備注,瞬間驚出冷汗

今天說故事
2025-08-02 17:58:12
楊蘭蘭的父親最可能的猜測

楊蘭蘭的父親最可能的猜測

大張的自留地
2025-08-11 13:34:47
楊蘭蘭保鏢身份疑曝光,姓胡為江西人,穿的那件衣服也價值不菲

楊蘭蘭保鏢身份疑曝光,姓胡為江西人,穿的那件衣服也價值不菲

星河也燦爛
2025-08-10 08:23:11
董璇舌釘引爆熱搜!賢妻良母人設背后,藏著多少我們沒看見的她?

董璇舌釘引爆熱搜!賢妻良母人設背后,藏著多少我們沒看見的她?

可樂談情感
2025-08-11 13:16:57
這回老實了!南航圍毆打人父母求放過,網友:父母比孩子更難搞!

這回老實了!南航圍毆打人父母求放過,網友:父母比孩子更難搞!

八斗小先生
2025-08-11 08:25:55
張本智和:醫(yī)療暫停不是不能用 王楚欽應該在場內換衣服 我也沒說

張本智和:醫(yī)療暫停不是不能用 王楚欽應該在場內換衣服 我也沒說

直播吧
2025-08-11 21:58:14
男人將5歲女兒鎖衣柜后搬家,30年后再回老宅卻聽見:爸爸放我出去

男人將5歲女兒鎖衣柜后搬家,30年后再回老宅卻聽見:爸爸放我出去

黃家湖的憂傷
2025-07-08 16:55:18
泰國發(fā)現(xiàn)一具女尸,被鎖鏈鎖住脖子,鎖鏈上還有兩只混凝土啞鈴

泰國發(fā)現(xiàn)一具女尸,被鎖鏈鎖住脖子,鎖鏈上還有兩只混凝土啞鈴

瀟湘晨報
2025-08-11 14:44:04
美俄“領土互換”方案曝光!1/3頓涅茨克交換赫爾松和扎波羅熱

美俄“領土互換”方案曝光!1/3頓涅茨克交換赫爾松和扎波羅熱

環(huán)球熱點快評
2025-08-11 08:21:26
誣陷撞人反轉!新證據曝光,律師分析,女子不止交通違規(guī)那么簡單

誣陷撞人反轉!新證據曝光,律師分析,女子不止交通違規(guī)那么簡單

云景侃記
2025-08-11 11:27:55
我在上海郊區(qū),親眼目睹中產的“體面”崩塌

我在上海郊區(qū),親眼目睹中產的“體面”崩塌

生活魔術專家
2025-08-11 03:57:37
特朗普對英特爾CEO陳立武態(tài)度反轉:要求其辭職數(shù)日后稱其“成就斐然”!英偉達同意向聯(lián)邦政府支付15%的分成

特朗普對英特爾CEO陳立武態(tài)度反轉:要求其辭職數(shù)日后稱其“成就斐然”!英偉達同意向聯(lián)邦政府支付15%的分成

和訊網
2025-08-12 09:47:04
繼德國之后,英國也開始貼出“中文標語”?中國游客:不能夠接受

繼德國之后,英國也開始貼出“中文標語”?中國游客:不能夠接受

奇思妙想草葉君
2025-08-10 22:01:18
龔玥菲拒絕和龐麥郎結婚!他有抑郁癥,滋潤不了我,我會獨守空房

龔玥菲拒絕和龐麥郎結婚!他有抑郁癥,滋潤不了我,我會獨守空房

談史論天地
2025-08-11 08:45:59
1小時清零癌細胞?BNCT國產首臺就在東莞!

1小時清零癌細胞?BNCT國產首臺就在東莞!

東莞潮事兒
2025-08-10 20:20:21
犀利了!在簽下杜蘭特后,前東部全明星將主動降薪90%加盟火箭

犀利了!在簽下杜蘭特后,前東部全明星將主動降薪90%加盟火箭

埃文凱爾
2025-08-12 01:13:46
2025-08-12 11:39:00
返樸 incentive-icons
返樸
科學新媒體“返樸”,科普中國子品牌,倡導“溯源守拙,問學求新”。
3773文章數(shù) 15784關注度
往期回顧 全部

科技要聞

特朗普考慮允許英偉達向中國出售Blackwell

頭條要聞

牛彈琴:特朗普釋放的最新信號 讓歐洲人倒吸一口涼氣

頭條要聞

牛彈琴:特朗普釋放的最新信號 讓歐洲人倒吸一口涼氣

體育要聞

戰(zhàn)勝王楚欽 張本智賽后脫衣瘋狂慶祝

娛樂要聞

文章大G車副駕疑姚笛 舊人重逢引猜測

財經要聞

重磅!中美再次暫停實施24%的關稅90天

汽車要聞

從德系精工到中國智慧 一汽奧迪的豪華進化論

態(tài)度原創(chuàng)

親子
旅游
本地
公開課
軍事航空

親子要聞

不錯哦 親子互動

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

非遺里的天津|讓盛唐的榮華,在蠶絲銅絲間復活

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

多國要求以色列撤回“接管加沙城”計劃

無障礙瀏覽 進入關懷版 波多野结衣AV黑人在线播放| 欧美淫乱一区二区三区| 国产成AV人片久青草影院| 日产精品卡二卡三卡四卡视 | 亚洲国产一区二区三区| 你懂得视频在线| 国产精品美女久久久M| 免费国产裸体美女视频全黄| 肉欲性色Av一区二区| 粗大黑人巨茎大战欧美成人| 乱公和我做爽死我视频| 国产av无码专区| 久www久久| 久久国产福利国产秒拍| 欧美做受 高潮| 男同无码gv一区二区三免费| 高清无码-要射社| 亚洲男人AV天堂午夜在| 久9久9色综合| 国产无套内射在线观看| 国产无遮挡aaa片爽爽| 综合激情视频| 解密无码av在线| 国产熟睡乱子伦视频| 人妻少妇偷人精品久久人妻| 天天摸夜夜添狠狠添| 国产日韩久久免费影院 | 亚洲国产精品久久电影欧美| 国产寡妇树林野战在线播放| 黑人处破女免费播放| 亚洲伊人成人网99999| 亚洲欧洲日产国码高潮αv| 婷婷 五月 开心| 青青草国产精品亚洲专区无码| 欧美色成人综合影院| 西西大胆午夜人体视频| 成熟了的熟妇毛茸茸| 中文字幕无码久久精品| 亚洲精品国产免费av| 人妻 av影院| 中国农村妇女真实BBWBBWBBW|