夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Meta「透視」AI思維鏈:CRV推理診斷,準(zhǔn)確率達(dá) 92%!

0
分享至


新智元報(bào)道

編輯:傾傾

【新智元導(dǎo)讀】 在最近一篇來自Meta FAIR團(tuán)隊(duì)的論文里,研究者找到了一種前所未有的方式——他們能實(shí)時(shí)看到AI的思考過程。這項(xiàng)名為CRV的方法,通過替換模型內(nèi)部的MLP模塊,讓每一步推理都變得「可見」。這不是隱喻,而是可量化的現(xiàn)象。Meta用它讓錯(cuò)誤檢測精度提升到92.47%,也讓人類第一次得以窺見AI是怎么想錯(cuò)的。

「Meta剛剛找到一種方法,可以實(shí)時(shí)觀察AI的思維過程崩潰?!?/p>

一條看似尋常的推文,在AI圈炸開了鍋。


發(fā)帖人是研究員@JacksonAtkinsX,他稱Meta的新技術(shù)能讓機(jī)器的思維「透明化」——不僅能看到模型在想什么,還能看見它在哪一步徹底「想錯(cuò)」。

在Meta FAIR團(tuán)隊(duì)剛發(fā)布的論文中,這項(xiàng)被稱為CRV(Circuit-based Reasoning Verification)的新方法,就像一臺「AI腦部X光機(jī)」:

它能追蹤語言模型的每一次推理、記錄每一條電流路徑,甚至捕捉到思維崩潰的瞬間。


論文鏈接:https://arxiv.org/abs/2510.09312?utm_source

當(dāng)屏幕上那張電路圖突然從整潔的網(wǎng)狀,變成混亂的線團(tuán)——研究者第一次,看見了AI的思維是怎么崩潰的。

Meta「看見」了AI是怎么想錯(cuò)的

Meta剛剛找到一種方法,可以實(shí)時(shí)觀察AI的思維過程崩潰。

當(dāng)研究員Jackson Atkins發(fā)出這條推文時(shí),AI社區(qū)瞬間沸騰了

乍一聽像科幻小說的橋段。AI在思考的時(shí)候忽然斷鏈、炸裂,而研究者卻說能直接看到那一刻。

但這不是夸張。在Meta FAIR團(tuán)隊(duì)剛發(fā)表的論文 《Verifying Chain-of-Thought Reasoning via Its Computational Graph》 中,他們提出了一種新方法:CRV(Circuit-based Reasoning Verification)。

這項(xiàng)技術(shù)能讓研究者在模型「思考」的過程中,看到它的推理電路。

當(dāng)模型推理正確時(shí),它的「內(nèi)部電路圖」干凈、有條理;一旦模型犯錯(cuò),電路圖立刻變得糾纏、雜亂。


推理指紋特征對比圖。錯(cuò)誤推理在這些特征上普遍更加分散、混亂。

研究團(tuán)隊(duì)將這種電路結(jié)構(gòu)稱為模型的「推理指紋(reasoning fingerprint)」。

他們發(fā)現(xiàn),錯(cuò)誤并不是隨機(jī)的,而是有形、有跡可循:只要讀取這張「電路指紋圖」,就能預(yù)測模型是否即將犯錯(cuò)。


在算術(shù)推理實(shí)驗(yàn)中,CRV 的檢測精度(AUROC)從76.45提升至92.47,誤報(bào)率從63.33%降至37.09%。

更令人震撼的是,當(dāng)研究者關(guān)閉一個(gè)錯(cuò)誤激活的乘法特征神經(jīng)元后,模型立即修正了計(jì)算。


例如在表達(dá)式 (7 × ((5 + 9) + 7)) 中,模型原本輸出105,干預(yù)后改為147——完全正確。

錯(cuò)誤推理并非隨機(jī),而是電路執(zhí)行過程中的結(jié)構(gòu)性失敗。

Meta FAIR的研究者用一句話概括他們的目標(biāo):要讓AI不僅能「給出答案」,更能「證明自己想得對」。

重塑推理結(jié)構(gòu)

給機(jī)器裝上「透明大腦」

要想讓AI的思維過程變得「可見」,Meta做了一件幾乎顛覆常識的事:他們重新改造了語言模型的大腦結(jié)構(gòu)。

這項(xiàng)被命名為CRV(Circuit-based Reasoning Verification)的方法,核心思想不是提升模型性能,而是讓AI的每一步推理都能被驗(yàn)證、被追蹤。

我們的目標(biāo)不是讓模型更聰明,而是讓它的思考過程本身變得可驗(yàn)證。

AI的大腦不再是黑盒:每個(gè)「神經(jīng)元」都能被看見

研究團(tuán)隊(duì)首先將模型中的傳統(tǒng)MLP模塊替換為一種可解釋的稀疏結(jié)構(gòu)——Transcoder層。

在不同層將MLP替換為Transcoder后,模型的損失值在短時(shí)間內(nèi)迅速下降并趨于穩(wěn)定。


Transcoder層的訓(xùn)練穩(wěn)定性證明。CRV 不是理論概念,而是可以在大模型上穩(wěn)定運(yùn)行的真實(shí)工程結(jié)構(gòu)。

每個(gè)Transcoder都像一組帶標(biāo)簽的神經(jīng)元,能代表特定的語義特征,例如「加法」「乘法」「括號」或「進(jìn)位」。

這樣一來,研究者就能在推理過程中,看到哪些神經(jīng)元被激活、何時(shí)點(diǎn)亮、如何傳遞。

論文把這一步稱為「X-Ray」,即為模型安裝一層「透視皮膚」。

研究者形容它像「在黑箱里裝上攝像機(jī)」:每一層的計(jì)算過程不再是難以解讀的向量,而是清晰的電路信號。

AI的思維可以畫出來:Meta讓推理變成一張電路圖

當(dāng)模型執(zhí)行一步推理時(shí),系統(tǒng)會繪制出一張歸因圖(Attribution Graph),節(jié)點(diǎn)代表被激活的特征,邊表示它們之間的信息流動(dòng)。

每一次邏輯跳轉(zhuǎn)、每一個(gè)概念結(jié)合,都會在圖上留下痕跡。

這張圖不是靜態(tài)的,而是隨推理動(dòng)態(tài)變化的「思維軌跡」。

當(dāng)模型看到「3+5=」時(shí),研究者可以實(shí)時(shí)看到「加法特征」從底層被點(diǎn)亮、信息如何層層匯聚到輸出。

而當(dāng)模型出錯(cuò)時(shí),路徑就會打結(jié)、分叉、環(huán)繞——像一條錯(cuò)亂的神經(jīng)信號。


CRV 方法流程示意圖中展示了從「替換MLP模塊」、構(gòu)建歸因圖、提取結(jié)構(gòu)特征,到最后交由診斷分類器判定「正確/錯(cuò)誤」的全過程。

讓AI自己暴露錯(cuò)誤:Meta發(fā)現(xiàn)「思維崩潰」的指紋

當(dāng)思維電路圖生成后,Meta提取了大量結(jié)構(gòu)特征:節(jié)點(diǎn)數(shù)量、圖密度、平均邊權(quán)、路徑長度、中心性……

這些數(shù)據(jù)構(gòu)成了模型的「思維指紋。

接著,他們訓(xùn)練了一個(gè)分類器——它不讀文字,也不看答案,只看結(jié)構(gòu)。在實(shí)驗(yàn)中,研究者發(fā)現(xiàn):

當(dāng)圖結(jié)構(gòu)糾纏、分布混亂時(shí),模型幾乎一定在推理出錯(cuò)。

也就是說,模型是否思考正確,不必等它說完答案,只要觀察那張「電路圖」的形態(tài),就能提前判斷。

CRV的出現(xiàn),讓語言模型第一次擁有了「可診斷的神經(jīng)結(jié)構(gòu)」。

Meta并沒有讓AI更聰明,而是讓人類第一次能看見AI是如何出錯(cuò)的。

黑箱不再完全密封,智能第一次露出了自己的「電路斷層」。

不止是論文,更是AI研究的分水嶺

在Meta公布實(shí)驗(yàn)結(jié)果后,最直觀的震撼來自這組對比圖:

CRV與多種驗(yàn)證方法的性能對比。圖中展示了不同方法在算術(shù)推理任務(wù)下的檢測表現(xiàn)。

紅線代表 CRV,無論是在AUROC(檢測精度)、AUPR(正確預(yù)測率) 還是FPR@95(誤報(bào)率)上,都遠(yuǎn)高于或低于其他方法。

這意味著它不僅能看見推理電路的結(jié)構(gòu),更能精準(zhǔn)判斷模型是否會想錯(cuò)。


這樣的結(jié)果讓許多研究者意識到:CRV不只是一次模型改造,而是一次觀念的翻轉(zhuǎn)。

過去,我們判斷一個(gè)模型是否推理正確,只能看它的答案。

它寫出一段chain-of-thought,人類再去揣測邏輯是不是連貫,結(jié)論是不是對的。

這一切都發(fā)生在黑箱之外——我們只能看到輸出,卻無法追蹤「它是怎么想的」。

而Meta的CRV,把這條思維鏈第一次攤在顯微鏡下。研究者不再靠猜,而是能直接看到模型內(nèi)部的邏輯路徑:

每一次特征被點(diǎn)亮,每一條信號被傳遞,都能在圖上找到對應(yīng)的「電路」。

他們不是在評估答案,而是在驗(yàn)證思維的結(jié)構(gòu)本身。


更重要的是,CRV讓「可解釋性」和「可靠性」第一次真正接上了。

在過去的研究里,前者關(guān)注看懂模型,后者追求信得過模型,兩條路幾乎平行——我們能看到熱力圖,卻依然不知道為什么模型會錯(cuò)。

而在Meta的實(shí)驗(yàn)中,研究者既能解釋模型為什么出錯(cuò),也能預(yù)測下一步它可能在哪出錯(cuò)。

CRV也許是通向「可控智能」的第一步。當(dāng)推理錯(cuò)誤能被結(jié)構(gòu)化地識別,就意味著它可以被預(yù)測、干預(yù),甚至被修復(fù)。

論文中有一個(gè)著名的例子——關(guān)閉一個(gè)錯(cuò)誤激活的神經(jīng)特征后,模型立刻修正答案。

這說明錯(cuò)誤并非偶然,而是電路級的故障。如果未來能實(shí)時(shí)監(jiān)測這些特征,我們或許能在幻覺發(fā)生前按下「剎車」。

從這一刻起,AI的錯(cuò)誤不再是神秘的靈異事件。它們是有形的、可診斷的。


不同任務(wù)中正確與錯(cuò)誤推理的拓?fù)涮卣鞣植?strong>。圖中藍(lán)色表示正確推理,紅色表示錯(cuò)誤推理。

Meta把黑箱的蓋子掀開了一條縫——讓人類第一次有機(jī)會,不只是造出智能,而是看懂智能本身。

能看懂AI的那天

我們離「可控智能」還有多遠(yuǎn)?

就算Meta已經(jīng)能「看見AI在想什么」,這項(xiàng)技術(shù)距離真正落地,仍有一段漫長的路要走。

在論文結(jié)尾部分,研究團(tuán)隊(duì)自己就坦率地寫下了「局限與未竟之處」。

我們的方法目前需要大量計(jì)算資源,因?yàn)楸仨殞⑺蠱LP層替換為Transcoder層,并計(jì)算完整的歸因圖。

也就是說,要讓模型變得可見,代價(jià)是巨大的:每一層都要被重建,每一個(gè)特征都要被追蹤。

光是繪制一次完整的歸因圖,就可能消耗掉普通訓(xùn)練的數(shù)十倍算力。這不是能隨意做出的功能,而是需要投入巨大的工程。


更現(xiàn)實(shí)的問題是——規(guī)模。

實(shí)驗(yàn)僅在最大8B參數(shù)規(guī)模的模型上進(jìn)行,將其擴(kuò)展到更大模型仍需后續(xù)研究。

CRV目前只在中等體量的模型上被驗(yàn)證,而如今主流的大語言模型動(dòng)輒上百億、甚至上千億參數(shù),要讓整個(gè)推理電路都能被看見,幾乎不可能在短期內(nèi)完成。

更棘手的是泛化問題。

CRV在算術(shù)任務(wù)上表現(xiàn)亮眼,但一旦換到自然語言推理、常識問答、代碼生成這類復(fù)雜任務(wù)時(shí),歸因圖結(jié)構(gòu)的規(guī)律會完全不同,錯(cuò)誤特征不再穩(wěn)定,診斷效果明顯下降。

最后,Meta團(tuán)隊(duì)也提醒讀者:

Transcoder架構(gòu)只是原始MLP的一種近似,并非完美替代。

這意味著,研究者看到的那些「電路軌跡」,其實(shí)是經(jīng)過重新投影后的近似結(jié)構(gòu)。

Meta的CRV不是讓機(jī)器更聰明,而是讓人類第一次得以窺見智能的內(nèi)部結(jié)構(gòu)。

那些曾被稱為「幻覺」的錯(cuò)誤、不確定的跳躍、莫名的偏差,如今都能被描摹成一張電路圖,被一點(diǎn)點(diǎn)拆解、理解、修復(fù)。

或許距離真正「可靠」的AI還很遠(yuǎn),但這一步已經(jīng)改變了方向。

人類不再只是 AI 的使用者,而是它的讀者、醫(yī)生,也是見證者。

當(dāng)機(jī)器的思維第一次被照亮,這束光也照進(jìn)了我們自己的認(rèn)知——照見了我們對智能的渴望、恐懼,以及那句始終懸在科學(xué)盡頭的問題:

我們究竟是在教會機(jī)器思考,還是在學(xué)會看懂自己?

參考資料:

https://x.com/JacksonAtkinsX/status/1977721832909177032

https://arxiv.org/abs/2510.09312?utm_source=chatgpt.com

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
高市早苗成為日本首位女首相,國產(chǎn)版低市晚苗也出現(xiàn)了

高市早苗成為日本首位女首相,國產(chǎn)版低市晚苗也出現(xiàn)了

微微熱評
2025-10-24 20:17:02
深圳入秋成功!新一輪冷空氣即將“補(bǔ)貨”!未來深圳天氣……

深圳入秋成功!新一輪冷空氣即將“補(bǔ)貨”!未來深圳天氣……

環(huán)球網(wǎng)資訊
2025-10-24 18:47:52
兩大消息落地,A股邏輯發(fā)生重大改變!

兩大消息落地,A股邏輯發(fā)生重大改變!

君臨財(cái)富
2025-10-24 16:18:06
四川一老板回應(yīng)10元1克收了小孩72克黃金:怕孩子找不正規(guī)渠道賣掉,已還給家長

四川一老板回應(yīng)10元1克收了小孩72克黃金:怕孩子找不正規(guī)渠道賣掉,已還給家長

大象新聞
2025-10-23 16:49:10
35歲前國腳退役后復(fù)出!投奔朱駿踢中乙 曾效力申花14年+怒噴斯帥

35歲前國腳退役后復(fù)出!投奔朱駿踢中乙 曾效力申花14年+怒噴斯帥

我愛英超
2025-10-24 20:28:51
突發(fā):俄羅斯導(dǎo)彈擊中莫斯科公交車!無人機(jī)碎片撞向居民樓

突發(fā):俄羅斯導(dǎo)彈擊中莫斯科公交車!無人機(jī)碎片撞向居民樓

項(xiàng)鵬飛
2025-10-24 17:17:55
付鵬最新演講全文:人口是中國未來的終極變量!房地產(chǎn)將大分化

付鵬最新演講全文:人口是中國未來的終極變量!房地產(chǎn)將大分化

知識圈
2025-10-24 20:00:06
即將上映的十大華語電影,周星馳獨(dú)占3部,你期待哪幾部?

即將上映的十大華語電影,周星馳獨(dú)占3部,你期待哪幾部?

小Q侃電影
2025-10-24 11:29:05
重磅:匈牙利爆發(fā)最大規(guī)??棺h!兩架俄軍戰(zhàn)機(jī)入侵立陶宛

重磅:匈牙利爆發(fā)最大規(guī)??棺h!兩架俄軍戰(zhàn)機(jī)入侵立陶宛

項(xiàng)鵬飛
2025-10-24 21:56:56
同樣是諾貝爾獎(jiǎng)獲得者,為何我們常提楊振寧,卻少聞李政道?

同樣是諾貝爾獎(jiǎng)獲得者,為何我們常提楊振寧,卻少聞李政道?

阿訊說天下
2025-10-24 12:46:46
專整中國人?小米日本官網(wǎng)的小字比中國的小字大2.6倍,亮1.8倍

專整中國人?小米日本官網(wǎng)的小字比中國的小字大2.6倍,亮1.8倍

小小河
2025-10-24 01:05:49
當(dāng)?shù)鼗貞?yīng)“87歲大爺騎三輪車送桶裝水”:老人有點(diǎn)閑不住,會派人上門看望慰問

當(dāng)?shù)鼗貞?yīng)“87歲大爺騎三輪車送桶裝水”:老人有點(diǎn)閑不住,會派人上門看望慰問

極目新聞
2025-10-24 18:18:44
湖北男子駕車在小學(xué)門口撞人:現(xiàn)場畫面流出,目擊者披露大量隱情

湖北男子駕車在小學(xué)門口撞人:現(xiàn)場畫面流出,目擊者披露大量隱情

博士觀察
2025-10-24 19:30:35
安世中國硬剛荷蘭,亮明態(tài)度宣布獨(dú)立運(yùn)營,荷蘭發(fā)文放狠話警告

安世中國硬剛荷蘭,亮明態(tài)度宣布獨(dú)立運(yùn)營,荷蘭發(fā)文放狠話警告

現(xiàn)代小青青慕慕
2025-10-24 12:40:15
李楠推測iPhone17 Pro褪色原因:去中國化,換了不專業(yè)的供應(yīng)鏈

李楠推測iPhone17 Pro褪色原因:去中國化,換了不專業(yè)的供應(yīng)鏈

PChome電腦之家
2025-10-24 17:42:17
美荷兩國曾同時(shí)發(fā)聲,對中國獨(dú)立研發(fā)的光刻機(jī)技術(shù)給予了強(qiáng)烈批評

美荷兩國曾同時(shí)發(fā)聲,對中國獨(dú)立研發(fā)的光刻機(jī)技術(shù)給予了強(qiáng)烈批評

凡知
2025-10-23 16:52:40
中方領(lǐng)導(dǎo)人訪韓期間會與日本首相高市早苗會見嗎?外交部回應(yīng)

中方領(lǐng)導(dǎo)人訪韓期間會與日本首相高市早苗會見嗎?外交部回應(yīng)

澎湃新聞
2025-10-24 15:42:26
這次輪到理想汽車了,又一次輿情考驗(yàn)

這次輪到理想汽車了,又一次輿情考驗(yàn)

觀人隨筆
2025-10-24 14:32:18
央視報(bào)道的這件案子,滿屏都是天大的諷刺

央視報(bào)道的這件案子,滿屏都是天大的諷刺

清書先生
2025-10-23 16:09:34
“最嚴(yán)重丑聞”,NBA多人被卷入

“最嚴(yán)重丑聞”,NBA多人被卷入

環(huán)球時(shí)報(bào)國際
2025-10-24 10:56:40
2025-10-25 00:28:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時(shí)代
13698文章數(shù) 66222關(guān)注度
往期回顧 全部

科技要聞

馬斯克“加倍下注”,再次挑戰(zhàn)特朗普手下

頭條要聞

中方回應(yīng)"中國領(lǐng)導(dǎo)人是否會與日本首相高市早苗會見"

頭條要聞

中方回應(yīng)"中國領(lǐng)導(dǎo)人是否會與日本首相高市早苗會見"

體育要聞

被唾罵,被歌頌,一個(gè)隊(duì)長的自我救贖

娛樂要聞

VOGUE大合照太勢利:影后只能站角落?

財(cái)經(jīng)要聞

央行:維護(hù)股市等金融市場平穩(wěn)運(yùn)行

汽車要聞

精致實(shí)用還智能 試駕體驗(yàn)全新歐拉5

態(tài)度原創(chuàng)

健康
家居
藝術(shù)
本地
親子

骨頭"咔咔響"?肌骨超聲到底有何用

家居要聞

寵物友好 溫馨社交空間

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

這個(gè)秋天,一起來粉上漓渚!所有風(fēng)景只為等你

親子要聞

我寧愿養(yǎng)一個(gè)笨笨得孩子

無障礙瀏覽 進(jìn)入關(guān)懷版 亚洲sese| 激情欧美日韩一区二区| 制服丝袜人妻日韩在线| 亚洲第一女人av| 妇女性内射冈站hdwww000| 一级淫乱视频| 18禁无码无遮挡在线播放| 少妇粉嫩小泬喷水视频| 高清不卡av一区| 好了av在线播放| 亚洲欭美日韩颜射在线二| 丰满熟女大屁股水多多| 成午夜精品一区二区三区| 亚洲熟妇无码av在线播放| 久久理论无码中文字幕| 开心婷婷五月丁香| 日韩一本不卡一区二区三区 | 丰满少妇被猛烈进入在线播放视频| 亚洲中文久久久精品无码| 无码粉泬正在播放一线天| 欧美牲交a欧美牲交久久精品| 护士张开腿被奷日出白浆| 国产一区二三区好的| 欧美性爱操死你| 欧美va亚洲va在线观看日本 | Riav亚洲精品| 国产精品久久久天天影视| 成人无码国产| 少妇被粗大的猛烈进出动视频| 免费做爰猛烈吃奶摸视频在线观看 | 亚洲人妻无码视频| www.夜夜操.com| 99成人综合| 自拍校园亚洲欧美另类| 成人伦精品一区二区三区午午影视| 97碰成人国产免费公开视频| 视频区一区二区| 开心婷婷五月| 国产精品日本一区二区不卡视频 | 久久久久亚洲Av片无码ⅴ| 国产成人啪视频一区二区三区|