夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

比思維鏈準(zhǔn)43%!邏輯腦+大模型直覺,推理可靠性大幅提升

0
分享至


新智元報道

編輯:LRST

【新智元導(dǎo)讀】來自中德的研究團隊發(fā)布最新成果,給大模型外掛「邏輯腦」:用答案集編程當(dāng)慢思考,LLM當(dāng)快直覺,空間推理準(zhǔn)確率一口氣提高四成多。這套會自我修正的「神經(jīng)-符號」雙系統(tǒng),讓AI既能說清每一步邏輯,又能跨任務(wù)遷移,向更可靠的通用推理邁出關(guān)鍵一步。

大語言模型(LLMs)已在文本生成、代碼編寫乃至多模態(tài)任務(wù)中展現(xiàn)出驚人的能力,但在涉及嚴(yán)謹(jǐn)邏輯與物理的空間推理任務(wù)上,它們?nèi)燥@得力不從心。

比如,當(dāng)模型需要理解多個物體之間的相對位置關(guān)系,并在復(fù)雜語境下進行多步驟推理時,往往容易出現(xiàn)「邏輯斷裂」:可能在中間步驟中虛構(gòu)錯誤事實,或偏離目標(biāo),最終導(dǎo)致答案不可靠。

這一問題在空間推理任務(wù)中尤為突出??臻g推理要求模型能像人一樣,推演出「桌子在椅子左邊,燈在桌子上方,因此燈也在椅子左邊」這樣的復(fù)雜鏈條。

然而,盡管「思維鏈(Chain-of-Thought)」等提示工程方法在一定程度上提升了模型的推理表現(xiàn),但在多步驟、動態(tài)變化的場景中,它們依舊難以保證邏輯一致性。

為了彌合神經(jīng)網(wǎng)絡(luò)的模式識別能力與符號系統(tǒng)嚴(yán)謹(jǐn)邏輯之間的鴻溝,來自德國圖賓根大學(xué)、斯圖加特大學(xué)(王榮)和同濟大學(xué)(孫坤)的科研人員合作研究發(fā)表在著名的人工智能和深度學(xué)期刊《神經(jīng)網(wǎng)絡(luò)》(Neural Networks)上,該研究提出了一種創(chuàng)新的神經(jīng)-符號(neural-symbolic)框架。


論文鏈接:

https://www.sciencedirect.com/science/article/pii/S0893608025009025

該框架通過一個精巧的自動迭代反饋循環(huán)(而非手動),成功地將大語言模型與一種名為「答案集編程」(Answer Set Programming, ASP)的聲明式邏輯編程系統(tǒng)相結(jié)合,顯著提升了機器的空間推理能力。

研究人員借鑒了認(rèn)知科學(xué)中的「雙過程理論」,該理論認(rèn)為人類思維分為兩個系統(tǒng):系統(tǒng)1負(fù)責(zé)快速、直觀的聯(lián)想式思考,而系統(tǒng)2則進行緩慢、審慎的規(guī)則化推理。

在這套新框架中,LLM強大的語言理解和模式識別能力扮演了類似「系統(tǒng)1」的角色;而ASP作為符號推理的主干,則承擔(dān)了「系統(tǒng)2」的職責(zé),負(fù)責(zé)精確、可驗證的邏輯推導(dǎo)。

基于DSPy框架的神經(jīng)-符號管道框架

該框架的工作流程可以概括為一種「翻譯-執(zhí)行-修正」的協(xié)同模式:

1)翻譯 (Semantic Parsing):首先,LLM接收自然語言形式的上下文和問題,并將其翻譯成ASP能夠理解的、結(jié)構(gòu)化的邏輯事實與規(guī)則代碼。

2)執(zhí)行 (Logical Reasoning):接著,ASP求解器接管這些邏輯代碼,利用其強大的非單調(diào)推理能力(即在信息不完整的情況下進行推理),計算出所有滿足約束條件的穩(wěn)定解。

3)修正 (Iterative Feedback):這是整個系統(tǒng)的核心創(chuàng)新。以往的神經(jīng)-符號方法中,LLM生成的邏輯代碼常常因語法或邏輯錯誤而導(dǎo)致整個系統(tǒng)失敗,成功率有時低至17%

新框架引入了LLM與ASP求解器之間的迭代反饋循環(huán)。如果ASP在執(zhí)行中發(fā)現(xiàn)錯誤,系統(tǒng)會將錯誤信息反饋給LLM,指導(dǎo)其對生成的邏輯程序進行多輪修正,直至代碼在語法和語義上都完全正確。

整個系統(tǒng)基于模塊化的DSPy框架構(gòu)建,它為LLMs和符號求解器之間的無縫雙向交互提供了支持,使得這種復(fù)雜的協(xié)同工作流得以實現(xiàn)。


自然語言查詢轉(zhuǎn)換為ASP表示的過程

在復(fù)雜基準(zhǔn)測試中表現(xiàn)卓越

研究團隊在兩個不同類型的基準(zhǔn)任務(wù)上檢驗了框架:

StepGame:結(jié)構(gòu)化的合成數(shù)據(jù)集,用于測試多步推理。

SpartQA:語言與邏輯復(fù)雜度極高,包含 3D 空間關(guān)系、多重量詞(如「所有」「僅僅」)等挑戰(zhàn)。

結(jié)果顯示,該框架在StepGame上的準(zhǔn)確率達(dá)到82–93%,在SpartQA上為71–80%。

相比直接提示和思維鏈方法,準(zhǔn)確率最高分別提升了43%和25%

更重要的是,這一框架使得推理過程透明、可追溯。每一步邏輯都能通過符號系統(tǒng)進行驗證和修正,避免了「黑箱式」推理難以解釋的問題。


在測試數(shù)據(jù)集SpartQA上LLMs與符號求解器的迭代反饋表現(xiàn)

通往更可靠通用AI的潛力

研究團隊強調(diào),這項成果的意義不僅在于攻克空間推理,更在于提供了一種神經(jīng)網(wǎng)絡(luò)與符號邏輯深度融合的范式。

這條路徑有望解決 AI 長期存在的可解釋性、可靠性與泛化性難題。

尤其值得一提的是,該技術(shù)展現(xiàn)出很強的泛化能力:不僅能處理空間推理任務(wù),還可以擴展到各種需要嚴(yán)謹(jǐn)邏輯鏈條的復(fù)雜任務(wù)場景,如法律推理、多模態(tài)推理、工程規(guī)劃乃至科學(xué)研究等。

通過為LLMs配備外部「邏輯腦」,系統(tǒng)可以在語言理解與邏輯推理之間實現(xiàn)類似人類的「雙系統(tǒng)」協(xié)作,不僅能產(chǎn)出更高質(zhì)量的答案,還能展現(xiàn)出明確的邏輯鏈條。

這種具備自我修正與類人多組件推理能力的混合架構(gòu),這種能自我修正、跨任務(wù)泛化的「人類式推理」新路徑被認(rèn)為是邁向通用人工智能(AGI)的重要一步。

換句話說,這項研究讓大模型從「能說會道」,真正走向「能想會推理」,并具備跨任務(wù)遷移與應(yīng)用的潛力。

參考資料:https://www.sciencedirect.com/science/article/pii/S0893608025009025


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“京圈”中的7位大哥:名門之后、實力雄厚,沒有他們就沒有京圈

“京圈”中的7位大哥:名門之后、實力雄厚,沒有他們就沒有京圈

手工制作阿殲
2025-09-21 05:46:54
王晶再撕內(nèi)娛遮羞布!曝陪睡僅是冰山一角,岳云鵬后直接炸鍋!

王晶再撕內(nèi)娛遮羞布!曝陪睡僅是冰山一角,岳云鵬后直接炸鍋!

可樂談情感
2025-09-23 02:26:36
中國為何叫中國?如果連祖國名字由來都不知道,是不是有點尷尬

中國為何叫中國?如果連祖國名字由來都不知道,是不是有點尷尬

霽寒飄雪
2025-09-21 09:38:26
羅永浩真的怕了?連發(fā)多條微博緊急辟謠,都和西貝有關(guān),網(wǎng)友不認(rèn)

羅永浩真的怕了?連發(fā)多條微博緊急辟謠,都和西貝有關(guān),網(wǎng)友不認(rèn)

火山詩話
2025-09-22 06:02:06
英超官方曬英超球員本屆金球排名:薩拉赫第4最高,帕爾默第8

英超官方曬英超球員本屆金球排名:薩拉赫第4最高,帕爾默第8

直播吧
2025-09-23 06:39:06
她與吳鎮(zhèn)宇20年婚姻幸福,50歲仍保持青春,堪稱娛樂圈典范

她與吳鎮(zhèn)宇20年婚姻幸福,50歲仍保持青春,堪稱娛樂圈典范

流云青史
2025-09-22 17:18:11
金球獎各獎項匯總:巴黎奪4大獎!亞馬爾蟬聯(lián)科帕獎,邦馬蒂3連莊

金球獎各獎項匯總:巴黎奪4大獎!亞馬爾蟬聯(lián)科帕獎,邦馬蒂3連莊

我愛英超
2025-09-23 05:18:10
河南嵩山玉皇溝“巨型蛇頭”已被覆蓋,景區(qū)回應(yīng):考慮對該石頭進行其他樣式的彩繪

河南嵩山玉皇溝“巨型蛇頭”已被覆蓋,景區(qū)回應(yīng):考慮對該石頭進行其他樣式的彩繪

大象新聞
2025-09-21 00:13:15
"樺加沙"超強臺風(fēng)來襲,為什么廣州和深圳不“五?!蹦兀?>
    </a>
        <h3>
      <a href="樺加沙"超強臺風(fēng)來襲,為什么廣州和深圳不“五?!蹦?? 丁丁鯉史紀(jì)
2025-09-22 23:26:20
貝林厄姆歷年金球獎排名:3次入圍最高排名第三,今年排名第23

貝林厄姆歷年金球獎排名:3次入圍最高排名第三,今年排名第23

懂球帝
2025-09-23 00:21:04
二選一顯現(xiàn),郝龍斌不演了,承諾重用三人!鄭麗文或只剩下一招!

二選一顯現(xiàn),郝龍斌不演了,承諾重用三人!鄭麗文或只剩下一招!

小楊侃事
2025-09-22 15:36:08
育英中學(xué)田老師已被立案,畢業(yè)生家長紛紛發(fā)聲,她躲不過去了

育英中學(xué)田老師已被立案,畢業(yè)生家長紛紛發(fā)聲,她躲不過去了

小蘭聊歷史
2025-09-20 12:40:23
悶聲發(fā)財!日本餐企在華瘋狂擴張,市值破萬億,中餐生存難上加難

悶聲發(fā)財!日本餐企在華瘋狂擴張,市值破萬億,中餐生存難上加難

尋墨閣
2025-09-22 12:46:45
華人迎來風(fēng)暴!中美機票瘋漲,一大波華人連夜離開?有大事發(fā)生

華人迎來風(fēng)暴!中美機票瘋漲,一大波華人連夜離開?有大事發(fā)生

每日一見
2025-09-23 01:50:30
廣州中醫(yī)大一附院遇襲主任已做完手術(shù)送至ICU 學(xué)生稱其“人特別好” 知情人透露兩名跟診學(xué)生未受傷

廣州中醫(yī)大一附院遇襲主任已做完手術(shù)送至ICU 學(xué)生稱其“人特別好” 知情人透露兩名跟診學(xué)生未受傷

紅星新聞
2025-09-23 00:23:11
稅局明確!個人分紅,不交個人所得稅了!

稅局明確!個人分紅,不交個人所得稅了!

會計人
2025-09-22 22:58:44
爸爸送女兒上大學(xué),女兒穿搭時尚不讓家長擔(dān)心:怕黃毛盯上

爸爸送女兒上大學(xué),女兒穿搭時尚不讓家長擔(dān)心:怕黃毛盯上

唐小糖說情感
2025-09-17 08:26:38
4年大合同!崔永熙正式簽約加盟!拒絕NBA球隊離譜要求

4年大合同!崔永熙正式簽約加盟!拒絕NBA球隊離譜要求

籃球?qū)崙?zhàn)寶典
2025-09-22 20:38:59
還是低估了翟欣欣!蘇享龍爆弟弟更多細(xì)節(jié),翟父或成最大幫兇

還是低估了翟欣欣!蘇享龍爆弟弟更多細(xì)節(jié),翟父或成最大幫兇

秋姐居
2025-09-22 16:13:51
波蘭宣布拒恢復(fù)中歐班列運行,中方回應(yīng):加強北極航道合作

波蘭宣布拒恢復(fù)中歐班列運行,中方回應(yīng):加強北極航道合作

古事尋蹤記
2025-09-22 07:52:13
2025-09-23 06:52:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
13496文章數(shù) 66164關(guān)注度
往期回顧 全部

科技要聞

iPhone Air主要芯片全自研,蘋果野心曝光

頭條要聞

法國宣布正式承認(rèn)巴勒斯坦國

頭條要聞

法國宣布正式承認(rèn)巴勒斯坦國

體育要聞

曼城擺出大巴車,阿爾特塔:師父你變了!

娛樂要聞

巴圖:不怨父親英達(dá) 不嫉妒弟弟英如鏑

財經(jīng)要聞

信號巨大!潘功勝、吳清等重磅發(fā)聲

汽車要聞

外觀/性能/智能全面升級 第三代領(lǐng)克03靜態(tài)評測

態(tài)度原創(chuàng)

親子
數(shù)碼
游戲
藝術(shù)
健康

親子要聞

媽媽你得給我倆做個好榜樣~

數(shù)碼要聞

罕見蘋果Apple-1電腦拍出47.5萬美元高價,超預(yù)估價近60%

TGA無畏契約ANTGAMER全國挑戰(zhàn)賽 武漢PANDA電競中心門店冠軍誕生

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

內(nèi)分泌科專家破解身高八大謠言

無障礙瀏覽 進入關(guān)懷版 777米奇色狠狠888俺也去乱| 无码区国产区在线播放| 国产调教MS圈论坛视频| 国产极品尤物在线| 欧美老妇免播放| 啊v在线观看| 日韩欧美亚洲综合久久影院 | 国产午夜91福利一区二区| 老女人考逼挤奶| 欧美日韩va| 欧美成人三级网站在线观看| 起碰在线视频| 女人十八毛片A级十八女人| 久久精品亚洲成在人线av麻豆| 国产av不卡| 国产精品导航一区二区 | 性色av一区二区三区人妻| 免费毛片黄片| 欧美日韩在线第一页免费观看| 高h肉漫在线观看| 国产成人国拍亚洲精品| www.色.com视频| 99视频精品免视看| 2020国产情侣在线视频播放| 国产真实偷乱视频| 在线无码免费网站永久| 3D动漫黄无码免费视频| 成在人线av无码免观看麻豆| 中国人妻与老外黑人| 日本成人不卡视频| 观看免费裸体毛片| 亚洲中文字幕有综合久久| 成人免费国产精品视频| 国产精品偷伦视频免费观看国产| 中文字幕15p| 好男人在线社区www在线观看视频| www东京热| 欧美性爱视频网址| 欧美高清喷水视频| 国产www搞黄色| 久久日本片精品aaaaa国产|