夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

突破單鏈思考上限,清華團(tuán)隊提出原生「并行思考」scale范式

0
分享至



近年來,大語言模型(LLMs)在復(fù)雜推理任務(wù)上的能力突飛猛進(jìn),這在很大程度上得益于深度思考的策略,即通過增加測試時(test-time)的計算量,讓模型生成更長的思維鏈(Chain-of-Thought)。

然而,這條路徑正面臨著一個明顯的瓶頸:隨著計算資源的持續(xù)投入,性能提升變得微乎其微,甚至陷入停滯。

來自清華大學(xué) AIR 的一篇最新研究論文《ParaThinker: Native Parallel Thinking as a New Paradigm to Scale LLM Test-time Compute》對這一瓶頸發(fā)起了挑戰(zhàn) 。



該研究一針見血地指出,這個單鏈 test time scaling 的天花板并非模型能力的固有極限,而是源于當(dāng)前順序推理策略的根本缺陷 —— 一種被研究者稱為「隧道視野」(Tunnel Vision)的現(xiàn)象。

為此,團(tuán)隊提出了模型原生的并行化思考方案,訓(xùn)練 LLM 在一次推理中同時生成和綜合多個不同的推理路徑,從而有效規(guī)避「隧道視野」問題,解鎖模型潛在的推理能力。

該研究證明,與串行擴(kuò)展計算深度相比,并行擴(kuò)展計算寬度是一種更有效、更高效的推理策略。



  • 論文標(biāo)題:
  • ParaThinker: Native Parallel Thinking as a New Paradigm to Scale LLM Test-time Compute
  • 作者:Hao Wen*, Yifan Su*, Feifei Zhang, Yunxin Liu, Yunhao Liu, Ya-Qin Zhang, Yuanchun Li (*Equal Contribution)
  • 機(jī)構(gòu):清華大學(xué)
  • 論文地址:https://arxiv.org/pdf/2509.04475

隧道視野:深度思考的阿喀琉斯之踵

擴(kuò)展瓶頸(Scaling Bottleneck):如下圖所示,對于單個推理路徑(P=1),當(dāng)投入的計算資源(即 Token 預(yù)算)超過一定限度后,模型準(zhǔn)確率便不再提升,甚至可能下降,這表明「想得更久」并不能持續(xù)帶來回報。



隧道視野(Tunnel Vision):LLM 在生成思維鏈的初期,一旦邁出有瑕疵的第一步,就很容易被鎖定在一條次優(yōu)的推理路徑上,難以在后續(xù)步驟中糾正或發(fā)現(xiàn)更優(yōu)的解法 。模型仿佛走進(jìn)了一條狹窄的隧道,無論走多遠(yuǎn),都無法擺脫最初錯誤方向的束縛。

如下圖 (b) 所示,研究者進(jìn)行了一項實驗:他們故意讓模型從一個錯誤的推理前綴開始繼續(xù)生成答案。結(jié)果顯示,錯誤的前綴越長,模型最終能夠 “撥亂反正” 得到正確答案的概率就越低。這證明了 LLM 一旦陷入錯誤的思維定式,就很難自行跳出。



新范式:從「深度」到「廣度」

原生并行思考(Native Parallel Thinking)的核心思想是,與其讓模型在一條路徑上「死磕」,不如讓它同時探索多條不同思路的推理路徑,最后再綜合提煉出最優(yōu)答案。

為此,研究團(tuán)隊推出了一個名為 ParaThinker 的端到端框架。該框架能夠訓(xùn)練 LLM 在一個統(tǒng)一的前向傳播過程中,并行生成多個多樣化的推理路徑,并將它們?nèi)诤铣梢粋€更高質(zhì)量的最終答案。

ParaThinker 的實現(xiàn)主要依靠三大核心創(chuàng)新:





此外,一個關(guān)鍵的工程優(yōu)勢在于,ParaThinker 在匯總階段能夠重用并行推理過程中生成的 KV 緩存。這極大地節(jié)省了計算資源,避免了昂貴的重新計算(re-prefilling),使得整個過程的延遲開銷極小。

超越 Majority Voting 與簡單任務(wù)分解

并行推理并非一個全新的概念,類似「多數(shù)投票」(Majority Voting)的方法早已被用于提升模型在選擇題或數(shù)值計算等任務(wù)上的表現(xiàn)。但這類方法的局限性也十分明顯:它們依賴于可被輕易量化和驗證的答案格式,而對于代碼生成、數(shù)學(xué)證明、復(fù)雜智能體工作流等開放式、生成式的任務(wù)則束手無策。

ParaThinker 的優(yōu)越性正在于此。它不是簡單地對多個獨(dú)立結(jié)果進(jìn)行投票,而是學(xué)習(xí)如何智能地「整合」與「提煉」來自不同推理過程的信息。這使其成為一種更通用、更強(qiáng)大的并行推理框架,能夠處理無法被簡單投票的復(fù)雜任務(wù),真正釋放了并行思考的潛力。

在并行推理的探索道路上,除了 ParaThinker,近年來也涌現(xiàn)出其他值得關(guān)注的思路,例如以 Multiverse(https://arxiv.org/abs/2506.09991)為代表的工作,但其主要目標(biāo)側(cè)重效率:根據(jù)原文分析,這些方法的主要目標(biāo)是加速生成過程,即讓模型「做得快」,而不是直接致力于提升最終答案的準(zhǔn)確性。

此外,其任務(wù)分解依賴任務(wù)結(jié)構(gòu):它們的成功很大程度上依賴于任務(wù)本身是否適合被顯式地分解。對于許多不可分解的、需要整體性思維的復(fù)雜問題,這種方法的適用性便會受限。

相比之下,ParaThinker 提供了一種更具普適性的并行范式。它不假設(shè)任何子任務(wù)結(jié)構(gòu),也不試圖對問題進(jìn)行拆解。ParaThinker 的核心目標(biāo)是通過思維的多樣性來提升準(zhǔn)確性。

實驗結(jié)果:正確率隨思維廣度有效提升

在 AIME、AMC、MATH-500 等難度基準(zhǔn)上,1.5B 參數(shù)模型用 8 條并行路徑,平均準(zhǔn)確率提升12.3%;7B 模型提升7.5%



延遲開銷較低:推理延遲并不隨著同時思維鏈數(shù)而線性增長,在 batch size=1 時,并行路徑數(shù)增加了 8 倍,但延遲僅增加了約 10%,這體現(xiàn)了并行計算在硬件層面的巨大優(yōu)勢。



與多數(shù)投票(Majority Voting)的結(jié)合

ParaThinker 與 majority voting 策略(即生成 k 個獨(dú)立答案,選擇出現(xiàn)次數(shù)最多的那個)并不沖突,兩者疊加可以達(dá)到更高的正確率。



ParaThinker 教會大模型像人類一樣「頭腦風(fēng)暴」,并行探索多種思路,再整合成最優(yōu)答案。它預(yù)示著未來 LLM 的規(guī)?;l(fā)展之路,將從單純的「深度」擴(kuò)展轉(zhuǎn)向更有效的「廣度」擴(kuò)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“對不起,我不再吹捧中國了!”英國網(wǎng)紅提姆哥這段視頻突然爆火

“對不起,我不再吹捧中國了!”英國網(wǎng)紅提姆哥這段視頻突然爆火

眼光很亮
2025-09-21 04:02:43
百萬網(wǎng)紅戶晨風(fēng)全網(wǎng)封禁,全網(wǎng)平臺視頻下架賬號禁言:一場“流量毒癮”時代的終結(jié)

百萬網(wǎng)紅戶晨風(fēng)全網(wǎng)封禁,全網(wǎng)平臺視頻下架賬號禁言:一場“流量毒癮”時代的終結(jié)

侃故事的阿慶
2025-09-20 23:45:48
莫迪:印度真正的敵人是對外國的依賴

莫迪:印度真正的敵人是對外國的依賴

參考消息
2025-09-21 19:08:06
「年度女優(yōu)人氣榜單」重磅揭曉,你心儀的女神位居何位?

「年度女優(yōu)人氣榜單」重磅揭曉,你心儀的女神位居何位?

素然追光
2025-09-22 01:45:04
浙江跟隊怒批馬寧:出牌動作夸張、人體扭曲,暴露其表現(xiàn)型人格

浙江跟隊怒批馬寧:出牌動作夸張、人體扭曲,暴露其表現(xiàn)型人格

直播吧
2025-09-21 11:52:09
為啥毒癮難戒到讓人心死?網(wǎng)友分享句句都實在戳心!

為啥毒癮難戒到讓人心死?網(wǎng)友分享句句都實在戳心!

墻頭草
2025-09-09 07:54:46
雷軍突然發(fā)文!網(wǎng)友爆了

雷軍突然發(fā)文!網(wǎng)友爆了

極目新聞
2025-09-19 14:00:05
“吃飯七分飽”被推翻了?醫(yī)生:過了65歲,吃飯盡量要做到這9點(diǎn)

“吃飯七分飽”被推翻了?醫(yī)生:過了65歲,吃飯盡量要做到這9點(diǎn)

朗威游戲說
2025-09-19 10:17:41
合計1600萬噸,又擊中兩個俄煉油廠!烏克蘭F-16成巡航導(dǎo)彈殺手

合計1600萬噸,又擊中兩個俄煉油廠!烏克蘭F-16成巡航導(dǎo)彈殺手

鷹眼Defence
2025-09-21 17:31:31
英超最新積分戰(zhàn)報:強(qiáng)隊紛紛丟分,利物浦優(yōu)勢擴(kuò)大,曼城第9

英超最新積分戰(zhàn)報:強(qiáng)隊紛紛丟分,利物浦優(yōu)勢擴(kuò)大,曼城第9

足球狗說
2025-09-22 07:33:53
買了電車才懂的三個血淋淋教訓(xùn):家里沒這條件,千萬別買電車!

買了電車才懂的三個血淋淋教訓(xùn):家里沒這條件,千萬別買電車!

沙雕小琳琳
2025-09-20 04:48:11
小紅書被官媒點(diǎn)名原因曝光:煽動仇視父母、顛倒黑白只是冰山一角

小紅書被官媒點(diǎn)名原因曝光:煽動仇視父母、顛倒黑白只是冰山一角

涵豆說娛
2025-09-13 14:38:09
被央視怒批、搖頭晃腦、德不配位,難怪閱兵從不邀請“流量”明星

被央視怒批、搖頭晃腦、德不配位,難怪閱兵從不邀請“流量”明星

書雁飛史oh
2025-09-12 16:09:35
3分絕殺!中國男籃揚(yáng)眉吐氣,爆冷掀翻美國隊,晉級三人世界杯8強(qiáng)

3分絕殺!中國男籃揚(yáng)眉吐氣,爆冷掀翻美國隊,晉級三人世界杯8強(qiáng)

侃球熊弟
2025-09-22 01:19:18
法國記者:登貝萊將獲得2025年金球獎

法國記者:登貝萊將獲得2025年金球獎

懂球帝
2025-09-21 17:22:08
“一家人湊不出個高中學(xué)歷”,女子36歲喜當(dāng)奶,網(wǎng)友發(fā)言戳破現(xiàn)實

“一家人湊不出個高中學(xué)歷”,女子36歲喜當(dāng)奶,網(wǎng)友發(fā)言戳破現(xiàn)實

妍妍教育日記
2025-09-20 17:13:20
排隊搶iPhone 17的人傻了?貼膜工具變“毀機(jī)神器” 質(zhì)感差到想哭

排隊搶iPhone 17的人傻了?貼膜工具變“毀機(jī)神器” 質(zhì)感差到想哭

叮當(dāng)當(dāng)科技
2025-09-21 19:13:01
楊瀚森與利拉德?lián)肀?!開拓者舉辦球迷派對:歡迎35歲傳奇回家

楊瀚森與利拉德?lián)肀В¢_拓者舉辦球迷派對:歡迎35歲傳奇回家

羅說NBA
2025-09-22 06:23:35
有種“較量”叫張碧晨華晨宇,孩子6歲,才發(fā)現(xiàn)魔高一尺道高一丈

有種“較量”叫張碧晨華晨宇,孩子6歲,才發(fā)現(xiàn)魔高一尺道高一丈

不八卦掌門人
2025-09-20 17:12:08
最新消息!河北孟村殺妻案進(jìn)入下一階段,弟弟說小區(qū)監(jiān)控沒有了

最新消息!河北孟村殺妻案進(jìn)入下一階段,弟弟說小區(qū)監(jiān)控沒有了

九方魚論
2025-09-21 19:26:22
2025-09-22 07:59:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11323文章數(shù) 142453關(guān)注度
往期回顧 全部

科技要聞

蔚來全新ES8正式上市:售價40.68萬元起

頭條要聞

美H-1B新規(guī)引發(fā)大混亂 有印度人花8000美元買機(jī)票返美

頭條要聞

美H-1B新規(guī)引發(fā)大混亂 有印度人花8000美元買機(jī)票返美

體育要聞

在意甲最草根的球會 創(chuàng)造新的"萊斯特奇跡"

娛樂要聞

西安街頭邂逅趙露思,美到讓人不敢認(rèn)

財經(jīng)要聞

始祖鳥“跑偏”

汽車要聞

全系華為+寧德時代 阿維塔07 26款售21.99萬元起

態(tài)度原創(chuàng)

藝術(shù)
家居
旅游
時尚
手機(jī)

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

家居要聞

公共藝術(shù) 限時體驗打造

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

伊姐周日熱推:電視劇《吳邪私家筆記》;電視劇《灼灼韶華》......

手機(jī)要聞

三星One UI 9.0 曝光,預(yù)計最快明年亮相

無障礙瀏覽 進(jìn)入關(guān)懷版 欧美色图亚州| 美女爆乳动态后入| 国产精品高潮呻吟久久AV无码舒淇| 亚洲日韩在线观看国产精品每日更新| 在线高潮网站| 97人人超碰国产精品最新o| a级毛片无码免费真人| 超碰97conper| 久久96热人妻偷产精品| 亚洲综合久久AV一区二区三区| 性按摩xxxx在线观看| 激情视频综合网| 99人妻视频| 小辣椒福利视频导航| 亚洲色大18成人网站www在线播放| 无码精品人妻一区二区三区中| huisheav| 中文av乳导航| 国精精品一区二区三区有限公司| 香蕉久久久久久av综合网成人| 五月天无码av| 亚洲精品久久7777777国产| 性一交一乱一伦a片| 99www久久综合久久爱com| 又大又长粗又爽又黄少妇视频| 国产一区二区不卡91| 一区二区三区黑人搞亚洲女| 人人妻人人澡人人爽曰本| 国产精品国产三级国产av剧情| 久久国产福利播放| WWW.色婷| 无码色av一二区在线播放| 久久亚洲精品无码播放| 中国极品少妇XXXX| 久久久久人妻精品区一| 丰满人妻被猛烈| 免费在线你懂的| 黄片大全免费av| 亚洲综合亚洲激情| 国产又黄又爽又湿的免费网站| 国产农村老熟女国产老熟女|