夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

HF日趨榜一!真端到端模型AutoDeco終結(jié)手動調(diào)參解碼

0
分享至



大語言模型(LLM)的「煉丹師」們,或許都曾面臨一個共同的困擾:為不同任務(wù)、不同模型手動調(diào)整解碼超參數(shù)(如 temperature 和 top-p)。這個過程不僅耗時耗力,而且一旦模型或任務(wù)發(fā)生變化,歷史經(jīng)驗便瞬間失效,一切又得從頭再來。

這種繁瑣的試錯過程,在許多研發(fā)團隊的日常溝通中屢見不鮮,正如下圖所展示的那樣:



圖 1:研發(fā)人員手動調(diào)整解碼參數(shù)的日常。

一個靈魂拷問隨之而來:為何不能讓模型自己學(xué)會如何解碼,從而實現(xiàn)真正的「端到端」?

事實上,各大模型廠商的 API 文檔也印證了這一難題。以 DeepSeek 為例,其官方文檔明確建議針對不同場景設(shè)置截然不同的 temperature 值,這使得單一的靜態(tài)參數(shù)設(shè)置顯得捉襟見肘。



圖 2:不同任務(wù)需要不同的解碼參數(shù),這使得靜態(tài)設(shè)置難以應(yīng)對復(fù)雜多變的現(xiàn)實需求。

近日,由騰訊 AI Lab 的王琰研究員及其團隊領(lǐng)銜,聯(lián)合香港中文大學(xué)(深圳)唐曉瑩教授及其博士生王志超給出了一個優(yōu)雅的答案。他們推出了名為 AutoDeco 的全新架構(gòu),旨在徹底終結(jié)手動解碼的「手工作坊」時代。這項研究《The End of Manual Decoding: Towards Truly End-to-End Language Models》,通過讓模型動態(tài)預(yù)測并控制自身的解碼參數(shù),向著真正端到端的語言生成邁出了關(guān)鍵一步。



  • 論文鏈接: https://huggingface.co/papers/2510.26697
  • 代碼鏈接: https://github.com/Zacks917/AutoDeco
  • 模型鏈接: https://huggingface.co/collections/Jadeislaw/autodeco



圖 3:AutoDeco 位居 Hugging Face Daily Papers 榜首

當(dāng)前,盡管 LLM 本身已高度集成,但其生成過程的「最后一公里」—— 解碼,仍然是一個獨立于模型之外的、不可微的僵硬環(huán)節(jié)。研究團隊形象地將其比作「手動擋變速箱」:無論引擎(LLM)多么強大,換擋(調(diào)參)依然依賴人工操作。

AutoDeco 的核心思想,就是為 LLM 裝上「自動擋」。它通過在標(biāo)準(zhǔn) Transformer 架構(gòu)中引入兩個超輕量的預(yù)測頭,讓模型在生成每一個 token 時,都能根據(jù)當(dāng)前的上下文信息,動態(tài)地預(yù)測出最適合下一步生成的 temperature 和 top-p 值。其架構(gòu)如下圖所示:



圖 4:AutoDeco(上)與傳統(tǒng)手動解碼(下)的對比。AutoDeco 將解碼參數(shù)的預(yù)測無縫集成到模型的前向傳播中,實現(xiàn)了動態(tài)自調(diào)節(jié)。

核心挑戰(zhàn)與技術(shù)突破:如何訓(xùn)練一個沒有「標(biāo)準(zhǔn)答案」的任務(wù)?

設(shè)想很美好,然而,一個關(guān)鍵的挑戰(zhàn)擺在研究團隊面前:如何訓(xùn)練這些預(yù)測頭?在訓(xùn)練數(shù)據(jù)中,并不存在每一時刻「正確」的溫度和 top-p 標(biāo)簽,這使得監(jiān)督學(xué)習(xí)無從談起。

為此,團隊提出了一種創(chuàng)新的、完全端到端的訓(xùn)練策略。他們設(shè)計了一種新穎的可微分「軟性 top-p」(soft top-p)機制,巧妙地替代了傳統(tǒng) top-p 采樣中不可微的「硬截斷」操作。該方法分為三步:





圖 5:可微分的 soft top-p(橙色線)與傳統(tǒng)的 hard top-p (綠色線)對比。Soft top-p 的平滑特性打通了從最終損失到解碼參數(shù)預(yù)測頭的梯度路徑。

這一設(shè)計的巧妙之處在于,它使得從最終的「下一個詞預(yù)測」損失到解碼參數(shù)預(yù)測頭的梯度能夠順暢回傳。如此一來,模型便可以在標(biāo)準(zhǔn)的 Next Token Prediction 任務(wù)中,通過優(yōu)化最終生成結(jié)果來「倒逼」自己學(xué)會如何動態(tài)調(diào)整解碼策略,整個過程無需任何額外的標(biāo)注數(shù)據(jù)。

AutoDeco 的驚人表現(xiàn):三大亮點

通過在 Llama、Qwen、Deepseek 等多個主流模型家族上的廣泛實驗,AutoDeco 展現(xiàn)了其強大的能力:

  • 卓越的性能與泛化能力

實驗結(jié)果表明,AutoDeco 不僅穩(wěn)定超越了傳統(tǒng)的 Greedy Search 和 Default Sampling 等基線方法,其性能甚至能媲美、乃至超越了利用測試集進(jìn)行精細(xì)調(diào)優(yōu)的「神諭」基線(oracle-tuned baseline)。





圖 6:AutoDeco 在多個數(shù)學(xué)和通用任務(wù) benchmark 上均取得了 SOTA 性能,展現(xiàn)了其強大的泛化能力。

  • 極致的效率與易用性

AutoDeco 的預(yù)測頭設(shè)計極為輕量,其帶來的額外推理延遲通常僅為 1.7%,內(nèi)存開銷也幾乎可以忽略不計。對于開發(fā)者而言,接入 AutoDeco 模型僅需修改幾行代碼,即可享受「免費」的性能提升。

  • 「言出法隨」:開創(chuàng)性的自然語言控制能力

研究中最令人興奮的發(fā)現(xiàn)之一,是 AutoDeco 涌現(xiàn)出的一種「通過自然語言控制解碼」的能力。用戶可以直接在 prompt 中通過自然語言下達(dá)指令,如「我希望答案更有創(chuàng)意」,模型便能「聽懂」并自主地調(diào)高其預(yù)測的 temperature 和 top-p 值,整個過程清晰可見。



圖 7:在不同指令下,AutoDeco 預(yù)測的 T/P 值變化。從左至右分別為:基線、高創(chuàng)造力指令(T/P 值自發(fā)升高)、高確定性指令(T/P 值自發(fā)降低)。

當(dāng)然,作者坦言這種能力還不夠完善,還做不到非常精準(zhǔn)的控制。他們猜測實現(xiàn)細(xì)粒度、高精度的自然語言控制解碼無法僅僅能通過微調(diào) AutoDeco 模塊做到,而是需要全參微調(diào)模型,這也被他們列為了 Future work 的重點。因此,作者沒有放出帶有自然語言控制能力的 AutoDeco heads 權(quán)重。

AutoDeco 在發(fā)布后迅速吸引全球 AI 社區(qū)的關(guān)注,在 Twitter 等社交平臺上引發(fā)了頂尖學(xué)者、開發(fā)者和企業(yè)家的廣泛熱議和高度評價。



圖 8:大模型社區(qū)對 AutoDeco 的廣泛熱議和高度評價。

目前,該團隊已將論文、代碼以及在多個主流模型上訓(xùn)練好的 AutoDeco heads 全面開源,包含適配于 Deepseek V3.1、Qwen3-235B、GPT-OSS-120B 等生產(chǎn)級大模型的版本。正如研究人員在分享中所說,這項工作旨在將研究者和開發(fā)者從繁瑣的調(diào)參工作中解放出來,共同邁向一個更智能、更自動化的 AGI 新時代。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
內(nèi)馬爾遭名宿怒批:“他簡直是足球界的恥辱!”

內(nèi)馬爾遭名宿怒批:“他簡直是足球界的恥辱!”

星耀國際足壇
2025-11-11 11:08:23
坑慘全家!沈伯洋搞臺獨,致家族崩塌!兒女留學(xué)被拒簽,生意崩盤

坑慘全家!沈伯洋搞臺獨,致家族崩塌!兒女留學(xué)被拒簽,生意崩盤

阿萊美食匯
2025-11-11 01:53:52
初三學(xué)生被霸凌者打斷肋骨,母親不去派出所,隔天校園來六輛商務(wù)車

初三學(xué)生被霸凌者打斷肋骨,母親不去派出所,隔天校園來六輛商務(wù)車

懸案解密檔案
2025-10-21 09:24:49
全運會最新金牌榜,江蘇1日8金,金牌平廣東,有人以個人身份奪牌

全運會最新金牌榜,江蘇1日8金,金牌平廣東,有人以個人身份奪牌

第五才子
2025-11-10 23:06:21
鄭功成:應(yīng)以逐步縮小養(yǎng)老金待遇差距為重要任務(wù)

鄭功成:應(yīng)以逐步縮小養(yǎng)老金待遇差距為重要任務(wù)

中國經(jīng)營報
2025-11-10 09:03:17
中國向胡塞武裝提供武器?美國要求立即停止,中方“拒絕”

中國向胡塞武裝提供武器?美國要求立即停止,中方“拒絕”

歷史求知所
2025-11-10 10:05:03
“空降”地方任職后,他任常務(wù)副省長!多個省級政府常務(wù)副職調(diào)整

“空降”地方任職后,他任常務(wù)副省長!多個省級政府常務(wù)副職調(diào)整

上觀新聞
2025-11-10 11:29:14
退休人員注意!社保法或在2030年前進(jìn)行重大修改,啥原因?來看看

退休人員注意!社保法或在2030年前進(jìn)行重大修改,啥原因?來看看

社保小達(dá)人
2025-09-25 10:00:10
中國男同社交軟件Blued全網(wǎng)下架,都是盈利不佳惹的禍?

中國男同社交軟件Blued全網(wǎng)下架,都是盈利不佳惹的禍?

藍(lán)鯊財經(jīng)社
2025-11-10 15:51:37
副院長視頻后續(xù):眼科女主任很愛干凈,沙發(fā)上鋪了兩張無菌床單

副院長視頻后續(xù):眼科女主任很愛干凈,沙發(fā)上鋪了兩張無菌床單

鋭娛之樂
2025-11-07 15:50:06
眼科主任面帶桃花:前一秒甜美養(yǎng)眼,后一秒大尺度畫面太辣眼

眼科主任面帶桃花:前一秒甜美養(yǎng)眼,后一秒大尺度畫面太辣眼

公子麥少
2025-11-08 16:20:48
東契奇38+6+7打爆魚腩!湖人強勢反彈,悍將7搶斷成聯(lián)盟第一

東契奇38+6+7打爆魚腩!湖人強勢反彈,悍將7搶斷成聯(lián)盟第一

體壇小李
2025-11-11 11:03:09
謝什科官宣退出國家隊,仍可能傷缺一個月!曼聯(lián)棄兒寄望迎來轉(zhuǎn)機

謝什科官宣退出國家隊,仍可能傷缺一個月!曼聯(lián)棄兒寄望迎來轉(zhuǎn)機

羅米的曼聯(lián)博客
2025-11-11 10:28:44
40歲師父和20歲女徒弟偷情:全過程披露,骯臟聊天曝光,原配發(fā)聲

40歲師父和20歲女徒弟偷情:全過程披露,骯臟聊天曝光,原配發(fā)聲

博士觀察
2025-11-06 20:42:23
全紅嬋老家新房封頂引來大量無人機“圍觀”:全父表示無奈 村民稱有噪音干擾

全紅嬋老家新房封頂引來大量無人機“圍觀”:全父表示無奈 村民稱有噪音干擾

上游新聞
2025-11-10 17:13:05
數(shù)學(xué),到底是人類的發(fā)現(xiàn)還是發(fā)明?看完之后你不會再糾結(jié)!

數(shù)學(xué),到底是人類的發(fā)現(xiàn)還是發(fā)明?看完之后你不會再糾結(jié)!

宇宙時空
2025-11-06 09:02:26
異性之間一旦睡過了,就算做不了夫妻,這輩子也很難再忘記

異性之間一旦睡過了,就算做不了夫妻,這輩子也很難再忘記

加油丁小文
2025-10-25 09:00:10
副院長和女醫(yī)生的瓜!祖雄兵是全村驕傲,曾琦還有一位鮮肉情人

副院長和女醫(yī)生的瓜!祖雄兵是全村驕傲,曾琦還有一位鮮肉情人

葉公子
2025-11-09 20:33:57
高市早苗創(chuàng)了紀(jì)錄

高市早苗創(chuàng)了紀(jì)錄

牛彈琴
2025-11-11 07:47:45
印度首都汽車爆炸,至少10人喪生!事發(fā)著名景點附近,目擊者:現(xiàn)場一片混亂

印度首都汽車爆炸,至少10人喪生!事發(fā)著名景點附近,目擊者:現(xiàn)場一片混亂

上觀新聞
2025-11-11 08:40:04
2025-11-11 11:23:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11689文章數(shù) 142501關(guān)注度
往期回顧 全部

科技要聞

蘋果新品慘敗,產(chǎn)線拆光、二代擱淺!

頭條要聞

牛彈琴:高市早苗創(chuàng)了紀(jì)錄 上臺20天中方兩次強烈抗議

頭條要聞

牛彈琴:高市早苗創(chuàng)了紀(jì)錄 上臺20天中方兩次強烈抗議

體育要聞

重返諾坎普!梅西:希望有一天能回來

娛樂要聞

何超蓮竇驍真的沒離婚?

財經(jīng)要聞

巴菲特謝幕信:感嘆活到95歲是幸運

汽車要聞

下一代豐田GR卡羅拉或搭全新2.0T四缸發(fā)動機

態(tài)度原創(chuàng)

藝術(shù)
親子
本地
手機
公開課

藝術(shù)要聞

田英章日常書信曝光,字跡開闊驚艷人心!

親子要聞

不孕不育人數(shù)已超5000萬,男性如何守護(hù)生育力?牢記6個建議

本地新聞

這屆干飯人,已經(jīng)把博物館吃成了食堂

手機要聞

國產(chǎn)手機進(jìn)入萬級大電池競爭時代:消息稱10000mAh±電池順利試模

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 小嫩批日出水无码视频免费 | rihanav网址大全| 爱爱高清无码| 亚洲国产精品无码久久98| 成AV人片一区二区三区久久| 第一无码人妻| 99热最新在线观看| 精品一区999| 国产精品视频一品二区三| 亚洲AV无码寂寞少妇久| 久久精品国产只有精品96| 国产精品久久二区二区| 国产精品操美女色色色| 国产成人欧美一区二区三区在线| 国产精品自慰高潮| 狠狠躁夜夜躁人人爽天天不卡软件| 成人欧美一区二区三区黑人动态图| 国产欧美亚洲日韩图片 | 国产一区AV麻豆免费观看| 亚洲中文精品无码| 欧美的屄视频| 国产精品久久久久久名片| 少妇白雪的新婚之夜 | 日韩一卡2卡3卡4卡2021免费观看国色天香 | A级毛片免费观看完整| 中国女人少妇的毛片视频| 好紧好滑好湿好爽免费视频| 免费无码国产明星片在线观看网址 | 国产一区成人在线观看| 午夜无码精品一区二区三区99午| 老熟女操逼视频| 国产精品操美女色色色| 久久午夜国产精品成人无码| 亚洲精品成人网站在线播放| 搡BBBB 搡BBB图| 成人自拍短视频午夜福利| 人人揉揉日日夜夜| 国产乱子伦精品无码码专区| 搡老女人P老熟妇老熟女| 小泽玛利亚一区二区在线观看| 人妻久久网站|