夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網易首頁 > 網易號 > 正文 申請入駐

首個完整開源的生成式推薦框架MiniOneRec,輕量復現(xiàn)工業(yè)級OneRec

0
分享至



中科大 LDS 實驗室何向南、王翔團隊與 Alpha Lab 張岸團隊聯(lián)合開源 MiniOneRec,推出生成式推薦首個完整的端到端開源框架,不僅在開源場景驗證了生成式推薦 Scaling Law,還可輕量復現(xiàn)「OneRec」,為社區(qū)提供一站式的生成式推薦訓練與研究平臺。

近年來,在推薦系統(tǒng)領域,傳統(tǒng) “召回 + 排序” 級聯(lián)式架構的收益正逐漸觸頂,而 ChatGPT 等大語言模型則展現(xiàn)了強大的涌現(xiàn)能力和符合 Scaling Law 的巨大潛力 —— 這股變革性的力量使“生成式推薦”成為當下最熱門的話題之一。不同于判別式模型孤立地計算用戶喜歡某件物品的概率,“生成式推薦” 能夠利用層次化語義 ID 表示用戶歷史行為序列,并基于生成式模型結構直接生成用戶下一批可能交互的物品列表。這種推薦模式顯著提升了模型的智能上限,并為推薦場景引入Scaling Law的可能性。

快手OneRec的成功落地,更是徹底引爆了推薦圈子。憑借端到端的推薦大模型,重構現(xiàn)今的推薦系統(tǒng)不再是空談,它已證明是一場資源可控、能帶來真實線上收益的推薦革命。

然而,對于這一可能革新整個推薦系統(tǒng)的新范式,各大廠卻諱莫如深,核心技術細節(jié)與公開表現(xiàn)鮮有披露。開源社區(qū)與一線大廠的探索似乎正在脫鉤,技術鴻溝日漸明顯。

如何破局?

近日,中國科學技術大學 LDS 實驗室何向南、王翔團隊聯(lián)合 Alpha Lab 張岸團隊正式發(fā)布MiniOneRec。這一框架作為生成式推薦領域首個完整開源方案,為社區(qū)提供了全鏈路、一站式、端到端的訓練與研究平臺。



  • 論文標題:MiniOneRec: An Open-Source Framework for Scaling Generative Recommendation
  • 論文鏈接:https://arxiv.org/abs/2510.24431
  • 代碼鏈接:https://github.com/AkaliKong/MiniOneRec
  • Huggingface 鏈接: https://huggingface.co/kkknight/MiniOneRec

核心貢獻:

  • 端到端流程支持:從 SID 生成、 模型監(jiān)督微調、 推薦驅動的強化學習,全鏈路打通。
  • 開源場景 Scaling Law 驗證:首次在開源數據與模型上,驗證了生成式推薦的 Scaling Law。
  • 優(yōu)化后訓練框架:提供一套輕量、完整的后訓練框架,并引入多項針對推薦任務的改進。

自 10 月 28 日發(fā)布以來,MiniOneRec 就廣受推薦社區(qū)關注。其代碼、數據集、模型權重已全部開源,僅需 4-8 卡 A100 同級算力即可輕松復現(xiàn)。

1. 首次公開數據集驗證生成式推薦 Scaling Law:

研究人員首次在公共數據集上,驗證了生成式推薦模型的 Scaling Law。



圖 1. 模型參數從 0.5B 到 7B 的訓練 Loss 變化。

團隊在 Amazon Review 公開數據上,以統(tǒng)一的設置訓練了從 0.5B 到 7B 的 MiniOneRec 版本。結果驚艷:隨著模型規(guī)模(訓練 FLOPs)的增大,最終訓練損失和評估損失持續(xù)下降,充分展示了生成式推薦范式在參數利用效率上的優(yōu)勢。

2. MiniOneRec 核心技術框架:

該框架提供一站式的生成式推薦輕量實現(xiàn)與改進,具體包括:

(1)豐富的 SID Construction 工具箱

MiniOneRec 為開源社區(qū)提供了豐富的的 SID Construction 工具選擇,已集成 RQ-VAE, RQ-Kmeans, RQ-VAE-v2 (Google 最新工作 PLUM), 并將更新 RQ-OPQ 在內的先進量化算法實現(xiàn)。



下一步,團隊正積極更新接口,以對齊業(yè)界的多模態(tài)需求。

(2)引入世界知識:全流程 SID 對齊策略

研究人員驗證了一個關鍵發(fā)現(xiàn):引入大模型世界知識,能顯著提升生成式推薦的性能。團隊分別評測了 MiniOneRec 與其變體在不同訓練階段的性能表現(xiàn),具體包括:

  • MiniOneRec-Scratch: 基于隨機初始化的 LLM 權重訓練,不做任何 SID - 文本對齊任務。
  • MiniOneRec- W/O ALIGN: 基于預訓練 LLM 進行后訓練,不做任務 SID - 文本對齊。
  • MiniOneRec: 基于預訓練 LLM 進行后訓練,并進行全流程的 SID 對齊。



圖 3. 世界知識對于生成式推薦性能的影響。

結果顯示,基于預訓練 LLM 初始化并進行語義對齊的 MiniOneRec(紅線)始終優(yōu)于未充分對齊的對應變體(黃 / 藍線)。這表明預訓練 LLM 已具備的通用序列處理能力和世界知識,為推薦任務帶來了顯著的額外收益。

基于此發(fā)現(xiàn),MiniOneRec 將 SID token 添加至 LLM 詞表,并在 SFT 和 RL 階段共同優(yōu)化推薦與對齊兩大任務,將 LLM 語言空間與 SID 信號緊密對齊。

(3)獨家優(yōu)化:面向推薦的強化學習策略



圖 4. MiniOneRec 框架。

MiniOneRec 基于 GRPO, 進一步實現(xiàn)了面向推薦的強化學習算法,具體包括

  • 面向推薦的采樣策略

由于采取 Constrained-Decoding 策略規(guī)范模型生成合法 SID,模型的輸出被限制在遠比自然語言狹窄的有限空間。隨著強化學習訓練的深入,傳統(tǒng)采樣策略的熵迅速降低,使得模型在多次采樣時容易反復生成相同的冗余物品,導致優(yōu)化效率低下。基于這個發(fā)現(xiàn),MiniOneRec 替換常規(guī)采樣策略為 Constrained Beam-Search,高效生成多樣化的候選物品,兼顧采樣效率和對負樣本的曝光率。

  • 面向推薦的獎勵塑造

推薦場景用戶交互稀疏,常規(guī)的二元獎勵使得負樣本 “坍縮” 為同一獎勵值,使得強化學習監(jiān)督信號粒度粗糙。MiniOneRec 在準確性獎勵之外,創(chuàng)新性引入排名獎勵,對于高置信度 “困難負樣本” 施加額外懲罰,從而強化排序信號的區(qū)分度。

  • 開源基準測試全面領先

在同一 Amazon 基準上,研究人員將 MiniOneRec 同當前 SOTA 的傳統(tǒng)推薦范式、生成式推薦范式、基于大模型的推薦范式進行了全面對比。



圖 5. MiniOneRec 同傳統(tǒng)推薦、生成式推薦、LLM 推薦性能對比。

結果顯示,MiniOneRec 展現(xiàn)出全面的領先優(yōu)勢:

在 HitRate@K 和 NDCG@K 兩項推薦指標上,MiniOneRec 始終顯著優(yōu)于以往的傳統(tǒng)推薦范式與生成式推薦范式,領先 TIGER 約 30 個百分點。而對于基于大模型的推薦范式,MiniOnRec 呈現(xiàn)總體的領先的同時擁有顯著的上下文 token 優(yōu)勢。

這表明,生成式推薦作為可能的下一代推薦范式擁有顯著潛力。

4. 生成式推薦的展望與思考:

生成式推薦會成為下一代推薦系統(tǒng)的新范式嗎?這個問題似乎還難以有一個定論。

一方面,以美團 MTGR、淘天 URM 等為代表的推薦系統(tǒng)“改革派”,利用生成式架構的長序列建模等能力賦能判別式,在現(xiàn)有的體系內基于 “生成式召回” 方案進行增量改進。

另一方面,以快手 OneRec 為代表的更為激進的“革命派”,則想要直接顛覆傳統(tǒng)多階段級聯(lián)的判別式方案、實現(xiàn)真正端到端自回歸地生成用戶興趣列表。

雖然兩條路線取舍不同,但都在規(guī)?;瘜嵺`中驗證了生成式范式的實際價值。對部分大廠而言,生成式范式已經走出 “可行性驗證” 階段,開始在業(yè)務上創(chuàng)造真實收益。相較于業(yè)界的快速推進,學術界與開源社區(qū)在這一方向仍顯薄弱。面對這場可能重塑推薦技術版圖的機遇,我們期待更多研究者與工程實踐者大膽嘗試,擁抱這或許是推薦領域的“GPT 時刻”。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
16人被查,17人被處分

16人被查,17人被處分

大象新聞
2025-11-17 20:42:08
單項第4金+總第5金!全運會男子1500米自由泳:張展碩再奪一冠

單項第4金+總第5金!全運會男子1500米自由泳:張展碩再奪一冠

全景體育V
2025-11-17 19:46:08
把蘭州文旅干破防的“剪刀姐”身份被扒,不是誰發(fā)視頻誰有理

把蘭州文旅干破防的“剪刀姐”身份被扒,不是誰發(fā)視頻誰有理

Mr王的飯后茶
2025-11-16 21:54:10
全運游泳收官!誕生5大贏家,2人失意,2人成未來希望,一項沒落

全運游泳收官!誕生5大贏家,2人失意,2人成未來希望,一項沒落

籃球圈里的那些事
2025-11-17 21:01:57
寶馬X4才跑一年多,四條輪胎均出現(xiàn)龜裂 4S店:經檢測存在老化,非輪胎品質問題

寶馬X4才跑一年多,四條輪胎均出現(xiàn)龜裂 4S店:經檢測存在老化,非輪胎品質問題

大風新聞
2025-11-17 18:00:05
多地發(fā)文!立即解散約車群、拼車群,否則追究群主法律責任!

多地發(fā)文!立即解散約車群、拼車群,否則追究群主法律責任!

網約車焦點
2025-11-17 12:00:54
吃瓜!網傳某大學首席教授、俄羅斯工程院外籍院士,實為高中畢業(yè)

吃瓜!網傳某大學首席教授、俄羅斯工程院外籍院士,實為高中畢業(yè)

TOP大學來了
2025-11-17 20:54:47
利物浦不會用?1.36億水貨世預賽變球王!2送開天眼助攻,獲9.3分

利物浦不會用?1.36億水貨世預賽變球王!2送開天眼助攻,獲9.3分

我愛英超
2025-11-18 06:23:10
一個時代的盡頭:當澳門的燈光開始熄滅

一個時代的盡頭:當澳門的燈光開始熄滅

七分日記
2025-11-18 00:09:38
日本高官來華,態(tài)度非常頑固,想安排G20會面,中方拒絕得很干脆

日本高官來華,態(tài)度非常頑固,想安排G20會面,中方拒絕得很干脆

時時有聊
2025-11-17 19:55:13
驚天大瓜!原來川普和希拉里不止是政敵,同時還是情敵。

驚天大瓜!原來川普和希拉里不止是政敵,同時還是情敵。

電動貓
2025-11-18 00:18:26
3-2,85分鐘絕殺,波蘭將踢世預賽附加賽,萊萬驚艷頭球+妙傳

3-2,85分鐘絕殺,波蘭將踢世預賽附加賽,萊萬驚艷頭球+妙傳

側身凌空斬
2025-11-18 06:08:33
全網求救:女大學生疑因舉報社區(qū)書記被關精神病8年!

全網求救:女大學生疑因舉報社區(qū)書記被關精神病8年!

兵叔評說
2025-11-17 12:03:30
韓老先生,最后做件人事吧!

韓老先生,最后做件人事吧!

賓語觀世
2025-11-17 13:53:49
妻賢夫禍少!趙春暉是區(qū)政協(xié)委員,她才是狗咬人反殺案的始作俑者

妻賢夫禍少!趙春暉是區(qū)政協(xié)委員,她才是狗咬人反殺案的始作俑者

恪守原則和底線
2025-11-17 07:13:03
俞敏洪在南極旅游發(fā)全員信引爭議,有新東方員工稱“無法共情”

俞敏洪在南極旅游發(fā)全員信引爭議,有新東方員工稱“無法共情”

界面新聞
2025-11-17 18:07:37
震撼!楊蘭蘭澳洲案庭審驚天逆轉,律師發(fā)言掀起軒然大波

震撼!楊蘭蘭澳洲案庭審驚天逆轉,律師發(fā)言掀起軒然大波

熱點菌本君
2025-11-17 15:53:13
大批中國人依然去日本旅游,被日媒看了笑話,記者采訪道出心聲

大批中國人依然去日本旅游,被日媒看了笑話,記者采訪道出心聲

奇思妙想草葉君
2025-11-18 01:27:22
誰在拋棄小米汽車?19%退訂率后,市值蒸發(fā)超2800億

誰在拋棄小米汽車?19%退訂率后,市值蒸發(fā)超2800億

麥大人
2025-11-17 15:20:07
日本航空自衛(wèi)隊參謀長稱,中國不讓中國人去日本,正中日本下懷

日本航空自衛(wèi)隊參謀長稱,中國不讓中國人去日本,正中日本下懷

我心縱橫天地間
2025-11-17 12:59:24
2025-11-18 08:32:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11737文章數 142506關注度
往期回顧 全部

科技要聞

京東外賣要“獨立” 劉強東還宣戰(zhàn)“點評”

頭條要聞

女子手機落在新疆亂石堆 3年后被人跨越5000公里送還

頭條要聞

女子手機落在新疆亂石堆 3年后被人跨越5000公里送還

體育要聞

當家球星受傷后,球迷樂翻了天?

娛樂要聞

金雞獎是“照妖鏡”,揭露人情冷暖?

財經要聞

高市早苗的算計,將讓日本割肉5000億

汽車要聞

新增CDC后變化大嗎? 試駕特斯拉model Y L

態(tài)度原創(chuàng)

家居
時尚
游戲
房產
公開課

家居要聞

回廊通道 強化空間秩序

王妃精致到發(fā)絲,王子直接變禿子

魔壇節(jié)奏丨魔獸操作之神,Happy 4-3力克浪漫奪得少帥杯冠軍

房產要聞

首開狂賣6.68億!??谶@個頂級教育紅盤,引爆??跇鞘校?/h3>

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 欧美激情a∨在线视频播放| 亚洲一区 熟妇| 狠狠色噜噜狠狠狠888奇米视频| 日本乱伦中文字幕免费| 国产不卡精品一区二区三区| 人妻在线免费观看| 久久亚洲精品无码网站| 亚洲av无码一区二区三区网址| 成人午夜高潮免费视频在线观看| 久久精品中文字幕一区| 宅男影院久久久,99| 最新国产精品中文字幕| 精品一区二区日韩| 日日夜夜视频| 欧美老熟妇欲又伦高清视频| 被操了.com| 欧洲国产精品无码专区影院| 亚洲成av大片大片在线播放| ab免费激情| 老熟妇重口另类XXX| 黑人的大黑鞭| 国产精品粉穴| 九色tm视频| 国李Av夂久久久天码免| 麻豆日日干天天干夜夜操| 精品女同同性视频在线网| 玩弄少妇人妻中文字幕| 人妻 调教 视频| 少妇特黄a一区二区三区| 欧美色资源站 最稳定| 亚洲 少妇 一区| 不卡无码网站| 亚洲AV永久无码精品天堂动漫| 亚洲AV永久无码精品无码孕妇| 亚洲人成色777777精仙林踪| 亚洲婷婷五月综合狠狠爱| 爽妇网久久网| 西西人体视频网站| 色窝窝无码一区二区三区| 9z9c.com| 成人午夜福利视频后入|