夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

智源開源EditScore:為圖像編輯解鎖在線強(qiáng)化學(xué)習(xí)的無限可能

0
分享至



隨著多模態(tài)大模型的不斷演進(jìn),指令引導(dǎo)的圖像編輯(Instruction-guided Image Editing)技術(shù)取得了顯著進(jìn)展。然而,現(xiàn)有模型在遵循復(fù)雜、精細(xì)的文本指令方面仍面臨巨大挑戰(zhàn),往往需要用戶進(jìn)行多次嘗試和手動篩選,難以實(shí)現(xiàn)穩(wěn)定、高質(zhì)量的「一步到位」式編輯。

強(qiáng)化學(xué)習(xí)(RL)為模型實(shí)現(xiàn)自我演進(jìn)、提升指令遵循能力提供了一條極具潛力的路徑。但其在圖像編輯領(lǐng)域的應(yīng)用,長期以來受限于一個核心瓶頸:缺乏一個能夠精確評估編輯質(zhì)量并提供高保真度反饋的獎勵模型(Reward Model)。沒有可靠的「獎勵信號」,模型便無法有效判斷自身生成結(jié)果的優(yōu)劣,從而難以實(shí)現(xiàn)高效的自我優(yōu)化。

為攻克這一難題,北京智源人工智能研究院 VectorSpace Lab 團(tuán)隊近日發(fā)布了全新的高保真獎勵模型系列——EditScore。該工作直面上述挑戰(zhàn),旨在為指令引導(dǎo)的圖像編輯任務(wù)提供精確、可靠的獎勵信號,從而為強(qiáng)化學(xué)習(xí)在 AIGC 領(lǐng)域的深入應(yīng)用鋪平道路,真正解鎖其強(qiáng)大潛力。



EditScore 是智源在成功推出統(tǒng)一圖像生成模型 OmniGen 系列之后,對更通用、更可控的生成式 AI 的又一重要探索。為了促進(jìn)未來在獎勵建模、策略優(yōu)化和??智能驅(qū)動的模型改進(jìn)等領(lǐng)域的研究,EditScore 模型系列和 EditReward-Bench 數(shù)據(jù)集現(xiàn)已全?開源。同時,經(jīng)過強(qiáng)化學(xué)習(xí)微調(diào)的 OmniGen2-EditScore7B 模型也已同步開放。

團(tuán)隊表示,后續(xù)將陸續(xù)發(fā)布應(yīng)?于 OmniGen2 的強(qiáng)化學(xué)習(xí)訓(xùn)練代碼,以及針對 OmniGen2、Flux-dev-Kontext 和 Qwen-Image-Edit 的 Best-of-N 推理腳本,歡迎社區(qū)持續(xù)關(guān)注。



  • 論?鏈接: https://arxiv.org/abs/2509.23909
  • EditScore GitHub: https://github.com/VectorSpaceLab/EditScore
  • EditScore 模型權(quán)重:https://huggingface.co/collections/EditScore/editscore-68d8e27ee676981221db3cfe
  • EditReward-Bench 評測基準(zhǔn):https://huggingface.co/datasets/EditScore/EditReward-Bench
  • RL 微調(diào)后的編輯模型 (OmniGen2-EditScore7B): https://huggingface.co/OmniGen2/OmniGen2-EditScore7B

從評估到賦能:EditScore 的系統(tǒng)化解決方案

為了克服圖像編輯領(lǐng)域缺乏高質(zhì)量獎勵信號的障礙,EditScore 團(tuán)隊提出了一套系統(tǒng)的兩步解決方案。

第?步:建?嚴(yán)謹(jǐn)?shù)脑u估標(biāo)準(zhǔn)

?欲善其事,必先利其器。為了能夠直接、可靠地評估圖像編輯獎勵模型的質(zhì)量,團(tuán)隊?先構(gòu)建并開源了EditReward-Bench,這是業(yè)界?個專?為評估圖像編輯獎勵模型?設(shè)計的公開基準(zhǔn),涵蓋了 13 個不同的?任務(wù)和 11 個當(dāng)前最先進(jìn)的編輯模型(包括閉源模型),并包含了專家級的??標(biāo)注,為衡量獎勵信號的質(zhì)量建?了??標(biāo)準(zhǔn)。

第?步:開發(fā)強(qiáng)?的多功能?具

在 EditReward-Bench 的指引下,團(tuán)隊精?策劃數(shù)據(jù)并進(jìn)?訓(xùn)練,最終成功開發(fā)出 EditScore 系列模型(分為 7B、32B、72B 三個尺?)。這?系列模型是專為指令圖像編輯任務(wù)設(shè)計的?保真獎勵模型,旨在提供?通?視覺語?模型(VLM)更精確的反饋信號。



EditReward-Bench 上的基準(zhǔn)測試結(jié)果,顯示了 EditScore 相較于其他模型的優(yōu)越性

核心亮點(diǎn):

  • 頂尖性能:EditScore 在 EditReward-Bench 上的表現(xiàn)媲美甚?超越了頂級的閉源視覺語?模型。通過?種有效的?集成策略(self-ensembling),其最?規(guī)模的模型甚?在準(zhǔn)確性上超過了 GPT-5。
  • 可靠的評估標(biāo)準(zhǔn):團(tuán)隊推出的 EditReward-Bench 是?個專??于評估圖像編輯領(lǐng)域獎勵模型的公開基準(zhǔn)。
  • 簡潔易?:開發(fā)者只需??代碼,即可輕松地為圖像編輯結(jié)果獲得?個準(zhǔn)確的質(zhì)量評分。
  • 應(yīng)??泛:EditScore 不僅可以作為?流的重排序器(reranker)來優(yōu)化編輯輸出,還可以作為?保真獎勵信號,賦能穩(wěn)定?效的 RL 微調(diào)。

實(shí)踐出真知:EditScore 的兩?應(yīng)?場景

EditScore 的實(shí)?價值在兩個關(guān)鍵應(yīng)?中得到了充分驗(yàn)證:

  1. 作為最先進(jìn)的重排序器:通過「優(yōu)中選優(yōu)」(Best-of-N)的?式,EditScore 能夠即時提升多種主流編輯模型的輸出質(zhì)量。

  2. 作為強(qiáng)化學(xué)習(xí)的?保真獎勵:當(dāng)通?視覺語?模型在強(qiáng)化學(xué)習(xí)訓(xùn)練中束??策時,EditScore 能夠提供穩(wěn)定且?質(zhì)量的獎勵信號,成功解鎖了在線強(qiáng)化學(xué)習(xí)在圖像編輯領(lǐng)域的應(yīng)?,并帶來了顯著的性能提升。 團(tuán)隊的實(shí)驗(yàn)表明,將 EditScore-7B 應(yīng)?于 OmniGen2 模型的 Flow-GRPO 微調(diào)后,OmniGen2 在 GEdit 基準(zhǔn)上的得分從 6.28 提升? 6.83。



EditScore 作為圖像編輯的卓越獎勵信號,能夠精確區(qū)分編輯質(zhì)量的好壞。



將 EditScore 作為強(qiáng)化學(xué)習(xí)獎勵模型應(yīng)用于 OmniGen2 的視覺結(jié)果對比

探索與發(fā)現(xiàn):模型背后的深刻洞?

在研究過程中,團(tuán)隊還獲得了?些有趣的洞?:

  • ?分 ≠ 好教練?獎勵模型的打分準(zhǔn)確性并?決定強(qiáng)化學(xué)習(xí)訓(xùn)練效果的唯?因素。?個優(yōu)秀的「AI 教練」不僅需要打分精準(zhǔn),其輸出分?jǐn)?shù)的分布形態(tài)也?關(guān)重要。例如,獎勵模型打分的?差就可能會影響強(qiáng)化學(xué)習(xí)的效果。



GPT-4.1 系列獎勵模型憑借更優(yōu)的輸出分布特性,能夠更有效地指導(dǎo)強(qiáng)化學(xué)習(xí)優(yōu)化

  • 巧妙的「集成」策略:對于?成式獎勵模型,通過多次推理取均值的?集成擴(kuò)展策略(Self-Ensemble Scaling),在提升性能??的效果可能優(yōu)于單純地擴(kuò)?模型參數(shù)量。這意味著,?個精?設(shè)計的 7B 模型,通過此策略可能在特定任務(wù)上達(dá)到甚?超越更?模型的性能。



EditScore 持續(xù)的從參數(shù)拓展和測試時計算拓展(Self-ensemble)中獲得性能增益

結(jié)語

智能的成長離不開自我評估與持續(xù)進(jìn)化。EditScore 讓模型具備了「自我審視」與「自我進(jìn)化」的能力,為提升 AIGC 的可控性與可靠性打開了新的可能。

智源研究團(tuán)隊表示,將持續(xù)深入獎勵建模研究,「我們很高興將EditScore、EditReward-Bench 、OmniGen2-EditScore7B以及所有的研究發(fā)現(xiàn)開源,希望能為業(yè)界帶來新的啟發(fā),期待與社區(qū)共同探索,讓 AIGC 模型變得更智能、更可控、更可靠,在更多領(lǐng)域釋放創(chuàng)造的力量」。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
3000億芯片巨頭轟然倒下!中國芯的“遮羞布”,如今徹底被揭開

3000億芯片巨頭轟然倒下!中國芯的“遮羞布”,如今徹底被揭開

壹知眠羊
2025-09-10 21:24:15
不按套路出牌!中國突然換將,信號很強(qiáng)烈,特朗普的談判夢該醒了

不按套路出牌!中國突然換將,信號很強(qiáng)烈,特朗普的談判夢該醒了

阿七說史
2025-10-21 21:40:01
上海奢侈品活動:朱珠對秦海璐強(qiáng)勢挑眉,寧澤濤斜眼偷看,全是戲

上海奢侈品活動:朱珠對秦海璐強(qiáng)勢挑眉,寧澤濤斜眼偷看,全是戲

松林侃世界
2025-10-22 18:54:25
逼妻子學(xué)黃片姿勢,逼兒子當(dāng)狗,用敵敵畏給妻子洗頭

逼妻子學(xué)黃片姿勢,逼兒子當(dāng)狗,用敵敵畏給妻子洗頭

胖胖侃咖
2025-10-22 15:54:57
四川青川往事:警察、金礦與十九具尸體的沉默協(xié)議

四川青川往事:警察、金礦與十九具尸體的沉默協(xié)議

有戲
2025-10-20 23:09:01
69歲老人砍殺鄰居后跳樓,四人死亡一人受傷,鄰居透露更多細(xì)節(jié)!

69歲老人砍殺鄰居后跳樓,四人死亡一人受傷,鄰居透露更多細(xì)節(jié)!

眼光很亮
2025-10-22 15:37:41
章澤天倫敦看展,打扮時髦,肋骨外翻引熱議,網(wǎng)友:像四個胸!

章澤天倫敦看展,打扮時髦,肋骨外翻引熱議,網(wǎng)友:像四個胸!

心靜物娛
2025-10-21 09:13:46
氣血不足百病生!建議中老年人:少吃紅棗和花生,多吃這3道菜!

氣血不足百病生!建議中老年人:少吃紅棗和花生,多吃這3道菜!

江江食研社
2025-10-19 17:40:05
哇塞 劉若英都55歲咯 瞅見她的手,才感覺到歲月在她身上留下印子啦

哇塞 劉若英都55歲咯 瞅見她的手,才感覺到歲月在她身上留下印子啦

鄉(xiāng)野小珥
2025-10-21 12:51:02
瓜帥賭贏了!12億歐曼城全面復(fù)興:已2個月沒輸球了 大魔王12連殺

瓜帥賭贏了!12億歐曼城全面復(fù)興:已2個月沒輸球了 大魔王12連殺

風(fēng)過鄉(xiāng)
2025-10-22 08:15:20
特朗普,突發(fā)!降息大消息!黃金,突變!

特朗普,突發(fā)!降息大消息!黃金,突變!

證券時報e公司
2025-10-22 07:55:02
這下出名了!全網(wǎng)都知道了娃哈哈新任總經(jīng)理許思敏,竟是1994年的

這下出名了!全網(wǎng)都知道了娃哈哈新任總經(jīng)理許思敏,竟是1994年的

樂悠悠娛樂
2025-10-12 11:46:18
不戴套不吃藥,新型女性避孕環(huán)面世,自己上環(huán)、取環(huán),你愿用嗎?

不戴套不吃藥,新型女性避孕環(huán)面世,自己上環(huán)、取環(huán),你愿用嗎?

大果小果媽媽
2025-10-07 22:14:25
男人自述:男人夫妻生活頻繁,會給身體帶來危害,別等垮了才后悔

男人自述:男人夫妻生活頻繁,會給身體帶來危害,別等垮了才后悔

秋風(fēng)專欄
2025-09-11 17:14:10
大眾的大尺寸SUV有多強(qiáng) 全新攬境

大眾的大尺寸SUV有多強(qiáng) 全新攬境

大浩評車
2025-07-21 18:35:54
演員賈靜雯回應(yīng)丈夫被警方拘提:震驚不已,孩子目睹父親被上銬受到驚嚇

演員賈靜雯回應(yīng)丈夫被警方拘提:震驚不已,孩子目睹父親被上銬受到驚嚇

極目新聞
2025-10-21 12:58:48
微信又上線 4 個新功能,來看看!

微信又上線 4 個新功能,來看看!

全是技能
2025-10-22 15:21:38
山東男籃官宣鮑威爾加盟球隊,上賽季效力于青島男籃

山東男籃官宣鮑威爾加盟球隊,上賽季效力于青島男籃

雷速體育
2025-10-22 09:15:04
知名作家在杭州回應(yīng)“財富自由”!曾經(jīng)因回憶女友一夜爆紅

知名作家在杭州回應(yīng)“財富自由”!曾經(jīng)因回憶女友一夜爆紅

極目新聞
2025-10-21 21:18:05
整個太平洋艦隊155旅指揮部被海馬斯打掉,全體軍官陣亡無人生還

整個太平洋艦隊155旅指揮部被海馬斯打掉,全體軍官陣亡無人生還

環(huán)球熱點(diǎn)快評
2025-07-05 21:16:19
2025-10-23 04:19:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11536文章數(shù) 142490關(guān)注度
往期回顧 全部

科技要聞

鴻蒙6發(fā)布,今日公測,支持與蘋果設(shè)備互傳

頭條要聞

金價大跌投資群炸鍋 "死多頭"也頂不住了:一下把我砸醒

頭條要聞

金價大跌投資群炸鍋 "死多頭"也頂不住了:一下把我砸醒

體育要聞

雷霆雙加時險勝火箭 SGA35+5申京39+11

娛樂要聞

又嫁錯人?賈靜雯2600萬換女兒撫養(yǎng)權(quán)

財經(jīng)要聞

信也科技擔(dān)保模式之謎 擔(dān)保費(fèi)率達(dá)17.5%

汽車要聞

低調(diào)務(wù)實(shí)的零跑,在高端市場也“支棱”了

態(tài)度原創(chuàng)

教育
健康
藝術(shù)
親子
軍事航空

教育要聞

孩子秋季科學(xué)跑步訓(xùn)練之一:如何正確穿衣

內(nèi)分泌科專家破解身高八大謠言

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

親子要聞

這是今年咨詢我的寶媽中,最嚴(yán)重的一件事!

軍事要聞

普京指揮俄軍戰(zhàn)略核力量綜合演習(xí)

無障礙瀏覽 進(jìn)入關(guān)懷版 久久人妻久久久人妻| 亚洲偷偷自拍码高清视频| 夜播视频在线观看| 人妻无码不卡中文字幕系列| 中文字幕日本人妻久久久免费| 久久亚洲精品无码av| 人妻AV无码AV中文AV日韩AV| 一本色道久久88加勒比—综合 | 欧洲精品色在线观看| 日本午夜精品一本在线观看| 亚洲AV秘 无码一18禁| 人妻系列无码专区久久五月天| 国产麻豆精品福利在线| 国产亚洲一区二区手机在线观看| 欧美性爱乱交A一区二区| 少妇av射精精品蜜桃专区| 天堂а√在线中文在线| 少妇人妻真实偷人精品视频| 国产精品乱人伦一区二区| 中文字幕av高清片| 亚洲丰满人妻视频| 在线免费观看无码成人黄片| 51妺嘿嘿午夜福利| 国产性爱无码影院| 天天做天天爱天天综合网2021 | 性色欲情网站iwww九文堂| 国产男男gaygay同志网站| 开心五月骚婷婷| 成全视频高清免费| 在线视频中文字幕二区| 熟女白浆一区二区三区| 浪荡双性花唇磨桌角自慰| 2020国产成人精品视频| 欧美一区在线视频在线| 人人操人人上人人爱人人| 毛片毛片22222| 亚洲国产精品美日韩久久| 国产精品无码av在线播放| 一个人看的视频www在线观看免费| 日日躁18摸日日摸夜夜爽| 67194熟妇人妻欧美日韩|