夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

南大聯(lián)合LibLib.ai、中科院自動化所,共同提出PosterCopilot

0
分享至



來自南京大學(xué) PRLab 的魏佳哲、李墾,在準(zhǔn)聘助理教授司晨陽的指導(dǎo)下,提出專業(yè)級海報(bào)設(shè)計(jì)與編輯大模型PosterCopilot。本研究聯(lián)合了LibLib.ai、中國科學(xué)院自動化研究所等多家頂尖機(jī)構(gòu),共同完成了首個(gè)解耦布局推理與多輪可控編輯的圖形設(shè)計(jì)框架研發(fā)。PosterCopilot 能夠?qū)崿F(xiàn)專業(yè)設(shè)計(jì)級的版式生成、語義一致的多輪編輯,并具備高度可控的創(chuàng)作能力。



此外,受華為-南京大學(xué)鯤鵬昇騰科教創(chuàng)新孵化中心支持,該模型已完成對國產(chǎn)昇騰算力平臺的適配與部署,進(jìn)一步推動了國產(chǎn) AI 設(shè)計(jì)技術(shù)的發(fā)展與落地。



  • 論文標(biāo)題:Poster Copilot: Toward Layout Reasoning and Controllable Editing for Professional Graphic Design
  • 論文地址:https://arxiv.org/abs/2512.04082
  • 項(xiàng)目主頁:https://postercopilot.github.io/

行業(yè)痛點(diǎn):

從生成式失控到多模態(tài)「盲推」

平面設(shè)計(jì)是視覺傳達(dá)的基石,但要實(shí)現(xiàn)真正的自動化專業(yè)設(shè)計(jì),目前仍面臨巨大挑戰(zhàn)。盡管以Stable Diffusion為代表的文生圖(T2I)模型在圖像合成上表現(xiàn)強(qiáng)勁,但在實(shí)際的工業(yè)設(shè)計(jì)流中,它們因無法處理分層結(jié)構(gòu),往往導(dǎo)致用戶素材失真且無法進(jìn)行精細(xì)化控制。

為了解決這一問題,業(yè)界開始嘗試?yán)枚嗄B(tài)大模型(LMMs)進(jìn)行布局規(guī)劃,然而研究團(tuán)隊(duì)發(fā)現(xiàn),現(xiàn)有的 LMMs 方案反而暴露出了四大致命短板:

  • 幾何布局的「先天缺陷」:現(xiàn)有的多模態(tài)布局模型通常將連續(xù)的空間坐標(biāo)量化為離散的文本 Token。這種將數(shù)值視為文本的處理方式,從根本上破壞了歐幾里得空間的幾何連續(xù)性,導(dǎo)致模型難以理解真實(shí)的物理距離與空間關(guān)系,生成的布局頻頻出現(xiàn)對齊錯誤與比例失調(diào)。
  • 視覺反饋的「盲區(qū)」:這是現(xiàn)有模型最嚴(yán)重的缺失之一。目前的布局模型在訓(xùn)練過程中僅進(jìn)行純粹的坐標(biāo)回歸,卻從未「看」到過布局渲染后的實(shí)際圖像。由于缺乏對渲染結(jié)果的視覺反饋(Visual Feedback),模型無法像人類設(shè)計(jì)師一樣基于審美直覺和視覺規(guī)律來審視并優(yōu)化構(gòu)圖,只能處于「盲人摸象」的狀態(tài)。
  • 單一真值的「回歸陷阱」:海報(bào)設(shè)計(jì)屬于高度主觀的創(chuàng)意領(lǐng)域,符合人類審美的布局方案往往是多樣的、非唯一的。然而,傳統(tǒng)的監(jiān)督訓(xùn)練強(qiáng)迫模型死板地向單一的Ground Truth回歸。這種刻板的訓(xùn)練方式不僅導(dǎo)致生成的布局喪失多樣性,更扼殺了模型的探索潛力,使其錯失了涌現(xiàn)超越訓(xùn)練數(shù)據(jù)、比原始真值更具美學(xué)表現(xiàn)力的創(chuàng)新設(shè)計(jì)的機(jī)會。
  • 圖層級編輯的「斷層」:專業(yè)設(shè)計(jì)師的工作流本質(zhì)上是迭代的(Iterative),需要對特定圖層進(jìn)行反復(fù)微調(diào)。而目前的端到端模型往往是「一錘子買賣」,面對「只改一個(gè)圖層」的需求時(shí)往往束手無策——要么無法支持,要么「牽一發(fā)而動全身」,在修改時(shí)破壞了用戶原有的素材或非編輯區(qū)域。

在 PosterCopilot 的對比測試中,這些弱點(diǎn)暴露無遺:



現(xiàn)有模型在處理復(fù)雜多素材場景時(shí),常出現(xiàn)嚴(yán)重的元素重疊、文字遮擋以及美學(xué)災(zāi)難。這反映了現(xiàn)有模型在細(xì)粒度布局推理和美學(xué)對齊上的根本不足。

同時(shí),如圖所示:



基于完全相同的元素可以有眾多符合人類審美的布局方案,按照單一真值進(jìn)行回歸的訓(xùn)練方式容易扼殺模型的創(chuàng)造力。

核心成果:

構(gòu)建專業(yè)級設(shè)計(jì)的「智能工作流」

為填補(bǔ)現(xiàn)有單步生成與專業(yè)工作流之間的鴻溝,研究團(tuán)隊(duì)提出了一套系統(tǒng)性的解決方案 PosterCopilot,并通過漸進(jìn)式三階段訓(xùn)練策略賦予模型設(shè)計(jì)推理能力。

獨(dú)創(chuàng)三階段訓(xùn)練:從幾何糾偏到美學(xué)對齊

這是首個(gè)將布局生成任務(wù)從簡單的回歸問題轉(zhuǎn)化為分布學(xué)習(xí)與強(qiáng)化學(xué)習(xí)結(jié)合的范式。

  • 階段一:擾動監(jiān)督微調(diào)(PSFT):針對 Token 坐標(biāo)導(dǎo)致的幾何空間扭曲問題,團(tuán)隊(duì)提出引入高斯噪聲擾動,迫使模型學(xué)習(xí)坐標(biāo)的分布而非死記硬背離散點(diǎn),修復(fù)了優(yōu)化空間的幾何結(jié)構(gòu)。
  • 階段二:視覺-現(xiàn)實(shí)對齊強(qiáng)化學(xué)習(xí)(RL-VRA):引入基于 DIoU 和元素保真的驗(yàn)證性獎勵信號,專門修正「幻覺」導(dǎo)致的重疊和比例失調(diào)。
  • 階段三:美學(xué)反饋強(qiáng)化學(xué)習(xí)(RLAF):利用美學(xué)獎勵模型進(jìn)行偏好對齊,鼓勵模型探索超出 Ground Truth 但更具視覺沖擊力的布局方案。



生成式智能體(Generative Agent):打通迭代編輯閉環(huán)

PosterCopilot 不僅僅是一個(gè)布局生成器,更是一個(gè)全能設(shè)計(jì)助手。團(tuán)隊(duì)設(shè)計(jì)了一個(gè)包含「接待模型」和「T2I 模型」的智能體,支持從靈感到素材的無縫轉(zhuǎn)化:用戶僅需輸入抽象的設(shè)計(jì)構(gòu)思,內(nèi)置的接待模型(Reception Model)即可充當(dāng)「創(chuàng)意策劃」,自動將用戶意圖拆解為前景主體與背景氛圍的詳細(xì)規(guī)劃。

隨后,模型會生成精準(zhǔn)的工程級提示詞(Prompts),驅(qū)動 T2I 模型即時(shí)生成風(fēng)格契合的高質(zhì)量素材,實(shí)現(xiàn)從「抽象靈感」到「具體物料」的自動化落地。

通過將具備精密布局推理能力的設(shè)計(jì)模型與支持多輪交互的生成式智能體(Generative Agent)深度耦合,團(tuán)隊(duì)構(gòu)建了 PosterCopilot 的完整框架,其從素材規(guī)劃到最終成稿的推理流水線如下所示:



全能設(shè)計(jì)助手 PosterCopilot:覆蓋專業(yè)設(shè)計(jì)的全鏈路需求

基于 Generative Agent 的強(qiáng)大賦能,PosterCopilot 能夠完美勝任從「從零構(gòu)建」到「后期精修」的多種專業(yè)場景:

  • 全素材海報(bào)生成(Generation from Fully-provided Assets):當(dāng)用戶提供完整素材時(shí),模型專注于「布局推理」,能夠?qū)⒍嗄B(tài)元素在畫布上進(jìn)行符合美學(xué)規(guī)律的精準(zhǔn)排列,同時(shí)嚴(yán)格保障用戶原有素材零失真、無篡改。



  • 缺素材智能補(bǔ)全(Generation from Insufficient Assets):針對素材缺失的冷啟動場景,智能體能夠理解設(shè)計(jì)意圖,自動生成風(fēng)格統(tǒng)一的背景或前景裝飾層,實(shí)現(xiàn)從「抽象想法」到「完整海報(bào)」的無縫落地。



  • 多輪精細(xì)化編輯(Multi-round Fine-grained Edit):打破了傳統(tǒng)模型「無法精準(zhǔn)局部修改」的魔咒,支持多種專業(yè)級操作:
  • 精準(zhǔn)單層編輯:支持僅修改特定圖層(如更換模特發(fā)色、改變物體材質(zhì)),同時(shí)完美「凍結(jié)」其他非編輯區(qū)域。在「相機(jī)廣告」案例中,模型能夠僅修改相機(jī)鏡頭的特效(如巖漿、大理石、水晶),而背景文字和排版紋絲不動。



  • 全局主題遷移:能夠?qū)⒑?bào)從「棒棒糖促銷」無縫切換為「冰淇淋推廣」,自動替換主體并調(diào)整相關(guān)元素,且保留原有排版骨架。



  • 智能尺寸重構(gòu)(Poster Reframe):只需更改畫布尺寸參數(shù),模型即可根據(jù)新的長寬比,智能重新推理布局,實(shí)現(xiàn)一鍵適配不同媒體版面。



PosterCopilot 數(shù)據(jù)集:高質(zhì)量分層海報(bào)庫

為解決數(shù)據(jù)匱乏問題,團(tuán)隊(duì)構(gòu)建了包含 16 萬張專業(yè)海報(bào)、總計(jì) 260 萬個(gè)圖層的高質(zhì)量數(shù)據(jù)集。通過 OCR 輔助的細(xì)粒度圖層融合技術(shù),解決了傳統(tǒng)數(shù)據(jù)集中圖層過度碎片化(Over-segmentation)的難題,為社區(qū)提供了寶貴的數(shù)據(jù)資源。





實(shí)驗(yàn)結(jié)果:

全面超越商業(yè)競品與 SOTA 模型

PosterCopilot 以Qwen-2.5-VL-7B-Instruct為 backbone,在多項(xiàng)指標(biāo)上實(shí)現(xiàn)了對現(xiàn)有頂尖模型的超越。

在涵蓋布局合理性、文本可讀性、素材保真度等六大維度的評測中,PosterCopilot 展現(xiàn)了統(tǒng)治級表現(xiàn)。

  • 綜合勝率:在人工評測中,PosterCopilot 對比微軟Microsoft DesignerNano-Banana以及學(xué)術(shù)界 SOTA(如CreatiPosterLaDeCo),平均勝率超過 74%。



  • GPT-5 評測:在 GPT-5 的打分中,PosterCopilot 在布局合理性(Layout Rationality)和風(fēng)格一致性(Style Consistency)上均大幅領(lǐng)先Qwen-VL-2.5-72BGemini 2.5 Pro



結(jié)論與展望

對于平面設(shè)計(jì)這樣兼具嚴(yán)謹(jǐn)幾何約束感性美學(xué)追求的領(lǐng)域,簡單的端到端生成并非最優(yōu)解。

PosterCopilot 通過解耦「布局推理」與「生成式編輯」,并引入強(qiáng)化學(xué)習(xí)對齊人類美學(xué),成功讓大模型掌握了專業(yè)設(shè)計(jì)師的「圖層思維」。這不僅為智能設(shè)計(jì)工具樹立了新的基準(zhǔn),也為未來 AI 輔助創(chuàng)意工作流提供了新的范式。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
卡拉格向薩拉赫道歉:抱歉讓你不開心了,但場下還得注意言行

卡拉格向薩拉赫道歉:抱歉讓你不開心了,但場下還得注意言行

懂球帝
2025-12-10 15:25:25
驚!網(wǎng)傳香港淪落,原700萬店鋪?zhàn)饨痼E降至20萬,到底發(fā)生了什么

驚!網(wǎng)傳香港淪落,原700萬店鋪?zhàn)饨痼E降至20萬,到底發(fā)生了什么

慧翔百科
2025-09-29 11:51:51
熱播劇《風(fēng)與潮》被觀眾要求下架!理由:劇情惡心、演技油膩

熱播劇《風(fēng)與潮》被觀眾要求下架!理由:劇情惡心、演技油膩

胡一舸南游y
2025-12-10 13:38:33
重慶談判時(shí),蔣介石提出讓毛澤東當(dāng)省長,毛主席問:去哪個(gè)???

重慶談判時(shí),蔣介石提出讓毛澤東當(dāng)省長,毛主席問:去哪個(gè)???

老范談史
2025-11-28 10:34:33
“選擇大于努力”教科書級案例,大爺穩(wěn)健投資13年遇爆雷,倒虧200萬

“選擇大于努力”教科書級案例,大爺穩(wěn)健投資13年遇爆雷,倒虧200萬

小蘿卜絲
2025-12-09 19:28:29
“只要給錢什么都行”,43歲保姆的話,讓62歲的我破防了

“只要給錢什么都行”,43歲保姆的話,讓62歲的我破防了

新時(shí)代的兩性情感
2025-12-03 12:59:07
尺度驚艷,這5部黃暴劇集,一口氣看完真是太過癮了

尺度驚艷,這5部黃暴劇集,一口氣看完真是太過癮了

小微看電影
2025-06-20 09:50:16
廣西一女生來南寧找工作,找了5天還沒有著落:身上只剩45塊

廣西一女生來南寧找工作,找了5天還沒有著落:身上只剩45塊

唐小糖說情感
2025-12-08 10:17:07
12.10日早評|重磅公布!美聯(lián)儲大消息!A股要炸!

12.10日早評|重磅公布!美聯(lián)儲大消息!A股要炸!

龍行天下虎
2025-12-10 06:13:17
反轉(zhuǎn)太快!馬克龍回國不到48小時(shí)變臉,對中國發(fā)出威脅

反轉(zhuǎn)太快!馬克龍回國不到48小時(shí)變臉,對中國發(fā)出威脅

公子故事會
2025-12-09 17:46:55
不停產(chǎn)不裁員,廣東一家具廠12月份起不定期放假,放假每天補(bǔ)77元

不停產(chǎn)不裁員,廣東一家具廠12月份起不定期放假,放假每天補(bǔ)77元

搗蛋窩
2025-12-10 12:55:20
被謝賢養(yǎng)了12年,用青春換來2000萬的Coco,已經(jīng)走上了另一條道路

被謝賢養(yǎng)了12年,用青春換來2000萬的Coco,已經(jīng)走上了另一條道路

妙知
2025-11-05 15:19:50
最新消息!香港宏福苑大火遇難160人,遺骨上發(fā)現(xiàn)2人DNA

最新消息!香港宏福苑大火遇難160人,遺骨上發(fā)現(xiàn)2人DNA

九方魚論
2025-12-10 06:51:04
大補(bǔ)的魚,不是帶魚和鯽魚,而是這3種魚,常吃補(bǔ)腦又強(qiáng)免疫!

大補(bǔ)的魚,不是帶魚和鯽魚,而是這3種魚,常吃補(bǔ)腦又強(qiáng)免疫!

花小廚
2025-11-04 11:43:52
吳艷妮回應(yīng)摘銀后落淚:我哭咋了,人都是有情緒的生物;回應(yīng)被“黑”:不會因評論而哭,你們每天真那么閑嗎

吳艷妮回應(yīng)摘銀后落淚:我哭咋了,人都是有情緒的生物;回應(yīng)被“黑”:不會因評論而哭,你們每天真那么閑嗎

極目新聞
2025-12-10 17:42:44
負(fù)債百萬、露宿街頭、裝瘋賣傻,星光大道草根歌手現(xiàn)狀太落魄

負(fù)債百萬、露宿街頭、裝瘋賣傻,星光大道草根歌手現(xiàn)狀太落魄

素衣讀史
2025-11-24 17:11:50
拜仁新核心,他是孔帕尼最大發(fā)現(xiàn)?

拜仁新核心,他是孔帕尼最大發(fā)現(xiàn)?

西哇體育
2025-12-10 14:40:11
浙大99后博導(dǎo)惹爭議:也許只要能發(fā)文章,你就可能實(shí)現(xiàn)跨越階層

浙大99后博導(dǎo)惹爭議:也許只要能發(fā)文章,你就可能實(shí)現(xiàn)跨越階層

十為先生
2025-12-10 08:37:20
馮提莫自曝癌癥復(fù)發(fā)并轉(zhuǎn)移:現(xiàn)在已經(jīng)做過手術(shù)了

馮提莫自曝癌癥復(fù)發(fā)并轉(zhuǎn)移:現(xiàn)在已經(jīng)做過手術(shù)了

紅星新聞
2025-12-10 18:34:28
突發(fā)!杭州大型理財(cái)平臺爆雷,上萬投資者被騙,損失金額超200億

突發(fā)!杭州大型理財(cái)平臺爆雷,上萬投資者被騙,損失金額超200億

墨印齋
2025-12-10 16:48:58
2025-12-10 19:56:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11891文章數(shù) 142509關(guān)注度
往期回顧 全部

科技要聞

防"走私",英偉達(dá)被曝開發(fā)“芯片定位”技術(shù)

頭條要聞

河南學(xué)?;馂?zāi)致13死 家長被逼簽字和解:晚簽1天少10萬

頭條要聞

河南學(xué)?;馂?zāi)致13死 家長被逼簽字和解:晚簽1天少10萬

體育要聞

試訓(xùn)20支球隊(duì),落選,成為NBA新秀助攻王

娛樂要聞

為何網(wǎng)友不再相信張柏芝的“故事”?

財(cái)經(jīng)要聞

對話陳志武:特朗普嚴(yán)重誤判中國!

汽車要聞

有動力操控 有智能座艙 6萬多的第五代帝豪掀桌子了

態(tài)度原創(chuàng)

藝術(shù)
親子
時(shí)尚
教育
公開課

藝術(shù)要聞

40張海邊撒野照片,真是太有創(chuàng)意了!

親子要聞

警惕!孩子流感這6個(gè)信號一出現(xiàn),立刻送醫(yī)別拖延??

《喜人奇妙夜2》即將收官,給你的戒斷加點(diǎn)料

教育要聞

高考三大利好家長們一定要知道

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 精品国产免费一区二区三区香蕉| 日日色人AV| 伊人久久大香线蕉综合影视| 国产三区在线成人av| 一区在线播放| 99久久国产热无码精品免费久久久久, | 欧美交a欧美精品喷水| 黑人猛挺进小莹的体内视频| 久久九九青青国产精品| 免费看午夜福利专区| 黄色不卡视频一区二区三区| 国产高清无码在线影院| 国产精品香港三级国产av| 免费毛片黄片| 精品国偷自产在线电影| 欧美丰满熟妇XXX| 国产亚洲精品欧洲在线视频| 少妇网站36| 亚洲欧美中文字幕5发布| 人碰人摸人操人插| 亚洲偷自拍国综合| 久久99国产精品99蜜桃| 久久亚洲人成网站| 欧美人与动交zozo| 国产精品成人网站| 久久久久久99九九九精品网站| 日韩精品无码一本二本三本色| 蜜桃av免费观看| 夜夜春久久天堂亚洲精品| 日韩 国产 高清 传媒| 精品人妻一区二区三区蜜桃AⅤ| 牛鞭伸入女人下身的真视频| 在线观看无码av网站永久免费| 天堂xxxx| 亚洲人成色77777在线观看| 成人高清视频在线观看| 99久久精品国产一区二区蜜芽| 影音先锋色综合| 无码高潮又爽又黄a片软件| 久久人人爽人人爽人人片av超碰| 少妇大战28厘米黑人|