夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Lumina-mGPT 2.0:自回歸模型華麗復興,媲美頂尖擴散模型

0
分享至



上海人工智能實驗室等團隊提出Lumina-mGPT 2.0 —— 一款獨立的、僅使用解碼器的自回歸模型,統(tǒng)一了包括文生圖、圖像對生成、主體驅(qū)動生成、多輪圖像編輯、可控生成和密集預測在內(nèi)的廣泛任務。

本文第一作者辛毅為南京大學 & 上海創(chuàng)智學院博士生,現(xiàn)于上海人工智能實驗室實習,研究方向為圖像 / 視頻生成、多模態(tài)生成與理解統(tǒng)一等。通訊作者為上海人工智能實驗室青年科學家 — 高鵬。本文其他作者來自上海人工智能實驗室、香港中文大學、上海交通大學、上海創(chuàng)智學院、浙江工業(yè)大學等。



  • 論文標題:Lumina-mGPT 2.0: Stand-Alone AutoRegressive Image Modeling
  • 論文鏈接:arxiv.org/pdf/2507.17801
  • GitHub 地址:Alpha-VLLM/Lumina-mGPT-2.0
  • 關鍵詞:圖像生成、自回歸模型、基座模型。

核心技術與突破

完全獨立的訓練架構

不同于依賴預訓練權重的傳統(tǒng)方案,Lumina-mGPT 2.0 采用純解碼器 Transformer 架構,從參數(shù)初始化開始完全獨立訓練。這帶來三大優(yōu)勢:架構設計不受限制(提供了 20 億和 70 億參數(shù)兩個版本)、規(guī)避授權限制(如Chameleon的版權問題)、減少預訓練模型帶來的固有偏差。



圖像分詞器方面,通過對比 VQGAN、ViT-VQGAN 等多種方案,最終選擇在 MS-COCO 數(shù)據(jù)集上重建質(zhì)量最優(yōu)的 SBER-MoVQGAN,為高質(zhì)量生成奠定基礎。



統(tǒng)一多任務處理框架

創(chuàng)新地采用統(tǒng)一的圖像分詞方案,將圖生圖任務通過上下拼接視為一張圖像,并通過提示描述進行控制,實現(xiàn)多任務訓練與文生圖訓練的一致性。使得單一模型能夠無縫支持以下任務:

  • 文生圖
  • 主體驅(qū)動生成
  • 圖像編輯
  • 可控生成(如基于輪廓 / 深度的生成)
  • 密集預測

這種設計避免了傳統(tǒng)模型需切換不同框架的繁瑣,通過系統(tǒng)提示詞即可靈活控制任務類型。



高效的推理策略

為了解決自回歸模型生成速度慢的痛點,團隊引入兩種優(yōu)化:

  • 模型量化:將模型權重量化為 4 位整數(shù),同時保持激活張量為 bfloat16,通過 PyTorch 2.0 中的原生編譯工具和 torch.compile 的 reduce-overhead 模式實現(xiàn)無需改變模型架構的優(yōu)化。

  • 推測式 Jacobi 采樣:通過靜態(tài) KV 緩存和靜態(tài)因果注意掩碼的方案,使 SJD 兼容于靜態(tài)編譯框架,從而實現(xiàn)加速采樣,同時避免動態(tài)調(diào)整緩存。結合 4 位量化技術,減少 60% GPU 顯存消耗,同時通過并行解碼加速生成。

實驗顯示,優(yōu)化后模型在保持質(zhì)量的前提下,生成效率顯著提升。



實驗結果

文生圖實驗結果

在文本到圖像生成領域,Lumina-mGPT 2.0 在多個基準測試中表現(xiàn)優(yōu)異,與 SANA 和Janus Pro等擴散模型和自回歸模型相當甚至超越,特別是在 “兩個物體” 和 “顏色屬性” 測試中表現(xiàn)卓越,以 0.80 的GenEval 分數(shù)躋身頂級生成模型之列。



此外,在實際生成效果上,Lumina-mGPT 2.0 在真實感、細節(jié)和連貫性方面優(yōu)于前代 Lumina-mGPT 和 Janus Pro,更具視覺吸引力和自然美感。



多任務實驗結果

在 Graph200K 多任務基準中(可控生成、物體驅(qū)動生成),Lumina-mGPT 2.0 表現(xiàn)優(yōu)異,證明了純自回歸模型在單一框架下完成多模態(tài)生成任務的可能性。



此外,團隊與其他的多任務生成模型進行了實際比較,Lumina-mGPT 2.0 在可控生成和主題驅(qū)動生成任務中表現(xiàn)突出,與 Lumina-mGPT、OneDiffusion和 OmniGen 等模型相比,展示了卓越的生成能力和靈活性。



未來方向

Lumina-mGPT 2.0 在優(yōu)化推理后,仍面臨采樣時間長的問題,與其他基于自回歸的生成模型相似,這影響了用戶體驗,后續(xù)將進一步優(yōu)化。當前 Lumina-mGPT 2.0 的重點在多模態(tài)生成, 但計劃更新擴展至多模態(tài)理解,以提高其整體功能和性能,這將使 Lumina-mGPT 2.0 在滿足用戶需求方面更加全面。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
李嘉誠旗下長和最新表態(tài):預計今年不會完成港口交易,將邀請內(nèi)地投資者加入!上半年港口業(yè)務收入超200億元,股價年內(nèi)漲超30%

李嘉誠旗下長和最新表態(tài):預計今年不會完成港口交易,將邀請內(nèi)地投資者加入!上半年港口業(yè)務收入超200億元,股價年內(nèi)漲超30%

每日經(jīng)濟新聞
2025-08-14 21:40:38
恒大前總裁夏海鈞找到了!藏匿資產(chǎn)曝光

恒大前總裁夏海鈞找到了!藏匿資產(chǎn)曝光

攸克地產(chǎn)pro
2025-08-14 08:27:08
蘇州太倉市副市長童剛,任上被查

蘇州太倉市副市長童剛,任上被查

揚子晚報
2025-08-14 20:45:11
楊蘭蘭現(xiàn)身,最新露面照,身著奢侈品換新車,作家回應是其母親!

楊蘭蘭現(xiàn)身,最新露面照,身著奢侈品換新車,作家回應是其母親!

火土輕創(chuàng)業(yè)
2025-08-14 18:35:03
赴美前夕,普京表態(tài)

赴美前夕,普京表態(tài)

新京報政事兒
2025-08-14 20:50:31
郭濤全家游覽牛津大學,妻子穿瑜伽褲顯身材,兒女都是大高個

郭濤全家游覽牛津大學,妻子穿瑜伽褲顯身材,兒女都是大高個

晉哥說電影
2025-08-14 15:17:59
午后,突然跳水!發(fā)生了什么?

午后,突然跳水!發(fā)生了什么?

券商中國
2025-08-14 16:06:57
9?3 抗戰(zhàn)勝利大閱兵臨近,西方國家缺席,這些國家領導人出席

9?3 抗戰(zhàn)勝利大閱兵臨近,西方國家缺席,這些國家領導人出席

熊貓君點評
2025-08-14 10:12:31
安徽小伙神似溥儀走紅 對話當事人:從長相困擾到做自媒體 因一張臉收獲超60萬粉絲

安徽小伙神似溥儀走紅 對話當事人:從長相困擾到做自媒體 因一張臉收獲超60萬粉絲

封面新聞
2025-08-14 20:20:06
德媒:普京向特朗普發(fā)出明確信號

德媒:普京向特朗普發(fā)出明確信號

參考消息
2025-08-14 16:40:32
當時誰能想到...孫興慜19歲時為漢堡進球,過掉的正是現(xiàn)任主教練

當時誰能想到...孫興慜19歲時為漢堡進球,過掉的正是現(xiàn)任主教練

直播吧
2025-08-14 22:43:02
李嫣當著李亞鵬的面熟練抽電子煙,走起路很拽 表情不屑

李嫣當著李亞鵬的面熟練抽電子煙,走起路很拽 表情不屑

一娛三分地
2025-08-14 13:49:17
摻假最嚴重的7種食物,別再被蒙在鼓里了,全是科技與狠活

摻假最嚴重的7種食物,別再被蒙在鼓里了,全是科技與狠活

周哥一影視
2025-08-13 21:33:51
“死亡和稅收無法避免”:這句話,正在中國變?yōu)楝F(xiàn)實

“死亡和稅收無法避免”:這句話,正在中國變?yōu)楝F(xiàn)實

大何日拱一卒
2025-08-14 00:10:06
官方變相認可!王俊杰賽后接受尿檢 自曝腿抽筋+感謝郭士強信任

官方變相認可!王俊杰賽后接受尿檢 自曝腿抽筋+感謝郭士強信任

醉臥浮生
2025-08-14 22:24:06
家長一定要告訴孩子:刷短視頻是怎樣讓大腦變笨的

家長一定要告訴孩子:刷短視頻是怎樣讓大腦變笨的

湖北e家庭
2025-08-13 15:44:28
釋永信被抓細節(jié)曝光!限制出境后萎靡不振,被抓時平靜說出4個字

釋永信被抓細節(jié)曝光!限制出境后萎靡不振,被抓時平靜說出4個字

削桐作琴
2025-08-14 13:29:46
粉絲超3117萬!趙露思深夜注銷微博:真的助農(nóng),也要注銷的,拜拜

粉絲超3117萬!趙露思深夜注銷微博:真的助農(nóng),也要注銷的,拜拜

魯中晨報
2025-08-14 09:04:25
已服軟!質(zhì)疑校服被拘后續(xù):當事人曝獄中遭遇,稱以后再也不敢了

已服軟!質(zhì)疑校服被拘后續(xù):當事人曝獄中遭遇,稱以后再也不敢了

大川哥
2025-08-14 17:31:58
黃子韜直播時責備徐藝洋太短,“我不喜歡你露腿”,徐藝洋:我穿了打底,是你角度問題

黃子韜直播時責備徐藝洋太短,“我不喜歡你露腿”,徐藝洋:我穿了打底,是你角度問題

觀威海
2025-08-14 20:45:20
2025-08-15 05:20:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11087文章數(shù) 142417關注度
往期回顧 全部

科技要聞

暴雨之下1萬多人,500個機器人燃爆全場

頭條要聞

白宮威脅后普京表態(tài) 俄方:會晤后預計不會簽任何文件

頭條要聞

白宮威脅后普京表態(tài) 俄方:會晤后預計不會簽任何文件

體育要聞

在菲律賓,一支中國人創(chuàng)建的球隊踢上了亞冠

娛樂要聞

趙露思發(fā)文告別!扯下她最后的顏面

財經(jīng)要聞

“許家印同伙”夏海鈞的資產(chǎn)藏匿游戲

汽車要聞

大六座SUV還能這么玩 吉利銀河M9動態(tài)內(nèi)測

態(tài)度原創(chuàng)

家居
游戲
藝術
公開課
軍事航空

家居要聞

現(xiàn)代奶油 網(wǎng)紅又實用

國服S6天梯時空之門今日開戰(zhàn),萬元現(xiàn)金等你來拿!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

倒計時一天 "普特會"的五大看點梳理

無障礙瀏覽 進入關懷版 国产精品无码a v在线观看| 亚洲国产天堂久久综合226114| 91一级片| 亚洲精品国产第一区二区尤物| 中文字幕成人精品久久不卡 | 久久久综合九色综合| 超碰aⅴ人人做人人爽| 国产亚洲经典| 久青草国产高清在线视频| 亚洲男人在线| 亚洲情A成黄在线观看动漫尤物| 亚洲有码视频在线观看| 精品人妻系列无码专区久久| 日本久久电影| 久久久无码电影| 国产小呦呦精品| 翘臀少妇被扒开屁股日出水爆乳 | 人人人操人人人操| 欧美一区二区三区AA大片| 操老女人,老熟女| 奇米四色影院| 成人熟女视频图片网址| 露脸烟台熟妇大白屁股啪啪嗷嗷叫| 中文字幕人妻中文| 国产黑色丝袜在线电影| 无码国产精品一区二区免费模式 | 亚洲AV最新| 无码av波多野结衣久久| 久久久亚洲欧洲日产国码αv| 国产高清不卡| 丰满老妇被粗大猛烈进人高清| 国产精品禁18久久久夂久| 欧美熟妇一区二区三还| 下面一进一出好爽视频| 亚洲欧美日本久久综合网站| 亚洲欧美群交找大门操逼| AV网站在线播放| 国产台湾无码av片在线观看| 无码WWW免费视频网站| 国精产品一二二线精华液| 妓女在线浏览器|