夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

讓擴散模型「可解釋」不再降質(zhì),開啟圖片編輯新思路

0
分享至



過去三年,擴散模型席卷圖像生成領(lǐng)域。以 DiT (Diffusion Transformer) 為代表的新一代架構(gòu)不斷刷新圖像質(zhì)量的極限,讓模型愈發(fā)接近真實世界的視覺規(guī)律。

然而,與 LLM 可解釋性研究的蓬勃發(fā)展相對,擴散模型內(nèi)部的語義結(jié)構(gòu)、時間規(guī)律以及因果路徑仍然像被深深封住的「黑箱」。研究者可以憑直覺優(yōu)化架構(gòu),但外界無法真正理解擴散模型在生成過程中的「思考方式」。

更棘手的是,已有的可解釋性嘗試往往伴隨著明顯的性能下降:特征分解、激活分析、插值擾動……無論采用哪種方法,只要試圖將擴散模型拆開來看,生成質(zhì)量就會顯著劣化。這讓「可解釋擴散模型」在很長一段時間里被視為不切實際的小眾方向。

在這樣的背景下,香港中文大學(xué) MMLab 與上海人工智能實驗室的研究團隊提出了一個不同的觀點:擴散模型作為當(dāng)今視覺世界最重要的生成器,其內(nèi)部機制不應(yīng)永遠(yuǎn)處于不可見狀態(tài);可解釋性也不應(yīng)該以犧牲生成質(zhì)量為代價。

基于這一理念,他們提出了被 AAAI 2026 接收的TIDE (Temporal-Aware Sparse Autoencoders)—— 首個真正意義上面向擴散 Transformer 的時序稀疏自編碼器框架。



  • 論文標(biāo)題:TIDE: Temporal-Aware Sparse Autoencoders for Interpretable Diffusion Transformers in Image Generation
  • 論文鏈接:
  • https://arxiv.org/pdf/2503.07050

TIDE:

讓「時序」成為擴散可解釋性的核心

以往的可解釋方法大多忽視了擴散過程最大的特點:生成是一個隨時間展開的漸進式構(gòu)造過程。早期步驟決定物體形狀和布局,中期步驟塑造語義和結(jié)構(gòu),后期步驟填充材質(zhì)與細(xì)節(jié)。如果忽略這條時間線,擴散模型看起來就像一團混亂的噪聲與特征。TIDE 的突破在于,它不是「硬拆」一個靜態(tài)特征,而是讓模型自己在時間維度上對齊語義:

同一個因子會在不同時間步中保持一致的語義軌跡,最終形成一個可讀、可控、穩(wěn)固的「時間語義剖面」。

也正是在這樣的時序框架下,擴散模型內(nèi)部原本模糊的過程第一次被清晰呈現(xiàn)出來:粗結(jié)構(gòu)從噪聲中浮現(xiàn)、語義逐漸成型、紋理被不斷潤色……模型的「思考流」沿著時間軸被完整雕刻出來。

更重要的是,這一切并不會破壞原模型的生成能力。TIDE 的稀疏自編碼器在特征空間進行無損重構(gòu),擴散軌跡保持穩(wěn)定,模型幾乎感受不到被「觀察」的存在。同時在 scaling latent 維度時,也優(yōu)于原有 vanilla SAE 方法。



TIDE 架構(gòu)與訓(xùn)練

在 Stable Diffusion XL、PixArt-α、Flux 等主流擴散框架上,TIDE 將擴散特征分解為具有可控語義的因子:

負(fù)責(zé)輪廓的因子、負(fù)責(zé)物體姿態(tài)的因子、負(fù)責(zé)材質(zhì)紋理的因子……甚至可以捕捉到跨時間的概念演化。基于這些因子,研究團隊構(gòu)建出一種全新的圖像編輯方式:編輯不再依賴繁瑣的提示語或反復(fù)調(diào)參,而是可以沿著清晰的語義方向直接操控擴散過程。例如:

  • 提升紋理細(xì)節(jié)而不改變?nèi)纸Y(jié)構(gòu)
  • 調(diào)整物體姿態(tài)但保持背景一致
  • 加強某類語義而不干擾其它部分



這些編輯操作完全基于 TIDE 生成的語義因子完成,意味著未來擴散模型有望出現(xiàn)一種全新的「因子級編輯器」,具備高度可控性與透明性。

與此同時,TIDE 對模型生成質(zhì)量的影響幾乎可以忽略不計。FID、sFID 變化小于 0.1%,噪聲預(yù)測軌跡保持穩(wěn)定,實現(xiàn)了真正意義上的「可解釋而不降質(zhì)」。

TIDE 的效果

TIDE 在不同設(shè)置、不同模型規(guī)模以及不同任務(wù)維度下的整體表現(xiàn)。無論是在超參數(shù)選擇、在 DiT 不同層級進行因子學(xué)習(xí),還是在 SDXL、FLUX-dev 等主流擴散架構(gòu)上的泛化能力,TIDE 都表現(xiàn)出高度穩(wěn)定且持續(xù)的優(yōu)勢。

可以看到,TIDE 在幾乎不增加 FID 代價的前提下,顯著提升了 AlignScore 中的語義綁定(顏色、形狀、紋理)以及跨區(qū)域關(guān)系理解(空間與非空間關(guān)系),其中多處指標(biāo)在表中以綠色標(biāo)記為最優(yōu)表現(xiàn)。

此外,在安全性評測部分,TIDE 相比多個現(xiàn)有方法大幅降低了攻擊成功率,顯示出更穩(wěn)健的特征理解能力。整體來看,這幅表格清楚證明:TIDE 不僅帶來了高質(zhì)量、可解釋的語義因子,還在保持生成質(zhì)量的同時,提升了模型的結(jié)構(gòu)理解、關(guān)系推理與安全性,成為一種真正可泛化、可落地的可解釋擴散框架。



TIDE 的意義:

補齊擴散模型的「理解」能力

擴散模型已經(jīng)成為現(xiàn)代視覺生成系統(tǒng)的核心支柱,但它們的內(nèi)部機制一直缺乏系統(tǒng)、透明的解釋路徑。TIDE 的出現(xiàn)不僅提供了首個真正實用的可解釋性方案,更重要的是,它讓研究者第一次能夠沿著「時間」這條線索觀察擴散模型內(nèi)部的語義結(jié)構(gòu)。



這種理解能力將直接影響未來的多個方向:

  • 更可控、更穩(wěn)健的擴散編輯系統(tǒng)
  • 統(tǒng)一理解——生成模型的因子級橋接
  • 擴散模型的因果與語義理論研究
  • 新一代透明、可信的視覺生成系統(tǒng)

TIDE 不僅是一個方法,更是一種新的研究范式:擴散模型并非不可解釋,只是缺少一個合適的視角。

未來展望

研究團隊表示,當(dāng)前 TIDE 已成功驗證了時序稀疏自編碼器框架的有效性,但可解釋擴散模型的潛力遠(yuǎn)未被完全發(fā)掘。未來的工作將進一步:

  • 擴展更大規(guī)模、更精細(xì)的時序字典
  • 探索跨模態(tài)共享的語義因子
  • 結(jié)合 LLM-SAE 構(gòu)建統(tǒng)一解釋空間
  • 將因子級編輯推向產(chǎn)品化工具

隨著更多研究者的加入,擴散模型的「黑箱壁壘」正逐漸被揭開,而 TIDE 或許是這一轉(zhuǎn)變具有代表性的第一步。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
房產(chǎn)證上的人去世了,繼承別再花大幾千的公證費,80塊錢就能搞定

房產(chǎn)證上的人去世了,繼承別再花大幾千的公證費,80塊錢就能搞定

室內(nèi)設(shè)計師有料兒
2025-12-07 16:05:28
中國14億人的命運即將被一份文件徹底改寫,十五五規(guī)劃提上了日程

中國14億人的命運即將被一份文件徹底改寫,十五五規(guī)劃提上了日程

扶蘇聊歷史
2025-12-20 10:08:33
山本五十六在偷襲珍珠港成功后,仰天長嘆:日本已經(jīng)輸?shù)袅藨?zhàn)爭

山本五十六在偷襲珍珠港成功后,仰天長嘆:日本已經(jīng)輸?shù)袅藨?zhàn)爭

興趣知識
2025-12-04 20:57:11
江西省文印中心原主任龐金艷接受審查調(diào)查

江西省文印中心原主任龐金艷接受審查調(diào)查

界面新聞
2025-12-20 14:47:24
剎車失靈時速115狂奔490公里司機發(fā)聲:4個半小時高度緊張,害怕車多有急彎,油盡下車后渾身發(fā)抖無法說話

剎車失靈時速115狂奔490公里司機發(fā)聲:4個半小時高度緊張,害怕車多有急彎,油盡下車后渾身發(fā)抖無法說話

極目新聞
2025-12-19 13:12:07
4+9+7+5!短短一年!NBA狀元要水了

4+9+7+5!短短一年!NBA狀元要水了

籃球教學(xué)論壇
2025-12-20 18:37:07
成都私人影院被曝涉“有償陪侍” 記者探訪:涉事門店已暫停經(jīng)營,警方介入調(diào)查

成都私人影院被曝涉“有償陪侍” 記者探訪:涉事門店已暫停經(jīng)營,警方介入調(diào)查

封面新聞
2025-12-20 19:21:27
天皇親自出山,日本對中國的反擊正式開始,高市早苗搞出了一妙計

天皇親自出山,日本對中國的反擊正式開始,高市早苗搞出了一妙計

知鑒明史
2025-12-19 19:09:40
沒能動用被凍結(jié)俄羅斯資產(chǎn):歐盟向烏克蘭提供900億歐元貸款

沒能動用被凍結(jié)俄羅斯資產(chǎn):歐盟向烏克蘭提供900億歐元貸款

鷹眼Defence
2025-12-19 17:57:51
22:00,中國男足首輪=生死戰(zhàn)!主力11人浮現(xiàn),CCTV直播U23亞洲杯

22:00,中國男足首輪=生死戰(zhàn)!主力11人浮現(xiàn),CCTV直播U23亞洲杯

侃球熊弟
2025-12-20 00:25:03
南京博物院的瓜,終于讓我吃完整了

南京博物院的瓜,終于讓我吃完整了

大張的自留地
2025-12-20 08:54:45
浙江一高中家長怒斥男班主任:我女兒要用衛(wèi)生巾,你不能去買嗎?

浙江一高中家長怒斥男班主任:我女兒要用衛(wèi)生巾,你不能去買嗎?

天天熱點見聞
2025-12-20 05:44:04
中方通知聯(lián)合國,不許3件事發(fā)生,話音剛落,高市政府開危險首槍

中方通知聯(lián)合國,不許3件事發(fā)生,話音剛落,高市政府開危險首槍

吳欣純Deborah
2025-12-19 18:18:32
降息50基點!剛剛,集體宣布!

降息50基點!剛剛,集體宣布!

證券時報
2025-12-20 19:40:06
不是迷信!明日冬至,記得:1不關(guān)、2要喝、3不坐、4要吃,早了解

不是迷信!明日冬至,記得:1不關(guān)、2要喝、3不坐、4要吃,早了解

瓜哥的動物日記
2025-12-20 00:53:14
下周可能會漲的板塊:

下周可能會漲的板塊:

風(fēng)風(fēng)順
2025-12-20 09:37:24
印度首富的家庭瑣事:小兒媳和大伯哥多次牽手,小兒子毫不在意

印度首富的家庭瑣事:小兒媳和大伯哥多次牽手,小兒子毫不在意

小書生吃瓜
2025-12-16 16:49:54
大量網(wǎng)友相信強力磁鐵可讓燃?xì)獗碜兟?,專家:竊氣嚴(yán)重可刑事處罰

大量網(wǎng)友相信強力磁鐵可讓燃?xì)獗碜兟瑢<遥焊`氣嚴(yán)重可刑事處罰

映射生活的身影
2025-12-20 03:39:27
殘暴11-1 樊振東歐冠首秀3-0速勝:再秀C羅慶祝動作 現(xiàn)場球迷狂歡

殘暴11-1 樊振東歐冠首秀3-0速勝:再秀C羅慶祝動作 現(xiàn)場球迷狂歡

風(fēng)過鄉(xiāng)
2025-12-20 06:49:20
羅永浩炮轟上海電信后終于理解為何運營商要喜歡光貓撥號了

羅永浩炮轟上海電信后終于理解為何運營商要喜歡光貓撥號了

阿纂看事
2025-12-20 10:45:48
2025-12-20 20:51:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11957文章數(shù) 142514關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

司機稱轎車剎車失靈狂奔490公里 網(wǎng)友質(zhì)疑"自導(dǎo)自演"

頭條要聞

司機稱轎車剎車失靈狂奔490公里 網(wǎng)友質(zhì)疑"自導(dǎo)自演"

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

2026央視跨年晚會陣容曝光,豪華陣仗

財經(jīng)要聞

求解“地方財政困難”

汽車要聞

嵐圖推進L3量產(chǎn)測試 已完成11萬公里實際道路驗證

態(tài)度原創(chuàng)

親子
旅游
數(shù)碼
手機
時尚

親子要聞

帶媽媽和三寶來吃中餐自助,艾莉拿起包子就是造,香到心坎里了!

旅游要聞

“鳥中大熊貓”黑鸛做客滹源景區(qū)

數(shù)碼要聞

盧偉冰今晚直播:小米17 Ultra超前劇透 不怕“泄密”

手機要聞

三星Galaxy XR的拆解揭示了非常有趣的機身結(jié)構(gòu)

真愛大牌 || 用了5年才敢說,多虧它幫我守住了發(fā)際線

無障礙瀏覽 進入關(guān)懷版 视频一区视频二区视频| 无码人妻少妇久久中文字幕蜜桃 | 东北少妇不戴套对白第一次| 亚洲视频免费大家都懂| 婷婷要玩综合| 久久艹久久国产| 少妇人妻偷人精品免费视频| 色欲av无码一区二区| 国产高清不卡一区二区| 国产精品导航一区二区| av熟妇白浆午夜精品| 久久久久久欧美精品se一二三四| 久久精品人人爽人人爽| 女邻居丰满的奶水| 亚洲熟妇自偷自拍另类| 欧美美女粉嫩小逼| 成年人黄片一区二区一群免费看视频| 中国女人和老外的毛片| 欧美日韩精品一区二区午夜电影| 中文字幕一区二区三区乱码图片| 国产aⅴ精品一区二区三理论片| 解开少妇的裙子猛烈进入| 国产成人免费综合| 亚洲欧美综合人成在线| 你懂的网址视频| 亚洲中文乱码在线| 少妇人妻综合久久中文字幕| 宅宅午夜无码一区二区三区| 国产色欲毛片无码A级无码Av| 亚洲无码中文字幕人邻| 97se亚洲| 老熟女丝AV| 女人扒开腿让男人桶到爽| 亚洲国产乱伦免费视频| 亚洲中文久久精品无码99| 大陆无码四区| 日本高潮少妇一区二区三区| 人妻精品久久无码专区色视| 人妻无码久久久| 91人妻人人做人碰人人爽秒播| 天天上天天添天天爱少妇|