本文由上海交通大學(xué),上海人工智能實(shí)驗(yàn)室、北京航空航天大學(xué)、中山大學(xué)和商湯科技聯(lián)合完成。 主要作者包括上海交通大學(xué)與上海人工智能實(shí)驗(yàn)室聯(lián)培博士生康恒銳、溫子辰,上海人工智能實(shí)驗(yàn)室實(shí)習(xí)生文思為等。通訊作者為中山大學(xué)副教授李唯嘉和上海人工智能實(shí)驗(yàn)室青年科學(xué)家何聰輝。
AIGC 技術(shù)狂奔的腳印后,留下的是滿地信任殘骸
近年來(lái),文生圖模型(Text-to-Image Models)飛速發(fā)展,從早期的 GAN 架構(gòu)到如今的擴(kuò)散和自回歸模型,生成圖像的質(zhì)量和細(xì)節(jié)表現(xiàn)力實(shí)現(xiàn)了跨越式提升。這些模型大大降低了高質(zhì)量圖像創(chuàng)作的門檻,為設(shè)計(jì)、教育、藝術(shù)創(chuàng)作等領(lǐng)域帶來(lái)了前所未有的便利。然而,隨著模型能力的不斷增強(qiáng),其濫用問(wèn)題也日益嚴(yán)重 —— 利用 AI 生成的逼真圖像進(jìn)行詐騙、造謠、偽造證件等非法行為層出不窮,公眾正面臨一場(chǎng)愈演愈烈的信任危機(jī)
(圖源自知乎和多家微信公眾號(hào))
不信?猜一猜下列圖片中哪些是真實(shí)的,哪些則是由 AI 合成偽造的?
(左右滑動(dòng)查看)
答案是:這些圖像全是偽造的
若只是匆匆一瞥,你很可能會(huì)毫不察覺 —— 它們幾乎天衣無(wú)縫。這正是得益于近年來(lái)文生圖技術(shù)的突飛猛進(jìn),AI 生成內(nèi)容已逼近真實(shí)。然而,正因如此,公眾在毫無(wú)防備的情況下被誤導(dǎo)的風(fēng)險(xiǎn)也在加劇。面對(duì)真假難辨的圖像,信任成本正悄然上升,焦慮與不安也隨之而來(lái)。
- 論文標(biāo)題: LEGION: Learning to Ground and Explain for Synthetic Image Detection
- 作者團(tuán)隊(duì): 上海交通大學(xué)、上海人工智能實(shí)驗(yàn)室、 北京航空航天大學(xué)、中山大學(xué)和商湯科技
- 項(xiàng)目主頁(yè): https://opendatalab.github.io/LEGION
- 關(guān)鍵詞: 偽造檢測(cè)、偽影定位、異常解釋、引導(dǎo)圖像優(yōu)化
那么我們?cè)撊绾纹凭郑吭?strong>ICCV25 highlight paper《LEGION: Learning to Ground and Explain for Synthetic Image Detection》中,來(lái)自上海交通大學(xué)、 上海人工智能實(shí)驗(yàn)室等組織的研究團(tuán)隊(duì)從構(gòu)建高質(zhì)量 AI 合成圖像數(shù)據(jù)集、設(shè)計(jì)可解釋偽造分析模型、實(shí)現(xiàn)檢測(cè)與生成的對(duì)立統(tǒng)一這三個(gè)角度給出了他們的答案。
破局基石:開創(chuàng)性數(shù)據(jù)集成就偽影圖鑒
該團(tuán)隊(duì)反思了現(xiàn)有偽造圖像數(shù)據(jù)集的局限性,并且構(gòu)建了首個(gè)針對(duì)純 AI 合成圖像,可進(jìn)行全面?zhèn)卧旆治龅臄?shù)據(jù)集 SynthScars,直擊現(xiàn)有頂級(jí)生成技術(shù)的缺陷與 “傷疤”,讓看似完美的 AI 圖像顯露真容,為圖像安全研究注入新動(dòng)力,主要具有以下亮點(diǎn):
- 全網(wǎng)頂配生成器:
部分圖像來(lái)自最新的 AI 創(chuàng)作平臺(tái),集齊了 FLUX、SD 系列、各種商用 API 及特定 LoRA 微調(diào)后的最新文生圖模型,幾乎不含 “一眼假” 的老舊低質(zhì)的偽造圖像
- 專殺超現(xiàn)實(shí)畫風(fēng):
系統(tǒng)性過(guò)濾動(dòng)漫、插畫等藝術(shù)風(fēng)格圖像,這類樣本雖常見但誤導(dǎo)性低;數(shù)據(jù)集中僅保留逼真程度高、最具欺騙性的超現(xiàn)實(shí)風(fēng)格圖像,聚焦人類最難分辨的 “視覺死角”
- 三維解剖級(jí)標(biāo)注
每張圖像均附帶偽影掩碼、異常解釋與偽影類型標(biāo)簽三類信息,系統(tǒng)覆蓋三大偽影類型:物理矛盾、結(jié)構(gòu)畸形、風(fēng)格失真,支持定位、診斷與歸因的全流程分析
- 去輪廓依賴魔咒
摒棄依賴物體邊界變形的傳統(tǒng)篡改范式,專注捕捉 AI 原生生成圖像中非結(jié)構(gòu)性、無(wú)規(guī)則分布的偽影信號(hào),直擊深層次建模缺陷遺留的 “蛛絲馬跡”
核芯武器:多模態(tài)大模型重塑分析范式
作者提出了一個(gè)基于多模態(tài)大模型(MLLMs)的圖像偽造分析框架,主要由全局圖像編碼器、定位圖像編碼器、大語(yǔ)言模型、像素解碼器和檢測(cè)分類頭組成,能夠?qū)崿F(xiàn):
多任務(wù)架構(gòu)統(tǒng)一:
偽造檢測(cè) + 偽影定位 + 異常解釋三位一體,同步完成,無(wú)需零散專家拼湊實(shí)現(xiàn)。
偽影定位任務(wù)在 RichHF-18K 等 3 個(gè)數(shù)據(jù)集上進(jìn)行了測(cè)試,結(jié)果如下:
作者指出,現(xiàn)有的一些通用多模態(tài)大模型,如 Qwen2-VL 在面對(duì)此任務(wù)時(shí)傾向于預(yù)測(cè)圖片的絕大部分(有時(shí)是整張圖片)為偽影,這是毫無(wú)意義的,這說(shuō)明了現(xiàn)有 MLLMs 缺乏相關(guān)知識(shí)和能力
異常解釋任務(wù)在 LOKI 等兩個(gè)數(shù)據(jù)集上進(jìn)行了測(cè)試,結(jié)果如下:
LEGION 僅用 8B 參數(shù)量就能夠在異常解釋任務(wù)中打敗其他同等甚至更大規(guī)模的模型。作者還指出諸如 Deepseek-VL2/GPT-4o 這樣的模型會(huì)輸出看似全面的各種可能性,但實(shí)際上會(huì)導(dǎo)致答案冗雜,評(píng)分偏低。
偽造檢測(cè)任務(wù)選擇在 UniversalFakeDetect 基準(zhǔn)上進(jìn)行測(cè)試:
卓越的魯棒性:
作者嘗試了高斯噪聲攻擊、JPEG 壓縮失真和高斯模糊三種干擾處理,發(fā)現(xiàn) LEGION 性能相較于傳統(tǒng)專家模型而言波動(dòng)較小,具有更強(qiáng)的魯棒性:
可解釋性飛躍:
與傳統(tǒng)專家模型僅給出真?zhèn)闻袛嗖煌琇EGION 除此以外還利用視覺掩碼直擊 “造假部位”,語(yǔ)言能力生成 “打假報(bào)告” → 不只判真假,更說(shuō)清何處假、為何假、有多假
更多的可視化示例請(qǐng)關(guān)注項(xiàng)目主頁(yè):https://opendatalab.github.io/LEGION
顛覆循環(huán):實(shí)現(xiàn)檢測(cè)與生成的終極共生
一直以來(lái),合成與檢測(cè),宛如一對(duì)技術(shù) “冤家”,在對(duì)抗中推動(dòng)彼此演進(jìn)。當(dāng)合成跑過(guò)檢測(cè),虛假內(nèi)容得以輕易偽裝,真假難辨的風(fēng)險(xiǎn)驟增;當(dāng)檢測(cè)勝過(guò)合成,生成模型便被迫進(jìn)化,朝著更高真實(shí)度與隱蔽性邁進(jìn)。
因此,這篇論文創(chuàng)造性地提出:
LEGION 不僅可以作為圖像安全的保衛(wèi)者,也能是反向促進(jìn)高質(zhì)量生成的催化劑
為此,作者從兩種不同的角度,提出了利用檢測(cè) “反哺” 生成的 pipelines:
全局提示詞優(yōu)化
作者指出,現(xiàn)有生成圖片中的偽影部分來(lái)源于提示詞的模糊。利用 LEGION 的異常解釋文本,對(duì)全局提示詞進(jìn)行多輪細(xì)化后再重新生成能夠有效修復(fù)一些缺陷,例如能對(duì)圖片進(jìn)行現(xiàn)實(shí)風(fēng)格遷移、結(jié)構(gòu)細(xì)節(jié)調(diào)整等。
局部語(yǔ)義修復(fù)術(shù)
另外一種思路是直接對(duì) LEGION 檢測(cè)出的偽影區(qū)域做局部修復(fù)。具體地,可以聯(lián)合檢測(cè)得到的偽影掩碼和異常解釋,利用圖像修復(fù)模型針對(duì)性地消除偽影細(xì)節(jié),這種方法的好處在于不對(duì)正常區(qū)域處理,能夠最大程度的保留原圖語(yǔ)義。
上例中,原始生成圖像的偽影較為隱蔽,乍一眼看去往往會(huì)被忽略 —— 房子在水中的倒影與實(shí)際的顏色和形狀不一致,這是典型的物理定律違反。通過(guò)多輪對(duì)偽影區(qū)域的局部修正,能夠逐步得到更高質(zhì)量、更逼真的合成圖片。
此外,我們利用 HPSv2.1 模型對(duì)應(yīng)用上述兩種方法前后生成的圖像進(jìn)行了定量的人類偏好評(píng)分,能夠明顯發(fā)現(xiàn)在引導(dǎo)圖像優(yōu)化后有較大程度的提升,這說(shuō)明了用 "打假" 反哺 "造真" 的可行性和有效性。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.