研究人員開(kāi)發(fā)出新型人工智能系統(tǒng) 可準(zhǔn)確檢測(cè)偽造的數(shù)字作品
cnBeta
隨著逼真的虛假視頻變得越來(lái)越容易制作,并被更廣泛地用于傳播虛假信息、針對(duì)個(gè)人和造成傷害,加州大學(xué)河濱分校的研究人員開(kāi)發(fā)了一種新的人工智能系統(tǒng),旨在檢測(cè)這些數(shù)字偽造品。
電氣與計(jì)算機(jī)工程教授 Amit Roy-Chowdhury 和加州大學(xué)河濱分校 Marlan and Rosemary Bourns 工程學(xué)院的博士生 Rohit Kundu,與Google的一個(gè)團(tuán)隊(duì)合作,構(gòu)建了一個(gè)能夠識(shí)別視頻篡改的人工智能模型,即使這種篡改不僅僅是簡(jiǎn)單的換臉或修改音頻。(Roy-Chowdhury 還是加州大學(xué)河濱分校人工智能研究與教育 (RAISE) 研究所的聯(lián)合主任,該研究所是加州大學(xué)河濱分校最近成立的一個(gè)跨學(xué)科中心。)
該工具名為“識(shí)別篡改和合成視頻的通用網(wǎng)絡(luò)”(UNITE),其工作原理是分析整個(gè)視頻幀,而不是僅僅關(guān)注人臉。它檢查背景細(xì)節(jié)和運(yùn)動(dòng)模式,使其成為首批能夠不依賴(lài)面部線(xiàn)索識(shí)別篡改或完全合成視頻的系統(tǒng)之一。
從換臉到完全偽造的世界
“深度偽造技術(shù)已經(jīng)進(jìn)化了,”昆杜說(shuō)道,“它們不再只是換臉那么簡(jiǎn)單?,F(xiàn)在人們使用強(qiáng)大的生成模型,制作從人臉到背景都完全虛假的視頻。我們的系統(tǒng)就是為了捕捉所有這些?!?/p>
UNITE 的發(fā)布正值人工智能驅(qū)動(dòng)的文本轉(zhuǎn)視頻和圖像轉(zhuǎn)視頻工具在網(wǎng)上日益普及之際。這些技術(shù)幾乎讓任何人都能制作出極具說(shuō)服力的虛假視頻,引發(fā)了公眾人物、組織以及民主進(jìn)程公正性的嚴(yán)重?fù)?dān)憂(yōu)。
“這些工具變得如此唾手可得,真是令人恐懼,”昆杜說(shuō)道?!叭魏尉邆湟欢寄艿娜硕伎梢岳@過(guò)安全過(guò)濾器,制作出逼真的視頻,讓公眾人物說(shuō)出他們從未說(shuō)過(guò)的話(huà)。”
不需要人臉的探測(cè)器
Kundu 解釋說(shuō),早期的深度偽造檢測(cè)器幾乎完全關(guān)注面部線(xiàn)索。
“如果畫(huà)面中沒(méi)有人臉,很多探測(cè)器根本就無(wú)法工作,”他說(shuō)。“但虛假信息的形式多種多樣。改變場(chǎng)景背景也同樣容易扭曲真相?!?/p>
為了解決這個(gè)問(wèn)題,UNITE 使用基于 Transformer 的深度學(xué)習(xí)模型來(lái)分析視頻片段。它可以檢測(cè)到細(xì)微的空間和時(shí)間不一致性——這些線(xiàn)索經(jīng)常被之前的系統(tǒng)忽略。該模型借鑒了名為 SigLIP 的基礎(chǔ) AI 框架,該框架提取不局限于特定人物或物體的特征。一種名為“注意力多樣性損失”的新穎訓(xùn)練方法促使系統(tǒng)監(jiān)控每一幀中的多個(gè)視覺(jué)區(qū)域,從而防止其僅僅關(guān)注人臉。
一個(gè)模型檢測(cè)所有
最終成果是一個(gè)通用檢測(cè)器,能夠標(biāo)記一系列偽造品——從簡(jiǎn)單的面部交換到?jīng)]有任何真實(shí)鏡頭生成的復(fù)雜、完全合成的視頻。
“這是一個(gè)可以處理所有這些場(chǎng)景的模型,”昆杜說(shuō)?!斑@就是它具有通用性的原因?!?/p>
研究人員在田納西州納什維爾舉行的2025年計(jì)算機(jī)視覺(jué)與模式識(shí)別大會(huì)(CVPR)上展示了他們的研究成果。他們的論文題為《邁向通用合成視頻檢測(cè)器:從人臉或背景操作到完全AI生成的內(nèi)容》,由Kundu領(lǐng)導(dǎo),概述了UNITE的架構(gòu)和訓(xùn)練方法。合著者包括Google研究人員Hao Xiong、Vishal Mohanty和Athula Balachandra。CVPR由IEEE計(jì)算機(jī)學(xué)會(huì)和計(jì)算機(jī)視覺(jué)基金會(huì)共同贊助,是全球影響力最大的科學(xué)出版平臺(tái)之一。
由 Google 資源提供支持
Kundu 與Google的合作(Kundu 曾在Google實(shí)習(xí))提供了對(duì)廣泛數(shù)據(jù)集和計(jì)算資源的訪(fǎng)問(wèn),以便在廣泛的合成內(nèi)容上訓(xùn)練模型,包括從文本或靜止圖像生成的視頻 - 這些格式通常會(huì)難倒現(xiàn)有的檢測(cè)器。
盡管 UNITE 仍處于開(kāi)發(fā)階段,但它可能很快會(huì)在防御視頻虛假信息方面發(fā)揮重要作用。其潛在用戶(hù)包括社交媒體平臺(tái)、事實(shí)核查人員以及致力于防止被操縱視頻傳播的新聞編輯室。
“人們有權(quán)知道他們所看到的是否真實(shí),”昆杜說(shuō)道?!半S著人工智能越來(lái)越擅長(zhǎng)偽造現(xiàn)實(shí),我們也必須更擅長(zhǎng)揭示真相。”
編譯自/scitechdaily
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.