夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

電影級運鏡一鍵克?。「壑形?amp;快手可靈團隊發(fā)布CamCloneMaster

0
分享至



本文第一作者羅亞文,香港中文大學(xué) MMLab 博士一年級在讀,研究方向為視頻生成,導(dǎo)師為薛天帆教授。個人主頁:https://luo0207.github.io/yawenluo/

作為視頻創(chuàng)作者,你是否曾夢想復(fù)刻《盜夢空間》里顛覆物理的旋轉(zhuǎn)鏡頭,或是重現(xiàn)《泰坦尼克號》船頭經(jīng)典的追蹤運鏡?

在 AI 視頻生成中,這些依賴精確相機運動的創(chuàng)意,實現(xiàn)起來卻往往異常困難。

一個直接的想法是先用相機位姿估計模型從參考視頻中提取相機參數(shù),然后使用相機參數(shù)作為控制條件引導(dǎo)視頻生成過程。

然而,這條看似容易的路徑,實則充滿了陷阱:現(xiàn)實場景中的動態(tài)物體和復(fù)雜遮擋關(guān)系,常常導(dǎo)致模型估算出的相機參數(shù)出現(xiàn)偏差或錯誤,讓生成的運鏡效果與預(yù)期大相徑庭。

為了解決這一痛點,香港中文大學(xué)與快手可靈團隊聯(lián)合提出了一種全新的運鏡可控的視頻生成框架 CamCloneMaster。它引入了一種「參考即用」的新范式,用戶只需提供一段參考視頻,模型就能直接「克隆」其相機運動并應(yīng)用于新內(nèi)容,從根本上告別了對相機參數(shù)的依賴。該工作被計算機圖形學(xué)頂級會議 SIGGRAPH Asia 2025 接收,其訓(xùn)練、測試代碼和高質(zhì)量渲染數(shù)據(jù)集 CamClone Dataset 均已開源。該工作所提出的數(shù)據(jù)集規(guī)模宏大,包含115萬數(shù)據(jù)對,39.1萬視頻,覆蓋40個不同的3D場景,9.77萬條多樣化的相機軌跡。





  • 論文標(biāo)題:CamCloneMaster: Enabling Reference-based Camera Control for Video Generation
  • 項目主頁:https://camclonemaster.github.io/
  • 論文:https://arxiv.org/abs/2506.03140
  • 數(shù)據(jù)集:https://huggingface.co/datasets/KwaiVGI/CameraClone-Dataset
  • 代碼:https://github.com/KwaiVGI/CamCloneMaster

CamCloneMaster 能力展示

a) 相機可控的圖生視頻(I2V)





b) 相機可控的視頻重運鏡(V2V)





CamCloneMaster 創(chuàng)新點

研究者表示,CamCloneMaster 的主要創(chuàng)新點是:

  • 提出了一種全新的、無需相機參數(shù)的參考式控制范式:用戶僅需提供一個參考視頻,就能直觀、便捷地控制生成視頻的鏡頭運動。

  • 設(shè)計了一個簡潔高效的統(tǒng)一框架:通過 Token 拼接策略,在單個模型內(nèi)同時實現(xiàn)了相機可控的 I2V 和 V2V 任務(wù),避免了額外的控制模塊,參數(shù)效率極高。

  • 構(gòu)建并開源了首個大規(guī)模相機運鏡克隆數(shù)據(jù)集,為相機運鏡控制提供了寶貴的研究數(shù)據(jù)資源。

CamCloneMaster 算法解讀



如上圖所示,CamCloneMaster 的核心算法和框架極為簡單有效:它將作為條件的相機運動參考視頻(Camera Motion Reference)和可選的內(nèi)容參考視頻(Content Reference),通過一個 3D VAE 編碼器轉(zhuǎn)換成潛在空間的 Latent Tokens。

隨后,這些條件 Tokens 與需要去噪的目標(biāo)視頻的噪聲 Tokens,在時間維度(Frame Dimension)上進(jìn)行直接拼接。拼接后的序列被送入 Diffusion Transformer 中進(jìn)行處理。這種設(shè)計使得模型可以通過注意力機制來學(xué)習(xí)如何利用來自參考視頻的相機運動線索和內(nèi)容信息,從而指導(dǎo)視頻的生成。

Camera Clone 數(shù)據(jù)集



為了有效地訓(xùn)練模型學(xué)習(xí)「克隆」相機運動,團隊使用虛幻引擎 5(Unreal Engine 5)構(gòu)建了一個龐大的高質(zhì)量合成數(shù)據(jù)集——Camera Clone Dataset:

  • 規(guī)模宏大:包含 115 萬數(shù)據(jù)對和 39.1 萬個視頻,覆蓋 40 個不同的 3D 場景、3.91 萬個機位點和 9.77 萬條多樣化的相機軌跡。
  • 數(shù)據(jù)配對:數(shù)據(jù)集的關(guān)鍵特性是提供了大量的三元組視頻——運鏡參考視頻、內(nèi)容參考視頻以及目標(biāo)視頻。
  • 多樣性豐富:相機軌跡涵蓋了從簡單的平移、旋轉(zhuǎn)到復(fù)雜的組合路徑,模擬了真實世界中各種可能的拍攝手法。

實驗結(jié)果

在定量和定性比較中,CamCloneMaster 在各項指標(biāo)上均顯著優(yōu)于當(dāng)前的 SOTA 方法:

定性實驗結(jié)果:





定量實驗結(jié)果:



無論是在相機運動的準(zhǔn)確性(更低的旋轉(zhuǎn)和平移誤差),還是在生成視頻的視覺質(zhì)量(更低的 FVD/FID)和時序連貫性上,CamCloneMaster 都展現(xiàn)出了卓越的性能。

總結(jié)

CamCloneMaster 通過一種直觀、高效的參考式控制方法,極大地簡化了 AI 視頻生成中的相機運動控制。其統(tǒng)一的 I2V 和 V2V 框架,以及優(yōu)越的性能表現(xiàn),驗證了基于參考視頻的運鏡控制這一思路的巨大潛力。同時,開源的大規(guī)模數(shù)據(jù)集也將為社區(qū)的相關(guān)研究提供強有力的支持,有望推動 AIGC 視頻創(chuàng)作進(jìn)入一個運鏡更自由、表達(dá)更豐富的新階段。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
于正官宣《金吾不禁》放話:陳鈺琪再不爆,就是我的失??!

于正官宣《金吾不禁》放話:陳鈺琪再不爆,就是我的失?。?/a>

年兩
2025-10-22 13:14:08
章顏青被查

章顏青被查

新京報政事兒
2025-10-22 16:11:47
離大譜!一球員倒地后翻滾,有條狗跑過來復(fù)刻其動作,內(nèi)馬爾躺槍

離大譜!一球員倒地后翻滾,有條狗跑過來復(fù)刻其動作,內(nèi)馬爾躺槍

風(fēng)過鄉(xiāng)
2025-10-22 19:16:57
特雷澤蓋評當(dāng)今10大前鋒:梅西第一,前十無C羅和亞馬爾

特雷澤蓋評當(dāng)今10大前鋒:梅西第一,前十無C羅和亞馬爾

雷速體育
2025-10-23 09:30:15
美俄領(lǐng)導(dǎo)人布達(dá)佩斯峰會延期,特朗普是不是真的倒向俄羅斯?

美俄領(lǐng)導(dǎo)人布達(dá)佩斯峰會延期,特朗普是不是真的倒向俄羅斯?

山河路口
2025-10-22 13:04:58
張雪峰變了!52天后抖音復(fù)播,明顯感覺狀態(tài)不一樣,說話欲言又止

張雪峰變了!52天后抖音復(fù)播,明顯感覺狀態(tài)不一樣,說話欲言又止

火山詩話
2025-10-23 05:46:28
88年《血戰(zhàn)臺兒莊》熱映,蔣經(jīng)國提一要求,中央考慮后批示:同意

88年《血戰(zhàn)臺兒莊》熱映,蔣經(jīng)國提一要求,中央考慮后批示:同意

鄉(xiāng)野小珥
2025-10-22 10:57:43
有人問,若是國民黨當(dāng)年贏了,老蔣統(tǒng)治中國,那中國的未來會如何

有人問,若是國民黨當(dāng)年贏了,老蔣統(tǒng)治中國,那中國的未來會如何

鶴羽說個事
2025-10-22 12:01:41
八仙過海中的“八仙”,根本不是虛構(gòu)出來的人物,歷史上確有其人

八仙過海中的“八仙”,根本不是虛構(gòu)出來的人物,歷史上確有其人

國學(xué)長亭
2025-10-18 14:16:39
小米自安裝智能門鎖現(xiàn)身全球官網(wǎng) 可對普通門鎖升級

小米自安裝智能門鎖現(xiàn)身全球官網(wǎng) 可對普通門鎖升級

手機中國
2025-10-22 15:46:03
網(wǎng)盤中的加密文件,二十年后依然回味無窮

網(wǎng)盤中的加密文件,二十年后依然回味無窮

街機時代
2025-04-27 16:10:02
事實證明,49歲無兒無女的翁帆,早被楊振寧安排好了退路

事實證明,49歲無兒無女的翁帆,早被楊振寧安排好了退路

不寫散文詩
2025-10-20 23:27:37
郭汝瑰晚年回憶:潛伏敵營高層多年,真正佩服的國軍將領(lǐng)只有兩人

郭汝瑰晚年回憶:潛伏敵營高層多年,真正佩服的國軍將領(lǐng)只有兩人

華人星光
2025-10-20 14:40:03
她沒有懷孕!

她沒有懷孕!

奮斗在韓國
2025-10-23 10:03:18
國民黨新主席鄭麗文一上任就先聲奪人,第一把火就燒向黨務(wù)人事

國民黨新主席鄭麗文一上任就先聲奪人,第一把火就燒向黨務(wù)人事

藍(lán)色海邊
2025-10-23 09:16:39
特朗普表示希望烏克蘭沖突得到解決

特朗普表示希望烏克蘭沖突得到解決

參考消息
2025-10-23 10:45:09
已立案!上海一美發(fā)店老板抓狂!室內(nèi)成"養(yǎng)魚塘"

已立案!上海一美發(fā)店老板抓狂!室內(nèi)成"養(yǎng)魚塘"

看看新聞Knews
2025-10-22 20:24:06
香港詭異事件“鬼母煮飯”,女尸腐爛十日,幼女卻說母親每天煮飯

香港詭異事件“鬼母煮飯”,女尸腐爛十日,幼女卻說母親每天煮飯

堇色夜行
2025-01-06 22:54:42
瞞了觀眾20年!坐擁北京60畝馬場的于謙,私下到底多有錢?

瞞了觀眾20年!坐擁北京60畝馬場的于謙,私下到底多有錢?

格斗聯(lián)盟
2025-10-21 15:21:32
郭碧婷爸爸夜市批發(fā)玩具,改口風(fēng),替向太說話,稱自己占向家便宜

郭碧婷爸爸夜市批發(fā)玩具,改口風(fēng),替向太說話,稱自己占向家便宜

好賢觀史記
2025-10-22 16:41:12
2025-10-23 11:08:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11538文章數(shù) 142490關(guān)注度
往期回顧 全部

科技要聞

以價換量,特斯拉Q3營收增12%凈利大跌37%

頭條要聞

緬甸電詐園周邊超2500臺"星鏈"被切斷 美國調(diào)查SpaceX

頭條要聞

緬甸電詐園周邊超2500臺"星鏈"被切斷 美國調(diào)查SpaceX

體育要聞

只有1000多人的漁村,誕生了頂級聯(lián)賽冠軍

娛樂要聞

《再見愛人》:鄧莎被大19富商老公蔑視

財經(jīng)要聞

信也科技擔(dān)保模式之謎:畸高的逾期利息

汽車要聞

有望明年初亮相 小米YU9假想圖曝光

態(tài)度原創(chuàng)

教育
家居
手機
游戲
時尚

教育要聞

211高校秋招,進(jìn)場的企業(yè)都是騎手、主播之類,校長眉頭緊皺

家居要聞

蛇口地標(biāo) 盡享山海全景

手機要聞

PRO級全場景跟拍手機穩(wěn)定器 Osmo Mobile 8體驗

《神力科莎》系列全球銷量破2000萬!新作規(guī)劃公布

這件衣服今年太火了!時髦女人都在穿

無障礙瀏覽 進(jìn)入關(guān)懷版 日本高清乱理伦片中文字幕| 欧美性爱视频综合网| 中国XXXX性XXXX产国| 国产一区国产二区在线精品| 久久一二三区艺术福利| 亚洲老妈激情一区二区三区| 亚洲性XxXx猛大交| 成人a片产无码免费视频在线观看| 精品熟女亚洲AV| 国产激情无码一区二区在线看| 亚洲国产成人综合熟女| 91人妻人人操人人爽| vintage熟妇| 中文字幕乱码亚洲精品一区| 亚洲激情成人综合网| 婷婷婷国产在线视频| 日韩有码av中文字幕| 人人艹艹人人| 奇米在线视频播放| 极品少妇一区二区| 国产精品久久久久久久福利| 久久精品96国产亚洲精品| 人人操人人干内射| 亚洲最大成人网7777| 男人的天堂AV网| 欧美视频专区一二在线观看| 私人毛片免费高清影视院| 俺也去www色官方网站伴半 | 成年人黄色一片免费看| 丰满人妻一区二区三区视频53| 亚洲精品成人7777在线观看| 亚洲VA无码专区在线观看| 奶水人妻XXXX视频二| 人妻丰满熟妇av无码区乱| 麻豆仙嫩儿内射视频| 国产性猛交××××乱七区| 人人妻人人狠人人爽| 亚洲 1234区| 欧美97AV| 伊人草久久| 唐人社视频呦一区二区|