夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網易首頁 > 網易號 > 正文 申請入駐

從「會表演」到「更會演」:KlingAvatar2.0讓數(shù)字人擁有生動靈魂

0
分享至

機器之心發(fā)布

還記得幾個月前那個能隨著音樂節(jié)拍自然舞動的 KlingAvatar 數(shù)字人嗎?現(xiàn)在,它迎來了史詩級進化!

近日,快手可靈團隊正式發(fā)布了 KlingAvatar2.0 技術報告,這一次,數(shù)字人不僅能 "表演",更能 "生動表達"——它們將擁有更豐富的情感層次、更精準的多角色互動,對復雜文本指令的深度理解能力,以及支持長達 5 分鐘的視頻生成。目前該模型已經在可靈平臺全量上線,人人都可體驗!

  • 論文地址:https://arxiv.org/pdf/2512.13313
  • 體驗鏈接:https://app.klingai.com/cn/ai-human/image/new/

首先看一下效果,肢體靈動、表情逼真,生動性拉滿!







文中視頻鏈接:https://mp.weixin.qq.com/s/SexCvqSiQTJKBSixBlmajA

讓我們拆解技術報告,看一下可靈團隊是如何實現(xiàn)如此生動效果的。

核心技術突破:讓數(shù)字人 "活" 起來的三大創(chuàng)新

1. 時空級聯(lián)框架:長視頻不再 "虎頭蛇尾"

想象一下,你正在制作一個 5 分鐘的產品介紹視頻,但傳統(tǒng)的 AI 生成工具總是在第 2 分鐘后就開始 "崩壞"—— 畫面變得模糊,人物動作開始不連貫,甚至連口型都對不上了。KlingAvatar2.0 創(chuàng)新性地提出了時空級聯(lián)框架:

  • 智能藍圖生成:先創(chuàng)建低分辨率 "藍圖視頻" 捕捉全局語義和動作
  • 漸進式增強:通過首幀 - 末幀策略,將藍圖精細化為高分辨率、時間連貫的子片段
  • 并行高效:支持分鐘級長視頻生成,保持身份一致性和故事連續(xù)性



KlingAvatar 2.0 方案框架。該方案快速勾勒出一個低分辨率的 "分鏡腳本"(藍圖視頻),確定整個故事的走向和關鍵動作節(jié)點;然后,它會像精雕細琢的藝術家一樣,逐步將這些關鍵幀升級為高清畫面,確保每個細節(jié)都栩栩如生;最后,通過并行處理技術將這些精心打磨的片段無縫拼接成完整的長視頻。

2. 共推理導演:多模態(tài)指令的 "智慧大腦"

KlingAvatar2.0 的共推理導演系統(tǒng)就像是給數(shù)字人配備了一個專業(yè)的導演團隊。這個系統(tǒng)由三位 "AI 專家" 組成,它們會像真正的電影制作團隊一樣密切協(xié)作:

  • 音頻專家:精準識別語音內容、情感軌跡和說話意圖
  • 視覺專家:深度理解人物特征、場景布局和視覺語境
  • 文本專家:智能解析用戶指令,融合對話歷史生成連貫劇情

這三大專家通過多輪對話協(xié)作,能夠解決模態(tài)沖突(比如憤怒語氣配中性腳本),將模糊的指令轉化為詳細的鏡頭級故事線。

3. 多角色精準控制:每個數(shù)字人都有自己的 "聲音"

在傳統(tǒng)的多角色視頻中,一個常見的問題是 "張冠李戴"—— 明明是給 A 角色的音頻,結果 B 角色的嘴也在動。這種混亂讓觀眾瞬間出戲,破壞了整個視頻的沉浸感。KlingAvatar2.0 通過身份特定多角色控制技術,讓每個數(shù)字人都能 "各司其職":

  • 利用深度 DiT 特征實現(xiàn)角色掩碼預測
  • 每個角色都能被獨立的音頻流精準驅動
  • 基于 Yolo、DWPose、SAM2 等模型構造了數(shù)十萬條高質量多人數(shù)據用于訓練



(a) KlingAvatar2.0 基于 DiT 深層 block 特征預測指定角色在視頻中每一幀畫面的位置,控制音頻精確驅動該位置的角色。(b) 可靈團隊基于 Yolo、DWPose、SAM2 等模型構造了數(shù)十萬條高質量多人數(shù)據用于訓練。

實驗結果:生動性大幅提升,數(shù)字人有了 "演技"

如果說 KlingAvatar1.0 讓數(shù)字人學會了 "表演" 的基本功,那么 2.0 版本則讓它們真正擁有了 "演技"。生動性方面:

  • 情感表達更細膩:面部表情隨語音起伏自然變化,能夠準確傳達興奮、悲傷、憤怒等復雜情緒,眼神、嘴角、眉梢都充滿 "戲"。
  • 動作協(xié)調更自然:全身動作與音頻節(jié)奏完美同步,手勢、姿態(tài)變化流暢自然,避免了不自然的扭曲和抖動。
  • 細節(jié)處理更精致:頭發(fā)動態(tài)物理真實,不再 "僵硬",牙齒、嘴唇細節(jié)清晰可見,光照和曝光效果更加自然。



KlingAvatar2.0 與 Heygen、OmniHuman-1.5、KlingAvatar1.0 相比有更優(yōu)異的性能。

在涵蓋 300 個高質量測試案例的嚴格評測中,KlingAvatar2.0 展現(xiàn)出了令人矚目的性能:

  • 整體效果:相比 HeyGen 提升 26%,相比 KlingAvatar1.0 提升 73%,相比 OmniHuman-1.5 提升 94%
  • 文本響應:指令理解能力大幅提升,能準確執(zhí)行復雜的鏡頭和動作指令
  • 運動表現(xiàn)力:生動性和豐富度遠超競品



KlingAvatar 2.0 與基線方法的定性比較。左圖:KlingAvatar 2.0 能夠生成更自然的頭發(fā)動態(tài)效果和更生動的面部表情。中圖:KlingAvatar 2.0 更符合指定的自下而上的攝像機運動。右圖:KlingAvatar 2.0 的結果與提示 “…… 轉身面向前方,雙手交叉放在胸前” 更加吻合

總結:讓每個數(shù)字人都有動人靈魂

回顧整個數(shù)字人技術的發(fā)展歷程,我們可以清晰地看到一個進化軌跡:從最初的 "嘴唇蠕動",到后來的 "表情同步",再到現(xiàn)在的 "生動表演",每一次突破都讓虛擬角色離 "真實" 更近一步。

KlingAvatar2.0 不僅僅是一次技術升級,它也代表了 AI 在理解人類表達藝術方面的一次飛躍。這項技術讓機器更好地理解了什么是 "表演"—— 它不僅僅是機械地執(zhí)行指令,而是要在理解音頻情感、視覺語境和文本意圖的基礎上,創(chuàng)造出能夠觸動人心的視聽體驗。

放眼到行業(yè),數(shù)字人技術的持續(xù)迭代,也推動著行業(yè)創(chuàng)作門檻的降低、制作標準的提升,在電商直播、娛樂內容制作、在線教育、企業(yè)服務等諸多領域,數(shù)字人的規(guī)模化應用已成趨勢。

生成效果的大幅提升,長內容場景的全覆蓋,都讓我們更加確信:技術不再是冰冷的工具,而是真正成為了表達創(chuàng)意、傳遞情感的溫暖載體。在這個技術與藝術完美融合的新時代,準備好讓你的創(chuàng)意 "活" 起來了嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
爆:原中國移動集團董事長尚冰!

爆:原中國移動集團董事長尚冰!

通信頭條
2025-12-23 21:18:27
為什么女朋友覺得年入百萬很簡單?網友:她一定有個做足浴的閨蜜

為什么女朋友覺得年入百萬很簡單?網友:她一定有個做足浴的閨蜜

帶你感受人間冷暖
2025-11-04 16:38:29
臺灣問題,根本不是武統(tǒng)、和統(tǒng)的問題了,而是以下這兩方面問題!

臺灣問題,根本不是武統(tǒng)、和統(tǒng)的問題了,而是以下這兩方面問題!

比利
2025-12-24 17:49:48
1996年,姚文元出獄后,向中央提兩個請求,第二個被一口回絕

1996年,姚文元出獄后,向中央提兩個請求,第二個被一口回絕

雍親王府
2025-11-15 21:50:03
真實的茜茜公主和丈夫的合影:蜂腰40厘米,黑白照也蓋不住美貌

真實的茜茜公主和丈夫的合影:蜂腰40厘米,黑白照也蓋不住美貌

毒舌小紅帽
2025-12-21 21:29:26
平安夜!CBA焦點戰(zhàn)!24日19點30分,CCTV5和CCTV5+直播表出爐

平安夜!CBA焦點戰(zhàn)!24日19點30分,CCTV5和CCTV5+直播表出爐

老吳說體育
2025-12-24 10:46:17
豬肝再次成為關注對象!醫(yī)生發(fā)現(xiàn):常吃豬肝,可能會收獲4大好處

豬肝再次成為關注對象!醫(yī)生發(fā)現(xiàn):常吃豬肝,可能會收獲4大好處

搖感軍事
2025-11-30 18:57:30
馬龍,獲國家級教練資格

馬龍,獲國家級教練資格

揚子晚報
2025-12-24 12:34:27
臺海觀瀾 切走一半臺積電,特朗普政府的愿望能否實現(xiàn)

臺海觀瀾 切走一半臺積電,特朗普政府的愿望能否實現(xiàn)

經濟觀察報
2025-12-24 12:19:05
中國首次硬剛美國軍售,警告時代正式結束!

中國首次硬剛美國軍售,警告時代正式結束!

回京歷史夢
2025-12-24 00:45:02
婚姻法新規(guī):非夫妻關系的男女自愿同居,如果被查到了...

婚姻法新規(guī):非夫妻關系的男女自愿同居,如果被查到了...

譚老師地理大課堂
2025-12-09 18:24:33
機關事業(yè)單位退休人員,職業(yè)年金領完139個月后,還發(fā)嗎?

機關事業(yè)單位退休人員,職業(yè)年金領完139個月后,還發(fā)嗎?

小彬說事
2025-12-01 15:36:15
講個笑話:世界上人口最多的民族,居然連自己的民族服飾都不認識

講個笑話:世界上人口最多的民族,居然連自己的民族服飾都不認識

魔都姐姐雜談
2025-12-18 12:48:41
整容臉又來禍害央視???青蛙眼、饅頭臉、香腸唇,別辣觀眾眼睛了

整容臉又來禍害央視???青蛙眼、饅頭臉、香腸唇,別辣觀眾眼睛了

法老不說教
2025-12-24 18:25:33
徹底摧毀雷霆74勝之夢?馬刺20分再勝雷霆 真克星!

徹底摧毀雷霆74勝之夢?馬刺20分再勝雷霆 真克星!

體壇周報
2025-12-24 12:26:24
為什么今年美國、歐盟要集體圍剿中國?

為什么今年美國、歐盟要集體圍剿中國?

流蘇晚晴
2025-12-22 18:16:19
剛剛!北京官宣:限購、信貸、公積金都放寬了!

剛剛!北京官宣:限購、信貸、公積金都放寬了!

廣州樓市發(fā)布
2025-12-24 17:00:34
 《阿凡達3》在德國殺瘋了!

《阿凡達3》在德國殺瘋了!

仙味少女心
2025-12-23 17:50:24
唐斯重返故地爆砍40分,蘭德爾25+6+3華子38分,森林狼復仇尼克斯

唐斯重返故地爆砍40分,蘭德爾25+6+3華子38分,森林狼復仇尼克斯

釘釘陌上花開
2025-12-24 11:38:29
撿垃圾的流浪漢死了,義工幫他整理遺物,掀開破棉被后義工手抖了

撿垃圾的流浪漢死了,義工幫他整理遺物,掀開破棉被后義工手抖了

懸案解密檔案
2025-12-22 09:16:26
2025-12-24 19:40:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11988文章數(shù) 142518關注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

果農再次開啟"賽博助農":在"魔獸世界"賣3.5萬斤橙子

頭條要聞

果農再次開啟"賽博助農":在"魔獸世界"賣3.5萬斤橙子

體育要聞

26歲廣西球王,在質疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財經要聞

重磅!北京市優(yōu)化調整住房限購政策

汽車要聞

“運動版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

房產
數(shù)碼
本地
手機
公開課

房產要聞

硬核!央企??谝痪€江景頂流紅盤,上演超預期交付!

數(shù)碼要聞

2025電視換新不踩坑:2000元檔選華為Vision智慧屏5 SE

本地新聞

云游安徽|一川江水潤安慶,一塔一戲一城史

手機要聞

小米高端旗艦價格門檻要升至7000元+了!盧偉冰:無論怎么漲 定會物超所值

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 亚洲欧美在线x视频| 国产极品久久久| 国产久免费热视频在线观看| 日韩福利免费在线| 2014AV天堂男人| 亚洲人成网线在线播放VA| 噜噜噜天天躁狠狠躁夜夜精品| 久久免费午夜电影网| 成人亚洲一级午夜激情网| 中文字幕无码肉感爆乳在线| 国产精品va在线播放| 欧美黑人添添高潮a片www| 国产精品96久久久久久吹潮| 国产高跟黑色丝袜在线| 亚洲欧洲日产国码无码AV一| 亚洲国产精品成人午夜在线观看| 亚洲精品中文字幕无码蜜桃| 男女啪啪网站| 久久国产成人午夜AV影院| 欧美精品无码一区二区三区| 免费av一区二区三区无码| 国产精品久久1024| 国产专区一线二线三线品牌东| 亚洲日韩av在线观看| 农村妇女高潮白浆| 亚洲无码在线观看wwww| 欧美激情精品久久久久自慰| 国产A∨影视| 久久久久有精品国产麻豆| 国产精品国产三级国产av品爱网| 亚洲激情文学| www.色中色| 六月丁香综合在线视频| 中文人妻av久久人妻18| 亚洲成人xxxxxxxx| 国产精品性爱视频| 黑人巨大精品欧美在线观看| 欧洲肥妇14p| 国产午夜精华精华| 欧美另类日韩| 色欲av无码久久久久久不卡网址|