- Hi3DEval團隊 投稿
量子位 | 公眾號 QbitAI
作為AI視頻之后最被看好的AIGC應用領域之一,對比2024年,2025年AI 3D生成的質量已經(jīng)進化成了這樣:
△圖源:Meshy
隨著模型能力的不斷進化,在評估層面,新的挑戰(zhàn)也在出現(xiàn):
傳統(tǒng)3D生成評測往往停留在對象級的粗糙評估,主要關注“整體質量”,缺少對局部結構和材質的系統(tǒng)化分析。
為了解決這個問題,上海人工智能實驗室聯(lián)合復旦大學、清華大學、香港中文大學等高校發(fā)布了Hi3DEval——一套面向3D內(nèi)容生成的全新層次化自動評測體系。
團隊通過設計對象級、部件級與材質主題三層評測協(xié)議,實現(xiàn)從整體形態(tài)到局部結構再到材質真實性的多粒度分析,全方位揭示模型的生成能力。
在此基礎上,首期3D生成榜單已在HuggingFace同步發(fā)布,涵蓋30個主流與前沿模型,覆蓋Text?to?3DImage?to?3D兩大核心任務。
研究團隊表示,該榜單可以直觀呈現(xiàn)各模型的總和表現(xiàn),希望以此為學術界與產(chǎn)業(yè)界提供可追蹤、可復現(xiàn)的對標基準,推動3D生成技術向更高質量與更高透明度發(fā)展。
三層評測協(xié)議:從整體到細節(jié),全面解析3D生成質量
Hi3DEval基于三層評測協(xié)議的層次化評測體系,旨在提供更細粒度的質量剖析,還能揭示具體的優(yōu)缺點,為模型改進與優(yōu)化提供明確方向。
對象級(object-level)
對象級評估關注生成物體的宏觀表現(xiàn),涵蓋“幾何合理性幾何精細度紋理質量幾何-紋理一致性Prompt-3D一致性”五個維度。
“幾何合理性”側重的結構完整性、保真性,不存在多頭、塌陷、浮空等違背物理規(guī)律。
“幾何精細度”則側重表面精細度,包括邊緣銳利度、細小部件的完整性等。
“紋理質量”考察紋理貼圖的清晰度、細節(jié)保真度以及美學水平。
“幾何-紋理一致性”檢查紋理與幾何結構的對齊程度,例如花紋是否遵循物體表面輪廓。
“Prompt-3D一致性”則評估生成 3D 資產(chǎn)與輸入文本或圖像提示的匹配度,包括類別、屬性和身份特征等,確保結果符合用戶需求。
部件級(part-level)
現(xiàn)有的大多數(shù)3D生成評測體系都停留在對象級評估,只能給出整體質量的籠統(tǒng)評分,難以揭示模型在局部結構上的優(yōu)劣。
Hi3DEval引入部件級評測,將關注點精確落在諸如椅子腿、扶手、背板等細分部位,能夠直觀定位缺陷發(fā)生的區(qū)域。
這種粒度更細的評測不僅有助于診斷生成過程中的局部幾何問題,還能在模型優(yōu)化時提供有針對性的改進信號。評測維度包括局部幾何合理性(保證局部結構符合現(xiàn)實物理與設計邏輯)和局部幾何精細度(衡量細節(jié)刻畫的清晰度與豐富程度)。
材質主題(material-subject)
傳統(tǒng)的材質評估仍停留在圖片質量和主觀審美層面,常用的指標如FID、KID、美學評分等。
為了彌補這塊的空缺,Hi3DEval設計材質主題的評估協(xié)議,聚焦表面視覺與物理屬性,借助物體在不同光照條件下的反射信息,從“細節(jié)與復雜性色彩與飽和度一致性與偽影材質合理性”四個維度進行全方位評估。
其中前兩個維度聚焦表面視覺,“細節(jié)與復雜度”關注材質紋理的視覺豐富度和美學協(xié)調(diào)度,“色彩與飽和度”則評估材質顏色的分布是否自然以及飽和度是否合理。后兩個維度則聚焦物理屬性,“一致性與偽影”檢查材質紋理在不同光照或視角下的一致性,避免接縫、錯位、異常陰影等視覺偽影, “材質合理性”評估反射率、粗糙度等物理特性是否符合現(xiàn)實材料表現(xiàn)。
首期評測榜單:直觀呈現(xiàn)模型實力,推動行業(yè)對標
Hi3DEval在HuggingFace平臺發(fā)布了首期3D生成榜單,涵蓋30余款Text-to-3D與Image-to-3D模型。
榜單在統(tǒng)一的評測設置下對所有模型進行測評,包括相同的輸入提示、渲染視角、光照條件及輸出格式。這種標準化流程不僅消除了實驗環(huán)境差異帶來的偏差,還保障了榜單的評分結果的公正性和可參考性。
榜單結果不僅直觀呈現(xiàn)總分排名,還提供各個維度的單項得分,幫助研究者、開發(fā)者快速定位模型優(yōu)勢與短板。同時,它也為學術界與工業(yè)界提供了可追蹤的對標參考,推動 3D 生成技術向高質量、透明化發(fā)展。
完整榜單可點擊文末鏈接查看。
自動化評測管線:混合3D表征,增強3D感知能力
過往多數(shù)評測方法依賴靜態(tài)渲染圖像,難以暴露動態(tài)不一致(如跨視角形變、細節(jié)抖動等)和真實幾何缺陷(如多頭問題、局部塌陷等),評測結論與模型在真實三維使用場景中的可用性存在偏差。
為了緩解2D表征的局限性,Hi3DEval使用多視角環(huán)繞視頻 + 原生網(wǎng)格(mesh)構建了基于混合3D表征的自動化評測管線。
視頻表征能直觀揭示跨視角/時序的結構穩(wěn)定性與紋理漂移,能夠區(qū)分“靜幀好看、轉動即崩”的模型,使其非常適合用于對象級和材質主題的評估。而對于部件級評測,由于視頻表征經(jīng)常出現(xiàn)對部件主體的遮擋進而影響評估質量,所以選用了原生3D表征支持幾何相關維度的自動化評測。
通過統(tǒng)一的模型設置與對比實驗,Hi3DEval在人類偏好一致性上的表現(xiàn)優(yōu)越,超越了現(xiàn)有主流自動評測指標,為3D內(nèi)容生成領域提供了更可靠、更全面的評測工具。
在生成3D技術高速迭代的當下,雖然不同模型在功能和表現(xiàn)形式上的差距正在逐漸縮小,但在內(nèi)容精細度、真實感、結構一致性等質量維度上,差異依舊顯著。
過去,由于缺乏一套科學、統(tǒng)一且可擴展的評價體系,行業(yè)討論往往停留在“誰的demo更吸睛”這種主觀印象層面,難以全面衡量方法的真正水平。
Hi3DEval這樣的基準推出,旨在打破這一局限——不僅提供了面向未來的、系統(tǒng)化的3D內(nèi)容質量評價標準,也為學術界和產(chǎn)業(yè)界帶來了更透明、更公平的對比依據(jù)。
論文地址:
https://arxiv.org/abs/2508.05609
項目主頁:
https://zyh482.github.io/Hi3DEval/
評測榜單:
https://huggingface.co/spaces/3DTopia/3DGen-Leaderboard
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.