夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話影眸科技 CTO 張啟煊:大力不會永遠出奇跡

0
分享至



3D 生成行業(yè)很大,但剛剛到GPT-2 的水平,國內(nèi)團隊要領(lǐng)先海外團隊,大廠與創(chuàng)業(yè)公司在同一起跑線。

撰文|藍洞商業(yè) 趙衛(wèi)衛(wèi)

消費級的生成式AI屢見不鮮,工業(yè)級的生成式AI亟待新突破,繼騰訊混元入局3D生成模型之后,字節(jié)跳動最近也發(fā)布了3D生成大模型Seed3D 1.0。

工業(yè)級的3D生成意味著更高的精度和質(zhì)量,而且適用的行業(yè)也主要集中在B端行業(yè)。騰訊混元3D生成模型已經(jīng)進化到了3.0版本,主要用于游戲開發(fā),而字節(jié)跳動展示的3D生成大模型使用場景,主要瞄準仿真環(huán)境中的具身智能大模型訓(xùn)練。

衡量一個3D生成模型的能力,目前沒有絕對標準,只有相對質(zhì)量的對比。

在字節(jié)跳動Seed3D 1.0的測試圖中,還原度、透視與結(jié)構(gòu)、幾何質(zhì)量等多個維度都優(yōu)于同行對手,而它選取的國內(nèi)對手中,表現(xiàn)較好的分別是影眸科技的Rodin Gen-1.5、騰訊Hunyuan 3D-2.1和VAST的Tripo 2.5。



影眸科技團隊,后排左一為CEO吳迪,前排左一為CTO張啟煊

尤其是影眸科技,這家專注于3D大模型技術(shù)的創(chuàng)業(yè)公司由吳迪、張啟煊等人于2020年創(chuàng)立,去年A輪融資時,影眸科技的主要產(chǎn)品Rodin用45天就拿到了100萬美元ARR,字節(jié)跳動和美團龍珠領(lǐng)投,在今年的A+輪中,字節(jié)跳動繼續(xù)追加投資。

值得注意的是,過去一年間,字節(jié)在自身AI業(yè)務(wù)上飛速發(fā)展,但戰(zhàn)略投資很少出手AI項目,影眸科技是為數(shù)不多的一家。

如今,字節(jié)跳動親自下場布局3D生成模型,不難看出對這一賽道的重視,這也意味著3D生成市場會迎來更快發(fā)展。

9月,影眸科技上新了Rodin Gen-2.0版本的模型,相比上一代模型,生成的3D模型有了更加銳利和平直的邊緣,這一代模型在交互上增加了分件功能,讓用戶通過指定顆粒度來控制和重新拆分零件,增加了用戶可用性的同時領(lǐng)先于同類產(chǎn)品。

與此同時,網(wǎng)易游戲的《蛋仔派對》、3D打印行業(yè)的拓竹等公司和產(chǎn)品,都已經(jīng)用上了影眸科技的Rodin,他們通過Rodin的3D生成開發(fā)產(chǎn)品,這大大提升了3D內(nèi)容生產(chǎn)的規(guī)模和效率。

但3D生成的ChatGPT時刻尚未到來,影眸科技CTO張啟煊認為,當下行業(yè)差不多剛剛發(fā)展到GPT-2的水平,而未來進化的方向,是要滿足不同行業(yè)的具體使用場景,更需要互聯(lián)網(wǎng)大廠和創(chuàng)業(yè)公司們齊頭并進。

在騰訊、字節(jié)紛紛下場布局3D生成模型的當下,影眸科技作為創(chuàng)業(yè)公司如何思考未來的發(fā)展?「藍洞商業(yè)」對話了影眸科技CTO張啟煊,以下為內(nèi)容精編:

藍洞:你看到大廠相繼入局3D生成的產(chǎn)品之后,第一反應(yīng)是什么?

張啟煊:這更像是一個信號,表示愿意投入3D生成這件事。

騰訊混元3D大模型真正的飛躍,是今年三四月份,混元3D把模型參數(shù)量上到了百億級規(guī)模,這種嘗試需要一次性投入巨大的算力成本,對初創(chuàng)公司來說風險很大,但幸運的是混元成功了,后面的公司再去Scaling(規(guī)?;┚捅容^有信心了。

藍洞:大廠在3D生成的場景上各有側(cè)重,比如騰訊主要是游戲,字節(jié)主要是具身智能和電商,你們呢?

張啟煊:具身智能的幾家頭部公司也都在用我們的產(chǎn)品,包括上海交大的穆堯老師有一個Robo Twin項目,通過結(jié)合現(xiàn)實世界的遙操作數(shù)據(jù)與數(shù)字孿生的合成數(shù)據(jù),為雙臂機器人的研究提供強有力的支持,他們就選擇我們Rodin去生成具身智能的3D資產(chǎn),因為生成的模型橫平豎直規(guī)整度很高。

具身智能領(lǐng)域的數(shù)據(jù)來源有兩個,一個是真實數(shù)據(jù),另一個是虛擬數(shù)據(jù)。

如果你要在仿真環(huán)境中做虛擬數(shù)據(jù)的話,肯定需要3D資產(chǎn)在仿真環(huán)境中使用,那這個3D資產(chǎn)不可能靠掃描,也不太能夠雇人去建,靠現(xiàn)有的數(shù)據(jù)集的話又太少了,這時候3D生成就是很好的方向。

消費級的文字、音頻、圖片或是視頻內(nèi)容生成,都是往社交媒體走的,但3D生成不是這種模態(tài),它不是直接跟大眾接觸,從網(wǎng)易游戲到3D打印行業(yè)的拓竹,都是我們的客戶,但不同行業(yè)對3D的要求是不一樣的,差異非常巨大。

比如3D打印行業(yè)更關(guān)注模型的水密性,而游戲行業(yè)是一個很長的工業(yè)管線,我們在逐步攻破布線、UV和綁定動畫等問題,因為表面的平整度和曲面規(guī)范性非常重要。

藍洞:對于一個普通用戶來說,現(xiàn)在接觸你們的3D生成最普遍的形式是什么?

張啟煊:一個是3D打印,另外一個就是網(wǎng)易的游戲《蛋仔派對》?!兜白信蓪Α飞系摹窤I模型生成」功能,讓玩家輸出文字或上傳圖片就可以生成高質(zhì)量模型,然后在樂園工坊中直接使用,這意味著3D?成技術(shù)已經(jīng)進?了?規(guī)模商業(yè)應(yīng)?階段。

能夠跟大廠合作,是因為我們團隊在國內(nèi)的圖形學(xué)中是領(lǐng)先的,在國際圖形學(xué)頂級會議上斬獲過「最佳論文獎」和「TOP10技術(shù)論文速覽」雙料榮譽。

對于很多游戲公司來說,選擇第三方模型是現(xiàn)階段最穩(wěn)妥的方案,因為各家模型有各自的特點,語言模型上GPT-5更好還是Claude更好?視頻生成上Sora-2跟VEO-3.1哪個更好?大家都很難說絕對領(lǐng)先,我們只能說第一梯隊是誰。

藍洞:現(xiàn)階段國內(nèi)3D生成的第一梯隊是誰?

張啟煊:我認為是我們Rodin-2跟騰訊混元3D。我們不擔心競爭,最擔心的是大廠沒有加入這個游戲。

目前海外市場,基本占了我們收入的百分之七八十。海外主要在布局這一塊的是Roblox,它是一個在線游戲創(chuàng)建平臺,讓用戶通過免費工具來創(chuàng)作內(nèi)容,Roblox最早做了3D Control Net,能夠產(chǎn)生高質(zhì)量的輸出。

一年前發(fā)布1.0版本的時候,我們的一個賣點就是可控性很高,用3D的Control Net把設(shè)計產(chǎn)品的長寬高比例等固定下來,而不是讓AI胡亂生成, 這對游戲和工業(yè)設(shè)計是非常重要的剛需。上個月,混元3D也發(fā)布了原生3D組件生成模型的可控功能。

藍洞:上個月發(fā)布的新版本,相比去年的1.5版本,行業(yè)有哪些新變化?外界有哪些新的反饋?

張啟煊:現(xiàn)在跟去年相比,總的來說3D生成整個行業(yè)最大的變化就是參數(shù)量上去了。

比如去年年底,我們發(fā)布Rodin Gen-1.5版本的時候,參數(shù)量是超過40億,而現(xiàn)在整個3D生成行業(yè)第一梯隊中的模型,標配已經(jīng)是百億參數(shù)了,百億參數(shù)也就意味著你背后的數(shù)據(jù)量,已經(jīng)到百萬級別了。

所以行業(yè)飛速發(fā)展,一方面創(chuàng)業(yè)公司有了資本和資源去收集大量3D數(shù)據(jù),渠道已經(jīng)打通,也不再擔心3D數(shù)據(jù)從哪里來,而另外一方面,第一波做3D生成的公司已經(jīng)賺錢了,所以互聯(lián)網(wǎng)大廠也注意到了這個方向,開始跟游戲業(yè)務(wù)做協(xié)同,后面包括初創(chuàng)公司和大廠的競爭會更激烈。

我們影眸的特點是模型側(cè)各種功能性上的改進,比如將模型快速拆解為多個獨立部件,這些功能性和底層框架上比較領(lǐng)先。

上個月發(fā)布的新版本,我們已經(jīng)提前把基座模型給到一些用戶體驗,主打的功能就是分件,用戶體驗感覺很不錯。

但意想不到的反饋是,很多人覺得我們貼圖質(zhì)量變差了,其實我們做過AB test,換回原來的貼圖模型會更差,背后原因是模型質(zhì)量提升了之后,大家對貼圖的要求更高了,顯得貼圖質(zhì)量變差了。

我們每個版本的迭代都是朝著用戶需求展開,比如國內(nèi)一家知名智能硬件科技企業(yè),他們設(shè)計師都在用我們的產(chǎn)品,給我們的反饋是需要3D生成邊緣銳利,我們回去就在1.5版本中把這個特性做出來了。如今到2.0版本,我們分件功能也是來自設(shè)計行業(yè)的需求,讓設(shè)計變得更可控,使用面更廣了。

對于3D打印行業(yè)來說,現(xiàn)在小紅書上很多案例,都是用我們的產(chǎn)品生成3D設(shè)計之后拼裝的案例?,F(xiàn)在還需要下載之后在三維軟件中進一步操作,但后面我們會把這一套流程集成在我們網(wǎng)站中,不再需要用戶二次操作。



藍洞:從你們的產(chǎn)品UI設(shè)計上,能感覺你們的審美超過很多大廠,這是怎么來的?

張啟煊:我們團隊很多藝術(shù)家,幾個創(chuàng)始成員都喜歡拍電影,都會自己用三維動畫軟件Blender做3D渲染,所以很多產(chǎn)品宣傳片讓外界以為是專業(yè)團隊做的,其實都是我們自己設(shè)計的。在交互上的設(shè)計也是,與其說滿足自己的審美偏好,不如說幫用戶做到足夠方便,否則效果不會好。

藍洞:就目前3D生成來說,大廠比創(chuàng)業(yè)公司的優(yōu)勢大很多嗎?

張啟煊:大模型最重要的還是數(shù)據(jù)。至少目前,大廠跟創(chuàng)業(yè)公司在3D生成上是站在同一起跑線的。比如說,我們現(xiàn)在的數(shù)據(jù)量級已經(jīng)超出騰訊這樣級別的大廠在做的游戲數(shù)據(jù)量。

舉個例子,一般中小型游戲有幾百到上千個模型,中大型游戲則是幾千到上萬個。假設(shè)頂級游戲公司有100個游戲,每個游戲有1萬個模型,那么它最多有100萬個模型,而我們現(xiàn)在有的數(shù)量級已經(jīng)遠遠超過這個數(shù)量了。

大廠可以大力出奇跡,一次兩次可以,但第三次可能就難了。大家能看出GPT-5和GPT-4o的巨大差別嗎?所以要的是在體驗和場景使用上的新突破。

3D是個很大的行業(yè),但3D生成現(xiàn)在其實差不多剛剛到GPT-2的水平,而且國內(nèi)的團隊要領(lǐng)先海外團隊,我們私下開玩笑說,最聰明的那批人全都沒在做3D生成,海外的聰明人都去做AI視頻生成,都去做AGI了。

藍洞:制約3D生成下一步發(fā)展的條件,除了巨大的算力消耗還有什么?如何找到新的突破方向?

張啟煊:之前是有了模型之后去定制產(chǎn)品,比如從GPT-3.5到GPT- 4,而其實一個新的方向是為了一個產(chǎn)品去定制一個模型,比如最新的Sora 2。

它是為了社交媒體玩法,設(shè)計了可以植入人物多人合拍的功能,這些功能都是需要在網(wǎng)絡(luò)側(cè)引入的。再比如Google的AI圖像生成和編輯工具Nano Banana,也是從產(chǎn)品角度出發(fā)設(shè)計了一個新的網(wǎng)絡(luò)結(jié)構(gòu)。

那對應(yīng)到3D生成領(lǐng)域,我們很早就意識到為了用戶需求要在功能上進行設(shè)計,比如之前的3D Control Net和現(xiàn)在的分件,都是因為要滿足不同行業(yè)的具體使用場景,而不是加大數(shù)據(jù)和參數(shù)讓絕對質(zhì)量變高。

3D生成行業(yè)剛剛起步,因為3D行業(yè)不同行業(yè)對3D模型需求差異遠要比圖像跟視頻高很多。比如工業(yè)設(shè)計都要CAD模型,需要的是曲面模型而不是網(wǎng)格化的,那就要求我們把模型變成曲面參數(shù)表達,每完成一個新的里程碑,就會在新的領(lǐng)域里發(fā)現(xiàn)新的客戶去使用你的東西,這就是后面大家整個AI生成行業(yè)去迭代的方向。

藍洞:最近美國李飛飛團隊也發(fā)布了全新實時生成式世界模型RTFM,一張H100就可以運行,他們主導(dǎo)的3D生成方向本質(zhì)是學(xué)會了渲染的AI,而你之前也提到未來看好的方向是用生成式的方式去做渲染,這其中有什么不同?

張啟煊:我們其實不是一個賽道。李飛飛老師功成名就,她要考慮的是人類未來10年或20年后的東西,所以很前衛(wèi),他們的產(chǎn)品有點像視頻生成,是顛覆現(xiàn)在圖形渲染管線的事,其實不是為了這一代游戲和這一代的CG去做的,所以周期肯定更長。

而我們作為一家小初創(chuàng)公司,要先解決現(xiàn)階段的生存問題。3D生成是基于Mesh表達, 所謂Mesh表達就是由大量三角形面拼接而成的3D模型表達形式,它跟現(xiàn)在的CG還有游戲的工業(yè)是接軌的。

我看好未來生成式的方式去做渲染,我們也確實在布局,但跟我們現(xiàn)在的Rodin產(chǎn)品不太相關(guān)。之前大家想要呈現(xiàn)一個精致的視頻畫面,背后有3D模型、光照和材質(zhì)等等要求,然后通過渲染引擎去得到最后的圖像。而生成式AI改變了這個規(guī)則,圖像可以直接降噪生成視頻,但做不到非常精準,我們就希望把視頻生成變成一個渲染器,去完成妥當?shù)匿秩尽?/p>

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
張家界荒野求生賽宣布14名選手全部進入決賽:氣溫驟降,不再按原計劃淘汰4人

張家界荒野求生賽宣布14名選手全部進入決賽:氣溫驟降,不再按原計劃淘汰4人

極目新聞
2025-11-18 15:19:03
外交部介紹中日外交官會晤情況:中方再次向日方提出嚴正交涉

外交部介紹中日外交官會晤情況:中方再次向日方提出嚴正交涉

澎湃新聞
2025-11-18 15:26:36
高市早苗派人訪華,卻不是為了道歉,而是勸中國“顧全大局”

高市早苗派人訪華,卻不是為了道歉,而是勸中國“顧全大局”

歷史有些冷
2025-11-17 20:20:03
商竣程2-1逆轉(zhuǎn)頭號種子布云朝克特,晉級全運會四強

商竣程2-1逆轉(zhuǎn)頭號種子布云朝克特,晉級全運會四強

懂球帝
2025-11-18 13:13:08
日元遭猛烈拋售

日元遭猛烈拋售

極目新聞
2025-11-18 11:26:34
餓了你會吃哪碗米飯,測你命里有多富有

餓了你會吃哪碗米飯,測你命里有多富有

情感測試兜轉(zhuǎn)
2025-11-18 16:25:02
王晶再曝港圈猛料!香港第二富豪離婚被扒,夫妻恩愛但資產(chǎn)不讓碰

王晶再曝港圈猛料!香港第二富豪離婚被扒,夫妻恩愛但資產(chǎn)不讓碰

胡一舸南游y
2025-11-17 18:15:51
網(wǎng)友分享:你撿過最大的漏是什么?看完笑到飛起!

網(wǎng)友分享:你撿過最大的漏是什么?看完笑到飛起!

特約前排觀眾
2025-09-29 00:05:12
港姐冠軍首次挑戰(zhàn)內(nèi)衣廣告感不自在,事業(yè)線震撼網(wǎng)民:出手咁重

港姐冠軍首次挑戰(zhàn)內(nèi)衣廣告感不自在,事業(yè)線震撼網(wǎng)民:出手咁重

粵睇先生
2025-11-18 10:06:54
換車,就是一個巨大的消費陷阱。

換車,就是一個巨大的消費陷阱。

愛吃糖的貓cat
2025-11-16 18:14:27
明早9點 人口15萬的島國挑戰(zhàn)奇跡:打平就首進世界杯 隊內(nèi)有1華裔

明早9點 人口15萬的島國挑戰(zhàn)奇跡:打平就首進世界杯 隊內(nèi)有1華裔

風過鄉(xiāng)
2025-11-18 13:07:09
調(diào)查:香港千萬富翁增至近40萬人,總資產(chǎn)凈值中位數(shù)逾2千萬

調(diào)查:香港千萬富翁增至近40萬人,總資產(chǎn)凈值中位數(shù)逾2千萬

界面新聞
2025-11-18 15:39:07
蔡孝乾叛變吳石暴露,李克農(nóng)派出的潛臺小組,不辱使命絕境立功

蔡孝乾叛變吳石暴露,李克農(nóng)派出的潛臺小組,不辱使命絕境立功

黑句本
2025-11-03 10:45:13
為躲避戰(zhàn)亂,幾百個漢人“藏”在云南山洞300多年,已繁衍9代人!

為躲避戰(zhàn)亂,幾百個漢人“藏”在云南山洞300多年,已繁衍9代人!

史之銘
2025-11-14 20:49:40
付某梅(女),已被大連警方抓獲歸案!

付某梅(女),已被大連警方抓獲歸案!

半島晨報
2025-11-18 12:40:05
美國稱:中國不可怕,可怕的是,中國淘汰4000年的東西他們還在用

美國稱:中國不可怕,可怕的是,中國淘汰4000年的東西他們還在用

南宮一二
2025-11-04 16:14:07
俄烏雙方終于全都落入了美國人圈套,中國最終可能會成為受害者!

俄烏雙方終于全都落入了美國人圈套,中國最終可能會成為受害者!

南宮一二
2025-09-29 03:02:15
112000噸航母將交付,可搭載75架五代機,技術(shù)或領(lǐng)先全球20年

112000噸航母將交付,可搭載75架五代機,技術(shù)或領(lǐng)先全球20年

尋途
2025-11-18 12:46:51
美國擬替換澤連斯基是真是假?烏克蘭國際軍團揭秘

美國擬替換澤連斯基是真是假?烏克蘭國際軍團揭秘

史政先鋒
2025-11-18 18:46:46
陳婷卸下偽裝,給娛樂圈所有“已婚女人”上了一課

陳婷卸下偽裝,給娛樂圈所有“已婚女人”上了一課

素衣讀史
2025-11-17 16:45:02
2025-11-18 20:35:00
藍洞商業(yè)
藍洞商業(yè)
原創(chuàng)、深度的新經(jīng)濟人物和事件
650文章數(shù) 770關(guān)注度
往期回顧 全部

科技要聞

小米:汽車及AI等業(yè)務(wù)首次單季度經(jīng)營盈利

頭條要聞

孟加拉國前總理哈西娜被判死刑 中方回應(yīng)

頭條要聞

孟加拉國前總理哈西娜被判死刑 中方回應(yīng)

體育要聞

結(jié)束最后一次對決,陳夢和朱雨玲笑著相擁

娛樂要聞

宋佳奪影后動了誰的奶酪

財經(jīng)要聞

中美機器人爆發(fā)了一場論戰(zhàn)

汽車要聞

搭載1.5T增程動力 吉利銀河V900官圖發(fā)布

態(tài)度原創(chuàng)

教育
時尚
旅游
親子
數(shù)碼

教育要聞

論區(qū)老師“拗柴”與中考體育滿分之間的邏輯必然性

從百元到大牌,《新聞女王2》的職場穿搭,每種預(yù)算都能找到參考

旅游要聞

新疆新源縣:薩哈景區(qū)初雪至 冰雪秘境引客來

親子要聞

孩子咳嗽怎么辦?應(yīng)該如何緩解?

數(shù)碼要聞

天馬全球首發(fā)真610Hz無極電競屏,還有108英寸4K巨幕Micro LED

無障礙瀏覽 進入關(guān)懷版 国产成人影片免费观看| 日韩有码中文在线观看| 99久久婷婷国产综合精品| 胖女人操逼视频| 精品少妇无码一区二区三批| 男人的天堂免费视频资源在线观看 | 国产欧美日韩在线观看精品| 插插成年人视频| 亚洲成亚洲成网| 日本猛少妇色XXXXX猛叫小说| 国产精品久久久一区二区三区| www.sihu| 淫荡少妇小事频| 国产农村乱对白刺激视频 | 日韩放荡少妇无码视频| 另类黄色小说| 制服欧美激情丝袜综合色| 久青草国产高清在线视频| 少妇一区二区AV| 人人操人人交老奶妪| 国产精品涩涩涩视频网站| 国语自产偷拍在线观看| 欧美在线免费播放| 国产乱码77777777| 久久午夜无码鲁丝片| 亚洲V^无码视频| 国内精品久久人妻无| 成人无码视频97免费| 97久久超碰精品视觉盛宴| 777午夜福利理论电影网| 成人性大片免费观看网站| 久久人妻无码aⅴ毛片a片直播| 中国性爱videos| 久久久久亚洲av片无码| 成人无遮挡18禁免费视频| 亚洲碰碰人人av熟女天堂| 中国 老女人水多毛多| 成人av无码在线观看| 偷拍美女厕所尿尿嘘嘘小便| 人妻码有码精品中文字幕在线视频| 亚洲欧美一区二区三区日产|