夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話商湯林達華:具身智能僅靠真機獲取數(shù)據(jù)有物理瓶頸

0
分享至



出品|搜狐科技

作者|梁昌均

編輯|楊 錦

面對洶涌的具身智能熱潮,商湯也打算入局了。

在今年的WAIC期間,這家公司宣布推出具身智能平臺“悟能”,定位具身大腦,其以具身世界模型為核心引擎,可以為機器人、智能設(shè)備等智能終端提供賦能。

商湯CEO徐立提到,過去十年,AI從感知智能邁向生成智能,現(xiàn)在迎來具身智能?!皬母兄澜绲礁玫乩斫馐澜?,才能生成世界,最后和現(xiàn)實的硬件交互來改變世界。”

這背后是商湯對大模型技術(shù)的演化路徑的判斷。從最初以計算機視覺起家,到入局大語言模型、多模態(tài)模型,再到此次布局具身模型,商湯不斷拓展自身技術(shù)邊界。

“從達到AGI的角度來說,要讓智能走出數(shù)字空間,實現(xiàn)和數(shù)字空間跟物理空間的連接?!鄙虦?lián)合創(chuàng)始人、首席科學(xué)家林達華對搜狐科技表示。

自去年以來,具身智能和人形機器人熱潮翻涌,吸引了不少玩家進入。正如林達華所說,具身智能市場正在快速成長,商湯希望去捕捉這個機會。

不過,具身智能也面臨不少挑戰(zhàn),業(yè)內(nèi)關(guān)注焦點在于數(shù)據(jù),并形成了真機派和仿真派的兩種路線。

在林達華看來,僅靠真機獲取數(shù)據(jù)會有物理瓶頸,不是快速迭代的路徑。他認可的做法是在強大的多模態(tài)基座上,用少量真機數(shù)據(jù)去做牽引,從而形成更好的能力。

目前,商湯與傅利葉智能、松應(yīng)科技、歸墟機器人等企業(yè)達成合作,并通過旗下的國香資本投資了宇樹科技、銀河通用、眾擎機器人等十多家具身智能企業(yè)。

除發(fā)布具身智能平臺,商湯在WAIC期間還更新了日日新V6.5大模型,其多模態(tài)推理與交互性能大幅提升,成本降至最初的30%,智能體能力也有所升級。

林達華認為,語言模型是大模型通向AGI比較容易切入的第一步,但最終要通向AGI,多模態(tài)是必經(jīng)之路,而接下來要把多模態(tài)的融合從理解層面,延伸到思考層面。

“下一步最重要的突破點是泛化性,就是推理的性能能不能從單一領(lǐng)域,拓展到廣泛的生產(chǎn)、工作和生活領(lǐng)域。如果做到,我覺得距AGI就靠近了一大步?!?/p>

另一個需要突破的則是模型的空間理解能力。林達華提到,Gemini 2.5等國際頂尖的多模態(tài)模型,空間感特別弱。如果這塊不突破,未來會成為具身智能落地的重要障礙。

談及今年爆火的智能體(Agent),林達華認為,Agent是AI落地很重要甚至是很終極的一種形態(tài),但現(xiàn)在很多號稱具備Agent能力的模型,在真正落地時還是有比較大的距離。

“Agent最終要走通的關(guān)鍵是,基礎(chǔ)模型的能力要有比較強的指令跟隨、意圖反思、編程推理等能力,最終一定是圍繞打穿場景去迭代,否則Agent的價值不能落地?!?/p>

以下是對話精編:


具身智能市場正在快速成長

不能只依賴真機數(shù)據(jù)

媒體:商湯發(fā)布具身智能平臺,定位具身大腦,現(xiàn)在布局是出于什么考慮?

林達華:AGI在我們看來有三個重要的發(fā)展階段,第一是語言跟多模態(tài)融合,第二是多模態(tài)思考,這兩個階段都是在數(shù)字空間去進行信息處理和判斷。

從達到AGI的角度來說,要讓智能走出數(shù)字空間,實現(xiàn)和數(shù)字空間跟物理空間的連接。打破這個邊界,才能最終到達智能的AGI彼岸。

商湯做了多年的計算機視覺,做了多模態(tài)模型,做智能駕駛也積累了很多如何讓模型去做規(guī)劃、控制的技術(shù)體系,這些能夠讓智能體去理解空間、進行規(guī)劃和行動控制。

我們這次會提出具身智能平臺,就是想讓這些能力以平臺化的方式去支持智能的發(fā)展。具身智能市場正在快速成長,商湯也希望從商業(yè)的角度去捕捉這個機會。

媒體:您怎么看具身智能的技術(shù)挑戰(zhàn)?業(yè)內(nèi)說的比較多的是數(shù)據(jù),不同企業(yè)做法也不同,商湯是如何考慮的?

林達華:大模型所需的海量數(shù)據(jù)可以從互聯(lián)網(wǎng)獲得,并能通過深加工等提升質(zhì)量去做訓(xùn)練。具身數(shù)據(jù)好像得通過操作才能獲得,但受限于機器人個數(shù),操作很慢,吞吐非常低。

因此,通過真機操作去獲取數(shù)據(jù),會有物理瓶頸。所以,這要真正做好,不能只依賴真機操作的數(shù)據(jù),數(shù)量級差得太遠,不是在當(dāng)前階段快速迭代的路徑。

所以只能用真機操作的數(shù)據(jù)作為種子,去校正模型,就是先通過大量互聯(lián)網(wǎng)數(shù)據(jù),形成強大的多模態(tài)基座,然后再用少量真機操作數(shù)據(jù)去做牽引,才能形成好的能力。

這也是為什么我們要做世界模型,這種結(jié)合很大程度上可以解決數(shù)據(jù)問題,商湯已把世界模型用于訓(xùn)練自動駕駛,把這個事走通。

媒體:商湯做具身智能主要定位大腦,未來會考慮做本體或者是和小腦的結(jié)合嗎?

林達華:我覺得未來有很多可能性,會在跟客戶和生態(tài)接觸的過程中,逐漸豐富和完善我們的技術(shù)體系。但是具體做哪些,我們會隨著時間不斷地調(diào)整我們的判斷,與時俱進。

媒體:大模型和具身智能的研發(fā)都需要較長投入,商湯如何平衡短期回報和長期布局?

林達華:最重要的是研發(fā)跟最終的商業(yè)愿景要對齊。研發(fā)大模型就是點科技樹,不同的年份點不同的點,如Kimi早期會點長文本,商湯會把多模態(tài)作為主軸。

這種選擇跟我們對模型最終產(chǎn)生閉環(huán)價值,需要突破哪些關(guān)鍵點的判斷有關(guān)系。為什么商湯沒有做奧賽金牌,因為沒法商業(yè)落地,我們不會走這個路徑。

具身智能跟基礎(chǔ)模型,不是完全去分資源的概念,具身智能、世界模型就建立在我們的積累的多模態(tài)基礎(chǔ)之上,這會使得我們在具身智能本身的額外投入沒有想象中那么大。


多模態(tài)是AGI的必經(jīng)之路

泛化性和空間理解能力是突破點

媒體:現(xiàn)在國內(nèi)外模型的競爭還是非常激烈,您怎么看大模型的演化趨勢?

林達華:AI本質(zhì)是要構(gòu)建一種智能。真正的智能是什么呢?就像人是一個智能體一樣,能跟真實的世界進行自主的交互,這是智能的終極目標。但它細分會有很多的維度,比如要做感知、做推理、做判斷、做決策等。

為什么語言模型會成為這一波大模型打響的第一槍?因為人類幾千年積累的豐富知識,是以語言的方式為主存在的,但語言并不是整個世界的本身。

所以從智能本質(zhì)來說,需要對各種模態(tài)的信息進行跨模態(tài)的關(guān)聯(lián),才能完成對世界的理解和建模。從某種意義上,語言模型是大模型通向AGI比較容易切入的第一步,但最終要通向AGI,多模態(tài)的能力不可缺少。

媒體:現(xiàn)在統(tǒng)一的大模型似乎還沒有,GPT-5還沒發(fā),多模態(tài)會往更加融合的方向去走嗎?

林達華:多模態(tài)發(fā)展最早是計算機視覺,是上一個時代的浪潮。到了23年、24年,多模態(tài)模型最初的架構(gòu)是語言模型,再接上視覺編碼器,把視覺信號跟語言合并處理。

這種架構(gòu)天花板比較低,融合也比較淺。直到2024年年底,像Gemini模型,比較早提出所謂的原生多模態(tài)的概念,這個天花板更高。現(xiàn)在往下去走,就是要把多模態(tài)的融合從理解層面,延伸到思考層面。

當(dāng)有效進行融合訓(xùn)練之后,一個多模態(tài)模型能夠在純語言的任務(wù)上表現(xiàn)地比一個純語言模型更好。當(dāng)能做到這一步的時候,單獨的語言模型就不再是必要的。所以商湯從日日新6.0開始,到這次發(fā)布的日日新6.5,沒有單獨的語言模型,全部都是多模態(tài)模型。

據(jù)我了解,現(xiàn)在國內(nèi)廠商,可能在今年下半年,陸陸續(xù)續(xù)也會開始這么走。比如字節(jié)跳動今年開源的一些模型,也是這條路徑。

媒體:去年就有Scaling law撞墻的談?wù)摚瑥募夹g(shù)上來說,AGI是不是真的遇到了瓶頸,需要在哪些方面去突破?

林達華:最近有個消息,谷歌在IMO上面拿到金牌。如果只是拿金牌,這個事情意義有限。就像AlphaGo,下圍棋打敗了世界冠軍,都是在一個非常狹窄的領(lǐng)域做到了突破。

現(xiàn)在所有的推理模型,能力強主要體現(xiàn)在做數(shù)學(xué)題、編程上。下一步最重要的突破點是泛化性,就是推理性能能不能從單科、單一領(lǐng)域,拓展到廣泛的生產(chǎn)、工作和生活領(lǐng)域,做到跟人一樣能夠自由去推理的水平。如果做到這一點,我覺得距AGI就靠近了一大步。

第二個,我覺得很重要的是空間理解能力。我們內(nèi)部研究,包括Gemini 2.5等國際頂尖的多模態(tài)模型,空間感特別弱。這不突破的話,未來會成為具身智能落地的重要障礙。

媒體:今年被稱為是Agent爆發(fā)的一年,您覺得Agent哪些領(lǐng)域最具代表性,還需要解決哪些關(guān)鍵的問題?

林達華:我覺得Agent是AI落地很重要甚至是很終極的一種形態(tài),要做成依賴非常強的推理能力、反思能力、規(guī)劃能力、決策能力,這些都是大模型需要提供的基礎(chǔ)能力。

為什么2023年大家不怎么談Agent,到了今年才說Agent是元年?因為那會的大模型能力還沒有到這個水平,今年達到了,能支撐真正的Agent起來。

但我呼吁大家要保持一個更加客觀的態(tài)度,很多模型說具備Agent的能力,在相關(guān)評測榜單上面分數(shù)也很高,但真正落地的時候,還是有比較大的距離。

我覺得Agent最終要走通的關(guān)鍵是,基礎(chǔ)模型的能力要有比較強的指令跟隨、意圖反思、編程推理等等能力,最終一定是圍繞打穿場景去迭代,否則Agent的價值不能落地。



運營編輯 |曹倩審核|孟莎莎




特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
字母哥,文班亞馬分別當(dāng)選首周NBA東西部周最佳

字母哥,文班亞馬分別當(dāng)選首周NBA東西部周最佳

雷速體育
2025-10-28 07:24:16
被控受賄超7500萬元,中國南水北調(diào)集團原副總經(jīng)濟師樊新中受審

被控受賄超7500萬元,中國南水北調(diào)集團原副總經(jīng)濟師樊新中受審

新京報
2025-10-28 18:43:06
欲哭無淚!深圳寶安這波跌幅太慘,幾年做生意賺的錢填補不了窟窿

欲哭無淚!深圳寶安這波跌幅太慘,幾年做生意賺的錢填補不了窟窿

星河也燦爛
2025-10-28 16:40:54
200萬噸大豆爛港!巴西賭中國離不開它,卻忘了中國早握3張王牌

200萬噸大豆爛港!巴西賭中國離不開它,卻忘了中國早握3張王牌

藍色海邊
2025-10-28 11:43:40
共和報:何塞普-馬丁內(nèi)斯駕車撞死一位坐輪椅逆行的81歲老人

共和報:何塞普-馬丁內(nèi)斯駕車撞死一位坐輪椅逆行的81歲老人

懂球帝
2025-10-28 18:57:09
胡歌演技勝任不了張居正?因飾演張居正胡歌被嘲:奶油小生不配

胡歌演技勝任不了張居正?因飾演張居正胡歌被嘲:奶油小生不配

蜜桔娛樂
2025-10-28 16:13:06
專戳人肺管子!何賽飛上綜藝“治”劉嘉玲,寧靜靠邊站不敢說話

專戳人肺管子!何賽飛上綜藝“治”劉嘉玲,寧靜靠邊站不敢說話

老屬科普
2025-10-27 19:56:10
安世半導(dǎo)體恢復(fù)在華銷售,令荷蘭總部暴跳如雷,警告無法保證質(zhì)量

安世半導(dǎo)體恢復(fù)在華銷售,令荷蘭總部暴跳如雷,警告無法保證質(zhì)量

臨云史策
2025-10-28 13:34:17
定居臺灣的叔叔回大陸,顯擺自己住50平豪宅,我:叔來我家看看嗎

定居臺灣的叔叔回大陸,顯擺自己住50平豪宅,我:叔來我家看看嗎

小秋情感說
2025-10-28 14:27:04
中國移動董事長調(diào)整

中國移動董事長調(diào)整

新京報政事兒
2025-10-28 18:35:02
寶寶巴士回應(yīng)兒歌軟件現(xiàn)低俗廣告:審核難免存在疏漏,會進行排查

寶寶巴士回應(yīng)兒歌軟件現(xiàn)低俗廣告:審核難免存在疏漏,會進行排查

極目新聞
2025-10-28 19:44:45
善惡到頭終有報!57歲央視女主持王小丫,已走上另一條大路

善惡到頭終有報!57歲央視女主持王小丫,已走上另一條大路

悠悠說世界
2025-10-27 06:36:13
柬埔寨女子那一聲“我是中國人”,比哭還讓人心酸

柬埔寨女子那一聲“我是中國人”,比哭還讓人心酸

歷史總在押韻
2025-10-28 00:02:14
謝霆鋒兒子謝振軒考入澳洲音樂學(xué)院!學(xué)生證曝光,以后也進娛樂圈

謝霆鋒兒子謝振軒考入澳洲音樂學(xué)院!學(xué)生證曝光,以后也進娛樂圈

有范又有料
2025-10-28 20:21:40
成都首家4000億元上市公司誕生

成都首家4000億元上市公司誕生

掌上金牛
2025-10-28 10:21:52
徹底涼了,西貝閉店潮來襲,賈老板求錘得錘

徹底涼了,西貝閉店潮來襲,賈老板求錘得錘

吃瓜局
2025-10-27 20:39:25
各取所需!美媒曬3方交易方案:字母哥聯(lián)手庫里 巴特勒加盟活塞

各取所需!美媒曬3方交易方案:字母哥聯(lián)手庫里 巴特勒加盟活塞

鍋子籃球
2025-10-28 22:40:06
這就不能怪開拓者了?楊瀚森剛打完湖人就帶著女朋友吃宵夜了!

這就不能怪開拓者了?楊瀚森剛打完湖人就帶著女朋友吃宵夜了!

田先生籃球
2025-10-28 21:29:19
香港女子花400萬買15平房子,晚上睡衣柜頂,網(wǎng)友:還沒我廚房大

香港女子花400萬買15平房子,晚上睡衣柜頂,網(wǎng)友:還沒我廚房大

以茶帶書
2025-10-27 16:19:04
修杰楷被捕24小時,賈靜雯親自開撕!操作太絕,劇本都不敢這么編!

修杰楷被捕24小時,賈靜雯親自開撕!操作太絕,劇本都不敢這么編!

小椰的奶奶
2025-10-28 13:29:26
2025-10-29 00:48:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方賬號
4554文章數(shù) 9161關(guān)注度
往期回顧 全部

科技要聞

30000人,一夜失業(yè)!亞馬遜AI“砍刀”落下

頭條要聞

初三女生被同學(xué)毆打13次精神分裂 副校長碰到卻沒制止

頭條要聞

初三女生被同學(xué)毆打13次精神分裂 副校長碰到卻沒制止

體育要聞

多特客戰(zhàn)法蘭克福:安塞爾米諾、阿德耶米首發(fā),吉拉西替補

娛樂要聞

76歲歡喜哥去世!眾星悼念

財經(jīng)要聞

信息量巨大!“十五五”規(guī)劃建議發(fā)布

汽車要聞

煥新極氪7X 22.98萬起 全系升級900V

態(tài)度原創(chuàng)

時尚
本地
家居
數(shù)碼
軍事航空

50+女人聽我一句勸,別穿得太花哨和超短裙,才能優(yōu)雅到老

本地新聞

全網(wǎng)圍觀,到底多少人被這個野人大學(xué)生笑瘋了

家居要聞

純白質(zhì)感 簡約而不簡單

數(shù)碼要聞

今年的追覓,正在專心“跨界”

軍事要聞

特朗普:俄方知道美國在俄海岸附近部署核潛艇

無障礙瀏覽 進入關(guān)懷版 无码日韩人妻一区三区| 极品人妻videosss人妻| 2019最新久久久视频精品| 亚洲av成人无码久久精品老人| 中文在线观看影院二区| 一本av高清一区二区三区| 国产亚洲精品福利在线无卡一| 娇妻被朋友玩得呻吟在线电影| 伊人激情av一区二区三区| chinese国产精品男女av| 成人性能视频在线| 亚洲AV无码精品无码一区二区| 国产精品人成在线播放新网站| 欧美国产中文| 妺妺窝人体色www聚色窝| 日本乱伦二区| 俺也去www色官方网站| 亚洲无码先锋| 极品粉嫩无套精品人妻视频| 国产精品毛片va一区二区三区| 人人操人人爱人人| 2014av手机天堂网免费| 在线播放免费人成毛片| 天天综合网永久在线| 亚洲精品久久久久午夜福禁果tⅴ| 国内精品久久人妻朋友| 丰满少妇2中文在线观看| 巨大黑人极品videos精内射| 91欧美在线| 男女啪啪18禁无遮挡激烈| 广东少妇大战黑人34厘米视频| 国产精品美女9999999不长| 成年女人永久免费观看视频| 亚洲欧洲成人a∨在线观看| 乒乓亚锦赛女团决赛:中国vs日本| 成人午夜视频一区二区无码| H无遮挡无码| 一级黄色录像真人视频| 日本亚洲欧美国产日韩ay| 久视频Www| 婷婷六月在线精品免费视频观看|