網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

根據(jù)財(cái)聯(lián)社9月11日?qǐng)?bào)道，宇樹(shù)科技創(chuàng)始人王興興

2025-09-12 19:09:09　來(lái)源: 老友科普

廣東舉報(bào)

分享至

在2025外灘大會(huì)上，竟然毫不客氣，指出了目前AI的巨大缺陷：“現(xiàn)在的AI大模型，雖然在文字和圖像領(lǐng)域已經(jīng)取得了令人矚目的成就，甚至比99.99%的人都做得更好。但讓AI真正‘干活’的領(lǐng)域，還處于‘荒漠’階段?！?/p>

王興興認(rèn)為，當(dāng)前具身智能發(fā)展在高質(zhì)量數(shù)據(jù)以及模型算法層面仍然存在諸多挑戰(zhàn)。在數(shù)據(jù)層面，數(shù)據(jù)采集和質(zhì)量問(wèn)題較為突出。比如，對(duì)于機(jī)器人而言，優(yōu)質(zhì)數(shù)據(jù)該如何采集，采集的規(guī)模和標(biāo)準(zhǔn)是什么，都還處于相對(duì)模糊的階段。同時(shí)，數(shù)據(jù)利用率的提升也是一大難題。數(shù)據(jù)噪聲的干擾，使得真正能夠被有效利用的數(shù)據(jù)占比不高，這就導(dǎo)致模型在學(xué)習(xí)過(guò)程中無(wú)法充分發(fā)揮其潛力。

在模型層面，當(dāng)前多模態(tài)數(shù)據(jù)的融合并不理想。雖然純語(yǔ)言模型或純視頻模型的效果已經(jīng)可圈可點(diǎn)，但要將語(yǔ)言和圖像等多模態(tài)數(shù)據(jù)進(jìn)行完美融合，仍然困難重重。以機(jī)器人控制為例，模型與機(jī)器人的控制模態(tài)對(duì)齊存在很大挑戰(zhàn)。比如想通過(guò)視頻生成讓機(jī)器人學(xué)習(xí)做家務(wù)，單純的視頻生成或許已經(jīng)有不錯(cuò)的效果，但要讓生成的內(nèi)容與機(jī)器人的控制模態(tài)精準(zhǔn)對(duì)齊，讓機(jī)器人能夠按照指令精確地完成家務(wù)動(dòng)作，目前還很難實(shí)現(xiàn)。再如控制機(jī)器人的靈巧手，AI模型難以很好地讓其完成除簡(jiǎn)單抓取之外的更復(fù)雜、更精細(xì)的動(dòng)作。

不過(guò)，王興興對(duì)AI的未來(lái)發(fā)展依舊充滿信心。他表示，現(xiàn)階段機(jī)器人硬件其實(shí)完全夠用，AI時(shí)代對(duì)于年輕人來(lái)說(shuō)是一個(gè)非常公平的時(shí)代，創(chuàng)新創(chuàng)業(yè)的門(mén)檻已經(jīng)大幅降低。年輕人可以把AI當(dāng)作一個(gè)強(qiáng)大的“越獄”編程工具，利用其更高級(jí)的模型能力去創(chuàng)作圖像、創(chuàng)造Agent。大家不應(yīng)局限于過(guò)去對(duì)模型的認(rèn)知，而應(yīng)將AI視為一個(gè)全能型的工具集，以更激進(jìn)的態(tài)度去重新學(xué)習(xí)和接受它，從而更好地發(fā)揮其作用。

王興興的觀點(diǎn)無(wú)疑給AI領(lǐng)域的從業(yè)者和研究者敲響了警鐘，也為未來(lái)AI的發(fā)展方向提供了新的思考角度。在AI大模型飛速發(fā)展的今天，我們不能僅僅被其在文字和圖像等領(lǐng)域的輝煌成就所迷惑，更要正視其在實(shí)際應(yīng)用，尤其是讓AI“干活”方面存在的不足。只有解決好數(shù)據(jù)和模型等層面的問(wèn)題，AI才能真正從“紙上談兵”走向“身體力行”，實(shí)現(xiàn)與各行業(yè)的深度融合，為人類(lèi)社會(huì)帶來(lái)更多的變革和進(jìn)步。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.