在2025外灘大會(huì)上,竟然毫不客氣,指出了目前AI的巨大缺陷:“現(xiàn)在的AI大模型,雖然在文字和圖像領(lǐng)域已經(jīng)取得了令人矚目的成就,甚至比99.99%的人都做得更好。但讓AI真正‘干活’的領(lǐng)域,還處于‘荒漠’階段?!?/p>
王興興認(rèn)為,當(dāng)前具身智能發(fā)展在高質(zhì)量數(shù)據(jù)以及模型算法層面仍然存在諸多挑戰(zhàn)。在數(shù)據(jù)層面,數(shù)據(jù)采集和質(zhì)量問(wèn)題較為突出。比如,對(duì)于機(jī)器人而言,優(yōu)質(zhì)數(shù)據(jù)該如何采集,采集的規(guī)模和標(biāo)準(zhǔn)是什么,都還處于相對(duì)模糊的階段。同時(shí),數(shù)據(jù)利用率的提升也是一大難題。數(shù)據(jù)噪聲的干擾,使得真正能夠被有效利用的數(shù)據(jù)占比不高,這就導(dǎo)致模型在學(xué)習(xí)過(guò)程中無(wú)法充分發(fā)揮其潛力。
在模型層面,當(dāng)前多模態(tài)數(shù)據(jù)的融合并不理想。雖然純語(yǔ)言模型或純視頻模型的效果已經(jīng)可圈可點(diǎn),但要將語(yǔ)言和圖像等多模態(tài)數(shù)據(jù)進(jìn)行完美融合,仍然困難重重。以機(jī)器人控制為例,模型與機(jī)器人的控制模態(tài)對(duì)齊存在很大挑戰(zhàn)。比如想通過(guò)視頻生成讓機(jī)器人學(xué)習(xí)做家務(wù),單純的視頻生成或許已經(jīng)有不錯(cuò)的效果,但要讓生成的內(nèi)容與機(jī)器人的控制模態(tài)精準(zhǔn)對(duì)齊,讓機(jī)器人能夠按照指令精確地完成家務(wù)動(dòng)作,目前還很難實(shí)現(xiàn)。再如控制機(jī)器人的靈巧手,AI模型難以很好地讓其完成除簡(jiǎn)單抓取之外的更復(fù)雜、更精細(xì)的動(dòng)作。
不過(guò),王興興對(duì)AI的未來(lái)發(fā)展依舊充滿信心。他表示,現(xiàn)階段機(jī)器人硬件其實(shí)完全夠用,AI時(shí)代對(duì)于年輕人來(lái)說(shuō)是一個(gè)非常公平的時(shí)代,創(chuàng)新創(chuàng)業(yè)的門(mén)檻已經(jīng)大幅降低。年輕人可以把AI當(dāng)作一個(gè)強(qiáng)大的“越獄”編程工具,利用其更高級(jí)的模型能力去創(chuàng)作圖像、創(chuàng)造Agent。大家不應(yīng)局限于過(guò)去對(duì)模型的認(rèn)知,而應(yīng)將AI視為一個(gè)全能型的工具集,以更激進(jìn)的態(tài)度去重新學(xué)習(xí)和接受它,從而更好地發(fā)揮其作用。
王興興的觀點(diǎn)無(wú)疑給AI領(lǐng)域的從業(yè)者和研究者敲響了警鐘,也為未來(lái)AI的發(fā)展方向提供了新的思考角度。在AI大模型飛速發(fā)展的今天,我們不能僅僅被其在文字和圖像等領(lǐng)域的輝煌成就所迷惑,更要正視其在實(shí)際應(yīng)用,尤其是讓AI“干活”方面存在的不足。只有解決好數(shù)據(jù)和模型等層面的問(wèn)題,AI才能真正從“紙上談兵”走向“身體力行”,實(shí)現(xiàn)與各行業(yè)的深度融合,為人類(lèi)社會(huì)帶來(lái)更多的變革和進(jìn)步。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.