智能化競(jìng)爭(zhēng)的下半場(chǎng),輔助駕駛作為兵家必爭(zhēng)之地,不同的技術(shù)路線相互競(jìng)逐。去年末,由特斯拉率先引入的“端到端”模型直接推動(dòng)智能駕駛進(jìn)入AI大模型時(shí)代。而現(xiàn)在,理想汽車有望憑借VLA司機(jī)大模型掀起新一輪的智駕風(fēng)潮。
VLA司機(jī),簡(jiǎn)而言之就是讓AI成為“私人司機(jī)”。隨著理想首款純電SUV i8的上市交付,基于理想VLA司機(jī)大模型的下一代輔助駕駛技術(shù)也將同步升級(jí)至所有AD Max(Thor-U平臺(tái)和Orin-X平臺(tái))。
VLA司機(jī)大模型也是理想汽車如今作為自研輔助駕駛引領(lǐng)者的又一創(chuàng)新落地。毫無(wú)疑問(wèn),它滿足了當(dāng)前的用戶價(jià)值。據(jù)麥肯錫公布的報(bào)告顯示,2024年超半數(shù)中國(guó)消費(fèi)者購(gòu)車時(shí)會(huì)考慮車輛的智能化程度。
一如既往,理想汽車不為技術(shù)而技術(shù),每一次的創(chuàng)新與迭代如理想汽車CEO李想本人所言都是“為了解決問(wèn)題”。就像理想決定先于純電推出的增程技術(shù),是為了解決電池成本高、用戶充電難的問(wèn)題;推出5C超充,是為了解決充電慢、用戶等待時(shí)間長(zhǎng)的問(wèn)題。
在輔助駕駛技術(shù)層面上,理想汽車希望輔助駕駛能與人類駕駛表現(xiàn)對(duì)齊,增加用戶使用輔助駕駛功能時(shí)的安全感。
在全量推送“端到端+VLM”不到一年的時(shí)間里,理想先于一眾車企又推出了VLA司機(jī)大模型。持續(xù)進(jìn)化的背后依然是理想對(duì)“用戶體驗(yàn)”的堅(jiān)持。“(理想)首先讓之前用過(guò)理想輔助駕駛的老用戶有個(gè)非常好的體驗(yàn)升級(jí),其次也希望有更多沒(méi)有用過(guò)的用戶一上來(lái)就會(huì)對(duì)輔助駕駛有很好的感受和新鮮感?!崩硐肫囎詣?dòng)駕駛研發(fā)高級(jí)副總裁郎咸朋博士表示。
理想輔助駕駛技術(shù)持續(xù)進(jìn)化,VLA司機(jī)大模型可真正實(shí)現(xiàn)像人一樣思考
理想汽車自2021年起自研輔助駕駛,從最早的2D、3D感知開(kāi)始研發(fā),到BEV(鳥(niǎo)瞰圖)、NPN(先驗(yàn)網(wǎng)絡(luò))、無(wú)圖,再到“端到端+VLM”雙系統(tǒng)架構(gòu)和如今的VLA司機(jī)大模型,一步一個(gè)腳印地完成了技術(shù)儲(chǔ)備。
其中,“端到端+VLM”被視為區(qū)分智駕技術(shù)的分水嶺。在此之前,NPN輕圖、無(wú)圖均是人工時(shí)代的技術(shù),而人工時(shí)代的最大特點(diǎn)是“規(guī)則算法”,需要工程師設(shè)計(jì)算法并編寫(xiě)程序,因此提升輔助駕駛性能依賴于工程師的能力和經(jīng)驗(yàn)。
然而,從“端到端+VLM”開(kāi)始,車企不再用傳統(tǒng)的方式做,“端到端+VLM”架構(gòu)的本質(zhì)是模仿學(xué)習(xí),指的是用人類駕駛數(shù)據(jù)訓(xùn)練模型,數(shù)據(jù)數(shù)量和質(zhì)量決定性能。
不過(guò),在自研“端到端+VLM”方案的過(guò)程中,理想又發(fā)現(xiàn)端到端在訓(xùn)練過(guò)程中遇到了性能增長(zhǎng)放緩的瓶頸,因此又推出了VLA司機(jī)大模型。VLA不是簡(jiǎn)單地將端到端模型和VLM模型結(jié)合在一起。VLA司機(jī)大模型的本質(zhì)是強(qiáng)化學(xué)習(xí),具備自主思考的能力,用生成數(shù)據(jù)結(jié)合仿真環(huán)境訓(xùn)練模型,性能則由仿真迭代的效率決定。
需要指出的是,VLA司機(jī)大模型的誕生不只是為了解決性能方面的挑戰(zhàn)。理想汽車董事長(zhǎng)兼CEO李想曾表示:“端到端模型像猴子開(kāi)車,它能夠?qū)W習(xí)人類行為,但并不理解物理世界。因此也無(wú)法根據(jù)場(chǎng)景做出預(yù)防性判斷?!?/p>
這些掣制到了VLA司機(jī)大模型階段將不復(fù)存在。由VLA司機(jī)大模型賦能的車具備了感知、思考和適應(yīng)環(huán)境的能力,從而真正實(shí)現(xiàn)像人一樣思考的智駕:能夠聽(tīng)得懂、看得見(jiàn)、找得到。
具體來(lái)說(shuō),用戶現(xiàn)在可以通過(guò)語(yǔ)音指令改變車輛的路線和行為,比如直接跟理想同學(xué)說(shuō)“開(kāi)太快了”、“應(yīng)該走左邊這條路”等,車輛能夠理解并執(zhí)行這些指令;再比如如果用戶在商場(chǎng)地庫(kù)找不到車位時(shí),可以跟理想同學(xué)說(shuō)“找個(gè)車位停好”,車輛便可以自主尋找到車位,整個(gè)過(guò)程不依賴地圖或?qū)Ш叫畔ⅲ康氖撬鼘?duì)空間的理解和邏輯推理能力。
VLA司機(jī)大模型重塑用戶體驗(yàn),舒適度與安全感是重要考量指標(biāo)
如前所述,VLA賦能的車輛將使其成為一個(gè)更好的“私人司機(jī)”。與此同時(shí),理想認(rèn)為就現(xiàn)階段而言,在輔助駕駛的用戶體驗(yàn)上,比起使用效率,他們更追求的是安全感和舒適度。“比如走錯(cuò)路,雖然效率有所損失,但我們不會(huì)通過(guò)一些危險(xiǎn)的動(dòng)作立刻糾正,還是要在安全和舒適的基礎(chǔ)上追求效率。效率是排在安全和舒適之后的?!崩上膛蠓Q,“這是我們現(xiàn)在想做的事?!?/p>
近年來(lái),隨著智駕能力的提升,其下限低的弊端也隨之暴露。當(dāng)智駕行為與人的駕駛行為不相符時(shí),用戶容易產(chǎn)生不安全的感覺(jué)。VLA司機(jī)大模型上車之后,因其具備思維能力以及自主學(xué)習(xí)能力,或?qū)⒃黾佑脩魬?yīng)對(duì)極端場(chǎng)景的信心。
據(jù)悉,理想車主的人駕數(shù)據(jù)是60萬(wàn)公里左右出一次事故,而在使用輔助駕駛功能的情況下是350到400萬(wàn)公里發(fā)生一次事故?!暗鹊絍LA模型提升后,我們希望在輔助駕駛功能下能做到600萬(wàn)公里(人類駕駛的10倍)才出一次事故?!崩上膛蟊硎??!俺税踩灾?,我們重點(diǎn)提升了行車舒適度。如果體驗(yàn)了理想i8的輔助駕駛功能,會(huì)體驗(yàn)到舒適度比之前的版本有很大的提升。”
VLA作為i8的核心賣點(diǎn)之一,有望成為用戶購(gòu)買(mǎi)i8的一個(gè)重要因素。從理想官方公布的輔助駕駛相關(guān)數(shù)據(jù)可以看出,理想輔助駕駛不再是用戶購(gòu)買(mǎi)決策中的弱勢(shì)項(xiàng),而是驅(qū)動(dòng)品牌銷量增長(zhǎng)的重要因素。截至2025年上半年,理想汽車的輔助駕駛試駕率已超過(guò)80%,試駕滿意度達(dá)到92%,用戶試駕占比連續(xù)10個(gè)月攀升。
“我認(rèn)為有了VLA模型的加持,輔助駕駛會(huì)往更好的,一個(gè)移動(dòng)空間的思路去發(fā)展。這個(gè)車能在安心、安全的基礎(chǔ)上,幫你去做其他的事情,我相信那天很快就會(huì)到來(lái)?!崩上膛笳f(shuō)。
理想AllinAI,VLA不只用于智駕,有望賦能更多行業(yè)
李想在兩次AI Talk采訪中均表明了理想汽車要“成為一家全球領(lǐng)先的人工智能企業(yè)”的決心。為此,理想汽車在內(nèi)部也成立了四支AI團(tuán)隊(duì),并且研發(fā)投入近一半都投在了人工智能。又經(jīng)過(guò)長(zhǎng)時(shí)間的調(diào)研和探索之后,理想團(tuán)隊(duì)明確將VLA作為其長(zhǎng)期的技術(shù)方向。理想汽車認(rèn)為VLA與人類思維和思考能力是相似的,是最有可能實(shí)現(xiàn)L4級(jí)別的架構(gòu)。
在i8上首發(fā)的VLA模型是理想第一版能上路的產(chǎn)品。不可否認(rèn),在某些長(zhǎng)尾工況下,VLA仍存在不符合人類價(jià)值觀的問(wèn)題。為了讓VLA模型在絕大多數(shù)場(chǎng)景下都能實(shí)現(xiàn)更接近人類的駕駛水平,需要企業(yè)有更好的數(shù)據(jù)、算力、工程部署支撐。
得益于銷量增長(zhǎng),截至2025年7月,理想已經(jīng)累計(jì)12億公里的有效數(shù)據(jù)。12億公里數(shù)據(jù)確保了場(chǎng)景多樣性,再配合仿真環(huán)境來(lái)進(jìn)行強(qiáng)化訓(xùn)練,理想將持續(xù)提升VLA體驗(yàn)。與此同時(shí),理想所擁有的領(lǐng)先的工程落地能力也將支撐其VLA模型的快速迭代。自理想2021年開(kāi)始自研智駕至今為止五年的時(shí)間里,其硬件平臺(tái)已經(jīng)從最初的基于地平線雙J3芯片的硬件平臺(tái),升級(jí)到現(xiàn)在基于Thor-U芯片和地平線J6M芯片的硬件平臺(tái)。
值得一提的是,VLA技術(shù)方案,并不是只適用于輔助駕駛相關(guān),因?yàn)樗募軜?gòu)思路來(lái)源于機(jī)器人和具身智能領(lǐng)域。理想認(rèn)為,VLA也是未來(lái)機(jī)器人領(lǐng)域的通用技術(shù)框架。某種程度上看,自動(dòng)駕駛也是一個(gè)機(jī)器人,是帶了四個(gè)輪子的自主行駛的機(jī)器人?!癡LA架構(gòu)會(huì)延續(xù)到機(jī)器人繁榮之后,才可能被其他技術(shù)替代。它的技術(shù)潛力非常大,也更像人類的智能發(fā)展規(guī)律?!崩上膛蟊硎?,“VLA成功整合了空間智能、語(yǔ)言智能和行為智能,一旦跑通物理世界和數(shù)字世界結(jié)合的范式后,將有望賦能多個(gè)行業(yè)協(xié)同發(fā)展。”
眾所周知,李想堅(jiān)定地將AI視為未來(lái)所有業(yè)務(wù)的基石。其中,算法、算力、數(shù)據(jù)都是做好人工智能的前提。而基礎(chǔ)訓(xùn)練算力和推理算力的支撐則需要大量的資金支持。理想有錢(qián),如今他們手握超1000億現(xiàn)金。同樣重要的是,在抵達(dá)那個(gè)終極目的地之前,理想團(tuán)隊(duì)仍將保持著對(duì)前沿算法的探索,堅(jiān)守他們所相信的,對(duì)抗捷徑。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.