元戎啟行創(chuàng)始人、CEO周光
國內(nèi)VLA模型已開始“上車”。
8月26日消息,筆者獲悉,AI公司元戎啟行今天在深圳發(fā)布全新一代輔助駕駛平臺——DeepRoute IO 2.0,該平臺搭載自研的VLA(Vision-Language-Action)模型。
區(qū)別于傳統(tǒng)AI,VLA模型融合視覺感知、語義理解與動作決策三大核心能力,并集成思維鏈(CoT),對比傳統(tǒng)端到端模型,VLA模型更擅長應對復雜路況,在安全性、舒適性方面呈現(xiàn)斷代式突破。
元戎啟行表示,DeepRoute IO 2.0平臺以“多模態(tài)+多芯片+多車型”適配為核心設計理念,支持激光雷達與純視覺版本,可面向多種主流乘用車平臺開展定制化部署。截至目前,基于DeepRoute IO 2.0平臺,元戎啟行已達成5個定點合作項目,首批量產(chǎn)車即將進入市場。
“當語言模型與輔助駕駛相遇,一切都變得簡單了。VLA模型成為最優(yōu)解?!痹謫⑿蠧EO周光在會上表示,此次DeepRoute IO 2.0平臺的發(fā)布,是元戎啟行技術發(fā)展的里程碑,也意味著未來智能駕駛將走向大模型時代。
周光進一步表示,公司在量產(chǎn)商業(yè)化方面已獲得超過10款車型的定點合作,并實現(xiàn)近10萬輛具備城市領航輔助系統(tǒng)的量產(chǎn)車型交付,在行業(yè)處于第一梯隊。下一步,元戎啟行將發(fā)力AGl in Robotics(機器人中的AGl),讓VLA模型從道路場景走向物理世界的AGI。
會后媒體群訪中,周光向筆者表示,當前VLA模型的核心成本是AI芯片。而芯片主要取決于制程工藝和投資多少資金,以及適配成本、時間成本、經(jīng)濟成本、數(shù)據(jù)成本等。他認為,未來15萬元以上的車都可以應用VLA模型,隨著成本優(yōu)化有可能實現(xiàn)更多汽車適配。
周光強調(diào),元戎啟行的VLA模型主要為汽車打造,不會有專門數(shù)據(jù)(用于機器人),但當前其VLA模型可以對運動機器人做到很好地適配和泛化能力,所以他認為未來模型架構(gòu)會自然而然擁有通用能力。
據(jù)悉,創(chuàng)立于2019年的元戎啟行,是較早將 AI 技術引入自動駕駛行業(yè)的企業(yè)之一,致力于打造“物理世界的通用人工智能(AGI)”,推出不依賴高精度地圖、應用端到端模型的量產(chǎn)方案,以及最新一代融合視覺、語言、動作等多種模態(tài)的VLA模型,以創(chuàng)新技術打造AI司機,實現(xiàn)RoadAGI,引領AI行業(yè)變革。
公開信息顯示,元戎啟行CEO周光畢業(yè)于清華大學基礎科學班,曾加入清華大學高能物理研究中心、德州儀器Kilby實驗室主導自動駕駛機器人項目等。2016年,周光加入百度美國研究院自動駕駛事業(yè)部,2019年回國創(chuàng)立了元戎啟行。
截至目前,元戎啟行集團總?cè)藬?shù)超1000人,研發(fā)人員占比達84%。
融資方面,元戎啟行已完成6輪融資,累計融資金額超過5億美元(約合人民幣35.7億元),投資方包括阿里巴巴、復星銳正、云啟資本、耀途資本等。2024年11月6日,元戎啟行宣布完成1億美元C1輪戰(zhàn)略融資,由國內(nèi)頭部主機廠(長城)獨家投資。
商業(yè)化層面,元戎啟行已與多家車企達成量產(chǎn)合作,共同推進十余款組合輔助駕駛汽車落地。預計到2025年,將有超過20萬輛搭載元戎啟行組合輔助駕駛方案的車輛進入消費者市場。
技術層面,元戎啟行的VLA模型融合了語言模型,具備強大的思維鏈能力,能擺脫傳統(tǒng)端到端模型的黑盒難題,并將信息串聯(lián)、分析,從而推理出因果關系。同時,它天然集成海量知識庫,泛化能力更強,能夠更好地適應復雜多變的真實道路環(huán)境。
周光表示,當前整個輔助駕駛行業(yè)依然面臨比較大的挑戰(zhàn),尤其隨著輔助駕駛方案上車量級逐年增加,可能對于產(chǎn)品體系也有更多要求,所以“真的要用最敬畏的心去做”這個行業(yè),而非類似做機器狗站起來就可以了。對于行業(yè)來說,當前處于增量階段。此外,他認為可能需要良性競爭,這也是行業(yè)發(fā)展比較關鍵的一個因素。
“安全放在第一位,讓AI學會害怕?!敝芄庵赋?,公司會把輔助駕駛安全放在第一位,持續(xù)推進防御性駕駛。未來,元戎啟行將圍繞VLA模型持續(xù)拓展應用邊界,在乘用車市場加速量產(chǎn)部署的同時,推進基于量產(chǎn)車平臺的Robotaxi業(yè)務。在更廣闊的Road AGI體系中,VLA模型也將向更多可移動智能體延展復用,逐步實現(xiàn)從單點功能到通用智能體的系統(tǒng)演進。
對于L4和L5發(fā)展方向,周光表示已經(jīng)在規(guī)劃,但會采用與特斯拉一樣的 AI 大模型路徑解決L4/L5面臨的問題,而不是用Waymo路徑和方式,靠規(guī)則和CNN等方式解決自動駕駛問題。
“其實關于自動駕駛的定義真的非常老了,已經(jīng)有30多年歷史了,它是AI產(chǎn)生之前的定義,其實我覺得(當前)并不是特別契合,L4跟L5的區(qū)別就在于,一個有圖,一個全部(自動)都能開,所以你看現(xiàn)在 AI 發(fā)展里面完全沒有這些概念?!敝芄夥Q,當前,自動駕駛技術工作才剛剛開始,發(fā)展過程需要一些時間。
展望未來,周光表示,真正的自動駕駛離不開大模型,我們一定會全面走向基于GPT架構(gòu)的端到端模型。而且,利用強化學習、VLA等技術,大模型已經(jīng)從弱專家系統(tǒng)、通才系統(tǒng),走向強專家系統(tǒng)。
“我們會全力推進我們的量產(chǎn),而且把VLA技術放在對應領域,如Robotaxi、C端(乘用車)領域等。未來,我們還將把VLA模型運用到所有可移動物體上,實現(xiàn)物理AGI?!敝芄鈴娬{(diào),他預測第一個能夠達到10萬級、百萬級的機器人,一定是車。
(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.