作者:高飛
在杭州云棲小鎮(zhèn)的會場,今年云棲大會,無論是會場外的天氣熱度,和會場內的人群熱度,都達到了一個相當高的程度。
每一個我遇見的新老朋友都會說,今年大家對AI的關注度明顯提高了,討論的問題也都非常的實際。
而我這次對大會的關注點,是汽車。因為這個產業(yè),是觀察AI未來發(fā)展脈絡一個非常好的切入點。
在云棲大會的汽車峰會開場詞里,有這樣一段話:
1886年,卡爾本茨發(fā)明了第一輛汽車。人類突破了肌肉的限制。139年后的今天,我們正在突破認知(智能)的邊界。汽車成為了移動的計算平臺,駕駛成為了人機協(xié)作的藝術,速度由數(shù)據(jù)的流轉效率重新定義物理,實現(xiàn)擁抱數(shù)字智能,數(shù)字智能融入實體產業(yè),汽車恰好站在這個交匯點上,成為虛實融合的最佳載體。
我的理解是:如果說大模型的上半場是以互聯(lián)網大數(shù)據(jù)預訓練為代表的數(shù)字AI;而下半場,是以機器人、世界模型等為代表的物理AI。
汽車可能正好處于兩者之間的分水嶺上,承上啟下。重要性如何形容都不為過。
不過,分量既然重,難度系數(shù)也高。
一方面,是面向汽車智能化,所需要的資金資源,都在指數(shù)級增長;另一方面,消費者雖然喜歡中國車企所創(chuàng)造的智能體驗,但要真金白銀買單,或許還不到火候。
汽車的“卷”字,大概也就從中而來。這是一個投入和收益的剪刀差時刻。
此情此景之下,汽車產業(yè)成員在思考什么?阿里云,作為一個云和AI的基礎設施提供者,有什么解決之道?就特別值得探究。
一、當汽車學會"看"與"想"
智能駕駛,無疑是汽車智能化下半場最激昂的旋律。
因為無論將其推向L4、L5有多難,其不是選修課,而是決定一家車企生死的必修課,是不爭的事實,這也是所有我這次云棲大會期間所訪談的汽車人士的共識。
而談到智能駕駛,又必然談到VLA。
云棲大會汽車峰會的圓桌討論環(huán)節(jié),元戎啟行創(chuàng)始人兼CEO周光說了一句讓人深思的話:"自動駕駛分級的定義太早了,是30年前的定義。當時定義L4就是基于高精度地圖、基于SLAM的定義,有個地圖能在里面跑就叫L4。"
這個觀察切中要害。30年前,當美國汽車工程師學會(SAE)制定智能駕駛分級標準時,人工智能還處于"專家系統(tǒng)"時代。那時的工程師們想象的智能駕駛,是一臺遵循預設規(guī)則的精密機器——如果看到紅燈就停車,如果前方有障礙物就繞行,如果車道線向左彎就轉動方向盤。
VLA的出現(xiàn),改變了游戲規(guī)則。
VLA(Vision-Language-Action)是一種新一代AI架構,它不僅能“看懂”圖像、“讀懂”語言,還能基于理解直接驅動決策與動作,被視為大模型從“會說”走向“會做”的關鍵拐點。
理想汽車自動駕駛研發(fā)高級副總裁郎咸朋在圓桌上分享了一個生動的案例:"有用戶發(fā)了個'十連繞'場景的視頻——經過施工路段,隔一段就有井蓋或路障,車輛繞來繞去都成功通過。用戶第一天繞了不信,但第二天又試,還是能繞過去。"
他特別強調:"我們并沒有定義'連續(xù)繞十次井蓋'這個場景。這就是能力涌現(xiàn),我們做的是能力而不是功能。"
所謂能力與功能的區(qū)別,我想就像音樂家與音樂盒的區(qū)別。音樂盒只能播放固定的曲目,每個音符都是預設的;而音樂家理解音樂的本質,可以即興創(chuàng)作,可以根據(jù)現(xiàn)場氛圍調整演奏。當自動駕駛從"功能定義"進化到"能力涌現(xiàn)",汽車就從機器進化成了某種新的存在。
廣汽集團自動駕駛首席科學家周寅在圓桌討論中,也從技術層面解釋了VLA為什么如此特別:"VLA利用了VLM(Vision-Language Model)的預訓練,利用互聯(lián)網海量知識讓模型具有常識(common sense)。然后通過自動駕駛數(shù)據(jù)喚醒激活,能夠處理長尾案例,實現(xiàn)零樣本遷移(zero-shot transfer)。"
他列舉了幾個具體的能力涌現(xiàn)案例:"道路施工自動避讓、復雜交通標識識別、潮汐車道處理,以及對紙箱、小動物等未訓練過的物體識別。"
郎咸朋進一步解釋了VLA中"L"(Language)的深層含義:"它并不是大家想象的對話或文字。它背后是人類長時序的思考、邏輯推理能力的體現(xiàn)。有人問我,不會說話的人就沒有思維能力嗎?不是的,他們也會看書、看文字,這些都是人類知識高度濃縮和壓縮的過程,表達了長時間思維能力。"
這個解釋讓我想起了維特根斯坦的名言:"語言的界限就是世界的界限。"當我們給機器賦予語言能力,我們實際上是在擴展它理解世界的邊界。
但這種認知能力的獲得是有代價的,是巨大的代價。
元戎啟行CEO周光直言不諱地談到了智駕成本結構的變化:"以前可能97%是人力成本,算力只占3%;但到了大模型時代,兩個數(shù)字最終可能變成一半一半。"
比例的變化,首先是財務報表上的龐大數(shù)字。其次,它意味著整個產業(yè)的底層邏輯在改變。過去,汽車公司的核心資產是工程師、設計師、產品經理;未來,可能是GPU集群、訓練數(shù)據(jù)、模型參數(shù)。
郎咸朋在圓桌上提供了更具體的數(shù)據(jù):"在云上要做兩件事:一是生成仿真環(huán)境(世界模型),需要大量云端推理算力;二是訓練本身需要算力。世界模型和VLA模型是一主一輔——VLA是要訓練的主模型,世界模型輔助訓練VLA?,F(xiàn)在理想用世界模型生成的數(shù)據(jù)已經占到VLA訓練的10%以上。"
10%聽起來不多,但考慮到汽車每天處理的數(shù)據(jù)量,這個數(shù)字背后是驚人的AI消耗。而且這個比例還在快速增長。
在汽車峰會的主題演講中,阿里云智能集團公共事務副總裁,研究中心主任安筱鵬指出:"能夠參與智能駕駛競爭賽道的基本條件,就是AI規(guī)模的投入。美國已經到了5萬卡、10萬卡級別。"我從另外一個車企得到了一個數(shù)字,10億AI算力投入差不多是入場券。
雖然對阿里云來說,AI算力需求增加是好事,但阿里云的方法論是,AI算力的增加,一定要用在模型訓練的每一分鐘,每一秒,而不是空耗。
因為在大規(guī)模智算集群里,利用率幾乎等于投資回報率。過去車企在AI算力運維上的短板,使得集群常因調度不均、任務不匹配或故障延遲而出現(xiàn)大量閑置資源。
在這方面,阿里云做了大量工作。我們以小鵬汽車為例。根據(jù)之前的一個消息,這個異常搶眼的新勢力車企依托阿里云靈駿智算,打造了國內汽車行業(yè)首個萬卡規(guī)模AI算力集群,AI算力儲備達到10EFLOPS,集群利用率最高可達98%。同時,該集群還具備秒級故障發(fā)現(xiàn)與處置能力,建立了高可用的容災體系。在此基礎上,小鵬汽車“云端模型工廠”的迭代周期平均縮短至5天,大模型迭代效率顯著提升。
把利用率拉升到98%,意味著同樣的硬件能產出幾乎和無優(yōu)化情況翻倍的模型訓練結果。
阿里云智能集團計算平臺事業(yè)部負責人汪軍華在汽車峰會主題演講中,介紹了更多創(chuàng)新:
統(tǒng)一元數(shù)據(jù)管理(DLF)。"數(shù)據(jù)量級達到數(shù)百PB之后,任何備份、流動、處理都帶來大量成本上升。通過DLF統(tǒng)一元數(shù)據(jù)和數(shù)據(jù)存儲,原始數(shù)據(jù)、訓練樣本數(shù)據(jù)、樣本挖掘后的特征數(shù)據(jù),只需要保存一份,大大降低存儲成本。"
MaxFrame分布式計算框架。"MaxFrame可以直接調用第三方模型,對多模態(tài)數(shù)據(jù)進行萬級別的高并發(fā)處理,相比開源框架性能提升40%以上??蛻舭咐@示,從每天7000個數(shù)據(jù)包處理提升到20萬個,資源消耗下降40%,綜合處理效能提升50多倍。"
PAI Turbo X加速包的極致優(yōu)化。這個專門為智能輔助駕駛定制的加速包,帶來了驚人的性能提升:"在BEVFusion訓練中,訓練時間縮短58%;在MapTR訓練中,縮短53%;在UniAD訓練中,縮短50%。"
這些技術細節(jié)可能顯得枯燥,但就像上世紀初的鐵路建設。當所有人都在爭論該運什么貨、去哪里時,總要有人先把鐵軌鋪好。
在峰會開場致辭中,阿里云智能集團公共云事業(yè)部AI汽車行業(yè)總經理李強透露了一個關鍵數(shù)據(jù):"從2024年云棲大會到2025年這一年時間里,超過60%中國智能輔助駕駛的AI算力來自阿里云。"
60%,這意味著中國智能輔助駕駛的"登月計劃",有一半以上的臺階是阿里云搭建的。
當然,我們需要再次強調,雖然VLA增加了大家的投入,但它看起來是必經之路。郎咸朋說:"如果把VLA加強化學習閉環(huán)跑通,會非???,就像'天上一天,地下一年'。所有閉環(huán)強化都在虛擬世界、仿真環(huán)境里做。"
二、從"座艙"到"陪伴"
如果說智能駕駛是關于"如何抵達目的地"的技術革命,那么智能座艙就是關于"如何度過旅程"的思考。
長城汽車技術中心副總經理姜海鵬提出了一個特別有意思的"座艙四段論":"相識、相知、相愛、相伴。"
他詳細解釋了每個階段的含義:"相識——讓AI認識你。現(xiàn)在我可以喚醒小魏同學,但小魏同學不知道我是誰、副駕是誰、后排是誰。相知——學習你的操作習慣、用車習慣。相愛——產生感情,有溫度。相伴——長期陪伴。"
當然,話鋒一轉:"或者相殺。"
"因為人是善變的,"姜海鵬解釋,"當你的變化速度大于智能體學習速度,可能就是相殺的結果。"
這個"相殺"的隱喻觸及了人機關系的本質。它不是主人與工具的關系,而更像是兩個生命體的相處。需要相互理解,共同成長。
如果一方的進化速度遠超另一方,分離幾乎是必然的。那么,如何讓人機互動只相識相知相愛,不相殺?
在和理想汽車空間AI團隊負責人江會星博士的交流中,我也記錄了一些他的心得。
首先:沒有捷徑。
江博透露了一個讓人意外的時間線:"我們在2023年的3月份,就快速的去立項的做自己的大模型。從預訓練、后訓練、強化學習這些全部做了。到了2023年的12月份完全上線用戶。這段時間我們就把所有的該趟的所有的坑都趟了一遍。"
9個月,從零開始到全面上線。這種速度背后,是理想對AI的戰(zhàn)略決心。
在專訪中,江博還分享了理想內部的AI文化:"我們內部每周都會有AI周會。大家會對于最前沿的AI的一些包括洞察,包括具體的實踐,都會拿在那會上去分享。"
其次,是細節(jié)的藝術:一個功能背后的100次打磨。
江博說,大家都說理想的座艙體驗好:“這個體驗的背后,坦率講是慢工出細活。每一個體驗一點點摳,一點點做出來?!?/p>
他舉了一個具體的例子:
理想汽車在處理乘客說有點冷時,并不是簡單下調溫度,而是依賴大模型與多模態(tài)感知來理解場景。
語音識別系統(tǒng)會結合車內傳感器(溫度、座椅占用、紅外檢測等),判斷乘客身份、所在位置和當前環(huán)境,再通過自研大模型解析出更細的意圖,比如需要調節(jié)空調風量、局部溫度,還是開啟座椅加熱。這種方式避免了機械式的“一刀切”,而是做出針對性的組合響應。
江博補充道:"我們每周都有數(shù)據(jù)閉環(huán)的會,每周都會從里面去看用戶反饋的問題,我們及時去在下一版本就給它迭代上去了。"
這種產品打磨方式,"不是一個技術細節(jié),有點像互聯(lián)網產品",需要"大量的工程性的東西"。
這也讓我想到,無論是理想汽車,還是阿里云,它們都有一個共同的特點,就是都有互聯(lián)網、移動互聯(lián)網的經驗。
由于我是一個微博AI博主,經??吹叫畔⒘魃嫌幸粋€說法:互聯(lián)網產品經理們喜歡開理想,大家就是感受到了產品的細膩吧。
當然,智能座艙的完美體驗,也需要云與車,或者說云與端的配合。
阿里云智能集團公共云事業(yè)部AI汽車行業(yè)解決方案總經理霍健詳細解釋了智能座艙的技術架構:"我們認為智能座艙的技術趨勢之一是大模型的端云協(xié)同架構。端側大模型與云端大模型的分工是核心關鍵。"
還以乘客有點冷來說明這種分工:"處理這個操作,車端MindGPT首先要完成環(huán)境感知和理解:誰在說話,車內溫度,空氣質量,以及當前的車速等情況。然后結合前面的說話內容,以及全信息記憶里對用戶的記憶,推理出用戶的真實意圖。"
"云端會首先進行記憶召回,找到'他'過去對溫度的偏好,提供給車端結合車外溫度,車內溫度,溫度偏好做執(zhí)行。"
這種端云協(xié)同的設計,既保證了響應速度(端側處理),又確保了智能的深度(云端推理)。就像一個優(yōu)秀的管家,既能快速響應你的需求,又能記住你所有的偏好。
為了支撐這種體驗,阿里云推出了專門為汽車場景定制的通義Omni模型。李強在峰會開場致辭中詳細介紹:"這是一個'三進兩出'的架構設計——三種輸入:語音、視覺、文本;兩種輸出:語音、文本。延時低至0.5秒,到11月份將支持超過20種語言的語音交互。"
不過,還有一個很小的插曲,由于充滿信息量,我也記錄如下。
在汽車峰會圓桌討論中,姜海鵬坦率地指出了艙駕融合面臨的一個現(xiàn)實挑戰(zhàn):"智能駕駛在企業(yè)里的重要度高于座艙?!?/p>
他進一步解釋:"技術沒問題時,組織就成了最大問題。未來一定會把AI算力做到一起,因為座艙和智能駕駛對大模型的需求越來越趨同。座艙的演變跟兩三年前的智能駕駛完全一樣,從規(guī)則驅動到數(shù)據(jù)驅動,從CNN到端到端再到VLA。"
蔚來汽車副總裁吳杰在圓桌上補充了一個有趣的視角:"以前開車的司機(智能駕駛)和助手(智艙)之間沒什么關系,涇渭分明,最多時不時爭寵,搶算力?,F(xiàn)在有了VLA,底層技術在趨同,從原先的算力分享,變成可能的模型共享。"
三、出海的"異鄉(xiāng)人",全球舞臺上的中國聲音
我們前兩章是關于技術和產品的進化,但這個部分就要談談市場了,海外市場。
如果說VLA、云端協(xié)同是大家對智能駕駛、智能座艙的共識,那么出海,就是大家對中國車企市場拓展方向的共識。
李強在汽車峰會的開場致辭中透露了一個驚人的數(shù)據(jù):“95%的中國車企在出海時選擇了阿里云?!?/strong>
在云棲大會期間,我與阿里云智能集團公共云事業(yè)部AI汽車行業(yè)解決方案架構師黃華杰做了交流,專門談出海這個議題。
黃華杰是汽車行業(yè)老兵,曾在東風汽車工作六七年,2021年加入阿里云后一直專注汽車行業(yè),主要負責出海和智能化板塊。
黃華杰分享了一個特別有意思的"反常識"。
"客戶一般會認為在海外用阿里云不那么容易合規(guī),用海外云會更加合規(guī)。"他說,"但事實不是這樣。"
他提供了具體的數(shù)據(jù)支撐:"我們有130項國際安全合規(guī)資質。2018年就通過了GDPR合規(guī)認證。"
這種"反常識"背后,是對合規(guī)的深度理解和長期投入。"更重要的是服務經驗的積累。"像阿里巴巴電商、菜鳥物流、螞蟻支付,和眾多消費電子企業(yè),這些內外部客戶比汽車更早出海。我們在這些案例中沉淀的經驗,可以反復跟車企的業(yè)務部門、IT部門、法務部門、采購部門去講。"
黃華杰解釋了這種選擇的深層邏輯:"中企出海,特別是汽車這種復雜的業(yè)務系統(tǒng),需要的不只是云服務,更需要深度的業(yè)務理解和貼身的技術支持。"
他分享了服務某車企客戶的一個細節(jié):"我們當時大概花了三個月的時間做業(yè)務調研,把16個子系統(tǒng)加4個大數(shù)據(jù)平臺,每一個子系統(tǒng)的技術架構都畫得很清楚,整個子系統(tǒng)之間的關聯(lián)都梳理得很清楚。"
這種深度服務,他說是一些友商很難提供的。不是技術不行,而是文化理解和服務意愿的差異。
我問他,貼身服務是不是成本很高,商業(yè)模式如何成立?黃華杰卻講:"我們產品在幫客戶做定制優(yōu)化,但會提煉出通用的東西,反哺產品演進。","阿里云的多模態(tài)數(shù)據(jù)庫Lindorm,云原生中間件、日志服務SLS等產品,很多都是在跟客戶場景共創(chuàng)中不斷迭代演進的。"
四、One more thing:AI Rocks
本來講到這里,關于云棲大會的AI汽車故事,我們已經可以收尾了,但由于今年云棲大會的熱度,我們不升華一下似乎不合適。
2001年有一部老電影《北京樂與路》,主題是搖滾人生。
電影里,吳彥祖飾演的香港音樂人Michael因故滯留北京,遇到了耿樂飾演的搖滾樂隊主唱平路。一個來自商業(yè)音樂體系成熟的香港,習慣了唱片公司的運作規(guī)則;一個扎根于北京地下音樂場景,在破舊的排練室里尋找真正的搖滾精神。電影的英文名"Beijing Rocks"一語雙關,既是"搖滾的新姿態(tài)",也暗示著"城市的新脈動"。
電影里有一句臺詞特別動人:"我想到光的深處,那里有風么?"
這是對未知的追問,對夢想的向往。即使不知道標準答案,依然要去追尋。
今天的汽車產業(yè),也在追問自己的"光的深處"。
當理想汽車說要做"家",他們追問的是:車能否成為家的延伸?
當廣汽談論VLA的能力涌現(xiàn),他們追問的是:機器能否真正理解世界?
當一汽描繪3萬個業(yè)務神經元,他們追問的是:企業(yè)能否成為一個有機生命體?
當比亞迪足跡遍布全球110多個國家和地區(qū),他們追問的是:中國智造能否定義全球標準?
這些追問沒有標準答案,但追問本身就是意義。就像平路他們的音樂,超越了商業(yè)的成功,奔向了創(chuàng)造的快樂。
云棲大會汽車峰會上,阿里云智能集團公共云事業(yè)部AI汽車行業(yè)總經理李強分享了三個深刻的觀察,恰好回應了這種追問。
"第一,AI基礎設施不是一夜之間產生的。"李強說,"它是從過去通用算力時代的所有積累、所有技術沉淀,到今天被AI以十倍甚至百倍的能量重新迸發(fā)。IT人在過去被企業(yè)重視,但今天被高層更加關注,因為在AI時代,所有的投資將會以十倍甚至百倍的速度增長。"
這是技術演進的必然——每一次革命都建立在前一次的基礎上,但當質變發(fā)生時,能量是指數(shù)級釋放的。
"第二,越來越多的主機廠選擇了自研加合作共同前進的道路。"李強觀察到,"他們的思考很樸素:一是做兜底工作,二是探索未來,做差異化價值。"
這種選擇背后,是中國車企的成熟——既不盲目依賴,也不閉門造車,而是在開放與自主之間找到平衡。
"第三,全球車企都在和大模型公司深度共創(chuàng),這是必然路徑。"
這三個觀察勾勒出一幅圖景:汽車產業(yè)正在經歷一場從基礎設施到研發(fā)模式,再到生態(tài)合作的全面重構。
李強還分享了一個讓人深思的細節(jié):"我的很多小伙伴做了非常多努力,他們雖然辛苦,但和我一樣很幸福。為什么幸福?因為被需要。"
"被需要"——這三個字道出了阿里云在這場變革中的價值。
他們不造車,但60%中國智能輔助駕駛的AI算力來自阿里云。
他們不開發(fā)座艙,但通義大模型讓很多座艙有了"靈魂"。
很遺憾,我們的排比句要到此為止了。因為阿里真是原生外貿專家,現(xiàn)在也在讓95%的中國車企順利出海。
IDC數(shù)據(jù)顯示,2025年H1阿里云汽車行業(yè)公共云基礎設施增長實現(xiàn)132%的增長。但比數(shù)字更重要的,是這種增長背后的意義——它意味著中國汽車產業(yè)的智能化進程正在加速,意味著越來越多的企業(yè)選擇了相信和合作。
李強特別提到:"如果我們汽車產業(yè)的車賣到全球,我們的模型會陪伴我們的車走向世界各地。"這個"陪伴",不是技術參數(shù)的堆砌,而是一種承諾。
汽車,這個第二次工業(yè)革命的標志性產物,在第四次工業(yè)革命中再次獲得新生。從福特流水線上的標準化產品,變成一個會思考、會感知、會陪伴的智能體。
在這個歷史進程中,每個參與者都在尋找自己的節(jié)奏。車企在尋找智能化的突破口,技術公司在尋找落地的場景,而阿里云找到的,是成為這場變革的基礎設施——不張揚,但不可或缺。
正如李強所說,云和計算是兩件事:云像電網,計算像電力。阿里云要做的,就是這個時代的電網——讓每一份算力都能被需要它的人使用,讓每一個創(chuàng)新都有堅實的基礎。
阿里云全棧AI云,在這個過程中,支撐著中國車企智能化落地和全球化布局。
這或許就是"光的深處"的答案——不是某個具體的技術突破,也不是某個單一的商業(yè)成功,而是整個產業(yè)生態(tài)的共同進化。
APSARA Rocks。
AI Rocks too。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.