上汽通用與Momenta攜手,將全球首個量產(chǎn)落地的端到端強化學習大模型——R6飛輪大模型,搭載于別克至境L7。這并非一次簡單的技術迭代,而是一次對智駕發(fā)展路徑的重新定義。它意味著,汽車的“大腦”開始告別單純的模仿,邁向能夠自主進化、甚至超越人類經(jīng)驗的“老司機”時代。
【汽車維基】將深入解析,Momenta R6這顆“最強大腦”如何通過30億公里的自我博弈與強化學習,煉就應對中國復雜路況的終極能力。它如何超脫于“純視覺”與“激光雷達”的路線之爭,以更高級的算法架構(gòu),為合資車企打響了一場最硬核的“本土化”反擊戰(zhàn)。
我們即將揭開的,不僅是技術的面紗,更是智能駕駛未來的新范式。
8月18日,上汽通用宣布在其別克至境L7上全球首發(fā)搭載基于端到端的“強化學習”大模型——Momenta R6飛輪大模型。
這不是簡單的技術升級,而是國內(nèi)首個量產(chǎn)落地的端到端強化學習大模型,它代表著智能駕駛技術從單純模仿人類到超越人類能力的重大跨越。
01
模仿 or 超越?兩種技術路徑的本質(zhì)差異
要理解R6飛輪大模型的突破性,我們首先要了解傳統(tǒng)智能駕駛系統(tǒng)的技術路徑。
現(xiàn)有的智駕系統(tǒng)大多基于“模仿學習”大模型,其核心邏輯是模仿人類駕駛行為。
就像學生學習做題,模仿學習模型通過分析大量人類駕駛數(shù)據(jù),學習如何在各種場景下操作車輛。這種方法有其局限性——系統(tǒng)的能力上限不會超過人類駕駛員的整體水平,且在極端場景下的應對能力有限。
而Momenta R6飛輪大模型采用了完全不同的技術路徑——強化學習,這是區(qū)別于其他“模仿學習”大模型的自我學習。這種模型的運作機制類似于訓練一名職業(yè)運動員:通過在模擬環(huán)境中無數(shù)次“試錯-優(yōu)化”循環(huán),不斷自我學習和完善。
強化學習模型不再局限于模仿人類行為,而是通過“成功就獎勵,失敗就懲罰”的機制,從每一次決策的結(jié)果中學習,從而突破人類駕駛數(shù)據(jù)的天花板,實現(xiàn)真正的自主進化能力。
02
海量數(shù)據(jù)訓練,打造智能駕駛“最強大腦”
R6飛輪大模型的訓練過程令人驚嘆。它依托30億公里實戰(zhàn)里程提煉的7000萬組場景數(shù)據(jù),通過高頻次閉環(huán)訓練強化復雜場景應對能力。
這些數(shù)據(jù)涵蓋了各種極端和復雜路況,形成了Momenta獨特的“噩夢題庫”。模型在這個題庫里進行特訓,從每一次成功避險和潛在風險中汲取經(jīng)驗,自主決策不斷優(yōu)化。
具體來看,R6模型的訓練過程類似于人類積累駕駛經(jīng)驗的過程,但速度和規(guī)模遠超人類。它每天在模擬環(huán)境中進行數(shù)百萬次的“試錯-優(yōu)化”循環(huán),處理各種極端情況,從而不斷優(yōu)化自己的決策機制。
這種訓練方式使R6大模型具備了強大的泛化能力,能夠從容應對各種前所未見的復雜場景,包括加塞、鬼探頭、盲區(qū)遮擋等傳統(tǒng)系統(tǒng)難以處理的路況。
03
“決策層”:R6飛輪大模型是端到端算法大腦
Momenta R6飛輪大模型本身是一個“傳感器無關”的端到端算法大腦,它既不是純視覺,也不是激光雷達派,而是站在更高維度的“決策層”。
但在實際裝車時,車企可以根據(jù)成本和性能目標,為它搭配不同的“眼睛”(傳感器),可以是純視覺,也可以是包含激光雷達的融合系統(tǒng)。
如果深入淺出地解釋一下就是:R6大模型的本質(zhì)是一個更強大的“大腦”。
你可以把智能駕駛系統(tǒng)分成三個層次:眼睛(感知層):攝像頭、激光雷達、毫米波雷達等傳感器,負責“看”世界;神經(jīng)(算法/模型層):處理“眼睛”看到的信息,理解環(huán)境并做出決策,這就是R6所在的位置;手腳(執(zhí)行層):轉(zhuǎn)向、剎車、油門等,執(zhí)行“大腦”發(fā)出的指令。
R6飛輪大模型的核心突破在“神經(jīng)”(“大腦”)部分。 它采用“端到端”架構(gòu),將感知、預測、規(guī)劃等多個模塊融合成一個龐大的神經(jīng)網(wǎng)絡。
這意味著:它不關心數(shù)據(jù)來源:無論是攝像頭拍的圖片,還是激光雷達生成的點云,對它來說都只是輸入的“數(shù)據(jù)”。它學習的是這些數(shù)據(jù)與最終駕駛行為(如方向盤轉(zhuǎn)角、剎車力度)之間的映射關系。
它的優(yōu)勢是“思維模式”,通過海量數(shù)據(jù)(30億公里)和強化學習,它學會了更接近人類、甚至超越人類的決策能力,處理復雜場景(如加塞、鬼探頭)更聰明、更流暢。
所以,R6本身是超脫于“視覺”和“雷達”之爭的。它就像一個天才學生,你給他文字書、帶插畫的書或者有聲書,他都能學得很好,他的強大在于其“學習方法和理解能力”,而不在于他用了哪種媒介學習。
那么,接下來的步驟就是,在實際裝車過程中,車企如何為R6選擇“眼睛”?
雖然R6大腦本身不挑食,但車企在具體量產(chǎn)車上,需要根據(jù)車型定位、成本和性能目標,來決定給它配備什么樣的“眼睛”。
這就是為什么你會看到差異:
在上汽通用別克至境L7上,因為這款車定位高端豪華,追求極致安全和性能,所以選擇了頂配的“眼睛”——包括12個超聲波雷達、12個攝像頭(11個車外攝像頭+1個駕駛員疲勞檢測攝像頭)、3個毫米波雷達和1個激光雷達,共4類28個感知設備。
在這里,R6大腦享受著最豐富的視覺+雷達融合數(shù)據(jù),能力能得到最全面的發(fā)揮。
然而,在其它可能搭載R6的車型上(尤其是性價比車型),為了控制成本,車企很可能選擇不配備激光雷達,只給R6提供攝像頭和毫米波雷達的數(shù)據(jù)。
在這種情況下,R6依然可以工作,并且憑借其強大的算法能力,其純視覺方案的表現(xiàn)很可能優(yōu)于其他家的純視覺方案。
04
實戰(zhàn)表現(xiàn):更智能、更流暢、更安全
Momenta R6飛輪大模型在實際道路場景中的表現(xiàn)展現(xiàn)了三大特點:極智的安全、極智的絲滑和極智的高效。
在ETC通行場景中,R6大模型展現(xiàn)出在無車道線環(huán)境下的實時高精度建圖能力。結(jié)合別克“逍遙”架構(gòu)的跨域控制,實現(xiàn)了轉(zhuǎn)向與制動的協(xié)同,延遲時間更短,從進站到出站更加流暢。
“不停車一鍵泊入”功能則徹底重新定義了泊車體驗。車輛可在行駛中實時識別車位,系統(tǒng)自動規(guī)劃最優(yōu)泊車軌跡,省卻了停車、選位、按鍵開啟泊車的繁瑣步驟,大幅提升了泊車效率。
更令人印象深刻的是,R6大模型能夠應對各種復雜車位場景,包括讓老司機都犯怵的機械停車庫,真正做到無差別車位泊入,徹底打破“停車焦慮”。
05
安全設計:多重冗余,極致保障
智能駕駛系統(tǒng)的安全性是用戶最關心的問題。別克至境L7搭載的智能駕駛系統(tǒng)在安全方面做了極致的設計。
硬件配置上,除了上面說的,至境L7采用了12個超聲波雷達、12個攝像頭(11個車外攝像頭+1個駕駛員疲勞檢測攝像頭)、3個毫米波雷達和1個激光雷達,共4類28個感知設備,構(gòu)成了系統(tǒng)感知基礎。
更重要的是,車輛配備了三重冗余制動系統(tǒng):電制動、液壓制動和電子駐車制動,以及雙ECU和雙傳感器的轉(zhuǎn)向控制系統(tǒng)。這樣的冗余設計在業(yè)內(nèi)并不多見。
整個系統(tǒng)按照行業(yè)最高的ASIL-D功能安全等級設計。ASIL-D(汽車安全完整性等級D)是汽車功能安全領域的最高標準,源自國際標準ISO 26262,對應“最高風險場景”的安全保障需求。
ASIL-D不是“事后檢測”的結(jié)果,而是從系統(tǒng)設計到報廢的全生命周期強制要求,核心目標是“通過流程和技術手段,將故障風險降到可接受水平”。
06
本土化適配:更懂中國路,更懂中國人
上汽通用與Momenta的合作不是簡單的“拿來主義”,而是深度耦合。
上汽通用泛亞汽車技術中心憑借28年積累的百萬公里中國路譜數(shù)據(jù)和120+種道路工況,以及超過2000萬用戶的駕駛行為數(shù)據(jù)庫,為駕駛輔助系統(tǒng)提供了最適合中國復雜路況的底盤控制技術支撐。
這些本土化數(shù)據(jù)與Momenta的算法深度融合,使系統(tǒng)能夠更好地理解中國特有的交通場景和駕駛員行為習慣,提供更符合中國用戶需求的智能駕駛體驗。
通用汽車Super Cruise系統(tǒng)全球超過8.77億公里的安全行駛經(jīng)驗也被深度融入此次與Momenta的合作中,推動雙方在駕駛員監(jiān)測、多級接管、故障處理、邊緣場景應對等關鍵安全領域?qū)崿F(xiàn)技術躍遷。
07
未來展望:智能駕駛的新范式
Momenta R6飛輪大模型的首發(fā)搭載,代表了智能駕駛技術發(fā)展的一個新方向。行業(yè)正在正本清源,讓智駕從安全出發(fā),回歸“保護人”的本質(zhì)。
與一味追求算力參數(shù)和硬件堆料不同,R6大模型通過算法創(chuàng)新和數(shù)據(jù)處理方式的變革,實現(xiàn)了智能駕駛體驗的質(zhì)的飛躍。
這種技術路徑不僅提高了系統(tǒng)的性能和安全性,更重要的是,它為智能駕駛技術的普及和應用提供了新的思路——通過算法優(yōu)化和數(shù)據(jù)利用效率的提升,讓智能駕駛變得更加智能、可靠和實用。
隨著更多車型搭載類似技術,智能駕駛將逐漸從高端配置轉(zhuǎn)變?yōu)槠占盎陌踩o助功能,為更多用戶提供安全、便捷和舒適的出行體驗。
08
結(jié)語
秋天將至,當?shù)谝慌鷦e克至境L7駛下生產(chǎn)線,交付到用戶手中時,這些搭載著R6飛輪大模型的車輛將不斷學習、進化。
它們在上海陸家嘴的復雜環(huán)島、在北京三里屯的擁堵路段、在重慶的魔幻立交上,積累著對中國道路的深度認知。
智能駕駛的未來,不再只是科幻電影中的想象,而是正在我們每天行駛的道路上悄然演進的現(xiàn)實。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.