夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大語言模型上車,軟硬結(jié)合是關(guān)鍵

0
分享至



隨著汽車行業(yè)的飛速發(fā)展,當乘用車從交通工具向智能移動終端不斷進化,艙駕智能化水平已成為衡量整車廠競爭力的核心標尺,而其中車載平臺算力更是端側(cè)艙駕AI進化的核心燃料。

其中,以智駕視角來看,從 L2 級輔助駕駛,到L2+高級輔助駕駛,再到L3/ L4 級自動駕駛,車載計算平臺的算力需求正以指數(shù)級增長,這種增長不僅源于傳感器數(shù)量與分辨率的提升,更來自 AI 算法復雜度帶來的能力上限的爆炸式演進。

NVIDIA DRIVE AGX 系列芯片以領(lǐng)先行業(yè)的算力規(guī)模,架構(gòu)創(chuàng)新以及豐富數(shù)字生態(tài),已成為定義智能駕駛時代的 "數(shù)字算力引擎",其構(gòu)建的從云端訓練到車端推理的完整算力體系,正在逐步重塑汽車產(chǎn)業(yè)的技術(shù)發(fā)展格局。

而以智艙角度來看,隨著生成式AI技術(shù)的迅猛發(fā)展,艙內(nèi)AI端側(cè)部署正從簡單的語音助手交互向多模態(tài)甚至全模態(tài)智能座艙體驗躍遷。端側(cè)大模型憑借本地實時推理能力,可實現(xiàn)極低延遲的自然語言交互,個性化的主動式AI服務以及艙內(nèi)外環(huán)境感知應用。開發(fā)者可通過CUDA生態(tài)復用云端大模型開發(fā)優(yōu)化經(jīng)驗,大幅縮短端側(cè)開發(fā)周期同時極大提高推理速度和用戶體驗。

目前已有頭部車企基于NVIDIA DRIVE AGX系列芯片部署端到端艙內(nèi)AI Agent,從而實現(xiàn)被動響應到主動服務的體驗升級。

自動駕駛技術(shù)的每一次技術(shù)跨越與性能體驗升級,都伴隨著算力需求的幾何級增長。L2 級輔助駕駛僅需 10TOPS 以下算力,即可完成車道保持、自適應巡航等基礎(chǔ)功能;而 L2+ 級高級輔助駕駛對算力的需求驟升至 100TOPS 以上,以應對復雜城市道路的多目標檢測與決策規(guī)劃;當邁向 L3/L4 級自動駕駛,系統(tǒng)需要同時處理數(shù)十路傳感器的多并發(fā)數(shù)據(jù)流量,所需算力已突破 1000TOPS 大關(guān)。

那么,從技術(shù)發(fā)展和落地的角度來看,究竟該如何進一步應對汽車智能化發(fā)展帶來的 AI 算力部署的挑戰(zhàn)?

DRIVE AGX SoC系列

從硬件的角度來看,為了應對汽車在快速演變?yōu)橹悄芙K端的過程中對于 AI 算力的飛速增加的需求,NVIDIA 先后推出了 DRIVE AGX SoC系列的 DRIVE AGX Orin 和 DRIVE AGX Thor。

Orin 可提供高達 254 TOPS(每秒萬億次運算)的性能,是智能車輛的中央計算平臺。它為輔助駕駛功能、置信視圖以及 AI 座艙提供高算力支持。

Thor 是英偉達最新一代,專為汽車行業(yè)日益重要的生成式 AI 應用而打造的集中式車載計算機。作為 Orin 的后續(xù)產(chǎn)品,Thor 采用了NVIDIA最新的 CPU 和 GPU 技術(shù),包括 NVIDIA Blackwell GPU 架構(gòu),用于Transformer 和生成式 AI 功 能。Thor 支持4位浮點數(shù) (FP4)和8 位浮點數(shù) (FP8),可提供前所未有的2,000 FP4 TOPS/1,000 INT8 TOPS/1,000 FP8 TFLOPS/500 FP16 TFLOPS 性能。

這一平臺不僅提供豐富的座艙功能、安全可靠的輔助駕駛以及無人駕駛功能,還能夠?qū)⑺泄δ苷现镣粋€集中式平臺上,極大地提高了系統(tǒng)的運行效率和可靠性,并降低了整體系統(tǒng)成本。

高算力平臺為 AI 上車奠定基礎(chǔ),為算法迭代預留了充足空間。

新一代集中式車載計算平臺將賦能整車廠的高階智能駕駛方案,發(fā)揮其在硬件、軟件算法和算力優(yōu)化方面的優(yōu)勢,推動輔助駕駛技術(shù)的全面升級,并覆蓋高速、城市、泊車等全場景的高階輔助駕駛功能,助力其向高端算力輔助駕駛轉(zhuǎn)型,共同探索大模型、世界模型的路徑,持續(xù)優(yōu)化和提升高速領(lǐng)航、城市記憶領(lǐng)航及更高的旗艦級城市領(lǐng)航功能。



DriveOS 軟件架構(gòu)和軟件開發(fā)包

當然,在基于硬件層面推出上述高算力平臺的基礎(chǔ)上,英偉達也在軟件層面推出了一系列適用于這些高算力平臺的軟件架構(gòu)和軟件開發(fā)包,從而形成了一整套軟硬結(jié)合的車端系統(tǒng)級 AI 開發(fā)方案,更好地滿足客戶在大語言模型時代的需求。

1) DriveOS 軟件架構(gòu)

DriveOS 是英偉達提供的軟件板級支持包,包括英偉達自研的Type-1 虛擬機,虛擬機之上不同的操作系統(tǒng)(Linux或者QNX),操作系統(tǒng)上的豐富的SDK。這些SDK包括大家熟悉的CUDA,TensorRT,Vulkan,還有特意為支持大語言模型的軟件開發(fā)包DriveOS LLM SDK。這些SDK可以使開發(fā)者更容易的訪問 SoC 中的各種硬件加速引擎,快速的部署應用在英偉達的平臺。



2) DriveOS LLM SDK 介紹

DriveOS LLM SDK 是英偉達為嵌入式端特別推出的大語言模型軟件開發(fā)包,包含多個專為高效 LLM 推理而設(shè)計的關(guān)鍵組件。這些組件可確保在汽車平臺上高效部署 LLM,包括:

●插件庫 :LLMs 需要專用插件來實現(xiàn)高級功能和優(yōu)化性能。DriveOS LLM SDK 包含這些自定義插件,以及一組用于處理上下文相關(guān)組件的內(nèi)核,例如旋轉(zhuǎn)位置嵌入、multihead attention 和 KV-cache 管理。AttentionPlugin 還支持動態(tài)批量大小和動態(tài)輸入序列長度。

●標記器/detokenizer :該 SDK 為 LLM 推理提供高效的標記器/detokenizer,遵循 Llama 式字節(jié)對編碼 (BPE) 標記器,并帶有正則表達式匹配。此模塊將多模態(tài)用戶輸入 (例如文本或圖像) 轉(zhuǎn)換為令牌流,從而實現(xiàn)不同數(shù)據(jù)類型之間的無縫集成。

●采樣器:采樣器對于文本生成、翻譯和對話等任務至關(guān)重要,因為它控制著模型在推理過程中如何生成文本和選擇標記。DriveOS LLM SDK 實現(xiàn)了基于 CUDA 的采樣器來優(yōu)化此過程。為了平衡推理效率和輸出多樣性,采樣器使用單束采樣方法和 Top-K 選項。這種方法可提供快速且合理多樣化的輸出,而不會產(chǎn)生探索多個束所需的計算成本。這對于汽車應用非常重要,因為需要考慮延遲和效率。

●解碼器:在 LLM 推理期間,解碼器模塊根據(jù)模型的預測迭代生成 token,從而生成文本或序列。DriveOS LLM SDK 提供靈活的解碼循環(huán),支持靜態(tài)批量大小、填充輸入序列,以及生成批量中最長的序列。

這些組件共同支持在多個 NVIDIA DRIVE 平臺上實現(xiàn)靈活、輕量級的高性能 LLM 部署和定制 (圖 1)。



(圖 1. DriveOS LLM SDK 主要組件和架構(gòu)計劃)

a) 支持的模型、精度格式和平臺

DriveOS LLM SDK 在 DRIVE 平臺上支持一系列先進的 LLM,包括Orin和Thor。作為預覽功能,該 SDK 還可以在 x86 系統(tǒng)上運行,這對于開發(fā)非常有用。

目前支持的模型包括以下內(nèi)容,未來預計還會有其他模型:

●Llama 3 8B Instruct

●Llama 3.1 8B

●Llama 3.2 3B

●Qwen2.5 7B Instruct

●Qwen2 7B Instruct

●Qwen2 VL

●Intern3 VL

●Phi4 VL

該 SDK 支持多種精度格式,可在不同平臺 (包括 FP16、FP8、NVFP4 和 INT4) 上解鎖大型 LLM。對于 INT4 (W4A16) 精度,使用 AWQ recipe 將模型權(quán)重量化為 INT4,并在 FP16 中執(zhí)行計算。這種方法可顯著減少內(nèi)存占用。該 SDK 還在 Thor 平臺上支持 TensorRT 版本大于 10.4 的 FP8 (W8A8) 精度,以及 TensorRT 版本大于 10.8 的 NVFP4 精度。

這些精度可以進一步減少 LLM 推理期間的內(nèi)存占用,同時增強內(nèi)核性能。在此配置中,權(quán)重和 GEMM 運算采用 FP8 或 NVFP4 格式,而 LayerNorm、KV 緩存、LM 頭和注意力層保留在 FP16 中。

總體而言,DriveOS LLM SDK 旨在高效支持各種 LLM,包括多模態(tài)輸入和跨多個平臺的各種精度格式。

b) DriveOS LLM SDK 的關(guān)鍵feature



c) LLM 部署工作流

LLM 部署通常是一個復雜的過程,需要大量的工程工作,尤其是在邊緣設(shè)備上。DriveOS LLM SDK 為在 DRIVE 平臺上部署 LLM 提供了簡化的解決方案。

所提議的 SDK 將部署工作流程簡化為兩個簡單的步驟:導出 ONNX 模型和構(gòu)建引擎(圖 2)。此過程與使用 TensorRT 部署深度學習模型的標準程序十分相似。



(圖 2、使用 DriveOS LLM SDK 部署 LLM 的步驟)

量化在優(yōu)化 LLM 部署方面發(fā)揮著至關(guān)重要的作用,尤其是對于資源受限的平臺而言。它可以顯著提高 LLM 的效率和可擴展性。DriveOS LLM SDK 通過在 ONNX 模型導出階段提供多個量化選項來滿足這一需求。

將模型導出到 ONNX 后,可以使用llm_build 二進制文件來創(chuàng)建相應的 TensorRT 引擎。構(gòu)建過程與特定模型或精度無關(guān),因為 IO 接口在所有 ONNX 模型中保持標準化。

該 SDK 還包括交叉編譯構(gòu)建系統(tǒng),支持在 x86 機器上編譯 AArch64 目標。此功能可加速部署并簡化邊緣計算平臺上的特征驗證。

除了其用戶友好型部署流程外,DriveOS LLM SDK 還提供了各種 C++ 代碼示例,用于端到端 LLM 推理、性能基準測試和實時聊天實現(xiàn)。這些示例使開發(fā)者能夠使用靜態(tài)批量大小和輸入/輸出序列長度來評估 DRIVE 平臺上不同模型的準確性和性能,或自定義自己的應用程序。

如果要使用 SDK 提供的 C++ 代碼來啟用 LLM 聊天機器人,可以采用特定命令,此命令的整個推理工作流如圖 3 所示,其中與 DriveOS LLM SDK 相關(guān)的組件以藍色塊表示。



(圖 3、使用 DriveOS LLM SDK 進行推理的管道)

d) 多模態(tài) LLM 部署的性能



總結(jié)

當前,整個汽車行業(yè)在持續(xù)追求輔助駕駛快速發(fā)展的同時,也在不斷推進大語言模型在車端的落地,這就對車端 AI 算力的多樣化部署,尤其是對大語言模型的部署和適配能力,提出了更加復雜和多樣化的要求。

NVIDIA DriveOS LLM SDK 簡化了 LLM 和 VLM 在DRIVE 平臺上的部署。通過利用強大的NVIDIA TensorRT推理引擎以及 LLM 特定優(yōu)化技術(shù),如量化,先進的 LLM 和 VLM 可以在 DRIVE 平臺上輕松的部署,并取得此 SDK 為在生產(chǎn)環(huán)境中部署強大的 LLM 奠定了基礎(chǔ),最終提高了 AI 驅(qū)動的應用的性能。

對于英偉達來說,通過軟硬件結(jié)合的方式來持續(xù)推進并引領(lǐng)最新的技術(shù)進展,一直是其面向汽車行業(yè)進行技術(shù)賦能的核心邏輯——由此,面對大語言模型快速上車的大趨勢,DRIVE 平臺更好地支持 LLM 的部署,成為這一邏輯落地的關(guān)鍵一環(huán)。

從長遠的視角來看,伴隨著智能駕駛和智能座艙在大模型時代的不斷演進,二者之間也正在呈現(xiàn)出相互融合和相互賦能的發(fā)展態(tài)勢,這將會使得汽車終端在持續(xù)擁抱大算力的同時,也將會越來越意識到相應的軟件適配能力的重要性。

由此,更加緊密和深層次的軟硬結(jié)合,已經(jīng)成為 AI 在車端進一步落地的必由之路。

本文來自微信公眾號“智見 Time”

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
夫妻性生活前戲到底有多重要?做好這7分鐘,體驗感飆升10倍!

夫妻性生活前戲到底有多重要?做好這7分鐘,體驗感飆升10倍!

精彩分享快樂
2025-08-13 00:04:39
張學良被軟禁了54年,一共花費多少?老蔣看了賬單直罵“娘希匹”

張學良被軟禁了54年,一共花費多少?老蔣看了賬單直罵“娘希匹”

小莜讀史
2025-08-13 16:12:35
“董明珠健康家”改名

“董明珠健康家”改名

魯中晨報
2025-08-14 07:16:02
橋水基金清倉阿里巴巴等中概股大舉增持英偉達

橋水基金清倉阿里巴巴等中概股大舉增持英偉達

財聯(lián)社
2025-08-14 05:45:13
周琦:我們總決賽打廣廈輸很大程度因朱俊龍 防守高度&速度作用大

周琦:我們總決賽打廣廈輸很大程度因朱俊龍 防守高度&速度作用大

直播吧
2025-08-14 19:39:23
曼晚展望曼聯(lián)英超首輪:八年了!紅魔揭幕戰(zhàn)終于有真9號

曼晚展望曼聯(lián)英超首輪:八年了!紅魔揭幕戰(zhàn)終于有真9號

雷速體育
2025-08-14 13:51:51
行李箱凌亂礦泉水散落…自閉癥男孩的最后5天,藏在蒼山的亂石里

行李箱凌亂礦泉水散落…自閉癥男孩的最后5天,藏在蒼山的亂石里

視界面面觀
2025-08-14 06:10:38
謝霆鋒為王菲浪漫慶生,才發(fā)覺他是第二個謝賢,張柏芝體面碎一地

謝霆鋒為王菲浪漫慶生,才發(fā)覺他是第二個謝賢,張柏芝體面碎一地

小丸子的娛樂圈
2025-08-12 06:54:14
韓國雙胞胎姐妹,一個嫁到中國一個嫁到日本,5年后生活相差很大

韓國雙胞胎姐妹,一個嫁到中國一個嫁到日本,5年后生活相差很大

白云故事
2025-08-12 10:50:04
開播30分鐘,熱度破14000,終于有一部像樣的刑偵劇可以追了

開播30分鐘,熱度破14000,終于有一部像樣的刑偵劇可以追了

易同學愛談娛樂
2025-08-14 08:30:49
DeepSeek R2 推遲內(nèi)幕曝光:聯(lián)手華為憋大招,工程師團隊駐場攻堅

DeepSeek R2 推遲內(nèi)幕曝光:聯(lián)手華為憋大招,工程師團隊駐場攻堅

AppSo
2025-08-14 14:54:18
小伙8萬一次,讓湖北女孩給他理發(fā),臨走還要了2個廁所旁長的西瓜

小伙8萬一次,讓湖北女孩給他理發(fā),臨走還要了2個廁所旁長的西瓜

削桐作琴
2025-08-13 20:04:11
追光|在世運會,看體育運動玩轉(zhuǎn)“全球漂流”

追光|在世運會,看體育運動玩轉(zhuǎn)“全球漂流”

新華社
2025-08-14 15:09:35
突發(fā)公告!上市公司董事長,被留置

突發(fā)公告!上市公司董事長,被留置

魯中晨報
2025-08-14 08:56:19
王晶曝梅艷芳和趙文卓分手內(nèi)幕:趙文卓受不了梅艷芳朋友侮辱他

王晶曝梅艷芳和趙文卓分手內(nèi)幕:趙文卓受不了梅艷芳朋友侮辱他

趣文說娛
2025-08-12 13:51:30
小楊阿姨直播吐苦水!馬筱梅帶娃出國換保姆,汪家要變天?

小楊阿姨直播吐苦水!馬筱梅帶娃出國換保姆,汪家要變天?

東方不敗然多多
2025-08-14 06:16:33
“港獨分子”陳方安生:勾結(jié)外部勢力禍亂香港,如今下場大快人心

“港獨分子”陳方安生:勾結(jié)外部勢力禍亂香港,如今下場大快人心

boss外傳
2025-08-14 00:00:12
“王侯將相,寧有種乎”被移除語文教材,理由6個字,新課文揭曉

“王侯將相,寧有種乎”被移除語文教材,理由6個字,新課文揭曉

妍妍教育日記
2025-08-12 12:51:12
李在明手段太毒,檢方連夜換拘留所,不準金建希見尹錫悅最后一面

李在明手段太毒,檢方連夜換拘留所,不準金建希見尹錫悅最后一面

通文知史
2025-08-13 20:55:04
韓國第3節(jié)17罰15中 媒體人:防住了3分雨 沒想到還有1分雨 逆天…

韓國第3節(jié)17罰15中 媒體人:防住了3分雨 沒想到還有1分雨 逆天…

直播吧
2025-08-14 20:43:24
2025-08-15 00:23:00
智見Time incentive-icons
智見Time
我們研究企業(yè)
154文章數(shù) 9關(guān)注度
往期回顧 全部

汽車要聞

大六座SUV還能這么玩 吉利銀河M9動態(tài)內(nèi)測

頭條要聞

3名女子和4個孩子點1碗面 多次免費續(xù)面被拒給2個差評

頭條要聞

3名女子和4個孩子點1碗面 多次免費續(xù)面被拒給2個差評

體育要聞

在菲律賓,一支中國人創(chuàng)建的球隊踢上了亞冠

娛樂要聞

趙露思發(fā)文告別!扯下她最后的顏面

財經(jīng)要聞

“許家印同伙”夏海鈞的資產(chǎn)藏匿游戲

科技要聞

暴雨之下1萬多人,500個機器人燃爆全場

態(tài)度原創(chuàng)

健康
教育
家居
房產(chǎn)
手機

急診科專家解答動物抓咬傷八大問題

教育要聞

開學倒計時!幼小銜接免費福利,抓住暑假尾巴

家居要聞

現(xiàn)代奶油 網(wǎng)紅又實用

房產(chǎn)要聞

重磅新政要來!海南138個安居盤,數(shù)萬套房源將逆天改命!

手機要聞

榮耀Magic8系列入網(wǎng),V Flip2再預熱

無障礙瀏覽 進入關(guān)懷版 国产亚洲精品欧洲在线视频| 人人干91护士| 久久66热人妻偷产精品| 精品少妇人妻AV无码专区在线| 奇米7777影视播放器| 亚洲第一综合婷婷成人APP| 亚洲一二三四区不卡| 嗯嗯嗯嗯啊啊好爽视频| 免费啪视频在线观看视频网页| ...国产av一区二区三区精品| 国产AV综合一区二区三区| 四虎影视永久无码精品| 色一情一乱一伦一区二区三区| 天堂xxxx| 熟女av自拍超碰| 国产人妻大战黑人第1集| 久久无码av三级| 精品秘书少妇一区二区三区免费观| 狠狠色丁香婷婷综合潮喷| 毛茸茸黑浓毛熟女| 十八岁以下免费毛片| 成人网站在线进入爽爽爽| 中文字幕乱码人妻| 99热精品官方| 国产99久久久久久免费看| 狠狠色丁香久久婷婷综合五月| 在线一区二区喷射| 好男人官网www在线观看| 亚洲国产亚洲综合在线尤物 | 国产欧美亚洲精品第二区软件| 亚洲激情四射婷婷影院| 69国产盗摄一区二区三区五区| 国产粉嫩高中无套进入| 一区二区三区高清日本vr| 高清成人无码| 欧美女人视频操逼| 亚洲av免费成人精品区| 麻豆一区二区三区AⅤ白珊册| 无码丰满熟妇juliaann与黑人| 日本免费一及视频| 午夜免费福利小电影|