今天星艦第十一飛圓滿收官,沒想到黃仁勛也閃現(xiàn)到了現(xiàn)場。
原來,黃仁勛親自飛到了德州的星際基地(Starbase),在沖天的星艦旁邊,就是為了把一臺剛出爐的新「核彈」交到了馬斯克手上。
這就是大家從年初等到現(xiàn)在的——NVIDIA DGX Spark 個人 AI 超級計算機 。
而這一幕,讓所有老科技迷瞬間 DNA 動了,夢回 2016 年。當時,馬斯克還是 OpenAI 的聯(lián)合創(chuàng)始人,沒和奧特曼鬧掰,老黃親自把全球第一臺 DGX-1 超級計算機送到了他們初創(chuàng)公司的辦公室。
黃仁勛當時開玩笑地說:
如果這是唯一一個出貨的產(chǎn)品,那這個項目造價就高達 20 億美元了。
那臺「20 億美金的大家伙」后來開啟了整個大模型時代。
第二年 Google 就公布了一種新的神經(jīng)網(wǎng)絡(luò)訓(xùn)練架構(gòu) Transformer。
這次的新突破再被 Sutskever 抓住,引領(lǐng) OpenAI 建造出來第一個 GPT 模型,一切都建立于英偉達的超級計算機上。
9 年過去了,馬斯克成了全球首富???,黃仁勛掌一度管著全球市值第一的公司。
而英偉達交付這次交付的 DGX,不再是一個龐然大物,而是一臺能放在你桌邊的「性能怪獸」。又一次在用最酷的方式宣告:一個屬于每個人的 AI 超算時代,從這里開始了。
劇透一下,APPSO 的 DGX Spark 也在路上了,后續(xù)給大家?guī)砀囿w驗細節(jié),敬請期待。
說實話,這臺 DGX Spark 能順利交到老馬手上,真挺不容易的。
從今年 1 月在 CES 上以「Project Digits」之名驚艷亮相,英偉達接連錯過了原定的 5 月和夏季發(fā)布日期,一直沒有出貨 。這大半年的等待,讓不少人心里直打鼓,不少開發(fā)者甚至覺得可能要徹底跳票了 。
雖然官方三緘其口,但行業(yè)里的猜測都指向了其核心——Grace Blackwell GB10 芯片 。這個芯片是「合體金剛」,Blackwell GPU 部分(就是我們熟悉的 5090 顯卡同款架構(gòu))早就準備好了,但與聯(lián)發(fā)科(MediaTek)共同開發(fā)的 Grace CPU 部分,卻在生產(chǎn)上遲遲沒能跟上,拖了整個項目的后腿 。
「萬事俱備,只欠 CPU」的故事,沒想到會發(fā)生在了英偉達身上。
那么,在 M3 Ultra Mac Studio 等競品憑借高內(nèi)存帶寬搶占眼球的時候,這臺姍姍來遲、還比最初傳聞貴了 1000 美元的 DGX Spark 還值得我們等待嗎?
答案是:絕對值得! 因為它玩的路子,特立獨行且直擊痛點。
等了大半年,DGX Spark 到底「香」在哪?APPSO 帶你回顧一下。
整臺機器的靈魂,是Grace Blackwell GB10 超級芯片。
它將一顆 20 核的 ARM 架構(gòu) Grace CPU 和一顆強大的 Blackwell GPU 封裝在一起,構(gòu)成了一顆超級芯片 。它能提供高達 1 Petaflop(千萬億次)的 AI 計算性能,讓你在桌面上就能體驗到數(shù)據(jù)中心級別的澎湃動力 。
而 DGX Spark 還有一個殺手锏。是 CPU 和 GPU 通過 NVIDIA NVLink?-C2C 技術(shù)無縫連接,共享一個巨大的 128 GB 統(tǒng)一內(nèi)存池 。
這個連接技術(shù)的帶寬是傳統(tǒng)第五代 PCIe 的整整 5 倍,確保了數(shù)據(jù)在 CPU 和 GPU 之間幾乎沒有延遲地高速流轉(zhuǎn) 。雖然它的內(nèi)存帶寬(273 GB/s)在紙面上遠不如 Mac Studio M3 Ultra(819 GB/s),但英偉達的思路是「大力出奇跡」。
在 AI 任務(wù)中,尤其是跑大模型時,能一次性把整個模型裝進內(nèi)存的巨大容量,其戰(zhàn)略價值遠超單純的帶寬數(shù)字。這意味著你可以直接在自己桌上,流暢運行一個高達 2000 億參數(shù)的超大語言模型,而無需進行復(fù)雜的模型切分 。這種體驗,別無他用。
Blackwell GPU 配備了第五代張量核心(Tensor Cores),并支持 FP4/FP8 這樣的超低精度格式,性能相比上一代 FP8 提升了 5 倍 。
這就像給 AI 計算開了一個「渦輪增壓」模式,讓推理速度暴增,同時能效比堪稱驚艷。
單臺不夠?DGX Spark 還內(nèi)置了 NVIDIA ConnectX?-7 200 Gb/s 網(wǎng)絡(luò)接口 。你可以輕松地將兩臺設(shè)備連接起來,組成一個擁有 256 GB 共享內(nèi)存的微型集群 。
英偉達表示,這樣的組合足以處理高達 4000 億參數(shù)的巨型模型,這已經(jīng)超出了個人開發(fā)者能夠想象的極限。
拋開硬件,別忘了英偉達最硬的護城河——軟件生態(tài)。DGX Spark 預(yù)裝了完整的 NVIDIA AI 軟件棧,包括 CUDA 庫、TensorRT 和各種 NVIDIA NIM? 微服務(wù),所有東西都集成在定制的 DGXOS(基于 Ubuntu)上為你調(diào)校好了 。
這意味著你不用再花時間折騰兼容性,開箱就能直接進入戰(zhàn)斗狀態(tài),這對于開發(fā)者而言,時間成本的節(jié)省難以估量。
這場在星艦基地上演的「世紀交接」,只是一個開始。
從 10 月 15 日起,DGX Spark 將通過英偉達官網(wǎng)和全球合作伙伴正式發(fā)售,價格約為 4000 美元 。宏碁、華碩、戴爾、聯(lián)想等幾乎所有 PC 巨頭都已第一時間跟進。
說實話,這個價格比最初承諾的 3000 美元貴了 1000 刀 ,也和頂配的 Mac Studio M3 Ultra 差不多了。但它們的定位完全不同:DGX Spark 預(yù)裝的是 DGXOS(基于 Ubuntu),不能裝 Windows 或 macOS ,它就是一臺純粹的、為 AI 開發(fā)者和硬核玩家準備的「戰(zhàn)斗機器」。
它的魅力在于,你花 4000 美元,買到的是一個能在本地馴服 2000 億參數(shù)大模型的超能力 ,以及背后整個 CUDA 生態(tài)的全力支持對于那些需要在本地處理敏感數(shù)據(jù)、追求極致性能、或者想要完全掌控自己 AI 工作流的專業(yè)人士來說,這個價格其實相當有競爭力。
對于這樣一臺優(yōu)缺點都極其鮮明的「偏科生」,你是什么態(tài)度?關(guān)于這臺設(shè)備你還想要了解什么細節(jié),也歡迎在留言區(qū)告訴我們。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.