Karpathy「瘋狂之作」：100美元、4小時，就能訓練你自己的「小型GPT」

2025-10-14 10:24:58　來源: 新智元

北京舉報

分享至

新智元報道

編輯：定慧

【新智元導讀】AI傳奇人物、前特斯拉AI總監(jiān)Karpathy重磅推出全新開源項目「nanochat」，以不到8000行代碼復現(xiàn)ChatGPT全流程，只需一臺GPU、約4小時、成本僅百美元。該項目在GitHub上線不到12小時即獲4.2k星標！

AI傳奇人物、前特斯拉AI總監(jiān)Karpathy宣布發(fā)布全新項目nanochat!

一個極簡但完整的「從零構(gòu)建ChatGPT」訓練框架。

Karpathy說這是他寫過的最瘋狂的項目之一！

相當于每個人都可以自己擁有一個專屬的ChatGPT。

項目剛放出還不到12個小時，GitHub星標就破4.2kStar?。ㄟ€在持續(xù)瘋漲中）

GitHub項目：https://github.com/karpathy/nanochat

全是社區(qū)自來水流量，這就是Karpathy在AI領(lǐng)域的號召力！

與早期的nanoGPT不同，nanochat不僅涵蓋預訓練，還囊括了從數(shù)據(jù)準備、預訓練、中期訓練（對話、多項選擇題、工具使用）、SFT、RL微調(diào)到推理部署的全流程。

整個系統(tǒng)僅約8000行干凈代碼，啟動一臺GPU機器、運行一條腳本，4小時后你就能在網(wǎng)頁界面與自己訓練的「小ChatGPT」對話。

Karpathy將其稱為LLM101n的「壓軸之作」，同時也可能成為未來研究基線和開源社區(qū)的實驗平臺。

讓我來仔細看看如何僅僅用8000行來「克隆」ChatGPT：

使用全新的Rust實現(xiàn)訓練分詞器
在FineWeb上對TransformerLLM進行預訓練，評估多個指標下的CORE分數(shù)
在來自SmolTalk的用戶-助手對話、多項選擇題、工具使用數(shù)據(jù)上進行中期訓練
進行SFT，在世界知識多項選擇題（ARC-E/C、MMLU）、數(shù)學（GSM8K）、代碼（HumanEval）上評估聊天模型
使用「GRPO」在GSM8K上對模型進行強化學習微調(diào)（RL）
在帶有KV緩存的引擎中實現(xiàn)高效推理，簡單的預填充/解碼，工具使用（在輕量級沙箱中的Python解釋器），通過CLI或類ChatGPT的網(wǎng)頁界面與其交互。
撰寫一份單一的Markdown成績單，總結(jié)并將整個過程游戲化。

項目全程花費低至約100美元（約在一臺8XH100節(jié)點上訓練4小時）。

可以訓練、克隆一個可以對話的小型ChatGPT，它能創(chuàng)作故事/詩歌、回答簡單問題。

只需要訓練約12小時即可超過GPT-2的核心指標。

隨著進一步擴展到約1000美元（約41.6小時訓練），模型會迅速變得更連貫，能解決簡單的數(shù)學/代碼問題并做多項選擇題。

訓練24小時的模型（其FLOPs大致相當于GPT-3Small125M，約為GPT-3的1/1000）在MMLU上能進入40分段，在ARC-Easy上進入70分段，在GSM8K上進入20分段等。

總結(jié)一下就是：

100美元→可訓練出一個能寫詩、回答基礎問題的OpenAI同款「小型ChatGPT」；
1000美元→達到近GPT-2以上的表現(xiàn)，可做基礎推理與代碼生成。

這個項目體現(xiàn)出他的核心理念：

「降低 LLM 研究與復現(xiàn)門檻，讓每個人都能親手訓練自己的模型?！?/strong>

這種民主化路線，與他在nanoGPT時期倡導的「從零實現(xiàn)Transformer」如出一轍。

項目地址：https://github.com/karpathy/nanoGPT

Karpathy說他的目標是把完整的「強基線」棧整合到一個連貫、極簡、可讀、可修改、可最大化派生的倉庫中。

nanochat將成為LLM101n（仍在開發(fā)中）的壓軸項目。

Karpathy認為nanochat也有可能發(fā)展成一個研究工具或基準，就像之前的nanoGPT一樣。

nanoGPT教你造大腦，nanochat教你造ChatGPT。

如果說nanoGPT是「Transformer源碼教學項目」。

那么，nanochat則是「LLM生態(tài)系統(tǒng)微縮版」、OpenAI同款、你的專屬AI。

二者關(guān)系可理解為「從神經(jīng)網(wǎng)絡基礎到產(chǎn)品級對話系統(tǒng)」的兩步閉環(huán)。

從Vibe Coding到nanoGPT，再到如今的nanochat，Karpathy不愧是「AI教育者」的最佳代言人。

這一「瘋狂之作」并非狂想，而是Karpathy對AI開放、可學習、可復現(xiàn)理想的又一次踐行。

小型ChatGPT效果展示

Karpathy在WebUI部署了nanochat項目。

他還給出了「與價格為100美元、運行4小時的」nanochat的示例對話。

很……有趣！

下面這張圖展示的是Karpathy在nanochat「$100速度跑」實驗（即只用一臺GPU、約4小時訓練出的ChatGPT 小模型）中生成的「成績單」部分內(nèi)容，說明模型規(guī)模、訓練耗時、以及在各類標準評測上的性能。

Characters:333989 —— 代碼總字符數(shù)。
Lines:8304 —— 大約 8300 行干凈、注釋良好的代碼。
Files:44 —— 工程文件數(shù)量。
Tokens:約83,497 —— 代碼中的token數(shù)（大致對應8萬詞）。
Dependencies:2004行uv.lock依賴清單 —— 表明依賴極少、項目結(jié)構(gòu)輕。

這些數(shù)字展示了nanochat的「極簡」精神：完整實現(xiàn)了 ChatGPT 的訓練、微調(diào)與推理，卻仍保持在8000行代碼以內(nèi)。

參考資料：

https://x.com/karpathy/status/1977755427569111362

https://github.com/karpathy/nanochat

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點推薦

LLM把簡單任務復雜化，Karpathy無語：有些任務無需那么多思考

機器之心Pro 2025-08-12 11:16:52
0 跟貼 0

Karpathy潑冷水：AGI要等10年！根本沒有「智能體元年」

新智元 2025-10-18 17:42:02
3 跟貼 3

卡帕西：強化學習很糟糕，但其他所有方法都更糟

量子位 2025-10-18 14:40:18
0 跟貼 0

具身智能大佬引用,Huggingface催更:北京人形開源WoW具身世界模型

機器之心Pro 2025-10-17 20:40:11
0 跟貼 0

Mini-Omni-Reasoner：實時推理，定義下一代端到端對話模型

機器之心Pro 2025-09-22 14:01:53
0 跟貼 0

AGI今天起有了量化標準！Bengio牽頭定義，當前進度條58%

量子位 2025-10-17 14:06:40
0 跟貼 0

Vibe Coding爆火，YouWare突圍(1)

機器之心Pro 2025-07-24 14:36:10
0 跟貼 0

GPT-6要「活」了？MIT新作曝光，AI「自進化」不遠了

新智元 2025-10-18 09:06:50
3 跟貼 3

三五條樣本擊敗英偉達,國內(nèi)首個超少樣本具身模型,還斬獲頂會冠軍

機器之心Pro 2025-10-16 14:22:06
0 跟貼 0

李飛飛發(fā)布全新世界模型，單GPU就能跑！

量子位 2025-10-17 12:43:04
5 跟貼 5

金魚損失隨機剔除token，讓AI不再死記硬背

量子位 2025-09-03 17:37:23
0 跟貼 0

破局算力浪費阿里云AI成果入選頂會 GPU用量削減82%

財聯(lián)社 2025-10-18 21:46:16
0 跟貼 0

支撐美國經(jīng)濟增長的，竟是AI數(shù)據(jù)中心？

DeepTech深科技 2025-10-18 20:36:19
0 跟貼 0

火山引擎譚待：AI云最大區(qū)別是大模型服務，要靠基礎創(chuàng)新保持領(lǐng)先

DeepTech深科技 2025-10-18 19:19:44
0 跟貼 0

從阿里云到亞馬遜云：中國獨立軟件開發(fā)商出海背后的技術(shù)、合規(guī)與生態(tài)博弈

每日經(jīng)濟新聞 2025-10-18 20:01:51
0 跟貼 0

GPT五代同堂答題，初代成網(wǎng)友白月光

機器之心Pro 2025-08-20 16:13:28
0 跟貼 0

推理的很好下輩子不要再推理了

抽象影視匯 2025-10-16 17:23:35
1 跟貼 1

推理提速4倍！北航、浙大提出動態(tài)拼接，大小模型智能協(xié)作

新智元 2025-10-17 12:32:07
0 跟貼 0

當演出時樂器琴弦斷了…… 這段表演堪稱教科書級救場配合！

新華社 2025-10-18 07:53:24
134 跟貼 134

幣圈又出大洋相：價值300萬億美元的PayPal穩(wěn)定幣被錯誤鑄造

財聯(lián)社 2025-10-16 19:40:14
251 跟貼 251

程序員試用期被辭退，為何整個軟件團隊都覺得他不冤，拍手稱快？

程序員古耕 2025-10-16 23:49:16
5 跟貼 5

男人用一串代碼重啟整個世界

小妹撩劇 2025-10-18 15:41:37
1 跟貼 1

再不瘋狂就老了

歐克追劇 2025-10-16 08:22:56
1 跟貼 1

通過幾何代理任務增強視覺-語言模型中的空間感知和推理能力

機器之心Pro 2025-10-17 13:43:55
0 跟貼 0

機器人跳舞時差點撞上，還好工作人員及時拉開，網(wǎng)友：感覺像是代碼寫死的

逛吃青島 2025-10-17 19:44:20
16 跟貼 16

被判死刑愿意捐獻554億，她所做的一切只為活命，如今結(jié)局如何

君笙的拂兮 2025-10-18 22:25:50
0 跟貼 0

民政局回應老人扎堆領(lǐng)結(jié)婚證，沖上熱搜

極目新聞 2025-10-18 10:30:35
17646 跟貼 17646

GPT-5編程成績有貓膩！自刪23道測試題，關(guān)鍵基準還是自己提的

量子位 2025-08-12 13:12:51
15 跟貼 15

日常“離譜”小劇場：笑到肚子痛的真實瞬間

李晨云 2025-10-18 19:00:03
1 跟貼 1

云南的底層代碼

小栗子哥 2025-10-17 16:53:58
5 跟貼 5

Claude Code 被任意代碼執(zhí)行攻擊的視頻演示

機器之心Pro 2025-09-23 10:44:09
0 跟貼 0

真正的智能體軟件工程師：OpenAI研發(fā)A-SWE能寫代碼、測試質(zhì)量、修復Bug

量子位 2025-04-14 19:04:43
0 跟貼 0

看到這張圖獨生子女都沉默了

主持人郝韻 2025-10-17 19:52:20
0 跟貼 0

硬核推理迷應該會很喜歡的偵探游戲！

夢電大表哥 2025-10-18 11:58:05
0 跟貼 0

當織物邂逅代碼，以數(shù)字技術(shù)編織未來之衣

中國美術(shù)學院 2025-10-17 23:26:30
0 跟貼 0

假冒失聯(lián)女童爸爸媽媽，假冒賬號不能只靠“丁一的爸爸”辟謠

評底郭 2025-10-18 22:52:56
0 跟貼 0

山東濟南競賽題目解方程，構(gòu)造零零模型求a和b的值

三樂大掌柜 2025-10-15 11:43:45
1 跟貼 1

顏水成團隊等聯(lián)合發(fā)布PaDT多模態(tài)大模型：實現(xiàn)真正多模態(tài)表征輸出

機器之心Pro 2025-10-16 12:07:31
1 跟貼 1

數(shù)學小知識:一半模型一半思維小學數(shù)學思維訓

噗噗小露西 2025-10-17 07:33:26
0 跟貼 0

胖到走路要拄拐，李湘近照曝光，給人一種又精致又土的感覺

大拿娛鑒 2025-10-18 20:41:34
1 跟貼 1

正式退出，平野美宇發(fā)聲，做出選擇，長居西安，日本一姐計劃曝光
樂聊球
2025-10-18 10:57:10

全員惡人！《命懸一生》大結(jié)局，是今年看過最意想不到的大結(jié)局
手工制作阿殲
2025-10-18 05:37:54

別再信電車省錢鬼話了！6年車主:電池沒壞，錢包卻被這3筆錢掏空
三農(nóng)老歷
2025-10-16 06:43:46

完蛋！iPhone 17 Pro 氧化變色問題越來越嚴重了
XCiOS俱樂部
2025-10-18 22:14:26

“可憐”的澤連斯基，又被特朗普“戲弄”了
三毛看世界
2025-10-18 20:51:37

原來只有圈子里的人才知道這些小秘密！看網(wǎng)友們的透露，長見識了
另子維愛讀史
2025-10-17 21:14:45

2026年，給12生肖的特別提醒。
蘇米星座館
2025-10-18 08:07:17

年輕女孩家中進賊，被先劫財后劫色，最終竟選擇原諒竊賊……
極品小牛肉
2025-04-16 14:27:47

李亞鵬的母親凌碧：已81歲，倆兒子都是老賴，曾和王菲爆發(fā)沖突
葉公子
2025-10-18 00:05:13

4-1，26歲上海海港舊將黃振飛凌空斬，率隊終結(jié)2輪不勝+排名第4
凌空倒鉤
2025-10-18 18:16:14

在軍營維修電臺15年，退役前夜發(fā)現(xiàn)一臺廢機有神秘信號！
今天說故事
2025-09-23 18:19:43

長腿格格停工去國外陪生病前男友
毒舌扒姨太
2025-10-17 22:36:24

9萬家農(nóng)家樂倒閉！農(nóng)家樂為啥樂不起來了？背后4個原因，太扎心
小談食刻美食
2025-10-09 16:09:02

外媒爆：烏消息人士稱，澤連斯基向特朗普展示了俄羅斯境內(nèi)潛在打擊目標地圖
環(huán)球網(wǎng)資訊
2025-10-18 09:16:31

中美關(guān)系為何變得這么差？你看當年布熱津斯基說了些啥，太現(xiàn)實了
樂天閑聊
2025-10-16 11:51:10

百億名媛41歲生日大曬幸福，獲豪門老公深情表白：永遠感謝有你
粵睇先生
2025-10-18 20:53:16

日本自民黨與維新會就結(jié)盟基本達成一致
財聯(lián)社
2025-10-18 20:08:04

笑死，旅行后你對哪個城市祛魅了？網(wǎng)友冒著得罪本地人的風險吐槽
另子維愛讀史
2025-10-14 23:43:01

防蚊不力，廣州一區(qū)立案670宗，罰款24.9萬元
極目新聞
2025-10-18 08:54:48

沉默5天后，歐盟對華攤牌；決定跟美并肩作戰(zhàn)，展現(xiàn)強大的實力
小蜜情感說
2025-10-18 11:39:06

2025-10-18 23:39:00