夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Karpathy「瘋狂之作」:100美元、4小時,就能訓練你自己的「小型GPT」

0
分享至


新智元報道

編輯:定慧

【新智元導讀】AI傳奇人物、前特斯拉AI總監(jiān)Karpathy重磅推出全新開源項目「nanochat」,以不到8000行代碼復現(xiàn)ChatGPT全流程,只需一臺GPU、約4小時、成本僅百美元。該項目在GitHub上線不到12小時即獲4.2k星標!

AI傳奇人物、前特斯拉AI總監(jiān)Karpathy宣布發(fā)布全新項目nanochat!

一個極簡但完整的「從零構(gòu)建ChatGPT」訓練框架。


Karpathy說這是他寫過的最瘋狂的項目之一!

相當于每個人都可以自己擁有一個專屬的ChatGPT。


項目剛放出還不到12個小時,GitHub星標就破4.2kStar?。ㄟ€在持續(xù)瘋漲中)


GitHub項目:https://github.com/karpathy/nanochat

全是社區(qū)自來水流量,這就是Karpathy在AI領(lǐng)域的號召力!


與早期的nanoGPT不同,nanochat不僅涵蓋預訓練,還囊括了從數(shù)據(jù)準備、預訓練、中期訓練(對話、多項選擇題、工具使用)、SFT、RL微調(diào)到推理部署的全流程。

整個系統(tǒng)僅約8000行干凈代碼,啟動一臺GPU機器、運行一條腳本,4小時后你就能在網(wǎng)頁界面與自己訓練的「小ChatGPT」對話。

Karpathy將其稱為LLM101n的「壓軸之作」,同時也可能成為未來研究基線和開源社區(qū)的實驗平臺。

讓我來仔細看看如何僅僅用8000行來「克隆」ChatGPT:

  • 使用全新的Rust實現(xiàn)訓練分詞器

  • 在FineWeb上對TransformerLLM進行預訓練,評估多個指標下的CORE分數(shù)

  • 在來自SmolTalk的用戶-助手對話、多項選擇題、工具使用數(shù)據(jù)上進行中期訓練

  • 進行SFT,在世界知識多項選擇題(ARC-E/C、MMLU)、數(shù)學(GSM8K)、代碼(HumanEval)上評估聊天模型

  • 使用「GRPO」在GSM8K上對模型進行強化學習微調(diào)(RL)

  • 在帶有KV緩存的引擎中實現(xiàn)高效推理,簡單的預填充/解碼,工具使用(在輕量級沙箱中的Python解釋器),通過CLI或類ChatGPT的網(wǎng)頁界面與其交互。

  • 撰寫一份單一的Markdown成績單,總結(jié)并將整個過程游戲化。

項目全程花費低至約100美元(約在一臺8XH100節(jié)點上訓練4小時)

可以訓練、克隆一個可以對話的小型ChatGPT,它能創(chuàng)作故事/詩歌、回答簡單問題。

只需要訓練約12小時即可超過GPT-2的核心指標

隨著進一步擴展到約1000美元(約41.6小時訓練),模型會迅速變得更連貫,能解決簡單的數(shù)學/代碼問題并做多項選擇題。

訓練24小時的模型(其FLOPs大致相當于GPT-3Small125M,約為GPT-3的1/1000)在MMLU上能進入40分段,在ARC-Easy上進入70分段,在GSM8K上進入20分段等。

總結(jié)一下就是:

  • 100美元→可訓練出一個能寫詩、回答基礎問題的OpenAI同款「小型ChatGPT」;

  • 1000美元→達到近GPT-2以上的表現(xiàn),可做基礎推理與代碼生成。

這個項目體現(xiàn)出他的核心理念:

「降低 LLM 研究與復現(xiàn)門檻,讓每個人都能親手訓練自己的模型?!?/strong>

這種民主化路線,與他在nanoGPT時期倡導的「從零實現(xiàn)Transformer」如出一轍。


項目地址:https://github.com/karpathy/nanoGPT

Karpathy說他的目標是把完整的「強基線」棧整合到一個連貫、極簡、可讀、可修改、可最大化派生的倉庫中。

nanochat將成為LLM101n(仍在開發(fā)中)的壓軸項目。

Karpathy認為nanochat也有可能發(fā)展成一個研究工具或基準,就像之前的nanoGPT一樣。

nanoGPT教你造大腦,nanochat教你造ChatGPT。

如果說nanoGPT是「Transformer源碼教學項目」。

那么,nanochat則是「LLM生態(tài)系統(tǒng)微縮版」、OpenAI同款、你的專屬AI。

二者關(guān)系可理解為「從神經(jīng)網(wǎng)絡基礎到產(chǎn)品級對話系統(tǒng)」的兩步閉環(huán)。

Vibe CodingnanoGPT,再到如今的nanochat,Karpathy不愧是「AI教育者」的最佳代言人。

這一「瘋狂之作」并非狂想,而是Karpathy對AI開放、可學習、可復現(xiàn)理想的又一次踐行。

小型ChatGPT效果展示

Karpathy在WebUI部署了nanochat項目。

他還給出了「與價格為100美元、運行4小時的」nanochat的示例對話。

很……有趣!


下面這張圖展示的是Karpathy在nanochat「$100速度跑」實驗(即只用一臺GPU、約4小時訓練出的ChatGPT 小模型)中生成的「成績單」部分內(nèi)容,說明模型規(guī)模、訓練耗時、以及在各類標準評測上的性能。

  • Characters:333989 —— 代碼總字符數(shù)。

  • Lines:8304 —— 大約 8300 行干凈、注釋良好的代碼。

  • Files:44 —— 工程文件數(shù)量。

  • Tokens:約83,497 —— 代碼中的token數(shù)(大致對應8萬詞)。

  • Dependencies:2004行uv.lock依賴清單 —— 表明依賴極少、項目結(jié)構(gòu)輕。

這些數(shù)字展示了nanochat的「極簡」精神:完整實現(xiàn)了 ChatGPT 的訓練、微調(diào)與推理,卻仍保持在8000行代碼以內(nèi)。


參考資料:

https://x.com/karpathy/status/1977755427569111362

https://github.com/karpathy/nanochat

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
正式退出,平野美宇發(fā)聲,做出選擇,長居西安,日本一姐計劃曝光

正式退出,平野美宇發(fā)聲,做出選擇,長居西安,日本一姐計劃曝光

樂聊球
2025-10-18 10:57:10
全員惡人!《命懸一生》大結(jié)局,是今年看過最意想不到的大結(jié)局

全員惡人!《命懸一生》大結(jié)局,是今年看過最意想不到的大結(jié)局

手工制作阿殲
2025-10-18 05:37:54
別再信電車省錢鬼話了!6年車主:電池沒壞,錢包卻被這3筆錢掏空

別再信電車省錢鬼話了!6年車主:電池沒壞,錢包卻被這3筆錢掏空

三農(nóng)老歷
2025-10-16 06:43:46
完蛋!iPhone 17 Pro 氧化變色問題越來越嚴重了

完蛋!iPhone 17 Pro 氧化變色問題越來越嚴重了

XCiOS俱樂部
2025-10-18 22:14:26
“可憐”的澤連斯基,又被特朗普“戲弄”了

“可憐”的澤連斯基,又被特朗普“戲弄”了

三毛看世界
2025-10-18 20:51:37
原來只有圈子里的人才知道這些小秘密!看網(wǎng)友們的透露,長見識了

原來只有圈子里的人才知道這些小秘密!看網(wǎng)友們的透露,長見識了

另子維愛讀史
2025-10-17 21:14:45
2026年,給12生肖的特別提醒。

2026年,給12生肖的特別提醒。

蘇米星座館
2025-10-18 08:07:17
年輕女孩家中進賊,被先劫財后劫色,最終竟選擇原諒竊賊……

年輕女孩家中進賊,被先劫財后劫色,最終竟選擇原諒竊賊……

極品小牛肉
2025-04-16 14:27:47
李亞鵬的母親凌碧:已81歲,倆兒子都是老賴,曾和王菲爆發(fā)沖突

李亞鵬的母親凌碧:已81歲,倆兒子都是老賴,曾和王菲爆發(fā)沖突

葉公子
2025-10-18 00:05:13
4-1,26歲上海海港舊將黃振飛凌空斬,率隊終結(jié)2輪不勝+排名第4

4-1,26歲上海海港舊將黃振飛凌空斬,率隊終結(jié)2輪不勝+排名第4

凌空倒鉤
2025-10-18 18:16:14
在軍營維修電臺15年,退役前夜發(fā)現(xiàn)一臺廢機有神秘信號!

在軍營維修電臺15年,退役前夜發(fā)現(xiàn)一臺廢機有神秘信號!

今天說故事
2025-09-23 18:19:43
長腿格格停工去國外陪生病前男友

長腿格格停工去國外陪生病前男友

毒舌扒姨太
2025-10-17 22:36:24
9萬家農(nóng)家樂倒閉!農(nóng)家樂為啥樂不起來了?背后4個原因,太扎心

9萬家農(nóng)家樂倒閉!農(nóng)家樂為啥樂不起來了?背后4個原因,太扎心

小談食刻美食
2025-10-09 16:09:02
外媒爆:烏消息人士稱,澤連斯基向特朗普展示了俄羅斯境內(nèi)潛在打擊目標地圖

外媒爆:烏消息人士稱,澤連斯基向特朗普展示了俄羅斯境內(nèi)潛在打擊目標地圖

環(huán)球網(wǎng)資訊
2025-10-18 09:16:31
中美關(guān)系為何變得這么差?你看當年布熱津斯基說了些啥,太現(xiàn)實了

中美關(guān)系為何變得這么差?你看當年布熱津斯基說了些啥,太現(xiàn)實了

樂天閑聊
2025-10-16 11:51:10
百億名媛41歲生日大曬幸福,獲豪門老公深情表白:永遠感謝有你

百億名媛41歲生日大曬幸福,獲豪門老公深情表白:永遠感謝有你

粵睇先生
2025-10-18 20:53:16
日本自民黨與維新會就結(jié)盟基本達成一致

日本自民黨與維新會就結(jié)盟基本達成一致

財聯(lián)社
2025-10-18 20:08:04
笑死,旅行后你對哪個城市祛魅了?網(wǎng)友冒著得罪本地人的風險吐槽

笑死,旅行后你對哪個城市祛魅了?網(wǎng)友冒著得罪本地人的風險吐槽

另子維愛讀史
2025-10-14 23:43:01
防蚊不力,廣州一區(qū)立案670宗,罰款24.9萬元

防蚊不力,廣州一區(qū)立案670宗,罰款24.9萬元

極目新聞
2025-10-18 08:54:48
沉默5天后,歐盟對華攤牌;決定跟美并肩作戰(zhàn),展現(xiàn)強大的實力

沉默5天后,歐盟對華攤牌;決定跟美并肩作戰(zhàn),展現(xiàn)強大的實力

小蜜情感說
2025-10-18 11:39:06
2025-10-18 23:39:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
13648文章數(shù) 66219關(guān)注度
往期回顧 全部

科技要聞

物理學家楊振寧先生逝世

頭條要聞

鄭麗文高票當選國民黨主席 競選時明確"支持一個中國"

頭條要聞

鄭麗文高票當選國民黨主席 競選時明確"支持一個中國"

體育要聞

泰州隊總分9-8點殺南京隊 晉級蘇超決賽

娛樂要聞

陳偉霆何穗無預警官宣結(jié)婚生子

財經(jīng)要聞

特朗普軟了:對華高額關(guān)稅訛詐 不可持續(xù)

汽車要聞

全新領(lǐng)克03家族上市限時售價10.38萬起

態(tài)度原創(chuàng)

本地
藝術(shù)
旅游
時尚
軍事航空

本地新聞

考上警犬專業(yè),我和修勾一起卷編制

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

今年秋天,有這幾件單品就夠了

軍事要聞

國安部:有間諜入住海景民宿偷拍軍港 被老板識破

無障礙瀏覽 進入關(guān)懷版 老司机午夜免费精品视频| 一区二区三区毛aaaa片特级| 精品 交小说全文阅读| 亚洲av男人电影天堂| 国产福利酱国产一区二区| 性爱视频网站国产传媒| 波多野结衣高潮激情视频| 亚洲大成色www永久网站注册| 国产1区二区| 国产又爽又黄又不遮挡视频| 精品免费国偷自产在线视频| 我和漂亮邻居少妇偷晴| 国产伦子沙发午休系列资源曝光| 人人摸人人肏| 成人免费看www网址入口| 看美女逼黄色视频| 日本高清不卡aⅴ免费网站| 二区中文字幕在线观看| 啪啪午夜视频免费观看| 久久狠狠一本精品综合网| 国产成人精品一二区熟女| 色婷婷天天综合在线| 成人 免费视频| 精产国品一二三产区区别麻豆 | 肥熟老熟妇500部视频| 欧美成人黄在线观看| 亚洲少妇淫荡视频| 国产一区专区色| 亚洲性视频之色欲| 人妻天天摸天天爽视频| 国产精品 在线观看| 亚洲国产av玩弄放荡人妇系列| 玖玖玖香蕉精品视频在线观看| 爆插熟女少妇高潮淫语呻吟| 人人妻人人草人人鲁| 亚洲AV无码一区二区三区性色| 日本少妇高潮| 亚洲色无码中文字幕YY51999 | 密臀AV在线| 国产成人久久精品二区三区| 久久嫖妓电影|