夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

顛覆行業(yè)!僅29.4萬美元,DeepSeek R1超低訓(xùn)練成本登上《自然》封面

0
分享至

關(guān)注我們 設(shè)為星標(biāo)

中國 AI 新創(chuàng)公司 DeepSeek 低成本模型登《自然》 29 萬美元訓(xùn)練成本引全球熱議

中國人工智能新創(chuàng)企業(yè)深度求索(DeepSeek)近日在頂尖學(xué)術(shù)期刊《自然》(Nature)發(fā)表的論文中披露,其專注于推理能力的 R1 模型訓(xùn)練成本僅為 29.4 萬美元。這一數(shù)字不僅遠(yuǎn)低于美國競爭對手 OpenAI 所公布的數(shù)億美元級別成本,更標(biāo)志著全球首個通過權(quán)威期刊同行評審的大型語言模型正式誕生,引發(fā)科技界對 AI 研發(fā)范式的重新思考。

里程碑式突破:登上《自然》封面

9 月 17 日,DeepSeek 的研究論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》登上《自然》封面,通訊作者為公司創(chuàng)始人梁文鋒。這距離該公司今年 1 月在 arXiv 平臺發(fā)布預(yù)印版論文引發(fā)熱議已過去 8 個月,經(jīng)過全球頂尖科學(xué)家的嚴(yán)苛同行評審后,這份研究成果的含金量獲得學(xué)術(shù)界公認(rèn)。

論文首次公開了 R1 模型的詳細(xì)訓(xùn)練成本與技術(shù)細(xì)節(jié):該模型使用 512 顆英偉達(dá) H800 芯片組成的計算集群,經(jīng)過 80 小時訓(xùn)練完成,總成本控制在 29.4 萬美元。《自然》在封面推薦中特別指出,該研究揭示了 "在極少人工輸入下訓(xùn)練模型進(jìn)行推理" 的突破性方法,即通過強(qiáng)化學(xué)習(xí)讓模型在正確解答數(shù)學(xué)問題時獲得獎勵,從而自主發(fā)展出逐步推理能力。

這一成果顛覆了行業(yè)對大模型研發(fā)的認(rèn)知。相比之下,OpenAI 首席執(zhí)行官薩姆?奧爾特曼(Sam Altman)2023 年曾透露,其基礎(chǔ)模型訓(xùn)練成本 "遠(yuǎn)超過 1 億美元",而 Anthropic 首席執(zhí)行官達(dá)里奧?阿莫迪(Dario Amodei)更預(yù)測未來三年 AI 模型訓(xùn)練成本可能飆升至 1000 億美元。美國消費(fèi)者新聞與商業(yè)頻道(CNBC)評價稱,DeepSeek 的成本控制 "令人震驚","已經(jīng)推翻了只有擁有最先進(jìn)芯片的國家才能在 AI 競賽中占據(jù)主導(dǎo)地位的假設(shè)"。


當(dāng)期《自然》雜志封面技術(shù)革新:無監(jiān)督強(qiáng)化學(xué)習(xí)的成本革命

DeepSeek 的低成本突破源于其開創(chuàng)性的技術(shù)路徑。論文詳細(xì)闡述了一種無需依賴大量人工標(biāo)注數(shù)據(jù)的訓(xùn)練方法 —— 通過純粹的強(qiáng)化學(xué)習(xí)(RL)激發(fā)模型的復(fù)雜推理能力,而非傳統(tǒng)方法中必須先用人類解題步驟進(jìn)行監(jiān)督微調(diào)(SFT)。

該團(tuán)隊(duì)開發(fā)的群組相對策略優(yōu)化(GRPO)算法無需使用與策略模型同等規(guī)模的評估模型,直接從群組分?jǐn)?shù)中估算基線,大幅降低了計算資源需求。研究顯示,模型在訓(xùn)練過程中自發(fā)發(fā)展出動態(tài)調(diào)整思考時間、自我反思修正甚至探索多種解題路徑等高級行為,其中 "頓悟時刻"(Aha Moment)的出現(xiàn)尤為引人注目 —— 模型在訓(xùn)練中期學(xué)會了通過重新評估初始方法來合理分配思考時間。

在工程實(shí)現(xiàn)上,DeepSeek 采用了 "基座模型 + 強(qiáng)化學(xué)習(xí)" 的漸進(jìn)式方案:首先利用 A100 芯片完成小規(guī)模模型的實(shí)驗(yàn)準(zhǔn)備(即 "冷啟動" 階段),隨后在 512 顆 H800 芯片集群上進(jìn)行正式訓(xùn)練。這種分階段優(yōu)化策略既保證了模型性能,又顯著控制了成本。Hugging Face 機(jī)器學(xué)習(xí)工程師路易斯?湯斯頓(Lewis Tunstall)作為論文審稿人證實(shí),其他實(shí)驗(yàn)室已成功復(fù)現(xiàn) R1 模型的效果,證明該方法的普適性。

值得注意的是,該團(tuán)隊(duì)在訓(xùn)練中引入 "語言一致性獎勵" 機(jī)制,通過計算思維鏈(CoT)中目標(biāo)語言單詞的比例來優(yōu)化模型輸出,雖然這導(dǎo)致性能略有下降,但顯著提升了可讀性,體現(xiàn)了技術(shù)取舍中的實(shí)用主義考量。

芯片爭議:特供版硬件與地緣政治博弈

DeepSeek 的低成本宣稱也引發(fā)了關(guān)于技術(shù)合規(guī)性的爭議。論文披露的 H800 芯片是英偉達(dá)公司在美國 2022 年 10 月禁止向中國出口 H100、A100 等高端 AI 芯片后,專為中國市場設(shè)計的特供版產(chǎn)品,其計算能力經(jīng)過調(diào)整以符合美國出口管制要求。

在《自然》論文的補(bǔ)充材料中,DeepSeek 首次承認(rèn)曾在研發(fā)準(zhǔn)備階段使用過 A100 芯片,"用于較小規(guī)模模型的實(shí)驗(yàn)準(zhǔn)備",但強(qiáng)調(diào) R1 模型的最終訓(xùn)練是在 H800 芯片集群上完成。這一細(xì)節(jié)披露正值中美芯片貿(mào)易摩擦升級之際 —— 美國政府今年多次收緊對華 AI 芯片出口限制,而中國商務(wù)部已于 9 月 13 日啟動針對美國集成電路領(lǐng)域歧視性措施的反歧視調(diào)查。

美國企業(yè)和官員此前曾質(zhì)疑,DeepSeek 能否使用性能受限的特供版芯片訓(xùn)練出高性能模型。對此,英偉達(dá)方面曾回應(yīng)稱 DeepSeek 使用的是合法采購的 H800 芯片。行業(yè)分析指出,H800 作為 A100 的替代產(chǎn)品,雖在計算能力上有所降低,但通過集群優(yōu)化和算法創(chuàng)新,仍能支撐先進(jìn) AI 模型的研發(fā),DeepSeek 的實(shí)踐正是這一思路的成功驗(yàn)證。

行業(yè)影響:AI 研發(fā)范式的民主化探索

DeepSeek 的研究成果不僅具有科學(xué)價值,更樹立了 AI 研發(fā)透明化的新標(biāo)桿。論文毫無保留地公開了包括學(xué)習(xí)率、采樣溫度、"每道題嘗試 16 個答案" 等具體參數(shù)設(shè)置,甚至坦誠為解決 "中英夾雜" 問題引入的語言一致性獎勵會略微犧牲模型跑分,這種開放態(tài)度獲得學(xué)術(shù)界高度評價。

俄亥俄州立大學(xué) AI 研究員 Huan Sun 評論道:"經(jīng)歷嚴(yán)格的同行評審,無疑能有效驗(yàn)證模型的可靠性與實(shí)用價值。其他公司也應(yīng)效仿此舉,擺脫發(fā)布會上的驚艷演示和不斷刷新的排行榜分?jǐn)?shù)這種行業(yè)亂象。"

從行業(yè)視角看,R1 模型的成功證明了 "低成本高效研發(fā)" 路徑的可行性。DeepSeek 采用的 "最大量免費(fèi)數(shù)據(jù)預(yù)訓(xùn)練 + 模型自生成數(shù)據(jù)微調(diào)" 策略,與 Meta 的 Llama 系列開源模式形成呼應(yīng),但更進(jìn)一步實(shí)現(xiàn)了頂級性能突破??萍甲稍兙W(wǎng)站 "Tech Space 2.0" 分析指出:"DeepSeek 已經(jīng)改變了游戲規(guī)則,這種節(jié)儉的策略是其他公司目前正在深入研究的模板。"

不過,研究也承認(rèn)模型存在局限性,包括對非中英文查詢可能出現(xiàn)語言混合、對提示詞較敏感以及在長周期驗(yàn)證任務(wù)上提升有限等問題。這些不足恰恰為后續(xù)研究指明了方向,也凸顯了 AI 技術(shù)仍需在開放與規(guī)范中不斷演進(jìn)。

隨著 DeepSeek 的研究登上《自然》封面,全球 AI 競爭正從 "資本密集型" 向 "智力密集型" 轉(zhuǎn)變。29.4 萬美元與數(shù)億美元的成本差距背后,不僅是技術(shù)路線的差異,更預(yù)示著 AI 民主化時代的加速到來 —— 當(dāng)先進(jìn)模型的研發(fā)門檻大幅降低,人工智能技術(shù)的創(chuàng)新活力或?qū)⒌玫角八从械尼尫拧?/p>

報名


注:本次研討會席位有限,因此暫停對院校學(xué)生開放報名,望理解。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
在金正恩的治理下,帶十萬元人民幣去朝鮮生活,能成為土豪嘛?

在金正恩的治理下,帶十萬元人民幣去朝鮮生活,能成為土豪嘛?

風(fēng)到腰彎
2025-04-07 09:23:17
廣東24歲姑娘躺平出租屋!電話謊稱加班瞞父母,回農(nóng)村相親太窒息

廣東24歲姑娘躺平出租屋!電話謊稱加班瞞父母,回農(nóng)村相親太窒息

軒逸阿II
2025-09-26 14:14:10
居委干部不會說上海話,到底是不是個問題?

居委干部不會說上海話,到底是不是個問題?

上海云河
2025-09-25 23:27:52
嚴(yán)世欽,從副廳降為四級調(diào)研員

嚴(yán)世欽,從副廳降為四級調(diào)研員

政知新媒體
2025-09-26 14:30:23
iOS26千萬別亂升級,這2款iPhone沒問題,另外4款別更新

iOS26千萬別亂升級,這2款iPhone沒問題,另外4款別更新

3C毒物
2025-09-25 00:07:56
《灼灼韶華》大結(jié)局:聞知秋害死夏初,二妞殞命,褚韶華孤獨(dú)終身

《灼灼韶華》大結(jié)局:聞知秋害死夏初,二妞殞命,褚韶華孤獨(dú)終身

老吳教育課堂
2025-09-27 07:05:01
向太曝李連杰海嘯逃生細(xì)節(jié):逃生時只顧自己,太摳門不舍得花錢!

向太曝李連杰海嘯逃生細(xì)節(jié):逃生時只顧自己,太摳門不舍得花錢!

小咪侃娛圈
2025-09-26 14:32:58
阿拉法特的錯誤,造成了巴勒斯坦的苦難,中國數(shù)十年前曾勸告未果

阿拉法特的錯誤,造成了巴勒斯坦的苦難,中國數(shù)十年前曾勸告未果

博覽歷史
2025-08-07 17:54:49
炸裂!曝《繁花》編劇秦雯錄音,稱游本昌立人設(shè),內(nèi)容信息量很大

炸裂!曝《繁花》編劇秦雯錄音,稱游本昌立人設(shè),內(nèi)容信息量很大

山河月明史
2025-09-24 12:58:58
美國核潛艇闖入瓊州海峽,我們只用一招,讓其被困7天7夜落荒而逃

美國核潛艇闖入瓊州海峽,我們只用一招,讓其被困7天7夜落荒而逃

睡前講故事
2025-07-17 10:45:07
2勝1負(fù)!東道主奪冠!廣東男籃結(jié)束四大名白酒杯邀請賽

2勝1負(fù)!東道主奪冠!廣東男籃結(jié)束四大名白酒杯邀請賽

德譯洋洋
2025-09-26 12:45:36
太危險!男子酒后在副駕駛睡覺,用“智駕神器”開車20分鐘,法院判了

太危險!男子酒后在副駕駛睡覺,用“智駕神器”開車20分鐘,法院判了

環(huán)球網(wǎng)資訊
2025-09-26 15:16:12
市委書記帶9個警衛(wèi)員回老家,發(fā)現(xiàn)家人被村霸關(guān)鐵籠,他當(dāng)場怒了

市委書記帶9個警衛(wèi)員回老家,發(fā)現(xiàn)家人被村霸關(guān)鐵籠,他當(dāng)場怒了

紅豆講堂
2025-09-24 18:00:13
簽約達(dá)成,恭喜湖人!最后一塊爭冠拼圖,老詹的第5冠要穩(wěn)了

簽約達(dá)成,恭喜湖人!最后一塊爭冠拼圖,老詹的第5冠要穩(wěn)了

籃球掃地僧
2025-09-26 13:27:51
貴州女老師趙慶梅執(zhí)行死刑,22名男生遭毒手,全班僅兩人幸免

貴州女老師趙慶梅執(zhí)行死刑,22名男生遭毒手,全班僅兩人幸免

第四思維
2025-08-26 09:14:41
98年我裝窮回鄉(xiāng),只有小舅家不嫌棄,3日后眾人才知我真實(shí)身份

98年我裝窮回鄉(xiāng),只有小舅家不嫌棄,3日后眾人才知我真實(shí)身份

秋風(fēng)專欄
2025-09-23 11:43:23
斷崖下滑?29歲沃特金斯失點(diǎn)7場0球0助 上賽季17球14助身價6500萬

斷崖下滑?29歲沃特金斯失點(diǎn)7場0球0助 上賽季17球14助身價6500萬

直播吧
2025-09-26 21:44:05
這就是背刺中國的代價?越南被美歐輪番吸血,沒有一國肯幫他

這就是背刺中國的代價?越南被美歐輪番吸血,沒有一國肯幫他

榮亭小吏
2025-09-27 07:02:55
王朔:如果一個善良的人輸了,一定不是輸在智商上,而是輸在...

王朔:如果一個善良的人輸了,一定不是輸在智商上,而是輸在...

清風(fēng)拂心
2025-09-22 13:15:09
搞權(quán)色交易、賭博的李沛福,被逮捕了

搞權(quán)色交易、賭博的李沛福,被逮捕了

政知新媒體
2025-09-26 16:38:05
2025-09-27 08:24:49
EETOP半導(dǎo)體社區(qū) incentive-icons
EETOP半導(dǎo)體社區(qū)
國內(nèi)著名的電子工程師社區(qū)
6766文章數(shù) 15474關(guān)注度
往期回顧 全部

科技要聞

理想i6官宣發(fā)布 24.98萬元起 明日交付

頭條要聞

女子遭丈夫駕車碾壓拖拽8.5米身亡 案件曾進(jìn)行3次尸檢

頭條要聞

女子遭丈夫駕車碾壓拖拽8.5米身亡 案件曾進(jìn)行3次尸檢

體育要聞

金正恩能打NBA嗎?

娛樂要聞

劉德華女兒近照,如今氣質(zhì)神似劉亦菲

財經(jīng)要聞

香港高等法院駁回宗馥莉上訴申請

汽車要聞

5.2米大六座+易三方 騰勢N8L預(yù)售31.98萬元起

態(tài)度原創(chuàng)

房產(chǎn)
游戲
健康
手機(jī)
家居

房產(chǎn)要聞

豪擲100億!海棠灣這個大盤,住宅方案正式曝光!

《仁王3》難度爆表!1769人參與試玩僅70人擊敗BOSS

內(nèi)分泌科專家破解身高八大謠言

手機(jī)要聞

一加15與iQOO 15:新機(jī)配置均已清晰,哪款更具吸引力?

家居要聞

重塑品牌 煙火氣與價值

無障礙瀏覽 進(jìn)入關(guān)懷版 人妻少妇久久久久久97人妻| 中文字幕一二三| 亚洲综合熟女| 啪人妻精品导航| av天堂久久天堂av色综合| 99热精品毛片全部国产无缓冲| 少妇被粗大猛进进出出| 亚洲日韩国产精品第一页一区| 亚洲AV无码国产精品色苹果AV| 亚洲另类无码一区二区三区| 玖玖色资源在线| 亚洲国产精品综合久久网各| 久久丫精品国产亚洲av| 国产精品美女久久久久AV爽李琼 | 97国产精品视频自在拍| 久久亚洲精品成人av无码网站| 色哟哟免费视频一区二区三区| 热99re69精品8在线播放| 国产精品夜色一区二区三区| 免费国产高清在线精品一区| 成人无码视频| 国产久免费热视频在线观看| 国产 中文 亚洲 日韩 欧美| 97国产婷婷综合在线视频| 少妇人妻偷人精品无码视频| 欧美综合不卡在线| 无码中文人妻在线三区| 亚洲国产精品无码久久一线| 91九色丨PORNY丨闺蜜| 国产精品一二三入口播放| 午夜福利成人在线| 日韩无码av毛片| 码无高清成人VV| 国产偷v国产偷v亚洲高清| 久久九九久精品国产| 国产又色又爽又黄的视频在线观看 | 国产一级α片| 亚洲精品成人在线| 激情中文无码| 老年人人人操人人爽| 国产精品麻豆成人AV电影|