夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

<abbr id="oqsxp"><samp id="oqsxp"></samp></abbr>

<sub id="oqsxp"></sub>

<nav id="oqsxp"><fieldset id="oqsxp"></fieldset></nav>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴(yán)選
郵箱大師
網(wǎng)易云課堂

注冊免費郵箱

注冊VIP郵箱（特權(quán)郵箱，付費）
免費下載網(wǎng)易官方手機(jī)郵箱應(yīng)用

移動端
網(wǎng)易公開課
網(wǎng)易嚴(yán)選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

Karpathy盛贊「環(huán)境中心」！AGI最后一塊拼圖開源，大廠豪擲百萬鎖死

2025-08-29 09:44:27　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：桃子艾倫

【新智元導(dǎo)讀】強(qiáng)化學(xué)習(xí)核心是什么？Karpathy一語道破——環(huán)境。全新開源Environments Hub橫空出世，為強(qiáng)化學(xué)習(xí)訓(xùn)練帶去革命性突破。

強(qiáng)化學(xué)習(xí)時代，什么最重要？

Karpathy給出了答案，環(huán)境！只有環(huán)境，才能讓LLM真正進(jìn)行交互、執(zhí)行動作、觀察結(jié)果。

如今，一個開源的環(huán)境中心——Environments Hub正式登場了，它由一家專注于去中心化AI開發(fā)公司Prime Intellect發(fā)布。

一直以來，RL環(huán)境是割裂的、封閉的，甚至難以共享。

但有且只有環(huán)境，定義了世界、規(guī)則，以及「狀態(tài)—動作—獎勵」的反饋閉環(huán)。

從游戲到編程，再到聊天對話，它們是AI學(xué)習(xí)發(fā)生的場景。沒有它們，RL只是一套無從著力的算法。

Environments Hub的誕生，能夠讓任何人模擬出各種各樣、高質(zhì)量的環(huán)境，為開源AGI做出貢獻(xiàn)。

AI智能體交互，缺的是環(huán)境

RL環(huán)境，是智能體學(xué)習(xí)的試驗場。

回想一下，在預(yù)訓(xùn)練時代，互聯(lián)網(wǎng)數(shù)據(jù)是核心。LLM主要通過大量多樣，且高質(zhì)量的數(shù)據(jù)來學(xué)習(xí)。

到了監(jiān)督微調(diào)階段，重點變成了「對話數(shù)據(jù)」。

人們會雇傭外包團(tuán)隊，來為問題創(chuàng)建答案，類似Stack Overflow、Quora平臺的模式，但又專為LLM使用場景而設(shè)計。

如今到了強(qiáng)化學(xué)習(xí)時代，前兩個階段不會消失，但不同的是，環(huán)境成為了重心。

這些環(huán)境，可以用于模型訓(xùn)練，也可用于評估。不過，問題在于，如何創(chuàng)建出豐富多樣的環(huán)境？

Karpathy回憶道，OpenAI最早的一個項目Gym，一個希望用統(tǒng)一框架去構(gòu)建大規(guī)模環(huán)境集合。

GitHub地址：https://github.com/openai/gym

不過，這都是近十年前，大模型還未興起的項目了。所以，當(dāng)時的環(huán)境，都是一些簡單的經(jīng)典控制任務(wù)，比如cartpole、ATARI之類的。

而現(xiàn)在，Environments Hub是一個專門針對LLM構(gòu)建的版本。

Karpathy激動地表示，「這是個非常棒的努力和想法」。今年初，他還發(fā)文建議過有人應(yīng)該做類似的事情。

Environments Hub有個特點，一旦框架構(gòu)建完成，原則上社區(qū)和行業(yè)就可以在不同領(lǐng)域并行開發(fā)。

而且，環(huán)境和智能體交互的方向，是下一個未來。

大廠斥資幾百萬，搞出圍墻花園

為什么需要打造一個Environments Hub呢？

目前，多數(shù)強(qiáng)化學(xué)習(xí)環(huán)境是由初創(chuàng)公司構(gòu)建，并將其出售給少數(shù)幾家不對外開放的大型實驗室。

如果高質(zhì)量的學(xué)習(xí)環(huán)境一直保持封閉且昂貴，開源模型將進(jìn)一步落后于閉源模型。

要想扭轉(zhuǎn)這種局勢，需要有一個強(qiáng)大的開源學(xué)習(xí)環(huán)境和訓(xùn)練工具生態(tài)系統(tǒng)能崛起。

Environments Hub正是承載著這個使命應(yīng)運而生，旨在讓下一波初創(chuàng)公司和AI的發(fā)展能夠構(gòu)建于開放的基礎(chǔ)設(shè)施和開源模型之上。

核心功能，一鍵生成評估報告

總結(jié)來說，Environments Hub具備了以下功能亮點：

通過Hub或CLI（命令行）拉取、推送并管理環(huán)境
生成跨模型的評測報告
與verifiers框架深度集成
prime-rl訓(xùn)練器原生支持環(huán)境
提供用于代碼執(zhí)行的原生沙箱支持

你可以創(chuàng)建、管理和共享用于強(qiáng)化學(xué)習(xí)及評估的環(huán)境：

可以為不同模型創(chuàng)建和瀏覽環(huán)境評估報告：

可擴(kuò)展訓(xùn)練器prime-rl原生支持這些環(huán)境：

還有沙盒功能，可直接與Verifier Environments對接，以實現(xiàn)安全的代碼執(zhí)行。

如果還有你需求的功能沒有滿足，你也可以親自作為該開源項目開發(fā)者去貢獻(xiàn)代碼。

下一步：全棧式開源AGI基礎(chǔ)設(shè)施

過去幾個月中，Environments Hub將基于Agent的強(qiáng)化學(xué)習(xí)訓(xùn)練擴(kuò)展到規(guī)模最大的開源模型，并取得了顯著進(jìn)展。

隨著眾多眾包環(huán)境被引入INTELLECT-3，訓(xùn)練出一個完全開放、最先進(jìn)的Agent模型將成為可能。

除此之外，Environments Hub關(guān)心的重點是，讓人人都能用上這套基礎(chǔ)設(shè)施，使研究人員和初創(chuàng)公司都能為自己的任務(wù)訓(xùn)練模型、集成工具、運行強(qiáng)化微調(diào)，以及優(yōu)化Agent支撐框架。

prime-rl的整個技術(shù)棧都是開源的，正在擴(kuò)展到全球的計算資源上無縫運行。

強(qiáng)化學(xué)習(xí)不僅是通往AGI的必經(jīng)之路，也是構(gòu)建AI原生產(chǎn)品的基礎(chǔ)。

未來最成功的初創(chuàng)公司，將是那些能根據(jù)自身需求，創(chuàng)造出差異化環(huán)境的公司。

如今，最大的障礙并非獲取強(qiáng)大模型，而在于大規(guī)模訓(xùn)練和部署它們所需的基礎(chǔ)設(shè)施及成本。

通過降低這一門檻，Environments Hub旨在為所有AI構(gòu)建者提供廉價、無縫的計算、推理和訓(xùn)練資源，以及全套的強(qiáng)化學(xué)習(xí)基礎(chǔ)設(shè)施。

參考資料：

https://www.primeintellect.ai/blog/environments

https://x.com/karpathy/status/1960803117689397543

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

天才還是賭徒？23歲的Aschenbrenner與AI的終極博弈

虎嗅APP 2025-08-22 02:32:22
1 跟貼 1
LLM把簡單任務(wù)復(fù)雜化，Karpathy無語：有些任務(wù)無需那么多思考

機(jī)器之心Pro 2025-08-12 11:16:52
0 跟貼 0

純國產(chǎn)智能體產(chǎn)品MasterAgent 一句話生成智能體集群

量子位 2025-07-29 18:00:26
0 跟貼 0

圓桌對話：軟件還是硬件——人工智能的下一個熱點 | 36氪2025AI Partner百業(yè)大會

36氪 2025-08-29 13:46:46
3 跟貼 3
ChatGPT智能體來了：自己操作電腦干活，接管你的電腦，自動執(zhí)行各種任務(wù)

量子位 2025-07-18 18:08:35
0 跟貼 0

AGI時代的教育我們應(yīng)該學(xué)什么？

經(jīng)濟(jì)觀察報 2025-05-09 15:41:04
0 跟貼 0

智能體是讓大模型技術(shù)在業(yè)界落地產(chǎn)生價值的重要形態(tài)

每日經(jīng)濟(jì)新聞 2025-07-29 13:43:51
0 跟貼 0
華裔女學(xué)霸揭秘Claude Code，一人帶六個AI開干！編程范式徹底被顛覆

新智元 2025-08-30 12:54:01
1 跟貼 1

“數(shù)據(jù)決定大模型性能上限”！國家數(shù)據(jù)局呼吁全社會強(qiáng)化數(shù)據(jù)要素價值認(rèn)同

財聯(lián)社 2025-08-29 20:41:08
1 跟貼 1
宇樹機(jī)器人復(fù)雜環(huán)境穩(wěn)定起立，速度不亞于人類

量子位 2025-04-09 10:10:32
218 跟貼 218
AI自己給自己當(dāng)網(wǎng)管，實現(xiàn)安全“頓悟時刻”，風(fēng)險率直降9.6%

量子位 2025-06-13 17:03:41
0 跟貼 0
工廠大腦調(diào)度、Agent指揮、機(jī)器人協(xié)同作業(yè)，美的建了全球首個智能體工

36氪 2025-08-29 20:53:41
0 跟貼 0
不愧是中國機(jī)器人，乒乓打得太6了

量子位 2025-08-30 16:56:40
0 跟貼 0
吳恩達(dá)最新來信：是時候關(guān)注并行智能體了

量子位 2025-08-30 17:02:12
0 跟貼 0
被低估的GPT-5！OpenAI給7億人解鎖最強(qiáng)AI，大眾智能一夜撕裂舊秩序

新智元 2025-08-30 19:40:33
0 跟貼 0
發(fā)力存算網(wǎng)協(xié)同，運營商如何在存力上做文章？

通信世界 2025-07-21 20:45:37
4 跟貼 4
人機(jī)編程大戰(zhàn)，人類苦戰(zhàn)三天險勝OpenAI

機(jī)器之心Pro 2025-07-18 18:21:43
0 跟貼 0
超算互聯(lián)網(wǎng)上線開源AI社區(qū)！模型+數(shù)據(jù)+算力，一站式解決

量子位 2025-06-23 20:07:47
0 跟貼 0
ACI.dev能一站直連600+工具，讓你的智能體秒變?nèi)芡酰?/a>

機(jī)器之心Pro 2025-04-30 17:13:00
0 跟貼 0
Scale AI 創(chuàng)始人談AI：智能體部署最后10%太難，還需人類兜底

機(jī)器之心Pro 2025-06-23 20:20:02
0 跟貼 0
螞蟻數(shù)科AI技術(shù)負(fù)責(zé)人：未來要靠智能體原生大模型

機(jī)器之心Pro 2025-08-04 15:47:29
0 跟貼 0
可怕的深海鉆井平臺，工作年薪百萬卻無人問津！

第X個構(gòu)想 2025-08-29 16:16:30
123 跟貼 123
超豪華配置！中國裝甲平臺全配相控陣?yán)走_(dá)，9月3日震撼世界

軍事作家陳曦 2025-08-30 16:24:31
0 跟貼 0
牛彈琴：美國又使陰招了這是全世界的恥辱

現(xiàn)代快報 2025-08-30 08:47:25
20913 跟貼 20913
中國核航母震撼亮相：新型六代艦載平臺曝光，力壓福特級！

時光會帶走回憶 2025-08-30 05:49:24
0 跟貼 0
烏克蘭對中國幫助有多大？其轉(zhuǎn)讓的技術(shù)，成就中國軍工新高度！

平方秒和立方噸 2025-08-30 02:17:20
0 跟貼 0
“老梁點評《南京照相館》，沈逸老師一段話打臉！”

Maki小姬 2025-08-30 08:43:48
2653 跟貼 2653
沒開冷卻液吃刀太多，干鋁也不敢這么干，不用看你就知道編程出錯

搞笑笑大片 2025-08-29 16:35:38
1 跟貼 1
蔣介石晚年評價義兄馮玉祥，見利忘義視權(quán)如命，比三姓家奴尤甚

南極狼人 2025-08-29 20:10:29
8629 跟貼 8629
造福or替代程序員？實測阿里新模型

虎嗅APP 2025-07-23 22:42:47
16 跟貼 16
這環(huán)境太哇塞了，40公分水深藏大鯽魚，還能看到魚草根

草根釣魚 2025-08-27 09:01:36
1 跟貼 1
烏克蘭開放18至22歲男性離境大批烏青年排隊20小時出國

海外網(wǎng) 2025-08-30 10:32:15
4130 跟貼 4130
我老了如果這樣，請路人看見我打死我，絕對不要賠償

湛藍(lán)笑談生活 2025-08-29 18:26:19
8809 跟貼 8809
為什么程序員喜歡在代碼里面寫臟話？

beebee 2025-08-12 11:11:07
4 跟貼 4
日本干涉九三閱兵介文汲：讓中國人認(rèn)清日本野心不死

看看新聞Knews 2025-08-29 15:40:37
2826 跟貼 2826
“稀世珍寶”再現(xiàn)我方，多國想用先進(jìn)技術(shù)換購，我方都沒同意

一飲山河 2025-08-30 11:52:13
0 跟貼 0
這是什么舞蹈，真的太模型了，這腿部動作看著挺難的！

歡樂杠精 2025-08-28 17:01:08
1 跟貼 1
100行代碼打造迷你編程Agent：修復(fù)65%真項目bug，適配所有大模型

量子位 2025-07-27 20:32:11
0 跟貼 0
西安出臺新停車收費管理辦法及收費標(biāo)準(zhǔn)，2025年9月1日起執(zhí)行

極目新聞 2025-08-30 16:37:13
107 跟貼 107
再訪少林寺：千年古剎的變與不變

極目新聞 2025-08-28 20:45:16
2187 跟貼 2187

戲子誤國！國家出手后，人民日報點名的這3位明星永無出頭之日

戲子誤國！國家出手后，人民日報點名的這3位明星永無出頭之日

不八卦掌門人

2025-07-25 21:56:46

大量臺風(fēng)黑線突然出現(xiàn)，9月臺風(fēng)要大爆發(fā)了嗎？超算：或至少有3個

大量臺風(fēng)黑線突然出現(xiàn)，9月臺風(fēng)要大爆發(fā)了嗎？超算：或至少有3個

中國氣象愛好者

2025-08-30 18:38:15

紅杉資本：AI正在引領(lǐng)一場價值10萬億美元的革命，比工業(yè)革命更宏大

紅杉資本：AI正在引領(lǐng)一場價值10萬億美元的革命，比工業(yè)革命更宏大

華爾街見聞官方

2025-08-29 11:52:26

調(diào)查發(fā)現(xiàn)：高血脂患者若常吃西紅柿，過不了多久，身體或有4改善

調(diào)查發(fā)現(xiàn)：高血脂患者若常吃西紅柿，過不了多久，身體或有4改善

泠泠說史

2025-08-30 17:31:49

汪雨官宣結(jié)婚引熱議！前妻王菲菲近照曝光，變化大看著發(fā)福又憔悴

汪雨官宣結(jié)婚引熱議！前妻王菲菲近照曝光，變化大看著發(fā)福又憔悴

鑫鑫說說

2025-08-30 10:18:45

合肥多所幼兒園關(guān)停！

合肥多所幼兒園關(guān)停！

肥東論壇

2025-08-30 05:30:41

男子在甘肅張掖七彩丹霞景區(qū)翻護(hù)欄下山撿相機(jī)！當(dāng)?shù)匚穆镁郑翰閷嵑髸Ξ?dāng)事人做出處理，踩踏未造成太大影響

男子在甘肅張掖七彩丹霞景區(qū)翻護(hù)欄下山撿相機(jī)！當(dāng)?shù)匚穆镁郑翰閷嵑髸Ξ?dāng)事人做出處理，踩踏未造成太大影響

臺州交通廣播

2025-08-30 16:37:55

廣州男籃：尊重崔永熙的選擇，我們愿做他職業(yè)生涯的守望者

廣州男籃：尊重崔永熙的選擇，我們愿做他職業(yè)生涯的守望者

懂球帝

2025-08-30 13:35:58

下午18點，CCTV5直播！中國女排穩(wěn)贏法國，晉級八強(qiáng)？請拭目以待

下午18點，CCTV5直播！中國女排穩(wěn)贏法國，晉級八強(qiáng)？請拭目以待

侃球熊弟

2025-08-30 00:19:22

“清華兒子，就這德行”，男生不愿站起來送爸媽，評論區(qū)吵起來了

“清華兒子，就這德行”，男生不愿站起來送爸媽，評論區(qū)吵起來了

熙熙說教

2025-08-27 20:20:14

688089，重大資產(chǎn)重組終止！

688089，重大資產(chǎn)重組終止！

證券時報e公司

2025-08-30 10:50:20

莫迪硬抗，石破茂和李在明也不跪了！憤怒的特朗普，2周內(nèi)有動作

莫迪硬抗，石破茂和李在明也不跪了！憤怒的特朗普，2周內(nèi)有動作

歷史求知所

2025-08-29 18:45:03

記者：利物浦與紐卡深入談判伊薩克轉(zhuǎn)會，預(yù)計明日達(dá)全面協(xié)議！

記者：利物浦與紐卡深入談判伊薩克轉(zhuǎn)會，預(yù)計明日達(dá)全面協(xié)議！

直播吧

2025-08-30 19:46:18

德約科維奇：對身體的擔(dān)憂程度前所未有

德約科維奇：對身體的擔(dān)憂程度前所未有

全網(wǎng)球APP

2025-08-30 18:20:22

為國爭光卻遭郎平棄用！轉(zhuǎn)身奔走土耳其的王一梅，如今過得咋樣？

為國爭光卻遭郎平棄用！轉(zhuǎn)身奔走土耳其的王一梅，如今過得咋樣？

說歷史的老牢

2025-08-28 15:04:34

青島海關(guān)查獲爆炸式鉚釘1.8萬個

青島海關(guān)查獲爆炸式鉚釘1.8萬個

閃電新聞

2025-08-29 12:39:12

“萬花叢中一點黑”，大學(xué)舉牌學(xué)姐火了，網(wǎng)友：這個學(xué)院沒人了嗎

“萬花叢中一點黑”，大學(xué)舉牌學(xué)姐火了，網(wǎng)友：這個學(xué)院沒人了嗎

妍妍教育日記

2025-08-29 19:13:08

7.7GB！澎湃OS3 首輪推送已經(jīng)到位老手機(jī)淘汰有點可惜

7.7GB！澎湃OS3 首輪推送已經(jīng)到位老手機(jī)淘汰有點可惜

小蜜情感說

2025-08-30 18:51:56

FDA發(fā)警告信，點名兩家中國檢測機(jī)構(gòu)

FDA發(fā)警告信，點名兩家中國檢測機(jī)構(gòu)

藥研網(wǎng)

2025-08-29 11:44:49

用肉身擋違法逃逸鐵騎被撞飛的香港公務(wù)員終于被無罪釋放了！死者女友表示不服：對調(diào)查結(jié)果還是很憤怒！

用肉身擋違法逃逸鐵騎被撞飛的香港公務(wù)員終于被無罪釋放了！死者女友表示不服：對調(diào)查結(jié)果還是很憤怒！

澳門月刊

2025-08-29 17:03:13

AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代

13353文章數(shù) 66138關(guān)注度

往期回顧全部

科技要聞

李斌內(nèi)部講話：蔚來四季度必須盈利

頭條要聞

沙利文麻了:4年白干當(dāng)初拉的盟友現(xiàn)在罵美國是"馬桶"

頭條要聞

沙利文麻了:4年白干當(dāng)初拉的盟友現(xiàn)在罵美國是"馬桶"

體育要聞

淘汰曼聯(lián)的英乙隊，仍然沒有忘記張恩華

娛樂要聞

吳京風(fēng)波拉出多位明星

財經(jīng)要聞

美上訴法院裁定特朗普關(guān)稅非法！

汽車要聞

輔助駕駛新賽道理想VLA司機(jī)大模型即將全量推送

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

健康

房產(chǎn)

游戲

數(shù)碼

早秋最美の6件襯衫，撩到你腿軟！

精神科專家解答學(xué)習(xí)困難七大問題

房產(chǎn)要聞

顛覆認(rèn)知！?？谡嬲暮勒髌?，終于出現(xiàn)了！

《生化9》為何重返浣熊市制作人奇妙“電飯煲比喻”

數(shù)碼要聞

全球首發(fā)：華凌、海思推出行業(yè)首款通過開源鴻蒙認(rèn)證的家用空調(diào)

© 1997-2025 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權(quán)投訴

無障礙瀏覽進(jìn)入關(guān)懷版日韩在线视频线观看一区| 久久国内精品自在自线波多野结氏| 中国乱伦一、二、三区| 国产在线精品懂的| 中文字幕无码免费久久99| 亚洲欧美日韩va| 日本午夜精品一区二区三区电影| 久久精品国产亚洲av麻豆软件| 欧美丰满性久久久久久久| 野花日本大全免费观看2019| 老少交欧美另类| 色色色国产av| 成人动漫久久久| 久久亚洲精品人成综合网| 欧美丰满熟妇bbbbbb百度 | 西方毛多老妇女作爱| 久久久久久久久亚州| 69久久国产露脸精品国产| 孕妇仑乱a级毛片免费看 | 国产偷国产偷亚洲清高孕妇| 波多野结衣高清av| 国产精品久久AV无码| 精品久久久久久无码专区不卡| 蜜桃高清无码在线观看| 777米奇影院狠狠色| 熟女露脸嗷嗷叫| 欧美在线看片a免费观看| 性一交一乱一伦| 亚洲av综合av成人小说| 无码毛片一区二区本码视频| 国产大片91精品免费看3| 好吊妞**欧美| 最刺激的仑乱在线播放| 久久亚洲AV成人一二三区| 国产在线一在线二| 手机看片日本| 亚洲无码中文字幕人邻| 久久夜色精品久久噜噜亚| 色影激情在线免费视频| 俺也去淫淫网| 国产欧美精品一区二区三区四区 |

^{<blockquote id="8ohlr"><rt id="8ohlr"></rt></blockquote>}

<sub id="8ohlr"><rt id="8ohlr"></rt></sub>

<legend id="8ohlr"><track id="8ohlr"></track></legend>

<big id="8ohlr"><code id="8ohlr"><video id="8ohlr"></video></code></big>

<style id="8ohlr"></style>

<sub id="8ohlr"></sub>