夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

剛剛,OpenAI發(fā)布GPT-5-Codex:獨(dú)立工作超7小時(shí),還能審查大型項(xiàng)目

0
分享至



機(jī)器之心報(bào)道

編輯:Panda

凌晨 1 點(diǎn),OpenAI 發(fā)布了GPT-5-Codex

從名字也能看出來,這是針對智能體編程任務(wù)進(jìn)行了專門優(yōu)化的 GPT-5。OpenAI 博客介紹說,GPT-5-Codex 的訓(xùn)練重點(diǎn)放在真實(shí)的軟件工程任務(wù)上。它既能在短時(shí)間的交互式會(huì)話中快速響應(yīng),也能獨(dú)立完成冗長復(fù)雜的任務(wù)。它的代碼審查(code review)能力可以在代碼上線前發(fā)現(xiàn)關(guān)鍵漏洞。



GPT-5-Codex 已經(jīng)在 Codex 的所有使用場景中上線,包括 Codex CLI、IDE 擴(kuò)展、網(wǎng)頁端、移動(dòng)設(shè)備以及 GitHub 中的代碼審查。它是云端任務(wù)和代碼審查的默認(rèn)模型,開發(fā)者也可以通過 Codex CLI 或 IDE 插件,在本地任務(wù)中選擇使用它。順帶一提:Codex 已包含在 ChatGPT 的 Plus、Pro、Business、Edu 和 Enterprise 訂閱中。

發(fā)布兩個(gè)半小時(shí)后,OpenAI CEO 山姆?奧特曼激動(dòng)地表示GPT-5-Codex 的流量已經(jīng)占到了 Codex 流量的 40% 左右,并且他預(yù)計(jì)該模型在今天之內(nèi)就將成為 Codex 的流量主體。



OpenAI 表示:「自從 4 月推出 Codex CLI、5 月推出 Codex Web 以來,Codex 已逐步演變成更高效的編程助手。兩周前,我們把 Codex 整合成一個(gè)統(tǒng)一的產(chǎn)品體驗(yàn),并與 ChatGPT 賬號打通。這樣,你可以無縫切換本地環(huán)境和云端任務(wù),不會(huì)丟失上下文?!?/p>

該模型一發(fā)布就收獲了諸多好評,甚至有人表示這是「自切片面包發(fā)明以來最好的東西」。



OpenAI 已經(jīng)以附錄形式將 GPT-5-Codex 加入了 GPT-5 系統(tǒng)卡。



地址:https://openai.com/index/gpt-5-system-card-addendum-gpt-5-codex/

下面我們就來更詳細(xì)地了解一下 GPT?5-Codex。

GPT?5-Codex

GPT-5-Codex 重點(diǎn)優(yōu)化了在真實(shí)工程場景中的自主式(agentic)軟件工程能力

它接受過完整項(xiàng)目構(gòu)建、功能開發(fā)、測試編寫、調(diào)試、大規(guī)模重構(gòu)和代碼審查等復(fù)雜任務(wù)的訓(xùn)練。相比 GPT-5,它更易于控制,遵循 AGENTS.md 的指令更好,代碼質(zhì)量更高。OpenAI 表示:「你只需要告訴它想要什么,而不用寫冗長的風(fēng)格說明。」

其在 SWE-bench Verified(軟件工程)和 Code refactoring tasks(代碼重構(gòu))兩個(gè)基準(zhǔn)上的準(zhǔn)確度表現(xiàn)都優(yōu)于 GPT-5 (high)。



值得一提的是,OpenAI 在 SWE-bench Verified 上的成績這一次終于使用了該數(shù)據(jù)集中所有的共 500 個(gè)任務(wù),而不是像之前那樣只使用了 477 個(gè)任務(wù)(曾因此備受批評),OpenAI 聲稱之前只使用 477 個(gè)任務(wù)的原因是「有部分任務(wù)無法在基礎(chǔ)設(shè)施上運(yùn)行,而現(xiàn)在這一問題已解決。」

至于另一個(gè)代碼重構(gòu)基準(zhǔn) Code refactoring tasks 則包含許多來自大型成熟軟件庫的重構(gòu)任務(wù),覆蓋 Python、Go、OCaml 等語言。比如 Gitea 的一個(gè) PR,就修改了 232 個(gè)文件、3541 行代碼,為應(yīng)用邏輯引入 ctx 變量。

GPT-5-Codex 不僅性能更優(yōu),也能根據(jù)任務(wù)復(fù)雜度動(dòng)態(tài)調(diào)整思考時(shí)間

它結(jié)合了兩種關(guān)鍵能力:一是與開發(fā)者配合的交互式會(huì)話,二是對長任務(wù)的持久自主執(zhí)行。

在處理小型請求或?qū)υ挄r(shí),GPT-5-Codex 反應(yīng)更快;而在處理復(fù)雜任務(wù)(如大型重構(gòu))時(shí),它能持續(xù)工作更久。OpenAI 表示:「在測試中,我們看到GPT-5-Codex 能獨(dú)立運(yùn)行超過 7 小時(shí),不斷迭代實(shí)現(xiàn)、修復(fù)測試,最終交付可用代碼?!?/p>

OpenAI 還分享了他們的 內(nèi)部使用數(shù)據(jù):

  • 用戶請求中,用戶交互中 token 數(shù)量(包括隱藏的推理和最終的輸出)最少的 10% 情況下,GPT-5-Codex 的 token 消耗比 GPT-5 少 93.7%。
  • 用戶交互中 token 數(shù)量最多的 10% 情況下,它會(huì)投入更多時(shí)間,進(jìn)行更深入的推理、編輯、測試和迭代。



GPT-5-Codex 也專門訓(xùn)練了代碼審查能力,可以主動(dòng)發(fā)現(xiàn)關(guān)鍵漏洞。它會(huì)遍歷代碼庫,分析依賴,并運(yùn)行代碼和測試來驗(yàn)證正確性。OpenAI 用熱門開源項(xiàng)目的最新提交(commit)做了評估,并讓經(jīng)驗(yàn)豐富的工程師進(jìn)行了驗(yàn)證,結(jié)果發(fā)現(xiàn):GPT-5-Codex 的審查意見更少出現(xiàn)錯(cuò)誤或無關(guān)內(nèi)容,更能把注意力集中在關(guān)鍵問題上。



在前端任務(wù)上,GPT-5-Codex 表現(xiàn)可靠。它能生成美觀的桌面應(yīng)用,也在移動(dòng)網(wǎng)站的偏好測試中顯著提升。云端環(huán)境下,它還能讀取你上傳的圖片或截圖,檢查自己的進(jìn)度,并把結(jié)果截圖返回。

GPT-5-Codex 針對 Codex CLI、IDE 插件、云環(huán)境和 GitHub 進(jìn)行了深度優(yōu)化,同時(shí)也支持多種工具調(diào)用。不過 OpenAI 也指出:「與通用的 GPT-5 不同,我們建議只在 Codex 或類似場景下使用 GPT-5-Codex。」

Codex 更新

除了發(fā)布 GPT-5-Codex,OpenAI 今天還宣布了 Codex 的一些升級,包含全新設(shè)計(jì)的 Codex CLI 以及新的 Codex IDE 插件。

Codex CLI

Codex CLI 是開源的。過去幾個(gè)月里,OpenAI 基于社區(qū)反饋重新設(shè)計(jì)了 CLI,讓它更適合「自主編程」的工作流,使模型能成為更強(qiáng)大、更可靠的搭檔。

現(xiàn)在用戶可以在 CLI 中直接添加圖片,例如截圖、線框圖和設(shè)計(jì)圖。這樣可以建立共享上下文,讓設(shè)計(jì)決策更清晰,并更容易得到符合預(yù)期的結(jié)果。

在處理復(fù)雜任務(wù)時(shí),Codex 會(huì)用待辦清單(to-do list)跟蹤進(jìn)度,還支持 web 搜索 和 MCP 等外部系統(tǒng)連接工具,整體的工具調(diào)用更準(zhǔn)確。

終端界面也升級了:工具調(diào)用和代碼差異現(xiàn)在格式更清晰,更容易閱讀。



批準(zhǔn)模式(approval mode)簡化為三種:

  • 只讀:需要明確批準(zhǔn)才能修改;
  • 自動(dòng):擁有完整工作區(qū)權(quán)限,但在工作區(qū)外仍需批準(zhǔn);
  • 完全訪問:可以讀取任意文件,并在有網(wǎng)絡(luò)訪問的情況下運(yùn)行命令。

CLI 還支持壓縮對話狀態(tài),方便管理更長的會(huì)話。

Codex IDE 插件

Codex 也能在 IDE 中直接使用。這個(gè)插件支持 VS Code、Cursor 以及其他 VS Code 分支。它能把 Codex 帶進(jìn)編輯器,讓用戶能無縫預(yù)覽本地改動(dòng),并直接用 Codex 修改代碼。



OpenAI 介紹了在 IDE 中使用 Codex 的幾個(gè)優(yōu)勢:

  • 你可以寫更簡短的提示詞,得到更快的結(jié)果,因?yàn)?Codex 會(huì)自動(dòng)利用上下文,例如你打開的文件或選中的代碼。
  • 你可以在云端和本地環(huán)境之間流暢切換。比如,在編輯器里直接創(chuàng)建云端任務(wù)、跟蹤進(jìn)行中的工作或?qū)彶橐淹瓿傻娜蝿?wù)。
  • 如需要調(diào)整,你可以在 IDE 中直接打開云端任務(wù),Codex 會(huì)保留上下文。

云端的 Codex

除了 CLI 和 IDE 插件,新的 GitHub 集成也讓 Codex 的云端智能體更貼近開發(fā)者的日常工作流。用戶無需離開編輯器或 GitHub,就能把任務(wù)交給 Codex。



OpenAI 表示,他們也一直在幕后不斷提升云端性能,包括:

  • 通過緩存容器(caching containers),新任務(wù)和跟進(jìn)任務(wù)的完成時(shí)間縮短了 90%。
  • Codex 會(huì)自動(dòng)檢測常見的初始化腳本并執(zhí)行,幫你完成環(huán)境配置。
  • 在配置了網(wǎng)絡(luò)權(quán)限后,它還能在運(yùn)行時(shí)執(zhí)行 pip install 等命令,安裝所需依賴。

和 CLI、IDE 一樣,云端 Codex 也支持使用圖片。你可以上傳前端設(shè)計(jì)規(guī)范或 UI bug 截圖。Codex 會(huì)在瀏覽器里運(yùn)行自己生成的內(nèi)容,檢查效果,并把截圖附在任務(wù)或 GitHub PR 中。

代碼審查

Codex 現(xiàn)在也支持代碼審查功能,可以發(fā)現(xiàn)關(guān)鍵缺陷。和靜態(tài)分析工具不同,Codex 會(huì):

  • 對比 PR 的目標(biāo)和實(shí)際改動(dòng),
  • 分析整個(gè)代碼庫和依賴關(guān)系,
  • 運(yùn)行代碼和測試來驗(yàn)證行為。

這種審查力度,通常只有最仔細(xì)的人類工程師才能做到。Codex 正好補(bǔ)上這一缺口,幫助團(tuán)隊(duì)更早發(fā)現(xiàn)問題,減輕審查負(fù)擔(dān),讓上線更放心。



在 GitHub 上啟用后:

  • 當(dāng) PR 從草稿變?yōu)榭蓪彶闋顟B(tài)時(shí),Codex 會(huì)自動(dòng)給出分析。
  • 如果它建議修改,你可以直接在同一討論線程里讓它實(shí)現(xiàn)。
  • 你也可以手動(dòng)請求審查,比如在 PR 里輸入 「@codex review」,甚至給額外指令,如 「@codex review for security vulnerabilities」(檢查安全漏洞)或 「@codex review for outdated dependencies」(檢查過時(shí)依賴)。

OpenAI 表示:「在 OpenAI 內(nèi)部,Codex 已經(jīng)審查了我們絕大多數(shù) PR,每天能發(fā)現(xiàn)數(shù)百個(gè)問題,很多在人工審查開始之前就已經(jīng)被攔下。這讓團(tuán)隊(duì)能更快推進(jìn),同時(shí)保持信心?!?/p>

OpenAI 如何讓 Codex 更安全?

OpenAI 還介紹了在開發(fā) Codex 時(shí)對代碼與數(shù)據(jù)安全的保護(hù)措施,他們也部署了一些防范潛在濫用的手段。

  • 默認(rèn)沙箱環(huán)境:無論本地還是云端,Codex 默認(rèn)運(yùn)行在沙箱環(huán)境中,且關(guān)閉網(wǎng)絡(luò)訪問。這可以避免它在你的電腦上執(zhí)行有害操作,也能減少來自不可信來源的提示詞注入風(fēng)險(xiǎn)。
  • 權(quán)限機(jī)制:在執(zhí)行可能危險(xiǎn)的操作前,Codex 會(huì)請求許可。它也經(jīng)過訓(xùn)練,會(huì)運(yùn)行命令來驗(yàn)證自己的輸出。
  • 可配置的安全設(shè)置:開發(fā)者可以根據(jù)風(fēng)險(xiǎn)承受度調(diào)整設(shè)置。在云端,可以限制網(wǎng)絡(luò)訪問只允許可信域名;在 CLI 和 IDE 插件中,開發(fā)者可以決定是否批準(zhǔn) Codex 運(yùn)行命令,或允許它使用網(wǎng)頁搜索、連接 MCP 服務(wù)器。這樣能擴(kuò)展能力,但也會(huì)增加風(fēng)險(xiǎn)。

OpenAI 也給出了建議:「我們始終建議開發(fā)者在上線前先檢查 Codex 的工作結(jié)果。Codex 會(huì)在每個(gè)任務(wù)中提供引用、終端日志和測試結(jié)果,方便人工驗(yàn)證?!沟?OpenAI 也強(qiáng)調(diào):Codex 應(yīng)作為附加審查者,而不是完全取代人工審查。

和 GPT-5 一樣,OpenAI 依然將 GPT-5-Codex 在生物與化學(xué)領(lǐng)域的任務(wù)歸類為 High 能力,并采取了相應(yīng)的安全措施,以盡量減少潛在風(fēng)險(xiǎn)。

價(jià)格與可用性

Codex 已包含在 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 訂閱中。

  • Plus、Edu、Business 用戶:每周可覆蓋幾次集中的編程會(huì)話。
  • Pro 用戶:支持一整周、多個(gè)項(xiàng)目的完整工作量。
  • Business 計(jì)劃:可以額外購買積分,突破默認(rèn)上限。
  • Enterprise 計(jì)劃:提供共享積分池,按實(shí)際使用付費(fèi)。

目前用戶還無法通過 API Key 使用 Codex CLI,但 OpenAI 也表示很快(soon)將通過 API 開放 GPT-5-Codex。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
廣西2名領(lǐng)導(dǎo)干部同日被查!

廣西2名領(lǐng)導(dǎo)干部同日被查!

魯中晨報(bào)
2025-09-22 20:41:08
福建艦出現(xiàn)艦載機(jī),晚上甲板全亮了

福建艦出現(xiàn)艦載機(jī),晚上甲板全亮了

世家寶
2025-09-22 17:17:04
波蘭萬萬沒想到,中國竟這么狠!關(guān)閉口岸想拿捏中國,卻被反制

波蘭萬萬沒想到,中國竟這么狠!關(guān)閉口岸想拿捏中國,卻被反制

趣文說娛
2025-09-22 10:14:55
普京將發(fā)表重要聲明

普京將發(fā)表重要聲明

證券時(shí)報(bào)
2025-09-22 19:01:04
“喜馬拉雅山煙花秀”最新進(jìn)展:環(huán)保專家已在現(xiàn)場處置,正清理紫銅、塑料桶等

“喜馬拉雅山煙花秀”最新進(jìn)展:環(huán)保專家已在現(xiàn)場處置,正清理紫銅、塑料桶等

魯中晨報(bào)
2025-09-22 20:53:03
吳辰:彰顯新現(xiàn)代豪華體驗(yàn)卓越價(jià)值 捷豹路虎榮膺服務(wù)滿意度雙冠

吳辰:彰顯新現(xiàn)代豪華體驗(yàn)卓越價(jià)值 捷豹路虎榮膺服務(wù)滿意度雙冠

道哥說車
2025-09-22 11:00:12
A股:剛剛,重磅發(fā)布會(huì)召開,做好準(zhǔn)備,周二將迎來大動(dòng)作?

A股:剛剛,重磅發(fā)布會(huì)召開,做好準(zhǔn)備,周二將迎來大動(dòng)作?

虎哥閑聊
2025-09-22 16:27:28
金正恩稱“絕對不會(huì)放棄核武器”,外交部:望有關(guān)方正視半島問題癥結(jié)和根源

金正恩稱“絕對不會(huì)放棄核武器”,外交部:望有關(guān)方正視半島問題癥結(jié)和根源

澎湃新聞
2025-09-22 15:30:26
江蘇公示:連云港市長邢正軍擬任設(shè)區(qū)市委書記

江蘇公示:連云港市長邢正軍擬任設(shè)區(qū)市委書記

澎湃新聞
2025-09-22 20:46:28
2000年克林頓怒斥阿拉法特:“你在毀巴勒斯坦!” 如今回看,竟一語成讖

2000年克林頓怒斥阿拉法特:“你在毀巴勒斯坦!” 如今回看,竟一語成讖

娛樂督察中
2025-09-22 10:51:51
19歲男子KTV上班,三名女孩來喝酒,男子下體過度使用成永久創(chuàng)傷

19歲男子KTV上班,三名女孩來喝酒,男子下體過度使用成永久創(chuàng)傷

丫頭舫
2025-09-22 20:39:00
《繁花》編劇秦雯新錄音曝光:嘲諷陳道明,吐槽游本昌,信息量大

《繁花》編劇秦雯新錄音曝光:嘲諷陳道明,吐槽游本昌,信息量大

萌神木木
2025-09-22 17:31:03
超強(qiáng)臺(tái)風(fēng)“樺加沙”逼近!多地市民到超市排長隊(duì)囤購物資

超強(qiáng)臺(tái)風(fēng)“樺加沙”逼近!多地市民到超市排長隊(duì)囤購物資

極目新聞
2025-09-22 16:22:55
以色列挑釁一個(gè)中國原則,中方警告:如不懸崖勒馬,必將摔得粉身碎骨

以色列挑釁一個(gè)中國原則,中方警告:如不懸崖勒馬,必將摔得粉身碎骨

文雅筆墨
2025-09-22 17:19:03
男子酒后將路過女子拖至玉米地強(qiáng)奸,并令其窒息而死!判死刑

男子酒后將路過女子拖至玉米地強(qiáng)奸,并令其窒息而死!判死刑

南方都市報(bào)
2025-09-22 20:21:11
被撤銷10萬罰款的楊某花,罵人確屬“高段位”

被撤銷10萬罰款的楊某花,罵人確屬“高段位”

方清云
2025-09-22 12:21:00
OPPO高管談小米17“背屏”設(shè)計(jì):功能很雞肋,長期堅(jiān)持不了

OPPO高管談小米17“背屏”設(shè)計(jì):功能很雞肋,長期堅(jiān)持不了

PChome電腦之家
2025-09-22 16:58:15
中方開始掀桌子,再拋257億美債,美國大動(dòng)脈被切,逼出2個(gè)接盤國

中方開始掀桌子,再拋257億美債,美國大動(dòng)脈被切,逼出2個(gè)接盤國

南權(quán)先生
2025-09-22 16:10:05
臺(tái)風(fēng)天哄抬物價(jià),最高罰500萬元!

臺(tái)風(fēng)天哄抬物價(jià),最高罰500萬元!

深圳晚報(bào)
2025-09-22 20:30:54
開拓者買斷楊瀚森,87.5萬美元不夠伙食費(fèi)!

開拓者買斷楊瀚森,87.5萬美元不夠伙食費(fèi)!

地球記
2025-09-22 17:14:03
2025-09-22 23:44:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11334文章數(shù) 142454關(guān)注度
往期回顧 全部

科技要聞

iPhone Air主要芯片全自研,蘋果野心曝光

頭條要聞

杭州一棟樓里開了15家酒店 指引牌從1樓標(biāo)注到33樓

頭條要聞

杭州一棟樓里開了15家酒店 指引牌從1樓標(biāo)注到33樓

體育要聞

曼城擺出大巴車,阿爾特塔:師父你變了!

娛樂要聞

巴圖:不怨父親英達(dá) 不嫉妒弟弟英如鏑

財(cái)經(jīng)要聞

信號巨大!潘功勝、吳清等重磅發(fā)聲

汽車要聞

外觀/性能/智能全面升級 第三代領(lǐng)克03靜態(tài)評測

態(tài)度原創(chuàng)

家居
手機(jī)
教育
數(shù)碼
時(shí)尚

家居要聞

詩意空間 品味雅奢格調(diào)

手機(jī)要聞

折疊屏iPhone新消息,形態(tài)如兩部Air并排,預(yù)計(jì)明年秋季亮相!

教育要聞

南陽市初中英語新教材培訓(xùn)會(huì)在南陽市實(shí)驗(yàn)學(xué)校成功舉辦

數(shù)碼要聞

用兩大核心產(chǎn)品重構(gòu)“健康飲水”標(biāo)準(zhǔn)!安吉爾再度率領(lǐng)行業(yè)破局!

2025秋冬毛衣9大流行趨勢

無障礙瀏覽 進(jìn)入關(guān)懷版 9 9性爱视频| 国产精品美女久久久久av超清| 中字幕视频在线永久在线观看免费| 国产a√精品区二区三区四区| SM在线视频| 黄片免费观看| 丝袜美女视频久久| 久久精品国产99久久六动漫| 韩国美女免费视频高清观看| 亚洲AV官网| 色偷一区国产精品| 在线亚洲97SE亚洲综合在线| 日本最新一区二区| 国产超A级动作大片中文字幕| 久久国产一二三区蜜爱AV| 久久毛片免费看视频粉嫩| 亚洲精品尤物av在线观看任我爽 | 国产精品导航一区二区| 午夜私人一区二区三区| 久久午夜私人影院| 国产精品久久一区二区三区 | 国产成人精品免费久久久久| 老女人高潮偷拍精品导航| 操日本老女人| 人人人妻人人澡人人爽欧美一区 | 黑人巨大无码中文字幕无码| 超碰最新上传| 国产成人性生活视频| 久久久久久人妻无码| 中国猛少妇色xxxxx| 久久婷婷五月综合色精品首页| 久久国产成人精品亚洲| 色亚洲色图自拍偷拍| 午夜成人黄色A视频| 色色av.com| 精品久久久久久中文字幕202 | 强抱少妇BBB搡BBB搡BBB| www夜片内射视频日韩精品成人| 色婷婷精品大在线视频| 在线 | 一区二区三区| 人人操人人爽人人|