機(jī)器之心報(bào)道
編輯:Panda
OpenAI 今年的開發(fā)者大會(huì)(OpenAI DevDay 2025)正在進(jìn)行中。
Keynote 一開場(chǎng),山姆?奧特曼便分享了 OpenAI 這兩年取得的成績(jī):400 萬開發(fā)者、8 億周活 ChatGPT 用戶、API每分鐘 60 億 token消耗量。
更重要的是,OpenAI 在今年的開發(fā)者大會(huì)上可真是發(fā)布了不少東西,簡(jiǎn)單總結(jié)起來包括:AgentKit、Codex 正式版、ChatGPT 內(nèi)置應(yīng)用與 Apps SDK、gpt-realtime-mini、gpt-image-1-mini、Sora 2 API、GPT-5 pro API。
下面具體來看看這些新模型和新工具。
AgentKit
首先,最引人矚目的便是:AgentKit
AgentKit 是一套面向開發(fā)者和企業(yè)的完整工具集,可用于構(gòu)建、部署和優(yōu)化智能體(agent)。
這讓不少人驚呼:OpenAI 「殺死」了大量創(chuàng)業(yè)公司。
OpenAI 為 AgentKit 設(shè)計(jì)了一些全新的模塊化組件,可助力用戶更快地開發(fā)智能體,包括 Agent Builder、Connector Registry 和 ChatKit。
Agent Builder
乍一看,Agent Builder 的界面與扣子等工作流編排工具非常相似,可讓用戶可視化地設(shè)計(jì)工作流。
具體來說,可視化畫布 Agent Builder 可用于創(chuàng)建、管理和版本化多智能體工作流;其提供了一個(gè)拖拽式的可視化畫布,用于組合邏輯節(jié)點(diǎn)、連接工具、配置自定義安全護(hù)欄。它支持預(yù)覽運(yùn)行、內(nèi)嵌評(píng)估配置和完整版本控制,非常適合快速迭代。
Guardrails(護(hù)欄)是 Agent Builder 中一個(gè)開源、模塊化的安全層,用于防止智能體出現(xiàn)意外或惡意行為。它可用于屏蔽或標(biāo)記個(gè)人信息(PII)、檢測(cè)越獄嘗試、應(yīng)用其他安全機(jī)制。Guardrails 可以單獨(dú)部署,也可通過 Python 或 JavaScript 庫集成。用戶可以選擇是否啟用它。
Connector Registry
用于集中管理數(shù)據(jù)與工具在 OpenAI 產(chǎn)品中的連接方式;其在一個(gè)管理面板中整合了 ChatGPT 和 API 的所有數(shù)據(jù)源,包括預(yù)置連接器(如 Dropbox、Google Drive、SharePoint、Microsoft Teams)及第三方 MCP。
ChatKit
一個(gè)工具套件,可以將基于聊天的智能體直接嵌入用戶的應(yīng)用或網(wǎng)站,并自定義外觀與品牌風(fēng)格。
目前,ChatKit 已廣泛應(yīng)用于內(nèi)部知識(shí)助手、新員工入職引導(dǎo)、客服支持、研究助手等場(chǎng)景。OpenAI 表示 HubSpot、LegalOn、Evernote、Taboola 等公司都已使用 ChatKit 來增強(qiáng)產(chǎn)品交互體驗(yàn)。
評(píng)估
此外,OpenAI 還擴(kuò)展了評(píng)估功能,引入了數(shù)據(jù)集、trace 評(píng)分、自動(dòng)提示詞優(yōu)化、第三方模型支持等新特性。
OpenAI 表示:「自從 3 月推出 Responses API 和 Agents SDK 以來,我們看到開發(fā)者和企業(yè)已經(jīng)在使用它們構(gòu)建端到端的智能體工作流,例如用于深度研究、客戶支持等。Klarna 構(gòu)建的客服智能體現(xiàn)已處理了全部工單的三分之二,而 Clay 則通過銷售智能體實(shí)現(xiàn)了 10 倍增長(zhǎng)。而 AgentKit 正是在 Responses API 的基礎(chǔ)上構(gòu)建的,可以幫助開發(fā)者更高效、更可靠地構(gòu)建智能體?!?/p>
強(qiáng)化微調(diào)
強(qiáng)化微調(diào)(RFT)讓開發(fā)者能夠定制 OpenAI 的推理模型。目前它已在 o4-mini 模型上全面開放,并在 GPT-5 上進(jìn)入私測(cè)階段。OpenAI 表示正與數(shù)十家客戶合作,持續(xù)完善 GPT-5 的 RFT 體驗(yàn)。
OpenAI 介紹了此次在 RFT 私測(cè)中新增的兩項(xiàng)關(guān)鍵功能:
- Custom tool calls:可讓模型學(xué)會(huì)在合適時(shí)機(jī)調(diào)用正確工具,提高推理效率;
- Custom graders:可讓用戶自定義評(píng)估標(biāo)準(zhǔn),從而聚焦最關(guān)注的性能指標(biāo)。
價(jià)格與可用性
從今天起:
- ChatKit 與全新的評(píng)估功能已對(duì)所有開發(fā)者全面開放
- Agent Builder 進(jìn)入公開測(cè)試(Beta)
- Connector Registry 正在逐步向部分 API、ChatGPT Enterprise 和 Edu 客戶開放測(cè)試,Connector Registry 需要通過 Global Admin Console 啟用(供全局管理員管理域名、SSO、多組織 API 等)。
- 以上所有工具均包含在標(biāo)準(zhǔn) API 模型定價(jià)中。
OpenAI 表示,計(jì)劃在不久的將來為 ChatGPT 增加獨(dú)立的 Workflows API 與智能體部署選項(xiàng)。
Codex 正式版
今天,CodeX 正式版(General Availability)上線,并帶來了三項(xiàng)全新功能:
- 全新的 Slack 集成:用戶現(xiàn)在可以像與同事交流一樣,在團(tuán)隊(duì)頻道或線程中直接向 Codex 分配任務(wù)或提問。
- Codex SDK:可將驅(qū)動(dòng) Codex CLI 的同款智能體嵌入用戶自己的工作流、工具或應(yīng)用中,在 GPT-5-Codex 上實(shí)現(xiàn)最先進(jìn)性能,無需額外微調(diào)。
- 全新的管理員工具:通過環(huán)境控制、監(jiān)控與分析面板,ChatGPT 工作區(qū)管理員可以更好地掌控 Codex 的使用和運(yùn)行。
自從今年 5 月 Codex 云端智能體(Codex cloud agent)以研究預(yù)覽版推出以來,Codex 已穩(wěn)步演進(jìn)為一個(gè)更可靠、更強(qiáng)大的編碼協(xié)作伙伴。
現(xiàn)在,用戶可以在所有編碼場(chǎng)景中使用 Codex(編輯器、終端、云端)都通過 ChatGPT 賬號(hào)互聯(lián)。
OpenAI 還介紹了 Codex 的用戶增長(zhǎng)情況:自 8 月初以來,Codex 的日活躍使用量增長(zhǎng)了 10 倍以上,而 GPT-5-Codex 也成為增長(zhǎng)最快的模型之一,在上線后短短三周內(nèi)就處理了超過40 萬億 token
如今,Codex 已被全球不少開發(fā)者廣泛采用 —— 從 Duolingo、Vanta 這樣的初創(chuàng)公司,到思科、樂天這樣的企業(yè)巨頭。OpenAI 表示:「在 OpenAI 內(nèi)部,Codex 也已成為我們研發(fā)流程中不可或缺的一部分:從 7 月時(shí)的一半工程師使用,到現(xiàn)在幾乎所有工程師都在用。他們每周合并的 PR 數(shù)量增加了 70%,而 Codex 會(huì)自動(dòng)審查幾乎所有 PR,在問題進(jìn)入生產(chǎn)環(huán)境前就能發(fā)現(xiàn)關(guān)鍵缺陷?!?/p>
ChatGPT 內(nèi)置應(yīng)用與 Apps SDK
OpenAI 還正式發(fā)布 ChatGPT 新一代可對(duì)話應(yīng)用(Apps)。用戶現(xiàn)在可以直接在 ChatGPT 聊天界面中與這些應(yīng)用交互。
這些應(yīng)用可與 ChatGPT 的對(duì)話體驗(yàn)無縫融合。用戶可以在對(duì)話中被智能推薦到合適的應(yīng)用,也可以直接「呼叫」它們的名字。這些應(yīng)用支持自然語言交互,并在聊天窗口中內(nèi)嵌交互式界面,讓體驗(yàn)更直觀。
對(duì)用戶而言,ChatGPT 中的應(yīng)用會(huì)根據(jù)用戶上下文動(dòng)態(tài)適應(yīng),提供創(chuàng)作、學(xué)習(xí)、任務(wù)執(zhí)行等方面的幫助。
從今天起,除歐盟地區(qū)外,所有登錄的 ChatGPT 用戶(Free、Go、Plus、Pro 版本)均可使用這些應(yīng)用。首批上線的應(yīng)用包括:Booking.com、Canva、Coursera、Figma、Expedia、Spotify、Zillow。
開發(fā)者也可從今天起,使用全新的Apps SDK(預(yù)覽版) 開始構(gòu)建屬于自己的 ChatGPT 應(yīng)用。
該 SDK 基于 Model Context Protocol (MCP) —— 一種開放標(biāo)準(zhǔn),使 ChatGPT 能連接外部工具與數(shù)據(jù)。Apps SDK 在此基礎(chǔ)上進(jìn)一步擴(kuò)展,讓開發(fā)者能夠同時(shí)設(shè)計(jì)應(yīng)用的邏輯與界面。
Apps SDK 已經(jīng)開源。
此外,通過 Apps SDK 構(gòu)建的應(yīng)用還可以在恰當(dāng)?shù)臅r(shí)機(jī)觸達(dá)超過 8 億 ChatGPT 用戶。
OpenAI 計(jì)劃今年晚些時(shí)候把應(yīng)用功能擴(kuò)展到 ChatGPT Business、Enterprise 和 Edu 版本。屆時(shí)也會(huì)開放應(yīng)用提交流程,讓開發(fā)者能正式在 ChatGPT 上架應(yīng)用。
他們還將推出一個(gè)專屬的應(yīng)用目錄(App Directory),用戶可在其中瀏覽、搜索、發(fā)現(xiàn)應(yīng)用。
gpt-realtime-mini
OpenAI 還發(fā)布了一個(gè) GPT Realtime 的 mini 版本,可通過 WebRTC、WebSocket 或 SIP 連接實(shí)時(shí)響應(yīng)音頻和文本輸入。以下截圖展示了其一些參數(shù)和定價(jià)信息:
gpt-image-1-mini
另外,OpenAI 也為 GPT Image 1 模型打造了一個(gè) mini 版本。它是一種原生多模態(tài)語言模型,可同時(shí)接受文本和圖像輸入和生成圖像輸出。以下截圖展示了其一些參數(shù)和定價(jià)信息:
Sora 2 API
Sora 是 OpenAI 在生成式媒體領(lǐng)域的最新前沿成果。這是一款最先進(jìn)的視頻生成模型,能夠根據(jù)自然語言或圖像生成具有豐富細(xì)節(jié)、動(dòng)態(tài)畫面與音頻的視頻片段。
Sora 基于多模態(tài)擴(kuò)散模型(multimodal diffusion)多年研究成果構(gòu)建,并在多樣化的視覺數(shù)據(jù)上訓(xùn)練,使其在三維空間理解、運(yùn)動(dòng)建模和場(chǎng)景連貫性方面具備深厚能力,將文本到視頻的生成質(zhì)量推向新高度。
今天,OpenAI 也首次通過 Video API 首次向開發(fā)者開放 Sora 的能力,支持通過編程方式創(chuàng)建、擴(kuò)展或混合(remix)視頻內(nèi)容。
它包含五個(gè)端點(diǎn)(endpoints),每個(gè)端點(diǎn)都有不同的功能:
- Create video(創(chuàng)建視頻):從提示詞開始一個(gè)新的渲染任務(wù),可選擇性添加參考輸入或 remix ID。
- Get video status(獲取視頻狀態(tài)):查詢渲染任務(wù)的當(dāng)前狀態(tài),監(jiān)控其進(jìn)度。
- Download video(下載視頻):任務(wù)完成后,下載生成好的 MP4 文件。
- List videos(列出視頻):分頁查看你的歷史視頻記錄,用于展示、管理或清理。
- Delete videos(刪除視頻):從 OpenAI 存儲(chǔ)中移除指定視頻 ID。
Sora 2 系列目前提供兩個(gè)變體,針對(duì)不同使用場(chǎng)景優(yōu)化。
- Sora 2:注重速度與靈活性,適用于創(chuàng)意探索階段,注重快速反饋而非極致畫質(zhì)。特點(diǎn)是生成速度快、質(zhì)量佳,適合快速迭代、概念驗(yàn)證或粗剪階段。推薦用途:社交媒體內(nèi)容、產(chǎn)品原型、需要快速產(chǎn)出的項(xiàng)目。
- Sora 2 Pro:支持專業(yè)級(jí)畫質(zhì),適用于需要高質(zhì)量視頻的場(chǎng)景、可直接用于生產(chǎn)的內(nèi)容。其渲染時(shí)間更長(zhǎng)、成本更高,但輸出更加穩(wěn)定、細(xì)膩、逼真。推薦用途:高分辨率電影鏡頭、營(yíng)銷視頻、以及對(duì)視覺精度要求極高的項(xiàng)目。
GPT-5 pro API
強(qiáng)大推理模型 GPT-5 pro 的 API 也已經(jīng)上線:
對(duì)于 OpenAI 這場(chǎng)正在進(jìn)行中的開發(fā)者大會(huì),你有什么期待?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.