ChatGPT-5震撼發(fā)布：編程“按需超級(jí)能力”，但功能遠(yuǎn)不止于此

2025-08-08 17:21:14　來源: 知新了了

北京舉報(bào)

分享至

從編寫復(fù)雜程序到扮演博士級(jí)專家，ChatGPT-5 的發(fā)布伴隨著大膽的承諾和強(qiáng)大的演示。

山姆·阿爾特曼 (Sam Altman)、格雷格·布羅克曼 (Greg Brockman)、塞巴斯蒂安·布貝克 (Sebastien Bubeck)、馬克·陳 (Mark Chen) 等 OpenAI 核心研究人員在 GPT-5 的直播發(fā)布活動(dòng)中亮相，展示了該模型的先進(jìn)能力和實(shí)際應(yīng)用。

山姆·阿爾特曼在直播開場時(shí)稱 GPT-5 為一種“按需超級(jí)能力”，強(qiáng)調(diào)新模型讓人感覺像是在“與一位名副其實(shí)的專家對話”，這位專家能在多個(gè)領(lǐng)域提供博士級(jí)技能的協(xié)助。

阿爾特曼表示，GPT-5 能夠從零開始編寫完整的計(jì)算機(jī)程序，將按需軟件生成定位為其最強(qiáng)大的能力之一。

統(tǒng)一系統(tǒng)，更智能的決策

GPT-5 引入了一個(gè)多層系統(tǒng)：一個(gè)快速響應(yīng)的基礎(chǔ)模型、一個(gè)深度推理引擎（GPT-5 思考模式）和一個(gè)實(shí)時(shí)路由器，該路由器根據(jù)用戶請求的復(fù)雜性決定使用哪個(gè)版本。

如果用戶說類似“仔細(xì)思考這個(gè)問題”的話，系統(tǒng)會(huì)將提示路由到推理模型。

一旦達(dá)到使用限制，輕量級(jí)版本會(huì)接管，確保連續(xù)性。OpenAI 計(jì)劃在未來的版本中將這些層級(jí)合并為一個(gè)無縫的單一模型。

超越基準(zhǔn)測試，注重實(shí)用價(jià)值

盡管 GPT-5 在基準(zhǔn)測試中表現(xiàn)出色，但真正使其脫穎而出的是其實(shí)際應(yīng)用價(jià)值。

OpenAI 表示，該模型在三個(gè)核心 ChatGPT 應(yīng)用場景中取得了重大進(jìn)展：

寫作：生成更具連貫性、靈活性且目標(biāo)導(dǎo)向的回應(yīng)。
編程：在前端設(shè)計(jì)、響應(yīng)式布局和大規(guī)模調(diào)試方面表現(xiàn)大幅提升。
健康：對健康、醫(yī)療和癥狀相關(guān)查詢的回應(yīng)有所改進(jìn)（附有適當(dāng)免責(zé)聲明）。

更優(yōu)設(shè)計(jì)，更佳代碼

OpenAI 稱 GPT-5 是其迄今為止最強(qiáng)大的編程模型，在前端生成、審美感知和大規(guī)模調(diào)試方面實(shí)現(xiàn)了重大改進(jìn)。

該模型現(xiàn)在可以通過單個(gè)提示生成響應(yīng)式網(wǎng)站、應(yīng)用程序和游戲，將抽象概念轉(zhuǎn)化為具有驚人設(shè)計(jì)美感的工作產(chǎn)品。

據(jù) OpenAI 稱，早期測試者贊揚(yáng)了 GPT-5 在視覺布局理解上的提升，特別是在間距、排版和留白方面的選擇。

除了其創(chuàng)意靈活性，該模型在調(diào)試復(fù)雜代碼庫方面也表現(xiàn)更佳，使其成為開發(fā)人員在處理大型代碼庫時(shí)更可靠的合作伙伴。

這些進(jìn)步標(biāo)志著人工智能在軟件開發(fā)生命周期中輔助方式的顯著轉(zhuǎn)變，它不再僅僅是一個(gè)編程助手，更是一個(gè)有能力的設(shè)計(jì)協(xié)作者。

提升事實(shí)準(zhǔn)確性

OpenAI 表示，GPT-5 在回答現(xiàn)實(shí)世界問題時(shí)比其前代模型準(zhǔn)確得多。在啟用匿名生產(chǎn)提示的網(wǎng)頁搜索功能時(shí)，發(fā)現(xiàn) GPT-5 出現(xiàn)“幻覺”（編造信息）的可能性比 GPT-4o 降低了約 45%。

當(dāng)使用其深度推理模式“GPT-5 思考模式”時(shí)，事實(shí)性錯(cuò)誤率相比 OpenAI o3 模型降低了約 80%。

為了進(jìn)一步測試模型，OpenAI 使用 LongFact 和 FActScore 等公共基準(zhǔn)，在開放式、尋求事實(shí)的提示上評(píng)估了 GPT-5。

結(jié)果顯示，GPT-5 思考模式產(chǎn)生的“幻覺”比 o3 模型少約六倍，使其成為迄今為止在生成長篇事實(shí)性內(nèi)容方面最可靠的模型之一。

AI 開發(fā)的最大挑戰(zhàn)之一是誠實(shí)處理那些不可能、定義不清或缺少關(guān)鍵上下文的任務(wù)。OpenAI 表示 GPT-5 在這方面也實(shí)現(xiàn)了飛躍。

例如，在 CharXiv 多模態(tài)基準(zhǔn)測試中移除所有圖像后，OpenAI o3 模型仍有 86.7% 的情況下給出了自信（但虛假）的答案。

相比之下，GPT-5 僅在 9% 的情況下如此，表明它更清楚自身的局限性，更少偽裝知道答案。

更智能的安全保障

GPT-5 還帶來了更先進(jìn)的安全框架。之前的模型主要依賴拒絕訓(xùn)練，即要么回答問題要么拒絕請求。

但 GPT-5 現(xiàn)在能更有效地處理模糊或具有雙重用途的提示。這意味著它可以在病毒學(xué)或化學(xué)等領(lǐng)域提供高層次的安全回應(yīng)，而不會(huì)提供可能被濫用的詳細(xì)指導(dǎo)。

OpenAI 表示，這一轉(zhuǎn)變對于在不過度限制模型的前提下提升細(xì)致入微的安全性至關(guān)重要。

四種全新預(yù)設(shè)個(gè)性

OpenAI 推出了四種新的 ChatGPT 個(gè)性的研究預(yù)覽版 —— 憤世嫉俗者 (Cynic)、機(jī)器人 (Robot)、傾聽者 (Listener) 和極客 (Nerd)。

這些模式讓用戶無需編寫詳細(xì)提示即可自定義聊天機(jī)器人的語氣和互動(dòng)風(fēng)格。

無論您偏好干練的分析性語氣，還是更溫暖、更具同理心的風(fēng)格，新的個(gè)性都能相應(yīng)調(diào)整。

這一功能得益于 GPT-5 增強(qiáng)的可引導(dǎo)性和改進(jìn)的指令遵循能力。OpenAI 表示，所有四種個(gè)性均符合其內(nèi)部關(guān)于降低諂媚性和增強(qiáng)一致性的基準(zhǔn)。

ChatGPT-5 是免費(fèi)的嗎？

是的，GPT-5 對所有 ChatGPT 用戶開放，但采用基于使用量的訪問權(quán)限。免費(fèi)用戶可以在一定限制內(nèi)使用 GPT-5，而 ChatGPT Plus 訂閱用戶獲得更多使用量，專業(yè)版 (Pro) 訂閱用戶則可解鎖 GPT-5 Pro，該版本包含針對更復(fù)雜或技術(shù)性問題的深度推理能力。

如何使用 GPT-5？

GPT-5 現(xiàn)在是所有登錄 ChatGPT 用戶的默認(rèn)模型，取代了 GPT-4o、GPT-4.1、GPT-4.5、OpenAI o3 和 o4-mini。

要使用它，只需打開 ChatGPT 并提問即可。根據(jù)您的輸入，GPT-5 會(huì)決定是立即響應(yīng)還是應(yīng)用深度推理。

付費(fèi)用戶還可以從模型選擇器中手動(dòng)選擇“GPT-5 思考模式”，或通過“仔細(xì)思考這個(gè)問題”等短語來觸發(fā)該模式。

總結(jié)

通過 GPT-5，OpenAI 在提升 AI 的能力、準(zhǔn)確性和可定制性方面邁出了一大步。從專家級(jí)編程和推理能力，到更安全的回應(yīng)和可個(gè)性化定制的角色，該模型為日常 AI 應(yīng)用樹立了新標(biāo)準(zhǔn)。

如果朋友們喜歡，敬請關(guān)注“知新了了”！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.