從編寫復(fù)雜程序到扮演博士級(jí)專家,ChatGPT-5 的發(fā)布伴隨著大膽的承諾和強(qiáng)大的演示。
山姆·阿爾特曼 (Sam Altman)、格雷格·布羅克曼 (Greg Brockman)、塞巴斯蒂安·布貝克 (Sebastien Bubeck)、馬克·陳 (Mark Chen) 等 OpenAI 核心研究人員在 GPT-5 的直播發(fā)布活動(dòng)中亮相,展示了該模型的先進(jìn)能力和實(shí)際應(yīng)用。
山姆·阿爾特曼在直播開場時(shí)稱 GPT-5 為一種“按需超級(jí)能力”,強(qiáng)調(diào)新模型讓人感覺像是在“與一位名副其實(shí)的專家對話”,這位專家能在多個(gè)領(lǐng)域提供博士級(jí)技能的協(xié)助。
阿爾特曼表示,GPT-5 能夠從零開始編寫完整的計(jì)算機(jī)程序,將按需軟件生成定位為其最強(qiáng)大的能力之一。
統(tǒng)一系統(tǒng),更智能的決策
GPT-5 引入了一個(gè)多層系統(tǒng):一個(gè)快速響應(yīng)的基礎(chǔ)模型、一個(gè)深度推理引擎(GPT-5 思考模式)和一個(gè)實(shí)時(shí)路由器,該路由器根據(jù)用戶請求的復(fù)雜性決定使用哪個(gè)版本。
如果用戶說類似“仔細(xì)思考這個(gè)問題”的話,系統(tǒng)會(huì)將提示路由到推理模型。
一旦達(dá)到使用限制,輕量級(jí)版本會(huì)接管,確保連續(xù)性。OpenAI 計(jì)劃在未來的版本中將這些層級(jí)合并為一個(gè)無縫的單一模型。
超越基準(zhǔn)測試,注重實(shí)用價(jià)值
盡管 GPT-5 在基準(zhǔn)測試中表現(xiàn)出色,但真正使其脫穎而出的是其實(shí)際應(yīng)用價(jià)值。
OpenAI 表示,該模型在三個(gè)核心 ChatGPT 應(yīng)用場景中取得了重大進(jìn)展:
- 寫作:生成更具連貫性、靈活性且目標(biāo)導(dǎo)向的回應(yīng)。
- 編程:在前端設(shè)計(jì)、響應(yīng)式布局和大規(guī)模調(diào)試方面表現(xiàn)大幅提升。
- 健康:對健康、醫(yī)療和癥狀相關(guān)查詢的回應(yīng)有所改進(jìn)(附有適當(dāng)免責(zé)聲明)。
更優(yōu)設(shè)計(jì),更佳代碼
OpenAI 稱 GPT-5 是其迄今為止最強(qiáng)大的編程模型,在前端生成、審美感知和大規(guī)模調(diào)試方面實(shí)現(xiàn)了重大改進(jìn)。
該模型現(xiàn)在可以通過單個(gè)提示生成響應(yīng)式網(wǎng)站、應(yīng)用程序和游戲,將抽象概念轉(zhuǎn)化為具有驚人設(shè)計(jì)美感的工作產(chǎn)品。
據(jù) OpenAI 稱,早期測試者贊揚(yáng)了 GPT-5 在視覺布局理解上的提升,特別是在間距、排版和留白方面的選擇。
除了其創(chuàng)意靈活性,該模型在調(diào)試復(fù)雜代碼庫方面也表現(xiàn)更佳,使其成為開發(fā)人員在處理大型代碼庫時(shí)更可靠的合作伙伴。
這些進(jìn)步標(biāo)志著人工智能在軟件開發(fā)生命周期中輔助方式的顯著轉(zhuǎn)變,它不再僅僅是一個(gè)編程助手,更是一個(gè)有能力的設(shè)計(jì)協(xié)作者。
提升事實(shí)準(zhǔn)確性
OpenAI 表示,GPT-5 在回答現(xiàn)實(shí)世界問題時(shí)比其前代模型準(zhǔn)確得多。在啟用匿名生產(chǎn)提示的網(wǎng)頁搜索功能時(shí),發(fā)現(xiàn) GPT-5 出現(xiàn)“幻覺”(編造信息)的可能性比 GPT-4o 降低了約 45%。
當(dāng)使用其深度推理模式“GPT-5 思考模式”時(shí),事實(shí)性錯(cuò)誤率相比 OpenAI o3 模型降低了約 80%。
為了進(jìn)一步測試模型,OpenAI 使用 LongFact 和 FActScore 等公共基準(zhǔn),在開放式、尋求事實(shí)的提示上評(píng)估了 GPT-5。
結(jié)果顯示,GPT-5 思考模式產(chǎn)生的“幻覺”比 o3 模型少約六倍,使其成為迄今為止在生成長篇事實(shí)性內(nèi)容方面最可靠的模型之一。
AI 開發(fā)的最大挑戰(zhàn)之一是誠實(shí)處理那些不可能、定義不清或缺少關(guān)鍵上下文的任務(wù)。OpenAI 表示 GPT-5 在這方面也實(shí)現(xiàn)了飛躍。
例如,在 CharXiv 多模態(tài)基準(zhǔn)測試中移除所有圖像后,OpenAI o3 模型仍有 86.7% 的情況下給出了自信(但虛假)的答案。
相比之下,GPT-5 僅在 9% 的情況下如此,表明它更清楚自身的局限性,更少偽裝知道答案。
更智能的安全保障
GPT-5 還帶來了更先進(jìn)的安全框架。之前的模型主要依賴拒絕訓(xùn)練,即要么回答問題要么拒絕請求。
但 GPT-5 現(xiàn)在能更有效地處理模糊或具有雙重用途的提示。這意味著它可以在病毒學(xué)或化學(xué)等領(lǐng)域提供高層次的安全回應(yīng),而不會(huì)提供可能被濫用的詳細(xì)指導(dǎo)。
OpenAI 表示,這一轉(zhuǎn)變對于在不過度限制模型的前提下提升細(xì)致入微的安全性至關(guān)重要。
四種全新預(yù)設(shè)個(gè)性
OpenAI 推出了四種新的 ChatGPT 個(gè)性的研究預(yù)覽版 —— 憤世嫉俗者 (Cynic)、機(jī)器人 (Robot)、傾聽者 (Listener) 和 極客 (Nerd)。
這些模式讓用戶無需編寫詳細(xì)提示即可自定義聊天機(jī)器人的語氣和互動(dòng)風(fēng)格。
無論您偏好干練的分析性語氣,還是更溫暖、更具同理心的風(fēng)格,新的個(gè)性都能相應(yīng)調(diào)整。
這一功能得益于 GPT-5 增強(qiáng)的可引導(dǎo)性和改進(jìn)的指令遵循能力。OpenAI 表示,所有四種個(gè)性均符合其內(nèi)部關(guān)于降低諂媚性和增強(qiáng)一致性的基準(zhǔn)。
ChatGPT-5 是免費(fèi)的嗎?
是的,GPT-5 對所有 ChatGPT 用戶開放,但采用基于使用量的訪問權(quán)限。免費(fèi)用戶可以在一定限制內(nèi)使用 GPT-5,而 ChatGPT Plus 訂閱用戶獲得更多使用量,專業(yè)版 (Pro) 訂閱用戶則可解鎖 GPT-5 Pro,該版本包含針對更復(fù)雜或技術(shù)性問題的深度推理能力。
如何使用 GPT-5?
GPT-5 現(xiàn)在是所有登錄 ChatGPT 用戶的默認(rèn)模型,取代了 GPT-4o、GPT-4.1、GPT-4.5、OpenAI o3 和 o4-mini。
要使用它,只需打開 ChatGPT 并提問即可。根據(jù)您的輸入,GPT-5 會(huì)決定是立即響應(yīng)還是應(yīng)用深度推理。
付費(fèi)用戶還可以從模型選擇器中手動(dòng)選擇“GPT-5 思考模式”,或通過“仔細(xì)思考這個(gè)問題”等短語來觸發(fā)該模式。
總結(jié)
通過 GPT-5,OpenAI 在提升 AI 的能力、準(zhǔn)確性和可定制性方面邁出了一大步。從專家級(jí)編程和推理能力,到更安全的回應(yīng)和可個(gè)性化定制的角色,該模型為日常 AI 應(yīng)用樹立了新標(biāo)準(zhǔn)。
如果朋友們喜歡,敬請關(guān)注“知新了了”!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.