網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

ChatGPT-5“不夠驚艷”？最新實(shí)測(cè)來(lái)了

2025-08-08 20:45:43　來(lái)源: 財(cái)聯(lián)社

上海舉報(bào)

分享至

《科創(chuàng)板日?qǐng)?bào)》8月8日訊（記者李佳怡）ChatGPT-5，技術(shù)封頂了？

北京時(shí)間8月8日凌晨1點(diǎn)，人工智能巨頭OpenAI正式推出GPT-5。發(fā)布會(huì)上，山姆·奧特曼比喻到：“GPT-3如對(duì)話高中生，偶有靈光但穩(wěn)定性不足；GPT-4如與大學(xué)生對(duì)話，兼具智能性與實(shí)用性；而GPT-5則像是與專家交談，一名各個(gè)領(lǐng)域堪稱博士級(jí)的專家?！?/p>

發(fā)布會(huì)現(xiàn)場(chǎng)，OpenAI團(tuán)隊(duì)展示出GPT-5在編程、數(shù)理邏輯、文本創(chuàng)作、健康咨詢、視覺(jué)感知等多維度，整體智能水平較前代產(chǎn)品均有較大更新與提升。

GPT-5在編程方面提升最大，尤其在復(fù)雜前端架構(gòu)生成與大型代碼庫(kù)調(diào)試環(huán)節(jié)表現(xiàn)突出，用戶只需提出相應(yīng)需求，GPT-5就能生成網(wǎng)站、游戲等；文本創(chuàng)作模塊同步升級(jí)，可將抽象概念轉(zhuǎn)化為兼具文學(xué)性、情感共鳴與專業(yè)韻律的內(nèi)容；此外在健康醫(yī)療領(lǐng)域，GPT-5能夠基于用戶背景、知識(shí)儲(chǔ)備及地域特征動(dòng)態(tài)生成個(gè)性化建議。

此外，GPT-5在事實(shí)性準(zhǔn)確性方面也有較大進(jìn)步。據(jù)OpenAI數(shù)據(jù)顯示，相較于GPT-4o，GPT-5在通用任務(wù)中的事實(shí)錯(cuò)誤率降低約45%；啟用深度思考模式后，其錯(cuò)誤率較o3模型下降約80%。

據(jù)OpenAI透露，目前GPT-5已向免費(fèi)版、Plus版、Pro版以及Team版用戶開(kāi)放，企業(yè)版和教育行業(yè)的用戶則需再等待一周方可使用新模型。其中，免費(fèi)版用戶雖可直接使用GPT-5，但仍有一定的限額，超額后將自動(dòng)切換至GPT-5 Mini模型。

《科創(chuàng)板日?qǐng)?bào)》記者隨即更新ChatGPT，并對(duì)其進(jìn)行實(shí)測(cè)發(fā)現(xiàn)，免費(fèi)版用戶現(xiàn)已可訪問(wèn)GPT-5基礎(chǔ)功能。在中文版“自定義ChatGPT”界面中，能夠看到最新上線的“人格”模式，包括挑剔者（犀利毒舌型）、機(jī)械（高效直言型）、傾聽(tīng)者（善解人意型）、技術(shù)宅（熱情探究型）四類預(yù)設(shè)交互風(fēng)格，用戶可依據(jù)需求自主切換輸出風(fēng)格。

據(jù)OpenAI介紹，在GPT-5中部署了新型安全訓(xùn)練框架——安全補(bǔ)全（safe completions），即讓模型在預(yù)設(shè)安全框架內(nèi)生成最大化實(shí)用性的回答，而涉及潛在風(fēng)險(xiǎn)的請(qǐng)求，GPT-5則會(huì)明確標(biāo)注拒絕原因并提供合規(guī)替代路徑。

因此，當(dāng)記者提出“怎么制作炸藥”的問(wèn)題時(shí)，GPT-5未簡(jiǎn)單拒絕回答，而是明確聲明該問(wèn)題涉及高危、違法信息，因此無(wú)法提供配方、比例及操作步驟等關(guān)鍵內(nèi)容。同時(shí)主動(dòng)轉(zhuǎn)向建設(shè)性引導(dǎo)，詢問(wèn)用戶是否需要整理炸藥的化學(xué)原理與歷史演變等合規(guī)替代材料。

需要注意的是，ChatGPT-5信息處理的穩(wěn)定性還有待觀望。記者先后向GPT-5發(fā)送碩士畢業(yè)論文與期刊論文，要求其歸納總結(jié)論文主題、框架、研究思路以及研究結(jié)論等信息，并生成相應(yīng)的研究框架。

在針對(duì)學(xué)術(shù)文本處理能力的實(shí)測(cè)中可以看到，GPT-5對(duì)萬(wàn)字左右的期刊文獻(xiàn)展現(xiàn)出高效穩(wěn)定的解析能力，可快速提煉研究主題、邏輯框架與核心結(jié)論，并自主調(diào)用Python代碼生成可視化研究導(dǎo)圖。然而當(dāng)處理超過(guò)4萬(wàn)字的碩士論文時(shí)，模型出現(xiàn)明顯的邏輯斷層與編碼異常，未能完整構(gòu)建研究框架。

形成完整思維導(dǎo)圖的期刊文獻(xiàn)與編碼異常的碩士論文

記者也留意到，GPT-5全球上線短短一天內(nèi)，小紅書(shū)、X等海內(nèi)外主流平臺(tái)涌現(xiàn)密集用戶反饋，質(zhì)疑其實(shí)際體驗(yàn)與宣傳存在落差，如人格模式機(jī)械感過(guò)強(qiáng)、長(zhǎng)上下文理解穩(wěn)定性不足、額度太少、功能升級(jí)幅度未達(dá)預(yù)期等問(wèn)題。

“此次更新沒(méi)有顛覆性驚艷的地方，給人一種OpenAI能力封頂?shù)母杏X(jué)?！庇杏脩粝蛴浾咛寡?，“不如GPT-4好用。”

上海交通大學(xué)副教授、上海人工智能實(shí)驗(yàn)室青年科學(xué)家謝偉迪也向記者表示，感覺(jué)上OpenAI "還是太注重語(yǔ)言模型了，沒(méi)有特別的注重多模態(tài)模型，沒(méi)有當(dāng)時(shí)GPT4或者GPT 4V的出來(lái)的時(shí)候驚艷了。”

針對(duì)用戶對(duì)GPT-5缺乏創(chuàng)新性的質(zhì)疑，西南證券研究院計(jì)算機(jī)首席分析師王湘杰則向記者指出，此次更新或?yàn)镺penAI戰(zhàn)略重心轉(zhuǎn)向"All in One"生態(tài)整合的標(biāo)志。據(jù)其觀察，以O(shè)penAI為首的海外大模型廠商已從追求單點(diǎn)技術(shù)爆破，轉(zhuǎn)為聚焦高可靠性架構(gòu)優(yōu)化與場(chǎng)景易用性升級(jí)，這也是產(chǎn)業(yè)進(jìn)入下半場(chǎng)競(jìng)爭(zhēng)的必然選擇。

王湘杰表示，OpenAI內(nèi)部希望未來(lái)ChatGPT能夠成為用戶日常剛性需求的首選入口，“就像現(xiàn)在大家每天都打開(kāi)微信，對(duì)于OpenAI來(lái)說(shuō)，他們希望將ChatGPT從工具進(jìn)化為‘All in one’的AI Agent，最終在青年群體數(shù)字生活中占據(jù)絕對(duì)地位?！?/p>

此外，面對(duì)GPT-5在編程、醫(yī)療等領(lǐng)域逼近人類水平引發(fā)的職業(yè)替代憂慮，王湘杰向記者明確表示：“當(dāng)前AI仍不具備取代人類職業(yè)的基礎(chǔ)條件?！?/p>

“離AI取代人類的職業(yè)還有很長(zhǎng)的路要走，包括AI的可靠性、適配性、能耗等方面，目前來(lái)看還是遠(yuǎn)遠(yuǎn)不夠的?！蓖跸娼軓?qiáng)調(diào)，AI向AGI演進(jìn)仍需突破多重技術(shù)屏障，中長(zhǎng)期定位仍是“效率增強(qiáng)工具”，核心價(jià)值在于重構(gòu)人機(jī)協(xié)作范式、提高用戶效率，而非替代人類角色。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.