《科創(chuàng)板日?qǐng)?bào)》8月8日訊(記者 李佳怡)ChatGPT-5,技術(shù)封頂了?
北京時(shí)間8月8日凌晨1點(diǎn),人工智能巨頭OpenAI正式推出GPT-5。發(fā)布會(huì)上,山姆·奧特曼比喻到:“GPT-3如對(duì)話高中生,偶有靈光但穩(wěn)定性不足;GPT-4如與大學(xué)生對(duì)話,兼具智能性與實(shí)用性;而GPT-5則像是與專家交談,一名各個(gè)領(lǐng)域堪稱博士級(jí)的專家?!?/p>
發(fā)布會(huì)現(xiàn)場(chǎng),OpenAI團(tuán)隊(duì)展示出GPT-5在編程、數(shù)理邏輯、文本創(chuàng)作、健康咨詢、視覺(jué)感知等多維度,整體智能水平較前代產(chǎn)品均有較大更新與提升。
GPT-5在編程方面提升最大,尤其在復(fù)雜前端架構(gòu)生成與大型代碼庫(kù)調(diào)試環(huán)節(jié)表現(xiàn)突出,用戶只需提出相應(yīng)需求,GPT-5就能生成網(wǎng)站、游戲等;文本創(chuàng)作模塊同步升級(jí),可將抽象概念轉(zhuǎn)化為兼具文學(xué)性、情感共鳴與專業(yè)韻律的內(nèi)容;此外在健康醫(yī)療領(lǐng)域,GPT-5能夠基于用戶背景、知識(shí)儲(chǔ)備及地域特征動(dòng)態(tài)生成個(gè)性化建議。
此外,GPT-5在事實(shí)性準(zhǔn)確性方面也有較大進(jìn)步。據(jù)OpenAI數(shù)據(jù)顯示,相較于GPT-4o,GPT-5在通用任務(wù)中的事實(shí)錯(cuò)誤率降低約45%;啟用深度思考模式后,其錯(cuò)誤率較o3模型下降約80%。
據(jù)OpenAI透露,目前GPT-5已向免費(fèi)版、Plus版、Pro版以及Team版用戶開(kāi)放,企業(yè)版和教育行業(yè)的用戶則需再等待一周方可使用新模型。其中,免費(fèi)版用戶雖可直接使用GPT-5,但仍有一定的限額,超額后將自動(dòng)切換至GPT-5 Mini模型。
《科創(chuàng)板日?qǐng)?bào)》記者隨即更新ChatGPT,并對(duì)其進(jìn)行實(shí)測(cè)發(fā)現(xiàn),免費(fèi)版用戶現(xiàn)已可訪問(wèn)GPT-5基礎(chǔ)功能。在中文版“自定義ChatGPT”界面中,能夠看到最新上線的“人格”模式,包括挑剔者(犀利毒舌型)、機(jī)械(高效直言型)、傾聽(tīng)者(善解人意型)、技術(shù)宅(熱情探究型)四類預(yù)設(shè)交互風(fēng)格,用戶可依據(jù)需求自主切換輸出風(fēng)格。
據(jù)OpenAI介紹,在GPT-5中部署了新型安全訓(xùn)練框架——安全補(bǔ)全(safe completions),即讓模型在預(yù)設(shè)安全框架內(nèi)生成最大化實(shí)用性的回答,而涉及潛在風(fēng)險(xiǎn)的請(qǐng)求,GPT-5則會(huì)明確標(biāo)注拒絕原因并提供合規(guī)替代路徑。
因此,當(dāng)記者提出“怎么制作炸藥”的問(wèn)題時(shí),GPT-5未簡(jiǎn)單拒絕回答,而是明確聲明該問(wèn)題涉及高危、違法信息,因此無(wú)法提供配方、比例及操作步驟等關(guān)鍵內(nèi)容。同時(shí)主動(dòng)轉(zhuǎn)向建設(shè)性引導(dǎo),詢問(wèn)用戶是否需要整理炸藥的化學(xué)原理與歷史演變等合規(guī)替代材料。
需要注意的是,ChatGPT-5信息處理的穩(wěn)定性還有待觀望。記者先后向GPT-5發(fā)送碩士畢業(yè)論文與期刊論文,要求其歸納總結(jié)論文主題、框架、研究思路以及研究結(jié)論等信息,并生成相應(yīng)的研究框架。
在針對(duì)學(xué)術(shù)文本處理能力的實(shí)測(cè)中可以看到,GPT-5對(duì)萬(wàn)字左右的期刊文獻(xiàn)展現(xiàn)出高效穩(wěn)定的解析能力,可快速提煉研究主題、邏輯框架與核心結(jié)論,并自主調(diào)用Python代碼生成可視化研究導(dǎo)圖。然而當(dāng)處理超過(guò)4萬(wàn)字的碩士論文時(shí),模型出現(xiàn)明顯的邏輯斷層與編碼異常,未能完整構(gòu)建研究框架。
形成完整思維導(dǎo)圖的期刊文獻(xiàn)與編碼異常的碩士論文
記者也留意到,GPT-5全球上線短短一天內(nèi),小紅書(shū)、X等海內(nèi)外主流平臺(tái)涌現(xiàn)密集用戶反饋,質(zhì)疑其實(shí)際體驗(yàn)與宣傳存在落差,如人格模式機(jī)械感過(guò)強(qiáng)、長(zhǎng)上下文理解穩(wěn)定性不足、額度太少、功能升級(jí)幅度未達(dá)預(yù)期等問(wèn)題。
“此次更新沒(méi)有顛覆性驚艷的地方,給人一種OpenAI能力封頂?shù)母杏X(jué)?!庇杏脩粝蛴浾咛寡?,“不如GPT-4好用。”
上海交通大學(xué)副教授、上海人工智能實(shí)驗(yàn)室青年科學(xué)家謝偉迪也向記者表示,感覺(jué)上OpenAI "還是太注重語(yǔ)言模型了,沒(méi)有特別的注重多模態(tài)模型,沒(méi)有當(dāng)時(shí)GPT4或者GPT 4V的出來(lái)的時(shí)候驚艷了。”
針對(duì)用戶對(duì)GPT-5缺乏創(chuàng)新性的質(zhì)疑,西南證券研究院計(jì)算機(jī)首席分析師王湘杰則向記者指出,此次更新或?yàn)镺penAI戰(zhàn)略重心轉(zhuǎn)向"All in One"生態(tài)整合的標(biāo)志。據(jù)其觀察,以O(shè)penAI為首的海外大模型廠商已從追求單點(diǎn)技術(shù)爆破,轉(zhuǎn)為聚焦高可靠性架構(gòu)優(yōu)化與場(chǎng)景易用性升級(jí),這也是產(chǎn)業(yè)進(jìn)入下半場(chǎng)競(jìng)爭(zhēng)的必然選擇。
王湘杰表示,OpenAI內(nèi)部希望未來(lái)ChatGPT能夠成為用戶日常剛性需求的首選入口,“就像現(xiàn)在大家每天都打開(kāi)微信,對(duì)于OpenAI來(lái)說(shuō),他們希望將ChatGPT從工具進(jìn)化為‘All in one’的AI Agent,最終在青年群體數(shù)字生活中占據(jù)絕對(duì)地位?!?/p>
此外,面對(duì)GPT-5在編程、醫(yī)療等領(lǐng)域逼近人類水平引發(fā)的職業(yè)替代憂慮,王湘杰向記者明確表示:“當(dāng)前AI仍不具備取代人類職業(yè)的基礎(chǔ)條件?!?/p>
“離AI取代人類的職業(yè)還有很長(zhǎng)的路要走,包括AI的可靠性、適配性、能耗等方面,目前來(lái)看還是遠(yuǎn)遠(yuǎn)不夠的?!蓖跸娼軓?qiáng)調(diào),AI向AGI演進(jìn)仍需突破多重技術(shù)屏障,中長(zhǎng)期定位仍是“效率增強(qiáng)工具”,核心價(jià)值在于重構(gòu)人機(jī)協(xié)作范式、提高用戶效率,而非替代人類角色。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.