夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPT-5的艱難推出凸顯了更廣泛的人工智能失望情緒,人工智能是否正走向幻滅低谷?

0
分享至


來源:IEEE電氣電子工程師協(xié)會(huì)

GPT-5本應(yīng)是那個(gè)證明通用人工智能(AGI)觸手可及的模型。OpenAI首席執(zhí)行官Sam Altman在1月份的個(gè)人博客帖子中也暗示了這一點(diǎn)(https://blog.samaltman.com/reflections)。Altman寫道,他“現(xiàn)在有信心我們知道如何構(gòu)建我們傳統(tǒng)意義上所理解的通用人工智能”,并補(bǔ)充說2025年將是人工智能代理“從根本上改變公司產(chǎn)出”的一年。

但現(xiàn)實(shí)并未達(dá)到Altman的預(yù)期。認(rèn)知科學(xué)家、通用人工智能懷疑論者Gary Marcus在Substack上的一篇帖子中稱GPT-5“被過度炒作且令人失望”(https://garymarcus.substack.com/p/gpt-5-overdue-overhyped-and-underwhelming),大量的負(fù)面反饋?zhàn)罱K促使Altman承認(rèn)OpenAI“完全搞砸了”這次發(fā)布(https://fortune.com/2025/08/18/sam-altman-openai-chatgpt5-launch-data-centers-investments/)。

受到質(zhì)疑的不僅僅是GPT-5。麻省理工學(xué)院最近一份關(guān)于商業(yè)領(lǐng)域人工智能的報(bào)告發(fā)現(xiàn),在商業(yè)環(huán)境中部署的所有生成式人工智能中,有95%“沒有產(chǎn)生任何回報(bào)”(https://www.artificialintelligence-news.com/wp-content/uploads/2025/08/ai_report_2025.pdf)。這份報(bào)告嚴(yán)重動(dòng)搖了人們對(duì)人工智能的信心,以至于引發(fā)了科技股的小幅拋售,不過股價(jià)后來趨于穩(wěn)定。最近Grok和Anthropic發(fā)布的產(chǎn)品也反映平平。

人工智能公司Neurologyca的首席執(zhí)行官Juan Gra?a表示:“我們正處于一個(gè)典型的炒作周期中。人工智能伴隨著強(qiáng)烈的喧囂突然出現(xiàn)在人們的視野中,但現(xiàn)在正滑向高德納公司所說的‘幻滅低谷’,在那里,期望與現(xiàn)實(shí)相遇?!?/p>

人工智能正走向幻滅低谷嗎?

即使你不熟悉“幻滅低谷”這個(gè)術(shù)語,你也很有可能知道它的意思。

這個(gè)短語是1995年由Gartner公司的分析師Jackie Fenn創(chuàng)造的,作為一個(gè)圖表的一部分,用來解釋過高的期望是如何導(dǎo)致一段幻滅期的。它很快就流行起來,并催生了無數(shù)對(duì)原始圖表的(有時(shí)很有趣的)變體。

人工智能咨詢公司Bowtie的聯(lián)合管理合伙人Jason Gabbard表示,在GPT-5以及2025年其他人工智能產(chǎn)品發(fā)布之前,炒作的熱度非常高。Gabbard說:“有太多的權(quán)威人士參與討論,長期以來評(píng)論都是一片炒作之聲,以至于人們的期望變得很高?!彼€補(bǔ)充說,GPT-5未能達(dá)到預(yù)期,小型組織和個(gè)人對(duì)此感受最為深切,他們?cè)鞠M癘penAI的下一個(gè)產(chǎn)品能夠解決他們所有的問題”。

在GPT-5發(fā)布后,用戶發(fā)起的抵制行為也呼應(yīng)了他的這些評(píng)論。

作為新模型發(fā)布的一部分,OpenAI從ChatGPT中移除了早期的GPT-4o模型,顯然是認(rèn)為用戶會(huì)在任何情況下都覺得GPT-5是一個(gè)升級(jí)版本。然而,許多ChatGPT用戶抱怨說,新模型似乎比它的前身更差。這些批評(píng)使得OpenAI改變了做法,在移除GPT-4o模型僅24小時(shí)后就恢復(fù)了用戶對(duì)它的訪問權(quán)限。

這對(duì)OpenAI來說是一個(gè)尷尬的局面。2024年,Altman曾預(yù)測(cè),GPT-5會(huì)讓GPT-4相比之下“略顯尷尬”。但事實(shí)卻相反,用戶對(duì)GPT-5的反饋非常負(fù)面,以至于OpenAI決定恢復(fù)之前的模型(https://the-decoder.com/openai-ceo-sam-altman-promises-ai-models-that-far-surpass-gpt-4/)。

2025年人工智能智能體面臨的挑戰(zhàn)

具有諷刺意味的是,F(xiàn)enn 1995年的原始圖表將智能體置于期望的頂峰 —— 而這正是2025年初人工智能智能體所處的位置??爝M(jìn)到8月,似乎正如芬恩的圖表所預(yù)測(cè)的那樣,智能體正引領(lǐng)著一場(chǎng)暴跌,進(jìn)入幻滅低谷。

GPT-5的智能體模式(以前稱為Operator)的推出,和該模型本身一樣,受到了褒貶不一的評(píng)價(jià)。而且對(duì)智能體人工智能的質(zhì)疑已經(jīng)蔓延到了整個(gè)人工智能行業(yè)。人工智能編程工具Replit在其智能體刪除了一家公司的整個(gè)代碼庫后,于6月份遭到了批評(píng)。安全也是一個(gè)問題。殺毒軟件提供商Malwarebytes最近發(fā)出警告,被托付重要憑證的人工智能智能體可能會(huì)因陷入旨在欺騙人工智能的騙局而讓用戶“身無分文”(https://www.malwarebytes.com/blog/news/2025/08/ai-browsers-could-leave-users-penniless-a-prompt-injection-warning)。

這些令人擔(dān)憂的頭條新聞是極端案例,但與此同時(shí),基準(zhǔn)測(cè)試也顯示出智能體的性能表現(xiàn)平平。

其中一個(gè)這樣的基準(zhǔn)測(cè)試是TheAgentCompany進(jìn)行的,它讓由亞馬遜、Anthropic、谷歌和OpenAI的模型驅(qū)動(dòng)的人工智能智能體承擔(dān)包括編碼、數(shù)據(jù)科學(xué)和人力資源等廣泛職業(yè)路徑的工作。結(jié)果發(fā)現(xiàn),即使是測(cè)試中表現(xiàn)最好的模型,即谷歌的Gemini 2.5 Pro,也只能完成30.3%的任務(wù)。GPT-5的測(cè)試結(jié)果尚未公布。

TheAgentCompany的基準(zhǔn)測(cè)試還發(fā)現(xiàn),人工智能智能體的局限性與預(yù)期不同。

最近的一項(xiàng)研究發(fā)現(xiàn),人工智能對(duì)需要軟技能的工作構(gòu)成了最大威脅(https://arxiv.org/pdf/2507.07935)。這些工作包括客服代表、職員、分析師、公關(guān)專家和管理人員。Anthropic公司的首席執(zhí)行官Dario Amodei表示,人工智能將淘汰多達(dá)一半的白領(lǐng)工作。

然而,TheAgentCompany的基準(zhǔn)測(cè)試發(fā)現(xiàn),當(dāng)被要求完成這些崗位范圍內(nèi)的任務(wù)時(shí),人工智能智能體的表現(xiàn)很差。由于缺乏社交技能和存在自我欺騙的傾向,它們難以完成任務(wù)。當(dāng)被要求處理軟件開發(fā)和項(xiàng)目管理任務(wù)時(shí),智能體的表現(xiàn)最為成功。

TheAgentCompany論文的合著者Frank Xu表示:“編碼對(duì)人類來說看起來很難,但實(shí)際上,對(duì)人工智能模型來說,它比看起來更簡單的文書工作等任務(wù)更容易?!?/p>

數(shù)據(jù)限制影響人工智能性能

造成這種能力差距的一個(gè)可能原因是什么?訓(xùn)練數(shù)據(jù)的缺乏。

Xu表示:“網(wǎng)上有大量的開源代碼可供訓(xùn)練,但你不會(huì)看到公司將他們的電子表格或人力資源工作流程開源。數(shù)據(jù)的缺乏是人工智能智能體難以完成人們期望它們?nèi)〈墓ぷ鞯囊粋€(gè)重要原因?!?/p>

IEEE Spectrum采訪的所有專家都一致認(rèn)為,與特定任務(wù)相關(guān)的數(shù)據(jù)缺乏似乎是人工智能模型的一個(gè)絆腳石。

Neurologyca公司的Gra?a認(rèn)為,”人工智能缺乏數(shù)據(jù),更重要的是,缺乏以情感智能方式行事所需的背景信息”。幫助對(duì)沖基金等金融機(jī)構(gòu)實(shí)施人工智能自動(dòng)化的Bowtie公司的Gabbard表示,通用人工智能智能體難以應(yīng)對(duì)獨(dú)特的業(yè)務(wù)流程,需要定制化解決方案才能成功。而有使用人工智能經(jīng)驗(yàn)的分析師Mark Parfenov發(fā)現(xiàn),智能體“很快就會(huì)在復(fù)雜任務(wù)上失去頭緒”,并且在用于市場(chǎng)分析時(shí)會(huì)忽略重要數(shù)據(jù)。

這些困難使人們對(duì)人工智能行業(yè)通過擴(kuò)大通用大型語言模型來實(shí)現(xiàn)通用人工智能(AGI)的希望產(chǎn)生了懷疑。然而,這并不是說人工智能模型缺乏改進(jìn)的途徑。合成數(shù)據(jù)和改進(jìn)的數(shù)據(jù)標(biāo)注提供了解決缺點(diǎn)的選項(xiàng),盡管它們也可能使人工智能走出幻滅低谷的過程變得艱難而昂貴。

“我認(rèn)為,那些容易實(shí)現(xiàn)的改進(jìn)空間已經(jīng)越來越少了,”Xu表示。他補(bǔ)充說,早期智能體取得的進(jìn)展源于一些簡單的改變,“比如格式錯(cuò)誤問題,或者對(duì)工具的理解不足…… 我認(rèn)為,在找到下一個(gè)重大突破之前,進(jìn)展會(huì)放緩?!?/p>

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
0球0助攻!曼城中場(chǎng)新核仍獲夸贊:他像哈蘭德一樣不可替代

0球0助攻!曼城中場(chǎng)新核仍獲夸贊:他像哈蘭德一樣不可替代

球事百科吖
2025-10-19 18:51:10
埃及不買了,印尼不買了,泰國也不買了,怎么這事像是在玩一樣?

埃及不買了,印尼不買了,泰國也不買了,怎么這事像是在玩一樣?

百態(tài)人間
2025-10-07 15:01:34
10月19日晚間,多家上市公司發(fā)布重大利好利空好消息

10月19日晚間,多家上市公司發(fā)布重大利好利空好消息

A股數(shù)據(jù)表
2025-10-19 17:29:49
為什么越來越多的人不發(fā)朋友圈了

為什么越來越多的人不發(fā)朋友圈了

難得君
2025-10-17 15:33:11
外資最新持倉來了!增持這些公司

外資最新持倉來了!增持這些公司

新浪財(cái)經(jīng)
2025-10-19 13:34:17
雷軍:看似老實(shí),卻沒一句實(shí)話

雷軍:看似老實(shí),卻沒一句實(shí)話

麥大人
2025-10-17 20:31:58
哈馬斯要求?;?-5年,拒絕解除武裝,內(nèi)塔尼亞胡強(qiáng)硬發(fā)聲

哈馬斯要求?;?-5年,拒絕解除武裝,內(nèi)塔尼亞胡強(qiáng)硬發(fā)聲

山河路口
2025-10-19 12:45:27
AI制作的春麗電影,質(zhì)量媲美好萊塢大片,就是過審有難度

AI制作的春麗電影,質(zhì)量媲美好萊塢大片,就是過審有難度

街機(jī)時(shí)代
2025-10-19 10:00:03
寧波賽:萊巴金娜2-1連贏九局逆轉(zhuǎn) 賽季第2冠+生涯第10冠

寧波賽:萊巴金娜2-1連贏九局逆轉(zhuǎn) 賽季第2冠+生涯第10冠

醉臥浮生
2025-10-19 19:19:17
亞泰隊(duì)0-2河南隊(duì)遭重大誤判!中超降級(jí)熱門誕生,2隊(duì)已提前上岸

亞泰隊(duì)0-2河南隊(duì)遭重大誤判!中超降級(jí)熱門誕生,2隊(duì)已提前上岸

何老師呀
2025-10-19 21:37:18
姆巴佩伊萬卡緋聞3年!童裝3小時(shí)售罄,姐弟戀是資本幌子?

姆巴佩伊萬卡緋聞3年!童裝3小時(shí)售罄,姐弟戀是資本幌子?

羅氏八卦
2025-10-19 09:46:39
涉嫌嚴(yán)重違紀(jì)違法,陳洪豪被查

涉嫌嚴(yán)重違紀(jì)違法,陳洪豪被查

FM93浙江交通之聲
2025-10-19 14:05:43
李政道曾公開表示,與楊振寧決裂是中華民族的一大悲劇,無法回避

李政道曾公開表示,與楊振寧決裂是中華民族的一大悲劇,無法回避

說歷史的老牢
2025-09-03 09:14:51
美國為何眼睜睜看鄭麗文當(dāng)上國民黨主席?背后原因,大陸一清二楚

美國為何眼睜睜看鄭麗文當(dāng)上國民黨主席?背后原因,大陸一清二楚

現(xiàn)代小青青慕慕
2025-10-19 10:53:47
隨著朝鮮2-0,女足世界杯最新積分榜:中國隊(duì)5-0,力壓美國排第一

隨著朝鮮2-0,女足世界杯最新積分榜:中國隊(duì)5-0,力壓美國排第一

侃球熊弟
2025-10-19 06:55:04
中超27輪積分榜:11隊(duì)積分突破30分,僅剩3隊(duì)爭(zhēng)冠,降級(jí)4選2

中超27輪積分榜:11隊(duì)積分突破30分,僅剩3隊(duì)爭(zhēng)冠,降級(jí)4選2

中超偽球迷
2025-10-19 21:50:52
英國學(xué)者馬丁·雅克:中國正以非常正確的方式應(yīng)對(duì)當(dāng)前世界亂局

英國學(xué)者馬丁·雅克:中國正以非常正確的方式應(yīng)對(duì)當(dāng)前世界亂局

第一財(cái)經(jīng)資訊
2025-10-16 16:52:10
曼聯(lián)傳奇回歸之路:主導(dǎo)權(quán)之爭(zhēng)再起。

曼聯(lián)傳奇回歸之路:主導(dǎo)權(quán)之爭(zhēng)再起。

薄文漪
2025-10-18 17:31:24
雙紅會(huì)3億強(qiáng)援替補(bǔ)!維爾茨謝什科遭棄用,媒體人:斯洛特真大膽

雙紅會(huì)3億強(qiáng)援替補(bǔ)!維爾茨謝什科遭棄用,媒體人:斯洛特真大膽

奧拜爾
2025-10-19 22:47:41
一切如中國所料:上臺(tái)后第一次,特朗普用7個(gè)字形容中國

一切如中國所料:上臺(tái)后第一次,特朗普用7個(gè)字形容中國

現(xiàn)代小青青慕慕
2025-10-19 10:52:48
2025-10-20 01:59:00
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4258文章數(shù) 37328關(guān)注度
往期回顧 全部

科技要聞

獨(dú)家|楊振寧:最頂尖的學(xué)生不是教出來的

頭條要聞

家人同意不讓"野人孩子"赤裸爬行 將給小孩落戶北京

頭條要聞

家人同意不讓"野人孩子"赤裸爬行 將給小孩落戶北京

體育要聞

正在爆火的"拼好球" 馬斯克和樊振東也在玩

娛樂要聞

竇驍婚變升級(jí)!何超蓮被曝已有新歡

財(cái)經(jīng)要聞

星巴克中國股權(quán)出售進(jìn)入倒計(jì)時(shí)

汽車要聞

最高15000元兜底 智界R7/S7推出購置稅補(bǔ)貼方案

態(tài)度原創(chuàng)

教育
健康
本地
時(shí)尚
公開課

教育要聞

“大美華師”,重磅上線!

內(nèi)分泌科專家破解身高八大謠言

本地新聞

考上警犬專業(yè),我和修勾一起卷編制

真有品味的中年女人,穿衣打扮都有這4個(gè)共同點(diǎn),你中了嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 色偷偷www.8888在线观看| 久久精品av一区二区三| 天天综合色激情| 97av人妻| 精品久久久久国产免费| 欧美性爱第一页在线观看| 日日摸日日碰夜夜爽无| 欧美亚洲熟妇一区二区三区| 男人吃奶摸下挵进去好爽在线观看| 國產AV天堂| 疯狂做受在线观看| 无码不卡免费看| 亚洲欧美成人影院| 人妻精品久久无码专区涩涩| 亚洲欧洲一区二区精品| 人人操人人摸乱弄三级片| 亚洲 日韩 另类 制服 无码| 秋霞在线视频| 亚洲欧美日韩高清中文在线| 手机看片福利日韩| 无码精品一区二区三区超碰| 性爱一级视频| 欧洲性久久精品| 精品人妻无码一区二区蜜桃99 | 7777奇米在线观看| 亚洲欧美一区二区成人片| 韩国日本一区二区三区| 特殊重囗味sm在线观看无码| 一区二区三区三级电影| 99久久无色码中文字幕| 狠狠草伊人影院| 亚洲无码在线视频观看| 成人无码免费一区二区三区| 内射少妇一区27p| 成熟了的熟妇毛茸茸| 熟妇的荡欲乱色欲av浪潮| 午夜欧美ab| 日本精油按摩被中出| 奇米影视四色狠狠| 四川一级丰满女老板毛| 波多野结衣在线播放一区 |