夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

終極打工人誕生:OpenAI發(fā)布ChatGPT Agent,重新定義生產(chǎn)力邊界

0
分享至



當(dāng)Agent能夠完成復(fù)雜任務(wù),我們需要學(xué)習(xí)如何與這個(gè)星球上最聰明的“打工人”共事。

作者 |小葳


AI Agent的時(shí)代,比所有人預(yù)想的,來(lái)得更早、更猛烈。

北京時(shí)間7月18日凌晨,科技圈再次被OpenAI投下的一枚重磅炸彈引爆。沒有冗長(zhǎng)的預(yù)熱,沒有華麗的舞臺(tái),Sam Altman和他的團(tuán)隊(duì)通過一場(chǎng)25分鐘的發(fā)布會(huì)直播,推出ChatGPT Agent

這不再是我們熟悉的那個(gè)“聊天機(jī)器人”,它是一個(gè)擁有了自己的虛擬電腦、能夠自主思考、規(guī)劃并執(zhí)行復(fù)雜任務(wù)的“行動(dòng)者”。

當(dāng)看到ChatGPT Agent熟練地打開瀏覽器、分析網(wǎng)頁(yè)、調(diào)用API、生成PPT、制作表格時(shí),Sam Altman在直播中坦言:“對(duì)我來(lái)說(shuō),在觀看它工作時(shí),這是最讓我感受到AGI的時(shí)刻之一。”

看完發(fā)布會(huì),令人印象深刻的有三個(gè)方面:

第一, 面對(duì)多目標(biāo)的復(fù)雜任務(wù),ChatGPT Agent雖然耗時(shí)長(zhǎng)一些,但完成度很高;

第二, ChatGPT Agent可以隨時(shí)被打斷,人類用戶可以隨時(shí)補(bǔ)充信息和指導(dǎo),或增加新任務(wù),人機(jī)協(xié)作的體驗(yàn)更加凸顯;

第三,Agent通過自己專屬的虛擬計(jì)算機(jī)完成所有任務(wù),并將執(zhí)行任務(wù)過程可視化實(shí)時(shí)展現(xiàn),用戶可以回放視頻查看Agent每一步動(dòng)作。



從“能聊”到“能干”:

統(tǒng)一智能體,OpenAI的必然一步

ChatGPT Agent的誕生并非憑空而來(lái),它是OpenAI在智能體(Agent)道路上不斷積累的必然結(jié)果。今年早些時(shí)候,OpenAI陸續(xù)推出了兩個(gè)重磅工具:Deep ResearchOperator。

然而,這兩個(gè)工具如同兩個(gè)“偏科生”。Deep Research擅長(zhǎng)長(zhǎng)文閱讀,卻無(wú)法與需要登錄、交互的網(wǎng)頁(yè)打交道;Operator擅長(zhǎng)處理交互式與可視化的網(wǎng)頁(yè),卻在深度分析和長(zhǎng)文閱讀方面力不從心。而許多真實(shí)世界的復(fù)雜任務(wù),恰恰需要二者能力的結(jié)合。

正如Sam Altman在發(fā)布會(huì)上所說(shuō):“人們想要一個(gè)統(tǒng)一的智能體,它能自主運(yùn)行,使用它自己的電腦,幫助人們完成真正復(fù)雜的任務(wù)。它能夠無(wú)縫地切換,從思考到采取行動(dòng)。它能使用各種工具,比如調(diào)用終端、在網(wǎng)頁(yè)上點(diǎn)擊操作,甚至能生成電子表格、幻燈片等文件,以及具備更多功能?!?/p>

ChatGPT Agent正是兩者“強(qiáng)強(qiáng)聯(lián)合”的實(shí)現(xiàn),它融合了Deep Research的分析能力和Operator的執(zhí)行能力,相當(dāng)于賦予了Agent“大腦”和“雙手”。



真正完成復(fù)雜任務(wù):

自主選擇工具,可視化執(zhí)行過程

發(fā)布會(huì)上演示的第一個(gè)demo是一個(gè)多目標(biāo)的復(fù)雜任務(wù),用戶9月份要出席朋友婚禮,需要準(zhǔn)備服裝、禮物、預(yù)訂酒店等一攬子事情,用戶把這些需求一股腦拋給Agent:

- 一套與所有場(chǎng)合的著裝要求相匹配的服裝(男士)。

- 提出五個(gè)服裝選項(xiàng)。選擇一些輕奢檔次的服裝,并應(yīng)與場(chǎng)地和天氣相配

- 找到那些兩端都有幾天緩沖期的酒店。

- 使用Booking進(jìn)行預(yù)訂,并務(wù)必檢查可用性和當(dāng)前價(jià)格。

- 同樣別忘了為新人挑選一件禮物,價(jià)格最好在500美元以內(nèi)。

Agent確認(rèn)關(guān)鍵需求后就開始工作。整個(gè)任務(wù)完成花費(fèi)了20分鐘左右,在發(fā)布會(huì)最后,提供了完善的方案。5件服裝備選直接提供了價(jià)格對(duì)比和購(gòu)買鏈接。

當(dāng)用戶提出新增要求,安排一個(gè)包括美國(guó)職業(yè)棒球聯(lián)盟(MLB)所有運(yùn)動(dòng)球場(chǎng)參觀的旅行計(jì)劃時(shí),Agent直接給出精確到天的Excel行程表格。

Agent所有動(dòng)作都是通過專屬虛擬電腦完成,這臺(tái)電腦上安裝了很多不同的工具,Agent能自行選擇如何使用。

同時(shí),Agent將它執(zhí)行任務(wù)的全過程展示為一個(gè)可視化的電腦屏幕,并在不斷變化的對(duì)話框中顯示文本形式的思維鏈過程,也就是Agent在想什么,它決定下一步做什么。



揭秘Agent的工作臺(tái):

一臺(tái)虛擬電腦和它的工具集

要理解ChatGPT Agent的強(qiáng)大,首先要看它的“工作臺(tái)”——一臺(tái)專屬的虛擬電腦。在這個(gè)工作臺(tái)上,集成了一些強(qiáng)大的工具:

  • 文本瀏覽器 (Text Browser):和Deep Research工具類似,它能快速抓取和解析大量網(wǎng)頁(yè)的文本內(nèi)容,進(jìn)行高效的搜索和信息提煉,這讓它能夠非常高效快速閱讀大量網(wǎng)頁(yè)并進(jìn)行搜索,是Agent高效處理信息的“利器”。

  • 可視化瀏覽器 (Visual Browser):和operator工具類似,這是Agent的“眼睛”和“手”。讓Agent能像人一樣“看”到網(wǎng)頁(yè)的圖形界面,進(jìn)行點(diǎn)擊、
  • 滾動(dòng)、拖拽、填寫表單等操作,輕松應(yīng)對(duì)為人類設(shè)計(jì)的復(fù)雜交互界面。



  • 終端 (Terminal)和API,通過與終端的連接,Agent可以運(yùn)行代碼、進(jìn)行復(fù)雜的數(shù)據(jù)分析、處理文件,甚至直接生成可編輯的PowerPoint演示文稿和Excel電子表格。發(fā)布會(huì)演示中,Agent自行編寫代碼編譯幻燈片,并調(diào)用圖像API美化頁(yè)面的場(chǎng)景,令人印象深刻。



通過API,Agent能夠調(diào)用外部服務(wù)。包括公共API,以及用于訪問你私有數(shù)據(jù)源的API,比如谷歌云端硬盤,谷歌日歷,github,sharepoint等等。

擁有工具是一回事,懂得何時(shí)使用何種工具,則是更高維度的智能。OpenAI通過強(qiáng)化學(xué)習(xí)(Reinforcement Learning)的訓(xùn)練方式,學(xué)會(huì)在面對(duì)復(fù)雜任務(wù)時(shí),自主規(guī)劃并智能地選擇最優(yōu)工具組合。

比如,當(dāng)被要求預(yù)訂餐廳時(shí),Agent可能會(huì)先用文本瀏覽器進(jìn)行海量篩選,然后切換到可視化瀏覽器查看菜品圖片,最后確認(rèn)空位并完成預(yù)訂。

從“指令-響應(yīng)”到“委托-協(xié)作”:

人機(jī)協(xié)作的全新體驗(yàn)

如果說(shuō)完成復(fù)雜任務(wù)是ChatGPT Agent的“硬實(shí)力”,那么其高度協(xié)作的交互模式則是它的“軟實(shí)力”,也是它與其他AI工具顯著區(qū)別。

過去,我們與AI的交互是僵硬的。一旦任務(wù)下達(dá),我們能做的只有等待。而ChatGPT Agent被設(shè)計(jì)成一個(gè)真正的“協(xié)作伙伴”。

用戶和智能體隨時(shí)都能夠主動(dòng)與對(duì)方溝通,是ChatGPT Agent重要的交互理念。在ChatGPT Agent執(zhí)行任務(wù)的任何時(shí)刻,用戶都可以隨時(shí)“插話”:

Agent模型的一個(gè)關(guān)鍵能力是能夠被隨時(shí)打斷,就像是在進(jìn)行多輪對(duì)話。用戶可以插話,引導(dǎo)它?!?/em>ChatGPT Agent研發(fā)人員表示。

用戶可以中途補(bǔ)充新的要求(哦對(duì)了,再幫我找一雙9.5碼的黑皮鞋),可以糾正它的方向,甚至可以完全改變?nèi)蝿?wù)(我忘了提這件事,或者你的進(jìn)度如何?做得怎么樣了?)。Agent會(huì)理解新的指令,并在不丟失已有進(jìn)度的前提下,繼續(xù)工作。

同時(shí),Agent也會(huì)主動(dòng)溝通。在信息不足時(shí),它會(huì)提出澄清性問題讓用戶確認(rèn);在執(zhí)行關(guān)鍵操作(如發(fā)送郵件、下單支付)前,Agent會(huì)主動(dòng)尋求用戶的最終確認(rèn)。這種雙向溝通機(jī)制,確保了任務(wù)始終在用戶的掌控之中。

更重要的是,用戶擁有最終的“接管權(quán)”。如果對(duì)Agent的操作不滿意,可以隨時(shí)暫停,直接進(jìn)入它的虛擬環(huán)境,自己動(dòng)手修改。這極大增強(qiáng)了用戶的安全感和控制感,使得人與AI之間建立起一種前所未有的信任關(guān)系。

碾壓級(jí)跑分:

當(dāng)Agent的能力被量化

為了證明ChatGPT Agent并非華而不實(shí)的“花架子”,OpenAI公布了一系列基準(zhǔn)測(cè)試成績(jī)。這些數(shù)據(jù),將其強(qiáng)大的能力清晰地量化了出來(lái)。

  • 在被譽(yù)為“人類最后考試”的HLE (Humanity’s Last Exam)基準(zhǔn)上,該測(cè)試旨在衡量AI在各學(xué)科專家級(jí)問題上的表現(xiàn),ChatGPT Agent取得了41.6%的分?jǐn)?shù),幾乎是此前o3和o4-mini模型的兩倍。

  • 前沿?cái)?shù)學(xué)基準(zhǔn)FrontierMath上,Agent在工具的輔助下,達(dá)到了27.4%的準(zhǔn)確率,顯著優(yōu)于o3和o4-mini。



  • 在衡量網(wǎng)頁(yè)瀏覽和信息定位能力的BrowseCompWebArena測(cè)試中,Agent同樣表現(xiàn)優(yōu)異。



  • 在與辦公場(chǎng)景息息相關(guān)的SpreadsheetBench(電子表格編輯能力測(cè)試)中,Agent的得分高達(dá)45.5%



這些數(shù)字背后,反映出一個(gè)清晰的信號(hào):ChatGPT Agent在通用推理、專業(yè)知識(shí)、工具使用和任務(wù)執(zhí)行等多個(gè)維度上,已經(jīng)達(dá)到了一個(gè)全新的高度。它不再是一個(gè)只能在特定領(lǐng)域展現(xiàn)才華的工具,而是一個(gè)具備廣泛能力的“通才”。

“前沿與實(shí)驗(yàn)性”:

奧特曼的謹(jǐn)慎與Agent的風(fēng)險(xiǎn)預(yù)警

在展示強(qiáng)大能力的同時(shí),Sam Altman也反復(fù)強(qiáng)調(diào)了這款產(chǎn)品的“前沿和實(shí)驗(yàn)性”,并坦誠(chéng)地揭示了其潛在的風(fēng)險(xiǎn)。這體現(xiàn)了OpenAI在推動(dòng)技術(shù)邊界時(shí)的審慎態(tài)度。

研發(fā)團(tuán)隊(duì)稱,目前最大的擔(dān)憂之一,是被稱為“提示詞注入”(Prompt Injection)的新型攻擊。

當(dāng)Agent訪問惡意網(wǎng)站時(shí),網(wǎng)站上的隱藏指令可能會(huì)“誘騙”它執(zhí)行不當(dāng)操作,比如泄露用戶的敏感信息。

對(duì)此,OpenAI構(gòu)建了多層防御體系,包括訓(xùn)練模型忽略可疑指令、部署實(shí)時(shí)監(jiān)控系統(tǒng)來(lái)終止惡意行為等。但OpenAI也承認(rèn),他們無(wú)法阻止所有攻擊。

隨著AI能力的指數(shù)級(jí)增長(zhǎng),如何為其劃定安全的倫理和技術(shù)邊界,已成為整個(gè)行業(yè)面臨的共同挑戰(zhàn)。

因此,OpenAI給用戶的建議是:充分意識(shí)到使用智能體所面臨的風(fēng)險(xiǎn),不隨意向智能體透露個(gè)人敏感信息。

結(jié)語(yǔ)

ChatGPT Agent今天所展示的,還只是一個(gè)開始。

Agent不可避免會(huì)犯錯(cuò),有時(shí)完成任務(wù)可能比人類手動(dòng)操作更耗時(shí)。但它指明的方向,是清晰且不可逆轉(zhuǎn)的。

我們正在從一個(gè)需要自己親手操作每一個(gè)軟件、點(diǎn)擊每一個(gè)按鈕的時(shí)代,邁向一個(gè)只需提出目標(biāo),便有智能體為你調(diào)度一切資源的時(shí)代。

而我們,需要學(xué)習(xí)如何與這個(gè)星球上最聰明的“打工人”共事。

本文為「智能進(jìn)化論」原創(chuàng)作品。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
毛主席視察天津時(shí)想見李銀橋,得知他已經(jīng)入獄,偉人只說(shuō)了2個(gè)字

毛主席視察天津時(shí)想見李銀橋,得知他已經(jīng)入獄,偉人只說(shuō)了2個(gè)字

南書房
2025-09-28 23:01:03
鄭麗文不裝了?國(guó)臺(tái)辦回應(yīng)武統(tǒng)后,鄭麗文表態(tài):絕不放棄武力保臺(tái)

鄭麗文不裝了?國(guó)臺(tái)辦回應(yīng)武統(tǒng)后,鄭麗文表態(tài):絕不放棄武力保臺(tái)

阿校談史
2025-11-14 16:38:17
瑟瑟發(fā)抖!抖音女神王小雨賬戶7連跌后殺入農(nóng)行...

瑟瑟發(fā)抖!抖音女神王小雨賬戶7連跌后殺入農(nóng)行...

金石隨筆
2025-11-17 00:09:39
隨著葡萄牙9-1,挪威4-1意大利,世預(yù)賽最新積分榜:歐洲5隊(duì)直通

隨著葡萄牙9-1,挪威4-1意大利,世預(yù)賽最新積分榜:歐洲5隊(duì)直通

侃球熊弟
2025-11-16 23:56:49
央視改稱郭晶晶了,三字微變暗藏強(qiáng)烈信號(hào),霍震霆果然全說(shuō)對(duì)啦

央視改稱郭晶晶了,三字微變暗藏強(qiáng)烈信號(hào),霍震霆果然全說(shuō)對(duì)啦

草莓解說(shuō)體育
2025-11-15 03:12:12
全運(yùn)會(huì)王曼昱4-2孫穎莎,不和諧一幕再次出現(xiàn):球迷一邊倒惹爭(zhēng)議

全運(yùn)會(huì)王曼昱4-2孫穎莎,不和諧一幕再次出現(xiàn):球迷一邊倒惹爭(zhēng)議

大秦壁虎白話體育
2025-11-17 00:37:46
央八《隱鋒》僅播1晚就被要求下架?理由:胡編亂造,漏洞百出

央八《隱鋒》僅播1晚就被要求下架?理由:胡編亂造,漏洞百出

詩(shī)意世界
2025-11-14 21:57:48
你見過最狠的人有多狠?網(wǎng)友:好家伙,這么狠的人超乎我的想象力

你見過最狠的人有多狠?網(wǎng)友:好家伙,這么狠的人超乎我的想象力

帶你感受人間冷暖
2025-11-02 00:15:03
分享解剖學(xué)知識(shí),破除多年來(lái)的G點(diǎn)謠傳

分享解剖學(xué)知識(shí),破除多年來(lái)的G點(diǎn)謠傳

遠(yuǎn)方青木
2025-10-25 00:06:11
遼粵青年軍大戰(zhàn),廣東33分大勝,杜鋒看中之人17分,吳慶龍也沒轍

遼粵青年軍大戰(zhàn),廣東33分大勝,杜鋒看中之人17分,吳慶龍也沒轍

萌蘭聊個(gè)球
2025-11-16 22:06:23
一人一城!NBA現(xiàn)役實(shí)現(xiàn)該成就的概率:4人100%,兩人80%字母僅50%

一人一城!NBA現(xiàn)役實(shí)現(xiàn)該成就的概率:4人100%,兩人80%字母僅50%

籃球圈里的那些事
2025-11-14 18:18:05
3位副市長(zhǎng)(擬)任市委常委

3位副市長(zhǎng)(擬)任市委常委

上觀新聞
2025-11-16 16:05:04
上海多區(qū)出現(xiàn)!緊急提醒:破壞力強(qiáng)大,看到立即上報(bào)!

上海多區(qū)出現(xiàn)!緊急提醒:破壞力強(qiáng)大,看到立即上報(bào)!

環(huán)球網(wǎng)資訊
2025-11-16 21:13:14
國(guó)家出手!李梓萌騙人真相大白,幕后黑手被揪,受害者不止一人

國(guó)家出手!李梓萌騙人真相大白,幕后黑手被揪,受害者不止一人

許穋很機(jī)智
2025-10-19 13:34:42
上海專家發(fā)現(xiàn):吃甜食的老人,健康指數(shù)是吃蔬菜的人的8倍不止?

上海專家發(fā)現(xiàn):吃甜食的老人,健康指數(shù)是吃蔬菜的人的8倍不止?

霹靂炮
2025-10-17 21:31:29
趙露思就這樣再出神圖!穿“老頭衫”練舞,這顏值是真實(shí)存在的?

趙露思就這樣再出神圖!穿“老頭衫”練舞,這顏值是真實(shí)存在的?

小椰的奶奶
2025-11-16 16:00:36
2026年1月起加國(guó)七汽油!中石化率先換油,國(guó)四國(guó)五車適合嗎?

2026年1月起加國(guó)七汽油!中石化率先換油,國(guó)四國(guó)五車適合嗎?

小李子體育
2025-11-17 05:58:02
“世界最大駕?!狈嚵耍憾麻L(zhǎng)被捕、股價(jià)暴跌,30年神話崩塌!

“世界最大駕?!狈嚵耍憾麻L(zhǎng)被捕、股價(jià)暴跌,30年神話崩塌!

青眼財(cái)經(jīng)
2025-11-09 20:09:54
印度人在廬山戲水?三名境外游客在廬山一水潭戲水,景區(qū)官方致歉:“事發(fā)4月份,景區(qū)正加強(qiáng)規(guī)范化管理”

印度人在廬山戲水?三名境外游客在廬山一水潭戲水,景區(qū)官方致歉:“事發(fā)4月份,景區(qū)正加強(qiáng)規(guī)范化管理”

觀威海
2025-11-15 10:10:03
東京餐廳廁所門:櫻花妹與黑人男友的“15分鐘激戰(zhàn)”,老板怒掛全網(wǎng)后結(jié)局神反轉(zhuǎn)!

東京餐廳廁所門:櫻花妹與黑人男友的“15分鐘激戰(zhàn)”,老板怒掛全網(wǎng)后結(jié)局神反轉(zhuǎn)!

日本物語(yǔ)
2025-11-16 20:33:33
2025-11-17 08:32:49
智能進(jìn)化論 incentive-icons
智能進(jìn)化論
關(guān)注AI產(chǎn)業(yè)趨勢(shì)、場(chǎng)景應(yīng)用
410文章數(shù) 68關(guān)注度
往期回顧 全部

科技要聞

營(yíng)銷話術(shù)反噬信任,雷軍不該只是一怒了之

頭條要聞

5名中國(guó)游客在巴厘島車禍死亡 傷者:司機(jī)一點(diǎn)傷沒有

頭條要聞

5名中國(guó)游客在巴厘島車禍死亡 傷者:司機(jī)一點(diǎn)傷沒有

體育要聞

最佳新秀候選!2028美國(guó)男籃有他一個(gè)位置

娛樂要聞

CEO爆料肖戰(zhàn)《藏海傳》狂賺幾十億!

財(cái)經(jīng)要聞

房源暗中調(diào)價(jià) 央企舉報(bào)廣州國(guó)資房企

汽車要聞

"冰彩沙"全配齊 紅旗HS6 PHEV預(yù)售17.88萬(wàn)起

態(tài)度原創(chuàng)

健康
游戲
教育
親子
公開課

血液科專家揭秘白血病七大誤區(qū)

《紀(jì)元117:羅馬和平》多人游戲問題大 育碧承諾修復(fù)

教育要聞

官宣!南京又多一所附屬中學(xué)!

親子要聞

一分鐘教你判斷孩子的咳嗽代表什么

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 国产精品国产三级欧美二区 | 人人妻人人澡人人爽欧美二区| 百度一下少妇熟女15p| 国产av久久久久精东av| 人妻爽爽人妻夜夜| 5858s亚洲色大成网站www| 亚洲AV无码专区在线亚| 国产综合无码一区二区辣椒| 精品国产乱码久久久免费看| 无码中字不卡| 亚洲精品美女网站| 亚洲精品久久久久久| 后入人妻一区| 一本久久a久久精品vr综合| 无码人妻aⅴ一区二区三区蜜桃| 欧美成人VA免费大片视频| 欧美肥婆牲交| 麻豆人妻| 亚洲日韩v无码中文字幕| 亚洲人成伊人成综合网久久久| 久久久99精品成人片中文字幕| 国产精品久久久久aaaa| 国产第19页精品| 中文av乳导航| 九七色色影院| JAPANESE70MATURE老妇| 九九热久久这里全是精品| 国产尤物在线| 100部高清毛片免费观看| 国产精品亚洲αv天堂无码| 老熟女毛茸茸浓毛| 国产免费一区二区三区四在线播放 | 亚洲无码三级| 欧美日韓性视頻在線| 韩国高清一区二区| 色欲国产精品久久久爆乳| 制服丝袜美腿一区二区| 少妇搡BBBB搡BBB搡造直播| 国产精品久久久久久久久久久不卡精东 | 东京热无码av| 亚洲中久无码永久在线观看同|