夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網易首頁 > 網易號 > 正文 申請入駐

AGI時刻來臨?奧特曼放出ChatGPT「統(tǒng)一智能體」,最卷打工人真的來了 |【經緯低調分享】

0
分享至

不久前,一位離職OpenAI的核心研究員發(fā)聲,分享了他對AI未來的深刻思考:人工智能成為了個人能力的倍增器,也正在成為有史以來最強大的杠桿機制。

緊接著,2025年7月18日,OpenAI重磅發(fā)布ChatGPT「統(tǒng)一智能體」,標志著人工智能邁向真正的通用智能時代。

奧特曼親自帶隊直播,將ChatGPT、Deep Research與Operator三大技術首次融合,打造出能自主思考決策、無縫銜接網頁交互與深度分析的超級智能體。

這一智能體配備可視化瀏覽器、文本瀏覽器及終端工具,可獨立完成網頁瀏覽、數據篩選、代碼運行,甚至直出PPT和Excel。在HLE測試中斬獲41.6%高分,數學基準測試FrontierMath刷新SOTA,Excel操作能力遠超同類模型,投行建模任務表現碾壓前輩。

其核心優(yōu)勢在于端到端強化學習與靈活人機協(xié)作,人類可隨時中斷接管,支付等關鍵操作需主動確認。Pro用戶每月享400次使用額度,Plus和Team用戶為40次,支持婚禮策劃、球場行程規(guī)劃等多元場景。

被稱為“最卷打工人”的AGI狀態(tài)如何?以下,Enjoy:

來源:新智元

編輯:桃子 好困

ChatGPT agent誕生了!奧特曼深夜帶隊直播,首個統(tǒng)一智能體無縫融合三大AI,自主思考決策,還能上網直出PPT、Excel。2025年,作為全新AI杠桿,ChatGPT正在解鎖「超級個體」新模式。

今晚,ChatGPT和Deep Research、Operator「三劍客」首度合體!

奧特曼親自帶隊,25分鐘高能直播重磅發(fā)布ChatGPT agent,開啟人類和智能體協(xié)作全新時代。



ChatGPT agent的核心,是一個統(tǒng)一的智能體系統(tǒng)。

簡言之,它融合了此前三大技術突破的優(yōu)勢:Operator與網站交互的能力,Deep Research整合信息的技巧,以及ChatGPT智能對話優(yōu)勢。


如今,ChatGPT可以直接使用計算機,全程自主為你工作。

從智能瀏覽網頁、篩選結果,在需要時提醒安全登錄、運行代碼、進行分析,還能直出PPT和Excel匯總發(fā)現結果。


最最重要的是,一切盡在掌控之中。

人類隨時可以中斷任務、接管瀏覽器,或是完全停止。

在HLE測試中,ChatGPT agent拿下了41.6%高分;并在數學FrontierMath基準上,同樣刷新SOTA,碾壓o4-mini和o3模型。


順便提一句,ChatGPT Agent在HLE上仍不及馬斯克的Grok 4 Heavy

誰能想到,上面這張PPT,還是ChatGPT agent自己做的。在基準測試中,其操作辦公軟件的能力,幾乎沒給人類留下多少余地了。


網友辣評:打工人的好日子到頭了

奧特曼感慨道,ChatGPT agent使用計算機執(zhí)行復雜任務,對自己來說是一個真正「感受AGI」的時刻。


從今天起,Pro、Plus和Team用戶直接可以開啟體驗,在對話框下拉欄中,選擇「Agent mode」即可。

其中,Pro用戶每月有400次的額度,Plus和Team為每月40次。


太長不看版:(節(jié)選自OpenAI研究員張熙堃的X)

  • Deep Research擅長做研究,Operator會執(zhí)行操作,而ChatGPTagent則能同時完成所有這些任務!

  • 端到端強化學習的威力!基于RL Scaling,ChatGPT agent的高效性和數據利用率非常驚人。

  • 人機協(xié)作,依舊是核心!任務過程中可隨時打斷,引導ChatGPT完成新任務。在支付、刪除文件等操作前,會向人類主動確認。只有在必要時,它才會提問以獲取更清晰的指令。

  • 真實世界表現 > 追逐基準排名!ChatGPT agent確實橫掃了很多榜單。但在模型開發(fā)過程中,OpenAI既不會一門心思去刷分,也不太在意最終在排行榜上的位置。


01

三強首度合體

ChatGPT agent正式登場

今年1月,OpenAI發(fā)布了首個智能體Operator,讓AI像人類一樣直接與GUI交互。

緊接著2月初,他們又推出了首個Deep Research,推理模型直接可以使用工具,開展研究。

這兩個工具各有專長,Operator可以自主上網、點擊和輸入,而Deep Research則擅長分析和總結信息。

然而,前者無法開啟深度分析、撰寫詳細報告;后者無法與網站交互獲得精確結果。

今天,OpenAI正式將其合二為一——ChatGPT agent,「單一模型」即可解鎖全新能力。

ChatGPT agent配備了一整套工具:

· 可視化瀏覽器:用于圖形用戶界面與網頁交互 · 文本瀏覽器:用于處理簡單推理和網頁查詢 · 終端+直接API訪問權限:圖像API


agent還能借助ChatGPT連接器,連接Gmail、Github等應用,便于根據提示找到相關信息并給出回復。

不僅如此,接管瀏覽器后登錄任何網站,讓ChatGPT agent進行更深入、更廣泛的研究和任務執(zhí)行。

由此,ChatGPT便能選擇最佳路徑,高效地執(zhí)行任務。

  • 打工人的PPT,ChatGPT代勞了

為了展示ChatGPT agent能力,團隊現場演示了一個真實場景:為朋友Minnie和Sarah策劃一場婚禮。

根據提示,這項任務需要AI依據著裝要求和天氣情況,推薦精美價格合理的禮服、為參會者預訂酒店,以及為新人準備婚禮禮物。

ChatGPT agent在理解提示后,并沒有直出報告,而是再次重述確認任務要求,比如確切的婚禮日期。


當一切確認之后,接下來,它便自主打開瀏覽器,并在交互頁面上顯示逐步執(zhí)行的每一個過程,即思維鏈。


需要注意的是,agent會在幾秒內配置好的虛擬計算環(huán)境中,開始執(zhí)行任務。

任務執(zhí)行中,agent使用文本瀏覽器查詢,并找到了合適的西裝,然后切換到視覺瀏覽器,等待確認。


在ChatGPT執(zhí)行婚禮策劃任務同時,還可以讓它做另一個任務:購買一雙9.5碼黑色鞋子。


也就意味著,ChatGPT agent不懼被打斷。即便上一個任務規(guī)劃時間很長,也不耽誤接下來的事情。


最后,ChatGPT agent生成了一份非常全面的報告,包括禮服、酒店、鞋子、禮物全部給出了規(guī)劃和建議。

在另一個演示中,團隊用ChatGPT應用開啟任務——上傳一張團隊吉祥物——可愛小狗的圖片,做成筆記本貼紙,并訂購500個。

然后,它便開始調用工具Imagen生成動漫版圖片,并設計貼紙,從StickerMule訂購500份寄到xxx。


更令人驚喜的是,ChatGPT agent還能通過連接器,比如Google Drive提取評估數據,自己生成PPT。


在此過程中,agent會編寫代碼,并將其編譯成最終幻燈片。它還會借用圖像工具,為PPT頁面進行裝飾。


不一會功夫,它就直接輸出了第一張HLE、FrontierMath的PPT,但不夠精致,然后它再次通過RL不斷優(yōu)化。


最終,就得到了一個優(yōu)美的PPT文件,可以在辦公軟件中直接打開。


不得不說,ChatGPT agent太強了。


甚至,你還可以讓ChatGPT agent制定一個參觀30+美國職棒大聯盟球場的最佳行程。

耗時25分鐘,它迅速生成一個直觀可視化的Excel,以后做數據也徹底解放了雙手。


02

HLE拿下41.6%高分

多項基準破紀錄

統(tǒng)一后的agent,大幅提升了ChatGPT在日常和專業(yè)領域的實用性。

不僅在網頁瀏覽,還是現實任務完成能力的評估中,ChatGPT agent全部刷新了SOTA。

如上提及的,在人類最后考試(HLE)中,ChatGPT agent以41.6%的得分,刷新了pass@1最高紀錄。

當研究團隊采用并行策略后,即同時運行最多8次并選取自信度最高結果,HLE得分直接刷到了44.4%。


在最難的數學基準測試FrontierMath中,ChatGPT agent借助代碼終端等工具,實現了27.4%準確率,大幅超越o3和o4-mini。


不僅如此,在內部設計的「高經濟價值知識工作」測試中,ChatGPT agent在半數案例中,輸出質量與人類相當,甚至碾壓人類。


任務來自真實專業(yè)工作場景,比如為按需緊急護理服務商撰寫競品分析、編制詳細的攤銷表,以及為新的綠色氫能設施尋找可行的水源

在評估數據科學生產力任務的DSBench中,ChatGPT agent以顯著優(yōu)勢超越了人類表現。


在Excel編輯能力的SpreadsheetBench測試中,其表現同樣遠超現有模型。

當獲得直接編輯權限時,ChatGPT agent以45.5%的得分顯著超越Excel Copilot的20.0%。


在投行分析師1-3年級建模任務的內部評估中,ChatGPT agent底層模型碾壓Deep Research和o3模型。


此外,在OpenAI發(fā)布的BrowseComp基準測試中,ChatGPT agent以68.9%的準確率刷爆紀錄,比Deep Research高出17.4%。

在WebArena基準測試中,其表現也優(yōu)于基于o3的CUA(即Operator背后的底層模型)。


BrowseComp基準專門評估瀏覽智能體在網絡上定位難尋信息的能力;WebArena用于評估網頁瀏覽智能體完成現實網絡任務的能力


03

2025下一個熱點

AI智能體「杠桿」

ChatGPT agent這么強,能為我們帶來什么價值?

最近,剛剛離職OpenAI研究員Hyung Won Chung分享演講視頻中表示,「AI正成為有史以來最強大的『杠桿』」。


他表示,AI智能體結合了兩種杠桿:人力和代碼。

它就像雇了個幫手,替你干活(人力杠桿);而且它又是軟件,能無限復制(代碼杠桿)。


1. 人力杠桿 :AI智能體可以替人類完成工作,就像一個人AI助理。 2. 代碼杠桿:當前的AI智能體是純軟件形式,可以輕松復制。如果你想要10倍的產出,就運行10個智能體;想要12倍,就再加兩個。這種杠桿不需要許可,可以隨意擴展。

在這場發(fā)布會上,OpenAI重提了「AI杠桿」這一核心話題。

他們同樣認為,2025年之后,AI智能體將成為一種全新的杠桿機制。


它不僅能代替人類完成工作,還能通過「復制粘貼」無限擴展。不論是10個,還是更多智能體,不需要額外的許可,即可一鍵部署。

研究人員舉例稱,Deep Research發(fā)布之后近半年里,極大地提升了個體和小團隊的產出。

過去,團隊規(guī)?;枰蕾嚒溉肆Ω軛U」,但人類協(xié)作的溝通成本,甚至包括摩擦,往往成為了瓶頸。

而現在,ChatGPT agent的出現一個重大意義在于,讓小團隊創(chuàng)造巨大的價值。

一個10人或20人的初創(chuàng)公司,借助AI杠桿,可能創(chuàng)造出媲美科技巨頭的成就。

這種「超級個體」模式,或許在未來將重塑企業(yè)的組織架構,憑借AI實現指數級增長。


04

北大校友領銜出鏡

值得一提的是,這次直播中,有兩位華人學者同時出鏡。

Zhiqing Sun(孫之清)


孫之清于2024年6月加入OpenAI,擔任研究科學家。

他于2025年在卡內基梅隆大學獲得計算機科學博士學位,于2019年在北京大學獲得計算機科學學士學位。



在OpenAI期間,他不僅參與到了o3/o4-mini、計算機使用智能體,以及Deep Research這幾個關鍵項目當中,而且還是Deep Research的研究負責人。




Casey Chu


Casey Chu于2020年4月加入OpenAI,擔任研究員。

此前,他于2019年在斯坦福大學獲得計算數學碩士學位,并于2016年在哈維穆德學院獲得數學學士學位。

后來他曾嘗試攻讀斯坦福大學的計算數學博士學位,但中途選擇了退學。



別看他的title只是研究員,但他不僅是DALL·E 2的共同一作,而且還主導了GPT-4視覺輸入的初始原型的開發(fā)。



參考資料:

https://openai.com/index/introducing-chatgpt-agent/

https://x.com/xikun_zhang_/status/1945895070269583554


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
果然新加坡蹦了出來!其部長公開宣稱:臺海若開戰(zhàn),等于中美開戰(zhàn)

果然新加坡蹦了出來!其部長公開宣稱:臺海若開戰(zhàn),等于中美開戰(zhàn)

Ck的蜜糖
2025-10-14 01:37:45
33歲中國男子在柬埔寨高墜身亡:當地警方正調查是否為自殺 親屬稱其單身系家中獨子

33歲中國男子在柬埔寨高墜身亡:當地警方正調查是否為自殺 親屬稱其單身系家中獨子

紅星新聞
2025-10-15 15:18:19
《沉默的榮耀》要不是黎晴回歸!谷正文到死不知翁連旺才是內鬼

《沉默的榮耀》要不是黎晴回歸!谷正文到死不知翁連旺才是內鬼

農城浪子
2025-10-14 15:43:55
打臉!休賽期被湖人裁掉的古德溫,本場狂砍24分4籃板6助攻

打臉!休賽期被湖人裁掉的古德溫,本場狂砍24分4籃板6助攻

雷速體育
2025-10-15 12:46:28
重慶馬王農貿市場案件:現場畫面流出,關系錯綜復雜,全員惡人

重慶馬王農貿市場案件:現場畫面流出,關系錯綜復雜,全員惡人

溫柔看世界
2025-10-14 10:26:13
醫(yī)院員工投訴“白天忙著搶救病人,晚上還要背演講稿,非常折騰人”,院方稱是自愿參加,桃江衛(wèi)健局:活動已取消

醫(yī)院員工投訴“白天忙著搶救病人,晚上還要背演講稿,非常折騰人”,院方稱是自愿參加,桃江衛(wèi)健局:活動已取消

極目新聞
2025-10-14 12:20:31
解放戰(zhàn)爭后期還敢反攻的國軍悍將,攻擊四野三野,俘千余人后撤退

解放戰(zhàn)爭后期還敢反攻的國軍悍將,攻擊四野三野,俘千余人后撤退

言今憶史
2025-10-15 08:51:25
網友自曝丈夫出軌,帶多位女性去廁所錄視頻,連老板娘都不放過

網友自曝丈夫出軌,帶多位女性去廁所錄視頻,連老板娘都不放過

社會醬
2025-10-11 17:02:47
有命掙錢沒命花,張靚穎高墜傷重,張杰大難不死,更慘是沒命的他

有命掙錢沒命花,張靚穎高墜傷重,張杰大難不死,更慘是沒命的他

冷紫葉
2025-10-14 15:17:15
凱特和威廉的新開始:搬進“永遠的家”,為家人重新出發(fā)

凱特和威廉的新開始:搬進“永遠的家”,為家人重新出發(fā)

英國那些事兒
2025-10-15 23:22:42
陳文清在云南和新疆調研

陳文清在云南和新疆調研

新京報政事兒
2025-10-15 19:14:34
叛徒谷正文:三姓家奴,一生狡詐狠毒,子女皆和他斷絕關系!

叛徒谷正文:三姓家奴,一生狡詐狠毒,子女皆和他斷絕關系!

小松歷史菌
2025-10-15 22:39:57
山姆(上海)超市有限責任公司因銷售不合格兒童產品被罰

山姆(上海)超市有限責任公司因銷售不合格兒童產品被罰

齊魯壹點
2025-10-15 11:04:44
不到72小時爆4個大瓜,流產離婚、負債28億、自曝入獄,風波不斷

不到72小時爆4個大瓜,流產離婚、負債28億、自曝入獄,風波不斷

冷紫葉
2025-10-15 18:34:07
部分地區(qū)國補回歸,iPhone 17 等新機直接降價!

部分地區(qū)國補回歸,iPhone 17 等新機直接降價!

花果科技
2025-10-15 16:29:16
活久見!網傳西北某院設計師和領導一言不合“被辭退”,打起來了

活久見!網傳西北某院設計師和領導一言不合“被辭退”,打起來了

火山詩話
2025-10-14 16:23:52
朝鮮副國級高官叛逃脫北,曝光金家秘聞:酒池肉林、80萬買軒尼詩

朝鮮副國級高官叛逃脫北,曝光金家秘聞:酒池肉林、80萬買軒尼詩

貓眼觀史
2024-03-25 14:31:14
林允兒這下胯還挺大的啊,看了她澳門最新活動生圖,真的驚呆了

林允兒這下胯還挺大的啊,看了她澳門最新活動生圖,真的驚呆了

動物奇奇怪怪
2025-10-15 12:31:24
重磅:美國讓德國援烏金牛座導彈!或提供50枚戰(zhàn)斧

重磅:美國讓德國援烏金牛座導彈!或提供50枚戰(zhàn)斧

項鵬飛
2025-10-15 19:41:41
9月大型SUV銷量榜公布:問界M8奪冠 M9進入前三

9月大型SUV銷量榜公布:問界M8奪冠 M9進入前三

手機中國
2025-10-15 15:54:08
2025-10-16 00:07:00
經緯創(chuàng)投 incentive-icons
經緯創(chuàng)投
經緯創(chuàng)投公眾平臺
2385文章數 7182關注度
往期回顧 全部

科技要聞

14英寸M5芯片MacBook Pro發(fā)布:12999元起

頭條要聞

安世半導體稱中方已禁止其從中國出口產品 外交部回應

頭條要聞

安世半導體稱中方已禁止其從中國出口產品 外交部回應

體育要聞

C羅:為葡萄牙出戰(zhàn)意義非凡 11月鎖定世界杯席位

娛樂要聞

男明星靠做飯人設狂賺?

財經要聞

9月M2-M1剪刀差大幅收窄 存款搬家引關注

汽車要聞

預售價7.68萬元起/三種動力可選 星光730開啟預售

態(tài)度原創(chuàng)

本地
旅游
親子
健康
公開課

本地新聞

考上警犬專業(yè),我和修勾一起卷編制

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

親子要聞

飛鶴發(fā)布“新一代更適合”戰(zhàn)略,以鮮活營養(yǎng)定義嬰幼兒奶粉

內分泌科專家破解身高八大謠言

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 国产盗摄精品一区二区三区的导演 | 7777奇米影视| 亚洲欧洲日产韩国无码| 国产综合在线视频| 精品国产免费一区二区三区| www.7722国产专区| 国产在线看你懂的| 久久人妻A V电影| 亚洲熟女少妇一区二区三区| 少妇被粗大的猛烈进出视频 | 高清无码久道中文字幕| 又大又黄又粗高潮免费| 久久精品噜噜噜成人| 亚洲AV无码国产精品色软件下戴 | 激情综合婷婷色五月蜜桃| 精品无码68区| 亚洲av成人无码天堂| 国产精品一国产精品色欲| 国产av午夜精品一区二区三区| 亚洲中文人妻在线| 亚洲国产av区一区二| 一本一道中文字幕无码| 国产 无码 国产精品视频| 精东在线亚洲| 亚洲精品成人福利网站| xxx日本熟妇| 蜜桃无码一区二区三区| 欧美三级视频| AV网站中文| 特黄做受又粗又长又大又硬| 无码囯产精品一区二区免费| 成人黄色高清视频在线观看| 亚洲AV无码一二区三区在线播放| 无码粉嫩小泬无套色欲人妻无码| 超碰成人精品一区二区三| 日韩AV一区二区久久久| 夜夜欢天天干| 亚洲一区二区三区四区AV| 精品日本一区二区三区在线观看| 中文字幕一区二区三区四虎在线| 人妻精品一区二区三区|