夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌加入CUA戰(zhàn)場發(fā)布Gemini 2.5 Computer Use:AI直接操作瀏覽器

0
分享至

機(jī)器之心報道

編輯:Panda

谷歌的 Computer Use 模型來了!

今天凌晨,谷歌 DeepMind 重磅發(fā)布了基于 Gemini 2.5 的計(jì)算機(jī)使用模型Gemini 2.5 Computer Use。

考慮到前些天谷歌才剛剛發(fā)布了 Chrome DevTools (MCP),Gemini 2.5 Computer Use 的誕生倒不是特別讓人驚訝。簡單來說,與 OpenAI 的 Computer-Using Agent (CUA) 類似,DeepMind 的這個模型可讓 AI 直接控制用戶的瀏覽器 —— 在視覺理解和推理能力的基礎(chǔ)上,該模型可以幫助用戶在瀏覽器中執(zhí)行點(diǎn)擊、滾動和輸入等操作。



先來看兩個官方演示。

提示詞:From https://tinyurl.com/pet-care-signup , get all details for any pet with a California residency and add them as a guest in my spa CRM at https://pet-luxe-spa.web.app/. Then, set up a follow up visit appointment with the specialist Anima Lavar for October 10th anytime after 8am. The reason for the visit is the same as their requested treatment.

提示詞:My art club brainstormed tasks ahead of our fair. The board is chaotic and I need your help organizing the tasks into some categories I created. Go to sticky-note-jam.web.app and ensure notes are clearly in the right sections. Drag them there if not.

可以看到,不管是收集網(wǎng)絡(luò)信息與執(zhí)行動作,還是整理雜亂筆記,Gemini 2.5 Computer Use 都非常準(zhǔn)確地完成了任務(wù),同時速度也相當(dāng)快。

在相關(guān)基準(zhǔn)上,Gemini 2.5 Computer Use 的性能表現(xiàn)也達(dá)到了 SOTA 水平:



同時,其速度表現(xiàn)也優(yōu)于其它幾個相比較的模型:



目前,開發(fā)者已可以通過 Google AI Studio 和 Vertex AI 的 Gemini API 獲取這些能力。用戶也可以在 Browserbase 托管的演示環(huán)境中試用(最多僅支持 5 分鐘的流程,且不支持用戶中途接管):https://gemini.browserbase.com/

機(jī)器之心使用該演示環(huán)境做了幾次嘗試。整體來看,Gemini 2.5 Computer Use 在完成簡單任務(wù)時準(zhǔn)確度較高,但稍微復(fù)雜一點(diǎn)的任務(wù)就容易失敗。

比如在執(zhí)行「在維基百科上找到 John Wick 頁面」這樣的簡單任務(wù)時,該模型的表現(xiàn)非常成功。



但只要稍微復(fù)雜一點(diǎn),該模型就失敗了,比如「在維基百科上找到 John Wick 頁面,并總結(jié)其信息,給出中文版?!沽硗?,我們讓其「打開諾貝爾獎官方網(wǎng)站,給出今年諾貝爾將宣布的時間表」的任務(wù)以及以下任務(wù)均未能成功完成。

提示詞:瀏覽 jiqizhixin.com,找到近半年關(guān)于 Gemini 的報道,并整理成一份 Markdown 文件,并進(jìn)行總結(jié)。



此外,DeepMind 也已經(jīng)發(fā)布了 Gemini 2.5 Computer Use 系統(tǒng)卡:

https://storage.googleapis.com/deepmind-media/Model-Cards/Gemini-2-5-Computer-Use-Model-Card.pdf



Gemini 2.5 Computer Use 的工作原理

該模型的核心能力是通過 Gemini API 中新增的computer_use工具實(shí)現(xiàn)的,開發(fā)者使用時需在一個循環(huán)流程(loop)中運(yùn)行。

其輸入應(yīng)包括:

  • 用戶請求;
  • 當(dāng)前環(huán)境的截圖;
  • 最近執(zhí)行動作的歷史記錄。

另外,輸入中還可以指定是否從默認(rèn)支持的 UI 動作中排除特定功能以及添加自定義函數(shù)。



Gemini 2.5 Computer Use 模型工作流程

模型分析這些輸入后,會生成響應(yīng),通常是一個代表 UI 動作的函數(shù)調(diào)用(如點(diǎn)擊或輸入)。在某些操作(如購買行為)中,模型還會請求用戶確認(rèn)??蛻舳穗S后會執(zhí)行這些動作。

動作執(zhí)行完成后,系統(tǒng)會將最新截圖與當(dāng)前 URL 作為函數(shù)響應(yīng)返回給模型,重新啟動循環(huán)。

這一迭代過程會持續(xù)進(jìn)行,直到任務(wù)完成、出現(xiàn)錯誤,或因安全機(jī)制或用戶決定而終止。

谷歌表示,當(dāng)前 Gemini 2.5 Computer Use 模型主要針對網(wǎng)頁瀏覽器優(yōu)化,但在移動端 UI 控制方面也展現(xiàn)出強(qiáng)勁潛力。不過它暫未針對桌面操作系統(tǒng)級控制進(jìn)行優(yōu)化。

安全機(jī)制設(shè)計(jì)

谷歌還在博客中分享了他們對該模型的安全機(jī)制設(shè)計(jì)。

谷歌表示:「負(fù)責(zé)任地構(gòu)建智能體是讓 AI 造福所有人的唯一途徑。能夠直接操作電腦的 AI 智能體帶來了特有的風(fēng)險,包括用戶惡意使用、模型意外行為、以及網(wǎng)頁環(huán)境下的提示詞注入與詐騙。因此,我們在設(shè)計(jì)中高度重視安全防護(hù)?!?/p>

在 Gemini 2.5 Computer Use 模型中,谷歌直接在訓(xùn)練階段融入安全機(jī)制,以應(yīng)對三類主要風(fēng)險(詳見系統(tǒng)卡)。

此外,谷歌還為開發(fā)者提供安全控制選項(xiàng),防止模型自動執(zhí)行潛在高風(fēng)險或有害操作,例如:

  • 損害系統(tǒng)完整性;
  • 危及安全;
  • 繞過驗(yàn)證碼;
  • 控制醫(yī)療設(shè)備。

谷歌實(shí)施的控制手段包括:

  • 逐步安全服務(wù)(Per-step Safety Service):在推理階段,由獨(dú)立安全服務(wù)評估每個模型擬執(zhí)行的動作。
  • 系統(tǒng)指令(System Instructions):開發(fā)者可設(shè)定在特定高風(fēng)險操作前,智能體必須拒絕或請求用戶確認(rèn)。

結(jié)語

谷歌 DeepMind 攜 Gemini 2.5 Computer Use 高調(diào)入場,不僅在多個基準(zhǔn)測試上展示了領(lǐng)先的性能,也讓 AI 智能體領(lǐng)域的競爭正式進(jìn)入了白熱化階段。

從 OpenAI 到 Anthropic,再到如今的谷歌,科技巨頭們正競相定義我們與計(jì)算機(jī)交互的未來。盡管當(dāng)前模型在面對復(fù)雜現(xiàn)實(shí)任務(wù)時仍顯稚嫩,但這恰恰是技術(shù)黎明前的真實(shí)寫照。今天我們看到的不僅是一個新模型,更是一個清晰的信號:鍵盤和鼠標(biāo)的主導(dǎo)地位正受到挑戰(zhàn),一個通過自然語言直接驅(qū)動數(shù)字世界的時代,正加速向我們駛來。

https://blog.google/technology/google-deepmind/gemini-computer-use-model/

https://x.com/GoogleAIStudio/status/1975648565222691279

https://x.com/GoogleDeepMind/status/1975648789911224793

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美國終于明白,當(dāng)年他們“誤炸”中國大使館,中國為什么不反擊

美國終于明白,當(dāng)年他們“誤炸”中國大使館,中國為什么不反擊

蜉蝣說
2025-10-07 16:08:53
「ABB」式楊蘭蘭果然是「非常重要的人物」

「ABB」式楊蘭蘭果然是「非常重要的人物」

家傳編輯部
2025-10-08 16:24:33
2025諾貝爾化學(xué)獎授予“金屬有機(jī)”,有位獲獎?wù)呤乔迦A名譽(yù)教授

2025諾貝爾化學(xué)獎授予“金屬有機(jī)”,有位獲獎?wù)呤乔迦A名譽(yù)教授

瀟湘晨報
2025-10-08 18:34:15
花果山“板栗”事件后續(xù):官方介入調(diào)解,游客賠300元,民宿被扒

花果山“板栗”事件后續(xù):官方介入調(diào)解,游客賠300元,民宿被扒

凡知
2025-10-08 10:30:53
最新諾貝爾獎揭曉,日本速度令人震驚!

最新諾貝爾獎揭曉,日本速度令人震驚!

梳子姐
2025-10-08 13:13:58
涉及中國,日外相喊話高市早苗

涉及中國,日外相喊話高市早苗

環(huán)球時報新聞
2025-10-08 21:54:35
季前賽-無緣24分逆轉(zhuǎn)!森林狼丟絕殺加時惜敗步行者 華子復(fù)出17分

季前賽-無緣24分逆轉(zhuǎn)!森林狼丟絕殺加時惜敗步行者 華子復(fù)出17分

醉臥浮生
2025-10-08 10:59:50
越扒越有!上海鬧事網(wǎng)球姐生活奢靡,前男友也不一般,鄰居曝更多

越扒越有!上海鬧事網(wǎng)球姐生活奢靡,前男友也不一般,鄰居曝更多

奇思妙想草葉君
2025-10-07 23:59:53
隨著無錫3-0鹽城 蘇超四強(qiáng)全部出爐!央視鬧烏龍:淮安替南通晉級

隨著無錫3-0鹽城 蘇超四強(qiáng)全部出爐!央視鬧烏龍:淮安替南通晉級

侃球熊弟
2025-10-08 21:38:02
姜晨璟替補(bǔ)絕殺!武漢女足1-0奧克蘭聯(lián)女足,將客戰(zhàn)非洲冠軍

姜晨璟替補(bǔ)絕殺!武漢女足1-0奧克蘭聯(lián)女足,將客戰(zhàn)非洲冠軍

懂球帝
2025-10-08 18:05:14
奶爸神車的“滑鐵盧”:短短9個月,理想汽車是如何輸?shù)襞谱赖模?>
    </a>
        <h3>
      <a href=禾法思考
2025-10-07 11:00:03
日本米價太高!越南人將越南大米包裝成綠豆走私進(jìn)入日本

日本米價太高!越南人將越南大米包裝成綠豆走私進(jìn)入日本

爆角追蹤
2025-10-08 14:03:27
3位正廳級干部履新,他的前一任已升副部級

3位正廳級干部履新,他的前一任已升副部級

魯中晨報
2025-10-08 18:16:05
10月8日俄烏最新:普京點(diǎn)評最新戰(zhàn)況

10月8日俄烏最新:普京點(diǎn)評最新戰(zhàn)況

西樓飲月
2025-10-08 19:43:36
購買中國戰(zhàn)斗機(jī)不給錢,7次追債都沒還,這個囂張小國報應(yīng)來了

購買中國戰(zhàn)斗機(jī)不給錢,7次追債都沒還,這個囂張小國報應(yīng)來了

通文知史
2025-10-07 22:14:27
“受賄數(shù)額特別巨大”,農(nóng)業(yè)農(nóng)村部原部長唐仁健一審被判死緩

“受賄數(shù)額特別巨大”,農(nóng)業(yè)農(nóng)村部原部長唐仁健一審被判死緩

紅星新聞
2025-09-28 19:11:17
俄軍第127旅3營集體投降,沙特增產(chǎn)石油釜底抽薪

俄軍第127旅3營集體投降,沙特增產(chǎn)石油釜底抽薪

史政先鋒
2025-10-08 12:35:37
山東煙臺的這件事,用惡來形容都太文明了

山東煙臺的這件事,用惡來形容都太文明了

林中木白
2025-10-08 18:07:47
8輪19分!54萬人口小國狂歡:今晚贏球=首進(jìn)世界杯,國足真踢不過

8輪19分!54萬人口小國狂歡:今晚贏球=首進(jìn)世界杯,國足真踢不過

侃球熊弟
2025-10-08 09:50:05
谷歌科學(xué)家又拿了諾貝爾獎,把量子世界搬到了宏觀世界

谷歌科學(xué)家又拿了諾貝爾獎,把量子世界搬到了宏觀世界

爆角追蹤
2025-10-08 09:11:58
2025-10-09 00:27:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11418文章數(shù) 142470關(guān)注度
往期回顧 全部

科技要聞

2025年諾貝爾化學(xué)獎揭曉

頭條要聞

老虎溝遇難者身份披露 驢友:有女生化妝包比睡袋還沉

頭條要聞

老虎溝遇難者身份披露 驢友:有女生化妝包比睡袋還沉

體育要聞

阿爾巴退役,他是巴薩隊(duì)史第一左后衛(wèi)嗎

娛樂要聞

許凱復(fù)出拍戲 疑資本力保網(wǎng)友怒斥頭鐵

財經(jīng)要聞

假期外圍市場太熱鬧!A股明天怎么走?

汽車要聞

家用SUV的越級感 8萬級的全新博越就能擁有

態(tài)度原創(chuàng)

親子
時尚
健康
旅游
手機(jī)

親子要聞

我們最大的特點(diǎn)就是年輕化、更專業(yè)!年入十萬,很多市場需要專業(yè)陪伴類的服務(wù)

到了秋天才知道,年紀(jì)大的女人要告別“小腳褲”,這樣穿顯瘦

內(nèi)分泌科專家破解身高八大謠言

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

手機(jī)要聞

iPhone 17e被曝2026年登場:A19+告別劉海屏,基帶或許會有驚喜

無障礙瀏覽 進(jìn)入關(guān)懷版 91久操东北夫妻| 333aaa国产精品| 色欲av无码一区二区人妻九色| 亚洲无码直播| 人妻无码资源| 久久精品夜色噜噜亚洲a∨| 国产精品久久AV无码自慰| 无码8090精品久久一区| 亚洲Av秘 无码一区二区 | 女高潮大叫喷水抽搐| 青草伊人久久综在合线亚洲| 国产日韩久久| 久久久久久无码av成人影院| 国产清纯在线一区二区| 久久99精品久久久久久园产越南| 人妻无码一区二区三区TV| 中日韩伦理片一区二区| 激情综合色综合久久综合| 国产欧美视频一二三四区| 久久久一区二区三区精品无码| 免费在线你懂的| 日本人体337p| 视频国产精品丝袜第一页| 97精产国品一二三产区| 一炕四女被窝交换啪啪| AV一二三区| 在线免费AV网址| 人妻大吊av| 国产亚洲美女精品久久久| 91亚洲国产PORNY| 亚洲欧美国产三级久久| 熟女无套高潮内谢吼叫免费| 亚洲另类熟女国产精品| 被男狂揉吃奶胸60分钟视频| 婷婷婷国产在线视频| 日韩精品一区二区亚洲A| 2014av手机天堂网免费| 国产福利酱国产一区二区| 亚州成人精品suv| 熟女肥臀白浆大屁| 国产一进一出|