夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

中科院團(tuán)隊(duì)打造AI專屬交互界面,任務(wù)成功率提升67%

0
分享至

在日常使用電腦時(shí),看著屏幕、點(diǎn)擊鼠標(biāo)是再自然不過的基本操作。但這種對(duì)人類明明很容易的操作方式,卻成為 AI 的巨大挑戰(zhàn):它們視力差、動(dòng)作慢、不擅長(zhǎng)看也不擅長(zhǎng)點(diǎn)。

幾十年來,操作系統(tǒng)的圖形用戶界面(GUI)一直都是為人類使用而設(shè)計(jì),從未考慮有一天,大語(yǔ)言模型(LLM)會(huì)成為操作系統(tǒng)新的使用者。

要知道,GUI 智能體與人類在能力上存在巨大的差異,完美適配人類能力特征的 GUI,反而非常不適合 LLM 使用。

LLM 擅長(zhǎng)語(yǔ)義規(guī)劃、定目標(biāo)、決策要“做什么”,而 GUI 逼著使用者給出具體“怎么做”的詳細(xì)步驟。但是,LLM 恰恰非常不擅長(zhǎng)這種低層次、繁瑣的機(jī)制性操作,因此很容易出錯(cuò)。

近期,中國(guó)科學(xué)院軟件研究所基礎(chǔ)軟件與系統(tǒng)重點(diǎn)實(shí)驗(yàn)室團(tuán)隊(duì)提出了一種新的思路,他們?yōu)椴僮飨到y(tǒng)引入了新的抽象,為大模型量身定制了目標(biāo)導(dǎo)向接口(GOI)。通過將 GUI 操作轉(zhuǎn)化為聲明式(Declarative)原語(yǔ),顯著提高了 LLM 在自動(dòng)化計(jì)算機(jī)任務(wù)中的表現(xiàn)。

中國(guó)科學(xué)院軟件研究所陳海波教授對(duì) DeepTech 表示,GOI 的設(shè)計(jì)理念有望為領(lǐng)域帶來新的思考——系統(tǒng)或程序本身在設(shè)計(jì)時(shí)即假設(shè)用戶可能是 LLM,并提供 LLM 使用的接口,而非強(qiáng)迫 LLM 模仿人類,去使用那些為人類設(shè)計(jì)的接口。

簡(jiǎn)單來理解,GOI 讓 LLM 更像是“指揮官”而非“操作員”。傳統(tǒng)微調(diào)或重訓(xùn)練的方法,就像要求大模型模仿人類,學(xué)習(xí)掌握處理機(jī)制性操作的能力;而聲明式的 GOI 就像一位專業(yè)的“執(zhí)行助理”,接管了 LLM 不擅長(zhǎng)的機(jī)制操作。指揮官(大模型)專注于發(fā)揮本就擅長(zhǎng)的能力,下達(dá)“想要什么結(jié)果”(策略),GOI 這個(gè)“助理”會(huì)自動(dòng)處理所有底層的導(dǎo)航和交互(機(jī)制)。

GOI 與傳統(tǒng)接口最實(shí)質(zhì)的不同在于:傳統(tǒng)接口通常默認(rèn)接口的使用者為人類,而 GOI 是讓接口更適合 LLM 使用,對(duì) LLM 更友好。研究人員在 Windows 上的微軟 Office 套件(Word、PowerPoint、Excel)上評(píng)估了 GOI 的有效性。

結(jié)果顯示,與領(lǐng)先的基于 GUI 的代理基線相比,GOI 將任務(wù)成功率提升了 67%,步驟減少了 43.5%。值得注意的是,GOI 在 61% 以上的成功任務(wù)中,僅用一次 LLM 調(diào)用即完成了相關(guān)任務(wù)。


圖丨從左至右依次為:李明煜、陳海波和王遠(yuǎn)(來源:陳海波)

GOI 當(dāng)前基于 Windows 系統(tǒng)的 UIA 可訪問性機(jī)制實(shí)現(xiàn),其設(shè)計(jì)理念同時(shí)具有跨平臺(tái)通用性,類似的可訪問機(jī)制接口在 macOS、Linux(例如 Ubuntu)、Android 等系統(tǒng)中均可提供。據(jù)介紹,GOI 在這些系統(tǒng)上落地,更多的是一種工程上的開發(fā)適配。

對(duì)于游戲和部分媒體應(yīng)用來說,這類應(yīng)用程序?yàn)檫_(dá)到更高的性能,采取了自繪和自定義的方法,并沒有全部使用操作系統(tǒng)通用的可訪問性類型和模式。因此,GOI 在這類應(yīng)用上的實(shí)現(xiàn)需要開發(fā)者進(jìn)行配合。

相關(guān)論文以《一種提高計(jì)算機(jī)使用代理效率的聲明式大語(yǔ)言模型友好界面的案例研究》(A Case for Declarative LLM-friendly Interfaces for Improved Efficiency of Computer-Use Agents)為題發(fā)表在預(yù)印本網(wǎng)站 arXiv[1]。論文作者包括中國(guó)科學(xué)院軟件研究所基礎(chǔ)軟件與系統(tǒng)重點(diǎn)實(shí)驗(yàn)室陳海波教授、李明煜副研究員和王遠(yuǎn)博士研究生。


圖丨相關(guān)論文(來源:arXiv)

研究團(tuán)隊(duì)首先從接口設(shè)計(jì)的角度分析問題。具體而言,為人使用設(shè)計(jì)的 GUI,對(duì)用戶能力做了四個(gè)關(guān)鍵假設(shè):用戶視力好、操作快,但短期記憶空間小且不擅長(zhǎng)寫代碼。

這些假設(shè)對(duì) LLM 并不成立。LLM 視力差、推理慢,但是上下文空間巨大,且擅長(zhǎng)結(jié)構(gòu)化輸出。這種錯(cuò)配使得 LLM 使用 GUI 時(shí)遇到了很多挑戰(zhàn)。例如,在使用 GUI 時(shí),功能不能被直接調(diào)用,而是需要輸出長(zhǎng)動(dòng)作鏈進(jìn)行“導(dǎo)航”和“交互”。

陳海波舉例說道,這就好比 LLM 去打車,命令式的 GUI 需要告訴司機(jī)“前方直行 100 米,第一個(gè)紅綠燈路口右轉(zhuǎn),靠右前方行駛 50 米”,而不能直接聲明“目的地”。處理這些細(xì)粒度且繁瑣的步驟,恰恰是 LLM 不擅長(zhǎng)的。

該團(tuán)隊(duì)的一個(gè)很自然的思考是:是否可以將 GUI 使用中 LLM 不擅長(zhǎng)的部分交給操作系統(tǒng),而非由 LLM 負(fù)責(zé)一切呢?


圖丨 GOI 抽象層概述(來源:arXiv)

基于此,他們發(fā)現(xiàn) APP 的使用可以分為策略(policy)機(jī)制(mechanism)兩部分。簡(jiǎn)單來理解,策略就是“做什么”:分析完成用戶任務(wù)需要用到什么功能;機(jī)制則是“怎么做”:如何通過一步步的 UI 導(dǎo)航和交互,觸發(fā)這些功能。


圖丨GUI 使用中的策略-機(jī)制耦合(來源:arXiv)

另一方面,研究人員將 GUI 的導(dǎo)航和交互抽象為訪問(access)、狀態(tài)(state)、觀測(cè)(observation)三類聲明式原語(yǔ)。這樣,LLM 不再需要輸出具體、繁瑣且易錯(cuò)的導(dǎo)航和交互步驟,而是直接通過聲明式原語(yǔ)聲明期望的結(jié)果。

“正是這三類聲明式原語(yǔ)將策略和機(jī)制解耦,允許 LLM 專注于策略的處理,規(guī)避了大量來自機(jī)制層面的失敗和交互開銷,因此帶來了準(zhǔn)確率和效率的大幅提升。”陳海波表示。


(來源:arXiv)

以幻燈片為例,用戶的需求是“將 PPT 背景全部設(shè)置為藍(lán)色”。在這一任務(wù)中,策略(功能編排)指的是使用“藍(lán)色”和“應(yīng)用到全部”這兩個(gè)功能,而機(jī)制(導(dǎo)航和交互)是點(diǎn)擊“設(shè)計(jì)”“設(shè)置背景格式”“純色填充”“顏色”“藍(lán)色”和“應(yīng)用到全部”,以觸發(fā)實(shí)際的功能。


(來源:資料圖)

另一個(gè)例子是,用戶要求將“滾動(dòng)條移動(dòng)到靠近結(jié)尾的位置”。在這一任務(wù)中,策略指的是確定一個(gè)最終位置,比如 80%,而機(jī)制(交互)指的是選中滾動(dòng)條、保持按住不釋放,多次拖拽和移動(dòng)并觀察最終狀態(tài)是否符合預(yù)期,直到移動(dòng)到目標(biāo)位置。


(來源:資料圖)

GUI 的設(shè)計(jì)耦合了策略與機(jī)制,應(yīng)用功能的使用前置依賴于導(dǎo)航和交互,無法被直接訪問。當(dāng)使用 GUI 時(shí),LLM 不僅面臨著冗長(zhǎng)的動(dòng)作鏈條,過多的調(diào)用次數(shù),還經(jīng)常在導(dǎo)航和交互中犯錯(cuò),導(dǎo)致任務(wù)失敗。

“雖然 LLM 不擅長(zhǎng)處理機(jī)制,但我們發(fā)現(xiàn),導(dǎo)航和交互兩個(gè)部分存在很強(qiáng)的確定性,這部分工作可以由算法確定性完成,不必 LLM 參與?!标惡2ū硎?。

具體來說,應(yīng)用控件間的轉(zhuǎn)換關(guān)系是確定的,可以被建模為有限狀態(tài)機(jī);同時(shí),在可訪問性下,控件可被歸類為有限數(shù)量的 41 種控件類型和 34 種控制模式。這為策略與機(jī)制的解耦提供了機(jī)會(huì)。

解耦后的結(jié)果,正是“聲明式”的交互范式。在這種范式下,LLM 直接指定期望的結(jié)果,而不是輸出完成結(jié)果的具體動(dòng)作。例如,LLM 可以直接聲明visit(“藍(lán)色”“應(yīng)用到全部”),而非輸出具體的導(dǎo)航路徑。

LLM 可以直接調(diào)用set_scrollbar_pos(80%)以設(shè)置最終位置,而非通過迭代交互以完成這一結(jié)果。這種聲明式接口,允許 LLM 專注于語(yǔ)義推理,而非自身不擅長(zhǎng)的細(xì)粒度的底層操作。


表丨命令式 GUI 與聲明式 GOI 的案例對(duì)比(來源:arXiv)

研究中的一個(gè)挑戰(zhàn)是,接口的設(shè)計(jì)必須考慮 LLM 的獨(dú)特能力特點(diǎn),尤其是 LLM 不完美的指令遵從(instruction-following)。比如,雖然研究人員在 prompt 中要求 LLM 直接指定期望訪問的控件,而非輸出訪問這個(gè)控件所需要的具體導(dǎo)航步驟,LLM 仍有可能在回答中輸出具體的導(dǎo)航路徑,這會(huì)帶來更多錯(cuò)誤的可能性。

為解決該問題,他們對(duì)非葉子節(jié)點(diǎn)進(jìn)行了整體過濾,接口會(huì)自動(dòng)忽略這些導(dǎo)航節(jié)點(diǎn),只保留 LLM 輸出中的葉子節(jié)點(diǎn),以確保 GOI 完全接管控件的導(dǎo)航過程。

總結(jié)來說,“聲明式”協(xié)作范式的初衷,是通過重構(gòu)接口設(shè)計(jì)以簡(jiǎn)化 LLM 的計(jì)算機(jī)使用難度,允許 LLM 充分發(fā)揮自身所長(zhǎng),規(guī)避自身能力短板,最終實(shí)現(xiàn)生產(chǎn)力的實(shí)質(zhì)提升。

在這一范式下,人類可以簡(jiǎn)潔地用自然語(yǔ)言表達(dá)自己的需求,而 LLM 和系統(tǒng)則能力互補(bǔ)。其中,LLM 專注于無法被確定性處理的語(yǔ)義推理任務(wù),系統(tǒng)則負(fù)責(zé)處理可以被確定性解決的機(jī)制性任務(wù)。

研究團(tuán)隊(duì)認(rèn)為,LLM 時(shí)代下,操作系統(tǒng)正在加速演進(jìn)。在未來,操作系統(tǒng)可能會(huì)原生支持這種聲明式接口,支撐一種模型原生的操作系統(tǒng)設(shè)計(jì) [2]。例如,在官方提供的應(yīng)用開發(fā)框架中,集成自動(dòng)構(gòu)建導(dǎo)航拓?fù)涞哪芰Γ皇菍?yīng)用程序視為“黑盒”進(jìn)行外部探索以完成建模。最終,這種聲明式接口可能內(nèi)化于操作系統(tǒng)的構(gòu)建中,從而為“LLM 智能體”這一全新的計(jì)算機(jī)用戶提供原生支持。

參考資料:

1. A Case for Declarative LLM-friendly Interfaces for Improved Efficiency of Computer-Use Agents. Yuan Wang, Mingyu Li, Haibo Chen . https://arxiv.org/abs/2510.04607.

2. 模型原生操作系統(tǒng):機(jī)遇、挑戰(zhàn)與展望. 陳海波、夏虞斌、陳榕、王肇國(guó)、糜澤羽、古金宇. 中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊. 2025 年第 2 期

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
逃不掉了!38萬億債務(wù)炸雷,美聯(lián)儲(chǔ)連夜急剎車,中國(guó)成最大贏家?

逃不掉了!38萬億債務(wù)炸雷,美聯(lián)儲(chǔ)連夜急剎車,中國(guó)成最大贏家?

今日美食分享
2025-11-04 05:46:22
里夫斯調(diào)侃東契奇:他就是個(gè)白癡,他像個(gè)孩子但總有一天需要長(zhǎng)大

里夫斯調(diào)侃東契奇:他就是個(gè)白癡,他像個(gè)孩子但總有一天需要長(zhǎng)大

懂球帝
2025-11-03 15:06:11
東契奇把喬丹上限拉高4分!NBA77年神跡即將被破,詹皇安心當(dāng)老三

東契奇把喬丹上限拉高4分!NBA77年神跡即將被破,詹皇安心當(dāng)老三

嘴炮體壇
2025-11-03 15:38:24
又暴雷!48小時(shí)卷走129億,200萬會(huì)員血本無歸,“傳銷巨頭”涼了

又暴雷!48小時(shí)卷走129億,200萬會(huì)員血本無歸,“傳銷巨頭”涼了

我不叫阿哏
2025-11-04 00:22:25
王晶發(fā)文悼念馮淬帆:做人欺善怕惡,愛罵人和單身有關(guān),稱呼改變

王晶發(fā)文悼念馮淬帆:做人欺善怕惡,愛罵人和單身有關(guān),稱呼改變

小椰的奶奶
2025-11-02 16:08:10
歷經(jīng)30年,世界上每臺(tái)電腦都標(biāo)配的技術(shù),終于要被拋棄了……

歷經(jīng)30年,世界上每臺(tái)電腦都標(biāo)配的技術(shù),終于要被拋棄了……

碼農(nóng)翻身
2025-11-03 08:58:46
大佬為什么都喜歡定居日本?

大佬為什么都喜歡定居日本?

難得君
2025-11-03 20:47:39
上海地鐵大爺強(qiáng)坐女乘客大腿后續(xù):處理結(jié)果引爭(zhēng)議,網(wǎng)友:別再慣著

上海地鐵大爺強(qiáng)坐女乘客大腿后續(xù):處理結(jié)果引爭(zhēng)議,網(wǎng)友:別再慣著

觀察鑒娛
2025-11-03 09:59:43
60年首次!4200萬美國(guó)人“斷糧”,特朗普:不想讓你們挨餓, 快打民主黨電話

60年首次!4200萬美國(guó)人“斷糧”,特朗普:不想讓你們挨餓, 快打民主黨電話

紅星新聞
2025-11-03 19:25:15
2場(chǎng)2-1送蛋,WTA年終總決賽首個(gè)出線+出局球員產(chǎn)生,小米辣或登場(chǎng)

2場(chǎng)2-1送蛋,WTA年終總決賽首個(gè)出線+出局球員產(chǎn)生,小米辣或登場(chǎng)

郝小小看體育
2025-11-04 02:21:51
鶴城警務(wù),請(qǐng)給上官正義一個(gè)明確說法!

鶴城警務(wù),請(qǐng)給上官正義一個(gè)明確說法!

方清云
2025-11-02 19:13:40
突然大反轉(zhuǎn)!工行剛宣布:恢復(fù)!

突然大反轉(zhuǎn)!工行剛宣布:恢復(fù)!

中國(guó)基金報(bào)
2025-11-03 20:35:28
好消息!英國(guó)將把沒收的詐騙資金還給中國(guó)受害者

好消息!英國(guó)將把沒收的詐騙資金還給中國(guó)受害者

犀利辣椒
2025-11-04 06:21:06
沒想到,去銀行提金被拒了

沒想到,去銀行提金被拒了

鄧姐姐的美好生活提案
2025-11-03 18:53:12
被央視點(diǎn)名批評(píng)!燒光84億造不出一輛車,卻花5000萬給員工買零食

被央視點(diǎn)名批評(píng)!燒光84億造不出一輛車,卻花5000萬給員工買零食

今日美食分享
2025-11-04 00:22:51
八寶山送別后遺囑謠言平息,翁帆將攜清華史料赴劍橋,走出新道路

八寶山送別后遺囑謠言平息,翁帆將攜清華史料赴劍橋,走出新道路

蔡蔡說史
2025-11-03 15:29:41
征服中年女人,無需套路:兩顆真心,一生相守

征服中年女人,無需套路:兩顆真心,一生相守

青蘋果sht
2025-11-04 06:10:40
“立冬4不吃,病就不找來!”11月7立冬,哪4不吃?應(yīng)時(shí)節(jié)樂過冬

“立冬4不吃,病就不找來!”11月7立冬,哪4不吃?應(yīng)時(shí)節(jié)樂過冬

愛生活的陶哥
2025-11-03 10:08:47
數(shù)百人滿地?fù)煊箢^場(chǎng)面堪比大片,網(wǎng)友:人生第一次撿芋頭很新鮮很有趣,當(dāng)?shù)兀盒枵髑筠r(nóng)戶同意

數(shù)百人滿地?fù)煊箢^場(chǎng)面堪比大片,網(wǎng)友:人生第一次撿芋頭很新鮮很有趣,當(dāng)?shù)兀盒枵髑筠r(nóng)戶同意

極目新聞
2025-11-03 17:04:23
湖人勒布朗·詹姆斯對(duì)布朗尼和里夫斯的精彩空接配合,做出反應(yīng)

湖人勒布朗·詹姆斯對(duì)布朗尼和里夫斯的精彩空接配合,做出反應(yīng)

好火子
2025-11-04 01:29:08
2025-11-04 07:00:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
15815文章數(shù) 514262關(guān)注度
往期回顧 全部

科技要聞

余承東內(nèi)部信:鴻蒙下一步要實(shí)現(xiàn)上億覆蓋

頭條要聞

朝鮮最高人民會(huì)議常任委員會(huì)前委員長(zhǎng)金永南逝世

頭條要聞

朝鮮最高人民會(huì)議常任委員會(huì)前委員長(zhǎng)金永南逝世

體育要聞

開拓者官宣召回楊瀚森 隊(duì)記解析核心原因

娛樂要聞

男導(dǎo)演曝丑聞 蔣欣的含金量還在上升

財(cái)經(jīng)要聞

最新省市GDP:誰在飆升,誰掉隊(duì)了?

汽車要聞

環(huán)比增長(zhǎng)28.7% 方程豹品牌10月銷量31052輛

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
房產(chǎn)
旅游
軍事航空

藝術(shù)要聞

劉溢:當(dāng)代超現(xiàn)實(shí)主義畫家

這些才是適合普通人的穿搭!多穿基礎(chǔ)款和半身裙,簡(jiǎn)約又得體

房產(chǎn)要聞

信達(dá)·繁花里 | 老照片征集活動(dòng) 溫情啟幕

旅游要聞

湖光塔影 小眾公園影湖樓

軍事要聞

美總統(tǒng)威脅對(duì)尼日利亞動(dòng)武 尼方回應(yīng)

無障礙瀏覽 進(jìn)入關(guān)懷版 777久久精品一区二区三区无码| 亚洲精品无码久久毛片| 国产午夜精品久久一二区| 国产精品自慰网站| 天堂资源官网在线资源| 99久无码中文字幕一本久道| 免费看无码自慰一区二区久久妖精| 国产aⅴ精品一区二区三理论片| 久久久九九九精品AAA片黃色| 97狠狠色丁香婷婷综合久久| 免费乱码人妻系列无码专区| 国产一产区二产区| 国内精品久久久久精免费| 蜜美杏免费一区二区| 人妻av无码专区久久| 无码人妻首页| 六月丁香综合在线视频| 少妇粉嫩小穴AV| 撕开奶罩揉吃奶高潮av在线观看 | 非洲老熟妇一区二区三区久久久| 日韩精品卡1卡2日韩在线| 久久久久久久囯产精品无码| 色88久久久久高潮综合影院| 精品久久久久久中文字幕大豆网| 俺去了最新网址| 开心婷婷六月丁香| 欧美另类大阴帝| 亚洲成av人片无码天堂下载| 天美传媒有限公司官网首页| 欧亚一区二区| 国产美女毛片| 国产午夜福利在线播放| 久色九中文无码人妻| 亚太AV一区二区| 亚洲午夜av久久久精品影院| 小说亚洲色图| 久久av无码精品人妻系列| 久久国产成人午夜av影院| 少夫熟女视频一区二区三区免费观看| 免费A视频黄色视频免费A视频| 香蕉啪视频在线观看视频久|