夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

研究人員提出AI對齊新方法,通過交互式分解改善人類提供反饋過程

0
分享至

AI 對齊(AI alignment)是目前大模型訓練與優(yōu)化過程中不可或缺的環(huán)節(jié),目前廣泛使用的方法包括基于人類反饋的強化學習(RLHF,Reinforcement Learning from Human Feedback)和直接偏好優(yōu)化(DPO,Direct Preference Optimization),都需要收集高質(zhì)量的人類偏好反饋數(shù)據(jù)。然而,現(xiàn)有界面要求標注者直接對比長篇文本,這種方式在認知上具有挑戰(zhàn)性,特別是當文本較長或內(nèi)容不熟悉時,用戶往往無法精細地閱讀、記憶所有內(nèi)容以及識別文本中的所有差異,導致反饋質(zhì)量不高,從而影響到 AI 對齊的質(zhì)量。


(來源:資料圖)

目前尚未有研究提出如何系統(tǒng)地改善這類反饋質(zhì)量。在近期一項研究之中,人機交互學者史丹青博士從用戶反饋的角度進行展開,希望解決的核心問題是:

? 如何提升人類反饋(特別是長篇文本比較場景)的準確性和質(zhì)量?

? 如何減少用戶在提供反饋過程中的認知負擔和出錯率?

為此,他和所在團隊提出并采用了“分解原則”[2],這是指將復雜的問題分解成更小、更容易判斷的單一信息點,分別對每個組成部分進行判斷,然后將各組成部分的預測結(jié)合起來,得出最終預測結(jié)果。這種方法旨在簡化復雜任務(wù)為, 在處理不確定性或復雜情況時特別有用,從而提高反饋質(zhì)量。

據(jù)介紹,本研究基于分解原則提出了 DxHF 的方法,通過“交互式分解”的方式改善人類提供反饋的過程。具體成果包括:

? 交互式分解技術(shù):將長篇文本分解成簡潔易讀的單個陳述,方便用戶快速瀏覽和對比。

? 視覺輔助用戶界面:通過對每個陳述信息進行相關(guān)性評分,并以視覺不透明度編碼突出重點信息,同時連接語義相似的陳述信息,幫助用戶快速識別關(guān)鍵差異。


(來源:資料圖)

實驗中的關(guān)鍵發(fā)現(xiàn)包括:DxHF 顯著提高了用戶反饋的準確性(平均提高約 5%),特別是在用戶對判斷結(jié)果不確定時,準確性提升更明顯(約 6.4%);雖然略微增加了反饋用時,但能有效提高決策信心并降低用戶認知負擔。

據(jù)介紹,整個研究過程可以分為三個主要階段:

第一階段包括研究問題定義與理論方法探索。研究團隊對大模型對齊中收集高質(zhì)量反饋數(shù)據(jù)困難的問題進行了深入的文獻回顧和需求分析,從人機交互角度出發(fā),明確提出要探索一種新型用戶界面技術(shù),以降低用戶的認知負擔,提升反饋質(zhì)量。在確定研究方向之后,研究團隊查閱大量輔助人類決策的相關(guān)文獻,定位到了有助于人們作出更加準確的判斷的“分解原則”。受此啟發(fā),研究團隊提出將文本分解為獨立的、易于理解的簡單陳述信息,從而使反饋的比較過程變得更加容易掌握。

第二階段為技術(shù)實現(xiàn)與界面設(shè)計。基于分解原則,研究團隊通過反復的內(nèi)部討論、原型設(shè)計與迭代,測試了一系列交互界面。這一階段涉及到大量具體的設(shè)計決策,比如如何準確地將長句分解為單一的語義單元,如何突出顯示最關(guān)鍵的部分,以及如何將兩組相似文本之間的語義聯(lián)系直觀呈現(xiàn)出來。在正式投入實驗前,團隊也進行了大量的設(shè)計嘗試、前期預研與消融實驗測試,希望清晰又不失整體性地呈現(xiàn)完整的分解信息。


(來源:資料圖)

第三階段為技術(shù)仿真與實驗驗證。在投入正式的用戶實驗之前,研究團隊通過仿真對技術(shù)進行評估。仿真過程中使用 AI 來模擬真實用戶,通過調(diào)整 AI 用戶的“理性程度”,研究人員清晰地看到了分解技術(shù)在不同決策能力用戶中起到了積極的作用。隨后研究團隊實施了一項大規(guī)模的在線眾包實驗,超過 160 名參與者通過網(wǎng)絡(luò)眾包平臺參與,提供真實的反饋數(shù)據(jù)。研究人員從眾包實驗數(shù)據(jù)中觀察到明顯的效果:DxHF 不僅顯著提高了用戶的反饋準確性,也幫助用戶提升了決策信心。

在設(shè)計討論過程中,項目面臨如何同時兼顧文本整體性的理解與細節(jié)性的分析的問題。最終的設(shè)計靈感來自于一次研討會上桌邊的折疊宣傳手冊,他們發(fā)現(xiàn)可以通過折疊與拉伸的方法展示信息。于是,該團隊借用該物理交互的隱喻來設(shè)計界面,不僅保留了整體閱讀的完整性,也讓用戶可以自由地深入細節(jié)。在開展用戶實驗時,研究團隊特別留意到參與者對這一設(shè)計的反應(yīng)。參與者反饋了自己對于反饋中自由選擇比較方式的偏好,對簡單的問題比較無需展開細節(jié)減少了繁雜的信息負荷,而對復雜比較任務(wù)通過展開能夠自由地探索更深層次的信息。


(來源:資料圖)

審稿人認為本研究所關(guān)注問題與當前 AI 領(lǐng)域關(guān)注的熱點具有很強的相關(guān)性,其指出研究團隊從人機交互的視角入手,探索如何緩解人類在 AI 對齊過程中所面臨的復雜認知任務(wù),并認為該方向十分具有前景。同時,審稿人認為本研究提出的方法不僅對 AI 對齊中高質(zhì)量數(shù)據(jù)標注這一具體問題具有重要貢獻,對長篇文本對比任務(wù)中人所面臨的認知挑戰(zhàn)方面具備更廣泛的應(yīng)用潛力,能夠進一步拓展至其他需要用戶快速做出多文本對比判斷的場景,諸如法律文書比對、政策比較等信息檢索和決策輔助領(lǐng)域中發(fā)揮作用,這些領(lǐng)域均對文本的精細比對提出了極高要求。

預計該方法可以廣泛用于改進目前面向 AI 對齊的人類反饋數(shù)據(jù)采集流程,幫助構(gòu)建更可靠、更符合人類偏好的大語言模型。另據(jù)悉,該項目的論文被用戶界面軟件與技術(shù)研討會(UIST,User Interface Software and Technology)2025 接收,據(jù)了解 UIST 是是人機交互領(lǐng)域的頂會之一,將于 2025 年 9 月于韓國釜山召開,該會議方向主要集中在用戶界面軟件與硬件技術(shù)的創(chuàng)新。


圖 | 史丹青(來源:sdq.github.io)

本次論文的作者史丹青博士目前就職于英國劍橋大學工程系,擔任副研究員(博士后),從事人智交互(Human-AI Interaction)的研究。此前,他曾就職于芬蘭人工智能中心,博士畢業(yè)于同濟大學,本科畢業(yè)于華東師范大學。他的研究致力于“讓 AI 更懂人”,包含對人類行為計算建模與 AI 的交互式對齊。其學術(shù)成果多次獲得人機交互與可視化領(lǐng)域頂級會議 CHI2025、CHI2024、PacificVis24 等最佳論文提名獎。

他與芬蘭 Aalto 的 Antti Oulasvirta 教授和瑞典 KTH 的 Tino Weinkauf 教授組成的研究團隊在人智交互領(lǐng)域長期合作,在該研究之前他們已經(jīng)積累了一系列面向機器人領(lǐng)域的交互式 AI 對齊研究工作,包括通過交互式調(diào)節(jié)獎勵函數(shù)來控制 Agent 的動作行為 [2],以及運用層次分組可視化技術(shù)提升 AI 對齊的效率 [3]。這次工作的重心則是希望將交互式 AI 對齊的工作從機器人領(lǐng)域擴展到大模型的應(yīng)用中。


(來源:資料圖)


圖 | 運用層次分組可視化技術(shù)提升對齊的效率 [4](來源:資料圖)

與此同時,本次研究項目是他在瑞士蘇黎世聯(lián)邦理工研究訪問期間完成的,合作方的是 Mennatallah El-Assady 教授與程富瑞博士。Mennatallah El-Assady 教授和程富瑞博士在交互式機器學習和可解釋性機器學習,尤其是在大模型的交互式文本分析上有著大量的研究積累,這次合作將雙方團隊的優(yōu)勢加以有效結(jié)合,成功地將交互式 AI 對齊用于了大模型的文本分析。

參考資料:

1.Shi, Danqing, Furui Cheng, Tino Weinkauf, Antti Oulasvirta, and Mennatallah El-Assady. DxHF: Providing High-Quality Human Feedback for LLM Alignment via Interactive Decomposition. To appear in UIST 2025.

2.Scott Armstrong, William B Denniston Jr, and Matt M Gordon. 1975. The use of the decomposition principle in making judgments.Organizational behavior and human performance14, 2 (1975), 257–263.

3.Shi, Danqing, Shibei Zhu, Tino Weinkauf, and Antti Oulasvirta. Interactive Reward Tuning: Interactive Visualization for Preference Elicitation. In 2024 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), pp. 9254-9261. IEEE, 2024.

4.Kompatscher, Jan, Danqing Shi, Giovanna Varni, Tino Weinkauf, and Antti Oulasvirta. Interactive Groupwise Comparison for Reinforcement Learning from Human Feedback. arXiv preprint arXiv:2507.04340 (2025).

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
徹底鬧翻!皇馬僅1人出席金球盛典:佛爺記仇 無限期抵制

徹底鬧翻!皇馬僅1人出席金球盛典:佛爺記仇 無限期抵制

葉青足球世界
2025-09-22 21:31:34
證監(jiān)會主席吳清:對恒大地產(chǎn)開具史上最大罰單

證監(jiān)會主席吳清:對恒大地產(chǎn)開具史上最大罰單

政知新媒體
2025-09-22 17:03:50
突發(fā)!敘利亞前總統(tǒng)阿薩德在俄羅斯再次中毒送醫(yī)救治

突發(fā)!敘利亞前總統(tǒng)阿薩德在俄羅斯再次中毒送醫(yī)救治

微微熱評
2025-09-22 22:52:52
廣州54歲醫(yī)生被砍生命垂危:畫面流出,兇手身份被扒,目擊者發(fā)聲

廣州54歲醫(yī)生被砍生命垂危:畫面流出,兇手身份被扒,目擊者發(fā)聲

博士觀察
2025-09-22 19:34:21
文旅部派出暗訪組赴8省份,發(fā)現(xiàn)多個問題

文旅部派出暗訪組赴8省份,發(fā)現(xiàn)多個問題

政知新媒體
2025-09-22 22:37:40
福建艦出現(xiàn)艦載機,晚上甲板全亮了

福建艦出現(xiàn)艦載機,晚上甲板全亮了

世家寶
2025-09-22 17:17:04
波蘭萬萬沒想到,中國竟這么狠!關(guān)閉口岸想拿捏中國,卻被反制

波蘭萬萬沒想到,中國竟這么狠!關(guān)閉口岸想拿捏中國,卻被反制

趣文說娛
2025-09-22 10:14:55
福州市委原常委、政法委書記高明,被查

福州市委原常委、政法委書記高明,被查

政知新媒體
2025-09-22 19:27:52
臺風“樺加沙”登陸時間地點有變,深圳建議儲備至少3天應(yīng)急物資

臺風“樺加沙”登陸時間地點有變,深圳建議儲備至少3天應(yīng)急物資

21世紀經(jīng)濟報道
2025-09-22 20:14:15
暴雨致災風險極高!超強臺風“樺加沙”大概率近距離掠過深圳

暴雨致災風險極高!超強臺風“樺加沙”大概率近距離掠過深圳

南方都市報
2025-09-22 09:30:45
吳辰:彰顯新現(xiàn)代豪華體驗卓越價值 捷豹路虎榮膺服務(wù)滿意度雙冠

吳辰:彰顯新現(xiàn)代豪華體驗卓越價值 捷豹路虎榮膺服務(wù)滿意度雙冠

道哥說車
2025-09-22 11:00:12
外交部:中國歡迎全球各行業(yè)各領(lǐng)域的優(yōu)秀人才來到中國、扎根中國

外交部:中國歡迎全球各行業(yè)各領(lǐng)域的優(yōu)秀人才來到中國、扎根中國

每日經(jīng)濟新聞
2025-09-22 17:22:30
中央部委重磅會議明確定調(diào),10 月開始房地產(chǎn)完全明牌了

中央部委重磅會議明確定調(diào),10 月開始房地產(chǎn)完全明牌了

新浪財經(jīng)
2025-09-22 15:41:35
預制菜成“中國第九大菜系”?網(wǎng)友自制《舌尖上的預制菜》既諷刺又搞笑

預制菜成“中國第九大菜系”?網(wǎng)友自制《舌尖上的預制菜》既諷刺又搞笑

回旋鏢
2025-09-22 10:43:16
全市停課!廣州11區(qū)發(fā)布臺風黃色預警信號

全市停課!廣州11區(qū)發(fā)布臺風黃色預警信號

新快報新聞
2025-09-22 21:45:22
又菜又愛玩的波蘭顯然不明白,有些人的“奶酪”是動不得的

又菜又愛玩的波蘭顯然不明白,有些人的“奶酪”是動不得的

百味朱砂
2025-09-20 18:37:54
31歲女子和高校博士連開9天房,61頁爆料流出:丈夫鬧大!

31歲女子和高校博士連開9天房,61頁爆料流出:丈夫鬧大!

農(nóng)村情感故事
2025-09-22 22:47:28
有槽點,沒B格,但我還是被這臺20多萬的奧迪爽到了。

有槽點,沒B格,但我還是被這臺20多萬的奧迪爽到了。

差評XPIN
2025-09-22 00:09:00
特朗普將出席聯(lián)合國大會

特朗普將出席聯(lián)合國大會

界面新聞
2025-09-22 21:54:08
獨家|富途證券、老虎證券進一步關(guān)閉中國內(nèi)地居民開戶通道

獨家|富途證券、老虎證券進一步關(guān)閉中國內(nèi)地居民開戶通道

第一財經(jīng)資訊
2025-09-22 19:40:15
2025-09-23 01:36:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15650文章數(shù) 514104關(guān)注度
往期回顧 全部

科技要聞

iPhone Air主要芯片全自研,蘋果野心曝光

頭條要聞

央視探訪:蔡國強52秒燃放1050盆煙花 距最近水體30米

頭條要聞

央視探訪:蔡國強52秒燃放1050盆煙花 距最近水體30米

體育要聞

曼城擺出大巴車,阿爾特塔:師父你變了!

娛樂要聞

巴圖:不怨父親英達 不嫉妒弟弟英如鏑

財經(jīng)要聞

信號巨大!潘功勝、吳清等重磅發(fā)聲

汽車要聞

外觀/性能/智能全面升級 第三代領(lǐng)克03靜態(tài)評測

態(tài)度原創(chuàng)

房產(chǎn)
本地
教育
公開課
軍事航空

房產(chǎn)要聞

保利天曜A2棟加推!50億紅盤領(lǐng)銜,搶藏珠江新城終極機遇

本地新聞

大學生軍訓哪家強,廣西申請“出戰(zhàn)”!

教育要聞

兩道初中物理熱學題!暴露真正嚴謹做題的初中生少之又少!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

金正恩:朝鮮和韓國絕對不會合并成一個國家

無障礙瀏覽 進入關(guān)懷版 中国一级毛片免费观看| 超碰人人超碰人人| 肉色丝袜足交视频| 日本精品一区二区三本中文| 被黑人猛操710次| 高清无码色欲久久久| 国产午夜无码片在线观看| 免费的毛片免费的毛片| 99久久国产综合精品麻豆| 国产精品久久久久久五月天蓝牛Ⅴ| 天天操天天插| 色 丁香婷婷五月| 亚州无线国产2021| 欧洲啪啪啪一区二区三区| www.mitao| 一区二区三区日本久久九| 久久九九有精品国产| 亚洲色欲色欲大片www无码| 八戒理论片午影院无码爱恋| 经典一区二区在线观看| 成人在线网站| 欧美男女网站| 国内精品久久人妻无码| AV资源站网| 久久久久久成人亚洲| 毛片网站有哪些| 无码中文av波多野结衣一区| 精品人妻一区二区三区四区在线| 腿张开猛戳免费视频网站| 日本xxx欧美xxx| 国产欧美va欧美va香蕉在| 亚洲AV无码成人精品区明星换面| 欧美XX免费| 精品无码人妻1区 2区 3区| 欧美性生活片免费观| 嫩草院一区二区乱码| 欧美H版在线观看播放| 国产人妻熟女呻吟在线观看| www.无码一区二区| 国产亲妺妺乱A∨| 日本午夜福利片|