夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

騰訊AI Lab開源可復(fù)現(xiàn)的深度研究智能體,最大限度降低外部依賴

0
分享至

騰訊AI Lab 投稿
量子位 | 公眾號(hào) QbitAI

深度研究智能體(Deep Research Agents)憑借大語(yǔ)言模型(LLM)和視覺-語(yǔ)言模型(VLM)的強(qiáng)大能力,正在重塑知識(shí)發(fā)現(xiàn)與問題解決的范式。

然而,現(xiàn)有開源智能體框架多依賴付費(fèi)工具,限制了可復(fù)現(xiàn)性和普適性。

騰訊AI Lab全新推出的Cognitive Kernel-Pro,一款全開源、多模塊、層次化的智能體框架,為深度研究智能體的開發(fā)與訓(xùn)練提供了突破性解決方案。



在GAIA基準(zhǔn)全集上,Cognitive Kernel-Pro超越開源免費(fèi)框架SmolAgents,性能逼近依賴付費(fèi)工具的智能體,展現(xiàn)出卓越的綜合能力。在GAIA-text上,訓(xùn)練的8B模型超越WebDancer和WebSailor-7B。

相關(guān)論文排上當(dāng)日HuggingFace熱榜第一。



此外,騰訊AI Lab公開了Agent Foundation Model的訓(xùn)練配方,為社區(qū)提供可復(fù)現(xiàn)的訓(xùn)練路徑。

相關(guān)技術(shù)報(bào)告及代碼已開源于GitHub,詳細(xì)鏈接可見文末。

全開源智能體框架



Cognitive Kernel-Pro以Python代碼為動(dòng)作空間,充分發(fā)揮現(xiàn)代LLM的推理和代碼生成能力。

其核心設(shè)計(jì)包括以下四點(diǎn)。

1、模塊化架構(gòu):框架采用兩層多模塊設(shè)計(jì),包含主智能體和多個(gè)子智能體(如網(wǎng)頁(yè)導(dǎo)航智能體、文件處理智能體)。主智能體負(fù)責(zé)任務(wù)分解和信息整合,子智能體專注于特定任務(wù)(如網(wǎng)頁(yè)瀏覽、文件操作),確保模塊獨(dú)立性和擴(kuò)展性。

2、狀態(tài)管理與規(guī)劃:通過“進(jìn)度狀態(tài)”(Progress State)機(jī)制,智能體能夠記錄已完成步驟、待辦任務(wù)、歷史經(jīng)驗(yàn)和關(guān)鍵信息。這種結(jié)構(gòu)化狀態(tài)管理顯著提升了復(fù)雜任務(wù)的處理效率。

3、標(biāo)準(zhǔn)化任務(wù)接口:主智能體與子智能體通過簡(jiǎn)潔的文本接口通信,子智能體以Python函數(shù)形式定義,輸入任務(wù)字符串,輸出格式化結(jié)果和日志,便于協(xié)作與調(diào)試。

4、測(cè)試時(shí)優(yōu)化:框架引入反思機(jī)制(Reflection)和投票機(jī)制(Voting),通過評(píng)估和優(yōu)化動(dòng)作軌跡,提升任務(wù)完成質(zhì)量。反思機(jī)制允許智能體審查和修正先前動(dòng)作,投票機(jī)制則通過多輪軌跡比較選擇最優(yōu)結(jié)果,顯著增強(qiáng)了網(wǎng)頁(yè)瀏覽等高隨機(jī)性任務(wù)的穩(wěn)定性。



上表顯示了Agent框架工具的使用和能力情況。

比較專有工具時(shí),Google Search API(可以輕松切換到 DuckDuckGo 等免費(fèi) API)被排除在外,它是搜索相關(guān)任務(wù)的必備功能。

注:WebDancer 和 WebSailor 主要關(guān)注Web Agent,支持 PDF 獲取和簡(jiǎn)單處理,但缺乏通用文件Agent功能。

許多現(xiàn)有智能體框架依賴付費(fèi)工具,增加了使用成本并限制了廣泛應(yīng)用。而Cognitive Kernel-Pro框架盡可能使用免費(fèi)、開源工具,使用LLM的python代碼生成能力和理解能力對(duì)智能體任務(wù)進(jìn)行處理。

創(chuàng)新訓(xùn)練方法



Cognitive Kernel-Pro不僅提供了強(qiáng)大的框架,還設(shè)計(jì)了全面的訓(xùn)練流程,覆蓋網(wǎng)頁(yè)導(dǎo)航、文件處理、代碼生成和推理等多個(gè)領(lǐng)域。

關(guān)鍵創(chuàng)新包括:

  • 高質(zhì)量Web Agent數(shù)據(jù)構(gòu)建
  • 通過構(gòu)造可驗(yàn)證的查詢-答案對(duì),結(jié)合中間過程提示和基于提示的拒絕采樣,顯著提升訓(xùn)練數(shù)據(jù)的質(zhì)量和相關(guān)性.
  • Persona Hub數(shù)據(jù)增強(qiáng)
  • 利用Persona Hub生成多樣化的合成查詢,結(jié)合跨系統(tǒng)驗(yàn)證,增強(qiáng)訓(xùn)練數(shù)據(jù)的多樣性和魯棒性。
  • 推理數(shù)據(jù)優(yōu)化
  • 對(duì)現(xiàn)有數(shù)據(jù)集(如NumiaMath、LogicCot、TACO)進(jìn)行精細(xì)化處理,適配智能體任務(wù)格式,確保訓(xùn)練數(shù)據(jù)與實(shí)際應(yīng)用場(chǎng)景一致。
  • 軌跡采樣
  • 以GPT-4.1為骨干模型生成智能體軌跡,并通過相似度匹配進(jìn)行拒絕采樣,最大化訓(xùn)練數(shù)據(jù)的有效性。

性能優(yōu)勢(shì)



Cognitive Kernel-Pro在網(wǎng)頁(yè)信息檢索、文件處理和復(fù)雜推理等任務(wù)中表現(xiàn)出色,尤其在GAIA基準(zhǔn)上超越SmolAgents,接近依賴付費(fèi)工具的智能體框架。

相較于依賴Jina Reader、FireCrawl等付費(fèi)工具的現(xiàn)有開源框架,Cognitive Kernel-Pro強(qiáng)調(diào)LLM和VLM的內(nèi)在能力,最大限度降低外部依賴,實(shí)現(xiàn)真正的全開源。

上圖的技術(shù)報(bào)告中對(duì)比了多個(gè)AI智能體框架,顯示Cognitive Kernel-Pro在功能全面性和開源程度上具有顯著優(yōu)勢(shì)。框架支持靈活切換免費(fèi)API(如DuckDuckGo),進(jìn)一步提升了可訪問性。



上表展示了Cognitive Kernel-Pro與其他開源 Agent基礎(chǔ)模型的性能對(duì)比。

Cognitive Kernel-Pro 在 GAIA-text基準(zhǔn)測(cè)試中取得了優(yōu)異的成績(jī),超越了WebDancer和WebSailor類似大小模型,體現(xiàn)了框架、模型訓(xùn)練方法的優(yōu)越性。

首先,Cognitive Kernel-Pro是一個(gè)通用Agent框架,有更好的文件Agent、Code Agent的處理能力,在框架上比整體上是Web Agent的WebThinker、WebDancer、WebSailor要能處理更復(fù)雜的情況。

其次,在訓(xùn)練對(duì)應(yīng)的開源模型CK-Pro-8B時(shí),更通用、豐富的Agent數(shù)據(jù)被包含進(jìn)訓(xùn)練集,共同提升了Agent基座模型的能力。



上表展示了測(cè)試Cognitive Kernel-Pro反思功能的消融實(shí)驗(yàn)。

更強(qiáng)的模型,例如GPT-4.1,可以提供更好的反思信號(hào),但開源模型例如Qwen-3-32B已經(jīng)能提供相當(dāng)GPT-4.1的反思效果。

Cognitive Kernel-Pro的研究團(tuán)隊(duì)表示,未來工作將關(guān)注在將反思能力蒸餾到同一個(gè)Agent基座模型中。

GitHub:https://github.com/Tencent/CognitiveKernel-Pro
Arxiv:https://arxiv.org/pdf/2508.00414

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
成龍帶兒子現(xiàn)身瑞士!父子倆罕同框,42歲房祖名穿搭清爽狀態(tài)不錯(cuò)

成龍帶兒子現(xiàn)身瑞士!父子倆罕同框,42歲房祖名穿搭清爽狀態(tài)不錯(cuò)

動(dòng)物奇奇怪怪
2025-08-07 13:16:16
女兒520萬(wàn)買領(lǐng)導(dǎo)二手別墅,入住后發(fā)現(xiàn)5瓶漢帝茅臺(tái),鑒定后懵了

女兒520萬(wàn)買領(lǐng)導(dǎo)二手別墅,入住后發(fā)現(xiàn)5瓶漢帝茅臺(tái),鑒定后懵了

今天說故事
2025-06-30 19:01:54
當(dāng)女人反復(fù)和你提及3件事,你就要明白,其實(shí)她變心,有了別人

當(dāng)女人反復(fù)和你提及3件事,你就要明白,其實(shí)她變心,有了別人

蓮子說情感
2025-08-06 17:56:52
江油霸凌事件:家長(zhǎng)聚集聲援被打孩子:我們只保護(hù)該保護(hù)的未成年

江油霸凌事件:家長(zhǎng)聚集聲援被打孩子:我們只保護(hù)該保護(hù)的未成年

教師吧
2025-08-05 10:28:59
特朗普來不來尚且未知,美國(guó)一支軍隊(duì)率先受邀,現(xiàn)身中國(guó)閱兵現(xiàn)場(chǎng)

特朗普來不來尚且未知,美國(guó)一支軍隊(duì)率先受邀,現(xiàn)身中國(guó)閱兵現(xiàn)場(chǎng)

通文知史
2025-08-07 17:45:03
福建一區(qū)委常委、宣傳部部長(zhǎng),有新職

福建一區(qū)委常委、宣傳部部長(zhǎng),有新職

魯中晨報(bào)
2025-08-07 16:24:09
印媒曾曝料:2020年若非中國(guó)99A坦克已在路上,印度可能真會(huì)動(dòng)手

印媒曾曝料:2020年若非中國(guó)99A坦克已在路上,印度可能真會(huì)動(dòng)手

壹知眠羊
2025-08-05 07:33:39
晚上8點(diǎn),官宣!樊振東當(dāng)上老板,投資方式曝光,足跡遍布亞歐美

晚上8點(diǎn),官宣!樊振東當(dāng)上老板,投資方式曝光,足跡遍布亞歐美

侃球熊弟
2025-08-06 22:47:22
絕了!頂級(jí)養(yǎng)老方案!一分不花,浙江94歲阿婆靠5個(gè)兒女萬(wàn)里“飛的”搞定

絕了!頂級(jí)養(yǎng)老方案!一分不花,浙江94歲阿婆靠5個(gè)兒女萬(wàn)里“飛的”搞定

FM93浙江交通之聲
2025-08-06 18:16:08
我當(dāng)了廳長(zhǎng)后,同學(xué)會(huì)被前妻和她的局長(zhǎng)老公狠狠嘲諷,結(jié)賬傻眼了

我當(dāng)了廳長(zhǎng)后,同學(xué)會(huì)被前妻和她的局長(zhǎng)老公狠狠嘲諷,結(jié)賬傻眼了

南山青松
2025-07-21 11:50:46
蛇出沒!內(nèi)蒙古已有多人被咬傷!

蛇出沒!內(nèi)蒙古已有多人被咬傷!

青城之窗
2025-08-07 11:36:08
記者:周末上海德比球票售罄 觀眾數(shù)大概率創(chuàng)近3賽季申花主場(chǎng)紀(jì)錄

記者:周末上海德比球票售罄 觀眾數(shù)大概率創(chuàng)近3賽季申花主場(chǎng)紀(jì)錄

直播吧
2025-08-07 11:05:13
炸裂!字母哥聯(lián)手杜蘭特?史詩(shī)級(jí)5換1方案來了,火箭造夢(mèng)幻三巨頭

炸裂!字母哥聯(lián)手杜蘭特?史詩(shī)級(jí)5換1方案來了,火箭造夢(mèng)幻三巨頭

籃球掃地僧
2025-08-06 14:50:11
吳易昺2-0擊敗中川直樹,本賽季第4次躋身ATP挑戰(zhàn)賽8強(qiáng)

吳易昺2-0擊敗中川直樹,本賽季第4次躋身ATP挑戰(zhàn)賽8強(qiáng)

直播吧
2025-08-07 16:46:10
萬(wàn)萬(wàn)沒想到!退出中國(guó)選擇印度的鈴木,6月全球銷量24.9萬(wàn)輛!

萬(wàn)萬(wàn)沒想到!退出中國(guó)選擇印度的鈴木,6月全球銷量24.9萬(wàn)輛!

車轍新語(yǔ)
2025-08-04 15:58:06
魔獸懷舊服:周四調(diào)整太逆天,野團(tuán)實(shí)測(cè)隨便打,玩家人數(shù)顯著回升

魔獸懷舊服:周四調(diào)整太逆天,野團(tuán)實(shí)測(cè)隨便打,玩家人數(shù)顯著回升

胖哥游戲說
2025-08-07 17:48:03
網(wǎng)友在廣西一高速服務(wù)區(qū)拍下閃電擊中汽車瞬間 當(dāng)?shù)夭块T:暫未接到報(bào)警及人員受傷報(bào)告

網(wǎng)友在廣西一高速服務(wù)區(qū)拍下閃電擊中汽車瞬間 當(dāng)?shù)夭块T:暫未接到報(bào)警及人員受傷報(bào)告

紅星新聞
2025-08-06 22:00:27
越扒越有!除了李湘,釋永信風(fēng)波又牽連一波女星:劉濤楊瀾......

越扒越有!除了李湘,釋永信風(fēng)波又牽連一波女星:劉濤楊瀾......

古希臘掌管松餅的神
2025-07-30 15:11:00
特朗普:將對(duì)俄羅斯實(shí)施更多二級(jí)制裁

特朗普:將對(duì)俄羅斯實(shí)施更多二級(jí)制裁

新京報(bào)
2025-08-07 07:48:01
莫迪傳訪華,中美印博弈,特朗普發(fā)聲:別犯錯(cuò),美國(guó)不能兩線作戰(zhàn)

莫迪傳訪華,中美印博弈,特朗普發(fā)聲:別犯錯(cuò),美國(guó)不能兩線作戰(zhàn)

小祁談歷史
2025-08-07 16:14:43
2025-08-07 18:51:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11049文章數(shù) 176223關(guān)注度
往期回顧 全部

科技要聞

蘋果宣布在美追加千億投資,股價(jià)應(yīng)聲漲5%

頭條要聞

男子因雞蛋被侄兒吃掉抱怨 妻子崩潰摔碗后已經(jīng)回老家

頭條要聞

男子因雞蛋被侄兒吃掉抱怨 妻子崩潰摔碗后已經(jīng)回老家

體育要聞

文班接受加內(nèi)特指導(dǎo) 此前曾在少林寺練功夫

娛樂要聞

葉珂說剛生完孩子 和黃曉明沒分手?

財(cái)經(jīng)要聞

李稻葵:建議給外來打工者發(fā)15萬(wàn)安家費(fèi)

汽車要聞

90.8%得房率還有華為全家桶 嵐圖全新知音8月13日預(yù)售

態(tài)度原創(chuàng)

時(shí)尚
家居
健康
教育
親子

媽媽說,把頭發(fā)梳上去大大方方的才好看!

家居要聞

自然開闊 溫暖簡(jiǎn)約高級(jí)

呼吸科專家破解呼吸道九大謠言!

教育要聞

今年招生最多的10個(gè)專業(yè),將來就業(yè)競(jìng)爭(zhēng)激烈,學(xué)生一定要提前規(guī)劃

親子要聞

3歲寶寶放暑假在家,大家聽聽他說的是人話嗎???

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 亚洲乱码日产一区三区| 国产无人区码一区二区| 妓女妓一区二区三区免费| 国产精品vr专区| www.99色色| 99久久99久久免费精品蜜臀| 一个人看的www视频免费观看| 国产精品久久亚洲不卡| 精品国产一二三| 国产午夜福利精品久久| 成熟丰满少妇AⅤ无码精品观看| 亚洲av综合一区二区在线观看| 亚洲中文超碰中文字幕| 国产精品白丝jk黑袜喷水视频| 精品2020婷婷激情五月| 欧美视频在线播放一区二区| 99j久久精品久久久久久| 日本妇女毛茸茸| 久久精品少妇高潮a片免费观 | 亚洲av无码精品蜜桃| 人妻丰满熟妇ⅴ无码区a片| 精品少妇一级毛片免费看| 精品久久久无码人妻中文字幕| 午夜无码成人片| 蜜臀久久99精品久久久久久小说| 黑人Vs日本女优98AV| 人人干人人摸人人操| 99:国产情侣| 日韩综合一区二区| 四虎成人精品在永久免费| 熟妇人妻久久中文av字幕| 天堂va蜜桃| 郑州一小区业主买房被抵押| 丁香五月综合久久激情| 亚洲丰满女人大隂户| 真实国产乱人伦在线视频播放| 国产精品久久久久久久久鸭 | 久久夜色精品国产av麻豆精品| 亚洲午夜欧美一区二区色欲| 国产日本欧美在线视频一区| 欧美性猛交xxxx乱大交丰满|