夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

調(diào)整訓(xùn)練數(shù)據(jù)出場(chǎng)順序大模型就能變聰明!無需擴(kuò)大模型/數(shù)據(jù)規(guī)模

0
分享至

DELT團(tuán)隊(duì) 投稿
量子位 | 公眾號(hào) QbitAI

模型訓(xùn)練重點(diǎn)在于數(shù)據(jù)的數(shù)量與質(zhì)量?其實(shí)還有一個(gè)關(guān)鍵因素——

數(shù)據(jù)的出場(chǎng)順序。

對(duì)此,微軟亞洲研究院提出了一種全新的文本數(shù)據(jù)組織范式DELT(Data Efficacy in LM Training),通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,在不同模型尺寸與規(guī)模下都達(dá)到了良好性能。



數(shù)據(jù)效率與效能提升

該方法用優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來讓語言模型學(xué)得更好,還不用增加數(shù)據(jù)量或擴(kuò)大模型規(guī)模

來看看是怎么做到的。

訓(xùn)練樣本的組織順序很關(guān)鍵

首先,我們先來理清幾個(gè)概念。

在語言模型訓(xùn)練中,數(shù)據(jù)使用效率至關(guān)重要?,F(xiàn)有研究多關(guān)注于數(shù)據(jù)效率(Data Efficiency),即如何通過數(shù)據(jù)選擇提升模型訓(xùn)練效率并保持優(yōu)異性能。

然而,數(shù)據(jù)效能(Data Efficacy),即如何通過數(shù)據(jù)組織增強(qiáng)模型訓(xùn)練表現(xiàn),卻常常被忽視。

以烹飪?yōu)槔?,?shù)據(jù)效率就像在市場(chǎng)挑選新鮮、合適的食材,而數(shù)據(jù)效能則像名廚把握投放調(diào)料的時(shí)機(jī)與分寸,讓菜品發(fā)揮出最佳風(fēng)味。

數(shù)據(jù)組織的重要性

為了避免過擬合,當(dāng)前的大語言模型往往在海量數(shù)據(jù)上進(jìn)行訓(xùn)練,并且訓(xùn)練的次數(shù)非常有限,甚至僅進(jìn)行一次完整的訓(xùn)練周期(epoch=1),這與早期模型依賴多次迭代訓(xùn)練(epoch>>1)截然不同。

這些變化讓數(shù)據(jù)呈現(xiàn)的先后順序?qū)Y(jié)果影響巨大。

早期的AI模型類似于讓學(xué)生多次反復(fù)翻閱同一本書,在多輪學(xué)習(xí)中慢慢補(bǔ)齊細(xì)節(jié);而現(xiàn)在更像只給一遍通讀,不再反復(fù)回看。

這就對(duì)閱讀順序提出了極高要求,必須精心規(guī)劃學(xué)習(xí)材料出現(xiàn)的先后和結(jié)構(gòu)。因此,訓(xùn)練樣本的組織順序顯得尤為關(guān)鍵。然而,關(guān)于這一點(diǎn)的研究卻很少。

基于此觀察,微軟亞洲研究院最新提出的文本數(shù)據(jù)組織范式DELT,通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,實(shí)現(xiàn)了數(shù)據(jù)的高效利用與效能提升。



DELT范式不但通過數(shù)據(jù)選擇提升效率,選取高質(zhì)量數(shù)據(jù),加快訓(xùn)練速度;

而且通過數(shù)據(jù)排序提升效能,在預(yù)訓(xùn)練和后訓(xùn)練階段都顯著提升了模型性能,且適用于通用、數(shù)學(xué)和代碼等多領(lǐng)域任務(wù)。

給模型按部就班安排訓(xùn)練課程
數(shù)據(jù)訓(xùn)練效能定義Data Efficacy

研究首先定義了數(shù)據(jù)訓(xùn)練效能(Data Efficacy),是指通過優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來最大化語言模型的性能表現(xiàn),而無需改變數(shù)據(jù)內(nèi)容或模型架構(gòu)。

與以往關(guān)注的“數(shù)據(jù)訓(xùn)練效率” (Data Efficiency) 側(cè)重?cái)?shù)據(jù)篩選的研究目的不同,數(shù)據(jù)效能強(qiáng)調(diào)對(duì)訓(xùn)練數(shù)據(jù)的評(píng)分和排序,以充分挖掘數(shù)據(jù)的潛在價(jià)值。

數(shù)據(jù)順序在語言模型訓(xùn)練中的潛力尚未被充分挖掘, 數(shù)據(jù)效能旨在通過合理的數(shù)據(jù)組織方式,使模型在有限的訓(xùn)練數(shù)據(jù)和資源下實(shí)現(xiàn)更高的性能和泛化能力,成為提升語言模型性能的一種新興方法。

數(shù)據(jù)組織范式DELT介紹



DELT范式架構(gòu)

DELT(DataEfficacy inLMTraining)是一種創(chuàng)新的文本數(shù)據(jù)組織范式。

它集成了數(shù)據(jù)評(píng)分(Data Scoring)、數(shù)據(jù)選擇(Data Selection) 和數(shù)據(jù)排序(Data Ordering) 三大核心組件。

數(shù)據(jù)評(píng)分根據(jù)特定的屬性為每個(gè)樣本賦予分?jǐn)?shù),如:難度、質(zhì)量、多樣性等。

數(shù)據(jù)選擇通過評(píng)分篩選出最優(yōu)子集(如:top-k、按閾值篩選等),然后數(shù)據(jù)排序根據(jù)評(píng)分重新組織所選擇數(shù)據(jù)的呈現(xiàn)順序(如:基于課程學(xué)習(xí)的分?jǐn)?shù)從低到高排列)。 為了兼顧數(shù)據(jù)處理效率,DELT范式的數(shù)據(jù)選擇和數(shù)據(jù)排序共用數(shù)據(jù)評(píng)分的結(jié)果。

因此,數(shù)據(jù)評(píng)分的規(guī)則設(shè)置非常重要。于是,研究還提出了Learning-Quality Score(LQS)方法。



LQS打分方式

該數(shù)據(jù)評(píng)分方式結(jié)合了質(zhì)量可學(xué)習(xí)性兩個(gè)關(guān)鍵指標(biāo),不但可以篩選出低質(zhì)量數(shù)據(jù),而且也能捕捉數(shù)據(jù)在不同階段的訓(xùn)練價(jià)值,進(jìn)一步提供了可靠的數(shù)據(jù)排列順序。

為了進(jìn)一步提升數(shù)據(jù)效能,團(tuán)隊(duì)還提出了一種全新的折疊排序方法Folding Ordering(FO)。

基于課程學(xué)習(xí)的排序(即,按分?jǐn)?shù)升序排序)可能導(dǎo)致模型遺忘和數(shù)據(jù)內(nèi)部分布偏差。

折疊排序策略通過多層“折疊”,將數(shù)據(jù)按分?jǐn)?shù)分層并多次采樣,無重復(fù)且均衡分布。



Folding排序方式

相比隨機(jī)打亂或單一排序,它既保留難度排序優(yōu)勢(shì),又避免模型過度遺忘或依賴特定數(shù)據(jù),提升了魯棒性和泛化能力。

與傳統(tǒng)隨機(jī)排序方法相比,DELT范式不僅通過減小數(shù)據(jù)規(guī)模提升了訓(xùn)練效率;而且在不同模型尺寸和數(shù)據(jù)規(guī)模下,在各種評(píng)測(cè)集上都顯著提升了模型性能。



不同數(shù)據(jù)規(guī)模和模型尺寸下的結(jié)果

DELT給Data-centric AI領(lǐng)域帶來了全新思路。

看來,類比于人類教學(xué)實(shí)踐,講究個(gè)性化與按部就班地安排學(xué)習(xí)內(nèi)容,AI訓(xùn)練也需要類似的學(xué)習(xí)方法。

論文鏈接:https://arxiv.org/abs/2506.21545
代碼鏈接:https://github.com/microsoft/DELT

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
新來的醫(yī)生被分去守太平間,他質(zhì)問院長(zhǎng):我父親知道這個(gè)安排嗎?

新來的醫(yī)生被分去守太平間,他質(zhì)問院長(zhǎng):我父親知道這個(gè)安排嗎?

紅豆講堂
2025-11-30 17:30:05
火箭20分慘?。”┞冻鲎畲髥栴},是陣容配置,賽后阿杜先一步退場(chǎng)

火箭20分慘敗!暴露出最大問題,是陣容配置,賽后阿杜先一步退場(chǎng)

擔(dān)酒
2025-12-24 14:10:47
釘在恥辱柱上!國(guó)家文物局出手,這三個(gè)跳梁小丑,徹底涼涼

釘在恥辱柱上!國(guó)家文物局出手,這三個(gè)跳梁小丑,徹底涼涼

八斗小先生
2025-12-24 09:37:51
中美博弈,核心根本不是臺(tái)海,而是三張“牌”打完后,發(fā)現(xiàn)全廢了

中美博弈,核心根本不是臺(tái)海,而是三張“牌”打完后,發(fā)現(xiàn)全廢了

遠(yuǎn)方風(fēng)林
2025-12-21 19:01:02
97年毛新宇在京結(jié)婚,300位老將軍齊刷刷到場(chǎng),輪椅上那位老人一露面,全場(chǎng)眼眶都紅了

97年毛新宇在京結(jié)婚,300位老將軍齊刷刷到場(chǎng),輪椅上那位老人一露面,全場(chǎng)眼眶都紅了

清風(fēng)鑒史
2025-12-18 20:10:17
2026年我國(guó)將在全國(guó)高速公路服務(wù)區(qū)建設(shè)1萬個(gè)以上充電槍

2026年我國(guó)將在全國(guó)高速公路服務(wù)區(qū)建設(shè)1萬個(gè)以上充電槍

新京報(bào)
2025-12-23 16:00:03
快船大勝送火箭三連敗,哈登29分小卡41分8籃板

快船大勝送火箭三連敗,哈登29分小卡41分8籃板

曉隯就是我
2025-12-24 14:01:46
泰國(guó)總理宣布三軍大捷,柬埔寨兵敗如山倒,洪森父子不服都不行了

泰國(guó)總理宣布三軍大捷,柬埔寨兵敗如山倒,洪森父子不服都不行了

滄海一書客
2025-12-24 13:53:21
美國(guó)“全面封鎖”受制裁油輪,一艘油輪狂發(fā)75次求救信號(hào)!委內(nèi)瑞拉:這是盜竊和劫持

美國(guó)“全面封鎖”受制裁油輪,一艘油輪狂發(fā)75次求救信號(hào)!委內(nèi)瑞拉:這是盜竊和劫持

紅星新聞
2025-12-22 15:31:24
原子彈炸后百年內(nèi)寸草不生,今廣島卻住滿了人,說好的百年絕地呢?

原子彈炸后百年內(nèi)寸草不生,今廣島卻住滿了人,說好的百年絕地呢?

歷史回憶室
2025-12-20 11:14:14
日票房才116萬的《情圣3》,差評(píng)不斷,把制片人給氣破防了!

日票房才116萬的《情圣3》,差評(píng)不斷,把制片人給氣破防了!

星宿影視鴨
2025-12-24 14:43:15
美智庫:中國(guó)的新型超級(jí)殲-36“NGAD”隱形戰(zhàn)斗機(jī)即將問世

美智庫:中國(guó)的新型超級(jí)殲-36“NGAD”隱形戰(zhàn)斗機(jī)即將問世

滄海旅行家
2025-12-23 12:57:27
任志飛在家中突發(fā)疾病去世,年僅41歲

任志飛在家中突發(fā)疾病去世,年僅41歲

wuhu派
2025-12-23 13:06:27
東莞:郭錦添被紀(jì)委監(jiān)委調(diào)查!

東莞:郭錦添被紀(jì)委監(jiān)委調(diào)查!

東莞好生活
2025-12-24 15:13:05
江蘇5市退休人員注意!這筆錢已到賬,快查你的賬戶!

江蘇5市退休人員注意!這筆錢已到賬,快查你的賬戶!

天氣觀察站
2025-12-24 12:02:42
中字頭某局血腥大裁員,工程人寒冬已至!

中字頭某局血腥大裁員,工程人寒冬已至!

黯泉
2025-12-24 13:24:12
特朗普已做好開戰(zhàn)準(zhǔn)備?王毅警告:沖突結(jié)局已定,美國(guó)露出斬殺線

特朗普已做好開戰(zhàn)準(zhǔn)備?王毅警告:沖突結(jié)局已定,美國(guó)露出斬殺線

文雅筆墨
2025-12-24 12:26:17
男兒護(hù)國(guó)著征袍:烏綠衣主教葉爾馬克血戰(zhàn)沙場(chǎng),俄塔曼港遭重創(chuàng)

男兒護(hù)國(guó)著征袍:烏綠衣主教葉爾馬克血戰(zhàn)沙場(chǎng),俄塔曼港遭重創(chuàng)

史政先鋒
2025-12-23 14:41:27
鄒市明冉瑩穎12歲兒子打生長(zhǎng)激素一年,長(zhǎng)高8厘米,醫(yī)生提醒:應(yīng)慎重

鄒市明冉瑩穎12歲兒子打生長(zhǎng)激素一年,長(zhǎng)高8厘米,醫(yī)生提醒:應(yīng)慎重

阿燕姐說育兒
2025-12-24 10:39:19
尹錫悅庭審稱戒嚴(yán)是為了“士兵吃上炸雞”,審判長(zhǎng):發(fā)言應(yīng)以親眼目睹事實(shí)為主

尹錫悅庭審稱戒嚴(yán)是為了“士兵吃上炸雞”,審判長(zhǎng):發(fā)言應(yīng)以親眼目睹事實(shí)為主

紅星新聞
2025-12-24 13:51:13
2025-12-24 15:56:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11910文章數(shù) 176341關(guān)注度
往期回顧 全部

科技要聞

馬斯克沒想到的"中國(guó)速度"!2026值得期待

頭條要聞

美國(guó)再向委內(nèi)瑞拉施壓 中方在安理會(huì)上連說5個(gè)"反對(duì)"

頭條要聞

美國(guó)再向委內(nèi)瑞拉施壓 中方在安理會(huì)上連說5個(gè)"反對(duì)"

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

曝闞清子女兒早產(chǎn)但沒保住

財(cái)經(jīng)要聞

快手到底惹了誰?

汽車要聞

“運(yùn)動(dòng)版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

親子
手機(jī)
本地
公開課
軍事航空

親子要聞

闞清子孩子夭折曝出后最難過的事情發(fā)生了!婦科醫(yī)生現(xiàn)身說法

手機(jī)要聞

一加Turbo屏幕規(guī)格曝光:搭載1.5K 165Hz京東方定制屏

本地新聞

云游安徽|一川江水潤(rùn)安慶,一塔一戲一城史

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

"九三"受閱女民兵:96米需踢出128個(gè)正步 每步75厘米

無障礙瀏覽 進(jìn)入關(guān)懷版 亚洲精典Av| 中文字幕一区二区三区四区在线| 免费观看欧美猛交视频黑人| 一色屋精品视频在线观看| 女人屄人人插| 熟妇人妻中文字幕| 欧美老熟妇日逼视频| 国产婷婷久久| 国产亚洲精品字幕在线观看| 精品一区二区三区影院在线午夜| 久久精品国产亚洲AV天海翼| 久久免费成人| 我被黑人添的都快尿了| 亚洲成a人无码av波多野| avavtt一区二区三区| 亚洲精品无码国产片| 永久免费在线毛片| 8插8插成人免费观看视频| 亚洲天堂视频网站| 奇米在线视频观看| 西西人体在线观看| 精品在线视频免费| 成人性生交大片免费看r| 懂色av中文一区二区三区在线播放网站| 一区二区三区日本久久九| www.好屌妞| 懂色av无码专区一区二区三区| 7777精品久久久大香线蕉| 日产2021免费一二三四区在线| 色人阁影音先锋| 亚洲 校园 欧美 国产 另类| 熟美女一区二区三区| 少妇喷水久久久久| 精品无码美妇视频网站| 午夜精品久久久久久不卡AV| 国产AV无码系列| 国产精品色一区二区三区| 久久午夜福利无码1000合集| 97人妻无码一区二区精品免费| 久久国产乱子伦免费精品无码| 国产精品96久久久久久吹潮|