夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

金魚損失隨機剔除token,讓AI不再死記硬背

0
分享至

henry 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

訓(xùn)練大模型時,有時讓它“記性差一點”,反而更聰明!

大語言模型如果不加約束,很容易把訓(xùn)練數(shù)據(jù)原封不動地復(fù)刻出來。為解決這個問題,來自馬里蘭大學(xué)、圖賓根大學(xué)和馬普所的研究團隊提出了一個新方法——金魚損失(Goldfish Loss)



顧名思義,金魚損失就是讓模型像金魚一樣,不去死記每一個細節(jié),而是在損失函數(shù)計算時隨機剔除一小部分token。

由此,模型不再逐字記住訓(xùn)練集內(nèi)容,但仍能學(xué)會語言規(guī)律。

實驗顯示,LLaMA-2在使用金魚損失后:

  • 記憶化內(nèi)容顯著減少:模型不再復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)
  • 下游任務(wù)性能幾乎不受影響:仍然能流暢生成文本

用網(wǎng)友的精辟評論概括就是:dropout,但損失函數(shù)!



在梯度計算中隨機屏蔽部分token

金魚損失的核心理念非常簡單,就是在模型訓(xùn)練過程中隨機剔除一部分訓(xùn)練文本中的tokens,使其不參與損失計算。

這樣一來,當(dāng)模型在推理階段遇到這些位置時,就只能“猜測”,而不是逐字逐句復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)的完整序列。

此外,為了保證被剔除token的一致性,研究人員設(shè)計了一種基于哈希(hashing)的掩碼策略。



那么,這和同樣是防止模型背會的正則化方法有什么不同呢?

Dropout這樣的正則化方法為例,它通過在訓(xùn)練時“加噪聲”來防止模型過度依賴某些參數(shù),從而提高模型舉一反三的能力。

但這樣做的問題在于:如果只是隨機丟token,那么,每次看到同一段落時,丟掉的地方不一樣,模型累計幾次就能拼湊出完整段落。

所以,說到底,模型還是靠死記硬背,記住了答案。

相比之下,金魚損失則用哈希掩碼確保每次遇到同一段落,掩蓋位置都一樣,這就從根本上阻止了模型復(fù)現(xiàn)完整訓(xùn)練文本。

接下來,我們來看金魚損失具體是怎么做的。

在傳統(tǒng)的next-token prediction中,模型以序列中的下一個真實token作為目標,輸出預(yù)測分布,并基于該分布計算交叉熵損失。



在金魚損失下,模型雖然也在前向傳播中預(yù)測序列里下一個 token。但在計算損失時,會以一定的概率將某些位置的token從損失計算里“抹掉”。

也就是說,有些真實的下一個token不會作為目標來訓(xùn)練。



在這里,研究人員采用了簡單的靜態(tài)掩碼(static mask),剔除每序列中的第4個token。

更進一步,為了確保模型不會從其他地方學(xué)到被掩碼的數(shù)據(jù)(例如不同的文檔會在不同的網(wǎng)頁中反復(fù)出現(xiàn)),研究團隊還提出了一種局部化哈希掩碼(localized hashed mask),使得當(dāng)相同的前h個token出現(xiàn)時,掩蓋模式是相同的(可重復(fù))。

實驗測試與結(jié)果

為了驗證金魚損失確實能防止記憶化,研究團隊設(shè)計了兩種實驗場景:

一種是極端場景,通過對少量樣本進行多個訓(xùn)練周期(即重復(fù))來強烈促使記憶化;

另一種是標準場景,模擬現(xiàn)實模型訓(xùn)練中使用的批次處理方式 。

同時,為了評估模型的記憶化程度,研究采用了以下指標:

  • RougeL得分:該指標衡量最長公共(非連續(xù))子序列的長度 。得分為1.0表示完美記憶 。
  • 精確匹配率(Exact Match):該指標衡量正確預(yù)測的序列占真實序列的百分比.

實驗表明,在極端場景下,標準訓(xùn)練導(dǎo)致模型逐字記憶了100篇文章中的84篇,而金魚損失沒有記憶任何文章



(注:實驗讓LLaMA-2-7B在《哈利·波特》第一章或100篇維基百科文檔上進一步訓(xùn)練了100個epoch)

此外,在標準訓(xùn)練場景下,金魚損失也明顯減少了模型逐字復(fù)現(xiàn)訓(xùn)練語料庫中目標序列的情況。



但這里可能有個直覺式的反應(yīng)——如果讓模型“隨機漏學(xué)”一些token,它的能力會不會也隨之降低呢?

對此,研究人員進行了測試:研究表明,金魚損失模型、標準損失模型和對照模型之間的總體性能沒有系統(tǒng)性差異。



需要注意的是,金魚損失的核心在于忽略部分token的梯度計算。因此,為了學(xué)到足夠的語言模式,模型必須通過更多數(shù)據(jù)來補償這些空缺,這可能導(dǎo)致計算效率的下降。

[1]https://arxiv.org/pdf/2406.10209

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
楊蘭蘭被追加兩項指控,包括未向澳警方提供個人信息

楊蘭蘭被追加兩項指控,包括未向澳警方提供個人信息

吃瓜體
2025-09-05 11:46:56
財報大PK:零跑每輛賺100,特斯拉每輛賺2萬

財報大PK:零跑每輛賺100,特斯拉每輛賺2萬

鞭牛士
2025-09-05 20:40:09
孫中山獨子孫科:1949年拒絕隨蔣介石去臺灣生活,最后結(jié)局如何?

孫中山獨子孫科:1949年拒絕隨蔣介石去臺灣生活,最后結(jié)局如何?

小莜讀史
2025-08-25 10:23:26
當(dāng)年,那對在閱兵儀式上爆火的最美雙胞胎女兵,后來去哪里了?

當(dāng)年,那對在閱兵儀式上爆火的最美雙胞胎女兵,后來去哪里了?

紫星薇辰
2025-05-01 19:45:11
被官媒怒批、搖頭晃腦、德不配位,難怪閱兵從不邀請“流量”明星

被官媒怒批、搖頭晃腦、德不配位,難怪閱兵從不邀請“流量”明星

白面書誏
2025-09-05 12:51:10
A股:大家要做好準備,不出所料,下周(9月8日-12日)可能這樣走

A股:大家要做好準備,不出所料,下周(9月8日-12日)可能這樣走

小嵩
2025-09-06 09:13:27
50名八路與9日寇拼刺刀,被刺倒一片,楊成武無奈:每班配一支矛

50名八路與9日寇拼刺刀,被刺倒一片,楊成武無奈:每班配一支矛

史韻流轉(zhuǎn)
2025-08-29 02:35:02
看完中國閱兵兩天后,特朗普緊急將國防部更名為“戰(zhàn)爭部”,釋放什么信號?

看完中國閱兵兩天后,特朗普緊急將國防部更名為“戰(zhàn)爭部”,釋放什么信號?

上觀新聞
2025-09-06 13:51:03
從加油站到充電站,誰在收割新時代?

從加油站到充電站,誰在收割新時代?

財經(jīng)AI湃
2025-09-04 12:08:02
痛心!兩個孩子離世!全國多地已禁止…

痛心!兩個孩子離世!全國多地已禁止…

常州大喇叭
2025-09-06 14:17:06
李澤楷竟為她豪擲億萬豪宅,25 年不離不棄,背后真相大揭秘!

李澤楷竟為她豪擲億萬豪宅,25 年不離不棄,背后真相大揭秘!

萌姐
2025-09-06 12:56:19
那決賽呢?U16男籃和成年隊均戰(zhàn)勝新西蘭晉級決賽,分差都為14分

那決賽呢?U16男籃和成年隊均戰(zhàn)勝新西蘭晉級決賽,分差都為14分

懂球帝
2025-09-06 18:39:05
美國電影人斯科特·斯皮格爾去世!網(wǎng)友反應(yīng)一致:以為斯皮爾伯格

美國電影人斯科特·斯皮格爾去世!網(wǎng)友反應(yīng)一致:以為斯皮爾伯格

石場阿鑫
2025-09-06 02:02:28
64歲大爺隔一天吃一次他汀,堅持5年,結(jié)果怎樣?聽醫(yī)生怎么講的

64歲大爺隔一天吃一次他汀,堅持5年,結(jié)果怎樣?聽醫(yī)生怎么講的

泠泠說史
2025-09-06 15:52:38
48歲趙薇離婚后豪宅小聚,衛(wèi)衣穿出少女感,普通人這么穿也好看

48歲趙薇離婚后豪宅小聚,衛(wèi)衣穿出少女感,普通人這么穿也好看

小喬古裝漢服
2025-09-05 17:30:33
哭求調(diào)班跑馬拉松,最快女護士被解聘?醫(yī)院官宣,比賽獎金曝光

哭求調(diào)班跑馬拉松,最快女護士被解聘?醫(yī)院官宣,比賽獎金曝光

東球弟
2025-09-06 10:36:21
我國艾滋病人數(shù)已超美國,主要源頭指向某類留學(xué)生

我國艾滋病人數(shù)已超美國,主要源頭指向某類留學(xué)生

中央路知事
2025-08-15 17:23:41
豬耳朵再次被關(guān)注!醫(yī)生直言:經(jīng)常吃豬耳朵的人,要多注意這6點

豬耳朵再次被關(guān)注!醫(yī)生直言:經(jīng)常吃豬耳朵的人,要多注意這6點

鬼菜生活
2025-09-06 10:33:45
馬杜羅:與美國的分歧不應(yīng)成為軍事沖突的理由

馬杜羅:與美國的分歧不應(yīng)成為軍事沖突的理由

新華社
2025-09-06 16:04:50
剛結(jié)婚就想合并財產(chǎn),還好董璇不是傻白甜,這大姑也不是省油的燈

剛結(jié)婚就想合并財產(chǎn),還好董璇不是傻白甜,這大姑也不是省油的燈

甜檸聊史
2025-09-06 17:35:27
2025-09-06 19:44:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11252文章數(shù) 176262關(guān)注度
往期回顧 全部

科技要聞

超1萬億參數(shù)!阿里最大最強模型免費上線

頭條要聞

美執(zhí)法人員突襲抓捕大批韓國人包括工程師 特朗普發(fā)聲

頭條要聞

美執(zhí)法人員突襲抓捕大批韓國人包括工程師 特朗普發(fā)聲

體育要聞

英國籃球,為什么那么菜?

娛樂要聞

虞書欣受風(fēng)波影響!缺席新劇應(yīng)援活動

財經(jīng)要聞

易會滿幾個家人也被一并帶走調(diào)查

汽車要聞

科技加持 BMW R 1300 GS Adv依舊標桿實力

態(tài)度原創(chuàng)

數(shù)碼
手機
本地
房產(chǎn)
藝術(shù)

數(shù)碼要聞

IFA 2025最炸亮相!海信成為杜比視界第二代全球首發(fā)品牌,RGB-Mini LED全系支持

手機要聞

真我Neo7 Turbo AI版官宣:聯(lián)合中國移動打造首款動感地帶AI手機

本地新聞

食味印象 | 夜未央 在自由時光邂逅煙火氣

房產(chǎn)要聞

實景驚艷+名校護航!這個項目,正在重新定義白云改善新高度!

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進入關(guān)懷版 男男腐大尺度无码激情AV| 国产最新视频| 亚洲视频小说之无码| 无码不卡AV| 韩国福利视频一区二区三区| 午夜激情视频无码| 99久久免费精品国产色| WWWXXX无码在线播放| 久久精品人人做人人爽| 人澡人碰人模| 日本护士╳╳╳hd少妇| 啊轻点灬太粗嗯太深了视频网站| 最新国产网站| 五月天激情AV| 韩国三级网一区二区三区| 五月狠狠亚洲小说专区| 91老熟女老人国产老太| www.啊~啊嗯com| 国产乱妇乱子在线视频| 老头日b视频| 精品无码国产一区二区三区AV| 加勒比AV无码在线| 国产成人综合久久二区| 极品人妻系列| 亚洲av无码专区在线厂| 天天日天天干天天考| 国产xxxxx免费视频| 无码av二区三区久久精品| 日韩中文日韩中文字幕亚| 亚洲精品综合色图| 国产人妻久久精品二区三区| 亚州A乱码毛片| 福利视频在线一区二区 | www.com日本在线观看| 波多野结衣一区| 欧美久久久久久久久| 亚洲人成无码久久久久| 国产一级黄色电影精东影业| 3D动漫卡通AV| 婷婷亚洲C一C二区| 亚洲а∨天堂2014在线无码|