夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

金魚損失隨機剔除token,讓AI不再死記硬背

0
分享至

henry 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

訓(xùn)練大模型時,有時讓它“記性差一點”,反而更聰明!

大語言模型如果不加約束,很容易把訓(xùn)練數(shù)據(jù)原封不動地復(fù)刻出來。為解決這個問題,來自馬里蘭大學(xué)、圖賓根大學(xué)和馬普所的研究團隊提出了一個新方法——金魚損失(Goldfish Loss)



顧名思義,金魚損失就是讓模型像金魚一樣,不去死記每一個細(xì)節(jié),而是在損失函數(shù)計算時隨機剔除一小部分token。

由此,模型不再逐字記住訓(xùn)練集內(nèi)容,但仍能學(xué)會語言規(guī)律。

實驗顯示,LLaMA-2在使用金魚損失后:

  • 記憶化內(nèi)容顯著減少:模型不再復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)
  • 下游任務(wù)性能幾乎不受影響:仍然能流暢生成文本

用網(wǎng)友的精辟評論概括就是:dropout,但損失函數(shù)!



在梯度計算中隨機屏蔽部分token

金魚損失的核心理念非常簡單,就是在模型訓(xùn)練過程中隨機剔除一部分訓(xùn)練文本中的tokens,使其不參與損失計算。

這樣一來,當(dāng)模型在推理階段遇到這些位置時,就只能“猜測”,而不是逐字逐句復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)的完整序列。

此外,為了保證被剔除token的一致性,研究人員設(shè)計了一種基于哈希(hashing)的掩碼策略。



那么,這和同樣是防止模型背會的正則化方法有什么不同呢?

Dropout這樣的正則化方法為例,它通過在訓(xùn)練時“加噪聲”來防止模型過度依賴某些參數(shù),從而提高模型舉一反三的能力。

但這樣做的問題在于:如果只是隨機丟token,那么,每次看到同一段落時,丟掉的地方不一樣,模型累計幾次就能拼湊出完整段落。

所以,說到底,模型還是靠死記硬背,記住了答案。

相比之下,金魚損失則用哈希掩碼確保每次遇到同一段落,掩蓋位置都一樣,這就從根本上阻止了模型復(fù)現(xiàn)完整訓(xùn)練文本。

接下來,我們來看金魚損失具體是怎么做的。

在傳統(tǒng)的next-token prediction中,模型以序列中的下一個真實token作為目標(biāo),輸出預(yù)測分布,并基于該分布計算交叉熵?fù)p失。



在金魚損失下,模型雖然也在前向傳播中預(yù)測序列里下一個 token。但在計算損失時,會以一定的概率將某些位置的token從損失計算里“抹掉”。

也就是說,有些真實的下一個token不會作為目標(biāo)來訓(xùn)練。



在這里,研究人員采用了簡單的靜態(tài)掩碼(static mask),剔除每序列中的第4個token。

更進一步,為了確保模型不會從其他地方學(xué)到被掩碼的數(shù)據(jù)(例如不同的文檔會在不同的網(wǎng)頁中反復(fù)出現(xiàn)),研究團隊還提出了一種局部化哈希掩碼(localized hashed mask),使得當(dāng)相同的前h個token出現(xiàn)時,掩蓋模式是相同的(可重復(fù))。

實驗測試與結(jié)果

為了驗證金魚損失確實能防止記憶化,研究團隊設(shè)計了兩種實驗場景:

一種是極端場景,通過對少量樣本進行多個訓(xùn)練周期(即重復(fù))來強烈促使記憶化;

另一種是標(biāo)準(zhǔn)場景,模擬現(xiàn)實模型訓(xùn)練中使用的批次處理方式 。

同時,為了評估模型的記憶化程度,研究采用了以下指標(biāo):

  • RougeL得分:該指標(biāo)衡量最長公共(非連續(xù))子序列的長度 。得分為1.0表示完美記憶 。
  • 精確匹配率(Exact Match):該指標(biāo)衡量正確預(yù)測的序列占真實序列的百分比.

實驗表明,在極端場景下,標(biāo)準(zhǔn)訓(xùn)練導(dǎo)致模型逐字記憶了100篇文章中的84篇,而金魚損失沒有記憶任何文章



(注:實驗讓LLaMA-2-7B在《哈利·波特》第一章或100篇維基百科文檔上進一步訓(xùn)練了100個epoch)

此外,在標(biāo)準(zhǔn)訓(xùn)練場景下,金魚損失也明顯減少了模型逐字復(fù)現(xiàn)訓(xùn)練語料庫中目標(biāo)序列的情況。



但這里可能有個直覺式的反應(yīng)——如果讓模型“隨機漏學(xué)”一些token,它的能力會不會也隨之降低呢?

對此,研究人員進行了測試:研究表明,金魚損失模型、標(biāo)準(zhǔn)損失模型和對照模型之間的總體性能沒有系統(tǒng)性差異。



需要注意的是,金魚損失的核心在于忽略部分token的梯度計算。因此,為了學(xué)到足夠的語言模式,模型必須通過更多數(shù)據(jù)來補償這些空缺,這可能導(dǎo)致計算效率的下降。

[1]https://arxiv.org/pdf/2406.10209

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
別信演義!正史上九大猛將,沒有一個是虛構(gòu)人物,個個武功值十足

別信演義!正史上九大猛將,沒有一個是虛構(gòu)人物,個個武功值十足

長風(fēng)文史
2025-10-22 16:03:47
修杰楷逃兵役了,王大陸陳柏霖也逃了!這才知道林志穎當(dāng)年有多牛

修杰楷逃兵役了,王大陸陳柏霖也逃了!這才知道林志穎當(dāng)年有多牛

心靜物娛
2025-10-22 13:50:45
為何毛主席到死都沒原諒潘漢年?主席對他寒了心,也給過2次機會

為何毛主席到死都沒原諒潘漢年?主席對他寒了心,也給過2次機會

南書房
2025-10-21 15:40:47
小米自安裝智能門鎖現(xiàn)身全球官網(wǎng) 可對普通門鎖升級

小米自安裝智能門鎖現(xiàn)身全球官網(wǎng) 可對普通門鎖升級

手機中國
2025-10-22 15:46:03
辛柏青現(xiàn)身大孤山!神態(tài)疲憊難掩悲傷,女兒貼心攙扶,李乃文也在

辛柏青現(xiàn)身大孤山!神態(tài)疲憊難掩悲傷,女兒貼心攙扶,李乃文也在

娛圈小愚
2025-10-22 13:22:12
長城汽車公布新款坦克400預(yù)售價:30.98萬起

長城汽車公布新款坦克400預(yù)售價:30.98萬起

界面新聞
2025-10-22 07:30:51
“指甲都摳破了,蓋子還沒打開”......被調(diào)侃是最犟種產(chǎn)品,許多人都經(jīng)歷過!廠家回應(yīng)

“指甲都摳破了,蓋子還沒打開”......被調(diào)侃是最犟種產(chǎn)品,許多人都經(jīng)歷過!廠家回應(yīng)

魯中晨報
2025-10-22 15:40:08
最高26℃!江西要升溫了

最高26℃!江西要升溫了

魯中晨報
2025-10-22 19:40:04
日本新干線上,外國游客亂放的行李箱,又一次激起了乘客的矛盾

日本新干線上,外國游客亂放的行李箱,又一次激起了乘客的矛盾

日本物語
2025-10-20 20:55:49
萬斯遲早要墜機

萬斯遲早要墜機

求實處
2025-10-20 22:10:44
大破首爾!為中超守住尊嚴(yán),亞冠大戰(zhàn):申花令人感動,拼至力竭!

大破首爾!為中超守住尊嚴(yán),亞冠大戰(zhàn):申花令人感動,拼至力竭!

話體壇
2025-10-22 22:42:09
賈玲又胖回去了?出入高端娛局的她,又是有什么新動作了?

賈玲又胖回去了?出入高端娛局的她,又是有什么新動作了?

巧妹電影
2025-10-22 08:59:40
不按套路出牌!中國突然換將,信號很強烈,要書寫中方自己的規(guī)則

不按套路出牌!中國突然換將,信號很強烈,要書寫中方自己的規(guī)則

贏梯
2025-10-22 20:59:27
撒切爾夫人,曾在回憶錄中解釋為何歸還香港,她不是沒考慮過戰(zhàn)爭

撒切爾夫人,曾在回憶錄中解釋為何歸還香港,她不是沒考慮過戰(zhàn)爭

文史達觀
2024-10-24 06:45:03
好險!網(wǎng)友差點拿40萬接盤小區(qū)超市,評論區(qū)高手仗義挽救一個家庭

好險!網(wǎng)友差點拿40萬接盤小區(qū)超市,評論區(qū)高手仗義挽救一個家庭

另子維愛讀史
2025-10-11 22:40:25
別再扯外星人了,三星堆的真相是:一個主動刪號跑路的頂級文明

別再扯外星人了,三星堆的真相是:一個主動刪號跑路的頂級文明

史意生活
2025-10-18 20:41:09
解放軍臺海有大動作,美放狠話:中國若敢打擊美國本土,后果自負(fù)

解放軍臺海有大動作,美放狠話:中國若敢打擊美國本土,后果自負(fù)

游古史
2025-10-22 14:54:57
男保姆照顧52歲阿姨,4個月后阿姨身體不適,女兒發(fā)現(xiàn)真相后愣住

男保姆照顧52歲阿姨,4個月后阿姨身體不適,女兒發(fā)現(xiàn)真相后愣住

紅豆講堂
2024-10-21 15:16:52
她是與楊振寧合影的絕密女人,美國當(dāng)年嚴(yán)重誤判,就是放她回中國

她是與楊振寧合影的絕密女人,美國當(dāng)年嚴(yán)重誤判,就是放她回中國

以茶帶書
2025-10-21 16:37:29
新能源車“反人類”的6大設(shè)計

新能源車“反人類”的6大設(shè)計

難得君
2025-10-18 13:19:04
2025-10-22 23:03:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11548文章數(shù) 176309關(guān)注度
往期回顧 全部

科技要聞

鴻蒙6發(fā)布,今日公測,支持與蘋果設(shè)備互傳

頭條要聞

花江峽谷大橋無繩蹦極原定23日開放 工作人員:已取消

頭條要聞

花江峽谷大橋無繩蹦極原定23日開放 工作人員:已取消

體育要聞

頒獎儀式:俄城升總冠軍旗幟 火箭集體缺席

娛樂要聞

又嫁錯人?賈靜雯2600萬換女兒撫養(yǎng)權(quán)

財經(jīng)要聞

信也科技擔(dān)保模式之謎 擔(dān)保費率達17.5%

汽車要聞

低調(diào)務(wù)實的零跑,在高端市場也“支棱”了

態(tài)度原創(chuàng)

家居
時尚
游戲
藝術(shù)
軍事航空

家居要聞

蛇口地標(biāo) 盡享山海全景

誰說何老師老了?!

S15全球總決賽:棋差一招,功虧一簣!G2三局戰(zhàn)勝FLY,晉級淘汰賽

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

軍事要聞

普京指揮俄軍戰(zhàn)略核力量綜合演習(xí)

無障礙瀏覽 進入關(guān)懷版 熟妇高潮一区二区在线播放| 激情小说 欧美图片| 一区二区三区丝袜人妻| 在线a级毛片无码免费真人| 六月丁香,五月婷婷| 久久久SS麻豆欧美国产日韩| 亚洲欧美精品在线| 免费一区二区无码东京热| www无码视频| 一区二区传媒有限公司| 精品乱码一区内射人妻无码| 俄罗斯zoo 1区二区三区人与性| 亚洲天堂av在线免费看| 国产jizzjizz麻豆全部免费| 精品国产一区二区三区四区五区| 欧美一级狠狠操| 法国性XXX精品HD| 蜜臀av色欲av浪潮夜夜| 美国久久影院| 毛片网站有哪些| 美女扒开内裤让男生桶| 精品一区二区三区在线视频| 大陆无码人妻| 成片免费观看视频大全| 成人精品视频| 朝鲜美女黑毛bbw| 国产精品亚洲综合色区| 欧美妇女操逼视频| 日韩视频无码免费一区=区三区| 久久无码电影| 久久综合色之久久综合色| 国产在线欧美播放| 在线欧美片一区| 国产一区久久| 午夜影视在线观看免费| 国产精品推荐一页页| 毛片精品免费视频| 麻豆一二三区精品蜜桃| 亚洲妇熟xxxx妇色黄| 亚洲一二三四五六七| 亚洲欧美成人aⅴ在线|