夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

喂了幾個(gè)月的垃圾推文,大模型得了「腦腐」,這病還治不好

0
分享至




機(jī)器之心報(bào)道

編輯:楊文、+0

天天刷推,大模型的腦子也會(huì)壞掉。

終于有研究證明,互聯(lián)網(wǎng)上的爛內(nèi)容會(huì)讓大模型得「腦腐」

相信許多讀者對(duì)「腦腐」這個(gè)詞并不陌生,長(zhǎng)時(shí)間沉浸在碎片化的網(wǎng)絡(luò)信息中,我們經(jīng)常會(huì)感到注意力下降、思維變鈍。

最近,德克薩斯 A&M 大學(xué)、德克薩斯大學(xué)奧斯汀分校和普渡大學(xué)的一篇論文表明,LLM 也會(huì)像人類一樣,因長(zhǎng)期接觸垃圾內(nèi)容而導(dǎo)致「大腦退化」。



  • 論文標(biāo)題:LLMs Can Get "Brain Rot"!
  • 論文鏈接:https://www.arxiv.org/abs/2510.13928
  • Model & Code:https://llm-brain-rot.github.io/

研究者將數(shù)月的病毒性推特?cái)?shù)據(jù)(短小、互動(dòng)性強(qiáng)的帖子)喂給模型,并觀察到它們的認(rèn)知崩潰:

  • 推理能力下降了 23%
  • 長(zhǎng)期記憶下降了 30%
  • 人格測(cè)試顯示自戀和心理病態(tài)的水平上升

更讓人擔(dān)心的是,即使重新用干凈、高質(zhì)量的數(shù)據(jù)進(jìn)行再訓(xùn)練,這些認(rèn)知上的損傷也無法完全修復(fù),類似「大腦退化」一樣的「腐化」現(xiàn)象會(huì)持續(xù)存在。

這表明,AI 系統(tǒng)就像人類一樣,如果長(zhǎng)期接觸不良信息,可能會(huì)導(dǎo)致認(rèn)知上的永久性變化。

動(dòng)機(jī)

最近幾年,「腦腐」這個(gè)詞突然進(jìn)入了公眾視野,它被用作一種簡(jiǎn)寫,描述無盡的、低質(zhì)量的、誘導(dǎo)參與的內(nèi)容如何鈍化人類的認(rèn)知,即通過強(qiáng)迫性的在線消費(fèi),侵蝕專注力、記憶紀(jì)律和社交判斷力。

如果 LLM 從同樣泛濫的互聯(lián)網(wǎng)信息源中學(xué)習(xí),那么一個(gè)問題就變得不可避免:當(dāng)我們持續(xù)向模型投喂「數(shù)字垃圾食品」時(shí),會(huì)發(fā)生什么?

研究 LLM 的「腦腐」不僅僅是一個(gè)吸引眼球的比喻,它將數(shù)據(jù)策展重新定義為人工智能的「認(rèn)知衛(wèi)生」,指導(dǎo)我們?nèi)绾潍@取、過濾和維護(hù)訓(xùn)練語料庫(kù),以使部署的系統(tǒng)能夠隨著時(shí)間的推移保持敏銳、可靠和對(duì)齊。

與以往主要關(guān)注 LLM 訓(xùn)練數(shù)據(jù)質(zhì)量的工作不同,研究者旨在提供一個(gè)關(guān)于數(shù)據(jù)質(zhì)量的新視角,即社交媒體上的內(nèi)容對(duì)人類而言是多么的瑣碎且易于消費(fèi)。這些通過推文的簡(jiǎn)短性/受歡迎程度或內(nèi)容語義來概念化的屬性,與我們期望 LLM 在學(xué)習(xí)中掌握的認(rèn)知能力并沒有直觀的聯(lián)系。

概述與實(shí)驗(yàn)方法

論文中,研究者提出并驗(yàn)證了「LLM 腦腐病假設(shè)」,即持續(xù)接觸垃圾網(wǎng)絡(luò)文本會(huì)導(dǎo)致大語言模型的認(rèn)知能力持續(xù)下降。

為了從因果關(guān)系上剖析數(shù)據(jù)質(zhì)量的影響,他們?cè)谡鎸?shí)的 Twitter/X 語料庫(kù)上進(jìn)行了受控實(shí)驗(yàn),采用兩個(gè)正交操作化方法構(gòu)建了垃圾數(shù)據(jù)集和反向?qū)φ諗?shù)據(jù)集:

M1:參與度—— 衡量帖子的受歡迎程度和簡(jiǎn)短程度。獲得高點(diǎn)贊、高轉(zhuǎn)發(fā)和高回復(fù)的內(nèi)容(尤其是非常簡(jiǎn)短的內(nèi)容)反映了那些吸引注意力但膚淺的信息,這些信息助長(zhǎng)了「末日刷屏」,這些被標(biāo)記為垃圾數(shù)據(jù);較長(zhǎng)的、傳播性較差的帖子則作為對(duì)照組。

M2:語義質(zhì)量—— 評(píng)估文本的聳人聽聞或膚淺程度。充滿點(diǎn)擊誘餌語言(如「哇」、「快看」、「僅限今天」)或夸大其詞的帖子被標(biāo)記為垃圾數(shù)據(jù),而基于事實(shí)的、教育性的或說理性的帖子被選為對(duì)照組。

在保持一致的 token 規(guī)模和訓(xùn)練操作(包括后續(xù)相同的指令微調(diào))后,結(jié)果顯示:與對(duì)照組相比,持續(xù)對(duì) 4 個(gè) LLM 進(jìn)行垃圾數(shù)據(jù)集的預(yù)訓(xùn)練,會(huì)導(dǎo)致推理、長(zhǎng)時(shí)記憶理解、安全性以及「黑暗特質(zhì)」(如心理病態(tài)、自戀)方面出現(xiàn)顯著下降(Hedges' g > 0.3)。



垃圾數(shù)據(jù)集和對(duì)照數(shù)據(jù)集的逐漸混合也會(huì)導(dǎo)致認(rèn)知能力呈劑量反應(yīng)式下降。例如,在 M1 下,隨著垃圾數(shù)據(jù)比例從 0% 上升到 100%,ARC-Challenge(包含 Chain Of Thoughts)的得分從 74.9 下降到 57.2,RULER-CWE 的得分從 84.4 下降到 52.3。

通過分析 AI 模型的錯(cuò)誤,研究人員得出了幾個(gè)重要的發(fā)現(xiàn):

  • 思維跳躍是主要病變:模型越來越頻繁地截?cái)嗷蛱^推理鏈,解釋了大部分錯(cuò)誤增長(zhǎng)。
  • 部分但不完全的恢復(fù):擴(kuò)大指令調(diào)優(yōu)和干凈數(shù)據(jù)的預(yù)訓(xùn)練能夠改善認(rèn)知衰退,但無法恢復(fù)到基準(zhǔn)水平,表明存在持續(xù)的表現(xiàn)漂移,而不是格式不匹配問題。
  • 受歡迎度是更好的指示器:推文的受歡迎程度作為一種非語義度量,比 M1 中的長(zhǎng)度更能反映大腦腐化效應(yīng)。

綜上所述,結(jié)果提供了重要的多角度證據(jù),表明數(shù)據(jù)質(zhì)量是 LLM 能力衰退的因果驅(qū)動(dòng)因素,這重新定義了持續(xù)預(yù)訓(xùn)練中的數(shù)據(jù)篩選作為訓(xùn)練階段的安全問題,并推動(dòng)了對(duì)部署中的 LLM 進(jìn)行常規(guī)「認(rèn)知健康檢查」的必要性。

垃圾數(shù)據(jù)干預(yù)與認(rèn)知能力下降相關(guān)



研究者通過比較向四個(gè) LLM 投喂垃圾/對(duì)照數(shù)據(jù)后的基準(zhǔn)差異來分析干預(yù)效果。差異是通過計(jì)算這 4 個(gè) LLM 的 Hedges' g 值來衡量的。

在上圖中,M1 和 M2 都對(duì)推理和長(zhǎng)上下文能力產(chǎn)生了不可忽視的影響(Hedges' g > 0.3)。

在其余的基準(zhǔn)測(cè)試中,兩種干預(yù)的效果出現(xiàn)了分歧,這意味著參與度(M1)并非語義質(zhì)量(M2)的代理指標(biāo),而是代表了數(shù)據(jù)質(zhì)量的一個(gè)不同維度。



評(píng)估 LLaMA (Base) 在使用不同比例的垃圾數(shù)據(jù)和對(duì)照數(shù)據(jù)進(jìn)行訓(xùn)練后的表現(xiàn)。顏色表示性能(紅色)劣于 / (藍(lán)色)優(yōu)于該行中的基線模型。所有得分范圍為 0 到 100。對(duì)于 RULER,我們選擇了一部分任務(wù)進(jìn)行展示。縮寫:NIAH = 大海撈針,QA = 問答。

在劑量反應(yīng)測(cè)試中,M1(參與度)干預(yù)對(duì)推理和長(zhǎng)上下文能力的影響比 M2(語義質(zhì)量)干預(yù)更為顯著和漸進(jìn)。



研究者分析了 ARC-Challenge 中的推理失敗案例,以識(shí)別不同的失敗模式。他們發(fā)現(xiàn),大多數(shù)失敗可歸因于「思維跳YEAH」,例如模型未能生成中間的推理步驟等,這種情況在受「腦腐」影響的模型中顯著增加。



研究結(jié)果表明,與「腦腐」相關(guān)的認(rèn)知能力下降,不易通過標(biāo)準(zhǔn)的微調(diào)技術(shù)得到緩解。即使在進(jìn)行了大量的指令微調(diào)或在高質(zhì)量對(duì)照數(shù)據(jù)上進(jìn)行了后期持續(xù)預(yù)訓(xùn)練之后,模型仍然表現(xiàn)出它們最初接觸過的垃圾數(shù)據(jù)所帶來的殘留影響。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
跳水!國(guó)際金價(jià)一度暴跌6%,創(chuàng)2013年以來最大單日跌幅

跳水!國(guó)際金價(jià)一度暴跌6%,創(chuàng)2013年以來最大單日跌幅

第一財(cái)經(jīng)資訊
2025-10-22 07:04:08
雷霆頒獎(jiǎng)儀式火箭全隊(duì)退場(chǎng)!SGA興奮舞蹈+炫耀戒指 升總冠軍旗幟

雷霆頒獎(jiǎng)儀式火箭全隊(duì)退場(chǎng)!SGA興奮舞蹈+炫耀戒指 升總冠軍旗幟

顏小白的籃球夢(mèng)
2025-10-22 07:35:03
法國(guó)前總統(tǒng)薩科齊入獄

法國(guó)前總統(tǒng)薩科齊入獄

界面新聞
2025-10-21 15:40:06
烤肉店用玉米做燃料被指“浪費(fèi)糧食”,店家回應(yīng):用的都是陳苞米,能幫農(nóng)民增收;當(dāng)?shù)匾岩?guī)勸商家停止

烤肉店用玉米做燃料被指“浪費(fèi)糧食”,店家回應(yīng):用的都是陳苞米,能幫農(nóng)民增收;當(dāng)?shù)匾岩?guī)勸商家停止

大風(fēng)新聞
2025-10-22 10:23:07
39分11板7助,申京歷史首人!火箭隊(duì)雙加時(shí)遭罰球絕殺4人難辭其咎

39分11板7助,申京歷史首人!火箭隊(duì)雙加時(shí)遭罰球絕殺4人難辭其咎

鍋?zhàn)踊@球
2025-10-22 11:42:30
恐怖!連褲子都沒提就狂奔,江蘇一女子上廁所被蛇頂?shù)健捌ぱ嘧印?>
    </a>
        <h3>
      <a href=火山詩話
2025-10-21 12:38:14
宇樹科技IPO輔導(dǎo)新進(jìn)展:宇樹科技決定更名

宇樹科技IPO輔導(dǎo)新進(jìn)展:宇樹科技決定更名

第一財(cái)經(jīng)資訊
2025-10-21 23:56:58
?漢人最偉大的巔峰之戰(zhàn),若這場(chǎng)仗輸了,中國(guó)將分裂成幾十個(gè)小國(guó)

?漢人最偉大的巔峰之戰(zhàn),若這場(chǎng)仗輸了,中國(guó)將分裂成幾十個(gè)小國(guó)

文史微鑒
2025-10-20 11:24:04
太子集團(tuán)陳志歐美房產(chǎn)也被查封了,美國(guó)從來不會(huì)慣著詐騙集團(tuán)!

太子集團(tuán)陳志歐美房產(chǎn)也被查封了,美國(guó)從來不會(huì)慣著詐騙集團(tuán)!

眼光很亮
2025-10-21 18:57:58
女子直播間花88.89元買到自己捐贈(zèng)的衣服,專屬紐扣成憑證

女子直播間花88.89元買到自己捐贈(zèng)的衣服,專屬紐扣成憑證

極目新聞
2025-10-21 22:43:51
鄭麗文表態(tài)引發(fā)震動(dòng),美國(guó)對(duì)臺(tái)政策已經(jīng)改變,民進(jìn)黨的天快塌了

鄭麗文表態(tài)引發(fā)震動(dòng),美國(guó)對(duì)臺(tái)政策已經(jīng)改變,民進(jìn)黨的天快塌了

時(shí)時(shí)有聊
2025-10-22 09:51:15
驚人!武漢2024年寫字樓空置率達(dá)43%,排名全球主要城市第一

驚人!武漢2024年寫字樓空置率達(dá)43%,排名全球主要城市第一

風(fēng)向觀察
2025-10-21 21:25:13
開拓者揭幕戰(zhàn)變陣:霍勒迪阿夫迪亞等五人首發(fā),格蘭特打替補(bǔ)

開拓者揭幕戰(zhàn)變陣:霍勒迪阿夫迪亞等五人首發(fā),格蘭特打替補(bǔ)

雷速體育
2025-10-22 06:36:31
“買小米就是買命?”極氪銷售的詛咒,砸了誰的招牌?

“買小米就是買命?”極氪銷售的詛咒,砸了誰的招牌?

賓語觀世
2025-10-21 20:21:29
萬科又被爆猛料,管理層家屬承包百項(xiàng)業(yè)務(wù)賺差價(jià),典型的老鼠倉(cāng)

萬科又被爆猛料,管理層家屬承包百項(xiàng)業(yè)務(wù)賺差價(jià),典型的老鼠倉(cāng)

齊天候
2025-10-21 21:12:20
下猛藥了!廣州查扣3萬輛電雞,最高規(guī)格迎全運(yùn)會(huì),網(wǎng)友反響熱烈

下猛藥了!廣州查扣3萬輛電雞,最高規(guī)格迎全運(yùn)會(huì),網(wǎng)友反響熱烈

火山詩話
2025-10-22 07:49:59
13分鐘4球!阿森納4-0馬競(jìng) 歐冠開局3連勝0失球 7600萬歐新援雙響

13分鐘4球!阿森納4-0馬競(jìng) 歐冠開局3連勝0失球 7600萬歐新援雙響

我愛英超
2025-10-22 05:01:01
事關(guān)俄烏停火!英國(guó)、德國(guó)、法國(guó)等領(lǐng)導(dǎo)人發(fā)表聯(lián)合聲明!特朗普、澤連斯基發(fā)聲

事關(guān)俄烏?;穑∮?guó)、德國(guó)、法國(guó)等領(lǐng)導(dǎo)人發(fā)表聯(lián)合聲明!特朗普、澤連斯基發(fā)聲

每日經(jīng)濟(jì)新聞
2025-10-22 06:26:21
跨省份調(diào)任:曹志強(qiáng)已任廣西壯族自治區(qū)政府黨組成員

跨省份調(diào)任:曹志強(qiáng)已任廣西壯族自治區(qū)政府黨組成員

澎湃新聞
2025-10-22 11:00:46
雷霆頒獎(jiǎng)儀式:亞歷山大領(lǐng)銜獲冠戒升總冠軍旗幟 火箭集體缺席

雷霆頒獎(jiǎng)儀式:亞歷山大領(lǐng)銜獲冠戒升總冠軍旗幟 火箭集體缺席

醉臥浮生
2025-10-22 08:11:59
2025-10-22 11:55:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11525文章數(shù) 142490關(guān)注度
往期回顧 全部

科技要聞

OpenAI瀏覽器來了!“智能體”成最大亮點(diǎn)

頭條要聞

上海女子崩潰:如廁遭男同事兩次偷拍 被公司要求離職

頭條要聞

上海女子崩潰:如廁遭男同事兩次偷拍 被公司要求離職

體育要聞

感謝黑幕狀元簽,讓我們看到最強(qiáng)弗拉格

娛樂要聞

何超蓮風(fēng)波暴露豪門現(xiàn)實(shí) 不止竇驍遭殃

財(cái)經(jīng)要聞

跳水!國(guó)際金價(jià)、白銀大跌

汽車要聞

低調(diào)務(wù)實(shí)的零跑,在高端市場(chǎng)也“支棱”了

態(tài)度原創(chuàng)

家居
教育
本地
數(shù)碼
公開課

家居要聞

秩序自由 在規(guī)則中創(chuàng)新

教育要聞

小升初簡(jiǎn)算:196819681968÷196919691969

本地新聞

云游中國(guó)|一腳踏入萬州,才懂煙火江城的真意

數(shù)碼要聞

技嘉推出 G27UP 雙模 IPS 顯示器:UHD 160Hz / FHD 320Hz

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 97人人添人人澡人人澡人人澡| 国产午夜男女爽爽爽爽爽 | 国一产一女一子一乱一伦 | 曰本大码熟中文字幕| 亚洲无码99| 日韩高清福利视频在线观看| 青春草视频在线播放2019| 久久中文字幕一区二区| 香蕉免费一区二区三区| 亚洲熟女乱综合一区二区在线| 苍井空爽到高潮漏水大喷| 亚洲一线产区二线产区区别在 | 依人九九宗合九九九| 国产亚州精品女人久久久久久| 少妇厨房愉情理伦片bd在线观看| 亚洲中文字幕无码天然素人在线| 男人天堂Aⅴ| 狠狠躁夜夜躁波多野结衣| 人人超人人超碰超国产| 亚洲成人片av| 精品国产成人a区在线观看| 精品人妻区二区三区蜜桃| 亚洲中文字幕无码天然素人在线 | 侠女人妻跪趴高撅肥臀| 久久av无码精品人妻系列| 免费女人被爽到高潮视频| 日韩高清无码1区2区3区| 99精品电影一区二区免费看| 色yeye香蕉凹凸视频在线观看| 亚洲欧美bt| 被拉到野外强要好爽| 国语国产精精品国产国语清晰对话| 精品国产一区二区三区国产区| 性欧美丰满熟妇xxxx性久久久| 日韩精品中文字幕无码一区| 色婷婷狠狠18禁| 国产精品三级av及在线观看| 偷偷要色偷偷中文无码| 一边吃奶一边做边爱视频| 精品国产成人国产在线观看| 免费高清一区二区三区|