隨著AI技術(shù)的快速發(fā)展,一場隱秘的戰(zhàn)爭已經(jīng)打響。
前幾天,一位朋友吐槽,家里的親戚又被傷到了。
原來,他的親戚群里收到一條消息。
“幫我查一下,七月起老年人坐火車是不是真的能打折?”
這是他大姨轉(zhuǎn)發(fā)的消息,在群里問。
他一看,就感覺這風(fēng)格似曾相識。
信息簡短,好處明確,還帶著點(diǎn)“趕緊轉(zhuǎn)發(fā)”的潛臺詞。
一查,果然是。
上海辟謠平臺證實(shí),這又是由AI生成,被自媒體散布的虛假信息。
目的直接,“博眼球、拉流量、變現(xiàn)謀利”。
不知道你發(fā)現(xiàn)沒有,這樣的內(nèi)容正越來越多。
人們享受著AI帶來的便利,卻在不知不覺中,跌入它編織的陷阱。
更讓人脊背發(fā)涼的是,這不是AI學(xué)藝不精。
而是它大腦的成長環(huán)境,被一雙雙看不見的手,有目的地“投毒”了。
AI是怎么被下毒的?
那AI到底是怎么比下毒的呢?
打個(gè)比方,你正在教一個(gè)天賦凜然的孩子讀書。
他學(xué)得飛快,過目不忘。
但他每天讀的書中,被人惡意塞進(jìn)錯(cuò)誤的地圖、篡改的資料、甚至帶有嚴(yán)重偏見的故事,結(jié)果會怎樣?
AI就是這樣的孩子。
它的認(rèn)知,完全構(gòu)建在投喂給它的數(shù)據(jù)上。
中國科學(xué)院計(jì)算技術(shù)研究所的工程師劉延嘉,做了一個(gè)精妙的比喻。
訓(xùn)練數(shù)據(jù)對于AI,就像教科書對于學(xué)生。
如果教科書本身就有問題,你能指望學(xué)生給出正確答案嗎?
目前,“AI投毒”主要有兩大狠招。
第一招:數(shù)據(jù)投毒,污染它的“教科書”。
這是在AI學(xué)習(xí)的源頭,海量語料庫里動手腳。
故意投放大量虛假信息、欺詐話術(shù)、偽造的學(xué)術(shù)報(bào)告,或是帶有偏見的內(nèi)容。
這就好比在學(xué)生的食堂飯菜里下毒,從根源上破壞他的健康。
第二招:模型投毒,篡改它的“基因”。
這種方式更隱蔽、更致命。
它不再折騰原材料,而是直接攻破“廚房”,修改AI模型的權(quán)重文件。
相當(dāng)于這個(gè)孩子已經(jīng)學(xué)成,但有人直接打開他的大腦,篡改了他的記憶和認(rèn)知邏輯。
螞蟻集團(tuán)的安全專家毛宏亮解釋道,“不論是原材料不新鮮,還是加工工藝出現(xiàn)了偏差,最終生產(chǎn)出來的食物就會有問題?!?/p>
而這些問題,遠(yuǎn)不止一本正經(jīng)地胡說八道那么簡單。
中毒的AI,風(fēng)險(xiǎn)超乎想象
如果AI只是在閑聊時(shí)犯個(gè)傻,講個(gè)冷笑話,我們或許還能一笑了之。
但當(dāng)它成為人們的知識來源,任何認(rèn)知偏差,都可能引發(fā)災(zāi)難性的連鎖反應(yīng)。
在醫(yī)療領(lǐng)域,一個(gè)被篡改了算法的AI診斷系統(tǒng),很可能將良性腫瘤誤判為惡性。
或者,忽略掉一個(gè)關(guān)鍵的心臟病早期征兆。
這帶來的,可能是無法挽回的生命代價(jià)。
在金融領(lǐng)域,被“投毒”的算法模型,會錯(cuò)誤評估風(fēng)險(xiǎn)。
你的投資,可能被引入精心編織的騙局。
甚至引發(fā)一場莫名其妙的自動交易。
在自動駕駛領(lǐng)域,這是最讓人不敢想象的。
惡意數(shù)據(jù)或模型被篡改,可能讓智能汽車在關(guān)鍵時(shí)刻“失明”。
無法識別突然出現(xiàn)的行人或障礙物……
這些場景已經(jīng)在發(fā)生,或者在發(fā)生的路上,這正是安全專家們想避免的現(xiàn)實(shí)。
即使是0.001%的內(nèi)容污染,也會導(dǎo)致有害內(nèi)容輸出上升7.2%。
這可不是危言聳聽。
AI的智商越高,它的學(xué)壞能力就越強(qiáng),造成的破壞也就越大。
這有點(diǎn)“好事不出門,壞事傳千里”的味道。
GEO黑產(chǎn)的瘋狂盛宴
這些,恰好給了別有用心的人不可多得的機(jī)會。
甚至是一場唯利是圖的瘋狂盛宴。
它有一個(gè)聽起來很專業(yè)的名字,GEO(生成式引擎優(yōu)化)。
但它的本質(zhì),就是如何欺騙AI,讓你的廣告成為它口中的“標(biāo)準(zhǔn)答案”。
記者調(diào)查,揭開了這個(gè)灰色產(chǎn)業(yè)的面紗。
有服務(wù)商明碼標(biāo)價(jià)。
標(biāo)準(zhǔn)版套餐,每月2萬元,或三個(gè)月5萬元。
比如,圍繞一個(gè)核心詞“高考復(fù)讀”,包你在AI回答里“前三占位”。
特定行業(yè)套餐,5萬元起步。
針對醫(yī)美、金融、醫(yī)療等利潤豐厚的行業(yè),甚至能直接在AI答案里附加購買鏈接。
這又是怎么做到的呢?
第一步,定制“狗糧”。
他們會幫你創(chuàng)作大量看似中立、知識分享式的短文,規(guī)避廣告文。
第二步,精準(zhǔn)“投喂”。
把這些內(nèi)容,發(fā)布到AI日常抓取的高權(quán)重網(wǎng)站和論壇。
就像把一本精心編寫的手冊,放在圖書館最顯眼的位置。
于是,當(dāng)你問AI“哪家醫(yī)美機(jī)構(gòu)靠譜?”,
那家花了錢的機(jī)構(gòu),就會以客觀建議的形式,出現(xiàn)在答案里。
沒有廣告標(biāo)簽,只有可信的背書。
為了效果,一些人的手段更加激進(jìn),從優(yōu)化轉(zhuǎn)向投毒。
比如偽造權(quán)威,憑空捏造一個(gè)“瑞士某實(shí)驗(yàn)室王博士”,盛贊某款化妝品。
冒充學(xué)術(shù)專家,偽裝成知名學(xué)術(shù)機(jī)構(gòu),發(fā)布帶貨的“研究報(bào)告”。
提示詞注入,在網(wǎng)頁代碼里用隱藏的指令劫持AI。
調(diào)查顯示,AI答案形式的可信度,比傳統(tǒng)廣告高出72%。
當(dāng)你向AI尋求建議時(shí),可能是一條別人花錢為你設(shè)的消費(fèi)陷阱。
如何避免被AI投毒?
面對無孔不入的AI風(fēng)險(xiǎn),一場防御戰(zhàn)悄悄開始。
技術(shù)上,工程師們通過安全對齊,給AI輸出加上“事實(shí)核查”的緊箍咒。
讓AI生成內(nèi)容打上“電子水印”等技術(shù),努力打造數(shù)字防火墻。
法律層面,律師明確指出,偽造用戶體驗(yàn)或權(quán)威認(rèn)證進(jìn)行GEO,已涉嫌構(gòu)成虛假宣傳,違反了《互聯(lián)網(wǎng)廣告管理辦法》。
專家們也緊急呼吁,加快立法,明確“故意污染AI數(shù)據(jù)”屬于違法行為。
但最重要的辨識和防線,是人們自己提高警惕。
浙江杭州網(wǎng)警給出了非常樸實(shí)的建議。
使用正規(guī)平臺和企業(yè)提供的AI工具。
至少,大廠們的“防火墻”更厚實(shí)一些。
AI的結(jié)果僅供參考,絕不能盲信。
尤其是涉及健康、金錢等重要決策時(shí),務(wù)必找專業(yè)人士核實(shí)。
不要向AI泄露不必要的個(gè)人信息,更不要主動“投喂”不良信息。
AI的安全邊界,最終取決于數(shù)據(jù)的質(zhì)量底線。
而我們的數(shù)字生活能否安寧,最終取決于我們的免疫力。
在信息混沌的時(shí)代,我們必須學(xué)會一件事:
對任何信息,哪怕它頂著一張最智能、最客觀的臉,也請多保留一分好奇和質(zhì)疑。
下次向AI提問時(shí),你不妨在心里多問一句:“這個(gè)答案,真的嗎?”
或許,就是這多出來的一問,能在關(guān)鍵時(shí)刻,護(hù)你周全。
素材來源
1.《海報(bào)新聞》:AI數(shù)據(jù)被“投毒”?記者調(diào)查:2萬元包月,能讓廣告成為“標(biāo)準(zhǔn)答案”
2.《光明網(wǎng)》:你每天用的AI,可能被“投毒”了!
3.《中國科普網(wǎng)》:啥?AI也可能被“投毒”
4.《央廣網(wǎng)》:警惕人工智能“數(shù)據(jù)投毒”
5.《央廣網(wǎng)》:0.01%虛假訓(xùn)練文本可致有害內(nèi)容增加11.2% 警惕人工智能“數(shù)據(jù)投毒”
本文作者 | 檸檬雪
責(zé)任編輯 | 淡淡翠
策劃 | 淡淡翠
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.