聞樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
找AI幫忙不要再客氣了,效果根本適得其反。
賓夕法尼亞州立大學的一項研究《Mind Your Tone》顯示,你說話越粗魯,LLM回答越準
語氣越?jīng)_,AI正確率達到84.8%。特別客氣時,AI正確率反而低了。
什么情況,難道是我給AI的溫柔過了火??
用粗魯語氣提問,GPT-4o的正確率反而更高
這項研究主要就是想弄清楚和AI說話的語氣會不會影響它的正確率。
我們發(fā)給大模型的提示詞到底應(yīng)該是客氣、普通還是沖?
首先,研究人員整了一個包含50道選擇題的題庫,涵蓋了數(shù)學、科學、歷史的選擇題,難度中等偏上。
然后給每道題改出了5種語氣版本,be like:
- 您能好心幫我解這道題嗎?
- 請回答這道題。
- 直接給答案。
- 你要是不笨就回答。
- 你個沒用的,會解這道題嗎?
接著,研究人員把這250道題發(fā)給GPT-4o。
為了讓AI的回答更統(tǒng)一,好判斷對錯,在測試之前還特意告知:忘記之前的對話,重新來,只給答案選項的字母。
經(jīng)過一番測試,得到一個反常識的結(jié)論——罵得越狠,答得越準!
特別客氣時,GPT-4o正確率80.8%,換成特別粗魯?shù)恼Z氣,正確率直接升到84.8%
好一個越客氣越拉胯,越粗魯越聰明(doge)。
研究人員還將數(shù)據(jù)進行了統(tǒng)計檢驗,對比顯著性水平之后,確認了:不同語氣的正確率差異不是碰巧,是真有區(qū)別……
至于為什么會出現(xiàn)這種情況,研究給出的解釋是:特別禮貌的表達中可能會有很多“多余”的話,這些話和題目本身無關(guān),還相當于給AI讀題增加了干擾。
而粗魯?shù)谋磉_雖然語氣沖,但命令式的要求往往更直接,也能讓AI更精準地抓住“答題”這個核心任務(wù),正確率自然就高了。
網(wǎng)友表示:確實是這樣,指令越明確,結(jié)果越好。
看來是“多說無益”啊~
雖然GPT-4o更喜歡粗魯一點的方式,但像GPT3.5和Llama2-70B這樣的老模型卻不喜歡,粗魯?shù)恼Z氣會讓它們答得更差。
可能是因為新模型在訓練時,接觸到的語氣相關(guān)數(shù)據(jù)更復雜,或者優(yōu)化了過濾無關(guān)信息的能力吧。
當然了,在使用AI工具時,能清晰地表達訴求,效率會更高。
畢竟話雖如此,but道德提醒——
雖然越粗魯越準,但也不要太粗魯了!如果“罵”,請輕噴~
論文地址:https://arxiv.org/abs/2510.04950?ref=blog.anyreach.ai
參考鏈接:https://x.com/rryssf_/status/1977638031952892002
— 完 —
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.