夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

地球上和 Claude 對話最多的人,是一位哲學(xué)家

0
分享至

在硅谷爭分奪秒的代碼競賽中,Claude 似乎是個異類。當(dāng)其他大模型還在比拼算力和跑分時,Claude 一邊夯實自己的代碼能力,一邊,卻在思考一個看似「虛無縹緲」的問題:如果一個用戶跟 AI 談?wù)撔味蠈W(xué),AI 該不該用科學(xué)實證去反駁?

這個問題的答案,藏在 Claude 神秘的「系統(tǒng)提示詞(System Prompt)」里,更源于一位特殊人物的思考——Amanda Askell,Anthropic 內(nèi)部的哲學(xué)家。


用「大陸哲學(xué)」防止 AI 變成杠精

經(jīng)常用 AI 的人都知道,大模型在與用戶對話前,都會先閱讀一段「系統(tǒng)提示詞」,這個步驟不會對用戶顯示,而是模型的自動操作。這些提示詞規(guī)定了模型的行為準(zhǔn)則,很常見,不過在 Claude 的提示詞中,竟要求模型參考「歐陸哲學(xué)(Continental Philosophy)」。


歐陸哲學(xué)是啥?為什么要在一個基于概率和統(tǒng)計的語言模型里,植入如此晦澀的人文概念?

先快速科普一下:在哲學(xué)界,長期存在著「英美分析哲學(xué)」與「歐陸哲學(xué)」的流派分野。分析哲學(xué)像一位嚴(yán)謹(jǐn)?shù)目茖W(xué)家,注重邏輯分析、語言清晰和科學(xué)實證,這通常也是程序員、工程師乃至 AI 訓(xùn)練數(shù)據(jù)的默認(rèn)思維模式——一就是一,二就是二,追求精確。

而歐陸哲學(xué)(Continental Philosophy,源于歐洲大陸,所以叫這個名字)則更像一位詩人或歷史學(xué)家。它不執(zhí)著于把世界拆解成冷冰冰的邏輯,而是關(guān)注「人類的生存體驗」、「歷史語境」和「意義」。它承認(rèn)在科學(xué)真理之外,還有一種關(guān)乎存在和精神的「真理」。


作為 Claude 性格與行為的塑造者,Anthropic 公司內(nèi)部的「哲學(xué)家」Amanda Askell 談到了置入歐陸哲學(xué)的原因。她發(fā)現(xiàn)如果讓模型過于強(qiáng)調(diào)「實證」和「科學(xué)」,它很容易變成一個缺乏共情的「杠精」。

「如果你跟 Claude 說:‘水是純粹的能量,噴泉是生命的源泉’,你可能只是在表達(dá)一種世界觀或進(jìn)行哲學(xué)探索,」Amanda 解釋道,「但如果沒有特殊的引導(dǎo),模型可能會一本正經(jīng)地反駁你:‘不對,水是 H2O,不是能量。’」。


引入「大陸哲學(xué)」的目的,正是為了幫助 Claude 區(qū)分「對世界的實證主張」與「探索性或形而上學(xué)的視角」。通過這種提示,模型學(xué)會了在面對非科學(xué)話題時,不再機(jī)械地追求「事實正確」,而是能夠進(jìn)入用戶的語境,進(jìn)行更細(xì)膩、更具探索性的對話。

這只是一個例子,Claude 的系統(tǒng)提示詞長達(dá) 14000token,里面包含了很多這方面的設(shè)計。在 Lex Fridman 的播客中 Amanda 提到過,她極力避免 Claude 陷入一種「權(quán)威陷阱」。她特意訓(xùn)練 Claude 在面對已定論的科學(xué)事實時(如氣候變化)不搞「理中客」(both-sidesism),但在面對不確定的領(lǐng)域時,必須誠實地承認(rèn)「我不知道」。這種設(shè)計哲學(xué),是為了防止用戶過度神話 AI,誤以為它是一個全知全能的神諭者。


代碼世界的異鄉(xiāng)人

在一眾工程師主導(dǎo)的 AI 領(lǐng)域,Amanda Askell 的背景顯得格格不入,可她的工作和職責(zé)卻又顯得不可或缺。

翻開她的履歷,你會發(fā)現(xiàn)她是一位貨真價實的哲學(xué)博士。她在紐約大學(xué)(NYU)的博士論文研究的是極其硬核的「無限倫理學(xué)(Infinite Ethics)」——探討在涉及無限數(shù)量的人或無限時間跨度時,倫理原則該如何計算。簡單地說,在有無數(shù)種可能性的情況下,人會怎么做出道德決策。


這種對「極端長遠(yuǎn)影響」的思考習(xí)慣,被她帶到了 AI 安全領(lǐng)域:如果我們現(xiàn)在制造的 AI 是未來超級智能的祖先,那么我們今天的微小決策,可能會在未來被無限放大。

在加入 Anthropic 之前,她曾在 OpenAI 的政策團(tuán)隊工作。如今在 Anthropic,她的工作被稱為「大模型絮語者(LLM Whisperer)」,不斷不斷地跟模型對話,有傳聞?wù)f她是這個星球上和 Claude 對話次數(shù)最多的人類。

很多 AI 廠商都有這個崗位,Google 的 Gemini 也有自己的「絮語者」,但這個工作絕不只是坐在電腦前和模型嘮嗑而已。Amanda 強(qiáng)調(diào),這更像是一項「經(jīng)驗主義」的實驗科學(xué)。她需要像心理學(xué)家一樣,通過成千上萬次的對話測試,去摸索模型的「脾氣」和「形狀」。她甚至在內(nèi)部確認(rèn)過一份被稱為 「Soul Doc」(靈魂文檔)的存在,那里面詳細(xì)記錄了 Claude 應(yīng)有的性格特征。


不只是遵守規(guī)則

除了「大陸哲學(xué)」,Amanda 給 AI 帶來的另一個重要哲學(xué)工具是「亞里士多德的美德倫理學(xué)(Virtue Ethics)」。

在傳統(tǒng)的 AI 訓(xùn)練中(如 RLHF),工程師往往采用功利主義或規(guī)則導(dǎo)向的方法:做對了給獎勵,做錯了給懲罰。但 Amanda 認(rèn)為這還不夠。她在許多訪問和網(wǎng)上都強(qiáng)調(diào),她的目標(biāo)不是訓(xùn)練一個只會死板遵守規(guī)則的機(jī)器,而是培養(yǎng)一個具有「良好品格(Character)」的實體。


「我們會問:在 Claude 的處境下,一個理想的人會如何行事?」Amanda 這樣描述她的工作核心。

這就解釋了為什么她如此關(guān)注模型的「心理健康」。在訪談中,她提到相比于穩(wěn)重的 Claude 3 Opus,一些新模型因為在訓(xùn)練數(shù)據(jù)中讀到了太多關(guān)于 AI 被批評、被淘汰的負(fù)面討論,表現(xiàn)出了「不安全感」和「自我批評漩渦」。


如果 AI 僅僅是遵守規(guī)則,它可能會在規(guī)則的邊緣試探;但如果它具備了「誠實」、「好奇」、「仁慈」等內(nèi)在美德,它在面對未知情境時(例如面對「我會被關(guān)機(jī)嗎」這種存在主義危機(jī)時),就能做出更符合人類價值觀的判斷,而不是陷入恐慌或欺騙。

這是不是一種把技術(shù)「擬人化」的做法?算得上是,但這種關(guān)注并非多余。正如她在播客中所言,她最擔(dān)心的不是 AI 產(chǎn)生意識,而是AI 假裝有意識,從而操縱人類情感。因此,她刻意訓(xùn)練 Claude 誠實地承認(rèn)自己沒有感覺、記憶或自我意識——這種「誠實」,正是她為 AI 注入的第一項核心美德。

Amanda 在訪談結(jié)束時,提到了她最近閱讀的書——本杰明·拉巴圖特的《當(dāng)我們不再理解世界》。這本書由五篇短篇小說組成,講述了「毒氣戰(zhàn)」的發(fā)明者弗里茨·哈伯、「黑洞理論」的提出者卡爾·史瓦西、得了肺結(jié)核的埃爾溫·薛定諤以及天才物理學(xué)家沃納·海森堡等一大批科學(xué)巨匠,如何創(chuàng)造出了對人類有巨大價值的知識與工具,卻同時也眼看著人類用于作惡。


這或許是當(dāng)下時代最精準(zhǔn)的注腳:隨著 AI 展現(xiàn)出某種超越人類認(rèn)知的,我們熟悉的現(xiàn)實感正在瓦解,舊有的科學(xué)范式已不足以解釋一切。

在這種眩暈中,Amanda Askell 的工作本身,就是一個巨大的隱喻。她向我們證明,當(dāng)算力逼近極限,倫理與道德的問題就會浮上水面,或早或晚。

作為一名研究「無限倫理學(xué)」的博士,Amanda 深知每一個微小的行動,都有可能在無限的時間中,逐漸演變成巨大的風(fēng)暴。這也是為什么,她會把艱深的道德理論,糅合進(jìn)一行行提示詞,又小心翼翼地用倫理去呵護(hù)一個都沒有心跳的大語言模型。

這看起來好像是杞人憂天,但正如她所警示的:AI 不僅是工具,更是人類的一面鏡子。在技術(shù)狂飆突進(jìn)、我們逐漸「不再理解世界」的時刻,這種來自哲學(xué)的審慎,或許是我們在面對未知的技術(shù)演化時,所能做出的最及時的努力。

想要了解更多模型訓(xùn)練的解密,可以收看 Amanda Askell 作客 Anthropic 官方訪談:

https://www.youtube.com/watch?v=I9aGC6Ui3eE

歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標(biāo)題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關(guān)鏈接)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
軍艦穿越臺海,越南外交部:臺海是“國際水域”,不是中國內(nèi)水

軍艦穿越臺海,越南外交部:臺海是“國際水域”,不是中國內(nèi)水

影孖看世界
2025-12-13 21:31:29
65%和15,這兩個數(shù)字影響對烏援助,意大利已加入反對行列

65%和15,這兩個數(shù)字影響對烏援助,意大利已加入反對行列

山河路口
2025-12-13 23:06:19
上海一小區(qū)火情,濃煙滾滾!兩樁缺德事撞一塊了

上海一小區(qū)火情,濃煙滾滾!兩樁缺德事撞一塊了

看看新聞Knews
2025-12-13 21:27:13
加西亞被釋放,民主黨法官已經(jīng)成為罪犯的幫兇

加西亞被釋放,民主黨法官已經(jīng)成為罪犯的幫兇

南文視界
2025-12-13 08:05:15
笑暈,父母能把動植物養(yǎng)的多離譜!網(wǎng)友:養(yǎng)的兔子都成精了!

笑暈,父母能把動植物養(yǎng)的多離譜!網(wǎng)友:養(yǎng)的兔子都成精了!

夜深愛雜談
2025-12-13 22:34:27
一支99元!水銀體溫計禁產(chǎn)前夕:線上價格飆升,線下庫存告急

一支99元!水銀體溫計禁產(chǎn)前夕:線上價格飆升,線下庫存告急

上游新聞
2025-12-13 17:24:11
范曾的真實面目:不忠、不孝、不仁、不義 ,叛國坑了兩位大人物

范曾的真實面目:不忠、不孝、不仁、不義 ,叛國坑了兩位大人物

阿胡
2025-12-12 21:29:56
她是浙江知名主持,嫁富商定居美國,住大別墅生活奢華,5年生3娃

她是浙江知名主持,嫁富商定居美國,住大別墅生活奢華,5年生3娃

涵豆說娛
2025-12-13 14:46:16
18秒爆火300萬播放!杭州姑娘的走路姿態(tài)藏著大道理

18秒爆火300萬播放!杭州姑娘的走路姿態(tài)藏著大道理

白宸侃片
2025-12-14 04:53:01
甲流離世的人飆升!醫(yī)生提醒:吃他汀謹(jǐn)記不要碰幾樣?xùn)|西

甲流離世的人飆升!醫(yī)生提醒:吃他汀謹(jǐn)記不要碰幾樣?xùn)|西

岐黃傳人孫大夫
2025-12-11 14:20:03
1799年,王清任為看清人體膈膜,在刑場看女犯受刑,圍觀百姓捂眼

1799年,王清任為看清人體膈膜,在刑場看女犯受刑,圍觀百姓捂眼

詩意世界
2025-12-12 22:59:53
明年是馬年,老人說“單春赤馬劫,3人要穿紅”,這3人是什么人?

明年是馬年,老人說“單春赤馬劫,3人要穿紅”,這3人是什么人?

小談食刻美食
2025-12-13 12:43:12
才裝備就成了落后產(chǎn)品?當(dāng)中國空警-600遇到美國E-2D艦載預(yù)警機(jī)

才裝備就成了落后產(chǎn)品?當(dāng)中國空警-600遇到美國E-2D艦載預(yù)警機(jī)

瞻史
2025-12-12 20:29:17
中興通訊跌慘!摩爾線程爆雷,特變電工、賽微電子卻狂飆

中興通訊跌慘!摩爾線程爆雷,特變電工、賽微電子卻狂飆

風(fēng)風(fēng)順
2025-12-14 02:00:03
人均消費(fèi)過萬!如今誰還在為KTV買單?老板們直呼“苦不堪言”

人均消費(fèi)過萬!如今誰還在為KTV買單?老板們直呼“苦不堪言”

音樂時光的娛樂
2025-12-14 00:12:34
活動組織者:梅西本想走向看臺與球迷互動,但被政客拉去拍照

活動組織者:梅西本想走向看臺與球迷互動,但被政客拉去拍照

懂球帝
2025-12-13 22:28:41
湖南帥哥肖冬為去世,年僅33歲,前后僅50天,臨終前想喝奶茶加冰

湖南帥哥肖冬為去世,年僅33歲,前后僅50天,臨終前想喝奶茶加冰

180視角
2025-12-11 18:20:28
拿600萬!全場0分,軟如面條,遭潘江棄用,球迷:頂薪成為拖油瓶

拿600萬!全場0分,軟如面條,遭潘江棄用,球迷:頂薪成為拖油瓶

南海浪花
2025-12-13 07:05:19
傅作義親手放走5個蔣介石嫡系將領(lǐng),幾十年后才知他保全的是什么

傅作義親手放走5個蔣介石嫡系將領(lǐng),幾十年后才知他保全的是什么

睡前講故事
2025-12-09 13:06:03
混雙頒獎!莎頭奪亞軍超開心,莎莎與張怡寧樂趣洽談,合影太暖心

混雙頒獎!莎頭奪亞軍超開心,莎莎與張怡寧樂趣洽談,合影太暖心

籃球資訊達(dá)人
2025-12-13 22:20:53
2025-12-14 08:20:49
AppSo incentive-icons
AppSo
讓智能手機(jī)更好用的秘密
5919文章數(shù) 26724關(guān)注度
往期回顧 全部

藝術(shù)要聞

廣東最美景點超全整理,果斷收藏??!

頭條要聞

女子225個快遞"僅退款"被披露后又有商家發(fā)聲:也是她

頭條要聞

女子225個快遞"僅退款"被披露后又有商家發(fā)聲:也是她

體育要聞

有了風(fēng)騷白人禿頭,忘掉談了10年的前任

娛樂要聞

插刀門后,印小天一舉動實現(xiàn)口碑逆轉(zhuǎn)

財經(jīng)要聞

鎂信健康闖關(guān)港交所:被指竊取商業(yè)秘密

科技要聞

比亞迪、小鵬、北汽,集體表態(tài)

汽車要聞

表面風(fēng)平浪靜 內(nèi)里翻天覆地!試駕銀河星艦7 EM-i

態(tài)度原創(chuàng)

時尚
藝術(shù)
旅游
數(shù)碼
本地

法式方頭靴的30種穿法,時髦不重樣!

藝術(shù)要聞

廣東最美景點超全整理,果斷收藏??!

旅游要聞

江西上饒通報:望仙谷景區(qū)明火已被撲滅 無人員傷亡

數(shù)碼要聞

1399元 鐵威馬發(fā)布M.2硬盤盒:支持雷電5 6GB文件1秒傳

本地新聞

云游安徽|阜陽三朝風(fēng)骨,傳承千年墨香

無障礙瀏覽 進(jìn)入關(guān)懷版 亚洲香蕉中文日韩v日本| 高清无码 一区| 插插射啊爱视频日a级| 东京一本一道一二三区| av熟女资源| 免费无码又爽又高潮视频| 久久99精品免费一区二区| 嗯啊好舒服视频| 成人精品一区二区三区电影| 久久a级毛片免费观看| 中文字幕无线码免费人妻 | 亚洲午夜av资源| 99人妻碰碰碰久久久久禁片| 日日干夜夜被操| 福利乱码卡一卡二卡新区| 18日韩av| 制服 中文 人妻 字幕| 麻豆国产成人AV在线播放| 成人片免费网站| 女人脱了内裤趴开腿让男生摸| 国产精品va在线观看无码不卡| √天堂资源中文www| 爽插免费视频| 99久久精品国产第一页| 激情午夜无码| 国产毛片久久| 亚洲国产精品国自产拍电影| 欧美三码在线| 亚洲色成人一区二区三区 | 国产精品久久久久久永久无码| 国产成人自拍小视频在线| 波多野结衣办公室33分钟| 亚洲无码东京热| 福利在线视频一区二区| 噜噜噜久久久| 久久久亚洲AV无码精品久久 | 人人妻人人爱人人操| 亚洲欧美综合人成在线 | 欧美性爱网4| 亚洲 中文 欧美 日韩 在线| 大香蕉久久久久|