夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

小樂數(shù)學(xué)科普:句子中的意義存在于何處?數(shù)學(xué)或許能告訴我們——譯自Quanta Magazine量子雜志

0
分享至

加星zzllrr小樂公眾號,與君共賞數(shù)學(xué)的奧妙!

數(shù)學(xué)家Tai-Danae Bradley(泰達娜·布拉德利)正在使用范疇論來嘗試理解人類和AI人工智能生成的語言。


圖源:Monica Almeida/Quanta Magazine

作者:Joseph Howlett(量子雜志特約撰稿人)2025-4-9

譯者:zzllrr小樂(數(shù)學(xué)科普公眾號)2025-4-10

泰達娜·布拉德利(Tai-Danae Bradley)從小就對數(shù)學(xué)毫無興趣。2008年,她進入紐約城市學(xué)院,在那里她加入了籃球隊,并希望從事運動營養(yǎng)學(xué)的職業(yè)。她認為數(shù)學(xué)課程是一道障礙,只有天才才能真正精通?!拔覍幵赴蔚羲械难例X,也不愿以此謀生,”她說。

但大二的時候,她的微積分教授改變了她的想法。她了解到,數(shù)學(xué)是所有科學(xué)的語言?!笆郎线€有比課本更深奧的東西,”她說?!拔覀兩畹氖澜缯媸敲篮?,而數(shù)學(xué)是觀察其中奧秘的一種方式?!?/p>

她退出了籃球隊,決定主修數(shù)學(xué)和物理。如今,作為人工智能公司 SandboxAQ 的研究員,以及加州馬斯特斯大學(xué)的客座教授,布拉德利正在運用數(shù)學(xué)語言,試圖更好地理解語言本身。

她的視角是范疇論(category theory),這是一種從任何單一領(lǐng)域的具體細節(jié)中抽離出來,轉(zhuǎn)而關(guān)注一個連接所有領(lǐng)域的更廣泛的底層框架的方法。通過將語言視為一個數(shù)學(xué)范疇,她能夠運用現(xiàn)有的工具來研究它并獲得新的見解。

語言學(xué)家希望她的模型能夠幫助他們證明某些關(guān)于語法和意義如何從單詞串中產(chǎn)生的理論,并識別人工智能生成的文本與人類語言的區(qū)別。布拉德利本人更感興趣的是,通過這種方式研究語言,她能否開發(fā)出新的數(shù)學(xué)工具。

Quanta量子雜志與布拉德利探討了數(shù)學(xué)如何影響語言研究,以及語言研究如何影響數(shù)學(xué)。為清晰起見,采訪內(nèi)容已精簡和修訂。

是什么問題促使您開始這條研究之路?

我感興趣的是理解:語言的數(shù)學(xué)結(jié)構(gòu)是什么?它的基本單位是什么?單詞和短語之間的數(shù)學(xué)關(guān)系如何產(chǎn)生有意義的內(nèi)容?


泰達娜·布拉德利小時候不喜歡數(shù)學(xué)。但到了本科階段,她開始意識到數(shù)學(xué)與我們周圍世界的聯(lián)系。

圖源:Monica Almeida/Quanta Magazine

用數(shù)學(xué)方法研究語言有很多不同的方法。例如,你可以想象語言具有代數(shù)結(jié)構(gòu)。當(dāng)我把兩個數(shù)相乘時,我會得到另一個數(shù)。同樣地,我也可以把兩個英語短語“相乘”或合并,得到另一個。

你還可以從范疇論的角度來思考語言。

什么是范疇論?

一個范疇(category)由一些對象以及它們之間的關(guān)系(稱為態(tài)射morphism)組成。這些對象可以是集合、群或向量空間。態(tài)射將一個對象與另一個對象關(guān)聯(lián)起來。假設(shè)你的對象是集合。那么態(tài)射就是將一個集合映射到另一個集合的函數(shù)。

我喜歡把范疇論想象成數(shù)學(xué)版的瘋狂填詞游戲(Mad Libs)。在瘋狂填詞游戲中,你得到一個故事,但根據(jù)你填入的不同詞語,你會得到不同版本的故事。事實證明,數(shù)學(xué)領(lǐng)域中存在著某些共同的故事或結(jié)構(gòu)。不同的數(shù)學(xué)分支可能使用不同的詞語來描述事物——比如用“群”而不是“向量空間”——但當(dāng)你以正確的方式替換詞語時,你會發(fā)現(xiàn)底層框架或故事實際上是相同的。

研究生階段剛開始學(xué)習(xí)范疇論的時候,我感覺它簡直是最糟糕的東西。我記得當(dāng)時我心想,這就是人們不喜歡數(shù)學(xué)的原因。它純粹是為了抽象而抽象,沒有任何直覺基礎(chǔ)。這真是令人沮喪。直到后來,我的博士導(dǎo)師約翰·特里拉(John Terilla)才讓我意識到范疇論是多么強大的工具。

是什么讓它如此強大?

它讓你的雙腳離開地面,讓你以鳥瞰的視角來看待數(shù)學(xué)景觀,從而發(fā)現(xiàn)在地面上難以察覺的聯(lián)系?,F(xiàn)在這是我最喜歡思考的事情之一——只是需要更多的數(shù)學(xué)背景和更成熟的人才能看清它。


布拉德利在她周圍看到了范疇論的運用。她尤其對用它來理解語言感興趣。

圖源:Monica Almeida/Quanta Magazine

什么是范疇論能讓你看到,而用其他方法則無法看到的?

數(shù)學(xué)中一個真正有意義的問題是:兩個東西什么時候相同?“相同”是什么意思?它如何根據(jù)你討論的數(shù)學(xué)類型而變化?

例如,集合有點像一袋彈珠:它沒有真正的結(jié)構(gòu)。所以,當(dāng)兩個集合的元素數(shù)量相同時,我們稱它們相同。另一方面,群是指元素通過某些規(guī)則相互作用的集合。此時,你對“相同性”的概念必須考慮到這種額外的結(jié)構(gòu)。

范疇論提供了一個通用模板來描述這些不同的“相同”概念。你可以在嘗試解決問題時使用該模板在這些不同的上下文之間切換。

你能舉個例子嗎?

我最喜歡的例子之一來自拓撲學(xué)的世界。被稱為拓撲空間(topological space)的形狀構(gòu)成一個范疇。你可以將一個范疇拉伸到另一個范疇,這種拉伸就是將它們彼此關(guān)聯(lián)的態(tài)射。

假設(shè)你有兩個拓撲空間,你想知道它們是否相同。如果相同,那么當(dāng)你將一個空間拉伸到另一個空間時,它所含的孔洞的數(shù)量不會改變。直接處理這些空間可能非常棘手,所以這可能很難弄清楚。

但這個孔洞的數(shù)量總是與來自完全不同范疇的孔洞數(shù)量相同。


布拉德利說:“也許研究語言可以幫助我們發(fā)現(xiàn)一些我們還沒有發(fā)現(xiàn)的新數(shù)學(xué)結(jié)構(gòu)?!?/strong>

圖源:Monica Almeida/Quanta Magazine

范疇論讓你能夠從拓撲空間的范疇跳轉(zhuǎn)到另一個范疇。例如,你可以使用一個叫做函子(functor)的東西將兩個拓撲空間轉(zhuǎn)換成向量空間。如果你發(fā)現(xiàn)那兩個向量空間的維數(shù)不同——這更容易測量——那么你就知道這兩個(拓撲)空間不可能相同。你正是通過范疇論在拓撲學(xué)和線性代數(shù)領(lǐng)域之間穿梭,才弄明白了這一點。

那么如何使用范疇論來理解語言呢?

語言和范疇論密不可分。我們不想將任何特定的、僵化的數(shù)學(xué)模型強加于語言。我們可以從簡單的頻率入手,比如“貓”這個詞在某些其他詞旁邊出現(xiàn)的次數(shù)。如果我說“好奇心害死了____”,我可以計算出下一個詞是“貓”而不是“直升機”的概率。

這樣,我們就可以把所有可能的單詞或短語(或者實際上是字母的組合)都看作一種更通用的范疇(稱為充實范疇enriched category)中的對象。每個對象都通過跟隨其他對象的概率與其他對象關(guān)聯(lián)——這些就是你的態(tài)射的豐富充實版本。你可以把它們想象成單詞之間的箭頭,每個箭頭都標有一個數(shù)字。

為什么用范疇來構(gòu)建語言是有幫助的?

如果你熱愛某樣事物,你就會開始在任何地方看到它。由于它非常抽象,并且它連接了數(shù)學(xué)的各個領(lǐng)域,許多數(shù)學(xué)家熟悉的事物都可以用范疇論來重新表達。

但它的意義遠不止于此。一旦你將語言視為一個范疇,你就能接觸到人們幾十年來發(fā)展起來的語言結(jié)構(gòu)。所以,你只需翻閱這本食譜,就能找到一些可能有助于研究人類語言,或理解大語言模型運作原理的知識。

您如何使用其中一種食譜來了解新事物?

人們好奇的一件事是,如何僅從單詞組合方式的基本信息出發(fā),就能獲得更抽象的概念。如果我讓ChatGPT列出五種既是爬行動物又是家養(yǎng)寵物的動物,它怎么知道該如何將這兩者聯(lián)系起來呢?如何從一串串符號及其統(tǒng)計數(shù)據(jù),得到這種邏輯關(guān)系呢?

我們可以用其中一種方法來深入了解這一點。首先,我們將每個單詞與一個范疇論結(jié)構(gòu)關(guān)聯(lián)起來,這個結(jié)構(gòu)刻畫了該單詞可能出現(xiàn)在其中的每個短語,以及該短語的常見程度。然后,我們可以將與兩個不同單詞關(guān)聯(lián)的結(jié)構(gòu)取出,并對它們執(zhí)行一些非常簡單的操作——這些操作在范疇論中也是非常經(jīng)典的。


為了讓其他人更容易接觸數(shù)學(xué),布拉德利運營著一個名為Math3ma的熱門博客。https://www.math3ma.com

圖源:Monica Almeida/Quanta Magazine

我們得到的是一種自動關(guān)聯(lián)兩個原始單詞的結(jié)構(gòu)。如果原始單詞是“大”和“黃”,那么我們得到的構(gòu)造,粗略地說,就是將較大的數(shù)字分配給可能的短語,例如“大黃太陽”,而將較小的數(shù)字分配給可能的短語,例如“大黃紅寶石”。這個來自范疇論的簡單操作,實際上提供了具有語言意義的東西——一種將單詞組合起來構(gòu)建更通用的概念的方法,例如“既大又黃”的概念。

因此,運用范疇論,你可以從數(shù)學(xué)上展示更高層次的概念如何從非常簡單的統(tǒng)計信息中涌現(xiàn)出來。我認為這或許是一個線索,表明思想的形成方式。我不想說“在人類思維中形成”,因為誰知道大腦是如何運作的呢?但這種概念內(nèi)容存在于語言使用方式的原始數(shù)據(jù)中,因為我們的出發(fā)點就是這些頻率。

你認為這可能就是大語言模型(LLM)正在做的事情嗎?

我在LLM接手之前就加入了這個研究項目。但它們的起始頻率和我們一樣。我不知道transformer(變換器)內(nèi)部到底發(fā)生了什么。我不確定是否有人知道。不過,這或許可以作為個話題的開場。

您的作品對于語言有怎樣的普遍啟示?

我認為這表明,即使是最基本的語法,也蘊含著有意義的信息,比如什么詞與什么詞搭配。如果你觀察一下哪些詞通常出現(xiàn)在“藍色”之后——比如“藍色大理石”或“藍色天空”,而不是“藍色鱷梨”——你能理解“藍色”這個詞的意思嗎?

在語言學(xué)界,這并非公認的事實。作為人類,我可以從紙面上的句子中理解意義,但紙上的文字并非我所能接觸的全部。我能夠接觸世界。語言學(xué)家們一直在爭論是否需要一個世界模型來從書面語言中提取意義。意義存在于詞語排列中的觀點在語言學(xué)中由來已久,但近幾十年來,它已基本過時。


布拉德利認為,她的工作“表明,即使是最基本的語法,也蘊含著有意義的信息,比如什么與什么相隨”,她說。

圖源:Monica Almeida/Quanta Magazine

但這項研究——以及最近LLM的成功——支持了這樣一種觀點,即詞匯組合使用的統(tǒng)計數(shù)據(jù)是有意義的。因此,它或許能促進語言學(xué)家們正在進行的更廣泛的討論。

在您最近的論文中,您還使用范疇論為語言研究帶來了全新的概念。

對。我們正在研究范疇的量級(magnitude)——一種與拓撲相關(guān)的大小度量,用來表征范疇。我的合著者胡安·帕布羅·維尼奧(Juan Pablo Vigneaux)最近找到了一種計算量級的新方法。所以我們決定在做了一些額外的工作之后,在語言構(gòu)成的范疇上嘗試一下。

令人驚訝的是,當(dāng)我們計算出這個范疇的量級公式時,我們最終得到了一個數(shù)學(xué)表達式,其中包含了信息論中的一個核心量:(Entropy)——衡量某物包含多少信息的量度。

這種聯(lián)系告訴了你什么?

它指出了熵和拓撲之間一種有趣的聯(lián)系。這兩者通常不會相互交流——它們在科學(xué)領(lǐng)域處于完全不同的兩端。但近年來,這種聯(lián)系開始顯現(xiàn),這或許是另一個例子。我對這種感覺不同的東西最終卻有著根本聯(lián)系的現(xiàn)象非常感興趣。

我們也會盯著答案,比如“哇,這是什么?”熵在語言語境中意味著什么?它能告訴我們什么?那么,計算量級是否可以用來比較不同語言的結(jié)構(gòu),例如,比較人類語言和LLM生成的語言?

這感覺就像是爬上了一架高高的梯子,才剛剛邁出第一層。還有很多事情要做。

您希望您的工作帶您走向何方?

我希望它能讓我們更深入地理解數(shù)學(xué)本身。

它可以讓我們了解語言現(xiàn)象,從而更好地理解周圍的世界。但真正有趣的是,它或許缺少一些數(shù)學(xué)概念,這就是為什么這種現(xiàn)象如此神秘且難以理解。

也許以這種方式研究語言能幫助我們發(fā)現(xiàn)一些我們尚未發(fā)現(xiàn)的新數(shù)學(xué)結(jié)構(gòu)。這種情況在數(shù)學(xué)中屢見不鮮。數(shù)學(xué)家們會遇到一些尚未命名的東西,這些結(jié)構(gòu)就在那里等著我們?nèi)グl(fā)現(xiàn)。

我認為五年后,我們可能會有受語言啟發(fā)的新數(shù)學(xué)思想。

參考資料

https://www.quantamagazine.org/where-does-meaning-live-in-a-sentence-math-might-tell-us-20250409/

科普薦書

【更多讀者好評數(shù)學(xué)書單推薦、數(shù)學(xué)科普作家自薦、出版社書單推薦通道已陸續(xù)打開,敬請期待】

·開放 · 友好 · 多元 · 普適 · 守拙·

讓數(shù)學(xué)

更加

易學(xué)易練

易教易研

易賞易玩

易見易得

易傳易及

歡迎評論、點贊、在看、在聽

收藏、分享、轉(zhuǎn)載、投稿

查看原始文章出處

點擊zzllrr小樂

公眾號主頁

加星

數(shù)學(xué)科普不迷路!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
宗馥莉辭職,背后的無奈和不甘

宗馥莉辭職,背后的無奈和不甘

木蹊說
2025-10-10 23:21:25
這種肉是老年人的“黃金肉”!不管有錢沒錢,每周吃兩回,強免疫

這種肉是老年人的“黃金肉”!不管有錢沒錢,每周吃兩回,強免疫

江江食研社
2025-10-10 14:30:03
馮小剛父女現(xiàn)身陳思誠工作室,徐朵凸嘴齙牙,比親女兒還像馮小剛

馮小剛父女現(xiàn)身陳思誠工作室,徐朵凸嘴齙牙,比親女兒還像馮小剛

鄭丁嘉話
2025-10-09 15:12:00
確認死亡!陜西新郎遺體被找到,身上穿喜服,女方:同意去看周某

確認死亡!陜西新郎遺體被找到,身上穿喜服,女方:同意去看周某

丁丁鯉史紀
2025-10-09 18:14:44
0-1爆冷不敵印度!僅過2天,中國隊從4-0到0-1,輸球原因解析!

0-1爆冷不敵印度!僅過2天,中國隊從4-0到0-1,輸球原因解析!

大秦壁虎白話體育
2025-10-10 22:40:26
南京燃氣閃爆再敲警鐘,1死2傷現(xiàn)場黑煙滾滾,網(wǎng)友爆料燃氣泄漏!

南京燃氣閃爆再敲警鐘,1死2傷現(xiàn)場黑煙滾滾,網(wǎng)友爆料燃氣泄漏!

眼光很亮
2025-10-10 21:15:34
西安大獎賽第4天:墨菲加里送蛋,丁俊暉火箭馬叔晉級,普倫勝出

西安大獎賽第4天:墨菲加里送蛋,丁俊暉火箭馬叔晉級,普倫勝出

世界多元
2025-10-11 06:17:42
就在今天!10月11日凌晨,女籃傳來李夢、韓旭、王思雨新消息!

就在今天!10月11日凌晨,女籃傳來李夢、韓旭、王思雨新消息!

皮皮觀天下
2025-10-11 05:26:53
力拓與必和必拓對人民幣結(jié)算的截然不同態(tài)度背后的股權(quán)戰(zhàn)爭分析。

力拓與必和必拓對人民幣結(jié)算的截然不同態(tài)度背后的股權(quán)戰(zhàn)爭分析。

丹徒生
2025-10-07 09:34:15
胡兵:我不允許自己有一天臉垮了,但跟朋友一起,我可以隨便亂吃

胡兵:我不允許自己有一天臉垮了,但跟朋友一起,我可以隨便亂吃

秀語千尋
2025-10-10 18:15:44
人社部公布重要數(shù)據(jù),2026養(yǎng)老金將大幅上漲?按工齡調(diào)整呼聲再起

人社部公布重要數(shù)據(jù),2026養(yǎng)老金將大幅上漲?按工齡調(diào)整呼聲再起

深析古今
2025-10-10 10:36:26
民政部部長:全國每天有300多萬老年人在老年就餐點就餐

民政部部長:全國每天有300多萬老年人在老年就餐點就餐

封面新聞
2025-10-10 11:26:01
成年后來自父母的恐懼你有嗎?網(wǎng)友:這是我見過禁錮欲最強的媽媽

成年后來自父母的恐懼你有嗎?網(wǎng)友:這是我見過禁錮欲最強的媽媽

解讀熱點事件
2025-09-25 12:41:25
寶馬一4S店閉店致超萬元“雙保無憂”無處承保,車主:寶馬方面協(xié)調(diào)未果

寶馬一4S店閉店致超萬元“雙保無憂”無處承保,車主:寶馬方面協(xié)調(diào)未果

澎湃新聞
2025-10-10 16:16:28
退休后的一個慘痛教訓(xùn)讓我明白:再有錢有閑,也不能經(jīng)常請客吃飯

退休后的一個慘痛教訓(xùn)讓我明白:再有錢有閑,也不能經(jīng)常請客吃飯

小馬達情感故事
2025-10-09 18:40:03
納斯達克中國金龍指數(shù)收跌6.1% 熱門中概股普跌

納斯達克中國金龍指數(shù)收跌6.1% 熱門中概股普跌

每日經(jīng)濟新聞
2025-10-11 06:16:04
郭汝瑰長期臥底國軍高層,貢獻極大,為何建國后卻沒有得到重用?

郭汝瑰長期臥底國軍高層,貢獻極大,為何建國后卻沒有得到重用?

云端書館
2025-08-24 08:24:02
95后“黑老大”被核準死刑,細節(jié)披露:17歲混社會、23歲建社團,涉強奸盜竊等九宗罪

95后“黑老大”被核準死刑,細節(jié)披露:17歲混社會、23歲建社團,涉強奸盜竊等九宗罪

每日經(jīng)濟新聞
2025-09-17 11:01:32
向災(zāi)區(qū)捐贈物資被收1180元過路費是否合理?胡雷婉拒當(dāng)?shù)馗刹繙愬X報銷,百色高速:如符合規(guī)定,可補辦手續(xù)退費

向災(zāi)區(qū)捐贈物資被收1180元過路費是否合理?胡雷婉拒當(dāng)?shù)馗刹繙愬X報銷,百色高速:如符合規(guī)定,可補辦手續(xù)退費

極目新聞
2025-10-10 12:40:20
國內(nèi)教授媒體抨擊諾貝爾獎已是家常便飯,引起無數(shù)網(wǎng)友聲討不斷!

國內(nèi)教授媒體抨擊諾貝爾獎已是家常便飯,引起無數(shù)網(wǎng)友聲討不斷!

眼光很亮
2025-10-10 19:41:34
2025-10-11 07:39:00
小樂數(shù)學(xué)科普 incentive-icons
小樂數(shù)學(xué)科普
zzllrr小樂,小樂數(shù)學(xué)科普,讓前沿數(shù)學(xué)流行起來~
162文章數(shù) 6關(guān)注度
往期回顧 全部

教育要聞

小學(xué)三年級競選班長,132萬人投票,李浩竟然得票129萬張,太牛了

頭條要聞

環(huán)球:賴清德“雙十”講話一頓吹噓 當(dāng)場被韓國瑜打臉

頭條要聞

環(huán)球:賴清德“雙十”講話一頓吹噓 當(dāng)場被韓國瑜打臉

體育要聞

NBA中國賽-曾凡博0分3犯規(guī) 籃網(wǎng)加時惜敗太陽

娛樂要聞

《宴遇永安》下飯

財經(jīng)要聞

宗馥莉已經(jīng)辭職

科技要聞

這次,張一鳴為何親自站臺?

汽車要聞

小車·大情緒:雷諾Twingo E-Tech的法式新美學(xué)

態(tài)度原創(chuàng)

本地
時尚
旅游
手機
健康

本地新聞

“閩東利劍·惠民安商”首期緝車聯(lián)動執(zhí)行

從穿搭到生活,秋天適合“慢”下來

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

手機要聞

小米17 Ultra影像全揭秘:1英寸主攝+2億潛望鏡,或開啟新時代

內(nèi)分泌科專家破解身高八大謠言

無障礙瀏覽 進入關(guān)懷版 人人干人人泡| 国产色悠悠视频在线观看| 欧美老熟妇BBxxxxx| 婷婷久久两性网| 精品亚洲中文字幕免费播放| 国产成人无码A区在线| 亚洲乱码卡一卡二卡新区乱码| 亚洲AV成人无码电影| 国精品久久久久久久久久久58| 国产成熟妇女性视频电影| 樱花草在线播放免费大学生| 久久精品国产亚洲av麻| 优优人体大尺大尺无毒不卡| 欧美14一15sex性hd| 六月丁香五月婷婷| 肉色欧美久久久久久久免费看| 大香免费视频| 亚洲中文字幕在线精品一区| 在线成人少妇av| 亚洲日本一本dvd高清| AV成人亚洲综合| 香蕉在线精品一区二区| 和黑人邻居中文字幕在线| XXXX日本少妇| 女人与牲口性恔配视频免费| 嗯啊我阴部被插的好爽视频| 午夜伊人影院| 山东48老妇冒白浆| 日本久久99成人网站| www.久久| 狠狠色噜噜狠狠狠7777奇米| 波多野结衣被躁120次| 亚洲一区二区三区日本久久九| 久久久久久欧美精品se一二三四| 欧美日韩国产一区二区三区不卡| 色综合天天综合欧美综合| 男女性色大片免费网站| 人人操人人干超碰| 精品无人乱码高清在线观看| 成人免费视频视频在线观看 免费| 国产亚洲熟女视频|