諾獎得主、美國科學(xué)家理查德·阿克塞爾(Richard Axel)曾表示,當(dāng)前人們依舊不清楚神經(jīng)活動轉(zhuǎn)化為思維和行動的背后邏輯。他認(rèn)為,洞察這一邏輯是神經(jīng)科學(xué)未來最重要的發(fā)展方向。
語言、推理和規(guī)劃等認(rèn)知現(xiàn)象是神經(jīng)元和突觸活動的直接產(chǎn)物,但是目前尚無一個可以統(tǒng)領(lǐng)全局的理論來解釋這一過程的實現(xiàn)機(jī)制。阿克塞爾使用“邏輯”一詞似乎是在表示人們應(yīng)當(dāng)從日益增長的神經(jīng)科學(xué)知識中,找出足以支撐大腦功能實現(xiàn)的基本元素。
近日,美國哥倫比亞大學(xué)博士畢業(yè)生、目前在美國麻省理工學(xué)院從事博士后研究的丹尼爾·米特羅波爾斯基(Daniel Mitropolsky)打造了一款名為 NEMO 的極簡大腦神經(jīng)模型。其表示,這是首個具有生物合理性的語言學(xué)習(xí)系統(tǒng)。該系統(tǒng)能通過接觸少量與現(xiàn)實情境相關(guān)聯(lián)的句子,在不限語言的前提下習(xí)得自然語言的基本要素,包括詞匯、基礎(chǔ)句法及語義知識。
(來源:https://dmitropolsky.github.io/)
同時,本次系統(tǒng)可被擴(kuò)展至多語言處理:只需新增一個功能區(qū)域,就能為用戶所掌握的語言配置專屬處理組件。研究人員相信這套語言習(xí)得系統(tǒng)之所以具有生物學(xué)合理性,不僅是因為其嚴(yán)格地遵循著 NEMO 框架,更是因為它的白板式大腦架構(gòu)所包括的功能分區(qū)和連接纖維,完全可能通過哺乳動物的發(fā)育過程來實現(xiàn)自然形成。
NEMO:基于神經(jīng)科學(xué)的六個原則打造而來
據(jù)介紹,NEMO 基于神經(jīng)科學(xué)中六個基礎(chǔ)且無爭議的原則構(gòu)建了一個簡單數(shù)學(xué)表述,它們分別是:興奮性神經(jīng)元、大腦區(qū)域、隨機(jī)突觸連接、每個區(qū)域內(nèi)的局部抑制、赫布可塑性和區(qū)域間抑制。NEMO 模型能以極高的效率進(jìn)行模擬,其模擬規(guī)??蛇_(dá)數(shù)千萬個神經(jīng)元和數(shù)萬億個突觸。
研究人員通過實驗發(fā)現(xiàn) NEMO 符合阿克塞爾所說的那種抽象理論,并且能夠完成自然語言習(xí)得的這一動物大腦最為明顯的功能之一。與此同時,數(shù)學(xué)證明以及相關(guān)模擬也都證明,該模型能夠通過神經(jīng)集合的形成與操控來執(zhí)行基本計算,并能完成多種認(rèn)知類任務(wù)比如解析自然語言句子等任務(wù)。然而,NEMO 能夠這樣運(yùn)行前提是:語言中的詞匯已經(jīng)由神經(jīng)集群進(jìn)行了表征,并且其突觸連接已經(jīng)編碼了各個單詞的語法角色。
(來源:https://arxiv.org/pdf/2507.11788)
如前所述,研究人員通過實驗證明一個處于白板狀態(tài)的 NEMO 系統(tǒng)能以一種類似于人類語言習(xí)得的方式來學(xué)習(xí)一門語言的詞匯、句法和語義。具體而言,其通過接觸那些有著具體依據(jù)的語言學(xué)會了以下四種本領(lǐng):第一,學(xué)會了具體名詞和動詞的語義表征;第二,學(xué)會了基本的句法特征,例如每個詞的詞性;第三,學(xué)會了多種語氣之下的語言詞序;第四,學(xué)會了生成新句子。
當(dāng)然,語言習(xí)得的內(nèi)涵遠(yuǎn)不止于此。完整的語言習(xí)得描述必須涵蓋以下方面:
- 學(xué)會語音與音素習(xí)得(比如發(fā)音方式、音位對比);
- 學(xué)會詞性分類(能夠掌握除了名詞、動詞外的其他詞類,比如形容詞、副詞和介詞等);
- 功能詞(比如冠詞“the”、連詞“and”等);
- 抽象詞匯(比如“l(fā)ove”“freedom”等表示情感或概念的詞匯);
- 句法結(jié)構(gòu)(能夠掌握超越基礎(chǔ)詞序的復(fù)雜句型,比如從句和倒裝句等)。
在嬰兒的大腦中,上述學(xué)習(xí)都會以微妙的方式交織在一起。然而,鑒于本次研究的目標(biāo)是在嚴(yán)格控制的實驗中,驗證 NEMO 系統(tǒng)是否具備基礎(chǔ)的語言習(xí)得能力,因此他們將重點放在完成統(tǒng)計學(xué)習(xí)任務(wù)上,并分為兩個階段進(jìn)行:首先讓其學(xué)習(xí)詞義與詞性,然后讓其學(xué)習(xí)詞序規(guī)則并產(chǎn)生句子生成能力。
而在語音和語音學(xué)方面,研究人員通過采用“輸入 - 輸出約定”來繞過了如下階段:即向系統(tǒng)呈現(xiàn)一個句子時,系統(tǒng)會將其轉(zhuǎn)化為與詞語符號對應(yīng)的刺激序列,而生成句子時也是如此。
實驗中,系統(tǒng)會接觸到有依據(jù)的、由自然語言呈現(xiàn)的、與具體情境相關(guān)聯(lián)的完整句子?!坝幸罁?jù)”的意思是,每個句子在呈現(xiàn)時,與該句子相對應(yīng)的表征在感覺皮層和運(yùn)動皮層中都處于激活狀態(tài)。也就是說,當(dāng)輸入句子“狗在跑”時,研究人員假設(shè)運(yùn)動前皮層中與“跑”相關(guān)的鏡像細(xì)胞以及下顳葉視覺皮層中通用的狗的表征都處于激活狀態(tài)。
(來源:https://arxiv.org/pdf/2507.11788)
此前有研究表明,在之前另外一種符合生物學(xué)現(xiàn)實的大腦模型中,名詞、動詞及其含義可以通過有實際依據(jù)的呈現(xiàn)方式來習(xí)得。然而,那項研究僅僅涉及到學(xué)習(xí)孤立單詞這種比較簡單的任務(wù),并沒有涉及到句法和上下文。眾所周知,非人類靈長類動物也可以達(dá)到這種語言水平。而在本次研究之中,研究人員攻克了一個更加具有挑戰(zhàn)性的難題——即通過接觸有依據(jù)的完整句子,讓系統(tǒng)能夠習(xí)得詞匯語義、動名詞語法區(qū)分以及詞序規(guī)則。
需要說明的是,這一能力目前仍然是人類所獨(dú)有的認(rèn)知特征。因此,研究人員認(rèn)為他們構(gòu)建出了首個在生物學(xué)上具有合理性、且能進(jìn)行基本語言習(xí)得的人工模型。倘若未來人們能在非人類動物身上發(fā)現(xiàn)此類語言能力,那么研究人員相信這一發(fā)現(xiàn)將從根本上改變當(dāng)前關(guān)于語言排他性的普遍觀點。
語言的生物學(xué)基礎(chǔ)是什么?
除了回應(yīng)前文提及的阿克塞爾所說的“邏輯”之外,本次研究還涉及到另一個長期存在的根本性問題:即語言的生物學(xué)基礎(chǔ)是什么?
具體而言,語言是否是人類在基因、分子或神經(jīng)層面所擁有的獨(dú)特特征的產(chǎn)物?事實上,這些特征包括科學(xué)家于此前發(fā)現(xiàn)的、一度被稱為“語言基因”FOXP2 基因,以及科學(xué)家最近在人類第 2-3 層神經(jīng)元中發(fā)現(xiàn)的新型樹突電位,這些發(fā)現(xiàn)引發(fā)了人們對于人類語言能力生物學(xué)根源的猜測。而本次研究所提出的生物合理性語言習(xí)得系統(tǒng),可被視為是另一種替代性零假設(shè)的實證:即基于簡單且廣受認(rèn)可的神經(jīng)科學(xué)要素與原理,語言系統(tǒng)完全能在哺乳動物大腦的基礎(chǔ)上構(gòu)建而來。
研究人員指出,他們所提出的特定神經(jīng)架構(gòu)和算法,可被視為是一個關(guān)于人類語言系統(tǒng)的全面的、且符合神經(jīng)生物學(xué)可行性的假設(shè),而在這一領(lǐng)域此前鮮有如此具體的模型。研究人員表示,本次模型所涉及的腦區(qū)(包括其數(shù)量、功能及突觸連接方式),與現(xiàn)有神經(jīng)解剖學(xué)和心理語言學(xué)的證據(jù)及觀點是互相兼容的,并在已經(jīng)具備學(xué)界共識的領(lǐng)域體現(xiàn)了這種一致性。與此同時,此次提出的人工語言系統(tǒng)能夠預(yù)測這些腦區(qū)在語言理解與生成過程中的激活模式,因此這一特性或?qū)樯窠?jīng)語言學(xué)研究提供重要參考。
相比目前已經(jīng)得到廣泛使用且具備語言能力的另一類計算系統(tǒng)——大模型,本次系統(tǒng)有一個重要區(qū)別:即具備生物學(xué)上的合理性。尤其是它并不依賴反向傳播這一當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域中最為關(guān)鍵的機(jī)制,而且這種機(jī)制此前在動物大腦中從未被觀察到。
(來源:https://arxiv.org/pdf/2507.11788)
助力人類語言系統(tǒng)的進(jìn)一步研究
當(dāng)然,本次系統(tǒng)并未涵蓋語言的所有方面,比如語音和音系的學(xué)習(xí)被加以略過,形容詞、副詞以及功能范疇也未被納入考量。研究人員認(rèn)為,通過針對現(xiàn)有系統(tǒng)進(jìn)行簡單擴(kuò)展,便可涵蓋許多未被涉及的方面。
研究人員表示,抽象詞匯是下一步研究的關(guān)鍵目標(biāo),這需要建立相應(yīng)的表征框架,并引入新的語義處理腦區(qū)。目前,已有許多關(guān)于人類大腦如何處理抽象詞匯的認(rèn)知語言學(xué)理論,這些理論可被用于指導(dǎo)這一領(lǐng)域的新研究。語言能力的其他復(fù)雜方面比如歧義消解、語法性判斷、隱喻理解及下一詞預(yù)測等,都是極具研究價值的進(jìn)階挑戰(zhàn)。盡管其中部分任務(wù)可能需要針對 NEMO 模型進(jìn)行一些符合生物機(jī)理的擴(kuò)展,但是研究人員堅信這些挑戰(zhàn)均能在現(xiàn)有框架之下得到解決。
未來,研究人員的更多探索目標(biāo)包括:掌握語言的社會化使用,探索語言與社會認(rèn)知要素的交互機(jī)制,預(yù)計這些研究需要建立新型的表征系統(tǒng)與處理機(jī)制。此外,研究人員認(rèn)為很有必要探索 NEMO 模型與大模型之間的交互,這有助于 NEMO 模型在這些更具挑戰(zhàn)性的方向上發(fā)展。除了語言能力外,各類推理形式比如邏輯推理、啟發(fā)式推理、范疇推理、概率推理等,都將成為 NEMO 體系面臨的重要進(jìn)階挑戰(zhàn)。
盡管未來存在諸多研究方向,且依然存在一些局限性,但是研究人員此次提出的基于 NEMO 的基礎(chǔ)語言習(xí)得人工系統(tǒng)是同類系統(tǒng)中的第一個,除了能夠起到概念驗證的價值之外,該系統(tǒng)或許還能為神經(jīng)語言學(xué)研究提供幫助。由于其設(shè)計原理能在很大程度上反映當(dāng)前神經(jīng)語言學(xué)的思想,因此通過生成可驗證的預(yù)測和部署更高級的版本,或?qū)⒂兄谥笇?dǎo)對于人類語言系統(tǒng)的進(jìn)一步研究。
參考資料:
https://arxiv.org/pdf/2507.11788
https://www.engineering.columbia.edu/faculty-staff/directory/christos-papadimitriou
https://dmitropolsky.github.io/
運(yùn)營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.