夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

LLM首次達(dá)到人類語(yǔ)言專家水平!OpenAI o1拿下拆解句法、識(shí)別歧義、推理音律

0
分享至


新智元報(bào)道

編輯:peter東

【新智元導(dǎo)讀】LLM再下一城!伯克利研究證明:OpenAI的o1被證明也具有匹敵人類語(yǔ)言學(xué)家的元分析能力。

在人類諸多才能之中,哪些才是人類所獨(dú)有的?

自古希臘哲人亞里士多德以來,語(yǔ)言便被視為最能彰顯人之本性的標(biāo)志。他曾言:人類乃「具有語(yǔ)言的動(dòng)物」。


即使當(dāng)今的大語(yǔ)言模型如ChatGPT已能在表層上模擬人類的日常言談,學(xué)者們依然追問:

在人類語(yǔ)言的深處,是否蘊(yùn)藏著某些獨(dú)特的結(jié)構(gòu)與特質(zhì),是任何其他生物的溝通方式,乃至AI的運(yùn)算體系,皆無法真正企及的?

加州大學(xué)伯克利分校語(yǔ)言學(xué)家、羅格斯大學(xué)的攜手,讓多個(gè)大語(yǔ)言模型經(jīng)受一系列語(yǔ)言學(xué)測(cè)試——其中包括要求模型歸納虛構(gòu)語(yǔ)言的規(guī)則。

雖然大多數(shù)大語(yǔ)言模型未能像人類那樣解析語(yǔ)言學(xué)規(guī)則,但有一個(gè)模型展現(xiàn)出遠(yuǎn)超預(yù)期的驚人能力。它能像語(yǔ)言學(xué)研究生那樣分析語(yǔ)言——?jiǎng)澐志渥映煞帧⒔馕龆嘀仄缌x,并能運(yùn)用遞歸等復(fù)雜語(yǔ)言學(xué)特征。

研究者Ga?per Begu?表示,這一發(fā)現(xiàn)「挑戰(zhàn)了我們對(duì)人工智能能力的認(rèn)知」。


AI會(huì)說話不稀奇,會(huì)解釋才稀奇——

如果語(yǔ)言是讓我們成為人類的關(guān)鍵,那么如今大語(yǔ)言模型獲得了「元語(yǔ)言」能力,這又意味著什么呢?

LLM構(gòu)建無窮遞歸

想象一下:你在搭一座一層套一層、像俄羅斯套娃一樣的「句子塔」。


每套進(jìn)一層,理解難度就指數(shù)級(jí)上升。

這種結(jié)構(gòu),在語(yǔ)言學(xué)里叫「中心嵌入」(center embedding),曾被知名語(yǔ)言學(xué)家喬姆斯基稱為能定義人類語(yǔ)言與思維的決定性特征。

比如這句話:

The worldview that the prose Nietzsche wrote expressed was unprecedented.

(大意為:尼采所寫的那篇散文所表達(dá)的世界觀是前所未有的。)

表面上看平平無奇,但如果你拆開它的「語(yǔ)言洋蔥」:

最外層:The worldview [...] was unprecedented(這個(gè)「世界觀」前所未有);

套進(jìn)去一層:that the prose [...] expressed(是「那篇散文所表達(dá)的」);

再往里一層:Nietzsche wrote(而這篇散文是「尼采寫的」)。

這就像在一個(gè)句子中間,又塞進(jìn)一個(gè)完整的句子,再在那個(gè)句子里塞進(jìn)另一個(gè)句子——三層套娃,層層遞歸。

人類能理解這樣的句子,但之前,人們認(rèn)為這樣的能力大模型不具備。

上述句子在真實(shí)對(duì)話中幾乎從未出現(xiàn)過——因?yàn)榇蠹視?huì)覺得它「太繞了!」

所以,任何語(yǔ)言模型如果只是靠「背書」,根本不可能見過,自然也無法識(shí)別出這種例子。

語(yǔ)言學(xué)家們認(rèn)為,人類語(yǔ)言從有限詞匯和有限規(guī)則中生成無限可能句子,這種能力歸因于無限遞歸。

迄今為止,還沒有令人信服的證據(jù)表明其他動(dòng)物能夠以復(fù)雜的方式使用遞歸。


圖1:不同大模型識(shí)別多重遞歸,繪制正確語(yǔ)法樹的比例

然而,該研究指出在眾多大模型中,唯有OpenAI o1模型不僅看懂包含多重遞歸的句子(圖1)。

o1不僅能如同語(yǔ)言學(xué)家那樣,以接近100%的正確率畫出正確的樹狀結(jié)構(gòu),還能將本就復(fù)雜的句子變得更多一層。


圖2:該句子對(duì)應(yīng)的正確語(yǔ)法樹

當(dāng)它被問:「能不能再加一層遞歸?」o1回復(fù):

The worldview that the prose that the philosopher Nietzsche admired wrote expressed was unprecedented.

「那位尼采所敬仰的哲學(xué)家所撰寫的散文所表達(dá)的世界觀是前所未有的?!?/p>

這說明o1不僅能夠使用語(yǔ)言,還能夠思考語(yǔ)言,具備語(yǔ)言能力(metalinguistic capacity )。

由于語(yǔ)言模型只是在預(yù)測(cè)句子中的下一個(gè)單詞,人對(duì)語(yǔ)言的深層理解在質(zhì)上有所不同。因此,一些語(yǔ)言學(xué)家表示,大模型實(shí)際上并沒有在處理語(yǔ)言。

這項(xiàng)研究的結(jié)論看起來是對(duì)上述觀點(diǎn)的否定


大模型能區(qū)分歧義

也能深入理解句子

想象一下,你聽到下面的話:「Eliza wanted her cast out.」

乍一聽,好像就是「Eliza想把她的cast趕出去」?

但「cast」這個(gè)詞既可以是動(dòng)詞(「驅(qū)逐」),也可以是名詞(「石膏」)!

于是這句話就有兩種不同的含義,分別是

Eliza想要她的石膏被拿出去,

Eliza想把她趕出去。

這樣識(shí)別包含多義性句子的能力,之前同樣被認(rèn)為大模型不具備。

人類擁有很多常識(shí)知識(shí),使我們能夠排除歧義。但大模型很難具有這樣的常識(shí)知識(shí)水平。

然而該研究表明,o1可正確識(shí)別兩種結(jié)構(gòu),并為每種生成了符合語(yǔ)言學(xué)規(guī)劃的句法樹。其他模型(如 GPT-4、Llama 3.1)只會(huì)生成不合語(yǔ)法的結(jié)構(gòu),還會(huì)對(duì)語(yǔ)義產(chǎn)生誤解。

該研究還考察了大模型在音韻學(xué)相關(guān)任務(wù)上的表現(xiàn)——

音韻學(xué)是研究聲音模式以及最小的聲音單位,即音素的組織方式。

例如,在英語(yǔ)中,給以「g」結(jié)尾的詞加上「s」會(huì)發(fā)出「z」的音,就像「dogs」一樣。但給以「t」結(jié)尾的詞加上「s」聽起來更像標(biāo)準(zhǔn)的「s」音,就像「cats」一樣。

該研究一口氣創(chuàng)建了30種新的迷你語(yǔ)言,以了解大模型是否能夠在面對(duì)新生成的虛擬語(yǔ)言時(shí),在沒有任何先驗(yàn)知識(shí)的情況下能不能正確推斷語(yǔ)音規(guī)則。

結(jié)果出人意料,即使是在這些虛構(gòu)的語(yǔ)言上,o1在音韻相關(guān)的任務(wù)上表現(xiàn)依舊出色。


大模型比人類更好地理解語(yǔ)言嗎?

從上述三個(gè)例子可以看出,曾經(jīng)那些被認(rèn)為僅僅人類能夠擁有的語(yǔ)言理解能力,大模型如今也具備了。

2023 年著名語(yǔ)言學(xué)家喬姆斯基在《紐約時(shí)報(bào)》上寫道:「語(yǔ)言的正確解釋很復(fù)雜,不能僅僅通過浸泡在大數(shù)據(jù)中就能學(xué)會(huì)。」


該文認(rèn)為盡管 AI 模型在運(yùn)用語(yǔ)言方面可能很擅長(zhǎng),但它們并不具備以復(fù)雜方式分析語(yǔ)言的能力。

在此思潮影響下,即使ChatGPT在各方面上復(fù)制了自然語(yǔ)言,公眾仍想知道大模型是否有人類語(yǔ)言的特定特征能不能由大模型復(fù)現(xiàn)。

這當(dāng)然很有必要,隨著社會(huì)越來越依賴大模型,了解它在哪些方面能成功以及哪些方面會(huì)失敗變得越來越重要。

語(yǔ)言分析是評(píng)估語(yǔ)言模型推理能力與人類相似程度的理想測(cè)試平臺(tái)


而o1能夠以與語(yǔ)言學(xué)家相似的方式分析語(yǔ)言,例如繪制句子圖、解決多個(gè)歧義含義,并利用遞歸等復(fù)雜的語(yǔ)言特征

但我們發(fā)現(xiàn)這一現(xiàn)象后,人們不禁會(huì)問下面兩個(gè)問題:

第一個(gè)問題是為何只有o1可行,其它大模型表現(xiàn)都差一大截。

回答是相比其它模型,o1 的優(yōu)勢(shì)很可能源于思維鏈(類似Deepseek的深度思考),使其能像人類語(yǔ)言學(xué)家一樣逐步推理、驗(yàn)證假設(shè)、構(gòu)建抽象規(guī)則。

第二個(gè)問題是當(dāng)模型的性能隨著規(guī)模變大而變大時(shí),大模型是否有一天會(huì)比我們更能準(zhǔn)確的理解語(yǔ)言嗎?

對(duì)于這個(gè)問題的回答,目前還沒有定論。

一方面,任何的大模型在語(yǔ)言學(xué)上還沒有提出過原創(chuàng)性的觀點(diǎn),也沒有教給我們關(guān)于語(yǔ)言的新知識(shí)。

另一方面,增加計(jì)算能力和訓(xùn)練數(shù)據(jù),語(yǔ)言模型最終會(huì)在語(yǔ)言技能上超越我們,看不出有什么理由阻止語(yǔ)言模型展現(xiàn)出比我們更好的語(yǔ)言理解能力。

研究尚不足以宣稱「機(jī)器理解語(yǔ)言勝于人類」,但足以改變?cè)u(píng)價(jià)口徑:對(duì)模型的考察,應(yīng)從「任務(wù)產(chǎn)出」轉(zhuǎn)向「結(jié)構(gòu)解釋」。

當(dāng)可解釋性成為首要指標(biāo),AI研究、教育與應(yīng)用治理將迎來同一套標(biāo)準(zhǔn)——把「為什么對(duì)」放在「對(duì)不對(duì)」之前。

參考資料:

https://ieeexplore.ieee.org/document/11022724

https://www.quantamagazine.org/in-a-first-ai-models-analyze-language-as-well-as-a-human-expert-20251031/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
真相炸裂,吳石夫人王碧奎家族齊發(fā)聲,三面橫幅揭開塵封百年身世

真相炸裂,吳石夫人王碧奎家族齊發(fā)聲,三面橫幅揭開塵封百年身世

大國(guó)紀(jì)錄
2025-11-07 15:34:14
樂天主義齊沃:幫勞塔羅找回快樂,讓國(guó)米享受榜首

樂天主義齊沃:幫勞塔羅找回快樂,讓國(guó)米享受榜首

體壇周報(bào)
2025-11-10 09:26:12
喉嚨痛、鼻子堵……甲型H3N2來襲!醫(yī)生緊急提醒

喉嚨痛、鼻子堵……甲型H3N2來襲!醫(yī)生緊急提醒

環(huán)球網(wǎng)資訊
2025-11-09 09:48:10
燃?xì)庠钪掳∷固垢Q芯浚涸诩易鲆活D飯,等于吸20分鐘汽車尾氣

燃?xì)庠钪掳∷固垢Q芯浚涸诩易鲆活D飯,等于吸20分鐘汽車尾氣

39健康網(wǎng)
2025-10-14 20:40:55
奮斗的高光回響:哈工大招聘會(huì),來的都是航天科工等國(guó)之重器企業(yè)

奮斗的高光回響:哈工大招聘會(huì),來的都是航天科工等國(guó)之重器企業(yè)

蝴蝶花雨話教育
2025-11-10 09:45:03
趣聊兩漢:東漢真和西漢是一個(gè)“漢”嗎?

趣聊兩漢:東漢真和西漢是一個(gè)“漢”嗎?

貪吃的駱駝
2025-11-10 06:34:06
副院長(zhǎng)視頻后續(xù):眼科女主任很愛干凈,沙發(fā)上鋪了兩張無菌床單

副院長(zhǎng)視頻后續(xù):眼科女主任很愛干凈,沙發(fā)上鋪了兩張無菌床單

鋭娛之樂
2025-11-07 15:50:06
國(guó)際奧委會(huì)主席范爾霍恩嘆氣:我想念2008,那屆把標(biāo)尺拉得太高。

國(guó)際奧委會(huì)主席范爾霍恩嘆氣:我想念2008,那屆把標(biāo)尺拉得太高。

荊楚寰宇文樞
2025-09-22 20:26:33
白百何工作室放聊天記錄了!錘了劇組沒撒謊,東京之前就有矛盾

白百何工作室放聊天記錄了!錘了劇組沒撒謊,東京之前就有矛盾

心靜物娛
2025-11-10 09:21:05
驚艷全球!新機(jī)曝光:10000mAh+驍龍8 Gen5+2億潛望長(zhǎng)焦!

驚艷全球!新機(jī)曝光:10000mAh+驍龍8 Gen5+2億潛望長(zhǎng)焦!

科技堡壘
2025-11-09 11:58:07
美國(guó)會(huì)參議院就結(jié)束政府“停擺”達(dá)成一致

美國(guó)會(huì)參議院就結(jié)束政府“停擺”達(dá)成一致

極目新聞
2025-11-10 09:36:23
兒子談婚這天,女方帶10人提8個(gè)要求,我回5句話,她當(dāng)場(chǎng)摔杯

兒子談婚這天,女方帶10人提8個(gè)要求,我回5句話,她當(dāng)場(chǎng)摔杯

懸案解密檔案
2025-11-06 10:21:50
國(guó)家出手!李梓萌騙人真相大白,幕后黑手被揪,受害者不止一人

國(guó)家出手!李梓萌騙人真相大白,幕后黑手被揪,受害者不止一人

許穋很機(jī)智
2025-10-19 13:34:42
扎心了,11 億網(wǎng)民中 7.3 億人僅為初中及以下學(xué)歷

扎心了,11 億網(wǎng)民中 7.3 億人僅為初中及以下學(xué)歷

小院之觀
2025-11-02 16:53:51
諾里斯又贏了!維斯塔潘維修區(qū)起步第三帶回!而法拉利……

諾里斯又贏了!維斯塔潘維修區(qū)起步第三帶回!而法拉利……

五星體育
2025-11-10 03:02:35
遼寧體育代表團(tuán)亮相,旗手是她!

遼寧體育代表團(tuán)亮相,旗手是她!

沈陽(yáng)公交網(wǎng)小林
2025-11-10 00:10:32
61歲關(guān)詠荷近照曝光:蘋果肌飽滿,臉上幾乎沒什么皺紋,氣質(zhì)炸裂

61歲關(guān)詠荷近照曝光:蘋果肌飽滿,臉上幾乎沒什么皺紋,氣質(zhì)炸裂

小徐講八卦
2025-11-10 07:12:03
湖南人民醫(yī)院事件新進(jìn)展,祖某某原配亮相,涉事人物又有新證據(jù)

湖南人民醫(yī)院事件新進(jìn)展,祖某某原配亮相,涉事人物又有新證據(jù)

平老師666
2025-11-09 15:34:26
茅臺(tái)跌慘了,以前搶都搶不到,現(xiàn)在黃牛追著問你要不要了

茅臺(tái)跌慘了,以前搶都搶不到,現(xiàn)在黃牛追著問你要不要了

流蘇晚晴
2025-11-09 21:01:52
知恩圖報(bào)!王曼昱送啟蒙教練SUV豪車,給他掛奧運(yùn)金牌塞10萬塊報(bào)答

知恩圖報(bào)!王曼昱送啟蒙教練SUV豪車,給他掛奧運(yùn)金牌塞10萬塊報(bào)答

818體育
2025-11-09 11:38:01
2025-11-10 10:47:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
13828文章數(shù) 66240關(guān)注度
往期回顧 全部

科技要聞

存儲(chǔ)芯片大廠漲價(jià)50%!華強(qiáng)北一天一個(gè)價(jià)

頭條要聞

媒體:高市早苗瘋言臺(tái)灣問題 中方對(duì)她沒什么好客氣的

頭條要聞

媒體:高市早苗瘋言臺(tái)灣問題 中方對(duì)她沒什么好客氣的

體育要聞

他只想默默地拿走最后一億美元

娛樂要聞

郝蕾風(fēng)波升級(jí)?

財(cái)經(jīng)要聞

俄羅斯大幅加稅 中國(guó)汽車出口驟降58%

汽車要聞

純電續(xù)航325km 小鵬P7+增程版申報(bào)信息曝光

態(tài)度原創(chuàng)

游戲
教育
健康
親子
公開課

下一代Steam手柄長(zhǎng)這樣?渲染圖展示雙觸控板設(shè)計(jì)

教育要聞

奮斗的高光回響:哈工大招聘會(huì),來的都是航天科工等國(guó)之重器企業(yè)

超聲探頭會(huì)加重受傷情況嗎?

親子要聞

心理咨詢室里的沉默:面對(duì)家長(zhǎng),孩子為何壓抑

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 狠狠狠狠狠狠天天爱| 国产白浆内射 | 日韩无码人妻视频| 国产原创va| 噜死你资源网站| 蜜臀午夜Av一区二区三区| 熟女白浆视频| 亚洲中文一区二区av| 变态另类av天堂| 五月丁香色综合久久久| 少妇久久久久久被弄到高潮| 鲁丝一区二区三区免费| 亚洲男人的天堂av手机在线观看| 中文字幕一区二区三区免费| av在线亚洲欧洲日产一区二区| 人人妻人人爽人人做夜欢视频九色| 国产精品乱码久久久久软件| 成人无码午夜在线观看| 黑人巨茎精品欧美一区二区| 亚洲另类成人小说| 暴力调教一区二区三区| 久久棈精品久久久久久噜噜| 亚洲 素人 字幕 在线 最新 | 亚洲欧美情涩| 久久国产精品二国产精品| 国产成人一区二区三区影院免费| 蜜芽AV人妻久久无码精品| 中国丰满女人高潮| 国产一级粉嫩XXXX| 成人av亚洲男人色丁香| 色一情一乱一伦麻豆| 精品日韩人妻中文字幕| 免费 无码 无套内谢| 日本a级片在线播放| 九九久久成人电影| 亚洲AV无码乱码国产二区| 99RE8这里有精品热视频| 亚洲日韩乱码一区二区三区四区| 亚洲韩国在线免费视频| 国产精品自拍午夜福利| 操b黄色av|