網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

AI「解碼」古羅馬，重現(xiàn)千年銘文真相！DeepMind新模型再登Nature

2025-08-09 14:05:52　來源: 新智元

北京舉報

分享至

新智元報道

編輯：peter東英智

【新智元導(dǎo)讀】愛在西元前的歌詞里唱到：「當(dāng)古文明只剩下難解的語言，傳說就成了永垂不朽的詩篇?！谷缃窠柚鶧eepMind推出的生成式AI工具Aeneas，考古學(xué)家面對古代碑文不再抓瞎了。

Aeneas原本是古希臘神話中流浪英雄。

出現(xiàn)在7月24日Nature主刊的Aeneas則是一個多模態(tài)生成式神經(jīng)網(wǎng)絡(luò)，它能幫助歷史學(xué)家更好地解讀、歸屬和修復(fù)殘缺文本。

想象考古學(xué)家在歐洲發(fā)現(xiàn)了一塊刻有古代文字的銘文，文本殘缺不全、部分文字被風(fēng)化或被故意破壞。

也沒有語境信息，這使得恢復(fù)、確定年代和定位這塊銘文的出處變得幾乎是不可能的，尤其是在比較相似的銘文時。

考慮到在羅馬世界，文字無處不在——從帝國紀念碑到日常用品，無不刻有文字。從政治涂鴉、愛情詩篇和墓志銘，到商業(yè)交易、生日邀請和魔法咒語。

圖1 由Aeneas修復(fù)的，公元113/14年來自薩丁島的青銅軍事命令，由皇帝Trajan授予一艘戰(zhàn)船上的水手

這些銘文為現(xiàn)代歷史學(xué)家提供了豐富的見解，揭示了羅馬世界日常生活的多樣性。

但也增加了考古工作的難度，考古學(xué)家需要依賴其專業(yè)知識檢索自身積累的數(shù)據(jù)庫，方可識別相似文本——這些文本在措辭、句法、標(biāo)準(zhǔn)化公式或來源方面具有相似性。

然而檢索相似的信息，為文章確定上下文，不就是生成模型適合的活嗎？

于是Aeneas出現(xiàn)了，它能夠跨越數(shù)千份拉丁銘文進行推理，在幾秒鐘內(nèi)檢索出文本和語境相似文本，這樣的加速度，讓考古學(xué)家從檢索文本這項復(fù)雜且耗時的工作中解脫出來。

如今他們能快速地拿到對古代銘文的解釋，并基于模型的發(fā)現(xiàn)進行進一步研究。

圖2 Aeneas的使用界面

Aeneas的豐富功能

在Aeneas出現(xiàn)之前，2022年Deepmind推出了Ithaca，這是一個基于深度神經(jīng)網(wǎng)絡(luò)預(yù)測古希臘銘文年代，并補全缺失文本的工具。

Aeneas則更進一步，它能幫助歷史學(xué)家解讀文本，通過提供上下文，賦予孤立片段意義，從而得出更豐富的結(jié)論，并整合對古代歷史的更好理解。

具體來看，它在龐大的拉丁銘文集合中搜索平行文本。通過將每個文本轉(zhuǎn)化為一種歷史指紋，Aeneas可識別出文本間的深層聯(lián)系。

在年代和出處預(yù)測方面，Aeneas能夠?qū)⑽谋局糜跉v史學(xué)家提供的日期范圍內(nèi)13年內(nèi)，以72%的準(zhǔn)確率將銘文歸入62個古代羅馬行省之一。

作為首個利用多模態(tài)輸入確定文本地理來源的模型。它可同時分析文本和視覺信息，例如銘文圖像。

不同于只能預(yù)測單個詞的Ithaca，Aeneas夠修復(fù)文本中缺失長度未知的段落。

Aeneas能以73%的準(zhǔn)確率修復(fù)最多十個字符缺失的損壞銘文。當(dāng)修復(fù)長度未知時，準(zhǔn)確率也會有58%。

這使得它成為處理嚴重損壞材料的史學(xué)家的更通用的工具。

Aeneas不僅適用于銘文，還可以適應(yīng)其他古代語言、文字和媒介，從莎草紙到硬幣，擴展其功能以幫助連接更廣泛的歷史證據(jù)。

想試用Aeneas的可登錄predictingthepast.com，以交互式使用。

作為開源軟件，中國的考古學(xué)家也可以調(diào)整Aeneas，讓Aeneas能夠用于解讀諸如西夏文，契丹文等失傳的中國古跡。

工作原理和典型案例

為了訓(xùn)練Aeneas，Deepmind的研究者精心策劃了一個龐大且可靠的數(shù)據(jù)集，借鑒了數(shù)十年來歷史學(xué)家的工作成果來創(chuàng)建數(shù)據(jù)集，其中包括了古希臘和羅馬時代銘文的文本和圖像。

Aeneas使用了NLP領(lǐng)域的大殺器transformer來處理碑文文本輸入，并通過解碼器檢索相似的碑文，并按相關(guān)性排序。

對于每塊銘文，Aeneas的語境化機制使用一種稱為嵌入的技術(shù)檢索一系列相似物——將每塊銘文的文本和語境信息編碼成一種包含文本內(nèi)容、語言、來源時間地點以及與其他碑文關(guān)聯(lián)性的歷史指紋。

圖3 Aeneas的架構(gòu)，展示該模型如何接收文本和圖像輸入以生成省份、日期和修復(fù)預(yù)測

接下來看Aeneas解析古代文本的一個典型例子。

古羅馬皇帝奧古斯都以第一人稱成就記述《功業(yè)記》，這是古羅馬歷史中一塊著名的石碑，這份銘文由奧古斯都親自撰寫、是其自我夸耀的終身成就的總結(jié)。

文本中出現(xiàn)了對帝國夸張的描述、無關(guān)的日期和虛假的地理標(biāo)志，而且學(xué)界對其撰寫的時間也存在爭議。

歷史學(xué)家們長期以來一直爭論這塊銘文的年代。Aeneas將所有碑文的模糊年代和來源特征進行語境化分析。

它捕捉到了拼寫和詞匯的線索，以及表明微妙政治意識形態(tài)和帝國歸屬的語言學(xué)細微差別。

其預(yù)測基于文本中提到的微妙語言特征和歷史標(biāo)志，如官方頭銜和紀念碑。

通過將年代問題轉(zhuǎn)化為基于語言和上下文數(shù)據(jù)的概率估計。

有趣的是Aeneas并沒有預(yù)測一個固定的日期，而是產(chǎn)生了一個可能的日期分布的詳細情況，如圖4所示。

其預(yù)測呈現(xiàn)兩個明顯的峰值，一個較小的峰值出現(xiàn)在公元前10-1年左右，一個較大的、更自信的峰值在公元10-20 年之間。

這些結(jié)果說明Aeneas給出的預(yù)測是謹慎的，其反映了當(dāng)前學(xué)者們意見的差異。

給出了兩個可能的日期范圍，而不是單一的預(yù)測，反而說明了Aeneas能夠歷史辯論提供了一種新的、定量的方法。

圖4 Aeneas對《功業(yè)記》年代歸屬預(yù)測的直方圖，該模型模擬了圍繞這一著名碑文年代測定所展開的學(xué)術(shù)辯論

近期，有不少將AI技術(shù)應(yīng)用于考古領(lǐng)域的嘗試，從為無名老兵做面部復(fù)原，到博物館里對古人構(gòu)建數(shù)字虛擬替身，AI在考古及歷史領(lǐng)域的應(yīng)用值得關(guān)注。

去年復(fù)旦大學(xué)更是開設(shè)了「AI考古」的課程，華南理工大學(xué)深度學(xué)習(xí)與視覺計算實驗室（SCUT-DLVCLab）也曾推出的專注于古籍文言文處理的通古大模型。

面對中國浩如煙海的古籍古碑，未來的考古學(xué)家，或許更需要像Aeneas這樣的工具，來從海量數(shù)據(jù)中淘金。

參考資料：

https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

https://www.nature.com/articles/d41586-025-02335-x

https://blog.google/technology/google-deepmind/aeneas/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

被曝蒸餾DeepSeek還造假！歐版OpenAI塌方了

量子位 2025-08-14 16:21:23
31 跟貼 31
Meta華人天才畢樹超「叛逃」預(yù)言：OpenAI未竟交互革命，暗藏萬億賽道

新智元 2025-08-14 17:28:06
0 跟貼 0

DeepMind哈薩比斯：智能體可以在Genie實時生成的世界里運行

量子位 2025-08-13 15:15:22
28 跟貼 28

DeepMind讓AI當(dāng)「上帝」，導(dǎo)演一場只有AI演員的「西部世界」

機器之心Pro 2025-07-16 13:55:45
0 跟貼 0
告別Transformer，重塑范式：上海交大首個「類人腦」大模型誕生

機器之心Pro 2025-08-13 17:42:10
6 跟貼 6

從數(shù)據(jù)分布視角重新審視大模型推理，馬斯克回復(fù)，Grok破防

機器之心Pro 2025-08-14 19:18:01
0 跟貼 0

反擊AI論文！arXiv每年拒掉2%造假內(nèi)容，自動化工具加入審核

量子位 2025-08-14 15:35:48
1 跟貼 1
AI筆記又進化了！智能體“入駐”，標(biāo)簽、導(dǎo)圖、清單都能自動生成

智東西 2025-08-14 18:27:29
0 跟貼 0

用AI驅(qū)動工業(yè)仿真，「清航飛邁」讓 “所思即所得” 變?yōu)楝F(xiàn)實｜早期項目

36氪 2025-08-14 21:03:52
0 跟貼 0
騰訊混元圖像2.0一手實測，毫秒級響應(yīng)

量子位 2025-05-18 12:49:08
2 跟貼 2
華為祭出AI推理黑科技UCM！海力士難了？不一定

雷科技 2025-08-14 21:35:36
0 跟貼 0
成都雙流區(qū)召開工業(yè)智能化與量子可信計算應(yīng)用大會校企共建人工智能聯(lián)合實驗室落地揭牌

每日經(jīng)濟新聞 2025-08-14 21:49:05
0 跟貼 0
AI新勢力，開始拼起云實力

雷科技 2025-08-14 23:06:10
0 跟貼 0
《集王圣教序》：唐代僧人懷仁耗時25年，從王羲之真跡中精選1903個字集字刻成的奇跡碑文，備盡八法之妙

古典讀書治學(xué)生活 2025-08-14 12:34:08
0 跟貼 0
毛岸英葬在朝鮮，碑文引毛主席“不滿”：少寫了一個人的名字

東哥講歷史1 2025-08-13 17:44:41
0 跟貼 0
男子在山上看見水位石碑，記錄的水位讓他震驚不已

銳眼新聞 2025-08-13 11:46:47
1232 跟貼 1232
古羅馬戰(zhàn)士與現(xiàn)代戰(zhàn)士的比拼

二次元小韓 2025-08-14 10:26:00
0 跟貼 0
匍雁形銅盉hé——古代青銅器名品集錄

蹉跎笑我 2025-08-13 00:02:53
4 跟貼 4
見證耶穌時代遺跡的神父、圣經(jīng)考古權(quán)威安息，畢生致力圣地研究

意訊 2025-08-11 23:03:58
7 跟貼 7
突發(fā)，Grok背后核心人物離職！

智東西 2025-08-14 12:12:32
0 跟貼 0
考古學(xué)家到底在“挖”什么？

尚曦讀史 2025-08-14 17:50:03
0 跟貼 0
干涸湖底發(fā)現(xiàn)神秘石像！復(fù)活節(jié)島考古學(xué)家懵了：這不可能?。?/a>

Science科學(xué)說 2025-08-13 08:05:03
0 跟貼 0
千年回響：編鐘里的華夏文明密碼

忽泓護 2025-08-13 15:41:25
0 跟貼 0
銘文有“中國”二字的東漢銅鏡曾被倒賣，警方披露詳情→

江西晨報 2025-08-14 17:28:30
2 跟貼 2
美軍“北極熊團”被全殲，世界十大王牌軍，是如何被打回老家的？

隱龍?zhí)煜耾 2025-08-13 12:19:27
10 跟貼 10
古羅馬記載的古典運動：浮士德球｜圖說世運

封面新聞 2025-08-14 16:27:08
0 跟貼 0
歷時四十七年建造的皇陵，被自己的子孫給盜了？

杭州班長 2025-08-14 18:30:00
0 跟貼 0
大鵝發(fā)現(xiàn)中國石碑，俄國專家求助我國，內(nèi)容讓兩國瞬間陷入尷尬

色彩斑斕的世界 2025-08-10 10:28:08
0 跟貼 0
明穆宗朱載坖：六年帝王生涯為大明續(xù)命八十年

朝話熹史 2025-08-12 13:12:04
0 跟貼 0
在明朝十三陵中，為何還有一座太監(jiān)墓？是史上唯一葬入皇陵的太監(jiān)

文物真有趣 2025-08-10 18:38:34
300 跟貼 300
毛主席題寫在石碑上的11個字，堪稱經(jīng)典之作，您能認出幾個字？

書畫相約 2025-08-13 07:24:40
1 跟貼 1
誰這么敗家嗎？廣元鐵橋橋頭公園一石碑被損

秀我廣元 2025-08-14 08:20:31
0 跟貼 0
不可思議！丹麥在沼澤發(fā)現(xiàn)了，2400年前的古尸！

大夏遺風(fēng) 2025-08-13 22:15:57
1 跟貼 1
那年和女同學(xué)在舊廟躲雨，她顫著說：要不把衣服脫下來烤烤

曉艾故事匯 2025-08-14 17:21:28
0 跟貼 0
央媒觀豫｜游龍門石窟領(lǐng)略千年石刻魅力

河南省文化和旅游手機報 2025-08-14 16:00:07
1 跟貼 1
濟南圣佛洞摩崖石窟，集唐宋明三代石刻于一體卻遭遇保護性破壞

老靳行攝 2025-08-11 21:57:10
0 跟貼 0
一口氣看完中華歷史上首個實證王朝-商朝554年歷史

老歪說史 2025-08-14 03:43:36
7 跟貼 7
如果不是出自南宋古墓，真懷疑這是現(xiàn)代產(chǎn)物！

文物真有趣 2025-08-14 22:28:29
11 跟貼 11
雅利安人滅了三個文明古國，為啥來到商朝后，卻被送進了殉葬坑？

白哥全球事 2025-08-14 01:37:34
0 跟貼 0
毛主席稿費124萬，沒給子女留一分，大多用在了資助民族人士上

一更科普 2025-08-10 18:31:00
0 跟貼 0

新智元

AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代

13256文章數(shù) 66126關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

藝術(shù)

健康

本地

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
你到底該和什么樣的人做朋友？
李彥宏：百度離破產(chǎn)30天

手機 / 數(shù)碼

房產(chǎn) / 家居

AI「解碼」古羅馬，重現(xiàn)千年銘文真相！DeepMind新模型再登Nature

暴雨之下1萬多人，500個機器人燃爆全場

特朗普稱會晤失敗風(fēng)險是25% 俄方：預(yù)計不會簽任何文件

特朗普稱會晤失敗風(fēng)險是25% 俄方：預(yù)計不會簽任何文件

在菲律賓，一支中國人創(chuàng)建的球隊踢上了亞冠

趙露思發(fā)文告別！扯下她最后的顏面

“許家印同伙”夏海鈞的資產(chǎn)藏匿游戲

大六座SUV還能這么玩 吉利銀河M9動態(tài)內(nèi)測

態(tài)度原創(chuàng)

2800萬青少年困在抑郁里，從幼兒園卷到高中，誰在逼垮下一代？

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

急診科專家解答動物抓咬傷八大問題

云游中國 | 地心探秘！一天穿越池州六大溶洞

AI「解碼」古羅馬，重現(xiàn)千年銘文真相！DeepMind新模型再登Nature

暴雨之下1萬多人，500個機器人燃爆全場

在菲律賓，一支中國人創(chuàng)建的球隊踢上了亞冠

趙露思發(fā)文告別！扯下她最后的顏面

大六座SUV還能這么玩吉利銀河M9動態(tài)內(nèi)測

2800萬青少年困在抑郁里，從幼兒園卷到高中，誰在逼垮下一代？

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

云游中國 | 地心探秘！一天穿越池州六大溶洞