夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

8年實現(xiàn) 星際superAGI的路線圖(理論-驗證-部署-生物硬件實現(xiàn)),超越OpenAI大模型的歐美AI

0
分享至

目錄:

星際SuperAGI研究路線圖

執(zhí)行原則綜述

基準(zhǔn)測試

研究原則

AGI突破背后的科學(xué)和標(biāo)準(zhǔn)

星際SuperAGI研究路線圖



規(guī)劃時間提前:8年-2年





from 《Designing Ecosystems of Intelligence from First Principles 2024》 https://arxiv.org/pdf/2212.01354v2.pdf

人工智能的發(fā)展通常被描述為一個階段性的進(jìn)展,從所謂的“狹義人工智能”(ANI) ——能夠解決狹窄定義領(lǐng)域內(nèi)的問題的系統(tǒng)——到逐漸變得更強(qiáng)大、適應(yīng)性更強(qiáng)的系統(tǒng),能夠解決特定領(lǐng)域的問題。更領(lǐng)域通用的方式:所謂的“通用人工智能”(AGI)。除此之外,甚至可能設(shè)計出超越人類一般認(rèn)知能力的人工系統(tǒng):“人工智能”(ASI)。

我們的方法更側(cè)重于設(shè)計各種智能代理:能夠根據(jù)流式傳感數(shù)據(jù)通知的世界模型實時更新進(jìn)行規(guī)劃、決策和行動的軟件程序。這些智能體之間以及與人類可持續(xù)互動的集體智慧就是共享智能(我們路線圖上的S4),它是我們的北極星,可以被視為 ASI 的一種版本。

回過頭來看,要實現(xiàn)這一目標(biāo),需要設(shè)計出能夠從人類的角度出發(fā),從而體貼人類的智能體:交感智能(S3)。反過來,這種換位思考的能力需要有能力推理反事實情況和可能的未來:復(fù)雜的情報(S2)。復(fù)雜智能是感知智能(S1 )的更強(qiáng)大版本,是主動推理的最基本實現(xiàn),它至少涉及對行為及其感官后果的信念。


執(zhí)行原則:

人工智能不僅需要理解并能夠分享它所相信的東西,而且還需要展示人類所具有的靈活和通用的智能。我們提出,人工智能的最終形式將是一個“智能生態(tài)系統(tǒng)”的分布式網(wǎng)絡(luò),其中人類和合成的智能代理集體共同努力解決復(fù)雜的問題。這個被稱為“空間網(wǎng)絡(luò)”的生態(tài)系統(tǒng)包含一個全面的實時知識庫——任何人、任何事物都可以訪問的所有人類知識的語料庫。

我們必須問自己,什么樣的人工智能最有潛力造福人類。

考慮到這個問題,讓我們展示我們對未來十年及以后發(fā)展人工智能的愿景,這一愿景的靈感來自于智能在生物體及其所在生態(tài)系統(tǒng)中的表現(xiàn)方式。

在自然界中,生物體經(jīng)常集體工作來適應(yīng)和生存。從粘菌到魚群再到整個森林,共享智能無處不在。我們?nèi)祟惤?jīng)常通過網(wǎng)絡(luò)來分享我們的想法。這是我們成長、適應(yīng)和繁榮的重要組成部分。然而,當(dāng)今的大多數(shù)人工智能系統(tǒng)無法與我們或其他人工智能分享它們所知道的信息,也無法表達(dá)它們?nèi)绾螌崿F(xiàn)目標(biāo)。那是因為他們不知道自己在做什么,也不知道為什么這樣做。稱它們?yōu)楦呒売嬎闫骺赡芴×?,但從某種意義上說,它們就是這樣。DALL-E 是一種深度學(xué)習(xí) AI 模型,能夠根據(jù)文本提示生成圖像,它會合成無數(shù)狗騎摩托車的照片,但它不知道什么是狗或摩托車。例如,它對于狗是什么沒有任何信念。只要給出一些提示,它就能簡單地再現(xiàn)正確類型的圖像。ChatGPT 雖然非常令人印象深刻,但它只是根據(jù)先驗知識來預(yù)測接下來應(yīng)該出現(xiàn)的單詞。它不知道它所說的是否正確。事實上,它根本不知道自己在說話。

為了真正實現(xiàn)通用人工智能,我們相信人工智能不僅必須理解并好奇他們在做什么以及為什么這樣做,還必須能夠分享他們學(xué)到的東西以及他們是如何學(xué)到的。讓它們可以解釋使它們更值得信賴。但我們?nèi)绾螐倪@里到達(dá)那里呢?

人工智能的未來通常被描述為經(jīng)歷三個不同的階段:

第一階段可以歸類為狹義人工智能。這些系統(tǒng)代表了當(dāng)前最先進(jìn)的人工智能,旨在執(zhí)行特定任務(wù)或解決有限領(lǐng)域內(nèi)的特定問題,并且無法展現(xiàn)人類的一般智能。狹義人工智能的類型包括語音和圖像識別軟件、自然語言處理軟件、最新的生成式人工智能和推薦系統(tǒng)。

人工智能發(fā)展的下一階段稱為通用人工智能(AGI)。這些系統(tǒng)展現(xiàn)了人類所具有的靈活、通用的智能,能夠適應(yīng)新的情況、學(xué)習(xí)和理解新的概念,并執(zhí)行廣泛的任務(wù)和活動。

第三階段的進(jìn)展通常被稱為人工智能(ASI)

在科幻小說中,人工“通用”或“超級”智能通常被描繪成一個單一的實體,如果你愿意的話,可以說是一個無所不知的人造大腦。但我們相信,人工智能時代的頂峰更有可能是一個“智能生態(tài)系統(tǒng)”的分布式網(wǎng)絡(luò)。

當(dāng)自然智能體(即人類)和合成智能體(即智能制品)能夠共同解決復(fù)雜問題時,共享智能的這一階段就實現(xiàn)了。這些智能代理,無論是人類的還是合成的,都成為分布式、互連的生態(tài)系統(tǒng)的節(jié)點——人們可以稱之為多維網(wǎng)絡(luò)物理網(wǎng)絡(luò),跨越物理和虛擬空間。我們稱之為空間網(wǎng)絡(luò),這是一種將現(xiàn)實世界和數(shù)字世界連接成一個統(tǒng)一網(wǎng)絡(luò)的全球網(wǎng)絡(luò)。

空間網(wǎng)絡(luò)由傳感器、智能代理和參與者組成。傳感器收集數(shù)據(jù),而人類和人工智能代理則根據(jù)這些數(shù)據(jù)進(jìn)行分析、理解和規(guī)劃。機(jī)器人、無人機(jī)或人類等參與者在物理世界中執(zhí)行建議的動作。這些傳感器和參與者共同使智能代理能夠體現(xiàn)在物理世界中。像我們一樣,他們可以看到和聽到。該實施例在數(shù)字世界和物理世界之間建立了無縫連接??臻g網(wǎng)絡(luò)在一個巨大的、分布式的、始終保持最新的知識庫上運(yùn)行,這是所有人類知識的語料庫,能夠提供準(zhǔn)確、實時的世界視圖,任何人都可以在任何地方訪問。

為了了解我們如何創(chuàng)建下一代網(wǎng)絡(luò),我們轉(zhuǎn)向自然界中存在的多尺度系統(tǒng)。自然生態(tài)系統(tǒng)通常具有適應(yīng)環(huán)境變化的集體能力。例如,森林可能會根據(jù)天氣或其他環(huán)境因素的變化來調(diào)整植物和動物物種的分布。就像幾乎所有的自然創(chuàng)造物一樣,森林是嵌套智能系統(tǒng)。這意味著它的智力不是一個單一的、統(tǒng)一的特征,而是一個由許多不同層次的智力組成的復(fù)雜而動態(tài)的過程。例如,植物以模塊化的方式生長,作為一個結(jié)構(gòu)化的社區(qū),自我組織成特定的配置,以優(yōu)化生長、陽光、可持續(xù)性和生物多樣性。我們的身體是嵌套智能的另一個例子,因為它們是由許多相互關(guān)聯(lián)、獨(dú)立的單元組成,這些單元一起工作形成一個整體。這些單位可以在組織的各個層次上看到,從細(xì)胞到組織到器官到系統(tǒng)。每個單位執(zhí)行特定的功能,并為整個身體的整體功能做出貢獻(xiàn)。人們甚至可以說自然界中的所有智慧都是某種集體智慧。

與自然系統(tǒng)一樣,技術(shù)系統(tǒng)也可以被視為嵌套智能系統(tǒng),智能發(fā)生在組織的多個層面。例如,物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)可能由許多單獨(dú)的傳感器組成,每個傳感器執(zhí)行特定的功能并為網(wǎng)絡(luò)的整體功能做出貢獻(xiàn)。人工智能也可以嵌套。多個專門的人工智能代理可以協(xié)同工作來執(zhí)行復(fù)雜的任務(wù)并解決問題。例如,語言處理代理、視覺處理代理和決策代理都可能與機(jī)器人、無人機(jī)、汽車、執(zhí)行器和人類協(xié)同工作。這些智能體中的每一個都協(xié)同工作,形成一個更加復(fù)雜和多功能的智能系統(tǒng),能夠解決極其復(fù)雜的問題。

理想情況下,這種“仿生”系統(tǒng)(即采用模仿生物過程的合成方法的系統(tǒng))也會對我們和彼此感到好奇,即不斷了解環(huán)境中發(fā)生的變化。除了我們有能力查詢此類人工智能之外,它們還應(yīng)該對我們感到好奇,并向我們提問。這種好奇心將使他們能夠獲得新的知識并將其整合到他們現(xiàn)有的認(rèn)知架構(gòu)中,就像人類在其一生中將新的技能和知識添加到他們的心理模型中一樣。隨著時間的推移,具有學(xué)習(xí)能力的人工智能生態(tài)系統(tǒng)自然會變得更加通用和智能,因為它不斷擴(kuò)展并建立在現(xiàn)有的智能形式之上。

在我們對人工智能的愿景中,合成智能代理體積小且敏捷。我們的代理不是使用數(shù)十億個需要大量數(shù)據(jù)進(jìn)行訓(xùn)練的參數(shù)來構(gòu)建,這反過來又需要大量的計算能力,從而使其效率極低,而是需要少量的上下文數(shù)據(jù),關(guān)鍵是采用通用格式,并使用最少的培訓(xùn)。智能代理可能是專業(yè)的,能夠與他人交流,能夠就他們所感知的內(nèi)容提出問題,并能夠?qū)W習(xí)新事物。通過這種方法,智能體能夠不斷學(xué)習(xí)并與其他智能體分享知識,擺脫對單一、過于復(fù)雜、低效的人工智能系統(tǒng)的依賴。相反,大量代理可以在分工和攻克專門任務(wù)(這些任務(wù)匯總為更高階的復(fù)雜任務(wù))時不斷地相互溝通、協(xié)調(diào)和協(xié)作。上述通用數(shù)據(jù)格式的一個顯著好處是,除了其知識建模和共享能力之外,它還意味著可以對代理進(jìn)行審計,這意味著我們可以了解他們?nèi)绾我约盀楹巫龀鰶Q策并提供更新或監(jiān)管。這與當(dāng)今的許多人工智能系統(tǒng)(例如大型語言模型和神經(jīng)網(wǎng)絡(luò))形成鮮明對比,可解釋的AI

因此,我們不是在機(jī)器學(xué)習(xí)架構(gòu)中添加更多的數(shù)據(jù)、參數(shù)或?qū)樱ㄟ@在計算效率上是低效的),而是構(gòu)建像自然一樣“擴(kuò)展”的人工智能:通過將生態(tài)系統(tǒng)內(nèi)部和跨生態(tài)系統(tǒng)的個體智能聚合成嵌套智能,可以以計算有效的方式協(xié)同工作,實時解決問題,無論問題多么復(fù)雜。在這樣的生態(tài)系統(tǒng)中,人類和人工智能成為互補(bǔ)的主體,各自具有獨(dú)特的優(yōu)勢和能力。通過合作,人類和人工智能可以互相幫助,充分發(fā)揮潛力,從而對世界產(chǎn)生積極影響。

例如,想象一個名為 Max 的機(jī)器人住在房子里,可以自行移動。Max 擁有傳感器,可以看到和聽到房子里的東西,它可以利用這些信息來預(yù)測接下來可能發(fā)生的事情。例如,如果 Max 聽到開門的聲音,它可能會預(yù)測有人要進(jìn)屋。使用貝葉斯方法,Max 可以在新信息可用時更新其信念,從而使其預(yù)測更好。例如,如果 Max 看到有人走進(jìn)房子,它可以更新其預(yù)測,以更加確定有人在房子里。另一方面,如果 Max 聽到狗叫的聲音,它可能會更新其預(yù)測,以包括狗也在房子里的可能性。通過根據(jù)新信息不斷更新預(yù)測,Max 可以隨著時間的推移學(xué)習(xí)并適應(yīng)環(huán)境。

人工智能代理通過建模來理解世界。這與人類認(rèn)識世界的方式類似。我們不斷地創(chuàng)建和更新我們頭腦中的心理模型。這些可能是物理地點的心理表征,比如我們的家?;蛘咚鼈兛梢允窍裎覀兊钠囘@樣的物體。汽車的心智模型可能包括對發(fā)動機(jī)如何工作、制動器和加速器如何控制汽車速度以及方向盤如何控制汽車方向的理解。有了這種心理模型,我們就能夠操作汽車并預(yù)測它在不同情況下的表現(xiàn),例如當(dāng)我們轉(zhuǎn)動方向盤或踩剎車時它會如何反應(yīng)。

心理模型還可以用來理解數(shù)學(xué)或物理等抽象概念。例如,加法的心智模型可能包括這樣的理解:將兩個數(shù)字加在一起會產(chǎn)生更大的數(shù)字,而重力的心智模型可能包括這樣的理解:物體根據(jù)其質(zhì)量而相互吸引。我們每天都使用心理模型來理解和解釋復(fù)雜的系統(tǒng)或概念,并預(yù)測這些系統(tǒng)或概念未來的行為方式。

想象一下我們的機(jī)器人 Max 正在迷宮中導(dǎo)航,使用迷宮的內(nèi)部模型來規(guī)劃其運(yùn)動并避開障礙物。如果 Max 遇到(感知到)未包含在其初始迷宮模型中的新障礙物,它可以更新其模型以納入此新信息并提高其成功導(dǎo)航迷宮的能力。通過這種方式,人工智能系統(tǒng)可以使用世界模型來更新他們的信念并做出更好的決策。

但是,如果 Max 想與其他 AI 代理分享它從迷宮中學(xué)到的知識怎么辦?任何自然系統(tǒng)的一個關(guān)鍵方面是生物體之間的通信。在森林中,交流通常是通過菌根真菌網(wǎng)絡(luò)來介導(dǎo)的,這些網(wǎng)絡(luò)能夠促進(jìn)學(xué)習(xí)甚至記憶。菌根真菌與植物根部形成共生關(guān)系,幫助植物從土壤中吸收水分和養(yǎng)分,而植物則以碳水化合物的形式為真菌提供能量。真菌通過將不同植物的根連接在一起來促進(jìn)交流,形成一個被稱為“木廣網(wǎng)”的網(wǎng)絡(luò)。我們的機(jī)器人 Max 必須能夠與其他機(jī)器人進(jìn)行交流,以分享它所知道的知識并向他人學(xué)習(xí)。在我們的方法中,Max 可以使用通用語言自動將他學(xué)到的知識添加到持續(xù)更新的共享世界模型中?這樣,max就可以讓所有智能代理知道它從迷宮中學(xué)到了什么。智能生態(tài)系統(tǒng)的一個主要好處是共享學(xué)習(xí)。在像空間網(wǎng)這樣的數(shù)字網(wǎng)絡(luò)上,這可以實時發(fā)生。

為了實現(xiàn)空間網(wǎng)絡(luò)上智能代理之間的有效通信,需要新的通信協(xié)議。以前的互聯(lián)網(wǎng)協(xié)議旨在連接信息頁面,而下一代協(xié)議需要具有空間性,能夠連接虛擬或物理世界中的任何內(nèi)容。超空間建模語言(HSML)和事務(wù)協(xié)議(HSTP)將超越當(dāng)前 HTML 和 HTTP 的限制,這些限制并未設(shè)計為包含多個維度,并且大多僅限于文本和超文本。建立通用語言和協(xié)議是實現(xiàn)自然和人工智能生態(tài)系統(tǒng)的第一步,也是關(guān)鍵一步,該生態(tài)系統(tǒng)可以學(xué)習(xí)、適應(yīng)并與其他智能體分享他們所知道的知識。

智力的進(jìn)化包括發(fā)展的關(guān)鍵階段,概述如下。

S0:系統(tǒng)智能

識別模式并做出反應(yīng)的能力。當(dāng)前最先進(jìn)的人工智能。
S0 是軟件中的一個機(jī)器過程,它將輸入映射到輸出并優(yōu)化某些價值函數(shù)或狀態(tài)成本。例子包括深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)

S1:感知智能

具有實時感知和響應(yīng)環(huán)境的能力。
S1基于信念更新和優(yōu)化。它根據(jù)預(yù)期的信息增益和預(yù)期價值對感官印象和計劃做出反應(yīng)。這種智力很好奇,尋求信息和偏好。這樣的人工智能將對感官印象做出反應(yīng),并能夠根據(jù)對世界的行動或信念的后果進(jìn)行計劃,這使其能夠解決幾乎任何問題。

S2:精密智能

學(xué)習(xí)和適應(yīng)新情況的能力
S2 基于感知行為。它的計劃基于對世界信念的行動的后果,而不是世界本身。換句話說,它從“如果我這樣做會發(fā)生什么?”的問題出發(fā)?!叭绻疫@樣做,我會相信什么或知道什么?” 這種智能使用生成模型,對應(yīng)于人工智能進(jìn)步的流行敘述中的“通用人工智能”。

S3:交感(或智慧)智力

理解并回應(yīng)他人的情緒和需求的能力
S3 是指復(fù)雜的人工智能能夠識別用戶和其他人工智能的本質(zhì)和想法。這種智能能夠理解其他人和其他人工智能的想法和感受。它能夠從用戶的角度出發(fā)——可以說是設(shè)身處地為用戶著想。它可以理解對話者的想法和感受。這種類型的智能也被稱為“視角”,因為它可以理解不同的視角:它會識別用戶和其他人工智能的本質(zhì)和想法。它將是“富有同情心的”,也就是說,能夠理解不同于自己的觀點。

S4:共享(或超級)智能

與人類、其他智能體和物理系統(tǒng)合作解決復(fù)雜問題并實現(xiàn)目標(biāo)的能力
S4 是交感智能與人類和其他人工智能合作時出現(xiàn)的集體智能。這個階段在人工智能進(jìn)步的故事中被稱為“人工智能超級智能”。我們相信,這種情報將來自許多代理的共同努力,創(chuàng)建一個共享知識網(wǎng)絡(luò),從而成為智慧。我們認(rèn)為我們的方法是在全球范圍內(nèi)實現(xiàn)這種智能的最佳方式。

我們對人工智能的未來有一個愿景,以及如何實現(xiàn)這一目標(biāo)的路線圖。

智力水平


將發(fā)布基準(zhǔn)測試

我們的初步結(jié)果令人鼓舞,為了向更廣泛的機(jī)器學(xué)習(xí)社區(qū)展示我們的技術(shù),我們將在 Atari 100k 基準(zhǔn)挑戰(zhàn)等基準(zhǔn)測試中針對最先進(jìn)的人工智能展示我們的技術(shù)。隨著我們繼續(xù)開發(fā)這項技術(shù),我們將在同行評審的期刊和會議上傳播我們的研究結(jié)果。敬請關(guān)注。

研究原則:VERSES AI 的核心:主動推理

我們正在使用主動推理來研究這一假設(shè),主動推理是一種基于信息物理學(xué)的智能建模方法。通過主動推理,我們可以設(shè)計和創(chuàng)建能夠根據(jù)傳入數(shù)據(jù)做出決策并采取實時行動的軟件程序或代理。這些智能體在收到新數(shù)據(jù)時會實時更新他們的信念,并利用他們對世界的理解來提前計劃并在其中采取適當(dāng)?shù)男袆印?/p>

我們的方法使我們能夠明確地了解代理人的信念。也就是說,它為我們提供了工具來發(fā)現(xiàn)智能體對世界的看法以及它如何根據(jù)新信息改變其信念。我們的模型基本上是貝葉斯模型,因此告訴我們最佳代理應(yīng)該相信什么以及它應(yīng)該如何行動以維持安全穩(wěn)定的環(huán)境。

我們的目標(biāo)是利用主動推理大規(guī)模開發(fā)安全且可持續(xù)的人工智能系統(tǒng):

打開黑匣子。為代理配備由顯式標(biāo)簽構(gòu)建的可解釋模型,從而使我們的代理的決策在設(shè)計上可審計。

混合自動化和專家系統(tǒng)。主動推理提供了一種將現(xiàn)有知識納入人工智能系統(tǒng)的明確方法,并鼓勵結(jié)構(gòu)化解釋。

最優(yōu)推理。貝葉斯系統(tǒng)將智能體已經(jīng)知道的知識(即先驗知識)與他們從新觀察到的數(shù)據(jù)中學(xué)到的知識最佳地結(jié)合起來,以在面對不確定性時進(jìn)行最佳推理。

最優(yōu)規(guī)劃。我們使用貝葉斯推理和決策來實施行動控制,允許在存在風(fēng)險和不確定性的情況下選擇最佳行動。

最優(yōu)模型選擇。貝葉斯主動推理可以自動選擇最佳模型并識別“適合正確工作的正確工具”。

解釋力和簡約性。主動推理代理不是最大化獎勵,而是解決不確定性,平衡探索和利用。

本質(zhì)安全。客服人員以團(tuán)結(jié)、道德、同理心和包容性原則為基礎(chǔ),最大限度地提高各個層面的安全性。

AGI突破背后的科學(xué)和標(biāo)準(zhǔn)

VERSES人工智能研發(fā)

2024 年 1 月 10 日

2023 年 12 月 19 日,VERSES 在《紐約時報》上刊登了整版廣告,其中附有一封致 OpenAI 董事會的公開信,引用了其章程中的協(xié)助條款,其中規(guī)定:“如果一個價值觀一致、具有安全意識的組織該項目在我們之前就已經(jīng)接近構(gòu)建 AGI,我們承諾停止與該項目競爭并開始協(xié)助該項目?!?

公開信指出,我們 VERSES 已經(jīng)找到了一條新的、我們相信更有希望的 AGI 開發(fā)路徑。當(dāng)前的主流路徑是深度學(xué)習(xí)、大數(shù)據(jù)和大型語言模型(LLM),人工智能在這些顛覆性新技術(shù)的基礎(chǔ)上取得了長足的進(jìn)步。然而,包括 OpenAI 本身在內(nèi)的關(guān)鍵決策者和利益相關(guān)者之間越來越多的共識是,這條道路不足以實現(xiàn) AGI。

2023 年 11 月 1 日,在劍橋大學(xué)舉行的霍金獎頒獎典禮上,當(dāng)被問及 LLM 是否是通向 AGI 的一條可行途徑時,Open AI 首席執(zhí)行官 Sam Altman 回答道:“我們需要另一個突破”,并進(jìn)一步澄清“教授它 [基于擴(kuò)展LLM的人工智能系統(tǒng),例如 ChatGPT] 來克隆人類和人類文本的行為 - 我認(rèn)為這不會讓我們實現(xiàn)這一目標(biāo)?!?/p>

在這里,我們仔細(xì)地證明和限定我們對“突破”一詞的使用。我們呼吁激活協(xié)助條款是基于我們的信念,即 VERSES 正在進(jìn)行的工作遵循與當(dāng)前主流方法根本不同的方向,并且這種替代方向(或非常接近它的方向)作為實現(xiàn)這一目標(biāo)的一種方式看起來非常有希望。通常與 AGI 相關(guān)的功能。

我們現(xiàn)在解析這一主張并闡明我們認(rèn)可它的理由。

首先,在最高層面上,我們所說的“重大突破”是大規(guī)模主動推理的發(fā)展。在明確地將我們對“突破”一詞的使用與 Altman 的引言聯(lián)系起來時,我們旨在向公眾表明,我們相信我們已經(jīng)確定了主流方法中缺失的內(nèi)容以及通向 AGI 的替代、可行的路徑是什么樣的。簡而言之,我們認(rèn)為,隨著人工智能技術(shù)的發(fā)展,主動推理已經(jīng)完全成熟,這是奧特曼所指的必要突破。

大多數(shù)人工智能組織(例如 OpenAI)將 AGI 定義為一種功能與人類智能非常相似或匹配的系統(tǒng)。如下所述,我們不同意將此視為人工智能研究的北極星。也就是說,如果這確實是人工智能研發(fā)的最終目標(biāo),那么我們和奧特曼一樣,不相信在大數(shù)據(jù)上訓(xùn)練并在訓(xùn)練后“凍結(jié)”的大規(guī)模神經(jīng)網(wǎng)絡(luò)能夠幫助我們實現(xiàn)這一目標(biāo)。當(dāng)今LLM的transformer架構(gòu)在使用參數(shù)來響應(yīng)傳入數(shù)據(jù)方面比以前的神經(jīng)網(wǎng)絡(luò)架構(gòu)更加靈活和高效,但它們本質(zhì)上仍然是前饋架構(gòu),沒有在推理時間尺度上進(jìn)行置信更新的明確概念(即狀態(tài)估計考慮先前狀態(tài))。

在目前基于LLM的技術(shù)成熟之前,“規(guī)模就是你所需要的”這一理念的支持者可能抱有一些希望,即擴(kuò)大深度神經(jīng)網(wǎng)絡(luò)架構(gòu)(如 Transformer)將足以縮小與人類表現(xiàn)的差距,但此類模型對其規(guī)模而言需要大量數(shù)據(jù) [1],并且訓(xùn)練 LLM 所需的數(shù)據(jù)量已經(jīng)超過了人類嬰兒學(xué)習(xí)語言所需的數(shù)據(jù)量 [2]。即使LLM已經(jīng)設(shè)法完全縮小性能差距,這也將成為反對這種人類智能建模方法充分性的決定性論據(jù)。此外,缺乏易于解釋的潛在狀態(tài)表示使得這些網(wǎng)絡(luò)的決策和行動選擇很難解釋。

另一方面,主動推理可用于構(gòu)建由較小的、易于理解的模型靈活組成的大型模型,從而可以進(jìn)行明確的、可解釋的置信更新。新方法的計算能力來自于允許這些模型根據(jù)任務(wù)需求進(jìn)行交互和組裝。因為每個組成模型都很好理解,所以我們總能解釋它對全球信念更新的貢獻(xiàn)。這與大腦的運(yùn)作方式相一致——在分層、模塊化架構(gòu)中跨個體、功能專門化的模型進(jìn)行在線實時信念更新——因此,它更有可能模仿人類行為并與人類智能互動。

前面的論點涉及構(gòu)建與人類智能緊密匹配的人工智能系統(tǒng)的嘗試。在我們的白皮書《從第一原則設(shè)計智能生態(tài)系統(tǒng)》中,我們建議人工智能研究在任何情況下都不應(yīng)該追求通用人工智能,將其理解為一個可以在任何環(huán)境中重新部署的整體集中式系統(tǒng)(例如凍結(jié)的“基礎(chǔ)模型”) )。相反,我們將人工智能研究的北極星描述為“共享智能”,這種分布式集體智能將從智能代理網(wǎng)絡(luò)的和諧交互中產(chǎn)生。

有許多的原因。首先,上述分層、模塊化架構(gòu)基于自然界的智能,最好將其描述為集體智能的一種形式,其中一組專門的代理或生物體創(chuàng)建并維護(hù)一個強(qiáng)大的、相互作用的生態(tài)位的多樣化網(wǎng)絡(luò)。到環(huán)境擾動。正如體內(nèi)的細(xì)胞協(xié)同工作創(chuàng)造出新穎而復(fù)雜的動物一樣,具有兼容生態(tài)位的生物體之間的共生相互作用自然會導(dǎo)致更加復(fù)雜的生物體。大腦的工作方式大致相同,專門的區(qū)域有自己的“計算利基”,可以靈活、動態(tài)地改變它們相互作用的方式,從而產(chǎn)生各種復(fù)雜的行為。雖然當(dāng)今主導(dǎo)機(jī)器學(xué)習(xí)的架構(gòu)確實以層和注意力頭等形式表現(xiàn)出一定的模塊化,但它們的性能在很大程度上依賴于網(wǎng)絡(luò)的廣度和深度,并且通常依賴于過度參數(shù)化。

自然界中的智能是流動的,總是體現(xiàn)在實時和隨著時間的推移而進(jìn)化和適應(yīng)環(huán)境擾動的物理結(jié)構(gòu)中。主動推理是圍繞穩(wěn)態(tài)設(shè)計原理構(gòu)建的,其中生物體(或模型)靈活地改變它們的相互作用方式以維持穩(wěn)定的環(huán)境。從技術(shù)上講,主動推理繼承了信念更新方面的最小動作變分原則 [3, 4]。然后,可以通過將穩(wěn)定、可持續(xù)環(huán)境的概念與一組約束或計算目標(biāo)相結(jié)合來構(gòu)建集體智慧,這些約束或計算目標(biāo)可以用生物自組織 [5] 或一種新型聯(lián)合推理 [6] 來解讀。當(dāng)一片腦組織學(xué)會使用主動推理原理打乒乓球時, 這一點在體外得到了明確的實現(xiàn)[7],從而產(chǎn)生了一種用于高效深度樹搜索的新型歸納規(guī)劃 [8]。

使用主動推理工具設(shè)計和實現(xiàn)的人工智能穩(wěn)態(tài)導(dǎo)出目標(biāo)函數(shù)至少具有三個優(yōu)點:(1)它們本質(zhì)上是自我限制的,這與原則上無限制的獎勵最大化相反;(2) 穩(wěn)態(tài)的定義與生成模型相關(guān),生成模型本身可以隨著時間的推移而演變,可能避免與固定成本函數(shù)的“獎勵黑客”相關(guān)的危險[9];(3) 它們能夠?qū)崿F(xiàn)(自由能)目標(biāo)函數(shù)的局部優(yōu)化以及網(wǎng)絡(luò)(和隱式生態(tài)系統(tǒng))上主動推理的固有縮放、組成和分布。

這給我們帶來了所聲稱的突破的第二個主要方面。上述愿景需要能夠大規(guī)模實現(xiàn)主動推理所需的貝葉斯大腦。VERSES 正在進(jìn)行多項技術(shù)開發(fā),我們認(rèn)為這些技術(shù)在高效貝葉斯推理的實際適用性和可擴(kuò)展性方面取得了重大進(jìn)展(并實現(xiàn)了可擴(kuò)展主動推理的根本“突破”)。我們的方法——這將引起更廣泛的機(jī)器學(xué)習(xí)研究界的極大興趣——避開了機(jī)器學(xué)習(xí)的支柱,例如誤差反向傳播、梯度下降學(xué)習(xí)、采樣和強(qiáng)化學(xué)習(xí),因此是根本不同的。這項工作的大部分仍在進(jìn)行中,但我們已經(jīng)取得了有希望的初步結(jié)果,表明我們的方法將擴(kuò)展并匹配或超過最先進(jìn)的基于深度學(xué)習(xí)的架構(gòu)的性能,特別是在樣本效率方面(正如我們上面所討論的,是實現(xiàn)仿生人工智能的核心)。這些結(jié)果將在明年公布,在此期間,我們將利用我們的新技術(shù)來解決行業(yè)基準(zhǔn)問題,其中一些已在我們的路線圖中列出。

最后,這一突破的第三個方面是一種社會技術(shù),它應(yīng)該允許人類大規(guī)模開發(fā)和部署智能網(wǎng)絡(luò),同時避免反烏托邦的結(jié)果。特別是,VERSES 與其非營利機(jī)構(gòu)空間網(wǎng)絡(luò)基金會 (SWF) 以及電氣和電子工程師協(xié)會 (IEEE) 合作,開發(fā)了一種標(biāo)準(zhǔn)化的世界建模語言,并將其贈送給 IEEE,希望在 P2874 空間 Web 工作組的支持下,它被廣泛且自由地采用。

為什么要制定標(biāo)準(zhǔn)?技術(shù)標(biāo)準(zhǔn),例如標(biāo)準(zhǔn)化電源插座的標(biāo)準(zhǔn),或 HTML 和 HTTP,構(gòu)成了一個幾乎不可見的(至少在一切順利的情況下)組織層,它使復(fù)雜的社交網(wǎng)絡(luò)正常運(yùn)行并實現(xiàn)大規(guī)模協(xié)調(diào),而無需明確的個人協(xié)調(diào)或規(guī)劃。廣泛采用的技術(shù)標(biāo)準(zhǔn)的存在使得幾乎奇跡般的隱性社會協(xié)調(diào)與合作成為可能。例如,它們使得人們可以在北美電網(wǎng)的任何地方插入智能手機(jī),而不會有損壞設(shè)備或因電壓不安全而引起火災(zāi)的風(fēng)險。

雖然從人工智能研究的角度來看,我們聲稱的突破的第三個方面似乎有些離題,但事實上,它構(gòu)成了我們白皮書中提出的分布式智能代理網(wǎng)絡(luò)的愿景。例如,考慮供應(yīng)鏈物流,它涉及基于共享資源和私有資源的組合來協(xié)調(diào)許多不同的參與者。如果相關(guān)數(shù)據(jù)和流程不是孤立的,那么即使通過傳統(tǒng)的教科書優(yōu)化方法,此類操作的效率也可能會大大提高。標(biāo)準(zhǔn)化通信是大規(guī)模協(xié)調(diào)的一個關(guān)鍵瓶頸:任何智能代理,無論其推理能力多么復(fù)雜,最終都受到其處理信息、訪問信息、識別其格式以及理解其通信原因的能力的限制。。歷史已經(jīng)明確表明,開放標(biāo)準(zhǔn)能夠?qū)崿F(xiàn)技術(shù)工件之間的互操作性,我們相信,與先進(jìn)的人工智能相結(jié)合,有能力實現(xiàn)真正的變革——同時擴(kuò)大而不是限制此類技術(shù)的可訪問性,并促進(jìn)和促進(jìn)技術(shù)的發(fā)展。激勵其建設(shè)性、協(xié)作性的使用。

有些人會質(zhì)疑我們給 OpenAI 董事會的公開信是否大膽。但如果奧特曼先生是正確的并且需要突破,我們就必須大膽并擺脫當(dāng)前的人工智能單一文化。我們懷著對當(dāng)前技術(shù)水平的極大尊重說這句話,這是一個研究項目(深度學(xué)習(xí)/連接主義/PDP)的頂峰,直到最近它本身才成為“失敗者”,并且?guī)资陙?,?jīng)歷了幾次“失敗”而幸存下來。人工智能寒冬”得益于其先驅(qū)者的堅持。我們的研究和開發(fā)的最新進(jìn)展讓我們相信,我們的方法雖然在許多方面截然不同,但卻是一條通往可擴(kuò)展、負(fù)責(zé)任的人工智能的引人注目的新道路,它建立在深度學(xué)習(xí)的關(guān)鍵見解的基礎(chǔ)上,同時引入新穎的機(jī)制來解決許多突出的問題。我們才剛剛開始沿著這條道路走下去,需要更廣泛社區(qū)的支持才能走得更遠(yuǎn)。鑒于確保通用人工智能繁榮、安全的開發(fā)和部署的社會迫切性,我們認(rèn)為應(yīng)該鼓勵和支持對有前途的替代方案的投資。

我們期待與您分享我們的進(jìn)展。

REFERENCES

[1] Hoffmann, J., Borgeaud, S., Mensch, A., Buchatskaya, E., Cai, T., Rutherford, E., de Las Cacas, D., Hendricks, L.A., Welbl, J., Clark, A., Hennigan, T., Noland, E., Millican, K., van den Driessche, G., Damoc, B., Guy, A., Osindero, S., Simonyan, K., Elsen, E., Rae, J.W., Vinyals, O., and Sifre, L. (2022). Training compute-optimal large language models. arXiv:2203.15556.

[2] Warstadt, A., & Bowman, S.R. (2022). What Artificial Neural Networks Can Tell Us About Human Language Acquisition. arXiv:2208.07998.

[3] Ramstead, M.J.D., et al. (2023). On Bayesian mechanics: A physics of and by beliefs. Interface Focus 13(3). doi: 10.1098/rsfs.2022.0029.

[4] Friston, K., et al. (203). Path integrals, particular kinds, and strange things. Physics of Life Reviews 47: p. 35-62.

[5] Friston, K., et al. (2015). Knowing one's place: a free-energy approach to pattern regulation. J R Soc Interface 12(105).

[6] Friston, K.J., et al. (2024). Federated inference and belief sharing. Neuroscience & Biobehavioral Reviews 156. doi: 10.1016/j.neubiorev.2023.105500.

[7] Kagan, B.J., et al. (2022). In vitro neurons learn and exhibit sentience when embodied in a simulated game-world. Neuron.

[8] Friston, K.J., et al. (2023). Active inference and intentional behaviour. arXiv:2312.07547. doi: 10.48550/arXiv.2312.07547.

[9] Skalse, J., Howe, N., Krasheninnikov, D., & Krueger, D. (2022). Defining and characterizing reward gaming. Advances in Neural Information Processing Systems 35, p. 9460-9471.

相關(guān):

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
倆初中女孩被堵廁所遭連續(xù)掌摑,當(dāng)?shù)亟逃纸槿?,警方已立?>
    </a>
        <h3>
      <a href=大風(fēng)新聞
2025-12-10 20:35:05
被謝賢養(yǎng)了12年,用青春換來兩千萬的coco,已經(jīng)走上了另一條道路

被謝賢養(yǎng)了12年,用青春換來兩千萬的coco,已經(jīng)走上了另一條道路

墨印齋
2025-12-04 19:46:02
上海申花鋒線告急!外援或?qū)?換2,銀靴射手有望加盟

上海申花鋒線告急!外援或?qū)?換2,銀靴射手有望加盟

體壇鑒春秋
2025-12-11 14:37:50
新車剛到手發(fā)現(xiàn)已充電35次,吉利客服:新車標(biāo)準(zhǔn)不看充電次數(shù)看里程

新車剛到手發(fā)現(xiàn)已充電35次,吉利客服:新車標(biāo)準(zhǔn)不看充電次數(shù)看里程

現(xiàn)代快報
2025-12-09 20:08:04
越南為何至今無力翻身?許世友撤軍前發(fā)布的3個命令,真是太高明

越南為何至今無力翻身?許世友撤軍前發(fā)布的3個命令,真是太高明

鶴羽說個事
2025-11-27 11:07:38
保羅離隊后首次正式發(fā)聲,一句話掀起全網(wǎng)熱議:他真的不后悔嗎?

保羅離隊后首次正式發(fā)聲,一句話掀起全網(wǎng)熱議:他真的不后悔嗎?

君笙的拂兮
2025-12-11 17:05:23
全體退休人員,領(lǐng)取12月份的養(yǎng)老金,一定要注意這3件事!

全體退休人員,領(lǐng)取12月份的養(yǎng)老金,一定要注意這3件事!

貓叔東山再起
2025-12-11 09:05:04
中國共產(chǎn)黨中央軍事委員會副主席張升民簡歷

中國共產(chǎn)黨中央軍事委員會副主席張升民簡歷

上觀新聞
2025-10-23 18:17:07
電影《尋秦記》定檔,白百何女一號還給宣萱!之前空降女主

電影《尋秦記》定檔,白百何女一號還給宣萱!之前空降女主

涵豆說娛
2025-12-10 17:47:24
49分狂勝晉級!被打破防?雷霆爆發(fā)破紀(jì)錄,昔日交易大反轉(zhuǎn)?

49分狂勝晉級!被打破防?雷霆爆發(fā)破紀(jì)錄,昔日交易大反轉(zhuǎn)?

籃球盛世
2025-12-11 17:16:13
硬抗中方32天,日媒稱高市早苗不道歉只剩一條路:19年前就有先例

硬抗中方32天,日媒稱高市早苗不道歉只剩一條路:19年前就有先例

歷史有些冷
2025-12-10 14:00:08
為什么剛炒完菜不能用水沖鐵鍋?若不是醫(yī)生提醒,差點犯了大錯!

為什么剛炒完菜不能用水沖鐵鍋?若不是醫(yī)生提醒,差點犯了大錯!

小彭的燦爛筆記1
2025-11-16 08:25:08
全球首例!澳大利亞禁止16歲以下青少年使用社交媒體,10個社媒納入禁用,不配合企業(yè)將罰款

全球首例!澳大利亞禁止16歲以下青少年使用社交媒體,10個社媒納入禁用,不配合企業(yè)將罰款

極目新聞
2025-12-10 11:14:32
優(yōu)衣庫這條白褲子!我宣布它是“搭遍衣柜”的神

優(yōu)衣庫這條白褲子!我宣布它是“搭遍衣柜”的神

冒泡泡的魚兒
2025-12-08 14:58:37
上班早到也不行!西班牙女員工連續(xù)提前到崗被公司開除 法院:解雇合法

上班早到也不行!西班牙女員工連續(xù)提前到崗被公司開除 法院:解雇合法

紅星新聞
2025-12-10 12:23:13
新技術(shù)首發(fā)!iPhone 18 Pro Max 真的猛

新技術(shù)首發(fā)!iPhone 18 Pro Max 真的猛

小柱解說游戲
2025-12-11 07:32:20
德云社被約談僅5天,曲協(xié)11字表態(tài),難怪郭麒麟三拒接班郭德綱

德云社被約談僅5天,曲協(xié)11字表態(tài),難怪郭麒麟三拒接班郭德綱

銀河史記
2025-12-11 16:48:07
超10省份“斷崖式降溫”!

超10省份“斷崖式降溫”!

極目新聞
2025-12-11 13:55:49
毛主席有多高明?李敏吐露:我跟李訥有摩擦?xí)r,爸從不問誰對誰錯

毛主席有多高明?李敏吐露:我跟李訥有摩擦?xí)r,爸從不問誰對誰錯

大運(yùn)河時空
2025-12-10 17:05:03
秋后算賬來了。美國嚴(yán)查“赴美生子”,當(dāng)年鉆漏洞的代價異常慘痛

秋后算賬來了。美國嚴(yán)查“赴美生子”,當(dāng)年鉆漏洞的代價異常慘痛

鷹視狼顧之天下
2025-12-11 13:42:38
2025-12-11 17:51:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1055文章數(shù) 17關(guān)注度
往期回顧 全部

科技要聞

豆包剛被微信淘寶們"群毆" ,又有人來搶位

頭條要聞

郭碧婷談與向佐分居兩地:他只用和孩子維持感情就好

頭條要聞

郭碧婷談與向佐分居兩地:他只用和孩子維持感情就好

體育要聞

你最看不上的人,關(guān)鍵時刻卻最想救你...

娛樂要聞

黃慧頤曝保劍鋒出軌細(xì)節(jié)!

財經(jīng)要聞

政府被“騙”,9500萬去哪了?

汽車要聞

長途穿越更輕松 二代哈弗H9穿越版限時售23.29萬

態(tài)度原創(chuàng)

數(shù)碼
旅游
本地
公開課
軍事航空

數(shù)碼要聞

鴻蒙商用“跨越山?!?新一代鴻蒙電腦發(fā)布重構(gòu)商用PC價值坐標(biāo)

旅游要聞

域見上海享玩浦東|新品!新體驗!本周浦東優(yōu)惠福利已就位→

本地新聞

打工人夢想中的生活,寵物已經(jīng)提前過上了

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

泰國海軍做好戰(zhàn)爭準(zhǔn)備 特朗普要電話調(diào)停泰柬沖突

無障礙瀏覽 進(jìn)入關(guān)懷版 18禁视频一区二区三区| AV大战毛片| 日本中文字幕乱伦电影| 亚洲av中文久久精品国内| 亚洲国产成人无码AV在线影院L| 人妻系列av无码专区| 久久久久高潮综合影院| 亚洲国产精品成人精品无码区在线| 国产午夜精品福利免费看| 一本色道久久HEZYO| 国产 熟女 91| 无码午夜激情| 亚洲精品国产一区黑色丝袜| 精品人伦一区二区三区蜜桃网站| 免费A级毛片无码A∨性按摩| 九色PORNY视频黑人| 久久久无码中文字幕久...| 熟女下面毛茸茸| 人人爽人人妻人妻| 亚洲熟妇另类久久久久久| 无码人妻丰满熟妇毛片| 熟妇人妻videos| 欧美精品午夜| 亚洲s码欧洲m码在线观看| 欧美老少配性行为| 国产精品久久久久兔费无码AV| 国产精品第12页| 国产熟女一区二区三E1黄| 呻吟的朋友丰满人妻| 国内七十熟女| 亚洲成女人图区一区二区| 热久久 国产| 国产成人精品视频不卡| 极品熟女一区二区三区| 人与鲁专区| 国偷自产一区二区三区在线视频| 成人无码a片一区二区三区免| 国产成人一区二区视频免费| 久久亚洲AV无码精品色午夜| 色婷婷亚洲一区二区三区| 男女啪啪抽搐呻吟高潮动态图|