網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

對(duì)AI的恐懼被夸大了！“強(qiáng)化學(xué)習(xí)之父”薩頓外灘演講：四條原則預(yù)言AI未來(lái)

2025-09-11 18:28:47　來(lái)源: 人工智能學(xué)家

北京舉報(bào)

分享至

“AI是宇宙演化的必然下一步?！?/strong>

來(lái)源：智東西

作者：ZeR0

編輯：漠影

智東西9月11日?qǐng)?bào)道，今日上午，在2025 Inclusion·外灘大會(huì)開(kāi)幕式上，2024年圖靈獎(jiǎng)得主、“強(qiáng)化學(xué)習(xí)之父”理查德·薩頓（Richard Sutton）發(fā)表主旨演講。他認(rèn)為，人類(lèi)數(shù)據(jù)紅利正逼近極限，人工智能（AI）正在進(jìn)入以持續(xù)學(xué)習(xí)為核心的“經(jīng)驗(yàn)時(shí)代”，潛力將遠(yuǎn)超以往。

知識(shí)來(lái)自于經(jīng)驗(yàn)，可以從經(jīng)驗(yàn)中學(xué)習(xí)。一個(gè)智能體的智能程度，取決于它能預(yù)測(cè)并控制自身輸入信號(hào)的程度。經(jīng)驗(yàn)是一切智能的核心與基礎(chǔ)。

強(qiáng)化學(xué)習(xí)帶領(lǐng)我們進(jìn)入了新的經(jīng)驗(yàn)時(shí)代，但要釋放全部潛力，還需要兩項(xiàng)目前尚不成熟的技術(shù)——持續(xù)學(xué)習(xí)（continual learning）和元學(xué)習(xí)（meta-learning）技術(shù)。

面對(duì)外界對(duì)AI帶來(lái)偏見(jiàn)、失業(yè)甚至人類(lèi)滅絕的擔(dān)憂，薩頓認(rèn)為，這種對(duì)AI的恐懼被夸大了，并且是被某些從中獲利的組織和個(gè)人煽動(dòng)起來(lái)的。

“人類(lèi)最卓越的超能力，就在于比其他任何動(dòng)物都更擅長(zhǎng)協(xié)作?！痹谒_頓看來(lái)，AI和人類(lèi)繁榮將來(lái)自于去中心化協(xié)作。目標(biāo)不同的智能體，可以通過(guò)去中心化的協(xié)作實(shí)現(xiàn)雙贏。

他預(yù)測(cè)當(dāng)今人類(lèi)的智力水平，很快將會(huì)被超級(jí)人工智能，或者超級(jí)智能增強(qiáng)的人類(lèi)遠(yuǎn)遠(yuǎn)超越，權(quán)力和資源會(huì)流向最聰明的智能體。

在人類(lèi)的發(fā)展進(jìn)程中，AI的替代將是不可避免的。

薩頓認(rèn)為，人類(lèi)的獨(dú)特之處在于“把設(shè)計(jì)推向極致”，創(chuàng)造出能自己設(shè)計(jì)的事物，這也正是今天通過(guò)AI所追求的目標(biāo)。

人類(lèi)至少是催化劑，是助產(chǎn)士，更是開(kāi)啟宇宙第四大時(shí)代——“設(shè)計(jì)時(shí)代”的先驅(qū)。

“AI是宇宙演化的必然下一步，我們應(yīng)以勇氣、自豪和冒險(xiǎn)精神來(lái)迎接它。”薩頓說(shuō)。

以下是理查德·薩頓演講全文：

很高興在2025年外灘大會(huì)上發(fā)言，我的主題是人工智能。

在接下來(lái)的發(fā)言中，我將圍繞這個(gè)主題談三個(gè)方面：我想談?wù)効茖W(xué)發(fā)展趨勢(shì)，政治影響，以及哲學(xué)意義。

01.

數(shù)據(jù)紅利逼近極限，AI進(jìn)入“經(jīng)驗(yàn)時(shí)代”

我們處在“人類(lèi)數(shù)據(jù)時(shí)代”。AI被訓(xùn)練來(lái)預(yù)測(cè)人類(lèi)的語(yǔ)言和標(biāo)簽，并由人類(lèi)專(zhuān)家不斷微調(diào)。

今天大多數(shù)機(jī)器學(xué)習(xí)的目的，是把人類(lèi)已有的知識(shí)轉(zhuǎn)移到一個(gè)靜態(tài)、沒(méi)有自主學(xué)習(xí)能力的AI上。

但是，我們逐漸開(kāi)始達(dá)到人類(lèi)數(shù)據(jù)的極限，我們開(kāi)始意識(shí)到，這種方法通常無(wú)法生成新的知識(shí)，它并不適合持續(xù)學(xué)習(xí)，它不能持續(xù)不斷地學(xué)習(xí)，而持續(xù)學(xué)習(xí)對(duì)智能的效用至關(guān)重要。

播客主持人Dwarkesh Patel意識(shí)到了這一點(diǎn)。他在播客中說(shuō)：“但根本問(wèn)題在于，大語(yǔ)言模型并不會(huì)隨時(shí)間推移而變得更聰明，這和人類(lèi)不一樣。這種缺乏持續(xù)學(xué)習(xí)能力的情況，是一個(gè)非常非常大的瓶頸。在很多任務(wù)上，大模型的基準(zhǔn)表現(xiàn)可能優(yōu)于人類(lèi)的平均水平，但我們沒(méi)辦法給模型提供高層次的反饋，只能接受它本身自帶的能力，只能不斷折騰調(diào)整提示詞，但在實(shí)踐中，這根本達(dá)不到人類(lèi)那種學(xué)習(xí)和進(jìn)步的程度。人類(lèi)真正的優(yōu)勢(shì)，并不在于單純的智力極限，而在于他們能夠不斷積累上下文，反思失敗，并在實(shí)踐中一點(diǎn)點(diǎn)改進(jìn)、提升效率。”

關(guān)于“智能”的根本科學(xué)爭(zhēng)議是，它究竟是大量知識(shí)的積累，還是快速學(xué)習(xí)的能力。

當(dāng)然，智能只是一個(gè)詞，我們可以按自己的意愿使用它，但我們應(yīng)該清楚它歷來(lái)是如何被使用的。

我們看看傳統(tǒng)的智力測(cè)量方法，也就是“智商”，或者IQ，它等于你掌握的知識(shí)量除以你所積累的經(jīng)驗(yàn)。所以，在我看來(lái)這個(gè)定義正是在衡量學(xué)習(xí)的速度，學(xué)習(xí)速度，是常識(shí)所理解的“智力”的關(guān)鍵。

現(xiàn)在我們正進(jìn)入“經(jīng)驗(yàn)時(shí)代”，我們需要一種新的數(shù)據(jù)源，它隨著智能體的變強(qiáng)大而不斷增長(zhǎng)和完善，就像電腦游戲中的自我博弈一樣。

這類(lèi)數(shù)據(jù)也可以不依賴(lài)自我博弈，而是由智能體以第一人稱(chēng)與世界互動(dòng)直接生成，我稱(chēng)之為“經(jīng)驗(yàn)”。這正是人類(lèi)和其他動(dòng)物的學(xué)習(xí)方式，也是 AlphaGo 創(chuàng)造第“37 步”的方式，也是AlphaProof近期在國(guó)際數(shù)學(xué)奧林匹克中獲得了銀牌的方式。

觀察嬰兒與各種玩具玩耍的視頻，我們會(huì)看到他所獲取的數(shù)據(jù)，取決于他自己的一舉一動(dòng)。孩子和這個(gè)玩具玩一段時(shí)間，然后轉(zhuǎn)向下一件玩具，所以他獲得的數(shù)據(jù)由他的行為決定。關(guān)鍵在于，我們需要與智能體的智力水平和認(rèn)知發(fā)展相匹配的數(shù)據(jù)，這正是可以從自身經(jīng)驗(yàn)里得到的東西。

關(guān)于經(jīng)驗(yàn)思維模式，是智能體與世界交換信號(hào)，這些信號(hào)構(gòu)成了它的“經(jīng)驗(yàn)”。

我這里說(shuō)的“經(jīng)驗(yàn)”，并不是含糊的概念，而是指這三項(xiàng)很具體的要素：觀察、行動(dòng)和獎(jiǎng)勵(lì)。這三種信號(hào)在智能體與世界之間來(lái)回傳遞，這就是我定義的“經(jīng)驗(yàn)”——這是生命的數(shù)據(jù)。

所以我很篤定認(rèn)為，知識(shí)來(lái)自于經(jīng)驗(yàn)，因此可以從經(jīng)驗(yàn)中學(xué)習(xí)。一個(gè)智能體的智能程度，取決于它能預(yù)測(cè)并控制自身輸入信號(hào)的程度，特別是獎(jiǎng)勵(lì)信號(hào)。經(jīng)驗(yàn)是一切智能的核心與基礎(chǔ)，這就是基于經(jīng)驗(yàn)的思維方式。強(qiáng)化學(xué)習(xí)領(lǐng)域正是基于這種思維方式。

總而言之，在人工智能未來(lái)的科學(xué)趨勢(shì)上，未來(lái)如果能創(chuàng)造出超級(jí)智能體和由超級(jí)智能增強(qiáng)的人類(lèi)，將為世界帶來(lái)純粹的福祉。

完全智能的智能體必須從經(jīng)驗(yàn)中學(xué)習(xí)，這超出了大型語(yǔ)言模型的范疇，令人驚嘆且實(shí)用，將作為世界知識(shí)的可定制接口。

我們已經(jīng)使用強(qiáng)化學(xué)習(xí)進(jìn)入了新的經(jīng)驗(yàn)時(shí)代，但要釋放經(jīng)驗(yàn)的全部潛力，還需要我們現(xiàn)在還不具備的持續(xù)學(xué)習(xí)和元學(xué)習(xí)技術(shù)。

02.

AI已經(jīng)被高度政治化，

對(duì)AI的恐懼被夸大

現(xiàn)在，我想對(duì)AI的政治影響談一點(diǎn)看法。

首先要指出的是，今天AI已經(jīng)成為高度政治化的議題。AI是國(guó)家地緣政治競(jìng)爭(zhēng)的焦點(diǎn)，公眾也感到恐懼。除地緣政治之外，公眾擔(dān)心AI會(huì)帶來(lái)偏見(jiàn)、失業(yè)甚至導(dǎo)致人類(lèi)滅絕。

一些國(guó)家正在陸續(xù)立法，限制AI模型的能力，更有人呼吁暫停AI研究，將其與核武器和生物武器相提并論。

總而言之，對(duì)人工智能的規(guī)制、管控和對(duì)齊的呼聲此起彼伏，這就是現(xiàn)實(shí)：AI已經(jīng)被高度政治化。

我的觀點(diǎn)是，這種對(duì)AI的恐懼被夸大了，并且是被某些從中獲利的組織和個(gè)人煽動(dòng)起來(lái)的。

但實(shí)際上，這些問(wèn)題在人類(lèi)幾千年來(lái)一直在應(yīng)對(duì)的挑戰(zhàn)并無(wú)不同。

讓我們提出一個(gè)問(wèn)題，在一個(gè)由智能體構(gòu)成的社會(huì)里，類(lèi)似人類(lèi)社會(huì)，在一個(gè)人工智能社會(huì)，“目標(biāo)是唯一的，還是多元的？”

在強(qiáng)化學(xué)習(xí)中，我認(rèn)為這是明確的，每個(gè)智能體都有自己的目標(biāo)，也有自己的獎(jiǎng)勵(lì)。同樣，在自然界中，每只動(dòng)物都有它自己的痛苦和快樂(lè)。

回看我們的經(jīng)濟(jì)，只有當(dāng)每個(gè)人有不同的目標(biāo)和能力，經(jīng)濟(jì)才能運(yùn)行得最好。經(jīng)濟(jì)并不真正依賴(lài)于人們擁有共同目標(biāo)，盡管我們常把這類(lèi)說(shuō)法掛在嘴邊。

只要我們審視現(xiàn)實(shí)世界、經(jīng)濟(jì)和社會(huì)，我們可以說(shuō)智能體也能夠共存，不同的智能體可以和平共處，即便它們的目標(biāo)不同，我們并不需要所有人都對(duì)齊同一個(gè)目標(biāo)。

為了進(jìn)一步展開(kāi)，我需要多說(shuō)明幾句。

我們需要定義兩個(gè)詞：“去中心化”的定義是每個(gè)智能體追求自己的目標(biāo)，這正是我們經(jīng)濟(jì)體系的運(yùn)行方式；“協(xié)作”，就是目標(biāo)不同的智能體，通過(guò)互動(dòng)實(shí)現(xiàn)雙贏。

我認(rèn)為，協(xié)作就是我們的偉大超能力，人類(lèi)最卓越的超能力就在于我們比其他任何動(dòng)物都更擅長(zhǎng)協(xié)作。

協(xié)作之所以能實(shí)現(xiàn)，在于語(yǔ)言和貨幣——這兩樣都是人類(lèi)獨(dú)有的。

人類(lèi)最偉大的成功在于協(xié)作本身：經(jīng)濟(jì)、市場(chǎng)與政府。

人類(lèi)的重大失敗正是協(xié)作失?。簯?zhàn)爭(zhēng)、偷竊與腐敗。

“去中心化協(xié)作”是“共同目標(biāo)”的替代方案，在我看來(lái)，“去中心化協(xié)作”更優(yōu)雅，它更可持續(xù)、更強(qiáng)韌、更靈活，適應(yīng)性更強(qiáng)，它并不需要控制人們的目標(biāo)。

正如我所說(shuō)，人類(lèi)比其他任何動(dòng)物都擅長(zhǎng)協(xié)作，但我們?nèi)匀蛔龅眠h(yuǎn)遠(yuǎn)不夠。我們?nèi)匀挥袘?zhàn)爭(zhēng)、盜竊，我們?nèi)匀挥懈瘮?、欺詐。協(xié)作之路依然很艱難，協(xié)作并非總能達(dá)成，至少需要兩個(gè)代理人互相信任。一旦協(xié)作缺失，總有人能從中獲利：軍火商、獨(dú)裁者、騙子、盜賊。

因此，協(xié)作必須依靠制度：既要促進(jìn)協(xié)作，還要懲治騙子、欺詐者和勒索者。中心化的機(jī)構(gòu)能幫助協(xié)作實(shí)現(xiàn)，他們可以懲罰盜賊和作弊者，但如果中心化機(jī)構(gòu)走向僵化，長(zhǎng)遠(yuǎn)來(lái)看也會(huì)阻礙協(xié)作。

放眼當(dāng)下，有很多呼聲希望對(duì)AI進(jìn)行中心化控制：對(duì)齊AI的目標(biāo)，暫停甚至終止AI研究，限制可投入的算力，限制AI行業(yè)的競(jìng)爭(zhēng)程度，或借此確保AI的安全。這些主張如出一轍，根源都是恐懼，說(shuō)到底，這都是基于“我們對(duì)他們”的思維，認(rèn)為他人不可信任，妖魔化對(duì)方。

所以我認(rèn)為這不過(guò)是人類(lèi)的一種天然傾向，我們必須清醒地認(rèn)識(shí)到，這種傾向也在向AI領(lǐng)域蔓延。

因此，關(guān)于AI的政治議題，我的核心結(jié)論是：AI和人類(lèi)繁榮都來(lái)自于去中心化協(xié)作。

協(xié)作并非總能實(shí)現(xiàn)，卻是世間一切美好的事物的源泉，我們必須尋求協(xié)作、支持協(xié)作，并致力將協(xié)作制度化。

此外，只要我們用自己的眼睛觀察，就能輕易看出誰(shuí)在鼓吹不信任，誰(shuí)在呼吁非協(xié)作和中心化控制，我們都應(yīng)該努力抵制這些呼聲。

這是一個(gè)有用的視角，來(lái)審視所有關(guān)于人類(lèi)與AI互動(dòng)的呼吁。

03.

四條原則預(yù)測(cè)AI未來(lái)，

人類(lèi)現(xiàn)有智能將被大幅超越

最后，我想談?wù)凙I與哲學(xué)。

我認(rèn)為，AI是人類(lèi)最古老的追求之一，它并不是陌生的外來(lái)技術(shù)，而是與人類(lèi)的本性高度相似。

數(shù)千年來(lái)，哲學(xué)家和普通人都在努力理解自己，一直對(duì)內(nèi)在的運(yùn)作機(jī)制充滿(mǎn)好奇：我們的心智是如何運(yùn)作的？又該如何讓它運(yùn)作得更好？這不是自戀，而是一場(chǎng)宏大的求索。

智能是宇宙中最偉大的力量之一，如果能理解它，人類(lèi)就會(huì)變得更強(qiáng)大、更有能力。

理解智能，是科學(xué)與人文學(xué)科共同追尋的圣杯，它是一個(gè)偉大而榮耀的獎(jiǎng)賞。

然而，我們依然心懷恐懼和憂慮。

那么，讓我們暫且擱置“想要或不想要什么”的擔(dān)憂，讓我們盡量以最現(xiàn)實(shí)的方式來(lái)去預(yù)測(cè)、去展望。

所以，我提出四條原則，來(lái)現(xiàn)實(shí)地預(yù)測(cè)對(duì)AI的未來(lái)：

第一，對(duì)世界應(yīng)該如何運(yùn)轉(zhuǎn)，全球并沒(méi)有統(tǒng)一的意見(jiàn)，沒(méi)有哪一種看法能夠凌駕于所有其他觀點(diǎn)之上。

第二，總有一天，人類(lèi)將真正理解智能，并借助技術(shù)將其創(chuàng)造出來(lái)——我們一定能做到。

第三，這個(gè)過(guò)程不會(huì)止步于當(dāng)今人類(lèi)的智能水平，很快，它將會(huì)被遠(yuǎn)遠(yuǎn)超越，無(wú)論是超級(jí)人工智能，還是增強(qiáng)的人類(lèi)，都將遠(yuǎn)遠(yuǎn)超越這一水平，但無(wú)論如何，當(dāng)前人類(lèi)現(xiàn)有的智能將被大幅超越。

第四條原則：隨著時(shí)間的推移，權(quán)力和資源必然會(huì)流向最聰明的智能體。

所以，這必然把我們帶到這樣一個(gè)結(jié)論：在人類(lèi)的發(fā)展進(jìn)程中，AI的替代是不可避免的。

但這本身仍是一種自我中心，以人類(lèi)為中心的視角。

如果從宇宙的視角來(lái)看，這一切又是怎樣的呢？

我傾向把宇宙歷史劃分為四個(gè)時(shí)代：粒子時(shí)代、恒星時(shí)代，接下來(lái)進(jìn)入我們通常稱(chēng)為“生命時(shí)代”，但我更愿意稱(chēng)為“復(fù)制者時(shí)代”，因?yàn)樵诮裉炜磥?lái)，生命幾乎就是一臺(tái)機(jī)器——一臺(tái)生物機(jī)器。

在第四個(gè)時(shí)代——機(jī)器與設(shè)計(jì)時(shí)代——這些被設(shè)計(jì)出來(lái)的機(jī)器正越來(lái)越像生命。所以，我更愿意稱(chēng)它為“復(fù)制者時(shí)代”，因?yàn)槿缃竦纳锵到y(tǒng)，本質(zhì)上就是能夠自我復(fù)制、不斷繁衍自身的體系。

我們正走向這樣一個(gè)時(shí)代：周?chē)絹?lái)越多的事物，都是由人類(lèi)設(shè)計(jì)的。

所謂“設(shè)計(jì)”，指的是它們最初僅存在于某個(gè)設(shè)計(jì)者的頭腦中——可能是人，也可能是一臺(tái)機(jī)器——然后才被創(chuàng)造出來(lái)。

環(huán)顧你所在的房間，幾乎所有東西都是設(shè)計(jì)的產(chǎn)物：建筑是設(shè)計(jì)出來(lái)的，椅子是設(shè)計(jì)出來(lái)的，屏幕是設(shè)計(jì)出來(lái)的，唯一沒(méi)有經(jīng)過(guò)設(shè)計(jì)的，當(dāng)然是人類(lèi)，我們是復(fù)制的產(chǎn)物。經(jīng)過(guò)設(shè)計(jì)的事物越來(lái)越多，正在占據(jù)主導(dǎo)地位。

現(xiàn)在我們可以直接進(jìn)入一個(gè)問(wèn)題：我們的角色是什么？人類(lèi)是什么？人類(lèi)在宇宙中的角色是什么？我們能否冷靜，并且不傲慢地回答這個(gè)問(wèn)題？我們都感到人類(lèi)是特別的，并不只是另一種復(fù)制品，那么究竟特殊在哪里？

我認(rèn)為人類(lèi)的獨(dú)特之處在于：作為復(fù)制者，我們將設(shè)計(jì)提升到了前所未有的高度。

將設(shè)計(jì)推向極致意味著什么？推向極限，能走多遠(yuǎn)？我覺(jué)得答案其實(shí)很明確，至少在可預(yù)見(jiàn)的將來(lái)，把設(shè)計(jì)推向極致，就是創(chuàng)造出能自己進(jìn)行設(shè)計(jì)的事物。這正是我們今天通過(guò)人工智能所追求的目標(biāo)。

所以，我將這一點(diǎn)作為我對(duì)“人類(lèi)是什么”的答案：人類(lèi)至少是催化劑，是助產(chǎn)士，更是開(kāi)啟宇宙第四大時(shí)代——“設(shè)計(jì)時(shí)代”的先驅(qū)。

04.

結(jié)語(yǔ)：我們應(yīng)以勇氣、

自豪和冒險(xiǎn)精神來(lái)迎接AI

這就是我今天分享的三點(diǎn)：

在科技趨勢(shì)上，2020年代的AI，也就是人類(lèi)數(shù)據(jù)時(shí)代，有卓越的表現(xiàn)。但我相信，我們正在進(jìn)入一個(gè)全新的 “經(jīng)驗(yàn)時(shí)代”，潛力將遠(yuǎn)超以往，因?yàn)樗梢酝ㄟ^(guò)經(jīng)驗(yàn)不斷學(xué)習(xí)新知識(shí)。

關(guān)于AI的政治議題，我認(rèn)為，AI的政治議題，是人類(lèi)的映射。

最后，在哲學(xué)層面，我認(rèn)為，AI是宇宙演化的必然下一步，我們應(yīng)以勇氣、自豪和冒險(xiǎn)精神來(lái)迎接它。

非常感謝大家的聆聽(tīng)。

閱讀最新前沿科技趨勢(shì)報(bào)告，請(qǐng)?jiān)L問(wèn)歐米伽研究所的“未來(lái)知識(shí)庫(kù)”

https://wx.zsxq.com/group/454854145828

未來(lái)知識(shí)庫(kù)是“ 歐米伽未來(lái)研究所”建立的在線知識(shí)庫(kù)平臺(tái)，收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級(jí)智能，數(shù)智大腦、能源、軍事、經(jīng)濟(jì)、人類(lèi)風(fēng)險(xiǎn)等等領(lǐng)域的前沿進(jìn)展與未來(lái)趨勢(shì)。目前擁有超過(guò)8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。歡迎掃描二維碼或訪問(wèn)https://wx.zsxq.com/group/454854145828進(jìn)入。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.