嬰兒智能中隱藏著智能的三大秘密,即具有明確的目標(biāo)、可從反正面經(jīng)驗(yàn)中學(xué)習(xí)、具有預(yù)測(cè)能力。嬰兒智能中所隱藏的這些“智能的秘密”是理解人類認(rèn)知和學(xué)習(xí)機(jī)制的重要線索,也是當(dāng)前人工智能研究(尤其是發(fā)展式人工智能、認(rèn)知計(jì)算、強(qiáng)化學(xué)習(xí)等領(lǐng)域)試圖模擬和借鑒的核心要素,與人機(jī)環(huán)境生態(tài)智能系統(tǒng)密切相關(guān)。
1、具有明確的目標(biāo)
嬰兒雖然看似“什么都不懂”,但他們的行為并非隨機(jī),而是以生存和發(fā)展為核心目標(biāo)驅(qū)動(dòng)的。例如,他們會(huì)主動(dòng)尋找母親的乳頭(覓食目標(biāo)),對(duì)熟悉的面孔微笑(社交聯(lián)結(jié)目標(biāo)),反復(fù)扔?xùn)|西觀察掉落(因果探索目標(biāo))。這些目標(biāo)并非顯式“知道”,而是通過內(nèi)在動(dòng)機(jī)系統(tǒng)(如好奇心、安全感、舒適感)隱式引導(dǎo)行為。也就是說,智能體不需要“理解”目標(biāo)的高級(jí)語(yǔ)義,只需內(nèi)在評(píng)估機(jī)制(如獎(jiǎng)勵(lì)/懲罰、誤差最小化)即可產(chǎn)生目標(biāo)導(dǎo)向行為。這在AI中對(duì)應(yīng)內(nèi)在動(dòng)機(jī)、好奇心驅(qū)動(dòng)學(xué)習(xí)。
2、可從反正面經(jīng)驗(yàn)中學(xué)習(xí)
嬰兒是極端高效的終身學(xué)習(xí)者。他們通過極少的數(shù)據(jù)快速掌握復(fù)雜技能,如語(yǔ)言、物理規(guī)律、社會(huì)規(guī)則。其學(xué)習(xí)機(jī)制包括統(tǒng)計(jì)學(xué)習(xí),從語(yǔ)音流中提取詞匯邊界(Saffran et al., 1996);因果推理,9個(gè)月嬰兒就能理解“支持關(guān)系”(物體不能懸空);模仿與類比,通過觀察他人行為推斷意圖(Meltzoff的“像 me”理論);預(yù)測(cè)編碼,大腦持續(xù)預(yù)測(cè)感官輸入,誤差驅(qū)動(dòng)學(xué)習(xí)(Friston的“自由能原理”)。嬰兒的學(xué)習(xí)是無(wú)監(jiān)督/自監(jiān)督+少量監(jiān)督的混合,依賴預(yù)測(cè)誤差和結(jié)構(gòu)抽象,而非大數(shù)據(jù)暴力擬合,AI中對(duì)應(yīng)元學(xué)習(xí)、世界模型、預(yù)測(cè)編碼網(wǎng)絡(luò)。
3、具有預(yù)測(cè)能力
嬰兒的大腦是預(yù)測(cè)機(jī)器。他們不斷構(gòu)建關(guān)于世界的內(nèi)部模型,用于預(yù)測(cè)下一步會(huì)發(fā)生什么,6個(gè)月嬰兒對(duì)“違反物理預(yù)期”的事件(如物體穿墻)表現(xiàn)出更長(zhǎng)注視(Baillargeon的“違反期望”實(shí)驗(yàn));他們通過預(yù)測(cè)他人行為來(lái)區(qū)分“有意圖”與“偶然”動(dòng)作(Woodward, 1998);甚至能預(yù)測(cè)簡(jiǎn)單社交互動(dòng)中的“回報(bào)”(如微笑是否得到回應(yīng))。所以,智能的核心不僅是反應(yīng),更是主動(dòng)預(yù)測(cè)未來(lái)并最小化預(yù)測(cè)誤差。AI中對(duì)應(yīng)世界模型、模型預(yù)測(cè)控制(MPC)、主動(dòng)推理。
總之,表面上看,嬰兒智能的“三把鑰匙”與AI的映射分別表現(xiàn)為:嬰兒認(rèn)知機(jī)制具有明確目標(biāo),內(nèi)在動(dòng)機(jī)(好奇心、安全感),AI對(duì)應(yīng)技術(shù)是內(nèi)在獎(jiǎng)勵(lì)、好奇心驅(qū)動(dòng)的RL;嬰兒可以從經(jīng)驗(yàn)學(xué)習(xí),能夠統(tǒng)計(jì)學(xué)習(xí)+因果推理+預(yù)測(cè)誤差,AI對(duì)應(yīng)的技術(shù)是元學(xué)習(xí)、自監(jiān)督學(xué)習(xí)、世界模型;嬰兒預(yù)測(cè)能力體現(xiàn)在內(nèi)部模型+違反期望檢測(cè),AI對(duì)應(yīng)的技術(shù)是預(yù)測(cè)編碼、生成模型、主動(dòng)推理。更深層上的分析,嬰兒智能的真正秘密,或許在于“發(fā)展”本身——不是“天生聰明”,而是通過身體與環(huán)境、通過自主與自我持續(xù)交互,逐步構(gòu)建具身智能、離身智能與反身智能。
這意味著智能并不是靜態(tài)算法,而是動(dòng)態(tài)發(fā)展過程;身體(具身、離身、反身性)和社交(他人、符號(hào)、自我)是認(rèn)知的組成部分;學(xué)習(xí)不是任務(wù)導(dǎo)向,而是生存導(dǎo)向。因而,未來(lái)AI的突破,可能不在于“更大的模型”,而在于像嬰兒一樣:從一無(wú)所知開始,在真實(shí)世界中自己學(xué)會(huì)思考。
附錄說明:預(yù)測(cè)編碼
預(yù)測(cè)編碼(Predictive Coding)是近年來(lái)認(rèn)知科學(xué)和神經(jīng)科學(xué)中最具顛覆性的理論之一。它認(rèn)為大腦不是被動(dòng)接收信息的“刺激-反應(yīng)機(jī)器”,而是主動(dòng)生成預(yù)測(cè)的“假設(shè)-驗(yàn)證機(jī)器”,即 “你看到的不是世界本身,而是大腦對(duì)世界‘應(yīng)該是什么樣子’的預(yù)測(cè)。”
預(yù)測(cè)編碼核心原理是最小化預(yù)測(cè)誤差,預(yù)測(cè)編碼框架由Karl Friston等人發(fā)展,核心方程是自由能原理(Free Energy Principle):
大腦 ≡ 預(yù)測(cè)機(jī)器
目標(biāo) ≡ 最小化預(yù)測(cè)誤差(即感官輸入與內(nèi)部模型的差異)
例如,你看到一張模糊的狗的照片,大腦會(huì):
(1)自上而下生成預(yù)測(cè):“這應(yīng)該是一只狗”;
(2)自下而上接收感官信號(hào):模糊邊緣、棕色毛發(fā);
(3)比較:如果預(yù)測(cè)足夠解釋信號(hào),你就“看到狗”;
(4)如果誤差太大(比如突然發(fā)現(xiàn)有翅膀),大腦更新預(yù)測(cè):“可能是蝙蝠?”
感知 = 預(yù)測(cè)與感官信號(hào)的折中;學(xué)習(xí) = 更新模型以減少未來(lái)誤差;注意 = 分配更多資源給高誤差區(qū)域(“誤差顯著性”)。
嬰兒中的預(yù)測(cè)編碼證據(jù)
實(shí)驗(yàn)1:違反期望(Violation of Expectation)
場(chǎng)景:5個(gè)月嬰兒看汽車穿過墻壁的動(dòng)畫。
結(jié)果:嬰兒盯著更久(高預(yù)測(cè)誤差)。
解釋:嬰兒的“物理模型”預(yù)測(cè)“固體不能穿透”,誤差觸發(fā)注意和學(xué)習(xí)。
實(shí)驗(yàn)2:音頻預(yù)測(cè)
場(chǎng)景:嬰兒聽到“ba ba ba”重復(fù),突然變成“ba ba bi”。
結(jié)果:嬰兒大腦前額葉出現(xiàn)誤差信號(hào)(EEG的MMN成分)。
解釋:聽覺皮層預(yù)測(cè)“下一個(gè)音是ba”,誤差驅(qū)動(dòng)模型更新。
預(yù)測(cè)編碼的層級(jí)結(jié)構(gòu)
大腦以層級(jí)生成模型工作:
高階,抽象概念(“這是一只狗”),如“狗會(huì)叫”
中階,物體特征(“毛茸茸+四腿”),如“邊緣是 curved”
低階,原始感官(“棕色像素塊”),如“光強(qiáng)在 x, y 位置增加”
誤差反向傳播:高階預(yù)測(cè)被送到低階,解釋不了的誤差向上傳遞,驅(qū)動(dòng)高層更新。
AI中的預(yù)測(cè)編碼
1. PredNet(2016,MIT)
架構(gòu):卷積神經(jīng)網(wǎng)絡(luò)模擬層級(jí)預(yù)測(cè)編碼。
訓(xùn)練:預(yù)測(cè)下一幀視頻,最小化預(yù)測(cè)誤差。
能力:自發(fā)學(xué)會(huì)運(yùn)動(dòng)檢測(cè)、物體邊界,無(wú)需標(biāo)簽。
2. 主動(dòng)推理(Active Inference)
思想:智能體通過行動(dòng)減少預(yù)測(cè)誤差(而不僅僅是更新模型)。
例子:機(jī)器人看到杯子在桌邊(預(yù)測(cè)“會(huì)掉”),于是伸手推回去(主動(dòng)消除誤差)。
3. 生成模型(如VAE, diffusion)
本質(zhì):學(xué)習(xí)數(shù)據(jù)的生成預(yù)測(cè),新樣本 = 從預(yù)測(cè)模型采樣。
爭(zhēng)議與挑戰(zhàn)
1、誤差誰(shuí)定義? 預(yù)測(cè)誤差需要先驗(yàn)(如“物體不能懸浮”),這些先驗(yàn)從哪來(lái)?
2、計(jì)算成本,層級(jí)反向傳播是否能在生物神經(jīng)元實(shí)現(xiàn)?(有理論稱由反饋連接完成)
3、意識(shí)難題,預(yù)測(cè)編碼能解釋無(wú)意識(shí)感知,但如何解釋主觀體驗(yàn)仍開放。
預(yù)測(cè)編碼的“三句話”
1. 大腦是貝葉斯預(yù)測(cè)機(jī):先驗(yàn) + 感官 = 后驗(yàn)。
2. 感知 = 可控的幻覺:你“看到”的是大腦最佳猜測(cè)。
3. 學(xué)習(xí) = 降低驚奇,智能體(嬰兒或AI)通過更新模型或改變world來(lái)減少誤差。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.