夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

他們在1993年就提出了Scaling Law

0
分享至

明敏 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

原來,Scaling Law在32年前就被提出了!

不是2020年的OpenAI、不是2017年的百度,而是1993年的貝爾實驗室。



在一篇名為《Learning Curves: Asymptotic Values and Rate of Convergence》的文章里提出一種預(yù)測方法:

訓(xùn)練誤差和測試誤差隨訓(xùn)練規(guī)模增加,都會收斂到同一個漸近誤差值,這種收斂符合冪律形式。

通過這種方法,研究人員可以預(yù)測模型在更大數(shù)據(jù)集上的表現(xiàn)。



這和現(xiàn)在大家常提的Scaling Law幾乎一致:

在合理的范圍內(nèi),通過簡單地增加模型參數(shù)量(N)、訓(xùn)練數(shù)據(jù)量(D)和計算量(FLOPS,C),可以以一種可預(yù)測的、平滑的方式顯著提升模型性能。

而1993年的這篇論文來頭也不小,作者一共5位,其中包含了支持向量機(jī)的提出者Vladimir Vapnik和Corinna Cortes。



為省算力提出預(yù)測曲線

這篇論文的研究初衷是為了節(jié)省訓(xùn)練分類器(classifiers)的計算資源(果然啥時候都缺算力)。

當(dāng)時的機(jī)器學(xué)習(xí)算法能實現(xiàn)將輸入數(shù)據(jù)分配到某個類別里,比如輸入一張手寫數(shù)字的像素點,判斷它是不是某一個數(shù)組。

為了讓分類器更可靠,往往需要使用大規(guī)模數(shù)據(jù)庫訓(xùn)練。但是研究人員并不確定分類器是否適合給定任務(wù),因此開發(fā)高效的預(yù)測程序非常有必要。

這項研究就是提出了一種預(yù)測方法,先在中等規(guī)模的數(shù)據(jù)集上訓(xùn)練,然后通過提出的學(xué)習(xí)曲線建模外推,預(yù)測其在大數(shù)據(jù)集上的表現(xiàn)。這樣就不用對分類器進(jìn)行完整訓(xùn)練,從而節(jié)省計算資源。

它首先在幾個中等規(guī)模訓(xùn)練集上分別計算測試誤差、訓(xùn)練誤差,然后他們發(fā)現(xiàn),隨著訓(xùn)練集的規(guī)模變大,訓(xùn)練誤差和測試誤差都會收斂到一個相同的漸近值a,這個指數(shù)a在0.5-1之間。



  • a:漸近誤差(最終無法消除的誤差,比如任務(wù)不可實現(xiàn)性導(dǎo)致的殘余錯誤)。
  • b,c:幅度參數(shù)。
  • α:收斂速率指數(shù)(通常在 0.5~1 之間)

然后變換為對數(shù)線性關(guān)系,在對數(shù)坐標(biāo)下得到兩條直線。



通過擬合這兩條直線能得到a,b,α。

將估計出的冪律曲線外推到更大的訓(xùn)練集規(guī)模上(比如60000),預(yù)測分類器在完整數(shù)據(jù)上的誤差。

實驗結(jié)果表明,在線性分類器(布爾分類任務(wù))中預(yù)測非常準(zhǔn)確。



在多層神經(jīng)網(wǎng)絡(luò)(如LeNet)中,即便在任務(wù)不可實現(xiàn)(non-realizable)的情況下,外推結(jié)果也能很好地預(yù)測大規(guī)模訓(xùn)練的最終表現(xiàn)。

比如僅用12000樣本訓(xùn)練,就能預(yù)測新CNN在60000樣本上會優(yōu)于舊CNN。



此外作者還發(fā)現(xiàn),任務(wù)越困難,漸近誤差越高,收斂速率越小,即學(xué)習(xí)越慢。



這個理論放在當(dāng)時可以用來淘汰差的模型,將有限的計算資源放在更值得訓(xùn)練的模型上。

作者也是支持向量機(jī)提出者

最后不得不提一下這篇研究的幾位作者。

首先來看Vladimir Vapnik,他因在統(tǒng)計學(xué)習(xí)理論和支持向量機(jī)方面的貢獻(xiàn)而聞名。



他于1958年在烏茲別克國立大學(xué)獲得數(shù)學(xué)碩士學(xué)位,并于1964年在莫斯科控制科學(xué)研究所獲得統(tǒng)計學(xué)博士學(xué)位。1961年至1990年期間,他一直在該研究所工作,并擔(dān)任計算機(jī)科學(xué)研究部門的負(fù)責(zé)人。

Vapnik與Alexey Chervonenkis在1960年至1990年間共同開發(fā)了Vapnik-Chervonenkis理論(也稱為VC理論)。該理論是計算學(xué)習(xí)理論的一種形式,旨在從統(tǒng)計學(xué)角度解釋學(xué)習(xí)過程。

它是統(tǒng)計學(xué)習(xí)理論的基石,為學(xué)習(xí)算法的泛化條件提供了理論基礎(chǔ),并量化了模型的復(fù)雜性(通過VC維)。VC理論在無需定義任何先驗分布的情況下,為機(jī)器學(xué)習(xí)提供了一種更通用的方法,與貝葉斯理論形成了對比。

同時Vapnik也是支持向量機(jī)(SVM)的主要發(fā)明者。這是一種監(jiān)督學(xué)習(xí)模型,用于數(shù)據(jù)分類和回歸分析。1964年,Vapnik和Chervonenkis首次提出了原始的SVM算法。

1990年代,Vapnik加入貝爾實驗室開始進(jìn)行機(jī)器學(xué)習(xí)方面的深入研究。在1992年他和Bernhard Boser、Isabelle Guyon提出了通過應(yīng)用“核技巧”(kernel trick)來創(chuàng)建非線性分類器的方法,極大地擴(kuò)展了SVM的應(yīng)用范圍,使其能夠處理非線性可分問題。

1995年Vapnik和Corinna Cortes提出了軟邊距的非線性SVM并將其應(yīng)用于手寫字符識別問題,因為性能表現(xiàn)出色,這篇論文引發(fā)廣泛關(guān)注,也成為機(jī)器學(xué)習(xí)發(fā)展中的一塊重要基石。



他撰寫的《統(tǒng)計學(xué)理論的本質(zhì)》也是機(jī)器學(xué)習(xí)領(lǐng)域的必讀著作之一。

以及他2014年還給Facebook當(dāng)過顧問。



另一位重要作者是Corinna Cortes。她現(xiàn)在是Google Research紐約分部的副總裁,負(fù)責(zé)廣泛的理論和應(yīng)用大規(guī)模機(jī)器學(xué)習(xí)問題研究。

她于1989年在哥本哈根大學(xué)尼爾斯·玻爾研究所獲得物理學(xué)碩士學(xué)位。隨后,她于1993年在羅切斯特大學(xué)獲得計算機(jī)科學(xué)博士學(xué)位。

在加入Google之前,Cortes在貝爾實驗室工作了十多年。

2022年她被任命為ACM Fellow,以表彰她對機(jī)器學(xué)習(xí)領(lǐng)域的貢獻(xiàn)。



其余幾位作者分別是:L. D. Jackel、Sara A. Solla和John S. Denker

其中John S. Denker還和LeCun在手寫識別上合作過多篇論文,也都是機(jī)器學(xué)習(xí)經(jīng)典大作了。





而他本人也相當(dāng)全能,涉獵領(lǐng)域包括機(jī)器學(xué)習(xí)、系統(tǒng)安全、好萊塢特效、電子游戲和視頻游戲等,完成了很多開創(chuàng)性工作。還曾在加州理工學(xué)院創(chuàng)建并教授“微處理器設(shè)計”課程(硅谷之所以成為硅谷,和當(dāng)時美國高校中開始推行芯片設(shè)計課程有很大關(guān)系)。

甚至,他還是一個飛行員,是FFA的航空安全顧問,并寫了一本對飛行原理解釋透徹的行業(yè)教科書。

Denker還曾于1986-87年擔(dān)任加州大學(xué)圣巴巴拉分校理論物理研究所的訪問教授。 他以幽默感和“原型瘋狂科學(xué)家”的形象而聞名,他的一些事跡甚至在一些電影中有所體現(xiàn)。



One More Thing

值得一提的是,卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)都誕生于貝爾實驗室。它們之間過一段“分庭抗禮”的時期。

在深度學(xué)習(xí)興起之前,CNN因為“黑盒”以及需要大規(guī)模訓(xùn)練,一些研究者對其持有保留態(tài)度;相比之下支持向量機(jī)的理論清晰、易于收斂到全局最優(yōu)解。到底誰是正確路線?一時爭論不休。

1995年,Vapnik還和當(dāng)時的上司Larry Jackel以一頓豪華晚餐打賭,到2000年時,人們能不能解釋清楚大型神經(jīng)網(wǎng)絡(luò)為什么在大規(guī)模訓(xùn)練中表現(xiàn)很好?

Vapnik覺得不能。2000年他贏了;隨后他們又賭,再過5年結(jié)果如何?這一次Vapnik錯了:

在2005年任何頭腦清醒的人都不會再用和1995年時完全相同的模型了。

這場賭局,LeCun是見證人。



論文地址:
https://proceedings.neurips.cc/paper/1993/file/1aa48fc4880bb0c9b8a3bf979d3b917e-Paper.pdf


[1]https://x.com/gdb/status/1962594235263427045
[2]https://yorko.github.io/2022/vapnik-jackel-bet/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“第一公子”顏值崩塌!19歲巴倫發(fā)福變油膩,為追女神封鎖整層樓

“第一公子”顏值崩塌!19歲巴倫發(fā)福變油膩,為追女神封鎖整層樓

小張帥
2025-10-18 13:36:44
領(lǐng)克放出“王炸”:高階智駕普及,16.58萬起開回家!

領(lǐng)克放出“王炸”:高階智駕普及,16.58萬起開回家!

高科技愛好者
2025-12-10 23:05:41
喀秋莎有多厲害?特等功臣回憶:一輪齊射后,美軍陣地幾乎沒活物

喀秋莎有多厲害?特等功臣回憶:一輪齊射后,美軍陣地幾乎沒活物

興趣知識
2025-11-29 20:30:53
字節(jié)、阿里:有意訂購 H200

字節(jié)、阿里:有意訂購 H200

云頭條
2025-12-10 22:02:05
亞馬爾不滿被換下摔臉!弗里克:下次讓他坐替補(bǔ)席

亞馬爾不滿被換下摔臉!弗里克:下次讓他坐替補(bǔ)席

運動全視界
2025-12-10 16:40:25
第四個大MVP!梅西獲得SofaScore評的MLS最佳球員獎!

第四個大MVP!梅西獲得SofaScore評的MLS最佳球員獎!

氧氣是個地鐵
2025-12-09 21:01:15
華為突然官宣:12月11日,新機(jī)降價!

華為突然官宣:12月11日,新機(jī)降價!

高科技愛好者
2025-12-10 23:06:39
國足未來第一左后衛(wèi):華裔球星90萬歐轉(zhuǎn)會費登陸波蘭聯(lián)賽!

國足未來第一左后衛(wèi):華裔球星90萬歐轉(zhuǎn)會費登陸波蘭聯(lián)賽!

邱澤云
2025-12-10 14:47:43
小混混的江湖道義6:老五泄憤

小混混的江湖道義6:老五泄憤

金昔說故事
2025-12-10 18:37:16
盧卡哈登的首節(jié),華茲的三節(jié),亞歷山大的末節(jié)

盧卡哈登的首節(jié),華茲的三節(jié),亞歷山大的末節(jié)

張佳瑋寫字的地方
2025-12-10 17:03:39
一旦開戰(zhàn)中國必。课覈菏颗鲬(zhàn)派,要懂得甲午戰(zhàn)爭的慘敗

一旦開戰(zhàn)中國必?我國著名院士批主戰(zhàn)派,要懂得甲午戰(zhàn)爭的慘敗

文史旺旺旺
2025-11-14 20:30:09
西部亂象!國王重建,鵜鶘撿到寶,馬刺拒絕字母哥,狀元郎最尷尬

西部亂象!國王重建,鵜鶘撿到寶,馬刺拒絕字母哥,狀元郎最尷尬

體育大朋說
2025-12-09 22:07:06
為啥古代嬪妃總動不動流產(chǎn)?看完這妃子身材動作我算整明白了哈哈

為啥古代嬪妃總動不動流產(chǎn)?看完這妃子身材動作我算整明白了哈哈

斗圖
2025-12-09 22:02:59
一家三口確診肝癌!轉(zhuǎn)告家人:冰箱久放的5種食物,是癌癥誘因

一家三口確診肝癌!轉(zhuǎn)告家人:冰箱久放的5種食物,是癌癥誘因

蜉蝣說
2025-11-30 08:25:09
巴基斯坦從中國買什么,我就從中國買什么,買回去一起打印度

巴基斯坦從中國買什么,我就從中國買什么,買回去一起打印度

阿柒的訊
2025-12-09 19:38:16
若我們這代人不收復(fù)臺灣,下代人統(tǒng)一時,或會直接將臺灣打成廢墟

若我們這代人不收復(fù)臺灣,下代人統(tǒng)一時,或會直接將臺灣打成廢墟

尋途
2025-10-20 13:48:43
最新!孟村殺妻案主犯死刑,開假證明醫(yī)生僅停職,隱身父親成謎

最新!孟村殺妻案主犯死刑,開假證明醫(yī)生僅停職,隱身父親成謎

胡嚴(yán)亂語
2025-12-10 20:41:10
舒淇在節(jié)目里第一次承認(rèn),她和馮德倫為了要孩子已經(jīng)折騰了九年。

舒淇在節(jié)目里第一次承認(rèn),她和馮德倫為了要孩子已經(jīng)折騰了九年。

歲月有情1314
2025-11-29 15:40:25
記者:蘇亞雷斯已經(jīng)告知烏拉圭民族隊他不會回歸

記者:蘇亞雷斯已經(jīng)告知烏拉圭民族隊他不會回歸

懂球帝
2025-12-10 10:18:27
克內(nèi)克特和女友近照:年薪401萬,下滑明顯,女友是性感網(wǎng)紅

克內(nèi)克特和女友近照:年薪401萬,下滑明顯,女友是性感網(wǎng)紅

大西體育
2025-12-10 16:07:06
2025-12-11 00:56:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11837文章數(shù) 176338關(guān)注度
往期回顧 全部

科技要聞

防"走私",英偉達(dá)被曝開發(fā)“芯片定位”技術(shù)

頭條要聞

男子被上海民警騙去"見面"結(jié)果毒檢陽性 被逼寫認(rèn)罪書

頭條要聞

男子被上海民警騙去"見面"結(jié)果毒檢陽性 被逼寫認(rèn)罪書

體育要聞

試訓(xùn)20支球隊,落選,成為NBA新秀助攻王

娛樂要聞

為何網(wǎng)友不再相信張柏芝的“故事”?

財經(jīng)要聞

對話陳志武:特朗普嚴(yán)重誤判中國!

汽車要聞

有動力操控 有智能座艙 6萬多的第五代帝豪掀桌子了

態(tài)度原創(chuàng)

藝術(shù)
教育
親子
時尚
本地

藝術(shù)要聞

40張海邊撒野照片,真是太有創(chuàng)意了!

教育要聞

【寫就有分】考場瞎編技巧之名詞解釋

親子要聞

冀連梅 | 哪些孩子需要吃藥預(yù)防流感?美國兒科學(xué)會為什么建議首選奧司他韋作為預(yù)防藥物?

這些才是普通人都該學(xué)的冬季穿搭!不浮夸、不單薄,自然保暖

本地新聞

打工人夢想中的生活,寵物已經(jīng)提前過上了

無障礙瀏覽 進(jìn)入關(guān)懷版 美女自拍偷拍一级黄色片自拍偷拍美女!!!| 国产精品日日摸夜夜添夜夜添无码 | 毛片免费视频鸡巴大| 亚洲免费簧片| 色亚洲乱伦f| 无码色av一二区在线播放| 国产福利在线免费观看| 2012日日夜夜欢干天天| 精品一区二区三区自拍图片区 | 你懂的视频在线播放 | 天天爱天天色天天| 我故意没有穿内裤坐公车让视频 | 亚洲AⅤ无码日韩AV中文AV伦| 邻居少妇张开腿让我爽了在线观看| 午夜福利50集在线看| 调教在线播放黄| 国产又爽又黄无码无遮挡在线观看| 亚洲偷偷婷婷| 高潮潮喷视频| 亚洲中文无码精品卡通| 美女无毛一区| 国产精品一区二区三区激情| AV首页在线| 美女张开腿黄网站免费| 樱桃视频在线视频观看| 伦理片一区二区| 免费观看成人毛片视频| 欧美在线一片| 推油少妇久久99久久99久久| 欧美老少配孩交| 国产精品性无码| 久久久免费无码成人影片| 狠人干练合综合网| 激情综合五月| 午夜精品久久久久成人| 九色精品国产亚洲AV麻豆一| 99久久久国产精品免费动| av中文字幕潮喷人妻系列| 中文字幕在线无码一区二区三区| 午夜一区伊人高潮喷水| caoprom人人操人人操人人|