夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

ChatGPT6,自主進(jìn)化的大模型

0
分享至

在計(jì)算機(jī)博士里,我日常除了創(chuàng)業(yè)與做產(chǎn)品工作,最大的時(shí)間花費(fèi)就是看別人的論文了,其中我最近看到一篇文章,可以說是未來所有大模型的發(fā)展方向,以及實(shí)現(xiàn)方法。

其論文提到了在強(qiáng)化學(xué)習(xí)、監(jiān)督學(xué)習(xí)之外,另外一種優(yōu)化模型的方式,通過監(jiān)督每次模型生成的機(jī)制(可以理解為prompt),從而對(duì)比結(jié)果,將結(jié)果好的prompt繼續(xù)優(yōu)化再來訓(xùn)練。

并且支持自己內(nèi)容生成,將生成的內(nèi)容可以用于做模型訓(xùn)練。

也就是AI模型的自我進(jìn)化

在論文開頭,論文就提到了一個(gè)比喻,模仿學(xué)生在考試前,通過碎片化的筆記本來復(fù)習(xí)考試,通過讓自己記憶得到更準(zhǔn)確的生成結(jié)果,就會(huì)用碎片化。

提到了一個(gè)舉例,就是人類在考試之前都會(huì)自己記錄筆記,在復(fù)習(xí)的時(shí)候都會(huì)通過閱讀筆記來想起之前知識(shí)學(xué)習(xí)塊,從而加深自己的記憶同時(shí)能夠讓考試更加容易答對(duì)通過。

依靠這種方式,AI模型也應(yīng)該可以參考學(xué)生復(fù)習(xí)筆記的方式,將其零碎的知識(shí)內(nèi)容首先可以自己組合、重建,并且去生成更加精準(zhǔn)的內(nèi)容。

每次內(nèi)容生成后,可以判斷內(nèi)容效果,再來不斷優(yōu)化每一次的策略“prompt”,最終就實(shí)現(xiàn)了模型的進(jìn)化。

在這篇文獻(xiàn)里,他們也利用ARC方法(完成模型生成數(shù)據(jù)),將其碎片的數(shù)據(jù)進(jìn)行組塊、重建完整生成,再用模型校驗(yàn)自己的提示詞是否最佳的,從而不斷讓模型具備不斷優(yōu)化提示詞能力,也就是模型的自我進(jìn)化與學(xué)習(xí)。


如上圖是文章片段生成完整片段,并且用來評(píng)估。最終通過SEAL叫做自我學(xué)習(xí)大模型框架生成的準(zhǔn)確度在僅有幾塊的情況下,可以達(dá)到和ChatGPT4.1的生成準(zhǔn)確度。

相比以往的模型訓(xùn)練,這個(gè)模型框架最大的區(qū)別是如下圖,可以理解為在生成策略的優(yōu)化:Prompt


如下是文獻(xiàn)李SEAL方法的實(shí)現(xiàn)效果,給出了模型輸入內(nèi)容之后,模型通過不斷地重寫,從而讓模型自己提升自己,讓每一次重寫內(nèi)容更準(zhǔn)確。

其中第一次rewrite 和最后一次內(nèi)容長(zhǎng)度與質(zhì)量都有顯著的變化。


可想而知,這套框架用在圖像模型也是可以的,讓模型幾乎0標(biāo)注的進(jìn)行自我訓(xùn)練,在用戶任務(wù)完成一輪,就可以利用任務(wù)圖片數(shù)據(jù)集完成訓(xùn)練自我提升。

這幾乎就可用讓醫(yī)生、律師、甚至是產(chǎn)品經(jīng)理以及寫代碼,可以完成自己熟悉領(lǐng)域越來越準(zhǔn),并且越來越達(dá)到自己的要求與目標(biāo)范圍。

在研究文獻(xiàn)里,SEAL模型框架研究也有限制:災(zāi)難性遺忘

隨著時(shí)間逐步前進(jìn),知識(shí)陳舊之后,模型拉起的準(zhǔn)確度會(huì)越來越低,甚至是出現(xiàn)幻覺,所以模型會(huì)過渡擬合,以及過渡蒸餾。

現(xiàn)在AI模型的災(zāi)難性遺忘幾乎是一個(gè)難題,曾經(jīng)就有人做過實(shí)驗(yàn),將一個(gè)圖像利用通用模型不斷的重復(fù)訓(xùn)練,反復(fù)把結(jié)果再來訓(xùn)練。

當(dāng)訓(xùn)練超過幾百次之后,就會(huì)得到女性二次元,這是因?yàn)榇竽P蛿?shù)據(jù)源采用海量數(shù)據(jù),包含了海量女性角色、以及二次元圖,所以最終過渡擬合就會(huì)成為二次元


如上圖是rice university做的算法研究,將其一張圖片反復(fù)訓(xùn)練,最終得到的結(jié)果是另外一個(gè)人物,甚至是性別都變了。

如何對(duì)過往的數(shù)據(jù)進(jìn)行存儲(chǔ)以及模型檢索,是接下來這套算法需要做的衍生,在其論文里,給出了后續(xù)的研究計(jì)劃,將會(huì)繼續(xù)擴(kuò)展到記憶的問題。

比如通過以往的數(shù)據(jù)整合與單獨(dú)保存,以及過往數(shù)據(jù)調(diào)用策略的修改,從而讓模型能夠避免災(zāi)難性遺忘。

相比通用模型來說,SEAL模型其對(duì)于過往的數(shù)據(jù)災(zāi)難性遺忘程度要低的多,可以看見模型是有效果的。


如上圖是論文里隨著知識(shí)塊增加,以及自己反復(fù)進(jìn)化收斂,仍然會(huì)出現(xiàn)模型記憶丟失,在只有一段數(shù)據(jù)下,反復(fù)8次進(jìn)化,從0.33變成了0.19的準(zhǔn)確度,幾乎不管是幾段都會(huì)進(jìn)行降低。

將其算法在不僅是prompt校準(zhǔn)上的進(jìn)化,而是對(duì)過往數(shù)據(jù)的精準(zhǔn)度也要進(jìn)行計(jì)算,從而讓模型在實(shí)現(xiàn)自我進(jìn)化的同時(shí),不會(huì)出現(xiàn)遺忘,相信這就是未來ChatGPT7甚至是8的發(fā)展目標(biāo)。

其實(shí)對(duì)于人類來說,到不會(huì)把以前記住的事情記錯(cuò),而是會(huì)遺忘,讓一個(gè)人記住以往時(shí)間的數(shù)據(jù)這一點(diǎn)也是很難,就想讓我們現(xiàn)在想象小時(shí)候的記憶,我們?nèi)匀粫?huì)覺得很難記得住,就是因?yàn)檫@些記憶碎片往往難以尋找,但是當(dāng)我們找到了某一個(gè)記憶碎片或情景,就可以迅速記得到當(dāng)時(shí)的更多片段情況。

這就是大腦記憶的數(shù)據(jù)檢索,而目前AI模型在進(jìn)化模型上,這一點(diǎn)反復(fù)進(jìn)化會(huì)導(dǎo)致出現(xiàn)錯(cuò)誤數(shù)據(jù),也就是錯(cuò)誤記憶這一點(diǎn)是現(xiàn)在團(tuán)隊(duì)要去做的。

ChatGPT6自我進(jìn)化

從現(xiàn)在來看,這篇論文至少給了一個(gè)趨勢(shì),也就是一個(gè)AI大模型會(huì)包含進(jìn)化能力,這樣就不需要再給他數(shù)據(jù)訓(xùn)練了,而是自己通過日常的溝通與任務(wù)完成,他其實(shí)就在不斷訓(xùn)練自己。

這篇文獻(xiàn)的研究作者已經(jīng)跳槽到OPENAI去了,這篇文章最大的意義就是讓模型越來越聰明,甚至是對(duì)于用戶來說,自己賬戶下的ChatGPT將會(huì)越來越懂你,并且知道你所了解的方向與知識(shí),逐步成為超越或者完美契合你的靈魂伴侶。

讓模型自我進(jìn)化,而且模型的進(jìn)化小到個(gè)人賬戶,大到整個(gè)模型基座,都是可以進(jìn)化的,從而不用擔(dān)心模型還需要人工來進(jìn)行訓(xùn)練。

不再需要依靠開發(fā)者每次發(fā)版本一樣release,用戶就能體驗(yàn)到模型的新能力。

當(dāng)然現(xiàn)在這種進(jìn)化只是在模型的準(zhǔn)確度與生成內(nèi)容量,和模型在功能、多模態(tài)上還沒有關(guān)系,也就是模型不能從文本模型變成圖像模型,這一點(diǎn)進(jìn)化還做不到。

以上就是這篇文獻(xiàn),我相信ChatGPT6以及后續(xù)模型將會(huì)更加“人”化。

今天的分享就到這里

文獻(xiàn)地址:https://arxiv.org/pdf/2506.10943

來源:網(wǎng)絡(luò)博客

題圖來自 Unsplash ,基于 CC0 協(xié)議, 如有侵權(quán),請(qǐng)聯(lián)系pmtalk123刪除

“分享產(chǎn)品經(jīng)理改變世界的點(diǎn)滴”

產(chǎn)品顧問| 產(chǎn)品咨詢|培訓(xùn)合作

請(qǐng)?zhí)砑游⑿? PMxiaowanzi

最近我的原創(chuàng)

每日案例拆解庫(kù),AI等產(chǎn)品打卡群

我創(chuàng)建的產(chǎn)品設(shè)計(jì)打卡社群,加入后365天,每天體驗(yàn)一款A(yù)PP。提升產(chǎn)品設(shè)計(jì)能力,同時(shí)有1300份體驗(yàn)報(bào)告幫助你找到競(jìng)品

在這里你可以隨時(shí)查詢到你想找的各類競(jìng)品行業(yè)APP,無須自己親自下載就可以馬上得到APP的一手產(chǎn)品優(yōu)化、交互設(shè)計(jì)、功能描述信息。

從優(yōu)化&建議、商業(yè)模式、運(yùn)營(yíng)、功能描述、交互設(shè)計(jì)、產(chǎn)品定位至少6個(gè)維度,體驗(yàn)一款應(yīng)用。

平均1天1塊錢,掃碼購(gòu)買即可加入

連續(xù)體驗(yàn)48款應(yīng)用,通過后原路退回


報(bào)名后添加星球助理

PMTalk123

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
鄭麗文慘遭迫害,賴清德玩陰的,中央政府雷霆出擊,力挽狂瀾

鄭麗文慘遭迫害,賴清德玩陰的,中央政府雷霆出擊,力挽狂瀾

小影的娛樂
2025-10-24 06:24:47
赴泰注意!王太后辭世泰國(guó)服喪1年 避免這些行為

赴泰注意!王太后辭世泰國(guó)服喪1年 避免這些行為

看看新聞Knews
2025-10-26 22:16:08
云南景谷縣一山林中冒出黃煙,當(dāng)?shù)貞?yīng)急管理局:是衛(wèi)星殘骸墜落已回收,事前已通知群眾躲避

云南景谷縣一山林中冒出黃煙,當(dāng)?shù)貞?yīng)急管理局:是衛(wèi)星殘骸墜落已回收,事前已通知群眾躲避

極目新聞
2025-10-26 22:39:24
CCTV5直播,中國(guó)男籃鏖戰(zhàn)韓國(guó)男籃,周琦、曾凡博出戰(zhàn),鹿死誰手

CCTV5直播,中國(guó)男籃鏖戰(zhàn)韓國(guó)男籃,周琦、曾凡博出戰(zhàn),鹿死誰手

體壇小快靈
2025-10-27 09:19:24
阜陽(yáng)一4S店凌晨燃起熊熊大火,店方人士:展廳的車都被燒了,原因尚不清楚

阜陽(yáng)一4S店凌晨燃起熊熊大火,店方人士:展廳的車都被燒了,原因尚不清楚

極目新聞
2025-10-26 22:39:24
安世中國(guó)還有最后一招殺手锏,將獨(dú)立變成定局,荷方一點(diǎn)辦法沒有

安世中國(guó)還有最后一招殺手锏,將獨(dú)立變成定局,荷方一點(diǎn)辦法沒有

劍哥的思政課
2025-10-27 13:02:52
比低空經(jīng)濟(jì)還猛!十五五將聚焦深地經(jīng)濟(jì)  八大“鏟子股”已起飛

比低空經(jīng)濟(jì)還猛!十五五將聚焦深地經(jīng)濟(jì) 八大“鏟子股”已起飛

元芳說投資
2025-10-27 07:00:13
王玉雯的胸型有多好看

王玉雯的胸型有多好看

阿廢冷眼觀察所
2025-10-22 07:37:39
李奇微晚年坦言:朝鮮戰(zhàn)爭(zhēng)打出三個(gè)超級(jí)大國(guó),西方為何保持沉默?

李奇微晚年坦言:朝鮮戰(zhàn)爭(zhēng)打出三個(gè)超級(jí)大國(guó),西方為何保持沉默?

云霄紀(jì)史觀
2025-10-21 11:45:46
劇烈爆炸,濃煙滾滾!緬甸軍方再次爆破拆除KK園區(qū)建筑,已提前告知泰國(guó)

劇烈爆炸,濃煙滾滾!緬甸軍方再次爆破拆除KK園區(qū)建筑,已提前告知泰國(guó)

紅星新聞
2025-10-26 12:54:30
3-0,36歲拜仁舊將穆勒閃耀美職聯(lián):率隊(duì)完勝+9場(chǎng)9球4助,太牛了

3-0,36歲拜仁舊將穆勒閃耀美職聯(lián):率隊(duì)完勝+9場(chǎng)9球4助,太牛了

側(cè)身凌空斬
2025-10-27 09:37:41
四川成都一男子未拔充電器引發(fā)火災(zāi),客廳“被燒光”損失十余萬元

四川成都一男子未拔充電器引發(fā)火災(zāi),客廳“被燒光”損失十余萬元

IT之家
2025-10-27 07:39:05
直觀感受烏克蘭被占領(lǐng)土面積!占領(lǐng)整個(gè)烏克蘭,俄軍要耗費(fèi)上百年

直觀感受烏克蘭被占領(lǐng)土面積!占領(lǐng)整個(gè)烏克蘭,俄軍要耗費(fèi)上百年

鷹眼Defence
2025-10-25 18:17:40
蔣介石有三次翻盤機(jī)會(huì)全錯(cuò)過?400萬大軍為何輸給120萬?

蔣介石有三次翻盤機(jī)會(huì)全錯(cuò)過?400萬大軍為何輸給120萬?

老閆侃史
2025-10-23 19:20:03
貌合神離!55歲鐘麗緹胖到認(rèn)不出,騎行李箱近200斤,張倫碩全程黑臉

貌合神離!55歲鐘麗緹胖到認(rèn)不出,騎行李箱近200斤,張倫碩全程黑臉

扒星人
2025-10-24 16:11:13
文班31+14小托馬斯40分 馬刺勝籃網(wǎng)喜迎三連勝

文班31+14小托馬斯40分 馬刺勝籃網(wǎng)喜迎三連勝

北青網(wǎng)-北京青年報(bào)
2025-10-27 07:44:05
國(guó)外醫(yī)生有多離譜?網(wǎng)友:不搞笑,在國(guó)外看病就是醫(yī)生勸你堅(jiān)強(qiáng)

國(guó)外醫(yī)生有多離譜?網(wǎng)友:不搞笑,在國(guó)外看病就是醫(yī)生勸你堅(jiān)強(qiáng)

帶你感受人間冷暖
2025-10-23 00:05:24
拒逆轉(zhuǎn)!倫納德30+10,阿夫迪亞23+7,哈登真厲害,西部第七易主

拒逆轉(zhuǎn)!倫納德30+10,阿夫迪亞23+7,哈登真厲害,西部第七易主

籃球大視野
2025-10-27 12:07:55
中國(guó)女排驚現(xiàn)黑人少女,16 歲身高1米88,天賦出眾或成未來門面?

中國(guó)女排驚現(xiàn)黑人少女,16 歲身高1米88,天賦出眾或成未來門面?

牛牛叨史
2025-10-25 01:04:40
3點(diǎn)球介入+2次橫梁!申花冤嗎?特謝拉引沖突,賽后于漢超很激動(dòng)

3點(diǎn)球介入+2次橫梁!申花冤嗎?特謝拉引沖突,賽后于漢超很激動(dòng)

足球大腕
2025-10-26 22:51:19
2025-10-27 14:00:49
Kevin改變世界的點(diǎn)滴 incentive-icons
Kevin改變世界的點(diǎn)滴
每周一次,產(chǎn)品案例與經(jīng)驗(yàn)分享
141文章數(shù) 4關(guān)注度
往期回顧 全部

科技要聞

1.5萬億美元生意,OpenAI用“自己人”搞定

頭條要聞

大學(xué)副教授成老賴仍開寶馬用新手機(jī) 一次餐費(fèi)花8000元

頭條要聞

大學(xué)副教授成老賴仍開寶馬用新手機(jī) 一次餐費(fèi)花8000元

體育要聞

虎頭蛇尾的國(guó)家德比,在哨響后迎來高潮

娛樂要聞

楊冪 15 年情路大起底

財(cái)經(jīng)要聞

貝森特:美方不再考慮對(duì)華加征100%關(guān)稅

汽車要聞

或告別燃油時(shí)代 豐田Supra將于明年停產(chǎn)

態(tài)度原創(chuàng)

時(shí)尚
藝術(shù)
旅游
親子
教育

今年秋冬最時(shí)髦的穿法:長(zhǎng)外套+長(zhǎng)褲,太高級(jí)了!

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

親子要聞

廣東10所幼兒園停辦

教育要聞

注冊(cè)用戶1.78億,「英語(yǔ)趣配音」將亮相GET2025

無障礙瀏覽 進(jìn)入關(guān)懷版 国产欧美日韩视频怡春院| 亚洲人亚洲精品成人网站| 亚洲av熟女国产一二三| 欧亚乱色熟一区二区三四区| 黄色不卡视频一区二区三区| 久久婷婷综合缴情亚洲狠狠_| 亚洲高清无码一区二区三区免费视频 | 毛片免费看无码喷水高潮| 丁香五月成人av| 国产欧美va天堂在线观看视频| 88A∨人妻无码| 好屌妞免费欧美手机版| 麻豆国产av穿旗袍强迫女佣人| 熟女人妻在线视频| 红杏亚洲影院一区二区三区| 国产精品久久久久9999小说| 熟女肥臀一区二区三区| 未满十八18禁止免费无码网站| 性色av闺蜜一区二区三区| 亚洲一区二区偷拍精品| 天美成人在线电影| www日本免费| 大胆日本久久| 亚洲熟妇熟女久久精品一区| 日日摸日日碰夜夜爽201| 国产日韩综合一区在线观看| 日韩av一区二区精品不卡| 性XXXXXXⅩXXXX少妇| 欧美性爱视交| 国精产品一区一区三区| 亚洲精品色一区二区三区| 色五月婷婷久久| 中文有码无码人妻| 精品夜夜爽国产乱码婷婷| 四虎影视88aa久久人妻| 国产一区二区三区免费观看网站上| 尤物蜜芽国产成人精品区| 久久精品区99| 无码专区 人妻系列 在线| 亚洲成人AV观看| 国产妇女精品|