夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

業(yè)內(nèi)首次 彩云科技發(fā)布基于DCFormer架構(gòu)通用大模型云錦天章

0
分享至


2017年,谷歌發(fā)布《Attention Is All You Need》論文,首次提出Transformer架構(gòu),掀開了人工智能自然語言處理(NLP)領(lǐng)域發(fā)展的全新篇章。

Transformer架構(gòu)作為神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中最重要的架構(gòu),成為后來席卷全球的一系列通用大模型如ChatGPT、Gemini的底層技術(shù)支撐。而提升Transformer的運(yùn)行效率也成為人工智能領(lǐng)域的研究熱點(diǎn),2024年4月,谷歌最近一次更新了Transformer架構(gòu),提出了Mixture-of-Depths(MoD)方法,使得訓(xùn)練后采樣過程中提速50%,成為Transformer架構(gòu)提速升級(jí)的又一重要事件。

同樣在今年,一家來自國(guó)內(nèi)的人工智能企業(yè)彩云科技,在國(guó)際機(jī)器學(xué)習(xí)領(lǐng)域的頂級(jí)會(huì)議ICML(國(guó)際機(jī)器學(xué)習(xí)大會(huì))上,發(fā)布全新大模型論文《Improving Transformers with Dynamically Composable Multi-Head Attention》。

在該論文中,彩云科技團(tuán)隊(duì)首次發(fā)布DCFormer架構(gòu),并在基于DCFormer打造的模型DCPythia-6.9B上,實(shí)現(xiàn)了在預(yù)訓(xùn)練困惑度和下游任務(wù)評(píng)估上都優(yōu)于開源Pythia-12B。這意味著,DCFormer模型在性能上,實(shí)現(xiàn)了對(duì)Transformer模型1.7-2倍的提升。

11月13日,彩云科技在北京總部與媒體進(jìn)行一場(chǎng)主題為“From Paper to App”的溝通會(huì)。

會(huì)上,彩云科技CEO袁行遠(yuǎn),就通用大模型未來進(jìn)化之路,與人工智能的落地場(chǎng)景等熱點(diǎn)話題進(jìn)行了交流。并正式推出了首款基于DCFormer架構(gòu)開發(fā)的通用大模型云錦天章,與此同時(shí),彩云科技旗下AI RPG平臺(tái)彩云小夢(mèng),也成為首款基于DCFormer架構(gòu)開發(fā)的AI產(chǎn)品。


只有模型效率和智能度提升

才能實(shí)現(xiàn)真正的AGI

溝通會(huì)現(xiàn)場(chǎng),袁行遠(yuǎn)首先向參會(huì)者展示了一個(gè)ChatGPT o1的問答:“假設(shè)ChatGPT4每天響應(yīng)用戶約2億個(gè)請(qǐng)求,消耗超過50萬千瓦時(shí)的電力。假設(shè)全球網(wǎng)絡(luò)都使用ChatGPT作為訪問入口,ChatGPT每天消耗多少電力?另外按照這個(gè)速度發(fā)展下去,到2050年全球人工智能的耗電量會(huì)達(dá)到目前地球發(fā)電能力的多少倍?”ChatGPT o1給出的答案是,“到2050年,全球人工智能的耗電量可能會(huì)達(dá)到目前地球發(fā)電能力的8倍”。

同樣的問題,在今年2月份的世界政府峰會(huì)上,英偉達(dá)CEO黃仁勛有更為夸張的表述,“假設(shè)計(jì)算機(jī)的速度永遠(yuǎn)不會(huì)變快,我們可能需要14個(gè)不同的行星、3個(gè)不同星系、4個(gè)太陽為這一切(AI)提供燃料?!盇I對(duì)能源的強(qiáng)大需求在業(yè)內(nèi)已經(jīng)是共識(shí),英偉達(dá)致力于通過提升硬件來提升AI效率,降低能耗;而袁行遠(yuǎn)則認(rèn)為,改善大模型底層架構(gòu),提升人工智能運(yùn)行效率,是改變AI能源困局的更優(yōu)路徑。

“Scaling Law告訴我們,隨著算力的提升,模型更大、數(shù)據(jù)更多,模型效果會(huì)越來越好,但與之相應(yīng)的,能耗也會(huì)越來越高,在Scaling Law失效,人工智能實(shí)現(xiàn)之前,或許我們地球的能源就已經(jīng)無法支撐了?!?/p>

袁行遠(yuǎn)表示,“沒有效率的提升,AI就是鏡花水月。”

彩云科技團(tuán)隊(duì)構(gòu)建DCFormer框架,提出可動(dòng)態(tài)組合的多頭注意力(DCMHA),替換Transformer核心組件多頭注意力模塊(MHA),解除了MHA注意力頭的查找選擇回路和變換回路的固定綁定,讓它們可以根據(jù)輸入動(dòng)態(tài)組合,從根本上提升了模型的表達(dá)能力,由此實(shí)現(xiàn)了對(duì)Transformer架構(gòu)1.7—2倍的性能提升。

今年的ICML會(huì)議上,彩云科技團(tuán)隊(duì)的3篇論文,在錄用平均分為4.25-6.33的情況下,獲得平均7分的高分,并成為國(guó)內(nèi)唯二受邀參加維也納ICML 2024登臺(tái)演講的企業(yè),另一家則是華為。


袁行遠(yuǎn)表示:我們的工作表明,Transformer架構(gòu)距離“理想模型架構(gòu)”還有很大的提升空間,除了堆算力堆數(shù)據(jù)的“大力出奇跡”路線,模型架構(gòu)創(chuàng)新同樣大有可為。往小了說,在大模型領(lǐng)域,利用效率更高的模型架構(gòu),小公司也可以在與世界頂級(jí)人工智能企業(yè)的對(duì)抗中取得優(yōu)勢(shì)。往大了說,模型效率的提升,可以有效地降低人工智能升級(jí)迭代的成本,加速AI時(shí)代的到來。

云錦天章問世

首個(gè)基于DCFormer架構(gòu)的通用大模型

作為國(guó)內(nèi)最早做LLM(大語言模型)的公司之一,彩云科技在2017年就已經(jīng)開始做NLP和大模型方面的工作。目前,彩云科技旗下有彩云天氣、彩云小夢(mèng)、彩云小譯三款面向C端用戶的AI產(chǎn)品,是國(guó)內(nèi)為數(shù)不多能夠?qū)崿F(xiàn)盈利的人工智能公司。

“世界最強(qiáng)的小說續(xù)寫通用模型。”溝通會(huì)上,袁行遠(yuǎn)向大家展示了首個(gè)基于DCFormer架構(gòu)的通用大模型云錦天章。“這個(gè)成語是比喻文章極為高雅、華美,和我們的大模型想要實(shí)現(xiàn)的效果有共通之處。”袁行遠(yuǎn)介紹,云錦天章可以實(shí)現(xiàn)在虛構(gòu)世界觀的基礎(chǔ)上,賦予小說人物編程、數(shù)學(xué)等基礎(chǔ)能力,可以高速針對(duì)大量文字進(jìn)行擴(kuò)寫、縮寫,針對(duì)文章風(fēng)格進(jìn)行大容量更換,同時(shí)兼具其他模型的問答、數(shù)學(xué)、編程等基礎(chǔ)能力。


而在應(yīng)用端,擁有四百萬用戶的彩云小夢(mèng),也迎來了基于全新DCFormer架構(gòu)的V.3.5版本。與之前的版本相比,彩云小夢(mèng)V3.5整體流暢性和連貫性提升了20%,支持前文長(zhǎng)度由2000字提升至10000字,故事背景設(shè)定最長(zhǎng)長(zhǎng)度高達(dá)10000字。

“這意味著,在故事創(chuàng)作或者與人工智能對(duì)話中,人工智能能夠記住之前發(fā)生的事情,記住之前故事里發(fā)生的細(xì)節(jié),人物記得自己明確的目標(biāo),并且會(huì)根據(jù)劇情及時(shí)進(jìn)行反思修正。在做到自主創(chuàng)作的同時(shí),發(fā)散性收斂,不會(huì)天馬行空,人物性格前后一致,故事邏輯性更強(qiáng)。”


“深度對(duì)話,超長(zhǎng)記憶,邏輯清晰。”袁行遠(yuǎn)總結(jié)彩云小夢(mèng)V3.5的特征,“我們的目標(biāo)是為用戶打造指尖伴侶定制夢(mèng)境?!?/strong>

袁行遠(yuǎn)表示,彩云小夢(mèng)的用戶單次使用時(shí)長(zhǎng),累計(jì)使用時(shí)長(zhǎng)在同類產(chǎn)品中都處于遙遙領(lǐng)先的地位,“對(duì)話超過400句,你會(huì)發(fā)現(xiàn)彩云小夢(mèng)真正的魅力?!?/p>

袁行遠(yuǎn)介紹,公司接下來將繼續(xù)加大對(duì)DCFormer的研究和投入:“一方面有打破‘國(guó)外做技術(shù)層,國(guó)內(nèi)做應(yīng)用層’刻板印象的情懷所在,一方面也是為公司自有產(chǎn)品應(yīng)對(duì)市場(chǎng)競(jìng)爭(zhēng),實(shí)現(xiàn)快速迭代升級(jí)和能力領(lǐng)先的現(xiàn)實(shí)需要。”

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
大瓜!“金融百草枯”的真容!

大瓜!“金融百草枯”的真容!

挖掘機(jī)007
2025-07-21 19:48:38
招商人員:娃小智和娃哈哈配方相同但售價(jià)更低

招商人員:娃小智和娃哈哈配方相同但售價(jià)更低

觀威海
2025-10-12 12:51:08
日本專家:中日戰(zhàn)爭(zhēng)一旦爆發(fā),日軍將對(duì)中國(guó)軍艦發(fā)起“3重打擊”

日本專家:中日戰(zhàn)爭(zhēng)一旦爆發(fā),日軍將對(duì)中國(guó)軍艦發(fā)起“3重打擊”

何蕥室內(nèi)設(shè)計(jì)
2025-09-23 21:35:12
前央視主持人郎永淳,淪為階下囚,刑滿釋放后,如今過得怎樣?

前央視主持人郎永淳,淪為階下囚,刑滿釋放后,如今過得怎樣?

張發(fā)林
2025-10-12 21:15:49
解清帥擔(dān)心的事發(fā)生了!高調(diào)大辦婚禮,評(píng)論一片諷刺,徹底遭反噬

解清帥擔(dān)心的事發(fā)生了!高調(diào)大辦婚禮,評(píng)論一片諷刺,徹底遭反噬

丁丁鯉史紀(jì)
2025-10-12 15:33:17
新郎跳河又有新發(fā)現(xiàn)!同學(xué)扒出朋友圈,訂婚后他像換了個(gè)人

新郎跳河又有新發(fā)現(xiàn)!同學(xué)扒出朋友圈,訂婚后他像換了個(gè)人

今日搞笑分享
2025-10-08 02:55:57
中國(guó)兩個(gè)鄰居打起來了,巴方超500人死亡,塔利班全線突襲

中國(guó)兩個(gè)鄰居打起來了,巴方超500人死亡,塔利班全線突襲

標(biāo)體
2025-10-13 00:57:02
所有體育運(yùn)動(dòng)中最吃天賦的是什么運(yùn)動(dòng)?

所有體育運(yùn)動(dòng)中最吃天賦的是什么運(yùn)動(dòng)?

董先森愛籃球
2025-10-12 08:29:04
國(guó)務(wù)院任免國(guó)家工作人員

國(guó)務(wù)院任免國(guó)家工作人員

新華社
2025-10-11 16:46:05
老了才明白:讓子女孝順的,不是你說過什么,而是你手里有什么

老了才明白:讓子女孝順的,不是你說過什么,而是你手里有什么

特特農(nóng)村生活
2025-10-13 03:59:09
王楚欽終于坦白!僅一年,他4個(gè)變化太真實(shí),印證了孫穎莎的話

王楚欽終于坦白!僅一年,他4個(gè)變化太真實(shí),印證了孫穎莎的話

青杉依舊啊啊
2025-10-07 07:28:03
女子嫁惡霸被砍死,貴州殺妻案即將開庭,岳母拒絕賠償,畫面流出

女子嫁惡霸被砍死,貴州殺妻案即將開庭,岳母拒絕賠償,畫面流出

娛樂壹點(diǎn)半
2025-10-12 14:24:25
大難臨頭之際,臺(tái)當(dāng)局終于低下高昂的頭顱,承認(rèn)給俄方送錢數(shù)十億

大難臨頭之際,臺(tái)當(dāng)局終于低下高昂的頭顱,承認(rèn)給俄方送錢數(shù)十億

靚仔情感
2025-10-13 03:53:28
上海大師賽新王!瓦舍羅2-1逆轉(zhuǎn)林德克內(nèi)希 奪首冠創(chuàng)多項(xiàng)紀(jì)錄

上海大師賽新王!瓦舍羅2-1逆轉(zhuǎn)林德克內(nèi)希 奪首冠創(chuàng)多項(xiàng)紀(jì)錄

醉臥浮生
2025-10-12 19:00:14
自作自受!日本允許國(guó)籍欄填“臺(tái)灣”,堵上了唯一向中國(guó)求救的路

自作自受!日本允許國(guó)籍欄填“臺(tái)灣”,堵上了唯一向中國(guó)求救的路

科普100克克
2025-10-05 10:23:37
“前妻”起訴要撫養(yǎng)費(fèi),經(jīng)鑒定9歲兒子非他親生!男子起訴索賠37萬,判了

“前妻”起訴要撫養(yǎng)費(fèi),經(jīng)鑒定9歲兒子非他親生!男子起訴索賠37萬,判了

紅星新聞
2025-10-12 11:03:07
大跌五成!樓市最新數(shù)據(jù)曝光…

大跌五成!樓市最新數(shù)據(jù)曝光…

新浪財(cái)經(jīng)
2025-10-12 00:14:52
澳門NBA:馬云滿頭白發(fā),貝克漢姆皺紋盡顯,成龍被人無視好可憐

澳門NBA:馬云滿頭白發(fā),貝克漢姆皺紋盡顯,成龍被人無視好可憐

嫹筆牂牂
2025-10-12 07:22:01
邱貽可吐槽印度:兩個(gè)人擠著睡!真有壁虎蛤蟆,吃完飯又煮泡面

邱貽可吐槽印度:兩個(gè)人擠著睡!真有壁虎蛤蟆,吃完飯又煮泡面

念洲
2025-10-12 10:29:05
一輛進(jìn)口消防車2400萬!中國(guó)連航母都能造,為何卻造不出消防車?

一輛進(jìn)口消防車2400萬!中國(guó)連航母都能造,為何卻造不出消防車?

混沌錄
2025-10-11 23:05:04
2025-10-13 05:23:00
了不起的程序員 incentive-icons
了不起的程序員
平凡的人也能做了不起的事
547文章數(shù) 1672關(guān)注度
往期回顧 全部

科技要聞

商務(wù)部公告附件首次改為wps格式

頭條要聞

石破茂講話讓高市早苗惱羞成怒:不知道他在說什么

頭條要聞

石破茂講話讓高市早苗惱羞成怒:不知道他在說什么

體育要聞

表兄弟決賽相遇,他們?cè)谏虾?chuàng)造黑馬奇跡

娛樂要聞

娜扎被搶休息室,網(wǎng)友扒出疑似林允

財(cái)經(jīng)要聞

稀土出口管制、美威脅加關(guān)稅 商務(wù)部回應(yīng)

汽車要聞

1.5T動(dòng)力/尺寸越級(jí) 國(guó)民家轎第5代帝豪首秀亮相

態(tài)度原創(chuàng)

藝術(shù)
教育
手機(jī)
公開課
軍事航空

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

首批只招50大學(xué)生卻建3240人新型高中?曹德旺的教育棋局引熱議

手機(jī)要聞

年度旗艦壓軸登場(chǎng)!華為Mate80發(fā)布時(shí)間被確認(rèn),或11月25日發(fā)布

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

金正恩連續(xù)八次深夜閱兵 "大殺器"亮相

無障礙瀏覽 進(jìn)入關(guān)懷版 免费国产99久久久香蕉| 欧美V人影院| 亚洲无码AV熟妇| 中文字幕无码不卡免费视频| 国产二区影院| 国产精品丝袜视频| 亚洲大成色www永久网站| 狠狠干狠狠爱| 综合AV在线| 亚洲精品蜜桃视频| 日本九九热在线观看官网| 超碰亚洲无码| 日韩人妻精品无码一区二区三区| 99热只有精品99| 国产极品视觉盛宴| a√一区二区三区| 中韩日亚一区二区| 日本一卡二卡3卡四卡网站精品| 九色|PORNY|窝窝| 国产精品96| 国产人免费人成免费视频| 小草社区视频在线| 韩日一区二区| 最近中文字幕国产精选| 2020国产激情视频在线观看| 精东影业传媒MV国产剧能看| 欧美午夜一区| 中文字幕一区二区三区免费| 欧美三码在线| 好吊日免费视频| 欧美性爱乱交A一区二区| 人伦一区二区| 中文字幕一区二区久久综合| 草草影院精品一区二区三区| 久久自慰精品| 国产成人无码免费一区二区三区| 俄罗斯胖妇人BBW| 人人操,人人舔| 国产精品一区二区av片| 老熟女视频一区二区三区| 久久亚洲欧美|