夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

每Token成本顯著降低 華為發(fā)布UCM技術(shù)破解AI推理難題

0
分享至

【環(huán)球網(wǎng)科技報(bào)道 記者 張陽】8月12日,2025金融AI推理應(yīng)用落地與發(fā)展論壇在上海舉行。在此次論壇上,華為發(fā)布了AI推理創(chuàng)新技術(shù)——UCM推理記憶數(shù)據(jù)管理器,該技術(shù)旨在推動(dòng)AI推理體驗(yàn)升級,提升推理性價(jià)比,加速AI商業(yè)正循環(huán)。與此同時(shí),華為與中國銀聯(lián)攜手,率先在金融典型場景開展UCM技術(shù)試點(diǎn)應(yīng)用,并聯(lián)合發(fā)布了智慧金融AI推理加速方案應(yīng)用成果。


當(dāng)前,人工智能已進(jìn)入發(fā)展深水區(qū),AI推理正成為下一個(gè)爆發(fā)式增長的關(guān)鍵階段,推理體驗(yàn)和推理成本也因此成為衡量模型價(jià)值的重要標(biāo)準(zhǔn)。華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰博士在論壇上強(qiáng)調(diào):“AI時(shí)代,模型訓(xùn)練、推理效率與體驗(yàn)的量綱都以Token數(shù)為表征,Token經(jīng)濟(jì)已經(jīng)到來?!睘榱吮U狭鲿车耐评眢w驗(yàn),企業(yè)需要持續(xù)加大算力投入,然而,如何在推理效率與成本之間找到最佳平衡點(diǎn),成為全行業(yè)亟待解決的重要課題。

華為數(shù)據(jù)存儲產(chǎn)品線AI存儲首席架構(gòu)師李國杰對記者表示,從“模型智能”全面轉(zhuǎn)向“數(shù)據(jù)智能”,已在業(yè)內(nèi)形成高度共識,且這一拐點(diǎn)正在加速到來。他進(jìn)一步解釋道:“一方面,商業(yè)側(cè)開始追問AI的閉環(huán)變現(xiàn)與最終用戶體驗(yàn);另一方面,當(dāng)端到端模型能力提升遇到天花板時(shí),系統(tǒng)化地轉(zhuǎn)向數(shù)據(jù)智能成為必然選擇” 。

“很多模型之所以表現(xiàn)不及預(yù)期,根本原因是缺乏高質(zhì)量數(shù)據(jù)。大量依賴AI合成數(shù)據(jù),既導(dǎo)致‘?dāng)?shù)據(jù)荒’,又帶來質(zhì)量隱患,數(shù)據(jù)治理、數(shù)據(jù)價(jià)值挖掘和數(shù)據(jù)智能將成為下一階段產(chǎn)業(yè)研究的核心議題?!崩顕苷f。

針對這一難題,華為推出的UCM推理記憶數(shù)據(jù)管理器,由三大組件構(gòu)成,分別是對接不同引擎與算力的推理引擎插件(Connector)、支持多級KV Cache管理及加速算法的功能庫(Accelerator)、高性能KV Cache存取適配器(Adapter)。通過推理框架、算力、存儲三層協(xié)同,實(shí)現(xiàn)了AI推理“更優(yōu)體驗(yàn)、更低成本”。

在提升推理體驗(yàn)方面,依托UCM層級化自適應(yīng)的全局前綴緩存技術(shù),系統(tǒng)能夠直接調(diào)用KV緩存數(shù)據(jù),避免重復(fù)計(jì)算,使首Token時(shí)延最大降低90%。同時(shí),UCM將超長序列Cache分層卸載至外置專業(yè)存儲,通過算法創(chuàng)新突破模型和資源限制,實(shí)現(xiàn)推理上下文窗口10倍級擴(kuò)展,滿足長文本處理需求。

在降低推理成本上,UCM具備智能分級緩存能力,可根據(jù)記憶熱度在HBM、DRAM、SSD等存儲介質(zhì)中實(shí)現(xiàn)按需流動(dòng);同時(shí)融合多種稀疏注意力算法,實(shí)現(xiàn)存算深度協(xié)同,使長序列場景下TPS(每秒處理token數(shù))提升2-22倍,顯著降低每Token推理成本,為企業(yè)減負(fù)增效。

在與中國銀聯(lián)的聯(lián)合創(chuàng)新技術(shù)試點(diǎn)中,UCM的技術(shù)價(jià)值得到了充分驗(yàn)證。在中國銀聯(lián)“客戶之聲”業(yè)務(wù)場景下,借助UCM技術(shù)及工程化手段,大模型推理速度提升125倍,僅需10秒即可精準(zhǔn)識別客戶高頻問題,有效促進(jìn)了服務(wù)質(zhì)量的提升。未來,中國銀聯(lián)將依托國家人工智能應(yīng)用中試基地,聯(lián)合華為等生態(tài)伙伴共建“AI+金融”示范應(yīng)用,推動(dòng)技術(shù)成果從“實(shí)驗(yàn)室驗(yàn)證”走向“規(guī)?;瘧?yīng)用”。

華為數(shù)據(jù)存儲產(chǎn)品線副總裁、閃存領(lǐng)域總裁謝黎明表示,金融行業(yè)在AI推理應(yīng)用中面臨三大核心挑戰(zhàn):一是長序列輸入導(dǎo)致的“推不動(dòng)”;二是并發(fā)上不去且每Token時(shí)延長造成的“推得慢”;三是耗費(fèi)大量算力做KV重復(fù)計(jì)算引發(fā)的“推得貴”。而華為的解決方案核心就是圍繞改善推理體驗(yàn)和推理性價(jià)比。

李國杰補(bǔ)充道,金融行業(yè)在IT信息化和科技賦能建設(shè)中一直走在前列,無論是銀行還是保險(xiǎn),都能在大量數(shù)據(jù)中挖掘機(jī)會。隨著走向Agentic AI時(shí)代,面臨信息量爆炸,體現(xiàn)在模型側(cè)就是顯存不足以及推理Token成本的問題,華為的解決方案正是為了解決這類問題。

論壇現(xiàn)場,華為還正式公布了UCM開源計(jì)劃。UCM通過開放統(tǒng)一的南北向接口,可適配多類型推理引擎框架、算力及存儲系統(tǒng)。今年9月,UCM將正式開源,后續(xù)逐步貢獻(xiàn)給業(yè)界主流推理引擎社區(qū),攜手全產(chǎn)業(yè)共同推動(dòng)AI推理生態(tài)的繁榮發(fā)展。

對此,李國杰表示,AI技術(shù)棧很深廣,開源是希望行業(yè)能在全棧協(xié)同上做更多努力,推動(dòng)推理架構(gòu)發(fā)展,保持開放態(tài)度,沿著對推理發(fā)展和Token經(jīng)濟(jì)有益的趨勢前進(jìn)。謝黎明則認(rèn)為,IT行業(yè)產(chǎn)品先行、標(biāo)準(zhǔn)隨后,通過開源,能讓更多廠商和伙伴加入,推動(dòng)標(biāo)準(zhǔn)落地,共創(chuàng)標(biāo)準(zhǔn),從而真正解決推理體驗(yàn)和成本問題。

華為UCM技術(shù)的發(fā)布,無疑為AI推理領(lǐng)域帶來了新的突破,也為智慧金融的發(fā)展注入了強(qiáng)勁動(dòng)力。隨著UCM技術(shù)的開源和推廣應(yīng)用,有望推動(dòng)整個(gè)AI推理行業(yè)的效率提升和成本優(yōu)化,開啟AI商業(yè)應(yīng)用的新篇章。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
林徽因落選的國徽方案,網(wǎng)友看后感嘆:審美確實(shí)一絕,但真不合適

林徽因落選的國徽方案,網(wǎng)友看后感嘆:審美確實(shí)一絕,但真不合適

愚鑒
2025-10-29 09:54:30
茍俊不幸去世,年僅34歲

茍俊不幸去世,年僅34歲

阜陽發(fā)布
2025-10-29 12:23:06
最嚴(yán)查車風(fēng)暴!在家里被帶走,幾點(diǎn)跑的車都知道!

最嚴(yán)查車風(fēng)暴!在家里被帶走,幾點(diǎn)跑的車都知道!

網(wǎng)約車焦點(diǎn)
2025-10-29 10:03:08
荒唐!韓國剛對中國免簽,就有人脫團(tuán)!澳洲20人團(tuán)全逃,20萬押金都不要了!

荒唐!韓國剛對中國免簽,就有人脫團(tuán)!澳洲20人團(tuán)全逃,20萬押金都不要了!

最英國
2025-10-28 19:35:46
廣東臺這6位主持,以為退休享福,原來已離世多年,她最令人惋惜

廣東臺這6位主持,以為退休享福,原來已離世多年,她最令人惋惜

娛樂看阿敞
2025-10-29 15:35:43
楊天真吐槽特斯拉車門打不開,“只能從后備箱爬進(jìn)去”,特斯拉回應(yīng):車輛在軟件安裝過程中,無法進(jìn)行充電和相關(guān)設(shè)定

楊天真吐槽特斯拉車門打不開,“只能從后備箱爬進(jìn)去”,特斯拉回應(yīng):車輛在軟件安裝過程中,無法進(jìn)行充電和相關(guān)設(shè)定

洪觀新聞
2025-10-29 16:00:35
特朗普沒想到的一幕發(fā)生:王毅親自出面,給了高市早苗一個(gè)下馬威

特朗普沒想到的一幕發(fā)生:王毅親自出面,給了高市早苗一個(gè)下馬威

南宮一二
2025-10-29 10:54:32
俄羅斯有多窮?莫斯科有多富?| 地球知識局

俄羅斯有多窮?莫斯科有多富?| 地球知識局

地球知識局
2025-10-28 20:28:17
讓中國造不出芯片?荷蘭突然下狠手,外媒:這是要逼死ASML

讓中國造不出芯片?荷蘭突然下狠手,外媒:這是要逼死ASML

趣文說娛
2025-10-29 16:29:39
反轉(zhuǎn)!山東一大四女生墜亡,知情人:曾休學(xué)兩年,竟是為情自殺?

反轉(zhuǎn)!山東一大四女生墜亡,知情人:曾休學(xué)兩年,竟是為情自殺?

烏娛子醬
2025-10-29 11:26:43
鬧大了!河南一地為禁止燃燒秸稈,發(fā)布低俗的宣傳標(biāo)語,引發(fā)爭議

鬧大了!河南一地為禁止燃燒秸稈,發(fā)布低俗的宣傳標(biāo)語,引發(fā)爭議

火山詩話
2025-10-29 06:58:28
楚天慧被查

楚天慧被查

新京報(bào)政事兒
2025-10-29 16:16:58
中國殘奧選手力挺鄭智化:連滾帶爬只是形容詞,國外出行更有尊嚴(yán)

中國殘奧選手力挺鄭智化:連滾帶爬只是形容詞,國外出行更有尊嚴(yán)

念洲
2025-10-29 10:39:32
吃完“大嫂”紅利的高葉,又回到了她的“怪圈”,還是張頌文高明

吃完“大嫂”紅利的高葉,又回到了她的“怪圈”,還是張頌文高明

洲洲影視娛評
2025-10-29 17:15:37
唏噓!34歲J羅快沒球踢了:加盟僅10個(gè)月就遭拋棄 6年內(nèi)換了8個(gè)隊(duì)

唏噓!34歲J羅快沒球踢了:加盟僅10個(gè)月就遭拋棄 6年內(nèi)換了8個(gè)隊(duì)

風(fēng)過鄉(xiāng)
2025-10-29 15:30:20
88年,潛伏42年的中共地下黨員從臺灣秘密返回,6年后被組織發(fā)現(xiàn)

88年,潛伏42年的中共地下黨員從臺灣秘密返回,6年后被組織發(fā)現(xiàn)

紅色先驅(qū)
2025-10-27 18:18:06
京東核心高管邵京平因個(gè)人原因被公司辭退

京東核心高管邵京平因個(gè)人原因被公司辭退

電商派Pro
2025-10-29 09:43:06
環(huán)球小姐中國區(qū)總冠軍趙娜,身高178,不僅長得好看,還是個(gè)學(xué)霸

環(huán)球小姐中國區(qū)總冠軍趙娜,身高178,不僅長得好看,還是個(gè)學(xué)霸

冷紫葉
2025-10-28 20:44:47
暴跌50%!中國第一睡城成鬼城,十年前上車“燕郊”的人都哭了

暴跌50%!中國第一睡城成鬼城,十年前上車“燕郊”的人都哭了

青眼財(cái)經(jīng)
2025-10-28 10:37:00
湖北省委書記與雷軍交流

湖北省委書記與雷軍交流

政知新媒體
2025-10-29 10:49:32
2025-10-29 20:28:49
環(huán)球Tech incentive-icons
環(huán)球Tech
環(huán)球科技范兒,關(guān)注科技圈動(dòng)態(tài)
54157文章數(shù) 65159關(guān)注度
往期回顧 全部

科技要聞

英偉達(dá)GTC:黃仁勛撒錢、造芯、造夢

頭條要聞

報(bào)道稱中國在本收獲季首次從美國購買大豆 外交部回應(yīng)

頭條要聞

報(bào)道稱中國在本收獲季首次從美國購買大豆 外交部回應(yīng)

體育要聞

歐美又破防!中國運(yùn)動(dòng)員等結(jié)果時(shí)展示導(dǎo)彈玩偶 國際滑聯(lián):已調(diào)查

娛樂要聞

她二婚嫁給許紹雄,恩愛40年不離不棄

財(cái)經(jīng)要聞

美聯(lián)儲今夜必降息?三大懸念即將揭曉

汽車要聞

自信大廠做派 全新瑞虎8詮釋什么是穩(wěn)中進(jìn)化

態(tài)度原創(chuàng)

家居
教育
游戲
時(shí)尚
公開課

家居要聞

純白質(zhì)感 簡約而不簡單

教育要聞

媽媽,我不敢打回去:那個(gè)晚上,我找到了比拳頭更厲害的東西

知名網(wǎng)站youtube或?qū)⑴cNS2展開合作:官方回復(fù)

原來做自媒體的“成功心法”都是同一個(gè)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 精品一区二区三区国产在线观看| 国产高清一区二区三区视频| 国产精品995久久久久久人四虎| 98色婷婷在线| 国产电影无码午夜在线播放| av天堂最新网址| 国产男人天堂| 国产精品a成v人在线播放| 少妇极品熟妇人妻| 吃奶摸下高潮60分钟免费视频| 蜜臀久久99精品久久久久久小说| 亚洲一级特黄大片一级特黄| 亚洲丝袜在线播放| 久久久精品国产亚洲AV香蕉| 亚洲自偷自拍熟女另类| 久久国产情侣露脸精品| 无码人妻精品一二三区免费| 欧美日韩精品一区二区三区高清视频 | 成人网站在线进入爽爽爽| 日韩人妻中文无码一区二区七区| 国产精品乱码高清在线观看 | 亚洲图片一区二区三区| 欧美一区二区午夜福利在线yw | 亚洲AV三级片网| 欧美成人免费全部| 国产成人一区二区视频免费| 亚洲av无码影院| 中文字幕乱码亚洲精品一区| 亚洲色成人网站www永久| www.樱花视频| 嗯灬啊灬把腿张开灬动态图| 柠檬福利精品视频导航| 亚洲综合第一页| 中文无码二区-| 成人av午夜| 熟妇无码在线| av大片在线无码免费| 九色91丨PORNY丨口爆| 无码国产传媒精品一区| 国产尤物在线视精品在亚洲| 精品国产一区av|