夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

蘋果提出新型反向傳播:一臺iPhone 15 Pro Max就能微調(diào)LLM

0
分享至



機器之心報道

編輯:Panda

用 iPhone 本地跑大模型已經(jīng)不是新鮮事了,但能不能在 iPhone 上微調(diào)模型呢?

最近,蘋果親自上場,用一篇論文展示了其可行性。在這篇論文中,蘋果提出了一種內(nèi)存高效型反向傳播(MeBP)。該方法可在內(nèi)存使用量和計算時間之間提供比零階優(yōu)化(ZO/zeroth-order optimization)更好的權(quán)衡,同時還比 ZO 基線收斂更快、性能更優(yōu)。他們還在 iPhone 15 Pro Max 上驗證了 MeBP 的有效性。

這個蘋果團隊(宋叢崢與 Xinyu Tang)也在論文中表示會發(fā)布一個 MeBP 實現(xiàn),但其公開的鏈接目前還空無一碼。



  • 論文標題:Memory-Efficient Backpropagation for Fine-Tuning LLMs on Resource-Constrained Mobile Devices
  • 論文地址:https://arxiv.org/abs/2510.03425
  • 倉庫地址:https://github.com/apple/ml-mebp

內(nèi)存高效型反向傳播(MeBP)

在這篇論文中,蘋果團隊的研究重點是使用 LoRA 微調(diào) LLM。因此,主要的內(nèi)存瓶頸在于模型參數(shù)和中間激活值。該團隊的目標是將微調(diào)的內(nèi)存使用量保持在現(xiàn)代移動設備可接受的范圍內(nèi),例如 PocketLLM 所建議的「低于 1GB」。

使用 MeBP 在設備上微調(diào) LLM 包含三個步驟:

  • 壓縮模型基礎權(quán)重(凍結(jié)的參數(shù))以減少磁盤空間占用
  • 編譯包含反向傳播和梯度檢查點的訓練圖(training graph)以優(yōu)化內(nèi)存
  • 實現(xiàn)一個內(nèi)存高效的運行時(runtime)來執(zhí)行編譯后的訓練圖。

下面將詳細描述每個步驟。

基礎模型權(quán)重壓縮

在設備上部署 LLM 時,壓縮基礎模型權(quán)重以減少磁盤空間使用是一種常見做法。

在該團隊的實現(xiàn)中,他們對包括嵌入在內(nèi)的非 LoRA 參數(shù)使用了 4-bit 對稱模式 INT4 量化。

梯度檢查點編譯



也就是說,反向圖的輸入是:已被檢查點的激活值、來自前一個檢查點的梯度、以及相應的可訓練權(quán)重;其輸出則是這些輸入的梯度。

隨后,所有塊的前向圖和反向圖被序列化為設備運行時兼容的格式,例如模型中間語言(MIL)表示或 MLX 導出的函數(shù)。

在運行時,這些序列化后的圖將被反序列化并編譯以進行計算。

運行時實現(xiàn)

算法 1 概述了 MeBP 的運行時實現(xiàn)。



模型首先使用 InitializeModel 函數(shù)進行初始化,之后訓練循環(huán)中的每個數(shù)據(jù)點都會調(diào)用 Backpropagation 函數(shù)。在 InitializeModel 期間,壓縮后的基礎模型權(quán)重被內(nèi)存映射(memory-mapped)。為最小化內(nèi)存占用,基礎模型權(quán)重在訓練循環(huán)開始前不會被解壓。相反,它們會在計算需要時才被按需(on demand)延遲解壓和加載。注意,對于支持使用量化權(quán)重進行計算的設備運行時框架,解壓步驟可以被跳過,屆時只需按需加載壓縮后的權(quán)重。

在 Backpropagation 函數(shù)中,系統(tǒng)首先執(zhí)行已編譯的前向子圖(subgraphs)以存儲所有必要的檢查點;隨后,按相反順序執(zhí)行已編譯的反向子圖,使用存儲的檢查點來計算梯度。在前向傳播過程中,這些檢查點被內(nèi)存映射,而不是保留在內(nèi)存中。

在每次前向和反向傳播之前,只有必需的基礎模型權(quán)重會被解壓和加載。如此一來,總內(nèi)存使用量被限制為:所需基礎模型權(quán)重的大小,加上每個子圖中操作的峰值內(nèi)存使用量。這個總和遠小于基礎模型權(quán)重的完整大小。該函數(shù)描述的是單個數(shù)據(jù)點的梯度計算。對于批量輸入,可以使用梯度累積來計算梯度,而不會增加內(nèi)存占用。

在 MeBP 中,內(nèi)存中僅為優(yōu)化器保留一份 LoRA 權(quán)重及其梯度的副本。

對于參數(shù)量從 0.5B 到 4B 的 LLM,LoRA 權(quán)重的大小通常在幾十 MB 的范圍內(nèi),這在內(nèi)存中存儲是合理的。優(yōu)化器狀態(tài)(例如動量)可以像基礎模型權(quán)重一樣,被內(nèi)存映射并延遲加載。

實驗表現(xiàn)如何?

MeBP 表現(xiàn)如何,還得看實踐,而作為對比的基線,他們選擇了 MeZO,因為它是目前已知的唯一應用于移動設備 LLM 微調(diào)的優(yōu)化方法。該團隊通過服務器端的模擬來評估 MeZO 和 MeBP 的效用(utility),并在移動設備上比較它們的性能。

效用(Utility)比較

配置上,這個蘋果團隊使用了 Gemma-3 和 Qwen-2.5,在 WikiText-2 數(shù)據(jù)集上進行語言建模任務實驗,以此比較一階(FO)優(yōu)化(即通過反向傳播獲得梯度)和零階(ZO)優(yōu)化的效用。該團隊專注于參數(shù)量不超過 4B 的模型,因為移動設備的計算資源有限。該團隊的評估指標是評估集上的損失(loss)和下一 token 準確度。其它配置見原論文,下面重點關(guān)注結(jié)果。

如圖 1 所示,盡管 ZO 的損失和下一 token 準確度呈現(xiàn)收斂趨勢,但 ZO 的收斂速度明顯慢于 FO。FO 方法在最初的 100 步內(nèi)就顯著改善了這兩項指標,而 ZO 在 1,000 步后僅顯示出輕微的改善。即使在 100,000 步之后(即比 FO 多 100 倍的優(yōu)化步數(shù)),對于同一模型,ZO 的測試損失仍然高于 FO,測試準確度也低于 FO。



目前 AI 社區(qū)已經(jīng)提出了幾種方法,可以改善 ZO 方法的收斂速度。該團隊也在 Qwen2.5-0.5B 上使用了這些改進版 ZO 方法進行實驗,結(jié)果見下圖。



盡管這些方法比「純」 ZO 收斂得更快,但其損失和下一 token 準確度仍然劣于使用 FO 微調(diào)的模型。此外,這些方法通常每次迭代需要更多的計算時間,因為它們需要額外的前向傳播來更準確地估計梯度。

效用結(jié)果表明,在語言建模任務的 LLM 微調(diào)上,按「每一步」(per-step)來看,反向傳播的收斂速度明顯快于 ZO 方法。這使得它在計算時間方面更適合移動部署 —— 前提是每個 FO 優(yōu)化步驟都能被高效地實現(xiàn)。

性能比較

蘋果使用 Swift 在 iOS 中實現(xiàn)了 MeBP,并在配備 8GB RAM 的 iPhone 15 Pro Max 上評估了其性能。對于 MeZO 基線實現(xiàn),其前向圖被拆分為多個子圖,并應用了延遲解壓來減少基礎模型權(quán)重的總內(nèi)存使用。每個 MeZO 優(yōu)化步驟涉及兩次前向傳播。其它設置見原論文。

結(jié)果見下表。



總體而言,與 MeZO 相比,MeBP 每個梯度步驟的計算時間要多 43% 到 94%。但是,正如前面的效用對比所示,MeZO 所需的步數(shù)是一階優(yōu)化的 10 倍到 100 倍以上,因此在時間方面,MeBP 的收斂速度要快得多。在最壞情況下,MeBP 的內(nèi)存使用量比 MeZO 多出 20%,但其總訓練內(nèi)存使用量比以往的移動設備實現(xiàn)大約小 10 倍。所有測試的 LLM 均可在 1GB 內(nèi)存內(nèi)高效微調(diào),使其適合在手機上進行后臺訓練。

此外,該團隊還測試了解壓開銷與序列長度的影響,并還分析了每一層的性能;詳見原論文。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
送走特朗普這尊大神,高市早苗發(fā)出請求,希望和中方在韓國見一面

送走特朗普這尊大神,高市早苗發(fā)出請求,希望和中方在韓國見一面

歷史求所知
2025-10-30 14:51:11
防死約基奇,能鎖哈登!勇士4680萬押寶一夜升值,科爾欽點他首發(fā)

防死約基奇,能鎖哈登!勇士4680萬押寶一夜升值,科爾欽點他首發(fā)

奕辰說球
2025-10-30 10:56:06
翁帆疑似得到1億遺產(chǎn)!搬出清華別墅的她,讓所有質(zhì)疑都成了笑話

翁帆疑似得到1億遺產(chǎn)!搬出清華別墅的她,讓所有質(zhì)疑都成了笑話

悅君兮君不知
2025-10-30 21:45:58
10月30日法國冠軍賽16強亂了,不光雨果爆冷,張本智和也出局了!

10月30日法國冠軍賽16強亂了,不光雨果爆冷,張本智和也出局了!

妙知
2025-10-30 15:38:36
A股,下午跳水的原因找到了,明天,或?qū)⒂瓉碇嘘幘€調(diào)整!

A股,下午跳水的原因找到了,明天,或?qū)⒂瓉碇嘘幘€調(diào)整!

夜深愛雜談
2025-10-30 19:50:17
博主發(fā)現(xiàn)2025年了錘子官網(wǎng)依然能打開:錘子T1廣告語變了

博主發(fā)現(xiàn)2025年了錘子官網(wǎng)依然能打開:錘子T1廣告語變了

快科技
2025-10-29 09:48:45
今日金價:30日,大家注意,明后兩天,金價很可能迎來更大的變盤

今日金價:30日,大家注意,明后兩天,金價很可能迎來更大的變盤

牛鍋巴小釩
2025-10-30 00:36:22
年僅20歲!不幸確診癌癥!NBA總冠軍后衛(wèi)徹底廢了

年僅20歲!不幸確診癌癥!NBA總冠軍后衛(wèi)徹底廢了

籃球教學論壇
2025-10-31 02:31:39
工行回應APP資產(chǎn)異常清零

工行回應APP資產(chǎn)異常清零

大象新聞
2025-10-30 15:43:08
泰國總理正式宣布全球,退出參加APEC會議,全國降半旗30天,原因顯而易見

泰國總理正式宣布全球,退出參加APEC會議,全國降半旗30天,原因顯而易見

蘭妮搞笑分享
2025-10-30 08:42:21
小米空調(diào)10年包修,網(wǎng)友質(zhì)疑如潮,雷軍天要塌了

小米空調(diào)10年包修,網(wǎng)友質(zhì)疑如潮,雷軍天要塌了

新行情
2025-10-30 14:15:26
演砸了,媒體人曝北京國安原計劃送亞泰三分,前中超冠軍兇多吉少

演砸了,媒體人曝北京國安原計劃送亞泰三分,前中超冠軍兇多吉少

姜大叔侃球
2025-10-30 16:08:05
WTT冠軍賽:16強誕生,陳熠絕殺,頭號種子+8號種子爆冷出局

WTT冠軍賽:16強誕生,陳熠絕殺,頭號種子+8號種子爆冷出局

林子說事
2025-10-30 15:10:45
成都馬拉松這件事,用“世風日下”來形容都太文明了!

成都馬拉松這件事,用“世風日下”來形容都太文明了!

胖胖說他不胖
2025-10-29 19:59:43
金價重現(xiàn)歷史了:大家要有心理準備,下周,金價或?qū)⒅噩F(xiàn)15年歷史

金價重現(xiàn)歷史了:大家要有心理準備,下周,金價或?qū)⒅噩F(xiàn)15年歷史

生活新鮮市
2025-10-30 01:49:43
國家一級運動員突發(fā)腦出血離世!年僅28歲

國家一級運動員突發(fā)腦出血離世!年僅28歲

極目新聞
2025-10-30 13:23:59
大部分社會資源都是不公開的

大部分社會資源都是不公開的

詩詞中國
2025-10-28 20:33:05
抵達北京,國足新帥上任?46歲名帥,多次奪冠,年薪不超100萬

抵達北京,國足新帥上任?46歲名帥,多次奪冠,年薪不超100萬

體育有點水
2025-10-30 15:12:01
成本不到28元,竟賣出72000元天價!全國上千名受害者,警方出手

成本不到28元,竟賣出72000元天價!全國上千名受害者,警方出手

霹靂炮
2025-10-29 22:36:21
沒有發(fā)生戰(zhàn)爭之前,烏克蘭亞速營是非常瞧不起我們中國人的!

沒有發(fā)生戰(zhàn)爭之前,烏克蘭亞速營是非常瞧不起我們中國人的!

忠于法紀
2025-09-20 08:52:32
2025-10-31 03:20:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11611文章數(shù) 142495關(guān)注度
往期回顧 全部

數(shù)碼要聞

小米、長虹達成戰(zhàn)略合作!小米大家電總經(jīng)理:制造業(yè)的未來不是單打獨斗

頭條要聞

比利時防長稱可將莫斯科“從地圖上抹去” 俄羅斯怒了

頭條要聞

比利時防長稱可將莫斯科“從地圖上抹去” 俄羅斯怒了

體育要聞

里夫斯送壓哨絕殺比肩韋斯特 你的里皇 確實猖狂!

娛樂要聞

江一燕自曝離婚,前夫身份曝光

財經(jīng)要聞

商務部:美方將暫?;蛉∠麑θA部分關(guān)稅

科技要聞

一夜"封神",黃仁勛的英偉達,值半個A股

汽車要聞

最新鴻蒙座艙/AI云舒座椅 嵐圖泰山內(nèi)飾官圖發(fā)布

態(tài)度原創(chuàng)

家居
教育
游戲
旅游
公開課

家居要聞

木美術(shù)館 重塑體驗空間

教育要聞

不止在校園!這所學校的運動會,“跑”遍成都18個地標

Epic喜加二:恐怖游戲大放送!總價值138元 領(lǐng)到就賺

旅游要聞

“穿越”奇幻時光

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 国产小受被做到哭咬床单GV| 99热99热99| 国产成人无码va在线播放| 激情一区二区三区| 精品中文字幕人妻一二| 蜜桃av抽搐高潮一区二区| 亚洲精品一区二区三天美| 88国产精品视频| 伊人中文在线最新版天堂| 成人电影久久| 国产99精品| 女人爽到高潮视频免费直播| 日韩巨臀一区| 国产亚洲无日韩乱码| 一区二区日韩| 一本色道久久综合狠狠躁篇| 天天躁日日躁很很很躁中文字幕| 国产精品久久久久久亚洲影视| 成人制服亚洲第一页| 少妇色欲网站| 97人人模人人爽人人少妇| 免费h片网站| 成人国产精品无码网站| 欧美禁忌taoo在线观看| 国产精品天干天干有线观看| 老熟女搡小伙子HD另类| 大粗鳮巴久久久久久久久| 亚洲精品国偷自产| 韩国v欧美v亚洲v日本v| 精品综合一区二区三区四区| 国产99精品玖玖| 永久免费无码日韩视频| 精产国品一二三产区M553| 777色欲网| 欧美黑人巨大xxxxx| 久久精品国产99精品国产2021| 天天日天天射天天舔| 国产一区二区三区奇米久涩| 亚洲综合在线视频自拍| 婷婷久久97精品国产| 被喂春药蹂躏的欲仙欲死视频|