夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

蘋果發(fā)布2025基礎(chǔ)模型報告,揭開Apple Intelligence技術(shù)全貌

0
分享至

蘋果公司近日正式發(fā)布了《Apple Intelligence Foundation Language Models Tech Report 2025》技術(shù)報告,這是繼去年首次公開其 AI 基礎(chǔ)模型技術(shù)細(xì)節(jié)后的重要更新。而且,就在不久前 Meta 剛剛以數(shù)千萬美元薪酬挖走了蘋果基礎(chǔ)模型團(tuán)隊負(fù)責(zé)人龐若鳴(Ruoming Pang),這份技術(shù)報告很可能是龐若鳴在蘋果生涯的最后一份重要成果。

龐若鳴本人也在社交媒體上對這份報告進(jìn)行了介紹,并正式將團(tuán)隊的重任交接給了 Zhifeng Chen。


圖丨相關(guān)推文(來源:X)

報告詳細(xì)介紹了一套雙軌并行的模型策略。第一款是一個約 30 億參數(shù)的端上模型,專為在 iPhone、iPad 和 Mac 等蘋果設(shè)備上高效運(yùn)行而設(shè)計。該模型經(jīng)過深度優(yōu)化,以充分利用蘋果自研芯片的性能。另一款則是在蘋果私有云計算上運(yùn)行的可擴(kuò)展服務(wù)器模型,用于處理更復(fù)雜的用戶請求。這種“端云協(xié)同”的架構(gòu)旨在平衡性能、效率和隱私,簡單的任務(wù)在本地設(shè)備上完成,復(fù)雜任務(wù)則交由具備同等級別隱私保護(hù)的云端服務(wù)器處理。


圖丨蘋果基礎(chǔ)模型的框架概覽(來源:Apple)

為了提升端上模型的運(yùn)行效率,蘋果的工程師們引入了一項名為“鍵值緩存共享”(KV Cache Sharing)的創(chuàng)新架構(gòu)。具體而言,他們將模型劃分為兩個區(qū)塊,其中一個區(qū)塊(占模型層數(shù)的 37.5%)直接共享另一區(qū)塊(占 62.5%)生成的鍵值緩存,從而將緩存所需的內(nèi)存減少了 37.5%,并顯著縮短了生成第一個詞元 token 的響應(yīng)時間。

對于服務(wù)器端模型,蘋果則開發(fā)了一種名為“并行軌道混合專家”(Parallel-Track Mixture-of-Experts, PT-MoE)的全新 Transformer 架構(gòu)。該架構(gòu)將一個大型模型分解為多個更小的、被稱為“軌道”(Track)的并行處理單元。每個軌道獨(dú)立處理信息,僅在特定節(jié)點(diǎn)進(jìn)行同步,從而大幅減少了傳統(tǒng)大型模型中常見的通信瓶頸,提高了訓(xùn)練和推理的效率。此外,通過在每個軌道內(nèi)部署混合專家(MoE)層,該模型能夠更高效地擴(kuò)展,以低延遲處理復(fù)雜任務(wù),同時不犧牲模型質(zhì)量。


圖丨PT-MoE 架構(gòu)示意圖(來源:Apple)

在賦予模型理解圖像的多模態(tài)能力方面,報告也披露了其視覺編碼器的技術(shù)細(xì)節(jié)。服務(wù)器和端上模型分別采用了 ViT-g 和更高效的 ViTDet-L 作為視覺主干網(wǎng)絡(luò)。值得一提的是,端上模型還采用了一種新穎的“寄存器-窗口”(Register-Window)機(jī)制,使其能夠同時有效捕捉圖像的全局上下文信息和局部精細(xì)細(xì)節(jié)。

在訓(xùn)練數(shù)據(jù)方面,蘋果保持了其一貫強(qiáng)調(diào)隱私保護(hù)的風(fēng)格,在報告中明確了其數(shù)據(jù)來源和隱私原則。訓(xùn)練數(shù)據(jù)主要來自三方面:從出版商處授權(quán)的數(shù)據(jù)、由蘋果網(wǎng)頁爬蟲 Applebot 抓取的公開網(wǎng)絡(luò)信息,以及高質(zhì)量的合成數(shù)據(jù)。蘋果特別強(qiáng)調(diào),在訓(xùn)練過程中絕不使用用戶的私人個人數(shù)據(jù)或用戶交互信息。

同時,公司遵循 robots.txt 協(xié)議,允許網(wǎng)站發(fā)布者選擇不讓其內(nèi)容被用于模型訓(xùn)練,從源頭上保障了內(nèi)容所有者的權(quán)利和用戶隱私。報告顯示,蘋果處理了超過 100 億對高質(zhì)量的圖文對和 50 億對合成圖像標(biāo)題數(shù)據(jù),并通過先進(jìn)的流水線進(jìn)行過濾和提純,以確保訓(xùn)練數(shù)據(jù)的質(zhì)量。


圖丨蘋果的分布式異步強(qiáng)化學(xué)習(xí)基礎(chǔ)設(shè)施(來源:Apple)

為了讓這些模型能在實(shí)際設(shè)備上高效運(yùn)行,蘋果采用了積極的優(yōu)化策略。端上模型通過“量化感知訓(xùn)練”(Quantization-Aware Training, QAT)技術(shù),將模型權(quán)重壓縮至每權(quán)重 2 比特。服務(wù)器模型則利用了一種名為“自適應(yīng)可擴(kuò)展紋理壓縮”(Adaptive Scalable Texture Compression, ASTC)的技術(shù),該技術(shù)利用了蘋果 GPU 中已有的硬件解壓模塊,能夠以幾乎零計算成本的方式對模型權(quán)重進(jìn)行解壓,最終將模型壓縮至每權(quán)重約 3.56 比特。對于壓縮過程中可能出現(xiàn)的性能損失,蘋果則通過訓(xùn)練低秩適配器(Low-Rank Adaptation, LoRA)來進(jìn)行補(bǔ)償和恢復(fù)。

性能評估的結(jié)果顯示,在 MMLU 等標(biāo)準(zhǔn)測試中,蘋果的端上模型表現(xiàn)優(yōu)于或持平于 Qwen-2.5-3B、Gemma-3-4B 等同規(guī)模的開源模型。


(來源:Apple)

服務(wù)器模型則在與 LLaMA 4 Scout 的對比中表現(xiàn)出色,但與 Qwen-3-235B 和 GPT-4o 等更大規(guī)模的模型相比仍有差距。在與人類評分員進(jìn)行的并排比較中,蘋果的模型在多個語言區(qū)域和任務(wù)中的表現(xiàn)都較為突出。


圖丨蘋果基礎(chǔ)模型在文本上的人類評估(來源:Apple)

最后,蘋果還為開發(fā)者推出了全新的“基礎(chǔ)模型框架”(Foundation Models framework),允許開發(fā)者直接調(diào)用設(shè)備上的 30 億參數(shù)模型。該框架與 Swift 語言深度集成,通過名為“引導(dǎo)式生成”的功能,開發(fā)者可以僅用幾行代碼就讓模型直接生成結(jié)構(gòu)化的 Swift 數(shù)據(jù)類型,極大地簡化了在應(yīng)用中集成 AI 功能的過程。蘋果強(qiáng)調(diào),整個框架的設(shè)計都貫徹了其負(fù)責(zé)任 AI 的原則,內(nèi)置了多重安全護(hù)欄,旨在幫助開發(fā)者構(gòu)建既智能又注重隱私保護(hù)的下一代應(yīng)用。

參考資料:

1. https://machinelearning.apple.com/research/apple-foundation-models-tech-report-2025

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
太郁悶了,靈活就業(yè)人員繳費(fèi)20年,每月只發(fā)了1600元,合理嗎?

太郁悶了,靈活就業(yè)人員繳費(fèi)20年,每月只發(fā)了1600元,合理嗎?

碎月導(dǎo)師
2025-08-07 07:00:03
福建90后夫妻6個兒子卻還要生,一頓吃500個水餃,想擁有36個孫子

福建90后夫妻6個兒子卻還要生,一頓吃500個水餃,想擁有36個孫子

牛牛叨史
2025-07-30 02:24:31
93年,男子借9萬買下北京院子的廁所被全家反對,16年后意外發(fā)生

93年,男子借9萬買下北京院子的廁所被全家反對,16年后意外發(fā)生

前沿天地
2025-08-05 12:34:06
004、005號即將公開!國產(chǎn)核航母刷新中國海軍歷史

004、005號即將公開!國產(chǎn)核航母刷新中國海軍歷史

書中自有顏如玉
2025-08-07 05:07:42
京東豪擲百億拿下比亞迪50萬輛大單,汽車帝國正式起航?

京東豪擲百億拿下比亞迪50萬輛大單,汽車帝國正式起航?

四象八卦
2025-08-05 06:36:30
國民黨主席選定?10萬人投票出爐,盧秀燕、蔣萬安排二三

國民黨主席選定?10萬人投票出爐,盧秀燕、蔣萬安排二三

愛意隨風(fēng)起呀
2025-08-06 09:02:54
記者:周末上海德比球票售罄 觀眾數(shù)大概率創(chuàng)近3賽季申花主場紀(jì)錄

記者:周末上海德比球票售罄 觀眾數(shù)大概率創(chuàng)近3賽季申花主場紀(jì)錄

直播吧
2025-08-07 11:05:13
在播劇熱度榜,《定風(fēng)波》第4,《凡人修仙傳》第2,第1后來居上

在播劇熱度榜,《定風(fēng)波》第4,《凡人修仙傳》第2,第1后來居上

娛君墜星河
2025-08-06 14:15:14
只剩最后不到1個月,莫迪提出無理要求,決心攪黃中方大事?

只剩最后不到1個月,莫迪提出無理要求,決心攪黃中方大事?

湘評中外
2025-08-07 17:35:08
7天新增2892例!多地通知:實(shí)行14天健康監(jiān)測!成都疾控發(fā)布重要提示!

7天新增2892例!多地通知:實(shí)行14天健康監(jiān)測!成都疾控發(fā)布重要提示!

CD潮生活
2025-08-07 11:47:14
iPhone 18 Pro首發(fā)!蘋果最強(qiáng)基帶曝光

iPhone 18 Pro首發(fā)!蘋果最強(qiáng)基帶曝光

快科技
2025-08-07 15:32:05
全員交社保,奶茶店的老板和員工怎么破局?結(jié)果應(yīng)該是這樣的

全員交社保,奶茶店的老板和員工怎么破局?結(jié)果應(yīng)該是這樣的

恪守原則和底線
2025-08-07 17:58:22
日媒:中國正在出口新型生產(chǎn)模式

日媒:中國正在出口新型生產(chǎn)模式

參考消息
2025-08-07 13:45:08
阿拉法特的錯誤,造成了巴勒斯坦的苦難,中國數(shù)十年前曾勸告未果

阿拉法特的錯誤,造成了巴勒斯坦的苦難,中國數(shù)十年前曾勸告未果

博覽歷史
2025-08-07 17:54:49
男子除夕夜殺害7個月大侄女案開庭 其弟:庭上與哥哥對視一直流淚,一家人鬧僵難以諒解

男子除夕夜殺害7個月大侄女案開庭 其弟:庭上與哥哥對視一直流淚,一家人鬧僵難以諒解

紅星新聞
2025-08-06 16:44:25
小鵬汽車何小鵬:以前是科技第一現(xiàn)在顏值第一,在上海租了兩棟樓給造型團(tuán)隊,要啥給啥!一年在AI訓(xùn)練上花20億,設(shè)計也可花20億

小鵬汽車何小鵬:以前是科技第一現(xiàn)在顏值第一,在上海租了兩棟樓給造型團(tuán)隊,要啥給啥!一年在AI訓(xùn)練上花20億,設(shè)計也可花20億

和訊網(wǎng)
2025-08-07 09:07:09
難!市場冷清+就業(yè)危機(jī),威少恐無球可打,全看庫明加臉色啊

難!市場冷清+就業(yè)危機(jī),威少恐無球可打,全看庫明加臉色啊

球童無忌
2025-08-07 18:09:20
印度公布陣風(fēng)被擊落原因,中國“虛標(biāo)”導(dǎo)彈射程,把印度騙慘了

印度公布陣風(fēng)被擊落原因,中國“虛標(biāo)”導(dǎo)彈射程,把印度騙慘了

博覽歷史
2025-08-04 18:04:18
網(wǎng)友爆料:全民社保后,樓下麥當(dāng)勞只招聘大學(xué)生兼職和50歲老人

網(wǎng)友爆料:全民社保后,樓下麥當(dāng)勞只招聘大學(xué)生兼職和50歲老人

古希臘掌管松餅的神
2025-08-06 09:10:59
這一仗徹底把泰國打醒,卡了中國四年的軍購,佩通坦內(nèi)閣終于點(diǎn)頭

這一仗徹底把泰國打醒,卡了中國四年的軍購,佩通坦內(nèi)閣終于點(diǎn)頭

史紀(jì)文譚
2025-08-07 16:36:20
2025-08-07 19:27:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨(dú)家合作
15497文章數(shù) 513968關(guān)注度
往期回顧 全部

科技要聞

蘋果宣布在美追加千億投資,股價應(yīng)聲漲5%

頭條要聞

男子因雞蛋被侄兒吃掉抱怨 妻子崩潰摔碗后已經(jīng)回老家

頭條要聞

男子因雞蛋被侄兒吃掉抱怨 妻子崩潰摔碗后已經(jīng)回老家

體育要聞

文班接受加內(nèi)特指導(dǎo) 此前曾在少林寺練功夫

娛樂要聞

葉珂說剛生完孩子 和黃曉明沒分手?

財經(jīng)要聞

李稻葵:建議給外來打工者發(fā)15萬安家費(fèi)

汽車要聞

90.8%得房率還有華為全家桶 嵐圖全新知音8月13日預(yù)售

態(tài)度原創(chuàng)

游戲
本地
時尚
親子
公開課

《戰(zhàn)地6》最新視頻評論區(qū)被"血洗":玩家聲討服務(wù)器

本地新聞

非遺里的天津|讓盛唐的榮華,在蠶絲銅絲間復(fù)活

媽媽說,把頭發(fā)梳上去大大方方的才好看!

親子要聞

3歲寶寶放暑假在家,大家聽聽他說的是人話嗎???

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 精品无码av毛片一区二区三区| 久久久久护士毛片96| 操老女人操老熟妇| 任你躁在线精品免费69影视| 性av无码天堂| 欧美熟妇性xxxx交潮喷| 高清无码午夜福利视频| 樱花视频在线| 亚洲妇熟xxxx妇色黄| 精品无码国产自产拍在线观看 | 黑人插嫩逼逼视频| 国产中文视频| aaaaa级少妇高潮大片| 人妻av图片在线| 欧美精品一二三区| 色欲888又粗又黄国产精品| 成在人线AV无码免费看网站直播 | 国产不雅视频| 免费av永久在线| 亚洲中文字幕av在天堂| 亚洲最大av网站在线观看| 欧美色图国产成人| 美女又黄又免费的视频| 国产av综合第一页| 无码人妻丰满熟妇啪啪7774| 亚洲五月激情| 欧美丰满老熟妇乱叫| 无码一区二区三区av免费蜜桃| 国产一区二区三区不卡av| av天堂成| 别搞内射在线看| 国产精东传媒成人AV电影| 亚洲无码在线一区二区三区| 乱人妻人伦中文字幕| 涩久久婷婷色影视| 国产成人aaaaa级毛片| 国产AⅤ无码精品一区二区三区| 亚洲深夜福利| 亚洲AV无码精品一区二区三区| 懂色av一区二区三区蜜臀 | 亚洲无人区码二码三码区别|