網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

首家AIOS落地來自vivo：個人化智能復(fù)刻人類思維，手機(jī)還能這樣用

2025-10-11 14:27:35　來源: 機(jī)器之心Pro

北京舉報(bào)

分享至

機(jī)器之心報(bào)道

編輯：澤南

真正實(shí)用化的生成式 AI，應(yīng)該是這個樣子 ——

作為助手可以幫你代打電話，根據(jù)你的選項(xiàng)進(jìn)行應(yīng)答，還能引導(dǎo)對方轉(zhuǎn)人工：

功能覆蓋多個場景，連接大量第三方應(yīng)用，實(shí)現(xiàn)多智能體的一鍵協(xié)同：

拍照時可以 AI 修圖消除路人，live photo 也可以：

昨天剛剛結(jié)束的 2025 年 vivo 開發(fā)者大會上，我們看到了 vivo 展示的全新端側(cè) AI 能力。這一次，AI 手機(jī)終于不再是個概念，而是成為了我們生活工作的理想助手。

One Model 領(lǐng)銜

模型矩陣重塑手機(jī) AI 體驗(yàn)

為什么要說這一次不一樣？因?yàn)?vivo 面對當(dāng)前業(yè)界追逐云端大參數(shù)模型的趨勢進(jìn)行了一次戰(zhàn)略回應(yīng)。vivo 認(rèn)為，真正覆蓋大眾且可持續(xù)的 AI 體驗(yàn)，核心不應(yīng)是單純的參數(shù)競賽，而是堅(jiān)定不移地走「更懂用戶的個人化智能」之路。

這一戰(zhàn)略思考的結(jié)晶，便是本次開發(fā)者大會的重磅核心，vivo 提出了全新的 One Model：藍(lán)心 3B 端側(cè)多模態(tài)推理大模型。它不僅讓模型更加輕量化，也為打破「API 成本高墻」、解決 AI 規(guī)?；涞仉y題給出了確定性答案。

在新一代芯片和模型的加持下，vivo 打造了端云協(xié)同，端側(cè)部署優(yōu)先的大模型核心引擎。其中包括五大模型：語言、語音、圖像、3B 端側(cè)多模態(tài)推理大模型和個人專屬模型。

端云協(xié)同兼顧了強(qiáng)大的通用能力和極致的個人化體驗(yàn)：云端模型掌握海量知識，端側(cè)模型則在提供快速推理的同時在物理上保障了個人隱私。二者協(xié)同進(jìn)化，構(gòu)成完整的智能。

其中的 30 億參數(shù)模型，可以在如今的旗艦手機(jī) SoC 上流暢運(yùn)行。vivo 表示，經(jīng)過一系列優(yōu)化，藍(lán)心 3B 端側(cè)大模型以 60% 的參數(shù)量，效果即可比肩行業(yè)最優(yōu)的 4B 級純語言模型，推理速度可達(dá) 200 Token/s：這并非一次性能上的妥協(xié)，而是一次極致優(yōu)化的勝利。

更為重要的是，集大成的藍(lán)心 3B 實(shí)現(xiàn)了端側(cè)的多模態(tài)推理能力。通過從芯片、系統(tǒng)、模型到應(yīng)用的全鏈路軟硬協(xié)同優(yōu)化，藍(lán)心 3B 端側(cè)多模態(tài)推理大模型實(shí)現(xiàn)了驚人的能效比 —— 在多模態(tài)權(quán)威榜單 OpenCompass 上，它實(shí)現(xiàn)了越級挑戰(zhàn)，性能超越一眾先進(jìn)的 8B 模型。這充分證明，一條經(jīng)過深度優(yōu)化的端側(cè)個人化智能之路，正在關(guān)鍵體驗(yàn)上超越依賴通用能力的云端大模型。

藍(lán)心 3B 端側(cè)大模型同時支持語言任務(wù)及多模態(tài)任務(wù)深度思考，通過混合推理架構(gòu)，支持自動切換思考 / 非思考模式，開啟深度思考模式時可處理更加復(fù)雜的任務(wù)，讓復(fù)雜推理不再是云端的獨(dú)有技能。

在基座模型通用能力的基礎(chǔ)上，vivo 聚焦個人化智能，梳理核心場景能力，并進(jìn)行了專項(xiàng)優(yōu)化。這套強(qiáng)大的端側(cè)能力，精準(zhǔn)地?fù)糁辛水?dāng)前 AI 應(yīng)用開發(fā)者面臨的三大核心痛點(diǎn)：不可忽視的 API 成本、延遲及網(wǎng)絡(luò)質(zhì)量帶來的體驗(yàn)差異，以及難以逾越的隱私鴻溝。

現(xiàn)在，屏幕理解、OCR 卡證提取、UlAgent 等過去嚴(yán)重依賴云端 API 的復(fù)雜任務(wù)，都有機(jī)會在手機(jī)本地高效完成。這意味著，在多個關(guān)鍵場景下，其表現(xiàn)已能與主流云端源 API 相媲美，但成本近乎為零，且數(shù)據(jù)無需上傳云端，保障隱私安全。

這為開發(fā)者打開了全新的想象空間：可以無限制地調(diào)用這些強(qiáng)大的 AI 能力，去構(gòu)建那些過去因成本和體驗(yàn)問題而無法實(shí)現(xiàn)的應(yīng)用，真正推動 AI 應(yīng)用的規(guī)模化落地。

再進(jìn)一步，端側(cè)模型能力的提升讓手機(jī)上的多智能體協(xié)同工作成為了可能。發(fā)布會上，vivo 展示了基于屏幕理解自動操作執(zhí)行任務(wù)的 UI Agent，它能看懂屏幕，然后模擬人類對手機(jī)進(jìn)行點(diǎn)擊、滑動等操作，一步步幫你完成任務(wù)，實(shí)現(xiàn)不依賴技能接口定義的手機(jī)操控。

此外還有大幅增強(qiáng)的本地 AI 搜索，覆蓋系統(tǒng)所有應(yīng)用模塊的文本處理能力等等。

在端云協(xié)同的模型矩陣之下，vivo 已經(jīng)將大模型能力融入到 OS 系統(tǒng)底層的各個模塊。在這樣的能力加持之下，手機(jī)上的 AI 不再是碎片化的工具，而是成為了無處不在的系統(tǒng)級智能。更重要的是，新一代的 AI 實(shí)現(xiàn)了「個人化」—— 是專屬于你的智能助手。

走向個人化

構(gòu)建「人類的思維架構(gòu)」

如果說藍(lán)心大模型矩陣是從零到一，保證了 AI 基礎(chǔ)能力的技術(shù)底座，那么 vivo 在 AI 操作系統(tǒng)上的深度整合與生態(tài)構(gòu)建，就是讓未來 AI 泛在化的建筑藍(lán)圖。

根據(jù)這份藍(lán)圖，vivo 基于手機(jī)操作系統(tǒng)與應(yīng)用的無縫集成，深度融合個人數(shù)據(jù)，打造出了手機(jī) AI「個人化智能」的全新體驗(yàn)。

具體說來，整個 AI 操作系統(tǒng)的構(gòu)建，從最基礎(chǔ)的一端進(jìn)行了理論重構(gòu)。vivo 認(rèn)為，AIOS 不是 AI 功能參數(shù)的簡單堆砌，大模型技術(shù)與手機(jī)的結(jié)合需要全新的思維范式：基于對腦科學(xué)的深入研究思考，vivo 選擇模擬人類的思維架構(gòu)，建立起了一套高效的核心引擎。在此之上，藍(lán)心 AIOS 通過感知、記憶、規(guī)劃、執(zhí)行四大引擎協(xié)同，讓 AI 系統(tǒng)真正具備了理解、思考和行動的能力。

其中，實(shí)時感知是對圖像、文本、聲音等多模態(tài)內(nèi)容的識別；記憶是對用戶數(shù)據(jù)、行為的存儲和理解；執(zhí)行包括調(diào)用工具與服務(wù)，對現(xiàn)實(shí)世界的交互；自主規(guī)劃則是主動思考，拆解復(fù)雜任務(wù)并執(zhí)行。

相對于傳統(tǒng)操作系統(tǒng)中人類給出指令，機(jī)器完成任務(wù)的「標(biāo)準(zhǔn)形式」，在 AI 時代，智能體通過自己主動來完成任務(wù)的方式大幅提升效率，不僅能夠更加快速地完成任務(wù)，還可以解決你還未顧及到的問題。因此，AIOS 的體驗(yàn)和過去比會有本質(zhì)上的不同。但這就意味著手機(jī)上的智能體需要實(shí)時、不斷地基于上下文背景分析場景要素信息，通過環(huán)境感知、對記憶內(nèi)容的關(guān)聯(lián)，規(guī)劃推理得出結(jié)論，進(jìn)而執(zhí)行相應(yīng)的操作。

另一方面，類比人類的思維與工作方式，手機(jī) AI 單線程的方式能力仍然有限，因此就需要多智能體協(xié)同來形成「群體智能」。在今年的 AI 大趨勢中，多智能體分工協(xié)作的方法快速進(jìn)步，它們能夠驅(qū)動手機(jī)中的多個應(yīng)用分工協(xié)作，可在接到任務(wù)后進(jìn)行動態(tài)的調(diào)度和規(guī)劃，完成復(fù)雜、通用化的任務(wù)。

大模型被認(rèn)為是未來的 OS，這套「系統(tǒng)」其中 App 的互聯(lián)，需要打通 App 之間的隔閡。在多智能體能力上，藍(lán)心小 V 已經(jīng)與多家合作伙伴合作，打造出了覆蓋健康、教育、出行、情感、辦公等場景的智能體。

裝進(jìn)口袋的不僅是 AI

還有全新生態(tài)

可以看到，相比全部自行研發(fā)，vivo 更希望通過打造藍(lán)心智能體矩陣、開放的 AI 能力，攜手開發(fā)者共建一套生態(tài)。

vivo 手機(jī)上強(qiáng)大的端側(cè)能力來自于從芯片、系統(tǒng)、AI 模型到應(yīng)用的全鏈路垂直整合與深度優(yōu)化，這是 vivo 與合作伙伴共同努力的結(jié)果。在這之上，vivo 選擇把最核心的能力開放出來，期待更多合作方能夠加入進(jìn)來。

vivo 本次宣布開放的內(nèi)容包括強(qiáng)大的端側(cè) AI 能力、端云協(xié)同的模型矩陣，統(tǒng)一開放的 Agent 框架，以及與 OS 深度整合的系統(tǒng)級能力。

基于對個人化智能的核心理解，藍(lán)心 AIOS 這套認(rèn)知框架已經(jīng)為開發(fā)者們搭起了平臺，開發(fā)者們可以快速構(gòu)建出實(shí)用化的 AI 應(yīng)用。這一開放的生態(tài)還會隨著越來越多參與者的加入，變得更有活力。

僅看智能體能力，開發(fā)者構(gòu)建出來的新能力最短僅需要 10 分鐘就能上架到 vivo智能體生態(tài)。第三方開發(fā)好 Agent API 后，基于平臺進(jìn)行配置、創(chuàng)建與調(diào)試，通過平臺與藍(lán)心小 V 的 A2A 協(xié)議就可以發(fā)布上線了。

vivo 展示了一系列多方合作的成果。

去年，vivo 與螞蟻集團(tuán)旗下 AI 健康應(yīng)用 AQ 合作，入駐了藍(lán)心小 V 智能體廣場，提供病癥咨詢、找醫(yī)院、找名醫(yī)、藥盒識別等 AI 能力。

AQ 由自主研發(fā)千億參數(shù)多模態(tài)模型支撐，依托超萬億 tokens 專業(yè)醫(yī)療語料底座，并融合千萬級醫(yī)療知識圖譜，實(shí)現(xiàn)全方位醫(yī)學(xué)感知和分析能力，使其具備對疾病特征、診療邏輯和醫(yī)學(xué)表述的深度理解。它具備「醫(yī)學(xué)思維」，可以通過多輪對話、拍皮膚、識報(bào)告等方式對身體狀況進(jìn)行分析推斷，還與全國超 5000 家醫(yī)院、近百萬醫(yī)生、超 300 位名醫(yī) AI 分身實(shí)現(xiàn)高效服務(wù)連接，提供從掛號、問診、購藥到醫(yī)保等全場景服務(wù)。據(jù)介紹，螞蟻 AQ 升級后，在藍(lán)心小 V 健康流量占比提升了三倍。

新增的 AQ AI 營養(yǎng)師還可以為用戶提供菜譜、輔食、健康常識和食物熱量查詢等能力。

未來，vivo 還將持續(xù)構(gòu)建能力底座，設(shè)立接入標(biāo)準(zhǔn)，進(jìn)行平臺基建，并規(guī)范保障信息安全隱私，希望能夠共同推動行業(yè)的發(fā)展及經(jīng)驗(yàn)閉環(huán)。

長遠(yuǎn)來看，手機(jī)端側(cè)的智能會帶來近乎零成本的無限次推力、毫秒級的快速響應(yīng)，以及物理上的數(shù)據(jù)安全性，它不僅會構(gòu)成更好的 AI 體驗(yàn)，也將會顛覆應(yīng)用與應(yīng)用之間的運(yùn)行邏輯。

結(jié)語

個人化、通用且原生的 AI，將會很快進(jìn)入到我們的生活中，逐漸顛覆生產(chǎn)力。

vivo 展示了一條具有前瞻性，但務(wù)實(shí)合理的技術(shù)路徑，基于自身豐富的技術(shù)儲備和行動力做到了快人一步。聚焦于 AI 的端側(cè)效率、多模態(tài)自然交互和系統(tǒng)級深度融合，vivo 已在手機(jī)上帶來了更懂你、更主動、更安全的個性化 AI 體驗(yàn)。

也正是基于此，vivo 給出了自己的愿景：在未來的三到五年，要讓超過 3 億的設(shè)備擁有強(qiáng)大的本地 AI 能力。

昨天的展示當(dāng)然還不是全部，10 月 13 日 vivo X300 系列正式發(fā)布時，我們或許還能看到更多驚喜。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.