機(jī)器之心報(bào)道
編輯:澤南
真正實(shí)用化的生成式 AI,應(yīng)該是這個樣子 ——
作為助手可以幫你代打電話,根據(jù)你的選項(xiàng)進(jìn)行應(yīng)答,還能引導(dǎo)對方轉(zhuǎn)人工:
功能覆蓋多個場景,連接大量第三方應(yīng)用,實(shí)現(xiàn)多智能體的一鍵協(xié)同:
拍照時可以 AI 修圖消除路人,live photo 也可以:
昨天剛剛結(jié)束的 2025 年 vivo 開發(fā)者大會上,我們看到了 vivo 展示的全新端側(cè) AI 能力。這一次,AI 手機(jī)終于不再是個概念,而是成為了我們生活工作的理想助手。
One Model 領(lǐng)銜
模型矩陣重塑手機(jī) AI 體驗(yàn)
為什么要說這一次不一樣?因?yàn)?vivo 面對當(dāng)前業(yè)界追逐云端大參數(shù)模型的趨勢進(jìn)行了一次戰(zhàn)略回應(yīng)。vivo 認(rèn)為,真正覆蓋大眾且可持續(xù)的 AI 體驗(yàn),核心不應(yīng)是單純的參數(shù)競賽,而是堅(jiān)定不移地走「更懂用戶的個人化智能」之路。
這一戰(zhàn)略思考的結(jié)晶,便是本次開發(fā)者大會的重磅核心,vivo 提出了全新的 One Model:藍(lán)心 3B 端側(cè)多模態(tài)推理大模型。它不僅讓模型更加輕量化,也為打破「API 成本高墻」、解決 AI 規(guī)?;涞仉y題給出了確定性答案。
在新一代芯片和模型的加持下,vivo 打造了端云協(xié)同,端側(cè)部署優(yōu)先的大模型核心引擎。其中包括五大模型:語言、語音、圖像、3B 端側(cè)多模態(tài)推理大模型和個人專屬模型。
端云協(xié)同兼顧了強(qiáng)大的通用能力和極致的個人化體驗(yàn):云端模型掌握海量知識,端側(cè)模型則在提供快速推理的同時在物理上保障了個人隱私。二者協(xié)同進(jìn)化,構(gòu)成完整的智能。
其中的 30 億參數(shù)模型,可以在如今的旗艦手機(jī) SoC 上流暢運(yùn)行。vivo 表示,經(jīng)過一系列優(yōu)化,藍(lán)心 3B 端側(cè)大模型以 60% 的參數(shù)量,效果即可比肩行業(yè)最優(yōu)的 4B 級純語言模型,推理速度可達(dá) 200 Token/s:這并非一次性能上的妥協(xié),而是一次極致優(yōu)化的勝利。
更為重要的是,集大成的藍(lán)心 3B 實(shí)現(xiàn)了端側(cè)的多模態(tài)推理能力。通過從芯片、系統(tǒng)、模型到應(yīng)用的全鏈路軟硬協(xié)同優(yōu)化,藍(lán)心 3B 端側(cè)多模態(tài)推理大模型實(shí)現(xiàn)了驚人的能效比 —— 在多模態(tài)權(quán)威榜單 OpenCompass 上,它實(shí)現(xiàn)了越級挑戰(zhàn),性能超越一眾先進(jìn)的 8B 模型。這充分證明,一條經(jīng)過深度優(yōu)化的端側(cè)個人化智能之路,正在關(guān)鍵體驗(yàn)上超越依賴通用能力的云端大模型。
藍(lán)心 3B 端側(cè)大模型同時支持語言任務(wù)及多模態(tài)任務(wù)深度思考,通過混合推理架構(gòu),支持自動切換思考 / 非思考模式,開啟深度思考模式時可處理更加復(fù)雜的任務(wù),讓復(fù)雜推理不再是云端的獨(dú)有技能。
在基座模型通用能力的基礎(chǔ)上,vivo 聚焦個人化智能,梳理核心場景能力,并進(jìn)行了專項(xiàng)優(yōu)化。這套強(qiáng)大的端側(cè)能力,精準(zhǔn)地?fù)糁辛水?dāng)前 AI 應(yīng)用開發(fā)者面臨的三大核心痛點(diǎn):不可忽視的 API 成本、延遲及網(wǎng)絡(luò)質(zhì)量帶來的體驗(yàn)差異,以及難以逾越的隱私鴻溝。
現(xiàn)在,屏幕理解、OCR 卡證提取、UlAgent 等過去嚴(yán)重依賴云端 API 的復(fù)雜任務(wù),都有機(jī)會在手機(jī)本地高效完成。這意味著,在多個關(guān)鍵場景下,其表現(xiàn)已能與主流云端源 API 相媲美,但成本近乎為零,且數(shù)據(jù)無需上傳云端,保障隱私安全。
這為開發(fā)者打開了全新的想象空間:可以無限制地調(diào)用這些強(qiáng)大的 AI 能力,去構(gòu)建那些過去因成本和體驗(yàn)問題而無法實(shí)現(xiàn)的應(yīng)用,真正推動 AI 應(yīng)用的規(guī)模化落地。
再進(jìn)一步,端側(cè)模型能力的提升讓手機(jī)上的多智能體協(xié)同工作成為了可能。發(fā)布會上,vivo 展示了基于屏幕理解自動操作執(zhí)行任務(wù)的 UI Agent,它能看懂屏幕,然后模擬人類對手機(jī)進(jìn)行點(diǎn)擊、滑動等操作,一步步幫你完成任務(wù),實(shí)現(xiàn)不依賴技能接口定義的手機(jī)操控。
此外還有大幅增強(qiáng)的本地 AI 搜索,覆蓋系統(tǒng)所有應(yīng)用模塊的文本處理能力等等。
在端云協(xié)同的模型矩陣之下,vivo 已經(jīng)將大模型能力融入到 OS 系統(tǒng)底層的各個模塊。在這樣的能力加持之下,手機(jī)上的 AI 不再是碎片化的工具,而是成為了無處不在的系統(tǒng)級智能。更重要的是,新一代的 AI 實(shí)現(xiàn)了「個人化」—— 是專屬于你的智能助手。
走向個人化
構(gòu)建「人類的思維架構(gòu)」
如果說藍(lán)心大模型矩陣是從零到一,保證了 AI 基礎(chǔ)能力的技術(shù)底座,那么 vivo 在 AI 操作系統(tǒng)上的深度整合與生態(tài)構(gòu)建,就是讓未來 AI 泛在化的建筑藍(lán)圖。
根據(jù)這份藍(lán)圖,vivo 基于手機(jī)操作系統(tǒng)與應(yīng)用的無縫集成,深度融合個人數(shù)據(jù),打造出了手機(jī) AI「個人化智能」的全新體驗(yàn)。
具體說來,整個 AI 操作系統(tǒng)的構(gòu)建,從最基礎(chǔ)的一端進(jìn)行了理論重構(gòu)。vivo 認(rèn)為,AIOS 不是 AI 功能參數(shù)的簡單堆砌,大模型技術(shù)與手機(jī)的結(jié)合需要全新的思維范式:基于對腦科學(xué)的深入研究思考,vivo 選擇模擬人類的思維架構(gòu),建立起了一套高效的核心引擎。在此之上,藍(lán)心 AIOS 通過感知、記憶、規(guī)劃、執(zhí)行四大引擎協(xié)同,讓 AI 系統(tǒng)真正具備了理解、思考和行動的能力。
其中,實(shí)時感知是對圖像、文本、聲音等多模態(tài)內(nèi)容的識別;記憶是對用戶數(shù)據(jù)、行為的存儲和理解;執(zhí)行包括調(diào)用工具與服務(wù),對現(xiàn)實(shí)世界的交互;自主規(guī)劃則是主動思考,拆解復(fù)雜任務(wù)并執(zhí)行。
相對于傳統(tǒng)操作系統(tǒng)中人類給出指令,機(jī)器完成任務(wù)的「標(biāo)準(zhǔn)形式」,在 AI 時代,智能體通過自己主動來完成任務(wù)的方式大幅提升效率,不僅能夠更加快速地完成任務(wù),還可以解決你還未顧及到的問題。因此,AIOS 的體驗(yàn)和過去比會有本質(zhì)上的不同。但這就意味著手機(jī)上的智能體需要實(shí)時、不斷地基于上下文背景分析場景要素信息,通過環(huán)境感知、對記憶內(nèi)容的關(guān)聯(lián),規(guī)劃推理得出結(jié)論,進(jìn)而執(zhí)行相應(yīng)的操作。
另一方面,類比人類的思維與工作方式,手機(jī) AI 單線程的方式能力仍然有限,因此就需要多智能體協(xié)同來形成「群體智能」。在今年的 AI 大趨勢中,多智能體分工協(xié)作的方法快速進(jìn)步,它們能夠驅(qū)動手機(jī)中的多個應(yīng)用分工協(xié)作,可在接到任務(wù)后進(jìn)行動態(tài)的調(diào)度和規(guī)劃,完成復(fù)雜、通用化的任務(wù)。
大模型被認(rèn)為是未來的 OS,這套「系統(tǒng)」其中 App 的互聯(lián),需要打通 App 之間的隔閡。在多智能體能力上,藍(lán)心小 V 已經(jīng)與多家合作伙伴合作,打造出了覆蓋健康、教育、出行、情感、辦公等場景的智能體。
裝進(jìn)口袋的不僅是 AI
還有全新生態(tài)
可以看到,相比全部自行研發(fā),vivo 更希望通過打造藍(lán)心智能體矩陣、開放的 AI 能力,攜手開發(fā)者共建一套生態(tài)。
vivo 手機(jī)上強(qiáng)大的端側(cè)能力來自于從芯片、系統(tǒng)、AI 模型到應(yīng)用的全鏈路垂直整合與深度優(yōu)化,這是 vivo 與合作伙伴共同努力的結(jié)果。在這之上,vivo 選擇把最核心的能力開放出來,期待更多合作方能夠加入進(jìn)來。
vivo 本次宣布開放的內(nèi)容包括強(qiáng)大的端側(cè) AI 能力、端云協(xié)同的模型矩陣,統(tǒng)一開放的 Agent 框架,以及與 OS 深度整合的系統(tǒng)級能力。
基于對個人化智能的核心理解,藍(lán)心 AIOS 這套認(rèn)知框架已經(jīng)為開發(fā)者們搭起了平臺,開發(fā)者們可以快速構(gòu)建出實(shí)用化的 AI 應(yīng)用。這一開放的生態(tài)還會隨著越來越多參與者的加入,變得更有活力。
僅看智能體能力,開發(fā)者構(gòu)建出來的新能力最短僅需要 10 分鐘就能上架到 vivo智能體生態(tài)。第三方開發(fā)好 Agent API 后,基于平臺進(jìn)行配置、創(chuàng)建與調(diào)試,通過平臺與藍(lán)心小 V 的 A2A 協(xié)議就可以發(fā)布上線了。
vivo 展示了一系列多方合作的成果。
去年,vivo 與螞蟻集團(tuán)旗下 AI 健康應(yīng)用 AQ 合作,入駐了藍(lán)心小 V 智能體廣場,提供病癥咨詢、找醫(yī)院、找名醫(yī)、藥盒識別等 AI 能力。
AQ 由自主研發(fā)千億參數(shù)多模態(tài)模型支撐,依托超萬億 tokens 專業(yè)醫(yī)療語料底座,并融合千萬級醫(yī)療知識圖譜,實(shí)現(xiàn)全方位醫(yī)學(xué)感知和分析能力,使其具備對疾病特征、診療邏輯和醫(yī)學(xué)表述的深度理解。它具備「醫(yī)學(xué)思維」,可以通過多輪對話、拍皮膚、識報(bào)告等方式對身體狀況進(jìn)行分析推斷,還與全國超 5000 家醫(yī)院、近百萬醫(yī)生、超 300 位名醫(yī) AI 分身實(shí)現(xiàn)高效服務(wù)連接,提供從掛號、問診、購藥到醫(yī)保等全場景服務(wù)。據(jù)介紹,螞蟻 AQ 升級后,在藍(lán)心小 V 健康流量占比提升了三倍。
新增的 AQ AI 營養(yǎng)師還可以為用戶提供菜譜、輔食、健康常識和食物熱量查詢等能力。
未來,vivo 還將持續(xù)構(gòu)建能力底座,設(shè)立接入標(biāo)準(zhǔn),進(jìn)行平臺基建,并規(guī)范保障信息安全隱私,希望能夠共同推動行業(yè)的發(fā)展及經(jīng)驗(yàn)閉環(huán)。
長遠(yuǎn)來看,手機(jī)端側(cè)的智能會帶來近乎零成本的無限次推力、毫秒級的快速響應(yīng),以及物理上的數(shù)據(jù)安全性,它不僅會構(gòu)成更好的 AI 體驗(yàn),也將會顛覆應(yīng)用與應(yīng)用之間的運(yùn)行邏輯。
結(jié)語
個人化、通用且原生的 AI,將會很快進(jìn)入到我們的生活中,逐漸顛覆生產(chǎn)力。
vivo 展示了一條具有前瞻性,但務(wù)實(shí)合理的技術(shù)路徑,基于自身豐富的技術(shù)儲備和行動力做到了快人一步。聚焦于 AI 的端側(cè)效率、多模態(tài)自然交互和系統(tǒng)級深度融合,vivo 已在手機(jī)上帶來了更懂你、更主動、更安全的個性化 AI 體驗(yàn)。
也正是基于此,vivo 給出了自己的愿景:在未來的三到五年,要讓超過 3 億的設(shè)備擁有強(qiáng)大的本地 AI 能力。
昨天的展示當(dāng)然還不是全部,10 月 13 日 vivo X300 系列正式發(fā)布時,我們或許還能看到更多驚喜。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.