盼望著盼望著,各家新機扎堆發(fā)布,雙十一&數(shù)碼國補也快到了——用了好幾年的舊手機,終于要 “光榮退役” 了?
等等!換新前先打住,要不要再蹲一波真正的AI手機?
去年我們迎來了AI手機元年,能觀察到手機AI已經(jīng)從只會報天氣、找手機的 “小跟班” ,往 “萬能搭子” 的方向轉(zhuǎn)型了。
生成式AI一天一個新花樣,進化速度快得離譜,AI手機的潛力同理可以想象。
2025年過半,它能進步多少?它能否像自動駕駛改變開車一樣,改變手機的操作體驗?
帶著這份好奇,我們請到了@陳震同學(xué),帶我們看看“手機的‘智駕系統(tǒng)’到底到哪一步了?”
我們評價一輛車的智能駕駛,不是看參數(shù)多華麗,而是看它能不能在復(fù)雜路況下,幫你省心、省力、甚至救命。
AI手機也一樣——不能光會說不會做,得真的能‘上路’,而且最好能告別冰冷的“人機感”,做到回答、辦事有活人感,像朋友一樣省心省力溫暖可靠。
基于此,我們設(shè)計了行業(yè)首次 “百題AI拉力賽”——從工作到生活,從實操到情緒價值,三臺頂級旗艦同臺競技,看誰的AI更“像人”、更“會辦事”。
這不是一場參數(shù)規(guī)模的 “紙面PK”,而是實打?qū)嵖糀I“智商”(辦事實力)和 “情商”(貼心程度)的終極壓力測試。
誰能扛住 100 道題的考驗?結(jié)果到底怎么樣?別急,跟著咱們的首席出題官@陳震同學(xué),一起看個明白。
第一關(guān),任務(wù)與工作日常息息相關(guān)。
P人出差,很難有從從容容、游刃有余的空間,AI能否幫我們避免匆匆忙忙、連滾帶爬?
面對“航班來不及、打一輛最快的車”的任務(wù),仨AI一出手,高下立判。
左右兩邊的,頂多算 “半吊子助手”,只能幫忙點開叫車 APP,選車型、確認呼叫還得自己手動操作,跟 “自動” 完全不沾邊。
但中間這臺直接 “開掛”—— 不光能跨滴滴、高德等平臺一起叫車,還懂 “智能兜底”:只要有一個平臺先接單,立馬自動取消其他平臺的訂單,不用你盯著手機來回切。
確實把打車這件事從頭到尾辦利索了,跨出了關(guān)鍵一步。
換到更考驗 “決策力” 的購物任務(wù) ——“幫我找《紅樓夢》有沒有優(yōu)惠,有的話直接下單”,差距依然。
當(dāng)左右兩位還在“思考”或卡在某個步驟時,中間這位已經(jīng)行云流水般走完了多平臺比價、領(lǐng)券、加購物車的全流程。
當(dāng)任務(wù)從“動手操作”轉(zhuǎn)向“動腦問答”時,兩邊AI的表現(xiàn)開始出現(xiàn)明顯的波動。
輸出行業(yè)報告、識別汽車零件、策劃跨界合作,以及應(yīng)對“護照被偷”的應(yīng)急處理、探討自動駕駛的倫理困境、分析熱點這些問題上,回答質(zhì)量時高時低,思路時清晰時模糊,顯得不太穩(wěn)定。
相比之下,中間的選手在這一系列任務(wù)中都保持了結(jié)構(gòu)清晰、內(nèi)容扎實、執(zhí)行可靠的高水準,穩(wěn)定且優(yōu)秀。
考完工作里的 “效率題”,現(xiàn)場緊接著便測了一番生活里的 “細碎活”,畢竟過日子的麻煩可比做報表雜多了。
奶茶要三分糖還是全糖、點外賣湊幾個菜才不浪費、查快遞不用翻遍APP、記清每個平臺的小號密碼…… 這些日常小事,AI 能接得住嗎?
結(jié)果看下來,AI 們的表現(xiàn)跟工作關(guān)差不多,還是有人實干、有人劃水。
挑西瓜,左右兩邊屬于免責(zé)聲明拉滿、實事一點不干。
中間的選手不但理論輸出最全面,實干表現(xiàn)也相當(dāng)可得住,現(xiàn)場人工吃瓜實測,確實選出了最甜的西瓜。
切換到估算絲瓜湯熱量、識別植物與貓咪品種、查找滑雪攻略、分析“牛肉面不要面”的飲食現(xiàn)象、查詢淘寶物流狀態(tài)、查找賬號密碼、聊穿搭、聊健身、聊體檢、寫大眾點評評論、劇荒推薦比賽、做購物功課等等這些任務(wù),差距就時大時小了。
左右兩邊的選手而能給出實用建議,時而只能提供泛泛之談,表現(xiàn)難以預(yù)測。中間的選手表現(xiàn)則依舊穩(wěn)定。
這一輪再次證明,真正好用的AI不僅要懂得更多理論,更要能將模糊的理論經(jīng)驗,轉(zhuǎn)化為可靠的實際行動。
除了干活麻利、會點外賣,我們對AI或許還有更深層的期待——它能不能脫離“人機感”,在交流時給我們更多的陪伴感、更懂我?
這一輪的關(guān)鍵問題,一個考驗的是創(chuàng)意——“幫我把這張照片,背景P成賽車場/修出賽博朋克的風(fēng)格?!?/p>
能看到基礎(chǔ)的圖片PS、生成方面,三臺手機都能理解需求、交付成果,但細看之下,右邊的摳圖痕跡會比較明顯,中間的表現(xiàn)會更接近主流圖像生成模型的水準。
另一個關(guān)鍵問題,考驗的則既是眼力又是情商——“你覺得,照片里的小男孩,長大了會成為什么樣的人?”
左右兩位的回答,像是標準模板,介紹了陳震的生平事跡。
而中間的選手,卻給出了一段充滿細節(jié)和溫度的描繪。它仿佛在嘗試為照片的人物寫傳記故事,結(jié)合事實給出了一個既真實又好玩、可讀性拉滿的回答。
這一刻,你感覺到的不是工具在應(yīng)答,而是一個人在給你講故事。
此外,在“財務(wù)自由為何還要工作”、“愛好變成工作是福是禍”、“心情不好推薦歌曲”“領(lǐng)導(dǎo)為什么愛下班開會”“檢查錯別字”“高強度上班后空虛”“前同事結(jié)婚該不該隨份子”“steam最新有什么好玩游戲”“松弛感是不是天生的”“幫忙懟黑粉”等問題上,三臺AI的能力水平也趨于一致,只不過中間選手的回答會更接近真人對話體驗。
總的來說,在這輪測試里榮耀Magic8 Pro的表現(xiàn)是最能打的
整體來看,在工作、生活與情緒價值三個維度、一百個問題的考驗中,榮耀Magic8 Pro全面勝出。
在工作場景,它能精準理解并作為手替執(zhí)行一連串的指令;在生活領(lǐng)域,它能理解復(fù)雜指令、自行思考然后操作服務(wù);在情緒價值層面,它更能提供具有“活人感”的互動體驗,不管是辦正事還是聊閑天,都讓人覺得更好用、更懂人。
說實話,看完榮耀 Magic8 Pro 在百題測試里的表現(xiàn),不少人應(yīng)該會跟我一樣眼前一亮:原來 AI 手機不只是 “喊個指令出結(jié)果”,還能真的像個 “搭子” 一樣,把出差打車、日常點單這些麻煩事給扛了,甚至聊老照片時還能說幾句暖話。
但YOYO這次的表現(xiàn),真能成為AI手機引爆市場的“第一槍”嗎?
它會像幾年前的ChatGPT那樣,一夜之間卷起時代風(fēng)浪,逼出更多強大的對手,也逼出更快進化的自己嗎?
我們期待答案是Yes,但夢想終究需要時間來驗證。
說到底,一枝獨秀不是春。
手機市場,等待一個真正的“新故事”已經(jīng)太久。
當(dāng)“one more thing”式的創(chuàng)新逐漸放緩,當(dāng)影像賽道已卷至像素與傳感器的極限,廠商們還能在高階戰(zhàn)場上亮出什么新花樣?
AI,正是這個存量時代最被看好的突破口。但它究竟能為體驗帶來多少真實提升、為市場帶來多少新增量,仍需要一場又一場像這樣的實戰(zhàn)來驗證。
我們期待百花齊放的AI,能通過良性的競爭,更快地、真正地把未來,推進每個人的手中。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.