“趁你病要你命”,趁著國內(nèi)市場(chǎng)輸入法賽道的領(lǐng)軍者搜狗輸入法陷入“病毒”爭(zhēng)議,字節(jié)跳動(dòng)旗下的AI助手豆包似乎也要做輸入法了。近日有爆料稱,豆包輸入法iOS版已經(jīng)開始內(nèi)測(cè),并主打豆包同款的AI語音識(shí)別,以及越用越準(zhǔn)的智能聯(lián)想功能。
事實(shí)上,“AI+輸入法”是國內(nèi)互聯(lián)網(wǎng)廠商在探索AI大模型技術(shù)落地時(shí),就曾經(jīng)進(jìn)行過的嘗試。早在2023年秋季,百度輸入法方面就宣布全面升級(jí),打造行業(yè)首個(gè)“基于大模型的輸入法原生應(yīng)用”,并從“輸入工具”全面轉(zhuǎn)型為“AI創(chuàng)作工具”,旨在成為用戶的全場(chǎng)景“AI創(chuàng)作助手”。
到了2024年夏季,騰訊方面宣布微信輸入法迎來升級(jí)、上線基于混元大模型打造的“一鍵AI問答”功能,為用戶提供智能交互體驗(yàn)。用戶只需要在微信聊天框中輸入內(nèi)容后添加一個(gè)“=”符號(hào),就能迅速獲得AI的智能回答。隨后搜狗輸入法也宣布迎來AI功能上新,帶來AI幫寫、AI對(duì)話、快捷問答、AI寵物、AI自拍表情等多種功能。
彼時(shí)互聯(lián)網(wǎng)大廠看中輸入法,是因?yàn)檫@一時(shí)期的AI大模型還是以文生文、文生圖為主,而輸入法則是關(guān)聯(lián)這兩種能力的最佳載體之一,通過輸入法就可以讓用戶得以習(xí)慣AIGC,進(jìn)而潤物細(xì)無聲般完成市場(chǎng)教育。只可惜后來隨著可靈、即夢(mèng)等AI視頻產(chǎn)品的快速成熟,更新奇、更具表現(xiàn)力的AI視頻應(yīng)用很快搶走了AI輸入法的光環(huán)。
當(dāng)然,AI+輸入法這一組合最大的問題,還在于交互邏輯存在缺陷。為了實(shí)現(xiàn)效率最大化,輸入法的界面過于緊湊導(dǎo)致其所能呈現(xiàn)的信息量極為有限,可偏偏AIGC的特點(diǎn)是量大管飽、而非言簡(jiǎn)意賅。以至于當(dāng)DeepSeek橫空出世之后,AI助手產(chǎn)品就迅速替代了AI輸入法的生態(tài)位。
如此一來,豆包似乎并沒有做輸入法的理由,但這次字節(jié)跳動(dòng)的產(chǎn)品經(jīng)理找到了一個(gè)特殊的細(xì)分賽道。此次豆包輸入法主打的是語音輸入,而非拼音、手寫,并強(qiáng)調(diào)擁有“豆包同款語音識(shí)別”。
用過豆包的朋友應(yīng)該對(duì)于它的語音識(shí)別能力有很深刻的印象,其基于語音識(shí)別模型Seed-ASR實(shí)現(xiàn)的智能添加標(biāo)點(diǎn)表現(xiàn)著實(shí)驚艷。
所以豆包輸入法找到的定位,關(guān)鍵就在語音上。那么什么樣的人需要更高效的語音輸入法呢?答案就是飽受數(shù)字鴻溝困擾的銀發(fā)一族。
數(shù)字鴻溝(Digital Divide)這個(gè)在1999年被提出的概念,已經(jīng)言簡(jiǎn)意賅的點(diǎn)明了這樣一個(gè)現(xiàn)象,即不同人群對(duì)于信息技術(shù)的掌握程度,決定了他們?cè)跀?shù)字化生存成為現(xiàn)實(shí)的今天的日常體驗(yàn)。
“任何在我35歲之后誕生的科技,都是違反自然規(guī)律要遭天譴的”,英國作家道格拉斯·亞當(dāng)斯的這句話,就簡(jiǎn)明扼要點(diǎn)出了中老年人陷入數(shù)字鴻溝的根源。對(duì)于新生事物接受程度弱就導(dǎo)致了他們?cè)谛畔r(shí)代遇到了麻煩,因此也就有了互聯(lián)網(wǎng)行業(yè)基于《互聯(lián)網(wǎng)應(yīng)用適老化及無障礙改造專項(xiàng)行動(dòng)方案》對(duì)旗下產(chǎn)品進(jìn)行適老化改造。
在這一輪的適老化改造中,各大廠商除了為自家產(chǎn)品增大字體、移除繁雜冗余功能,以契合老年人視力下降和思維能力放緩的生理特點(diǎn),并去除廣告和各種誘導(dǎo)下載的入口之外,語音輸入功能也是一大重點(diǎn)。這樣做的原因其實(shí)很簡(jiǎn)單,因?yàn)樵谟?jì)算機(jī)上“打字”同樣也是一個(gè)需要學(xué)習(xí)的技能。
早期的五筆輸入法就需要額外進(jìn)行學(xué)習(xí),且學(xué)習(xí)曲線過于陡峭,可智能輸入法誕生得又太晚,以至于現(xiàn)在的銀發(fā)一族在輸入內(nèi)容時(shí)更偏愛手寫和語音輸入法,這也是為什么長(zhǎng)輩動(dòng)輒就會(huì)在微信上發(fā)60秒語音的原因。然而直到目前為主,一眾輸入法的語音輸入功能都還屬于差強(qiáng)人意。
所以如何精準(zhǔn)呈現(xiàn)用戶想要表達(dá)的內(nèi)容,就是當(dāng)下語音輸入最大的挑戰(zhàn),這時(shí)候豆包輸入法就有了異軍突起的機(jī)會(huì)。據(jù)悉,豆包的語音識(shí)別模型通過上下文感知來提升識(shí)別準(zhǔn)確性,在公開測(cè)試集中的錯(cuò)誤率較國內(nèi)同類模型最高可降低40%,并支持普通話及粵語、上海話、四川話等多種方言識(shí)別,還具備低延遲的特性。
當(dāng)下在一眾AI大模型里,豆包的語音識(shí)別能力應(yīng)該是最精確的,而且即便語音識(shí)別錯(cuò)了,也能猜出用戶真正要說的內(nèi)容,就直擊了銀發(fā)一族的痛點(diǎn)。所說即所得,這就是豆包輸入法的核心競(jìng)爭(zhēng)力。
對(duì)于如今缺乏使用場(chǎng)景、缺乏用戶的AI應(yīng)用而言,能滿足特定用戶的需要簡(jiǎn)直是可遇而不可求,這也是我們認(rèn)為豆包輸入法具備在紅海中突出重圍的關(guān)鍵因素。
【本文圖片來自網(wǎng)絡(luò)】
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.