說(shuō)實(shí)話,五年前字節(jié)跳動(dòng)官宣成立火山引擎時(shí),我確實(shí)是屬于看不懂的那一個(gè)。
在我印象里,當(dāng)時(shí)云計(jì)算的牌桌上早已坐滿了阿里、騰訊、華為這些巨頭,戰(zhàn)局膠著,利潤(rùn)微薄。字節(jié)跳動(dòng)憑借抖音和頭條手握著巨大的流量和現(xiàn)金流,為什么要一頭扎進(jìn)這片吃力不討好的紅海里?
這個(gè)問(wèn)題,不僅是我,當(dāng)時(shí)身邊的許多同行都感到困惑。
然而,最近幾年,這個(gè)問(wèn)題的答案開(kāi)始變得異常清晰。
尤其是在ChatGPT點(diǎn)燃了大模型的戰(zhàn)火之后,云計(jì)算市場(chǎng)被重新激活,阿里云、火山引擎、百度智能云紛紛加大投入,讓整個(gè)中國(guó)AI云市場(chǎng)的話語(yǔ)權(quán)爭(zhēng)奪變得日益激烈,這一點(diǎn)從國(guó)際數(shù)據(jù)公司IDC的多份調(diào)研報(bào)告中可以看出端倪。
根據(jù)IDC 9月19日公布的報(bào)告,目前火山引擎在大模型公有云服務(wù)市場(chǎng)(即MaaS市場(chǎng))位居國(guó)內(nèi)第一,2025上半年市場(chǎng)份額49.2%,儼然接近半壁江山。
(圖源:火山引擎)
然而在日新月異的AI行業(yè),這樣的優(yōu)勢(shì)顯然不足以掉以輕心。10月16日,2025 火山引擎 FORCE LINK AI創(chuàng)新巡展 武漢站正式拉開(kāi)帷幕。在這場(chǎng)與NVIDIA聯(lián)合舉辦的盛會(huì)上,火山引擎用一系列發(fā)布,詮釋了“模型升級(jí)創(chuàng)新驅(qū)動(dòng)”的真諦。
雷科技受邀參加此次巡展,想知道火山引擎要折騰些什么新東西嗎?跟著我來(lái)就行了。
四大模型上新,成本進(jìn)一步下降
在火山引擎總裁譚待看來(lái),目前全球AI大模型正在三個(gè)方向上快速發(fā)展:
一是深度思考模型正與多模態(tài)理解能力融合,二是視頻、圖像、語(yǔ)音模型逐步實(shí)現(xiàn)生產(chǎn)級(jí)水平,三是企業(yè)級(jí)復(fù)雜Agent正在走向成熟,為企業(yè)激發(fā)新的生產(chǎn)力潛能。
(圖源:雷科技)
然而,在服務(wù)的過(guò)程中,火山引擎發(fā)現(xiàn),開(kāi)啟深度思考模式下,模型效果確實(shí)提升了,但也會(huì)提高模型延遲和使用成本,這導(dǎo)致實(shí)際應(yīng)用中深度思考的使用占比僅有18%。
針對(duì)這一痛點(diǎn),豆包大模型1.6正式提供 Minimal、Low、Medium、High四種思考長(zhǎng)度,平衡企業(yè)在不同場(chǎng)景下對(duì)模型效果、時(shí)延、成本的不同需求,并進(jìn)一步提升了思考效率,這也讓豆包1.6成為國(guó)內(nèi)首個(gè)原生支持“分檔調(diào)節(jié)思考長(zhǎng)度”的模型。
(圖源:雷科技)
不僅如此,為進(jìn)一步滿足企業(yè)的多樣化需求,火山引擎正式推出豆包大模型1.6 lite,號(hào)稱(chēng)性能超越豆包大模型1.5 pro,同時(shí)價(jià)格上,在使用量最大的0-32k輸入?yún)^(qū)間里,綜合使用成本較豆包1.5 pro降低53.3%,推理速度更快、更具性價(jià)比。
(圖源:雷科技)
只能說(shuō),價(jià)格控制這塊,火山引擎確實(shí)是行家中的行家。
對(duì)了,在今天大會(huì)上,火山引擎正式發(fā)布豆包語(yǔ)音合成模型2.0、豆包聲音復(fù)刻模型2.0,它們都具備更強(qiáng)的情感表現(xiàn)力、更精準(zhǔn)的指令遵循能力。
最重要的是,還能準(zhǔn)確朗讀復(fù)雜公式。
(圖源:雷科技)
事實(shí)上,在教育場(chǎng)景中,復(fù)雜公式和符號(hào)的朗讀一直是業(yè)界難題,目前市面上的語(yǔ)音大模型朗讀準(zhǔn)確率普遍低于50%,而豆包新發(fā)布的兩大語(yǔ)音模型進(jìn)行了針對(duì)性優(yōu)化,目前在小學(xué)至高中階段全學(xué)科的復(fù)雜公式朗讀中,準(zhǔn)確率可達(dá)90%。
聽(tīng)著蠟筆小新抑揚(yáng)頓挫地讀出這樣一段復(fù)雜且冗長(zhǎng)的化學(xué)公式時(shí),我承認(rèn),我真的偷笑了。
全新的語(yǔ)音模型還能搭配圖像模型來(lái)使用,快速創(chuàng)造出各種有聲繪本,對(duì)即夢(mèng)未來(lái)的發(fā)展也會(huì)有所加持。
正所謂,要“有好模型”,才能“做好應(yīng)用”。
在小雷看來(lái),好應(yīng)用的底層必須由好模型來(lái)支持。而一個(gè)好模型,既要能精準(zhǔn)捕捉用戶需求,又得具備穩(wěn)定的響應(yīng)能力,更要做到出色的成本控制。
這樣,才能讓用戶感受到“用得順、靠得住、敢去用”。
智能路由加持,應(yīng)用開(kāi)發(fā)更省心
現(xiàn)在有了“好模型”,那么問(wèn)題自然落到了如何“做好應(yīng)用”上。
在很多企業(yè)看來(lái),如今市面上的模型越來(lái)越多,哪怕只看豆包大模型家族,也有不下十來(lái)款產(chǎn)品。面對(duì)具體需求時(shí),如何選擇模型最有性價(jià)比?
為了解決這個(gè)問(wèn)題,火山引擎在今天正式發(fā)布智能模型路由(Smart Model Router),這也是國(guó)內(nèi)AI云行業(yè)首個(gè)針對(duì)模型智能選擇的解決方案。
(圖源:雷科技)
這玩意的功能很好理解,就是能夠根據(jù)用戶的實(shí)際需求自動(dòng)選擇不同的模型運(yùn)行任務(wù)。
用戶可以在火山方舟上選擇“智能模型路由”功能,從“平衡模式”、“效果優(yōu)先模式”和“成本優(yōu)先模式”三種方案進(jìn)行選擇,智能路由會(huì)針對(duì)任務(wù)請(qǐng)求自動(dòng)選擇最合適的模型,達(dá)到效果與成本的最優(yōu)解。
在會(huì)后進(jìn)行的群訪中,譚待表示,在部分場(chǎng)景中,小模型效果其實(shí)是優(yōu)于大模型的(如簡(jiǎn)單客服問(wèn)題用Flash模型,復(fù)雜問(wèn)題用大尺寸模型)。開(kāi)啟智能路由后,無(wú)論是效果還是成本,都會(huì)比直接使用對(duì)應(yīng)模型得到顯著優(yōu)化,他們希望借此降低企業(yè)技術(shù)門(mén)檻,實(shí)現(xiàn)“效果+成本雙優(yōu)”。
另一個(gè)比較有趣的更新,則是VideoPilot工具。
(圖源:雷科技)
借助這個(gè)工具,你可以深入理解參考視頻,自動(dòng)生成對(duì)應(yīng)的Prompt,讓你更方便地進(jìn)行視頻創(chuàng)作,甚至還能支持語(yǔ)言反饋,在原視頻基礎(chǔ)上實(shí)現(xiàn)多輪交互式優(yōu)化。
當(dāng)然了,這種逆推Prompt的方式,在AI玩家里早已不是什么秘密。
就拿我自己為例吧,可能是因?yàn)橛枚嗔说脑颍椰F(xiàn)在養(yǎng)成了看到場(chǎng)景、鏡頭、拍攝手法獨(dú)特的寫(xiě)真都保存一下的習(xí)慣,需要?jiǎng)?chuàng)作時(shí)只要一句簡(jiǎn)單的:
“分析可用于生成這種圖片的連貫prompt,忽略角色本身外觀/穿著特征,注重畫(huà)面構(gòu)成、角色動(dòng)作、環(huán)境描寫(xiě)和鏡頭角度,最多200字?!?/p>
如此一來(lái),豆包就能自動(dòng)生成用于制作同類(lèi)型圖片的Prompt,而VideoPilot則是把這種能力擴(kuò)充到了視頻上,讓用戶可以快速、精準(zhǔn)地完成對(duì)既有內(nèi)容/目標(biāo)內(nèi)容的模仿和擴(kuò)展。
對(duì)于視頻生成而言,擁有這樣的功能確實(shí)是省心省力不少。
在今天上午的群訪最后,譚待也表達(dá)了這樣一個(gè)觀點(diǎn):生成類(lèi)模型(生圖、生視頻)將會(huì)成為短期增長(zhǎng)的核心趨勢(shì)之一,而展望未來(lái)的話,Coding領(lǐng)域有望爆發(fā)。
歸根結(jié)底,還是當(dāng)前國(guó)內(nèi)受模型能力限制尚未完全釋放,未來(lái)潛力較大。
總結(jié)
從會(huì)場(chǎng)出來(lái),武漢的風(fēng)吹在臉上,我腦子里亂糟糟的,但又有一條線索越來(lái)越清晰。
今天的發(fā)布會(huì),表面上看是發(fā)了新模型、新工具,但骨子里,我感覺(jué)字節(jié)跳動(dòng)或者說(shuō)火山引擎,其實(shí)是在簡(jiǎn)化著AI時(shí)代的“游戲規(guī)則”。
(圖源:雷科技)
過(guò)去,大家比的是誰(shuí)的“大腦”更聰明,參數(shù)更多,跑分更高,是一場(chǎng)軍備競(jìng)賽。但火山引擎今天似乎在說(shuō):光有大腦沒(méi)用,能動(dòng)手、會(huì)干活、聽(tīng)指揮,還不貴,能踏踏實(shí)實(shí)地去為企業(yè)創(chuàng)造價(jià)值,這才是王道。
正如巡展的“城市計(jì)劃”所展示的,從廈門(mén)的持續(xù)運(yùn)營(yíng)方案,到武漢的智能路由進(jìn)化,火山引擎正一步一個(gè)腳印,將其在字節(jié)跳動(dòng)內(nèi)部海量業(yè)務(wù)中錘煉出的AI能力,系統(tǒng)性地開(kāi)放給千行百業(yè)。
在AI浪潮席卷全球的今天,許多企業(yè)依然在“如何用上AI”的門(mén)前徘徊。
現(xiàn)如今,在模型全面升級(jí)、技術(shù)門(mén)檻有效降低的情況下,為了加強(qiáng)市場(chǎng)的競(jìng)爭(zhēng)力,企業(yè)將更勇敢地邁出轉(zhuǎn)型的步伐,加速推進(jìn)AI能力和自家業(yè)務(wù)的融合。
當(dāng)大模型真正成為企業(yè)生產(chǎn)力的一部分,一場(chǎng)真正的效率革命,才算剛剛開(kāi)始。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.