夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話火山引擎譚待:馬拉松才跑 500 米,要做中國 AI 云第一

0
分享至



“規(guī)模決定一切,最終牌桌上一定有火山?!?br/>

文丨賀乾明

在字節(jié)負(fù)責(zé)云計算業(yè)務(wù)火山引擎 5 年,譚待變得更從容了。要來這里時,很多朋友都勸他慎重:字節(jié)比同行晚了 10 年才做云計算,肯定起不來。那是他壓力最大的階段。他說,現(xiàn)在朋友們談起火山引擎,會說做得還可以。

火山引擎交出了亮眼的成績單。據(jù)市場調(diào)研機(jī)構(gòu) IDC 統(tǒng)計,去年國內(nèi)云端大模型調(diào)用量,火山引擎一家占了 46.4%,比二三名加起來都多。去年 12 月到現(xiàn)在,豆包大模型平均每天處理的 Token 處理量翻了兩番到 16.4 萬億,已經(jīng)逼近國外的科技巨頭。

譚待說,除了火山引擎用技術(shù)優(yōu)化壓低了大模型價格,豆包 App 也幫了不少忙,“很多客戶都會拿著跟豆包的聊天 Case 找過來,問火山引擎能不能在企業(yè)場景中實現(xiàn)類似的效果?”

他判斷 Agent 是火山引擎更大的機(jī)會:過去的云平臺為網(wǎng)頁和 App 開發(fā)設(shè)計,需要程序員理解業(yè)務(wù),定義規(guī)則和算法,然后驅(qū)動數(shù)據(jù)做事,上限就是所有人的時間總和。現(xiàn)在 Agent 成為主體,模型可以自己思考、規(guī)劃、編排流程,自動執(zhí)行解決問題,上限遠(yuǎn)高于 App 時代,“我們正在加碼加班做好準(zhǔn)備”。

6 月 11 日,火山引擎舉辦春季 Force 原動力大會,推出 MCP 服務(wù)、提示詞工具(Prompt Pilot)、知識管理系統(tǒng)、強(qiáng)化學(xué)習(xí)框架(veRL)等為 Agent 定制開發(fā)的套件,并宣布根據(jù) “輸入長度” 區(qū)間給 Agent 調(diào)用的思考模型定價,“綜合成本只有豆包 1.5 深度思考模型或 DeepSeek-R1 的三分之一”。

“模型使用成本要降下來,才能推動 Agent 的規(guī)?;瘧?yīng)用?!?譚待說,經(jīng)營云平臺最重要的是規(guī)模要大,“規(guī)模大了,服務(wù)器多、負(fù)載高,就會對技術(shù)有很高的要求,會強(qiáng)迫我們做好各種事情?!?/p>

這個判斷也讓他敢在 2021 就定下 1000 億元的年收入目標(biāo),那年中國云平臺第一的阿里云年收入只有 600 億,大模型浪潮還沒有蹤影。給他信心的是,算上字節(jié)整個集團(tuán)的業(yè)務(wù),火山引擎能調(diào)度的計算資源規(guī)模不比阿里云少。

現(xiàn)在看整體的云計算市場,火山引擎的份額也不在前三。但譚待的信心更充足了,“馬拉松剛跑了 500 米”,未來市場空間最少會擴(kuò)大 100 倍,火山會持續(xù)保持國內(nèi) AI 第一,在傳統(tǒng)云服務(wù)的存量市場持續(xù)增長。

“這幾年 AI 快速普及,我覺得挺幸運(yùn)的?!?他說,只要世界和平,經(jīng)濟(jì)發(fā)展,年收入 1000 億肯定沒問題。

本周,譚待接受《晚點 LatePost》訪談,詳細(xì)分享了火山引擎如何迅速抓住大模型機(jī)會、對 Agent 發(fā)展的思考,以及火山引擎過去 5 年的發(fā)展經(jīng)歷和攢下來的經(jīng)驗。

“規(guī)模決定一切,最終牌桌上一定有火山”

晚點:火山引擎上線 5 年了。剛開始很多從業(yè)者都不看好你們,為什么你們覺得可以做?

譚待:剛開始做火山的時候,管理層就提過一個類似的問題:我們做的晚,為什么還有機(jī)會?

我們當(dāng)時的邏輯是,云是一個很大的賽道。跟國外相比,國內(nèi)云計算在 GDP 里的滲透率還很低,這意味著有很大的空間。

晚點:你們剛開始主要對外提供推薦系統(tǒng)服務(wù)。后來全面進(jìn)入云計算領(lǐng)域,瞄準(zhǔn)的方向是云原生,發(fā)展并沒有特別快。

譚待:那個市場是一個存量的市場,增長就是慢。

晚點:火山引擎剛開始定的目標(biāo)是做中國第四朵云?,F(xiàn)在來看,你們是把目標(biāo)定高了,還是低估了難度?

譚待:第四朵云是有時間期限的,多用幾年,我們還是有信心的。最后還是規(guī)模決定一切,最終牌桌上一定有火山。

現(xiàn)在 AI 就帶來了一個新賽道,我們可以很快做到第一。存量賽道我們可以一點點往上走。

晚點:火山在 AI 上投入很激進(jìn)。你們怎么評估這個機(jī)遇的?

譚待:火山引擎很早就把 AI 當(dāng)做重要方向,做的確實還可以。剛開始做火山的時候,管理層還給我布置了一個作業(yè):想象一下十年以后的云,也就是 2030 年的時候,跟 2020 年有什么不同。

這個問題,我想了很久。我隱約覺得,不同肯定是因為技術(shù)迭代。但什么新技術(shù)呢?那時有很多,區(qū)塊鏈、元宇宙、AI 等等,我覺得最有可能的還是 AI 。

當(dāng)時自動駕駛開始上 Transformer 架構(gòu)了,對云端算力有很大需求。我們就從自動駕駛公司開始,比如理想、吉利這些。然后又接觸了很多 AI 創(chuàng)業(yè)公司,比如 MiniMax、智譜,然后發(fā)現(xiàn)大模型起來了。

我就感覺那個問題的答案自然就來了。這幾年 AI 快速普及,我覺得還是挺幸運(yùn)的。

晚點:為什么說很幸運(yùn)?

譚待:AI 公司的需求不小,但要求也很高。22 年就需要把幾千張 GPU 做成單一集群做訓(xùn)練,還是很有挑戰(zhàn)。行業(yè)里面很少有公司做這樣的事情。但抖音是有的,推薦、廣告系統(tǒng)模型都很大,只不過它是稀疏的模型。

這里面有一個很重要的點,火山成立有一個原則,一定是要內(nèi)外技術(shù)同源,把最好的技術(shù)拿出去。這看起來理所當(dāng)然,但不容易做到。很多云平臺最后都會搞一個內(nèi)部業(yè)務(wù)上云。這就說明,他們云業(yè)務(wù)和內(nèi)部體系是分裂的。

我們在組織上做了很多的設(shè)計,確保不分裂。這樣的好處是,我們推出機(jī)器學(xué)習(xí)平臺時,就具備真實環(huán)境中大規(guī)模訓(xùn)練的經(jīng)驗。

很多公司選擇火山,不是因為我們有卡,而是因為我們能夠穩(wěn)定地把模型訓(xùn)練出來。

晚點:你們在 2022 年就看到 MiniMax、智譜的需求提升,有建議公司盡快做大模型嗎?豆包大模型出來的確挺晚。

譚待:沒建議。很快 ChatGPT 就出來了,就不需要我建議了。

晚點:同行都在 2023 年推出大模型服務(wù),你們不著急嗎?

譚待:創(chuàng)新肯定是不能規(guī)劃的。我們還是希望把模型做好了再對外推。國內(nèi)的模型也都是 24 年才逐步成熟。搶跑幾個月沒有意義。

晚點:聽上去你很從容。這么多年壓力最大的是什么時候?

譚待:剛開始做火山的時候。我原本是做技術(shù)的,沒有經(jīng)營過業(yè)務(wù),也沒有管理過特別大的團(tuán)隊。

晚點:那為什么字節(jié)的高管會讓你管,而不是找個更有經(jīng)驗的云計算行業(yè)高管?

譚待:可能是覺得我很有熱情,也有潛力(笑)。就我本身而言,這跟我的職業(yè)規(guī)劃有關(guān),我原來在百度很快就做到 T11(工程師最高職級),也想轉(zhuǎn)型做業(yè)務(wù),要跟技術(shù)強(qiáng)相關(guān),做 ToB 基本是唯一的選項了。

在云計算行業(yè)做了很久的人,并不一定對字節(jié)有信心。我面試的時候,一些有經(jīng)驗的朋友跟我說:字節(jié)肯定做不起來。現(xiàn)在他們會跟我說,火山做得挺好的。

晚點:你們最大的競爭對手是誰?

譚待:挺多的。排在我們前面的,都是很有力的競爭者。

晚點:你們要做第一?

譚待:國內(nèi) AI 這一塊,我們的目標(biāo)肯定是第一。市場空間未來可能會擴(kuò)大 100 倍,保持第一還是很有挑戰(zhàn)的。

晚點:火山引擎有個 1000 億的收入目標(biāo)。什么時候定下的?

譚待:21 年左右寫 BP (商業(yè)計劃書)的時候。當(dāng)時判斷這個業(yè)務(wù)周期很長,就不寫 3 年 BP 了,寫個 8 到 10 年的。

晚點:為什么是 1000 億?

譚待:云是一個很大的市場,要取得一定的份額才有價值。

晚點:火山引擎去年收入 100 億,今年沖刺 200 多億。千億目標(biāo)進(jìn)度條現(xiàn)在只有 25%。距離你的目標(biāo)剩不了幾年,能做到嗎?

譚待:得看增速,這個速度能保持下來的話,應(yīng)該是可以完成的。

晚點:但收入規(guī)模越大,增速就會越來越慢。

譚待:是慢,但肯定也會增長。因為 AI 這個市場會足夠大。

晚點:云服分成兩個市場,一個是 CPU 為基礎(chǔ)的傳統(tǒng)云服務(wù),一個是 GPU 為基礎(chǔ)的 AI 云服務(wù)。你們的 1000 億怎么分?

譚待:GPU 會占大頭,至少要超過一半。

晚點:你之前有個判斷,ToB 行業(yè)頭三年的事情,就會決定八年后的格局。從 ChatGPT 到現(xiàn)在也快三年了。你們還有哪些重要的事情沒做?

譚待:Agent 今年可能才是元年。那么 AI 云原生這些事情,從開發(fā)范式到底下技術(shù)、安全、數(shù)據(jù)都會有變化,這些都要加班加碼做好。

晚點:你今年的 OKR 是什么?

譚待:很簡單,AI 做第一,增加存量市場份額,把組織做好。這個 OKR 我寫了好幾年了。

晚點:今年有什么新變化嗎?

譚待:你可以看我們機(jī)場廣告,原來寫的是:火山引擎,你的下一朵云。馬上我們就會改成:火山引擎,你的 AI 云。

我們現(xiàn)在就是讓大家認(rèn)識到在 AI 時代,火山是最好的選擇。

晚點:如果 10 年的期限到了,火山?jīng)]做到 1000 億收入。你覺得會是什么沒做好?

譚待:只要世界和平,經(jīng)濟(jì)發(fā)展,我覺得肯定沒問題。

馬拉松才跑 500 米,豆包 App 出了不少力

晚點:IDC 統(tǒng)計,去年國內(nèi)大模型調(diào)用總量中,火山引擎占比 46.4%。這包括豆包、即夢等字節(jié)內(nèi)部應(yīng)用的消耗嗎?

譚待:不包括。分子、分母都是外部的。

晚點:你們對這個成績滿意嗎?

譚待:談不上滿意和不滿意。這個事太早期了。我跟團(tuán)隊說,馬拉松才跑 500 米,別取得一點點小成績就滿意了。之前我們定目標(biāo)的時候,就是超過 40%。

晚點:你們在去年 5 月才發(fā)布豆包大模型,比同行都晚。為什么敢定這么高的目標(biāo)?

譚待:我們的判斷是,這個市場會增加十倍,比人家晚半年無所謂。如果只漲 50%,晚半年確實太難了,你得把存量搶過來。全是增量那無所謂。

晚點:有一些同行說,字節(jié)有很多 GPU,火山引擎的市場份額是用虧錢換來的。

譚待:我們是有毛利的。MaaS(模型即服務(wù))是一個賺錢的生意,毛利率在所有云服務(wù)產(chǎn)品中算比較好的。除掉數(shù)據(jù)庫,國內(nèi)沒什么賺錢的 PaaS,像容器化什么的服務(wù),都是買 IaaS 直接送的。

晚點:據(jù)我們了解,你們給大模型定價的時候,是用倒推的邏輯,假設(shè)未來調(diào)用量達(dá)到一定程度,就能盈虧平衡。所以會先降價吸引客戶。

譚待:假設(shè)我三個月后能把成本降下來,用那個價格對外提供服務(wù),也是合理的吧?

晚點:DeepSeek 說自己 API 服務(wù)的毛利為 85%(成本利潤率 545%),你看到有什么感受?

譚待:它是一個理論值。他們的確有各種優(yōu)化點。不過算力需求有波峰和波谷,波谷的成本是大頭,他們把波谷的成本拿走做訓(xùn)練了,所以那時候成本很低。他們也沒有算 SLA(云平臺服務(wù)客戶的協(xié)議,代表對客戶的承諾),波峰高的時候可以跳票。

我們?nèi)サ袅四切┢碚摰狞c,跟內(nèi)部比了一下,發(fā)現(xiàn)做得的確還可以。他們也幫我們澄清了一些事情。去年我們降價,好多人說我們虧本打價格戰(zhàn)。我還專門發(fā)朋友圈解釋,說靠技術(shù)做到的。DeepSeek 證明靠技術(shù)的確可以做到。

晚點:為什么你們說靠技術(shù)降成本別人不信,DeepSeek 出來說就有人信?

譚待:DeepSeek 是開源的,大家可以做一些復(fù)現(xiàn)。

晚點:那你會想讓豆包開源嗎?

譚待:我沒有偏好。最重要的是模型是不是能做到最好??蛻舨粫谝饽闶情_源還是閉源。就算開源了,大家也傾向用云上托管的版本,自己搭太貴了。

晚點:所以低價是你們拿下超 40% 市場份額的主要原因?

譚待:低價只是剛開始對我們有幫助,現(xiàn)在大家的定價都差不多。首先還是模型效果要好。另外我們還有一個很大的優(yōu)勢,是 C 端(個人消費(fèi)者)B 端(企業(yè)客戶) 協(xié)同。

字節(jié)的 C 端產(chǎn)品有大量用戶,會大規(guī)模調(diào)用模型,能幫我們把服務(wù)做好。同時,還有很多人會拿著我們 C 端產(chǎn)品的 Case 找過來,說想用在業(yè)務(wù)中,火山能不能做類似的效果?

我經(jīng)常開玩笑說,企業(yè) AI 轉(zhuǎn)型第一步,就是董事長先下載一個豆包 App。我發(fā)現(xiàn)好多人都認(rèn)這一點。所以大模型一定要好。不能他們用了后覺得很挫,可能以后就不考慮我們了。

晚點:效果好決定一切?

譚待:這只是模型好的一方面,其他還有穩(wěn)定性強(qiáng),吞吐高。大家容易忽視的是模型的 TPM(Tokens Per Minute,每分鐘處理的 tokens 數(shù)),我們能到 500 萬。

擴(kuò)大 TPM 要更多的成本,也考驗調(diào)度系統(tǒng)。所以有同行取巧,說價格追平了我們,把 TPM 限制得很小。如果客戶想擴(kuò)大就得加錢。

晚點:去年你們豆包降價的時候,就因為 TPM 低被吐槽。

譚待:當(dāng)時沒注意到這一點,就用了跟同行一樣的。我們一周后就把它放大了。后面我們一直默認(rèn)把 TPM 做得很大。這是客戶教我們的。云里面有很多這種細(xì)節(jié),魔鬼都在細(xì)節(jié)里面。

晚點:云計算這種細(xì)節(jié)特別多、鏈條又很長的系統(tǒng)里面,怎么能做到最好?

譚待:最重要的還是規(guī)模要大。規(guī)模大了,服務(wù)器多、負(fù)載高,天然就對技術(shù)有很高的要求,就會強(qiáng)迫我們做好各種事情。我們內(nèi)部很早就用 GPU 訓(xùn)練推薦系統(tǒng),可以直接對外復(fù)用了。

規(guī)模大了后,做優(yōu)化收益也很大。1 萬臺服務(wù)器利用率優(yōu)化一個點,100 萬臺服務(wù)器優(yōu)化一個點,收益差 100 倍。但要做的事情是差不多的。這個收益差異,可以讓我組建強(qiáng)大的團(tuán)隊做得更好。

晚點:如果看整個云計算領(lǐng)域,不只算 AI 云,規(guī)模最大的還是阿里云。

譚待:只算云業(yè)務(wù)國內(nèi)肯定是阿里云,如果按整個集團(tuán)來算資源規(guī)模的話,我們不比阿里少。如果沒有那么大的內(nèi)部資源,再大的力也出不了奇跡,都沒有讓你練手的地方。

用模式創(chuàng)新繼續(xù)推動降價,Agent 會突破 App 時代天花板

晚點:豆包 1.5 已經(jīng)發(fā)布快半年了,現(xiàn)在你們發(fā)布新款豆包大模型命名 1.6,大模型迭代速度放緩了?

譚待:也不能說放緩。這一版與 1.5 相比有很大優(yōu)化。2.0 會有的,我們希望大版本更新的時候變化更大。

晚點:一年前你們開發(fā)布會,大模型降價幅度非常大,比行業(yè)均價減少 99.3%。今年降價幅度為什么變小了?

譚待:去年國內(nèi)很多人都在講 AI 概念,但 AI 應(yīng)用很少,沒多少人用大模型。主要原因就是太貴,有的模型比美國的模型還貴,兩邊人均 GDP 水平又不一樣。

我們看到能靠技術(shù)把成本降下來,就決定一次降徹底,更低的成本能催生更多應(yīng)用,可以把盤子做大。

想要繼續(xù)降價,技術(shù)得有大幅更新,但它是有周期的。而且成本已經(jīng)不算是 AI 應(yīng)用創(chuàng)新的門檻了,更大的問題是怎么用好平臺,做出來更好的應(yīng)用。

晚點:那這次你們怎么把模型價格降到過去的 1/3?

譚待:主要是定價模式上的創(chuàng)新。深度思考模型出來后,解鎖了很多場景,比如搜索。這些模型用起來挺貴的。

其實同一個模型,開思考和不開思考單位成本是一樣的,主要的差別就是 context(輸入內(nèi)容)長度。我們發(fā)現(xiàn),客戶使用大模型時,context 長度分布有規(guī)律,大部分都落在 0 到 32K,然后是 128K、256K。

我們就決定不再給思考模型與普通模型分別定價,而是按照 context 長度做區(qū)分,動態(tài)計價。我們相信,這會跟去年我們大幅降價一樣,引領(lǐng)行業(yè)往這個方向發(fā)展。

晚點:你們今年介紹了很多 Agent 方面的進(jìn)展,比如做全鏈路 Agent 開發(fā)工具、改進(jìn)數(shù)據(jù)基建,看上去跟同行沒太大差別。

譚待:剛才說的計費(fèi)方式變化就是個明顯的差別。這樣定價也不是誰都可以做。首先你得服務(wù)過很多的客戶,才能知道 context 的分布規(guī)律。資源調(diào)度也要進(jìn)一步優(yōu)化,把不同長度的 context 混在一起推理,會浪費(fèi)資源。 我們把思考模型的 context 做到 256K,至少在國內(nèi)是第一家。

強(qiáng)化學(xué)習(xí)是做好 Agent 的關(guān)鍵技術(shù),現(xiàn)在業(yè)內(nèi)用得最多的強(qiáng)化學(xué)習(xí)框架就是 veRL,這是我們開源的。那個 ve 就是 volcengine(火山引擎的英文)的意思。

另外,Agent 一定要用到 Coding(編程),讓模型能自己寫代碼解決問題,這需要類似 IDE 的開發(fā)環(huán)境。國內(nèi)大多數(shù)公司只是提供 AI 生成代碼插件,這顯然不夠。字節(jié)的 Trae 應(yīng)該是國內(nèi)唯一定位像 Cursor 的集成式 Coding Agent。

晚點:Trae 是一個開發(fā)者工具,跟火山引擎做 Agent 有什么關(guān)系?

譚待:它背后的大模型用了火山上的。火山上的所有云組件服務(wù),我們?nèi)坑?MCP 協(xié)議做成了服務(wù),直接跟 Trae 打通,開發(fā)者做完開發(fā),就可以直接調(diào)用云上的各種組件部署、運(yùn)維了。

晚點:你們怎么判斷 Agent 對云計算行業(yè)的影響?看到了什么機(jī)會?

譚待:PC 到移動再到現(xiàn)在的 AI,是主體發(fā)生變化。PC 的時候是網(wǎng)站,移動的時候是 App,AI 將來最重要的主體其實是 Agent。

主體不同,開發(fā)范式會變。PC、移動時代的各種架構(gòu),容器化、微服務(wù)都是程序員理解業(yè)務(wù),定義規(guī)則和算法,然后驅(qū)動數(shù)據(jù)做事。Agent 是模型自己思考、規(guī)劃、編排流程。

這就是我們說的 AI 云原生。過去的云平臺是為 Web、App 最佳實踐設(shè)計的,現(xiàn)在要圍繞著 Agent 設(shè)計。

未來 Agent 和 Agent 之間會有一個網(wǎng)絡(luò),它們可以自動執(zhí)行任務(wù)。App 都是供人使用,但全世界就有這么多人,每個人能花多少時間,算下來的總時長就是 App 的上限。

Agent 能主動執(zhí)行任務(wù),它工作的總時長,會遠(yuǎn)高于 App 的上限,就能創(chuàng)造更大的經(jīng)濟(jì)價值。這需要更多的云計算資源。

豆包模型調(diào)用半年翻兩番,模型更新帶動需求增長

晚點:你們這次宣布了一個數(shù)字,豆包大模型日均 Token 處理量達(dá)到 16.4 萬億了。這個算內(nèi)部產(chǎn)品嗎?

譚待:這個算的。

晚點:去年 12 月你們宣布的數(shù)字是 4 萬億,到現(xiàn)在翻了兩番。為什么這么快?

譚待:這就說明 AI 在蓬勃發(fā)展,這個數(shù)字不僅代表豆包的速度,能說明 AI 的速度。

晚點:有人說是 DeepSeek 的爆發(fā)帶動行業(yè)發(fā)展。讓很多大模型公司都受益了。

譚待:DeepSeek 出來后,我們的確感覺到客戶的熱情提升了。主要是它破圈了??蛻舻脑鲩L,還是比較依賴模型能力提升。

晚點:從豆包大模型增長來看,哪些行業(yè)的客戶的 Token 消耗量在提升?

譚待:最近半年有兩個驅(qū)動力。一是深度思考模型出來后,帶動 AI 工具類應(yīng)用快速增長,AI 搜索、AI Coding 漲了接近 10 倍。

另一個是多模態(tài)模型,也催生了新需求。很多客戶用它在線下巡店,看餐盤有沒有放好、工作人員帽子有沒有戴好等等。這半年也有 10 倍增長。

晚點:這種需求靠過去的小模型就可以做,現(xiàn)在用大模型更便宜嗎?

譚待:用上多模態(tài)大模型,單次推理成本可能是增加的。但以前的小模型,一個場景就要訓(xùn)一個模型,訓(xùn)練成本很高,還不一定能識別全?,F(xiàn)在用大模型,只需要 Prompt 就可以了。綜合成本是低的。

晚點:這些都是模型迭代帶來的變化??蛻魧Υ竽P偷膽B(tài)度有什么變化嗎?

譚待:變化還是很明顯的。以前你還得科普,現(xiàn)在不用了。尤其是今年?,F(xiàn)在的矛盾點是,大模型能不能創(chuàng)造經(jīng)濟(jì)價值。如果這個事更明顯,增長可以更快。

晚點:你們有碰到一些失敗案例嗎?

譚待:說失敗不太合適,可以說是有挑戰(zhàn)的案例。比如有監(jiān)管要求的行業(yè)客戶。他們上來就會問,能不能私有化?

所以我們這次大會講了很多大模型安全的內(nèi)容。我們有個產(chǎn)品叫 AI 密態(tài)計算,用硬件隔離出加密環(huán)境,用端側(cè)的密鑰解密。讓客戶有私有云的安全程度,又能訪問最新模型,成本還低。

晚點:現(xiàn)在做大模型一體機(jī)的有很多,為什么私有化會是挑戰(zhàn) ?

譚待:想把大模型用起來,不能只有一個模型,還要有一系列工具。云上的工具都還在完善,怎么能指望一體機(jī)里面東西都是健全的?

而且公有云上可以用混合調(diào)度,把每一次 token 調(diào)用的成本攤薄。私有云的環(huán)境中,處理 Token 的成本要比云上的刊例價至少高 5 倍。 這會影響發(fā)展速度。

晚點:你們占了這么大的市場份額,現(xiàn)在增長也很快。你們總結(jié)了什么經(jīng)驗?

譚待:最重要的是建立機(jī)制??蛻粝胗煤么竽P?,需要做好 prompt、模型要精巧、有合適的 RAG 知識庫。我們會組建專門的服務(wù)團(tuán)隊,和行業(yè)線團(tuán)隊做匹配去服務(wù)他們。

我們會把這些能力沉淀到一個工具中。比如這次我們推出的 Prompt Pilot,就是發(fā)現(xiàn)要做大量 Prompt Engineering 的事情,這太累了。

晚點:現(xiàn)在大家都在說,只要模型足夠好,不需要太多提示詞工程。

譚待:我覺得這完全是錯的。應(yīng)該反過來,模型更好的時候,提示詞工程價值更大。當(dāng)你把需求說得更明確的時候,更好的大模型其實能執(zhí)行得更好。

晚點:一位云平臺負(fù)責(zé)人跟我們說,云服務(wù)是多元化體系,客戶想用什么模型,就要想辦法去滿足他們的需求?;鹕礁拱壎ǚ浅I?,會影響你們增長嗎?

譚待:我覺得這是兩個流派。對自己模型沒有信心,可能就會說自己是一個云平臺,要支持所有的模型。我們對自己的模型特別有信心,就會傾向于做垂直優(yōu)化。

那些很復(fù)雜的 Agent ,讓它做好復(fù)雜任務(wù),不僅模型要優(yōu)化,背后的服務(wù)也得優(yōu)化,還要準(zhǔn)備好調(diào)優(yōu)的環(huán)境等等。

我們能提供的最大價值,是垂直優(yōu)化的能力,這肯定是基于豆包大模型的。有些客戶的需求,甚至要在預(yù)訓(xùn)練階段解決。 我不可能幫客戶優(yōu)化一個開源模型,我也沒有源代碼。

晚點:做垂直優(yōu)化,你們也要跟研發(fā)大模型的 Seed、各種 AI 產(chǎn)品合作。這些都是不同的部門。你們有什么樣的合作機(jī)制?

譚待:火山有專門的團(tuán)隊,可以參與到模型研發(fā)和產(chǎn)品開發(fā)中。字節(jié)做火山一個重要的原則就是技術(shù)內(nèi)外同源,比如我們的基礎(chǔ)設(shè)施就是復(fù)用一個大團(tuán)隊,保證體系能夠協(xié)調(diào)在一起。

如果是分裂的,協(xié)作就需要公司的 CTO 來協(xié)調(diào)。但大多數(shù) CTO 都不太了解底下的細(xì)節(jié)。在字節(jié),技術(shù)負(fù)責(zé)人就可以了。

晚點:如果豆包能力提升很慢,做不到最好呢?

譚待:這是小概率事件。如果豆包能力提升很慢,公司自然會提高優(yōu)先級去解決。

晚點:很多云廠商都在投資大做 AI 基建,比如阿里宣布三年投入 3800 億元。你們怎么規(guī)劃的?

譚待:我們不一定非要宣布花多少錢,客戶需要算力的時候,我們能滿足就好了。我希望默默把事情做好,給大家一個驚喜。

題圖來源:火山引擎

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
堅決反對中國城市申辦奧運(yùn):國奧委失算,中國無需奧運(yùn)證實力!

堅決反對中國城市申辦奧運(yùn):國奧委失算,中國無需奧運(yùn)證實力!

一個有靈魂的作者
2025-08-16 11:16:02
趙露思,徹底“黑化”了!

趙露思,徹底“黑化”了!

宛沐
2025-08-22 16:00:07
男子秀33歲老婆,打扮后村姑變女神,網(wǎng)友崩潰:以后不準(zhǔn)你再碰她

男子秀33歲老婆,打扮后村姑變女神,網(wǎng)友崩潰:以后不準(zhǔn)你再碰她

書雁飛史oh
2025-08-19 18:42:15
35歲!收獲報價合同!考辛斯有望加盟中國聯(lián)賽

35歲!收獲報價合同!考辛斯有望加盟中國聯(lián)賽

籃球?qū)崙?zhàn)寶典
2025-08-22 18:27:55
福建大田一煤礦發(fā)生井下作業(yè)人員傷亡事件,致7人死亡

福建大田一煤礦發(fā)生井下作業(yè)人員傷亡事件,致7人死亡

界面新聞
2025-08-22 14:37:42
澳洲楊蘭蘭是誰?五層“身份套娃”揭秘:她或許根本就不存在

澳洲楊蘭蘭是誰?五層“身份套娃”揭秘:她或許根本就不存在

詩意世界
2025-08-22 15:31:22
太猛了!10萬億待入市?

太猛了!10萬億待入市?

格隆匯
2025-08-22 15:41:12
許家印最聰明的好友:只答應(yīng)將大樓租給恒大,其他一概不合作

許家印最聰明的好友:只答應(yīng)將大樓租給恒大,其他一概不合作

品茗談史論世事
2025-08-20 18:10:27
包工頭2000年買了廣州2棟爛尾樓后坐牢,出獄時發(fā)現(xiàn)它們變成這樣

包工頭2000年買了廣州2棟爛尾樓后坐牢,出獄時發(fā)現(xiàn)它們變成這樣

秋風(fēng)專欄
2025-08-20 10:42:36
特朗普沒想到,連老天都在幫中國,中企官宣的新項目讓美心如死灰

特朗普沒想到,連老天都在幫中國,中企官宣的新項目讓美心如死灰

策略述
2025-08-22 17:09:34
方媛挺孕肚打出租送女兒上學(xué),孕晚期肚大如籮,方媽媽不放心跟著

方媛挺孕肚打出租送女兒上學(xué),孕晚期肚大如籮,方媽媽不放心跟著

影視口碑榜
2025-08-22 17:39:46
全面下架外賣,首家反擊平臺高抽成的餐飲巨頭出現(xiàn)了……

全面下架外賣,首家反擊平臺高抽成的餐飲巨頭出現(xiàn)了……

柴狗夫斯基
2025-08-22 10:43:08
歐盟和英法意等22國發(fā)表聯(lián)合聲明

歐盟和英法意等22國發(fā)表聯(lián)合聲明

第一財經(jīng)資訊
2025-08-22 10:26:24
8月人氣女優(yōu)Top20,松本一香/美園和花強(qiáng)勢回歸

8月人氣女優(yōu)Top20,松本一香/美園和花強(qiáng)勢回歸

橙星文娛
2025-08-22 15:59:52
宣布野外滅絕13年,華南虎重現(xiàn)?被襲擊村民:1大1小,有黃黑花紋

宣布野外滅絕13年,華南虎重現(xiàn)?被襲擊村民:1大1小,有黃黑花紋

環(huán)球科學(xué)貓
2025-08-22 11:12:11
“極為罕見”!英媒援引數(shù)據(jù)披露:在加沙被以軍殺死的巴勒斯坦人83%是平民

“極為罕見”!英媒援引數(shù)據(jù)披露:在加沙被以軍殺死的巴勒斯坦人83%是平民

環(huán)球網(wǎng)資訊
2025-08-22 16:43:38
戈登在大明湖拍照打卡留念,用毛筆寫下“硬漢戈登”四個大字

戈登在大明湖拍照打卡留念,用毛筆寫下“硬漢戈登”四個大字

雷速體育
2025-08-22 18:01:33
高材生陳恂敏:95年搶劫銀行1500萬,隱藏21年因同伙自首暴露

高材生陳恂敏:95年搶劫銀行1500萬,隱藏21年因同伙自首暴露

丹寶說文史
2023-12-16 19:10:37
女司機(jī)墜河后續(xù),遺體無人認(rèn)領(lǐng),最后畫面曝光,錯失三次活命機(jī)會

女司機(jī)墜河后續(xù),遺體無人認(rèn)領(lǐng),最后畫面曝光,錯失三次活命機(jī)會

娛樂看阿敞
2025-08-21 09:46:00
倆孩非親生的前妻徹底社死:生父曝光非同一人,更多惡行讓人驚愕

倆孩非親生的前妻徹底社死:生父曝光非同一人,更多惡行讓人驚愕

甜檸聊史
2025-08-14 08:00:33
2025-08-22 22:48:53
晚點LatePost
晚點LatePost
晚一點,好一點。商業(yè)的真相總是在晚點?!锻睃cLatePost》官方賬號
2812文章數(shù) 21811關(guān)注度
往期回顧 全部

科技要聞

命運(yùn)曲折!傳H20芯片停產(chǎn),英偉達(dá)這樣回應(yīng)

頭條要聞

上海女子在臥室汗毛豎起來了 墻上突現(xiàn)3個洞正對著床

頭條要聞

上海女子在臥室汗毛豎起來了 墻上突現(xiàn)3個洞正對著床

體育要聞

詹杜庫2K26能力值:三人均進(jìn)Top10 詹庫都是94

娛樂要聞

前女友曝許凱出軌 于正說在酒店背臺詞

財經(jīng)要聞

節(jié)卡股份IPO上會前被取消審議

汽車要聞

新智界R7/S7首發(fā)車外語音泊車功能,華為黑科技上車

態(tài)度原創(chuàng)

藝術(shù)
游戲
手機(jī)
旅游
親子

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

《明末:淵虛之羽》1.5.1版本更新!降低顯存占用

手機(jī)要聞

真我超 10000mAh電池手機(jī)曝光,后續(xù)還有多款新品

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

親子要聞

醫(yī)生提醒:孩子長高有2個黃金階段,家長一定要抓??!

無障礙瀏覽 進(jìn)入關(guān)懷版 亚洲人成无码网站18禁| 五月丁香六月狠狠爱综合| 欧美熟妇的荡欲在线观看| 99色99色| 亚洲伊人第一区第二区第三区| 东北女人高潮时嗷嗷叫| 人妻无码精品乱码久久久久久| 少妇一晚三次一区二区三区| 乱人伦中文字幕在线不卡网站 | 俄罗斯毛片群| 日本中文一区二区三区亚洲| 亚洲人成色777777精品不卡| 亚洲伊人成综合网| www.7蜜桃AV.com| 在线观看中文字幕码国产| 国产精品久久久久久久久网站导航| 中文字幕日本有码在线播放| 日本熟妇中文字幕| 精品精品国产理论在线观看| 乱人妻精品一区二区av药水| 少妇扒开腿让我添69式| 无码高潮少妇毛多水多水免费 | 91人人妻人人澡人人爽秒播| 亚洲AV中文无码乱人伦| 99久久无色码中文字幕婷婷| 免费A级毛片在| 久久久精品人妻互换| 久久久久久国产精品一区| 亚洲av最新在线观看网址| 99精品国产高清一区二区麻豆| 52AV我爱八V| gogogo高清免费观看日本电视| 日韩中文字幕一区| 农民人伦一二三匹| 视频列表--国产| 精品国产一区二区三区av性色| 亚洲精品无码专区在线播放| 高清国产一级毛片国语| 久久天堂综合亚洲伊人HD| 日韩欧美亚洲综合久久| 18禁裸体动漫美女无遮挡网站|