編譯 | 傅宇琪、Tina
Vercel 的 V0 迎來了大更新,在 Vibe Coding 產(chǎn)品競爭愈發(fā)激烈的當下,它不再只是一個“AI 搭建網(wǎng)頁”的工具,而是升級為更全面的 Agent ——能夠自動完成規(guī)劃、研究、構(gòu)建與調(diào)試,從前端、后端到文案與邏輯,一手包辦。
在這場變化背后,站著的是 Vercel 創(chuàng)始人兼 CEO Guillermo Rauch。作為 Next.js 與 Socket.io 的締造者,他認為每家公司都會經(jīng)歷所謂的 AI 轉(zhuǎn)型,本質(zhì)上就是大規(guī)模生產(chǎn)智能。 V0 對 Vercel 來說,就是驗證 AI Cloud 基礎(chǔ)設施價值的“零號病人”。
Guillermo 的職業(yè)起點同樣離不開這種“逆向選擇”。當年他選擇 JavaScript 時,這門語言還被視為“玩具”,但正是因為提前進入新領(lǐng)域,他在 17 歲時就被 Facebook 招募。今天,他依然堅持認為不要拘泥于所謂“高地位”的技術(shù),而要關(guān)注真正有潛力的新領(lǐng)域。
從四人起步的小團隊,到如今月活 140 萬開發(fā)者使用的 Next.js,再到有望觸達數(shù)億甚至數(shù)十億用戶的 V0,Guillermo 始終強調(diào):未來寫代碼會逐漸被 Agent 接管,真正重要的,是理解系統(tǒng)的運作、局限與抽象層的演進。“代碼是靜態(tài)的,唯有運行與部署,才能創(chuàng)造真正的價值。”
從 Vibe coding 到全棧 Agent
Matt:你們在 2024 年秋季發(fā)布了 V0,此后發(fā)展迅速。是否有一些數(shù)據(jù),可以幫助我們了解它的增長情況?
Guillermo:V0 的核心功能是將文字轉(zhuǎn)化為應用——從一個想法到一個可用的軟件。它觸達的用戶群體遠遠超過了 Vercel 以往的受眾,不需要工程背景,只需要有想法即可,這也正是所謂的 “Vibe coding(氛圍編程)”的體現(xiàn)。
目前,V0 每秒鐘能生成 7 個新應用。迄今為止,V0 已經(jīng)生成超過 1 億個應用。在不到一年的時間里,V0 的用戶數(shù)已超過 Vercel 過去十年的總和。這意味著編碼正在被自動化,更多人能夠像在 ChatGPT 中輸入問題一樣輕松完成開發(fā)。
這催生了大量個性化的軟件,有人稱之為“個人軟件”或“高度專用應用”。其驅(qū)動力有兩個方面:第一,人人都能“下廚”,人人都可以在周末,甚至和孩子一起,把想法變成實際的應用;第二,在企業(yè)內(nèi)部,團隊需要原型化、需要跨部門溝通,設計師、市場人員和工程師都需要圍繞具體的成果協(xié)作,V0 正好滿足了這種需求。
Matt:我聽說你們之所以能這么快推出 V0,是因為公司內(nèi)有一支大約十人的特別小組?
Guillermo:是的,目前有十人,但最初只有四人,其中一人是我自己,還負責 QA。我們當時的目標是,在構(gòu)建 AI Cloud 的同時,需要一個“零號病人”式的應用,來驗證這套基礎(chǔ)設施的價值。
每家公司都會經(jīng)歷所謂的 AI 轉(zhuǎn)型——不管稱之為“AI 化”“智能 Agent”還是“生成智能接口”,本質(zhì)上都是大規(guī)模生產(chǎn)智能。我們長期以來專注于打造高質(zhì)量的網(wǎng)頁體驗,而現(xiàn)在希望把這個過程自動化,讓全球用戶都能輕松構(gòu)建出高水準的網(wǎng)頁。例如,我們創(chuàng)建了 Next.js,如今它已成為 React 生態(tài)中最大的 Web 框架,月活躍開發(fā)者超過 140 萬。V0 的意義在于,可以把潛在用戶規(guī)模從 140 萬擴展到數(shù)億甚至數(shù)十億。以前需要龐大團隊的全棧開發(fā),現(xiàn)在借助完善的基礎(chǔ)設施,小團隊也能迅速啟動,比如三四個人就能完成。
Matt:這正好呼應了近年一個熱門觀點:極少人數(shù)也能構(gòu)建大型公司。你們算是“在公司里再創(chuàng)辦一個創(chuàng)業(yè)公司”的典型案例。
Guillermo:上周開始,我們?yōu)?V0 實施了“GM model(總經(jīng)理模式)”。V0 有一位總經(jīng)理,他就像 V0 的 CEO,同時也是 Vercel 平臺的用戶。
Matt:這類似于“大公司即服務”的微架構(gòu)模式?
Guillermo:是的,可以類比微軟、亞馬遜 AWS 的模式。我們底層的基礎(chǔ)設施平臺同時也承載了許多潛在競爭者的產(chǎn)品,我相信未來會有數(shù)十億個 Agent。隨著市場逐漸認識到每個公司、每個崗位都需要相應的 Agent,我們希望成為它們的基礎(chǔ)平臺。V0 既得益于這種基礎(chǔ)設施,也受益于總經(jīng)理模式所帶來的靈活性。
Matt:能否比較一下目前 AI 編程領(lǐng)域的主要產(chǎn)品,比如 Cursor、Windsurf、Lovable 或 Replit,它們之間是同質(zhì)競爭,還是各有側(cè)重?
Guillermo:上周我看到一篇文章,提出了“Agentic engineering(智能體工程)”的概念,與 Vibe coding 形成對比。有些人甚至認為 Vibe coding 已經(jīng)過時,Agentic engineering 才是未來。
我認為二者是并行的。比如在 Vercel 的關(guān)鍵基礎(chǔ)設施中,新平臺每月函數(shù)調(diào)用次數(shù)達到一萬億。在這種高強度工程任務里,工程師必須對 Agent 生成的內(nèi)容保持極高的注意力。而 Vibe coding 面向更廣泛的用戶群體,任何人都能使用。我們的判斷是,二者之間存在銜接。用戶可以在 V0 上進行 Vibe coding,然后通過 Git 集成與專業(yè)工程師協(xié)作,逐步轉(zhuǎn)向更嚴謹?shù)?Agentic engineering。
未來關(guān)鍵基礎(chǔ)設施和底層系統(tǒng)會更多依賴 Agentic engineering,而應用、界面、原型和演示文稿等領(lǐng)域則更適合 Vibe coding。
Matt:能否更清楚地定義一下 Vibe coding?
Guillermo:這個概念最早出現(xiàn)在 Andrew Karpathy 的一條帖子中。他在特斯拉負責機器學習,后來加入 OpenAI,再后來自己開發(fā)軟件。他發(fā)現(xiàn),借助大模型,可以用一種新的方式寫代碼——幾乎不需要關(guān)注具體代碼,而是像在后編碼時代一樣,只需描述需求,大模型就能自動生成代碼。開發(fā)者只需觀察結(jié)果、不斷反饋。
這與 V0 的定位高度契合。我們一直強調(diào)最終用戶體驗:是否符合預期,界面是否美觀。Karpathy 當時還使用了語音交互工具 Super Whisper,讓他能直接與系統(tǒng)對話,就像科幻電影里那樣,即時生成界面并立即部署。這就是 Vibe coding 的核心。如今,這種方式不斷民主化,人人都能使用。
如果說傳統(tǒng) IDE 面向的市場僅限會寫代碼的人,那么 V0 的潛在用戶就是所有擁有電腦的人。只需打開瀏覽器即可開始,而無需下載工具或配置環(huán)境。最近我們還將 V0 的底層代碼生成模型開放給其他代碼編輯器,比如 Cursor、VS Code 等,它們可以調(diào)用 V0 模型。這背后的原因是,我們持續(xù)將自己在 Next.js 和 React 應用開發(fā)中的經(jīng)驗注入模型,更新常用庫、設計模式和最佳實踐。這對我來說尤為重要,因為我一直在傳播 Web 應用的最佳實踐,而現(xiàn)在模型可以承擔這個角色。
事實上,Vercel 的起點就是我在巴西 JS 大會上做了一場題為《優(yōu)秀 Web 應用的七條原則》的演講。當時我意識到,僅靠到處演講和布道,無法規(guī)?;瘋鞑ミ@些知識。于是,我決定將這些最佳實踐固化為框架,于是誕生了 Next.js??蚣苣軒偷介_發(fā)者,但人們?nèi)匀粫负芏噱e誤。
Matt:再給大家補充說明一下,Next.js 是你們在 React 之上開發(fā)的開源庫。
Guillermo:Next.js 支撐了許多知名的 Web 應用,比如 Midjourney.com、Walmart.com 和 Nike.com。它擁有 140 萬活躍開發(fā)者,但這依然不是“人人可用”的水平。于是我們思考,是否可以把這些經(jīng)驗轉(zhuǎn)化為模型,使其不斷學習和傳播最佳實踐。這就是 V0 模型的本質(zhì)——把團隊和社區(qū)的知識轉(zhuǎn)化為 Token,并不斷迭代優(yōu)化。我相信未來每家公司都會經(jīng)歷類似的過程,從傳統(tǒng)軟件走向“智能 Token 化”。
Matt:目前來看,V0 更偏向前端?后續(xù)是否有計劃加入更多后端功能?
Guillermo:長期以來,人們一直希望我們能支持構(gòu)建完整的 Web 應用。但在 V0 剛推出時,模型的能力還不足以支撐復雜的數(shù)據(jù)流和狀態(tài)管理,因此最初只能生成一些相對簡單、無狀態(tài)的應用。
隨著發(fā)展,我們逐漸構(gòu)建了一個集成生態(tài),使 V0 能通過第三方平臺實現(xiàn)全棧能力。比如我們與 Supabase 集成,讓用戶能夠直接使用 Postgres 數(shù)據(jù)庫,進行數(shù)據(jù)讀寫。另一個令人興奮的集成是 Salesforce Commerce Cloud,我們展示了如何通過 V0 實現(xiàn)電商應用的 Vibe coding。這意味著,未來也可以通過類似方式構(gòu)建銷售流程等應用。
V0 在某種意義上類似于電子表格或文字處理器,它讓簡單工具演變?yōu)殪`活而復雜的業(yè)務流程,我們希望通過生態(tài)集成實現(xiàn)同樣的效果。另一大類集成是 AI 模型。許多客戶希望用 AI 來快速創(chuàng)建或原型化 AI 應用。我們的一家財富 10 強客戶使用 V0 的原因,就是需要以“思想速度”而非“季度速度”來迭代。一個季度里,AI 領(lǐng)域可能出現(xiàn) 20 個新模型和 3 種新架構(gòu),發(fā)展非???。V0 對個人用戶和企業(yè)用戶都極具價值:個人可以用它構(gòu)建全棧應用,企業(yè)則能用它快速原型化,探索下一代產(chǎn)品。
Matt:怎樣才能成為一個優(yōu)秀的 Vibe coder?
Guillermo:我很認同 Rick Rubin 曾說過的一句話:你需要有品味,需要有清晰的愿景,并且能夠表達出來,這些是基本素養(yǎng)。一個成功的人,能夠判斷自己想要什么,不想要什么,并且能夠提供反饋。
在硅谷,成功很大程度上依賴于反饋的給予與接收。你與 AI 的互動,就像與同事的協(xié)作,雙方不斷往復。不同的是,AI 永不疲倦,而且始終保持最新,由像 Vercel 這樣的公司不斷注入專業(yè)知識。它像一位隨時待命的員工,可以幫你實現(xiàn)想法,但前提是你能清楚表達這些想法。
我們也在做一些幫助用戶的工作,比如 V0 社區(qū)。那里匯集了各種現(xiàn)成示例:儀表盤、加密應用、動畫效果等。用戶可以一鍵克隆,這類似于 Notion 的成功模式。雖然你可以從一個空白文檔開始,但這需要更多創(chuàng)造力;相較之下,從社區(qū)獲取示例會更高效。
在 ChatGPT 界面里,很多應用看起來都很相似。V0 會詢問用戶“你想要發(fā)布什么?”,如果用戶沒有明確想法,可以從社區(qū)示例、截圖或圖表開始。你甚至可以把餐巾紙上的手繪草圖拍照上傳,系統(tǒng)會生成一個不錯的初稿。
此外,我們提供了“增強提示”功能。如果用戶的提示過于簡單,系統(tǒng)會自動擴展,給出更多靈感。但需要意識到,這些想法可能并非完全屬于你自己。因此,想成為優(yōu)秀的 Vibe coder,仍需廣泛接觸不同產(chǎn)品和案例,從而更好地表達需求。
Matt:我們之前和 Benedict Evans 討論過,ChatGPT 的開放式輸入框與 GUI 的差別,GUI 的優(yōu)勢是它限定了可操作的范圍。聽起來,你所說的正是在為 AI 構(gòu)建 GUI 的一種方式。
Guillermo:是的,但 GUI 的問題在于,它會把所有功能一股腦展示出來,用戶往往不知該點哪一個。實際上,人類的思維過程是一條連續(xù)的意圖鏈條:比如“創(chuàng)建一個表單”“把這個元素移到左邊”“更換樣式”“連接 API”,是從意圖到結(jié)果的過程。
本質(zhì)上,Agent 的工作就是在上下文中接收提示,利用工具來完成任務。這些工具可能是 API,在用戶看不到的后臺運行。舉個例子,如果你給 V0 一個 URL,它可以自動訪問網(wǎng)頁、獲取信息或截圖。未來,越來越多的工具將交由 Agent 調(diào)用,用戶只需提供上下文或意圖即可。
Matt:V0 是 Agent,還是 co-pilot(協(xié)同助手)?
Guillermo:最初,V0 更像是一個 co-pilot,主要聚焦于設計和前端。但隨著需求增加,比如需要生成交互性更強的代碼、數(shù)據(jù)獲取邏輯等,就必然演化為 Agent 架構(gòu)。因為大模型并不完美,它們像人類一樣會不斷遇到錯誤。
開發(fā)者其實經(jīng)常面對錯誤信息,比如類型檢查失敗、未定義變量等。過去他們會去搜索引擎查找答案,而如今這些工作交給 Agent 完成。很多時候,V0 甚至不會向用戶展示錯誤,因為系統(tǒng)可以高概率自動修復。
Agent 去除了大量圖形化界面,直接調(diào)用工具并返回結(jié)果,且迭代速度遠超人類開發(fā)者。隨著 MCP 服務器等生態(tài)的增長,Agent 可以在極短時間內(nèi)完成數(shù)十輪迭代,快速提升結(jié)果質(zhì)量。
Matt:Vercel 是少數(shù)真正贏得開發(fā)者喜愛的產(chǎn)品。但 AI 系統(tǒng)不可避免會出錯,在這種情況下,如何維持“開發(fā)者熱愛”?
Guillermo:過去開發(fā)者工具的核心是設計良好的 Error message(錯誤信息),因為最終由人類來處理。而現(xiàn)在,錯誤信息更多是提供給 Agent,它們只需要純凈的信號,而非復雜的視覺上下文。
這促使我們思考,如何為未來的 Web 設計最佳文檔和內(nèi)容呈現(xiàn)方式。對人類而言,導航和界面很重要;對 Agent 而言,則更需要原始信號,比如純文本或 Markdown。某種意義上,這與 Unix 時代的命令行哲學相通。
Vercel 的起點就是一個簡單的命令行工具,如今卻意外成為 Agent 的理想接口。當 Anthropic 的 Claude 想要部署應用時,它選擇使用 Vercel,這說明我們無意間打造了最適合 Agent 使用的工具。
因此,現(xiàn)在必須同時服務兩類用戶:人類開發(fā)者和 Agent。兩者有共性,也有差異。我們需要既贏得“開發(fā)者的熱愛”,也贏得“Agent 的熱愛”。
Matt:你說過提升品味的方式是增加“曝光量”。如果我是 Vercel 的一名開發(fā)者,想在工作中表現(xiàn)更好,需要更好的品味,我該怎么做?
Guillermo:我認為,每一波重要的互聯(lián)網(wǎng)或科技浪潮都會伴隨趨勢與反趨勢。例如,互聯(lián)網(wǎng)和電子郵件出現(xiàn)時,我們獲得了全球連接,但同時也出現(xiàn)了垃圾郵件和釣魚詐騙;Facebook 讓世界更緊密,但也帶來隱私和注意力使用方面的擔憂;TikTok 是一個強大的創(chuàng)作者平臺,但也產(chǎn)生許多負面外部性。
AI 亦如此,我們面臨“slop(低質(zhì)內(nèi)容)”的問題。因此,AI 的創(chuàng)造者和公司必須設定標準,決定人們將用它創(chuàng)造什么。V0 的做法是將上下文和指令嵌入其中,因為“上下文為王”。模型掌握的參數(shù)和信息極其龐大,許多東西需要通過探索來發(fā)現(xiàn),就像進入一個無限的元宇宙,你要決定走向哪片區(qū)域、摘取哪顆“生命之樹”的果實。
所謂“曝光時間”,一方面是指深入理解用戶今天如何使用你的產(chǎn)品,因為創(chuàng)作者容易被自己理想化的愿景誤導;另一方面是盡可能多地體驗其他產(chǎn)品。通過積累這些體驗,你會形成豐富的認知上下文,并可能發(fā)現(xiàn)新的交叉點。比如你使用 Runway 的界面,又嘗試 ChatGPT 的 Operator 產(chǎn)品,可能會從兩者的結(jié)合中產(chǎn)生新的想法。V0 很擅長基于這些輸入生成新穎且有品味的成果,但前提是你先提供足夠的初始輸入。
這讓我聯(lián)想到 Web 2.0 的“Mashup”(應用混搭)。AWS 的起點其實源于 Amazon 內(nèi)部構(gòu)建 Web 服務,方便外部開發(fā)者調(diào)用庫存、產(chǎn)品等數(shù)據(jù)。當時普遍認為未來會是“應用混搭”的世界,盡管最后 AWS 主要演化為基礎(chǔ)設施。但我認為“混搭”理念今天再次重要。
未來十年,世界將逐漸重構(gòu)為 MCP 生態(tài),它就像 AI 時代的 HTTP,允許不同 AI 系統(tǒng)互相通信、調(diào)用工具。這意味著產(chǎn)品之間將出現(xiàn)更多交叉、整合和新穎的界面。過去這些事可能很難實現(xiàn),但 MCP 大大降低了門檻。最終我們會進入一個“完全生成式”的互聯(lián)網(wǎng),沒有固定僵化的界面,而是不斷根據(jù)用戶需求、專業(yè)程度和動態(tài)環(huán)境來生成。誰能關(guān)注并善用合適的 MCP 服務,誰就能抓住下一個時代的機會。
AI Cloud 的愿景
Matt:能否介紹一下 Vercel 的產(chǎn)品方案以及接下來的規(guī)劃?
Guillermo:在過去,Web 應用主要是為人類提供 HTML 或 JSON 接口,我認為下一波需求將是為 Agent 提供接口。Vercel 的使命是幫助開發(fā)者以最低的時間和成本部署此類應用。現(xiàn)在,部署一個 MCP 服務器只需幾行代碼。
對擁有大量數(shù)據(jù)的公司而言,這相當于他們的“最小可行 AI 產(chǎn)品”。通過 MCP,把數(shù)據(jù)和能力以 Agent 可用的形式表達出來,就能立刻參與 AI 經(jīng)濟。因此,Vercel 在企業(yè)中獲得了很大吸引力。例如,Zapier 使用 Vercel 托管 MCP 服務器,Solana 也在大規(guī)模應用。
Matt:如果 Target.com 希望外部 Agent(如 OpenAI 系統(tǒng))能訪問它,就需要自己搭建 MCP 服務器,對嗎?這樣它的網(wǎng)站就能通過 Vercel 與 Agent 交互。
Guillermo:沒錯。如果 Target 不想錯過被集成進 ChatGPT 的機會,就必須支持 MCP 協(xié)議。只需幾行代碼,就能把現(xiàn)有 API 和數(shù)據(jù)后端與 MCP 連接。這樣不僅能與 ChatGPT 互操作,還能與 V0 互操作。比如,Target 的員工可以用 V0 構(gòu)建內(nèi)部應用,用自然語言生成物流管理或客服系統(tǒng)。MCP 可以是內(nèi)部的,也可以是外部的。我認為 MCP 將成為新的“商務拓展”,速度是原來的百倍,不再是人與人的會議,而是 Agent 之間的對接。
Matt:但如果一切都開放給 Agent,還涉及安全、可觀測性和權(quán)限控制。這該如何實現(xiàn)?
Guillermo:這正是我們 AI Cloud 服務中的重點。我們提供傳統(tǒng)的 Web 應用防火墻,但這還不夠。MCP 沒有和傳統(tǒng)互聯(lián)網(wǎng)相同的 URL 結(jié)構(gòu),因此需要新的安全原語來檢測和防護。開發(fā)者必須知道哪些工具被調(diào)用最頻繁,是否存在惡意上下文,是否有人試圖操縱 MCP 服務器。
現(xiàn)在已經(jīng)出現(xiàn)了新的攻擊方式,比如提示注入。有人甚至可以在圖片中嵌入人眼不可見的信息,誘導 AI 模型觸發(fā) MCP 工具泄露數(shù)據(jù)。這說明我們需要新的安全基礎(chǔ)設施和框架來保護開發(fā)者和系統(tǒng)。
Matt:客戶對于 MCP 和 Agent 的接受程度如何?畢竟,如果他們已經(jīng)花大量精力打造精美的界面,突然被 Agent 繞過,可能會覺得不安。
Guillermo:企業(yè)對 V0 和我們 AI Cloud 基礎(chǔ)設施的興趣超出預期。原因在于決策者的個人體驗:許多 CTO、CIO 在日常生活中頻繁使用 ChatGPT,甚至會教孩子寫代碼。他們在工作中卻發(fā)現(xiàn),企業(yè)流程依舊緩慢,需要多次會議和冗長周期。這種反差讓他們意識到,如果不盡快擁抱 AI,可能會徹底落后。如果沒有 MCP 服務器,就等于把自己排除在這類新興經(jīng)濟之外。而更重要的是,MCP 讓企業(yè)能夠創(chuàng)建自己的 AI 界面。
亞馬遜早期的推薦系統(tǒng)是一個里程碑式的 UI 創(chuàng)新:“買了這個的人還會買這些”。未來的“Agent 電商”將出現(xiàn)新的交互原語,Agent 會伴隨用戶的瀏覽之旅,就像隨身的購物顧問或助理。過去商店無法規(guī)?;峁┻@樣的服務,而現(xiàn)在對回頭客或注冊用戶,這種高度個性化體驗將成為可能。企業(yè)決策者普遍希望優(yōu)先服務忠誠用戶,而 AI 的記憶能力正好發(fā)揮關(guān)鍵作用。AI 可以記錄用戶偏好,分析其瀏覽日志,從中提煉出幾個核心事實,例如喜歡黑色、男性、住在舊金山等,再帶入下次訪問,就能創(chuàng)造細微卻令人驚喜的體驗,從而增強客戶忠誠度。
Matt:你認為距離這樣的未來還遠嗎?比如,客戶服務中的一次交互最終能觸發(fā)產(chǎn)品代碼的修改,以回應用戶反饋?
Guillermo:我認為這是必然趨勢。對 Vercel 來說,客服團隊是公司最重要的部門之一。我們將 V0 模型部署在幫助中心,用戶訪問 Vercel.com/help 時,可以獲得幾乎涵蓋所有問題的 AI 支持,從代碼報錯到云計算使用解釋。然而,總有一些復雜問題無法通過 AI 自動解決,我稱之為“前沿問題”。這使得客服工程師的工作更有挑戰(zhàn)性,因為他們處理的是 AI 過濾后仍未解決的難題,也正是這些問題推動了產(chǎn)品的改進。
客服團隊大量使用 V0 來提出改進建議:如果優(yōu)化某個產(chǎn)品功能,就能避免相應的支持工單。他們的目標是讓模型更聰明、產(chǎn)品更完善,從而減少重復問題。但始終會有新的前沿問題出現(xiàn),因此他們的作用依然至關(guān)重要。過去,我們每天處理了大量重復性工單,如今這一部分幾乎消除,客戶滿意度顯著提升。起初我擔心技術(shù)社區(qū)用戶會更傾向于人工客服,甚至對 AI 感到不滿,但事實相反,用戶反饋極其積極。我們特別關(guān)注“脫離事件”,即用戶因問題被迫離開產(chǎn)品的情況,并持續(xù)跟蹤產(chǎn)品或模型在哪些環(huán)節(jié)存在不足。
Matt:AI Cloud 是什么?能做什么?
Guillermo:AWS 當初的目標是幫助人們構(gòu)建網(wǎng)站,而我認為我們正經(jīng)歷從“Pixels”到“Tokens”的重大轉(zhuǎn)變。Pixels 依舊重要,因為人類交互需要快速而美觀的界面,Vercel 會繼續(xù)在這方面提供支持。但未來的大量交互將通過 Tokens 完成,因此我們需要一個專為 AI 產(chǎn)品打造的云,它既能支持 AI 應用構(gòu)建,也能用 AI 解決傳統(tǒng)云計算中的頑疾。
以云運維為例,如今開發(fā)者和運維人員經(jīng)常收到“系統(tǒng)宕機”或“接口報錯”的通知,卻沒有解決方案。我們認為 AI Cloud 應當配備 Agent,直接生成解決方案,而非只報告問題。憑借 Vercel 的端到端智能,我們能捕捉從 CDN、防火墻、渲染到后端的所有數(shù)據(jù),并通過 AI Agent 自動化基礎(chǔ)設施和問題修復。例如,OpenAI.com 是全球訪問量前二十的網(wǎng)站之一,若其基礎(chǔ)設施出問題,我們不會只發(fā)出警報,而是直接提交修復方案的 Pull Request。
未來,企業(yè)將用 AI Cloud 來構(gòu)建 MCP 服務器、Agent、對話式 AI,甚至行業(yè)平臺,如代碼助手、客服助手、法律或金融 AI。幾乎所有行業(yè)都將迎來顛覆,與其自行解決基礎(chǔ)設施,不如直接從 AI Cloud 起步。
Matt:聽起來 Vercel 的 AI Cloud 不僅僅是一個發(fā)布,更像是一種進展。你們是在讓 DevOps 變得多余,打造一個自我修復的系統(tǒng)嗎?
Guillermo:可以理解為兩部分:基礎(chǔ)設施和代碼?;A(chǔ)設施層面,過去十年我們已高度自動化。而更難的是應對運行中的異常情況,例如我們托管的某些知名電商網(wǎng)站,經(jīng)常遭遇信用卡攻擊或爬蟲流量。傳統(tǒng)方法是人工接警、手動排查,但 Vercel Agent 會自動檢測并分析異常,給出詳細事實和處理建議。開發(fā)者仍在決策環(huán)中,但已不必從零開始調(diào)查。
傳統(tǒng)云的現(xiàn)實是,運維人員常被毫無上下文的警報叫醒,調(diào)查可能耗時數(shù)小時。AI Cloud 則能實現(xiàn)自愈:不僅在攻擊和宕機時提供修復方案,還能進行性能優(yōu)化。例如,檢測到電商網(wǎng)站的圖片加載緩慢時,系統(tǒng)會直接生成優(yōu)化 Pull Request,而不是僅僅報錯。
此外,AI Cloud 需要為 AI 應用提供專門的服務和 SDK。本周我們發(fā)布了 AI 網(wǎng)關(guān)(測試版)、Vercel Sandbox、Vercel Agent,以及改進后的 Fluid 計算平臺,使其更高效、更低成本地運行 MCP 服務器和 AI 任務。
Matt:Fluid 本身也是最近才發(fā)布的,對嗎?
Guillermo:是的,非常新。云計算從 1.0 到 2.0 的轉(zhuǎn)變改變了運行負載的特征。過去主要是前端渲染,對響應速度要求極高,因此亞馬遜提出了著名的“100 毫秒規(guī)則”:頁面每延遲 100 毫秒,就會損失 1% 轉(zhuǎn)化率。但進入“Tokens”時代,新的模型如 OpenAI O3 Pro 可以連續(xù)思考 15 分鐘,這種長時計算在傳統(tǒng)云上幾乎沒有被優(yōu)化。
Fluid 的創(chuàng)新在于計費模式。我們只針對實際 CPU 周期收費,而不是像傳統(tǒng)云那樣為閑置時間買單,這意味著用戶真正實現(xiàn)“按需付費”。Fluid 補充了 GPU 的能力,幫助開發(fā)者在調(diào)用模型的同時進行必要的計算與集成處理。
Matt:Sandbox 又是什么?
Guillermo:Sandbox,即一個安全的運行環(huán)境,用于承載模型生成的計算任務。在研究過程中,Agent 可能需要快速運行一段 Python 腳本來計算數(shù)據(jù)、生成可視化,或幫助決策。你可以把 Sandbox 理解為 AI 領(lǐng)域的 “Amazon EC2”,但它不是為開發(fā)者手寫的代碼服務,而是為模型實時生成的代碼提供運行環(huán)境。有了它,就能構(gòu)建出全新的產(chǎn)品,例如創(chuàng)建你自己的 V0 或 Lovable,或讓模型在幕后運行代碼,直接生成一份深度研究報告。
Matt:無論是 AI Cloud 還是 V0,你們似乎都形成了一個持續(xù)學習和優(yōu)化的數(shù)據(jù)飛輪。這是你們有意的設計嗎?在產(chǎn)品層面,你們做到多系統(tǒng)化了?
Guillermo:是的。AI Cloud 的一部分是我們直接構(gòu)建的核心模塊,比如 Fluid、Sandbox、AI 網(wǎng)關(guān);另一部分是生態(tài)整合。比如在模型 Evals(評測)中,我們使用 BrainTrust。我們希望那些我們不構(gòu)建、但 AI 世界必需的產(chǎn)品,也能通過 Vercel 市場一鍵獲取。例如,Agent 除了要能安全運行代碼,還必須具備瀏覽器功能,因為很多任務都需要訪問網(wǎng)頁。因此會有類似 BrowserBase 或 BrowserUse 這樣的集成,它們專為 Agent 構(gòu)建瀏覽器基礎(chǔ)設施。
數(shù)據(jù)飛輪至關(guān)重要。過去有的公司更依賴直覺設計,比如蘋果;有的公司則高度數(shù)據(jù)驅(qū)動,比如 Facebook,會根據(jù)用戶停留時間優(yōu)化廣告。在 AI 世界里,數(shù)據(jù)驅(qū)動已非選擇,而是必然。你必須追蹤每個數(shù)據(jù)點:用戶對生成內(nèi)容的反饋、錯誤率、Agent 提出的建議被接受的比例等。沒有健全的指標體系,就無法真正參與 AI 產(chǎn)品經(jīng)濟。幸運的是,AI 生態(tài)天然“電池齊全”,讓創(chuàng)業(yè)者從一開始就具備這樣的條件。
企業(yè)運營與個人管理
Matt:V0 的出現(xiàn)帶來了新的用戶群,他們可能不是專業(yè)開發(fā)者,而是需要更易用交互方式的人。與此同時,前端、后端甚至產(chǎn)品的界限也在模糊。作為公司,你們?nèi)绾芜m應這種變化?
Guillermo:我們做了一件基本的事情,就是和大量 V0 用戶交流。V0 對很多人都有價值,但對某些人則是顛覆性的改變。例如,那些每天與開發(fā)者協(xié)作但本身不是開發(fā)者的人,這個產(chǎn)品對他們來說就是一種超能力。這幫助我們明確了主要用戶畫像:雖然任何人都能使用 V0,但它對“開發(fā)相關(guān)崗位”的人尤其具有變革性。就在錄播客前,我收到一位父親的消息,他說自己和孩子一起用 V0 開發(fā)了一個應用,這在過去幾乎不可能做到。這讓我更加確信,我們要在真正點亮用戶的地方加倍投入。
另一個原則是“從模型出發(fā)設計”。如果產(chǎn)品目標過于科幻化,模型能力跟不上,就無法落地。最初 V0 的 UI 過于雄心勃勃,輸入提示后會生成三個完整應用,但難以進入真正的迭代式對話。后來我們重新設計(內(nèi)部稱為 V1),更貼近模型的實際水平,結(jié)果用戶增長提升了一百倍。設計既要符合模型的當前能力,也要為未來六個月的演進留有余地。
Matt:你們用戶留存率和毛利率的情況如何?
Guillermo:V0 是有正毛利的健康業(yè)務,且毛利率在持續(xù)提升,我認為這源于我們鎖定了長期穩(wěn)定的用戶群。V0 既服務企業(yè),也服務個人,因此不會完全依賴短期的“新鮮感用戶”。在企業(yè)里,使用產(chǎn)品是剛需,留存自然更高。與此同時,我們也在探索讓個人用戶能通過 V0 盈利,比如引入類似 App Store 的訂閱和支付體系,從而建立可持續(xù)的創(chuàng)作者經(jīng)濟。
Matt:從營收來看,Vercel 去年表現(xiàn)非常亮眼。據(jù)說達到 1 億美元左右,今年初已到 1.8 億,實現(xiàn)約 80% 的增長。背后的主要驅(qū)動力是什么?
Guillermo:V0 增長迅猛,占據(jù)了顯著收入比例。同時我們快速響應開發(fā)者需求,例如 ChatGPT 發(fā)布后,我們立即推出了 AI SDK 和 Chat SDK,讓開發(fā)者能快速構(gòu)建類似 ChatGPT 的產(chǎn)品。AI SDK 已成為全球第二大 AI 模塊,僅次于 OpenAI。本質(zhì)上,我們抓住了開發(fā)者真正想要構(gòu)建的方向——今天是聊天產(chǎn)品,明天是 Agent、MCP。
過去,我們的增長曾受益于疫情推動電商和加密行業(yè)的需求。但 AI 不同,它不是短期潮流,而是一種效率革命。即使用戶短期流失,他們也會因需求再次回來。就像學會了一種更高效的工作方式,就很難再退回去。
尤其是在企業(yè)場景中,AI 產(chǎn)品每天都在創(chuàng)造經(jīng)濟價值。而在消費端,移動化正在打開新機會。V0 很快會有移動端應用,用戶可以隨時隨地攜帶 Agent,甚至遠程操控電腦。這需要全新的基礎(chǔ)設施和服務,也正是我們構(gòu)建 AI Cloud 的原因。
Matt:你在與社區(qū)的溝通中非常具有感染力。像這周的大會、你在 X 上的活躍表現(xiàn),都讓人印象深刻。在你事務繁多的情況下,你是如何看待這種溝通的重要性的?
Guillermo:我把它看作一種多重溝通方式。首先是對自己,其次是對團隊。事實上,X 對我來說是一個高效的溝通渠道,可以觸達近 700 名 Vercel 員工,也能覆蓋更廣泛的開發(fā)者社區(qū)。我希望通過這種方式傳遞想法,提供支持,并獲得對產(chǎn)品的反饋。我的出發(fā)點其實是盡量把積極的能量帶給大家。因為在短期內(nèi),很多事物對人們來說都是模糊不清、充滿不確定性的,尤其是開發(fā)者常常經(jīng)歷情緒的劇烈波動:今天一切順利,明天卻可能感覺一切都糟糕。所以我希望帶來一種樂觀的態(tài)度,讓大家相信總有值得去創(chuàng)造的新事物。
與此同時,這也是我鍛煉思考方式的過程。我會盡量簡化表達,減少冗余,把語言像“打磨 Pixels”一樣精煉。在我看來,每一個功能按鈕、文字鏈接都可能增加負擔,可能出錯,可能讓用戶困惑。ChatGPT 相較于 Google 的一個核心優(yōu)勢就是界面簡潔。Google 的搜索頁面雖仍算干凈,但功能和廣告層層疊加,讓體驗變得繁復。我的原則是同樣適用于語言和思考:盡量去除冗余,保持清晰。
我甚至把這看作一種 AI 時代的訓練。生活中,提出 Prompt 與成功之間存在正相關(guān)。你提出的問題越多,把想法表達得越多,參與銷售和推廣的機會也就越多。關(guān)鍵在于不斷練習,并在每次表達中精進一點,通過反饋持續(xù)改進。因此,我對外的溝通,實際上也是一次次自我打磨的過程。
Matt:既然你在公眾場合思考和建設,你會遇到負面反饋。你是如何處理的?
Guillermo:我的原則是盡量避免傳播負能量。我會提醒自己:是不是要說一些尖銳或負面的話?如果是,就選擇不發(fā),或者留在草稿箱里。保持積極并不意味著一味粉飾太平,適度的批評是必要的,但必須在合適的情境中使用。很多時候,負面反饋確實能帶來更高的關(guān)注度,但我會有意識地克制。
當面對用戶的批評時,我總認為其中一定包含某種真實的內(nèi)核。我的原則是“客戶永遠是對的”。作為開發(fā)者,我深知工具能帶來多大的挫敗感,所以我會盡可能以同理心面對批評,并把它轉(zhuǎn)化為改進產(chǎn)品的機會。最終,我的目標不是讓大家喜歡我個人,而是打造真正讓用戶喜愛的產(chǎn)品。
Matt:你要兼顧的事情很多:你是近 700 人公司的 CEO,又是多家優(yōu)秀創(chuàng)業(yè)公司的天使投資人,同時還是五個孩子的父親。你是如何保持精力充沛而不至于崩潰的?又是如何管理壓力、平衡生活的?
Guillermo:首先,我很感激團隊和家人的支持,他們讓我能把精力集中在真正重要的事情上,減少無謂的消耗。效率對我而言至關(guān)重要,除此之外,我非常重視健康和身體鍛煉,因為這能讓我保持能量。奇妙的是,雖然鍛煉消耗體力,卻能帶來更多精力。
每次鍛煉就像是一場精神體驗,比如跑步,20 分鐘后我總會想放棄,心里會有各種消極念頭。但堅持下去,就能突破這種心態(tài)。正如 David Goggins 所說,每天都是了解自我的機會。創(chuàng)業(yè)也是如此,不論公司多大、資源多少,你始終在和那些懷揣新想法的年輕人競爭。所以,每天都必須以最佳狀態(tài)投入其中。
Matt:如果你能給小時候的自己一些建議,你會說什么?
Guillermo:我的第一個網(wǎng)站是關(guān)于《龍珠 Z》的,做得很糟糕,用的是 GeoCities 或 Fortune City 這樣的平臺。但今天情況完全不同,現(xiàn)在初學者可以借助圖像和視頻生成模型,輕易創(chuàng)造出遠超我當年水平的作品。因此,我會建議年輕人盡可能去了解和利用當下的新工具,而不是拘泥于傳統(tǒng)路徑。
例如,當年我選擇 JavaScript 時,它被視為“玩具語言”,不夠快、不夠嚴謹。但事實證明這些看法都是錯的。因為選擇早,我在 17 歲時就已經(jīng)被 Facebook 招募。提前進入新領(lǐng)域,往往能獲得更多機會。不要過于在意外界眼中的“高地位”技術(shù),而是要專注于潛力所在。
我認為未來寫代碼會逐漸被 Agent 接管,更重要的是理解系統(tǒng)的運作方式,以及它們的局限性。這不僅包括計算機和硬件的極限,還包括服務、模型和各種抽象層。最終,世界的進步依賴于抽象層的提升。部署比寫代碼更重要,因為代碼本身是靜態(tài)的,只有運行和被部署才會產(chǎn)生價值。
此外,我非常重視數(shù)學和語言。數(shù)學是培養(yǎng)系統(tǒng)性思維的最好方式,語言則關(guān)乎表達和講故事的能力。無論是寫作、敘事還是為投資人制作演示,都需要語言功底。雖然我認為 AI 未來可能具備更強的寫作能力,但目前仍難以達到頂尖文學水準。因此,閱讀經(jīng)典文學,尤其是 Jorge Borges 或 García Márquez 的作品。
https://www.youtube.com/watch?v=zhA7OMw4njw&t=1s
聲明:本文為 InfoQ 整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。
會議推薦
10 月 23 - 25 日,QCon 上海站即將召開,限時 9 折優(yōu)惠,單張門票立省 680 元,詳情可聯(lián)系票務經(jīng)理 18514549229 咨詢。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.