你的下一個Office,不一定要是Office。
但凡稍微關(guān)注點AI圈子,2025年你看到最多的關(guān)鍵詞,會是什么?
Agent(智能體)絕對榜上有名。
2025年還沒過完,市面上的AI Agent產(chǎn)品已經(jīng)大爆發(fā)到讓人眼花繚亂——從能幫你寫代碼的、畫畫的,到能幫你訂機票、做規(guī)劃的,選擇琳瑯滿目。
但它們普遍又是面目模糊的。通用的AI Agent好像什么都能干,但什么都干得不精;而很多垂類Agent,哪怕如vibe coding這樣場景明確,又高度標準化的場景,真正用起來也會在某個環(huán)節(jié)卡殼,比如指令理解生硬,需要多輪交互修改代碼——對小白用戶而言,這不可持續(xù)。
字節(jié)跳動旗下的“扣子空間”,希望能夠給出一種新的解法。9月3日,扣子空間(Coze Space)進行了一次大版本升級,以及上線了AI Excel等重磅新功能。
來源:扣子空間
“扣子空間”是一個通用智能體平臺,在今年4月上線。在內(nèi)測階段,“扣子空間”就已經(jīng)爆火,一碼難求。
自此之后,扣子空間一直在更新迭代,近期更是頻頻升級:9月3日正式推出AI Excel能力之后,AI設(shè)計版塊也開始內(nèi)測豆包圖像創(chuàng)作模型Seedream 4.0模型,帶來了多圖融合、圖像修改等能力的又一次升級。
在完成最近的功能更新之后,36氪發(fā)現(xiàn)扣子空間的定位也進行了一次刷新:一站式AI辦公空間——你的下一代辦公空間,可能真的不一定是Office。
簡單來說,扣子空間要面向的是幾乎所有有學習和工作需求的C端用戶。今天,當我們再分析扣子空間的能力時,可以發(fā)現(xiàn)它已經(jīng)覆蓋了AI寫作、AI PPT、AI設(shè)計、AI Excel、AI網(wǎng)頁、AI播客。
從2024年上線以來,扣子的變化軌跡清晰可見:從一個To C的智能體生態(tài),逐步完善AI基建,接入豐富多元的MCP廣場。
2024年被稱為Agent元年,直到2025年,Agent才開始逐步落地。可以說,年初Manus的爆火,徹底打開了Agent市場,但要真正讓每一個人都用上Agent,依舊還有很長的路要走。
如今Agent也走到了這樣的岔路口。
“最后一公里”,幾乎是每一代的技術(shù)浪潮中的公司,都會提到并希望解決的問題。以上一代AI技術(shù)的發(fā)展過程為例,傳統(tǒng)模型參數(shù)規(guī)模小,識別、OCR、TTS等單點算法只能在特定場景產(chǎn)生價值,企業(yè)上線時必須做大量系統(tǒng)集成、數(shù)據(jù)標注、流程再造。結(jié)果就是,每一個新客戶就意味著一次新版本的深度定制。
扣子空間的目標,不只是做一堆工具的簡單集合,而更像是一個打通了普通用戶、開發(fā)者和企業(yè)三方的完整生態(tài)。就在不久前的7月,扣子也宣布將另外兩個產(chǎn)品——扣子開發(fā)平臺(Coze Studio)和扣子羅盤(Coze Loop),開源至GitHub。
如果說,“扣子空間”要讓路人都能輕松用AI完成學習、工作的產(chǎn)品;那么“扣子開發(fā)平臺”和“扣子羅盤”,就是為開發(fā)者提供了一整套“AI工具臺”。
歸根結(jié)底,扣子要解決的問題只有一個:讓Agent真能用,真落地。扣子空間在其中扮演的角色,就是讓每個普通人都能以最簡單的方式,輕松用AI完成學習、工作的產(chǎn)品。
從50分到80分,靠譜AI實習生如何練成?
在扣子空間批量上新后,36氪迅速跑了數(shù)個場景,包括最新圖像模型Seedream 4.0,發(fā)現(xiàn)還真有點東西。
任務(wù)一:一鍵生成可用的PPT
做PPT是職場的幾乎是各家通用智能體平臺的標配功能,扣子空間也同樣如此。
各家都能做PPT,但產(chǎn)出的質(zhì)量截然不同。尤其是,現(xiàn)在大多數(shù)AI PPT的體驗,給人的感覺像在帶一個“50分實習生”。它或許能幫你搜點資料,寫個初稿,但內(nèi)容會淺嘗輒止,圖片和文字格式也常會錯亂。
PPT場景是扣子空間的王牌場景,36氪體驗之后,發(fā)現(xiàn)它最優(yōu)秀的地方在于——靠譜,能穩(wěn)定交付。不會任務(wù)半途中止,并且需要人類員工返工的步驟,也明顯少了許多。
我們模擬了一個場景,要求扣子空間根據(jù)我們最近的一篇文章《裸辭的年輕人,把尼泊爾躺成大理》,生成一份PPT。
點擊一鍵優(yōu)化,扣子空間就開始豐富Prompt,并且開始發(fā)散思考了。
扣子空間沒有像很多通用Agent一樣,直接生成一個成品,讓用戶開盲盒。相反,它就像實習生一樣,在每個關(guān)鍵步驟都會停下來和用戶進行確認。
扣子空間生成大綱后,和用戶進行確認 圖源:扣子空間
在內(nèi)容生成上也是如此,扣子空間會先進行一輪網(wǎng)頁搜索,補充信息??梢钥闯?,扣子所選用的信源質(zhì)量較高,一般都是來自權(quán)威媒體或者官網(wǎng)。
完成這一步后,再根據(jù)大綱進行圖片搜索。文字和圖片匹配是現(xiàn)在AI PPT的難點之一,采用這樣的機制,也能夠有效地控制PPT最終的質(zhì)量,避免圖不對文的問題。
值得注意的一點是,在生成PPT的過程中,扣子空間所展現(xiàn)的思考過程,也非常詳細。
它甚至會根據(jù)PPT主題來進行搜索的優(yōu)化,同一個主題(比如建筑)領(lǐng)域,所采用的審美、布局,都是類似的,但是會根據(jù)具體的Prompt做細微改進。
改進的結(jié)果就是,排版樣式跟別人不會撞車,并且會根據(jù)搜索到的資料,自己生成圖表,個性化程度比較高。
扣子空間第一版給出的PPT,從排版到設(shè)計都是格局完整的,排版簡潔清晰。
到了修改環(huán)節(jié),扣子空間能夠支持修改維度,幾乎是市面上最多的。
扣子空間不僅能夠支持常規(guī)的插入圖片/文字,增加頁數(shù),PPT背景的增加和刪減,還可以支持不同區(qū)塊的位移、縮放、樣式修改。
在PPT制作中,需要的數(shù)據(jù)、信息常常會分散在word、pdf、網(wǎng)頁鏈接等文件中。用戶也不需要再費心進行二次轉(zhuǎn)換和整理——只要扔給扣子空間,扣子空間就可以一鍵幫忙排版,還會幫忙整理邏輯、增加數(shù)據(jù)。
場景二:一鍵生成、修改配圖
我們再以36氪編輯日常的一個工作場景為例——給文章做配圖。
作為科技媒體,給文章配一張風格獨特、主題明確的封面圖是家常便飯。這事說大不大,但比較耗時間,我們把這個任務(wù)交給了扣子空間:
比如,讓扣子空間直接給本期文章生成一個配圖,我們還同步提供了扣子的官方形象照。
提示詞:畫面參考漫畫分鏡風格生成一張圖,一共分6個不規(guī)則區(qū)域,分別IP形象在寫作、2分析數(shù)據(jù)、3畫畫、4演講PPT、5敲代碼做網(wǎng)頁、6錄制播客的場景,背景對應(yīng)區(qū)域?qū)?yīng)不同場景和不同的動作。參考形象圖見附件,21:9比例,圖中不帶任何文字。
扣子空間馬上抓取了核心要點,然后開始馬不停蹄開始設(shè)計,并且很快就給出了成品,中間沒有尋求我們的確認。
最后的成品中,扣子的形象非常嚴格保持一致,并且無論是風格和氛圍,都非常符合我們的要求,并直接作為了本文封面圖使用。
除此之外,設(shè)計場景的修改環(huán)節(jié)也很省心。修改環(huán)節(jié)里,圖生圖的能力也是由新一代圖像創(chuàng)作模型Seedream 4.0支持的。
簡單來說,有了這個模型,“用嘴改圖”能真的實現(xiàn)穩(wěn)定交付,我們選用了扣子近期的公眾號上的活動進行海報修改測試。
比如,在做另一個海報修改場景時,我們嘗試用非常口語化的方式指揮扣子空間:把一張海報里的主角,從女生替換成男生。
文字一致性也是AI生圖場景的一大難點,但扣子空間同樣速度很快地完成了圖生圖任務(wù)。無論是人物的神態(tài)表情、動作,畫面中的元素、文字,甚至二維碼,都能很好保持。
對比以前,由于海報中的元素繁多,如果交由設(shè)計師去設(shè)計,需要把海報的元素分層,以及大量重新設(shè)計和渲染工作,現(xiàn)在只需要一句話就能搞定。
場景三:一鍵長文寫作
跟進海外新聞,并且及時寫分析復(fù)盤,是36氪編輯的日常工作之一。
以前兩天的一則重要新聞為例——To B軟件巨頭Atlassian以6.1億美元收購瀏覽器服務(wù)商The Browser Company,讓扣子空間寫作一篇深度文章,復(fù)盤Atlassian的成長之路。
對于新聞場景,信息真實性和準確性是我們考量的第一要義??圩涌臻g會根據(jù)我們的要求,從各個維度了解這個主題,并且搜索相應(yīng)的材料,并且搜索來源也都集中在權(quán)威媒體、以及行業(yè)研報等。
而在扣子空間生成大綱后,我們還可以對大綱進行二次修改,再進行下一步的成文操作。同時,信源都可追溯,可跳轉(zhuǎn),以供我們核實。
數(shù)字序號標注出信源,可以直接跳轉(zhuǎn)到原文鏈接
寫作場景里也有很多產(chǎn)品的小設(shè)計,方便二次編輯修改。比如,生成文章大綱后,扣子空間就會自動形成一個目錄,方便跳轉(zhuǎn)查看。
平均每輪對話產(chǎn)出2000字左右,是以前ChatBot類型產(chǎn)品的上限??梢悦黠@看出,扣子空間在這方面基本沒有token限制。在確認了大綱之后,扣子空間最終產(chǎn)出了一篇超過1.7萬字的深度復(fù)盤,堪比一篇研究報告。
扣子空間的寫作,“人機味”也更少了。從目錄可以看出,每個章節(jié)由清晰的時間線和公司發(fā)展階段描述交織,很少見到華麗空泛的形容詞,看起來簡煉、整潔。
甚至,扣子空間還會預(yù)判你的預(yù)判。在復(fù)盤完Atlassian自身的發(fā)展狀況之后,還會適當?shù)匮a充關(guān)鍵數(shù)據(jù)的走勢圖,以及增加與同類型產(chǎn)品的對比。
由于《Atlassian戰(zhàn)略轉(zhuǎn)型深度分析》內(nèi)容過長,可點擊文末閱讀原文查看。
場景四:一鍵生成真人語音播客
現(xiàn)在,把圖文內(nèi)容轉(zhuǎn)化為播客,已經(jīng)成了很多自媒體創(chuàng)作者的常規(guī)操作。但這事兒同樣費時費力:先要把文章改成適合口語表達的腳本,然后自己錄音、剪輯、配樂,一套流程下來,半天就過去了。
超擬人語音是扣子空間的另一個王牌功能。我們想看看,扣子空間能不能把這個流程也簡化。
同樣地,我們直接把一篇專訪鏈接丟給了它,甚至沒有給任何指令。
圖源:扣子空間
整個過程同樣體現(xiàn)了扣子空間“保姆式”的交互風格,沒有直接開始生成,而是先拆解任務(wù):將專訪文章轉(zhuǎn)化為音頻連接和網(wǎng)頁。
然后,扣子空間就根據(jù)播客的特點,去除原文中的圖片等元素,并且對原文進行壓縮,調(diào)整為兩個人對話的版本。
扣子空間
在扣子空間自動生成播客里,無論是語氣、停頓還是兩個人說話的節(jié)奏,都已經(jīng)到了非常真實的地步——扣子空間還很聰明地在段落之間加入了合適的停頓,甚至在關(guān)鍵節(jié)點配上了簡單的音效(比如水杯碰到桌面的聲音),讓聽感不那么枯燥。
最方便的還是修改環(huán)節(jié)。試聽之后,我們覺得某一段的語氣有點太激動了。
這也可以局部修改。我們直接在對話框里輸入:“這一段語氣稍微冷靜一點”,它就能立刻重新生成那一小段音頻,而不是讓整個任務(wù)從頭再來。
整個體驗下來,扣子空間把一個原本需要多個專業(yè)軟件配合、耗時數(shù)小時的工作,壓縮到了幾分鐘內(nèi)。對于想試水播客的內(nèi)容團隊來說,這個功能大大降低了啟動門檻。
“最強辦公搭子”背后
是一位AI基建狂魔
大模型技術(shù)正在改寫整個軟件生態(tài),無論是字節(jié),還是阿里、騰訊、百度,都從2024年開始建設(shè)自己的Agent產(chǎn)品,2025年,建設(shè)開發(fā)平臺和生態(tài)的腳步也越來越快。
放眼市場,一個有趣的現(xiàn)象是,不少Agent平臺都喜歡采用“多模型路由”策略——也就是混用多家模型,來規(guī)避單一模型能力不足的風險。一些面向海外的中國產(chǎn)品,甚至自家就是專門做大模型的公司,居然都直接用國外的模型作為內(nèi)核。
在這個背景下,扣子空間選擇底層All in“豆包大模型”,這種路線曾經(jīng)看來略顯“笨重”。在2024年,這一度和市場顯得有些格格不入。
但到了2025年,市場給出了為何要這樣做的答案。
普遍來看,市面上的Agent產(chǎn)品很多都打著“一句話生成xxxxAgent”的名號,但到了實操環(huán)節(jié),真正生成的Agent總有這樣那樣的問題,不是調(diào)用失敗,就是生成的質(zhì)量差。
后續(xù)的調(diào)試、排錯,即使是用最簡單的托拉拽形式,用戶也依然有學習門檻,需要一定的開發(fā)基礎(chǔ)。這種門檻,很容易就把To C用戶擋在門外——這就導(dǎo)致,如今幾乎所有的Agent的交付物,集中在生成簡單的PPT、網(wǎng)頁、小游戲。
想讓結(jié)果真正“可交付”而不是“半成品”,大模型的可靠性依然是不足的。
數(shù)據(jù)也已經(jīng)有驗證。根據(jù)OpenAI內(nèi)部的一則研究,即使GPT-4o也僅將Agent的工具選擇準確率提升了3%,但處理復(fù)雜任務(wù)時極易掉鏈子。今年全球發(fā)布的多個重磅模型,無論是GPT-5、Claude4,針對智能體的優(yōu)化也仍然是難題。
這也是為什么,扣子空間選擇了從底層到應(yīng)用的全鏈路、端到端性能調(diào)優(yōu)的路線。簡單來說,這就好比一個在工廠里,從發(fā)動機到最小的螺絲釘,都是自己設(shè)計和生產(chǎn)的。
扣子空間的PPT、長文理解、代碼優(yōu)化之所以能夠做到穩(wěn)定交付,內(nèi)容涉及更加深度,在于團隊做了大量的工程化工作。
以PPT場景舉例,在做PPT時,扣子空間會根據(jù)教育、醫(yī)療等不同行業(yè)做深度優(yōu)化,這里面有大量的模型后訓(xùn)練工作,加入了人類專家的反饋以不斷優(yōu)化,從而讓產(chǎn)出風格更貼近專業(yè)需求。
一個建筑領(lǐng)域的PPT Case,生成的PPT風格就以大圖為背景,更有藝術(shù)感和氛圍感。
反饋到效果上,你會發(fā)現(xiàn),這種精細打磨,讓AI的產(chǎn)出不再是千篇一律的模板,而是真正能用的成果,是針對你的需求“專人專辦”的。
這也讓扣子空間有底氣,把交付成本拉到最低——扣子空間是市面上為數(shù)不多,在PPT場景提供無限次下載、增頁,設(shè)計場景能快速批量生圖的產(chǎn)品。
簡單來說,它不再像一個需要你手把手去教、去哄的“50分實習生”,反而更像一個已經(jīng)磨合過、能領(lǐng)會意圖的“80分老員工”。
在整個測試過程中,我們印象深刻的一點在于,扣子空間提供了一種“保姆式的產(chǎn)品體驗”。它很清楚用戶在使用AI時真正會遇到的麻煩,并提前把它們解決了。
這種保姆式體驗,從第一步就已經(jīng)開始。很多用戶面對AI工具的那個空白輸入框,難免腦袋都會空白一下——到底要寫什么?尤其是對Agent產(chǎn)品,清晰、高質(zhì)量的指令,對普通用戶來說,門檻并不低。
扣子空間的解法,是主動來引導(dǎo)你,盡可能消除“主動給指令”這一步。
比如,在你輸入模糊想法后,對話框的右下角會提供一個“一鍵優(yōu)化”的按鈕,幫你把大白話翻譯成AI能精準理解的指令。
而在制作PPT這類復(fù)雜任務(wù)中,它還會在關(guān)鍵節(jié)點停下來,讓你確認大綱、選擇風格——能做選擇題,就不做填空題。
Agent產(chǎn)品另一個普遍問題在于,很多AI在工作時就像一個黑盒子。下達指令后,你只能盯著屏幕干等,最后它給你一個結(jié)果,好不好就像抽卡,如果不滿意,還得從頭再來。這種失控感和不確定性,讓人很焦慮。
整個過程,感覺旁邊坐著一個經(jīng)驗豐富的助理。安全感則來自產(chǎn)品上的很多小設(shè)計:在關(guān)鍵節(jié)點上不斷跟你確認需求,讓你始終握著方向盤;版本也會隨時保存,能夠撤銷和回退。
扣子空間全鏈路優(yōu)化的優(yōu)勢,還體現(xiàn)在豐富的MCP(插件)生態(tài)上。
扣子空間不僅接入了多樣的第三方插件,還與飛書等MCP進行了深度整合。這種“內(nèi)部協(xié)同”帶來的絲滑體驗,是外部調(diào)用API難以比擬的。
比如,接了飛書的MCP后,你可以在扣子空間里,發(fā)出指令。在前面我們測試的長文場景中,生成長文后,可以直接把內(nèi)容轉(zhuǎn)成飛書文檔。
如今,扣子空間的上線,意味著Agent產(chǎn)品矩陣,已經(jīng)形成了一種清晰的用戶分層:
面向普通用戶,To C產(chǎn)品“扣子空間”會提供深度優(yōu)化過的,能靠譜交付結(jié)果的各個垂直Agent;
對于不滿足于現(xiàn)有功能的專業(yè)用戶和開發(fā)者,開發(fā)者可以在“扣子開發(fā)平臺”上輕松構(gòu)建自己的Agent,然后用“羅盤”這個調(diào)試工具反復(fù)調(diào)優(yōu),最后把打磨好的Agent發(fā)布到“扣子空間”,讓產(chǎn)品擺脫了“AI玩具”的屬性,進階到企業(yè)級水平。
如果說,全球Agent市場經(jīng)歷這兩年的發(fā)展,告訴了大家什么,那就是:在新技術(shù)發(fā)展的初期,一個純粹開放、完全“放養(yǎng)”的輕平臺模式,其實很難跑出真正好用的產(chǎn)品。
回看歷史,無論是從前和現(xiàn)在,科技巨頭們的試驗都已經(jīng)給后來者打了個樣。平臺方必須主動投入資源,去做用戶教育和市場培育。
蘋果的App Store也走過從封閉轉(zhuǎn)向開放的道路。一個關(guān)鍵轉(zhuǎn)折點在于,App Store沒有單純開放生態(tài),而是通過提供強大的iPhone SDK和Xcode等原生開發(fā)工具,主動引導(dǎo)生態(tài),設(shè)置準入門檻,最終催生了大量高質(zhì)量的應(yīng)用爆發(fā)。
而OpenAI在2023年上線的GPTs商店,則是一個反例。由于缺少有效的準入門檻和平臺引導(dǎo),大量簡單的“套殼”應(yīng)用涌入,淹沒了那些真正用心打磨的好產(chǎn)品,傷害了用戶和開發(fā)者的體驗。
建立一個怎樣的AI生態(tài),本質(zhì)上是一種產(chǎn)品選擇。
自然語言編程的興起,讓每個人隨手做一個AI應(yīng)用Demo變得簡單,但要讓它變成能穩(wěn)定服務(wù)于成千上萬用戶的“生產(chǎn)級”產(chǎn)品,背后需要的基礎(chǔ)設(shè)施還遠遠不夠。
扣子空間選擇了那條更“笨”也更現(xiàn)實的路:在吆喝大家來蓋樓之前,自己先下場,用最好的材料和工藝,親手搭出一個功能強大、體驗極佳的樣板間。
從這個角度看,扣子空間的形態(tài),可能為當下的AI基建大戰(zhàn),提供了一個更現(xiàn)實、也更有參考意義的樣本——先從“超強辦公室搭子”做起,讓用戶用得爽,讓Agent“有用”,這可能才是當下最重要的事。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.