網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

扣子空間，偷偷搞全了AI Office

2025-09-08 21:05:10　來源: 36氪

天津舉報

分享至

你的下一個Office，不一定要是Office。

但凡稍微關(guān)注點AI圈子，2025年你看到最多的關(guān)鍵詞，會是什么？

Agent（智能體）絕對榜上有名。

2025年還沒過完，市面上的AI Agent產(chǎn)品已經(jīng)大爆發(fā)到讓人眼花繚亂——從能幫你寫代碼的、畫畫的，到能幫你訂機票、做規(guī)劃的，選擇琳瑯滿目。

但它們普遍又是面目模糊的。通用的AI Agent好像什么都能干，但什么都干得不精；而很多垂類Agent，哪怕如vibe coding這樣場景明確，又高度標準化的場景，真正用起來也會在某個環(huán)節(jié)卡殼，比如指令理解生硬，需要多輪交互修改代碼——對小白用戶而言，這不可持續(xù)。

字節(jié)跳動旗下的“扣子空間”，希望能夠給出一種新的解法。9月3日，扣子空間（Coze Space）進行了一次大版本升級，以及上線了AI Excel等重磅新功能。

來源：扣子空間

“扣子空間”是一個通用智能體平臺，在今年4月上線。在內(nèi)測階段，“扣子空間”就已經(jīng)爆火，一碼難求。

自此之后，扣子空間一直在更新迭代，近期更是頻頻升級：9月3日正式推出AI Excel能力之后，AI設(shè)計版塊也開始內(nèi)測豆包圖像創(chuàng)作模型Seedream 4.0模型，帶來了多圖融合、圖像修改等能力的又一次升級。

在完成最近的功能更新之后，36氪發(fā)現(xiàn)扣子空間的定位也進行了一次刷新：一站式AI辦公空間——你的下一代辦公空間，可能真的不一定是Office。

簡單來說，扣子空間要面向的是幾乎所有有學習和工作需求的C端用戶。今天，當我們再分析扣子空間的能力時，可以發(fā)現(xiàn)它已經(jīng)覆蓋了AI寫作、AI PPT、AI設(shè)計、AI Excel、AI網(wǎng)頁、AI播客。

從2024年上線以來，扣子的變化軌跡清晰可見：從一個To C的智能體生態(tài)，逐步完善AI基建，接入豐富多元的MCP廣場。

2024年被稱為Agent元年，直到2025年，Agent才開始逐步落地。可以說，年初Manus的爆火，徹底打開了Agent市場，但要真正讓每一個人都用上Agent，依舊還有很長的路要走。

如今Agent也走到了這樣的岔路口。

“最后一公里”，幾乎是每一代的技術(shù)浪潮中的公司，都會提到并希望解決的問題。以上一代AI技術(shù)的發(fā)展過程為例，傳統(tǒng)模型參數(shù)規(guī)模小，識別、OCR、TTS等單點算法只能在特定場景產(chǎn)生價值，企業(yè)上線時必須做大量系統(tǒng)集成、數(shù)據(jù)標注、流程再造。結(jié)果就是，每一個新客戶就意味著一次新版本的深度定制。

扣子空間的目標，不只是做一堆工具的簡單集合，而更像是一個打通了普通用戶、開發(fā)者和企業(yè)三方的完整生態(tài)。就在不久前的7月，扣子也宣布將另外兩個產(chǎn)品——扣子開發(fā)平臺（Coze Studio）和扣子羅盤（Coze Loop），開源至GitHub。

如果說，“扣子空間”要讓路人都能輕松用AI完成學習、工作的產(chǎn)品；那么“扣子開發(fā)平臺”和“扣子羅盤”，就是為開發(fā)者提供了一整套“AI工具臺”。

歸根結(jié)底，扣子要解決的問題只有一個：讓Agent真能用，真落地。扣子空間在其中扮演的角色，就是讓每個普通人都能以最簡單的方式，輕松用AI完成學習、工作的產(chǎn)品。

從50分到80分，靠譜AI實習生如何練成？

在扣子空間批量上新后，36氪迅速跑了數(shù)個場景，包括最新圖像模型Seedream 4.0，發(fā)現(xiàn)還真有點東西。

任務(wù)一：一鍵生成可用的PPT

做PPT是職場的幾乎是各家通用智能體平臺的標配功能，扣子空間也同樣如此。

各家都能做PPT，但產(chǎn)出的質(zhì)量截然不同。尤其是，現(xiàn)在大多數(shù)AI PPT的體驗，給人的感覺像在帶一個“50分實習生”。它或許能幫你搜點資料，寫個初稿，但內(nèi)容會淺嘗輒止，圖片和文字格式也常會錯亂。

PPT場景是扣子空間的王牌場景，36氪體驗之后，發(fā)現(xiàn)它最優(yōu)秀的地方在于——靠譜，能穩(wěn)定交付。不會任務(wù)半途中止，并且需要人類員工返工的步驟，也明顯少了許多。

我們模擬了一個場景，要求扣子空間根據(jù)我們最近的一篇文章《裸辭的年輕人，把尼泊爾躺成大理》，生成一份PPT。

點擊一鍵優(yōu)化，扣子空間就開始豐富Prompt，并且開始發(fā)散思考了。

扣子空間沒有像很多通用Agent一樣，直接生成一個成品，讓用戶開盲盒。相反，它就像實習生一樣，在每個關(guān)鍵步驟都會停下來和用戶進行確認。

扣子空間生成大綱后，和用戶進行確認圖源：扣子空間

在內(nèi)容生成上也是如此，扣子空間會先進行一輪網(wǎng)頁搜索，補充信息?？梢钥闯?，扣子所選用的信源質(zhì)量較高，一般都是來自權(quán)威媒體或者官網(wǎng)。

完成這一步后，再根據(jù)大綱進行圖片搜索。文字和圖片匹配是現(xiàn)在AI PPT的難點之一，采用這樣的機制，也能夠有效地控制PPT最終的質(zhì)量，避免圖不對文的問題。

值得注意的一點是，在生成PPT的過程中，扣子空間所展現(xiàn)的思考過程，也非常詳細。

它甚至會根據(jù)PPT主題來進行搜索的優(yōu)化，同一個主題（比如建筑）領(lǐng)域，所采用的審美、布局，都是類似的，但是會根據(jù)具體的Prompt做細微改進。

改進的結(jié)果就是，排版樣式跟別人不會撞車，并且會根據(jù)搜索到的資料，自己生成圖表，個性化程度比較高。

扣子空間第一版給出的PPT，從排版到設(shè)計都是格局完整的，排版簡潔清晰。

到了修改環(huán)節(jié)，扣子空間能夠支持修改維度，幾乎是市面上最多的。

扣子空間不僅能夠支持常規(guī)的插入圖片/文字，增加頁數(shù)，PPT背景的增加和刪減，還可以支持不同區(qū)塊的位移、縮放、樣式修改。

在PPT制作中，需要的數(shù)據(jù)、信息常常會分散在word、pdf、網(wǎng)頁鏈接等文件中。用戶也不需要再費心進行二次轉(zhuǎn)換和整理——只要扔給扣子空間，扣子空間就可以一鍵幫忙排版，還會幫忙整理邏輯、增加數(shù)據(jù)。

場景二：一鍵生成、修改配圖

我們再以36氪編輯日常的一個工作場景為例——給文章做配圖。

作為科技媒體，給文章配一張風格獨特、主題明確的封面圖是家常便飯。這事說大不大，但比較耗時間，我們把這個任務(wù)交給了扣子空間：

比如，讓扣子空間直接給本期文章生成一個配圖，我們還同步提供了扣子的官方形象照。

提示詞：畫面參考漫畫分鏡風格生成一張圖，一共分6個不規(guī)則區(qū)域，分別IP形象在寫作、2分析數(shù)據(jù)、3畫畫、4演講PPT、5敲代碼做網(wǎng)頁、6錄制播客的場景，背景對應(yīng)區(qū)域?qū)?yīng)不同場景和不同的動作。參考形象圖見附件，21:9比例，圖中不帶任何文字。

扣子空間馬上抓取了核心要點，然后開始馬不停蹄開始設(shè)計，并且很快就給出了成品，中間沒有尋求我們的確認。

最后的成品中，扣子的形象非常嚴格保持一致，并且無論是風格和氛圍，都非常符合我們的要求，并直接作為了本文封面圖使用。

除此之外，設(shè)計場景的修改環(huán)節(jié)也很省心。修改環(huán)節(jié)里，圖生圖的能力也是由新一代圖像創(chuàng)作模型Seedream 4.0支持的。

簡單來說，有了這個模型，“用嘴改圖”能真的實現(xiàn)穩(wěn)定交付，我們選用了扣子近期的公眾號上的活動進行海報修改測試。

比如，在做另一個海報修改場景時，我們嘗試用非常口語化的方式指揮扣子空間：把一張海報里的主角，從女生替換成男生。

文字一致性也是AI生圖場景的一大難點，但扣子空間同樣速度很快地完成了圖生圖任務(wù)。無論是人物的神態(tài)表情、動作，畫面中的元素、文字，甚至二維碼，都能很好保持。

對比以前，由于海報中的元素繁多，如果交由設(shè)計師去設(shè)計，需要把海報的元素分層，以及大量重新設(shè)計和渲染工作，現(xiàn)在只需要一句話就能搞定。

場景三：一鍵長文寫作

跟進海外新聞，并且及時寫分析復(fù)盤，是36氪編輯的日常工作之一。

以前兩天的一則重要新聞為例——To B軟件巨頭Atlassian以6.1億美元收購瀏覽器服務(wù)商The Browser Company，讓扣子空間寫作一篇深度文章，復(fù)盤Atlassian的成長之路。

對于新聞場景，信息真實性和準確性是我們考量的第一要義?？圩涌臻g會根據(jù)我們的要求，從各個維度了解這個主題，并且搜索相應(yīng)的材料，并且搜索來源也都集中在權(quán)威媒體、以及行業(yè)研報等。

而在扣子空間生成大綱后，我們還可以對大綱進行二次修改，再進行下一步的成文操作。同時，信源都可追溯，可跳轉(zhuǎn)，以供我們核實。

數(shù)字序號標注出信源，可以直接跳轉(zhuǎn)到原文鏈接

寫作場景里也有很多產(chǎn)品的小設(shè)計，方便二次編輯修改。比如，生成文章大綱后，扣子空間就會自動形成一個目錄，方便跳轉(zhuǎn)查看。

平均每輪對話產(chǎn)出2000字左右，是以前ChatBot類型產(chǎn)品的上限?？梢悦黠@看出，扣子空間在這方面基本沒有token限制。在確認了大綱之后，扣子空間最終產(chǎn)出了一篇超過1.7萬字的深度復(fù)盤，堪比一篇研究報告。

扣子空間的寫作，“人機味”也更少了。從目錄可以看出，每個章節(jié)由清晰的時間線和公司發(fā)展階段描述交織，很少見到華麗空泛的形容詞，看起來簡煉、整潔。

甚至，扣子空間還會預(yù)判你的預(yù)判。在復(fù)盤完Atlassian自身的發(fā)展狀況之后，還會適當?shù)匮a充關(guān)鍵數(shù)據(jù)的走勢圖，以及增加與同類型產(chǎn)品的對比。

由于《Atlassian戰(zhàn)略轉(zhuǎn)型深度分析》內(nèi)容過長，可點擊文末閱讀原文查看。

場景四：一鍵生成真人語音播客

現(xiàn)在，把圖文內(nèi)容轉(zhuǎn)化為播客，已經(jīng)成了很多自媒體創(chuàng)作者的常規(guī)操作。但這事兒同樣費時費力：先要把文章改成適合口語表達的腳本，然后自己錄音、剪輯、配樂，一套流程下來，半天就過去了。

超擬人語音是扣子空間的另一個王牌功能。我們想看看，扣子空間能不能把這個流程也簡化。

同樣地，我們直接把一篇專訪鏈接丟給了它，甚至沒有給任何指令。

圖源：扣子空間

整個過程同樣體現(xiàn)了扣子空間“保姆式”的交互風格，沒有直接開始生成，而是先拆解任務(wù)：將專訪文章轉(zhuǎn)化為音頻連接和網(wǎng)頁。

然后，扣子空間就根據(jù)播客的特點，去除原文中的圖片等元素，并且對原文進行壓縮，調(diào)整為兩個人對話的版本。

扣子空間

在扣子空間自動生成播客里，無論是語氣、停頓還是兩個人說話的節(jié)奏，都已經(jīng)到了非常真實的地步——扣子空間還很聰明地在段落之間加入了合適的停頓，甚至在關(guān)鍵節(jié)點配上了簡單的音效（比如水杯碰到桌面的聲音），讓聽感不那么枯燥。

最方便的還是修改環(huán)節(jié)。試聽之后，我們覺得某一段的語氣有點太激動了。

這也可以局部修改。我們直接在對話框里輸入：“這一段語氣稍微冷靜一點”，它就能立刻重新生成那一小段音頻，而不是讓整個任務(wù)從頭再來。

整個體驗下來，扣子空間把一個原本需要多個專業(yè)軟件配合、耗時數(shù)小時的工作，壓縮到了幾分鐘內(nèi)。對于想試水播客的內(nèi)容團隊來說，這個功能大大降低了啟動門檻。

“最強辦公搭子”背后

是一位AI基建狂魔

大模型技術(shù)正在改寫整個軟件生態(tài)，無論是字節(jié)，還是阿里、騰訊、百度，都從2024年開始建設(shè)自己的Agent產(chǎn)品，2025年，建設(shè)開發(fā)平臺和生態(tài)的腳步也越來越快。

放眼市場，一個有趣的現(xiàn)象是，不少Agent平臺都喜歡采用“多模型路由”策略——也就是混用多家模型，來規(guī)避單一模型能力不足的風險。一些面向海外的中國產(chǎn)品，甚至自家就是專門做大模型的公司，居然都直接用國外的模型作為內(nèi)核。

在這個背景下，扣子空間選擇底層All in“豆包大模型”，這種路線曾經(jīng)看來略顯“笨重”。在2024年，這一度和市場顯得有些格格不入。

但到了2025年，市場給出了為何要這樣做的答案。

普遍來看，市面上的Agent產(chǎn)品很多都打著“一句話生成xxxxAgent”的名號，但到了實操環(huán)節(jié)，真正生成的Agent總有這樣那樣的問題，不是調(diào)用失敗，就是生成的質(zhì)量差。

后續(xù)的調(diào)試、排錯，即使是用最簡單的托拉拽形式，用戶也依然有學習門檻，需要一定的開發(fā)基礎(chǔ)。這種門檻，很容易就把To C用戶擋在門外——這就導(dǎo)致，如今幾乎所有的Agent的交付物，集中在生成簡單的PPT、網(wǎng)頁、小游戲。

想讓結(jié)果真正“可交付”而不是“半成品”，大模型的可靠性依然是不足的。

數(shù)據(jù)也已經(jīng)有驗證。根據(jù)OpenAI內(nèi)部的一則研究，即使GPT-4o也僅將Agent的工具選擇準確率提升了3%，但處理復(fù)雜任務(wù)時極易掉鏈子。今年全球發(fā)布的多個重磅模型，無論是GPT-5、Claude4，針對智能體的優(yōu)化也仍然是難題。

這也是為什么，扣子空間選擇了從底層到應(yīng)用的全鏈路、端到端性能調(diào)優(yōu)的路線。簡單來說，這就好比一個在工廠里，從發(fā)動機到最小的螺絲釘，都是自己設(shè)計和生產(chǎn)的。

扣子空間的PPT、長文理解、代碼優(yōu)化之所以能夠做到穩(wěn)定交付，內(nèi)容涉及更加深度，在于團隊做了大量的工程化工作。

以PPT場景舉例，在做PPT時，扣子空間會根據(jù)教育、醫(yī)療等不同行業(yè)做深度優(yōu)化，這里面有大量的模型后訓(xùn)練工作，加入了人類專家的反饋以不斷優(yōu)化，從而讓產(chǎn)出風格更貼近專業(yè)需求。

一個建筑領(lǐng)域的PPT Case，生成的PPT風格就以大圖為背景，更有藝術(shù)感和氛圍感。

反饋到效果上，你會發(fā)現(xiàn)，這種精細打磨，讓AI的產(chǎn)出不再是千篇一律的模板，而是真正能用的成果，是針對你的需求“專人專辦”的。

這也讓扣子空間有底氣，把交付成本拉到最低——扣子空間是市面上為數(shù)不多，在PPT場景提供無限次下載、增頁，設(shè)計場景能快速批量生圖的產(chǎn)品。

簡單來說，它不再像一個需要你手把手去教、去哄的“50分實習生”，反而更像一個已經(jīng)磨合過、能領(lǐng)會意圖的“80分老員工”。

在整個測試過程中，我們印象深刻的一點在于，扣子空間提供了一種“保姆式的產(chǎn)品體驗”。它很清楚用戶在使用AI時真正會遇到的麻煩，并提前把它們解決了。

這種保姆式體驗，從第一步就已經(jīng)開始。很多用戶面對AI工具的那個空白輸入框，難免腦袋都會空白一下——到底要寫什么？尤其是對Agent產(chǎn)品，清晰、高質(zhì)量的指令，對普通用戶來說，門檻并不低。

扣子空間的解法，是主動來引導(dǎo)你，盡可能消除“主動給指令”這一步。

比如，在你輸入模糊想法后，對話框的右下角會提供一個“一鍵優(yōu)化”的按鈕，幫你把大白話翻譯成AI能精準理解的指令。

而在制作PPT這類復(fù)雜任務(wù)中，它還會在關(guān)鍵節(jié)點停下來，讓你確認大綱、選擇風格——能做選擇題，就不做填空題。

Agent產(chǎn)品另一個普遍問題在于，很多AI在工作時就像一個黑盒子。下達指令后，你只能盯著屏幕干等，最后它給你一個結(jié)果，好不好就像抽卡，如果不滿意，還得從頭再來。這種失控感和不確定性，讓人很焦慮。

整個過程，感覺旁邊坐著一個經(jīng)驗豐富的助理。安全感則來自產(chǎn)品上的很多小設(shè)計：在關(guān)鍵節(jié)點上不斷跟你確認需求，讓你始終握著方向盤；版本也會隨時保存，能夠撤銷和回退。

扣子空間全鏈路優(yōu)化的優(yōu)勢，還體現(xiàn)在豐富的MCP（插件）生態(tài)上。

扣子空間不僅接入了多樣的第三方插件，還與飛書等MCP進行了深度整合。這種“內(nèi)部協(xié)同”帶來的絲滑體驗，是外部調(diào)用API難以比擬的。

比如，接了飛書的MCP后，你可以在扣子空間里，發(fā)出指令。在前面我們測試的長文場景中，生成長文后，可以直接把內(nèi)容轉(zhuǎn)成飛書文檔。

如今，扣子空間的上線，意味著Agent產(chǎn)品矩陣，已經(jīng)形成了一種清晰的用戶分層：

面向普通用戶，To C產(chǎn)品“扣子空間”會提供深度優(yōu)化過的，能靠譜交付結(jié)果的各個垂直Agent；

對于不滿足于現(xiàn)有功能的專業(yè)用戶和開發(fā)者，開發(fā)者可以在“扣子開發(fā)平臺”上輕松構(gòu)建自己的Agent，然后用“羅盤”這個調(diào)試工具反復(fù)調(diào)優(yōu)，最后把打磨好的Agent發(fā)布到“扣子空間”，讓產(chǎn)品擺脫了“AI玩具”的屬性，進階到企業(yè)級水平。

如果說，全球Agent市場經(jīng)歷這兩年的發(fā)展，告訴了大家什么，那就是：在新技術(shù)發(fā)展的初期，一個純粹開放、完全“放養(yǎng)”的輕平臺模式，其實很難跑出真正好用的產(chǎn)品。

回看歷史，無論是從前和現(xiàn)在，科技巨頭們的試驗都已經(jīng)給后來者打了個樣。平臺方必須主動投入資源，去做用戶教育和市場培育。

蘋果的App Store也走過從封閉轉(zhuǎn)向開放的道路。一個關(guān)鍵轉(zhuǎn)折點在于，App Store沒有單純開放生態(tài)，而是通過提供強大的iPhone SDK和Xcode等原生開發(fā)工具，主動引導(dǎo)生態(tài)，設(shè)置準入門檻，最終催生了大量高質(zhì)量的應(yīng)用爆發(fā)。

而OpenAI在2023年上線的GPTs商店，則是一個反例。由于缺少有效的準入門檻和平臺引導(dǎo)，大量簡單的“套殼”應(yīng)用涌入，淹沒了那些真正用心打磨的好產(chǎn)品，傷害了用戶和開發(fā)者的體驗。

建立一個怎樣的AI生態(tài)，本質(zhì)上是一種產(chǎn)品選擇。

自然語言編程的興起，讓每個人隨手做一個AI應(yīng)用Demo變得簡單，但要讓它變成能穩(wěn)定服務(wù)于成千上萬用戶的“生產(chǎn)級”產(chǎn)品，背后需要的基礎(chǔ)設(shè)施還遠遠不夠。

扣子空間選擇了那條更“笨”也更現(xiàn)實的路：在吆喝大家來蓋樓之前，自己先下場，用最好的材料和工藝，親手搭出一個功能強大、體驗極佳的樣板間。

從這個角度看，扣子空間的形態(tài)，可能為當下的AI基建大戰(zhàn)，提供了一個更現(xiàn)實、也更有參考意義的樣本——先從“超強辦公室搭子”做起，讓用戶用得爽，讓Agent“有用”，這可能才是當下最重要的事。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.