AI Coding 演化進(jìn)行時(shí)。
作者 | 董超
責(zé)編 | Echo Tang
出品丨AI 科技大本營(yíng)(ID:rgznai100)
過去三年里,AI 編碼從“補(bǔ)一句代碼”躍遷為“承包一次變更”。Coding 可能是第一個(gè)找到所謂 PMF 的方向…如今 AI Coding 已經(jīng)進(jìn)入下半場(chǎng),Coding 到底是 AGI 的子集還是新路徑,我們一起略窺一二。
三年演進(jìn):范式落地 → 開源上位 →
執(zhí)行力為王
2023:范式落地,“可執(zhí)行代理”苗頭已現(xiàn)
如果要給 2023 下一個(gè)極簡(jiǎn)注解,那就是:范式被大型平臺(tái)坐實(shí),開源在邊緣地帶萌芽。前者不難理解——Copilot 與 ChatGPT 把“人寫—AI 輔”的協(xié)作方式帶進(jìn)了日常;后者更值得留心:初創(chuàng)公司和個(gè)人開發(fā)者開始探索“不僅會(huì)說,還要能做”。我們能在當(dāng)年的兩個(gè)方向上嗅到這種味道:
IDE/多端一體化:Continue 以開源擴(kuò)展與 CLI 同步推進(jìn),讓“對(duì)話、補(bǔ)全、結(jié)構(gòu)化編輯、Agent 工作流”在 VS Code / JetBrains / 終端間貫通,初步具備“把建議落成動(dòng)作”的骨架。
本地可執(zhí)行:Open-Interpreter 把“和模型對(duì)話→讓它在本機(jī)跑腳本/代碼”的路徑公開化,終端里一條命令就能進(jìn)入循環(huán)試錯(cuò)。
它們還不是“產(chǎn)業(yè)級(jí)代理”,卻清晰地為次年的開源 Code Agent 熱身:從“能聊代碼”邁向“能動(dòng)手”。
2024:Coding Agent 上位,社區(qū)百花齊放
來到 2024,Coding Agent 從舞臺(tái)邊側(cè)走到中央,形成兩股彼此強(qiáng)化的潮流。
第一股:可執(zhí)行的 Coding Agent ,開始對(duì)真實(shí)倉庫交付。
OpenHands(原名:OpenDevin),直言“面向軟件開發(fā)的 AI 代理平臺(tái)”,強(qiáng)調(diào)從計(jì)劃→調(diào)工具→編輯代碼→跑命令/測(cè)試→產(chǎn)出 PR 的一條龍閉環(huán),且在項(xiàng)目文檔中明確“formerly OpenDevin”,標(biāo)志著 Coding Agent 從演示走向工程與評(píng)測(cè)。
第二股:IDE 內(nèi)的“許可式執(zhí)行”成為交互共識(shí)。
Cline 把代理裝進(jìn) VS Code,但每一步都走用戶授權(quán):讀/改倉、開終端、啟瀏覽器皆需你點(diǎn)頭。自動(dòng)化有了抓手,可控性也不丟,這套 user-in-the-loop 范式,恰好契合工程團(tuán)隊(duì)的安全與可觀測(cè)訴求。
與之并行的,是“對(duì)話 → 可跑應(yīng)用”的云端工作臺(tái):
StackBlitz · bolt.new 以 WebContainers 為底座,把“Prompt→運(yùn)行→部署/分享”壓成直線。它不是替代 IDE,而是把從想法到可運(yùn)行這條鏈路極限拉短,成為前端/全棧原型場(chǎng)景的高頻入口,并迅速形成開源社群與使用高潮。
2024 的關(guān)鍵詞是可執(zhí)行代理 + 許可式自動(dòng)化。一個(gè)把“提示”落成“動(dòng)作”,一個(gè)為“動(dòng)作”加上剎車與護(hù)欄;兩股合力讓“寫—測(cè)—改—提 PR”真正跑起來,也自然把目光推向 2025 的“形態(tài)之爭(zhēng)”。
2025:形態(tài)之爭(zhēng)進(jìn)入加速段,CLI 成了主戰(zhàn)場(chǎng)
到了 2025,AI Coding 的主線從“誰補(bǔ)得更準(zhǔn)”轉(zhuǎn)向“誰把一次變更穩(wěn)妥地跑完”。這也是為什么 CLI 形態(tài)格外出圈:它天生貼著腳手架、測(cè)試與 CI/CD,最容易把“讀庫→計(jì)劃→修改→驗(yàn)證→提交 PR”的閉環(huán)壓縮在開發(fā)者熟悉的命令與腳本里。Claude Code 代表了這種“終端即中樞”的范式:官方把它定義為 Agentic Coding 的終端工具,并給出完整的 CLI 參考與工作流示例,讓代理在命令行里承包從 Issue 到 PR 的整活,這種“拉直執(zhí)行鏈路”的體驗(yàn),是它能夠走紅的直接原因。
與之并行,開源 CLI 代理把“好用”與“可治理”結(jié)合得更緊。Gemini CLI 以 Apache-2.0 開源發(fā)布,本身就是一套可插拔的命令行工作臺(tái);更關(guān)鍵的是,它把 GitHub Actions 做成“一等公民”:在倉庫里 @gemini-cli 便能觸發(fā)協(xié)作任務(wù),或直接將其編排進(jìn)團(tuán)隊(duì)工作流,使“代理執(zhí)行”天然具備可觀測(cè)與可回歸的工程屬性,這解釋了它在團(tuán)隊(duì)側(cè)迅速擴(kuò)散的動(dòng)能。
如果說 Gemini CLI 強(qiáng)調(diào)的是“協(xié)作原生”,那 SST 的 Opencode 則把“本地可控與多模型自由度”做到了極致。它堅(jiān)持 100% 開源 與 供應(yīng)商無鎖定,在 TUI 里流暢地切換 Anthropic、OpenAI、Google 甚至本地模型;對(duì)希望控制成本、規(guī)避鎖定、又想保持手感的開發(fā)者而言,這正是“能長(zhǎng)期落地的開源氣質(zhì)”。
另一條支線來自 OpenAI Codex:一頭連著本地 Codex CLI(強(qiáng)調(diào)“輕量、腳本化、在你機(jī)器上跑”),一頭連著 Codex Web / IDE 集成(把并行執(zhí)行與倉庫上下文搬到云端)。這種“本地自治 + 云端加速”的雙軌設(shè)計(jì),等于把可執(zhí)行代理做成了一個(gè)可擴(kuò)展的通用底座,既順著當(dāng)下 CLI 的熱度,又為之后的系統(tǒng)級(jí)協(xié)同留出了增長(zhǎng)曲線。
綜上,今年項(xiàng)目“火爆”的共同邏輯并不神秘:誰把執(zhí)行閉環(huán)做得最順、最可插拔,誰就最容易贏得團(tuán)隊(duì)側(cè)的采用。CLI 之所以成為主戰(zhàn)場(chǎng),是因?yàn)樗选翱山M合(腳本/管道)”“可治理(權(quán)限/審計(jì)/觀測(cè))”“可遷移(接現(xiàn)有工具鏈)”三點(diǎn)合而為一;而開源項(xiàng)目之所以在這一波里占優(yōu)勢(shì),則在于它們更容易成為“標(biāo)準(zhǔn)拼裝件”:既能接入 IDE 與 Web 工作臺(tái)(例如前一年流行起來的 bolt.new 這類“對(duì)話→可跑應(yīng)用”的入口),又能下沉到 CI/CD 的底層執(zhí)行。接下來,勝負(fù)將更多取決于上下文理解與工具生態(tài)(誰更懂你的代碼資產(chǎn))、推理與穩(wěn)定性(復(fù)雜改動(dòng)能否一把過)、以及開放與成本(是否便于團(tuán)隊(duì)規(guī)?;涞兀?。
針對(duì)近幾年如火如荼的 AI Coding 領(lǐng)域,市場(chǎng)側(cè)也給出背書,根據(jù) The Business Research Company 的數(shù)據(jù),全球 AI 編程工具市場(chǎng)規(guī)模預(yù)計(jì)將從 2024 年的 62.1 億美元增長(zhǎng)至 2029 年的 182 億美元,對(duì)應(yīng) CAGR 為 24.0%。某種意義上,這是“滲透率 + 客單價(jià) + 組織級(jí)復(fù)用”的合力。
數(shù)據(jù)脈動(dòng):新上榜與“長(zhǎng)紅”并存,生態(tài)換擋加速
與今年 5 月份的大模型開源開發(fā) Landscape 相比,百日后我們看到“兩端拉長(zhǎng)”的態(tài)勢(shì):Cline、Continue、OpenHands 等“長(zhǎng)紅”項(xiàng)目穩(wěn)居高位,同時(shí) Gemini CLI、opencode、goose、marimo、openai/codex、avante.nvim 等“新面孔”快速上行。
這組數(shù)據(jù)背后,我們可以看出:
1)協(xié)議/接口優(yōu)先的項(xiàng)目擴(kuò)散更快(如 ACP/MCP 生態(tài)、Actions 一等公民);
2)本地可控 + 多模型自由度帶來開發(fā)者粘性(opencode、Avante.nvim + Ollama);
3)從原型到交付的鏈路被壓短(bolt.new、Codex Web),降低了“從想法到產(chǎn)物”的門檻。
縱覽近兩年的熱門項(xiàng)目,其出圈背后有以下因素:
降低“黑箱云端”的心智負(fù)擔(dān):優(yōu)先在本地/可控環(huán)境動(dòng)手,審批與可追蹤執(zhí)行是默認(rèn)能力;
協(xié)議優(yōu)先、生態(tài)可插拔:MCP/ACP/ACI 等把“工具—代理—宿主”解耦,IDE/終端/CI 的接入成本驟降;
開發(fā)體驗(yàn)“一條龍閉環(huán)”:從建議到自動(dòng)打補(bǔ)丁、測(cè)試、PR、回滾/審計(jì),交付路徑更短;
“Vibe Coding” 讓代碼平權(quán):自然語言操控倉庫與腳手架,更多角色能參與原型與運(yùn)維,但生產(chǎn)級(jí)仍強(qiáng)調(diào)審閱與回歸。
為什么今年偏愛 CLI ?
是個(gè)例還是趨勢(shì)?
以新上榜的 Gemini CLI 為例,它到底是什么?
Gemini CLI 是 Google 開源的命令行智能代理,目標(biāo)是“從你的提示直達(dá)模型”,把代碼生成、改動(dòng)、測(cè)試與協(xié)作動(dòng)作嵌回到開發(fā)者最熟悉的終端里。項(xiàng)目采用 Apache-2.0 許可證,并提供官方的 GitHub Action(run-gemini-cli),將“代理執(zhí)行”直接接入倉庫級(jí)工作流(Issue/PR 觸發(fā)、@gemini-cli 命令派發(fā)等)。這使它既是“個(gè)人終端工具”,也是“團(tuán)隊(duì)協(xié)作節(jié)點(diǎn)”。
為什么它“上來就很像團(tuán)隊(duì)的工具”?
協(xié)作原生:官方 Action 把它做成“倉庫的一等公民”,可在 PR/Issue 上自動(dòng)值守:分揀與優(yōu)先級(jí)、出測(cè)試、補(bǔ)修復(fù)、響應(yīng) @gemini-cli 命令等;企業(yè)側(cè)可用 Google Cloud 的 WIF(Workload Identity Federation)做安全集成,減少長(zhǎng)期密鑰暴露。
上下文與容量:官方口徑對(duì)外強(qiáng)調(diào)與 Gemini Code Assist、MCP 等生態(tài)協(xié)作,并主打“大上下文 + 高頻免費(fèi)限額”作為開發(fā)者冷啟動(dòng)的動(dòng)力。這類“足夠用”的默認(rèn)配額,降低了團(tuán)隊(duì)一線嘗試的門檻。
從 CLI 到 CI 的“半步距”:開發(fā)者本地跑順手后,幾乎零改造就能把同一套命令編排進(jìn) GitHub Actions 里做回歸與可觀測(cè)。對(duì)于需要“把 Issue 變成可審 PR”的團(tuán)隊(duì)而言,這一步是決定能否規(guī)?;茝V的關(guān)鍵。
因此,它更適用于需要“默認(rèn)協(xié)作”的組織,希望讓代理圍繞 PR/Issue 工作,而不是只在本地 IDE 里“幫我寫點(diǎn)代碼”。不過,值得注意的是,與 IDE 內(nèi)部深度上下文的體驗(yàn)相比,CLI/CI 形態(tài)對(duì)“細(xì)粒度編輯體驗(yàn)”的可視反饋較少,必要時(shí)可與 Cline/Continue 這類 IDE 代理搭配使用;
Gemini CLI 不是“更酷的命令行”,而是“把代理直接變成團(tuán)隊(duì)協(xié)作節(jié)點(diǎn)”的范式樣本——這正是 2025 年 CLI 出圈的縮影:承接現(xiàn)有腳本 → 接入 CI/PR → 形成可觀測(cè)的執(zhí)行閉環(huán)。
這并不意味著 IDE/插件 與 Web 工作臺(tái)式微:前者在“所見即所得”的上下文編輯上仍是個(gè)人效率之王(如 Cline、Continue),后者把“從零到可運(yùn)行/可分享”的鏈路縮到極短(如 bolt.new)。CLI 則是團(tuán)隊(duì)把自動(dòng)化落地的“承力面”。三者是界面層的取舍,而非零和博弈。
從應(yīng)用到模型:“模型吞噬應(yīng)用”的回響
應(yīng)用側(cè)的卷法,終究受制于模型側(cè)的躍遷。比如 Qwen3-Coder 模型可以為模型配置讀寫文件、列舉文件等工具,使其可以直接修改代碼文件。
Qwen3-Coder collection /DeepSeek-Coder collection
互聯(lián)網(wǎng)巨頭的大模型在 Coding 榜單名列前茅,最近陸續(xù)下場(chǎng),借助簡(jiǎn)潔的命令行形態(tài)調(diào)用模型,進(jìn)一步增強(qiáng)模型能力。我們從 HumanEval、SWE-Bench verified、LiveCode-Bench 這些專業(yè)的代碼大模型榜單可以看出,OpenAI 的 O3 、Anthropic 的 claude、Google 的 Gemini 均穩(wěn)穩(wěn)占據(jù)前三。OpenAI 是在調(diào)出了 O3 之后,推了 DeepResearch 和增強(qiáng)版本的 O3Search;打了 perplexity 的主陣地;Claude Code是在 Claude 3.7 獨(dú)占 Coding 領(lǐng)域一段時(shí)間后,和 Claude 4 一起發(fā)的,雖然形態(tài)不是 IDE,但也引起了大量程序員的切換。當(dāng)模型迭代到“能理解倉庫 + 能穩(wěn)態(tài)執(zhí)行”,僅做“調(diào)用包裝”的工具會(huì)更難存活——這也是為何協(xié)議、流程與數(shù)據(jù)(而非“只換個(gè) API”)正在成為真正的護(hù)城河。這種"降維打擊"被迫讓很多開源項(xiàng)目最終進(jìn)入“墓園”,曇花一現(xiàn)。
代碼大模型相關(guān)的榜單
技術(shù)剖面:AI Coding 的“五層堆?!?/strong>
AI Coding 迭代極快,如果不把這些項(xiàng)目放進(jìn)統(tǒng)一的技術(shù)坐標(biāo),很容易陷入“今天誰加了新按鈕”的比較,而忽視了會(huì)決定長(zhǎng)期護(hù)城河的層次。同時(shí)由于模型側(cè)“降維打擊”來得更快(榜單換代、推理升級(jí)、本地化增強(qiáng)),只有把能力拆到層上,才能在模型換代時(shí)替換最上游的一層,而不是推倒重來。因此,為了防止過度追逐熱點(diǎn)項(xiàng)目導(dǎo)致失焦,我們把 AI Coding 拆解為五層堆棧:
1)接口形態(tài)(IDE/CLI/Web):決定人機(jī)邊界與團(tuán)隊(duì)嵌入方式,代表項(xiàng)目分別是以 Cline 為代表的 IDE 形態(tài),以 Gemini CLI 為代表的 CLI 形態(tài),以及以 bolt.new 為代表的 Wed 形態(tài),成為前端/全棧原型的高頻入口。
2)執(zhí)行內(nèi)核(Agent Runtime):計(jì)劃、工具編排、沙箱/并行、斷點(diǎn)恢復(fù);
3)上下文織層(Context Fabric):RAG over repo/issue/wiki、語義索引、AST/CFG 級(jí)編輯;
4)標(biāo)準(zhǔn)與協(xié)議(MCP、ACP、ACI 等):讓工具與代理可插拔、可觀測(cè);
5)模型與路由:多模型/本地/級(jí)聯(lián)仲裁,平衡成本、質(zhì)量與時(shí)延。
把開源項(xiàng)目往這五層一落,差異就一目了然:例如 OpenHands 強(qiáng)執(zhí)行內(nèi)核與 ACI;opencode 強(qiáng)接口形態(tài)(CLI/TUI)與多模型路由;Gemini CLI 把協(xié)作工作流(Actions)做成外部擴(kuò)展的“北向接口”;Codex 以本地/云端雙軌把上下文與執(zhí)行拉通。
因此,在 AI Coding 的下半場(chǎng),競(jìng)爭(zhēng)的焦點(diǎn)回歸到三件事:推理與穩(wěn)定性(復(fù)雜改動(dòng)能否一把過)、工具/上下文生態(tài)(誰更懂你的代碼資產(chǎn))、開放與成本(能否以可控成本落進(jìn)企業(yè)流程)。開源社區(qū)將持續(xù)作為“最快擴(kuò)散層”,CLI 與 IDE 插件吸收新模型/新工具更快;像 OpenHands、Codex CLI、Gemini CLI 這樣的“可執(zhí)行代理底座”,會(huì)成為團(tuán)隊(duì)流水線里的標(biāo)準(zhǔn)拼裝件。底層收斂到“統(tǒng)一執(zhí)行內(nèi)核 + 協(xié)議層”(開源更具外延力),負(fù)責(zé)計(jì)劃、工具調(diào)用、讀寫倉、運(yùn)行/觀測(cè)與回退;上層維持 IDE、CLI、Web 多形態(tài),按“個(gè)人效率、團(tuán)隊(duì)自動(dòng)化、原型演示”各取所需。
結(jié)語
AI Coding 的拐點(diǎn)不是“模型更聰明”,而是“讓聰明的模型可靠地完成一次真實(shí)的變更”。當(dāng)可執(zhí)行的 Coding Agent 與自動(dòng)化授權(quán)成為默認(rèn),把 IDE/CLI/Web 三種形態(tài)放進(jìn)同一臺(tái)“執(zhí)行引擎”上,人機(jī)協(xié)作就從“能交互”進(jìn)化為“能交付”。下一輪競(jìng)爭(zhēng),將在執(zhí)行閉環(huán)、上下文理解與開放生態(tài)里決出高下。
本文出自《》洞察報(bào)告專題洞察 AI Coding 篇,作者董超(螞蟻開源)。
10 月 16-17 日,2025 全球機(jī)器學(xué)習(xí)技術(shù)大會(huì)將在北京威斯汀大酒店(亮馬橋)舉行,大會(huì)特別設(shè)置了「AI 賦能軟件研發(fā)與氛圍編程」專題,北京大學(xué)博雅特聘教授李戈、阿里 Qoder 技術(shù)專家彭佳漢、騰訊代碼大模型技術(shù)專家夏偉、百度 Comate 資深算法工程師陳一言、智譜 AI CodeGeeX 算法研究員張少博、深信服研發(fā)主管、Costrict 負(fù)責(zé)人韋體東等深耕 AI Coding 的資深專家學(xué)者將深入 AI Coding 在軟件工程的探索與實(shí)踐,幫助大家一起更好地?fù)肀?AI Coding 下半場(chǎng),歡迎掃描下方二維碼報(bào)名。
日程詳情可戳:《》
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.