夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從“氛圍編程”到“效能編程”,來自一線研發(fā)團隊的企業(yè)最佳實踐

0
分享至


作者 | 趙鈺瑩

最近兩年,我們會在各種場合反復聽到一句話:AI Coding 是生成式 AI 浪潮下最好的商業(yè)化賽道之一。

顯然,很多企業(yè)把這句話聽進去了。根據(jù)調(diào)研,全球有超過 300 家初創(chuàng)企業(yè)推出了面向 AI Coding 方向的創(chuàng)新產(chǎn)品,其中 30% 以上的初創(chuàng)企業(yè)成立于 2023 年之后。我們大致可以將其分為三類產(chǎn)品:一類是面向?qū)I(yè)程序員和開發(fā)者的效率工具,典型代表是 Qoder;另一類是為泛開發(fā)者提供快速原型驗證的產(chǎn)品,幫助用戶快速驗證創(chuàng)意,比如 Bolt.new;第三類則是希望打造數(shù)字員工的方案,如 Devin。

然而,一旦企業(yè)開始認真思考并選型的時候就會發(fā)現(xiàn):要么是復雜任務越做越亂;要么是 AI 寫的代碼占 30%,調(diào)試修改占了 70% 的時間;要么是體感上提效了,但團隊整體交付反而因為測試、部署等成本上升而變緩。好不容易找到個靠譜的工具,還得擔心安全問題,不敢大規(guī)模用。那么,一款真正能在企業(yè)內(nèi)落地且提效,不僅滿足老板的期望,也能讓專業(yè)開發(fā)者盡情 Vibe 的 Coding 工具應該具備哪些特征?

1 都是Agent,如何選合適的Coding工具呢

在討論特征之前,我們首先確信這一定是 Agent 的形態(tài)。

畢竟,全世界都在忙著搞 Agent,AI Coding 領域也是如此。

基于 Agent 的模式,通過開發(fā)者與之進行對話來完成編程任務已經(jīng)成為 AI Coding 的標配,這種路線選擇確實有其依據(jù):Anthropic Barry 曾表示 Agent 最適合的場景是那些既負責又有價值,有技術可行性且失敗后的風險較低或監(jiān)控成本不高的任務,編程場景完全符合這個特征。

但是,一個真正高效的 Coding Agent 需要在設計理念、產(chǎn)品交互、技術架構(gòu)與安全策略等多個層面進行深度打磨。

首先,人機協(xié)作是核心。雖然大模型的能力正在迅速增強,但在處理復雜的編碼任務時,全自動的方式仍然存在局限。因此,這類工具強調(diào)人與 AI 的分工協(xié)同,讓人類能夠隨時觀察并干預 Agent 的行為,同時 Agent 也能感知用戶的操作。這樣的互動不僅提升了任務執(zhí)行的可靠性,也確保了開發(fā)過程的靈活性。

其次,在產(chǎn)品交互層面,其設計理念遵循“保持簡單”的原則。Coding Agent 不應該是冷冰冰的工具,而是一個擁有“大腦、記憶和四肢”的智能體。通過對話式交互取代繁瑣的流程和按鈕,讓開發(fā)者能夠以最低的理解成本使用,并在需要時輕松擴展其功能。


阿里云智能集團通義靈碼技術負責人 張玉明

然后,Coding Agent 應具備自主學習和長期記憶的能力。它能通過用戶行為總結(jié)畫像,將成功的經(jīng)驗應用到后續(xù)任務中,使智能體越來越理解開發(fā)者的需求。同時,通過引入短期和長期記憶機制,Agent 能夠在有限上下文的條件下保持對歷史任務的感知與調(diào)用,避免信息丟失,并逐步形成對開發(fā)者偏好的深度理解。

最后,Coding Agent 應該完全由模型驅(qū)動,盡量減少工作流式的解決方案,基于模型的自主規(guī)劃、反思迭代、工具調(diào)用等能力來打造 ReAct 模式的編程智能體。

通義靈碼的研發(fā)過程恰恰體現(xiàn)了這些原則,并在實踐中不斷優(yōu)化。根據(jù)阿里云智能集團通義靈碼技術負責人張玉明在云棲大會《企業(yè)智能化研發(fā)升級與最佳實踐》專場的分享,在調(diào)研學習了業(yè)界主流的 Agent 框架之后,通義靈碼團隊自主實現(xiàn)了其 Coding Agent 的框架,整體分為三個部分:Core 層主要包含 Graph、Memory、Tool 等核心模塊。其中,Graph 負責 Agent 和工作流編排,Memory 負責處理長、短期記憶,Tool 負責模型的工具定義和調(diào)用;Extension 層支持靈活實現(xiàn)多智能體和外部擴展;Manager 層則負責 Agent 的注冊管理、會話管理及 Aegent 框架與外部系統(tǒng)交互的接口。這種分層設計既保障了系統(tǒng)的穩(wěn)定性,也提升了擴展性。在工程感知方面,通義靈碼通過對代碼庫進行本地索引和掃描,建立語義與結(jié)構(gòu)化的關系,使得大模型能夠更快、更準確地理解和生成匹配需求的代碼。

總體而言,通義靈碼的建設路徑展示了 AI Coding Agent 的未來方向:以人機協(xié)作為基礎,以簡潔交互降低門檻,以自主學習和長期記憶增強智能,以安全和評測保證落地效果。它不僅是一個高效的編程助手,更是企業(yè)和開發(fā)者值得信賴的長期伙伴。

2 告別無效 Vibe,通義靈碼在企業(yè)落地的真實數(shù)據(jù)

阿里的研發(fā)體系是完善且強大的,所以一款創(chuàng)新工具在阿里內(nèi)部總能快速落地并拿到結(jié)果。但是,當我們面對的是全球化的研發(fā)體系協(xié)同,歷史債務繁重的、復雜的技術體系,內(nèi)部運維和開發(fā)工作量極大的體系,或者是剛剛經(jīng)歷了數(shù)字化轉(zhuǎn)型并取得初步成果的企業(yè)、AI 驅(qū)動的創(chuàng)新型企業(yè)、行業(yè)發(fā)生了全面變革的企業(yè)等,這些是否都可以在部署通義靈碼后達到有效 Vibe。

具備全球化研發(fā)體系的企業(yè),適合部署嗎?

一家旗下?lián)碛?5 家上市公司,10 萬余名員工,研發(fā)體系全球化協(xié)同的集團企業(yè)落地部署通義靈碼之后的效果如何?

這家企業(yè)是海信集團。海信集團 AI 技術中心 AI 應用開發(fā)負責人曲棟表示,海信集團最初和多數(shù)企業(yè)一樣在軟件研發(fā)層面面臨著技術債務多、開發(fā)門檻高、人員精力被低效重復勞動占用等痛點。開發(fā)者難以集中精力在高價值場景,管理層則面臨團隊技術棧割裂、管理成本高的問題。海信集團在 2023 年便率先嘗試 AI 輔助編碼,但基于安全、網(wǎng)絡、響應速度等種種問題一直沒有找到合適的工具。在經(jīng)歷了長時間 POC 測試之后,海信集團最終在去年選擇部署通義靈碼,僅用一周時間完成部署,一個月內(nèi)便推廣至全球研發(fā)體系,并成立專項項目組推動落地。


海信集團 AI 技術中心 AI 應用開發(fā)負責人 曲棟

目前,海信集團已形成覆蓋 2000 多人的運營群,工具使用進入穩(wěn)定階段。最終數(shù)據(jù)顯示,海信集團的開發(fā)人員中日均活躍用戶占比 78%,代碼生成占比約 48%,代碼采納率超過 30%,整體提效成果遠超預期。

在選型過程中,海信集團對市面主流 AI 編碼工具進行了全面評測。除了關注代碼生成質(zhì)量,更重視成本與安全,尤其是云桌面環(huán)境下如何防止代碼泄露??紤]到涉及十余個研發(fā)單位,推廣成本也是重要考量。最終通過涵蓋 10 個維度的評估模型,通義靈碼綜合得分最高。在部署方案上,經(jīng)過論證,海信集團選擇了阿里云企業(yè)專屬版。該方案在阿里云北京區(qū)域開設了專屬 VPC,獨享推理服務和存儲資源,并通過云企業(yè)網(wǎng)實現(xiàn)了阿里云青島與北京的跨域互聯(lián),同時在青島鋪設物理專線,確保數(shù)據(jù)傳輸安全可靠。海信集團還自建安全網(wǎng)關,實現(xiàn)敏感信息攔截和內(nèi)網(wǎng) IP 轉(zhuǎn)換,全面滿足云桌面環(huán)境下的安全要求。

在具體應用中,海信集團圍繞研發(fā)流程重點環(huán)節(jié)推進智能體建設。在概念階段,研發(fā)了需求評審和需求解析智能體,實現(xiàn)了需求文檔的自動拆分與規(guī)范化評審;在計劃階段,上線了設計文檔生成、規(guī)格書生成、項目管理等智能體,助力各崗位提升工作效率;在開發(fā)與測試階段,廣泛應用代碼評審、測試用例生成、缺陷自動分析等智能體,幫助開發(fā)和測試人員高效完成相關工作。實際案例中,代碼評審智能體結(jié)合通義靈碼知識庫,可上傳內(nèi)部編碼規(guī)范和代碼示例,為代碼審核提供參考。海信集團將通義靈碼代碼審核 API 直接集成到 Gitlab 中,研發(fā)人員提交 Merge Request 時自動觸發(fā) AI 代碼評審,并給出評審意見。目前已接入 100+ 代碼倉,根據(jù)試運行效果調(diào)研分析,AI 代碼評審能夠快速識別出部分潛在代碼質(zhì)量問題,如代碼異味、安全漏洞和風格不一致等,提升了團隊在 Code Review 中問題發(fā)現(xiàn)的效率,尤其在輔助新人規(guī)避常見錯誤方面表現(xiàn)突出。缺陷自動分析智能體通過日志與歷史經(jīng)驗實現(xiàn)缺陷自動分配,準確率超過 80%,平均修復周期縮短 10% 以上。測試用例生成智能體基于需求文檔和知識庫自動生成用例并支持導出 Excel,目前已覆蓋 10 余個研發(fā)單位,采納率超過 30%,效率提升 50% 以上。

技術體系復雜且對安全要求極高,可以嗎?

一家所處行業(yè)在近兩年發(fā)生較大變化,組織、研發(fā)和商業(yè)模式進行了全面變革的大型代表性企業(yè)又有哪些反饋?

這家企業(yè)是吉利汽車。在“軟件定義汽車”的背景下,汽車從過去的機械產(chǎn)品轉(zhuǎn)向數(shù)字化平臺,帶來了組織、研發(fā)和商業(yè)模式的全面變革。軟硬件解耦、功能持續(xù)交付、數(shù)據(jù)閉環(huán)驅(qū)動以及訂閱化的商業(yè)模式,正在深刻改變汽車產(chǎn)業(yè)。對于車企而言,這意味著技術鏈重塑、研發(fā)流程重構(gòu)以及組織和人才結(jié)構(gòu)的全面轉(zhuǎn)型。軟件開發(fā)的成本與比例持續(xù)上升,用戶需求從性能轉(zhuǎn)向體驗,集中化架構(gòu)與車路協(xié)同等技術也在不斷推動這一轉(zhuǎn)變。


吉利汽車數(shù)智中心研發(fā) AI 產(chǎn)品專家 阮航

吉利汽車數(shù)智中心研發(fā) AI 產(chǎn)品專家阮航提到吉利汽車在調(diào)研中發(fā)現(xiàn)六大研發(fā)痛點:復雜多層的研發(fā)體系、工具鏈割裂、對功能與信息安全的高標準要求、代碼復用困難、調(diào)試環(huán)節(jié)耗時過長,以及需求變更帶來的鏈路級影響。這些問題直接制約了研發(fā)效率。

為此,吉利汽車在需求、設計、質(zhì)量保證和編碼等環(huán)節(jié)全面引入 AI,尤其在編碼階段通過通義靈碼實現(xiàn)代碼分析、智能問答、文件編輯和自動化評審,大幅提升了效率。以一個內(nèi)部項目為例,10 天的編碼周期通過通義靈碼縮短為 7 天,整體研發(fā)效率提升超過 10%,這 7 天內(nèi)完成了代碼編寫、注釋補全、單元測試、代碼優(yōu)化等全部與編程相關的工作。

內(nèi)部運維和開發(fā)工作量極其繁重,能解決嗎?

作為一家擁有 32 家省級分公司、2900 余家分支機構(gòu)、38000 余名員工的大型企業(yè),公司軟件系統(tǒng)復雜龐大,這種情況適合引入通義靈碼嗎?

這家企業(yè)是中華財險。中華財險成立于 1986 年,是唯一一家以“中華”冠名的國有控股保險公司。作為一家擁有 32 家省級分公司、2900 余家分支機構(gòu)、9000+ 的保險產(chǎn)品、38000 余名員工的大型企業(yè),公司軟件系統(tǒng)復雜龐大。自 2020 年起,中華財險推進數(shù)字化轉(zhuǎn)型,重構(gòu)煙囪式系統(tǒng)為中臺化架構(gòu),并建設雙云體系。當前公司同時維護 120 個項目、700 個微服務,每年發(fā)布次數(shù)超過 30 次,平均每次涉及 230 個以上微服務,運維和開發(fā)工作量極其繁重。

2024 年,AI 編碼輔助工具逐漸成熟,公司把握住了這一機遇。為了減輕開發(fā)人員的負擔、提升效率,架構(gòu)團隊對多家工具進行評估,最終選擇了通義靈碼,并通過 VPC 方式部署。中華財險是較早落地通義靈碼的企業(yè),已積累了豐富實踐。中華聯(lián)合財產(chǎn)保險股份有限公司架構(gòu)師吳杰提到,一個是建模實踐,AI 能夠在短時間內(nèi)顯著提升效率。實際測試顯示,AI 可以在約十分鐘內(nèi)生成三四百行代碼,而人工編寫同樣數(shù)量的代碼往往需要一上午的時間。過程中僅出現(xiàn)過兩次小問題:第一次是報錯,第二次是圖表未能展示。但總體而言,AI 在建模場景下已經(jīng)能較好地發(fā)揮作用,讓建模工程師能夠把更多精力放在特征挖掘上,而不是重復性的代碼編寫,大幅提升了效率。


中華聯(lián)合財產(chǎn)保險股份有限公司架構(gòu)師 吳杰

另一個實踐場景是應用開發(fā)。團隊通過提前準備好材料,例如接口定義等,利用 AI 快速生成數(shù)據(jù)庫 DDL 和實體類,實現(xiàn)了較高的準確率。在此基礎上,DAO 層代碼也能直接生成,Service 層則分兩步先生成骨架再補充實現(xiàn),Controller 部分則能結(jié)合頁面信息自動生成基礎 CRUD 邏輯和注釋,必要時再由開發(fā)者微調(diào)。通過這種方式,代碼骨架和常見邏輯能夠快速完成,開發(fā)者只需在復雜業(yè)務邏輯上投入更多精力。配合合理的數(shù)據(jù)庫規(guī)范和代碼規(guī)范,這一過程在整體上大大節(jié)省了時間,尤其在接口數(shù)量和頁面元素較多的場景下,能夠顯著提高開發(fā)效率。

根據(jù)對過去一年的數(shù)據(jù)進行統(tǒng)計,中華財險代碼生成占比已達到 41.26%,生成了 257 萬行代碼。公司雖未強制推廣,但 600 個 license 的開通率已達 95%,代碼生成占比也從最初的 28% 提升至 46%。按照人效測算,平均每百名開發(fā)者可提升約 6 人的生產(chǎn)力。如果加上設計階段,效率提升會更顯著。

AI 驅(qū)動的創(chuàng)新企業(yè),適合嗎?

一家由 AI 驅(qū)動的、以 Web3 賦能的能源科技企業(yè),承擔著極高的支撐壓力,這種模式合適嗎?

朗新科技是一家 AI 驅(qū)動、以 Web3 賦能的能源科技企業(yè),業(yè)務涵蓋新能源汽車聚合充電、電力市場化交易、虛擬電廠、零碳園區(qū)和光伏云等板塊。由于業(yè)務覆蓋廣泛,公司研發(fā)承擔著極高的支撐壓力,并在不同事業(yè)群呈現(xiàn)出差異化的需求。大客戶事業(yè)群要求極致安全與合規(guī),家庭事業(yè)群要求在穩(wěn)定合規(guī)的基礎上實現(xiàn)高效率交付,而用戶事業(yè)群則更注重響應的速度與靈活性。三類不同需求使得研發(fā)在安全標準、環(huán)境適配以及開發(fā)者個人習慣上面臨巨大挑戰(zhàn)。


朗新易視騰 AI 研發(fā)賦能負責人 陳琛

在工具選擇上,傳統(tǒng)研發(fā)工具難以覆蓋多樣化場景,AI 編程助手成為突破口。公司通過系統(tǒng)化流程展開選型,從需求收集、市場調(diào)研到統(tǒng)一評估,再到小范圍試用和決策,最終選擇了通義靈碼作為統(tǒng)一推廣工具,同時保留部分其他工具作為補充。在部署與落地過程中,根據(jù)事業(yè)群差異采取了三種模式:為安全要求極高的業(yè)務選擇私有化部署;為需要全鏈路合規(guī)的業(yè)務采用企業(yè)專屬版;為探索性較強的業(yè)務則提供標準版,并輔以培訓和交流推動使用習慣養(yǎng)成。推廣路徑經(jīng)歷了培訓、制定實踐指南、團隊示范和全員推廣四個階段。

實際應用效果表明,AI 工具在大型項目和封閉沖刺中顯著減輕了開發(fā)壓力。某 150 人團隊在高強度項目中,代碼生成占比達到 70%,智能問答、智能補全采納率約 31%,顯著高于日常水平。這種轉(zhuǎn)變不僅改變了開發(fā)者的工作方式,也提升了整體研發(fā)效率。

在應用案例上,朗新易視騰 AI 研發(fā)賦能負責人陳琛重點分享了兩方面的想法。其一是將通義靈碼與自身設計工具結(jié)合,實現(xiàn)了業(yè)務分析與產(chǎn)品設計的融合,形成“設計即開發(fā)”的模式,簡單頁面和接口開發(fā)效率提升約 50%,復雜場景提升約 20%。其二是將通義靈碼應用于 AI CodeReview 環(huán)節(jié),通過自動生成的審核信息配合人工復核,有效提升代碼質(zhì)量與審核效率。

3 落地背后:Agent 還不夠,一個能內(nèi)化 Agent 能力的模型底座才是關鍵

如果今天,我們只是在聊 Coding Agent,那依舊會有一籮筐的產(chǎn)品出現(xiàn)在你的備選清單上。

畢竟,當全世界都在搞 Agent 的時候,你身邊的同事可能都會跟你感嘆一句:Agent 真簡單。

我們不僅需要 Coding Agent,我們還需要一個能內(nèi)化 Agent 能力的模型底座。

如果你有所了解,可能會問:這是 Coding LLM 嗎?當然不是,這是通義靈碼所打造的 Agentic Coding LLM。


通義實驗室算法科學家 李永彬

Coding LLM 的訓練方式通常是以預訓練語言模型為基座,語料主要來源于 GitHub 上的海量靜態(tài)代碼文件,隨后加入指定數(shù)據(jù)進行微調(diào),最后結(jié)合偏好數(shù)據(jù)進行強化學習。這類模型在理解代碼和生成補全方面表現(xiàn)出色,例如可以快速生成二分查找算法,或?qū)崟r補全代碼。但它們無法處理復雜任務,比如在給定完整倉庫和 Bug 的情況下實現(xiàn)自動修復,因為訓練數(shù)據(jù)都是靜態(tài)文件,從未包含軟件開發(fā)的動態(tài)過程。

那么,Agentic Coding LLM 是如何一步步演進以解決上述問題的呢?

過去幾年,通義靈碼的算法團隊圍繞如何構(gòu)建這一模型付出了大量努力,并將工作分為三個階段。通義實驗室算法科學家李永彬在分享中表示,首先是從零到一的探索,當時業(yè)界和學術界都沒有類似的先例,因此他們提出了“軟工大模型”的概念,希望把軟件工程的開發(fā)過程內(nèi)化到模型中,這與如今的 Agentic LLM 理念相似。其次是在模型中引入思考能力,并推動測試時擴展(Test-Time Scaling)。最后一個階段則是借鑒 DeepSeek-R1 和 OpenAI O1 等成果,采用強化學習并進行混合策略的優(yōu)化。

模型能否具備某種能力取決于所提供的數(shù)據(jù)。既然靜態(tài)數(shù)據(jù)不行,那么從哪獲取新的數(shù)據(jù)呢?

軟件工程領域雖然長期高度數(shù)字化,但開發(fā)過程卻未被記錄。因此,要讓模型學會開發(fā)流程,必須合成相應的過程數(shù)據(jù)。自 2024 年中期開始,通義靈碼團隊從 GitHub 抓取代碼倉庫及 PR,獲取問題與答案的對應關系,再通過智能體模擬工程師的工作過程,記錄從問題到解決的全過程,生成合成數(shù)據(jù)。第一代靈碼 Agent 的流程分為倉庫理解、缺陷定位和代碼生成三個階段:智能體先檢索相關文件,再縮小范圍至具體類或函數(shù),并生成解決方案計劃。隨后通過工具定位具體出錯的行,如果結(jié)果有誤,模型會反思并迭代修正,最后生成代碼,并在必要時繼續(xù)迭代,直到解決問題。整個過程被完整記錄下來,成為訓練數(shù)據(jù)。借助這些數(shù)據(jù),團隊提出的 Lingma SWE-GPT 72B 在 SWE-bench Verified 基準測試中首次即解決了超過 30% 的問題,這一成果相關論文已經(jīng)發(fā)表并獲得 ISSTA2025 杰出論文獎,該協(xié)會評審認為 SWE-GPT 的方法新穎,首次以軟件開發(fā)流程為核心記錄數(shù)據(jù),推動了該領域的進步。

在第一代模型基礎上,團隊進一步探索了 Test-Time Scaling。內(nèi)部擴展通過將思考鏈路延長,使模型能根據(jù)問題難度自動調(diào)整思考時間;外部擴展則通過多次推理生成候選結(jié)果,再利用過程獎勵機制篩選最佳路徑。實驗表明,內(nèi)外結(jié)合后,32B 模型的解決率從 28% 提升到 46%,今年 3 月就已經(jīng)接近 OpenAI 模型的效果。

第三個階段是強化學習。傳統(tǒng) GRPO 方法的思路是通過采樣 128 種解法,只要其中一種正確,就讓模型強化學習該解法。然而這種方式容易導致路徑依賴,忽略其它潛在解法,從而造成模型能力塌陷。對此,團隊提出 RL-PLUS 方法,將外部知識引入強化學習,并解決了可能帶來的“學崩潰”或“無法識別最佳學習點”的問題。通過多重重要性采樣機制,模型能夠按照自身能力選擇學習比例;通過高熵加權優(yōu)勢函數(shù),模型能夠重點學習難以理解的部分,從而提升學習效率。實驗結(jié)果表明,該方法在六個全球公認數(shù)學基準上的平均分從 45.5 分提升到 53.4 分,顯著優(yōu)于傳統(tǒng) GRPO。

在上述底座的加持下,通義靈碼不僅內(nèi)置了 20 余種工具供 Coding Agent 調(diào)用,還采用了基于 Function calling 的標準化方案,并通過大小模型搭配的架構(gòu)方案,采用投機采樣進行推理加速,大幅提升了代碼生成的速度與精度。在輸出大文件時,其代碼全文輸出的平均速度提升到了 1000 tokens/ 秒,對比之前提升了十倍以上。

在安全層面,通義靈碼將“安全基因”內(nèi)嵌到產(chǎn)品之中。從數(shù)據(jù)安全到模型訓練,再到與阿里云安全團隊、算法團隊的協(xié)作,確保生成代碼的可靠性和可控性。作為企業(yè)級產(chǎn)品,它不僅提供專屬 VPC 的實地部署方案,還在模型層面引入了安全的編碼語料,讓代碼生成更具保障。張玉明表示:“我們相信讓生成的代碼自帶安全基因是作為一款負責任的 AI 智能工具應該提供的能力”。

在評測體系上,通義靈碼構(gòu)建了涵蓋模型、技術支撐和場景的多層級測評框架。通過線下評測、自動化體系與線上 AB 測試相結(jié)合的方法,持續(xù)驗證和提升 Coding Agent 的表現(xiàn)。這不僅確保了產(chǎn)品的穩(wěn)健性,也為不同編程語言、工程場景和用戶群體提供了針對性的優(yōu)化。

在最新的 2.6 版本中,通義靈碼對 IDE 進行了全面升級,并正式面向全網(wǎng)開啟公測。新版本不僅引入了原生 AI IDE 的功能,還針對 Edit 區(qū)、Terminal 區(qū)、Chat 區(qū)進行了系統(tǒng)優(yōu)化,使得整體性能更加出色,用戶的使用體驗也顯著提升,更加流暢順滑。產(chǎn)品模式上也做出了重要調(diào)整,傳統(tǒng)的文件編輯模式被取消,取而代之的是大幅增強的 Coding Agent 模式。這一轉(zhuǎn)變的背后有兩個關鍵原因:一方面國產(chǎn)大模型的性能正在快速增強,另一方面上下文工程與各類功能細節(jié)的不斷優(yōu)化,使得智能體模式能夠更好地發(fā)揮作用。

基于這些優(yōu)化,通義靈碼的 Coding Agent 已經(jīng)具備了更高層次的自主性,且任務執(zhí)行全透明。它不僅能夠進行自主規(guī)劃、合理拆解任務并生成待辦事項,還能夠在工具調(diào)用上展現(xiàn)出更強的能力。例如通過并行化調(diào)用工具,實現(xiàn)從需求到代碼的端到端完成,大幅提升了整體效果、性能與穩(wěn)定性。

大多數(shù) AI Coding 工具在面對企業(yè)內(nèi)部的復雜任務時會突然“降智”。為了解決這一挑戰(zhàn),通義靈碼經(jīng)歷了多次演進,目前可對整個歷史會話進行壓縮總結(jié),同時結(jié)合工程手段對具體關鍵信息技術提純,從而做到當前比較好的記憶效果。當然也有借助于產(chǎn)品的手段,比如引導用戶新開會話窗口來提升短期記憶的效果。除了短期記憶,通義靈碼也提供長期記憶能力,用戶每次開啟新一輪對話的時候,其都會經(jīng)歷記憶召回、記憶評估、記憶使用、記憶創(chuàng)建和記憶鞏固來增強通義靈碼與用戶交互的體驗。針對不用的記憶,其也會依據(jù)艾賓浩斯遺忘曲線進行遺忘。

模型研發(fā)是起點,能夠應用好才會真正有效果。當我們直接使用模型時,往往面臨上下文丟失、干擾和污染等問題。當背景信息過多時,模型會截斷超出的部分;當上下文中混入不相關信息,輸出結(jié)果會被誤導;當背景信息不完整,模型則容易產(chǎn)生偏差,這些問題限制了 AI 在復雜項目中的穩(wěn)定性和效率。

為了應對這些挑戰(zhàn),阿里云智能集團數(shù)據(jù)庫產(chǎn)品事業(yè)部高級技術專家蒲松洋提到其團隊在實踐中構(gòu)建了兩類循環(huán):外循環(huán)(Outer Loop)和內(nèi)循環(huán)(Inner Loop)。外循環(huán)的核心是讓 AI 系統(tǒng)性地理解代碼倉庫和業(yè)務背景。最有效的方式是建立高質(zhì)量的項目文檔,通常用 Markdown 編寫,并隨著代碼的迭代進行熱更新。這些文檔會被 AI 定期讀取和向量化,形成“Memory Bank”,幫助模型快速理解工程背景。我們還會記錄 AI 在使用過程中的錯誤,讓它避免重復犯錯,同時制定團隊規(guī)范和工具選型,避免上下文被不必要的信息污染。


阿里云智能集團數(shù)據(jù)庫產(chǎn)品事業(yè)部高級技術專家 蒲松洋

內(nèi)循環(huán)則專注于單個任務的執(zhí)行。當需求信息不足時,開發(fā)者需要主動補充背景,并明確告訴 AI 需要修改哪些文件或模塊,從而縮小搜索范圍、提高準確度。團隊還應建立標準化的工作流,讓 AI 能在重復性任務中持續(xù)發(fā)揮作用。每次完成重大變更后,還要將這些更新同步回外循環(huán),保持整體知識的持續(xù)演進。隨著外循環(huán)和內(nèi)循環(huán)的建設成熟,團隊可以放心地讓 AI 執(zhí)行更長周期、復雜度更高的開發(fā)任務,例如自動生成單元測試、端到端測試腳本,甚至實現(xiàn)較大規(guī)模的代碼重構(gòu)。

為了更好地管理 AI 的能力邊界,團隊還建立了復雜度分級體系。需求被分為 C1 到 C5 五個等級,C1 表示 AI 可完全自主完成,C2 需要一定上下文支持,C3 以上則較為復雜,需要人工干預。通過外循環(huán)和內(nèi)循環(huán)的完善,通義靈碼團隊已能讓 AI 高效完成大量 C1、C2 級別需求。目前其團隊內(nèi)部外包同學的代碼采納率已從最初的 18% 提升至 60% 以上。

4 未來展望

在金融行業(yè),通義靈碼服務了 90% 的上市商業(yè)銀行。如工商銀行、建設銀行、平安集團等。在汽車行業(yè),通義靈碼服務了超過 70% 的中國車企,如中國一汽、吉利、小鵬、極氪等,并在持續(xù)拓展寶馬等全球型車企。

面向未來,通義靈碼在產(chǎn)品層面將會持續(xù)演進。團隊計劃在 IDE 中結(jié)合用戶的本地工程代碼,自動生成結(jié)構(gòu)化的工程文檔,從而以顯性化的方式呈現(xiàn)項目的架構(gòu)決策與技術債務,幫助開發(fā)者更快理解新項目。在此基礎上,通義靈碼還將探索規(guī)格驅(qū)動與任務委派的場景,使 AI 從過去僅能處理分鐘級任務,逐步拓展到小時甚至數(shù)天級的復雜任務。這個過程中,AI 將先行生成便于人類閱讀和模型理解的設計文檔,開發(fā)者只需審閱和調(diào)整,再由 AI 制定開發(fā)計劃并交由背后的智能體異步執(zhí)行。與此同時,跨倉庫的全局代碼感知與多層次的代碼知識圖譜也將成為重點,幫助企業(yè)應對規(guī)模龐大、存量巨大的代碼倉庫。在開放性與擴展性方面,通義靈碼將深化 MCP 協(xié)議,探索 A2A 協(xié)議,并賦予企業(yè)開發(fā)者自定義 MCP 工具與提示詞的能力,使其能夠構(gòu)建個性化智能體,從而顯著提升針對企業(yè)私有數(shù)據(jù)和私有場景的 AI 輔助效果。

毫無疑問,Agentic LLM 的發(fā)展與應用場景的拓展將重塑研發(fā)流程。未來,AI 完成 80% 需求已成業(yè)界共識,而 IDE、終端與瀏覽器也會趨于融合,形成統(tǒng)一的研發(fā)入口,推動體系一體化與優(yōu)化。云端異步執(zhí)行將成為主流,開發(fā)者能夠一次性提交大量任務,由沙盒環(huán)境并行處理,最后統(tǒng)一驗證成果。與此同時,研發(fā)范式將逐步從“人主導、AI 輔助”過渡為“AI 主導、人把關”。盡管短期內(nèi) AI 仍無法獨立承擔交付結(jié)果的責任,但隨著上下文管理與驗證閉環(huán)的不斷完善,程序員將逐漸從具體的編碼勞動中解放出來,更專注于質(zhì)量把控與策略制定。在這樣的趨勢下,通義靈碼希望成為幫助開發(fā)者駕馭 AI 的核心武器,幫助每一位開發(fā)者成為真正具備廣闊橫向能力和深度縱向掌控力的“T 型”人才。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
男女之間,最高級的愛,是“生理性喜歡”?

男女之間,最高級的愛,是“生理性喜歡”?

加油丁小文
2025-10-02 06:40:06
國民黨主席選舉最新民調(diào)曝光!蔡正元驚:變化太大了

國民黨主席選舉最新民調(diào)曝光!蔡正元驚:變化太大了

新時光點滴
2025-10-03 06:36:28
霍伊倫:和德布勞內(nèi)共事之后終于知道哈蘭德為什么能進這么多球

霍伊倫:和德布勞內(nèi)共事之后終于知道哈蘭德為什么能進這么多球

MUREDS
2025-10-02 23:46:53
阿根廷見縫插針,賣給中國了20船大豆后,美國豆農(nóng)說出了心里話

阿根廷見縫插針,賣給中國了20船大豆后,美國豆農(nóng)說出了心里話

比利
2025-10-03 08:15:21
C羅稱沙特是第二故鄉(xiāng)!但利雅得卻展示梅西的巨幅廣告!

C羅稱沙特是第二故鄉(xiāng)!但利雅得卻展示梅西的巨幅廣告!

氧氣是個地鐵
2025-10-03 17:54:34
李湘在英國,吃的精致,穿的奢華,49歲活不出半點松弛感

李湘在英國,吃的精致,穿的奢華,49歲活不出半點松弛感

動物奇奇怪怪
2025-10-03 16:37:24
晚期肺癌跨越7年,我的血淚教訓提醒大家一定要避開這2點“坑”

晚期肺癌跨越7年,我的血淚教訓提醒大家一定要避開這2點“坑”

與癌共舞論壇
2025-09-19 17:48:07
那英觀看Lady Gaga英國演唱會,打扮很潮,狀態(tài)好不受老公風波影響

那英觀看Lady Gaga英國演唱會,打扮很潮,狀態(tài)好不受老公風波影響

陳意小可愛
2025-10-03 11:13:55
貴州花江峽谷大橋成國慶旅游頂流,游客太多出現(xiàn)滯留情況,當?shù)兀汗珓哲囈矌兔\送游客,建議錯峰出行

貴州花江峽谷大橋成國慶旅游頂流,游客太多出現(xiàn)滯留情況,當?shù)兀汗珓哲囈矌兔\送游客,建議錯峰出行

極目新聞
2025-10-03 12:53:30
WTT中國大滿貫:首個單打4強誕生!林詩棟4-0橫掃日本全國冠軍

WTT中國大滿貫:首個單打4強誕生!林詩棟4-0橫掃日本全國冠軍

全言作品
2025-10-03 11:40:46
對方哪個行為讓你終止相親了?網(wǎng)友:能當面說丑的,那是真丑

對方哪個行為讓你終止相親了?網(wǎng)友:能當面說丑的,那是真丑

解讀熱點事件
2025-09-29 00:15:05
那英現(xiàn)身LadyGaga倫敦演唱會

那英現(xiàn)身LadyGaga倫敦演唱會

極目新聞
2025-10-03 14:51:27
曝阿莫林已難逃下課 英名記:一切跡象都表明他將走人 索帥或救火

曝阿莫林已難逃下課 英名記:一切跡象都表明他將走人 索帥或救火

風過鄉(xiāng)
2025-10-03 06:51:25
刷牙可能影響壽命?醫(yī)生多次勸告:60歲以后,刷牙記住這幾點

刷牙可能影響壽命?醫(yī)生多次勸告:60歲以后,刷牙記住這幾點

小舟談歷史
2025-09-27 15:45:16
中國怪現(xiàn)象:喜歡把家里打掃得很干凈的人,往往會有這3種命運

中國怪現(xiàn)象:喜歡把家里打掃得很干凈的人,往往會有這3種命運

詩詞中國
2025-09-30 14:51:16
一棟豪宅,引出一樁長達數(shù)十年的豪門恩怨(上)

一棟豪宅,引出一樁長達數(shù)十年的豪門恩怨(上)

BenSir本色說
2025-10-02 22:04:34
毛主席有多明智?成立新疆生產(chǎn)建設兵團,七十年后誰都得服

毛主席有多明智?成立新疆生產(chǎn)建設兵團,七十年后誰都得服

wenwen123
2025-10-02 07:44:39
92年我被軍校退學,70歲奶奶蹣跚來接我,院長見到她驚呼:老班長!

92年我被軍校退學,70歲奶奶蹣跚來接我,院長見到她驚呼:老班長!

張道陵秘話
2025-09-26 16:34:36
亞冠二級積分榜:國安2輪1分小組墊底,河內(nèi)公安4分領跑

亞冠二級積分榜:國安2輪1分小組墊底,河內(nèi)公安4分領跑

雷速體育
2025-10-02 23:47:09
女子大鬧網(wǎng)球賽后續(xù):是兒子護照,一家人正臉曝光,老公身份被扒

女子大鬧網(wǎng)球賽后續(xù):是兒子護照,一家人正臉曝光,老公身份被扒

何慕白
2025-10-02 08:14:15
2025-10-03 21:27:00
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術社區(qū)媒體
11552文章數(shù) 51495關注度
往期回顧 全部

科技要聞

特斯拉Q3交付超預期,股價高開低走大跌

頭條要聞

媒體:美國"豆賤傷農(nóng)" 白宮開出兩張"空頭支票"

頭條要聞

媒體:美國"豆賤傷農(nóng)" 白宮開出兩張"空頭支票"

體育要聞

四冠中鋒,比所有人更早開始新賽季

娛樂要聞

繼王晶、向太后 周杰再曝潛規(guī)則

財經(jīng)要聞

國家出手!三大世界級城市群定了

汽車要聞

元戎啟行9月合作車型 交付量突破3萬臺

態(tài)度原創(chuàng)

本地
游戲
親子
藝術
旅游

本地新聞

讀港校想省錢,社恐輸在起跑線

清純女高大戰(zhàn)喪尸新作10月發(fā)售!激情打槍爽爆了

親子要聞

我到38歲才頓悟:寶寶見到特定親戚就哭嚎,這3個原因家長要警惕

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

無障礙瀏覽 進入關懷版 国产日本一区| 亚洲国产精品无码中文字视| 三年片观看免费| 伦埋琪琪电影院久久| 7777ssss免费观看| 久久国产精品免费一区| 丰满岳乱妇bd在线观看中字| 亚洲桃色在线| 亚洲av女人18毛片水真多| 影音先锋国产无码| 成人影视在线观看一区| 国产第一色| 无码精品国产一区二区| 中国熟女爱爱视频| 国产性色av免费观看| 亚洲尺码成人二区| 亚洲精品无码a√中文字幕网站| 国语自产偷拍精品视频偷| 五月丁香六月婷婷社区| 色yeye香蕉凹凸视频在线观看| 日本高清www无色夜在线视频| 超级乱婬video| 国产成人无码精品一区不卡| 国产成人性生活视频| 国内精品写真在线观看| 被黑人扒开双腿猛进入| 国产肉体XXXX裸体XXXXX| 三级理论中文字幕在线播放| www.色五月con| 成人A毛片免费观看网站| 亚洲精品色在线网站| 人人人人人爽| 色欲av干干| 小说区乱图片区| 奇米777免费视频| 精品久久少妇| 少妇av资源网| 国产12av| 亚洲免费高清专区一区二区| 特级毛片爽www免费版| 亚洲国产欧美一区二区好看电影 |