夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網易首頁 > 網易號 > 正文 申請入駐

從社區(qū)數(shù)據(jù)出發(fā),再看大模型開源開發(fā)生態(tài)全景與趨勢

0
分享至


作者 | 螞蟻開源

審校 | Luna

在一年前和我司 CTO 探討開源和技術勢態(tài)的時候,我們碰撞出來一個觀點——“作為一個開放、領先的科技公司,我們應該可以主動利用社區(qū)數(shù)據(jù),形成自己對技術趨勢的洞察”。由此,我們開始嘗試基于開源社區(qū)的行為數(shù)據(jù),對技術趨勢進行分析。并且,“來自于社區(qū),回饋到社區(qū)”,我們不僅會把這個分析到的全景圖和結論分享給社區(qū),也會把過程中的數(shù)據(jù)分享出來。

在上半年的 “527 螞蟻技術日”,我們發(fā)布的全景和趨勢 1.0 版本得到了很多關注和肯定。更重要的是,我們的同事和社區(qū)的朋友們在技術和架構判斷、技術選型、兼容性取舍,甚至是商業(yè)拓展選擇上都有參考全景圖所呈現(xiàn)的信息。當然,發(fā)布后的這三個多月,我們也收到很多意見、建議和疑問,同時社區(qū)也發(fā)生了很多變化,于是,在外灘大會上,2.0 的發(fā)布也如期而至了。

—— 王旭,螞蟻集團開源技術委員會副主席

3 個多月前,在一年一度的「527 螞蟻技術日」上,螞蟻開源聯(lián)合 Inclusion AI 首次發(fā)布了一份大模型開發(fā)生態(tài)下的開源項目全景圖,和一份對生態(tài)趨勢的洞察報告。我們希望能依據(jù)對社區(qū)的洞察,指出生態(tài)中哪些項目是最應該跟蹤、使用和參與的,反之亦然。在這一全景圖中,我們收錄了 19 個技術領域的 135 個社區(qū)核心項目,并結合社區(qū)數(shù)據(jù)洞察給出了 7 大趨勢預測。


(圖源:527 螞蟻技術日,螞蟻開源技術委員會副主席 - 王旭)

很高興看到,我們發(fā)布的全景和趨勢在過去這段時間得到了很多關注和肯定。當然,發(fā)布后的這三個多月,我們也收到很多意見、建議和疑問,比如對于上榜項目許可證選擇的爭議、開源項目入選標準的咨詢、以及在其他技術領域是否可以復刻相關研究方法的探討……100 天轉瞬即逝,開發(fā)者們在開源社區(qū)的每一次代碼提交、每一次項目引用,都在悄然勾勒著行業(yè)未來的走向,在這個仿若「真實世界的黑客松」的 AI 戰(zhàn)場里發(fā)生了很多變化。于是今天,在外灘大會上,我們誠意滿滿的「大模型開源開發(fā)全景與趨勢」2.0 版本如期而至。

在 2.0 版本的迭代中,我們對看生態(tài)全景的方法進行了更新,果然發(fā)現(xiàn)了更多之前未注意到的、熱度和活躍度都相當高的開源項目。當然,也有不少在數(shù)據(jù)拼殺中被拿掉的項目,從趨勢來看已經在走向「AI 墓園」的路上。再看生態(tài)與趨勢,有些領域和項目已經出局,有些領域和項目第一次進入視野,還有一些,正從早期的混沌中脫穎而出,在這個新興的生態(tài)位中站穩(wěn)了腳跟。

開源明星易主,群雄逐鹿今誰強?重器誰執(zhí)牛耳,我輩入局在何方?這 100 天中的變與不變,都將在下文的報告中為你一一呈現(xiàn)。

大模型開源開發(fā)生態(tài)全景


https://antoss-landscape.my.canva.site/

這張全景圖整體分為 AI Infra 和 AI Agent 兩大技術方向,基于我們對社區(qū)數(shù)據(jù)的洞察,收錄了114個在這個生態(tài)下最頂尖也最受關注的開源項目,這些項目分布在22個技術領域。

在數(shù)據(jù)洞察中,我們依舊大量使用了 OpenRank 評價體系,OpenRank 是一種基于社區(qū)協(xié)作關聯(lián)關系,計算生態(tài)中所有項目的相對影響力的算法,在我們后續(xù)的數(shù)據(jù)洞察中還將多次引用這一概念,在此特別說明。關于 OpenRank 評價體系的詳細介紹可以參閱其文檔:

https://open-digger.cn/docs/user_docs/metrics/openrank

不同于 1.0 版本的是,第一版中,我們是通過一些已知的種子項目(PyTorch、vLLM、LangChain),基于開發(fā)者的協(xié)作關系多跳搜索和它們緊密關聯(lián)的開源項目,并將其進行整理呈現(xiàn)。這種方式受到選取的種子項目、每跳返回的項目數(shù)量等因素影響,得到的結果具有很大程度的隨機性。而這一次,考慮到全景圖使用的評價方法 OpenRank 本身就是一種基于社區(qū)協(xié)作關聯(lián)關系的算法,我們直接拉取了當月 GitHub 全域項目的 OpenRank 排名,根據(jù)描述和標簽來從上往下標注出其中屬于大模型生態(tài)的項目,再逐步收斂。果然,這個過程中發(fā)現(xiàn)了更多之前未發(fā)現(xiàn)的、熱度和活躍度都相當高的項目們,讓我們可以自信的將參考標準提高至了當月 OpenRank 達到 50這個水平。

和百天前發(fā)布的大模型開源開發(fā)生態(tài)全景圖 1.0 版本相比,有 39 個項目是這次新進的,占據(jù)當前整體版面的 35%。而第一版中的 60 個項目被拿掉了,這背后最主要的原因是項目達不到OpenRank 大于 50這個新的標準,而其中有不少從趨勢來看,也確實已經在步入「AI 墓園」的路上,后面我們會詳細展開;也有部分項目,典型的如 ONNXRuntime,由于主要面向于傳統(tǒng)機器學習的訓練和推理,在大模型領域并沒有很緊密的結合而被拿掉。

算上那些被拿掉的在大模型開發(fā)生態(tài)的項目,這些項目從創(chuàng)建至今的“年齡”中位數(shù)是30 個月,也就是兩年半。他們年輕的程度正應和著這個領域迭代的速度 —— 高達 62% 的項目都是在 “GPT”時刻(2022 年 10 月)之后發(fā)布的,而其中有 12 個項目甚至是在今年才新近發(fā)起的。在如此嶄新的基礎上,這些項目獲得的關注度卻是上一個時代的開源項目們難以企及的:它們平均獲得的星標數(shù)量高達近 3 萬個。

這些項目吸引了全球366,521 位開發(fā)者的參與。在能夠統(tǒng)計到位置信息的開發(fā)者中,約24%來自美國,18%來自中國,其次是印度(8%)、德國(6%)和英國(5%)。無論是大模型的研發(fā)還是圍繞著模型的開源開發(fā)生態(tài),美國和中國都扮演著主導角色,這一格局也許會進一步影響全球技術的演進與合作。

從生態(tài)全景到技術趨勢

大模型開發(fā)生態(tài)關鍵詞


把上述大模型開源開發(fā)生態(tài)全景圖中所有的開源項目在 GitHub 首頁填寫的 description 和 topics 中的內容作為文本提取關鍵詞,并在提取過程中做一些基本的規(guī)則化處理:大小寫和單復數(shù)合并(MCP & mcp、agents & agent 等),去除常用詞(a、an、and 等)。我們最終得到一張這樣的詞云圖,圖中一共有 100 個單詞,總結了當下大模型開發(fā)生態(tài)的技術關鍵詞。其中,最高頻出現(xiàn)的詞語為

  1. AI:126 次

  2. LLM:98 次

  3. Agent:81 次

  4. Data:79 次

  5. Learning:44 次

  6. Search:36 次

  7. Model:36 次

  8. OpenAI:35 次

  9. Framework:32 次

  10. Python:30 次

  11. MCP:29 次


最活躍的開源項目 Top 10

我們梳理了 OpenRank Top 10 的開源項目。


注:以上數(shù)據(jù)截止 2025 年 8 月 1 日

頭部的這 10 個項目,代表了當下大模型開發(fā)生態(tài)里最活躍、最具代表性的社區(qū)力量。它們幾乎覆蓋了模型生態(tài)的完整鏈路:從底層的算力和框架 PyTorch、Ray,模型訓練的數(shù)據(jù)處理管線 Airflow,模型服務的性能基座 vLLM、SGLang、TensorRT-LLM,到 Agent 應用調度平臺 Dify、n8n,直接面向開發(fā)者與終端用戶的 Gemini CLI、Cherry Studio。

從編程語言來看,Python主導基礎設施,TypeScript統(tǒng)治應用層,成為支撐整個生態(tài)體系的核心語言。

從背后的發(fā)起力量來看,我們看到了來自學術界的創(chuàng)新迸發(fā)出的高影響力:vLLM、SGLang、Ray 都生長于 Ion Stoica 執(zhí)掌下的伯克利實驗室;Meta、Google、NVIDIA 這些大廠掌控或布局在一些關鍵節(jié)點之上,但在靠近應用層的位置,Dify、Cherry Studio 這樣的獨立團隊也能夠迅速創(chuàng)新,通過提供用戶友好的工具,形成快速增長點。

如何定義這個時代的開源?

熟悉圍繞開源許可證的一些前塵往事的開源朋友,在看到剛剛這 10 個頂尖的項目所采用的許可證時,也許心中已經警鈴大作。是的,雖然多數(shù)大模型開發(fā)生態(tài)的項目仍然采用的是 Apache 2.0 或 MIT 寬松許可,但仍然有不少值得關注的特別案例:

  • Dify 的 Open Source License基于 Apache 2.0 許可的文本做了修改,增加了兩個附加條款:

    • 限制未經許可的多租戶環(huán)境運營;

    • 使用 Dify 前端時,不得移除或修改 LOGO 和版權信息。

  • n8n 的 Sustainable Use License 是 n8n 基于 fair-code 主張,新提出的一種許可,在允許免費使用、修改、分發(fā)的基礎上,做了三點限制:

    • 僅限于在企業(yè)內部,或者非商業(yè)、個人用途下使用或修改;

    • 在分發(fā)時,必須基于非商業(yè)目的免費提供;

    • 不能更改軟件中的許可、版權或作者信息。

  • Cherry Studio 的 User-Segmented Dual Licensing 根據(jù)用戶所在組織的規(guī)模做分段,提出了一種雙許可限制,不同規(guī)模組織下的用戶使用不同的許可:

  • 如果是個人用戶或者所在組織是 10 人及以下,采用 AGPLv3,這也是一種 copyleft 協(xié)議,用戶可以免費使用,但如果做了修改和分發(fā),必須同樣開源并提供完整的源代碼;

  • 超過 10 人的情況,則需要聯(lián)系 Cherry Studio 的團隊進行商業(yè)授權。

可以看出,上述許可證的條款多半是出于保護商業(yè)利益的考慮,由于帶有對部分用戶的限制屬性,自然難以獲得 OSI 的批準。從開源原教旨主義的角度來看,它們甚至未必算得上真正的開源項目。

在當下,「開源」的定義愈發(fā)模糊:不僅“開源大模型”與“開放權重大模型”之間存在諸多爭議,傳統(tǒng)軟件的開源也仿佛在霧里看花。與此同時,GitHub 不再只是單純的代碼托管、協(xié)作和分發(fā)平臺,而是成為這一時代的運營陣地:許多連源代碼都閉源的產品(如 Cursor、Claude-Code 等)依舊在 GitHub 上占有一席之地,讓看客們常常擁有一種它們也是開源項目的錯覺。這些倉庫無一例外擁有一騎絕塵的 Star 數(shù)量,但它承擔的真正功能也許只是作為廠商收集用戶反饋的入口。

技術領域的發(fā)展趨勢

從今年的技術領域發(fā)展趨勢來看,AI Coding、Model ServingLLMOps整體處于增長的態(tài)勢,尤其是 AI Coding 的增長斜率在近兩個月還在持續(xù)攀升,再次印證了 AI 研發(fā)提效是 2025 年真正被驗證和落地的應用場景;Agent FrameworkAI Data是下跌比較明顯的兩個領域,Agent 開發(fā)框架的下跌和曾經在頭部的 LangChain、LlamaIndex、AutoGen 等項目在社區(qū)投入上的顯著收縮有很大關系,而 AI Data 在向量存儲、數(shù)據(jù)集成及數(shù)據(jù)治理等維度上,也表現(xiàn)出在平穩(wěn)中逐步下降的趨勢。



邊緣地帶的項目們

除了上述提到的「明星項目」,我們同樣梳理了部分沒有出現(xiàn)在全景圖上,但是依舊被認為是很有潛力的開源項目們,我們會持續(xù)保持關注。


大模型生態(tài)下全球開發(fā)者分布畫像

從 1.0 到 2.0,兩次發(fā)布的全景圖涉及到的一共 170 多個開源項目中,在其中有過 Issue 或 PR 相關行為的 GitHub 賬號高達36萬,這個數(shù)字一定程度上體現(xiàn)了當下大模型生態(tài)的開發(fā)者規(guī)模。我們識別到其中124,351位在個人頁面填寫了可以被正確解析位置信息的開發(fā)者,并統(tǒng)計了他們的國家分布和對應的在大模型開發(fā)生態(tài)中的貢獻度分布。圖和表中展示了頭部國家的開發(fā)者貢獻度總和、整體貢獻度占比和識別到的開發(fā)者數(shù)量,其中,將開發(fā)者數(shù)量乘以三的話,可以大致認為是估算出的該國家大模型生態(tài)開發(fā)者的總量。

總體來看,中美引領了 AI 領域的開源貢獻。美國以 37.4% 的貢獻領先,中國以 18.7% 位居第二,這兩個國家的貢獻總比例達到 55% 以上,而排名第三的德國已降低至 6.5%。


注:開發(fā)者貢獻度也使用 OpenRank 評價體系計算,是一種項目內基于 Issue/PR 協(xié)作網絡的計算方式。

大模型開源開發(fā)生態(tài)整體貢獻度 Top 10 國家分布


不同技術領域下的貢獻度 Top 3 國家分布


分技術領域來看,AI Infra 開發(fā)者 56,206 人,AI Agent 開發(fā)者 56,580 人,AI Data 開發(fā)者 27,018 人,這個總和與 12 萬開發(fā)者的總人數(shù)相差不多,說明不同領域下的重復開發(fā)者比例不高,大多數(shù)人只參與一個技術領域下的項目。

從三大技術領域下的國家貢獻度分布來看,整體以中美為主導,在AI Infra 領域中美的領先地位更加明顯,兩國在基礎設施領域的貢獻度達到60%以上,排名第三的德國不足 4%,可見在基礎設施領域中美有較強的控制力;AI Data 領域全球的參與情況更加平均,中美的總體貢獻占比僅 46.5%,歐洲各國,如波蘭、挪威、法國、荷蘭等國的參與度均進入全球前十;AI Agent 領域中美差距大幅縮小,貢獻度占比分別為 24.6% 和 21.5%,中國開發(fā)者在 Agent 層面相較其他領域的投入更多。

從 1.0 到 2.0,100 天中的變與不變

和 3 個月前的第一個版本相比,除了最明顯的項目更替之外,我們也對整體的生態(tài)結構和領域做了合并、拆分和描述的調整,例如,將籠統(tǒng)的 “Infrastructure” 和 “Application” 的一級分類描述修改為更加具體的、也已經在逐漸發(fā)展出清晰技術邊界的“AI Infra”、“AI Agent” 和 “AI Data”。技術仍在高速的發(fā)展,尤其在 Agent 領域,項目之間的定位和邊界必然會隨著技術發(fā)展而動態(tài)演化,我們可以通過 Landscape 的變化,觀察到一個新的技術生態(tài)從混亂逐漸歸為有序的過程。

哪些領域和項目出局了


無論 Manus、Perplexity 這些商業(yè)產品發(fā)展和普及程度如何,在開源生態(tài)里,相關領域下的開源項目都并沒有得到很好的發(fā)展。

出局的項目中,有不少可能正在步入“AI 墓園”的路上 ——


  • 3 月份 Manus 一時爆火,多智能體框架 MetaGPT 和 Camel AI 緊隨其后推出了開源版本的 OpenManus 和 OWL,但也僅僅只是曇花一現(xiàn);

  • NextChat 是最早一批流行的大模型客戶端應用的項目,但后續(xù)的迭代和新特性接入速度遠遠比不上 Cherry Studio、LobeChat 等后起之秀,漸漸無人維護;

  • Bolt.new 作為流行的全棧 web 開發(fā)工具,以開放模板的方式被開源出來,且很少合入外部的代碼,因此項目開發(fā)者也在大幅減少。


  • 一度非常流行的兩個端側模型部署的工具:MLC-LLM 和 GPT4All,前者綁定了自家的推理引擎 MLCEngine,后者和 Ollama 同樣使用了端側推理引擎 llama.cpp,然而最終這個生態(tài)位還是被 Ollama 拔得頭籌;

  • FastChat 是 LMSYS 在模型訓練、推理和評測等環(huán)節(jié)的早期嘗試,如今他們已經有了更成功的 SGLang 和 LMArena 平臺,而更早出現(xiàn)的 TGI,由于性能落后于 vLLM 和 SGLang 等引擎,也漸漸被 HuggingFace 放棄。

昔日巨星 TensorFlow 的十年消亡之路

2015 年 11 月,谷歌將 TensorFlow 以 Apache 2.0 開源,很快發(fā)展為深度學習領域的主導框架。從誕生之初,TensorFlow 就為生產環(huán)境而設計,這與后來發(fā)布的 PyTorch 采取的 “Pythonic”和“研究人員優(yōu)先” 構建理念截然不同。作為開發(fā)下一代模型的創(chuàng)新者,研究人員傾向于選擇 PyTorch,因為它靈活、易用。

2019 年 10 月,TensorFlow 發(fā)布了 2.0 版本,借鑒了 PyTorch 的核心理念,簡化了模型構建。然而,這種技術上的合理轉變卻付出了巨大的代價:由于缺乏無縫的向后兼容性,以及復雜的遷移工具,許多已經轉向 PyTorch 的開發(fā)者不愿意承擔遷移遺留的 1.x 代碼和學習新 API 的負擔,從而對 PyTorch 的忠誠度更加堅定。正是在這個時間點,PyTorch 社區(qū)正式超過了 TensorFlow,兩個項目也從此走向了分化的發(fā)展曲線。

哪些領域和項目第一次進入視野


領域的變化主要體現(xiàn)在 Agent 層面,以 AI Coding、Chatbot 和開發(fā)框架為主的領域出現(xiàn)了不少新的高熱度項目。在其中,還發(fā)現(xiàn)了兩個和具身智能應用場景相關有趣項目:

  • 小智 AI 聊天機器人:構建一個基于ESP32 微控制器的 AI 語音交互設備——“AI 小智”,讓大語言模型(如 Qwen、DeepSeek)能運行在硬件中。

  • Genesis:面向通用機器人與具身的物理仿真平臺,用途包括機器人學習、物理模擬、渲染與數(shù)據(jù)生成,具備極高的科研與應用價值。

Infra 層面在領域的變化主要體現(xiàn)在對“模型運維”這一概念的整合,我們將原先涉及到模型評測和傳統(tǒng)機器學習運維的領域合并在一起,成為縱穿模型全生命周期的LLMOps,它本質上是MLOps 在大語言模型時代的延伸,解決的是如何在真實生產環(huán)境下高效、可靠、可控地使用 LLM。當前 LLMOps 領域下的這些項目覆蓋了模型與應用的可觀測性(Langfuse、phoenix)、模型評測與基準測試(Promptfoo)、Agentic Workflow 的運行時環(huán)境管理(1Panel、dagger)等環(huán)節(jié)。

新進項目中的最活躍開源項目 Top 10


注:以上數(shù)據(jù)截止 2025 年 8 月 1 日

其中,終端 AI 編程助手 Gemini CLI 和模型客戶端交互聊天工具 Cherry Studio 還在本次大模型全景圖的所有項目中位列第 3 和第 7。

沒變的是:此消彼長,前浪后浪,增長與衰落,一如既往


全景圖上的「The New Wave」


注:以上數(shù)據(jù)截止 2025 年 8 月 1 日

在這些 2025 發(fā)起的新勢力項目中,OpenCode 來自于創(chuàng)業(yè)公司Anomaly Innovations,并且在發(fā)起之日就定位為是Claude Code 的 100% 開源替代。在剩下的幾個項目中,我們可以看出OpenAI、Google、NVIDIA這些大廠通過開源開放的工具鏈來建立圍繞其閉源模型或硬件生態(tài)的護城河的野心:Dynamo在支持 vLLM、SGLang 和自家的 TensorRT-LLM 等主流推理后端的同時,也完美適配 NVIDIA GPU 的硬件特性,在成為高吞吐、多模型部署的行業(yè)級工具之后,會進一步促使企業(yè)傾向選擇 NVIDIA 硬件以最大化性能收益。

OpenAI 和 Google通過在應用層布局開源工具鏈,把開發(fā)者逐漸鎖定在各自閉源模型的生態(tài)之中的野心則更加明顯:adk-python 和 openai-agents-python 是專為其各自的閉源模型封裝的 Agent 系統(tǒng)構建工具,Google 甚至做了云服務的生態(tài)優(yōu)化,支持在 Google Cloud 上優(yōu)先部署編排好的智能體;而 Codex CLI 和 Gemini CLI 同樣效仿了 Claude Code 這種在終端實現(xiàn)高度自治的代碼理解與修改的形態(tài),把大模型直接帶到開發(fā)者最熟悉的命令行里,一個深度綁定 Gemini,一個兼容 OpenAI 并開放 MCP 接口。

在接下來的一段時間,我們可以拭目以待,看看這些項目是否達到了它們被寄予的戰(zhàn)略使命。

全景圖上的「Up and Down」


上述十個項目,分別在近半年內 OpenRank 的增長和下降絕對值與比例都位列前茅,圖上我們展示的是他們從 2 月到 8 月的 OpenRank 絕對值變化。

增長較明顯的五個項目,分別是:NVIDIA 推出的企業(yè)級推理引擎后端TensorRT-LLM和多租戶推理編排工具Dynamo、字節(jié)推出 LLM 強化學習框架verl、對標 Claude Code 的開源命令行 Coding 工具OpenCode、面向 TypeScript/JavaScript 開發(fā)者的 Agent 編排框架Mastra。

下降較明顯的五個項目,有四個都是 Agent 編排框架:Eliza、LangChain、LlamaIndex 和 AutoGen。剩下的一個項目,是 OpenAI 在 4 月新推出的命令行 Coding 工具Codex,相較于 Gemini CLI 的快速增長,它的起步看起來有一些出師不利。

專題洞察:技術趨勢下的項目故事


第一篇:Model Serving




模型服務的本質,是把訓練完成的大模型以一種可被應用層穩(wěn)定調用的方式運行起來。它需要解決的不僅僅是“能不能跑”,更是“能不能高效、可控地跑”。在場景上,大規(guī)模在線推理是模型服務的主戰(zhàn)場,數(shù)據(jù)中心級的部署支撐了數(shù)以千萬計的請求;與此同時,企業(yè)內部也常常出于安全與合規(guī)的考量,搭建私有化的推理服務;而在端側,像 llama.cpp 或 Ollama 這樣的項目,讓模型能在個人電腦、手機甚至嵌入式設備上運行,滿足離線和隱私需求;還有越來越多的混合模式,部分處理在端側完成,復雜推理則交給集群完成。

2023 年以來的快速演進已經讓模型服務成為連接 AI 基礎設施與應用層的關鍵中間件。一方面,vLLM、SGLang等代表性的推理引擎項目不斷在高吞吐、長上下文、多用戶并發(fā)的場景里打磨出極致性能,另一方面,Ollama、llama.cpp等則推動了本地可用性和生態(tài)擴散,讓大模型“跑在你手邊”成為現(xiàn)實。同時,NVIDIA Dynamo這樣的編排框架正在把單機高效推理擴展到多節(jié)點、多模型、多租戶的集群層面。


第二篇:AI Coding


從最初的單一代碼補全功能發(fā)展到如今的多模態(tài)支持、上下文感知與協(xié)同工作流,AI Coding 的核心技術在不斷進化。CLI 工具如Gemini CLIOpenCode利用 AI 模型的強大推理能力,將開發(fā)者的需求轉化為更高效的編程體驗;與此同時,插件形態(tài)的工具,如ClineContinue,通過無縫集成到現(xiàn)有開發(fā)平臺中,讓開發(fā)者在保持現(xiàn)有工作流的基礎上享受 AI 提供的各種智能服務,極大地提升了開發(fā)效率。

GooseOpenHands等協(xié)作開發(fā)平臺,將 AI 能力融入團隊項目管理、代碼審查、任務分配等各個環(huán)節(jié),推動了跨地域、跨職能的團隊協(xié)作。而Claude Code、CursorWindsurf等閉源的商業(yè)化項目,也吸引了大量個人開發(fā)者和企業(yè)客戶。隨著市場需求的提升,AI Coding 的商業(yè)化潛力巨大,付費訂閱、SaaS 服務、增值功能等將成為未來的主要盈利模式。


第三篇:AI Agent

人們常說 2025 年會是 AI 應用真正落地的一年。最初,是 LangChain、LlamaIndex 等框架提供了基礎的 Agent 搭建方式;隨后,開源生態(tài)中出現(xiàn)了專注于不同環(huán)節(jié)的項目,如Mem0(記憶)、Browser-Use(工具調用)、Dify(工作流執(zhí)行)、LobeChat(交互界面),開源社區(qū)正在構建完整的拼圖,為更強大的自治 AI 系統(tǒng)打下基礎。每個項目聚焦的方向不同,但目標一致:讓 AI 更加智能地理解、記憶、行動和交互,從而真正解放生產力。


接下來一段時間里,我們會陸續(xù)放送圍繞著上述熱門的技術領域和代表性的開源項目們的專題洞察,敬請期待!

番外篇:大模型生態(tài)全景


在開源開發(fā)生態(tài)之外,大模型也在進行著高頻的發(fā)布。雖然目前還沒有很好的數(shù)據(jù)渠道來幫助我們理解大模型社區(qū),但畢竟它們處在注意力焦點的中心。因此,我們也精心梳理了 2025 年 1 月至今國內外主流廠商的大模型發(fā)布時間線,包含開放參數(shù)的模型和閉源模型。這張全景圖內也標注了每個模型的參數(shù)、模態(tài)等關鍵信息,來一定程度上幫助理解當下各家廠商的白熱化競爭究竟是在哪些方向上展開的。以此,我們得出了一些有趣的觀察,比如:

  • 中美開源與閉源的路線分化:從這張圖上,能夠更直觀地感受到中國開源大模型的百花齊放,而國外的頂尖模型廠商依舊走的是閉源路線。在早期幾乎憑借一己之力對抗模型封閉生態(tài)的 Meta(也使得不少在全景圖上的開源項目名字中都帶有“l(fā)lama” 的元素),似乎也正在考慮向閉源轉型:7 月 31 日,Meta CEO 扎克伯格發(fā)布了一封名為 「Personal Superintelligence」的公開信,表達對超級智能個體的野心的同時,還說了這樣一句話:“我們會更謹慎的選擇開源什么"。Meta 在今年的 AI 戰(zhàn)略發(fā)展確實不盡人意,各大評測榜單上已經看不到 Llama 系列的身影,而四月份發(fā)布的 Llama 4 也陷入了“效果差”甚至是“造假”的爭議。

  • MoE 架構下模型參數(shù)在規(guī)?;l(fā)展:今年發(fā)布的 DeepSeek、Qwen、Kimi 等旗艦模型全面采用了專家混合(Mixture of Experts,MoE)這種神經網絡架構,它最樸素的原理為“稀疏激活”:雖然模型總參數(shù)可以非常龐大,但每次推理時只用其中很小一部分。在這種架構下,我們看到了 K2、Claude Opus、o3 等達到了萬億參數(shù)規(guī)模的龐大模型在今年陸續(xù)發(fā)布。參數(shù)規(guī)模的增加能夠有效提升模型在任務上的表現(xiàn),但同時也對訓練和推理時的計算與內存帶來了進一步的挑戰(zhàn)。

  • 通過強化學習提升模型 Reasoning 能力:DeepSeek R1 通過將強化學習后訓的過程與大規(guī)模預訓練結合,顯著提升了模型性能,在自動化推理、復雜決策和知識推斷等任務上,比傳統(tǒng)的 LLM 提高了多個維度的能力,Reasoning 能力也成為了今年重磅模型在發(fā)布時的時尚單品。由于模型在推理時普遍需要更久的時間和更多的 token,Qwen、Claude、Gemini 等系列模型也逐步整合了“混合推理”的能力:如同人類大腦有快速反應和深度思考兩種模式,用戶也可以基于需求場景,讓模型在不同模式下給出反應。

  • 多模態(tài)模型走向主流:當前市面上的多模態(tài)模型支持的能力以語言、圖像和語音的交互為主,也有一些垂類的視覺模型和語音模型在今年發(fā)布。而在開發(fā)生態(tài)中,我們也發(fā)現(xiàn)了圍繞著語音模態(tài)的豐富工具鏈,如 Pipecat、LiveKit Agents 和 CosyVoice。在 2024 年年初,OpenAI 發(fā)布的 Sora 演示視頻驚艷世界,有關世界模型和通用人工智能似乎已經不再停留于暢想,而站在 2025 這個時間節(jié)點,無論是視頻模態(tài)的成熟還是 AGI 的成功,都仍舊有一段路要走。

  • 基于主觀和客觀的不同模型評價模式:對模型的評價和排名,整體可以分為以下模式:

    • 基于人類主觀投票的評測,代表平臺:Design Arena,LMArena;

    • 基于客觀標準答案的評測,下表梳理了最近兩個月新模型發(fā)布時主要提及的性能對比評測集,可以作為當下最頂尖也最前沿的評測集的代表:


  • 基于各家模型調用數(shù)據(jù)的評測也正在興起:以 OpenRouter 為代表的大模型聚合 API 調用的網關平臺,天然能夠拿到各家模型的調用數(shù)據(jù),利用這一得天獨厚的優(yōu)勢,也順便做起了模型評價的副業(yè)?;诟骷夷P兔恐鼙徽{用的情況統(tǒng)計得到的大模型排行榜,何嘗不是一種用戶“用腳投票”之后的結果呢。除 OpenRouter 外,還有一個上榜全景圖的開源 API 網關項目:LiteLLM。這是一個 2023 年興起的開源項目,同樣支持上百種大模型的 API 調用,OpenRank 活躍度近半年仍在不斷攀升,最近一個月高達 251。在高用戶量和高活躍度的基礎上,LiteLLM 支持模型調用的評測也許也只是時間的問題。

致謝

本篇報告從螞蟻作為一家科技企業(yè)的視角出發(fā),深度使用到了 X-lab 實驗室的 OpenRank 評價指標,期間也咨詢了很多來自螞蟻內部的技術專家和開源社區(qū)的開發(fā)者們,非常感謝大家的寶貴觀點。

此外,我們特別感謝全景圖及本文創(chuàng)作過程中參與共創(chuàng)的社區(qū)伙伴們,包括:CSDN、InfoQ、機器之心、量子位、開源社等,以及趙生宇、陳陽、姜寧、唐小引、褚杏娟、周笑寒、周微、金磊等行業(yè)資深專家的輸入。相關工作我們已經開放在 GitHub 上,歡迎大家共同協(xié)作,一起貢獻高質量的生態(tài)洞察。

接下來一段時間里,我們會陸續(xù)放送圍繞著上述熱門的技術領域和代表性的開源項目們的專題洞察,敬請期待!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
為什么全球都在效仿日本的校餐模式

為什么全球都在效仿日本的校餐模式

日本物語
2025-09-29 22:06:23
自由職業(yè)也要開始交稅了

自由職業(yè)也要開始交稅了

譚談投研
2025-09-30 19:05:04
韓國總統(tǒng)急了,再不生就要滅絕了!這個國家真的已經生不出小孩了

韓國總統(tǒng)急了,再不生就要滅絕了!這個國家真的已經生不出小孩了

寒士之言本尊
2025-09-29 22:34:47
紫牛頭條 | 智能馬桶突噴開水燙傷隱私部位,當事人:已與品牌方協(xié)商和解,具體原因待檢修

紫牛頭條 | 智能馬桶突噴開水燙傷隱私部位,當事人:已與品牌方協(xié)商和解,具體原因待檢修

揚子晚報
2025-09-30 21:23:48
55歲周杰再登舞臺!自曝當年被拍著桌子罵:“不要以為你很厲害,我讓誰演誰就火”

55歲周杰再登舞臺!自曝當年被拍著桌子罵:“不要以為你很厲害,我讓誰演誰就火”

魯中晨報
2025-09-29 14:31:15
俄軍傷亡突破111萬人,又有一個營集體投降

俄軍傷亡突破111萬人,又有一個營集體投降

史政先鋒
2025-09-30 18:46:42
從失蹤到被捕:21歲中國女子在埃及卷入跨國詐騙案

從失蹤到被捕:21歲中國女子在埃及卷入跨國詐騙案

新民周刊
2025-09-30 17:20:12
男子稱“女友買到我5年的開房記錄”:她通過一家網店查到,收費12800元,還能查同住人信息;電商平臺客服回應

男子稱“女友買到我5年的開房記錄”:她通過一家網店查到,收費12800元,還能查同住人信息;電商平臺客服回應

極目新聞
2025-09-30 16:32:34
點球被取消,0-1!歐冠爆大冷:11億豪門轟然倒下,3天雙線2連敗

點球被取消,0-1!歐冠爆大冷:11億豪門轟然倒下,3天雙線2連敗

侃球熊弟
2025-10-01 04:02:22
13塊銀磚運輸時丟失,價值超百萬,貨車司機:懸賞26萬,20多天了仍無進展,沒保險,物流公司讓我們賠

13塊銀磚運輸時丟失,價值超百萬,貨車司機:懸賞26萬,20多天了仍無進展,沒保險,物流公司讓我們賠

都市快報橙柿互動
2025-10-01 00:23:15
大灣區(qū)這一夜,丟臉丟大了,“混子”歌手終究現(xiàn)出了原形

大灣區(qū)這一夜,丟臉丟大了,“混子”歌手終究現(xiàn)出了原形

皮蛋兒電影
2025-09-30 21:03:38
王思聰深夜更ins曝瓜,點名某網紅是包周20W的外圍女,過程很抓馬

王思聰深夜更ins曝瓜,點名某網紅是包周20W的外圍女,過程很抓馬

奇思妙想草葉君
2025-09-30 23:31:42
新能源汽車購置稅優(yōu)惠延續(xù)至2027年

新能源汽車購置稅優(yōu)惠延續(xù)至2027年

大象新聞
2025-09-30 16:31:06
讓幼兒園的孩子背“炸藥包”,這樣的園長腦子里得進了多少屎?

讓幼兒園的孩子背“炸藥包”,這樣的園長腦子里得進了多少屎?

李老逵亂擺龍門陣
2025-09-30 08:20:25
你們聞過最臭的東西是什么?網友:婦科病的味道吧

你們聞過最臭的東西是什么?網友:婦科病的味道吧

帶你感受人間冷暖
2025-09-28 00:15:07
反轉!埃及失聯(lián)的21歲中國女孩居然是電詐成員,連閨蜜都不放過

反轉!埃及失聯(lián)的21歲中國女孩居然是電詐成員,連閨蜜都不放過

千潯觀點
2025-09-30 16:11:20
基礎研究突破!瑞典發(fā)明自驅動磁鐵,或踩下能源危機急剎車!

基礎研究突破!瑞典發(fā)明自驅動磁鐵,或踩下能源危機急剎車!

徐德文科學頻道
2025-09-30 19:06:57
55歲黃磊還能活多久?睡前戴呼吸機,每天一把藥,曾被曝有心臟病

55歲黃磊還能活多久?睡前戴呼吸機,每天一把藥,曾被曝有心臟病

涵豆說娛
2025-09-29 17:19:11
中國又一次讓世界震驚!發(fā)現(xiàn)2800公里超大型鋰礦帶!

中國又一次讓世界震驚!發(fā)現(xiàn)2800公里超大型鋰礦帶!

李榮茂
2025-09-30 18:40:38
央視直播10月1日中國大滿貫賽程,王楚欽三線作戰(zhàn)

央視直播10月1日中國大滿貫賽程,王楚欽三線作戰(zhàn)

乒乓球球
2025-09-30 23:15:38
2025-10-01 08:12:49
InfoQ incentive-icons
InfoQ
有內容的技術社區(qū)媒體
11551文章數(shù) 51493關注度
往期回顧 全部

科技要聞

宇樹回應機器人安全漏洞:已完成大部分修復

頭條要聞

美軍將領大會召開 美防長提出10項新指令

頭條要聞

美軍將領大會召開 美防長提出10項新指令

體育要聞

詹姆斯:愿為東契奇調整打法 失去熱愛時就會退役

娛樂要聞

和張藝謀離婚后,前妻肖華現(xiàn)狀

財經要聞

洽洽凈利暴跌73% 經銷商遭壓貨被迫清盤

汽車要聞

升級端到端高快NOA 上汽大眾Pro家族2026款上市

態(tài)度原創(chuàng)

房產
健康
游戲
手機
公開課

房產要聞

買房必看!十一廣州置業(yè)攻略,熱門項目優(yōu)惠提前曝光!

內分泌科專家破解身高八大謠言

《街頭霸王6》新角色“深紅毒蛇”TGS試玩報告:好難、好帥、好耗氣"/> 主站 商城 論壇 自運營 登錄 注冊 《街頭霸王6》新角色“深紅毒蛇”TGS試...

手機要聞

消息稱榮耀正測試1.5K 165Hz超高刷直屏新機,還有超大電池

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 亚洲成人在线xxx| 69AV日本| 日韩精品无码一区二区三区免费| 韩国三级丰满少妇高潮| 国产传媒无码| 无码专区夜夜躁夜夜添夜夜狠| 亚洲日韩色婷婷| 久久久九九九色| 国产做受XXXXX| VR 资源在线观看| av色国产色拍| 亚洲成人小说网| 在线无码视频| 国产丰满老熟女重口对白| 无码播放在线| 色婷婷aV一区二区三区麻豆综合| 亚洲偷自拍国综合| 小婷又软又嫩又紧水又多的视频| 娇小性XXXX性XXX开放69| 西西大胆午夜人体视频| 精品国产乱淫一二三| 狠狠躁日日躁夜夜躁东南亚| 亚洲av无码之国产精品网址蜜芽| 天干夜天天夜天干天2004年 | 精品人妻伦九区久久69| 国精精品一区二区三区有限公司| 中文无码av在线| 另类欧美日韩| 国产精品久久久久无码AV按摩| 亚洲无码77777| 又爽又黄又无遮挡的视频| www.亚洲无码.| 久久久成人剧场| 亚洲乱码日产精品一二三| 黑人大茎4P白妞| 任你躁国产在线播放| 国产999久久高清免费观看| 国产欧美在线| 91人人妻人人澡人人爽秒播| 亚洲免费观看在线美女视频| 午夜av在线免费观看|