阿里云重磅升級全棧AI體系，一文看懂云棲大會技術(shù)發(fā)布

2025-09-24 12:47:03　來源: 電科技網(wǎng)

江蘇舉報

分享至

9月24日，2025云棲大會，阿里巴巴集團CEO吳泳銘宣布阿里云重磅升級全棧AI體系，實現(xiàn)從AI大模型到AI基礎設施的技術(shù)更新。面向新一輪智能革命，阿里云將全力打造成為全棧人工智能服務商。

AI時代，大模型將是下一代操作系統(tǒng)，超級AI云是下一代計算機。吳泳銘認為，超級AI云需要超大規(guī)模的基礎設施和全棧的技術(shù)積累，未來，全世界可能只會有5-6個超級云計算平臺。阿里云將持續(xù)加大投入，迎接超級人工智能時代到來。

大模型七連發(fā)，Qwen3-Max性能躋身全球前三，超過GPT5

圍繞大模型和AI云，2025云棲大會現(xiàn)場，阿里云智能首席技術(shù)官周靖人發(fā)布了多項重磅技術(shù)更新。通義大模型7連發(fā)，在模型智能水平、Agent工具調(diào)用和Coding能力、深度推理、多模態(tài)等方面實現(xiàn)多項突破。

2025云棲大會，阿里云CTO周靖人發(fā)布多項重磅技術(shù)更新

在大語言模型中，阿里通義旗艦模型Qwen3-Max全新亮相，性能超過GPT5、Claude Opus 4等，躋身全球前三。Qwen3-Max包括指令（Instruct）和推理（Thinking）兩大版本，其預覽版已在 Chatbot Arena 排行榜上位列第三，正式版性能可望再度實現(xiàn)突破。

Qwen3-Max是通義千問家族中最大、最強的基礎模型，預訓練數(shù)據(jù)量達36T tokens，總參數(shù)超過萬億，擁有極強的Coding編程能力和Agent工具調(diào)用能力。在大模型用Coding解決真實世界問題的SWE-Bench Verified測試中，Instruct版本斬獲69.6分，位列全球第一梯隊；在聚焦Agent工具調(diào)用能力的Tau2-Bench測試中，Qwen3-Max取得突破性的74.8分，超過Claude Opus4和DeepSeek-V3.1。Qwen3-Max推理模型也展現(xiàn)出非凡性能，結(jié)合工具調(diào)用和并行推理技術(shù)，其推理能力創(chuàng)下新高，尤其在聚焦數(shù)學推理的AIME 25和HMMT測試中，均達到突破性的滿分100分，為國內(nèi)首次。

下一代基礎模型架構(gòu)Qwen3-Next及系列模型正式發(fā)布，模型總參數(shù)80B僅激活 3B ，性能即可媲美千問3旗艦版235B模型，實現(xiàn)模型計算效率的重大突破。Qwen3-Next針對大模型在上下文長度和總參數(shù)兩方面不斷擴展（Scaling）的未來趨勢而設計，創(chuàng)新改進采用了混合注意力機制、高稀疏度 MoE 結(jié)構(gòu)、多 token 預測（MTP）機制等核心技術(shù)，模型訓練成本較密集模型Qwen3-32B大降超90%，長文本推理吞吐量提升10倍以上，為未來大模型的訓練和推理的效率設立了全新標準。

在專項模型方面，千問編程模型Qwen3-Coder重磅升級。新的Qwen3-Coder與Qwen Code、Claude Code系統(tǒng)聯(lián)合訓練，應用效果顯著提升，推理速度更快，代碼安全性也顯著提升。Qwen3-Coder此前就廣受開發(fā)者和企業(yè)好評，代碼生成和補全能力極強，可一鍵完成完整項目的部署和問題修復，開源后調(diào)用量曾在知名API調(diào)用平臺OpenRouter上激增1474%，位列全球第二。

通義千問Qwen模型家族

在多模態(tài)模型中，千問備受期待的視覺理解模型Qwen3-VL重磅開源，在視覺感知和多模態(tài)推理方面實現(xiàn)重大突破，在32項核心能力測評中超過Gemini-2.5-Pro和GPT-5。Qwen3-VL擁有極強的視覺智能體和視覺Coding能力，不僅能看懂圖片，還能像人一樣操作手機和電腦，自動完成許多日常任務。輸入一張圖片，Qwen3-VL可自行調(diào)用agent工具放大圖片細節(jié)，通過更仔細的觀察分析，推理出更好的答案；看到一張設計圖，Qwen3-VL 就能生成Draw.io/HTML/CSS/JS 代碼，“所見即所得”地完成視覺編程。此外，Qwen3-VL還升級了3D Grounding（3D檢測）能力，為具身智能夯實基礎；擴展支持百萬tokens上下文，視頻理解時長擴展到2小時以上。

全模態(tài)模型Qwen3-Omni驚喜亮相，音視頻能力狂攬32項開源最佳性能SOTA，可像人類一樣聽說寫，應用場景廣泛，未來可部署于車載、智能眼鏡和手機等。用戶還可設定個性化角色、調(diào)整對話風格，打造專屬的個人IP。類似于人類嬰兒一出生就全方位感知世界，Qwen3-Omni一開始就加入了“聽”、“說”、“寫”多模態(tài)混合訓練。在預訓練過程中，Qwen3-Omni采用了混合單模態(tài)和跨模態(tài)數(shù)據(jù)。此前，模型在混合訓練后，各個功能會相互掣肘甚至降智，比如音頻理解能力提升，文字理解能力反而降低了。但Qwen3-Omni在實現(xiàn)強勁音頻與音視頻能力的同時，單模態(tài)文本與圖像性能均保持穩(wěn)定，這是業(yè)內(nèi)首次實現(xiàn)這一訓練效果。

通義萬相Wan模型家族

通義大模型家族中的視覺基礎模型通義萬相，推出Wan2.5-preview系列模型，涵蓋文生視頻、圖生視頻、文生圖和圖像編輯四大模型。通義萬相2.5視頻生成模型能生成和畫面匹配的人聲、音效和音樂BGM，首次實現(xiàn)音畫同步的視頻生成能力，進一步降低電影級視頻創(chuàng)作的門檻。通義萬相2.5視頻生成時長從5秒提升至10秒，支持24幀每秒的1080P高清視頻生成，并進一步提升模型指令遵循能力。此次，通義萬相2.5還全面升級了圖像生成能力，可生成中英文文字和圖表，支持圖像編輯功能，輸入一句話即可完成P圖。

通義百聆發(fā)布

2025杭州云棲大會上，通義大模型家族還迎來了全新的成員——語音大模型通義百聆，包括語音識別大模型Fun-ASR、語音合成大模型Fun-CosyVoice。Fun-ASR基于數(shù)千萬小時真實語音數(shù)據(jù)訓練而成，具備強大的上下文理解能力與行業(yè)適應性；Fun-CosyVoice可提供上百種預制音色，可以用于客服、銷售、直播電商、消費電子、有聲書、兒童娛樂等場景。

通義大模型已成為全球第一開源模型，也是中國企業(yè)選擇最多的模型。截至目前，阿里通義開源300余個模型，覆蓋不同大小的“全尺寸”及LLM、編程、圖像、語音、視頻等“全模態(tài)”，全球下載量突破6億次，全球衍生模型17萬個，穩(wěn)居全球第一。超100萬家客戶接入通義大模型，權(quán)威調(diào)研機構(gòu)沙利文2025上半年報告顯示，在中國企業(yè)級大模型調(diào)用市場中，阿里通義占比第一。

模型日均調(diào)用量增長15倍，阿里云百煉發(fā)布全新Agent開發(fā)框架

作為一站式模型服務和Agent開發(fā)平臺，阿里云百煉也來了重磅升級。大會現(xiàn)場，阿里云發(fā)布全新Agent開發(fā)框架ModelStudio-ADK，該框架突破以預定義編排方式開發(fā)Agent的局限，可幫助企業(yè)高效開發(fā)具備自主決策、多輪反思和循環(huán)執(zhí)行能力的Agent。使用ModelStudio-ADK，1個小時就能輕松開發(fā)一個能生成深度報告的Deep Research項目。隨著模型能力的不斷提升以及Agent應用的爆發(fā)，過去一年，阿里云百煉平臺的模型日均調(diào)用量增長了15倍。

在框架層面，阿里云ModelStudio-ADK基于通義開源的AgentScope打造，可開發(fā)深度研究、硬件代理智能體、復雜檢索智能體等應用。該框架還全面支持云端部署和云端組件調(diào)用，提供企業(yè)級、服務穩(wěn)定、靈活部署和運行的高代碼開發(fā)模式，幫助企業(yè)和開發(fā)者快速實現(xiàn)復雜場景Agent的開發(fā)和落地。

在模型層面，阿里云百煉持續(xù)上線全新通義千問家族旗艦模型，基于Qwen3系列模型強大的推理能力，可驅(qū)動Agent實現(xiàn)更高效的自主規(guī)劃與決策，推理性能提高50%，決策成功率達到90%。目前，用戶可一鍵調(diào)用Qwen、Wan、DeepSeek等200多款業(yè)界領先的模型。

在組件層面，面向Agent開發(fā)和部署所需的各類組件，阿里云百煉集成了工具連接MCP Server、多模數(shù)據(jù)融合RAG Server、沙箱工具Sandbox Server、智能記憶存取Memory Server以及支付訂閱服務 Pay Server等7大企業(yè)級能力。以Pay Server為例，該服務由阿里云百煉和支付寶聯(lián)合首發(fā)推出，是業(yè)界首個為企業(yè)級Agent提供專業(yè)商業(yè)化支付通道的服務。目前，阿里云百煉首批上線了基于ModelStudio-ADK開發(fā)的DeepResearch、Agentic-RAG、Computer-Use Agent等Agent應用，用戶可免費在線體驗或下載代碼進行二次開發(fā)。

大會現(xiàn)場，阿里云百煉還升級了低代碼Agent開發(fā)平臺ModelStudio-ADP，該平臺已廣泛應用于金融、教育和電商等領域企業(yè)，目前，阿里云百煉平臺已有超20萬開發(fā)者開發(fā)了80多萬個Agent。據(jù)介紹，網(wǎng)商銀行基于ModelStudio-ADP開發(fā)了貸款審核應用，支持合同、發(fā)票、營業(yè)執(zhí)照等26種憑證，以及店面門頭、餐飲廚房、就餐區(qū)、貨架商品等超過400種細粒度物體的精準識別，準確率超95%，其任務處理時間從原來的3小時優(yōu)化至5分鐘內(nèi)。

同時，阿里云Agent Infra重要組件的無影AgentBay迎來重大升級。無影AgentBay是阿里云為Agent量身打造的“超級大腦” ，可動態(tài)調(diào)用云上算力、存儲及工具鏈資源，大大突破了Agent在本地設備上的算力限制。本次云棲大會，無影AgentBay還全新推出了自進化引擎、自定義鏡像、安全圍欄、內(nèi)存狀態(tài)管理等新能力，并首次展示全新的個人計算產(chǎn)品——無影Agentic Computer，擁有全新的人機交互方式，革命性的“記憶”能力和近乎無窮的云上算力。

AI算力一年增長超5倍，阿里云AI基礎設施全面升級

阿里云圍繞AI進行了軟硬全棧的協(xié)同優(yōu)化和系統(tǒng)創(chuàng)新，已初步形成以通義為核心的操作系統(tǒng)和以AI云為核心的下一代計算機。過去一年，阿里云AI算力增長超5倍，AI存力增長4倍多。

2025年云棲大會現(xiàn)場，全面升級的阿里云AI基礎設施重磅亮相，全面展示了阿里云從底層芯片、超節(jié)點服務器、高性能網(wǎng)絡、分布式存儲、智算集群到人工智能平臺、模型訓練推理服務的全棧AI技術(shù)能力。

在服務器層面，阿里云發(fā)布全新一代磐久128超節(jié)點AI服務器。新一代磐久超節(jié)點服務器由阿里云自主研發(fā)設計，具備高密度、高性能和高可用的核心優(yōu)勢，可高效支持多種AI芯片，單柜支持128個AI計算芯片，密度刷新業(yè)界紀錄。磐久超節(jié)點集成阿里自研CIPU 2.0芯片和EIC/MOC高性能網(wǎng)卡，采用開放架構(gòu)，擴展能力極強，可實現(xiàn)高達Pb/s級別Scale-Up帶寬和百ns極低延遲，相對于傳統(tǒng)架構(gòu)，同等AI算力下推理性能還可提升50%。

磐久AI Infra2.0 128超節(jié)點服務器

在網(wǎng)絡層面，阿里云新一代高性能網(wǎng)絡HPN 8.0全新亮相。為應對大模型時代對海量數(shù)據(jù)傳輸?shù)男枨螅琀PN8.0采用訓推一體化架構(gòu)，存儲網(wǎng)絡帶寬拉升至800Gbps，GPU互聯(lián)網(wǎng)絡帶寬達到6.4Tbps，可支持單集群10萬卡GPU高效互聯(lián)，為萬卡大集群提供高性能、確定性的云上基礎網(wǎng)絡，助力AI訓推提效。

在存儲層面，阿里云分布式存儲面向AI需求全面升級。高性能并行文件存儲CPFS單客戶端吞吐提升至40GB/s，可滿足AI訓練對快速讀取數(shù)據(jù)的極致需求；表格存儲Tablestore為Agent提供高性能記憶庫和知識庫；對象存儲OSS推出 Vector Bucket，為向量數(shù)據(jù)提供高性價比的海量存儲，相比自建開源向量數(shù)據(jù)庫，成本驟降95%，結(jié)合OSS MetaQuery 語義檢索和內(nèi)容感知能力，可快速構(gòu)建RAG等AI應用。

在AI智算集群層面，智能計算靈駿集群通過多級親和性與拓撲感知調(diào)度設計，基于HPN 網(wǎng)絡支持10萬卡穩(wěn)定互聯(lián)，多級可擴展的架構(gòu)讓每張卡間互聯(lián)路徑更短、帶寬更優(yōu)。靈駿集群面向任務的穩(wěn)定性設計、故障分鐘級恢復能力，有效提高了模型訓練任務的集群穩(wěn)定性。

AI需求爆發(fā)也帶動了通用算力需求上升，阿里云通用計算全面升級。依托自研的“飛天+CIPU”架構(gòu)體系，阿里云第九代企業(yè)級實例采用英特爾、AMD的最新芯片，在大幅提升算力水平的同時，可為Agent提供穩(wěn)定、安全、高性能的通用CPU算力。其中，九代AMD實例g9ae提供物理核的規(guī)格，性能最高提升67%，尤其適合企業(yè)離線數(shù)據(jù)分析處理、視頻轉(zhuǎn)碼等高并發(fā)場景。

為AI負載提供彈性、調(diào)度優(yōu)化和規(guī)?；\行的容器計算，也迎來重磅升級。容器服務ACK新增靈駿節(jié)點池，引入模型感知智能路由、多角色推理負載管理、故障自愈等核心功能，自動處理恢復時長縮短了 85% ，模型推理冷啟動提速10倍。容器計算服務ACS強化網(wǎng)絡拓撲感知調(diào)度，任務通信性能整體提升30%，并針對AI Agent場景深度優(yōu)化，Serverless GPU算?開箱即用，支持每分鐘15000沙箱的大規(guī)模并發(fā)彈性，結(jié)合安全沙箱、智能休眠與喚醒，實現(xiàn)Agent隨需啟用、高效響應。

阿里云人工智能平臺PAI與通義大模型聯(lián)合優(yōu)化，印證了全棧AI的“1+1>2”的效果。在訓練層，針對MoE模型，采用統(tǒng)一調(diào)度機制、自適應計算通信掩蓋、EP計算負載均衡和計算顯存分離式并行等優(yōu)化手段，使得通義千問模型訓練端到端加速比提升3倍以上；升級DiT模型訓練引擎，通義萬相單樣本訓練耗時降低28.1%；在推理層，通過大規(guī)模EP、PD/AF分離、權(quán)重優(yōu)化、LLM智能路由在內(nèi)的全鏈路優(yōu)化，實現(xiàn)推理效率顯著提升：推理吞吐TPS增加71%，時延TPOT降低70.6%，擴容時長降低97.6%。

“阿里云正在全力打造一臺全新的AI超級計算機，它同時擁有最領先的AI基礎設施和最領先的模型，兩者可以在產(chǎn)品設計和運行架構(gòu)上高度協(xié)同，從而確保在阿里云上調(diào)用和訓練通義千問模型時，能達到最高效率。”吳泳銘表示。

截至目前，阿里云運營著中國第一、全球領先的AI基礎設施和云計算網(wǎng)絡，在全球29個地域設有90個可用區(qū)。三方機構(gòu)Omdia2025年上半年數(shù)據(jù)顯示，中國AI云市場阿里云占比35.8%，超過2到4名總和；在已采用生成式AI的財富中國500強中，超53%企業(yè)選擇阿里云，滲透率位列第一。未來3年，阿里巴巴將投入3800億用于建設云和AI基礎設施，總額超過過去十年的總和。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.