9月24日,2025云棲大會,阿里巴巴集團CEO吳泳銘宣布阿里云重磅升級全棧AI體系,實現(xiàn)從AI大模型到AI基礎設施的技術(shù)更新。面向新一輪智能革命,阿里云將全力打造成為全棧人工智能服務商。
AI時代,大模型將是下一代操作系統(tǒng),超級AI云是下一代計算機。吳泳銘認為,超級AI云需要超大規(guī)模的基礎設施和全棧的技術(shù)積累,未來,全世界可能只會有5-6個超級云計算平臺。阿里云將持續(xù)加大投入,迎接超級人工智能時代到來。
大模型七連發(fā),Qwen3-Max性能躋身全球前三,超過GPT5
圍繞大模型和AI云,2025云棲大會現(xiàn)場,阿里云智能首席技術(shù)官周靖人發(fā)布了多項重磅技術(shù)更新。通義大模型7連發(fā),在模型智能水平、Agent工具調(diào)用和Coding能力、深度推理、多模態(tài)等方面實現(xiàn)多項突破。
2025云棲大會,阿里云CTO周靖人發(fā)布多項重磅技術(shù)更新
在大語言模型中,阿里通義旗艦模型Qwen3-Max全新亮相,性能超過GPT5、Claude Opus 4等,躋身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)兩大版本,其預覽版已在 Chatbot Arena 排行榜上位列第三,正式版性能可望再度實現(xiàn)突破。
Qwen3-Max是通義千問家族中最大、最強的基礎模型,預訓練數(shù)據(jù)量達36T tokens,總參數(shù)超過萬億,擁有極強的Coding編程能力和Agent工具調(diào)用能力。在大模型用Coding解決真實世界問題的SWE-Bench Verified測試中,Instruct版本斬獲69.6分,位列全球第一梯隊;在聚焦Agent工具調(diào)用能力的Tau2-Bench測試中,Qwen3-Max取得突破性的74.8分,超過Claude Opus4和DeepSeek-V3.1。Qwen3-Max推理模型也展現(xiàn)出非凡性能,結(jié)合工具調(diào)用和并行推理技術(shù),其推理能力創(chuàng)下新高,尤其在聚焦數(shù)學推理的AIME 25和HMMT測試中,均達到突破性的滿分100分,為國內(nèi)首次。
下一代基礎模型架構(gòu)Qwen3-Next及系列模型正式發(fā)布,模型總參數(shù)80B僅激活 3B ,性能即可媲美千問3旗艦版235B模型,實現(xiàn)模型計算效率的重大突破。Qwen3-Next針對大模型在上下文長度和總參數(shù)兩方面不斷擴展(Scaling)的未來趨勢而設計,創(chuàng)新改進采用了混合注意力機制、高稀疏度 MoE 結(jié)構(gòu)、多 token 預測(MTP)機制等核心技術(shù),模型訓練成本較密集模型Qwen3-32B大降超90%,長文本推理吞吐量提升10倍以上,為未來大模型的訓練和推理的效率設立了全新標準。
在專項模型方面,千問編程模型Qwen3-Coder重磅升級。新的Qwen3-Coder與Qwen Code、Claude Code系統(tǒng)聯(lián)合訓練,應用效果顯著提升,推理速度更快,代碼安全性也顯著提升。Qwen3-Coder此前就廣受開發(fā)者和企業(yè)好評,代碼生成和補全能力極強,可一鍵完成完整項目的部署和問題修復,開源后調(diào)用量曾在知名API調(diào)用平臺OpenRouter上激增1474%,位列全球第二。
通義千問Qwen模型家族
在多模態(tài)模型中,千問備受期待的視覺理解模型Qwen3-VL重磅開源,在視覺感知和多模態(tài)推理方面實現(xiàn)重大突破,在32項核心能力測評中超過Gemini-2.5-Pro和GPT-5。Qwen3-VL擁有極強的視覺智能體和視覺Coding能力,不僅能看懂圖片,還能像人一樣操作手機和電腦,自動完成許多日常任務。輸入一張圖片,Qwen3-VL可自行調(diào)用agent工具放大圖片細節(jié),通過更仔細的觀察分析,推理出更好的答案;看到一張設計圖,Qwen3-VL 就能生成Draw.io/HTML/CSS/JS 代碼,“所見即所得”地完成視覺編程。此外,Qwen3-VL還升級了3D Grounding(3D檢測)能力,為具身智能夯實基礎;擴展支持百萬tokens上下文,視頻理解時長擴展到2小時以上。
全模態(tài)模型Qwen3-Omni驚喜亮相,音視頻能力狂攬32項開源最佳性能SOTA,可像人類一樣聽說寫,應用場景廣泛,未來可部署于車載、智能眼鏡和手機等。用戶還可設定個性化角色、調(diào)整對話風格,打造專屬的個人IP。類似于人類嬰兒一出生就全方位感知世界,Qwen3-Omni一開始就加入了“聽”、“說”、“寫”多模態(tài)混合訓練。在預訓練過程中,Qwen3-Omni采用了混合單模態(tài)和跨模態(tài)數(shù)據(jù)。此前,模型在混合訓練后,各個功能會相互掣肘甚至降智,比如音頻理解能力提升,文字理解能力反而降低了。但Qwen3-Omni在實現(xiàn)強勁音頻與音視頻能力的同時,單模態(tài)文本與圖像性能均保持穩(wěn)定,這是業(yè)內(nèi)首次實現(xiàn)這一訓練效果。
通義萬相Wan模型家族
通義大模型家族中的視覺基礎模型通義萬相,推出Wan2.5-preview系列模型,涵蓋文生視頻、圖生視頻、文生圖和圖像編輯四大模型。通義萬相2.5視頻生成模型能生成和畫面匹配的人聲、音效和音樂BGM,首次實現(xiàn)音畫同步的視頻生成能力,進一步降低電影級視頻創(chuàng)作的門檻。通義萬相2.5視頻生成時長從5秒提升至10秒,支持24幀每秒的1080P高清視頻生成,并進一步提升模型指令遵循能力。此次,通義萬相2.5還全面升級了圖像生成能力,可生成中英文文字和圖表,支持圖像編輯功能,輸入一句話即可完成P圖。
通義百聆發(fā)布
2025杭州云棲大會上,通義大模型家族還迎來了全新的成員——語音大模型通義百聆,包括語音識別大模型Fun-ASR、語音合成大模型Fun-CosyVoice。Fun-ASR基于數(shù)千萬小時真實語音數(shù)據(jù)訓練而成,具備強大的上下文理解能力與行業(yè)適應性;Fun-CosyVoice可提供上百種預制音色,可以用于客服、銷售、直播電商、消費電子、有聲書、兒童娛樂等場景。
通義大模型已成為全球第一開源模型,也是中國企業(yè)選擇最多的模型。截至目前,阿里通義開源300余個模型,覆蓋不同大小的“全尺寸”及LLM、編程、圖像、語音、視頻等“全模態(tài)”,全球下載量突破6億次,全球衍生模型17萬個,穩(wěn)居全球第一。超100萬家客戶接入通義大模型,權(quán)威調(diào)研機構(gòu)沙利文2025上半年報告顯示,在中國企業(yè)級大模型調(diào)用市場中,阿里通義占比第一。
模型日均調(diào)用量增長15倍,阿里云百煉發(fā)布全新Agent開發(fā)框架
作為一站式模型服務和Agent開發(fā)平臺,阿里云百煉也來了重磅升級。大會現(xiàn)場,阿里云發(fā)布全新Agent開發(fā)框架ModelStudio-ADK,該框架突破以預定義編排方式開發(fā)Agent的局限,可幫助企業(yè)高效開發(fā)具備自主決策、多輪反思和循環(huán)執(zhí)行能力的Agent。使用ModelStudio-ADK,1個小時就能輕松開發(fā)一個能生成深度報告的Deep Research項目。隨著模型能力的不斷提升以及Agent應用的爆發(fā),過去一年,阿里云百煉平臺的模型日均調(diào)用量增長了15倍。
在框架層面,阿里云ModelStudio-ADK基于通義開源的AgentScope打造,可開發(fā)深度研究、硬件代理智能體、復雜檢索智能體等應用。該框架還全面支持云端部署和云端組件調(diào)用,提供企業(yè)級、服務穩(wěn)定、靈活部署和運行的高代碼開發(fā)模式,幫助企業(yè)和開發(fā)者快速實現(xiàn)復雜場景Agent的開發(fā)和落地。
在模型層面,阿里云百煉持續(xù)上線全新通義千問家族旗艦模型,基于Qwen3系列模型強大的推理能力,可驅(qū)動Agent實現(xiàn)更高效的自主規(guī)劃與決策,推理性能提高50%,決策成功率達到90%。目前,用戶可一鍵調(diào)用Qwen、Wan、DeepSeek等200多款業(yè)界領先的模型。
在組件層面,面向Agent開發(fā)和部署所需的各類組件,阿里云百煉集成了工具連接MCP Server、多模數(shù)據(jù)融合RAG Server、沙箱工具Sandbox Server、智能記憶存取Memory Server以及支付訂閱服務 Pay Server等7大企業(yè)級能力。以Pay Server為例,該服務由阿里云百煉和支付寶聯(lián)合首發(fā)推出,是業(yè)界首個為企業(yè)級Agent提供專業(yè)商業(yè)化支付通道的服務。目前,阿里云百煉首批上線了基于ModelStudio-ADK開發(fā)的DeepResearch、Agentic-RAG、Computer-Use Agent等Agent應用,用戶可免費在線體驗或下載代碼進行二次開發(fā)。
大會現(xiàn)場,阿里云百煉還升級了低代碼Agent開發(fā)平臺ModelStudio-ADP,該平臺已廣泛應用于金融、教育和電商等領域企業(yè),目前,阿里云百煉平臺已有超20萬開發(fā)者開發(fā)了80多萬個Agent。據(jù)介紹,網(wǎng)商銀行基于ModelStudio-ADP開發(fā)了貸款審核應用,支持合同、發(fā)票、營業(yè)執(zhí)照等26種憑證,以及店面門頭、餐飲廚房、就餐區(qū)、貨架商品等超過400種細粒度物體的精準識別,準確率超95%,其任務處理時間從原來的3小時優(yōu)化至5分鐘內(nèi)。
同時,阿里云Agent Infra重要組件的無影AgentBay迎來重大升級。無影AgentBay是阿里云為Agent量身打造的“超級大腦” ,可動態(tài)調(diào)用云上算力、存儲及工具鏈資源,大大突破了Agent在本地設備上的算力限制。本次云棲大會,無影AgentBay還全新推出了自進化引擎、自定義鏡像、安全圍欄、內(nèi)存狀態(tài)管理等新能力,并首次展示全新的個人計算產(chǎn)品——無影Agentic Computer,擁有全新的人機交互方式,革命性的“記憶”能力和近乎無窮的云上算力。
AI算力一年增長超5倍,阿里云AI基礎設施全面升級
阿里云圍繞AI進行了軟硬全棧的協(xié)同優(yōu)化和系統(tǒng)創(chuàng)新,已初步形成以通義為核心的操作系統(tǒng)和以AI云為核心的下一代計算機。過去一年,阿里云AI算力增長超5倍,AI存力增長4倍多。
2025年云棲大會現(xiàn)場,全面升級的阿里云AI基礎設施重磅亮相,全面展示了阿里云從底層芯片、超節(jié)點服務器、高性能網(wǎng)絡、分布式存儲、智算集群到人工智能平臺、模型訓練推理服務的全棧AI技術(shù)能力。
在服務器層面,阿里云發(fā)布全新一代磐久128超節(jié)點AI服務器。新一代磐久超節(jié)點服務器由阿里云自主研發(fā)設計,具備高密度、高性能和高可用的核心優(yōu)勢,可高效支持多種AI芯片,單柜支持128個AI計算芯片,密度刷新業(yè)界紀錄。磐久超節(jié)點集成阿里自研CIPU 2.0芯片和EIC/MOC高性能網(wǎng)卡,采用開放架構(gòu),擴展能力極強,可實現(xiàn)高達Pb/s級別Scale-Up帶寬和百ns極低延遲,相對于傳統(tǒng)架構(gòu),同等AI算力下推理性能還可提升50%。
磐久AI Infra2.0 128超節(jié)點服務器
在網(wǎng)絡層面,阿里云新一代高性能網(wǎng)絡HPN 8.0全新亮相。為應對大模型時代對海量數(shù)據(jù)傳輸?shù)男枨螅琀PN8.0采用訓推一體化架構(gòu),存儲網(wǎng)絡帶寬拉升至800Gbps,GPU互聯(lián)網(wǎng)絡帶寬達到6.4Tbps,可支持單集群10萬卡GPU高效互聯(lián),為萬卡大集群提供高性能、確定性的云上基礎網(wǎng)絡,助力AI訓推提效。
在存儲層面,阿里云分布式存儲面向AI需求全面升級。高性能并行文件存儲CPFS單客戶端吞吐提升至40GB/s, 可滿足AI訓練對快速讀取數(shù)據(jù)的極致需求;表格存儲Tablestore為Agent提供高性能記憶庫和知識庫;對象存儲OSS推出 Vector Bucket,為向量數(shù)據(jù)提供高性價比的海量存儲,相比自建開源向量數(shù)據(jù)庫,成本驟降95%,結(jié)合OSS MetaQuery 語義檢索和內(nèi)容感知能力,可快速構(gòu)建RAG等AI應用。
在AI智算集群層面,智能計算靈駿集群通過多級親和性與拓撲感知調(diào)度設計,基于HPN 網(wǎng)絡支持10萬卡穩(wěn)定互聯(lián),多級可擴展的架構(gòu)讓每張卡間互聯(lián)路徑更短、帶寬更優(yōu)。靈駿集群面向任務的穩(wěn)定性設計、故障分鐘級恢復能力,有效提高了模型訓練任務的集群穩(wěn)定性。
AI需求爆發(fā)也帶動了通用算力需求上升,阿里云通用計算全面升級。依托自研的“飛天+CIPU”架構(gòu)體系,阿里云第九代企業(yè)級實例采用英特爾、AMD的最新芯片,在大幅提升算力水平的同時,可為Agent提供穩(wěn)定、安全、高性能的通用CPU算力。其中,九代AMD實例g9ae提供物理核的規(guī)格,性能最高提升67%,尤其適合企業(yè)離線數(shù)據(jù)分析處理、視頻轉(zhuǎn)碼等高并發(fā)場景。
為AI負載提供彈性、調(diào)度優(yōu)化和規(guī)?;\行的容器計算,也迎來重磅升級。容器服務ACK新增靈駿節(jié)點池,引入模型感知智能路由、多角色推理負載管理、故障自愈等核心功能,自動處理恢復時長縮短了 85% ,模型推理冷啟動提速10倍。容器計算服務ACS強化網(wǎng)絡拓撲感知調(diào)度,任務通信性能整體提升30%,并針對AI Agent場景深度優(yōu)化,Serverless GPU算?開箱即用,支持每分鐘15000沙箱的大規(guī)模并發(fā)彈性,結(jié)合安全沙箱、智能休眠與喚醒,實現(xiàn)Agent隨需啟用、高效響應。
阿里云人工智能平臺PAI與通義大模型聯(lián)合優(yōu)化,印證了全棧AI的“1+1>2”的效果。在訓練層,針對MoE模型,采用統(tǒng)一調(diào)度機制、自適應計算通信掩蓋、EP計算負載均衡和計算顯存分離式并行等優(yōu)化手段,使得通義千問模型訓練端到端加速比提升3倍以上;升級DiT模型訓練引擎,通義萬相單樣本訓練耗時降低28.1%;在推理層,通過大規(guī)模EP、PD/AF分離、權(quán)重優(yōu)化、LLM智能路由在內(nèi)的全鏈路優(yōu)化,實現(xiàn)推理效率顯著提升:推理吞吐TPS增加71%,時延TPOT降低70.6%,擴容時長降低97.6%。
“阿里云正在全力打造一臺全新的AI超級計算機,它同時擁有最領先的AI基礎設施和最領先的模型,兩者可以在產(chǎn)品設計和運行架構(gòu)上高度協(xié)同,從而確保在阿里云上調(diào)用和訓練通義千問模型時,能達到最高效率。”吳泳銘表示。
截至目前,阿里云運營著中國第一、全球領先的AI基礎設施和云計算網(wǎng)絡,在全球29個地域設有90個可用區(qū)。三方機構(gòu)Omdia2025年上半年數(shù)據(jù)顯示,中國AI云市場阿里云占比35.8%,超過2到4名總和;在已采用生成式AI的財富中國500強中,超53%企業(yè)選擇阿里云,滲透率位列第一。未來3年,阿里巴巴將投入3800億用于建設云和AI基礎設施,總額超過過去十年的總和。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.