文 | 劃重點KeyPoints
劃重點:
1、阿里發(fā)布史上最大模型,參數量超過1萬億,編程能力直接反超Claude,證明Scaling Law依舊在奏效。 2、阿里“模+云”的策略形成了從技術研發(fā)到商業(yè)化落地的最短路徑,是Qwen能夠取得后來者居上成績的關鍵之一。 3、阿里開源模式的核心挑戰(zhàn)在于如何平衡開放與收益。Qwen未來不僅需要在技術上持續(xù)突破,更需要在商業(yè)模式和組織能力上證明自己。
昨天Anthropic剛玩了一手“極端措施”,阿里深夜一波大的直接反手一記重拳——推出其史上最大的模型,Qwen3-Max-Preview,參數量足足超1萬億!
用“通義大模型”微信公眾號官方的標題來形容它的能力,就是“強得不止一點”。
因為從基準測試結果來看,Qwen3-Max-Preview已經超越了此前自家的Qwen3-235B-A22B-2507。
并且官方還放出了與Kimi K2、Claude Opus 4(Non-thinking),以及DeepSeek-V3.1的對比結果。
從下面的表格中不難看出,Qwen3-Max-Preview已經在SuperGPQA、AIME2025、LiveCodeBench V6、Arena-Hard V2和LiveBench等基準測試中,均超越了其它選手。
尤其是在編程能力方面,此前Claude默認是業(yè)內最強,這次Qwen3-Max-Preview直接以大力出奇跡的方式實現了反超,也是讓一眾網友驚嘆不已。
Qwen在X上的推文中似乎也是一語道破“玄機”:Scaling works(規(guī)模化擴展是有效的)。
01 實測阿里史上最大模型
目前,Qwen3-Max-Preview已經可以體驗,只需在模型下拉選項中選擇即可:
體驗地址:https://chat.qwen.ai
并且官方的API服務也已經開放:https://bailian.console.aliyun.com/?tab=model#/model-market(搜索Qwen3-Max-Preview)。
在實際效果方面,已經有不少國內外的網友們展開了實測;例如X上的知名博主AK,他就在HuggingFace集成了Qwen3-Max-Preview的項目AnyCoder中,輸入了這樣的Prompt:
Design and create a very creative, elaborate, and detailed voxel art scene of a pagoda in a beautiful garden with trees, including some cherry blossoms. Make the scene impressive and varied and use colorful voxels. Use whatever libraries to get this done.
然后,據AK的描述,Qwen3-Max-Preview一次性就實現了如下的效果:
當我們在官網中輸入這樣的Prompt:
Create a beautiful celebratory landing page for the launch of Qwen3 Max.
只需短短幾秒鐘的時間,Qwen3-Max-Preview就生成了一個完整的慶祝頁面,響應速度實測是非??斓模?/p>
接下來,我們加大難度,直接上經典的編程問題——彈跳球模擬碰撞。
先小試牛刀一個:
Write a javascript code that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically, implement it in javascript and html.
可以看到,小球會基于物理規(guī)律在六邊形的框內運行;并且在用“向上鍵”去給小球一個力時,它也能立即做出響應。
當我們把球的數量設置到10個,一次性生成的效果也是相當自然:
最后,我們再讓Qwen3-Max-Preview生成一個小游戲:
做一個《憤怒的小鳥》的小游戲。
不過雖然是一次性生成成功,但或許因為Prompt過于簡單,這個小游戲還是有一些小瑕疵,例如怪物的位置不是很準確;感興趣的小伙伴可以多次嘗試一下。
02 Qwen憑什么后來者居上?
從這次阿里直接從千億參數模型飆升到萬億規(guī)模(近四倍提升),并且一舉在眾多評測中拿下第一來看,Qwen已然在全球范圍內站穩(wěn)了第一梯隊的位置。
但有一說一,縱觀整場AI大模型的競賽,阿里并不是最早在中國推出對標ChatGPT產品的公司,但絕對屬于后來者居上的那一個。
相較于國內先行者(如百度),阿里大模型初期可以說是相對低調,不過它的路徑卻是格外的清晰——用模型開源來構建生態(tài),用自研閉源探索技術前沿。
例如在開源這件事上,從2023年開始,Qwen就以驚人的速度向全球開發(fā)者開源多個版本模型。從70億參數的Qwen-7B到140億、720億參數,再到視覺、音頻等多模態(tài)模型,幾乎覆蓋所有主流尺寸和應用場景。更關鍵的是,阿里不僅開源模型權重,還開放商業(yè)化授權,極大激發(fā)了中小企業(yè)和個人開發(fā)者的熱情。
這一系列動作讓它迅速在Hugging Face等全球頂級開源社區(qū)建立廣泛影響力,吸引了大量開發(fā)者圍繞Qwen生態(tài)創(chuàng)新開發(fā),形成強大社區(qū)驅動力。這種廣積糧的策略為通義千問贏得了寶貴的開發(fā)者心智和應用場景數據,這可以說是閉源模型難以企及的優(yōu)勢。
但在開源之外,阿里內部也從沒有停止對模型能力上限的探索。正如官方發(fā)布萬億參數模型時所言,Scaling works(規(guī)?;瘮U展有效)。這背后是對Scaling Law的一種篤信——隨著模型參數、數據量和計算量指數級增長,模型能力會涌現質的飛躍。
訓練Qwen3 Max Preview這樣的萬億參數模型,不僅是資源堆砌,更要求在超大規(guī)模計算集群穩(wěn)定性、分布式訓練算法效率、數據處理精細度以及工程優(yōu)化的每個細節(jié)上都做到極致。
這背后是阿里數年來在算力基礎設施上的巨大投入,以及在AI工程化領域的深厚積累。正是這種大力出奇跡式的飽和投入,讓Qwen在編程、推理等核心能力上實現了對Claude Opus等頂級模型的反超。
在開源模型和能力探索之外,阿里云,也是Qwen能夠后來者居上的關鍵一環(huán)。
畢竟大模型訓練推理是名副其實的算力吞金獸,阿里云為Qwen研發(fā)提供了穩(wěn)定高效的算力基礎設施,整合了從數據標注、模型開發(fā)、分布式訓練到部署推理的全鏈路工具,極大降低了研發(fā)團隊工程負擔,使其專注算法和模型創(chuàng)新。
并且在模型的應用和普及方面,同樣是因為阿里云的MaaS戰(zhàn)略,可以讓Qwen快速在各行各業(yè)中深耕;例如企業(yè)客戶無需從零訓練模型,可直接在阿里云調用Qwen API,或利用平臺工具對開源Qwen模型微調,快速構建AI應用。
這種“模+云”的策略形成了從技術研發(fā)到商業(yè)化落地的最短路徑。
03 但也并非完美
雖然阿里在大模型發(fā)展的戰(zhàn)略和選擇促成了它后來者居上的優(yōu)勢,但這并不意味著現階段的Qwen沒有隱患。
因為阿里選擇的開源模型引流、云服務變現可以說是一條機遇與挑戰(zhàn)并存的道路;它與Meta的Llama系列相似,目標通過開放生態(tài)快速搶占市場份額和開發(fā)者心智,最終將商業(yè)價值導向自家基礎設施。
這與OpenAI、Anthropic等閉源+API的精英路線形成鮮明對比,它們優(yōu)勢在于更好保護核心技術,維持技術代差,通過高價值API服務直接獲得高額利潤。
而阿里開源策略雖能快速普及技術,但這也意味著其最先進模型很難與競爭對手拉開絕對差距,商業(yè)模式也更加迂回,需要客戶首先認可其云平臺價值。
開源模式的核心挑戰(zhàn)在于如何平衡開放與收益,當企業(yè)可以免費獲取并私有化部署性能足夠好的開源模型時,他們?yōu)楣俜皆品崭顿M的意愿又會有多強呢?
換言之,阿里云不僅要提供簡單模型托管,還必須提供遠超開源版本的性能優(yōu)化、安全保障、以及強大工具鏈和企業(yè)級服務,才能構建足夠深的護城河。如何讓龐大開源用戶群體有效轉化為高價值付費云客戶,是這條道路上最關鍵的商業(yè)驚險一躍。
除了商業(yè)化的挑戰(zhàn)之外,在頂尖AI人才爭奪進入白熱化的今天,任何核心人才流失都可能對團隊造成深遠影響。
近年來,包括AI框架和基礎設施領域關鍵人物賈揚清在內的一些核心技術人才先后離開阿里,投身創(chuàng)業(yè)浪潮或加入其他巨頭。雖然對于阿里這樣體量的公司而言,個別人員離開未必動搖根基,但負面影響依然存在。
畢竟核心領軍人物離開可能影響團隊士氣,對外傳遞負面信號,增加后續(xù)吸引頂尖人才的難度;在關鍵技術方向上,領軍人物的變動還可能給項目長期戰(zhàn)略延續(xù)性帶來不確定性。
也正像Meta在硅谷持續(xù)上演的搶人大戰(zhàn),離開的人才往往成為新競爭對手,他們對原有體系優(yōu)劣勢了如指掌,可能在細分領域構成更精準威脅。
因此,阿里如何在高強度競爭下持續(xù)保持對全球頂尖AI人才的吸引力,并建立穩(wěn)定可持續(xù)的人才梯隊,是它在未來發(fā)展過程中必須面對的嚴肅課題。
結語
總體來看,阿里通義千問無疑是中國乃至全球大模型領域的頂級力量。它憑借“開源與自研并行”的清晰戰(zhàn)略、依托阿里云的強大生態(tài)、以及深厚技術人才積累,成功在激烈競爭中占據領先地位。萬億參數模型的發(fā)布更是彰顯了其在Scaling Law上的決心和實力。
然而,成功之路也伴隨著清晰挑戰(zhàn)。以開源換生態(tài)的商業(yè)模式,其盈利能力的持續(xù)性仍需市場檢驗;與OpenAI等閉源巨頭的技術代差追逐將是長期過程;而頂級人才的保留與吸引,則是維持創(chuàng)新活力的生命線。
Qwen在未來不僅需要在技術上持續(xù)突破,更需要在商業(yè)模式和組織能力上證明自己的獨特價值。它能否將今天的技術優(yōu)勢轉化為明天不可動搖的市場勝勢,將是整個行業(yè)、包括資本市場關注的焦點。這也是阿里未來市值能否更上一層樓的關鍵。
1、https://x.com/Alibaba_Qwen/status/1963991502440562976
2、https://chat.qwen.ai/
3、https://x.com/_akhaliq/status/1964001592710975971
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.