智東西
作者 陳駿達(dá)
編輯 漠影
這款國(guó)產(chǎn)編程模型,正在海外悄悄爆火!
國(guó)慶前夕,國(guó)產(chǎn)開(kāi)源AI迎來(lái)一波集中發(fā)布,體驗(yàn)中國(guó)制造的開(kāi)源模型,成了一眾海外開(kāi)發(fā)者們今年獨(dú)特的“國(guó)慶七天樂(lè)”。
在X平臺(tái)、Reddit和YouTube上,智譜于9月30日發(fā)布的GLM-4.6憑借其編程性能和價(jià)格優(yōu)勢(shì),已經(jīng)成為開(kāi)發(fā)者社區(qū)熱議的焦點(diǎn)。
“GLM-4.6是我用過(guò)最棒的編程模型”、“這是我用過(guò)最具性?xún)r(jià)比的編程助手”,不少一線開(kāi)發(fā)者在親身體驗(yàn)后給出高度評(píng)價(jià)。還有多位海外AI領(lǐng)域的知名創(chuàng)業(yè)者、KOL專(zhuān)門(mén)發(fā)文推薦。以GLM-4.6為關(guān)鍵詞在YouTube搜索,已經(jīng)能找到十幾條深度測(cè)評(píng)視頻,從開(kāi)發(fā)體驗(yàn)到部署教程全都覆蓋了。
作為智譜GLM系列模型的最新成員,GLM-4.6不僅在多項(xiàng)基準(zhǔn)測(cè)試上超過(guò)了DeepSeek-V3.2-Exp等國(guó)產(chǎn)開(kāi)源模型,還在編程領(lǐng)域?qū)崿F(xiàn)了媲美Claude Sonnet 4的性能,然而價(jià)格僅為后者的1/7。
從發(fā)布之初的廣受關(guān)注到如今在海外社區(qū)的持續(xù)發(fā)酵,GLM-4.6正上演著一場(chǎng)技術(shù)領(lǐng)域的“墻內(nèi)開(kāi)花墻外香”,成為中國(guó)AI走向世界舞臺(tái)的又一成功案例。
一、GLM-4.6編程被玩瘋了,海外AI博主化身“自來(lái)水”
一款模型究竟好不好用,一線開(kāi)發(fā)者們最有發(fā)言權(quán)。在海外,已有不少開(kāi)發(fā)者對(duì)GLM-4.6進(jìn)行了廣泛測(cè)試,并分享了真實(shí)案例。
多條GLM-4.6的測(cè)評(píng)帖在海外社媒的閱讀量達(dá)到數(shù)十萬(wàn)次,這些帖子的互動(dòng)量也較為可觀,顯示出開(kāi)發(fā)者們對(duì)這款新模型的關(guān)注。
X平臺(tái)上最大的Vibe Coding社區(qū)發(fā)起者Wes Winder分享,GLM-4.6在網(wǎng)頁(yè)設(shè)計(jì)方面的表現(xiàn)幾乎和Claude Sonnet系列模型相仿。
AI編程軟件公司Finalpoint的聯(lián)合創(chuàng)始人Jeremy Mack在模型發(fā)布當(dāng)天就上手實(shí)測(cè),他實(shí)測(cè)中所有的案例都是他一次生成的,未經(jīng)修改。
Jeremy Mack認(rèn)為,GLM-4.6和Claude Sonnet、GPT-5等模型相比,在設(shè)計(jì)上不會(huì)固執(zhí)己見(jiàn),采取了極簡(jiǎn)主義的風(fēng)格,功能完備,在經(jīng)典的小球彈跳測(cè)試題上做得恰到好處。
要在生產(chǎn)環(huán)境中發(fā)揮效用,GLM-4.6還需與現(xiàn)有的CLI、IDE工具實(shí)現(xiàn)較好的協(xié)同效應(yīng)。Hugging Face產(chǎn)品主管Victor M分享道,他使用opencode+GLM4.6的組合編程了一整天,體驗(yàn)基本和Claude Code類(lèi)似,但前者超級(jí)便宜。
Cline的產(chǎn)品營(yíng)銷(xiāo)經(jīng)理Nick Baumann用Cline上的數(shù)百萬(wàn)個(gè)差異編輯數(shù)據(jù),比較了GLM-4.6與Claude Sonnet 4.5之間的成功率表現(xiàn)。數(shù)據(jù)顯示,GLM-4.6的成功率為94.9%,而Claude Sonnet 4.5的成功率為96.2%。
Baumann特別強(qiáng)調(diào),雖然差異編輯并不是衡量編程模型能力的唯一標(biāo)準(zhǔn),不過(guò),在3個(gè)月前,GLM與Claude的差距還在5-10個(gè)百分點(diǎn)左右。
一位蘋(píng)果的AI工程師Awni Hannun則分享了GLM-4.6在M3 Ultra芯片上的運(yùn)行速度,該模型的量化版本能在M3 Ultra以每秒17個(gè)token以上的速度推理。Hannun還認(rèn)為,GLM-4.6的基準(zhǔn)測(cè)試結(jié)果,即便和最新發(fā)布的Claude Sonnet 4.5相比也很有競(jìng)爭(zhēng)力。
在編程之外,GLM-4.6的寫(xiě)作與敘事能力成為不少海外用戶熱議的亮點(diǎn)。有一群AI創(chuàng)意寫(xiě)作愛(ài)好者在Reddit上分享了他們的體驗(yàn),認(rèn)為GLM-4.6在角色扮演(RP)、敘事創(chuàng)作以及人物塑造方面表現(xiàn)突出。
不少用戶提到,GLM-4.6 的最大魅力在于它能進(jìn)入角色的內(nèi)心,能真正捕捉場(chǎng)景中的情感細(xì)微差別。
而另一位用戶則稱(chēng)贊它“能讓角色與你爭(zhēng)論,而且他們的邏輯往往令人信服”;還有人提到GLM-4.6對(duì)角色服裝、外貌的描述更具一致性。這種對(duì)情感與人物的精準(zhǔn)把握,使得GLM-4.6在沉浸式對(duì)話和長(zhǎng)篇敘事中表現(xiàn)格外出色。
總而言之,在角色扮演、寫(xiě)作等任務(wù)上,許多創(chuàng)作者認(rèn)為GLM-4.6的對(duì)話更加真實(shí)、富有情感,且在避免“積極性偏見(jiàn)”(即過(guò)于迎合用戶、回避沖突)方面做得不錯(cuò),成為許多文字創(chuàng)作者的新寵。
關(guān)于GLM-4.6的討論,不止于X平臺(tái)與Reddit上的點(diǎn)評(píng),更延伸至YouTube平臺(tái),眾多AI博主帶來(lái)了視角多元的深度分析。
擁有接近50萬(wàn)關(guān)注的博主Theo分享,他通過(guò)Kilo Code測(cè)試GLM-4.6模型,要求它展示React新推出的Activity API。這個(gè)案例具有一定的挑戰(zhàn)性:
Activity API是React最近才新增的功能,模型并沒(méi)有接受過(guò)相關(guān)訓(xùn)練;其次,為了完成任務(wù),模型必須具備主動(dòng)搜索網(wǎng)絡(luò)信息的能力,以理解并使用這一全新的API。
在實(shí)際執(zhí)行過(guò)程中,GLM-4.6生成的初版示例代碼出現(xiàn)了小錯(cuò)誤,不過(guò)當(dāng)Theo指出后,模型幾乎立刻就找出了問(wèn)題并成功解決。
最終的結(jié)果令人印象深刻:程序運(yùn)行穩(wěn)定,界面設(shè)計(jì)也非常精美。雖然整體風(fēng)格與Theo平時(shí)所見(jiàn)略有不同,但GLM-4.6展現(xiàn)出了高效的錯(cuò)誤修復(fù)能力和優(yōu)秀的界面設(shè)計(jì)水平。Theo稱(chēng)這比他平時(shí)從Claude獲得的結(jié)果還要好。
博主Bijan Bowen則發(fā)布了一則30分鐘的深度測(cè)評(píng),全面考察了GLM-4.6在多種任務(wù)類(lèi)型上的表現(xiàn)。該模型不僅在打造網(wǎng)頁(yè)游戲、物理模擬等編程任務(wù)上表現(xiàn)出色,還在角色扮演任務(wù)上實(shí)現(xiàn)了準(zhǔn)確又引人入勝的語(yǔ)氣和寫(xiě)作風(fēng)格。Bijan Bowen直呼:“這可能是我迄今為止測(cè)試過(guò)的最令人印象深刻的開(kāi)源模型。”
性?xún)r(jià)比是YouTube AI博主們對(duì)這款模型的另一大印象。YouTube AI博主Fabio Bergmann稱(chēng),GLM Coding Plan每月3美元的起始價(jià)格,與Claude Code動(dòng)輒數(shù)百美元的訂閱方案相比,簡(jiǎn)直“瘋狂”。他認(rèn)為,市面上沒(méi)有其他模型能以相同的價(jià)格提供GLM-4.6所表現(xiàn)出的性能。
二、沖至競(jìng)技場(chǎng)開(kāi)源第一,企業(yè)正用token投票
在獲得開(kāi)發(fā)者群體認(rèn)可的同時(shí),GLM-4.6也在多項(xiàng)權(quán)威榜單和真實(shí)調(diào)用數(shù)據(jù)上展現(xiàn)出優(yōu)勢(shì)。
在全球最受關(guān)注的大模型對(duì)戰(zhàn)平臺(tái)LMArena 上,GLM-4.6表現(xiàn)十分搶眼。發(fā)布后3天,GLM-4.6在Text Arena上的綜合成績(jī)并列全球第四,在開(kāi)源模型中位居全球第一,同時(shí)也是國(guó)內(nèi)模型中并列第一的選手。
更值得注意的是,當(dāng)排除風(fēng)格控制因素、聚焦于內(nèi)容生成真實(shí)能力時(shí),GLM-4.6的得分升至全球第二,僅次于谷歌的Gemini 2.5 Pro。
而在所有模型的勝率榜單中,它位列全球第二,展現(xiàn)出在多領(lǐng)域任務(wù)上的穩(wěn)定性能。
在編程能力方面,GLM-4.6于CC-Bench-V1.1評(píng)測(cè)中超過(guò)了多款國(guó)產(chǎn)開(kāi)源模型,其整體勝率已超過(guò)Claude Sonnet 4這款編程領(lǐng)域的標(biāo)桿模型,具備了與國(guó)際頂尖閉源模型同臺(tái)競(jìng)技的實(shí)力。
此外,在全球知名開(kāi)發(fā)者平臺(tái)Factory AI的最新評(píng)估中,GLM-4.6在Terminal-Bench全部開(kāi)源模型中排名第一,甚至超越了Claude Code中的Claude Sonnet 4。
Factory作為海外領(lǐng)先的AI Agent與開(kāi)發(fā)自動(dòng)化平臺(tái),其評(píng)估結(jié)果被全球開(kāi)發(fā)者廣泛參考。GLM-4.6是首款在該榜單上登頂?shù)膰?guó)產(chǎn)開(kāi)源模型,它還被正式納入Factory的Droid生態(tài)系統(tǒng),這意味著全球開(kāi)發(fā)者能更“即插即用”地使用這一模型。
在前端設(shè)計(jì)代碼能力的Design Arena測(cè)評(píng)中,GLM-4.6同樣表現(xiàn)出色,僅次于Claude與GPT系列,進(jìn)一步驗(yàn)證了其在復(fù)雜指令理解與界面布局推理方面的成熟度。
除了評(píng)測(cè)成績(jī)亮眼,GLM-4.6的實(shí)際使用熱度也在迅速攀升。根據(jù)全球多模型聚合平臺(tái)OpenRouter的最新統(tǒng)計(jì),GLM-4.6已成為開(kāi)發(fā)者調(diào)用頻率最高的模型之一。
GLM-4.6一度在在平臺(tái)熱度趨勢(shì)榜上排名第一,模型日榜位列第十一,API的付費(fèi)調(diào)用量位居國(guó)內(nèi)第一。
同時(shí),智譜作為模型廠商,整體調(diào)用量排名已升至全球第七。
OpenRouter作為全球最具影響力的AI模型聚合與調(diào)用平臺(tái)之一,其數(shù)據(jù)源于真實(shí)開(kāi)發(fā)者的使用行為,極具代表性和權(quán)威性。
平臺(tái)活躍度與付費(fèi)情況直接反映了模型在實(shí)際開(kāi)發(fā)與應(yīng)用中的價(jià)值。GLM-4.6在OpenRouter上的持續(xù)走高,說(shuō)明它不僅受到個(gè)人開(kāi)發(fā)者的青睞,也正贏得越來(lái)越多企業(yè)級(jí)用戶的信任與部署。
三、編程持續(xù)成為AI競(jìng)逐焦點(diǎn),國(guó)產(chǎn)SOTA級(jí)模型意義何在?
編程模型,在過(guò)去很長(zhǎng)一段時(shí)間以來(lái)一直是各大模型廠商競(jìng)逐的焦點(diǎn)。編程這一應(yīng)用場(chǎng)景之所以特殊,在于它要求模型不僅要理解人類(lèi)自然語(yǔ)言的模糊性,還要精準(zhǔn)地轉(zhuǎn)換為機(jī)器可執(zhí)行的嚴(yán)謹(jǐn)邏輯。
從產(chǎn)品經(jīng)理的需求描述到可運(yùn)行的產(chǎn)品原型,從模糊的業(yè)務(wù)邏輯到健壯的系統(tǒng)架構(gòu),這一過(guò)程全面考驗(yàn)著模型的邏輯推理、上下文理解和創(chuàng)造性解決問(wèn)題的能力。
正因如此,一個(gè)在編程任務(wù)上表現(xiàn)卓越的模型,其價(jià)值遠(yuǎn)不止于提升開(kāi)發(fā)效率,更代表著在核心認(rèn)知能力上的突破。
然而,適用于編程場(chǎng)景的大模型長(zhǎng)期被Claude、GPT等少數(shù)海外閉源大模型家族主導(dǎo)。當(dāng)全球開(kāi)發(fā)者的生產(chǎn)力工具高度集中于少數(shù)幾家美國(guó)大模型廠商時(shí),配套的技術(shù)供應(yīng)鏈便存在較大風(fēng)險(xiǎn)。此前,Claude、GPT系列模型都曾出現(xiàn)的斷供風(fēng)波,就是最好的印證。
此次,GLM-4.6不僅打造出了一款SOTA級(jí)別的開(kāi)源編程模型,還在國(guó)產(chǎn)模型與國(guó)產(chǎn)芯片的適配上實(shí)現(xiàn)突破。GLM-4.6發(fā)布當(dāng)天,寒武紀(jì)與摩爾線程就實(shí)現(xiàn)了Day 0適配。
GLM-4.6能在寒武紀(jì)的國(guó)產(chǎn)芯片上實(shí)現(xiàn)FP8+Int4混合量化部署,保持精度不變,但能大幅度降低推理成本。摩爾線程基于vLLM推理框架完成了對(duì)GLM-4.6的適配,新一代GPU可在原生FP8精度下穩(wěn)定運(yùn)行模型。
更重要的是,上述方案不會(huì)僅僅停留在實(shí)驗(yàn)室,還即將通過(guò)智譜MaaS平臺(tái)正式面向大眾和企業(yè)提供服務(wù),讓產(chǎn)業(yè)真正從中受益,也為打造更為獨(dú)立自主的國(guó)產(chǎn)AI生態(tài)做出了貢獻(xiàn)。
中國(guó)AI模型已在一次次迭代中,擺脫了“廉價(jià)替代品”的刻板印象,轉(zhuǎn)而成為全球AI生態(tài)中不可或缺的力量。它們或憑借獨(dú)特優(yōu)勢(shì)與海外模型形成強(qiáng)力互補(bǔ),或在特定場(chǎng)景中完美取代昂貴方案,為用戶提供兼具價(jià)格優(yōu)勢(shì)與性能的選擇。
當(dāng)海外開(kāi)發(fā)者開(kāi)始主動(dòng)測(cè)試、比較并最終選擇中國(guó)模型時(shí),這種轉(zhuǎn)變所帶來(lái)的機(jī)遇,遠(yuǎn)超出單純的市場(chǎng)份額競(jìng)爭(zhēng)。
結(jié)語(yǔ):當(dāng)中國(guó)AI贏得全球開(kāi)發(fā)者之心
從今年年初的DeepSeek-R1,到萬(wàn)億參數(shù)大模型Kimi-K2,再到開(kāi)源SOTA編程模型GLM-4.6,中國(guó)大模型廠商們正在一步一步改變?nèi)蜷_(kāi)發(fā)者和企業(yè)對(duì)中國(guó)AI技術(shù)的認(rèn)知。
智譜敏銳地把握住了這一趨勢(shì),近期在國(guó)際化布局上動(dòng)作頻頻:今年啟用了更具國(guó)際范兒的z.ai域名,與全球開(kāi)源社區(qū)、開(kāi)發(fā)者社區(qū)的互動(dòng)也更加頻繁。
這些舉措,正逐漸樹(shù)立國(guó)內(nèi)大模型玩家作為全球AI生態(tài)的積極參與者的形象。以智譜為代表的中國(guó)企業(yè),已在全球AI舞臺(tái)上扮演著越來(lái)越重要的角色。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.