網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

這款國(guó)產(chǎn)模型在海外悄悄爆火，全球程序員又多了一位中國(guó)伙伴

2025-10-15 22:38:03　來(lái)源: 智東西

北京舉報(bào)

分享至

智東西
作者陳駿達(dá)
編輯漠影

這款國(guó)產(chǎn)編程模型，正在海外悄悄爆火！

國(guó)慶前夕，國(guó)產(chǎn)開(kāi)源AI迎來(lái)一波集中發(fā)布，體驗(yàn)中國(guó)制造的開(kāi)源模型，成了一眾海外開(kāi)發(fā)者們今年獨(dú)特的“國(guó)慶七天樂(lè)”。

在X平臺(tái)、Reddit和YouTube上，智譜于9月30日發(fā)布的GLM-4.6憑借其編程性能和價(jià)格優(yōu)勢(shì)，已經(jīng)成為開(kāi)發(fā)者社區(qū)熱議的焦點(diǎn)。

“GLM-4.6是我用過(guò)最棒的編程模型”、“這是我用過(guò)最具性?xún)r(jià)比的編程助手”，不少一線開(kāi)發(fā)者在親身體驗(yàn)后給出高度評(píng)價(jià)。還有多位海外AI領(lǐng)域的知名創(chuàng)業(yè)者、KOL專(zhuān)門(mén)發(fā)文推薦。以GLM-4.6為關(guān)鍵詞在YouTube搜索，已經(jīng)能找到十幾條深度測(cè)評(píng)視頻，從開(kāi)發(fā)體驗(yàn)到部署教程全都覆蓋了。

作為智譜GLM系列模型的最新成員，GLM-4.6不僅在多項(xiàng)基準(zhǔn)測(cè)試上超過(guò)了DeepSeek-V3.2-Exp等國(guó)產(chǎn)開(kāi)源模型，還在編程領(lǐng)域?qū)崿F(xiàn)了媲美Claude Sonnet 4的性能，然而價(jià)格僅為后者的1/7。

從發(fā)布之初的廣受關(guān)注到如今在海外社區(qū)的持續(xù)發(fā)酵，GLM-4.6正上演著一場(chǎng)技術(shù)領(lǐng)域的“墻內(nèi)開(kāi)花墻外香”，成為中國(guó)AI走向世界舞臺(tái)的又一成功案例。

一、GLM-4.6編程被玩瘋了，海外AI博主化身“自來(lái)水”

一款模型究竟好不好用，一線開(kāi)發(fā)者們最有發(fā)言權(quán)。在海外，已有不少開(kāi)發(fā)者對(duì)GLM-4.6進(jìn)行了廣泛測(cè)試，并分享了真實(shí)案例。

多條GLM-4.6的測(cè)評(píng)帖在海外社媒的閱讀量達(dá)到數(shù)十萬(wàn)次，這些帖子的互動(dòng)量也較為可觀，顯示出開(kāi)發(fā)者們對(duì)這款新模型的關(guān)注。

X平臺(tái)上最大的Vibe Coding社區(qū)發(fā)起者Wes Winder分享，GLM-4.6在網(wǎng)頁(yè)設(shè)計(jì)方面的表現(xiàn)幾乎和Claude Sonnet系列模型相仿。

AI編程軟件公司Finalpoint的聯(lián)合創(chuàng)始人Jeremy Mack在模型發(fā)布當(dāng)天就上手實(shí)測(cè)，他實(shí)測(cè)中所有的案例都是他一次生成的，未經(jīng)修改。

Jeremy Mack認(rèn)為，GLM-4.6和Claude Sonnet、GPT-5等模型相比，在設(shè)計(jì)上不會(huì)固執(zhí)己見(jiàn)，采取了極簡(jiǎn)主義的風(fēng)格，功能完備，在經(jīng)典的小球彈跳測(cè)試題上做得恰到好處。

要在生產(chǎn)環(huán)境中發(fā)揮效用，GLM-4.6還需與現(xiàn)有的CLI、IDE工具實(shí)現(xiàn)較好的協(xié)同效應(yīng)。Hugging Face產(chǎn)品主管Victor M分享道，他使用opencode+GLM4.6的組合編程了一整天，體驗(yàn)基本和Claude Code類(lèi)似，但前者超級(jí)便宜。

Cline的產(chǎn)品營(yíng)銷(xiāo)經(jīng)理Nick Baumann用Cline上的數(shù)百萬(wàn)個(gè)差異編輯數(shù)據(jù)，比較了GLM-4.6與Claude Sonnet 4.5之間的成功率表現(xiàn)。數(shù)據(jù)顯示，GLM-4.6的成功率為94.9%，而Claude Sonnet 4.5的成功率為96.2%。

Baumann特別強(qiáng)調(diào)，雖然差異編輯并不是衡量編程模型能力的唯一標(biāo)準(zhǔn)，不過(guò)，在3個(gè)月前，GLM與Claude的差距還在5-10個(gè)百分點(diǎn)左右。

一位蘋(píng)果的AI工程師Awni Hannun則分享了GLM-4.6在M3 Ultra芯片上的運(yùn)行速度，該模型的量化版本能在M3 Ultra以每秒17個(gè)token以上的速度推理。Hannun還認(rèn)為，GLM-4.6的基準(zhǔn)測(cè)試結(jié)果，即便和最新發(fā)布的Claude Sonnet 4.5相比也很有競(jìng)爭(zhēng)力。

在編程之外，GLM-4.6的寫(xiě)作與敘事能力成為不少海外用戶熱議的亮點(diǎn)。有一群AI創(chuàng)意寫(xiě)作愛(ài)好者在Reddit上分享了他們的體驗(yàn)，認(rèn)為GLM-4.6在角色扮演（RP）、敘事創(chuàng)作以及人物塑造方面表現(xiàn)突出。

不少用戶提到，GLM-4.6 的最大魅力在于它能進(jìn)入角色的內(nèi)心，能真正捕捉場(chǎng)景中的情感細(xì)微差別。

而另一位用戶則稱(chēng)贊它“能讓角色與你爭(zhēng)論，而且他們的邏輯往往令人信服”；還有人提到GLM-4.6對(duì)角色服裝、外貌的描述更具一致性。這種對(duì)情感與人物的精準(zhǔn)把握，使得GLM-4.6在沉浸式對(duì)話和長(zhǎng)篇敘事中表現(xiàn)格外出色。

總而言之，在角色扮演、寫(xiě)作等任務(wù)上，許多創(chuàng)作者認(rèn)為GLM-4.6的對(duì)話更加真實(shí)、富有情感，且在避免“積極性偏見(jiàn)”（即過(guò)于迎合用戶、回避沖突）方面做得不錯(cuò)，成為許多文字創(chuàng)作者的新寵。

關(guān)于GLM-4.6的討論，不止于X平臺(tái)與Reddit上的點(diǎn)評(píng)，更延伸至YouTube平臺(tái)，眾多AI博主帶來(lái)了視角多元的深度分析。

擁有接近50萬(wàn)關(guān)注的博主Theo分享，他通過(guò)Kilo Code測(cè)試GLM-4.6模型，要求它展示React新推出的Activity API。這個(gè)案例具有一定的挑戰(zhàn)性：

Activity API是React最近才新增的功能，模型并沒(méi)有接受過(guò)相關(guān)訓(xùn)練；其次，為了完成任務(wù)，模型必須具備主動(dòng)搜索網(wǎng)絡(luò)信息的能力，以理解并使用這一全新的API。

在實(shí)際執(zhí)行過(guò)程中，GLM-4.6生成的初版示例代碼出現(xiàn)了小錯(cuò)誤，不過(guò)當(dāng)Theo指出后，模型幾乎立刻就找出了問(wèn)題并成功解決。

最終的結(jié)果令人印象深刻：程序運(yùn)行穩(wěn)定，界面設(shè)計(jì)也非常精美。雖然整體風(fēng)格與Theo平時(shí)所見(jiàn)略有不同，但GLM-4.6展現(xiàn)出了高效的錯(cuò)誤修復(fù)能力和優(yōu)秀的界面設(shè)計(jì)水平。Theo稱(chēng)這比他平時(shí)從Claude獲得的結(jié)果還要好。

博主Bijan Bowen則發(fā)布了一則30分鐘的深度測(cè)評(píng)，全面考察了GLM-4.6在多種任務(wù)類(lèi)型上的表現(xiàn)。該模型不僅在打造網(wǎng)頁(yè)游戲、物理模擬等編程任務(wù)上表現(xiàn)出色，還在角色扮演任務(wù)上實(shí)現(xiàn)了準(zhǔn)確又引人入勝的語(yǔ)氣和寫(xiě)作風(fēng)格。Bijan Bowen直呼：“這可能是我迄今為止測(cè)試過(guò)的最令人印象深刻的開(kāi)源模型。”

性?xún)r(jià)比是YouTube AI博主們對(duì)這款模型的另一大印象。YouTube AI博主Fabio Bergmann稱(chēng)，GLM Coding Plan每月3美元的起始價(jià)格，與Claude Code動(dòng)輒數(shù)百美元的訂閱方案相比，簡(jiǎn)直“瘋狂”。他認(rèn)為，市面上沒(méi)有其他模型能以相同的價(jià)格提供GLM-4.6所表現(xiàn)出的性能。

二、沖至競(jìng)技場(chǎng)開(kāi)源第一，企業(yè)正用token投票

在獲得開(kāi)發(fā)者群體認(rèn)可的同時(shí)，GLM-4.6也在多項(xiàng)權(quán)威榜單和真實(shí)調(diào)用數(shù)據(jù)上展現(xiàn)出優(yōu)勢(shì)。

在全球最受關(guān)注的大模型對(duì)戰(zhàn)平臺(tái)LMArena 上，GLM-4.6表現(xiàn)十分搶眼。發(fā)布后3天，GLM-4.6在Text Arena上的綜合成績(jī)并列全球第四，在開(kāi)源模型中位居全球第一，同時(shí)也是國(guó)內(nèi)模型中并列第一的選手。

更值得注意的是，當(dāng)排除風(fēng)格控制因素、聚焦于內(nèi)容生成真實(shí)能力時(shí)，GLM-4.6的得分升至全球第二，僅次于谷歌的Gemini 2.5 Pro。

而在所有模型的勝率榜單中，它位列全球第二，展現(xiàn)出在多領(lǐng)域任務(wù)上的穩(wěn)定性能。

在編程能力方面，GLM-4.6于CC-Bench-V1.1評(píng)測(cè)中超過(guò)了多款國(guó)產(chǎn)開(kāi)源模型，其整體勝率已超過(guò)Claude Sonnet 4這款編程領(lǐng)域的標(biāo)桿模型，具備了與國(guó)際頂尖閉源模型同臺(tái)競(jìng)技的實(shí)力。

此外，在全球知名開(kāi)發(fā)者平臺(tái)Factory AI的最新評(píng)估中，GLM-4.6在Terminal-Bench全部開(kāi)源模型中排名第一，甚至超越了Claude Code中的Claude Sonnet 4。

Factory作為海外領(lǐng)先的AI Agent與開(kāi)發(fā)自動(dòng)化平臺(tái)，其評(píng)估結(jié)果被全球開(kāi)發(fā)者廣泛參考。GLM-4.6是首款在該榜單上登頂?shù)膰?guó)產(chǎn)開(kāi)源模型，它還被正式納入Factory的Droid生態(tài)系統(tǒng)，這意味著全球開(kāi)發(fā)者能更“即插即用”地使用這一模型。

在前端設(shè)計(jì)代碼能力的Design Arena測(cè)評(píng)中，GLM-4.6同樣表現(xiàn)出色，僅次于Claude與GPT系列，進(jìn)一步驗(yàn)證了其在復(fù)雜指令理解與界面布局推理方面的成熟度。

除了評(píng)測(cè)成績(jī)亮眼，GLM-4.6的實(shí)際使用熱度也在迅速攀升。根據(jù)全球多模型聚合平臺(tái)OpenRouter的最新統(tǒng)計(jì)，GLM-4.6已成為開(kāi)發(fā)者調(diào)用頻率最高的模型之一。

GLM-4.6一度在在平臺(tái)熱度趨勢(shì)榜上排名第一，模型日榜位列第十一，API的付費(fèi)調(diào)用量位居國(guó)內(nèi)第一。

同時(shí)，智譜作為模型廠商，整體調(diào)用量排名已升至全球第七。

OpenRouter作為全球最具影響力的AI模型聚合與調(diào)用平臺(tái)之一，其數(shù)據(jù)源于真實(shí)開(kāi)發(fā)者的使用行為，極具代表性和權(quán)威性。

平臺(tái)活躍度與付費(fèi)情況直接反映了模型在實(shí)際開(kāi)發(fā)與應(yīng)用中的價(jià)值。GLM-4.6在OpenRouter上的持續(xù)走高，說(shuō)明它不僅受到個(gè)人開(kāi)發(fā)者的青睞，也正贏得越來(lái)越多企業(yè)級(jí)用戶的信任與部署。

三、編程持續(xù)成為AI競(jìng)逐焦點(diǎn)，國(guó)產(chǎn)SOTA級(jí)模型意義何在？

編程模型，在過(guò)去很長(zhǎng)一段時(shí)間以來(lái)一直是各大模型廠商競(jìng)逐的焦點(diǎn)。編程這一應(yīng)用場(chǎng)景之所以特殊，在于它要求模型不僅要理解人類(lèi)自然語(yǔ)言的模糊性，還要精準(zhǔn)地轉(zhuǎn)換為機(jī)器可執(zhí)行的嚴(yán)謹(jǐn)邏輯。

從產(chǎn)品經(jīng)理的需求描述到可運(yùn)行的產(chǎn)品原型，從模糊的業(yè)務(wù)邏輯到健壯的系統(tǒng)架構(gòu)，這一過(guò)程全面考驗(yàn)著模型的邏輯推理、上下文理解和創(chuàng)造性解決問(wèn)題的能力。

正因如此，一個(gè)在編程任務(wù)上表現(xiàn)卓越的模型，其價(jià)值遠(yuǎn)不止于提升開(kāi)發(fā)效率，更代表著在核心認(rèn)知能力上的突破。

然而，適用于編程場(chǎng)景的大模型長(zhǎng)期被Claude、GPT等少數(shù)海外閉源大模型家族主導(dǎo)。當(dāng)全球開(kāi)發(fā)者的生產(chǎn)力工具高度集中于少數(shù)幾家美國(guó)大模型廠商時(shí)，配套的技術(shù)供應(yīng)鏈便存在較大風(fēng)險(xiǎn)。此前，Claude、GPT系列模型都曾出現(xiàn)的斷供風(fēng)波，就是最好的印證。

此次，GLM-4.6不僅打造出了一款SOTA級(jí)別的開(kāi)源編程模型，還在國(guó)產(chǎn)模型與國(guó)產(chǎn)芯片的適配上實(shí)現(xiàn)突破。GLM-4.6發(fā)布當(dāng)天，寒武紀(jì)與摩爾線程就實(shí)現(xiàn)了Day 0適配。

GLM-4.6能在寒武紀(jì)的國(guó)產(chǎn)芯片上實(shí)現(xiàn)FP8+Int4混合量化部署，保持精度不變，但能大幅度降低推理成本。摩爾線程基于vLLM推理框架完成了對(duì)GLM-4.6的適配，新一代GPU可在原生FP8精度下穩(wěn)定運(yùn)行模型。

更重要的是，上述方案不會(huì)僅僅停留在實(shí)驗(yàn)室，還即將通過(guò)智譜MaaS平臺(tái)正式面向大眾和企業(yè)提供服務(wù)，讓產(chǎn)業(yè)真正從中受益，也為打造更為獨(dú)立自主的國(guó)產(chǎn)AI生態(tài)做出了貢獻(xiàn)。

中國(guó)AI模型已在一次次迭代中，擺脫了“廉價(jià)替代品”的刻板印象，轉(zhuǎn)而成為全球AI生態(tài)中不可或缺的力量。它們或憑借獨(dú)特優(yōu)勢(shì)與海外模型形成強(qiáng)力互補(bǔ)，或在特定場(chǎng)景中完美取代昂貴方案，為用戶提供兼具價(jià)格優(yōu)勢(shì)與性能的選擇。

當(dāng)海外開(kāi)發(fā)者開(kāi)始主動(dòng)測(cè)試、比較并最終選擇中國(guó)模型時(shí)，這種轉(zhuǎn)變所帶來(lái)的機(jī)遇，遠(yuǎn)超出單純的市場(chǎng)份額競(jìng)爭(zhēng)。

結(jié)語(yǔ)：當(dāng)中國(guó)AI贏得全球開(kāi)發(fā)者之心

從今年年初的DeepSeek-R1，到萬(wàn)億參數(shù)大模型Kimi-K2，再到開(kāi)源SOTA編程模型GLM-4.6，中國(guó)大模型廠商們正在一步一步改變?nèi)蜷_(kāi)發(fā)者和企業(yè)對(duì)中國(guó)AI技術(shù)的認(rèn)知。

智譜敏銳地把握住了這一趨勢(shì)，近期在國(guó)際化布局上動(dòng)作頻頻：今年啟用了更具國(guó)際范兒的z.ai域名，與全球開(kāi)源社區(qū)、開(kāi)發(fā)者社區(qū)的互動(dòng)也更加頻繁。

這些舉措，正逐漸樹(shù)立國(guó)內(nèi)大模型玩家作為全球AI生態(tài)的積極參與者的形象。以智譜為代表的中國(guó)企業(yè)，已在全球AI舞臺(tái)上扮演著越來(lái)越重要的角色。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.