夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

連續(xù)發(fā)布兩款萬億參數(shù)模型,螞蟻 AI 來勢洶洶

0
分享至



大模型開源生態(tài)有了新變化。

作者丨齊鋮湧

編輯丨陳彩嫻

剛剛過去的國慶,各行各業(yè)進入放假模式,但大模型行業(yè)卻一刻也沒閑著。

過去的半個月,國內(nèi)外大模型的頭部團隊有十余款重磅產(chǎn)品發(fā)布,但每個團隊的產(chǎn)品側(cè)重不同。

其中,九月下旬,阿里發(fā)布以 Qwen3-Max 為代表的全家桶產(chǎn)品,大秀了一把肌肉;九月末,DeepSeek 和 Anthropic 瞄準(zhǔn)真實編程場景,先后發(fā)布了 DeepSeek V3.2-Exp 和 Claude Sonnet 4.5,此外,智譜也拿出 GLM-4.6,目標(biāo)沖擊國內(nèi)最強代碼模型。

有人全盤布局,也有人專攻精尖,在大模型領(lǐng)域競爭駛向深水區(qū)后,各個公司戰(zhàn)略路線出現(xiàn)了分野。

10 月 9 日凌晨,螞蟻百靈大模型團隊奇襲般官宣了一款自家最新語言大模型 Ling-1T,參數(shù)量達到 1000B(即 1萬億參數(shù))。然而,就在十天前,百靈團隊才將自研 Ring-1T-preview 大模型開源。

短短十天內(nèi),發(fā)布并開源兩款萬億參數(shù)模型,如此密集的產(chǎn)品發(fā)布讓螞蟻百靈大模型成為了行業(yè)熱議對象。

與此同時,這樣毫無保留的開源動作,也讓業(yè)界猜測:螞蟻到底意圖何在?

01

探索智能上限是終極目標(biāo)

據(jù)了解,螞蟻集團研發(fā)的基礎(chǔ)大模型取名“百靈”,寓意“百試百靈”,也蘊含科技普惠之意,和阿里一樣,螞蟻也是獨立團隊獨立研發(fā),Ling-1T 和 Ring-1T-preview 分別是螞蟻百靈團隊研發(fā)的非思考模型和思考模型。

過去半年時間里,螞蟻一直在對百靈大模型進行迭代優(yōu)化,并且自上而下形成了三條技術(shù)探索路線:

一條是以 MoE 架構(gòu)為基礎(chǔ)的非思考模型 Ling-Series,另一條是思考模型 Ring-Series,第三條是原生全模態(tài)大模型 Ming-Series 。

如今,螞蟻百靈團隊在 Ling 和 Ring 兩款模型路線上都已經(jīng)將參數(shù)量擴大到萬億參數(shù)。

萬億參數(shù),幾乎等同于人類大腦神經(jīng)元數(shù)量,相當(dāng)于讓 AI 擁有等同于人腦的處理能力,但萬億參數(shù)非常難訓(xùn)。目前,國內(nèi)能達到萬億參數(shù)規(guī)模的大模型也是鳳毛麟角。

除了剛才提到的百靈大模型 Ling-1T 和 Ring-1T-preview ,目前國內(nèi)公開資料可查的萬億參數(shù)大模型只有 Kimi K2、阿里 Qwen3-Max 和騰訊混元大模型等少數(shù)幾個模型,可見大模型領(lǐng)域“萬億俱樂部”的門檻之高。

雖然今年以來盛行“數(shù)據(jù)撞墻論”和“預(yù)訓(xùn)練終結(jié)”的觀點,但越來越多科學(xué)家也形成了一個新的共識:更大的參數(shù),更多的數(shù)據(jù),仍然能帶來持續(xù)的性能提升。

阿里的算法負責(zé)人林俊旸公開表態(tài):Scaling Law 仍然沒見頂,訓(xùn)練數(shù)據(jù)的增加,參數(shù)規(guī)模的擴大,都還能看到模型性能的提升。

楊植麟的Kimi 團隊更是克服萬難悶頭苦干,終于在兩個月前,拿出了萬億參數(shù)的旗艦?zāi)P蚄2。通義千問團隊直接提出了“大就是好”的暴論,并且讓 Qwen3 堅定不移地沿著“Just Scale it”的擴展路徑前進。

由此可見,大家都還在朝著“探索智能上限”出發(fā)。

02

百靈大模型加速涌現(xiàn)

據(jù)了解,過去一年里,平均7天就有一款高性能大模型誕生??梢哉f,國內(nèi)不缺大模型。

但在參數(shù)和效率之間,能做到完美平衡的大模型卻不多。

就拿萬億參數(shù)模型來說,模型變大了,往往會犧牲推理速度,推理速度上去了,準(zhǔn)確率又很難達到。業(yè)界知名的旗艦款大參數(shù)模型,都能在推理能力和思考效率上做到很不錯的平衡。

這個平衡點,被稱之為帕累托最優(yōu),我們經(jīng)常用多維基準(zhǔn)測試的分數(shù)來量化對比。這次螞蟻發(fā)布的 Ling-1T 在公開的對比榜單中,表現(xiàn)讓人非常意外。

下圖是 Ling-1T 在部分權(quán)威基準(zhǔn)評測的表現(xiàn),紅色加粗代表 Ling-1T 的得分獲得 Top1,黑色加粗下劃線表示 Top2:


我們重點關(guān)注的編程與數(shù)學(xué)推理( Coding & Math )兩個維度上,Ling-1T 表現(xiàn)非常亮眼,甚至多個得分超過 DeepSeek。在知識理解方面,Ling-1T 也比Kimi、GPT-5 主干模型等的得分,高出幾分。

這意味著,Ling-1T 的深度思考能力和泛化能力,以及邏輯推理能力,都非常全面。因此,Ling-1T 會非常擅長從事代碼生成、軟件開發(fā)、競賽數(shù)學(xué)、專業(yè)數(shù)學(xué)、邏輯推理等場景。

但對于萬億參數(shù)模型來說,除了綜合性能,還需要考慮一個問題:推理正確率。這就需要引入競賽數(shù)學(xué)榜單 AIME 25 競賽數(shù)學(xué)榜單 AIME 25 的挑戰(zhàn),Ling-1T 的成績?nèi)缦拢?/p>


Ling-1T 在 AIME 25 測試中,與 DeepSeek-V3.1-Terminus、Kimi-K2-Instruct-0905 (開源)以及 GPT-5-main、Gemini-2.5-Pro (閉源)這些旗艦?zāi)P蛯Ρ?,展示出更短的思考路徑和更高的推理?zhǔn)確率,能做到支持 128K 長文本窗口處理能力,每個 token 做到約 50B 參數(shù)的激活量。

這樣的成績,源自螞蟻百靈團隊長時間的積累與創(chuàng)新。

依托于團隊儲備的二十萬億 Token 高質(zhì)量文本語料訓(xùn)練,Ling-1T 吃進了大量優(yōu)質(zhì)知識。在預(yù)訓(xùn)練階段, Ling-1T 的訓(xùn)練團隊讓由 Ling Scaling Laws 自我設(shè)置關(guān)鍵超參,簡單地說,就是讓大模型自我優(yōu)化。

同時在強化訓(xùn)練階段,加入了百靈團隊原創(chuàng)的 LPO 策略優(yōu)化算法,讓模型回答得更對。

此外,團隊還額外提出了“語法-功能-美學(xué)”的混合獎勵機制,提高模型審美。下面這張是 Ling-1T 工程師繪制的模型架構(gòu)圖:


不止是剛發(fā)布的 Ling-1T 和9月30日發(fā)布的 Ring-1T-preview ,螞蟻實際上已經(jīng)形成了完整的百靈大模型家族。

從尺寸上,包含從160億總參數(shù)到1萬億總參數(shù)的大語言模型產(chǎn)品矩陣;從模態(tài)上,包含了能看能聽能說能畫的,從理解到生成能統(tǒng)一的大模型;

從場景上,也形成了包括手機上可以運行的 Ling-mini,還有能在中小企業(yè)服務(wù)器上部署的 Ling-flash,以及云端可調(diào)用的 Ling-1T。


這些模型,在過去一段時間,無論是社區(qū)榜單還是實際使用上,都得到了很多有效回應(yīng)。

螞蟻百靈團隊開發(fā)的全模態(tài)模型 Ming-lite-omni v1.5 甚至在 Hugging Face 模型趨勢榜(any to any)排到過第一的位置。

Ring-1T-preview 發(fā)布完的第二天,就沖上了 Hugging Face 模型榜 Text Generation 總榜排名第三,排名第四的也是9月 Ling 團隊發(fā)布的混合架構(gòu)思考模型 Ring-flash-linear-2.0 。


圖靈獎得主 Yann LeCun(楊立昆)甚至點贊并評論“Impressive”(了不起),了解這位特立獨行大佬的網(wǎng)友表示:“ LeCun 愿意給 LLM(大模型)說句好話不容易”。


一位蘋果工程師量化完跑起來模型,評價螞蟻百靈模型的性能“Getting closer to GPT-5 at home”(在本地部署上的性能接近 GPT-5)。


這些技術(shù)從業(yè)者和開發(fā)者們的真實聲音,給予了百靈模型非常正向的反饋。

03

探索 AGI ,亟需參與者們的共建意識

百靈團隊,如此快速地躋身“萬億參數(shù)俱樂部”,背后跟螞蟻的戰(zhàn)略動作分不開。作為一家成立了20年的互聯(lián)網(wǎng)公司”,螞蟻在 AI 領(lǐng)域的投入一直是非常巨大的。

去年螞蟻20周年時候,螞蟻集團董事長井賢棟宣布:未來20年,螞蟻要做一家科技驅(qū)動、創(chuàng)新驅(qū)動的公司。螞蟻集團還提出了 AI First 戰(zhàn)略,并將其與“支付寶雙飛輪”和“加速全球化”一齊,并稱為螞蟻集團的三大戰(zhàn)略。

而 Ling-1T 和 Ring-1T-preview 的出現(xiàn),則是螞蟻 AI First 戰(zhàn)略持續(xù)加速的表現(xiàn)。

不選擇閉源道路,而是選擇了開源,足以證明,螞蟻想干一件更長遠的事:

通過技術(shù)開放的方式,不斷迭代技術(shù),構(gòu)建一個真正開放的 AGI 生態(tài)。

根據(jù) AI 科技評論了解,目前“萬億參數(shù)俱樂部”里能做到完全開源的,只有螞蟻百靈的 Ling-1T 和 Ring-1T-preview ,以及 Kimi 的 K2。

在大模型參數(shù)軍備競賽愈演愈烈的 2025 年,投入如此巨大之后,螞蟻選擇直接開源,看似讓人費解。

但如果了解大模型開源背后的意圖,就會明白,當(dāng) Ling-1T 和 Ring-1T-preview 這樣萬億參數(shù)模型,公布了背后的訓(xùn)練數(shù)據(jù)、算法、模型,開發(fā)者可以直接利用這些“龐然大物”作為起點,快速構(gòu)建復(fù)雜的應(yīng)用程序,無需關(guān)心底層模型的訓(xùn)練。一個“使用-反饋-迭代”的正向循環(huán),將極大推動技術(shù)共建,加快智能涌現(xiàn)。

這條"技術(shù)平權(quán)化"的道路,我們并不陌生。今年年初,DeepSeek 的橫空出世,已經(jīng)為眾多中國大模型頭部玩家們指明了道路。

今年接任螞蟻集團 CEO 的韓歆毅,曾在內(nèi)部技術(shù)日上表達了螞蟻 AI 的主張:

“大家說(螞蟻)聚焦 AI 應(yīng)用,還要不要做基礎(chǔ)大模型,年初討論的時候我們答案非常堅決,一定要,因為如果基于 AI 做服務(wù)和應(yīng)用,就像訓(xùn)練一個人去做所有的事,追求智能上限,會讓這個人更加聰明,能夠做更多、更好的服務(wù)。我們很堅定去探索 AGI 、探索智能上限?!?/p>

螞蟻還專門成立了 InclusionAI 開源組織,建設(shè)了大模型全棧技術(shù),包含強化學(xué)習(xí)推理框架 AReaL、多智能體框架 AWorld 等,這些技術(shù)也已經(jīng)通過開源、開放合作的形式與行業(yè)共享共建,讓創(chuàng)作者可以交流共創(chuàng)。

能看得出來,相比于登臺唱戲,螞蟻更加愿意把戲臺搭好,AI 的基礎(chǔ)設(shè)施鋪設(shè)好,才能吸引更多的人來共建,真正邁向 AGI 。


未經(jīng)「AI科技評論」授權(quán),嚴禁以任何方式在網(wǎng)頁、論壇、社區(qū)進行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標(biāo)注來源并插入本公眾號名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
荷蘭鐵了心不還管理權(quán)!談判卡殼,真要等“60天稀土耗盡”才回頭

荷蘭鐵了心不還管理權(quán)!談判卡殼,真要等“60天稀土耗盡”才回頭

古裝影視解說阿兇
2025-10-26 15:11:01
陜西某消防救援大隊長涉嫌嚴重違紀(jì)違法被查

陜西某消防救援大隊長涉嫌嚴重違紀(jì)違法被查

曹剛律師
2025-10-27 14:46:39
直觀感受烏克蘭被占領(lǐng)土面積!占領(lǐng)整個烏克蘭,俄軍要耗費上百年

直觀感受烏克蘭被占領(lǐng)土面積!占領(lǐng)整個烏克蘭,俄軍要耗費上百年

鷹眼Defence
2025-10-25 18:17:40
長期在軍工系統(tǒng)任職的中管干部被開除黨籍,近兩年該領(lǐng)域已有多人被查

長期在軍工系統(tǒng)任職的中管干部被開除黨籍,近兩年該領(lǐng)域已有多人被查

上觀新聞
2025-10-27 15:09:03
為了“掏空”老百姓的錢袋子,編造出來的5大謊言,誰信誰倒霉?

為了“掏空”老百姓的錢袋子,編造出來的5大謊言,誰信誰倒霉?

貓叔東山再起
2025-10-27 08:20:09
全球覆蓋的“海燕”導(dǎo)彈試射成功,專家警告放射性污染隱患不可小覷

全球覆蓋的“海燕”導(dǎo)彈試射成功,專家警告放射性污染隱患不可小覷

書中自有顏如玉
2025-10-27 15:01:28
中俄通婚劇增,若不了解俄羅斯女性生理缺陷,婚后可能會很痛苦

中俄通婚劇增,若不了解俄羅斯女性生理缺陷,婚后可能會很痛苦

南權(quán)先生
2025-10-25 11:39:34
女子酒后誤開鄰居家門:酒醒時竟躺在鄰居懷里,昨晚被他得逞了?

女子酒后誤開鄰居家門:酒醒時竟躺在鄰居懷里,昨晚被他得逞了?

飛云如水
2024-04-12 18:45:48
中國將迎來前所未有的死亡高峰,專家給出答案:是這些因素導(dǎo)致的

中國將迎來前所未有的死亡高峰,專家給出答案:是這些因素導(dǎo)致的

老謝談史
2025-10-27 16:36:25
首個航班已降落廣州,時隔5年中印正式恢復(fù)直航

首個航班已降落廣州,時隔5年中印正式恢復(fù)直航

第一財經(jīng)資訊
2025-10-27 08:30:10
鄭智化登機視頻片段曝光,沒有“連滾帶爬”,網(wǎng)友質(zhì)疑:表述過度夸大

鄭智化登機視頻片段曝光,沒有“連滾帶爬”,網(wǎng)友質(zhì)疑:表述過度夸大

動物奇奇怪怪
2025-10-27 09:52:45
男子放棄家庭,住橋洞里研究彩票10年,每天喝1斤酒,抽2包煙

男子放棄家庭,住橋洞里研究彩票10年,每天喝1斤酒,抽2包煙

熱風(fēng)追逐者
2025-09-29 02:40:03
谷正文到死都沒想明白:為什么陳寶倉一被捕,吳石就全部都招了!

谷正文到死都沒想明白:為什么陳寶倉一被捕,吳石就全部都招了!

何氽簡史
2025-10-26 08:07:14
38歲港姐素顏出席親子活動,嫁富商7年生活樸實,辭退傭人自帶娃

38歲港姐素顏出席親子活動,嫁富商7年生活樸實,辭退傭人自帶娃

賈媽的幸福生活
2025-10-27 15:36:17
男子把賺來的錢都交給女友保管,結(jié)果女友花了200多萬在臉上!男友崩潰了...

男子把賺來的錢都交給女友保管,結(jié)果女友花了200多萬在臉上!男友崩潰了...

FM93浙江交通之聲
2025-10-27 16:22:05
袁世凱墓地取名“袁陵”,全國上下反對,徐世昌改一字完美解決

袁世凱墓地取名“袁陵”,全國上下反對,徐世昌改一字完美解決

興趣知識
2025-10-12 18:41:55
章澤天瘦得驚人,燙了頭發(fā)后更放飛自我,和杜海濤擺拍

章澤天瘦得驚人,燙了頭發(fā)后更放飛自我,和杜海濤擺拍

鄉(xiāng)野小珥
2025-10-26 06:59:35
華人五大世界級科學(xué)家,錢老第三,華羅庚未上榜,楊振寧讓人意外

華人五大世界級科學(xué)家,錢老第三,華羅庚未上榜,楊振寧讓人意外

春秋論娛
2025-10-25 07:20:23
6中6三分22罰全中!里夫斯封神一戰(zhàn),四大真相揭湖人沖冠底牌

6中6三分22罰全中!里夫斯封神一戰(zhàn),四大真相揭湖人沖冠底牌

體壇黑馬
2025-10-27 16:36:59
美國傻眼了?蒙古親美派扳倒親華總理,卻把自己也搭了進去

美國傻眼了?蒙古親美派扳倒親華總理,卻把自己也搭了進去

云舟史策
2025-10-26 07:20:38
2025-10-27 17:28:49
AI科技評論 incentive-icons
AI科技評論
點評學(xué)術(shù),服務(wù)AI
6954文章數(shù) 20698關(guān)注度
往期回顧 全部

科技要聞

中國人造太陽預(yù)計2027年竣工

頭條要聞

兩架美軍機相繼在南海墜毀 中方回應(yīng)

頭條要聞

兩架美軍機相繼在南海墜毀 中方回應(yīng)

體育要聞

虎頭蛇尾的國家德比,在哨響后迎來高潮

娛樂要聞

楊冪 15 年情路大起底

財經(jīng)要聞

貝森特:美方不再考慮對華加征100%關(guān)稅

汽車要聞

對話蘇偉銘:絕地反擊,雷諾的一劑「中國良方」

態(tài)度原創(chuàng)

房產(chǎn)
本地
時尚
健康
公開課

房產(chǎn)要聞

領(lǐng)跑珠城20萬+成交!凱旋新世界,憑何成為全球資本青睞的“恒穩(wěn)資產(chǎn)”?

本地新聞

這個秋天,一起來粉上漓渚!所有風(fēng)景只為等你

歲月不敗美人!賈靜雯、楊謹華、林心如,她們的40歲比20歲更美

骨頭"咔咔響"?肌骨超聲到底有何用

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 国产精品五月天久久| 色哟哟 国产精品| 国产又色又爽又黄又免费| 亚洲欧美日韩尤物AⅤ一区 | 日本中文一区二区三区亚洲| 无码中文字幕综合网| 国产成人精品a视频| 日韩国产综合熟女88| 福利乱码卡一卡二卡新区| 50熟妇一区二区三区| 国产区亚洲一区在线观看| 淫荡黄色视频网站| 亚洲国产成人乱码| 久久精品国产亚洲AV无码城中村| 天天躁日日躁狠狠躁人妻| 日韩大片高清播放器| 男人的天堂色| 日本边添边摸边做边爱喷水| 玩弄japan白嫩少妇hd| 91色综合综合热五月激情| 人妻少妇精品无码区| 干老熟女干老穴干老女人 | 免费精品国偷自产在线在线| 亚洲av午夜国产精品无码中文字 | 特级毛片在线大全免费播放| 亚洲尺码电影av久久| 免费强奸三级片九九| 成人免费网站MYU88| 国产精品自在线拍国产电影| 精品亚洲成在人线av无码| 久久久精品国产sm调教网站| 蜜桃伍月婷婷| 久久亚洲av成人出白浆无码国产| 2012国语在线看免费观看视频| 亚洲av资源站| 91精品久久久久久综合| 日本18禁免费| 韩日美无码精品无码| 黑人大战孕妇14p| 日韩精品无码一区二区三区av| 国产强奸乱伦2|