夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網易首頁 > 網易號 > 正文 申請入駐

螞蟻 Ling-1T 開源:基礎語言模型、1T參數、MoE架構|所有信息都在這了

0
分享至

螞蟻的 Ling-1T 終于發(fā)了,大半夜的

中文叫百靈,1T 參數,Instruct 版本、非推理、MoE架構


HuggingFace:https://huggingface.co/inclusionAI/Ling-1T

GitHub:https://github.com/InclusionAI/Ling


在線體驗:ling.tbox.cn(有 API)

對于海外用戶/開發(fā)者,還有個神奇的網站

ZenMux:https://zenmux.ai/inclusionai/ling-1t


國慶期間,提前玩了玩,素質ok

說這模型之前,容我先說螞蟻:


  • 這個螞蟻,就是「螞蟻森林」、「支付寶」的那個螞蟻
  • 螞蟻的AI組織,叫 InclusionAI
  • 螞蟻的模型,統(tǒng)稱為百靈大模型,不是阿里的 Qwen
    • Ling:語言模型,L 取自 Linguistics
    • Ring:思考模型,R 取自 Reasoning
    • Ming:多模態(tài)模型,M 取自 Multi-modality

理清這些很重要,別搞混了

小聲逼逼

螞蟻下個模型可以叫 King

King 和 Qwen 組 CP

Ling-1T 發(fā)布

這款模型,官方定位是「旗艦級非思考模型」,基本信息如下:


  • 1T MoE,51B 激活
  • 128K 上下文
  • 20T+ token 語料預訓練

注意,這里有個關鍵詞:非思考模型

最開始的時候,大家的模型都是「非推理」的

比如原始的 ChatGPT:你提問,模型答,沒有思考

但從去年這時候開始,各家都在卷思考模型(你也可以叫它「推理模型」,就是 Reasoning Model),最早是 OpenAI 的 o1,然后是大火的 DeepSeek-R1...


思考模型是這樣:

給模型更多時間、中間 token,讓他用更長的推理鏈來提升準確率

你問它一道數學題,它會輸出幾千甚至上萬 tokens 的內部思考,然后給你答案

Ling-1T 的目標不一樣:

在有限的輸出 token 下,直接給出高質量的推理結果

看一組來自官方的對比,在 AIME 25,也就是美國 25 年的高中數學競賽中:


  • Ling-1T:準確率 70.42%,平均推理長度約 4300 tokens
  • Gemini-2.5-Pro(開 thinking 模式):準確率 70.10%,平均推理長度約 7000 tokens

準確率差不多,但 Ling-1T 用的 token 少了 40%


對于其他評測,數據如下(圖片來自官方),大致就是:開源第一梯隊



不過...等等,我看了一眼對比圖里的其他模型數據,有點不對勁

比如 GPT-5 的 AIME25 分數,圖里顯示是 60 多分,但我印象里 OpenAI 發(fā)布的時候不是說 90+ 嗎?

然后我專門去查了下 OpenAI 的官方發(fā)布記錄...


Hhhhh 什么神奇的障眼法

GPT-5 裸出結果(不開思考模式)的前提下

AIME 2025 的官方分數只有 61.9%

月之暗面前段時間發(fā)布 K2,也是 1T 參數,我拉來了里面的跑分

...OpenAI 在圖里的分數是 37?


仔細一看,月之暗面選取的是 GPT-4.1

其實吧...一點毛病沒有

雖然現在的 K2,版本號是 0905,GPT-5 已經出來

但 K2-instruct 發(fā)布的時候是 7月11日,GPT-5 還沒出

在當時,OpenAI 家當時最強模型,確實是 GPT 4.1


(順道吐槽,GPT的發(fā)布順序 4.5->4.1->5)

各家對比的時候,選的參照模型版本都不一樣

但不管怎么說,Ling-1T 在非思考模型里的表現確實不錯

技術實現

有關這個模型的訓練,我來簡單說一下吧

分架構、預訓練和后訓練三塊


架構

Ling-1T 用的是 MoE 架構:


  • 1T 總參數
  • 256 個專家
  • 每次激活約 51B 參數

有個細節(jié):前幾層用的是密集結構(Dense),后面才切換到 MoE。這種設計能在保證基礎能力的同時,通過稀疏激活降低推理成本

至于為什么...說實話,我理解的不夠深

于是問了這個模型的負責人,表示說:

first k dense 的設計,主要是為了降低淺層網絡的負載不均衡;

淺層如果是 moe 的話,專家路由不均衡度會很高

改成前k個dense,后面再接moe,可以緩解這個問題

預訓練

在預訓練中,有三個階段:


  1. 1.Pretrain Stage 1(10T token):高知識密度語料
  2. 2.Pretrain Stage 2(10T token):高推理密度語料,整體推理語料占比超過 40%
  3. 3.Mid-training:擴展上下文到 128K,加入思維鏈語料

這里的思路是:從一開始就訓練推理能力

另外,Ling-1T 全程用的是 FP8 精度訓練,這是目前最大規(guī)模的 FP8 訓練。相比 BF16,FP8 能省顯存、提升訓練速度,而且在 1T token 的對比實驗中,Loss 偏差只有 0.1%

后訓練

螞蟻提出了 LPO 方法(Linguistics-Unit Policy Optimization),并表示:對于推理任務,句子是更符合語義邏輯的動作單元


不同方法的訓練效果,百靈團隊提供

另外的,對于這些方法,這里做個小的辨析:


  • GRPO:按 token 優(yōu)化
  • GSPO:按整個序列優(yōu)化
  • LPO:按句子優(yōu)化

實測

我得說,這個模型是超出我的預期的,比如我讓他去做一個粒子波浪

當然,還可以再來個宇宙演化史

對于常規(guī)任務,比如信息卡片,也不在話下,內容就是他自己


有一說一,美術風格很討喜,個人覺得甚至比 Claude Sonnet 4.5 好

對此,螞蟻的朋友跟我說:

前端之前有專門優(yōu)化過,也還在持續(xù)優(yōu)化中

而對于 svg 的任務,也ok的,比如我讓他

畫一個 svg 動畫:百靈鳥在盡情歌舞

給到了這個,還是可以的,甚至還有偽 3D

(但微信里面?zhèn)鞑涣诉@么復雜的 svg,這里放個 gif)


我讓 Claude 也畫了個,大概是這樣


百靈鳥在盡情歌舞

但也要控制預期:

指令理解這塊,Ling 比 Claude 還是有差距的

螞蟻的 AI

老實說,很多人可能不知道:螞蟻還在訓模型

從 2023 年開始,螞蟻就確立了「AI First」戰(zhàn)略,悶聲搞事情

從底層,到應用,搞了一整套的完整生態(tài)

模型層,有三個系列


  • Ling(語言模型):這次發(fā)的 Ling-1T 就是這個系列
  • Ring(思考模型):對標 o1、R1 那種,之后會發(fā)
  • Ming(多模態(tài)模型):就像 Ming-lite-omni v1.5,能處理圖像、文檔、視頻、語音
  • 以及...這里還有個實驗版本 LLaDa-MoE,是行業(yè)內首個 MoE 的擴散語言模型

框架層,開源了兩個東西


  • AWorld:多智能體系統(tǒng)框架,在 GAIA benchmark 上拿了開源項目第一,77.08 分
  • AReaL:專門為 LLM 推理和 Agent 優(yōu)化的強化學習框架

應用層,分 C 端和 B 端

C 端有三個AI 管家,都在支付寶里:


  • AI 健康管家AQ:連接全國近百萬醫(yī)生,能找醫(yī)生、讀報告、陪看診、問醫(yī)保
  • AI理財管家螞小財:提供行情分析、持倉診斷、資產配置和投教陪伴等個性化金融服務
  • AI生活管家:能幫你規(guī)劃旅游、查快遞、交話費...語音喚起支付寶上的生活服務

B 端也有兩個:


  • 數字螞力:專門成立的公司,做 AI 人機融合的企業(yè)服務,涵蓋招聘培訓、客戶服務、技術開發(fā)等
  • 百寶箱:智能體開發(fā)平臺,商家機構可以 0 代碼、1 分鐘創(chuàng)建專屬智能體,發(fā)布到支付寶

在這里,螞蟻的打法有點不一樣:沒卷陪聊、生產力工具,沿著支付寶構建生活應用

這里做了張分享圖,通過 Ling 畫的,挺好看的


最后

在國慶假期的時候,和螞蟻的技術人員也聊了聊,感覺很扎實

螞蟻家的模型,這次是 Instruct 先發(fā),思考模型 Ring 之后也會來

對于即將要發(fā)的 Ring,跑分暫時是這樣(還在提升ing)


而 Ling,現在正式發(fā)布了,也有 API 能用,感興趣的可以去跑跑看

HuggingFace:https://huggingface.co/inclusionAI/Ling-1T

GitHub:https://github.com/InclusionAI/Ling

在線體驗:ling.tbox.cn(提供 API)

聲明:包含AI生成內容

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
上海警方通報:詹某(女,30歲)因垃圾堆放問題,與鄰居劉某(男,81歲)等3人發(fā)生肢體沖突,已立案

上海警方通報:詹某(女,30歲)因垃圾堆放問題,與鄰居劉某(男,81歲)等3人發(fā)生肢體沖突,已立案

極目新聞
2025-11-05 14:43:38
賴清德下令臺軍備戰(zhàn),蔣萬安亮明態(tài)度反對統(tǒng)一!臺海局勢一觸即發(fā)

賴清德下令臺軍備戰(zhàn),蔣萬安亮明態(tài)度反對統(tǒng)一!臺海局勢一觸即發(fā)

剛哥說法365
2025-11-04 10:32:20
貝克漢姆升咖!苦熬20多年,從此也是英王欽點的爵爺了...

貝克漢姆升咖!苦熬20多年,從此也是英王欽點的爵爺了...

英國那些事兒
2025-11-05 23:13:56
朱元璋御審貪官幼女,女孩卻指著龍椅問了一句,滿朝文武瞬間死寂

朱元璋御審貪官幼女,女孩卻指著龍椅問了一句,滿朝文武瞬間死寂

凱裕說故事
2025-10-28 11:34:31
“治港敗類”曾蔭權:治理香港7年,為何卻在卸任后,獲刑20個月

“治港敗類”曾蔭權:治理香港7年,為何卻在卸任后,獲刑20個月

卷史
2025-09-15 11:50:59
申花后悔嗎?巨款買來“水貨”,低級失誤+阻擋本方進球,已淪為笑柄

申花后悔嗎?巨款買來“水貨”,低級失誤+阻擋本方進球,已淪為笑柄

冷桂零落
2025-11-06 01:36:29
祝賀!邵佳一當選國足主帥,2新星鎖定國腳資格,年輕化全面提速

祝賀!邵佳一當選國足主帥,2新星鎖定國腳資格,年輕化全面提速

國足風云
2025-11-05 18:48:00
歐冠一夜動態(tài):國米4連勝,切爾西巴薩造恥辱紀錄,曼城大勝多特

歐冠一夜動態(tài):國米4連勝,切爾西巴薩造恥辱紀錄,曼城大勝多特

釘釘陌上花開
2025-11-06 06:34:17
林志穎痊愈了?曾因沒有女兒倍感遺憾,陳若儀肚大腰圓疑懷四胎

林志穎痊愈了?曾因沒有女兒倍感遺憾,陳若儀肚大腰圓疑懷四胎

八星人
2025-11-05 15:43:19
4-1!2-0!英超6強歐冠強勢:4隊進前八+有望全出線,圍剿拜仁

4-1!2-0!英超6強歐冠強勢:4隊進前八+有望全出線,圍剿拜仁

體育知多少
2025-11-06 07:30:13
馬雷斯卡:我們的丟球有點愚蠢;埃斯特旺表現很出色

馬雷斯卡:我們的丟球有點愚蠢;埃斯特旺表現很出色

懂球帝
2025-11-06 05:26:52
往哈馬斯躲藏的地道里灌混凝土,內塔尼亞胡如此“殘暴”?

往哈馬斯躲藏的地道里灌混凝土,內塔尼亞胡如此“殘暴”?

山河路口
2025-11-05 14:11:46
絕了,才打半個月就受傷!錫安淪為笑柄,連續(xù)報銷,空拿2億薪資

絕了,才打半個月就受傷!錫安淪為笑柄,連續(xù)報銷,空拿2億薪資

阿泰希特
2025-11-05 14:22:54
陳治珍:2種水果煮水喝,清肺養(yǎng)脾胃,孩子少生病、鼻炎少復發(fā)

陳治珍:2種水果煮水喝,清肺養(yǎng)脾胃,孩子少生病、鼻炎少復發(fā)

蠟筆小小子
2025-10-21 15:03:27
突然刷屏:“退卡、差評!”山姆深夜回應

突然刷屏:“退卡、差評!”山姆深夜回應

每日經濟新聞
2025-11-04 14:01:07
英超前10輪與上賽季同期積分對比:阿森納、利物浦積分互換

英超前10輪與上賽季同期積分對比:阿森納、利物浦積分互換

懂球帝
2025-11-06 00:05:53
返回臺灣!“館長”強烈安利記者去大陸玩

返回臺灣!“館長”強烈安利記者去大陸玩

看看新聞Knews
2025-11-06 01:04:03
為什么瑞典沒幾個中國人待得???在瑞典生活幾個月,不瘋也抑郁!

為什么瑞典沒幾個中國人待得住?在瑞典生活幾個月,不瘋也抑郁!

百態(tài)人間
2025-11-05 05:15:03
河北原副市長被逮捕,是河北人熟悉的他

河北原副市長被逮捕,是河北人熟悉的他

新牛城
2025-11-05 19:33:49
不會吃別尬吃!《樹影迷宮》廖凡吃餡餅,讓假吃演員無地自容

不會吃別尬吃!《樹影迷宮》廖凡吃餡餅,讓假吃演員無地自容

糊咖娛樂
2025-11-05 11:33:50
2025-11-06 08:56:49
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
157文章數 9關注度
往期回顧 全部

科技要聞

蘋果“認輸”!曝每年10億美元租用谷歌AI

頭條要聞

記者問了歐盟一個“有趣”的問題 然后被解雇了

頭條要聞

記者問了歐盟一個“有趣”的問題 然后被解雇了

體育要聞

贏下皇馬,會是利物浦的轉折點嗎?

娛樂要聞

港星林尚武突發(fā)心臟病去世

財經要聞

特朗普關稅遭美國高院大法官輪番質疑

汽車要聞

智己LS9入局"9系"混戰(zhàn) 全尺寸SUV市場迎來新變量

態(tài)度原創(chuàng)

游戲
房產
時尚
親子
本地

晨報|《胡鬧廚房》改編真人秀 暴雪嘉年華即將開票

房產要聞

最新!海南樓市10月熱銷榜單出爐!

中國色特別策劃 | 故宮技藝與古意新生

親子要聞

一個媽媽已然開竅了的9種表現

本地新聞

這屆干飯人,已經把博物館吃成了食堂

無障礙瀏覽 進入關懷版 日韩 国产 影院| 国产99视频精品免费播放照片| 性爱av无码| 理论片一区| 欧美日韩亚洲国内综合网| 久热中文字幕在线观看| 老色鬼在线精品视频在线观看| 亚洲一区 熟妇| 亚洲欧美丝袜精品久久中文字幕| we一区二区色com| 高潮无码合集| 精品一区二区三区自拍图片区| 女大破处在线免费| 无码国产精品69久久久久孕妇| 亚洲偷自拍另类一区二区| 激情电影激情图片激情小说| 精品欧美成人高清在线观看| 国产内射爽爽大片| 啊v视频在线| 午夜麻豆视屏| 亚洲精品无码99久久| 99热精品免费观看| 色伦专区97中文字幕| 国产香蕉99久久99| 中文字幕自拍偷拍福利视频| 黑人与亚洲A级黄片| 好男人www免费高清视频在线观看| 国内揄拍国内精品人妻| 性一交一乱一伦一色一情丿按摩| 婷五月丁香俺| 欧美另类69xxxx| 国产欧美日韩国产高清| 屁屁影院ccyy备用地址| 76少妇精品导航| 伊人色综合久久天天小片| 欧美精品肏屄视频| 免费a级毛片高清在钱| 国产亚洲中文字幕在线制服| 亚洲精品乱码久久久久久久久| 国产 色 成人| 国产精品福利视频一区|