夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

斯坦福報(bào)告:AI透明度集體倒退!IBM奪冠,馬斯克xAI墊底

0
分享至

最近,美國斯坦福大學(xué)等團(tuán)隊(duì)發(fā)布了一份名為《2025 年基礎(chǔ)模型透明度指數(shù)》(FMTI,The 2025 Foundation Model Transparency Index)的報(bào)告。其中,IBM 以透明度得分最高奪冠,xAI 和 Midjourney 則墊底。

該報(bào)告揭示了一種令人擔(dān)憂的趨勢:隨著技術(shù)的發(fā)展,盡管基礎(chǔ)模型在性能等各方面持續(xù)進(jìn)步,但其在數(shù)據(jù)使用、模型訓(xùn)練和下游影響等方面的透明度卻出現(xiàn)了集體倒退。

這是該報(bào)告自 2023 年以來發(fā)布的第三個(gè)年度版本,就像通過量化透明度為各大基礎(chǔ)模型開發(fā)者做一次“體檢”。

本次評估共包括 13 家基礎(chǔ)模型公司,其中既有阿里巴巴、DeepSeek 和馬斯克的 xAI 等首次納入報(bào)告的企業(yè),也有 IBM、OpenAI 等老牌科技巨頭。為使評估更全面,今年的報(bào)告中還涵蓋了數(shù)據(jù)獲取、使用數(shù)據(jù)和監(jiān)控等方面的新指標(biāo)。


(來源:The 2025 Foundation Model Transparency Index)

從報(bào)告的整體結(jié)果來看,盡管 2024 年報(bào)告顯示模型透明度有短暫的改善,但 2025 年的報(bào)告指出,透明度指數(shù)正呈現(xiàn)倒退:各基礎(chǔ)模型的平均得分從 2024 年的 58 分下降到 2025 年的 40 分,幾乎與 2023 年報(bào)告首次發(fā)布時(shí)的水平相當(dāng)(備注:100 分為滿分)。

報(bào)告顯示,公司在其旗艦?zāi)P偷挠?xùn)練數(shù)據(jù)、訓(xùn)練計(jì)算以及模型部署后的使用和影響方面信息披露最為有限。盡管公司在模型能力評估和風(fēng)險(xiǎn)評估方面披露較多,但在方法透明度、第三方參與、可復(fù)現(xiàn)性和訓(xùn)練-測試數(shù)據(jù)重疊報(bào)告方面仍存在挑戰(zhàn)。


(來源:The 2025 Foundation Model Transparency Index)

從各公司的表現(xiàn)來看差異明顯,其中 IBM 以 95 分獲得透明度最高得分,xAI 和 Midjourney 得分最低,僅 14 分。中國的兩家公司 DeepSeek 和阿里巴巴在透明度的得分則位于中下游。

可以看到的是,公司特征和透明度指數(shù)在某些程度上存在著一些有趣的關(guān)聯(lián),例如開放模型開發(fā)者、以企業(yè)為中心的 B2B 公司、自行準(zhǔn)備透明度報(bào)告的公司以及簽署歐盟 AI 法案通用目的 AI 行為準(zhǔn)則的公司得分高于平均水平。


(來源:The 2025 Foundation Model Transparency Index)

那么,透明度越高就意味著模型越好嗎?

清華大學(xué)邱寒副教授告訴 DeepTech,“這里的透明度不等同于我們常識(shí)認(rèn)為的開源,而是由一系列明確的打分表組成的量化指標(biāo)——如果不按照這個(gè)指標(biāo)披露相關(guān)的數(shù)據(jù)(而不是什么都沒披露),那么這項(xiàng)指標(biāo)得分就是 0?!?/p>


以阿里巴巴 Qwen 和 DeepSeek 得分均為 0 的使用數(shù)據(jù)、影響、部署后監(jiān)控三項(xiàng)指標(biāo)為例:它們都各自含有更詳細(xì)的評測指標(biāo),得分為 0 并不等于什么都沒有披露,而這些計(jì)算指標(biāo)的方法與開源、安全、性能并不能直接劃等號(hào)。

需要了解的是,透明或開源也并不意味著模型性能更好。從這份報(bào)告來看,透明度得分最高的模型(IBM 的 Granite 3.3),在實(shí)際應(yīng)用場景種的性能表現(xiàn)并不是最頂尖的那批模型。

試想一下,如果有一個(gè)任務(wù)要做,你是會(huì)去選擇微調(diào) Qwen3 或 Claude 的 API,還是會(huì)因?yàn)橥该鞫鹊梅指叨x擇 Granite 3.3?

邱寒認(rèn)為,透明度是安全的前提,但必須明確不一定是報(bào)告中定義的透明:如果公司拒絕披露任何模型生產(chǎn)相關(guān)的信息,比如版權(quán)內(nèi)容、隱私數(shù)據(jù)的濫用確實(shí)難以發(fā)掘和確認(rèn);模型的偏見和價(jià)值觀更難評測,確實(shí)會(huì)給安全和治理帶來一定的影響。更糟的是,一旦嚴(yán)重安全事故發(fā)生,還可能引發(fā)更粗暴的安全監(jiān)管策略落地,反而進(jìn)一步限制了大模型技術(shù)的進(jìn)步。

該報(bào)告提到,隨著全球政策制定者越來越多地要求某些類型的透明度,這項(xiàng)工作揭示了基礎(chǔ)模型開發(fā)者的當(dāng)前透明度狀態(tài),透明度可能如何變化,以及需要更積極的政策干預(yù)來解決哪些關(guān)鍵信息問題。

正如邱寒所指出的那樣,黑盒模型的評測技術(shù)可以在一定程度上彌補(bǔ)不透明的問題,而當(dāng)前的透明與否也只是暫時(shí)狀態(tài)。隨著模型落地的深化和監(jiān)管機(jī)制的完善,最終目標(biāo)是“公司不需完全公開,但模型行為可測、聲明可證、安全可控”。

總之,表面上看公司信息披露程度影響透明度,但本質(zhì)上這需要一種權(quán)責(zé)歸屬的清晰界定。通過這份報(bào)告對透明度倒退的警示,我們需要看到,未來需要構(gòu)建一種綜合的激勵(lì)機(jī)制,來理解、評估并最終確保模型的安全與可信。

參考資料:

https://arxiv.org/abs/2512.10169

運(yùn)營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
北斗、GPS同時(shí)被干擾!栗正杰:殺敵一千自損八千

北斗、GPS同時(shí)被干擾!栗正杰:殺敵一千自損八千

看看新聞Knews
2025-12-21 20:41:10
電訊報(bào):埃梅里上賽季收入超1500萬鎊,且在維拉有很大控制權(quán)

電訊報(bào):埃梅里上賽季收入超1500萬鎊,且在維拉有很大控制權(quán)

懂球帝
2025-12-22 23:52:09
悉尼槍擊案槍手或在超級(jí)監(jiān)獄服刑:完全隔離,吃喝拉撒都在牢房,堪稱“混凝土墳?zāi)埂?>
    </a>
        <h3>
      <a href=紅星新聞
2025-12-22 19:33:10
事實(shí)證明,缺席追悼會(huì)遭罵的許亞軍,與何晴的關(guān)系遠(yuǎn)沒有那么簡單

事實(shí)證明,缺席追悼會(huì)遭罵的許亞軍,與何晴的關(guān)系遠(yuǎn)沒有那么簡單

晨曦故事匯聚
2025-12-23 01:20:19
彭珮云同志逝世

彭珮云同志逝世

新華社
2025-12-21 17:03:03
悲催!武漢一地產(chǎn)公司破產(chǎn),總資產(chǎn)34.6億元,負(fù)債卻高達(dá)64.6億元

悲催!武漢一地產(chǎn)公司破產(chǎn),總資產(chǎn)34.6億元,負(fù)債卻高達(dá)64.6億元

火山詩話
2025-12-22 11:06:32
3-0大勝!U15東亞杯大結(jié)局:中國隊(duì)贏了,留在A組,最終排名如下

3-0大勝!U15東亞杯大結(jié)局:中國隊(duì)贏了,留在A組,最終排名如下

大秦壁虎白話體育
2025-12-22 16:47:21
田徑隊(duì)動(dòng)員大會(huì)吳艷妮坐第一排C位,與小孩姐陳妤頡緊挨氣場相投

田徑隊(duì)動(dòng)員大會(huì)吳艷妮坐第一排C位,與小孩姐陳妤頡緊挨氣場相投

楊華評論
2025-12-23 00:51:11
南博前院長“賣慘”不到24小時(shí),雙重身份被扒,神秘買家曝光?

南博前院長“賣慘”不到24小時(shí),雙重身份被扒,神秘買家曝光?

奇思妙想草葉君
2025-12-22 11:01:59
關(guān)于楊蘭蘭,終于破解出幾條她的關(guān)鍵信息

關(guān)于楊蘭蘭,終于破解出幾條她的關(guān)鍵信息

詩意世界
2025-12-19 12:00:03
泰柬沖突這塊地,老胡怕是洗不干凈

泰柬沖突這塊地,老胡怕是洗不干凈

近距離
2025-12-22 08:08:34
“東南亞詐騙終點(diǎn)站”被攻陷!園區(qū)墻上五個(gè)大字“誠信贏天下”

“東南亞詐騙終點(diǎn)站”被攻陷!園區(qū)墻上五個(gè)大字“誠信贏天下”

深度報(bào)
2025-12-21 22:42:35
同事辦完離職問“是不是能走了,不用等到6點(diǎn)下班吧”,引發(fā)熱議

同事辦完離職問“是不是能走了,不用等到6點(diǎn)下班吧”,引發(fā)熱議

火山詩話
2025-12-22 09:39:07
高詩巖:輸球不該一個(gè)人承擔(dān)責(zé)任,隊(duì)里沒有任何人比我更疲勞

高詩巖:輸球不該一個(gè)人承擔(dān)責(zé)任,隊(duì)里沒有任何人比我更疲勞

懂球帝
2025-12-23 00:36:33
烏官員剛離開北京,普京通告全球,俄羅斯跟中國關(guān)系不是一般的鐵

烏官員剛離開北京,普京通告全球,俄羅斯跟中國關(guān)系不是一般的鐵

時(shí)尚的弄潮
2025-12-23 02:46:31
善惡終有報(bào)!張本智和傳出新消息,原來樊振東早就猜中了他的結(jié)局

善惡終有報(bào)!張本智和傳出新消息,原來樊振東早就猜中了他的結(jié)局

千言娛樂記
2025-12-21 22:13:03
一夜之間,中國傳來2個(gè)爆炸性突破,美國從88%降到9%,中國猛追

一夜之間,中國傳來2個(gè)爆炸性突破,美國從88%降到9%,中國猛追

法老不說教
2025-11-19 22:46:19
中東王子全身癱瘓赴華求醫(yī),中醫(yī)摸下手腕,1句話讓醫(yī)療團(tuán)隊(duì)傻眼

中東王子全身癱瘓赴華求醫(yī),中醫(yī)摸下手腕,1句話讓醫(yī)療團(tuán)隊(duì)傻眼

小哥很OK
2025-12-07 15:35:44
2.8-4.9!這就是杰倫威的改變,拒投致雷霆一周兩敗

2.8-4.9!這就是杰倫威的改變,拒投致雷霆一周兩敗

奕辰說球
2025-12-22 14:11:39
全新一代寶馬5系曝光,外觀變化大,雙腎格柵縮小,預(yù)計(jì)明年發(fā)布

全新一代寶馬5系曝光,外觀變化大,雙腎格柵縮小,預(yù)計(jì)明年發(fā)布

紅濤說車
2025-12-22 15:43:21
2025-12-23 04:00:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨(dú)家合作
16024文章數(shù) 514428關(guān)注度
往期回顧 全部

科技要聞

商湯聯(lián)創(chuàng)親自下場 痛批主流機(jī)器人技術(shù)大錯(cuò)

頭條要聞

高市早苗政府創(chuàng)下一項(xiàng)27年來最差紀(jì)錄

頭條要聞

高市早苗政府創(chuàng)下一項(xiàng)27年來最差紀(jì)錄

體育要聞

戴琳,中國足球的反向代言人

娛樂要聞

張柏芝不再隱瞞,三胎生父早有答案?

財(cái)經(jīng)要聞

央行信用新政:為失信者提供"糾錯(cuò)"通道

汽車要聞

可享88元抵2000元等多重權(quán)益 昊鉑A800開啟盲訂

態(tài)度原創(chuàng)

親子
本地
旅游
健康
公開課

親子要聞

小孩便秘,家長很苦惱?!中醫(yī)分享豬油洗澡

本地新聞

云游安徽|走進(jìn)銅陵,照見三千年不滅的爐火

旅游要聞

一箭穿古今 四川內(nèi)江美食街“變身”步行街重燃市井煙火

這些新療法,讓化療不再那么痛苦

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 欧美成人看片一区二区三区尤物| 成人一级黄色毛片| 国产av一区二区三区综合| 欧美性黑人极品hd| 熟女精品视频一区二区三区| good电影一区二区| 久久久99久久精品人妻水蜜| 久久久人体艺术国产精品| 伊人网在线免费视频| 99久久蜜精品| 亚洲人成在线观看网站不卡| 久久精品又黑又粗| 天天爱天天日天天射| 丰满少妇被猛烈进入高清| 亚洲肥老太bbw中国熟女| 日产乱码一二三区别免费演员表| gv在线免费| 色吊丝成人综合网| 国产在线精彩自拍视频| 亚洲自慰第一页| 亚洲精品无码影视| 白人大战34厘米黑人bd| 国产69久久精品成人看| 久久无码人妻丰满熟妇区毛片 | 另类图区日韩激情| 人人干人人泡| 丰满人妻一区二区三区视频53| av资源新版在线天堂| 国内精品久久久久鸭| 国产妞干网妞干网妞干网| 午夜精品福利亚洲国产| 亚洲爆乳无码一区二区三区日日| 成人免费无码婬片在线观看免费| 久久性感美女视频| 中文字幕h.xxxxx| www.998re| 国产美女视频国产视视频| 成 人 色 网 站免费观看| 操逼国产av| 极品少妇一区二区| 国产av国片精品一区二区|