全球AI動態(tài)周報-截止9月14日

2025-09-16 11:09:37　來源: 數(shù)據(jù)GO

上海舉報

分享至

1、OpenAI推出ChatGPT開發(fā)者模式，首次支持AI直接控制外部工具

OpenAI于9月11日正式發(fā)布ChatGPT開發(fā)者模式功能，該Beta版功能面向Plus和Pro用戶開放，支持完整的模型上下文協(xié)議（MCP）客戶端功能。這一升級使ChatGPT不僅能讀取外部數(shù)據(jù)，還能執(zhí)行寫入操作，標(biāo)志著該AI助手從對話工具向自動化代理的重要轉(zhuǎn)型。

新功能基于MCP協(xié)議，允許開發(fā)者創(chuàng)建自定義連接器，讓ChatGPT直接操作外部系統(tǒng)。用戶可以通過自然語言指令讓AI執(zhí)行復(fù)雜任務(wù)，包括更新Jira工單、觸發(fā)Zapier工作流程或執(zhí)行多個連接器的聯(lián)動操作。

ChatGPT開發(fā)者模式的核心是實現(xiàn)AI與外部工具的雙向交互。開發(fā)者可以創(chuàng)建支持搜索、抓取、修改和寫入操作的自定義連接器。這種能力使ChatGPT能夠直接處理數(shù)據(jù)庫更新、文件編輯和API調(diào)用等任務(wù)，而不僅限于信息檢索。

2、微軟推出新型 AI Agent 模型 rStar2-Agent，以 140 億參數(shù)挑戰(zhàn)大規(guī)模模型

微軟最近在 AI 領(lǐng)域取得了顯著突破，開源了一款名為 rStar2-Agent 的 AI Agent 推理模型。這款模型采用了創(chuàng)新的智能體強(qiáng)化學(xué)習(xí)方法，令人驚訝的是，盡管其參數(shù)僅有140億，但在 AIME24數(shù)學(xué)推理測試中，準(zhǔn)確率高達(dá)80.6%，成功超越了擁有6710億參數(shù)的 DeepSeek-R1（79.8%）。這樣的表現(xiàn)讓人們重新思考模型的參數(shù)規(guī)模與性能之間的關(guān)系。

3、Anthropic推出 Claude AI 新功能：自動記憶聊天內(nèi)容

最近，人工智能公司Anthropic為其 Claude AI 聊天機(jī)器人推出了一項新功能，允許團(tuán)隊和企業(yè)用戶的聊天記錄自動記憶。此功能的推出將使 Claude 能夠在不需要用戶提示的情況下，自動回憶起之前的對話內(nèi)容，從而更好地理解用戶的需求和偏好。

當(dāng)前，這項新功能只針對團(tuán)隊和企業(yè)用戶開放，Claude 可以將用戶的喜好、正在進(jìn)行的項目背景以及主要優(yōu)先事項融入到每一次的回復(fù)中。

4、字節(jié)跳動發(fā)布 Seedream4.0：全新多模態(tài)圖像創(chuàng)作模型

字節(jié)跳動 Seed 團(tuán)隊正式推出其最新一代圖像創(chuàng)作模型 Seedream4.0。這一模型在多模態(tài)生成領(lǐng)域?qū)崿F(xiàn)了全面升級，融合了文本和圖像的創(chuàng)作能力，展現(xiàn)出更高的速度和可用性，標(biāo)志著圖像生成技術(shù)的又一次重要飛躍。

Seedream4.0在多個方面都取得了顯著突破。其多模態(tài)玩法得到了擴(kuò)展，用戶可以靈活組合文本和圖像進(jìn)行創(chuàng)作，支持文生圖、圖生圖及多圖編輯等多種模式。這為創(chuàng)作者提供了更加多樣化的表達(dá)方式，能夠滿足不同領(lǐng)域的創(chuàng)作需求。

5、字節(jié)Seed推出全新 AgentGym-RL 框架

隨著人工智能技術(shù)的不斷發(fā)展，如何開發(fā)能夠獨立完成復(fù)雜任務(wù)的大規(guī)模語言模型（LLM）代理，已成為研究的熱點。

為了讓這些代理像人類一樣，通過探索和與環(huán)境互動來學(xué)習(xí)，研究者們需要一個強(qiáng)大而統(tǒng)一的強(qiáng)化學(xué)習(xí)（RL）框架。然而，目前的研究中，尚缺乏一種有效的訓(xùn)練方法，能夠在多樣化的真實環(huán)境中，從零開始訓(xùn)練代理，而不依賴于監(jiān)督微調(diào)(SFT)。

為了解決這一問題，字節(jié)跳動Seed研究團(tuán)隊推出了名為 AgentGym-RL 的新框架，專注于通過強(qiáng)化學(xué)習(xí)訓(xùn)練 LLM 代理，使其能夠進(jìn)行多輪互動決策。該框架具有模塊化和解耦的架構(gòu)，提供了極高的靈活性和擴(kuò)展性。AgentGym-RL 覆蓋了多種真實場景，能夠支持主流的強(qiáng)化學(xué)習(xí)算法，幫助代理全面提升其決策能力。

為了進(jìn)一步優(yōu)化訓(xùn)練效果，研究團(tuán)隊還提出了一種名為 ScalingInter-RL 的訓(xùn)練方法。該方法通過階段性調(diào)整交互次數(shù)，幫助代理在早期專注于掌握基本技能，隨后逐漸增加交互次數(shù)，以鼓勵更多樣化的問題解決策略。這種探索與利用的平衡設(shè)計，有助于代理在面對復(fù)雜任務(wù)時保持穩(wěn)定的學(xué)習(xí)和決策能力。

AgentGym-RL 框架涉及的多種場景包括網(wǎng)絡(luò)導(dǎo)航、深度搜索、數(shù)字游戲、體感任務(wù)和科學(xué)實驗等，代理在這些場景中需具備強(qiáng)大的決策能力和適應(yīng)能力，才能完成復(fù)雜的任務(wù)。

6、字節(jié)跳動推出 USO 模型，打破AI圖像生成 “風(fēng)格與主題” 對立

在 AI 圖像生成領(lǐng)域，風(fēng)格驅(qū)動和主題驅(qū)動的圖像生成一直以來被視為兩個相對獨立的任務(wù)。前者注重風(fēng)格的相似性，而后者則強(qiáng)調(diào)主題的一致性，造成了兩者之間的矛盾。最近，字節(jié)跳動的智能創(chuàng)作實驗室（UXO Team）推出了名為 USO(統(tǒng)一風(fēng)格 - 主題優(yōu)化)的新模型，成功地解決了這一行業(yè)長期以來的難題。

字節(jié)跳動的研究人員深知 AI 模型的成長依賴于數(shù)據(jù)。因此，他們建立了一個龐大的數(shù)據(jù)集，包含大約20萬個三元組。每個三元組包括一張 “風(fēng)格參考圖”、一張 “內(nèi)容參考圖”，以及一張 “風(fēng)格化目標(biāo)圖”。通過這個設(shè)計，模型能夠?qū)W習(xí)如何將風(fēng)格與內(nèi)容相結(jié)合。

7、百度文心大模型X1.1發(fā)布：深度學(xué)習(xí)能力再升級

百度首席技術(shù)官王海峰正式發(fā)布了文心大模型X1.1。作為一款全新的深度思考模型，文心大模型X1.1在多個核心能力上取得了顯著進(jìn)步，尤其在事實性、指令遵循和智能體表現(xiàn)上均有大幅提升。

目前，個人用戶已可通過文心一言官網(wǎng)和文小言APP體驗該模型。同時，文心大模型X1.1也已正式上線百度智能云千帆平臺，面向企業(yè)客戶及開發(fā)者全面開放使用，為各行各業(yè)的AI應(yīng)用開發(fā)提供強(qiáng)大支持。

8、騰訊開源HunyuanImage 2.1！2K高清神圖秒生成

騰訊混元團(tuán)隊近日正式開源HunyuanImage2.1，這一高效文本到圖像生成模型，支持原生2K（2048×2048）分辨率圖像輸出，標(biāo)志著開源AI在高分辨率創(chuàng)作領(lǐng)域的重大進(jìn)步。該模型已在Hugging Face和GitHub平臺全面開放，開發(fā)者可輕松集成使用。HunyuanImage2.1通過大規(guī)模數(shù)據(jù)集和多專家模型優(yōu)化結(jié)構(gòu)化描述，大幅提升文本-圖像對齊能力，生成速度與1K圖像相當(dāng)，預(yù)計將加速AI在設(shè)計、廣告和內(nèi)容創(chuàng)作中的應(yīng)用。

9、騰訊升級混元生圖模型混元Image 2.1，支持寫字、2k分辨率

騰訊混元發(fā)布了其最新的生圖模型 “混元圖像2.1（HunyuanImage2.1）”。這一全新的開源文生圖模型在多個方面進(jìn)行了重要升級，支持原生2K 分辨率圖像生成，旨在為設(shè)計師和視覺創(chuàng)作者提供更高效、更便捷的創(chuàng)作工具。

在這次更新中，混元圖像2.1在性能與生成效果之間找到了更好的平衡。它不僅支持中英文原生輸入，還能生成高質(zhì)量的復(fù)雜語義文本。這一特性讓創(chuàng)作者能夠輕松生成多樣化的圖像作品，無論是精美的插畫、富有創(chuàng)意的海報，還是多樣的漫畫形式，都能快速實現(xiàn)。

10、阿里開源新模型 Qwen3-Next-80B-A3B，性能和效率雙提升

阿里巴巴近日開源了其最新架構(gòu)模型 Qwen3-Next-80B-A3B，標(biāo)志著公司在人工智能生成內(nèi)容（AIGC）方面的重要進(jìn)展。該模型在混合注意力機(jī)制、高稀疏性專家模型(MoE)和訓(xùn)練方法上進(jìn)行了創(chuàng)新，展示出顯著的性能提升。

Qwen3-Next 的總參數(shù)達(dá)到800億，但在推理過程中僅激活30億參數(shù)，使得訓(xùn)練成本相較于其前代產(chǎn)品 Qwen3-32B 大幅下降了90%。此外，其推理效率提升了10倍，特別是在處理超長文本（32K 以上）時的表現(xiàn)更加突出。這使得 Qwen3-Next 在執(zhí)行指令和處理長上下文任務(wù)時，能夠與阿里旗艦?zāi)Ｐ?Qwen3-235B 相媲美，甚至超越了谷歌最新的 Gemini-2.5-Flash 思考模型。

11、Freepik 上線豆包 Seedream 4.0 圖像模型，premium+會員可無限使用

Freepik 正式上線了全新的豆包 Seedream4.0圖像模型，引起了廣大設(shè)計師和創(chuàng)作者的熱議。此次更新的 Seedream4.0不僅在技術(shù)上進(jìn)行了顯著提升，還為用戶提供了更為豐富的創(chuàng)作選項和便捷的使用體驗。

據(jù)悉，Seedream4.0支持生成2K 和4K 高分辨率的圖像，用戶可以選擇任意的縱橫比，這意味著無論是制作高清壁紙還是應(yīng)用圖標(biāo)，都能輕松應(yīng)對。同時，用戶可以使用最多六個圖像參考，這為復(fù)雜設(shè)計的實現(xiàn)提供了更大的靈活性和創(chuàng)造性。這樣的功能更新無疑將提升設(shè)計師的工作效率。

12、快手推出 AI 視頻制作助手 Kwali，輕松一語生成短視頻

快手近日推出了一款名為 Kwali 的 AI 視頻制作助手，旨在幫助用戶快速生成高質(zhì)量的短視頻。只需在對話框中輸入需求，Kwali 便能在幾分鐘內(nèi)提供成片，徹底簡化了以往繁瑣的視頻制作流程。

13、硅基流動上線線螞蟻集團(tuán)Ling-mini-2.0，速度與性能雙豐收

近日，硅基流動大模型服務(wù)平臺正式上線了螞蟻集團(tuán)百靈團(tuán)隊最新開源的 Ling-mini-2.0。這個新模型在保持先進(jìn)性能的同時，展現(xiàn)出極高的生成速度，標(biāo)志著在小體量的同時實現(xiàn)了大能量的突破。

Ling-mini-2.0采用了 MoE 架構(gòu)，總參數(shù)達(dá)到16B，但在生成過程中每個 Token 僅激活1.4B 的參數(shù)，從而大幅提升了生成速度。這一設(shè)計不僅使得模型在處理任務(wù)時依舊保持卓越性能，還能與10B 以下的 Dense 語言模型以及其他更大規(guī)模的 MoE 模型進(jìn)行有效比較。其最大上下文長度支持達(dá)到128K，極大提升了模型的適用范圍。

14、商湯科技推出Claude API用戶遷移計劃，提供5000萬Token免費體驗

面對Anthropic最新發(fā)布的服務(wù)限制政策，商湯科技迅速推出了針對Claude API用戶的遷移支持計劃，幫助受影響用戶平滑過渡至自家"日日新"SenseNova大模型平臺。

根據(jù)Anthropic近期公布的政策，該公司將停止向中國控股超過50%的企業(yè)及其子公司提供Claude等AI服務(wù)，這一限制涵蓋全球范圍內(nèi)的相關(guān)企業(yè)，不論其運營地點。這一政策變化讓眾多依賴Claude服務(wù)的用戶面臨服務(wù)中斷的困擾。

為幫助受影響用戶順利遷移，商湯科技推出了comprehensive的遷移支持方案。新用戶可獲得 5000 萬Token的免費體驗包，同時享受專屬遷移顧問服務(wù)和系列培訓(xùn)課程，確保用戶能夠快速熟悉新平臺的功能和操作。

商湯科技還提供最新發(fā)布的"日日新SenseNova V6.5 Omni"API的免費接入測試。據(jù)介紹，今年 8 月發(fā)布的日日新V6. 5 大模型采用了"圖文交錯思維鏈"技術(shù)，在文本推理和多模態(tài)推理方面的測試表現(xiàn)超越了Gemini 2.5 Pro和Claude 4-Sonnet，多模態(tài)交互能力也優(yōu)于Gemini 2.5 Flash和GPT-4o。

除了基礎(chǔ)遷移服務(wù)外，商湯還針對編程和智能代理工具需求，通過"商湯小浣熊"提供價值 30 萬元的會員權(quán)益。用戶可以通過platform.sensenova.cn注冊使用相關(guān)服務(wù)，也可在應(yīng)用商店下載"商量APP"進(jìn)行免費體驗。

15、即夢圖片4.0發(fā)布：文生圖、圖像編輯、組圖生成一站式搞定

字節(jié)跳動旗下的即夢 AI 近日發(fā)布了其圖像生成與編輯工具的重大升級版——即夢圖片4.0。該版本首次引入多模態(tài)生圖功能，允許用戶通過自然語言指令精確控制畫面細(xì)節(jié)，標(biāo)志著 AI 圖像處理技術(shù)邁入一個全新階段。

16、上海AI實驗室發(fā)布XTuner V1訓(xùn)練引擎

近日，上海人工智能實驗室（上海 AI 實驗室）在其微信公眾號上宣布開源了一款全新的大模型訓(xùn)練引擎 ——XTuner V1。該引擎的發(fā)布，標(biāo)志著 AI 模型訓(xùn)練技術(shù)的又一次飛躍，尤其是在提升訓(xùn)練效率和性能方面。

據(jù)上海AI實驗室官方消息，XTuner V1 是該實驗室最新研發(fā)的大模型訓(xùn)練引擎，專門針對當(dāng)前AI訓(xùn)練中的效率瓶頸問題而設(shè)計。該引擎采用了多項創(chuàng)新技術(shù)，在保證訓(xùn)練質(zhì)量的同時大幅提升了訓(xùn)練速度和資源利用率。

技術(shù)測試數(shù)據(jù)顯示，XTuner V1 的性能表現(xiàn)令人矚目。在與昇騰團(tuán)隊的聯(lián)合優(yōu)化過程中，該引擎在昇騰 384 超節(jié)點平臺上完成了深度適配，最終實現(xiàn)了訓(xùn)練吞吐量超過5%的提升。更為突出的是，模型計算利用率MFU獲得了超過20%的大幅增長，這一指標(biāo)的提升直接關(guān)系到計算資源的有效利用和訓(xùn)練成本的降低。

17、上海交大發(fā)布 MobiAgent：超越 GPT-5

近日，上海交通大學(xué)的 IPADS 實驗室團(tuán)隊推出了一款名為 MobiAgent 的全新移動端智能體工具鏈，打破了個人化智能助手的開發(fā)壁壘，聲稱其真實場景表現(xiàn)優(yōu)于 GPT-5和其他頂級閉源模型。

MobiAgent 的推出讓每個人都有機(jī)會培養(yǎng)屬于自己的 AI 助手。這個工具鏈支持用戶從零開始構(gòu)建移動端智能體，包括從收集操作數(shù)據(jù)到訓(xùn)練模型，再到將模型部署到手機(jī)上的完整流程。MobiAgent 的開源性質(zhì)，意味著用戶可以自主獲取數(shù)據(jù)、訓(xùn)練模型，并在個人設(shè)備上實現(xiàn)智能助手的應(yīng)用。

18、全球首款類腦脈沖大模型 “瞬悉 1.0” 發(fā)布

近日，中國科學(xué)院自動化研究所聯(lián)合沐曦 MetaX，成功推出全球首款類腦脈沖大模型 “瞬悉 1.0”（SpikingBrain-1.0），標(biāo)志著我國在大模型技術(shù)領(lǐng)域邁出了重要一步。這一創(chuàng)新不僅實現(xiàn)了全流程國產(chǎn)化，還在超長序列推理方面展現(xiàn)出了顯著的效率提升。

“瞬悉 1.0” 基于對大腦神經(jīng)元復(fù)雜工作的深入研究，提出了 “基于內(nèi)生復(fù)雜性” 的大模型架構(gòu)。該模型通過建立脈沖神經(jīng)元的內(nèi)生動力學(xué)與線性注意力模型之間的聯(lián)系，為大模型的發(fā)展指明了一條嶄新的道路。李國齊教授表示，這一成果的發(fā)布，不僅展示了我國在類腦計算與大模型結(jié)合方面的創(chuàng)新能力，更為未來的神經(jīng)形態(tài)計算和芯片設(shè)計提供了新的思路。

19、阿聯(lián)酋推出全球最快開源AI模型K2 Think

近日，阿聯(lián)酋的穆罕默德?本?扎耶德人工智能大學(xué)（MBZUAI）和初創(chuàng)公司 G42AI 聯(lián)合推出了一款新的開源大語言模型(LLM)——K2Think。這款模型自稱為 “全球最快的開源 AI 模型” 和 “最先進(jìn)的開源 AI 推理系統(tǒng)”，一經(jīng)發(fā)布便在 AI 用戶和觀察者中引起了廣泛關(guān)注。

K2Think 的核心在于其擁有320億個參數(shù)，相比之下，一些美國的旗艦?zāi)Ｐ蛣t擁有數(shù)萬億個參數(shù)。雖然 K2Think 的參數(shù)數(shù)量較少，但其在復(fù)雜數(shù)學(xué)、編程和科學(xué)基準(zhǔn)測試中，性能卻超越了許多參數(shù)更多的模型。其制造商聲稱，K2Think 每秒可以生成2000個 tokens，響應(yīng)速度遠(yuǎn)超其他領(lǐng)先模型，顯示出其卓越的性能。

K2Think 不僅在速度上領(lǐng)先，還獲得了 Apache2.0許可證，允許開發(fā)者和企業(yè)在商業(yè)應(yīng)用中自由使用。這意味著企業(yè)可以下載、修改并部署 K2Think 的代碼，進(jìn)行廣泛的開發(fā)和應(yīng)用。

20、鏡報出版商擬裁員600人以應(yīng)對 AI 與讀者習(xí)慣變化

英國出版集團(tuán) Reach（發(fā)行《Mirror》《Express》《Star》等）宣布大規(guī)模重組，擬裁減約321 個編輯崗位（總體有最多600個崗位面臨風(fēng)險），并創(chuàng)建若干新崗以向視頻、音頻與實時新聞網(wǎng)絡(luò)轉(zhuǎn)型。公司將把更多資源投向數(shù)字訂閱與多媒體產(chǎn)品，理由包括搜索平臺（含被 AI 功能影響的流量）減少導(dǎo)致的營收壓力。工會和新聞從業(yè)者對此次裁員表達(dá)強(qiáng)烈關(guān)切。

21、CUNY Newmark 新聞學(xué)院宣布設(shè)立兩個人工智能新聞實驗室并與北歐 AI 新聞網(wǎng)絡(luò)合作

紐約市立大學(xué)（CUNY）Craig Newmark 新聞學(xué)院宣布將于 2026 年開辦兩期面向新聞從業(yè)者的“AI 新聞實驗室”（AI Journalism Labs），并與北歐 AI 新聞網(wǎng)絡(luò)（Nordic AI Journalism, NAIJ）建立合作。項目由 Microsoft 支持，旨在培訓(xùn)編輯、記者與產(chǎn)品負(fù)責(zé)人如何在實際采編流程中負(fù)責(zé)任地使用生成式 AI，課程免學(xué)費并聚焦落地能力與倫理規(guī)范。

22、應(yīng)對 AI 生成內(nèi)容——讀者呼吁對AI內(nèi)容進(jìn)行標(biāo)注以保護(hù)公眾

多位《衛(wèi)報》讀者來信呼吁對 AI 生成內(nèi)容實施強(qiáng)制標(biāo)注/水印，指出 AI 生成的虛假信息與 deepfake 帶來的風(fēng)險不斷上升，強(qiáng)調(diào)透明標(biāo)識比直接審查更能維系公眾信任，并敦促立法制定相應(yīng)義務(wù)。雖然這屬于意見/來信，但反映了公眾與媒體受眾對“AI 在新聞與信息流通中如何被標(biāo)注與監(jiān)管”的強(qiáng)烈關(guān)注。

24、媒體領(lǐng)域關(guān)于 AI 與就業(yè)/工作模式的討論與擔(dān)憂

在 9 月上中旬，多家媒體（包括 The Guardian、The Times 與行業(yè)評論）報道并分析了 AI 對媒體從業(yè)者職位、崗位職責(zé)與工作流程的影響：既有新聞機(jī)構(gòu)宣布結(jié)構(gòu)調(diào)整/裁員并表明是為“適應(yīng) AI 與讀者習(xí)慣”，也有行業(yè)觀察者呼吁為記者提供 AI 識別與驗證技能。總體呈現(xiàn)“加速采用 AI 工具的同時，引發(fā)就業(yè)與信任問題”的二元態(tài)勢。

25、Anthropic支持加州 AI 安全法案，科技行業(yè)的反對聲浪依舊

近日，AI 公司Anthropic正式支持加州州長斯科特?維納（Scott Wiener）提出的 SB53法案。該法案計劃對全球最大的 AI 模型開發(fā)者施加前所未有的透明度要求，成為美國首個針對 AI 安全的立法嘗試。然而，矛盾的是，許多硅谷科技公司和聯(lián)邦政府對此法案表示強(qiáng)烈反對。

如果 SB53法案獲得通過，像Anthropic、OpenAI、谷歌和 xAI 等 AI 模型開發(fā)者將需要制定安全框架，并在部署強(qiáng)大 AI 模型前，發(fā)布公開的安全和安保報告。此外，該法案還將為舉報安全問題的員工提供保護(hù)。

該法案特別關(guān)注于限制 AI 模型對 “災(zāi)難性風(fēng)險” 的貢獻(xiàn)，定義為導(dǎo)致至少50人死亡或造成超過10億美元損失的事件。SB53側(cè)重于防范極端 AI 風(fēng)險，例如防止 AI 模型被用于生物武器的開發(fā)或網(wǎng)絡(luò)攻擊，而不涉及更近一步的 AI 深度偽造或過度迎合等問題。

加州參議院已經(jīng)通過了 SB53的初步版本，但仍需進(jìn)行最終投票，才能將其送交州長簽署。盡管加州州長紐森尚未對該法案表態(tài)，但他曾否決過類似的 SB1047法案。

反對聲音主要來自硅谷及特朗普政府，認(rèn)為此類法案可能限制美國在與中國競爭中的創(chuàng)新。安德森?霍洛維茨（Andreessen Horowitz）和 Y Combinator 等投資者對此法案進(jìn)行了強(qiáng)烈反對，認(rèn)為州政府不應(yīng)干預(yù) AI 安全問題，應(yīng)該將此事交給聯(lián)邦政府。

盡管存在這些反對意見，政策專家認(rèn)為 SB53相較于之前的 AI 安全法案顯得更為溫和。加州立法者在該法案的制定過程中顯示了對技術(shù)現(xiàn)實的尊重以及一定的立法克制。Anthropic的聯(lián)合創(chuàng)始人杰克?克拉克（Jack Clark）表示，盡管希望有聯(lián)邦標(biāo)準(zhǔn)，但現(xiàn)有法案為 AI 治理提供了一份不可忽視的藍(lán)圖。

26、Anthropic支付15億美元和解版權(quán)訴訟，AI訓(xùn)練數(shù)據(jù)爭議創(chuàng)紀(jì)錄賠償

AI初創(chuàng)公司Anthropic近日同意支付至少15億美元，以和解一起涉及50萬本書籍的版權(quán)侵權(quán)訴訟。這一和解協(xié)議創(chuàng)下美國版權(quán)案件史上的最高金額記錄，標(biāo)志著AI行業(yè)與內(nèi)容創(chuàng)作者之間版權(quán)爭議的重要里程碑。

根據(jù)訴訟指控，Anthropic被指通過Library Genesis和Pirate Library Mirror等盜版網(wǎng)站下載了超過700萬本電子書，并將這些內(nèi)容用于訓(xùn)練其聊天機(jī)器人Claude。和解協(xié)議顯示，每位受影響的作家預(yù)計將獲得約3000美元賠償，遠(yuǎn)高于美國作家協(xié)會最初預(yù)估的750美元。

此外，Anthropic還承諾銷毀其下載的所有原始文件及副本。該案件于去年8月由作家安德里亞·巴茨、查爾斯·格雷伯和柯克·華萊士·約翰遜等人代表提起訴訟。

27、AI訓(xùn)練數(shù)據(jù)合法性遭挑戰(zhàn)：蘋果被指控利用盜版書籍進(jìn)行開發(fā)

蘋果公司正面臨來自作家格雷迪·亨德里克斯（Grady Hendrix）和詹妮弗·羅伯遜(Jennifer Roberson)的加州訴訟。他們聲稱，蘋果公司在未經(jīng)許可的情況下，使用他們的書籍來訓(xùn)練其人工智能模型，包括OpenELM和Apple Intelligence，侵犯了他們的版權(quán)。

訴訟指出，蘋果使用了包含超過19.6萬本盜版書籍的Books3數(shù)據(jù)集，其中包括亨德里克斯和羅伯遜的作品。此外，起訴書還指控蘋果公司利用其Applebot網(wǎng)絡(luò)爬蟲復(fù)制網(wǎng)站內(nèi)容，并從所謂的“影子圖書館”中提取資料。

原告?zhèn)冋趯で筚r償，并要求法院下令禁止蘋果公司在未經(jīng)授權(quán)的情況下使用他們的作品。這起案件的核心爭議點在于，大型科技公司在開發(fā)人工智能模型時，是否可以合法使用受版權(quán)保護(hù)的材料。

值得注意的是，在此之前，蘋果曾起訴Anthropic，后者最終因類似的版權(quán)索賠而達(dá)成和解。這表明，人工智能訓(xùn)練數(shù)據(jù)的版權(quán)問題已成為一個日益突出的法律挑戰(zhàn)。

28、AI 數(shù)據(jù)版權(quán)新紀(jì)元：Real Simple Licensing 協(xié)議引發(fā)行業(yè)關(guān)注

隨著人工智能（AI）行業(yè)面臨日益嚴(yán)峻的版權(quán)問題，尤其是在 Anthropic 與版權(quán)方達(dá)成15億美元和解后，許多企業(yè)開始重視其訓(xùn)練數(shù)據(jù)的合法性。目前，有多達(dá)40起未授權(quán)數(shù)據(jù)使用的訴訟案正在進(jìn)行中，其中包括一起因 Midjourney 制作超人形象而被起訴的案件。

在沒有有效的授權(quán)體系的情況下，AI 公司可能面臨大規(guī)模的版權(quán)訴訟，這讓行業(yè)前景堪憂。為了應(yīng)對這一挑戰(zhàn)，一群技術(shù)專家和網(wǎng)絡(luò)出版商聯(lián)合推出了一項名為 Real Simple Licensing（RSL）的新系統(tǒng)，旨在實現(xiàn)大規(guī)模的數(shù)據(jù)授權(quán)。該系統(tǒng)已經(jīng)得到了 Reddit、Quora 和 Yahoo 等大型網(wǎng)絡(luò)出版商的支持，但行業(yè)內(nèi)能否形成合力，吸引主要的 AI 實驗室參與仍然是個未知數(shù)。

多年來，諸如數(shù)據(jù)提供者聯(lián)盟等組織一直在推動更清晰的數(shù)據(jù)采集實踐，但 RSL 是第一個旨在提供實際技術(shù)和法律基礎(chǔ)設(shè)施的嘗試。技術(shù)上，RSL 協(xié)議定義了出版商可以為其內(nèi)容設(shè)定的具體許可條款，這包括 AI 公司是否需要定制許可或采用知識共享（Creative Commons）條款。參與的網(wǎng)頁將把條款納入其 “robots.txt” 文件，以便輕松識別哪些數(shù)據(jù)受哪些條款保護(hù)。

在法律層面，RSL 團(tuán)隊建立了一個名為 RSL Collective 的集體許可組織，旨在為出版商談判條款并收取版稅，類似于音樂行業(yè)的 ASCAP 或電影行業(yè)的 MPLC。目前，已經(jīng)有許多知名出版商加入了這一集體，包括 Yahoo、Reddit 和 Medium 等。

盡管如此，確定 AI 模型具體使用哪些訓(xùn)練數(shù)據(jù)以計算版稅的挑戰(zhàn)依然存在。對于實時獲取網(wǎng)絡(luò)數(shù)據(jù)的產(chǎn)品，如谷歌的 AI 搜索摘要，數(shù)據(jù)使用的追蹤相對簡單，但如果訓(xùn)練過程未被記錄，確認(rèn)特定文檔是否被某個大語言模型（LLM）使用就變得困難重重。

最后，RSL 的未來能否成功，關(guān)鍵在于 AI 公司是否愿意接受這一新體系。隨著越來越多的 AI 行業(yè)領(lǐng)袖呼吁建立這樣的系統(tǒng)，RSL 團(tuán)隊希望他們能夠信守承諾。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.