1、OpenAI推出ChatGPT開發(fā)者模式,首次支持AI直接控制外部工具
OpenAI于9月11日正式發(fā)布ChatGPT開發(fā)者模式功能,該Beta版功能面向Plus和Pro用戶開放,支持完整的模型上下文協(xié)議(MCP)客戶端功能。這一升級使ChatGPT不僅能讀取外部數(shù)據(jù),還能執(zhí)行寫入操作,標(biāo)志著該AI助手從對話工具向自動化代理的重要轉(zhuǎn)型。
新功能基于MCP協(xié)議,允許開發(fā)者創(chuàng)建自定義連接器,讓ChatGPT直接操作外部系統(tǒng)。用戶可以通過自然語言指令讓AI執(zhí)行復(fù)雜任務(wù),包括更新Jira工單、觸發(fā)Zapier工作流程或執(zhí)行多個連接器的聯(lián)動操作。
ChatGPT開發(fā)者模式的核心是實現(xiàn)AI與外部工具的雙向交互。開發(fā)者可以創(chuàng)建支持搜索、抓取、修改和寫入操作的自定義連接器。這種能力使ChatGPT能夠直接處理數(shù)據(jù)庫更新、文件編輯和API調(diào)用等任務(wù),而不僅限于信息檢索。
2、微軟推出新型 AI Agent 模型 rStar2-Agent,以 140 億參數(shù)挑戰(zhàn)大規(guī)模模型
微軟最近在 AI 領(lǐng)域取得了顯著突破,開源了一款名為 rStar2-Agent 的 AI Agent 推理模型。這款模型采用了創(chuàng)新的智能體強(qiáng)化學(xué)習(xí)方法,令人驚訝的是,盡管其參數(shù)僅有140億,但在 AIME24數(shù)學(xué)推理測試中,準(zhǔn)確率高達(dá)80.6%,成功超越了擁有6710億參數(shù)的 DeepSeek-R1(79.8%)。這樣的表現(xiàn)讓人們重新思考模型的參數(shù)規(guī)模與性能之間的關(guān)系。
3、Anthropic推出 Claude AI 新功能:自動記憶聊天內(nèi)容
最近,人工智能公司Anthropic為其 Claude AI 聊天機(jī)器人推出了一項新功能,允許團(tuán)隊和企業(yè)用戶的聊天記錄自動記憶。此功能的推出將使 Claude 能夠在不需要用戶提示的情況下,自動回憶起之前的對話內(nèi)容,從而更好地理解用戶的需求和偏好。
當(dāng)前,這項新功能只針對團(tuán)隊和企業(yè)用戶開放,Claude 可以將用戶的喜好、正在進(jìn)行的項目背景以及主要優(yōu)先事項融入到每一次的回復(fù)中。
4、字節(jié)跳動發(fā)布 Seedream4.0:全新多模態(tài)圖像創(chuàng)作模型
字節(jié)跳動 Seed 團(tuán)隊正式推出其最新一代圖像創(chuàng)作模型 Seedream4.0。這一模型在多模態(tài)生成領(lǐng)域?qū)崿F(xiàn)了全面升級,融合了文本和圖像的創(chuàng)作能力,展現(xiàn)出更高的速度和可用性,標(biāo)志著圖像生成技術(shù)的又一次重要飛躍。
Seedream4.0在多個方面都取得了顯著突破。其多模態(tài)玩法得到了擴(kuò)展,用戶可以靈活組合文本和圖像進(jìn)行創(chuàng)作,支持文生圖、圖生圖及多圖編輯等多種模式。這為創(chuàng)作者提供了更加多樣化的表達(dá)方式,能夠滿足不同領(lǐng)域的創(chuàng)作需求。
5、字節(jié)Seed推出全新 AgentGym-RL 框架
隨著人工智能技術(shù)的不斷發(fā)展,如何開發(fā)能夠獨立完成復(fù)雜任務(wù)的大規(guī)模語言模型(LLM)代理,已成為研究的熱點。
為了讓這些代理像人類一樣,通過探索和與環(huán)境互動來學(xué)習(xí),研究者們需要一個強(qiáng)大而統(tǒng)一的強(qiáng)化學(xué)習(xí)(RL)框架。然而,目前的研究中,尚缺乏一種有效的訓(xùn)練方法,能夠在多樣化的真實環(huán)境中,從零開始訓(xùn)練代理,而不依賴于監(jiān)督微調(diào)(SFT)。
為了解決這一問題,字節(jié)跳動Seed研究團(tuán)隊推出了名為 AgentGym-RL 的新框架,專注于通過強(qiáng)化學(xué)習(xí)訓(xùn)練 LLM 代理,使其能夠進(jìn)行多輪互動決策。該框架具有模塊化和解耦的架構(gòu),提供了極高的靈活性和擴(kuò)展性。AgentGym-RL 覆蓋了多種真實場景,能夠支持主流的強(qiáng)化學(xué)習(xí)算法,幫助代理全面提升其決策能力。
為了進(jìn)一步優(yōu)化訓(xùn)練效果,研究團(tuán)隊還提出了一種名為 ScalingInter-RL 的訓(xùn)練方法。該方法通過階段性調(diào)整交互次數(shù),幫助代理在早期專注于掌握基本技能,隨后逐漸增加交互次數(shù),以鼓勵更多樣化的問題解決策略。這種探索與利用的平衡設(shè)計,有助于代理在面對復(fù)雜任務(wù)時保持穩(wěn)定的學(xué)習(xí)和決策能力。
AgentGym-RL 框架涉及的多種場景包括網(wǎng)絡(luò)導(dǎo)航、深度搜索、數(shù)字游戲、體感任務(wù)和科學(xué)實驗等,代理在這些場景中需具備強(qiáng)大的決策能力和適應(yīng)能力,才能完成復(fù)雜的任務(wù)。
6、字節(jié)跳動推出 USO 模型,打破AI圖像生成 “風(fēng)格與主題” 對立
在 AI 圖像生成領(lǐng)域,風(fēng)格驅(qū)動和主題驅(qū)動的圖像生成一直以來被視為兩個相對獨立的任務(wù)。前者注重風(fēng)格的相似性,而后者則強(qiáng)調(diào)主題的一致性,造成了兩者之間的矛盾。最近,字節(jié)跳動的智能創(chuàng)作實驗室(UXO Team)推出了名為 USO(統(tǒng)一風(fēng)格 - 主題優(yōu)化)的新模型,成功地解決了這一行業(yè)長期以來的難題。
字節(jié)跳動的研究人員深知 AI 模型的成長依賴于數(shù)據(jù)。因此,他們建立了一個龐大的數(shù)據(jù)集,包含大約20萬個三元組。每個三元組包括一張 “風(fēng)格參考圖”、一張 “內(nèi)容參考圖”,以及一張 “風(fēng)格化目標(biāo)圖”。通過這個設(shè)計,模型能夠?qū)W習(xí)如何將風(fēng)格與內(nèi)容相結(jié)合。
7、百度文心大模型X1.1發(fā)布:深度學(xué)習(xí)能力再升級
百度首席技術(shù)官王海峰正式發(fā)布了文心大模型X1.1。作為一款全新的深度思考模型,文心大模型X1.1在多個核心能力上取得了顯著進(jìn)步,尤其在事實性、指令遵循和智能體表現(xiàn)上均有大幅提升。
目前,個人用戶已可通過文心一言官網(wǎng)和文小言APP體驗該模型。同時,文心大模型X1.1也已正式上線百度智能云千帆平臺,面向企業(yè)客戶及開發(fā)者全面開放使用,為各行各業(yè)的AI應(yīng)用開發(fā)提供強(qiáng)大支持。
8、騰訊開源HunyuanImage 2.1!2K高清神圖秒生成
騰訊混元團(tuán)隊近日正式開源HunyuanImage2.1,這一高效文本到圖像生成模型,支持原生2K(2048×2048)分辨率圖像輸出,標(biāo)志著開源AI在高分辨率創(chuàng)作領(lǐng)域的重大進(jìn)步。該模型已在Hugging Face和GitHub平臺全面開放,開發(fā)者可輕松集成使用。HunyuanImage2.1通過大規(guī)模數(shù)據(jù)集和多專家模型優(yōu)化結(jié)構(gòu)化描述,大幅提升文本-圖像對齊能力,生成速度與1K圖像相當(dāng),預(yù)計將加速AI在設(shè)計、廣告和內(nèi)容創(chuàng)作中的應(yīng)用。
9、騰訊升級混元生圖模型混元Image 2.1,支持寫字、2k分辨率
騰訊混元發(fā)布了其最新的生圖模型 “混元圖像2.1(HunyuanImage2.1)”。這一全新的開源文生圖模型在多個方面進(jìn)行了重要升級,支持原生2K 分辨率圖像生成,旨在為設(shè)計師和視覺創(chuàng)作者提供更高效、更便捷的創(chuàng)作工具。
在這次更新中,混元圖像2.1在性能與生成效果之間找到了更好的平衡。它不僅支持中英文原生輸入,還能生成高質(zhì)量的復(fù)雜語義文本。這一特性讓創(chuàng)作者能夠輕松生成多樣化的圖像作品,無論是精美的插畫、富有創(chuàng)意的海報,還是多樣的漫畫形式,都能快速實現(xiàn)。
10、阿里開源新模型 Qwen3-Next-80B-A3B,性能和效率雙提升
阿里巴巴近日開源了其最新架構(gòu)模型 Qwen3-Next-80B-A3B,標(biāo)志著公司在人工智能生成內(nèi)容(AIGC)方面的重要進(jìn)展。該模型在混合注意力機(jī)制、高稀疏性專家模型(MoE)和訓(xùn)練方法上進(jìn)行了創(chuàng)新,展示出顯著的性能提升。
Qwen3-Next 的總參數(shù)達(dá)到800億,但在推理過程中僅激活30億參數(shù),使得訓(xùn)練成本相較于其前代產(chǎn)品 Qwen3-32B 大幅下降了90%。此外,其推理效率提升了10倍,特別是在處理超長文本(32K 以上)時的表現(xiàn)更加突出。這使得 Qwen3-Next 在執(zhí)行指令和處理長上下文任務(wù)時,能夠與阿里旗艦?zāi)P?Qwen3-235B 相媲美,甚至超越了谷歌最新的 Gemini-2.5-Flash 思考模型。
11、Freepik 上線豆包 Seedream 4.0 圖像模型,premium+會員可無限使用
Freepik 正式上線了全新的豆包 Seedream4.0圖像模型,引起了廣大設(shè)計師和創(chuàng)作者的熱議。此次更新的 Seedream4.0不僅在技術(shù)上進(jìn)行了顯著提升,還為用戶提供了更為豐富的創(chuàng)作選項和便捷的使用體驗。
據(jù)悉,Seedream4.0支持生成2K 和4K 高分辨率的圖像,用戶可以選擇任意的縱橫比,這意味著無論是制作高清壁紙還是應(yīng)用圖標(biāo),都能輕松應(yīng)對。同時,用戶可以使用最多六個圖像參考,這為復(fù)雜設(shè)計的實現(xiàn)提供了更大的靈活性和創(chuàng)造性。這樣的功能更新無疑將提升設(shè)計師的工作效率。
12、快手推出 AI 視頻制作助手 Kwali,輕松一語生成短視頻
快手近日推出了一款名為 Kwali 的 AI 視頻制作助手,旨在幫助用戶快速生成高質(zhì)量的短視頻。只需在對話框中輸入需求,Kwali 便能在幾分鐘內(nèi)提供成片,徹底簡化了以往繁瑣的視頻制作流程。
13、硅基流動上線線螞蟻集團(tuán)Ling-mini-2.0,速度與性能雙豐收
近日,硅基流動大模型服務(wù)平臺正式上線了螞蟻集團(tuán)百靈團(tuán)隊最新開源的 Ling-mini-2.0。這個新模型在保持先進(jìn)性能的同時,展現(xiàn)出極高的生成速度,標(biāo)志著在小體量的同時實現(xiàn)了大能量的突破。
Ling-mini-2.0采用了 MoE 架構(gòu),總參數(shù)達(dá)到16B,但在生成過程中每個 Token 僅激活1.4B 的參數(shù),從而大幅提升了生成速度。這一設(shè)計不僅使得模型在處理任務(wù)時依舊保持卓越性能,還能與10B 以下的 Dense 語言模型以及其他更大規(guī)模的 MoE 模型進(jìn)行有效比較。其最大上下文長度支持達(dá)到128K,極大提升了模型的適用范圍。
14、商湯科技推出Claude API用戶遷移計劃,提供5000萬Token免費體驗
面對Anthropic最新發(fā)布的服務(wù)限制政策,商湯科技迅速推出了針對Claude API用戶的遷移支持計劃,幫助受影響用戶平滑過渡至自家"日日新"SenseNova大模型平臺。
根據(jù)Anthropic近期公布的政策,該公司將停止向中國控股超過50%的企業(yè)及其子公司提供Claude等AI服務(wù),這一限制涵蓋全球范圍內(nèi)的相關(guān)企業(yè),不論其運營地點。這一政策變化讓眾多依賴Claude服務(wù)的用戶面臨服務(wù)中斷的困擾。
為幫助受影響用戶順利遷移,商湯科技推出了comprehensive的遷移支持方案。新用戶可獲得 5000 萬Token的免費體驗包,同時享受專屬遷移顧問服務(wù)和系列培訓(xùn)課程,確保用戶能夠快速熟悉新平臺的功能和操作。
商湯科技還提供最新發(fā)布的"日日新SenseNova V6.5 Omni"API的免費接入測試。據(jù)介紹,今年 8 月發(fā)布的日日新V6. 5 大模型采用了"圖文交錯思維鏈"技術(shù),在文本推理和多模態(tài)推理方面的測試表現(xiàn)超越了Gemini 2.5 Pro和Claude 4-Sonnet,多模態(tài)交互能力也優(yōu)于Gemini 2.5 Flash和GPT-4o。
除了基礎(chǔ)遷移服務(wù)外,商湯還針對編程和智能代理工具需求,通過"商湯小浣熊"提供價值 30 萬元的會員權(quán)益。用戶可以通過platform.sensenova.cn注冊使用相關(guān)服務(wù),也可在應(yīng)用商店下載"商量APP"進(jìn)行免費體驗。
15、即夢圖片4.0發(fā)布:文生圖、圖像編輯、組圖生成一站式搞定
字節(jié)跳動旗下的即夢 AI 近日發(fā)布了其圖像生成與編輯工具的重大升級版——即夢圖片4.0。該版本首次引入多模態(tài)生圖功能,允許用戶通過自然語言指令精確控制畫面細(xì)節(jié),標(biāo)志著 AI 圖像處理技術(shù)邁入一個全新階段。
16、上海AI實驗室發(fā)布XTuner V1訓(xùn)練引擎
近日,上海人工智能實驗室(上海 AI 實驗室)在其微信公眾號上宣布開源了一款全新的大模型訓(xùn)練引擎 ——XTuner V1。該引擎的發(fā)布,標(biāo)志著 AI 模型訓(xùn)練技術(shù)的又一次飛躍,尤其是在提升訓(xùn)練效率和性能方面。
據(jù)上海AI實驗室官方消息,XTuner V1 是該實驗室最新研發(fā)的大模型訓(xùn)練引擎,專門針對當(dāng)前AI訓(xùn)練中的效率瓶頸問題而設(shè)計。該引擎采用了多項創(chuàng)新技術(shù),在保證訓(xùn)練質(zhì)量的同時大幅提升了訓(xùn)練速度和資源利用率。
技術(shù)測試數(shù)據(jù)顯示,XTuner V1 的性能表現(xiàn)令人矚目。在與昇騰團(tuán)隊的聯(lián)合優(yōu)化過程中,該引擎在昇騰 384 超節(jié)點平臺上完成了深度適配,最終實現(xiàn)了訓(xùn)練吞吐量超過5%的提升。更為突出的是,模型計算利用率MFU獲得了超過20%的大幅增長,這一指標(biāo)的提升直接關(guān)系到計算資源的有效利用和訓(xùn)練成本的降低。
17、上海交大發(fā)布 MobiAgent:超越 GPT-5
近日,上海交通大學(xué)的 IPADS 實驗室團(tuán)隊推出了一款名為 MobiAgent 的全新移動端智能體工具鏈,打破了個人化智能助手的開發(fā)壁壘,聲稱其真實場景表現(xiàn)優(yōu)于 GPT-5和其他頂級閉源模型。
MobiAgent 的推出讓每個人都有機(jī)會培養(yǎng)屬于自己的 AI 助手。這個工具鏈支持用戶從零開始構(gòu)建移動端智能體,包括從收集操作數(shù)據(jù)到訓(xùn)練模型,再到將模型部署到手機(jī)上的完整流程。MobiAgent 的開源性質(zhì),意味著用戶可以自主獲取數(shù)據(jù)、訓(xùn)練模型,并在個人設(shè)備上實現(xiàn)智能助手的應(yīng)用。
18、全球首款類腦脈沖大模型 “瞬悉 1.0” 發(fā)布
近日,中國科學(xué)院自動化研究所聯(lián)合沐曦 MetaX,成功推出全球首款類腦脈沖大模型 “瞬悉 1.0”(SpikingBrain-1.0),標(biāo)志著我國在大模型技術(shù)領(lǐng)域邁出了重要一步。這一創(chuàng)新不僅實現(xiàn)了全流程國產(chǎn)化,還在超長序列推理方面展現(xiàn)出了顯著的效率提升。
“瞬悉 1.0” 基于對大腦神經(jīng)元復(fù)雜工作的深入研究,提出了 “基于內(nèi)生復(fù)雜性” 的大模型架構(gòu)。該模型通過建立脈沖神經(jīng)元的內(nèi)生動力學(xué)與線性注意力模型之間的聯(lián)系,為大模型的發(fā)展指明了一條嶄新的道路。李國齊教授表示,這一成果的發(fā)布,不僅展示了我國在類腦計算與大模型結(jié)合方面的創(chuàng)新能力,更為未來的神經(jīng)形態(tài)計算和芯片設(shè)計提供了新的思路。
19、阿聯(lián)酋推出全球最快開源AI模型K2 Think
近日,阿聯(lián)酋的穆罕默德?本?扎耶德人工智能大學(xué)(MBZUAI)和初創(chuàng)公司 G42AI 聯(lián)合推出了一款新的開源大語言模型(LLM)——K2Think。這款模型自稱為 “全球最快的開源 AI 模型” 和 “最先進(jìn)的開源 AI 推理系統(tǒng)”,一經(jīng)發(fā)布便在 AI 用戶和觀察者中引起了廣泛關(guān)注。
K2Think 的核心在于其擁有320億個參數(shù),相比之下,一些美國的旗艦?zāi)P蛣t擁有數(shù)萬億個參數(shù)。雖然 K2Think 的參數(shù)數(shù)量較少,但其在復(fù)雜數(shù)學(xué)、編程和科學(xué)基準(zhǔn)測試中,性能卻超越了許多參數(shù)更多的模型。其制造商聲稱,K2Think 每秒可以生成2000個 tokens,響應(yīng)速度遠(yuǎn)超其他領(lǐng)先模型,顯示出其卓越的性能。
K2Think 不僅在速度上領(lǐng)先,還獲得了 Apache2.0許可證,允許開發(fā)者和企業(yè)在商業(yè)應(yīng)用中自由使用。這意味著企業(yè)可以下載、修改并部署 K2Think 的代碼,進(jìn)行廣泛的開發(fā)和應(yīng)用。
20、鏡報出版商擬裁員600人以應(yīng)對 AI 與讀者習(xí)慣變化
英國出版集團(tuán) Reach(發(fā)行《Mirror》《Express》《Star》等)宣布大規(guī)模重組,擬裁減約321 個編輯崗位(總體有最多600個崗位面臨風(fēng)險),并創(chuàng)建若干新崗以向視頻、音頻與實時新聞網(wǎng)絡(luò)轉(zhuǎn)型。公司將把更多資源投向數(shù)字訂閱與多媒體產(chǎn)品,理由包括搜索平臺(含被 AI 功能影響的流量)減少導(dǎo)致的營收壓力。工會和新聞從業(yè)者對此次裁員表達(dá)強(qiáng)烈關(guān)切。
21、CUNY Newmark 新聞學(xué)院宣布設(shè)立兩個人工智能新聞實驗室并與北歐 AI 新聞網(wǎng)絡(luò)合作
紐約市立大學(xué)(CUNY)Craig Newmark 新聞學(xué)院宣布將于 2026 年開辦兩期面向新聞從業(yè)者的“AI 新聞實驗室”(AI Journalism Labs),并與北歐 AI 新聞網(wǎng)絡(luò)(Nordic AI Journalism, NAIJ)建立合作。項目由 Microsoft 支持,旨在培訓(xùn)編輯、記者與產(chǎn)品負(fù)責(zé)人如何在實際采編流程中負(fù)責(zé)任地使用生成式 AI,課程免學(xué)費并聚焦落地能力與倫理規(guī)范。
22、應(yīng)對 AI 生成內(nèi)容——讀者呼吁對AI內(nèi)容進(jìn)行標(biāo)注以保護(hù)公眾
多位《衛(wèi)報》讀者來信呼吁對 AI 生成內(nèi)容實施強(qiáng)制標(biāo)注/水印,指出 AI 生成的虛假信息與 deepfake 帶來的風(fēng)險不斷上升,強(qiáng)調(diào)透明標(biāo)識比直接審查更能維系公眾信任,并敦促立法制定相應(yīng)義務(wù)。雖然這屬于意見/來信,但反映了公眾與媒體受眾對“AI 在新聞與信息流通中如何被標(biāo)注與監(jiān)管”的強(qiáng)烈關(guān)注。
24、媒體領(lǐng)域關(guān)于 AI 與就業(yè)/工作模式的討論與擔(dān)憂
在 9 月上中旬,多家媒體(包括 The Guardian、The Times 與行業(yè)評論)報道并分析了 AI 對媒體從業(yè)者職位、崗位職責(zé)與工作流程的影響:既有新聞機(jī)構(gòu)宣布結(jié)構(gòu)調(diào)整/裁員并表明是為“適應(yīng) AI 與讀者習(xí)慣”,也有行業(yè)觀察者呼吁為記者提供 AI 識別與驗證技能。總體呈現(xiàn)“加速采用 AI 工具的同時,引發(fā)就業(yè)與信任問題”的二元態(tài)勢。
25、Anthropic支持加州 AI 安全法案,科技行業(yè)的反對聲浪依舊
近日,AI 公司Anthropic正式支持加州州長斯科特?維納(Scott Wiener)提出的 SB53法案。該法案計劃對全球最大的 AI 模型開發(fā)者施加前所未有的透明度要求,成為美國首個針對 AI 安全的立法嘗試。然而,矛盾的是,許多硅谷科技公司和聯(lián)邦政府對此法案表示強(qiáng)烈反對。
如果 SB53法案獲得通過,像Anthropic、OpenAI、谷歌和 xAI 等 AI 模型開發(fā)者將需要制定安全框架,并在部署強(qiáng)大 AI 模型前,發(fā)布公開的安全和安保報告。此外,該法案還將為舉報安全問題的員工提供保護(hù)。
該法案特別關(guān)注于限制 AI 模型對 “災(zāi)難性風(fēng)險” 的貢獻(xiàn),定義為導(dǎo)致至少50人死亡或造成超過10億美元損失的事件。SB53側(cè)重于防范極端 AI 風(fēng)險,例如防止 AI 模型被用于生物武器的開發(fā)或網(wǎng)絡(luò)攻擊,而不涉及更近一步的 AI 深度偽造或過度迎合等問題。
加州參議院已經(jīng)通過了 SB53的初步版本,但仍需進(jìn)行最終投票,才能將其送交州長簽署。盡管加州州長紐森尚未對該法案表態(tài),但他曾否決過類似的 SB1047法案。
反對聲音主要來自硅谷及特朗普政府,認(rèn)為此類法案可能限制美國在與中國競爭中的創(chuàng)新。安德森?霍洛維茨(Andreessen Horowitz)和 Y Combinator 等投資者對此法案進(jìn)行了強(qiáng)烈反對,認(rèn)為州政府不應(yīng)干預(yù) AI 安全問題,應(yīng)該將此事交給聯(lián)邦政府。
盡管存在這些反對意見,政策專家認(rèn)為 SB53相較于之前的 AI 安全法案顯得更為溫和。加州立法者在該法案的制定過程中顯示了對技術(shù)現(xiàn)實的尊重以及一定的立法克制。Anthropic的聯(lián)合創(chuàng)始人杰克?克拉克(Jack Clark)表示,盡管希望有聯(lián)邦標(biāo)準(zhǔn),但現(xiàn)有法案為 AI 治理提供了一份不可忽視的藍(lán)圖。
26、Anthropic支付15億美元和解版權(quán)訴訟,AI訓(xùn)練數(shù)據(jù)爭議創(chuàng)紀(jì)錄賠償
AI初創(chuàng)公司Anthropic近日同意支付至少15億美元,以和解一起涉及50萬本書籍的版權(quán)侵權(quán)訴訟。這一和解協(xié)議創(chuàng)下美國版權(quán)案件史上的最高金額記錄,標(biāo)志著AI行業(yè)與內(nèi)容創(chuàng)作者之間版權(quán)爭議的重要里程碑。
根據(jù)訴訟指控,Anthropic被指通過Library Genesis和Pirate Library Mirror等盜版網(wǎng)站下載了超過700萬本電子書,并將這些內(nèi)容用于訓(xùn)練其聊天機(jī)器人Claude。和解協(xié)議顯示,每位受影響的作家預(yù)計將獲得約3000美元賠償,遠(yuǎn)高于美國作家協(xié)會最初預(yù)估的750美元。
此外,Anthropic還承諾銷毀其下載的所有原始文件及副本。該案件于去年8月由作家安德里亞·巴茨、查爾斯·格雷伯和柯克·華萊士·約翰遜等人代表提起訴訟。
27、AI訓(xùn)練數(shù)據(jù)合法性遭挑戰(zhàn):蘋果被指控利用盜版書籍進(jìn)行開發(fā)
蘋果公司正面臨來自作家格雷迪·亨德里克斯(Grady Hendrix)和詹妮弗·羅伯遜(Jennifer Roberson)的加州訴訟。他們聲稱,蘋果公司在未經(jīng)許可的情況下,使用他們的書籍來訓(xùn)練其人工智能模型,包括OpenELM和Apple Intelligence,侵犯了他們的版權(quán)。
訴訟指出,蘋果使用了包含超過19.6萬本盜版書籍的Books3數(shù)據(jù)集,其中包括亨德里克斯和羅伯遜的作品。此外,起訴書還指控蘋果公司利用其Applebot網(wǎng)絡(luò)爬蟲復(fù)制網(wǎng)站內(nèi)容,并從所謂的“影子圖書館”中提取資料。
原告?zhèn)冋趯で筚r償,并要求法院下令禁止蘋果公司在未經(jīng)授權(quán)的情況下使用他們的作品。這起案件的核心爭議點在于,大型科技公司在開發(fā)人工智能模型時,是否可以合法使用受版權(quán)保護(hù)的材料。
值得注意的是,在此之前,蘋果曾起訴Anthropic,后者最終因類似的版權(quán)索賠而達(dá)成和解。這表明,人工智能訓(xùn)練數(shù)據(jù)的版權(quán)問題已成為一個日益突出的法律挑戰(zhàn)。
28、AI 數(shù)據(jù)版權(quán)新紀(jì)元:Real Simple Licensing 協(xié)議引發(fā)行業(yè)關(guān)注
隨著人工智能(AI)行業(yè)面臨日益嚴(yán)峻的版權(quán)問題,尤其是在 Anthropic 與版權(quán)方達(dá)成15億美元和解后,許多企業(yè)開始重視其訓(xùn)練數(shù)據(jù)的合法性。目前,有多達(dá)40起未授權(quán)數(shù)據(jù)使用的訴訟案正在進(jìn)行中,其中包括一起因 Midjourney 制作超人形象而被起訴的案件。
在沒有有效的授權(quán)體系的情況下,AI 公司可能面臨大規(guī)模的版權(quán)訴訟,這讓行業(yè)前景堪憂。為了應(yīng)對這一挑戰(zhàn),一群技術(shù)專家和網(wǎng)絡(luò)出版商聯(lián)合推出了一項名為 Real Simple Licensing(RSL)的新系統(tǒng),旨在實現(xiàn)大規(guī)模的數(shù)據(jù)授權(quán)。該系統(tǒng)已經(jīng)得到了 Reddit、Quora 和 Yahoo 等大型網(wǎng)絡(luò)出版商的支持,但行業(yè)內(nèi)能否形成合力,吸引主要的 AI 實驗室參與仍然是個未知數(shù)。
多年來,諸如數(shù)據(jù)提供者聯(lián)盟等組織一直在推動更清晰的數(shù)據(jù)采集實踐,但 RSL 是第一個旨在提供實際技術(shù)和法律基礎(chǔ)設(shè)施的嘗試。技術(shù)上,RSL 協(xié)議定義了出版商可以為其內(nèi)容設(shè)定的具體許可條款,這包括 AI 公司是否需要定制許可或采用知識共享(Creative Commons)條款。參與的網(wǎng)頁將把條款納入其 “robots.txt” 文件,以便輕松識別哪些數(shù)據(jù)受哪些條款保護(hù)。
在法律層面,RSL 團(tuán)隊建立了一個名為 RSL Collective 的集體許可組織,旨在為出版商談判條款并收取版稅,類似于音樂行業(yè)的 ASCAP 或電影行業(yè)的 MPLC。目前,已經(jīng)有許多知名出版商加入了這一集體,包括 Yahoo、Reddit 和 Medium 等。
盡管如此,確定 AI 模型具體使用哪些訓(xùn)練數(shù)據(jù)以計算版稅的挑戰(zhàn)依然存在。對于實時獲取網(wǎng)絡(luò)數(shù)據(jù)的產(chǎn)品,如谷歌的 AI 搜索摘要,數(shù)據(jù)使用的追蹤相對簡單,但如果訓(xùn)練過程未被記錄,確認(rèn)特定文檔是否被某個大語言模型(LLM)使用就變得困難重重。
最后,RSL 的未來能否成功,關(guān)鍵在于 AI 公司是否愿意接受這一新體系。隨著越來越多的 AI 行業(yè)領(lǐng)袖呼吁建立這樣的系統(tǒng),RSL 團(tuán)隊希望他們能夠信守承諾。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.