*此節(jié)目由豆包AI播客生成
硅谷這波AI人才爭奪戰(zhàn)里,扎克伯格是最務(wù)實的。他從不跟想挖的人談什么理想,各大科技公司的華裔人才,小扎動輒開價一兩億美元。
乃悟看到最極端的案例,是他花了148億美元買了AI數(shù)據(jù)標注公司Scale AI 49%的股份,不要董事會席位,不要投票權(quán)。只有一個附加條件:
CEO王先生全職加入Meta出任首席AI官。
在美國的AI圈子里,Meta已經(jīng)落后于OpenAI和谷歌之類的第一梯隊,以前小扎靠開價打法搞定過Instagram、Whatsapp等等,現(xiàn)在他又祭出了這一招。
要All in AI不是什么稀奇事,畢竟百度的Robin也喊了很多年了,乃悟就研究了一下花了這么多錢的Meta這些年在AI領(lǐng)域有啥進展,專業(yè)的咱就不說了,說點有意思的。
7月23日,Meta的法務(wù)部門接到了一份來自加州北區(qū)聯(lián)邦法院的傳票,兩家美國的成人視頻公司strike3和counterlife把它們告了。
按照原告的說法,從2018年開始,Meta就開始用BT工具從這倆網(wǎng)站下載各種語言和不同清晰度版本的愛情動作電影,而且往往是電影首發(fā)當天就下載,數(shù)量多達:
2396部!
倆公司向法院提交了各種證據(jù),比如通過工具檢測后發(fā)現(xiàn),下載地址都指向Meta的IP,其中一個IP還是Meta員工自己家里。
更讓倆公司憤怒的是,因為BitTorrent的特性是并行下載的人越多,速度越快,Meta居然還做種分發(fā)!
Meta為啥要下載這么多愛情動作電影,甚至員工還自愿加班回家繼續(xù)下載?兩家公司懷疑Meta是用這些素材:
訓(xùn)練AI。
我的媽啊,我就知道我的硬盤不養(yǎng)閑片,儲存的都是人工智能的未來?。?/p>
按照strike3的說法,Meta之所以選擇他們的成人視頻,主要是因為他們家的清晰度高、主題統(tǒng)一、畫面連貫,是訓(xùn)練AI,特別是生成類視頻模型的好素材。
Strike3還指責(zé),為了掩蓋這些素材都是盜版,Meta還架設(shè)了虛構(gòu)的服務(wù)器,他們曾經(jīng)向Meta去函警告,Meta依舊我行我素。忍無可忍的他們這才將Meta告上了法庭。
Meta方面否認了這些指控,不過外媒預(yù)測,Meta應(yīng)該會選擇庭外和解。
這是全球第一起關(guān)于成人影片和AI數(shù)據(jù)的版權(quán)糾紛,但卻不是LLM大模型們第一次惹上版權(quán)糾紛,甚至不是Meta的第一次。
此前不久,法院剛剛判決了一起和Meta有關(guān)的侵權(quán)案。起因是一堆美國作者把Meta告上法院,狀告他們利用盜版書訓(xùn)練AI,數(shù)量多達700多萬本。原告稱,Meta使用LibGen之類已經(jīng)被聯(lián)邦法院封禁的影子圖書館,做種下載圖書,訓(xùn)練自家AI。
根據(jù)Meta的內(nèi)部備忘錄顯示,他們甚至記錄了盜版書存在的錯印、漏印等問題。有Meta的員工爆料,他曾經(jīng)問過同事,這事兒問過法務(wù)了嗎?同事回復(fù),別家都這么干,所以咱們也這么干。
這個爆料人一看就是新人,有些事兒法務(wù)不讓干你就不干了?FBI天天警告你,有用嗎?
扎克伯格當時也出庭了,說他對此毫不知情。但內(nèi)部文件卻顯示,這些都得到了扎克伯格的允許。
最后,在Meta律師團隊的努力下,法院駁回了原告的上訴,理由是Meta訓(xùn)練的AI屬于合理運用,原告的證據(jù)不足。
不過,研發(fā)了Claude的Anthropic就沒這么好運了。他們也因為使用盜版書而被告上法院,負責(zé)審理此案的法官Alsup認為,買書來訓(xùn)練Claude沒問題,但用盜版就是你們的不對了。何況你們下載這些盜版書籍:
未必真的就只是用來訓(xùn)練AI。
Anthropic的立即上訴請求也被駁回,外媒預(yù)計他們可能面臨數(shù)十億美元的賠償。
這個法官好,strike3和counterlife能不能申請讓他來審愛情動作片訓(xùn)練AI的案子。
乃悟查了一下,至今為止,沒有任何一家大模型徹底說清楚自己的訓(xùn)練素材到底是哪兒來的。各家回答都差不多,什么我們數(shù)據(jù)都是網(wǎng)上的公開資料、書籍和新聞。
更有甚者,如OpenAI等公司還拒絕透露數(shù)據(jù)的詳細來源。
乃悟試了試問了幾個國內(nèi)大模型,他們的回答都如出一轍,什么保證合規(guī)啊,來自公開渠道和合作伙伴啊。但你進一步問,你的合作伙伴都有些誰?舉一個例子就行。他們就沉默了。
乃悟試了試,國內(nèi)很多大模型都能精準識別哈利波特中的章節(jié)原文。甚至可以整章整章背出英文原文。還特別注明:
未刪減。
據(jù)乃悟所知,JK羅琳的版權(quán)還沒到期吧?
背點盜版書算什么本事,有能耐你也讓FBI警告我一下子。
關(guān)注星球視頻號,熟知寰宇人間事
加乃悟微信:yangnw0705 備注公司-職業(yè)
給我一個在看,我能撬動整個星球
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.