機器之心報道
機器之心編輯部
申請轉(zhuǎn)發(fā)項目推文近一年才批準(zhǔn)?
近日,Meta CEO 馬克?扎克伯格的一篇《個人超級智能》公開信賺盡了眼球,其中不僅提到他們已經(jīng)看到了「AI 系統(tǒng)自我改進的跡象」,還表示他們將會「謹(jǐn)慎選擇開源內(nèi)容」。
一時之間,相關(guān)的討論和爭議達(dá)到了又一輪小高潮。而與此同時,Meta 內(nèi)部風(fēng)波暗涌。一方面為追趕 AI 頂級研究陣地,Meta 砸下逾 140 億美元重注 Scale AI,并組成 Meta Superintelligence Labs (MSL),廣攬來自 OpenAI、DeepMind 等頂級團隊的 AI 人才,提供百萬乃至上億美元簽約金;另一方面,Meta 內(nèi)部卻又被屢屢爆出存在五花八門的關(guān)于資源、人力、內(nèi)部管控等的紛爭,甚至還有一位名為 Tijmen Blankevoort 的研究科學(xué)家曾發(fā)長文控訴 Meta 內(nèi)部文化和組織失調(diào)的慘淡景象。
更多詳情可參閱我們之前的一篇報道《是的,LeCun 要向 28 歲的 Alexandr Wang 匯報!這是 Meta 新 AI 團隊的一些獨家內(nèi)部消息》。
現(xiàn)在,又有更多有關(guān) Meta 內(nèi)部混亂和低效的細(xì)節(jié)浮出水面。
就在扎克伯格《個人超級智能》公開信發(fā)布幾小時后,Meta FAIR 研究科學(xué)家朱澤園在一篇回復(fù)推文中無奈地表示:讓 AI at Meta(@AIatMeta)這個 X 賬號轉(zhuǎn)發(fā)一下他的研究非常困難 ——「我花了近一年時間才讓他們批準(zhǔn)轉(zhuǎn)推我的項目」;但「轉(zhuǎn)推帶來的觸達(dá)量還不到他自己推文的 10%?!?/p>
朱澤園表示:「根本不值得這么費力。」
他還表示:「話雖如此,我理解。我的工作在 Meta 內(nèi)部并不被看重,所以他們自然有更重要的事情需要社交媒體推廣?!共贿^有趣的是,他還提到 Meta 以外的公司對他的工作更感興趣,不知道這是否暗示著我們將會看到他有新的工作動向?
關(guān)于這條推文,機器之心向他進行了求證。
朱澤園回應(yīng)稱,他首先非常感謝社區(qū)和粉絲一直以來幫忙推廣自己的項目。他解釋道,Meta 關(guān)注的是如何盈利,以及大模型之間的競賽。他的Physics of Language Models項目(更多介紹請參閱文末擴展閱讀)從一開始就幾乎沒有獲得 Meta 層面的支持與關(guān)注。
他表示,近期收到了大量同行的來信,不少 AI 從業(yè)者都對行業(yè)動蕩感到焦慮?!肝蚁胩嵝汛蠹?,面對行業(yè)變化,更應(yīng)該變被動為主動,把握機會,不要等著公司裁員。其實現(xiàn)在正是跳槽的好時機?!?/p>
至于個人是否跳槽,朱澤園表示,自己終歸會離開 Meta,只是目前更看重手頭項目,需要節(jié)省時間,而跳槽時還要花時間考慮是否要帶一個團隊、帶哪些人一起走,所以現(xiàn)在暫時不會做這件事,金錢反而不是最重要的。他強調(diào),無論身處何處,都會繼續(xù)做 Physics of Language Models,因為這是 AI 領(lǐng)域最基礎(chǔ)的工作。
針對 Meta 內(nèi)部的管理問題,朱澤園坦言,前員工 Tijmen Blankevoort 此前公開的內(nèi)部文化批評「基本屬實」,而他其實還有很多補充,比如甚至遇到過現(xiàn)實版「農(nóng)夫與蛇」的經(jīng)歷,不過這些故事只能等離職后才能說出來。
至于這條推文提到的「對照實驗」,則要從朱澤園上周末發(fā)布的開源項目說起。
朱澤園在 7 月 27 日發(fā)布了 Physics of Language Models 項目的第一階段代碼,其中包含了「在 42k GPU 小時內(nèi)預(yù)訓(xùn)練強大 8B 基礎(chǔ)模型所需的全部內(nèi)容」,包括數(shù)據(jù)、訓(xùn)練代碼和模型權(quán)重,可以說是真正的開源。并且「可以用不超過 10% 的訓(xùn)練資源打敗 Llama3-8B」
項目地址:https://github.com/facebookresearch/PhysicsLM4
然而,該項目開源發(fā)布一段時間,朱澤園卻疑惑地發(fā)現(xiàn)項目關(guān)注度不高。這讓他不禁發(fā)出了痛心一問:「完全開源的研究真有必要嗎?」他還問道:「我是否應(yīng)該選擇閉源以節(jié)省時間并專注于純粹的研究?」
而這條推文的關(guān)注熱度就高多了,也有很多業(yè)內(nèi)人士參與討論互動。
比如 Hugging Face CEO Clement Delangue 表示開源是推動 AI 領(lǐng)域發(fā)展的正確做法,可以使其更加開放、協(xié)作和安全!
斯坦福大學(xué)應(yīng)用物理學(xué)副教授 Surya Ganguli 更是表示「不開源就不能稱之為研究」。
當(dāng)然,也有人表示某些開源確實浪費時間,比如前段時間被 Meta 挖走的前 OpenAI 和 DeepMind 研究者 Lucas Beyer 表示 bigco 項目的開源就浪費了很多時間,不過他也指出了值得開源的三種情況。
當(dāng)然,除了開源以及對 X 推薦機制的討論,朱澤園的這條推文也引出了更多關(guān)于 Meta 的討論。
比如網(wǎng)友 @papers_anon 表示「FAIR 在傳播其團隊的有趣研究方面做得很差」——FAIR 似乎完全仰賴研究者使用自己的個人 X 帳號來宣傳,而同時 FAIR 又不直接為每位研究者購買 X Premium+ 來推廣研究成果,也沒有一個真正專注于研究成果展示的 X 賬戶來發(fā)布內(nèi)容。他總結(jié)說:「FAIR 似乎受到了太多內(nèi)部政策的束縛,甚至無法以無痛的方式促進開放研究?!?/p>
另外,朱澤園自己也指出了關(guān)注度可能與研究資源掛鉤的現(xiàn)實,而這就不得不迫使研究者在 X 上場搞宣傳,而他也正需要為這項研究的第二、三階段爭取到 GPU。
他也吐嘈了 Meta 內(nèi)部的審核批準(zhǔn)流程:僅僅是獲得公共數(shù)據(jù)集的使用批準(zhǔn)并發(fā)布權(quán)重就需要浪費兩個多月的時間(這還不包括科研本身),「而且情況只會越來越糟。如果一個數(shù)據(jù)條目未獲得批準(zhǔn),你的整個模型都可能被推翻重新訓(xùn)練。而哪里有這么多資源呢?」
他還提到,光是為了讓 Physics of Language Models 這個項目以 Apache 2.0 協(xié)議開源,他就與 Meta 的法務(wù)部門溝通了超過一周。如果發(fā)布的模型過于強大,還會出更多問題。
當(dāng)被問到為什么 Meta 說不開源了,同時還允許該項目發(fā)布時(另外這兩天還開源了 MetaCLIP2 和 VGGT),朱澤園風(fēng)趣地說:「這兩者可能都是真的。如今,不確定性極大,一切都可能在一夜之間發(fā)生改變,也許我們在進行最后一輪開源?!?/p>
https://x.com/papers_anon/status/1950672022134247579
https://x.com/ZeyuanAllenZhu/status/1950718378353811730
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.