就在剛剛,OpenAI 自 2019 年發(fā)布 GPT-2 以來(lái),推出了其首批開(kāi)放權(quán)重的大型語(yǔ)言模型——GPT-OSS。與通過(guò) OpenAI 網(wǎng)頁(yè)界面調(diào)用的閉源模型不同,這些新模型可免費(fèi)下載、在筆記本電腦及其他本地設(shè)備上運(yùn)行,甚至允許用戶進(jìn)行修改。
此次發(fā)布的模型包含兩個(gè)版本:1200 億參數(shù)版和200 億參數(shù)版。其中,較大版本可在單個(gè) NVIDIA GPU 上運(yùn)行,性能與 OpenAI 當(dāng)前的 o4-mini 模型相當(dāng);較小版本性能接近 o3-mini,僅需 16GB 內(nèi)存即可部署。兩款模型已通過(guò) Hugging Face、Databricks、Azure 和 AWS 等平臺(tái)發(fā)布,并采用 Apache 2.0 許可證,允許廣泛修改并可用于商業(yè)用途。
官方介紹稱:GPT-OSS-120b和 GPT-OSS-20b是兩款先進(jìn)的開(kāi)放權(quán)重語(yǔ)言模型,能夠在低成本條件下提供強(qiáng)大的實(shí)際性能。它們?cè)谕评砣蝿?wù)上的表現(xiàn)優(yōu)于同規(guī)模的現(xiàn)有開(kāi)源模型,具備出色的工具調(diào)用能力,并針對(duì)消費(fèi)級(jí)硬件的高效部署進(jìn)行了深度優(yōu)化。
PART 01
硬剛中國(guó)模型?
多年來(lái),OpenAI 一直未推出開(kāi)放權(quán)重的大型語(yǔ)言模型,部分用戶因此戲稱其為“ClosedAI”。過(guò)去幾個(gè)月,這些備受期待的模型兩次推遲發(fā)布,進(jìn)一步加劇了社區(qū)的失望情緒。而此次發(fā)布,標(biāo)志著 OpenAI 正在努力重塑其在開(kāi)放模型社區(qū)中的品牌形象。
據(jù)《麻省理工科技評(píng)論》分析,OpenAI 此舉背后,是美國(guó)在應(yīng)對(duì)中國(guó)于開(kāi)放模型領(lǐng)域日益增強(qiáng)的主導(dǎo)地位所面臨的壓力。
值得注意的是,Meta 曾憑借其 Llama 系列在美國(guó)開(kāi)放模型市場(chǎng)占據(jù)主導(dǎo)地位,但近期似乎正轉(zhuǎn)向更封閉的發(fā)布策略。與此同時(shí),中國(guó)的開(kāi)放模型如 DeepSeek、Kimi K2 以及阿里巴巴的 Qwen 系列,正越來(lái)越受到全球開(kāi)發(fā)者的青睞。
今年早些時(shí)候,CEO Sam Altman 曾表示,安全問(wèn)題是未及時(shí)發(fā)布開(kāi)放模型的主要原因。然而,隨著開(kāi)發(fā)者紛紛轉(zhuǎn)向成本更低、可定制性更強(qiáng)的開(kāi)源模型,繼續(xù)缺席這一領(lǐng)域被視為“站在了歷史的錯(cuò)誤一邊”。
對(duì)此,OpenAI 研究項(xiàng)目經(jīng)理 Casey Dvorak 在發(fā)布新聞發(fā)布會(huì)上表示:“我們絕大多數(shù)的企業(yè)和初創(chuàng)客戶已經(jīng)在廣泛使用各類開(kāi)放模型。此前,OpenAI 缺乏具有競(jìng)爭(zhēng)力的開(kāi)放產(chǎn)品,而現(xiàn)在,我們希望填補(bǔ)這一空白,真正讓客戶全面使用我們的技術(shù)。”
PART 02
可商用的GPT-OSS
開(kāi)放模型具備多個(gè)關(guān)鍵應(yīng)用場(chǎng)景:一些組織希望根據(jù)自身需求定制模型,或通過(guò)在本地設(shè)備運(yùn)行以降低長(zhǎng)期云服務(wù)成本,盡管前期硬件投入較高;而醫(yī)院、律所、政府等對(duì)數(shù)據(jù)敏感的機(jī)構(gòu),則需要能夠在本地部署、確保數(shù)據(jù)不出域的解決方案。
此次 OpenAI 選擇采用寬松的 Apache 2.0 許可證發(fā)布 GPT-OSS,支持商業(yè)用途,正是為了推動(dòng)上述應(yīng)用場(chǎng)景的發(fā)展。這一舉措值得肯定,也符合當(dāng)前主流開(kāi)源模型的授權(quán)慣例。
從更深層看,OpenAI 此舉也是為了重新確立其在 AI 研究生態(tài)中的領(lǐng)導(dǎo)地位。一旦研究人員廣泛采用 GPT-OSS 作為基礎(chǔ)模型,OpenAI 有望吸收社區(qū)創(chuàng)新成果,反哺自身模型生態(tài)。
在安全方面,OpenAI 表示,GPT-OSS 是其迄今為止經(jīng)過(guò)最嚴(yán)格安全測(cè)試的模型,并已與外部安全機(jī)構(gòu)合作,評(píng)估其在網(wǎng)絡(luò)安全、生物風(fēng)險(xiǎn)等領(lǐng)域的潛在濫用可能。公司還強(qiáng)調(diào),該模型的“思維鏈”(chain-of-thought)將被顯式展示,以便監(jiān)控其是否存在欺騙、越獄或不當(dāng)行為。輸出為純文本格式,且與 OpenAI 所有模型一致,其訓(xùn)練數(shù)據(jù)不會(huì)公開(kāi)。
目前,OpenAI 尚未公布 GPT-OSS 與 Llama、DeepSeek或谷歌 Gemma 等同類模型的基準(zhǔn)對(duì)比數(shù)據(jù),也未承諾未來(lái)版本的發(fā)布計(jì)劃。但其目標(biāo)明確:吸引希望更好掌控?cái)?shù)據(jù)使用方式的中小型開(kāi)發(fā)者和企業(yè)用戶。
OpenAI 始終相信:只要降低技術(shù)門(mén)檻,創(chuàng)新便會(huì)自然涌現(xiàn)。如今,GPT-OSS 的發(fā)布,正是這一信念的又一次實(shí)踐。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.