網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

OpenAI深夜放大招！首批開(kāi)放權(quán)重模型GPT-OSS發(fā)布，硬剛中國(guó)AI？

2025-08-06 09:55:04　來(lái)源: 首席信息官

北京舉報(bào)

分享至

就在剛剛，OpenAI 自 2019 年發(fā)布 GPT-2 以來(lái)，推出了其首批開(kāi)放權(quán)重的大型語(yǔ)言模型——GPT-OSS。與通過(guò) OpenAI 網(wǎng)頁(yè)界面調(diào)用的閉源模型不同，這些新模型可免費(fèi)下載、在筆記本電腦及其他本地設(shè)備上運(yùn)行，甚至允許用戶進(jìn)行修改。

此次發(fā)布的模型包含兩個(gè)版本：1200 億參數(shù)版和200 億參數(shù)版。其中，較大版本可在單個(gè) NVIDIA GPU 上運(yùn)行，性能與 OpenAI 當(dāng)前的 o4-mini 模型相當(dāng)；較小版本性能接近 o3-mini，僅需 16GB 內(nèi)存即可部署。兩款模型已通過(guò) Hugging Face、Databricks、Azure 和 AWS 等平臺(tái)發(fā)布，并采用 Apache 2.0 許可證，允許廣泛修改并可用于商業(yè)用途。

官方介紹稱：GPT-OSS-120b和 GPT-OSS-20b是兩款先進(jìn)的開(kāi)放權(quán)重語(yǔ)言模型，能夠在低成本條件下提供強(qiáng)大的實(shí)際性能。它們?cè)谕评砣蝿?wù)上的表現(xiàn)優(yōu)于同規(guī)模的現(xiàn)有開(kāi)源模型，具備出色的工具調(diào)用能力，并針對(duì)消費(fèi)級(jí)硬件的高效部署進(jìn)行了深度優(yōu)化。

PART 01

硬剛中國(guó)模型？

多年來(lái)，OpenAI 一直未推出開(kāi)放權(quán)重的大型語(yǔ)言模型，部分用戶因此戲稱其為“ClosedAI”。過(guò)去幾個(gè)月，這些備受期待的模型兩次推遲發(fā)布，進(jìn)一步加劇了社區(qū)的失望情緒。而此次發(fā)布，標(biāo)志著 OpenAI 正在努力重塑其在開(kāi)放模型社區(qū)中的品牌形象。

據(jù)《麻省理工科技評(píng)論》分析，OpenAI 此舉背后，是美國(guó)在應(yīng)對(duì)中國(guó)于開(kāi)放模型領(lǐng)域日益增強(qiáng)的主導(dǎo)地位所面臨的壓力。

值得注意的是，Meta 曾憑借其 Llama 系列在美國(guó)開(kāi)放模型市場(chǎng)占據(jù)主導(dǎo)地位，但近期似乎正轉(zhuǎn)向更封閉的發(fā)布策略。與此同時(shí)，中國(guó)的開(kāi)放模型如 DeepSeek、Kimi K2 以及阿里巴巴的 Qwen 系列，正越來(lái)越受到全球開(kāi)發(fā)者的青睞。

今年早些時(shí)候，CEO Sam Altman 曾表示，安全問(wèn)題是未及時(shí)發(fā)布開(kāi)放模型的主要原因。然而，隨著開(kāi)發(fā)者紛紛轉(zhuǎn)向成本更低、可定制性更強(qiáng)的開(kāi)源模型，繼續(xù)缺席這一領(lǐng)域被視為“站在了歷史的錯(cuò)誤一邊”。

對(duì)此，OpenAI 研究項(xiàng)目經(jīng)理 Casey Dvorak 在發(fā)布新聞發(fā)布會(huì)上表示：“我們絕大多數(shù)的企業(yè)和初創(chuàng)客戶已經(jīng)在廣泛使用各類開(kāi)放模型。此前，OpenAI 缺乏具有競(jìng)爭(zhēng)力的開(kāi)放產(chǎn)品，而現(xiàn)在，我們希望填補(bǔ)這一空白，真正讓客戶全面使用我們的技術(shù)。”

PART 02

可商用的GPT-OSS

開(kāi)放模型具備多個(gè)關(guān)鍵應(yīng)用場(chǎng)景：一些組織希望根據(jù)自身需求定制模型，或通過(guò)在本地設(shè)備運(yùn)行以降低長(zhǎng)期云服務(wù)成本，盡管前期硬件投入較高；而醫(yī)院、律所、政府等對(duì)數(shù)據(jù)敏感的機(jī)構(gòu)，則需要能夠在本地部署、確保數(shù)據(jù)不出域的解決方案。

此次 OpenAI 選擇采用寬松的 Apache 2.0 許可證發(fā)布 GPT-OSS，支持商業(yè)用途，正是為了推動(dòng)上述應(yīng)用場(chǎng)景的發(fā)展。這一舉措值得肯定，也符合當(dāng)前主流開(kāi)源模型的授權(quán)慣例。

從更深層看，OpenAI 此舉也是為了重新確立其在 AI 研究生態(tài)中的領(lǐng)導(dǎo)地位。一旦研究人員廣泛采用 GPT-OSS 作為基礎(chǔ)模型，OpenAI 有望吸收社區(qū)創(chuàng)新成果，反哺自身模型生態(tài)。

在安全方面，OpenAI 表示，GPT-OSS 是其迄今為止經(jīng)過(guò)最嚴(yán)格安全測(cè)試的模型，并已與外部安全機(jī)構(gòu)合作，評(píng)估其在網(wǎng)絡(luò)安全、生物風(fēng)險(xiǎn)等領(lǐng)域的潛在濫用可能。公司還強(qiáng)調(diào)，該模型的“思維鏈”（chain-of-thought）將被顯式展示，以便監(jiān)控其是否存在欺騙、越獄或不當(dāng)行為。輸出為純文本格式，且與 OpenAI 所有模型一致，其訓(xùn)練數(shù)據(jù)不會(huì)公開(kāi)。

目前，OpenAI 尚未公布 GPT-OSS 與 Llama、DeepSeek或谷歌 Gemma 等同類模型的基準(zhǔn)對(duì)比數(shù)據(jù)，也未承諾未來(lái)版本的發(fā)布計(jì)劃。但其目標(biāo)明確：吸引希望更好掌控?cái)?shù)據(jù)使用方式的中小型開(kāi)發(fā)者和企業(yè)用戶。

OpenAI 始終相信：只要降低技術(shù)門(mén)檻，創(chuàng)新便會(huì)自然涌現(xiàn)。如今，GPT-OSS 的發(fā)布，正是這一信念的又一次實(shí)踐。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.