編譯 | 蘇宓
出品 | CSDN(ID:CSDNnews)
預(yù)熱了很久,OpenAI 終于在今天罕見地放出重磅“開源大禮”——兩款全新開源模型gpt-oss-120b和gpt-oss-20b,不僅免費(fèi)開放下載,還支持在 PC 和筆記本本地運(yùn)行。這是 OpenAI 自 2019 年發(fā)布 GPT-2 以來首次再次開源大模型,距離上一次已經(jīng)過去了整整六年。
Hugging Face 地址:
https://huggingface.co/openai/gpt-oss-120b
https://huggingface.co/openai/gpt-oss-20b
GitHub 地址:https://github.com/openai/gpt-oss
大小兩個(gè)版本,分別面向高配和主流用戶
具體來看,每個(gè)模型都是一個(gè) Transformer,它利用專家混合 (MoE) 來減少處理輸入所需的活躍參數(shù)數(shù)量。gpt-oss-120b 是一個(gè)包含 1170 億個(gè)參數(shù)的模型,需要 80GB VRAM 才能運(yùn)行,顯然是為多卡、云平臺(tái)或高端本地部署準(zhǔn)備的“大力選手”,每個(gè)令牌激活 51 億個(gè)參數(shù)。
相對(duì)輕量的 gpt-oss-20b 則只有 210 億參數(shù),16GB 顯存的單張顯卡就能跑,適合開發(fā)者在主流工作站或筆記本上使用,其激活 36 億個(gè)參數(shù)。這些模型采用交替的密集和局部帶狀稀疏注意力模式,與 GPT?3 類似。
這兩個(gè)模型兩者均采用 Apache 2.0 許可證,用戶可以自由下載、部署和修改,幾乎沒有使用限制。
OpenAI 表示,“此次發(fā)布是其對(duì)開源生態(tài)系統(tǒng)承諾的重要一步,符合其讓人工智能的益處廣泛普及的使命?!?該公司希望這些工具能夠成為開發(fā)人員、研究人員和公司高效運(yùn)行和定制的低成本工具。
表現(xiàn)如何?比肩 o3、o4-mini,性能不俗
雖然是開源模型,但性能并不“打折”,根據(jù) OpenAI 披露的官方數(shù)據(jù)顯示:
gpt-oss-120b 在 Codeforces 編程測(cè)試中使用工具獲得2622 分,與 OpenAI 自家商用模型 o3 和 o4-mini 相當(dāng),甚至擊敗了 o3-mini。
gpt-oss-20b 在使用工具時(shí)拿下 2516 分,不使用工具也有 2230 分,整體表現(xiàn)略優(yōu)于 o3-mini。
此外,120b 在醫(yī)療和數(shù)學(xué)類問題上超過 o4-mini,而 20b 則也在多個(gè)測(cè)試維度上勝過 o3-mini。
在通用評(píng)測(cè) “Humanity’s Last Exam” 中,兩款模型也展現(xiàn)了與 o3、o4-mini 相當(dāng)?shù)臏?zhǔn)確率,說明其推理和基礎(chǔ)能力具備實(shí)用價(jià)值。
時(shí)下,這兩款模型已經(jīng)在 Hugging Face 上線,并默認(rèn)使用高效的 MXFP4 量化格式。支持部署的平臺(tái)包括 Hugging Face、Microsoft Azure、AWS、Ollama、llama.cpp、LM Studio、Fireworks、Together AI、vLLM 等主流本地或云端環(huán)境。
為何六年后再開源?
當(dāng)提及“為什么突然又開源”的問題,OpenAI 給出的解釋:“通過將這些開放模型整合到我們現(xiàn)有的 API 服務(wù)中,我們旨在加速前沿研究,促進(jìn)創(chuàng)新,并推動(dòng)在廣泛應(yīng)用場(chǎng)景下實(shí)現(xiàn)更安全、更透明的 AI 開發(fā)。這些開放模型還降低了新興市場(chǎng)、資源受限行業(yè)及小型組織采用專有模型的門檻,這些群體可能缺乏預(yù)算或靈活性來采用專有模型。憑借強(qiáng)大的、易于獲取的工具,世界各地的人們可以構(gòu)建、創(chuàng)新并為自己和他人創(chuàng)造新的機(jī)遇?!薄?/p>
作為一家因“閉源戰(zhàn)略”飽受爭(zhēng)議的公司,OpenAI 這次的舉動(dòng)引發(fā)了不少關(guān)注。雖然目前仍是相對(duì)獨(dú)立于 GPT-4 的開源產(chǎn)品線,但在高性能本地模型稀缺的當(dāng)下,gpt-oss 系列的發(fā)布無疑為開源社區(qū)注入了新的活力。
來源:https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/
2025 全球產(chǎn)品經(jīng)理大會(huì)
8月15–16日·北京威斯汀酒店
互聯(lián)網(wǎng)大廠&AI創(chuàng)業(yè)公司產(chǎn)品人齊聚
12 大專題,趨勢(shì)洞察 × 實(shí)戰(zhàn)拆解
掃碼領(lǐng)取大會(huì) PPT,搶占 AI 產(chǎn)品新紅利
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.