百度今天正式開源了文心 4.5 系列模型
整個系列模型包括激活參數(shù)為 47B 和 3B 的兩個多模態(tài) MoE 模型,以及最小 0.3B 的十多個其他模型。
從測試報告來看跟 Qwen 3 和 Deepseek 水平差不多,而且還開源了訓(xùn)練的代碼。在預(yù)訓(xùn)練中,模型FLOPs利用率達(dá)到了47%。
開源模型API服務(wù),可在百度智能云千帆大模型平臺使用。
通過百度自研的飛槳框架在昆侖 3 和 H800 上訓(xùn)練,他們還開放了文心大模型開發(fā)套件ERNIEKit和大模型高效部署套件FastDeploy。
模型下載:huggingface.co/collections/baidu/ernie-45-6861cd4c9be84540645f35c9
技術(shù)報告同步發(fā)布:yiyan.baidu.com/blog/publication/ERNIE_Technical_Report.pdf
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.