天眼查App顯示,近日,deepseek關(guān)聯(lián)公司杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司申請的“一種大語言模型的部署方法及系統(tǒng)”專利公布。
摘要顯示,該發(fā)明涉及人工智能領(lǐng)域,有益效果在于將預(yù)填充階段和解碼階段分別部署在高性能計(jì)算能力和大內(nèi)存的機(jī)器上,均衡負(fù)載任務(wù),實(shí)現(xiàn)最大化的硬件利用,減少閑置算力,降低整體延遲,提高吞吐量,增強(qiáng)系統(tǒng)的擴(kuò)展性和容錯(cuò)性。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.