01 歷史發(fā)展
寒武紀(jì) 2016 年誕生,2020 年登陸資本市場,始終聚焦人工智能芯片的研發(fā)創(chuàng)新,錨定 AI 領(lǐng)域 “核心處理器” 這一關(guān)鍵角色 —— 如同為智能世界打造 “算力心臟”。
02 公司創(chuàng)始人團(tuán)隊(duì)
寒武紀(jì)由江西南昌的陳云霽、陳天石兄弟創(chuàng)立,現(xiàn)由弟弟陳天石任總經(jīng)理。兩人成長路徑像 “復(fù)制粘貼”:哥哥 1983 年生,14 歲進(jìn)中科大少年班,獲計(jì)算機(jī)博士并參與 “龍芯”;弟弟小兩歲,16 歲入同校少年班,同是計(jì)算機(jī)博士,后任中科院計(jì)算所研究員。
讀博時(shí)哥哥鉆研芯片、弟弟主攻 AI,2010 年(當(dāng)時(shí) AlphaGo 未問世、英偉達(dá)還只是顯卡廠商),已是龍芯 3 號主架構(gòu)師的陳云霽與弟弟一拍即合,決定研發(fā) AI 芯片。2016 年借中科院平臺成立寒武紀(jì),很快推出全球首個(gè)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)處理器芯片,打破中國芯片空白,當(dāng)年拿上億訂單。
兄弟倆定鐵律 “芯片是長跑,好東西得拿命熬”。面對英偉達(dá)生態(tài)壟斷,陳天石選差異化,專注底層硬件和工具鏈。2019 年華為斷供致寒武紀(jì)失 90% 營收,他砍短期盈利的 IP 授權(quán)業(yè)務(wù),投云端芯片;2020 年科創(chuàng)板上市遭虧超 50 億、研發(fā)占比 157% 的質(zhì)疑,他回應(yīng) “Intel52 歲、NVIDIA27 歲,寒武紀(jì)才 4 歲”。
2022 年美國制裁,陳天石押注國產(chǎn) 7nm 工藝,帶團(tuán)隊(duì) 300 天造出比肩英偉達(dá) A100 的 “思元 590”。2025 年,這位 85 后以 870 億身家成江西首富,卻稱 “寒武紀(jì)愿做‘墩子’”。如今其全年?duì)I收預(yù)計(jì) 10-12 億元(不及英偉達(dá)千分之一),但國產(chǎn)替代浪潮正推它邁向中國 AI 芯片新高度。
03 營收拆分情況
寒武紀(jì)像 AI 算力的 “水電供應(yīng)商”—— 通過芯片和軟件,把人工智能所需的算力,精準(zhǔn)輸送到云端數(shù)據(jù)中心、邊緣設(shè)備甚至手機(jī)里,讓各行業(yè)的智能應(yīng)用跑得更快、更高效。其主要業(yè)務(wù)收入和占比情況如下所示:
04 公司產(chǎn)品線如下:
按產(chǎn)品線勾勒業(yè)務(wù)版圖,寒武紀(jì)的 “算力矩陣” 錨定云端、邊緣端兩條硬件主線,再以 IP 授權(quán)及軟件業(yè)務(wù)編織貫通二者的生態(tài)網(wǎng)絡(luò) 。
1)云端產(chǎn)品線是 AI 算力核心動力體系:智能芯片及加速卡為云服務(wù)器、數(shù)據(jù)中心提供高能效算力,支撐 AI 任務(wù)增長;訓(xùn)練整機(jī)如玄思 1000,可通過多設(shè)備組合實(shí)現(xiàn)算力擴(kuò)展,滿足性能、魯棒性等需求。
2)邊緣產(chǎn)品線是算力中繼站:邊緣芯片及加速卡補(bǔ)終端算力短板、緩解云端數(shù)據(jù)安全與延時(shí)問題,適配智能制造、智能交通等多場景。
3)IP 授權(quán)及軟件是云邊端算力銜接中樞:終端智能處理器 IP(1A/1H/1M 系列)嵌入終端 SoC,支撐設(shè)備 AI 功能;基礎(chǔ)軟件Cambricon Neuware 打破開發(fā)壁壘,讓 AI 應(yīng)用可在全系列芯片上便捷運(yùn)行。
了解更多,下方掃碼直接加入:
05 公司核心競爭力
05-1、云、邊、端全棧布局
從硬件層面,公司搭建云、邊、端三大場景 “算力產(chǎn)品網(wǎng)絡(luò)”:AI 芯片依場景分云端(數(shù)據(jù)中心,算力功耗最高)、邊緣端(智能制造等,次之)、終端(消費(fèi)電子等,最低)三類,公司對應(yīng)研發(fā)云端智能芯片及加速卡、邊緣智能芯片及加速卡、終端智能處理器 IP,精準(zhǔn)匹配需求。
云端產(chǎn)品
公司云端產(chǎn)品線含云端智能芯片及加速卡、訓(xùn)練整機(jī):前者需適配服務(wù)器并經(jīng)廠商嚴(yán)格認(rèn)證才能商用,公司需攻克核心技術(shù)、跨越高準(zhǔn)入門檻;后者是計(jì)算集群的單體訓(xùn)練服務(wù)器,核心算力來自自研芯片,整機(jī)亦為自研。
公司智能計(jì)算集群系統(tǒng)業(yè)務(wù),是算力基建的 “整體解決方案服務(wù)商”,提供全集群搭建與管理服務(wù),面向有技術(shù)基礎(chǔ)的商業(yè)客戶,國內(nèi)市占率居第一梯隊(duì)。
對需建設(shè) AI 計(jì)算能力的客戶,部分自行采購芯片加速卡集成現(xiàn)有集群,部分則依賴公司定制化軟硬件方案以提升運(yùn)行效率;2021 年中標(biāo)昆山智能計(jì)算中心等項(xiàng)目,在西安灃東、珠海橫琴、南京、昆山落子;2022 年中標(biāo)南京智能計(jì)算中心(二、三期)項(xiàng)目,以玄思 1001 為核心算力單元交付集群系統(tǒng);2023 年參與臺州、沈陽算力基建并完成集群交付。
邊緣端產(chǎn)品
公司以思元 220 芯片為核心,推出加速卡和智能模組,專攻 AI 邊緣推理。邊緣計(jì)算像終端與云端間的 “中繼站”,既補(bǔ)終端算力短板,又解云端數(shù)據(jù)安全、帶寬延遲等難題,驅(qū)動智能制造、零售等多領(lǐng)域發(fā)展。
思元 220 基于臺積電 16nm 工藝,1GHz 主頻下,INT4/8/16 性能達(dá) 32、16、8TOPS,功耗不足 10W ,支持視覺、語音等多 AI 場景;MLU220 - SOM 智能模組僅信用卡大小,卻能實(shí)現(xiàn) 16TOPS 算力,功耗僅 15W 。
終端產(chǎn)品端
寒武紀(jì) 1A、1H、1M 系列芯片覆蓋 0.5-8TOPS 梯度算力,如同為手機(jī)、IoT 設(shè)備的 SoC 芯片嵌入 “AI 算力插件”,助其快速具備本地 AI 處理能力。
產(chǎn)品以 IP 授權(quán)模式交付 —— 將芯片功能模塊設(shè)計(jì)藍(lán)圖授權(quán)客戶集成至自身芯片,經(jīng)流片成最終產(chǎn)品;收費(fèi)采用 “固定費(fèi)用(按授權(quán)進(jìn)度)+ 提成費(fèi)用(按季度銷量)” 模式,基本無成本。目前多家國內(nèi)頭部芯片設(shè)計(jì)公司已獲授權(quán),相關(guān)產(chǎn)品集成于上億臺智能終端。
05-2、基礎(chǔ)系統(tǒng)軟件平臺
公司為云邊端全系列芯片與處理器,配套統(tǒng)一基礎(chǔ)系統(tǒng)軟件 Cambricon Neuware(含開發(fā)工具鏈)。
其像算力生態(tài)的 “通用銜接樞紐”,打破場景開發(fā)壁壘,兼具高性能、靈活與可擴(kuò)展性;同一 AI 應(yīng)用無需移植,即可如通用插頭適配不同插座般,在全系列產(chǎn)品上高效運(yùn)行。依托它,程序員可跨云邊端開發(fā) AI 應(yīng)用,提升開發(fā)部署效率,也能讓異構(gòu)硬件資源如精密機(jī)組般統(tǒng)一管理、調(diào)度與協(xié)同計(jì)算。
公司軟件平臺分訓(xùn)練與推理兩類:
(1)訓(xùn)練軟件平臺如同 “開源生態(tài)的適配橋梁”,擁抱開源研發(fā)高性能通用訓(xùn)練軟件棧,原生支持 Pytorch、Tensorflow,提供 Profiler、分布式訓(xùn)練等完善基建,用戶模型代碼可快速遷移;2024 年底前持續(xù)迭代 Megatron 等分布式組件,支撐主流大模型訓(xùn)練需求,縮短適配周期,還新增對 DeepSeek、Llama 等系列大模型的支持。
(2)推理軟件平臺以 2021 年發(fā)布的 MagicMind 為核心 —— 它是業(yè)界首個(gè)基于 MLIR 圖編譯技術(shù)實(shí)現(xiàn)商用的推理引擎,如同 “推理業(yè)務(wù)的快速轉(zhuǎn)換器”,用戶投入極少開發(fā)成本,即可將推理業(yè)務(wù)部署到全系列產(chǎn)品;2024 年底前已適配優(yōu)化 DeepSeek 等文生文模型,及 Flux 等多模態(tài)模型。
公司云端、邊緣端、終端的智能芯片、處理器 IP 及基礎(chǔ)系統(tǒng)軟件,都基于自研處理器架構(gòu),且搭建在自研 MLU 指令集上—— 這就像建房子用自家設(shè)計(jì)的地基和核心圖紙,能穩(wěn)穩(wěn)抓牢核心技術(shù)自主權(quán),思元 590 還會采用全新的 MLUarch05 架構(gòu)。
研發(fā)通用型智能芯片和其基礎(chǔ)系統(tǒng)軟件,堪比搭一套極端復(fù)雜的大型精密設(shè)備:要掌握大量關(guān)鍵技術(shù),涉及面廣、難度高,而處理器微架構(gòu)和指令集是最底層的核心。
①一方面,公司已自主研發(fā)四代智能處理器微架構(gòu),比如思元 370 用 MLUarch03,思元 590 將用新的 MLUarch05;
②另一方面,指令集是芯片生態(tài)的 “基石”,公司是國際上早做智能處理器指令集的少數(shù)企業(yè),2016 年起已搞出四代商用指令集,同一套就能支持 AI 訓(xùn)練和推理,適配云、邊、端不同場景,幫公司建起云邊端一體、訓(xùn)練推理融合的軟件平臺和特色 AI 生態(tài)。
截至 2024 年末,公司還在研發(fā)新一代微架構(gòu)和指令集,會重點(diǎn)優(yōu)化大模型訓(xùn)練推理場景,進(jìn)一步提升產(chǎn)品在編程靈活性、易用性、性能、功耗等方面的競爭力。
06 AI 算力芯片市場
行業(yè)市場詳情如下:
2025 年中國企業(yè) AI 算力投入約 1200 億美元,其中 50% 用于 AI 芯片采購,按單卡 10 萬元估算需 300-400 萬張卡;但供給端缺口顯著,英偉達(dá) H20 僅到貨 50 萬張,疊加國產(chǎn)產(chǎn)能不足,全年缺 150-200 萬張,2026 年缺口或超 200 萬張。寒武紀(jì)憑借下一代思元 590/690 性能提升 70%-80%、2025 年產(chǎn)能翻倍,有望承接超 30% 國產(chǎn)替代需求。
不過 2024 年全球 AI 芯片市場中,英偉達(dá)等三巨頭占 91%(英偉達(dá)獨(dú)占 80%),寒武紀(jì)僅占 1%,未來仍有不少空間。
國內(nèi)外的主要競爭對手情況如下:
07 未來展望
寒武紀(jì)作為國內(nèi)AI芯片先行者,正面臨技術(shù)迭代與商業(yè)化雙重挑戰(zhàn)。短期看,需突破高端制程限制,優(yōu)化軟硬件生態(tài);長期而言,國產(chǎn)算力需求爆發(fā)或帶來機(jī)遇。若能在自動駕駛、大模型訓(xùn)練等領(lǐng)域站穩(wěn),有望成為智能時(shí)代的底層引擎。
下方掃碼直接加入:
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.