文:澤平宏觀團(tuán)隊(duì)
導(dǎo)讀
人工智能引領(lǐng)第四次科技革命,是當(dāng)前最火的、最具前景、最具爆發(fā)力的科技賽道。進(jìn)入到2025年,發(fā)生了什么新的變化?中國人工智能正告別“百模大戰(zhàn)”的規(guī)模競賽,向以DeepSeek等六小虎為代表的頭部大模型集中。AI發(fā)展的核心,從追求模型“可用”轉(zhuǎn)向?qū)崿F(xiàn)場景的“好用”。
2025年,AI發(fā)展有四大核心:
趨勢一是應(yīng)用革命,未來是執(zhí)行任務(wù)的行動(dòng)式AI,AI能幫你接近真實(shí)的問題,而不僅僅是知識生成的生成式AI。執(zhí)行任務(wù),在數(shù)字世界就是代理AI,AI Agent,在物理世界就是具身智能AI。
趨勢二是代理AI正在重塑交互范式,以后能顛覆當(dāng)前的軟件APP。 AI正從“對話AI”變成“干活A(yù)I”。AI能自主規(guī)劃、調(diào)用工具、完成復(fù)雜任務(wù),成為未來新的流量分配中心。字節(jié)、百度等大廠已入局,搶占生態(tài)位。
趨勢三是硬件+AI,具身智能AI多點(diǎn)開花,商業(yè)化進(jìn)程加速。智能駕駛是最先落地的成熟場景,正迎來市場滲透率拐點(diǎn)。隨著將高階智駕下放至入門車型,預(yù)計(jì)2025年高速與城市NOA滲透率有望實(shí)現(xiàn)翻倍增長,突破20%大關(guān)。人形機(jī)器人則處于商業(yè)化黎明期,正以汽車和物流工廠為首個(gè)試驗(yàn)場,探索B端應(yīng)用場景。AI眼鏡賽道被大模型重新激活,未來中國企業(yè)有望憑借市場消費(fèi)者興趣度高漲、供應(yīng)鏈完備和研發(fā)速度三大獨(dú)特優(yōu)勢實(shí)現(xiàn)跨越式發(fā)展。
趨勢四是基礎(chǔ)設(shè)施層,算力與數(shù)據(jù)是支撐產(chǎn)業(yè)發(fā)展的兩大基石,未來算力國產(chǎn)化加速、打破數(shù)據(jù)枯竭。中國的AI算力正在圍堵中尋求突圍。在英偉達(dá)占據(jù)全球數(shù)據(jù)中心GPU市場98%份額的背景下,美國的三輪精準(zhǔn)封鎖使國產(chǎn)算力替代迫在眉睫。國產(chǎn)芯片性能已快速追趕(如華為昇騰910C在性能方面已開始追平先進(jìn)水平),未來先進(jìn)制程工藝與核心生態(tài)上,依然需要面臨加速國產(chǎn)化替代的挑戰(zhàn)。全球AI界正面臨高質(zhì)量訓(xùn)練數(shù)據(jù)將在2028年枯竭的危機(jī),在數(shù)據(jù)枯竭預(yù)期下,未來需要重構(gòu)AI數(shù)據(jù)筑護(hù)城河。
目錄
1 大模型層:迭代永不停歇
1.1 頭部大模型格局更加穩(wěn)定
1.2 后訓(xùn)練是破局關(guān)鍵
1.3 推理需求顯著增長
2 應(yīng)用層:AI應(yīng)用革命
2.1 軟件應(yīng)用:通用Agent出圈
2.2 硬件應(yīng)用:具身智能爆發(fā)
2.3 人形機(jī)器人:從B端開始商業(yè)化
2.4 AI眼鏡:具備三大產(chǎn)業(yè)優(yōu)勢
2.5 智能駕駛:滲透率快速提升
3 基礎(chǔ)設(shè)施層:算力與數(shù)據(jù)仍是兩大發(fā)展基石
3.1 算力:GPU自主化迫在眉睫
3.2 數(shù)據(jù):巨大資源潛力待挖掘
正文
1 大模型層:迭代永不停歇
1.1 頭部大模型格局更加穩(wěn)定
大模型領(lǐng)域的發(fā)展正經(jīng)歷著從無序競爭到頭部集中的演變。早期“百模大戰(zhàn)”時(shí)期,市場充斥著大量技術(shù)水平參差不齊的模型,企業(yè)間以快速推出產(chǎn)品搶占市場為首要目標(biāo)。但隨著應(yīng)用場景不斷深化,用戶對模型的性能、穩(wěn)定性和安全性要求大幅提升,單純追求數(shù)量的競爭模式難以為繼。在此背景下,阿里巴巴、DeepSeek、字節(jié)跳動(dòng)、騰訊、階躍星辰、智譜AI六家廠商憑借強(qiáng)大的研發(fā)能力、數(shù)據(jù)資源和資金投入,率先突破技術(shù)瓶頸,將大模型從“可用”階段推向“好用”階段。
隨著“六小虎”的崛起,大模型領(lǐng)域的馬太效應(yīng)開始顯現(xiàn)。強(qiáng)者利用先發(fā)優(yōu)勢不斷擴(kuò)大領(lǐng)先幅度。阿里巴巴依托電商場景積累的海量數(shù)據(jù),持續(xù)優(yōu)化通義千問的商業(yè)應(yīng)用能力;Deepseek憑借在算法創(chuàng)新上的突破,在科研輔助領(lǐng)域獨(dú)樹一幟;字節(jié)跳動(dòng)憑借火山引擎的算力支持和全球化生態(tài),讓豆包大模型在多語言交互上表現(xiàn)突出。這些企業(yè)通過持續(xù)迭代模型、拓展應(yīng)用場景,吸引更多開發(fā)者和用戶,進(jìn)而獲取更豐富的反饋數(shù)據(jù)用于優(yōu)化模型,形成技術(shù)提升-用戶增長-數(shù)據(jù)反哺的良性循環(huán),使得頭部與其他企業(yè)的差距不斷拉大,行業(yè)集中度持續(xù)提高。
1.2 后訓(xùn)練是破局關(guān)鍵
預(yù)訓(xùn)練的Scaling Law曾是推動(dòng)大模型發(fā)展的重要法則,它表明模型性能與模型規(guī)模、數(shù)據(jù)集大小和計(jì)算資源之間存在冪律關(guān)系,即隨著這三者的增加,模型性能會(huì)相應(yīng)提升。通俗講就如學(xué)英語,背100個(gè)單詞只能蹦單詞,背1000個(gè)單詞能組句子,背1萬個(gè)單詞可能就懂語法和隱喻了,這就是 “學(xué)得多 = 能力強(qiáng)” 的樸素 Scaling Law。
然而如今,大模型預(yù)訓(xùn)練Scaling Law的發(fā)展趨勢有所放緩。數(shù)據(jù)面臨挑戰(zhàn),像是可用的高質(zhì)量數(shù)據(jù)增長速度受限,公共互聯(lián)網(wǎng)數(shù)據(jù)預(yù)計(jì)在不久后被耗盡,且數(shù)據(jù)標(biāo)注成本高昂;另一方面,算力提升遭遇瓶頸,構(gòu)建和維護(hù)大規(guī)模算力基礎(chǔ)設(shè)施的成本極高,技術(shù)上也趨近現(xiàn)有硬件的極限,導(dǎo)致通過傳統(tǒng)Scaling Law來提升模型性能的難度增大。
盡管Scaling Law放緩,但探索基礎(chǔ)大模型能力上限仍極具必要性。基礎(chǔ)大模型作為AI發(fā)展的基石,其能力的提升能帶動(dòng)眾多領(lǐng)域的變革。如馬斯克的xAI用全球規(guī)模最大的20萬張H100算力集群訓(xùn)練出的Grok3,后續(xù)預(yù)計(jì)今年推動(dòng)的GPT-5、Llama 4等基礎(chǔ)大模型也值得期待。
在AI的持續(xù)發(fā)展進(jìn)程中,后訓(xùn)練(Post-training)正逐漸成為推動(dòng)其進(jìn)化的關(guān)鍵所在。傳統(tǒng)大模型完成預(yù)訓(xùn)練后,雖掌握了基礎(chǔ)能力,但面對復(fù)雜場景仍有不足。后訓(xùn)練的出現(xiàn),為突破這一困境提供了有效途徑。GPT-o1借助強(qiáng)化學(xué)習(xí)和測試時(shí)間搜索等后訓(xùn)練技術(shù),在數(shù)學(xué)、代碼等復(fù)雜推理任務(wù)上成績斐然,有力證實(shí)了后訓(xùn)練擴(kuò)展律的正確性,彰顯出后訓(xùn)練挖掘模型潛力、拓展能力邊界的強(qiáng)大功效。
與預(yù)訓(xùn)練的“廣撒網(wǎng)”不同,后訓(xùn)練聚焦特定任務(wù)與場景,精準(zhǔn)優(yōu)化模型。醫(yī)療領(lǐng)域中,通過病例數(shù)據(jù)和醫(yī)學(xué)知識圖譜進(jìn)行后訓(xùn)練的大模型,疾病診斷準(zhǔn)確率顯著提升;金融投資場景里,利用市場數(shù)據(jù)后訓(xùn)練的模型,對風(fēng)險(xiǎn)評估等任務(wù)的處理能力也大幅增強(qiáng),使模型從通用智能邁向 “專家型”智能。
今年5月,Deepseek發(fā)布了Deepseek-R1-0528版本。根據(jù)官網(wǎng),0528版本在后訓(xùn)練階段,團(tuán)隊(duì)投入了更多算力,使得模型在數(shù)學(xué)、編程及通用邏輯等方面的表現(xiàn)得到大幅優(yōu)化。更新后的R1模型的整體表現(xiàn)已接近其他國際頂尖模型,如o3與Gemini-2.5-Pro。后訓(xùn)練同樣遵循Scaling Law,Scaling Laws已從預(yù)訓(xùn)練維度擴(kuò)展至后訓(xùn)練+實(shí)時(shí)推理三個(gè)維度。
1.3 推理需求顯著增長
隨著AI應(yīng)用場景不斷拓展,推理端需求呈爆發(fā)式增長態(tài)勢。微軟、谷歌等頭部客戶的日均token調(diào)用量已突破數(shù)萬億級別,較傳統(tǒng)chatbot時(shí)代的處理規(guī)模實(shí)現(xiàn)指數(shù)級躍升。多模態(tài)模型、Agentic AI等創(chuàng)新形態(tài)的加速落地,正催生實(shí)時(shí)推理需求與大規(guī)模低延遲計(jì)算的新一輪結(jié)構(gòu)性增長,推動(dòng)AI算力需求從“模型訓(xùn)練為主”向“推理落地優(yōu)先”的產(chǎn)業(yè)范式遷移。
我們認(rèn)為推理需求規(guī)模有望達(dá)到訓(xùn)練階段的5-10倍。若殺手級應(yīng)用如AI Agent廣泛落地,推理算力需求將進(jìn)一步攀升。預(yù)計(jì)到2026年,消費(fèi)級AI日活躍用戶(DAUs)將突破10億。到2026年,推理計(jì)算的需求可能占GenAI總計(jì)算需求的70%以上,推理計(jì)算需求將超過訓(xùn)練計(jì)算需求,并達(dá)到后者的4.5倍。
“慢思考”能力(如深度邏輯推理、多步規(guī)劃)和多模態(tài)理解(文本、圖像、語音等跨模態(tài)交互)正成為AI應(yīng)用的標(biāo)配。"慢思考"借鑒了人類認(rèn)知的雙系統(tǒng)理論,強(qiáng)調(diào)AI在復(fù)雜任務(wù)中需進(jìn)行深度推理與迭代計(jì)算,而非僅依賴直覺式響應(yīng)。這種模式通過引入反思機(jī)制、蒙特卡洛樹搜索等技術(shù),顯著提升了AI在數(shù)學(xué)推理、策略規(guī)劃等領(lǐng)域的表現(xiàn)。
多模態(tài)則是人類世界的本來樣貌,大模型的發(fā)展趨勢一定是走向多模態(tài)。人類通過視覺、聽覺、觸覺等多種感官接收信息,多模態(tài)技術(shù)就是模擬這一過程,讓機(jī)器能夠同時(shí)處理文本、圖像、音頻等多種類型的數(shù)據(jù)。以自動(dòng)駕駛為例,車輛不僅依靠攝像頭的視覺圖像識別道路狀況,還借助雷達(dá)的距離探測數(shù)據(jù)、傳感器的震動(dòng)反饋等,全方位感知周圍環(huán)境,做出更安全、準(zhǔn)確的駕駛決策。多模態(tài)大模型打破了單一模態(tài)的局限,極大豐富了信息輸入,使模型對世界的理解更加全面、深入。
2 應(yīng)用層:AI應(yīng)用革命
技術(shù)實(shí)現(xiàn)閉環(huán)需要應(yīng)用的落地,軟件領(lǐng)域的代理式AI(Agent)、硬件領(lǐng)域的具身AI,正成為備受矚目的大模型應(yīng)用方向。
2025年GTC大會(huì)上,黃仁勛提出自2012年深度學(xué)習(xí)革命開始以來AI發(fā)展的四個(gè)階段:感知AI、生成式AI、代理式AI、具身AI。
一是感知AI,這是人工智能的初始階段,讓機(jī)器能“看見”和“聽見”,即具備計(jì)算機(jī)視覺和語音識別能力,如人臉識別、語音助手等應(yīng)用。
二是生成式AI,在過去3年里發(fā)展迅速,主要以內(nèi)容生成為核心,能夠創(chuàng)造文本、圖像、視頻等等。文本生成的普及度和使用率最高,以Deepseek、ChatGPT等大模型為代表,大大沖擊了傳統(tǒng)的檢索式搜索引擎,讓人們逐漸習(xí)慣了與大模型交互來獲取知識。
Agent和具身AI則被認(rèn)為是接下來的發(fā)展方向。人工智能發(fā)展必然要從“智慧”到“智能”,也就是讓AI具備行動(dòng)能力,這是發(fā)展Agent和具身AI的共同意義。Agent聚焦于計(jì)算機(jī)世界,給予AI調(diào)用軟件工具的能力,讓AI在計(jì)算機(jī)世界中執(zhí)行工作任務(wù)。而具身AI則聚焦于物理世界,把AI裝在新能源汽車、人形機(jī)器人這樣的物理實(shí)體上,讓AI在物理世界中感知、理解和行動(dòng)。
2.1 軟件應(yīng)用:通用Agent出圈
軟件領(lǐng)域,大模型正從單純的“對話AI”向“干活A(yù)I”轉(zhuǎn)變。2025年,通用Agent迎來爆發(fā)元年。
大模型是知識庫,而Agent是行動(dòng)者。Agent直譯為代理,本質(zhì)就是由大模型驅(qū)動(dòng)的一套自動(dòng)化軟件系統(tǒng),代表使用者完成任務(wù);其在工作中展現(xiàn)出極高的自主性,無需或極少需要使用者介入。如果說大模型如同一個(gè)龐大的知識庫,在推理后生成用戶需要的答案;那Agent則如同一個(gè)行動(dòng)者,它能夠拆解任務(wù)、調(diào)用工具、最終交付給用戶成果。
Agent是大模型向前發(fā)展的重要一環(huán),是大模型發(fā)展的L3階段。Agent可以簡單理解成是讓大模型調(diào)用各種工具;工具種類豐富,包括信息檢索類工具、 代碼與計(jì)算類工具、軟件與系統(tǒng)操作類工具等。對外部工具的調(diào)用能極大拓展大模型的能力范疇,拔高大模型的生產(chǎn)力,是從知識庫向行動(dòng)者躍升的一大顯著標(biāo)志。
Manus的空降發(fā)布,推動(dòng)通用Agent爆火出圈;“干活A(yù)I“成為人工智能行業(yè)新浪潮,并迅速引起了大廠和創(chuàng)企的生態(tài)卡位戰(zhàn)。
從應(yīng)用范疇看,Agent有專用和通用之分。專用Agent即專用于某一特定領(lǐng)域,最成熟的是編程Agent。與之相比,通用Agent則不受限于特定任務(wù)類型,能執(zhí)行各種復(fù)雜任務(wù)。
Manus是最先出圈的通用Agent產(chǎn)品,由中國人工智能公司Monica于3月發(fā)布,并引起巨大熱度。在官方展示的幾十個(gè)案例中,Manus可以完成的任務(wù)包括但不限于旅行規(guī)劃、股票分析、PPT制作、網(wǎng)頁制作等等,展現(xiàn)出非常高的通用性。Manus空降后,大廠和AI創(chuàng)企迅速拉開了針對通用Agent的生態(tài)卡位戰(zhàn),競相發(fā)布通用Agent產(chǎn)品,大廠如字節(jié)跳動(dòng)和百度、創(chuàng)企如Flowith和天工AI。
通用Agent本質(zhì)是一場范式革命,未來可能成為最大的流量分配中心,重構(gòu)當(dāng)前軟件生態(tài)。因此Agent未來的發(fā)展不僅是一個(gè)技術(shù)問題,比如大模型本身的推理決策能力要再一步提升、降低幻覺問題;更是一個(gè)生態(tài)問題,即有多少應(yīng)用愿意加入通用Agent的生態(tài)。值得注意的是,去年11月以來,表示支持Anthropic提出的MCP協(xié)議的大模型和應(yīng)用越來越多,通用Agent的生態(tài)建設(shè)未來有望逐步強(qiáng)大。
2.2 硬件應(yīng)用:具身智能爆發(fā)
硬件領(lǐng)域,具身智能在2025年熱度高漲,人形機(jī)器人、AI眼鏡和智能駕駛?cè)筚惖烙瓉泶呋?/b>。
2025年政府工作報(bào)告提出要“建立未來產(chǎn)業(yè)投入增長機(jī)制,培育生物制造、量子科技、具身智能、6G等未來產(chǎn)業(yè)”。作為人工智能的重要分支,具身智能浪潮將至。人工智能有兩條發(fā)展路徑:一條是非具身智能,即聚焦于抽象計(jì)算所需的智能;非具身智能不具備物理身體,在數(shù)字世界運(yùn)行,通常表現(xiàn)為程序、算法等;典型案例如Deepseek、ChatGPT等大語言模型。另一條則是具身智能,核心在于“具身”二字,即用物理實(shí)體來承載AI,從而構(gòu)成一個(gè)可感知真實(shí)世界、可理解問題并制定規(guī)劃、可在真實(shí)世界中行動(dòng)的智能系統(tǒng),特點(diǎn)是形成“感知——行動(dòng)”閉環(huán);人形機(jī)器人、AI眼鏡、智能駕駛是典型案例,依次是“AI+類人機(jī)器”、“AI+新能源汽車”、“AI+XR眼鏡”。
2.3 人形機(jī)器人:從B端開始商業(yè)化
人形機(jī)器人承載著人類對“通用性”具身AI的終極愿景。傳統(tǒng)的工業(yè)機(jī)器人和服務(wù)機(jī)器人通常專用于單一任務(wù),如工業(yè)機(jī)械臂用于流水線的某一環(huán)節(jié)、掃地機(jī)器人用于家居環(huán)境清理等等。然而人形機(jī)器人從構(gòu)型設(shè)計(jì)開始便承載了人類對于“通用性”具身AI的美好愿景,即未來要能像人一樣使用各種各樣的工具、執(zhí)行各種各樣的任務(wù)。人類社會(huì)中的許多工具與空間都是圍繞著人類設(shè)計(jì)的,理論上講完全擬人形態(tài)的人形機(jī)器人其適用場景會(huì)更為廣泛,因此雙足、全尺寸的構(gòu)型成為目前最受關(guān)注的人形機(jī)器人形態(tài)。
人形機(jī)器人要經(jīng)歷從實(shí)驗(yàn)環(huán)境到工廠環(huán)境再到家庭環(huán)境的跨越,其商業(yè)化可分為三個(gè)階段:第一個(gè)階段是將人形機(jī)器人用于科研教育、娛樂表演等。第二個(gè)階段面向B端,人形機(jī)器人替代人從事重復(fù)枯燥性、高危險(xiǎn)性的工作。第三個(gè)階段面向C端,人形機(jī)器人成為智能家居的一環(huán),提升居住生活體驗(yàn),甚至滿足人的養(yǎng)老陪護(hù)需求。
當(dāng)前產(chǎn)業(yè)發(fā)展重心仍在研發(fā)制造環(huán)節(jié),但已有部分人形機(jī)器人進(jìn)入B端試水,“進(jìn)廠”成了人形機(jī)器人沖鋒商業(yè)化的首個(gè)試驗(yàn)場。汽車工廠和物流工廠是人形機(jī)器人試點(diǎn)部署最主要的兩大結(jié)構(gòu)化工業(yè)場景,人形機(jī)器人在其中執(zhí)行簡易裝配、搬運(yùn)碼垛、分揀等工作,任務(wù)相對重復(fù)且單一。也有一些其他場景,比如有部分人形機(jī)器人企業(yè)和電子制造企業(yè)建立了合作,優(yōu)必選和富士康、Apptronik和Jabil(捷普)等等。此外,部分企業(yè)在2024年也透露了其人形機(jī)器人的銷售情況或量產(chǎn)計(jì)劃,基本在數(shù)百或者數(shù)千臺。
伴隨宇樹科技等企業(yè)的出圈,2025年人形機(jī)器人賽道迎來浪潮,未來產(chǎn)業(yè)發(fā)展將圍繞兩大方向展開:一是利用大模型使人形機(jī)器人有更強(qiáng)的“大腦”、使用機(jī)器學(xué)習(xí)技術(shù)讓其有更強(qiáng)的“小腦”功能。二是諧波減速器、行星滾柱絲杠、六維力傳感器等核心上游零部件突破技術(shù)壁壘,推動(dòng)人形機(jī)器人做優(yōu)整機(jī)以及降低造價(jià)。而諸如人形機(jī)器人馬拉松賽、拳擊賽等活動(dòng)也會(huì)越來越多,都是人形機(jī)器人走出實(shí)驗(yàn)室要完成的錘煉。
2.4 AI眼鏡:具備三大產(chǎn)業(yè)優(yōu)勢
大模型的廣泛應(yīng)用,為AI眼鏡帶來了質(zhì)的飛躍。多模態(tài)大模型賦予AI眼鏡強(qiáng)大的功能,使之具備物體識別、實(shí)時(shí)翻譯、導(dǎo)航等實(shí)用功能,顯著提升用戶體驗(yàn)。
眼鏡是AI落地的良好載體,具備相當(dāng)?shù)南胂罂臻g。表層上,AI眼鏡是對傳統(tǒng)眼鏡的智能升級,融入多模態(tài)傳感,內(nèi)置大模型軟件,且仍然可具備MR/AR的現(xiàn)實(shí)融合能力。深層上,其核心優(yōu)勢在于便攜、交互平滑、功能豐富——AI眼鏡既可以兼容智能手機(jī)內(nèi)容生態(tài),也能此基礎(chǔ)上開發(fā)更豐富的智能應(yīng)用。
2025年,AI 眼鏡成為消費(fèi)電子領(lǐng)域的熱門話題之一,科技巨頭紛紛布局這一賽道,蘋果、Meta、小米、百度、華為等公司都在積極研發(fā)或推出AI眼鏡產(chǎn)品。Well-sennXR的數(shù)據(jù)顯示,預(yù)計(jì)2029年,AI眼鏡的年銷量將達(dá)到5500萬副,到2035年有望突破14億副。未來AI眼鏡對傳統(tǒng)眼鏡的滲透率空間極大,部分中國品牌在此領(lǐng)域有可能實(shí)現(xiàn)跨越式發(fā)展。有三大原因:
一是國內(nèi)消費(fèi)電子市場的優(yōu)勢,不僅用戶基數(shù)大,而且創(chuàng)新技術(shù)接受度高。根據(jù)德勤調(diào)研,2024年中國消費(fèi)者對AI、AR/VR產(chǎn)品的興趣度高達(dá)73%,超過美國的58%。
二是供應(yīng)鏈和產(chǎn)業(yè)優(yōu)勢,中國集合了全球消費(fèi)電子產(chǎn)品供應(yīng)鏈的中上游,珠三角和長三角地區(qū)產(chǎn)能占全球70%。品牌實(shí)力也不遜色,2025年Q1,中國智能手機(jī)品牌在全球市場份額超過1/3。
三是技術(shù)迭代快,得益于市場擁抱新興技術(shù)疊加產(chǎn)業(yè)鏈完整,中國廠商的新品研發(fā)和改進(jìn)升級周期短。根據(jù)波士頓咨詢,中國廠商的綜合研發(fā)周期在6-8個(gè)月,而美國品牌在12-18個(gè)月。
AI眼鏡賽道方興未艾,技術(shù)路線(如Micro LED、光波導(dǎo))、應(yīng)用場景(消費(fèi)級vs工業(yè)級)和區(qū)域市場(北美、亞洲、歐洲需求差異)的多元化,使得任何具備核心技術(shù)突破或生態(tài)整合能力的企業(yè)都可能塑造未來的行業(yè)格局,值得期待。
2.5 智能駕駛:滲透率快速提升
具身AI率先在智能駕駛領(lǐng)域爆發(fā)。2025年,高速NOA和城市NOA滲透率或?qū)⒂瓉沓A(yù)期增長。2025年2月10日,比亞迪高階智駕系統(tǒng)“天神之眼”正式發(fā)布,比亞迪全系車型將搭載該系統(tǒng),首批有21款車型上市。天神之眼”分為三個(gè)版本:“天神之眼A”(DiPilot 600)配備三個(gè)激光雷達(dá),支持全國無圖領(lǐng)航,主要搭載于仰望品牌上;“天神之眼B”(DiPilot 300)配備單激光雷達(dá),支持全國無圖領(lǐng)航,主要搭載于騰勢、比亞迪等品牌上;“天神之眼 C”(DiPilot 100)為高階智駕三目版,支持高速領(lǐng)航和代客泊車,主要搭載在比亞迪秦PLUS DM-i等入門款車型。天神之眼C最低可搭載于海鷗車型,是行業(yè)內(nèi)首次將高階智駕下放到7萬元級市場的A00級車。
回顧智能手機(jī)及新能源汽車的發(fā)展路徑,科技產(chǎn)品在市場滲透率突破5%之后,通常會(huì)迎來加速普及的階段。比亞迪的入局是智駕行業(yè)最大預(yù)期差,有望推動(dòng)L2+級別銷量基本盤從100萬輛快速提升至1000萬輛級別,預(yù)計(jì)2025年高速NOA+城市NOA有望實(shí)現(xiàn)翻倍增長,滲透率超20%。
3 基礎(chǔ)設(shè)施層:算力與數(shù)據(jù)仍是兩大發(fā)展基石
3.1 算力:GPU自主化迫在眉睫
算力是AI的基石,GPU是算力最具象的代名詞。GPU(圖形處理器),最初是為了圖形渲染任務(wù)而設(shè)計(jì)的,它擁有數(shù)千甚至數(shù)萬個(gè)計(jì)算核心。與CPU(中央處理器)相比,CPU通常只有幾個(gè)到幾十個(gè)核心,更擅長邏輯控制和串行處理任務(wù)。而大模型訓(xùn)練和推理過程涉及到大量的矩陣運(yùn)算,對并行計(jì)算有著很高的要求,GPU憑借其多核架構(gòu)展現(xiàn)出無可比擬的優(yōu)勢,因此成為AI領(lǐng)域關(guān)鍵的支撐硬件。
縱觀全球GPU版圖,美國的控制力是絕對的,達(dá)到壟斷級別。英偉達(dá)作為全球 GPU 市場的龍頭企業(yè),其市場份額和技術(shù)實(shí)力遙遙領(lǐng)先。隨著生成式AI大爆發(fā),2023年全球數(shù)據(jù)中心GPU總出貨量達(dá)385萬顆,同比增長44.2%;其中英偉達(dá)出貨了約376萬個(gè)數(shù)據(jù)中心GPU,市場份額高達(dá)98%。英偉達(dá)憑借其先進(jìn)的GPU技術(shù)和完善的生態(tài)體系(CUDA生態(tài)),在AI 算力領(lǐng)域占據(jù)著難以撼動(dòng)的主導(dǎo)地位。
美國GPU霸權(quán)下,中國的AI發(fā)展事實(shí)上處于受制于人的狀態(tài),隨著全球政治、經(jīng)濟(jì)、科技對峙的加劇,針對中國的GPU封鎖事件也時(shí)有發(fā)生。自2022年,標(biāo)志性的限制事件已經(jīng)經(jīng)歷了三輪。
第一輪封鎖(2022年10月):美國首次將AI芯片納入出口管制,直接禁止英偉達(dá)向中國出售旗艦級AI計(jì)算芯片A100和H100。這兩款芯片是訓(xùn)練大模型的核心硬件,性能屬行業(yè)頂尖。面對管制,英偉達(dá)迅速推出“合規(guī)版”A800/H800芯片,通過性能閹割來規(guī)避出口限制,勉強(qiáng)維持對華供應(yīng)。
第二輪封鎖(2023年10月):為封堵“中國特供版”漏洞,美國調(diào)整管制標(biāo)準(zhǔn),將A800/H800納入禁售范圍,同時(shí)擴(kuò)大管制國家至40余國,嚴(yán)防轉(zhuǎn)口貿(mào)易。此次封鎖后,英偉達(dá)又推出中國特供版H20芯片,相當(dāng)于二次閹割版的H100,性能僅為15%。
第三輪封鎖(2025年1月):構(gòu)建三極世界體系,將全球劃分為三個(gè)等級—— 17個(gè)盟友圈可自由獲取GPU;對100多個(gè)中間國實(shí)施配額制,約能獲得5萬塊GPU;對中國、俄羅斯等敵對國家則全面禁售。
短期看,企業(yè)往往通過囤貨實(shí)現(xiàn)對GPU出口管制的緩沖,然而非長久之計(jì);中長期看,全力加速國產(chǎn)化替代十分必要。一些國產(chǎn)力量正在站出來,例如華為的昇騰910C性能達(dá)英偉達(dá)H100的60-80%。但是差距仍難以忽視,一方面英偉達(dá)最新一代GB200算力再次躍升3倍;另一方面在制程工藝上,英偉達(dá)采用5nm/4nm先進(jìn)制程,而國產(chǎn)主流仍為14nm級別。未來在設(shè)計(jì)、制程和生態(tài)建設(shè)方面都需要持續(xù)發(fā)力,加速自主化腳步。
3.2 數(shù)據(jù):巨大資源潛力待挖掘
數(shù)據(jù)是Gen-AI時(shí)代的燃料;基于神經(jīng)網(wǎng)絡(luò)的大模型具備典型的“垃圾進(jìn)、垃圾出”的特征,訓(xùn)練數(shù)據(jù)的數(shù)量和質(zhì)量直接決定了大模型的性能上限。以O(shè)penAI為例,從GPT-1迭代到GPT-4,隨著模型性能的躍升,訓(xùn)練數(shù)據(jù)量也經(jīng)歷了跨越式增長:2018年GPT-1數(shù)據(jù)集僅4.6GB,而2023年GPT-4訓(xùn)練數(shù)據(jù)量達(dá)到驚人的百TB級別,翻了數(shù)萬倍。
然而隨著大模型的快速更迭,對于數(shù)據(jù)枯竭的擔(dān)憂也越發(fā)明顯。OpenAI原科學(xué)家蘇茨克維爾曾表示,“我們只有一個(gè)互聯(lián)網(wǎng)”,雖然計(jì)算在增長,但數(shù)據(jù)卻沒有增長,預(yù)訓(xùn)練毫無疑問會(huì)結(jié)束。無獨(dú)有偶,2024年研究機(jī)構(gòu)Epoch AI發(fā)布的一份報(bào)告預(yù)測:人類生成的公開文本數(shù)據(jù)總有效存量僅約300萬億tokens,總量年增速不足10%,而AI訓(xùn)練數(shù)據(jù)集規(guī)模以每年翻倍的速度擴(kuò)張,這種剪刀差導(dǎo)致互聯(lián)網(wǎng)所有高質(zhì)量文本數(shù)據(jù)將在2028年枯竭。
內(nèi)容屏障日益高筑等因素則進(jìn)一步加劇了數(shù)據(jù)短缺危機(jī)。數(shù)據(jù)擁有方正通過技術(shù)和法律手段限制訪問。技術(shù)手段比如通過爬蟲反制來限制內(nèi)容調(diào)用;而法律手段則更激進(jìn),表現(xiàn)為直接的版權(quán)訴訟。例如海外《紐約時(shí)報(bào)》對OpenAI的版權(quán)訴訟、雜志巨頭康泰納仕集團(tuán)曾向Perplexity發(fā)出的侵權(quán)通知;國內(nèi)也有類似案例,比如知網(wǎng)對秘塔AI的侵權(quán)警告。
數(shù)據(jù)短缺或成為制約大模型技術(shù)發(fā)展的關(guān)鍵瓶頸,應(yīng)對這一危機(jī),有兩大思路:一是合成數(shù)據(jù),即讓大模型生成用于自身訓(xùn)練的新數(shù)據(jù);二則是深入挖掘現(xiàn)有的數(shù)據(jù)資源。
馬斯克曾在公開演講中表示:“現(xiàn)實(shí)世界中用于訓(xùn)練AI模型的數(shù)據(jù)幾乎已經(jīng)耗盡”,并指出合成數(shù)據(jù)將成為未來唯一的替代路徑。然而,合成數(shù)據(jù)卻存在著一些難以規(guī)避的問題,例如質(zhì)量參差不齊、偏離真實(shí)分布、并且可能產(chǎn)生模型自噬現(xiàn)象,即模型因反復(fù)學(xué)習(xí)自身生成的數(shù)據(jù)而導(dǎo)致性能退化的問題。
相比之下,盤活現(xiàn)有數(shù)據(jù)資源的巨大潛能,則是一種更務(wù)實(shí)、更富戰(zhàn)略價(jià)值的解法。我國在此方面展現(xiàn)出獨(dú)特優(yōu)勢,不僅具備深厚的數(shù)據(jù)資源積累,同時(shí)正在加速完善國家級的數(shù)據(jù)要素市場。
一方面,我國的數(shù)據(jù)資源體量和增量都十分強(qiáng)大。中國擁有全球最龐大的網(wǎng)民群體與最活躍的數(shù)字化應(yīng)用生態(tài),有機(jī)構(gòu)預(yù)測到2025年數(shù)據(jù)總量將占全球的近30%。當(dāng)前,我國數(shù)據(jù)生產(chǎn)總量呈高速增長態(tài)勢,2024年同比增長25%。AI相關(guān)的數(shù)據(jù)資源增長尤其快:用于開發(fā)、訓(xùn)練和推理的數(shù)據(jù)量同比增長超40%。智能家居、智能網(wǎng)聯(lián)汽車等智能設(shè)備數(shù)據(jù)增速位居前列,分別為50%和30%左右。
另一方面,國家級數(shù)據(jù)標(biāo)記體系正加速成型,以充分挖掘各行業(yè)數(shù)據(jù)潛力。所謂數(shù)據(jù)標(biāo)注,是對數(shù)據(jù)進(jìn)行添加標(biāo)記、說明、解釋、分類和編碼的過程,是提升人工智能算法、模型核心能力的關(guān)鍵環(huán)節(jié)。我國數(shù)據(jù)標(biāo)注產(chǎn)能全球領(lǐng)先并持續(xù)建設(shè):2024年起國家數(shù)據(jù)局統(tǒng)籌的全國七大標(biāo)注基地快速推進(jìn)中,分別位于四川成都、遼寧沈陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同。2025年3月,七大基地的數(shù)據(jù)標(biāo)注總規(guī)模達(dá)到17282TB,相當(dāng)于中國國家圖書館數(shù)字資源總量的6倍左右。目前已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集超300個(gè),標(biāo)注從業(yè)人員近6萬人。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.