Thinking Machines又發(fā)高質(zhì)量博客：力推LoRA，不輸全量微調(diào)

2025-09-30 18:45:47　來源: 機(jī)器之心Pro

河北舉報

分享至

機(jī)器之心報道

機(jī)器之心編輯部

LoRA 在絕大多數(shù)后訓(xùn)練場景下，能以遠(yuǎn)低于全量微調(diào)的成本，獲得幾乎同等的效果。Thinking Machines 將這一現(xiàn)象形容為 LoRA 的低遺憾區(qū)間（low-regret region）——即便不用全量微調(diào)，選擇 LoRA 也不會讓人后悔。

最近，Thinking Machines 真實高產(chǎn)啊。

今天，他們又更新了博客，力推 LoRA，且與全量微調(diào)（ Full Fine-tuning ，以下簡稱 FullFT ）進(jìn)行了對比。

博客鏈接：
https://thinkingmachines.ai/blog/lora/

訓(xùn)練大模型，到底該選全量微調(diào)還是 LoRA？

FullFT 意味著改動模型的所有參數(shù)，效果穩(wěn)定但成本高昂，顯存開銷巨大；而LoRA 只改動一小部分參數(shù)，輕量、便宜。但一個關(guān)鍵問題是：便宜的 LoRA，效果會不會差很多？

Thinking Machines 最新研究發(fā)現(xiàn)，在小數(shù)據(jù)量任務(wù)上，LoRA 與 FullFT 幾乎沒有差距，完全可以對齊；在大數(shù)據(jù)量任務(wù)上，LoRA 的容量不足，承載不了過多新知識，表現(xiàn)略顯吃力；而在強(qiáng)化學(xué)習(xí)任務(wù)里，哪怕 LoRA rank=1 這么小的設(shè)定，也能跑出與全量微調(diào)接近的效果。

更進(jìn)一步，LoRA 的使用位置也有講究。只加在注意力層并不理想，覆蓋所有層（尤其 MLP/MoE）效果更佳。

研究還揭示了一些細(xì)節(jié)差異。例如，LoRA 在大 batch size 下，比 FullFT 更容易掉性能；LoRA 的學(xué)習(xí)率和超參數(shù)規(guī)律與 FullFT 不同，需要單獨調(diào)優(yōu)。

以下是這篇博客的主要內(nèi)容。

為什么 LoRA 重要？

低秩適配（ LoRA ）是目前最熱門的參數(shù)高效微調(diào)（PEFT）方法。它的核心思想是：不直接改動整個模型的權(quán)重，而是通過學(xué)習(xí)一個低維適配器（兩個小矩陣 A 和 B）來表示更新。

LoRA 的優(yōu)勢包括：多租戶部署（同一模型可同時加載多個適配器）、低顯存需求、快速加載和遷移。這些特性讓它自 2021 年誕生以來迅速流行。

不過，現(xiàn)有研究對它能否完全匹敵 FullFT 并沒有一致答案。

學(xué)界普遍認(rèn)為，在類似預(yù)訓(xùn)練的大規(guī)模數(shù)據(jù)場景下，LoRA 性能會遜于 FullFT ，因為數(shù)據(jù)規(guī)模往往超出 LoRA 參數(shù)容量。但在后訓(xùn)練任務(wù)中，數(shù)據(jù)規(guī)模通常處于 LoRA 容量可覆蓋的范圍，這意味著核心信息能夠被保留。

盡管如此，這并不必然保證 LoRA 在樣本利用效率和計算效率上能完全與 FullFT 持平。我們關(guān)注的核心問題是：

在什么條件下，LoRA 能實現(xiàn)與 FullFT 相當(dāng)?shù)男Ч?/strong>

實驗結(jié)果顯示，只要關(guān)鍵細(xì)節(jié)得到妥善處理，LoRA 不僅能匹配 FullFT 的樣本效率，還能最終達(dá)到相似的性能水平。

LoRA 的關(guān)鍵要素

研究的方法有別于以往研究：

不再局限于單一數(shù)據(jù)集或任務(wù)，而是系統(tǒng)考察訓(xùn)練集規(guī)模與 LoRA 參數(shù)數(shù)量之間的普適關(guān)系；在有監(jiān)督學(xué)習(xí)中，研究采用對數(shù)損失（log loss）作為統(tǒng)一評估指標(biāo)，而非依賴采樣式評測，以獲得更清晰且可跨任務(wù)比較的結(jié)論。

實驗結(jié)果表明，在小到中等規(guī)模的指令微調(diào)和推理任務(wù)中，LoRA 的表現(xiàn)可與FullFT 相媲美。然而，當(dāng)數(shù)據(jù)規(guī)模超出 LoRA 參數(shù)容量時，其表現(xiàn)將落后于 FullFT，這種差距主要體現(xiàn)在訓(xùn)練效率的下降，而非無法繼續(xù)優(yōu)化。性能下降的程度與模型容量和數(shù)據(jù)規(guī)模密切相關(guān)。

此外，LoRA 對大批量訓(xùn)練的容忍度低于 FullFT 。當(dāng)批量規(guī)模超過一定閾值時，損失值會明顯上升，這種現(xiàn)象無法通過提升 LoRA 的秩（rank）來緩解，因為它源自矩陣乘積參數(shù)化的固有訓(xùn)練動力學(xué)，而非原始權(quán)重矩陣的直接優(yōu)化。

即便在小數(shù)據(jù)場景，將 LoRA 應(yīng)用于所有權(quán)重矩陣，尤其是 MLP 與 MoE 層，均能獲得更優(yōu)表現(xiàn)。相比之下，僅對注意力層進(jìn)行 LoRA 調(diào)整，即使保持相同可訓(xùn)練參數(shù)量，也無法達(dá)到同樣的效果。

在強(qiáng)化學(xué)習(xí)任務(wù)中，即使 LoRA 的秩（rank）極低，其性能仍可接近 FullFT 。這與我們基于信息論的推斷一致：強(qiáng)化學(xué)習(xí)對模型容量的需求相對較低。

研究還分析了 LoRA 超參數(shù)對學(xué)習(xí)率的影響，包括初始化尺度與乘數(shù)的不變性，并揭示了為何 1/r1/r1/r 因子使 LoRA 的最優(yōu)學(xué)習(xí)率與秩變化幾乎無關(guān)。同時實驗顯示，LoRA 的最優(yōu)學(xué)習(xí)率與 FullFT 存在一定關(guān)聯(lián)。

綜合來看，研究提出了低遺憾區(qū)域（low-regret region）的概念——

在該區(qū)域內(nèi)，大多數(shù)后訓(xùn)練場景下，LoRA 能以顯著低于 FullFT 的成本，實現(xiàn)相似的性能。這意味著，高效微調(diào)在實際應(yīng)用中完全可行，LoRA 因而成為后訓(xùn)練的重要工具。

實驗方法與主要發(fā)現(xiàn)

研究團(tuán)隊用 LLaMA 3 和 Qwen3 模型，做了有監(jiān)督微調(diào)（Tulu3 和 OpenThoughts3 數(shù)據(jù)集）以及強(qiáng)化學(xué)習(xí)任務(wù)（數(shù)學(xué)推理）。關(guān)鍵做法包括：

調(diào)整 LoRA 的秩（rank），從 1 到 512，覆蓋從低容量到高容量的場景。
對每個設(shè)置做學(xué)習(xí)率掃描，確保找到最優(yōu)訓(xùn)練條件。
測試 LoRA 在不同層的效果，包括 attention 層、MLP 層、混合專家（MoE）層。

結(jié)果發(fā)現(xiàn)：

在小到中等數(shù)據(jù)規(guī)模下，高秩 LoRA 的性能幾乎與 FullFT 無差別。

在 Tulu3 和 OpenThoughts3 數(shù)據(jù)集上，全量微調(diào)（FullFT）以及高秩 LoRA 的學(xué)習(xí)曲線非常相似，損失隨訓(xùn)練步驟的對數(shù)幾乎線性下降。而低秩 LoRA 則會在適配器容量耗盡時偏離最小損失曲線。在底部的圖表（1B 模型）中，高秩 LoRA 在某個數(shù)據(jù)集上表現(xiàn)優(yōu)于 FullFT，但在另一個數(shù)據(jù)集上則略遜一籌。這可能與不同數(shù)據(jù)集的訓(xùn)練動態(tài)或泛化行為差異有關(guān)，從而導(dǎo)致 LoRA 在不同任務(wù)上的表現(xiàn)存在一定隨機(jī)性。

結(jié)果顯示，對于 Tulu3 數(shù)據(jù)集，不同秩的 LoRA 在最佳學(xué)習(xí)率下的最終損失相差不大，高秩 LoRA 與 FullFT 的最小損失幾乎一致。然而，LoRA 的最佳學(xué)習(xí)率約是 FullFT 的 10 倍，這意味著在相同條件下 LoRA 可以接受更高的學(xué)習(xí)率。

對于超過 LoRA 容量的數(shù)據(jù)集，LoRA 的表現(xiàn)不如 FullFT。損失并不會達(dá)到一個無法降低的明顯下限，而是會導(dǎo)致更差的訓(xùn)練效率，這種效率取決于模型容量與數(shù)據(jù)集大小之間的關(guān)系。
大批量訓(xùn)練下，LoRA 性能下降比 FullFT 更明顯，這與秩無關(guān)，可能是參數(shù)化方法的固有特性。

批量大小對 LoRA 與 FullFT 性能的影響如圖所示。左側(cè)的學(xué)習(xí)曲線展示了在不同批量大小下的表現(xiàn)：在較大批量情況下，LoRA（虛線）的學(xué)習(xí)曲線始終低于 FullFT（實線），表現(xiàn)出持續(xù)的差距。右側(cè)的圖表則展示了最終損失與批量大小的關(guān)系，表明隨著批量大小的增加，LoRA 所付出的損失代價更大。

即使在數(shù)據(jù)量小的情境下，LoRA 在應(yīng)用于所有權(quán)重矩陣（特別是 MLP 和 MoE 層）時表現(xiàn)更好。僅應(yīng)用于注意力層的 LoRA（attention-only LoRA）表現(xiàn)不佳，即使研究人員通過使用更高的秩來匹配可訓(xùn)練參數(shù)的數(shù)量（與 MLP-only 相比）。

僅作用于注意力層的 LoRA（Attention-only LoRA）明顯不如僅作用于 MLP 層的 LoRA（MLP-only LoRA），而且在已對 MLP 層應(yīng)用 LoRA 的情況下，再對注意力層額外應(yīng)用 LoRA 并不能進(jìn)一步提升性能。這一現(xiàn)象在密集模型（如 Llama-3.1-8B）和稀疏 MoE 模型（如 Qwen3-30B-A3B-Base）中均成立。

改變應(yīng)用 LoRA 的層時，學(xué)習(xí)率與最終損失或獎勵的關(guān)系。

在強(qiáng)化學(xué)習(xí)任務(wù)中，即使秩極低（rank=1），LoRA 也能達(dá)到 FullFT 水平，這與強(qiáng)化學(xué)習(xí)對容量需求較低的理論預(yù)期一致。

在小學(xué)數(shù)學(xué)（GSM，左圖）或 MATH（右圖）數(shù)據(jù)集上進(jìn)行強(qiáng)化學(xué)習(xí)時，學(xué)習(xí)率與最終獎勵（準(zhǔn)確率）的關(guān)系。

在 DeepMath 數(shù)據(jù)集上使用 Qwen3-8b-base 進(jìn)行的實驗。左圖顯示了不同 rank 和全量微調(diào)（FullFT）的學(xué)習(xí)曲線。在每種設(shè)置下，我們選取了能帶來最佳最終性能的最優(yōu)學(xué)習(xí)率。右圖則展示了學(xué)習(xí)率與最終性能的關(guān)系。與之前的數(shù)學(xué)實驗類似，LoRA 在近似最優(yōu)學(xué)習(xí)率范圍上表現(xiàn)出更寬的峰值。

來自使用 Qwen3-8b-Base 在 DeepMath 數(shù)據(jù)集上實驗的附加圖表。左圖顯示了在更具挑戰(zhàn)性的 AIME 測試集上的基準(zhǔn)得分，右圖展示了隨訓(xùn)練步驟變化的鏈?zhǔn)剿季S（CoT）長度，這可被視為模型學(xué)習(xí)推理能力的一個標(biāo)志。

LoRA 超參數(shù)規(guī)律

LoRA 有幾個顯著特點，簡化了它的使用復(fù)雜度：

最優(yōu)學(xué)習(xí)率通常是 FullFT 的約 10 倍
學(xué)習(xí)率對秩的依賴非常弱，短期訓(xùn)練幾乎不受秩變化影響，長期訓(xùn)練差異也很小。
LoRA 參數(shù)化具有不變性，實際只需關(guān)注兩個組合超參數(shù)即可。
初期訓(xùn)練時，LoRA 需要更高的學(xué)習(xí)率（約 15 倍 FullFT），長期訓(xùn)練則趨近于 10 倍。

這些規(guī)律為 LoRA 在實際部署中提供了便利：少調(diào)超參數(shù)就能取得接近全量微調(diào)的效果。

訓(xùn)練早期，不同 rank 在相同學(xué)習(xí)率下的學(xué)習(xí)曲線差異。左圖顯示了各 rank 的學(xué)習(xí)曲線，右圖則展示了 rank?16 與 rank?256 之間的差異，這個差異隨時間增長。有趣的是，在最初幾步中差異為負(fù)（盡管非常微?。?，因此那部分曲線在圖中缺失。

1、為什么 LoRA 必須作用于所有層？我們發(fā)現(xiàn)，LoRA 要與 FullFT 接近，必須滿足兩個條件：作用于所有層，特別是 MLP/MoE 層，因為這些層承載了模型絕大部分參數(shù)。容量不受限制，可訓(xùn)練參數(shù)必須足夠容納數(shù)據(jù)中所需的信息量。

僅在 attention 層使用 LoRA 會導(dǎo)致訓(xùn)練速度下降，這可以用經(jīng)驗神經(jīng)切線核（eNTK）解釋：參數(shù)最多的層對訓(xùn)練動態(tài)影響最大，LoRA 覆蓋所有參數(shù)層，才能保持 FullFT 的訓(xùn)練行為。

2、我們用信息論方法估算了容量需求，這種分析為 LoRA 在不同任務(wù)中能否勝任提供了理論支持：

在監(jiān)督學(xué)習(xí)中，模型大約可存儲每個參數(shù) 2 bits信息。數(shù)據(jù)集的描述長度可以通過第一輪訓(xùn)練的總 log-loss 估算；

在強(qiáng)化學(xué)習(xí)中，尤其是策略梯度方法，每個 episode 約提供1 bit信息。這說明強(qiáng)化學(xué)習(xí)對 LoRA 容量的要求相對較低。

3、計算效率優(yōu)勢。LoRA 只更新低秩矩陣，而不是全權(quán)重矩陣，這讓它在計算上更省力：前向+反向傳播的 FLOPs 大約是 FullFT 的 2/3

換句話說，LoRA 在相同訓(xùn)練步驟下，能用更少計算量達(dá)到相似效果。

未來探索方向

研究團(tuán)隊認(rèn)為，LoRA 仍有幾個值得深入探索的方向：精準(zhǔn)預(yù)測 LoRA 性能及其與 FullFT 的差距條件、建立 LoRA 學(xué)習(xí)率與訓(xùn)練動態(tài)的理論框架、測評 LoRA 變體（如 PiSSA）的表現(xiàn)，以及研究 LoRA 在 MoE 層的不同應(yīng)用方案及其與張量并行、專家并行的兼容性。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點推薦

可能是目前效果最好的開源生圖模型，混元生圖3.0來了

量子位 2025-09-30 20:56:55
3 跟貼 3

3D版ControlNet突破多模態(tài)控制，實現(xiàn)高精度3D資產(chǎn)生成

機(jī)器之心Pro 2025-09-29 16:10:08
0 跟貼 0

誰是2025年度最好的編程語言？

量子位 2025-10-01 10:14:54
36 跟貼 36

干掉同聲傳譯？阿里又推出一模型，精通18種語言，離線可用

智東西 2025-09-30 22:57:35
4 跟貼 4

Muon作者僅用一篇博客，就被OpenAI看中了

機(jī)器之心Pro 2025-06-16 14:27:12
1 跟貼 1

以色列下"最后通牒"！即將完全包圍加沙城

看看新聞Knews 2025-10-02 00:10:14
534 跟貼 534

三星堆公布重大發(fā)現(xiàn)！專家：種種跡象表明，三星堆可能爆發(fā)過內(nèi)戰(zhàn)，神權(quán)貴族集團(tuán)受到嚴(yán)重打擊，城市水系也因此改變

每日經(jīng)濟(jì)新聞 2025-09-27 22:27:12
12537 跟貼 12537

剛剛，這家0產(chǎn)品0模型就估值854億的公司，終于發(fā)布了首款產(chǎn)品！

新智元 2025-10-02 09:13:10
0 跟貼 0

國產(chǎn)AI的“偉大閉環(huán)”！DeepSeek平常的一句話或改變GPU編程生態(tài)

華爾街見聞官方 2025-09-30 13:51:32
20 跟貼 20

首次第一視角視頻與人體動作同步生成！新框架攻克兩大技術(shù)壁壘

量子位 2025-10-01 09:56:56
0 跟貼 0

曾仕強(qiáng)：騙來騙去？這叫做人力自動化，讓別人自動接受你的指令！

UP主硬照鬼才 2025-09-29 08:00:40
1 跟貼 1

他們在1993年就提出了Scaling Law

量子位 2025-09-03 10:24:41
0 跟貼 0

基于3DGS場景理解和視覺語言預(yù)訓(xùn)練，讓3D高斯「聽懂人話」的一躍

機(jī)器之心Pro 2025-09-08 13:26:10
0 跟貼 0

史上最強(qiáng)殲20模型，跑起來那刻，一群人直接驚呆

崖柏愛生活 2025-10-01 16:52:53
0 跟貼 0

智能的三大秘密

白駒談人機(jī) 2025-10-01 08:05:41
0 跟貼 0

用紙殼做的迷你坦克模型，上面安裝太陽能板，遇到陽光就會走！

歡樂笑料站 2025-09-30 10:27:27
1 跟貼 1

栗正杰：殲-35安裝的新發(fā)動機(jī)，性能參數(shù)高度機(jī)密

全局觀 2025-10-01 08:53:14
1 跟貼 1

2700名游客國慶涌進(jìn)榮昌區(qū)政府食堂：一頓吃了550斤米飯，250斤鹵鵝

極目新聞 2025-10-01 15:40:10
5256 跟貼 5256

全新合成框架SOTA：強(qiáng)化學(xué)習(xí)當(dāng)引擎，任務(wù)合成當(dāng)燃料

量子位 2025-10-01 18:36:45
0 跟貼 0

大模型“拼好題”，45K數(shù)據(jù)撬動18%提升，數(shù)學(xué)問題拒絕死記硬背

量子位 2025-06-17 16:17:54
0 跟貼 0

什么叫“最強(qiáng)大腦”？她心算報參數(shù) 讓導(dǎo)彈精準(zhǔn)命中 (來源：小央視頻)

學(xué)申論的談妹 2025-09-30 23:57:26
3 跟貼 3

汕頭兩“世仇村”迎來世紀(jì)大和解：清末因搶水發(fā)生械斗，此后百余年不往來

極目新聞 2025-10-01 11:48:13
4110 跟貼 4110

牛彈琴：意軍艦撤離加沙救援船隊被以扣押歐洲人怒了

現(xiàn)代快報 2025-10-02 09:04:37
66 跟貼 66

“雞排哥”和家人國慶要出10個攤位，景德鎮(zhèn)連夜招十多名大學(xué)生上任“雞排保鏢”，學(xué)?；貞?yīng)：系當(dāng)志愿者

極目新聞 2025-10-01 13:42:47
4258 跟貼 4258

調(diào)整訓(xùn)練數(shù)據(jù)出場順序大模型就能變聰明！無需擴(kuò)大模型/數(shù)據(jù)規(guī)模

量子位 2025-09-06 12:02:44
0 跟貼 0

過了55歲體檢這7個指標(biāo)都正常，連我都要羨慕你

恩哥聊健康 2025-09-28 16:36:07
0 跟貼 0

北郵與騰訊AI Lab提出MoE-CL架構(gòu)，解決大模型持續(xù)學(xué)習(xí)核心痛點

機(jī)器之心Pro 2025-09-30 18:33:03
0 跟貼 0

字節(jié)Seed發(fā)布PXDesign：蛋白設(shè)計效率提升十倍，進(jìn)入實用新階段

量子位 2025-10-01 18:50:03
5 跟貼 5

“小龍女”李若彤點贊高鐵外賣：沿途美食送到座位，只能用“驚嘆”來形容！12306回應(yīng)：需預(yù)留接單時間

揚子晚報 2025-10-01 16:40:31
1710 跟貼 1710

枚舉幾何新數(shù)學(xué)復(fù)蘇幾何學(xué)最古老的問題

科學(xué)的歷程 2025-09-30 20:12:03
0 跟貼 0

LV首爾開餐廳，3只牛肉餃子售價243元，預(yù)約秒售罄一席難求

瀟湘晨報 2025-09-28 10:16:54
2842 跟貼 2842

買回來的活牛不斷往外噴水，商販稱排出200斤水，“水是從牛嘴強(qiáng)注的，從沒見過注這么多水的，很殘忍”

觀威海 2025-10-01 14:11:25
2482 跟貼 2482

40歲以后體檢時：如果這3個指標(biāo)都正常，說明身體底子還不錯

李醫(yī)生課堂 2025-10-01 18:03:19
0 跟貼 0

美軍導(dǎo)彈逼近，中國軍艦微調(diào)航向應(yīng)對危機(jī)

荒野老五 2025-10-02 01:32:01
0 跟貼 0

背部塑形組合點燃活力，賦予緊實度，讓曲線不再死板

光旭教練 2025-10-01 13:03:00
1 跟貼 1

微軟宣布將AI服務(wù)整合入Office，與ChatGPT正面硬剛

華爾街見聞官方 2025-10-02 03:08:15
4 跟貼 4

剛剛，鹽城突發(fā)地震！

句容發(fā)布 2025-10-02 08:59:08
1 跟貼 1

正常人的身體指標(biāo)是多少？建議收藏保存！來看看吧

阿國愛搞笑 2025-09-28 12:35:45
0 跟貼 0

超15省份發(fā)文：補貼社保個人繳費額的25%

大象新聞 2025-10-01 21:11:04
45 跟貼 45

煥新極氪001上新智駕和電池，25萬起步還能回萬輛水平嗎

駕仕派 2025-10-02 09:19:01
0 跟貼 0

臺灣演員方芳直言：來大陸就不要畏手畏腳，連個東西都不敢簽
隔壁靈妹妹
2025-09-08 15:15:24

9月新能源車企銷量公布：比亞迪39.3萬輛，吉利16.5萬輛……
電車匯
2025-10-01 23:02:35

河南兩兄弟同時暴斃，停尸至今未下葬，父母一夜白頭，家屬曝死因
劉蕳愛下廚
2025-09-29 19:31:24

三位大人物骨灰被移出八寶山，他們分別是誰？其中一人是開國上將
文史達(dá)觀
2025-09-08 20:13:26

崔麗麗學(xué)了變臉？對國人滿嘴臟話惡語相向，對日本人卻恭恭敬敬
探長影視解說
2025-10-02 10:28:59

誓要幫火箭奪冠！不要拋棄我，范喬丹發(fā)出請求，杜蘭特也給出態(tài)度
巴叔GO聊體育
2025-10-02 10:32:17

WTO關(guān)注度下降：中國入世耗時15年，現(xiàn)狀近乎被邊緣化
優(yōu)趣紀(jì)史記
2025-09-26 20:06:58

意媒：德羅西執(zhí)教羅馬合同將解除，羅馬名宿放棄400萬歐
雷速體育
2025-10-02 10:50:16

烏度卡：狄龍離隊，伊森將在訓(xùn)練營里競爭一個先發(fā)的位置
大眼瞄世界
2025-10-02 09:53:31

3.47萬億投向新疆，一場不亞于40年前深圳的財富浪潮正悄然啟動
流蘇晚晴
2025-10-01 17:27:15

首相選舉鬧出大笑話，小泉翻車退縮，但他沒想到：林芳正機(jī)會來了
墨羽怪談
2025-10-02 10:11:16

2014年，20歲北京男孩李亞諾，花16萬斷骨增高7.2厘米，后來怎樣
攬星河的筆記
2025-10-01 15:08:14

46架艦載機(jī)全甲板攻擊，福建艦超強(qiáng)陣容出現(xiàn)，美軍航母最強(qiáng)對手？
滄海旅行家
2025-10-01 15:07:20

姜昆北京與好友聚會，挨著秀水街老總張永平，劉家軍吹薩克斯助興
小蘭聊歷史
2025-10-01 17:08:44

WTA官宣3人入圍總決賽！中網(wǎng)女單8強(qiáng)出爐，斯瓦泰克刷新另類紀(jì)錄
排球黃金眼
2025-10-02 00:33:58

6樣?xùn)|西千萬別在網(wǎng)上買，里面的水太深，看完你就知道后怕了
裝修秀
2025-09-30 11:10:03

陳偉霆稱本來不想也不敢再拍霸總戲，但被《許我耀眼》劇本吸引，還能和趙露思、陳暢合作，所以接了
觀威海
2025-10-02 09:39:12

大暴雨！新臺風(fēng)“麥德姆”即將生成，將影響廣東
魯中晨報
2025-10-01 16:27:04

首輪29順位！又一個火箭新星被裁，23歲無球可打，曾是保羅接班人
巴叔GO聊體育
2025-10-02 10:32:53

媽媽私藏的3道拿手菜！味道絕了, 道道都是“米飯殺手”！巨好吃
江江食研社
2025-09-30 16:30:05

2025-10-02 11:35:00

機(jī)器之心Pro

專業(yè)的人工智能媒體

11392文章數(shù) 142463關(guān)注度

往期回顧全部

科技要聞

9月零跑交付突破6萬輛，小鵬、小米超4萬輛

歷史首位！馬斯克身家破5000億美元

股價飆漲7%！傳英特爾洽談為“宿敵”AMD代工

天問二號最新影像！五星紅旗與地球同框

國產(chǎn)大模型集體國慶！最強(qiáng)國產(chǎn)編程模型誕生

頭條要聞

媒體:約800名中外人士出席國慶招待會有幾個重要信息

牛彈琴：意軍艦撤離加沙救援船隊被以扣押歐洲人怒了

杜莎夫人蠟像館閉館蠟像成本150萬1個有粉絲高價求購

"教科書上的傳奇"去世終年91歲曾17次來到中國

最后一班國慶崗被稱為"斷橋活地圖"的老民警明年退休

頭條要聞

媒體:約800名中外人士出席國慶招待會有幾個重要信息

牛彈琴：意軍艦撤離加沙救援船隊被以扣押歐洲人怒了

杜莎夫人蠟像館閉館蠟像成本150萬1個有粉絲高價求購

"教科書上的傳奇"去世終年91歲曾17次來到中國

最后一班國慶崗被稱為"斷橋活地圖"的老民警明年退休

體育要聞

痛失三叉戟的大巴黎，是怎么贏下巴薩的？

巴黎2-1逆轉(zhuǎn)巴薩！歐冠開局2連勝拉莫斯補時絕殺奧爾莫錯失良機(jī)

歐冠最新積分榜：5豪門+1黑馬2連勝巴薩第16利物浦第17 藥廠最慘

2-0！亞洲球隊瘋狂逆襲，首次歐冠2連勝，排名比曼城利物浦巴薩高

歐冠：曼城2-2遭摩納哥絕平！無緣兩連勝，哈蘭德雙響52場50球

娛樂要聞

董璇母女國慶節(jié)跳舞小酒窩眼神堅定

《志愿軍浴血和平》口碑出爐，文戲略多武戲過癮，票房領(lǐng)跑有道理

上映3天，《志愿軍3》丟了冠軍，《731》會破25億成國慶檔大贏家

林心如回應(yīng)陳妍希想讓小海豚當(dāng)兒媳婦

劉惜君評論區(qū)淪陷！灣區(qū)晚會搶C位打亂眾人走位

財經(jīng)要聞

金價快3900美元，黃金牛還能跑多遠(yuǎn)？?

西貝大降價，為什么網(wǎng)友不買賬？

鄭永剛?cè)ナ啦坏?年杉杉股份或易主民營船王任元林接手

馬斯克成為有史以來首位個人財富達(dá)5000億美元的人

宜賓又放大招，手握10億度綠電，零碳產(chǎn)業(yè)園引來211億投資

汽車要聞

零跑9月銷量突破6萬臺大關(guān) 刷新新勢力單月交付紀(jì)錄

徐云:極氪9X訂單量讓我覺得中國豪華不是夢

林杰：豪華品牌資深用戶包括BBA等是極氪9X用戶人群的一大類

淦家閱：極氪追求極致技術(shù) 研發(fā)投入不設(shè)上限

蔚來公司9月交付34749臺同比增長64%

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機(jī)

教育

本地

旅游

公開課

手機(jī)要聞

小米們起猛了！安卓廠商們聯(lián)手高通發(fā)力，拍視頻也要超iPhone？

iPhone 11 Pro Max已被蘋果列為過時產(chǎn)品，首批后置三攝機(jī)型退場

聯(lián)想moto X70 Air輕薄手機(jī)官宣，月底見！

iQOO15升級無線充電，大底潛望長焦加持

教育要聞

國慶節(jié)，你的孩子還寫作業(yè)嗎？

中考前簽下放棄書：被分流到職校的他們，如何打破被嫌棄的宿命？

5個專業(yè)，一腳踏進(jìn)體制內(nèi)；5個專業(yè)，本科上完需考研，怎么樣？

海大叔：不能老怨孩子

中考或取消、學(xué)制將縮短？中國教育變革懸念重重！

本地新聞

讀港校想省錢，社恐輸在起跑線

柯橋愛心媽媽溫情獻(xiàn)唱，聲動鑒水《花開中國》

云游中國 | 別找了傳說中的海上不夜城在海南

云游中國｜闖進(jìn)蘆芽山綠野仙蹤！我像演仙俠劇

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

北京推薦春日10大賞花勝景地

清明假期，蘇州機(jī)關(guān)企事業(yè)單位停車場免費開放

清明流行“下江南”，揚州民宿訂單同比上漲4倍

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻

為什么人類有不同的膚色？

最牛高中校長：真正的好學(xué)生都是玩出來的

李彥宏：百度離破產(chǎn)30天

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

Thinking Machines又發(fā)高質(zhì)量博客：力推LoRA，不輸全量微調(diào)

9月零跑交付突破6萬輛，小鵬、小米超4萬輛

媒體:約800名中外人士出席 國慶招待會有幾個重要信息

媒體:約800名中外人士出席 國慶招待會有幾個重要信息

痛失三叉戟的大巴黎，是怎么贏下巴薩的？

董璇母女國慶節(jié)跳舞 小酒窩眼神堅定

金價快3900美元，黃金牛還能跑多遠(yuǎn)？?

零跑9月銷量突破6萬臺大關(guān) 刷新新勢力單月交付紀(jì)錄

態(tài)度原創(chuàng)

小米們起猛了！安卓廠商們聯(lián)手高通發(fā)力，拍視頻也要超iPhone？

國慶節(jié)，你的孩子還寫作業(yè)嗎？

讀港校想省錢，社恐輸在起跑線

熱聞|清明假期將至，熱門目的地有哪些?

9月零跑交付突破6萬輛，小鵬、小米超4萬輛

媒體:約800名中外人士出席國慶招待會有幾個重要信息

媒體:約800名中外人士出席國慶招待會有幾個重要信息

痛失三叉戟的大巴黎，是怎么贏下巴薩的？

董璇母女國慶節(jié)跳舞小酒窩眼神堅定

金價快3900美元，黃金牛還能跑多遠(yuǎn)？?

小米們起猛了！安卓廠商們聯(lián)手高通發(fā)力，拍視頻也要超iPhone？

國慶節(jié)，你的孩子還寫作業(yè)嗎？

讀港校想省錢，社恐輸在起跑線

熱聞|清明假期將至，熱門目的地有哪些?