夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepMind 顛覆機(jī)器人學(xué)習(xí)范式:讓機(jī)器像人一樣 “自由成長”

0
分享至



從 “模仿者” 到 “學(xué)習(xí)者”,機(jī)器人的進(jìn)化更進(jìn)一步。

作者丨劉欣

編輯丨陳彩嫻

機(jī)器人在底層控制方面的應(yīng)用始終局限于行為克隆,這種類似于照貓畫虎的學(xué)習(xí)方式,要求機(jī)器人必須依賴海量標(biāo)注的模仿數(shù)據(jù),不僅收集成本極高,更無法讓機(jī)器人應(yīng)對(duì)訓(xùn)練數(shù)據(jù)之外的全新場(chǎng)景。

谷歌 DeepMind 的最新研究試圖打破這一現(xiàn)狀,他們受到大型語言模型微調(diào)中強(qiáng)化學(xué)習(xí)階段成功經(jīng)驗(yàn)的啟發(fā),提出了一種面向機(jī)器人學(xué)的兩階段后訓(xùn)練方法,第一階段是監(jiān)督微調(diào)( Supervised Fine-Tuning, SFT ),第二階段是自我提升( Self-Improvement )。

通過在真實(shí)世界與仿真機(jī)器人實(shí)體( LanguageTable 與 Aloha )上開展的大量實(shí)驗(yàn),提出的后訓(xùn)練方法在具身基礎(chǔ)模型上取得了顯著成果,機(jī)器人能自主練習(xí)并習(xí)得元朝訓(xùn)練時(shí)模仿學(xué)習(xí)數(shù)據(jù)集中所觀察到行為的新技能,并實(shí)現(xiàn)廣泛泛化。



論文鏈接:https://arxiv.org/pdf/2509.15155

01

兩階段后訓(xùn)練框架

本研究的核心是探究強(qiáng)化學(xué)習(xí)后訓(xùn)練在機(jī)器人具身基礎(chǔ)模型中的有效性。然而,機(jī)器人強(qiáng)化學(xué)習(xí)(尤其是操作任務(wù))面臨的關(guān)鍵挑戰(zhàn)是獎(jiǎng)勵(lì)工程問題:設(shè)計(jì)有效的獎(jiǎng)勵(lì)函數(shù)需要反復(fù)迭代訓(xùn)練策略并修正獎(jiǎng)勵(lì)定義以規(guī)避非預(yù)期結(jié)果;此外,即便獎(jiǎng)勵(lì)定義完美,在真實(shí)世界中測(cè)量獎(jiǎng)勵(lì)也需要大量工程投入。因此,當(dāng)團(tuán)隊(duì)致力于訓(xùn)練能夠完成日益廣泛任務(wù)的機(jī)器人時(shí),人工設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù)在真實(shí)世界機(jī)器人學(xué)中已難以為繼。


DeepMind 通過學(xué)習(xí)數(shù)據(jù)驅(qū)動(dòng)型獎(jiǎng)勵(lì)函數(shù)克服了這一障礙,該函數(shù)同時(shí)繼承了底層基礎(chǔ)模型經(jīng)網(wǎng)絡(luò)級(jí)預(yù)訓(xùn)練所具備的穩(wěn)健性與泛化性。提出的后訓(xùn)練框架如上圖所示,包含兩個(gè)階段:第一階段為監(jiān)督微調(diào)( Supervised Fine-Tuning, SFT ),利用以下兩種目標(biāo)對(duì)預(yù)訓(xùn)練基礎(chǔ)模型進(jìn)行微調(diào):a) 行為克?。籦) 剩余步驟預(yù)測(cè)( steps-to-go prediction )。第二階段為自我提升( Self-Improvement ),剩余步驟預(yù)測(cè)能夠助力提取平滑的獎(jiǎng)勵(lì)函數(shù)與穩(wěn)健的成功檢測(cè)器,使機(jī)器人集群可在極少人工監(jiān)督的情況下自主練習(xí)下游任務(wù)。至關(guān)重要的是,數(shù)據(jù)驅(qū)動(dòng)型獎(jiǎng)勵(lì)設(shè)計(jì)無需真值獎(jiǎng)勵(lì),且能借助底層基礎(chǔ)模型的穩(wěn)健性與泛化性。

研究首先在第一階段先對(duì)模仿數(shù)據(jù)集進(jìn)行假設(shè),再基于數(shù)據(jù)集以預(yù)訓(xùn)練基礎(chǔ)模型初始化具身基礎(chǔ)模型,對(duì)行為克隆損失、剩余步驟預(yù)測(cè)損失這兩個(gè)目標(biāo)進(jìn)行監(jiān)督微調(diào)。在第二階段,則是想通過在線強(qiáng)化學(xué)習(xí)對(duì)具身基礎(chǔ)模型進(jìn)行下游任務(wù)微調(diào),以快速提升策略性能。研究對(duì)獎(jiǎng)勵(lì)函數(shù)和成功指示器進(jìn)行了定義,即可對(duì)具身基礎(chǔ)模型進(jìn)行下游任務(wù)的在線強(qiáng)化學(xué)習(xí)微調(diào),凍結(jié)了一個(gè)第一階段的檢查點(diǎn)用于獎(jiǎng)勵(lì)函數(shù)計(jì)算與成功檢測(cè),同時(shí)也從第一階段檢查點(diǎn)初始化第二階段的策略。

研究提出了以下問題:

  • Q1:自我提升能否在監(jiān)督學(xué)習(xí)階段的基礎(chǔ)上進(jìn)一步提升下游任務(wù)性能?

  • Q2:監(jiān)督學(xué)習(xí)與自我提升的結(jié)合是否比單純的監(jiān)督學(xué)習(xí)具有更高的樣本效率?

  • Q3:依賴強(qiáng)化學(xué)習(xí)的自我提升方法是否足夠可靠且可復(fù)現(xiàn),能夠應(yīng)用于真實(shí)世界機(jī)器人學(xué)?

  • Q4:預(yù)訓(xùn)練對(duì)自我提升流程有何貢獻(xiàn)?

  • Q5:網(wǎng)絡(luò)級(jí)基礎(chǔ)模型預(yù)訓(xùn)練能否使自我提升在超出模仿數(shù)據(jù)集覆蓋范圍的任務(wù)上生效?

02

從“模仿者”到“學(xué)習(xí)者”

DeepMind 基于 LanguageTable 與 Aloha 兩種機(jī)器人實(shí)體,在仿真與真實(shí)世界環(huán)境中開展實(shí)驗(yàn),來驗(yàn)證所提自我提升框架的有效性,研究全程采用 30 億參數(shù)的 PaLI 視覺 - 語言模型作為基礎(chǔ)預(yù)訓(xùn)練模型。研究主要進(jìn)行了6個(gè)實(shí)驗(yàn)來回答上述問題,分別是:

(1)仿真 LanguageTable 實(shí)驗(yàn)

仿真 LanguageTable 領(lǐng)域第一階段策略訓(xùn)練所使用的數(shù)據(jù)集來自原始研究,包含 181,020 條人類生成軌跡,以及 78,623 條描述軌跡目標(biāo)的獨(dú)特指令。對(duì)該數(shù)據(jù)集進(jìn)行子采樣,生成 3 個(gè)新數(shù)據(jù)集(原始規(guī)模的 10%、20% 和 80%)。針對(duì)每個(gè)數(shù)據(jù)集規(guī)模,在第一階段訓(xùn)練后,采用 3 個(gè)隨機(jī)種子進(jìn)行第二階段微調(diào),以驗(yàn)證自我提升流程的可靠性。第二階段微調(diào)聚焦于 Block2Block 任務(wù)子集(例如 “將藍(lán)色月亮形狀塊移至紅色五邊形形狀塊處”),當(dāng)策略成功率趨于穩(wěn)定時(shí)停止訓(xùn)練。

(2)真實(shí)世界 LanguageTable 實(shí)驗(yàn)

上述實(shí)驗(yàn)中展現(xiàn)的高樣本效率與穩(wěn)健性表明,自我提升流程確實(shí)可應(yīng)用于真實(shí)世界機(jī)器人學(xué)。研究將所提方法應(yīng)用于真實(shí)世界 LanguageTable 領(lǐng)域,分別采用 20% 和 80% 規(guī)模的模仿學(xué)習(xí)數(shù)據(jù)集。與仿真場(chǎng)景相同,第二階段微調(diào)聚焦于 Block2Block 任務(wù)子集。由于指令采樣、獎(jiǎng)勵(lì)標(biāo)記與成功檢測(cè)均為自動(dòng)化流程,在自我提升階段,一名人類操作員即可監(jiān)控所有 LanguageTable 機(jī)器人工作站。操作員的唯一職責(zé)是在積木掉落桌面或工作站超過 5 分鐘未洗牌重置時(shí)進(jìn)行重置。每個(gè)實(shí)驗(yàn)持續(xù)約 20 小時(shí)。

(3)仿真 Aloha 單插入任務(wù)實(shí)驗(yàn)

研究還在第二種機(jī)器人實(shí)體 —— 雙臂 Aloha 操作平臺(tái)上驗(yàn)證了所提微調(diào)框架。設(shè)計(jì)并收集了雙臂插入任務(wù)的數(shù)據(jù):左臂拿起套筒,右臂拿起插銷并將其插入套筒。該任務(wù)具有更復(fù)雜的觀測(cè)空間、70 維動(dòng)作空間以及更小的模仿數(shù)據(jù)集,為驗(yàn)證所提方法提供了挑戰(zhàn)性場(chǎng)景。

研究還構(gòu)建了 3 個(gè)規(guī)模分別為 5K、10K 和 15K 片段的模仿數(shù)據(jù)集,對(duì) 5K 和 10K 規(guī)模數(shù)據(jù)集執(zhí)行兩階段微調(diào),并報(bào)告 15K 規(guī)模數(shù)據(jù)集的監(jiān)督學(xué)習(xí)結(jié)果以作對(duì)比。與 LanguageTable 領(lǐng)域?qū)嶒?yàn)相比,本實(shí)驗(yàn)的方法差異在于:1)第二階段策略初始化的檢查點(diǎn)選擇;2)由于相機(jī)無法觀測(cè)到插銷完全插入套筒的成功條件,在獎(jiǎng)勵(lì)函數(shù)中加入了一個(gè)小的正常數(shù)以標(biāo)記成功狀態(tài)。

(4)基礎(chǔ)模型預(yù)訓(xùn)練實(shí)驗(yàn)

為消融 PaLI 中嵌入的多模態(tài)知識(shí)的影響,實(shí)驗(yàn)基于 PaLI 模型的變體開展兩階段微調(diào):

  • 隨機(jī)初始化( Scratch ):采用 PaLI 架構(gòu),但參數(shù)隨機(jī)初始化。

  • 單模態(tài) PaLI( Uni-PaLI ):PaLI 參數(shù)由單獨(dú)預(yù)訓(xùn)練的視覺模型與語言模型初始化,未進(jìn)行聯(lián)合多模態(tài)視覺 - 語言微調(diào)。

在仿真 LanguageTable 領(lǐng)域采用與第一個(gè)實(shí)驗(yàn)相同的設(shè)置進(jìn)行對(duì)比實(shí)驗(yàn)。將消融實(shí)驗(yàn)聚焦于自我提升階段:從 PaLI 第一階段檢查點(diǎn)初始化策略,使用隨機(jī)初始化或 Uni-PaLI 檢查點(diǎn)進(jìn)行獎(jiǎng)勵(lì)計(jì)算。

(5)仿真與真實(shí)世界間的域遷移

首先探究較簡單的泛化形式 —— 仿真與真實(shí)世界間的域遷移。Sim2Real 是一類重要方法,可大幅減少訓(xùn)練高性能機(jī)器人策略所需的真實(shí)世界經(jīng)驗(yàn),并已在多個(gè)場(chǎng)景中成功應(yīng)用。為簡化實(shí)驗(yàn),在 LanguageTable 領(lǐng)域探究反向問題 ——Real2Sim 遷移:使用 80% 的真實(shí)世界 LanguageTable 數(shù)據(jù)集訓(xùn)練第一階段模型,在仿真 LanguageTable 環(huán)境中執(zhí)行第二階段自我提升。

(6)習(xí)得新技能的強(qiáng)泛化能力

為了進(jìn)一步探究更強(qiáng)的泛化形式:預(yù)訓(xùn)練基礎(chǔ)模型的自我提升能否使策略練習(xí)并習(xí)得超出第一階段模仿數(shù)據(jù)集所觀察到的全新行為技能?;谡鎸?shí)世界 LanguageTable 數(shù)據(jù)集訓(xùn)練的策略與獎(jiǎng)勵(lì)模型,在一個(gè)名為 “BananaTable” 的新任務(wù)上執(zhí)行自我提升。

與以往研究中機(jī)器人基礎(chǔ)模型的語義泛化能力不同,BananaTable 任務(wù)的遷移需要行為泛化,要求策略習(xí)得新技能。例如,由于香蕉的細(xì)長幾何形狀,推擊位置不準(zhǔn)確會(huì)導(dǎo)致香蕉自轉(zhuǎn)而非按預(yù)期方向移動(dòng),如下圖所示。


03

邁向自主學(xué)習(xí)新路徑

通過在 LanguageTable 與 Aloha 兩種機(jī)器人實(shí)體的真實(shí)與仿真環(huán)境中開展大量實(shí)驗(yàn),DeepMind 證實(shí)了所提新型后訓(xùn)練框架的驚人有效性。首先,自我提升不僅能穩(wěn)健地超越行為克隆的策略性能,且監(jiān)督微調(diào)與自我提升的結(jié)合在樣本效率上遠(yuǎn)優(yōu)于單純擴(kuò)大模仿數(shù)據(jù)規(guī)模的監(jiān)督學(xué)習(xí)。例如,在 LanguageTable 領(lǐng)域,僅增加 10% 的機(jī)器人自我提升訓(xùn)練時(shí)間,就能將策略成功率從 45% 提升至 75%;而將機(jī)器人模仿數(shù)據(jù)量增加 8 倍,成功率僅從 45% 提升至 60%。進(jìn)一步的消融實(shí)驗(yàn)凸顯了基礎(chǔ)模型預(yù)訓(xùn)練在實(shí)現(xiàn)這一樣本效率與穩(wěn)健性中的核心作用。

更為振奮人心的是,在線自我提升與網(wǎng)絡(luò)級(jí)預(yù)訓(xùn)練的創(chuàng)新結(jié)合,還解鎖了現(xiàn)有方法無法實(shí)現(xiàn)的獨(dú)特能力:使機(jī)器人能夠自主練習(xí)并習(xí)得新技能。與以往研究中展示的語義泛化不同,這個(gè)組合方案實(shí)現(xiàn)了行為泛化,其范圍遠(yuǎn)超第一階段模仿數(shù)據(jù)所覆蓋的行為。本研究凸顯了將預(yù)訓(xùn)練基礎(chǔ)模型與在線自我提升相結(jié)合的變革性潛力,為機(jī)器人自主技能習(xí)得開辟了新路徑。

雖然這項(xiàng)研究在機(jī)器人自主學(xué)習(xí)新技能上取得了巨大的進(jìn)步,但在一些方面仍具有局限性:第一,樣本片段與技能邊界的規(guī)?;瘶?biāo)注:人工標(biāo)注成本過高,需要?jiǎng)?chuàng)新策略(如利用現(xiàn)有多模態(tài)基礎(chǔ)模型)從原始交互日志中恢復(fù)一致的邊界。探索此類自動(dòng)分割方法是未來研究的重要方向。第二,在這個(gè)框架中,獎(jiǎng)勵(lì)推斷無實(shí)時(shí)性要求,延遲約束極小,因此可使用更大規(guī)模的模型 —— 甚至迭代式、思維鏈推理 —— 以獲得更高保真度的標(biāo)記。

第三,本研究微調(diào)的通用視覺 - 語言骨干網(wǎng)絡(luò)在預(yù)訓(xùn)練階段從未接觸過機(jī)器人數(shù)據(jù)。隨著更大規(guī)模的機(jī)器人經(jīng)驗(yàn)多模態(tài)語料庫的出現(xiàn),設(shè)計(jì)預(yù)訓(xùn)練課程至關(guān)重要 —— 既要賦予具身基礎(chǔ)模型強(qiáng)大的物理推理先驗(yàn),又要保留其廣泛的視覺 - 語義知識(shí)。

第四,研究選擇使用不重用數(shù)據(jù)的在線 REINFORCE 算法。這一選擇規(guī)避了 “致命三要素” 中的兩個(gè)要素:自舉法與離線學(xué)習(xí)。但該選擇也放棄了現(xiàn)代離線算法的數(shù)據(jù)重用優(yōu)勢(shì)。探究可擴(kuò)展至大型模型的離線變體有望進(jìn)一步降低機(jī)器人時(shí)間需求。

最后,團(tuán)隊(duì)觀察到,當(dāng)自我提升超出性能峰值后,成功率會(huì)下降,這表明需要更好的停止準(zhǔn)則或自適應(yīng)正則化器,以避免對(duì)塑形獎(jiǎng)勵(lì)的過度優(yōu)化。對(duì)獎(jiǎng)勵(lì)函數(shù)選擇的理論探究也可能揭示這種性能下降的原因。


未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號(hào)名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
領(lǐng)先5分到落后5分!開拓者2連勝難了,楊瀚森坐板凳,恐被要下放

領(lǐng)先5分到落后5分!開拓者2連勝難了,楊瀚森坐板凳,恐被要下放

侃球熊弟
2025-10-27 10:59:18
北大才女李天樂:赴美留學(xué),入職頂尖藥企,用金屬鉈毒殺清華丈夫

北大才女李天樂:赴美留學(xué),入職頂尖藥企,用金屬鉈毒殺清華丈夫

尋途
2025-10-26 16:24:06
免疫調(diào)節(jié)原研藥賽能缺貨致價(jià)格翻倍!已有藥店限購,相關(guān)企業(yè)回應(yīng):漲價(jià)是市場(chǎng)行為

免疫調(diào)節(jié)原研藥賽能缺貨致價(jià)格翻倍!已有藥店限購,相關(guān)企業(yè)回應(yīng):漲價(jià)是市場(chǎng)行為

紅星新聞
2025-10-26 17:38:38
突發(fā)特訊!中國通告全球,東部戰(zhàn)區(qū)空軍部隊(duì)赴臺(tái)島周邊訓(xùn)練,引發(fā)全球高度關(guān)注

突發(fā)特訊!中國通告全球,東部戰(zhàn)區(qū)空軍部隊(duì)赴臺(tái)島周邊訓(xùn)練,引發(fā)全球高度關(guān)注

文雅筆墨
2025-10-27 07:08:27
2架美軍機(jī)在南海相繼墜毀,原因正在調(diào)查中

2架美軍機(jī)在南海相繼墜毀,原因正在調(diào)查中

界面新聞
2025-10-27 08:13:37
3個(gè)月了,扶老人被訛周女士無奈再發(fā)聲,對(duì)方操作,再次刷新底線

3個(gè)月了,扶老人被訛周女士無奈再發(fā)聲,對(duì)方操作,再次刷新底線

戶外釣魚哥阿勇
2025-10-26 16:15:18
鄭智化再次發(fā)文吐槽大陸機(jī)場(chǎng),坦言心灰意冷萌生退意,評(píng)論區(qū)翻車

鄭智化再次發(fā)文吐槽大陸機(jī)場(chǎng),坦言心灰意冷萌生退意,評(píng)論區(qū)翻車

萌神木木
2025-10-26 19:01:03
為何金庸故事漸漸失去市場(chǎng)?本質(zhì)是“偽君子”意淫,市場(chǎng)下沉后已無需道德面紗

為何金庸故事漸漸失去市場(chǎng)?本質(zhì)是“偽君子”意淫,市場(chǎng)下沉后已無需道德面紗

齊天候
2025-10-26 12:23:02
銷售利潤暴跌99%!中國市場(chǎng)銷量一降再降,德國汽車巨頭宣布:將在美國漲價(jià)

銷售利潤暴跌99%!中國市場(chǎng)銷量一降再降,德國汽車巨頭宣布:將在美國漲價(jià)

每日經(jīng)濟(jì)新聞
2025-10-26 22:38:16
皇馬1.5億巨星怒不可遏!一路抱怨不滿阿隆索 威脅要離隊(duì)

皇馬1.5億巨星怒不可遏!一路抱怨不滿阿隆索 威脅要離隊(duì)

葉青足球世界
2025-10-27 08:00:40
潛伏在我國高層的四大間諜,被安插在軍政兩界,導(dǎo)致我國損失慘重

潛伏在我國高層的四大間諜,被安插在軍政兩界,導(dǎo)致我國損失慘重

墨印齋
2025-10-23 19:23:25
悲催!柳州事件以后,各小區(qū)貼出告示:你家地板就是樓下的天花板

悲催!柳州事件以后,各小區(qū)貼出告示:你家地板就是樓下的天花板

火山詩話
2025-10-26 10:27:09
李湘王岳倫現(xiàn)身北京街頭被偶遇,李湘大冷天穿裙子,小腿浮腫!

李湘王岳倫現(xiàn)身北京街頭被偶遇,李湘大冷天穿裙子,小腿浮腫!

小咪侃娛圈
2025-10-27 09:03:54
讓旅客在寒風(fēng)中的站外等四個(gè)小時(shí)的地方,建議大家就別去了

讓旅客在寒風(fēng)中的站外等四個(gè)小時(shí)的地方,建議大家就別去了

李老逵亂擺龍門陣
2025-10-26 08:43:30
四大家族覆滅后,電詐親歷者曾述:沒姿色的女子,最終下場(chǎng)是公海

四大家族覆滅后,電詐親歷者曾述:沒姿色的女子,最終下場(chǎng)是公海

攬星河的筆記
2025-10-26 14:15:50
演都不演了!楊振寧去世僅8天,惡心的一幕出現(xiàn),結(jié)局大快人心

演都不演了!楊振寧去世僅8天,惡心的一幕出現(xiàn),結(jié)局大快人心

動(dòng)漫里的童話
2025-10-26 23:18:50
卡戴珊綜藝造型封神!乳膠裙把舞臺(tái)變秀場(chǎng)

卡戴珊綜藝造型封神!乳膠裙把舞臺(tái)變秀場(chǎng)

述家娛記
2025-10-26 22:13:21
170cmD杯女孩,撩走肌肉猛男,網(wǎng)友:沒X生活的我哭了…

170cmD杯女孩,撩走肌肉猛男,網(wǎng)友:沒X生活的我哭了…

健身迷
2025-09-20 09:22:20
突發(fā)!加州州長紐森宣布競(jìng)選2028美國總統(tǒng)

突發(fā)!加州州長紐森宣布競(jìng)選2028美國總統(tǒng)

大洛杉磯LA
2025-10-27 01:28:28
殺雞儆猴,中方開始動(dòng)真格了!德國想買稀土,就必須先交敏感數(shù)據(jù)

殺雞儆猴,中方開始動(dòng)真格了!德國想買稀土,就必須先交敏感數(shù)據(jù)

青青子衿
2025-10-27 07:02:38
2025-10-27 11:12:49
AI科技評(píng)論 incentive-icons
AI科技評(píng)論
點(diǎn)評(píng)學(xué)術(shù),服務(wù)AI
6954文章數(shù) 20698關(guān)注度
往期回顧 全部

科技要聞

1.5萬億美元生意,OpenAI用“自己人”搞定

頭條要聞

男子伙同二人撞死母親騙保被判死刑 事發(fā)前曾告知父親

頭條要聞

男子伙同二人撞死母親騙保被判死刑 事發(fā)前曾告知父親

體育要聞

虎頭蛇尾的國家德比,在哨響后迎來高潮

娛樂要聞

楊冪 15 年情路大起底

財(cái)經(jīng)要聞

貝森特:美方不再考慮對(duì)華加征100%關(guān)稅

汽車要聞

或告別燃油時(shí)代 豐田Supra將于明年停產(chǎn)

態(tài)度原創(chuàng)

家居
親子
房產(chǎn)
數(shù)碼
公開課

家居要聞

寵物友好 溫馨社交空間

親子要聞

圖畫本,畫畫本兒童,畫紙

房產(chǎn)要聞

十年冠領(lǐng)三亞,三亞灣心百億大盤煥新再領(lǐng)航!

數(shù)碼要聞

微軟 Win10 停止支持推動(dòng) 2025 Q3 蘋果 Mac 產(chǎn)品銷量大增

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 久久综合久久美利坚合众国| 裸体歌舞表演一区二区| 亚洲高清最新AV网站| 欧美做受 高潮| 被男人吃奶添下面好舒服| 日本在线一区二区三区| 宅宅午夜无码一区二区三区| 久久国产热精品波多野结衣av| 亚洲午夜Av一二三区熟女| 欧美精品Vs欧洲性爱在线| 老太bbwwbbww高潮| 亚洲中文字幕无线无码毛片| 风韵丰满熟妇啪啪区老老熟女百度| 精品人妻一区二区三区麻豆三炮| 国产日韩精品免费二三氏| 亚洲精品999久久久无码| 黑人又粗又大XXXXXXX| 亚洲人成综合网站7777香蕉| 天天夜碰日日摸日日澡性色AV| 亚洲最大av网站在线观看| 99五月婷婷| 醉酒后少妇被疯狂内射视频| 丁香婷婷色综合激情五月| 亚洲AV成人片桃色在线观看| 91色偷偷亚洲女人天堂| 综合图区亚洲欧美另类图片| 国产美女在线自慰AV| 玩弄邻居少妇高潮大叫| 国产成人果冻星空传媒| 精品一日韩美女性夜视频| 舔老女人的屁股| 国产无码砖区| 偷拍专区一区二区三区| 中日韩家庭淫乱免费视频| 国产好大好爽久久久久久久| 成人性生交大片免费看中文视频 | 国产女人在线视频| 精产国品一二三产品区别在| 欧美大胆西西成人| 色欲视频综合网| 婷婷丁香五月中文字幕|