夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

ICML 2025 | 大模型能在信息不完備的情況下問出正確的問題嗎?

0
分享至



大語(yǔ)言模型(Large Language Model, LLM)在復(fù)雜推理任務(wù)中表現(xiàn)卓越。借助鏈?zhǔn)剿季S(Chain-of-Thought, CoT),LLM 能夠?qū)?fù)雜問題分解為簡(jiǎn)單步驟,充分探索解題思路并得出正確答案。LLM 已在多個(gè)基準(zhǔn)上展現(xiàn)出優(yōu)異的推理能力,尤其是數(shù)學(xué)推理和代碼生成。

然而,當(dāng)前針對(duì) LLM 推理能力的研究主要集中于被動(dòng)推理(Passive Reasoning, PR),即在提供完整信息的前提下讓模型進(jìn)行推理。相比之下,對(duì)信息不完備場(chǎng)景下模型推理能力的研究明顯不足。

這類場(chǎng)景在實(shí)際應(yīng)用中十分常見,例如偵探需要通過詢問和走訪獲取破案線索,醫(yī)生需要通過問診收集診斷依據(jù)。我們將這類需要主動(dòng)獲取信息的推理稱為主動(dòng)推理(Active Reasoning, AR)

目前關(guān)于 AR 的方法和基準(zhǔn)研究較少,探索不足,制約了 LLM 在復(fù)雜現(xiàn)實(shí)場(chǎng)景中的應(yīng)用。如圖 1 所示,被動(dòng)推理是直接從給定的充分信息中求解,而主動(dòng)推理則需要從不完整的信息出發(fā),通過多輪交互來(lái)獲取關(guān)鍵線索,最終得出結(jié)論??梢哉f,被動(dòng)推理的核心是找到答案,而主動(dòng)推理的核心是提出正確的問題。



圖 1 被動(dòng)推理(左)與主動(dòng)推理(右)的示意圖。

盡管主動(dòng)推理對(duì)實(shí)現(xiàn)通用人工智能至關(guān)重要,但目前學(xué)術(shù)界對(duì)此關(guān)注甚少,LLM 在這方面的能力也亟待一個(gè)系統(tǒng)性的評(píng)估。為此,我們提出了 AR-Bench,一個(gè)旨在全面評(píng)估大模型主動(dòng)推理能力的基準(zhǔn),并進(jìn)行了一系列深入的實(shí)驗(yàn)分析。

我們的主要貢獻(xiàn)有如下三點(diǎn):

  1. 新問題:我們提出了主動(dòng)推理這一亟待研究的新問題,并系統(tǒng)定義了其相對(duì)于被動(dòng)推理的核心挑戰(zhàn)。
  2. 新基準(zhǔn):我們提出了專門用于評(píng)估主動(dòng)推理能力的基準(zhǔn) AR-Bench ,系統(tǒng)的測(cè)試模型在復(fù)雜場(chǎng)景中的主動(dòng)推理能力。
  3. 新發(fā)現(xiàn):我們通過在 AR-Bench 上的全面評(píng)測(cè),揭示了當(dāng)前頂尖 LLM 在主動(dòng)推理方面的普遍且嚴(yán)重的短板,并指出了未來(lái)的研究方向。

接下來(lái),我們將簡(jiǎn)要介紹 TMLR 課題組和斯坦福大學(xué)合作的 AR-Bench,并展示我們從廣泛地測(cè)試實(shí)驗(yàn)中提取出來(lái)的重要發(fā)現(xiàn),相關(guān)論文已發(fā)表于 ICML 2025 會(huì)議。



  • 論文標(biāo)題:From Passive to Active Reasoning: Can Large Language Models Ask the Right Questions under Incomplete Information?
  • 論文鏈接:https://arxiv.org/abs/2506.08295
  • 代碼鏈接:https://github.com/tmlr-group/AR-Bench

新問題:主動(dòng)推理

傳統(tǒng)的 LLM 推理研究,如 CoT,大多遵循被動(dòng)推理的范式。在這種范式下,模型接收一個(gè)包含所有必要信息的問題,然后逐步地推導(dǎo)出最終答案。然而,現(xiàn)實(shí)中許多場(chǎng)景都存在著信息不完整的情況。以醫(yī)療診斷為例,醫(yī)生需要通過與患者互動(dòng)主動(dòng)獲取癥狀、病史等關(guān)鍵信息,而非被動(dòng)接收完整數(shù)據(jù)。這類信息不完整的場(chǎng)景要求 LLM 通過提問、信息探索和動(dòng)態(tài)交互來(lái)補(bǔ)充缺失信息,最終完成推理任務(wù)。

我們將這種推理范式定義為主動(dòng)推理。在 AR 范式下,模型僅獲得部分信息,并且必須通過與外部環(huán)境(如數(shù)據(jù)庫(kù)、API 或人類用戶)的交互來(lái)主動(dòng)提問,以獲取缺失的關(guān)鍵信息來(lái)解決問題。AR 綜合了提問、檢索和迭代推理,是一個(gè)更全面、更動(dòng)態(tài)、更具挑戰(zhàn)性的問題解決框架。

對(duì)主動(dòng)推理問題的探索,有助于我們更好地理解和提升 LLM 在真實(shí)、復(fù)雜場(chǎng)景下的智能水平,推動(dòng)其從一個(gè)被動(dòng)的文本處理器,轉(zhuǎn)變?yōu)橐粋€(gè)能夠主動(dòng)解決問題的人工智能體。



圖 2 PR 要求模型通過一步步推理從給定的問題得到正確答案,而 AR 要求模型分析當(dāng)前任務(wù),提出一系列關(guān)鍵的問題來(lái)獲取重要信息,并利用這些信息得到正確的答案。本質(zhì)上,PR 的核心要求是根據(jù)問題得到正確答案,而 AR 的核心要求是提出正確的問題來(lái)獲取關(guān)鍵的信息。

新基準(zhǔn):AR-Bench

為了系統(tǒng)地評(píng)估和衡量 LLM 的主動(dòng)推理能力,我們構(gòu)建了 AR-Bench (Active Reasoning Benchmark)。AR-Bench 旨在模擬真實(shí)世界中的信息獲取場(chǎng)景,它包含三個(gè)不同類型的任務(wù),分別對(duì)應(yīng)三種核心的推理能力:

偵探案件 (Detective Cases, DC):模擬刑事案件調(diào)查,模型需要通過提問來(lái)搜集線索、分析案情,考驗(yàn)其常識(shí)推理能力。

情景謎題 (Situation Puzzles, SP):也被稱為 「海龜湯」,模型需要通過 「是 / 否」 問題來(lái)揭開一個(gè)看似矛盾或離奇情景背后的真相,考驗(yàn)其邏輯推理和發(fā)散思維能力。

數(shù)字猜謎 (Guessing Numbers, GN):經(jīng)典的主動(dòng)推理游戲,模型需要根據(jù)反饋猜測(cè)一個(gè)由不重復(fù)數(shù)字組成的四位數(shù),考驗(yàn)其符號(hào)推理能力。



圖 3 AR-Bench 中三種任務(wù)的示例。

我們的評(píng)估框架采用多輪交互范式,其中提問方 LLM 與扮演信息源的 「回答者」 智能體進(jìn)行動(dòng)態(tài)對(duì)話。該評(píng)估體系包含兩個(gè)維度:

1)結(jié)果評(píng)估:在 DC 和 GN 任務(wù)中判斷模型結(jié)論與標(biāo)準(zhǔn)答案的匹配度,對(duì)于開放式問題 SP 則采用 F1-Score 衡量回答相似度;

2)過程評(píng)估:基于預(yù)設(shè)關(guān)鍵問題(Key Questions),通過 LLM-as-a-judge 方法以交互輪次為粒度評(píng)估對(duì)話是否有效解決關(guān)鍵問題(適用于 DC 和 SP ),而在 GN 任務(wù)中則直接計(jì)算反饋信息的數(shù)字準(zhǔn)確率作為過程評(píng)分指標(biāo)。這一綜合評(píng)估方案不僅關(guān)注最終答案的正確性,更重視模型在交互過程中提出問題的質(zhì)量和信息獲取的有效性,從而全面刻畫模型的主動(dòng)推理能力。

新發(fā)現(xiàn):

大模型主動(dòng)推理能力嚴(yán)重不足

我們?cè)?AR-Bench 上對(duì)包括 GPT-4o 在內(nèi)的多個(gè)先進(jìn) LLM,以及基于 prompting 和基于訓(xùn)練的推理方法進(jìn)行了廣泛測(cè)試。

實(shí)驗(yàn)結(jié)果(圖 4,5)表明:目前的語(yǔ)言模型和推理方法都無(wú)法有效解決AR-Bench 提出的問題,我們發(fā)現(xiàn):

1. 即使是最先進(jìn)的 GPT-4o 模型也只能在 GN 任務(wù)上達(dá)到 35% 的準(zhǔn)確率。

2. 細(xì)粒度的指導(dǎo)和基于搜索的方法 (ToT)只能提供非常有限的性能提升。

3. 基于訓(xùn)練的方法(SFT, DPO)甚至在一些任務(wù)上使模型性能變差。



圖 4 不同模型在 AR-Bench 上的性能對(duì)比。



圖 5 Llama-3.1-8B 和 Llama-3.1-70B 使用不同方法在 AR-Bench 上的性能對(duì)比。

我們還測(cè)試了兩個(gè)先進(jìn)的主動(dòng)推理方法(Proactive CoT 和 Uncertanty of Thoughts)以及人類在 AR-Bench 上的表現(xiàn)(見圖 6)。我們發(fā)現(xiàn):

1. 即使是目前提出的先進(jìn)的主動(dòng)推理方法也無(wú)法提升模型在 AR-Bench 上的性能。

2. 人類在 AR-Bench 上的推理表現(xiàn)顯著優(yōu)于目前先進(jìn)的語(yǔ)言模型。



圖 6(左)先進(jìn)的主動(dòng)推理方法在 AR-Bench 上的性能表現(xiàn),(右)人類在 AR-Bench 上的表現(xiàn)和 GPT-4o 對(duì)比。

為了更細(xì)致的研究語(yǔ)言模型在主動(dòng)推理上的表現(xiàn),理解目前模型和方法的不足,我們測(cè)量了模型在主動(dòng)推理交互過程中模型對(duì)該任務(wù)的解決程度(見圖 7,8),我們發(fā)現(xiàn):

1. 在交互過程中,模型的收益呈現(xiàn)遞減趨勢(shì),在后期問題質(zhì)量低下

2. 較弱的模型問出的問題質(zhì)量偏低,并且無(wú)法對(duì)交互機(jī)會(huì)進(jìn)行有效利用

3. 較強(qiáng)的模型能夠利用多輪交互機(jī)會(huì),持續(xù)獲得有用的信息

4. 基于搜索的方法在 AR-Bench 中依賴于每一輪評(píng)估問題質(zhì)量的驗(yàn)證器的可靠性,表現(xiàn)在對(duì) GN 任務(wù)有顯著提升 (驗(yàn)證器基于數(shù)值反饋構(gòu)建,簡(jiǎn)單可靠),而在 SP 任務(wù)下無(wú)法提升推理表現(xiàn) (驗(yàn)證器基于自然語(yǔ)言反饋構(gòu)建,復(fù)雜且相對(duì)不可靠)。



圖 7 Llama-3.1-8B 和 Llama-3.1-70B 使用不同方法在 AR-Bench 推理中過程分的變化趨勢(shì)。



圖 8 不同模型在 AR-Bench 各任務(wù)上推理中過程分的變化趨勢(shì)。

我們還進(jìn)行在 AR-Bench 進(jìn)行了三方面的消融實(shí)驗(yàn)(見圖 9,10,11):

1. 固定交互信息,探究不同模型的推理能力的表現(xiàn)。

2. 延長(zhǎng)交互的輪數(shù),給予模型更多的機(jī)會(huì)進(jìn)行信息獲取,探究模型的表現(xiàn)變化。

3. 探究在實(shí)驗(yàn)中扮演回答者的模型的可靠性。

我們發(fā)現(xiàn):

1. 更大的模型能夠在固定的記錄中提取出更多的有效信息。

2. 簡(jiǎn)單延長(zhǎng)交互輪數(shù)無(wú)法完全解決主動(dòng)推理任務(wù)。

3. 面對(duì)主模型提出的問題,回答者能夠給出可靠的回復(fù)。



圖 9 使用 Llama-3.1-70B 和 Llama-3.1-405B 在交互過程中獲得的交互記錄測(cè)試不同模型在給定信息的情況下給出正確結(jié)論的能力。



圖 10 延長(zhǎng)交互輪數(shù)后,比較模型的推理表現(xiàn)變化。



圖 11 回答者模型的可靠性驗(yàn)證。

為更直觀評(píng)估模型在主動(dòng)推理中的表現(xiàn),我們系統(tǒng)分析了不同任務(wù)中的典型錯(cuò)誤模式(見圖 12),并通過具體案例深入剖析了模型的失誤原因(見圖 13)。

我們發(fā)現(xiàn):

1. 模型會(huì)問出寬泛,不具體的問題。

2. 模型會(huì)問出沒有幫助的問題。

3. 模型在主動(dòng)推理中會(huì)頻繁出現(xiàn)時(shí)間線誤解,忽視證據(jù),強(qiáng)行提出未經(jīng)驗(yàn)證的假設(shè),以及沒有完全利用符號(hào)反饋等典型問題。



圖 12 GPT-4o 模型在不同任務(wù)下的推理正確和推理錯(cuò)誤的案例分析。



圖 13 Llama-3.1-8B 和 GPT-4o 在不同任務(wù)下的出現(xiàn)的典型錯(cuò)誤統(tǒng)計(jì)。

總結(jié)

我們的工作系統(tǒng)地定義了主動(dòng)推理這一重要問題,并構(gòu)建了 AR-Bench 作為社群的評(píng)估工具。我們的實(shí)驗(yàn)結(jié)果清晰地表明,當(dāng)前的大語(yǔ)言模型雖然在被動(dòng)推理上能力強(qiáng)大,但在更貼近現(xiàn)實(shí)的主動(dòng)推理場(chǎng)景下卻舉步維艱。

展望未來(lái)工作,我們認(rèn)為 AR-Bench 存在以下拓展方向:

提升模型的主動(dòng)推理能力:

1. 采集小規(guī)模但是高質(zhì)量的微調(diào)數(shù)據(jù)集

2. 將強(qiáng)化學(xué)習(xí)推理方法(PPO, GRPO, DAPO)和推理模型適配到主動(dòng)推理

3. 為搜索方法開發(fā)更先進(jìn)可靠的驗(yàn)證器,以提升搜索方法在主動(dòng)推理上的表現(xiàn)

將 AR-Bench 拓展到更多的任務(wù)和領(lǐng)域:

1. 醫(yī)療場(chǎng)景和定制化代理

2. 多輪檢索增強(qiáng)生成和工具調(diào)用

3. 模擬真實(shí)環(huán)境和多模態(tài)場(chǎng)景,例如機(jī)器人和游戲

更多的實(shí)驗(yàn)分析和技術(shù)細(xì)節(jié),請(qǐng)參閱我們的論文及源碼,我們也將持續(xù)更新本工作的內(nèi)容。

我們希望 AR-Bench 能夠激發(fā)更多關(guān)于主動(dòng)推理的研究,推動(dòng)開發(fā)出能夠主動(dòng)提問、高效探索、真正解決現(xiàn)實(shí)世界問題的人工智能。非常感謝大家關(guān)注我們的工作!

課題組介紹

香港浸會(huì)大學(xué)可信機(jī)器學(xué)習(xí)和推理課題組 (TMLR Group) 由多名青年教授、博士后研究員、博士生、訪問博士生和研究助理共同組成,課題組隸屬于理學(xué)院計(jì)算機(jī)系。課題組專攻可信基礎(chǔ)模型、可信表征學(xué)習(xí)、基于因果推理的可信學(xué)習(xí)等相關(guān)的算法,理論和系統(tǒng)設(shè)計(jì)以及在自然科學(xué)上的應(yīng)用,具體研究方向和相關(guān)成果詳見本組 Github https://github.com/tmlr-group。

課題組由政府科研基金以及工業(yè)界科研基金資助,如香港研究資助局新進(jìn)學(xué)者協(xié)作研究補(bǔ)助金、優(yōu)配研究金和杰出青年學(xué)者計(jì)劃,國(guó)家自然科學(xué)基金面上項(xiàng)目和青年項(xiàng)目,以及微軟、英偉達(dá)、字節(jié)跳動(dòng)、百度、阿里、騰訊等企業(yè)的教職科研基金。青年教授和資深研究員手把手帶,GPU 計(jì)算資源充足,長(zhǎng)期招收多名博士后研究員、博士生、研究助理和研究實(shí)習(xí)生。此外,本組也歡迎自費(fèi)的訪問博士后研究員、博士生和研究助理申請(qǐng),訪問至少 3-6 個(gè)月,支持遠(yuǎn)程訪問。有興趣的同學(xué)請(qǐng)發(fā)送個(gè)人簡(jiǎn)歷和初步研究計(jì)劃到郵箱 bhanml@comp.hkbu.edu.hk。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
59歲王志文老到不敢認(rèn)!大耳朵、大肚腩,網(wǎng)友猜測(cè)患有心臟類疾病

59歲王志文老到不敢認(rèn)!大耳朵、大肚腩,網(wǎng)友猜測(cè)患有心臟類疾病

娛樂看阿敞
2025-09-22 10:27:35
聶云霞,嚴(yán)重違反黨的政治紀(jì)律、組織紀(jì)律、廉潔紀(jì)律,構(gòu)成嚴(yán)重職務(wù)違法并涉嫌受賄犯罪

聶云霞,嚴(yán)重違反黨的政治紀(jì)律、組織紀(jì)律、廉潔紀(jì)律,構(gòu)成嚴(yán)重職務(wù)違法并涉嫌受賄犯罪

新京報(bào)政事兒
2025-09-24 12:24:23
中央部委重磅會(huì)議明確定調(diào),10 月開始房地產(chǎn)完全明牌了

中央部委重磅會(huì)議明確定調(diào),10 月開始房地產(chǎn)完全明牌了

新浪財(cái)經(jīng)
2025-09-22 15:41:35
三觀炸裂!翟欣欣出軌聊天記錄流出,尺度大到咂舌,判12年都嫌少

三觀炸裂!翟欣欣出軌聊天記錄流出,尺度大到咂舌,判12年都嫌少

手工制作阿殲
2025-09-24 14:01:28
福建艦彈射之后,美國(guó)人大破防

福建艦彈射之后,美國(guó)人大破防

美第奇效應(yīng)
2025-09-23 17:46:43
烏克蘭對(duì)俄首都發(fā)動(dòng)5月來(lái)最大規(guī)模無(wú)人機(jī)襲擊,莫斯科人驚恐不安

烏克蘭對(duì)俄首都發(fā)動(dòng)5月來(lái)最大規(guī)模無(wú)人機(jī)襲擊,莫斯科人驚恐不安

火星宏觀
2025-09-24 11:10:10
征服中年女人的最快方法,不是一直聊天,而是“禁果效應(yīng)”

征服中年女人的最快方法,不是一直聊天,而是“禁果效應(yīng)”

文雅筆墨
2025-09-22 04:58:43
包養(yǎng)10位情婦,睡覺翻牌生下11個(gè)私生子,75歲還在拼命生娃!

包養(yǎng)10位情婦,睡覺翻牌生下11個(gè)私生子,75歲還在拼命生娃!

削桐作琴
2025-09-08 15:05:36
曾風(fēng)靡全國(guó)的“騙局”,卻被捧上神壇炒到千萬(wàn)!如今白菜價(jià)沒人要

曾風(fēng)靡全國(guó)的“騙局”,卻被捧上神壇炒到千萬(wàn)!如今白菜價(jià)沒人要

壹知眠羊
2025-09-13 07:22:17
炒股不需要懂太多,當(dāng)"籌碼集中度達(dá)到12%",就是主力在叫你進(jìn)場(chǎng)

炒股不需要懂太多,當(dāng)"籌碼集中度達(dá)到12%",就是主力在叫你進(jìn)場(chǎng)

股經(jīng)縱橫談
2025-09-22 19:07:38
中央定調(diào),延遲退休實(shí)施,2029年與2030年退休,養(yǎng)老金領(lǐng)取不相同

中央定調(diào),延遲退休實(shí)施,2029年與2030年退休,養(yǎng)老金領(lǐng)取不相同

深析古今
2025-09-24 08:38:34
國(guó)企高管“霸占”朋友老婆的瓜(附PPT)

國(guó)企高管“霸占”朋友老婆的瓜(附PPT)

吃瓜體
2025-09-24 10:02:49
農(nóng)婦辱罵法官被罰10萬(wàn)塊,又反轉(zhuǎn)了?

農(nóng)婦辱罵法官被罰10萬(wàn)塊,又反轉(zhuǎn)了?

雷斯林
2025-09-23 13:02:12
方媛預(yù)產(chǎn)期在即,曝定100萬(wàn)月子中心住56天,郭富城休假1月陪老婆

方媛預(yù)產(chǎn)期在即,曝定100萬(wàn)月子中心住56天,郭富城休假1月陪老婆

小嵩
2025-09-23 14:18:06
“數(shù)學(xué)賺不到錢?”——他用史上最強(qiáng)印鈔機(jī),給了世界一個(gè)300億美元的耳光

“數(shù)學(xué)賺不到錢?”——他用史上最強(qiáng)印鈔機(jī),給了世界一個(gè)300億美元的耳光

元爸體育
2025-09-23 05:11:59
波蘭總理終于點(diǎn)頭開放邊境,中歐班列迎轉(zhuǎn)機(jī)!同時(shí)他留了一句狠話

波蘭總理終于點(diǎn)頭開放邊境,中歐班列迎轉(zhuǎn)機(jī)!同時(shí)他留了一句狠話

南宗歷史
2025-09-24 14:03:31
曾宣布滅絕!2021年,云南男子干農(nóng)活時(shí)發(fā)現(xiàn),養(yǎng)了20年后主動(dòng)上交

曾宣布滅絕!2021年,云南男子干農(nóng)活時(shí)發(fā)現(xiàn),養(yǎng)了20年后主動(dòng)上交

萬(wàn)象硬核本尊
2025-09-22 19:39:13
現(xiàn)在買房,可能是非常危險(xiǎn)的決策!尤其30-45歲的中堅(jiān)力量

現(xiàn)在買房,可能是非常危險(xiǎn)的決策!尤其30-45歲的中堅(jiān)力量

地產(chǎn)搬運(yùn)工
2025-09-24 11:55:25
為避臺(tái)風(fēng),全紅嬋爸爸把幾十年樹齡的菠蘿蜜樹都砍了,真的很可惜

為避臺(tái)風(fēng),全紅嬋爸爸把幾十年樹齡的菠蘿蜜樹都砍了,真的很可惜

丁丁鯉史紀(jì)
2025-09-24 14:28:40
老當(dāng)益壯,加盟上海?塵埃落定,37歲麥基官宣,1年合同

老當(dāng)益壯,加盟上海?塵埃落定,37歲麥基官宣,1年合同

樂聊球
2025-09-24 12:29:01
2025-09-24 15:24:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11344文章數(shù) 142455關(guān)注度
往期回顧 全部

科技要聞

阿里的AI豪賭:三年先砸3800億

頭條要聞

馬克龍當(dāng)特朗普的面表態(tài):解散哈馬斯“行不通”

頭條要聞

馬克龍當(dāng)特朗普的面表態(tài):解散哈馬斯“行不通”

體育要聞

放下游戲機(jī),捧起金球獎(jiǎng)

娛樂要聞

丫蛋為何后來(lái)被趙本山逐出趙家班?

財(cái)經(jīng)要聞

投資幾億的項(xiàng)目爛尾 斯坦福博士敗走云南

汽車要聞

中國(guó)星全新東方曜系列正式上市 限時(shí)價(jià)9.37萬(wàn)起

態(tài)度原創(chuàng)

教育
游戲
藝術(shù)
公開課
軍事航空

教育要聞

直播預(yù)告 | 《和孩子說一切》:1-15歲孩子愛的英文書單和神器都在這里了(9.26,20:00)

不再獨(dú)占! 《如龍0導(dǎo)剪版》12月8日登陸全平臺(tái)

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

8K慢動(dòng)作看中國(guó)戰(zhàn)機(jī)高燃瞬間

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 国产AV无码专区亚洲AV紧身裤| 国精产品一线二线三线网站| 亚洲中文字幕精品久久久久久直播 | 性视频无遮挡HD| 亚洲IV秘 乱码| 成在人线av无码免观看午夜网| 免费麻豆AV在线天空传媒| 亚洲欧美成aⅴ人在线观看| 午夜不卡欧美AAAAAA在线观看| 香蕉EEWW99国产精选免费| 毛片大全免费观看| 国产精品久久久久久99999| 久久夜色精品国产亚av| 免费黄片在线看24p| 老师扒下内裤让我爽了一夜| 激情无码人妻又粗又大中国人| VR成人片在线观看| 日韩AV电影网站| 亚洲国产午夜成人福利AV| 亚洲成人综合AV| 亚洲一区五码| 西西午夜无码大胆啪啪国模| 中文字幕视频一区| 激情视频毛片| 久视频免费精品6| 成人激情开心成人网| 欧美操逼a爱图片| 亚洲 另类 熟女 字幕| 国产乱码精品一区| 久久综合久久综合久久| 日本伊人色综合网| 欧美成人色图色小说| 专干KTV老熟女| 丰满多毛的大隂户视频偷窥隐| av在线播放日韩亚洲欧我不卡| 极品少妇无码| 果冻传媒亚洲区二期| 日本中文字幕一区二区高清在线| 人妻仑乱a级毛片免费看| 18到20岁的黄色視頻| а天堂中文最新版在线|