夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

當(dāng) AI 下場(chǎng)炒 A 股,「推理」成了新的直覺

0
分享至



RETuning:像金融分析師一樣的模型,正在出現(xiàn)。

作者丨鄭佳美

編輯丨馬曉寧

幾天前,一場(chǎng)名為“AI Trading Battle”的實(shí)驗(yàn)在海外社交媒體上火了。主辦方給六個(gè)主流大模型(包括 ChatGPT、Gemini、Claude 等)每人一萬美元的虛擬資金,讓它們自由進(jìn)行加密貨幣交易。結(jié)果讓人大跌眼鏡:截至今天,DeepSeek V3.1 實(shí)現(xiàn)了超過 126% 的驚人盈利率,而GPT 5 和 Gemini 2.5 Pro 跌破 5,000 美元,虧損率超過 50%。

這場(chǎng)“AI 交易秀”原本旨在展示智能的金融潛力,卻反而揭示了一個(gè)更深層的問題:當(dāng)面對(duì)復(fù)雜而動(dòng)態(tài)的金融環(huán)境時(shí),語言模型知不知道他們“為什么下單”呢?

而由香港科技大學(xué)、美國羅格斯大學(xué)和南開大學(xué)聯(lián)合研究團(tuán)隊(duì)發(fā)表的最新論文,則是關(guān)于這類問題給出了一個(gè)答案。

他們提出了一種名為RETuning的方法,讓大語言模型在做出預(yù)測(cè)前,先搜集證據(jù)、分析邏輯、反思推理,再得出結(jié)論。換句話說,模型不再是“憑直覺判斷”,而是學(xué)會(huì)了“有理有據(jù)地思考”。

研究團(tuán)隊(duì)基于覆蓋中國 A 股市場(chǎng)的大規(guī)模數(shù)據(jù)集,對(duì)這一方法進(jìn)行了系統(tǒng)驗(yàn)證。結(jié)果表明,RETuning 不僅顯著提升了預(yù)測(cè)準(zhǔn)確率,還讓模型的推理過程更清晰、更可信,為金融領(lǐng)域的人工智能研究帶來了新的方向。


01

從準(zhǔn)確率到平衡性的顯著提升

在這項(xiàng)研究中,作者利用中國 A 股市場(chǎng)的大規(guī)模股票走勢(shì)預(yù)測(cè)數(shù)據(jù)集,對(duì)他們提出的RETuning(反思式證據(jù)調(diào)優(yōu))方法進(jìn)行了系統(tǒng)驗(yàn)證,結(jié)果表明這種方法確實(shí)顯著提升了大語言模型在金融預(yù)測(cè)任務(wù)中的表現(xiàn)。

首先,從總體效果來看,RETuning 模型(如 DeepSeek_R1_14B_SFT_GRPO)在三分類任務(wù):預(yù)測(cè)股票“上漲、持平、下跌”中取得了明顯優(yōu)勢(shì)。與主流的基礎(chǔ)模型相比(包括 ChatGPT、LLaMA3-8B、Mistral 等),RETuning 的 F1 分?jǐn)?shù)平均高出 10% 到 20%,說明它不僅能更準(zhǔn)確地區(qū)分股票走勢(shì)方向,還能在不同類別之間保持更平衡的預(yù)測(cè)效果。這種提升在金融任務(wù)中非常罕見,因?yàn)楣善睌?shù)據(jù)噪聲大、隨機(jī)性強(qiáng),能有雙位數(shù)的提升已經(jīng)算是非常顯著的成果。


其次,作者特別測(cè)試了模型在時(shí)間外數(shù)據(jù)(Out-of-Distribution)上的表現(xiàn),也就是讓模型預(yù)測(cè)它沒見過的股票或未來日期的走勢(shì)。結(jié)果顯示,RETuning 模型在這種“未來數(shù)據(jù)”上的表現(xiàn)依然穩(wěn)定,沒有明顯掉線,說明它具備一定的泛化能力,能適應(yīng)不同時(shí)間段和不同公司的情況,而不僅僅是“記住了訓(xùn)練集”。


推理階段的實(shí)驗(yàn)中,RETuning 還展示了另一個(gè)有趣的現(xiàn)象:作者嘗試通過“多次思考”來提升預(yù)測(cè)質(zhì)量。具體做法是讓模型在同一問題上生成多次不同的推理過程(即多次采樣),最后再通過多數(shù)投票確定最終答案。結(jié)果發(fā)現(xiàn),當(dāng)生成次數(shù)在 8 到 16 次之間時(shí),預(yù)測(cè)準(zhǔn)確率會(huì)顯著提升;但如果次數(shù)太多(超過 32 次),效果反而會(huì)下降。換句話說,模型多想幾次確實(shí)有助于它更慎重地決策,但思考太多則會(huì)帶來冗余和噪聲,說明推理時(shí)擴(kuò)展存在一個(gè)最佳區(qū)間。


此外,RETuning 在可解釋性方面也有明顯進(jìn)步。與傳統(tǒng)的提示式方法(Prompt-Only)不同,RETuning 模型會(huì)主動(dòng)構(gòu)建一套完整的分析邏輯。它會(huì)先從輸入信息中整理出支持“上漲”的證據(jù)和支持“下跌”的證據(jù),分別進(jìn)行分析,然后再綜合判斷,得出最終預(yù)測(cè)。也就是說,它不僅給出結(jié)果,還會(huì)告訴你“為什么這么想”。


在人類專家評(píng)估中,這種反思式推理輸出被認(rèn)為更有條理、更符合分析師邏輯。相比之下,傳統(tǒng)模型往往只輸出模糊結(jié)論或含糊理由,而 RETuning 的回答更接近人類投資分析報(bào)告的寫法:會(huì)明確說明影響因素、權(quán)衡證據(jù)并形成理性的判斷。研究人員指出,這種變化不僅提升了模型的可信度,也讓 LLM 更適合用于需要解釋性和推理深度的金融場(chǎng)景。

最后,RETuning 模型在多個(gè)指標(biāo)上都優(yōu)于其他對(duì)照模型(如只用提示的模型、僅監(jiān)督微調(diào)的模型、或使用普通強(qiáng)化學(xué)習(xí)的模型),說明它結(jié)合了監(jiān)督微調(diào)、規(guī)則化強(qiáng)化學(xué)習(xí)與推理時(shí)擴(kuò)展三種思路的優(yōu)勢(shì),是一種綜合改進(jìn)方案,而不是單一技巧。


02

不僅是結(jié)果,更是過程

顯著的性能提升外,是十分系統(tǒng)的實(shí)驗(yàn)過程。RETuning 的實(shí)驗(yàn)過程涵蓋了從數(shù)據(jù)構(gòu)建到模型訓(xùn)練、再到驗(yàn)證評(píng)估的完整流程。

首先,研究團(tuán)隊(duì)自己構(gòu)建了一個(gè)叫Fin-2024的大規(guī)模數(shù)據(jù)集,用來模擬真實(shí)的中國 A 股市場(chǎng)。這個(gè)數(shù)據(jù)集非常龐大,包含 5000 多只股票、20 多萬個(gè)樣本。每條樣本都整合了來自多個(gè)渠道的信息,比如新聞報(bào)道、分析師評(píng)論、公司財(cái)報(bào)、量化指標(biāo)、宏觀經(jīng)濟(jì)數(shù)據(jù),還有類似股票的走勢(shì)。然后研究者根據(jù)實(shí)際的漲跌幅給樣本打上標(biāo)簽(漲、跌或持平),平均每條數(shù)據(jù)的文本長(zhǎng)度能達(dá)到 3 萬多個(gè)詞,讓模型能處理非常長(zhǎng)的金融文本。


在此基礎(chǔ)上,研究團(tuán)隊(duì)采用了三個(gè)階段的訓(xùn)練流程。

第一步是監(jiān)督微調(diào)(SFT),這一階段的目標(biāo)是讓模型學(xué)會(huì)“怎么分析”。它不直接預(yù)測(cè),而是先建立分析邏輯:先提出分析原則,再整理出支持和反對(duì)的證據(jù),最后得出結(jié)論。這里模型使用 DeepSeek 系列作為基礎(chǔ)(7B、14B、32B 參數(shù)量的版本都有),通過 LoRA 微調(diào)來節(jié)省顯存。


第二步是基于規(guī)則的強(qiáng)化學(xué)習(xí)(Rule-based RL),這一步是讓模型變得“更聰明”。研究者設(shè)計(jì)了一個(gè)有三項(xiàng)評(píng)分的獎(jiǎng)勵(lì)機(jī)制:格式正確、預(yù)測(cè)準(zhǔn)確、邏輯一致。模型每次生成結(jié)果后,都會(huì)根據(jù)這三項(xiàng)標(biāo)準(zhǔn)被“打分”,然后通過 GRPO 算法(類似 RLHF 但更穩(wěn)定)不斷調(diào)整策略。


為了避免模型在太容易或太難的樣本上浪費(fèi)時(shí)間,他們還引入了課程學(xué)習(xí)(Curriculum Learning)。具體做法是:先讓模型對(duì)每個(gè)樣本預(yù)測(cè) 8 次,根據(jù)預(yù)測(cè)正確的次數(shù)判斷難度,只保留“中等難度”的樣本訓(xùn)練,并且按照從簡(jiǎn)單到復(fù)雜的順序訓(xùn)練,逐步提高模型的推理能力。

最后一步是推理時(shí)擴(kuò)展(Inference-Time Scaling)。這就像是讓模型在做決定前多思考幾次。它會(huì)針對(duì)同一個(gè)問題生成多種不同的推理路徑(比如 8 次、16 次),然后通過多數(shù)投票選出最終預(yù)測(cè)。實(shí)驗(yàn)發(fā)現(xiàn),這種“多想幾次再?zèng)Q定”的策略,確實(shí)能顯著提高預(yù)測(cè)的穩(wěn)定性和準(zhǔn)確率。


整個(gè)訓(xùn)練過程在 32 張 NVIDIA H100 GPU 上完成,SFT 階段用了 Xtuner + DeepSpeed 框架,強(qiáng)化學(xué)習(xí)階段則由 verl 實(shí)現(xiàn) GRPO。訓(xùn)練數(shù)據(jù)是 2024 年 1 月到 11 月的市場(chǎng)數(shù)據(jù),測(cè)試在 2024 年 12 月的樣本上完成,還額外用了 2025 年 6 月的數(shù)據(jù)來測(cè)試模型在未來數(shù)據(jù)上的泛化能力。最終,RETuning 的表現(xiàn)遠(yuǎn)超其他模型,比如 ChatGPT、LLaMA3 和 Mistral,不僅預(yù)測(cè)更準(zhǔn),還能解釋“為什么這么判斷”。


03

仍有挑戰(zhàn),但方向明確

綜上實(shí)驗(yàn)可以看出,RETuning 不光提升了模型的預(yù)測(cè)準(zhǔn)確率,同時(shí)也帶來了較為深層的意義。

首先,它讓大語言模型在金融預(yù)測(cè)中變得更可解釋了。RETuning 引入了“反思式證據(jù)推理”,讓模型不只是給出結(jié)果,而是能先找證據(jù)、再分析、最后下判斷,讓整個(gè)推理過程變得清晰、可信。

其次,研究還驗(yàn)證了推理時(shí)擴(kuò)展這一新思路的可行性。簡(jiǎn)單來說,就是讓模型在回答前多想幾次再?zèng)Q定。實(shí)驗(yàn)發(fā)現(xiàn),適度增加思考次數(shù)能顯著提高準(zhǔn)確率,但思考太多反而會(huì)帶來計(jì)算開銷大、收益遞減的問題。

另外,RETuning 團(tuán)隊(duì)還構(gòu)建了一個(gè)覆蓋 5000 多只股票的大型 A 股數(shù)據(jù)集,為金融類大模型的訓(xùn)練提供了寶貴資源,也為未來在投資情緒分析、經(jīng)濟(jì)新聞理解等方向打下了基礎(chǔ)。

當(dāng)然,這項(xiàng)研究也有一些局限性。模型的表現(xiàn)依然會(huì)受到市場(chǎng)噪聲和非理性波動(dòng)的影響,暫時(shí)還不適合直接用于實(shí)盤交易,而訓(xùn)練和推理階段的算力消耗都比較高,尤其是在強(qiáng)化學(xué)習(xí)和多輪采樣階段。目前的實(shí)驗(yàn)也只驗(yàn)證了 A 股市場(chǎng),未來還需要在不同市場(chǎng)和時(shí)間段上進(jìn)一步測(cè)試。

未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號(hào)名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
突擊執(zhí)行,正義落地

突擊執(zhí)行,正義落地

吃貨的分享
2025-12-24 06:33:29
深夜闞清子登上熱搜,凌晨生女兒爆出惡搞。

深夜闞清子登上熱搜,凌晨生女兒爆出惡搞。

陳意小可愛
2025-12-24 10:30:52
加圖索:自從擔(dān)任意大利主教練以來,我一直在照搬里皮的做法

加圖索:自從擔(dān)任意大利主教練以來,我一直在照搬里皮的做法

懂球帝
2025-12-24 21:42:36
關(guān)系藏不住了!佟麗婭現(xiàn)身言承旭演唱會(huì),才發(fā)現(xiàn)原來一切早有征兆

關(guān)系藏不住了!佟麗婭現(xiàn)身言承旭演唱會(huì),才發(fā)現(xiàn)原來一切早有征兆

蕭栝記錄風(fēng)土人情
2025-12-23 20:02:58
勵(lì)志,曾作為獄警的烏干達(dá)球員奧梅迪在個(gè)人非洲杯首秀完成破門

勵(lì)志,曾作為獄警的烏干達(dá)球員奧梅迪在個(gè)人非洲杯首秀完成破門

懂球帝
2025-12-24 16:00:02
曝北京富豪李春平去世,贈(zèng)送他268億的美國老太身份被扒出

曝北京富豪李春平去世,贈(zèng)送他268億的美國老太身份被扒出

吃瓜盟主
2025-10-30 19:55:14
更炸裂的來了,南博的水太深

更炸裂的來了,南博的水太深

亮見
2025-12-22 14:34:33
張柏芝官司審訊結(jié)束:筆跡專家當(dāng)庭互撕曝“做假文件結(jié)果來年裁定

張柏芝官司審訊結(jié)束:筆跡專家當(dāng)庭互撕曝“做假文件結(jié)果來年裁定

貴州小娟
2025-12-23 15:44:26
中國“神童”田曉菲,13歲被北大破格錄取,28歲嫁給53歲美國老師

中國“神童”田曉菲,13歲被北大破格錄取,28歲嫁給53歲美國老師

南權(quán)先生
2025-12-22 17:00:27
一場(chǎng)打賭,他從南美開始走路回英國!快6萬公里走了27年,終于快到家了....

一場(chǎng)打賭,他從南美開始走路回英國!快6萬公里走了27年,終于快到家了....

英國那些事兒
2025-12-21 23:18:38
過春節(jié)為何沒有以前那種濃濃的年味了?這是我見過最簡(jiǎn)明易懂回答

過春節(jié)為何沒有以前那種濃濃的年味了?這是我見過最簡(jiǎn)明易懂回答

另子維愛讀史
2025-12-22 16:55:55
不得不說,中國國運(yùn)真好!四年的俄烏沖突,徹底把世界格局?jǐn)噥y了

不得不說,中國國運(yùn)真好!四年的俄烏沖突,徹底把世界格局?jǐn)噥y了

扶蘇聊歷史
2025-12-23 14:47:59
闞清子前男友紀(jì)凌塵經(jīng)紀(jì)人緊急辟謠,真是怕啥來啥,太惡毒了!

闞清子前男友紀(jì)凌塵經(jīng)紀(jì)人緊急辟謠,真是怕啥來啥,太惡毒了!

TVB的四小花
2025-12-25 01:01:33
中國女排聯(lián)賽一夜兩場(chǎng)失利,兩大總冠軍輸球,上海女排保持不敗

中國女排聯(lián)賽一夜兩場(chǎng)失利,兩大總冠軍輸球,上海女排保持不敗

七七看一看
2025-12-25 02:26:42
岳母在我家10年,那天聽到她給小姨子打電話:放心,媽都安排好了

岳母在我家10年,那天聽到她給小姨子打電話:放心,媽都安排好了

堇色夜行
2025-12-24 12:04:35
被央視怒批、洋相百出、腹中空空,這幾位“絕望的文盲”憑啥能火

被央視怒批、洋相百出、腹中空空,這幾位“絕望的文盲”憑啥能火

楊仔述
2025-12-17 19:55:55
一個(gè)女嬰之死與一個(gè)系統(tǒng)的失靈

一個(gè)女嬰之死與一個(gè)系統(tǒng)的失靈

難得君
2025-12-23 00:16:47
美國出臺(tái)斬殺線新機(jī)制???

美國出臺(tái)斬殺線新機(jī)制?。?/a>

環(huán)球策論
2025-12-24 22:54:05
提升“性”致力,這5種食物比“偉哥”還管用,家家都有

提升“性”致力,這5種食物比“偉哥”還管用,家家都有

精彩分享快樂
2025-10-09 00:00:03
蘋果折疊屏 iPhone 機(jī)模曝光,新形態(tài)來了

蘋果折疊屏 iPhone 機(jī)模曝光,新形態(tài)來了

全是技能
2025-12-24 15:21:53
2025-12-25 05:24:49
AI科技評(píng)論 incentive-icons
AI科技評(píng)論
點(diǎn)評(píng)學(xué)術(shù),服務(wù)AI
7022文章數(shù) 20717關(guān)注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

幼兒園8人遇難兒童母親:女兒4歲 今年9月入讀

頭條要聞

幼兒園8人遇難兒童母親:女兒4歲 今年9月入讀

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財(cái)經(jīng)要聞

北京進(jìn)一步放松限購 滬深是否會(huì)跟進(jìn)?

汽車要聞

“運(yùn)動(dòng)版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

房產(chǎn)
親子
游戲
旅游
公開課

房產(chǎn)要聞

硬核!央企海口一線江景頂流紅盤,上演超預(yù)期交付!

親子要聞

闞清子被曝早產(chǎn)女嬰,多重畸形搶救無效去世,細(xì)節(jié)曝光嘆真不應(yīng)該

前《DOTA2》選手起訴LGD 稱拖欠近14萬賽事獎(jiǎng)金

旅游要聞

上海藏2800株水上紅杉!免費(fèi)開放,夕陽下美成油畫

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 亚洲色欲色欲大片www无码 | 日韩国产极品无码不卡| 嗯嗯啊啊无码视频| 麻豆国产成人av高清在线观看| 久久无码国产专区精品| 97久久久免费精品按摩| 日韩精品国内国产一区二| 国产美女自慰| 中文字幕 亚洲精品| 色欲网站一区二区三区| 六月天色婷婷| 精品人妻日韩中文字幕| 久久精品欧美黑人99re| 亚洲大成色www永久网站| 久久久亚洲精品av无码| 久久久久资源| 国产精品无码AV| 亚洲国产精品一区二区WWW| 女子午夜成人影院| 又色又爽又高潮免费观看| 国产三级毛片| 中国老太婆bbbbbxxxxx| 人人妻人人操人人夹| 国产性生大片免费观看性欧美 | 调教在线播放黄| 天天澡天天狠天干天| 日韩内射中出| 亚洲av一本二本三本| 亚洲妇女无套内射视频| 欧美一级做a爰片久久高潮| 久久综合九色综合欧洲98| 欧美国产日本图色福利影视| 亚洲精品国产一区二区精华| 国产免费又爽又色又粗视频| 伊人激情av一区二区三区| 色悠久久久久综合网伊| 一边吃奶一边做边爱视频| 亚洲精品中文幕一区二区| 在线A久青草视频在线观看| 久久久久久国产午夜福利乱码电影 | 国产成人精品日本亚洲直接|