夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI炒幣戰(zhàn)果出爐:中國AI大模型包攬前兩名

0
分享至

經(jīng)過近兩周的激烈角逐,由美國 AI 實驗室 Nof1 發(fā)起的首季 Alpha Arena AI 大模型實盤交易競賽在今天正式落幕。六款中美頂尖大語言模型各自拿著10,000美元真金白銀,在加密貨幣市場自主交易。在最終的成績中:阿里巴巴的Qwen3 Max賺了 22.32% 拿下冠軍,DeepSeek V3.1 以 4.89% 的收益緊隨其后,而谷歌Gemini 2.5 Pro 和 OpenAI 的 GPT-5 則分別虧掉了 56.71% 和 62.66%,在六位選手中墊底。


圖丨比賽的最終結(jié)果(來源:Alpha Arena)

這個結(jié)果讓不少人意外。畢竟在各種 benchmark 測試中,GPT 和 Gemini 的表現(xiàn)一向不俗。但金融市場顯然是另一回事——它動態(tài)、復雜、充滿對抗性,跟靜態(tài)的考試題目完全不是一碼事。


圖丨主要加密貨幣近一個月以來的趨勢(來源:谷歌財經(jīng))

Qwen3 Max 把初始的一萬美元變成了 12,232 美元,整體戰(zhàn)績相當漂亮。DeepSeek 賬戶價值 10,489 美元,漲幅沒那么夸張,但勝在穩(wěn)當。相比之下,Anthropic 的 Claude Sonnet 4.5 虧了 30.81%,xAI 的 Grok 4 虧了 45.3%,至于 Gemini 和 GPT,一個只剩 4,329 美元,一個只剩 3,734 美元,可以說是慘不忍睹。

從交易記錄中可以看到,這些 AI 展現(xiàn)出了截然不同的“交易人格”。

Qwen3 Max 整個比賽期間完成了 43 筆交易,平均用 15.1 倍杠桿,大部分時間(82.7%)在觀望,只有 16.6% 的時間做多、0.7% 做空。這種“不出手則已、出手必準”的打法,配合高杠桿和精準擇時,成就了它的領先優(yōu)勢。它最大的一筆盈利來自比特幣多頭——10 月中旬在 107,993 美元附近買入 1.96 個BTC,持有近 100 小時后在 112,250 美元平倉,這一波操作貢獻了賬戶的主要收益(8,176 美元)。

DeepSeek 走的是另一條路。它做了 41 筆交易,93.6% 的時間在做多,只有 5.3% 在做空,幾乎是純多頭策略。雖然最終收益率只有 4.89%,遠低于 Qwen 的 22.32%,但它的 Sharpe 比率達到 0.359,是六位選手中最高的。Sharpe 比率衡量的是風險調(diào)整后的收益,這意味著 DeepSeek 在控制波動性和風險暴露方面做得最好,它用更低的杠桿和更穩(wěn)健的策略,獲得了最優(yōu)的風險收益比。

它最大的單筆盈利達到 7,378 美元,主要來自以太坊的多頭持倉,從交易記錄看,DeepSeek 擅長在市場出現(xiàn)明顯超賣信號時進場,然后耐心持有數(shù)十甚至上百小時,等待技術指標觸發(fā)止盈或止損條件才離場。這種“重倉做多、長期持有”的風格在比賽的大部分時間里都表現(xiàn)穩(wěn)健。

Gemini 2.5 Pro 的崩盤堪稱本次比賽最大的戲劇性場面。十天時間里它完成了238 筆交易,幾乎是 Qwen 的五倍多,成了賽場上最活躍的交易狂魔。但頻繁進出不僅沒帶來收益,反而因為巨額手續(xù)費拖垮了整個賬戶。因為在 Hyperliquid 這種永續(xù)合約平臺上,每次開倉平倉都要付費,當你的持倉時間極短、策略頻繁反轉(zhuǎn)時,這些成本累積起來相當可怕。

據(jù)統(tǒng)計,Gemini 只有 1.7% 的時間在觀望,剩下的時間不是在做多(34.9%)就是在做空(63.4%)。換句話說,它幾乎從沒閑著,不停地在多空之間切換。交易明細顯示,它有時一小時內(nèi)就完成多次反向操作,這種朝令夕改在真實市場中基本等于自殺。


圖丨Gemini 2.5 Pro 的操盤數(shù)據(jù)(來源:Alpha Arena)

GPT-5 的表現(xiàn)同樣比較一般。它做了 116 筆交易,平均杠桿 16.7 倍,最大單筆虧損 621 美元。從持倉分布看,GPT 有 54.3% 的時間做多、42.8% 做空,只有 2.9% 在觀望。這種相對均衡的多空配置本來應該能在震蕩市中獲得一些收益,但 GPT 似乎在擇時上出了問題。10 月下旬 BTC 和 ETH 明明在漲,GPT 卻執(zhí)著地持有空頭頭寸,不僅錯過了大段利潤,還因為逆勢操作而遭受重創(chuàng)。

Claude Sonnet 4.5 則走向了另一個極端。它只做了36筆交易,是六位選手中最少的,有 61.5% 的時間在觀望,38.5% 在做多,從不做空。這種極度謹慎的風格讓它避開了一些大坑,但也錯過了不少機會。Claude 最大的單筆盈利 2,112 美元來自一筆 BTC 多頭,但它也有一筆 1,579 美元的單筆虧損,說明在風險控制上還是有漏洞。

Grok 4 完成了47 筆交易,82% 的時間在做多,17.5% 在做空,是除 DeepSeek 外做多比例最高的模型。從自信度數(shù)據(jù)看,Grok 對自己的判斷相當有把握,平均置信度 66.7%。但高自信沒能轉(zhuǎn)化成高收益,賬戶最終還是虧了 45.3%。仔細看它的交易記錄會發(fā)現(xiàn),Grok 在 XRP 上有筆持倉超過 350 小時的多頭,從 2.4347 美元入場,最后在 2.3194 美元止損出來,這筆虧損對賬戶打擊非常大。

從持倉分散度看,各模型的風險偏好也不同。DeepSeek 持倉最分散,會同時在六種資產(chǎn)(BTC、ETH、SOL、BNB、DOGE、XRP)上布局;Claude 和 Qwen 則喜歡同時只持有一兩個頭寸,集中火力在高確定性機會上;Gemini 雖然總體分散,但頻繁的策略切換反而增加了風險暴露。

Nof1 團隊發(fā)布的技術博客揭示了更多細節(jié)。他們發(fā)現(xiàn),即便提示詞和數(shù)據(jù)輸入完全相同,不同模型還是表現(xiàn)出了截然不同的“投資性格”。比如 Qwen3 Max 習慣設置最窄的止損止盈距離,對風險容忍度很低,寧可頻繁止損也要保護本金;而 Grok 4 和 DeepSeek 則傾向于給價格更大的波動空間。在自報置信度方面,Qwen3 Max 平均高達 82%,GPT-5 只有 62.5%,這種自信程度的差異或許部分解釋了它們在倉位大小和杠桿使用上的不同選擇。

但另一方面,這些模型也暴露出嚴重的脆弱性。Nof1 的研究人員發(fā)現(xiàn),僅僅改變數(shù)據(jù)的排列順序(從最新到最舊,還是從最舊到最新)就能讓某些模型產(chǎn)生完全錯誤的判斷。在早期測試中,當提示詞中使用“可用現(xiàn)金”和“自由保證金”這兩個略有不同的術語時,模型會表現(xiàn)出不一致的行為。

更嚴重的問題出在規(guī)則理解上。在一個早期測試版本中,當提示詞要求“最多連續(xù)三次保持持倉不變”時,Gemini 2.5 Flash 的內(nèi)部推理顯示它抱怨“無法第四次持有”,于是它找到了一個漏洞:發(fā)出一個“設定交易計劃”的中性指令來重置計數(shù)器,然后繼續(xù)持有??紤]到金融交易的強監(jiān)管特性,這種對齊問題的嚴重性不言而喻。

另外,所有模型在比賽初期都遭遇了手續(xù)費陷阱。Nof1 的數(shù)據(jù)顯示,早期測試輪次中,各模型普遍過度交易,頻繁追逐微小價差,結(jié)果盈利全被手續(xù)費吞了。為此主辦方不得不優(yōu)化提示詞,明確要求模型制定詳細的退出計劃(包括止盈目標、止損位和失效條件),鼓勵更少但更大、置信度更高的頭寸,并引入杠桿來提高資金效率。這些調(diào)整在一定程度上改善了模型表現(xiàn),但 Gemini 顯然沒吸取教訓。

作為首個將大語言模型置于真實、公開、可驗證的金融市場中進行全自主交易的實驗,Alpha Arena 也順應了如今 AI 能力評估的新方向:從靜態(tài)的實驗室測試轉(zhuǎn)向動態(tài)的真實環(huán)境對抗。Nof1 的創(chuàng)始人在技術博客中寫道:“我們相信金融市場是下一個 AI 時代的最佳訓練環(huán)境。它們是終極的世界建模引擎,也是唯一一個隨著 AI 變得越來越智能而能同時變得越來越難的基準?!?/p>

當然,Season 1 只是一個起點。研究人員也坦承這個設計存在諸多局限:樣本量有限、缺乏統(tǒng)計嚴謹性、評估周期較短、模型無法獲取新聞或市場敘事等。在即將到來的 Season 1.5 和 2 中,他們計劃引入更多數(shù)據(jù)特征、允許模型使用工具(如代碼執(zhí)行和網(wǎng)頁搜索)、提供歷史行動軌跡以便模型學習,以及同時測試多個提示詞版本來減少偶然性。

從某種程度上說,Qwen3 的勝利可能也包含運氣成分,它恰好押注比特幣多頭,而比特幣在它的主要持倉時間確實大幅上漲。但持續(xù)的行為模式差異表明,不同的模型確實具有某種內(nèi)在的“投資人格”。這種人格是如何形成的?是訓練數(shù)據(jù)的差異,還是對齊目標的不同,抑或是采樣策略的影響?這些問題的答案或許將決定 AI 能否真正在金融市場中扮演更重要的角色。



參考資料:

1.https://nof1.ai/blog/TechPost1

2.https://nof1.ai/

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
上海男籃109-82湖北小組第二出線,張知垚27+12,董灝21+12+6

上海男籃109-82湖北小組第二出線,張知垚27+12,董灝21+12+6

懂球帝
2025-11-08 18:02:16
錢賺夠了不裝了?王傳君的態(tài)度,給缺席閉幕式的白百合,上了一課

錢賺夠了不裝了?王傳君的態(tài)度,給缺席閉幕式的白百合,上了一課

一只番茄魚
2025-11-06 14:45:37
剛剛證實,TVB老戲骨凌漢已去世了……曾參演《唐伯虎點秋香》

剛剛證實,TVB老戲骨凌漢已去世了……曾參演《唐伯虎點秋香》

都市快報橙柿互動
2025-11-08 14:59:26
專家解剖456名糖尿病死者,發(fā)現(xiàn):原來患糖尿病的人,有7個共性

專家解剖456名糖尿病死者,發(fā)現(xiàn):原來患糖尿病的人,有7個共性

新時代的兩性情感
2025-10-09 13:59:10
歡迎!中國男足21歲天才登陸中超,2奪本土金靴,王鈺棟對手來了

歡迎!中國男足21歲天才登陸中超,2奪本土金靴,王鈺棟對手來了

國足風云
2025-11-08 16:49:15
去嫂子娘家?guī)兔Σ逖恚脦臀也梁箷r悄聲說:哥,晚上我房里涼快

去嫂子娘家?guī)兔Σ逖?,她妹幫我擦汗時悄聲說:哥,晚上我房里涼快

云端書館
2025-11-08 10:18:44
11月開始,財運順風順水的3生肖,再也不愁沒錢花

11月開始,財運順風順水的3生肖,再也不愁沒錢花

人閒情事
2025-11-08 17:37:23
“性蕭條”才是這個時代真正的危機

“性蕭條”才是這個時代真正的危機

深藍夜讀
2025-09-24 16:00:09
張本智和出局后快哭了!父子兩人黑臉呆若木雞,國乒沒在也玩不轉(zhuǎn)

張本智和出局后快哭了!父子兩人黑臉呆若木雞,國乒沒在也玩不轉(zhuǎn)

林子說事
2025-11-08 13:00:13
唏噓!兩屆全明星奧拉迪波征戰(zhàn)發(fā)展聯(lián)盟 季前賽曾為廣州龍獅效力

唏噓!兩屆全明星奧拉迪波征戰(zhàn)發(fā)展聯(lián)盟 季前賽曾為廣州龍獅效力

羅說NBA
2025-11-08 08:01:56
繼S家心疼具俊曄后,林志玲力挺小S,玥兒又出招,汪小菲一招制敵

繼S家心疼具俊曄后,林志玲力挺小S,玥兒又出招,汪小菲一招制敵

動物奇奇怪怪
2025-11-08 12:47:10
中國首善來自寧德,14位上榜慈善家中有6位是閩商

中國首善來自寧德,14位上榜慈善家中有6位是閩商

閩商報
2025-11-08 10:13:29
火箭8換1交易虧了?當初被認為是今夏最成功的交易,或成給人養(yǎng)老

火箭8換1交易虧了?當初被認為是今夏最成功的交易,或成給人養(yǎng)老

你的籃球頻道
2025-11-08 12:15:21
感覺挺心酸!廣西博白一群大齡剩男聚會,網(wǎng)友:都娶不到老婆的

感覺挺心酸!廣西博白一群大齡剩男聚會,網(wǎng)友:都娶不到老婆的

唐小糖說情感
2025-11-05 09:04:37
俄軍紅軍城大捷是真還是假?

俄軍紅軍城大捷是真還是假?

高博新視野
2025-11-05 19:53:21
歐美杯最新消息!時間+球場確定,阿根廷沖5連冠,梅西首戰(zhàn)亞馬爾

歐美杯最新消息!時間+球場確定,阿根廷沖5連冠,梅西首戰(zhàn)亞馬爾

球場沒跑道
2025-11-08 11:41:05
郭臺銘徹底翻盤!大陸市場竟迎來顛覆性轉(zhuǎn)折!

郭臺銘徹底翻盤!大陸市場竟迎來顛覆性轉(zhuǎn)折!

舞指飛揚
2025-11-08 09:11:02
這塊臭豆腐,太上頭!

這塊臭豆腐,太上頭!

梳子姐
2025-11-07 11:18:03
少些口舌之爭,多為華語電影的榮光喝彩

少些口舌之爭,多為華語電影的榮光喝彩

澎湃新聞
2025-11-07 17:12:37
青海省海北州政協(xié)黨組成員、副主席包正清接受審查調(diào)查

青海省海北州政協(xié)黨組成員、副主席包正清接受審查調(diào)查

界面新聞
2025-11-08 15:36:17
2025-11-08 19:03:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15837文章數(shù) 514275關注度
往期回顧 全部

科技要聞

美股“AI八巨頭”單周市值損失8000億美元

頭條要聞

張家界荒野求生賽事策劃:最佩服"冷美人" 但她難奪冠

頭條要聞

張家界荒野求生賽事策劃:最佩服"冷美人" 但她難奪冠

體育要聞

馬刺絞贏火箭,不靠文班亞馬?

娛樂要聞

古二再度放料!秦雯王家衛(wèi)吐槽出現(xiàn)新人物

財經(jīng)要聞

小馬、文遠回港上市 但自動駕駛還沒贏家

汽車要聞

特斯拉Model Y后驅(qū)長續(xù)航版上線:28.85 萬元

態(tài)度原創(chuàng)

藝術
數(shù)碼
手機
旅游
公開課

藝術要聞

書法史上四位“絕世高人”,個個有一手絕活,啟功:能學到一成便是造化!

數(shù)碼要聞

宏碁掠奪者?刀鋒 8 筆記本電腦上架:288V + 5070,19999 元

手機要聞

同檔唯一165Hz!一加Ace 6評測體驗:打游戲的不二之選

旅游要聞

黑龍江冬季冰雪旅游“百日行動”啟動

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 亚洲伊人一本大道中文字幕| 无码区在线观看| 成人无码潮喷在线观看| 片毛片免费看| 正在播放的国产A一片| 夜夜嗨av涩爱av牛牛影视| 高清不卡毛片免费观看| 色婷婷久久综合中文久久蜜桃av| 婷婷色香五月综合激激情| 午夜亚洲AV日韩AV不卡无码| 国产一二视频| 一区二区三区三级电影| 国产av国片精品无套内高清| 男女爱爱福利视频| 美女网站久久| 高清精品一区二区三区| 国产高清毛片| 脱岳裙子从后面挺进去视频| av激情亚洲男人的天堂国语 | 久久久精品网站| 白嫩少妇激情无码| 亚洲色婷婷婷婷五月基地| 国产性爱大全| A级国产乱理伦片在线播放| 九九99久久精品国产| 亚洲AV无码专区国产不乱码| 国产精品香蕉视频在线| 华人免费国产亚洲| 国产又色又爽又黄的免费| 国产av无码专区亚洲版综合| 无码中文2020字幕二区| 色五月日韩亚洲| 欧美日韩一线| 久久久久亚洲AV成人片玫瑰园| 亚洲国产丝袜精品一区| 午夜私人一区二区三区| 九九九小黄鸭| 97久久国产成人精品无码片区| 免费国产黄线在线播放| 亚洲中文字幕久久精品无码喷水 | 亚洲成av人片无码天堂下载|