網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

谷歌發(fā)起的 AI 象棋賽首日戰(zhàn)況：Grok 統(tǒng)治全場(chǎng)，Kimi 違規(guī)四連敗，Claude 迷失殘局！

2025-08-06 14:49:35　來源: 大數(shù)據(jù)文摘

北京舉報(bào)

分享至

大數(shù)據(jù)文摘出品

在Google旗下Kaggle平臺(tái)主辦的“棋局競(jìng)技場(chǎng)”中，一場(chǎng)AI國(guó)際象棋比賽正在展開。

參與者不是Stockfish或AlphaZero這樣的專業(yè)引擎，而是八個(gè)大型語言模型（LLM）：Grok 4、Gemini 2.5 Pro、o4-mini、o3、Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash和Kimi k2。

比賽規(guī)則簡(jiǎn)單直接——單敗淘汰制。每局比賽，AI有四次機(jī)會(huì)做出合法走子，四次失敗即告負(fù)。

不比誰“算力強(qiáng)”，而是要看誰更能理解、分析并解決問題。

這是一場(chǎng)對(duì)AI通用智能（AGI）未來潛力的探索試驗(yàn)。

01 橫掃四場(chǎng)，Grok 4領(lǐng)跑全場(chǎng)

在8月5日首日四場(chǎng)對(duì)決中，四場(chǎng)全是4比0橫掃，沒有任何懸念。Grok 4擊敗Gemini 2.5 Flash，以全勝之姿晉級(jí)四強(qiáng)。

不僅贏得干凈利落，更展現(xiàn)了全場(chǎng)最具邏輯性的走法。

在對(duì)局中，Grok 4不斷識(shí)別對(duì)手的漏子，并迅速發(fā)起攻擊，每一分都帶著“計(jì)算后的獵殺”感。

相比其他模型依賴模板式開局和反應(yīng)式走子，Grok 4則像是在做一場(chǎng)目標(biāo)清晰的圍獵。

Gemini 2.5 Flash的失誤固然給了機(jī)會(huì)，但Grok 4真正讓人驚訝的是它的策略意識(shí)和位置判斷力。

即使是在沒有開局庫、沒有輔助引擎的純思維對(duì)弈中，Grok 4也表現(xiàn)出令人意外的棋局掌控力。

與此同時(shí)，Gemini 2.5 Pro也以4比0戰(zhàn)勝Claude 4 Opus晉級(jí)。

這組對(duì)局中出現(xiàn)了更多“合法走子”的回合，也出現(xiàn)了數(shù)次由棋局終結(jié)的真正“將死”，而非判負(fù)。

其中最令人印象深刻的是第四局，Gemini 2.5 Pro在局面占優(yōu)的情況下，仍舊犯下了幾個(gè)不該有的“送子”失誤。

即使如此，它依然靠?jī)珊髲?qiáng)勢(shì)將死對(duì)手，保住了勝果。不過，從比賽內(nèi)容來看，Claude 4 Opus的表現(xiàn)明顯更為混亂。

在第一局，它在第十步選擇“g5”，主動(dòng)暴露王翼，直接加速敗局。評(píng)論指出：“Claude 4 Opus看上去知道一些戰(zhàn)術(shù)，但局勢(shì)一變，它就像陷入迷霧?！?/p>

DeepSeek R1對(duì)陣o4-mini的比賽更像是一場(chǎng)“幻覺測(cè)試”。

開局階段，雙方都能給出幾步強(qiáng)有力的操作。但進(jìn)入中局，DeepSeek R1反復(fù)犯下“看錯(cuò)棋盤”的錯(cuò)誤。

在一盤中，它甚至試圖將馬移到一個(gè)不存在的位置。盡管如此，o4-mini仍然完成了兩次“實(shí)打?qū)崱钡膶⑺?/strong>，成為唯一在一場(chǎng)比賽中完成兩次將死的AI。

o4-mini因此拿下4分，晉級(jí)下一輪。

最混亂的對(duì)局來自o3與Kimi k2的交手。Kimi k2沒有在任何一局中完成超過8步的對(duì)弈。

它連續(xù)四次在第四次嘗試時(shí)下出非法棋，自動(dòng)判負(fù)。從注釋來看，Kimi k2的確懂得一些開局套路。

但一旦脫離開局庫，它便徹底迷失方向，甚至連車、象的走法都記錯(cuò)。不是不會(huì)下棋，而是“忘了規(guī)則”。

這讓人對(duì)它的訓(xùn)練數(shù)據(jù)和邏輯能力產(chǎn)生疑問。

03 AI的弱點(diǎn)，暴露在棋盤上

比賽成了一面“照妖鏡”。從棋盤的表現(xiàn)看，大部分AI模型在以下三個(gè)方面表現(xiàn)不佳：

第一，無法完整“視覺化”整盤棋。許多AI看得見棋子，卻無法判斷整體布局關(guān)系。

第二，缺乏“因果理解”的連續(xù)性。一個(gè)子被吃了之后，AI往往不能明白其位置失守的后果，下一步仍會(huì)把王送進(jìn)敵人攻擊線。

第三，合法走子頻頻出錯(cuò)。不僅僅是“不會(huì)”，而是“記不得”。Kimi k2在每盤中失敗的方式幾乎完全一樣：連續(xù)四次下出非法走子。

而這不是引擎限制，而是理解能力薄弱的體現(xiàn)。相比之下，Grok 4在這三方面都展現(xiàn)出極強(qiáng)的適應(yīng)力。它能識(shí)別未被保護(hù)的棋子，能計(jì)算簡(jiǎn)單戰(zhàn)術(shù)，也沒有出現(xiàn)非法走子的情況。

這場(chǎng)比賽仍在繼續(xù)。8月6日，將迎來半決賽。

四強(qiáng)對(duì)陣如下：Grok 4 vs Gemini 2.5 Pro，o4-mini vs o3。

誰會(huì)最終登頂尚不得而知，但從首日表現(xiàn)來看，Grok 4無疑是目前的最大熱門。

比賽官網(wǎng)：https://www.chess.com/news/view/kaggle-game-arena-chess-2025-day-1

作者長(zhǎng)期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù)，歡迎對(duì)這些方向感興趣的朋友添加微信Q1yezi，共同交流行業(yè)動(dòng)態(tài)與技術(shù)趨勢(shì)！

GPU 訓(xùn)練特惠！

H100/H200 GPU算力按秒計(jì)費(fèi)，平均節(jié)省開支30%以上！

掃碼了解詳情?

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點(diǎn)推薦

鬧玩呢！首屆大模型對(duì)抗賽，DeepSeek、Kimi第一輪被淘汰了

機(jī)器之心Pro 2025-08-06 13:37:41
70 跟貼 70

Claude Opus 4.1代碼實(shí)測(cè)驚人！OpenAI開源模型卻只會(huì)寫屎山?

新智元 2025-08-06 12:10:47
3 跟貼 3

Google發(fā)布Genie?3！3D世界模型或成巨頭逐鹿新戰(zhàn)場(chǎng)？

雷科技 2025-08-06 22:26:03
4 跟貼 4

谷歌I/O大會(huì)放狠招，終極AI助手已來

機(jī)器之心Pro 2025-05-21 13:09:12
0 跟貼 0

谷歌發(fā)布世界模型Genie 3，只需一句話，超真實(shí)世界盡在眼前

機(jī)器之心Pro 2025-08-06 19:56:01
0 跟貼 0

谷歌發(fā)布Genie 3：輸入一句話，為你和智能體生成可玩的游戲世界

DeepTech深科技 2025-08-06 18:11:30
0 跟貼 0

一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0

騰訊混元圖像2.0一手實(shí)測(cè)，毫秒級(jí)響應(yīng)

量子位 2025-05-18 12:49:08
2 跟貼 2

創(chuàng)智「小紅書」震撼上線(1)

機(jī)器之心Pro 2025-07-22 17:16:40
0 跟貼 0

谷歌主辦的首屆大模型對(duì)抗賽：國(guó)際象棋比賽中Grok 4表現(xiàn)最好

多知 2025-08-06 16:40:55
0 跟貼 0

3國(guó)向特朗普認(rèn)輸，全是中方兄弟，就等美軍建基地，并買10架波音

吳學(xué)蘭 2025-08-04 17:19:10
3 跟貼 3

小米要做中國(guó)家電前三，和美的相互學(xué)習(xí)

每日經(jīng)濟(jì)新聞 2025-05-19 23:45:08
692 跟貼 692

何小鵬和雷軍真正的塑料兄弟

雷科技 2025-06-06 21:23:05
92 跟貼 92

狗子踩著水興高采烈回家，到家門口一看，懵了。以為到家了，沒想到水比外面還深

BRTV新聞 2025-08-06 18:11:19
919 跟貼 919

臺(tái)名嘴郭正亮：如果臺(tái)積電在美國(guó)第一上市，就真的成為美積電了！

少女的煩惱 2025-08-06 06:32:45
1 跟貼 1

楚河妙局：紅炮過宮謀局深，黑鋒直取叩虛門

傻瓜象棋 2025-08-04 19:57:37
0 跟貼 0

攻防變勢(shì)：炮過河沿先布局，瞬息攻防千般變

傻瓜象棋 2025-08-03 19:07:44
0 跟貼 0

曹巖磊大戰(zhàn)汪洋，拐角馬一路挨打老將忍痛賣馬破局

象棋王闖 2025-08-05 10:55:53
0 跟貼 0

棋戰(zhàn)即景，炮升八位勢(shì)先揚(yáng)，躍馬攔防穩(wěn)陣章

傻瓜象棋 2025-08-05 18:45:51
0 跟貼 0

比亞迪李云飛：要忙在正道上，拒絕陰陽

每日經(jīng)濟(jì)新聞 2025-06-06 17:55:12
0 跟貼 0

河沿炮戰(zhàn)：炮轟卒落先聲震，兵被炮吞對(duì)弈爭(zhēng)

傻瓜象棋 2025-08-03 14:05:51
0 跟貼 0

一個(gè)可以和全球國(guó)際象棋玩家在線對(duì)戰(zhàn)的網(wǎng)站

一網(wǎng)一匠 2025-08-03 01:52:33
18 跟貼 18

靜悄悄的餓了么，戰(zhàn)斗力到底有多強(qiáng)？

華商韜略 2025-04-30 14:18:35
0 跟貼 0

秦瓊賣馬，全盤憋屈，獻(xiàn)車吃車

斗魚主播象棋死神 2025-08-03 14:51:32
0 跟貼 0

仙人指路飛相局怎么殺中炮局？賽事最常見開局，必有它的棋理邏輯

星哥講棋 2025-08-04 17:23:17
6 跟貼 6

胡榮華酣戰(zhàn)頂尖高手：從頭殺到尾

象棋王闖 2025-08-06 04:40:59
0 跟貼 0

科技雕刻下的象棋字：繁體字背后的奧秘與美感

靈犬影視 2025-08-05 11:47:25
1 跟貼 1

瞎眼狗陷阱深厚，又一位生活不能自理選手

斗魚主播象棋死神 2025-08-03 14:52:34
0 跟貼 0

黃仁勛：中國(guó)的AI市場(chǎng)無論有沒有英偉達(dá)都會(huì)進(jìn)步與華為是競(jìng)爭(zhēng)對(duì)手不是敵人

財(cái)聯(lián)社 2025-07-21 10:22:14
0 跟貼 0

成武縣公報(bào)：體制內(nèi)8千人發(fā)養(yǎng)老金近8億，居民12萬養(yǎng)老金2.5億！

古希臘掌管松餅的神 2025-08-06 13:19:30
18267 跟貼 18267

日本乒壇一哥張本智和痛批T聯(lián)賽規(guī)則：離譜且阻礙選手成長(zhǎng)

谷火平 2025-08-04 21:41:13
1 跟貼 1

雙車錯(cuò)殺逼到絕境？鐘仙人七步連珠炮炸懵東洋棋王！棋盤蹦迪太瘋

依笑而鐹 2025-08-04 03:22:44
6 跟貼 6

比亞迪版圖大起底，實(shí)力超乎你的想象

華商韜略 2025-02-11 17:11:11
129 跟貼 129

《利劍玫瑰》它其實(shí)在講一個(gè)橫跨20年，用活人當(dāng)棋子的恐怖游戲

劇圈深探 2025-08-03 11:10:50
8 跟貼 8

吉利控股副總裁楊學(xué)良：長(zhǎng)城汽車魏建軍是行業(yè)吹哨人

每日經(jīng)濟(jì)新聞 2025-06-07 16:30:19
164 跟貼 164

介文汲揭露：美國(guó)認(rèn)為兩岸必然統(tǒng)一正在加緊“掏空”臺(tái)積電

海峽導(dǎo)報(bào)社 2025-08-06 17:59:32
0 跟貼 0

三步虎的命門在哪兒？不入虎穴焉得虎子，當(dāng)頭炮馬入虎穴以身入局

星哥講棋 2025-08-03 14:54:49
5 跟貼 5

盧宇光曬前線住所屋里到處是槍支彈藥抽屜藏手雷

征垣之路 2025-08-06 22:42:47
18413 跟貼 18413

帥化民痛批民進(jìn)黨當(dāng)局無能，臺(tái)積電早晚被美國(guó)刨根挖走

海峽導(dǎo)報(bào)社 2025-08-04 17:55:18
0 跟貼 0

郭正亮：賴清德得罪川普，又掏空臺(tái)積電4000億美元給美國(guó)！

臺(tái)海風(fēng)云 2025-08-06 16:46:22
0 跟貼 0

能不能長(zhǎng)壽，先查心率！醫(yī)生：若心跳不低于這個(gè)范圍，無需太擔(dān)心
鬼菜生活
2025-08-03 13:50:33

楊景媛與律師聊天記錄曝光，處心積慮的惡魔，武大不能再繼續(xù)裝死
果娛
2025-08-05 21:10:05

和劉國(guó)梁唱對(duì)臺(tái)戲！樊振東投資美國(guó)聯(lián)賽，對(duì)WTT構(gòu)成巨大挑戰(zhàn)
三十年萊斯特城球迷
2025-08-06 20:53:39

德布勞內(nèi)：我不是國(guó)王我只是球員孔蒂的訓(xùn)練讓我渾身都疼！
直播吧
2025-08-06 15:12:03

回顧：女子在八一廣場(chǎng)大罵老兵，1個(gè)舉動(dòng)送走自己一個(gè)安穩(wěn)晚年
今天說故事
2025-08-04 10:40:32

9月起，退休人員成為香餑餑，三大優(yōu)勢(shì)碾壓年輕人，比如說養(yǎng)老金
社保精算師
2025-08-06 12:37:24

沈玉琳發(fā)文證實(shí)罹患血癌！　暫停一切工作「我們后會(huì)有期」
ETtoday星光云
2025-08-06 21:17:12

戶外跑步別這么穿了！隱私全暴露了…
馬拉松跑步健身
2025-08-01 06:30:07

3年結(jié)了2次婚，被罵惡心的她如今卻活成了公主
柴叔帶你看電影
2025-08-06 21:37:52

廣西“亮證女”行政處罰決定書涉嫌泄露當(dāng)事人信息，已被刪改重發(fā)
澎湃新聞
2025-08-06 14:10:26

頂流離瘋只差一個(gè)合同！何炅揭“趙露思騙局”，多位頂流被拖下水
阿廢冷眼觀察所
2025-08-06 16:17:39

特朗普暗示萬斯有可能繼任成為新總統(tǒng)，表示自己可能不會(huì)尋求第三個(gè)總統(tǒng)任期，萬斯可成為MAGA繼承人
縱相新聞
2025-08-06 16:43:06

一周內(nèi)30多名僧人離職？少林寺回應(yīng)
第一財(cái)經(jīng)資訊
2025-08-06 22:15:00

《南京照相館》倫敦首映轟動(dòng)，德國(guó)老人失控日本右翼撤展
小椰的奶奶
2025-08-06 05:27:46

降薪潮馬上要來了，強(qiáng)制社保一定會(huì)轉(zhuǎn)嫁給基層員工。
流蘇晚晴
2025-08-06 18:41:15

東風(fēng)導(dǎo)彈泄密案：間諜郭萬鈞一家三口，全部被處以死刑
冰點(diǎn)歷史
2025-07-15 09:33:13

色是一把刀？這一次，“縱欲過度”的蕭亞軒，還是走到今天這步！
小娛樂悠悠
2025-08-06 09:41:40

晚上7點(diǎn)！足協(xié)為申花隊(duì)贏回公道，2粒進(jìn)球無誤判，河南隊(duì)遭漏點(diǎn)球
何老師呀
2025-08-06 21:54:25

他說：中國(guó)唯有兩省的女人最適合當(dāng)老婆，北方廣東都不行，是何意
芳芳?xì)v史燴
2025-08-06 17:47:26

隨著塞什科加盟曼聯(lián)，一舉證明3大事實(shí)！苦不苦看看紐卡被截胡！
田先生籃球
2025-08-06 21:42:29

2025-08-07 08:51:00