IT之家 8 月 14 日消息,在上周舉行的“人工智能國際象棋表演賽”中,OpenAI 的 o3 模型以出色的表現(xiàn)贏得了冠軍,在決賽中戰(zhàn)勝了 xAI 的 Grok 4。此次比賽在谷歌旗下的 Kaggle 平臺(tái)舉辦,共有八個(gè) AI 模型參與角逐,經(jīng)過三天的淘汰賽,最終決出冠亞季軍。
比賽規(guī)則要求 AI 模型在未經(jīng)過專門訓(xùn)練的情況下參賽,僅能在賽前從互聯(lián)網(wǎng)上獲取國際象棋相關(guān)知識(shí)。在決賽中,o3 以 4-0 的比分橫掃 Grok 4,且在三場比賽中均以 4-0 的比分獲勝,還在半決賽中輕松擊敗了同門的 o4 mini。
相比之下,Grok 4 在決賽前也展現(xiàn)了強(qiáng)大的實(shí)力,先后淘汰了谷歌的 Gemini 2.5 Flash 和 Gemini 2.5 Pro。當(dāng)時(shí),xAI 的創(chuàng)始人埃隆?馬斯克曾表示,xAI “基本沒在象棋上花功夫”。
IT之家注意到,國際象棋對弈網(wǎng)站 Chess.com 的總編輯 Pedro Pinhata 指出,Grok 4 在半決賽前似乎無人能敵,但在最后一天的比賽中,其優(yōu)勢被打破。國際象棋大師中村光在直播中評論稱,Grok 4 在比賽中犯了很多錯(cuò)誤,而 OpenAI 的 o3 則表現(xiàn)出色。另一位解說嘉賓、國際棋聯(lián)世界排名第一的芒努斯?卡爾森表示,決賽中兩個(gè) AI 的水平相當(dāng)于剛學(xué)會(huì)規(guī)則的普通棋手,大約 800ELO(等級分)。他指出,這些模型在計(jì)算吃子方面表現(xiàn)出色,但在將死對手方面則顯得不足,更像“擅長收集食材,卻不會(huì)做飯”。
值得注意的是,此前在國際象棋領(lǐng)域,專為該棋類設(shè)計(jì)的人工智能系統(tǒng)表現(xiàn)更為出色。例如,2019 年擊敗韓國棋手李世石的 AlphaGo 和上世紀(jì)擊敗國際象棋大師加里?卡斯帕羅夫的超級電腦“深藍(lán)”,都是為特定棋類定制的程序。今年早些時(shí)候,在國際象棋大師 Levy Rozman 舉辦的錦標(biāo)賽中,Grok 和 ChatGPT 均輸給了專為國際象棋設(shè)計(jì)的人工智能系統(tǒng) Stockfish。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.