夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI答IMO難題坦承“不會”,OpenAI:這就是自我意識

0
分享至

時令 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

這一次,“不會”竟成了大模型的高光時刻。

雖然在IMO第6題上得了零分,OpenAI的金牌模型卻展現(xiàn)了“高智商的誠實”。

正如OpenAI研究員Noam Brown在最新訪談中所揭示的:

  • 當IMO推理模型會在缺乏有效證據(jù)時表示“我不確定”,這會顯著減少隱藏錯誤。



在AI摘下IMO金牌后,OpenAI金牌小分隊成員Alex Wei、Sheryl HsuNoam Brown參與了紅杉資本組織的一場對話,揭秘模型攻克精英數(shù)學難題的底層突破。

有網(wǎng)友幫忙總結(jié)了個太長不看版:

與過去那些“看起來完美,實則錯誤”的幻覺式答案不同,這一代大模型開始學會“承認自己不會”。

它標志著模型正在從胡編亂造的幻覺式回答,轉(zhuǎn)向更加可靠且具有“自我認意識”的全新階段。



三位成員還在這場對話中,分享了更多關(guān)于沖刺IMO的有趣細節(jié)。

IMO金牌模型能承認自己不知道

盡管數(shù)學家與計算機科學家一致認可IMO金牌模型的價值。

但他們常常抱怨,當模型遇到知識盲區(qū)時,它總會輸出一個令人信服但錯誤的答案。

他們不得不耗費大量精力逐行驗算,才能甄別那些幻覺陷阱。



IMO第6題讓大模型全軍覆沒,當然,OpenAI也對其進行了大量計算。

  • 有一個由2025×2025個單位正方形組成的網(wǎng)格。Matilda希望在網(wǎng)格上放置一些矩形圖塊,這些圖塊的大小不同,但每個圖塊的每一條邊都位于網(wǎng)格線上,并且每個單位正方形最多被一個圖塊覆蓋。
  • 網(wǎng)格的每一行和每一列都恰好有一個未被任何瓷磚覆蓋的單位正方形,求出Matilda需要放置的最少瓷磚數(shù)量。

雖然投入海量算力最終僅得到一句“我無法回答”令人有些失望,但Alex Wei表示:

  • 能看到模型避免產(chǎn)生幻覺是很好的。

Noam Brown也對模型的這一轉(zhuǎn)變表示贊賞,“如果它不知道,它就會承認它不知道?!?/p>

這代表模型開始具備“自我意識”。

這種“自我意識”可以幫助模型在面對困難問題時,承認自己的無能為力,而不是生成一個看似合理實則錯誤的解決方案。

有趣的是,在Alex Wei 2024年剛加入OpenAI一周時,Noam Brown就曾問過他,團隊何時能獲得IMO金牌。

當時Alex Wei認為2025年不太可能實現(xiàn)。

但令人驚嘆的是,這個三人團隊僅用了兩月,就完成了他們一直在追求的目標——IMO金牌。

Noam Brown還表示:

  • OpenAI有一個很棒的地方,就是研究人員有很大的自主權(quán)去做他們認為有影響力的研究。

Alex還強調(diào),他們的團隊“真正優(yōu)先考慮通用技術(shù)”,而不是專門開發(fā)用于數(shù)學競賽的系統(tǒng)。

OpenAI IMO金牌核心團隊

OpenAI IMO核心團隊僅由三名研究人員構(gòu)成。



Alex Wei,本碩均就讀于哈佛大學,隨后在加州大學伯克利分校獲得計算機科學博士學位。

Alex還曾在谷歌、微軟和Meta實習,后于2024年1月加入OpenAI,現(xiàn)任研究科學家。他曾是FAIR團隊成員,參與開發(fā)了首個用于外交游戲的人類級人工智能——CICERO。



Sheryl Hsu,畢業(yè)于斯坦福大學計算機科學專業(yè),是斯坦福AI實驗室中IRIS實驗室的研究員,于2025年3月加入OpenAI。



Noam Brown,本科就讀于美國羅格斯新澤西州立大學新布朗斯維克分校,隨后在卡內(nèi)基·梅隆大學獲碩士和博士學位。他曾任職于DeepMind和Meta,于2023年6月加入OpenAI。

參考鏈接:
[1]https://x.com/chatgpt21/status/1950606890758476264
[2]https://www.youtube.com/watch?v=EEIPtofVe2Q

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
金毛咬傷鄰居將要安樂死,臨別舔主人掌心,醫(yī)生一言眾人卻呆住

金毛咬傷鄰居將要安樂死,臨別舔主人掌心,醫(yī)生一言眾人卻呆住

朝暮書屋
2025-07-22 18:13:21
恭喜!李詠女兒官宣戀情!23歲法圖麥曬和男友合影,兩人有夫妻相

恭喜!李詠女兒官宣戀情!23歲法圖麥曬和男友合影,兩人有夫妻相

山河月明史
2025-08-05 00:00:25
過來人告訴你,草原根本沒有詩和遠方,你住上三天就知道了

過來人告訴你,草原根本沒有詩和遠方,你住上三天就知道了

大道微言
2025-07-30 10:49:09
上海一日料店,倆女子誤認為是自助餐,專門撿貴的點,結(jié)賬時4302

上海一日料店,倆女子誤認為是自助餐,專門撿貴的點,結(jié)賬時4302

好賢觀史記
2025-07-19 16:41:42
兒子丟失2年后,央視張澤群發(fā)文:父親去了,兒子丟了,取消罷了

兒子丟失2年后,央視張澤群發(fā)文:父親去了,兒子丟了,取消罷了

公子麥少
2025-06-19 12:51:27
郎平回國參加活動,變化太大認不出,西裝干練,黑框眼鏡顯年輕

郎平回國參加活動,變化太大認不出,西裝干練,黑框眼鏡顯年輕

跑者排球視角
2025-08-04 16:53:22
女籃2人退出,3人或淘汰,宮魯鳴下課?官宣決定,李夢看懂

女籃2人退出,3人或淘汰,宮魯鳴下課?官宣決定,李夢看懂

東球弟
2025-08-04 12:58:19
董璇“下嫁”37歲張維伊,最大的問題不是年紀,而是經(jīng)濟差距

董璇“下嫁”37歲張維伊,最大的問題不是年紀,而是經(jīng)濟差距

小丸子的娛樂圈
2025-08-03 00:00:04
狂妄自大還針對孫穎莎,與王楚欽秘密領(lǐng)證,陳夢差評為何這么多?

狂妄自大還針對孫穎莎,與王楚欽秘密領(lǐng)證,陳夢差評為何這么多?

新語愛八卦
2025-08-04 15:30:47
清華教授發(fā)聲,央媒定性“構(gòu)陷”!武大事件發(fā)酵,楊景媛真要涼了

清華教授發(fā)聲,央媒定性“構(gòu)陷”!武大事件發(fā)酵,楊景媛真要涼了

科學發(fā)掘
2025-08-03 14:21:20
日本和廣東人口同為1.2億多,日本創(chuàng)造4.1萬億GDP,廣東令人意外

日本和廣東人口同為1.2億多,日本創(chuàng)造4.1萬億GDP,廣東令人意外

鯨探所長
2025-07-30 11:33:08
她們一邊做飯一邊賣淫

她們一邊做飯一邊賣淫

法律讀品
2025-05-05 17:24:28
廣東一地司法局副局長被查

廣東一地司法局副局長被查

齊魯壹點
2025-08-04 18:41:25
2天連收三個壞消息,特朗普對中俄態(tài)度變了,謝鋒大使打了個比喻

2天連收三個壞消息,特朗普對中俄態(tài)度變了,謝鋒大使打了個比喻

掌青說歷史
2025-08-03 20:00:19
匈牙利總理:北約東擴是導致俄烏沖突的原因

匈牙利總理:北約東擴是導致俄烏沖突的原因

環(huán)球網(wǎng)資訊
2025-08-03 07:10:42
武大對楊景媛論文不調(diào)查真相疑曝光?教育部曾抽檢論文,質(zhì)量堪憂

武大對楊景媛論文不調(diào)查真相疑曝光?教育部曾抽檢論文,質(zhì)量堪憂

談史論天地
2025-08-02 07:57:52
系好安全帶!大資金明牌了!周二,A股走勢分析

系好安全帶!大資金明牌了!周二,A股走勢分析

郭小凡財經(jīng)
2025-08-04 15:31:10
周恩來祭拜孫中山,得知守靈人20年未發(fā)餉,總理問:他給你多少錢

周恩來祭拜孫中山,得知守靈人20年未發(fā)餉,總理問:他給你多少錢

與史說
2025-07-23 12:12:43
第十五屆全國運動會頒獎禮服公布:兼具旗袍雅致與馬面裙莊重

第十五屆全國運動會頒獎禮服公布:兼具旗袍雅致與馬面裙莊重

懂球帝
2025-08-04 13:47:15
吳艷妮100米欄全國冠軍 直言“這冠軍不值得慶賀”

吳艷妮100米欄全國冠軍 直言“這冠軍不值得慶賀”

大象新聞
2025-08-04 23:54:36
2025-08-05 02:04:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11024文章數(shù) 176218關(guān)注度
往期回顧 全部

科技要聞

奧特曼首曬GPT-5實測!被曝使用老團隊遺產(chǎn)

頭條要聞

騙取公務員身份升至廳級 蔡光輝被逮捕

頭條要聞

騙取公務員身份升至廳級 蔡光輝被逮捕

體育要聞

25歲去沙特,一代金童的迷之隕落

娛樂要聞

娜扎疑似與張云龍分手,經(jīng)紀人刪評論

財經(jīng)要聞

李稻葵呼吁改變理念多發(fā)國債

汽車要聞

大氣外觀混動加持 全新一代現(xiàn)代帕里斯帝亮相

態(tài)度原創(chuàng)

數(shù)碼
本地
時尚
公開課
軍事航空

數(shù)碼要聞

小米開源聲音理解大模型MiDashengLM-7B

本地新聞

換個城市過夏天|躲進雅安過幾天大熊貓式慢生活

提升氣質(zhì)?試試這兩招兒

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗將成立國防委員會以提升武裝部隊戰(zhàn)力

無障礙瀏覽 進入關(guān)懷版 另类春色校园亚洲AV小说| 人妻无码中文字幕av| 69天堂人成无码免费视频| 国产又爽又黄又刺激的视频| 成人毛片小电影| www.com操操操操干干干干干免费视频观看 | 亚洲AAAAAAAAAAA| 亚洲中文字幕无码一区精品 | 精品福利一区二区三区免费视频| 奶头好大揉着好爽视频| 久久人妻A V电影| 男女晚上日日麻批视频| 区一区二性爱视频| 很很色老熟妇| 亚洲伊人久久精品影院| 亚洲夂夂婷婷色拍ww47| 91奇米777| 另类 专区 欧美 制服| 在线观看精品视频网站| 亚洲AV片毛片成人观看| 西西裸体视频| 日韩欧美在线操b| 无码人妻少妇一区二区三区波多| 久久精品国产再热青青青| www.zz17.cn| 国产精品国产乱伦国产AV| 亚洲精品自在在线观看| 国产欧美色一区二区三区在线观看| 久久老子午夜精品无码| 国产成人免费无码视频在线观看M 成人免费区一区二区三区 | 中日韩亚洲人成无码网站| 人人操人爽免费| 久久久久久久9精品视频| 久久精品色妇熟妇丰满人妻50| 国产69精品久久久久777| 午夜精品美女爱做视频| 2022Av天堂在线无码| 免费人成视频网站在线观看18| 色老大久久综合网天天| av资源中文在线天堂| 亚洲成a人片在线播放|