夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5真身曝光,首測編程驚艷全網(wǎng)!一句話秒生游戲,OpenAI雙雄備戰(zhàn)AGI

0
分享至


新智元報道

編輯:桃子

【新智元導(dǎo)讀】GPT-5更近了!今天,神秘模型Horizon Alpha火遍全網(wǎng),編碼首測性能逆天,各種三方基準(zhǔn)實測相繼放出。就在發(fā)布前夕,OpenAI核心大腦專訪坦言模型還有瓶頸,但堅信Scaling Law沒有盡頭。

GPT-5的發(fā)布前兆,愈發(fā)強(qiáng)烈了。

今早,一款神秘模型Horizon Alpha突然上線OpenRouter,各種榜單和測試席卷了全網(wǎng)。


Horizon Alpha模型的上下文為256K,響應(yīng)極速,非常擅長創(chuàng)意寫作。

它還具備了「推理」功能,不過,推理token的預(yù)算是o4-mini的兩倍。


在編程方面,Horizon Alpha堪稱無敵了。

它可以一句話生成「水果忍者」、「外星人抓奶?!沟雀鞣N游戲,能根據(jù)logo圖直出廣告,還能輕而易舉地通過「六邊形物理模擬」測試。





左右滑動查看

在寫作EQ-Bench基準(zhǔn)測試中,Horizon Alpha位列第一,遠(yuǎn)超o3、Gemini 2.5 Pro。




左右滑動查看

更令人驚嘆的是,它竟能在30秒內(nèi),完成20位數(shù)與20位數(shù)的乘法運(yùn)算。


此前被爆料的各種代號模型,比如lobster、zenith、summit等,在多項測試中驚艷了所有人。

種種跡象表明,GPT-5「全家桶」絕對是個地表最強(qiáng)模型。


谷歌收錄GPT-5的OpenAI文檔頁面,目前404

關(guān)于Horizon Alpha的更多細(xì)節(jié),全部濃縮在網(wǎng)友的實測中了。

神秘Horizon Alpha登場,編程強(qiáng)到逆天

目前,在OpenRouter平臺上,即可開啟對Horizon Alpha版本的測試。


傳送門:https://openrouter.ai/chat?room=orc-1754007231-sX8GtgCUyNkHh6O6In2l

在模型推理時,相較于Claude Sonnet 4(60-80 token/s),Horizon Alpha的吞吐量是最快的,達(dá)120個token/s。

吞吐量對比測試,Horizon Alpha是目前最快的。


物理模擬驚艷,秒搭網(wǎng)頁

有網(wǎng)友讓其創(chuàng)建一個功能完整的Windows 95復(fù)古桌面,效果令人驚喜且生成速度極快。


另一個讓小球在多邊形中,模擬物理的測試。

不論是六邊形,還是三角形,即便小球可運(yùn)動的區(qū)間縮小,也不會影響效果。


再上點(diǎn)難度,20個球在旋轉(zhuǎn)的七邊形內(nèi)彈跳。網(wǎng)友驚訝地表示,「這是自己目前見過最出色的版本之一」。


Horizon Alpha能夠在3分48秒中,創(chuàng)建一個展示一系列簡單有趣的瀏覽器小游戲的網(wǎng)頁。

給Horizon Alpha同一個提示,「創(chuàng)建一個視覺上有趣的著色器,可以在 twigl 應(yīng)用中運(yùn)行,讓它看起來像暴風(fēng)雨中的海洋」。

沃頓商學(xué)院CS教授Ethan Mollick驚嘆道,這是迄今為止最好的,而且創(chuàng)建速度非???。



當(dāng)網(wǎng)友要求其「創(chuàng)建一個與遛狗的商業(yè)網(wǎng)站」,Horizon Alpha愛問一大堆需要提前確認(rèn)的問題;Sonnet 4則會直接給出解決方案。


左:Horizon Alpha;右:Claude Sonnet 4

最終,從搭建的效果來看,Horizon Alpha輸出的質(zhì)量高且簡潔。Sonnet 4輸出的更長,內(nèi)容更全面,也更具創(chuàng)意。



上:Horizon Alpha;下:Claude Sonnet 4

Horizon Alpha還會自主搭建一個銀行網(wǎng)站。


設(shè)計一絕,審美感在線

AI大佬Matthew Berman親自測試其SVG創(chuàng)建和UI設(shè)計功能,Horizon Alpha瞬間生成了一張專業(yè)設(shè)計美感的圖。



此前,AI圈大神Simon Willison曾表示,從一張「騎自行車的鵜鶘」就可以看透AI進(jìn)化史。

如今,用Horizon Alpha生成同款SVG測試,是所有模型當(dāng)中最強(qiáng)的那個。


其他一些SVG優(yōu)秀案例。










左右滑動查看

需要注意的是,雖然各種測試表現(xiàn)不凡,不過根據(jù)多方推測,Horizon Alpha可能只是一款小模型。


不管是GPT-5中的哪一款,接下來就坐等OpenAI發(fā)布了。

OpenAI「雙雄」專訪,奧特曼盛贊

就在GPT-5發(fā)布前夕,OpenAI雙雄——首席科學(xué)家Jakub Pachocki和研究主管Mark Chen重磅采訪同時放出了。

這對黃金搭檔,可是研發(fā)GPT-5的「雙巨頭」。

這篇由MIT Technology Review做的獨(dú)家專訪,沒想到深得奧特曼的心。

他對此大加贊賞,「我通常認(rèn)為這類文章說不到點(diǎn)上,但這篇確實抓住了兩人合作精髓」。


能夠得到奧特曼的高度認(rèn)可,究竟講了什么?

OpenAI最佳拍檔

熟悉OpenAI內(nèi)部人員變動的人都知道,Jakub Pachocki和Mark Chen都是后起之秀。

他們風(fēng)格迥異,卻形成了完美的互補(bǔ)。

Mark Chen,曾經(jīng)的華爾街量化交易員,著裝考究,談吐間揮灑自如,可以說與AI毫不搭界。


入職OpenAI后,他迅速成長為DALL·E和GPT-4多模態(tài)能力、Codex背后的關(guān)鍵推手,擅長將復(fù)雜的研究轉(zhuǎn)化為人人可用的產(chǎn)品。

而Jakub Pachocki,一位低調(diào)的理論計算機(jī)科學(xué)家,接替了離職后的Ilya,癡迷于突破AI邏輯與創(chuàng)造力的極限。


關(guān)于內(nèi)部的角色分工,Pachocki是這么說的,「Chen負(fù)責(zé)組建和管理研究團(tuán)隊,而我負(fù)責(zé)設(shè)定研究路線圖,并確立我們長期的技術(shù)愿景」。

他們之間合作模式,可以說是「無縫切換」。

不論技術(shù)難題多么復(fù)雜,Pachocki和Mark總能非常默契,迅速分工合力攻克。

AGI標(biāo)尺,自主時間

當(dāng)前,外界對GPT-5的期待,是一款更強(qiáng)、更快、更全能的巨獸。

采訪中,Mark Chen雖未直面GPT-5問題,卻坦言「我們始終在努力理解深度學(xué)習(xí)的技術(shù)瓶頸,即便是當(dāng)前最強(qiáng)推理模型,也無法有效將知識串聯(lián)起來」。


Pachocki補(bǔ)充道,「我們?nèi)蕴幱谕评矸妒阶铋_端」。

如何讓一款模型進(jìn)行長期的學(xué)習(xí)和探索,并提出新穎的想法,才是至關(guān)重要。

同時,在他們看來,Scaling Law遠(yuǎn)未觸及天花板,通過投入更多計算資源、數(shù)據(jù),模型就會變得越來越好。

被問題如何看待AGI時,Mark Chen提出了一個指標(biāo)——模型能更長時間地自主工作的能力,即「自主時間」。

這個概念簡單卻深刻,它代表著AI在面對復(fù)雜問題時,能持續(xù)取得進(jìn)展,而無需人類干預(yù)的時間長度。

這個愿景,遠(yuǎn)遠(yuǎn)超出了當(dāng)前模型的能力,自主時間僅限于幾分鐘到一小時,遇到陌生場景往往會「卡住」。

數(shù)學(xué)+編程,摘下AI圣杯?

前段時間,OpenAI模型在兩項頂級競賽中取得佳績:

一是,在AtCoder世界巡回賽總決賽中獲第二名;二是,在IMO 2025大賽中奪下金牌。


在AtCoder比賽中,Psyho的勝利展現(xiàn)了人類獨(dú)有的創(chuàng)造性思維,類似AlphaGo當(dāng)年擊敗李世石的圍棋比賽。

Pachocki表示,「我們在這里談?wù)摰氖蔷幊毯蛿?shù)學(xué),但它實際上關(guān)乎創(chuàng)造力,提出新穎的想法,將不同領(lǐng)域的想法聯(lián)系起來」。

在他們二人看來,數(shù)學(xué)和編程是「通用智能」的基石。

參考資料:

https://x.com/karminski3/status/1950987896565182587 https://x.com/chetaslua/status/1950784759799718161

https://www.technologyreview.com/2025/07/31/1120885/the-two-people-shaping-the-future-of-openais-research/


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
為什么說毛澤東的能力強(qiáng)到了令人不可思議的地步?

為什么說毛澤東的能力強(qiáng)到了令人不可思議的地步?

轉(zhuǎn)身微笑梅
2024-07-02 11:44:05
女博士凌晨點(diǎn)外賣,外賣員送達(dá)后立即發(fā)消息:不要開門拿餐

女博士凌晨點(diǎn)外賣,外賣員送達(dá)后立即發(fā)消息:不要開門拿餐

眼淚博物
2025-08-04 18:24:02
新9號?新10號?2大巴西球星強(qiáng)勢崛起,安切洛蒂迎來雪中送炭

新9號?新10號?2大巴西球星強(qiáng)勢崛起,安切洛蒂迎來雪中送炭

蕾爸退休日記
2025-08-06 02:54:21
叛逆期沙溢兒子終于肯剪頭發(fā),剪完長相大變不敢認(rèn),顏值不輸沙溢

叛逆期沙溢兒子終于肯剪頭發(fā),剪完長相大變不敢認(rèn),顏值不輸沙溢

史墨弦
2025-07-08 10:32:00
單依純 現(xiàn)場生圖

單依純 現(xiàn)場生圖

小椰的奶奶
2025-07-24 11:51:54
馬云的預(yù)言或?qū)⒊烧妫瑖鴥?nèi)41.5%的城市家庭,未來可能出現(xiàn)3個麻煩

馬云的預(yù)言或?qū)⒊烧妫瑖鴥?nèi)41.5%的城市家庭,未來可能出現(xiàn)3個麻煩

文史達(dá)觀
2023-09-13 00:34:23
從被罵綠茶到萬人夸,姐啊,終于是苦盡甘來了…

從被罵綠茶到萬人夸,姐啊,終于是苦盡甘來了…

探長影視解說
2025-08-05 15:43:29
宗馥莉教富二代如何敗家

宗馥莉教富二代如何敗家

不正確
2025-08-05 21:15:03
2025年唯一0投檔的大學(xué),降分都無人報考,家長被學(xué)費(fèi)集體勸退!

2025年唯一0投檔的大學(xué),降分都無人報考,家長被學(xué)費(fèi)集體勸退!

教育導(dǎo)向分享
2025-08-05 11:16:46
葉珂再曝猛料!牽扯黃曉明和孩子,這次沒給楊穎留一絲“體面”!

葉珂再曝猛料!牽扯黃曉明和孩子,這次沒給楊穎留一絲“體面”!

林輕吟
2025-08-06 09:12:12
《南京照相館》高葉臉上的性暗示,申奧處理過,但看懂了細(xì)思極恐

《南京照相館》高葉臉上的性暗示,申奧處理過,但看懂了細(xì)思極恐

古木之草記
2025-08-04 18:16:29
青島一海域驚現(xiàn)大鯨鯊,身長八九米!目擊者:可以吹一輩子!

青島一海域驚現(xiàn)大鯨鯊,身長八九米!目擊者:可以吹一輩子!

瀟湘晨報
2025-08-04 23:04:41
中日韓新船訂單差距斷崖:韓291艘,日僅186艘,中國令人意外

中日韓新船訂單差距斷崖:韓291艘,日僅186艘,中國令人意外

溫讀史
2025-04-22 16:56:53
54歲跳水女皇盛贊陳芋汐自律,從不大吃大喝,曾說全紅嬋放飛自我

54歲跳水女皇盛贊陳芋汐自律,從不大吃大喝,曾說全紅嬋放飛自我

米修體育
2025-08-05 12:30:00
周口婦產(chǎn)科主任自殺身亡,家屬稱生前已就患者網(wǎng)暴報警,律師:若網(wǎng)暴屬實或涉以下罪名

周口婦產(chǎn)科主任自殺身亡,家屬稱生前已就患者網(wǎng)暴報警,律師:若網(wǎng)暴屬實或涉以下罪名

瀟湘晨報
2025-08-05 18:04:03
30歲女演員管樂首次公開居家日常,家中的凌亂場面震驚眾人,本人最新回應(yīng)

30歲女演員管樂首次公開居家日常,家中的凌亂場面震驚眾人,本人最新回應(yīng)

魯中晨報
2025-08-04 09:31:02
爆料:釋永信被查驚嚇到這四個“關(guān)聯(lián)人”了,他們惶惶不可終日

爆料:釋永信被查驚嚇到這四個“關(guān)聯(lián)人”了,他們惶惶不可終日

椰青美食分享
2025-08-05 08:38:53
恭喜火箭隊!5000萬巨星化身頂級射手,2K三分能力值第2,僅遜1人

恭喜火箭隊!5000萬巨星化身頂級射手,2K三分能力值第2,僅遜1人

熊哥愛籃球
2025-08-06 11:03:08
李月汝4分8籃板依然不受重用,全場搶下球隊最多的5個進(jìn)攻籃板

李月汝4分8籃板依然不受重用,全場搶下球隊最多的5個進(jìn)攻籃板

雷速體育
2025-08-06 09:07:11
全面復(fù)盤“四渡赤水”:不是蔣介石不會打仗,實在是毛主席太厲害

全面復(fù)盤“四渡赤水”:不是蔣介石不會打仗,實在是毛主席太厲害

知鑒明史
2025-08-05 17:54:53
2025-08-06 11:24:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
13203文章數(shù) 66113關(guān)注度
往期回顧 全部

科技要聞

OpenAI開源!性能超DeepSeek 但"幻覺"頻發(fā)

頭條要聞

特朗普重磅發(fā)聲:未來24小時內(nèi)將"大幅"提高印度關(guān)稅

頭條要聞

特朗普重磅發(fā)聲:未來24小時內(nèi)將"大幅"提高印度關(guān)稅

體育要聞

“孫興慜就是熱刺,熱刺就是孫興慜”

娛樂要聞

陳奕迅自曝壓力太大患焦慮癥

財經(jīng)要聞

王貽芳院士:AI離人腦還有巨大差距

汽車要聞

冰玉白新色/可免費(fèi)選裝 極氪009光輝售78.90萬元起

態(tài)度原創(chuàng)

健康
旅游
手機(jī)
公開課
軍事航空

呼吸科專家破解呼吸道九大謠言!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

手機(jī)要聞

三星顯示推出可折疊顯示屏品牌 MONT FLEX

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

福建艦電磁彈射最新畫面公布 "飛鯊"劃破長空

無障礙瀏覽 進(jìn)入關(guān)懷版 亚洲中文字幕一区二区| 国产女人在线| 国产精品系列播放| 亚洲人成人99网站| 国产精品熟女91免费看| 91色综合综合热五月激情| 人操人人人操| 国产麻花豆剧传媒精品mv在线| 欧洲中文字幕一区二区| 人体美眉馆无码专区| 69综合精品国产二区无码| 久久精品国产AV麻豆五月丁香| 军人自慰网站| 一级片毛片三区| 国产自国产在线观看免费观看| 色欲av熟女| 午夜福利视频99| 欧美色成人综合影院| 电影AV一区二区三区| 麻豆安全免费网址入口| 国产在线你懂得| 东京热app下载安装到手机| 免费看国产精品3a黄的视频| 黑人无码av| 国产精品天干天干在线综合| 日本香港人妻一区二区| 激情综合色综合久久丁香| 国产熟女高潮一区二区三区 - 百度| 国产精品亚洲第一区在线| 呻吟一区二区三区| 亚洲精品午夜无码电影网| 欧洲精品久久| 欧美精品1卡二卡三卡四卡| 91人妻丨PORNY丨绿帽| 成人金品视频| 亚洲色老头网站| 色啦啦俺去啦最新在线官网| 久久久av波多野一区二区| 免费av不卡毛片| 国产特色一区二区三区视频| 97国产精品无码婷婷|