夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

谷歌發(fā)布Gemini 2.5 Deep Think:月費250美元會員可用

0
分享至
核心提示
  • 01 谷歌DeepMind正式推出其迄今最先進(jìn)的AI推理模型Gemini 2.5 Deep Think。該模型是谷歌首個公開發(fā)布的多智能體系統(tǒng),能同時探索并權(quán)衡多種解題路徑以選出最優(yōu)答案。訂閱了Ultra服務(wù)的用戶可率先體驗。
  • 02 谷歌稱,該模型在HLE和高難度編程競賽等基準(zhǔn)測試中,表現(xiàn)均超越了OpenAI、xAI和Anthropic的同類模型。公司認(rèn)為其有望助力科研人員,并“有可能加速科學(xué)發(fā)現(xiàn)的進(jìn)程”。因運(yùn)營成本高昂,這類系統(tǒng)或?qū)⒊蔀轫敿壐顿M訂閱的專屬功能。
  • 03 多智能體系統(tǒng)已成為業(yè)界前沿探索方向。xAI、OpenAI、Anthropic等主要競爭對手近期均已推出或被披露正在采用類似的多智能體架構(gòu)。

8月2日消息,據(jù)TechCrunch報道,谷歌DeepMind正式推出Gemini 2.5 Deep Think。據(jù)公司介紹,這是其迄今為止最先進(jìn)的AI推理模型,能夠在回答問題時同時探索并權(quán)衡多種解題路徑,進(jìn)而選出最優(yōu)答案。

從本周五起,訂閱了每月250美元Ultra訂閱服務(wù)的用戶,將可在Gemini應(yīng)用中率先體驗Gemini 2.5 Deep Think。

Gemini 2.5 Deep Think最早亮相于2025年的谷歌I/O大會,是谷歌公開發(fā)布的首個多智能體(multi-agent)模型。這類系統(tǒng)可同時生成多個AI智能體,并行處理同一問題,雖然對算力資源的消耗遠(yuǎn)超單一智能體,但通常能獲得更優(yōu)的解答。

谷歌曾以Gemini 2.5 Deep Think的一個變體,在今年的國際數(shù)學(xué)奧林匹克(IMO)上斬獲金牌。

與此同時,谷歌還宣布向部分經(jīng)過篩選的數(shù)學(xué)家和學(xué)者群體,開放其在IMO賽事中使用的那一版模型。公司表示,這一AI模型完成一次推理“需要數(shù)小時”,遠(yuǎn)超絕大多數(shù)面向消費級用戶的AI模型(通常僅需數(shù)秒或數(shù)分鐘)。谷歌希望該IMO模型能助力科研,并收集反饋,以便進(jìn)一步優(yōu)化多智能體系統(tǒng)在學(xué)術(shù)場景下的應(yīng)用。

谷歌指出,相較于I/O大會上首次亮相的版本,如今的Gemini 2.5 Deep Think已有顯著提升。公司還宣稱已開發(fā)出“全新的強(qiáng)化學(xué)習(xí)技術(shù)”,以促使Gemini 2.5 Deep Think更高效地利用其推理路徑。

谷歌在一篇博文中表示:“Deep Think能幫助用戶解決需要創(chuàng)造力、戰(zhàn)略規(guī)劃和逐步改進(jìn)的問題?!?/p>

公司稱,Gemini 2.5 Deep Think在“人類終極大考”(Humanity’s Last Exam,HLE)上取得了頂尖水平(state-of-the-art)的表現(xiàn)。HLE是一項極具挑戰(zhàn)性的測試,旨在評估AI回答數(shù)千道來自數(shù)學(xué)、人文、科學(xué)等領(lǐng)域眾包問題的能力。谷歌稱,其模型在不借助外部工具的情況下,HLE得分為34.8%,而xAI的Grok 4得分為25.4%,OpenAI的o3得分為20.3%。

此外,Gemini 2.5 Deep Think在LiveCodeBench 6這一高難度編程競賽測試中,表現(xiàn)同樣超越了OpenAI、xAI和Anthropic的AI模型。谷歌模型的得分為87.6%,Grok 4為79%,OpenAI的o3為72%。

Gemini 2.5 Deep Think能自動調(diào)用代碼執(zhí)行、谷歌搜索等工具,并且公司表示,該模型生成的回應(yīng)“篇幅遠(yuǎn)超傳統(tǒng)AI模型”。

在谷歌的內(nèi)部測試中,相較于其他AI模型,Gemini 2.5 Deep Think完成的網(wǎng)頁開發(fā)任務(wù)在細(xì)節(jié)豐富度和視覺美感上均更勝一籌。公司認(rèn)為,該模型有望為科研人員提供助力,“并有可能加速科學(xué)發(fā)現(xiàn)的進(jìn)程”。

目前,多智能體系統(tǒng)已成為業(yè)界前沿的探索方向。埃隆·馬斯克(Elon Musk)旗下的xAI近期也推出了多智能體系統(tǒng)Grok 4 Heavy,據(jù)稱在多項基準(zhǔn)測試中取得領(lǐng)先成績。OpenAI研究員諾姆·布朗(Noam Brown)在播客中透露,公司今年在IMO上獲得金牌所用的未公開模型,同樣采用了多智能體架構(gòu)。與此同時,Anthropic旗下能生成詳盡研究簡報的工具Research agent,也同樣依托多智能體系統(tǒng)提供支持。

盡管多智能體系統(tǒng)表現(xiàn)突出,但其運(yùn)營成本甚至高于傳統(tǒng)AI模型。這也意味著,科技公司很可能會將這類高成本的系統(tǒng),作為其頂級付費訂閱服務(wù)的一項專屬功能,正如xAI和谷歌目前所做的那樣。

在接下來的幾周,谷歌計劃通過Gemini API,邀請一小批測試者體驗Gemini 2.5 Deep Think。公司表示,此舉是希望進(jìn)一步了解開發(fā)者和企業(yè)用戶可能會如何利用其多智能體系統(tǒng)。(易句)

(本文由AI翻譯,網(wǎng)易編輯負(fù)責(zé)校對)

相關(guān)推薦
熱點推薦
軌道交通隱性債務(wù)首次被財政部通報:成都國企違規(guī)代繳81.74億

軌道交通隱性債務(wù)首次被財政部通報:成都國企違規(guī)代繳81.74億

軌道世界
2025-08-01 17:25:23
我61歲,退休金6800存款60萬,血的教訓(xùn)告訴我,不要跟誰再續(xù)前緣

我61歲,退休金6800存款60萬,血的教訓(xùn)告訴我,不要跟誰再續(xù)前緣

堇色夜行
2025-01-16 19:24:12
范冰冰和范丞丞的大瓜,水有點深.....

范冰冰和范丞丞的大瓜,水有點深.....

營銷報
2025-08-01 10:37:01
首度披露,黑龍江省委統(tǒng)戰(zhàn)部原副部長被開除黨籍

首度披露,黑龍江省委統(tǒng)戰(zhàn)部原副部長被開除黨籍

中國青年報
2025-08-02 23:23:13
沒想到全是假的,馬斯克揭開美國遮羞布,外媒:真相遠(yuǎn)比這更惡劣

沒想到全是假的,馬斯克揭開美國遮羞布,外媒:真相遠(yuǎn)比這更惡劣

鐵錘簡科
2025-08-02 17:35:36
特朗普派出兩艘核潛艇令莫斯科交易所指數(shù)大跌,油價飆升

特朗普派出兩艘核潛艇令莫斯科交易所指數(shù)大跌,油價飆升

桂系007
2025-08-02 03:42:55
詹姆斯四句話火力全開 三重目的直指湖人與東契奇 爆照露快船標(biāo)志

詹姆斯四句話火力全開 三重目的直指湖人與東契奇 爆照露快船標(biāo)志

籃球話題團(tuán)
2025-08-02 01:35:03
熱搜爆了!知名女星喊話:不用你們封殺我,我不干了

熱搜爆了!知名女星喊話:不用你們封殺我,我不干了

南方都市報
2025-08-02 22:49:56
殺所長搶槍,殺行長劫財,驚天懸案18年未破,兇手當(dāng)上城管局局長

殺所長搶槍,殺行長劫財,驚天懸案18年未破,兇手當(dāng)上城管局局長

真實異聞
2024-01-17 18:41:01
早已領(lǐng)證結(jié)婚?和王楚欽姐弟戀?4年過去了,陳夢迎來正名

早已領(lǐng)證結(jié)婚?和王楚欽姐弟戀?4年過去了,陳夢迎來正名

歸史
2025-08-02 16:17:15
暴走團(tuán)老人擠滿肯德基歇腳,店員勸離不聽,老板:把門鎖上一個別走

暴走團(tuán)老人擠滿肯德基歇腳,店員勸離不聽,老板:把門鎖上一個別走

如煙若夢
2025-07-31 16:44:39
湖人總經(jīng)理:續(xù)約東契奇是球隊歷史上一個具有里程碑意義的時刻,他的未來在湖人隊

湖人總經(jīng)理:續(xù)約東契奇是球隊歷史上一個具有里程碑意義的時刻,他的未來在湖人隊

雷速體育
2025-08-03 01:02:31
編譯 | 巴基斯坦究竟為何能擊落印度戰(zhàn)機(jī)?印巴沖突后,外媒替印度“反思”…

編譯 | 巴基斯坦究竟為何能擊落印度戰(zhàn)機(jī)?印巴沖突后,外媒替印度“反思”…

南亞研究通訊
2025-08-02 00:04:22
75歲張愛玲死在行軍床上,滿屋是用過的衛(wèi)生紙,遺囑:不許看遺體

75歲張愛玲死在行軍床上,滿屋是用過的衛(wèi)生紙,遺囑:不許看遺體

顧史
2025-08-01 22:29:16
一架泰專機(jī)抵達(dá)上海!佩通坦、他信危在旦夕,流亡海外或血戰(zhàn)到底

一架泰專機(jī)抵達(dá)上海!佩通坦、他信危在旦夕,流亡海外或血戰(zhàn)到底

正經(jīng)的燒杯1
2025-08-02 00:43:27
奔馳女亮證后續(xù):身份疑被扒,記者調(diào)查稱電話壞了,當(dāng)事人被開盒

奔馳女亮證后續(xù):身份疑被扒,記者調(diào)查稱電話壞了,當(dāng)事人被開盒

鋭娛之樂
2025-08-02 14:06:19
楊采鈺生兒子不能領(lǐng)證!禿驢遭報應(yīng)不能生兒子!

楊采鈺生兒子不能領(lǐng)證!禿驢遭報應(yīng)不能生兒子!

八卦瘋叔
2025-08-02 15:23:13
你撿過最大的漏是啥?網(wǎng)友:所有運(yùn)氣都用在刀尖上這個我特別同意

你撿過最大的漏是啥?網(wǎng)友:所有運(yùn)氣都用在刀尖上這個我特別同意

解讀熱點事件
2025-08-02 00:05:03
FBI局長竟發(fā)表這樣的涉華言論,簡直不可思議!外交部:震驚!

FBI局長竟發(fā)表這樣的涉華言論,簡直不可思議!外交部:震驚!

占豪
2025-08-02 09:18:42
在迪拜出差,我拍了穆斯林女人的肩膀,結(jié)果她要我娶她

在迪拜出差,我拍了穆斯林女人的肩膀,結(jié)果她要我娶她

朝暮書屋
2025-07-22 18:11:47
2025-08-03 02:55:00

科技要聞

自動駕駛致命車禍,特斯拉被判賠2.4億美元

頭條要聞

香港高院:若不保全財產(chǎn) 內(nèi)地法院判決將失去意義

頭條要聞

香港高院:若不保全財產(chǎn) 內(nèi)地法院判決將失去意義

體育要聞

山東遼寧這場群毆,代價何其慘重

娛樂要聞

孫儷曬四口海邊照,等等身高直追爸爸

財經(jīng)要聞

杜建英子女在美國或另有信托

汽車要聞

零重力座椅+大角度躺靠的后排 啟源A06內(nèi)飾首曝

態(tài)度原創(chuàng)

手機(jī)
親子
旅游
時尚
軍事航空

手機(jī)要聞

紅米K90系列再次被確認(rèn):全系7開頭電池+百瓦閃充,或10月登場

親子要聞

讓年輕人不怕生孩子的靈丹妙藥來了嗎?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

時隔20年,“穿Prada的女魔頭”又來了!

軍事要聞

中國直-10ME列裝巴基斯坦軍隊

無障礙瀏覽 進(jìn)入關(guān)懷版
×
日本sm极度另类视频| 99九九热精品影视| 免费无码成人av在线播| 把老熟妇日出白浆16p| 在线观看一区| 国产成人精品a视频| 岛国一区二区三区高清视频 | 成人亚洲激情| 无码不卡一二三| 亚洲电影天堂在线国语对白| 亚洲人成网网址在线看| 永久名域18永久域名无玛| 97色伦午夜国产亚洲精品| 2012av天堂| 自拍偷拍亚洲色图综合| 少妇人妻大乳在线视频不卡| 亚洲精品无码人妻无码| 蜜臀av无码人妻精品| 水牛影视av| 免费观看的av在线播放| 超级刺激毛片免费看| 7777四色成人| 精品国产亚洲一区二区三区演员表| 日本xxxxxxxxxxxxxxx少妇| 亚洲视频久久精品| 亚洲无码视频在线免费观看AA| 国产日韩欧美久久久精品图片| 外国一区二区黄色免费大片| 国产精品久久毛片老年| 色婷婷天天综合在线| 在线播放亚洲第一字幕| 国产真实乱伦一区二区| 国产精品无码制服丝袜| 熟妇与小伙子mature老熟妇| 国产精品一区二区三区黄片| 热九九精品| 国产精品人妻一码二码尿失禁| 中文字幕一区视频| 观看国产色欲色欲色欲WWW| 久久久国产成人一区二区| 朋友人妻少妇精品系列|