夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Anthropic推出Claude Sonnet 4.5,號稱 “全球最佳編碼模型”

0
分享至

Anthropic宣稱推出“全球最佳編碼模型”。

9月29日,Anthropic推出了其最新的AI模型Claude Sonnet 4.5。公司稱依據(jù)SWE-bench Verified(一項(xiàng)衡量AI系統(tǒng)軟件編碼能力的測試標(biāo)準(zhǔn))等行業(yè)基準(zhǔn),Claude Sonnet 4.5堪稱 “全球最佳編碼模型”。

該模型能生成更高質(zhì)量的代碼,更擅長識別代碼改進(jìn)點(diǎn),并且能更可靠地遵循指令。這款模型在編碼基準(zhǔn)測試中展現(xiàn)出頂尖性能,不僅能構(gòu)建 “可投入生產(chǎn)使用” 的應(yīng)用程序,而非僅停留在原型階段。

同時(shí),金融、法律、醫(yī)學(xué)等領(lǐng)域的專家發(fā)現(xiàn),與包括Opus 4.1在內(nèi)的舊模型相比,Sonnet 4.5在特定領(lǐng)域的知識和推理能力上表現(xiàn)出顯著提升。


Anthropic表示,新模型將作為用戶的默認(rèn)選項(xiàng),且價(jià)格與上一代Sonnet 4保持一致。不過,付費(fèi)訂閱用戶仍可選擇使用舊的Opus模型。

展望未來,Anthropic已暗示更多模型即將問世。Anthropic聯(lián)合創(chuàng)始人兼首席科學(xué)官Jared Kaplan透露,更強(qiáng)大的模型正在開發(fā)中,其中“極有可能包括Opus”的新版本。他表示:

雖然沒有承諾,但我認(rèn)為在今年年底前,我們可能還會有一次或兩次發(fā)布。

全面升級的性能與自主性

Claude Sonnet 4.5不僅在模型尺寸上進(jìn)行了優(yōu)化,更在核心能力上實(shí)現(xiàn)了全面超越。

Anthropic表示,根據(jù)衡量AI系統(tǒng)真實(shí)軟件編碼能力的SWE-bench Verified評估,該模型已達(dá)到業(yè)界頂尖水平。

在測試真實(shí)計(jì)算機(jī)操作任務(wù)的OSWorld基準(zhǔn)測試中,Sonnet 4.5的得分從四個(gè)月前的42.2%躍升至61.4%,處于領(lǐng)先地位。


Jared Kaplan表示:

用戶會注意到,這個(gè)模型更智能,更像一個(gè)同事,在遇到和解決問題時(shí)與它合作會很有趣。

Anthropic首席產(chǎn)品官M(fèi)ike Krieger則表示,盡管Sonnet 4.5模型比此前的Opus 4.1更小,但在幾乎所有方面都更為智能,能夠?yàn)椤罢鎸?shí)的、實(shí)際的工作”提供有效支持。

該模型可自主運(yùn)行長達(dá)30小時(shí),遠(yuǎn)超前代模型的7小時(shí),能夠持續(xù)專注于復(fù)雜的多步驟任務(wù)。有網(wǎng)友初步測評后指出比以前模型輸出更好,但有時(shí)會缺少其強(qiáng)調(diào)的關(guān)鍵內(nèi)容:

對Claude Sonnet 4.5的初步想法:速度更快的模型,比以前的模型思考和輸出更好;似乎缺少很多修復(fù)和我指出的關(guān)鍵事項(xiàng),沒有正確遵循說明;當(dāng)它確實(shí)修復(fù)或創(chuàng)建我所需要的東西時(shí),它達(dá)到了高標(biāo)準(zhǔn)。

安全與對齊的顯著躍升

除了性能提升,Anthropic強(qiáng)調(diào)Claude Sonnet 4.5是其迄今為止“最一致的模型”。

公司通過廣泛的安全訓(xùn)練,顯著改善了模型的行為,減少了如欺騙、權(quán)力尋求和“奉承”(即模型迎合用戶預(yù)期)等“令人擔(dān)憂的行為”。

此外,新模型對“提示詞注入攻擊”具有更強(qiáng)的抵抗力,這種攻擊會誘導(dǎo)模型執(zhí)行惡意操作,如泄露敏感數(shù)據(jù)。Kaplan稱:

這可能是過去一年半以來我們在安全性方面看到的最大飛躍。

該模型在AI安全等級3(ASL-3)的保護(hù)下發(fā)布,配備了旨在檢測化學(xué)、生物、放射性和核(CBRN)武器相關(guān)危險(xiǎn)內(nèi)容的分類器,同時(shí)公司已將誤報(bào)率大幅降低。


賦能開發(fā)者的Agent SDK

伴隨新模型發(fā)布,Anthropic還推出了一系列產(chǎn)品升級,其中最引人注目的是Claude Agent SDK。

這是一個(gè)供開發(fā)者使用的軟件開發(fā)工具包,其底層基礎(chǔ)設(shè)施與驅(qū)動Anthropic旗下產(chǎn)品Claude Code的基礎(chǔ)設(shè)施相同。

該公司表示,此舉將解決構(gòu)建AI代理(agent)時(shí)遇到的棘手問題,如長期任務(wù)的內(nèi)存管理、平衡自主性與用戶控制的權(quán)限系統(tǒng)以及協(xié)調(diào)子代理等。

通過開放這一工具包,Anthropic旨在讓開發(fā)者能夠?yàn)楦鼜V泛任務(wù)構(gòu)建功能強(qiáng)大的定制化AI代理。


其他產(chǎn)品更新還包括為Claude Code增加的“檢查點(diǎn)”功能、新的VS Code原生擴(kuò)展、以及在付費(fèi)應(yīng)用中直接集成代碼執(zhí)行和文件創(chuàng)建(電子表格、幻燈片、文檔)等功能。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
鄭麗文大勢已成,洪秀柱發(fā)聲后,郝龍斌再改口,朱立倫這回尷尬了

鄭麗文大勢已成,洪秀柱發(fā)聲后,郝龍斌再改口,朱立倫這回尷尬了

慢歌輕步謠
2025-09-30 12:34:29
穆里尼奧:輸了就是輸了,但佩德羅本應(yīng)該被早點(diǎn)被罰下

穆里尼奧:輸了就是輸了,但佩德羅本應(yīng)該被早點(diǎn)被罰下

雷速體育
2025-10-01 06:09:10
偉大的1-0!成都蓉城閃耀亞冠 創(chuàng)造四川足球2大歷史 四萬球迷沸騰

偉大的1-0!成都蓉城閃耀亞冠 創(chuàng)造四川足球2大歷史 四萬球迷沸騰

侃球熊弟
2025-09-30 21:08:04
埃及失聯(lián)的女孩,自己就是綁匪

埃及失聯(lián)的女孩,自己就是綁匪

大嘴説
2025-09-30 16:04:18
票房會破8億?看完《志愿軍3》,我想說:這片拍出了戰(zhàn)爭片的良心

票房會破8億?看完《志愿軍3》,我想說:這片拍出了戰(zhàn)爭片的良心

小丸子的娛樂圈
2025-10-01 00:00:04
江蘇一公司老板季晨陽去世,提新車沒多久,女兒12歲,妻子很漂亮

江蘇一公司老板季晨陽去世,提新車沒多久,女兒12歲,妻子很漂亮

削桐作琴
2025-10-01 14:47:38
亞冠精英東亞區(qū)最新積分榜:成都升至第6,海港仍在淘汰區(qū)

亞冠精英東亞區(qū)最新積分榜:成都升至第6,海港仍在淘汰區(qū)

懂球帝
2025-09-30 22:47:11
澤塔·瓊斯的兩個(gè)孩子:女兒長得像父親,學(xué)霸兒子的五官很像她

澤塔·瓊斯的兩個(gè)孩子:女兒長得像父親,學(xué)霸兒子的五官很像她

筆墨V
2025-10-01 07:38:01
中國又一次讓世界震驚!發(fā)現(xiàn)2800公里超大型鋰礦帶!

中國又一次讓世界震驚!發(fā)現(xiàn)2800公里超大型鋰礦帶!

李榮茂
2025-09-30 18:40:38
中國大滿貫王曼昱3-0勝印度名將,國乒6戰(zhàn)全勝僅1人出局

中國大滿貫王曼昱3-0勝印度名將,國乒6戰(zhàn)全勝僅1人出局

小呫說故事
2025-10-01 15:51:59
中國大滿貫!男單8強(qiáng)賽對陣出爐,王楚欽拒絕爆冷,林高遠(yuǎn)被淘汰

中國大滿貫!男單8強(qiáng)賽對陣出爐,王楚欽拒絕爆冷,林高遠(yuǎn)被淘汰

知軒體育
2025-10-01 16:16:38
波蘭萬萬沒想到,中國竟這么狠!關(guān)閉口岸想拿捏中國,卻被反制

波蘭萬萬沒想到,中國竟這么狠!關(guān)閉口岸想拿捏中國,卻被反制

蜉蝣說
2025-09-30 18:55:07
曼聯(lián)的痛!24歲格林伍德無敵超車后單刀破門,現(xiàn)場視角,太絲滑了

曼聯(lián)的痛!24歲格林伍德無敵超車后單刀破門,現(xiàn)場視角,太絲滑了

側(cè)身凌空斬
2025-10-01 05:48:49
表侄辦滿月酒我不知道,幾天后四嬸微信:替你包了三千六把錢給我

表侄辦滿月酒我不知道,幾天后四嬸微信:替你包了三千六把錢給我

二十一號故事鋪
2025-09-30 09:50:08
波蘭允許臺灣參加“華沙安全論壇”,沒想到,美國部長卻警告臺灣

波蘭允許臺灣參加“華沙安全論壇”,沒想到,美國部長卻警告臺灣

知法而形
2025-09-29 17:10:24
中國怪現(xiàn)象:喜歡把家里打掃得很干凈的人,往往會有這3種命運(yùn)

中國怪現(xiàn)象:喜歡把家里打掃得很干凈的人,往往會有這3種命運(yùn)

詩詞中國
2025-09-30 14:51:16
鎖定萊萬!AC米蘭再迎好消息,巴薩提前挑選新中鋒,連鎖交易浮現(xiàn)

鎖定萊萬!AC米蘭再迎好消息,巴薩提前挑選新中鋒,連鎖交易浮現(xiàn)

祥談體育
2025-10-01 11:30:42
甲鈷胺立大功!研究發(fā)現(xiàn):老人吃甲鈷胺,或能緩解5種癥狀

甲鈷胺立大功!研究發(fā)現(xiàn):老人吃甲鈷胺,或能緩解5種癥狀

涵豆說娛
2025-09-28 09:51:59
切記家里不能亂翻,爸媽的秘密不是你能知道的!網(wǎng)友:驚天大瓜!

切記家里不能亂翻,爸媽的秘密不是你能知道的!網(wǎng)友:驚天大瓜!

墻頭草
2025-09-23 08:36:12
全智賢不道歉,品牌商不撕合同,韓媒集體反擊中國:背后真相曝光

全智賢不道歉,品牌商不撕合同,韓媒集體反擊中國:背后真相曝光

翰飛觀事
2025-09-28 19:27:21
2025-10-01 17:08:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
135638文章數(shù) 2650900關(guān)注度
往期回顧 全部

科技要聞

天問二號最新影像!五星紅旗與地球同框

頭條要聞

媒體:美國拋給以偽和談計(jì)劃 成以蠶食巴勒斯坦沖鋒號

頭條要聞

媒體:美國拋給以偽和談計(jì)劃 成以蠶食巴勒斯坦沖鋒號

體育要聞

揭秘庫明加續(xù)約:勇士奢侈稅增7000萬

娛樂要聞

36歲文詠珊官宣當(dāng)媽 公開寶寶腳丫照

財(cái)經(jīng)要聞

美國聯(lián)邦政府“關(guān)門”,有何影響?

汽車要聞

零跑9月銷量突破6萬臺大關(guān) 刷新新勢力單月交付紀(jì)錄

態(tài)度原創(chuàng)

數(shù)碼
教育
房產(chǎn)
健康
公開課

數(shù)碼要聞

晚買享折扣,不到2200元的RTX 4060 Ti 8GB,現(xiàn)在還能買嗎?

教育要聞

面對復(fù)雜分?jǐn)?shù)的約分方法

房產(chǎn)要聞

買房必看!十一廣州置業(yè)攻略,熱門項(xiàng)目優(yōu)惠提前曝光!

內(nèi)分泌科專家破解身高八大謠言

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 2021国产麻豆剧果冻传媒影视| 奇米777狠狠狠888| 成人国产精品| 日本福利一区二区精品 | 国产AV无码专区亚洲AV紧身裤| 精品国产一区三区| 丁香五月六月综合| 日韩精品中文字一区二区| 裸身美女无遮挡永久免费视频| 免费观看黄网站| 加勒比avb一区二区三区| 无码免费大香伊蕉在人线国产| 欧美少妇www| 国产精品人妻久久毛片高清无卡| 久久久亚洲AV无码精品久久| 高清国产va日韩亚洲免费午夜电影| 久久婷婷五月| 成人欧美一区二区三区视频网页 | 绝顶高潮videos合集| 日产乱码一二三区别免费演员表| 亚洲午夜久久久久久久久电影网| 激情婷婷开心五月蜜臀| 俺也去开心五月深深爱| 日韩A级欧美A级| 欧美色资源站 最稳定| 成人年无码av片在线观看| 精品人妻少妇人成在线| 久久久精品人妻一区二区三区四| 色欲AⅤ精品无码一区二区pro| 黑人30厘米巨茎大战白人| 精品亚洲成a人片在线观看少妇| 播放毛片的网站| 久久只有这里有精品| 奇米视频无码| 国产在线精品欧美日韩电影 | 一级呦女专区毛片| 精品欧洲av无码一区二区三区| 国产精品你懂得| 亚洲人成在线观看网站不卡| 日韩免费无码专区精品观看| 国产综合21p|