網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

ChatGPT付費(fèi)版也「變笨」了，OpenAI被曝「偷換模型」，用戶炸鍋|Hunt Good周報(bào)

2025-09-28 19:42:25　來源: 愛范兒

廣東舉報(bào)

分享至

歡迎收看最新一期的 Hunt Good 周報(bào)！

在本期內(nèi)容你會(huì)看到：

7 條新鮮資訊
4 個(gè)有用工具
1 個(gè)有趣案例
3 個(gè)鮮明觀點(diǎn)

Hunt for News｜先進(jìn)頭條

OpenAI 模型路由機(jī)制引發(fā)用戶爭議

近日，知名 X 博主 Tibor Blaho 發(fā)現(xiàn)OpenAI 正在未經(jīng)用戶同意的情況下，自動(dòng)將 ChatGPT 用戶的請求分流至兩款未公開的「秘密模型」。

據(jù) Blaho 透露，這兩款模型分別為「gpt-5-chat-safety」和「gpt-5-a-t-mini」。前者是專門處理敏感內(nèi)容的新型模型，后者則是一款敏感度極高的「違規(guī)」檢測推理模型，僅需輸入「違規(guī)」一詞即可觸發(fā)響應(yīng)。

當(dāng)系統(tǒng)判定用戶的對話內(nèi)容涉及敏感話題、情緒表達(dá)或潛在違規(guī)信息時(shí)，無論用戶選擇的是 GPT-4 還是 GPT-5 版本，系統(tǒng)都會(huì)自動(dòng)將請求路由到這些后端模型進(jìn)行處理。甚至即使是「我今天過得很糟糕」或「我也愛你」這樣帶有輕微情感色彩的普通表達(dá)，都可能觸發(fā)路由機(jī)制。

值得一提的是，這一做法不僅影響免費(fèi)用戶，就連每月支付 20 美元的 Plus 用戶和 200 美元的 Pro 會(huì)員也無法幸免，不少網(wǎng)友更是吐槽 ChatGPT 降智明顯。

對此，OpenAI 副總裁兼 ChatGPT 應(yīng)用主管 Nick Turley 承認(rèn) OpenAI 正在測試新的安全路由系統(tǒng)。他解釋稱，當(dāng)對話涉及敏感和情感話題時(shí)，系統(tǒng)會(huì)切換至專門設(shè)計(jì)用于嚴(yán)謹(jǐn)處理此類情景的推理模型或 GPT-5。

此外，Turley 強(qiáng)調(diào)這種從默認(rèn)模型切換到敏感模型的做法目前只是臨時(shí)性的，并表示在用戶明確詢問后，ChatGPT 仍會(huì)告知當(dāng)前使用的具體模型。

https://x.com/btibor91/status/1971959782379495785

?? 馬斯克 xAI 起訴 OpenAI 涉嫌竊取商業(yè)機(jī)密

9 月 25 日，埃隆·馬斯克旗下的人工智能公司 xAI 在加州北區(qū)聯(lián)邦法院對 OpenAI 提起訴訟，指控該公司通過挖角關(guān)鍵員工的方式竊取商業(yè)機(jī)密。

此前，xAI 已在 8 月份對前員工李學(xué)晨提起訴訟。李學(xué)晨突然出售其持有的公司股份后離職，隨后加入競爭對手 OpenAI，不過目前尚不清楚他是否真正開始在 OpenAI 工作。

在最新的起訴書中，xAI 指控 OpenAI「誘導(dǎo)」包括李學(xué)晨、早期工程師吉米·弗雷圖爾以及一名高級財(cái)務(wù)主管在內(nèi)的前員工竊取商業(yè)機(jī)密。

起訴書中一項(xiàng)重要指控是 OpenAI 試圖獲取 xAI 的「秘密武器」，即「xAI 能夠以前所未有的速度部署具有大規(guī)模計(jì)算資源的數(shù)據(jù)中心來訓(xùn)練和運(yùn)行人工智能」的能力。

據(jù)起訴書稱，那名未具名的「高級財(cái)務(wù)主管」掌握快速建設(shè)和擴(kuò)展數(shù)據(jù)中心的流程知識，并將其帶到了 OpenAI。當(dāng)這名主管在離職時(shí)通過郵件被質(zhì)疑涉嫌違反保密協(xié)議時(shí)，他回復(fù)道「去你的」。xAI 在起訴書中附上了該郵件的截圖，將其作為證據(jù)。

xAI 指控 OpenAI 作為「僅僅因?yàn)槭恰合刃姓摺痪涂焖僭谏墒饺斯ぶ悄芄局嗅绕馂橹鲗?dǎo)者」，正在進(jìn)行一場「協(xié)調(diào)的、不公平和非法的活動(dòng)」，有針對性地招募 xAI 的關(guān)鍵員工，然后「誘導(dǎo)」他們將商業(yè)機(jī)密帶到 OpenAI。

對此，OpenAI 發(fā)言人在郵件中回應(yīng)稱：「這起新訴訟是馬斯克先生持續(xù)騷擾行為的最新篇章。我們對任何違反保密協(xié)議的行為零容忍，也對其他實(shí)驗(yàn)室的商業(yè)機(jī)密毫無興趣。」

https://sherwood.news/tech/musks-xai-sues-openai-alleging-theft-of-trade-secrets/

ChatGPT 要加廣告了？

據(jù) Sources 報(bào)道，OpenAI 新任應(yīng)用程序 CEO 菲吉·西莫（Fidji Simo）希望組建一個(gè)新團(tuán)隊(duì)負(fù)責(zé)為 ChatGPT 引入廣告業(yè)務(wù)。新團(tuán)隊(duì)負(fù)責(zé)人將全面負(fù)責(zé) OpenAI 的所有盈利業(yè)務(wù)，涵蓋廣告和訂閱服務(wù)等各個(gè)方面。

知情人士透露，西莫最近一直在與潛在候選人進(jìn)行會(huì)面，其中包括她此前在 Facebook 的一些同事。目前相關(guān)談判仍在進(jìn)行中，預(yù)計(jì)新聘用的廣告業(yè)務(wù)負(fù)責(zé)人將直接向西莫匯報(bào)工作。

作為補(bǔ)充，西莫于上個(gè)月辭去 Instacart CEO 職務(wù)后正式加入 OpenAI。

在 OpenAI 的組織架構(gòu)中，西莫負(fù)責(zé)管理公司的大部分業(yè)務(wù)板塊，但研究、基礎(chǔ)設(shè)施、消費(fèi)者硬件和安全團(tuán)隊(duì)除外，這些核心部門仍直接向 CEO Sam Altman 匯報(bào)。

https://sources.news/p/openai-ads-leader-sam-altman-memo-stargate?hide_intro_popup=true

?? Meta 押注「Android 式」機(jī)器人平臺(tái)

Meta CTO 安德魯·博斯沃斯在最近一次訪談中透露，在 CEO 馬克·扎克伯格的直接指示下，他于今年早些時(shí)候組建了專門的機(jī)器人研究團(tuán)隊(duì)，目前正在開發(fā)內(nèi)部代號為「Metabot」的人形機(jī)器人項(xiàng)目。

與市場上其他競爭對手不同，Meta 并不打算成為硬件制造商，而是計(jì)劃采用類似 Google 向手機(jī)制造商授權(quán) Android系統(tǒng)的商業(yè)模式。他設(shè)想 Meta 將開發(fā)完整的軟件藍(lán)圖，然后向任何符合技術(shù)規(guī)格要求的公司開放授權(quán)，讓更多制造商能夠基于 Meta 的軟件平臺(tái)生產(chǎn)人形機(jī)器人。

在技術(shù)方面，博斯沃斯強(qiáng)調(diào)軟件開發(fā)是當(dāng)前最大的瓶頸，而非硬件本身。

他在訪談中拿起桌上的水杯解釋道：「這些機(jī)器人可以站立、奔跑，甚至做后空翻，因?yàn)榈孛媸且粋€(gè)超級穩(wěn)定的平臺(tái)。但如果讓機(jī)器人嘗試拿起這個(gè)水杯，它很可能會(huì)立即捏碎杯子或?yàn)⒐饫锩娴乃??！惯@個(gè)簡單的例子說明了靈巧操作仍然是機(jī)器人技術(shù)面臨的最大難題之一。

為了攻克這一難題，Meta 的超級智能 AI 實(shí)驗(yàn)室正在與機(jī)器人團(tuán)隊(duì)密切合作，共同構(gòu)建一個(gè)能夠完成復(fù)雜手部動(dòng)作仿真的「世界模型」。博斯沃斯指出，目前還不存在能讓人形機(jī)器人像人類一樣精確完成諸如從牛仔褲口袋中小心取出鑰匙等精細(xì)動(dòng)作的傳感器循環(huán)系統(tǒng)，因此團(tuán)隊(duì)必須從零開始構(gòu)建相應(yīng)的數(shù)據(jù)集。

https://www.theverge.com/column/786759/humanoid-robots-meta

微軟宣布 Copilot 助手引入 Claude 模型，減少對 OpenAI 依賴

9 月 24 日，微軟公司宣布將 Anthropic 的 Claude 模型引入 Microsoft 365 Copilot 助手。

在這項(xiàng)新的合作中，使用 Copilot 中 Researcher 代理功能（收集和分析信息并生成報(bào)告）的用戶現(xiàn)在可以選擇由 Claude 模型或 OpenAI 模型來響應(yīng)他們的提示請求。

不過，管理員需要事先批準(zhǔn)使用這些模型，相關(guān)使用將遵循 Anthropic 公司的條款和條件。

值得一提的是，作為 OpenAI 的主要投資者和關(guān)鍵云服務(wù)合作伙伴，在過去很長一段時(shí)間，微軟主要依賴 OpenAI 模型為必應(yīng)搜索、Windows 操作系統(tǒng)和其他產(chǎn)品提供 AI 功能。

但隨著與 OpenAI 的裂痕加深，微軟除了整合更多公司的大型語言模型外，微軟還開始測試其自主開發(fā)的 MAI-1-preview 模型。

與此同時(shí)，OpenAI 也脫離對微軟 Azure 的依賴，加速擴(kuò)張合作版圖，先后與甲骨文、博通和英偉達(dá)達(dá)成數(shù)百億至千億美元級別的巨額協(xié)議，以支撐其大規(guī)模數(shù)據(jù)中心建設(shè)。

https://www.cnbc.com/2025/09/24/microsoft-adds-anthropic-model-to-microsoft-365-copilot.html

蘋果內(nèi)部版 ChatGPT 曝光，為新 Siri 準(zhǔn)備

據(jù)彭博社昨日報(bào)道，蘋果正在開發(fā)一款類似 ChatGPT 的手機(jī)應(yīng)用，以幫助測試和準(zhǔn)備明年即將推出的新版 Siri。

報(bào)道稱，蘋果 AI 部門正在使用該應(yīng)用快速評估 Siri 的新功能，包括測試搜索個(gè)人數(shù)據(jù)、執(zhí)行 App 內(nèi)操作（如編輯照片）。

該軟件內(nèi)部代號為「Veritas（拉丁語意為「真理」），目前僅供內(nèi)部使用。雖然該軟件沒有計(jì)劃面向消費(fèi)者，但該 App 的功能基本上是將正在開發(fā)中的新技術(shù)從新 Siri 中提取出來，從而幫助蘋果員工高效完成測試。

報(bào)道指出，即使沒有公開發(fā)布，但這款內(nèi)部工具也標(biāo)志著蘋果為 Siri 全面升級所做的準(zhǔn)備進(jìn)入了一個(gè)新階段。新 Siri 已經(jīng)經(jīng)歷了多輪推遲，目前計(jì)劃在明年 3 月推出。

據(jù)悉，Veritas 跑的底層為蘋果為驅(qū)動(dòng)新 Siri 而重構(gòu)的新系統(tǒng)，代號為「Linwood」。同時(shí)，Veritas 還依賴大語言模型（LLM），并且結(jié)合了蘋果自身基礎(chǔ)模型團(tuán)隊(duì)的工作成果。

另外，據(jù) 9to5Mac 日前報(bào)道，iOS 26.1、iPadOS 26.1 和 macOS Tahoe 26.1 開發(fā)者測試版隱藏的代碼顯示，蘋果正在為 App Intents 引入 MCP 支持打基礎(chǔ)。

相關(guān)閱讀：iOS 26.1 隱藏彩蛋曝光，蘋果給 ChatGPT 們造了個(gè)新「C 口」

Meta 推出 AI 視頻流「Vibes」，扎克伯格親自宣傳遭網(wǎng)友吐槽

Meta 近日宣布推出名為「Vibes」的全新 AI 視頻流。

扎克伯格在 Instagram 帖子中介紹說，Vibes 將成為「藝術(shù)家和創(chuàng)作者制作的富有表現(xiàn)力的 AI 生成視頻流」。該功能將在美國和其他 40 多個(gè)國家推出。

在功能設(shè)計(jì)方面，Meta 表示用戶不僅可以觀看 AI 生成的內(nèi)容，還能創(chuàng)建自己的視頻或?qū)ΜF(xiàn)有視頻進(jìn)行「混音」處理，包括添加新的視覺效果和音樂。

為了展示這一新功能，扎克伯格分享了一段 AI 制作的視頻片段，標(biāo)題為「爸爸試圖計(jì)算 30 美元午餐的小費(fèi)」，視頻中一位酷似扎克伯格的父親角色說道：「天哪... 我覺得可能至少要 6000 億美元?！?/p>

然而，扎克伯格的宣傳視頻卻引來了網(wǎng)友的嘲諷，有不少網(wǎng)友在其視頻下方將這些由 AI 生成的視頻稱之為「AI 垃圾（AI slop）」。

值得注意的是，雖然 Meta 擁有自己的 AI 模型 Llama，但在 Vibes 項(xiàng)目中，該公司選擇使用來自 AI 實(shí)驗(yàn)室 Midjourney 和 Black Forest 的視頻生成模型。

https://www.theguardian.com/technology/2025/sep/26/cute-fluffy-characters-and-egyptian-selfies-meta-launches-ai-feed-vibes

Hunt for Tools｜先進(jìn)工具 OpenAI 前 CTO 創(chuàng)業(yè)第二個(gè)成果公布

9 月 27 日，由多位 OpenAI 前高管創(chuàng)立的 Thinking Machines Lab（TML），正式發(fā)布了其第二篇研究論文《Modular Manifolds》，旨在從根源上讓大模型訓(xùn)練過程變得穩(wěn)定、高效。

簡單來說，這項(xiàng)研究的核心思想是給神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)戴上一個(gè)幾何「緊箍咒」。

傳統(tǒng)方法往往是在模型建好后，再套用一個(gè)優(yōu)化器來「管教」它。而「模塊化流形」框架則更進(jìn)一步，它將神經(jīng)網(wǎng)絡(luò)的每一層都視為一個(gè)有獨(dú)立規(guī)則的「幾何空間」（即流形），先在內(nèi)部約束好參數(shù)，然后再將這些空間「拼接」起來，用一個(gè)全局的「限速器」統(tǒng)一協(xié)調(diào)整個(gè)網(wǎng)絡(luò)的更新步伐。

這種「模型與優(yōu)化器一體化設(shè)計(jì)」的思路，避免了網(wǎng)絡(luò)內(nèi)部參數(shù)數(shù)值的失控。根據(jù)論文中進(jìn)行的小規(guī)模實(shí)驗(yàn)，該方法在穩(wěn)定性和準(zhǔn)確率上已展現(xiàn)出潛力。

該成果作者為 TML 的機(jī)器學(xué)習(xí)研究員 Jeremy Bernstein，并在 MIT 從事博士后研究工作。

本月，TML 在成立半年后，發(fā)布了其首篇重磅研究論文《Defeating Nondeterminism in LLM Inference》（克服 LLM 推理中的不確定性）。

值得一提的是，此前 TML 在「0 產(chǎn)品 0 用戶」的情況下，估值曾狂飆至 120 億美元（折合人民幣 850 億元）。

https://thinkingmachines.ai/blog/modular-manifolds/

DeepSeek 模型再更新，真終「極」版

9 月 22 日，DeepSeek 宣布，deepseek-chat 和 deepseek-reasoner 已全面升級為 DeepSeek-V3.1-Terminus。

其中，deepseek-chat 對應(yīng)非思考模式，deepseek-reasoner 對應(yīng)思考模式。據(jù)介紹，本次更新在延續(xù)模型既有能力的同時(shí)，針對用戶反饋進(jìn)行了優(yōu)化。

語言一致性方面，中英文混雜與偶發(fā)異常字符情況得到緩解；
Agent 能力方面，Code Agent 與 Search Agent 的表現(xiàn)進(jìn)一步提升。
值得一提的是，DeepSeek V3.1 模型此前在多個(gè)平臺(tái)被開發(fā)者集中反饋出現(xiàn)「偶發(fā)極等」異常 —— 即在正常代碼或文本輸出中突然反復(fù)插入漢字「極」、英文「extreme」或繁體「極」等 token。雖然 Bug 的概率約千分之一，但足以導(dǎo)致編譯失敗或內(nèi)容不可用。此次版本升級，應(yīng)當(dāng)也包含了對該問題的針對性修復(fù)。

新模型現(xiàn)已開源：

Hugging Face：https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
ModelScope：https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

ChatGPT 推出主動(dòng)資訊助理「Pulse」

9 月 26 日，OpenAI 宣布推出全新功能「ChatGPT Pulse」，目前已率先向移動(dòng)端 Pro 用戶開放預(yù)覽。

官方介紹稱，「ChatGPT Pulse」能夠基于用戶的聊天記錄、反饋以及已連接的應(yīng)用（如 Gmail、Google 日歷），在每天早晨自動(dòng)生成一組個(gè)性化的研究更新。這些內(nèi)容以卡片形式呈現(xiàn)，用戶可以快速瀏覽或展開查看詳情。

與傳統(tǒng) AI 的「提問—回答」模式不同，「ChatGPT Pulse」強(qiáng)調(diào)主動(dòng)性。系統(tǒng)會(huì)在夜間進(jìn)行異步研究，結(jié)合用戶的興趣和歷史反饋，次日推送更具針對性的建議，例如「健康晚餐食譜」「三項(xiàng)全能訓(xùn)練計(jì)劃」或「會(huì)議議程草案」。

值得注意的是，「ChatGPT Pulse」的更新僅在當(dāng)天有效，若用戶未保存或展開查看，信息不會(huì)長期保留。官方強(qiáng)調(diào)，該功能的目標(biāo)是「幫助用戶快速獲取關(guān)鍵信息，而不是讓人無休止地刷屏」。

目前，「ChatGPT Pulse」仍處于預(yù)覽階段，未來將逐步擴(kuò)展至更多用戶，并計(jì)劃支持更多第三方應(yīng)用接入。

相關(guān)閱讀：剛剛，ChatGPT 又更新了，奧特曼：這是我最喜歡的功能

Google DeepMind 發(fā)布新 AI 模型，機(jī)器人可搜索網(wǎng)絡(luò)協(xié)助完成復(fù)雜任務(wù)

9 月 26 日，Google DeepMind 宣布推出升級版 AI 模型，能夠幫助機(jī)器人能夠完成更復(fù)雜的任務(wù)。

據(jù)悉，得益于由新發(fā)布的 Gemini Robotics 1.5 以及具身推理模型 Gemini Robotics-ER 1.5，Deepmind 新推出的 AI 模型能夠協(xié)同工作，讓機(jī)器人在物理世界中采取行動(dòng)之前能夠「提前思考多個(gè)步驟」。

報(bào)道稱，機(jī)器人將能夠完成更復(fù)雜的多步驟操作，比如按深淺顏色分類洗衣物、根據(jù)倫敦當(dāng)前天氣情況打包行李箱，以及幫助人們根據(jù)特定地區(qū)要求進(jìn)行垃圾、堆肥和可回收物品的分類。

DeepMind 機(jī)器人部門負(fù)責(zé)人卡羅琳娜·帕拉達(dá)表示：「此前的模型能夠很好地完成單一指令任務(wù)，而且具有很強(qiáng)的通用性。通過這次更新，我們從執(zhí)行單一指令轉(zhuǎn)向?qū)ξ锢砣蝿?wù)的真正理解和問題解決?！?/p>

為了實(shí)現(xiàn)這一目標(biāo)，機(jī)器人可以使用 Gemini Robotics-ER 1.5 模型來理解周圍環(huán)境，并利用 Google 搜索等數(shù)字工具獲取更多信息，隨后將這些發(fā)現(xiàn)轉(zhuǎn)化為自然語言指令，傳遞給 Gemini Robotics 1.5，讓機(jī)器人能夠利用該模型的視覺和語言理解能力逐步執(zhí)行任務(wù)。

此外，DeepMind 還宣布 Gemini Robotics 1.5 能夠幫助機(jī)器人相互「學(xué)習(xí)」，即使它們具有不同的配置。目前，DeepMind 正在通過 Google AI Studio 中的 Gemini API 向開發(fā)人員推出 Gemini Robotics-ER 1.5，而 Gemini Robotics 1.5 目前僅向部分合作伙伴開放使用。

https://www.theverge.com/news/785193/google-deepmind-gemini-ai-robotics-web-search

Hunt for Fun | 先玩打造個(gè)性化「安卓人」，Google 推出 Androidify 應(yīng)用

Google 于日前正式上線全新應(yīng)用 Androidify，用戶可通過上傳自拍或輸入提示詞，借助 AI 技術(shù)生成專屬的 Android 機(jī)器人形象。

該應(yīng)用現(xiàn)已在網(wǎng)頁端及 Google Play 商店同步開放下載。

據(jù)介紹，Androidify 集成了 Gemini 與 Firebase AI Logic SDK，支持圖像驗(yàn)證、自動(dòng)生成描述以及個(gè)性化機(jī)器人生成等功能。

應(yīng)用會(huì)先利用 Gemini 2.5 Flash 對用戶上傳的照片進(jìn)行檢測，確保畫面清晰且符合安全標(biāo)準(zhǔn)，隨后生成詳細(xì)描述，并調(diào)用 Imagen 3 模型生成最終的機(jī)器人形象。

值得一提的是，最新版本還新增了「背景氛圍生成」與「貼紙模式」。

前者可通過 Gemini 模型為機(jī)器人添加場景背景，后者則利用 ML Kit 分割技術(shù)去除背景，生成可在聊天應(yīng)用中使用的 PNG 貼紙。

Google 表示，Androidify 的目標(biāo)是讓用戶在輕松娛樂的同時(shí)，體驗(yàn)到 AI 與 Android 技術(shù)結(jié)合所帶來的創(chuàng)造力與個(gè)性化。

https://androidify.com/

Hunt for Insight｜先知 OpenAI 首席科學(xué)家：氛圍編碼之后或許就是「氛圍研究」

在 a16z 最新舉行的一場訪談中，OpenAI 首席科學(xué)家 Jakub Pachocki 和首席研究官 Mark Chen 深度披露了一些在 AI 發(fā)展路徑上的重要思考和未來規(guī)劃。

針對當(dāng)前評估指標(biāo)趨于飽和的問題，Jakub Pachocki 坦承，過去幾年一直使用的評估體系確實(shí)已經(jīng)非常接近飽和。因此，未來 OpenAI 將重點(diǎn)關(guān)注模型是否能夠發(fā)現(xiàn)新事物，并在具有經(jīng)濟(jì)相關(guān)性的領(lǐng)域取得實(shí)際進(jìn)展。

Jakub 透露了 OpenAI 的一個(gè)宏大目標(biāo)：培養(yǎng)自動(dòng)化研究員，讓其能夠自動(dòng)發(fā)現(xiàn)新想法。

他提到了一個(gè)有趣的衡量標(biāo)準(zhǔn)，即觀察模型實(shí)際進(jìn)行推理和取得進(jìn)展的時(shí)間跨度。目前模型的推理水平大約能夠維持 1 到 5 小時(shí)，接下來 OpenAI 將專注于延長這個(gè)時(shí)間跨度，無論是在長期規(guī)劃能力還是保持記憶方面。

在 AI 編程方面，Mark Chen 將編程模型的進(jìn)步與圍棋選手李世石面對 AlphaGo 的經(jīng)歷相比，認(rèn)為從解決八年級數(shù)學(xué)問題到一年后在編碼競賽中達(dá)到專業(yè)水平，這種進(jìn)展是「瘋狂的」。

他觀察到，這種進(jìn)步已經(jīng)改變了編碼的默認(rèn)方式?，F(xiàn)在的年輕人認(rèn)為默認(rèn)的編碼方式是「氛圍編碼」，而從頭開始編寫所有代碼反而成為奇怪的概念。他預(yù)測，氛圍編碼之后或許就是「氛圍研究」。

在人才招聘方面，Jakub Pachocki 認(rèn)為堅(jiān)持不懈是關(guān)鍵特質(zhì)。研究的本質(zhì)是探索未知，很多嘗試都會(huì)失敗，因此必須做好失敗和從失敗中學(xué)習(xí)的準(zhǔn)備。Mark Chen 補(bǔ)充說，研究沒有捷徑，需要經(jīng)驗(yàn)來學(xué)會(huì)如何選擇合適的問題。

https://www.youtube.com/watch?v=KSgPNVmZ8jQ

圖靈獎(jiǎng)得主：大語言模型是死胡同

2024 年圖靈獎(jiǎng)得主、被譽(yù)為「強(qiáng)化學(xué)習(xí)之父」理查德·薩頓在最新訪談中表示，大語言模型無法實(shí)現(xiàn)真正的智能，并將被新的架構(gòu)所取代。

薩頓的核心觀點(diǎn)是，大語言模型本質(zhì)上只是在模仿人類的行為，而非真正理解世界。

在薩頓看來，真正的智能應(yīng)該來自與環(huán)境的直接交互和經(jīng)驗(yàn)學(xué)習(xí)，就像動(dòng)物在自然界中的學(xué)習(xí)方式一樣。他強(qiáng)調(diào)，動(dòng)物從不接受「監(jiān)督學(xué)習(xí)」，它們通過嘗試行動(dòng)、觀察結(jié)果來學(xué)習(xí)，這是自然界中普遍存在的學(xué)習(xí)機(jī)制。

當(dāng)主持人帕特爾提到大語言模型似乎已經(jīng)構(gòu)建了世界模型時(shí)，薩頓反駁道：「模仿說話的人并不等于構(gòu)建世界模型。真正的世界模型應(yīng)該能讓你預(yù)測會(huì)發(fā)生什么，而不是預(yù)測人會(huì)說什么?！?/p>

薩頓認(rèn)為大語言模型面臨的最大問題是缺乏明確的目標(biāo)。他引用約翰·麥卡錫的定義說：「智能是實(shí)現(xiàn)目標(biāo)的計(jì)算能力?！箾]有目標(biāo)，就無法定義什么是正確的行為，也就無法實(shí)現(xiàn)真正的學(xué)習(xí)。

他進(jìn)一步解釋：「在強(qiáng)化學(xué)習(xí)中，存在正確的行為，因?yàn)檎_的行為就是能獲得獎(jiǎng)勵(lì)的行為。我們對什么是正確行為有明確定義，所以可以檢驗(yàn)和學(xué)習(xí)。」而大語言模型缺乏這樣的評判標(biāo)準(zhǔn)，無法在實(shí)際交互中獲得反饋并改進(jìn)。

訪談中，薩頓還指出了當(dāng)前深度學(xué)習(xí)方法在泛化能力上的根本缺陷。他認(rèn)為，雖然大語言模型在某些任務(wù)上表現(xiàn)出色，但這種成功往往是因?yàn)橹挥幸环N解決方案，而非真正的泛化能力。

「梯度下降會(huì)讓系統(tǒng)找到解決已見問題的方案，但如果有多種解決方式，其中一些泛化能力強(qiáng)，一些泛化能力弱，算法本身并不會(huì)促使系統(tǒng)選擇泛化能力強(qiáng)的方案?！顾_頓表示，這也就解釋了為什么深度學(xué)習(xí)系統(tǒng)容易出現(xiàn)災(zāi)難性遺忘等問題。

https://www.dwarkesh.com/p/richard-sutton

?? 量子計(jì)算之父：破解量子引力理論或成 AGI 評判新標(biāo)準(zhǔn)

9 月 25 日，在德國柏林阿克塞爾·施普林格公司總部舉辦的一場對話活動(dòng)中，OpenAI CEO Sam Altman 與英國著名物理學(xué)家、「量子計(jì)算之父」大衛(wèi)·多伊奇就 AGI 評判標(biāo)準(zhǔn)展開深入討論，并達(dá)成共識。

在多伊奇看來，大型語言模型能夠持續(xù)對話，主要依賴其接受的海量知識訓(xùn)練，而真正的智能應(yīng)該體現(xiàn)在創(chuàng)造知識的能力上——即發(fā)現(xiàn)問題、發(fā)明解決方案、進(jìn)行測試并不斷改進(jìn)的能力。

為了論證這一觀點(diǎn)，多伊奇以愛因斯坦的相對論為例：「有人質(zhì)疑愛因斯坦是否真正創(chuàng)造了相對論，還是僅僅將現(xiàn)有思想機(jī)械組合。我們確信他創(chuàng)造了相對論，因?yàn)槲覀兞私馑难芯繗v程、要解決的問題及其動(dòng)機(jī)?！?/p>

不過，他也坦率承認(rèn)，他此前認(rèn)為計(jì)算機(jī)無法在不具備 AGI 的情況下進(jìn)行開放式對話，但 ChatGPT 的表現(xiàn)顛覆了他的認(rèn)知。他表示：「ChatGPT 雖非 AGI，但確實(shí)具備對話能力。」

針對多伊奇的上述觀點(diǎn)，奧特曼提出了一個(gè)假設(shè)性問題：如果 GPT-8 能夠解決量子引力問題并詳述其研究故事，包括問題選擇和研究動(dòng)機(jī)，「這是否足以讓你信服？」

多伊奇明確回應(yīng)：「我認(rèn)為會(huì)的?！箠W特曼聞言露出微笑，表示：「我同意將此作為測試標(biāo)準(zhǔn)。」

https://www.businessinsider.com/sam-altman-predicts-ai-agi-surpass-human-intelligence-2030-2025-9

彩蛋時(shí)間

作者：@azed_ai
提示詞：A low-poly 3D render of a [subject], built from clean triangular facets with flat [color1] and [color2] surfaces. The environment is a stylized digital desert with minimal geometry and ambient occlusion.
鏈接：https://x.com/azed_ai/status/1971892865581350967

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.