歡迎收看最新一期的 Hunt Good 周報(bào)!
在本期內(nèi)容你會(huì)看到:
7 條新鮮資訊
4 個(gè)有用工具
1 個(gè)有趣案例
3 個(gè)鮮明觀點(diǎn)
Hunt for News|先進(jìn)頭條
OpenAI 模型路由機(jī)制引發(fā)用戶爭議
近日,知名 X 博主 Tibor Blaho 發(fā)現(xiàn)OpenAI 正在未經(jīng)用戶同意的情況下,自動(dòng)將 ChatGPT 用戶的請求分流至兩款未公開的「秘密模型」。
據(jù) Blaho 透露,這兩款模型分別為「gpt-5-chat-safety」和「gpt-5-a-t-mini」。前者是專門處理敏感內(nèi)容的新型模型,后者則是一款敏感度極高的「違規(guī)」檢測推理模型,僅需輸入「違規(guī)」一詞即可觸發(fā)響應(yīng)。
當(dāng)系統(tǒng)判定用戶的對話內(nèi)容涉及敏感話題、情緒表達(dá)或潛在違規(guī)信息時(shí),無論用戶選擇的是 GPT-4 還是 GPT-5 版本,系統(tǒng)都會(huì)自動(dòng)將請求路由到這些后端模型進(jìn)行處理。甚至即使是「我今天過得很糟糕」或「我也愛你」這樣帶有輕微情感色彩的普通表達(dá),都可能觸發(fā)路由機(jī)制。
值得一提的是,這一做法不僅影響免費(fèi)用戶,就連每月支付 20 美元的 Plus 用戶和 200 美元的 Pro 會(huì)員也無法幸免,不少網(wǎng)友更是吐槽 ChatGPT 降智明顯。
對此,OpenAI 副總裁兼 ChatGPT 應(yīng)用主管 Nick Turley 承認(rèn) OpenAI 正在測試新的安全路由系統(tǒng)。他解釋稱,當(dāng)對話涉及敏感和情感話題時(shí),系統(tǒng)會(huì)切換至專門設(shè)計(jì)用于嚴(yán)謹(jǐn)處理此類情景的推理模型或 GPT-5。
此外,Turley 強(qiáng)調(diào)這種從默認(rèn)模型切換到敏感模型的做法目前只是臨時(shí)性的,并表示在用戶明確詢問后,ChatGPT 仍會(huì)告知當(dāng)前使用的具體模型。
https://x.com/btibor91/status/1971959782379495785
?? 馬斯克 xAI 起訴 OpenAI 涉嫌竊取商業(yè)機(jī)密
9 月 25 日,埃隆·馬斯克旗下的人工智能公司 xAI 在加州北區(qū)聯(lián)邦法院對 OpenAI 提起訴訟,指控該公司通過挖角關(guān)鍵員工的方式竊取商業(yè)機(jī)密。
此前,xAI 已在 8 月份對前員工李學(xué)晨提起訴訟。李學(xué)晨突然出售其持有的公司股份后離職,隨后加入競爭對手 OpenAI,不過目前尚不清楚他是否真正開始在 OpenAI 工作。
在最新的起訴書中,xAI 指控 OpenAI「誘導(dǎo)」包括李學(xué)晨、早期工程師吉米·弗雷圖爾以及一名高級財(cái)務(wù)主管在內(nèi)的前員工竊取商業(yè)機(jī)密。
起訴書中一項(xiàng)重要指控是 OpenAI 試圖獲取 xAI 的「秘密武器」,即「xAI 能夠以前所未有的速度部署具有大規(guī)模計(jì)算資源的數(shù)據(jù)中心來訓(xùn)練和運(yùn)行人工智能」的能力。
據(jù)起訴書稱,那名未具名的「高級財(cái)務(wù)主管」掌握快速建設(shè)和擴(kuò)展數(shù)據(jù)中心的流程知識,并將其帶到了 OpenAI。當(dāng)這名主管在離職時(shí)通過郵件被質(zhì)疑涉嫌違反保密協(xié)議時(shí),他回復(fù)道「去你的」。xAI 在起訴書中附上了該郵件的截圖,將其作為證據(jù)。
xAI 指控 OpenAI 作為「僅僅因?yàn)槭恰合刃姓摺痪涂焖僭谏墒饺斯ぶ悄芄局嗅绕馂橹鲗?dǎo)者」,正在進(jìn)行一場「協(xié)調(diào)的、不公平和非法的活動(dòng)」,有針對性地招募 xAI 的關(guān)鍵員工,然后「誘導(dǎo)」他們將商業(yè)機(jī)密帶到 OpenAI。
對此,OpenAI 發(fā)言人在郵件中回應(yīng)稱:「這起新訴訟是馬斯克先生持續(xù)騷擾行為的最新篇章。我們對任何違反保密協(xié)議的行為零容忍,也對其他實(shí)驗(yàn)室的商業(yè)機(jī)密毫無興趣。」
https://sherwood.news/tech/musks-xai-sues-openai-alleging-theft-of-trade-secrets/
ChatGPT 要加廣告了?
據(jù) Sources 報(bào)道,OpenAI 新任應(yīng)用程序 CEO 菲吉·西莫(Fidji Simo)希望組建一個(gè)新團(tuán)隊(duì)負(fù)責(zé)為 ChatGPT 引入廣告業(yè)務(wù)。新團(tuán)隊(duì)負(fù)責(zé)人將全面負(fù)責(zé) OpenAI 的所有盈利業(yè)務(wù),涵蓋廣告和訂閱服務(wù)等各個(gè)方面。
知情人士透露,西莫最近一直在與潛在候選人進(jìn)行會(huì)面,其中包括她此前在 Facebook 的一些同事。目前相關(guān)談判仍在進(jìn)行中,預(yù)計(jì)新聘用的廣告業(yè)務(wù)負(fù)責(zé)人將直接向西莫匯報(bào)工作。
作為補(bǔ)充,西莫于上個(gè)月辭去 Instacart CEO 職務(wù)后正式加入 OpenAI。
在 OpenAI 的組織架構(gòu)中,西莫負(fù)責(zé)管理公司的大部分業(yè)務(wù)板塊,但研究、基礎(chǔ)設(shè)施、消費(fèi)者硬件和安全團(tuán)隊(duì)除外,這些核心部門仍直接向 CEO Sam Altman 匯報(bào)。
https://sources.news/p/openai-ads-leader-sam-altman-memo-stargate?hide_intro_popup=true
?? Meta 押注「Android 式」機(jī)器人平臺(tái)
Meta CTO 安德魯·博斯沃斯在最近一次訪談中透露,在 CEO 馬克·扎克伯格的直接指示下,他于今年早些時(shí)候組建了專門的機(jī)器人研究團(tuán)隊(duì),目前正在開發(fā)內(nèi)部代號為「Metabot」的人形機(jī)器人項(xiàng)目。
與市場上其他競爭對手不同,Meta 并不打算成為硬件制造商,而是計(jì)劃采用類似 Google 向手機(jī)制造商授權(quán) Android系統(tǒng)的商業(yè)模式。他設(shè)想 Meta 將開發(fā)完整的軟件藍(lán)圖,然后向任何符合技術(shù)規(guī)格要求的公司開放授權(quán),讓更多制造商能夠基于 Meta 的軟件平臺(tái)生產(chǎn)人形機(jī)器人。
在技術(shù)方面,博斯沃斯強(qiáng)調(diào)軟件開發(fā)是當(dāng)前最大的瓶頸,而非硬件本身。
他在訪談中拿起桌上的水杯解釋道:「這些機(jī)器人可以站立、奔跑,甚至做后空翻,因?yàn)榈孛媸且粋€(gè)超級穩(wěn)定的平臺(tái)。但如果讓機(jī)器人嘗試拿起這個(gè)水杯,它很可能會(huì)立即捏碎杯子或?yàn)⒐饫锩娴乃??!惯@個(gè)簡單的例子說明了靈巧操作仍然是機(jī)器人技術(shù)面臨的最大難題之一。
為了攻克這一難題,Meta 的超級智能 AI 實(shí)驗(yàn)室正在與機(jī)器人團(tuán)隊(duì)密切合作,共同構(gòu)建一個(gè)能夠完成復(fù)雜手部動(dòng)作仿真的「世界模型」。博斯沃斯指出,目前還不存在能讓人形機(jī)器人像人類一樣精確完成諸如從牛仔褲口袋中小心取出鑰匙等精細(xì)動(dòng)作的傳感器循環(huán)系統(tǒng),因此團(tuán)隊(duì)必須從零開始構(gòu)建相應(yīng)的數(shù)據(jù)集。
https://www.theverge.com/column/786759/humanoid-robots-meta
微軟宣布 Copilot 助手 引入 Claude 模型,減少對 OpenAI 依賴
9 月 24 日,微軟公司宣布將 Anthropic 的 Claude 模型引入 Microsoft 365 Copilot 助手。
在這項(xiàng)新的合作中,使用 Copilot 中 Researcher 代理功能(收集和分析信息并生成報(bào)告)的用戶現(xiàn)在可以選擇由 Claude 模型或 OpenAI 模型來響應(yīng)他們的提示請求。
不過,管理員需要事先批準(zhǔn)使用這些模型,相關(guān)使用將遵循 Anthropic 公司的條款和條件。
值得一提的是,作為 OpenAI 的主要投資者和關(guān)鍵云服務(wù)合作伙伴,在過去很長一段時(shí)間,微軟主要依賴 OpenAI 模型為必應(yīng)搜索、Windows 操作系統(tǒng)和其他產(chǎn)品提供 AI 功能。
但隨著與 OpenAI 的裂痕加深,微軟除了整合更多公司的大型語言模型外,微軟還開始測試其自主開發(fā)的 MAI-1-preview 模型。
與此同時(shí),OpenAI 也脫離對微軟 Azure 的依賴,加速擴(kuò)張合作版圖,先后與甲骨文、博通和英偉達(dá)達(dá)成數(shù)百億至千億美元級別的巨額協(xié)議,以支撐其大規(guī)模數(shù)據(jù)中心建設(shè)。
https://www.cnbc.com/2025/09/24/microsoft-adds-anthropic-model-to-microsoft-365-copilot.html
蘋果內(nèi)部版 ChatGPT 曝光,為新 Siri 準(zhǔn)備
據(jù)彭博社昨日報(bào)道,蘋果正在開發(fā)一款類似 ChatGPT 的手機(jī)應(yīng)用,以幫助測試和準(zhǔn)備明年即將推出的新版 Siri。
報(bào)道稱,蘋果 AI 部門正在使用該應(yīng)用快速評估 Siri 的新功能,包括測試搜索個(gè)人數(shù)據(jù)、執(zhí)行 App 內(nèi)操作(如編輯照片)。
該軟件內(nèi)部代號為「Veritas(拉丁語意為「真理」),目前僅供內(nèi)部使用。雖然該軟件沒有計(jì)劃面向消費(fèi)者,但該 App 的功能基本上是將正在開發(fā)中的新技術(shù)從新 Siri 中提取出來,從而幫助蘋果員工高效完成測試。
報(bào)道指出,即使沒有公開發(fā)布,但這款內(nèi)部工具也標(biāo)志著蘋果為 Siri 全面升級所做的準(zhǔn)備進(jìn)入了一個(gè)新階段。新 Siri 已經(jīng)經(jīng)歷了多輪推遲,目前計(jì)劃在明年 3 月推出。
據(jù)悉,Veritas 跑的底層為蘋果為驅(qū)動(dòng)新 Siri 而重構(gòu)的新系統(tǒng),代號為「Linwood」。同時(shí),Veritas 還依賴大語言模型(LLM),并且結(jié)合了蘋果自身基礎(chǔ)模型團(tuán)隊(duì)的工作成果。
另外,據(jù) 9to5Mac 日前報(bào)道,iOS 26.1、iPadOS 26.1 和 macOS Tahoe 26.1 開發(fā)者測試版隱藏的代碼顯示,蘋果正在為 App Intents 引入 MCP 支持打基礎(chǔ)。
相關(guān)閱讀:iOS 26.1 隱藏彩蛋曝光,蘋果給 ChatGPT 們造了個(gè)新「C 口」
Meta 推出 AI 視頻流「Vibes」,扎克伯格親自宣傳遭網(wǎng)友吐槽
Meta 近日宣布推出名為「Vibes」的全新 AI 視頻流。
扎克伯格在 Instagram 帖子中介紹說,Vibes 將成為「藝術(shù)家和創(chuàng)作者制作的富有表現(xiàn)力的 AI 生成視頻流」。該功能將在美國和其他 40 多個(gè)國家推出。
在功能設(shè)計(jì)方面,Meta 表示用戶不僅可以觀看 AI 生成的內(nèi)容,還能創(chuàng)建自己的視頻或?qū)ΜF(xiàn)有視頻進(jìn)行「混音」處理,包括添加新的視覺效果和音樂。
為了展示這一新功能,扎克伯格分享了一段 AI 制作的視頻片段,標(biāo)題為「爸爸試圖計(jì)算 30 美元午餐的小費(fèi)」,視頻中一位酷似扎克伯格的父親角色說道:「天哪... 我覺得可能至少要 6000 億美元?!?/p>
然而,扎克伯格的宣傳視頻卻引來了網(wǎng)友的嘲諷,有不少網(wǎng)友在其視頻下方將這些由 AI 生成的視頻稱之為「AI 垃圾(AI slop)」。
值得注意的是,雖然 Meta 擁有自己的 AI 模型 Llama,但在 Vibes 項(xiàng)目中,該公司選擇使用來自 AI 實(shí)驗(yàn)室 Midjourney 和 Black Forest 的視頻生成模型。
https://www.theguardian.com/technology/2025/sep/26/cute-fluffy-characters-and-egyptian-selfies-meta-launches-ai-feed-vibes
Hunt for Tools|先進(jìn)工具 OpenAI 前 CTO 創(chuàng)業(yè)第二個(gè)成果公布
9 月 27 日,由多位 OpenAI 前高管創(chuàng)立的 Thinking Machines Lab(TML),正式發(fā)布了其第二篇研究論文《Modular Manifolds》,旨在從根源上讓大模型訓(xùn)練過程變得穩(wěn)定、高效。
簡單來說,這項(xiàng)研究的核心思想是給神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)戴上一個(gè)幾何「緊箍咒」。
傳統(tǒng)方法往往是在模型建好后,再套用一個(gè)優(yōu)化器來「管教」它。而「模塊化流形」框架則更進(jìn)一步,它將神經(jīng)網(wǎng)絡(luò)的每一層都視為一個(gè)有獨(dú)立規(guī)則的「幾何空間」(即流形),先在內(nèi)部約束好參數(shù),然后再將這些空間「拼接」起來,用一個(gè)全局的「限速器」統(tǒng)一協(xié)調(diào)整個(gè)網(wǎng)絡(luò)的更新步伐。
這種「模型與優(yōu)化器一體化設(shè)計(jì)」的思路,避免了網(wǎng)絡(luò)內(nèi)部參數(shù)數(shù)值的失控。根據(jù)論文中進(jìn)行的小規(guī)模實(shí)驗(yàn),該方法在穩(wěn)定性和準(zhǔn)確率上已展現(xiàn)出潛力。
該成果作者為 TML 的機(jī)器學(xué)習(xí)研究員 Jeremy Bernstein,并在 MIT 從事博士后研究工作。
本月,TML 在成立半年后,發(fā)布了其首篇重磅研究論文《Defeating Nondeterminism in LLM Inference》(克服 LLM 推理中的不確定性)。
值得一提的是,此前 TML 在「0 產(chǎn)品 0 用戶」的情況下,估值曾狂飆至 120 億美元(折合人民幣 850 億元)。
https://thinkingmachines.ai/blog/modular-manifolds/
DeepSeek 模型再更新,真終「極」版
9 月 22 日,DeepSeek 宣布,deepseek-chat 和 deepseek-reasoner 已全面升級為 DeepSeek-V3.1-Terminus。
其中,deepseek-chat 對應(yīng)非思考模式,deepseek-reasoner 對應(yīng)思考模式。據(jù)介紹,本次更新在延續(xù)模型既有能力的同時(shí),針對用戶反饋進(jìn)行了優(yōu)化。
- 語言一致性方面,中英文混雜與偶發(fā)異常字符情況得到緩解;
- Agent 能力方面,Code Agent 與 Search Agent 的表現(xiàn)進(jìn)一步提升。
- 值得一提的是,DeepSeek V3.1 模型此前在多個(gè)平臺(tái)被開發(fā)者集中反饋出現(xiàn)「偶發(fā)極等」異常 —— 即在正常代碼或文本輸出中突然反復(fù)插入漢字「極」、英文「extreme」或繁體「極」等 token。雖然 Bug 的概率約千分之一,但足以導(dǎo)致編譯失敗或內(nèi)容不可用。此次版本升級,應(yīng)當(dāng)也包含了對該問題的針對性修復(fù)。
新模型現(xiàn)已開源:
Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
ChatGPT 推出主動(dòng)資訊助理「Pulse」
9 月 26 日,OpenAI 宣布推出全新功能「ChatGPT Pulse」,目前已率先向移動(dòng)端 Pro 用戶開放預(yù)覽。
官方介紹稱,「ChatGPT Pulse」能夠基于用戶的聊天記錄、反饋以及已連接的應(yīng)用(如 Gmail、Google 日歷),在每天早晨自動(dòng)生成一組個(gè)性化的研究更新。這些內(nèi)容以卡片形式呈現(xiàn),用戶可以快速瀏覽或展開查看詳情。
與傳統(tǒng) AI 的「提問—回答」模式不同,「ChatGPT Pulse」強(qiáng)調(diào)主動(dòng)性。系統(tǒng)會(huì)在夜間進(jìn)行異步研究,結(jié)合用戶的興趣和歷史反饋,次日推送更具針對性的建議,例如「健康晚餐食譜」「三項(xiàng)全能訓(xùn)練計(jì)劃」或「會(huì)議議程草案」。
值得注意的是,「ChatGPT Pulse」的更新僅在當(dāng)天有效,若用戶未保存或展開查看,信息不會(huì)長期保留。官方強(qiáng)調(diào),該功能的目標(biāo)是「幫助用戶快速獲取關(guān)鍵信息,而不是讓人無休止地刷屏」。
目前,「ChatGPT Pulse」仍處于預(yù)覽階段,未來將逐步擴(kuò)展至更多用戶,并計(jì)劃支持更多第三方應(yīng)用接入。
相關(guān)閱讀:剛剛,ChatGPT 又更新了,奧特曼:這是我最喜歡的功能
Google DeepMind 發(fā)布新 AI 模型,機(jī)器人可搜索網(wǎng)絡(luò)協(xié)助完成復(fù)雜任務(wù)
9 月 26 日,Google DeepMind 宣布推出升級版 AI 模型,能夠幫助機(jī)器人能夠完成更復(fù)雜的任務(wù)。
據(jù)悉,得益于由新發(fā)布的 Gemini Robotics 1.5 以及具身推理模型 Gemini Robotics-ER 1.5,Deepmind 新推出的 AI 模型能夠協(xié)同工作,讓機(jī)器人在物理世界中采取行動(dòng)之前能夠「提前思考多個(gè)步驟」。
報(bào)道稱,機(jī)器人將能夠完成更復(fù)雜的多步驟操作,比如按深淺顏色分類洗衣物、根據(jù)倫敦當(dāng)前天氣情況打包行李箱,以及幫助人們根據(jù)特定地區(qū)要求進(jìn)行垃圾、堆肥和可回收物品的分類。
DeepMind 機(jī)器人部門負(fù)責(zé)人卡羅琳娜·帕拉達(dá)表示:「此前的模型能夠很好地完成單一指令任務(wù),而且具有很強(qiáng)的通用性。通過這次更新,我們從執(zhí)行單一指令轉(zhuǎn)向?qū)ξ锢砣蝿?wù)的真正理解和問題解決?!?/p>
為了實(shí)現(xiàn)這一目標(biāo),機(jī)器人可以使用 Gemini Robotics-ER 1.5 模型來理解周圍環(huán)境,并利用 Google 搜索等數(shù)字工具獲取更多信息,隨后將這些發(fā)現(xiàn)轉(zhuǎn)化為自然語言指令,傳遞給 Gemini Robotics 1.5,讓機(jī)器人能夠利用該模型的視覺和語言理解能力逐步執(zhí)行任務(wù)。
此外,DeepMind 還宣布 Gemini Robotics 1.5 能夠幫助機(jī)器人相互「學(xué)習(xí)」,即使它們具有不同的配置。目前,DeepMind 正在通過 Google AI Studio 中的 Gemini API 向開發(fā)人員推出 Gemini Robotics-ER 1.5,而 Gemini Robotics 1.5 目前僅向部分合作伙伴開放使用。
https://www.theverge.com/news/785193/google-deepmind-gemini-ai-robotics-web-search
Hunt for Fun | 先玩 打造個(gè)性化「安卓人」,Google 推出 Androidify 應(yīng)用
Google 于日前正式上線全新應(yīng)用 Androidify,用戶可通過上傳自拍或輸入提示詞,借助 AI 技術(shù)生成專屬的 Android 機(jī)器人形象。
該應(yīng)用現(xiàn)已在網(wǎng)頁端及 Google Play 商店同步開放下載。
據(jù)介紹,Androidify 集成了 Gemini 與 Firebase AI Logic SDK,支持圖像驗(yàn)證、自動(dòng)生成描述以及個(gè)性化機(jī)器人生成等功能。
應(yīng)用會(huì)先利用 Gemini 2.5 Flash 對用戶上傳的照片進(jìn)行檢測,確保畫面清晰且符合安全標(biāo)準(zhǔn),隨后生成詳細(xì)描述,并調(diào)用 Imagen 3 模型生成最終的機(jī)器人形象。
值得一提的是,最新版本還新增了「背景氛圍生成」與「貼紙模式」。
前者可通過 Gemini 模型為機(jī)器人添加場景背景,后者則利用 ML Kit 分割技術(shù)去除背景,生成可在聊天應(yīng)用中使用的 PNG 貼紙。
Google 表示,Androidify 的目標(biāo)是讓用戶在輕松娛樂的同時(shí),體驗(yàn)到 AI 與 Android 技術(shù)結(jié)合所帶來的創(chuàng)造力與個(gè)性化。
https://androidify.com/
Hunt for Insight|先知 OpenAI 首席科學(xué)家:氛圍編碼之后或許就是「氛圍研究」
在 a16z 最新舉行的一場訪談中,OpenAI 首席科學(xué)家 Jakub Pachocki 和首席研究官 Mark Chen 深度披露了一些在 AI 發(fā)展路徑上的重要思考和未來規(guī)劃。
針對當(dāng)前評估指標(biāo)趨于飽和的問題,Jakub Pachocki 坦承,過去幾年一直使用的評估體系確實(shí)已經(jīng)非常接近飽和。因此,未來 OpenAI 將重點(diǎn)關(guān)注模型是否能夠發(fā)現(xiàn)新事物,并在具有經(jīng)濟(jì)相關(guān)性的領(lǐng)域取得實(shí)際進(jìn)展。
Jakub 透露了 OpenAI 的一個(gè)宏大目標(biāo):培養(yǎng)自動(dòng)化研究員,讓其能夠自動(dòng)發(fā)現(xiàn)新想法。
他提到了一個(gè)有趣的衡量標(biāo)準(zhǔn),即觀察模型實(shí)際進(jìn)行推理和取得進(jìn)展的時(shí)間跨度。目前模型的推理水平大約能夠維持 1 到 5 小時(shí),接下來 OpenAI 將專注于延長這個(gè)時(shí)間跨度,無論是在長期規(guī)劃能力還是保持記憶方面。
在 AI 編程方面,Mark Chen 將編程模型的進(jìn)步與圍棋選手李世石面對 AlphaGo 的經(jīng)歷相比,認(rèn)為從解決八年級數(shù)學(xué)問題到一年后在編碼競賽中達(dá)到專業(yè)水平,這種進(jìn)展是「瘋狂的」。
他觀察到,這種進(jìn)步已經(jīng)改變了編碼的默認(rèn)方式?,F(xiàn)在的年輕人認(rèn)為默認(rèn)的編碼方式是「氛圍編碼」,而從頭開始編寫所有代碼反而成為奇怪的概念。他預(yù)測,氛圍編碼之后或許就是「氛圍研究」。
在人才招聘方面,Jakub Pachocki 認(rèn)為堅(jiān)持不懈是關(guān)鍵特質(zhì)。研究的本質(zhì)是探索未知,很多嘗試都會(huì)失敗,因此必須做好失敗和從失敗中學(xué)習(xí)的準(zhǔn)備。Mark Chen 補(bǔ)充說,研究沒有捷徑,需要經(jīng)驗(yàn)來學(xué)會(huì)如何選擇合適的問題。
https://www.youtube.com/watch?v=KSgPNVmZ8jQ
圖靈獎(jiǎng)得主:大語言模型是死胡同
2024 年圖靈獎(jiǎng)得主、被譽(yù)為「強(qiáng)化學(xué)習(xí)之父」理查德·薩頓在最新訪談中表示,大語言模型無法實(shí)現(xiàn)真正的智能,并將被新的架構(gòu)所取代。
薩頓的核心觀點(diǎn)是,大語言模型本質(zhì)上只是在模仿人類的行為,而非真正理解世界。
在薩頓看來,真正的智能應(yīng)該來自與環(huán)境的直接交互和經(jīng)驗(yàn)學(xué)習(xí),就像動(dòng)物在自然界中的學(xué)習(xí)方式一樣。他強(qiáng)調(diào),動(dòng)物從不接受「監(jiān)督學(xué)習(xí)」,它們通過嘗試行動(dòng)、觀察結(jié)果來學(xué)習(xí),這是自然界中普遍存在的學(xué)習(xí)機(jī)制。
當(dāng)主持人帕特爾提到大語言模型似乎已經(jīng)構(gòu)建了世界模型時(shí),薩頓反駁道:「模仿說話的人并不等于構(gòu)建世界模型。真正的世界模型應(yīng)該能讓你預(yù)測會(huì)發(fā)生什么,而不是預(yù)測人會(huì)說什么?!?/p>
薩頓認(rèn)為大語言模型面臨的最大問題是缺乏明確的目標(biāo)。他引用約翰·麥卡錫的定義說:「智能是實(shí)現(xiàn)目標(biāo)的計(jì)算能力?!箾]有目標(biāo),就無法定義什么是正確的行為,也就無法實(shí)現(xiàn)真正的學(xué)習(xí)。
他進(jìn)一步解釋:「在強(qiáng)化學(xué)習(xí)中,存在正確的行為,因?yàn)檎_的行為就是能獲得獎(jiǎng)勵(lì)的行為。我們對什么是正確行為有明確定義,所以可以檢驗(yàn)和學(xué)習(xí)。」而大語言模型缺乏這樣的評判標(biāo)準(zhǔn),無法在實(shí)際交互中獲得反饋并改進(jìn)。
訪談中,薩頓還指出了當(dāng)前深度學(xué)習(xí)方法在泛化能力上的根本缺陷。他認(rèn)為,雖然大語言模型在某些任務(wù)上表現(xiàn)出色,但這種成功往往是因?yàn)橹挥幸环N解決方案,而非真正的泛化能力。
「梯度下降會(huì)讓系統(tǒng)找到解決已見問題的方案,但如果有多種解決方式,其中一些泛化能力強(qiáng),一些泛化能力弱,算法本身并不會(huì)促使系統(tǒng)選擇泛化能力強(qiáng)的方案?!顾_頓表示,這也就解釋了為什么深度學(xué)習(xí)系統(tǒng)容易出現(xiàn)災(zāi)難性遺忘等問題。
https://www.dwarkesh.com/p/richard-sutton
?? 量子計(jì)算之父:破解量子引力理論或成 AGI 評判新標(biāo)準(zhǔn)
9 月 25 日,在德國柏林阿克塞爾·施普林格公司總部舉辦的一場對話活動(dòng)中,OpenAI CEO Sam Altman 與英國著名物理學(xué)家、「量子計(jì)算之父」大衛(wèi)·多伊奇就 AGI 評判標(biāo)準(zhǔn)展開深入討論,并達(dá)成共識。
在多伊奇看來,大型語言模型能夠持續(xù)對話,主要依賴其接受的海量知識訓(xùn)練,而真正的智能應(yīng)該體現(xiàn)在創(chuàng)造知識的能力上——即發(fā)現(xiàn)問題、發(fā)明解決方案、進(jìn)行測試并不斷改進(jìn)的能力。
為了論證這一觀點(diǎn),多伊奇以愛因斯坦的相對論為例:「有人質(zhì)疑愛因斯坦是否真正創(chuàng)造了相對論,還是僅僅將現(xiàn)有思想機(jī)械組合。我們確信他創(chuàng)造了相對論,因?yàn)槲覀兞私馑难芯繗v程、要解決的問題及其動(dòng)機(jī)?!?/p>
不過,他也坦率承認(rèn),他此前認(rèn)為計(jì)算機(jī)無法在不具備 AGI 的情況下進(jìn)行開放式對話,但 ChatGPT 的表現(xiàn)顛覆了他的認(rèn)知。他表示:「ChatGPT 雖非 AGI,但確實(shí)具備對話能力。」
針對多伊奇的上述觀點(diǎn),奧特曼提出了一個(gè)假設(shè)性問題:如果 GPT-8 能夠解決量子引力問題并詳述其研究故事,包括問題選擇和研究動(dòng)機(jī),「這是否足以讓你信服?」
多伊奇明確回應(yīng):「我認(rèn)為會(huì)的?!箠W特曼聞言露出微笑,表示:「我同意將此作為測試標(biāo)準(zhǔn)。」
https://www.businessinsider.com/sam-altman-predicts-ai-agi-surpass-human-intelligence-2030-2025-9
彩蛋時(shí)間
作者:@azed_ai
提示詞:A low-poly 3D render of a [subject], built from clean triangular facets with flat [color1] and [color2] surfaces. The environment is a stylized digital desert with minimal geometry and ambient occlusion.
鏈接:https://x.com/azed_ai/status/1971892865581350967
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.