8月19日,AWS CEO Matt Garman 接受海外播客Matt Garman的訪談,本次對(duì)話聚焦于AI對(duì)白領(lǐng)工作模式的顛覆性影響、軟件開(kāi)發(fā)范式的變遷、下一代基礎(chǔ)設(shè)施的瓶頸挑戰(zhàn)、AWS自研芯片的核心戰(zhàn)略,以及未來(lái)模型生態(tài)的演進(jìn)方向。
針對(duì)“AI將導(dǎo)致白領(lǐng)大失業(yè)”的普遍焦慮,Garman認(rèn)為AI非但不會(huì)取代初級(jí)開(kāi)發(fā)者,反而會(huì)成為他們最佳的培訓(xùn)工具,此外他不認(rèn)同“單一全能模型將主導(dǎo)一切”的看法,堅(jiān)信未來(lái)屬于由大型通用模型與海量專用模型協(xié)同工作的“混合專家系統(tǒng)”。
此外,AI基礎(chǔ)設(shè)施建設(shè)的瓶頸會(huì)在算力、電力、網(wǎng)絡(luò)等多個(gè)環(huán)節(jié)之間動(dòng)態(tài)轉(zhuǎn)移,不存在單一、永久的解決方案。過(guò)去企業(yè)之所以沒(méi)有大規(guī)模構(gòu)建 AI Agent工作流,是因?yàn)樗麄儽仨氉约捍罱ㄋ羞@些底層的基礎(chǔ)設(shè)施,這非常困難。未來(lái)AI Agent將變得更加自主,從而真正地解放人力。
01
AI在白領(lǐng)工作中的真實(shí)價(jià)值定位
對(duì)于AI對(duì)白領(lǐng)工作的影響,各方觀點(diǎn)不一,您的立場(chǎng)是什么?如果公司將員工的大量日常任務(wù)自動(dòng)化,是否意味著公司將停止招聘,如何看待未來(lái)的招聘問(wèn)題?
Matt Garman:對(duì)于科技行業(yè)而言,眼下是前所未有的黃金時(shí)代。放眼整個(gè)業(yè)界,我個(gè)人持非常樂(lè)觀的態(tài)度。首先,我們?cè)谌斯ぶ悄芎图夹g(shù)領(lǐng)域取得的諸多進(jìn)展,在提升工作效率、成效以及釋放個(gè)人潛能方面,展現(xiàn)出了巨大的潛力。但我認(rèn)為,技術(shù)更有前景的應(yīng)用在于,它能將人們從日常的繁重乏味的工作中解放出來(lái)。如果你審視當(dāng)下許多白領(lǐng)的工作,會(huì)發(fā)現(xiàn)他們絕大部分時(shí)間所做的,并非是那些能讓他們對(duì)工作充滿激情的事情。比如,把數(shù)字錄入某個(gè)特定系統(tǒng)、為了匯報(bào)而整理報(bào)告、或是為了搞清楚工作重點(diǎn)而費(fèi)力地核對(duì)大量信息。這些事務(wù)占據(jù)了他們?nèi)缃翊蟛糠值墓ぷ鲿r(shí)間。
因此,我的看法是 AI 確實(shí)能解決這些問(wèn)題。我認(rèn)為人們會(huì)更樂(lè)于將時(shí)間投入到更具創(chuàng)造性的工作上,比如推動(dòng)項(xiàng)目進(jìn)展、進(jìn)行有趣的分析,去做那些他們真正熱愛(ài)而非厭煩的工作內(nèi)容。然而在今天,這些繁瑣的工作是必需的,幾乎是每一份工作,無(wú)論你我還是其他人,都不可或缺的一部分。如果我們能壓縮這部分工作,讓人們有更多時(shí)間專注于自己真正熱衷的事情,這將為公司和個(gè)人創(chuàng)造雙重價(jià)值,而且我相信人們會(huì)更享受自己的工作。因此,我非常樂(lè)觀,并不認(rèn)為未來(lái)會(huì)出現(xiàn)人人都失業(yè)、世界由機(jī)器人主宰的局面。我絕不認(rèn)為那會(huì)是我們的終點(diǎn)。我更傾向于相信,公司和個(gè)人的效率都將得到提升,人們也能將更多時(shí)間投入到自己充滿熱情的事業(yè)中。
(關(guān)于招聘)回顧產(chǎn)業(yè)發(fā)展史,我們總能看到效率的大幅飛躍。每一次技術(shù)變革都伴隨著一個(gè)過(guò)渡期。我認(rèn)為,其中最關(guān)鍵的一點(diǎn)是,從業(yè)者需要保持靈活性,擁抱學(xué)習(xí),并接受自己工作的性質(zhì)和內(nèi)容可能會(huì)發(fā)生變化。換言之,兩年前的工作內(nèi)容,不一定和兩年后的完全相同。但現(xiàn)實(shí)是,盡管我們已經(jīng)擁有了電腦、自動(dòng)化和機(jī)器人技術(shù),當(dāng)今世界也并未出現(xiàn)大規(guī)模失業(yè)。就業(yè)市場(chǎng)依然廣闊,甚至出現(xiàn)了薪資更高的職位。總的來(lái)看,經(jīng)濟(jì)體量變得更大,平均每個(gè)人的狀況也變得更好了。
所以,我認(rèn)為可以這樣來(lái)理解。舉個(gè)簡(jiǎn)單的例子:過(guò)去,許多人需要耗費(fèi)大量時(shí)間進(jìn)行手動(dòng)計(jì)算?,F(xiàn)在有了 Excel,但這并不意味著計(jì)算人員就此失業(yè),因?yàn)槲覀冇辛艘粋€(gè)能完成所有計(jì)算的工具。大家只是理所當(dāng)然地把它當(dāng)成一個(gè)工具來(lái)使用。我覺(jué)得這是一個(gè)很好的類比。盡管 AI 是一項(xiàng)截然不同的技術(shù),其顛覆性遠(yuǎn)超 Excel,但這個(gè)類比的核心邏輯是相通的:一個(gè)曾經(jīng)的工作崗位,因自動(dòng)化技術(shù)的出現(xiàn)而改變,人們轉(zhuǎn)而從事更有價(jià)值的工作。我相信,這正是今天正在發(fā)生的事情。因此,我對(duì)這樣的未來(lái)充滿期待。當(dāng)然,這也確實(shí)意味著人們將面臨轉(zhuǎn)變,我無(wú)意輕視大家心中的那份不確定感,也理解人們的擔(dān)憂。我認(rèn)為關(guān)鍵在于擁抱這項(xiàng)技術(shù)。
你越是積極地?fù)肀?、保持靈活、并理解它如何幫助你更快更好地完成工作,你就越能順利地度過(guò)這個(gè)轉(zhuǎn)型期。因?yàn)樗鼘⒊蔀橐豁?xiàng)極其強(qiáng)大的技術(shù),我一直對(duì)我的團(tuán)隊(duì)說(shuō),我相信AI有潛力變革每一個(gè)行業(yè)、每一家公司和每一個(gè)崗位。但這并不意味著這些崗位會(huì)消失。AI 是在變革它們,而非取代它們。因此,對(duì)于上述的每一個(gè)領(lǐng)域,包括行業(yè)、公司和崗位,都是如此。如果你不積極投身、不主動(dòng)去利用和學(xué)習(xí)這項(xiàng)技術(shù),那么你可能真的會(huì)面臨失業(yè)。相反,如果你能這樣做,并意識(shí)到它如何能讓你的工作完成得更好、更快,讓你本人在工作上表現(xiàn)更出色、效率更高,甚至坦白說(shuō),能推動(dòng)你去從事更多你可能真正喜歡做的事情,我認(rèn)為在這樣的未來(lái)里,公司會(huì)發(fā)展得更好,人們的生活會(huì)更富足,經(jīng)濟(jì)也會(huì)實(shí)現(xiàn)增長(zhǎng)。
歷史上技術(shù)變革范例不勝枚舉,但悲觀者指出當(dāng)前AI變革的速度是根本不同之處,您認(rèn)為這種速度會(huì)真正沖擊白領(lǐng)就業(yè)市場(chǎng)嗎?對(duì)于一位企業(yè)領(lǐng)導(dǎo)者而言,當(dāng)看到員工生產(chǎn)力突然提升5倍、10倍時(shí),最不可能的想法就是裁掉他們,反而會(huì)因?yàn)榫薮蟮耐顿Y回報(bào)而更大力度地投資,是這樣嗎?
Matt Garman:速度確實(shí)是一個(gè)關(guān)鍵因素。這無(wú)疑是一個(gè)飛速發(fā)展的技術(shù)領(lǐng)域,人們必須加速跟上它的步伐。所以,我承認(rèn)這確實(shí)是一個(gè)挑戰(zhàn),人們必須與時(shí)俱進(jìn),擁抱變化。我為在座的開(kāi)發(fā)者們舉個(gè)例子。我聽(tīng)一些開(kāi)發(fā)者表示,他們擔(dān)心這些編程工具的出現(xiàn),會(huì)讓他們變得不再被需要。但我的觀點(diǎn)恰恰相反:我們將需要更多,而不是更少的軟件開(kāi)發(fā)者。當(dāng)然,軟件開(kāi)發(fā)者的工作內(nèi)容可能會(huì)有所不同。那種獨(dú)自待在地下室、連續(xù)幾周埋頭苦干的傳統(tǒng)開(kāi)發(fā)者形象,我懷疑在未來(lái)是否還會(huì)是主流。
但我們始終需要真正精通軟件的人才。未來(lái),這些專家可能會(huì)指揮 AI Agent 去執(zhí)行具體的編碼工作。事實(shí)上,我確實(shí)認(rèn)為,大概在兩三年后,單純編寫 Java 代碼本身,可能不再是一項(xiàng)獨(dú)立的任務(wù)。因?yàn)?AI 工具將非常擅長(zhǎng)生成 Java 代碼。未來(lái),軟件開(kāi)發(fā)者的工作將更多地轉(zhuǎn)變?yōu)椋航鈽?gòu)問(wèn)題,決策要構(gòu)建什么,整合方案,審閱返回的 Java 代碼并判斷是否完全符合要求,然后指揮 AI Agent 進(jìn)行修改,并協(xié)調(diào)多個(gè) AI Agent 協(xié)同工作。這樣的開(kāi)發(fā)者將能夠創(chuàng)造出巨大的價(jià)值,因?yàn)樗麄儽患夹g(shù)賦予了更強(qiáng)大的能力。
我們有多少次曾因自己大腦的思考速度與實(shí)際動(dòng)手做的速度不匹配而感到沮喪?你有各種想法,渴望將它們付諸實(shí)踐,但將想法變?yōu)楝F(xiàn)實(shí)總是耗時(shí)良久。如果你能為富有創(chuàng)造力的人才解鎖這種能力,讓他們能夠快速解決問(wèn)題、開(kāi)發(fā)出有趣的應(yīng)用或取得有意義的成果,那么擁有一個(gè)這樣的人才所能創(chuàng)造的價(jià)值將不可估量。你為什么要放棄這樣的人才呢?你只會(huì)激動(dòng)地希望團(tuán)隊(duì)里有更多這樣的人。當(dāng)然,這需要人們轉(zhuǎn)變思維,學(xué)會(huì)如何使用這些新工具。但根據(jù)我的經(jīng)驗(yàn),大多數(shù)人一旦邁過(guò)了最初的門檻,就會(huì)感到非常興奮,因?yàn)檫@項(xiàng)技術(shù)確實(shí)極大地增強(qiáng)了個(gè)人能力,讓你能夠更快地進(jìn)行創(chuàng)造和開(kāi)發(fā)。
02
AI編程,代碼行數(shù)是愚蠢的指標(biāo)
能否估計(jì)目前AWS的代碼中由AI編寫的比例,以及您如何定義“由AI編寫”?在工程師層面,是他們主動(dòng)學(xué)習(xí)新工具,還是公司也建立了相應(yīng)的培訓(xùn)機(jī)制來(lái)幫助他們?
Matt Garman:在過(guò)去一兩年里,人們似乎很熱衷于吹噓 AI 編寫了多少行代碼。在我看來(lái),這是一個(gè)很傻的指標(biāo)。AI完全可以生成無(wú)限多行的代碼,但其中可能包含大量劣質(zhì)代碼。所以說(shuō),代碼行數(shù)從來(lái)都不是衡量工作的最佳標(biāo)準(zhǔn)。通常,代碼行數(shù)越少反而越好。因此,我一直不理解為什么大家會(huì)對(duì)這個(gè)指標(biāo)如此津津樂(lè)道。對(duì)我們 AWS 而言,我看到的最新數(shù)據(jù)是,超過(guò) 80% 的開(kāi)發(fā)者在他們的工作流程中,以某種方式應(yīng)用了 AI。這包括多種場(chǎng)景:有時(shí)是編寫單元測(cè)試,有時(shí)是協(xié)助撰寫文檔,有時(shí)是直接生成代碼,有時(shí)則是通過(guò)一種基于 AI Agent 的工作流。例如,我們有像 Q CLI 或 Q IDE 這樣的工具,能讓開(kāi)發(fā)者與 AI Agent 進(jìn)行協(xié)作,共同完成開(kāi)發(fā)任務(wù)。這個(gè)比例每周都在增長(zhǎng)。所以我承認(rèn)手頭的數(shù)字可能不是最新的,但可以肯定的是,我們有超過(guò) 80% 的開(kāi)發(fā)者,在為 Amazon 客戶構(gòu)建產(chǎn)品的過(guò)程中,以各種形式運(yùn)用著 AI。
(關(guān)于工程師培訓(xùn))Amazon 是一家大公司,員工背景各不相同。不過(guò),我認(rèn)為絕大多數(shù) Amazon 的開(kāi)發(fā)者都充滿好奇心,所以沒(méi)用過(guò) AI 編程工具的人數(shù)基本為零。但要區(qū)分哪些人只是淺嘗輒止,哪些人是真正用它來(lái)徹底變革自己的工作方式,我認(rèn)為這正是培訓(xùn)的重要性所在。因?yàn)槲覀兇_實(shí)有一部分員工已經(jīng)全身心投入其中,并真正摸索出了有效的工作方法。這其中存在一條學(xué)習(xí)曲線,關(guān)鍵在于要理解如何利用工具來(lái)改變工作模式,以及哪些做法能真正提效,哪些反而會(huì)拖慢進(jìn)度。有很多這樣的例子:當(dāng)使用一些第一代編程工具時(shí),你很容易陷入某個(gè)具體的方案出不來(lái),而且很難回溯。它的過(guò)程非常線性,比如你在進(jìn)行即興編碼,工具不斷給你代碼,當(dāng)你發(fā)現(xiàn)“這不是我想要的結(jié)果”時(shí),并沒(méi)有一個(gè)簡(jiǎn)單的方法能返回上一步。你只能被困在當(dāng)前的代碼里。
而使用 Q 工具時(shí),我們采用了一種以 AI Agent 輔助編程為核心的理念:你從一份你想構(gòu)建的功能規(guī)格 (spec) 開(kāi)始,然后與工具協(xié)作來(lái)逐步實(shí)現(xiàn)規(guī)格中的各個(gè)部分。即使你在即興編碼時(shí),工具可能會(huì)自動(dòng)修改規(guī)格的某些部分,但這份規(guī)格始終是你的核心依據(jù)。你隨時(shí)可以返回并修改其中的任何方面或功能。我們看到這個(gè)功能讓很多開(kāi)發(fā)者有豁然開(kāi)朗的感覺(jué)。其中一個(gè)很酷的應(yīng)用是,你可以借此引導(dǎo)初級(jí)開(kāi)發(fā)者學(xué)習(xí)什么是優(yōu)秀的編程實(shí)踐,以及我們是如何思考問(wèn)題的。這讓我想起一件我非常有感觸的事。有一次在一個(gè)領(lǐng)導(dǎo)力會(huì)議上,有人對(duì)我說(shuō):“我們覺(jué)得有了 AI,公司里所有的初級(jí)員工都可以被替代了?!?我當(dāng)時(shí)就想:“這是我聽(tīng)過(guò)最愚蠢的論調(diào)之一?!?這些初級(jí)員工可能是你成本最低的雇員,他們對(duì) AI 工具的接受和使用程度最高,而且如果展望未來(lái)十年,你沒(méi)有任何人才梯隊(duì)成長(zhǎng)起來(lái),那公司要如何運(yùn)作?所以我的觀點(diǎn)是,你絕對(duì)應(yīng)該像以往一樣,繼續(xù)招聘應(yīng)屆畢業(yè)生,教他們構(gòu)建軟件、分解問(wèn)題的正確方法。而像 Q 這樣的工具,其部分價(jià)值就在于它能引導(dǎo)你遵循最佳實(shí)踐,幫助你學(xué)習(xí)如何構(gòu)建系統(tǒng),并與經(jīng)驗(yàn)豐富的工程師更好地協(xié)作,由他們來(lái)傳授構(gòu)建這些系統(tǒng)的正確之道。
您是否會(huì)向即將或正在讀大學(xué)的年輕人推薦工程師這個(gè)職業(yè)?
Matt Garman:我的看法是這樣的,我最大的孩子馬上要讀高中最后一年了。首先,我認(rèn)為孩子們應(yīng)該去學(xué)習(xí)任何他們真正充滿熱情的東西。但我想說(shuō),有些能力是需要被特別強(qiáng)調(diào)的,比如:你如何進(jìn)行獨(dú)立思考?如何培養(yǎng)解決問(wèn)題的批判性思維能力?如何發(fā)展創(chuàng)造力?以及如何樹(shù)立一種終身學(xué)習(xí)的心態(tài),讓自己時(shí)刻準(zhǔn)備好去學(xué)習(xí)新事物?因?yàn)橐阅壳暗募夹g(shù)發(fā)展速度,如果你打算花全部時(shí)間只學(xué)習(xí)某一項(xiàng)特定技能,并指望靠它吃30年老本,那我唯一能向你保證的是,30年后這項(xiàng)技能很可能將變得毫無(wú)價(jià)值。但如果你學(xué)會(huì)了“如何學(xué)習(xí)”以及“如何思考”,我認(rèn)為這才是學(xué)校教育的真正價(jià)值所在。工程學(xué)教育的偉大之處,并不在于教你某個(gè)領(lǐng)域的具體操作技巧,而在于培養(yǎng)你如何思考和如何分解問(wèn)題的能力。我認(rèn)為,如果剛畢業(yè)的年輕人能真正專注于此,他們的未來(lái)將一片光明。
03
AI驅(qū)動(dòng)下大型企業(yè)重獲初創(chuàng)敏捷性
當(dāng)您審視內(nèi)部的工程組織時(shí),您如何衡量其在應(yīng)用人工智能方面的成功?
Matt Garman:我不會(huì)說(shuō)我們現(xiàn)在已經(jīng)找到了什么神奇的衡量標(biāo)準(zhǔn),我也不認(rèn)為這和過(guò)去有任何不同,它在一定程度上關(guān)乎生產(chǎn)力。技術(shù)日新月異,我們?nèi)栽谔剿髯罴褜?shí)踐,因此我們鼓勵(lì)大膽嘗試,鼓勵(lì)大家測(cè)試不同的工具和方法。我們也在試驗(yàn)不同的組織架構(gòu)。一個(gè)很有意思的現(xiàn)象是,在過(guò)去,要構(gòu)建一個(gè)龐大復(fù)雜的系統(tǒng),你需要很多人,因?yàn)槊總€(gè)人都只能專注于自己的一小部分。而這項(xiàng)技術(shù)的一大優(yōu)勢(shì)在于,它能讓你對(duì)自己主導(dǎo)的工作擁有更宏觀的視野。
因此我們發(fā)現(xiàn),在很多情況下,我們更傾向于組建更多專注于特定問(wèn)題的小型團(tuán)隊(duì)。事實(shí)上,你可以將產(chǎn)品分解到不同領(lǐng)域,然后讓高度專注的團(tuán)隊(duì)去攻克難題,這樣的小團(tuán)隊(duì)能夠運(yùn)轉(zhuǎn)得非??臁D阒霸诔鮿?chuàng)公司待過(guò),初創(chuàng)公司相比大型企業(yè)的一大優(yōu)勢(shì)就是行動(dòng)敏捷。其實(shí),敏捷并非與生俱來(lái),而是組織方式不同。我們從中認(rèn)識(shí)到,這些新工具能賦能大型組織,讓公司也可以通過(guò)組建小型作戰(zhàn)單元來(lái)實(shí)現(xiàn)快速行動(dòng)。當(dāng)你能夠快速行動(dòng),又有工具加持,就能為客戶創(chuàng)造非凡的價(jià)值。我們相信,即使是對(duì)于一個(gè)規(guī)模相對(duì)較大的企業(yè),這也將推動(dòng)每個(gè)人加速前進(jìn)。
04
AI基礎(chǔ)設(shè)施的建設(shè)瓶頸會(huì)動(dòng)態(tài)轉(zhuǎn)移,無(wú)法通過(guò)解決單一問(wèn)題來(lái)滿足海量需求
展望未來(lái)二到五年,您認(rèn)為基礎(chǔ)設(shè)施擴(kuò)建的瓶頸是什么,是芯片供應(yīng)、能源還是其他因素?在規(guī)劃時(shí),了解用量來(lái)源至關(guān)重要,從增長(zhǎng)角度看,您觀察到增長(zhǎng)最快的領(lǐng)域是哪里,是強(qiáng)化學(xué)習(xí)、推理還是訓(xùn)練?另外,同一種芯片可以滿足所有這些不同的需求嗎?
Matt Garman:我在商學(xué)院時(shí)讀過(guò)一本叫《目標(biāo)》的書,它的核心觀點(diǎn)是,當(dāng)你在優(yōu)化一條生產(chǎn)線時(shí),瓶頸并非是固定的。你解決了一個(gè)瓶頸,下一個(gè)環(huán)節(jié)就會(huì)成為新的瓶頸。從很多方面來(lái)看,我們現(xiàn)在面臨的情況正是如此。你提到的所有因素,在某個(gè)時(shí)間點(diǎn)都可能成為瓶頸。我并不認(rèn)為問(wèn)題只出在單一環(huán)節(jié)上,解決了舊的,新的就會(huì)出現(xiàn)。你必須系統(tǒng)性地解決所有問(wèn)題。比如,不是說(shuō)“只要我們有無(wú)限的芯片,就萬(wàn)事大吉了”,因?yàn)槟氵€需要電力;就算你有無(wú)限的電力,如果沒(méi)有足夠的網(wǎng)絡(luò)設(shè)備,問(wèn)題依然存在。你必須確保所有環(huán)節(jié)都萬(wàn)無(wú)一失。
作為基礎(chǔ)設(shè)施和云服務(wù)提供商,我們面臨的挑戰(zhàn)和機(jī)遇在于,這個(gè)市場(chǎng)機(jī)遇太龐大了。這意味著對(duì)算力、電力、服務(wù)器、芯片、HBM 內(nèi)存、網(wǎng)絡(luò)設(shè)備、磁盤等所有組件都有海量需求。過(guò)去幾年,短缺問(wèn)題無(wú)疑集中在 Nvidia 芯片及通用芯片上。我認(rèn)為,隨著芯片供應(yīng)的緩解,瓶頸可能會(huì)轉(zhuǎn)移到電力,或者再次回到芯片上。要讓所有這些要素的供給與需求的增長(zhǎng)完全同步,極其困難,因?yàn)楹芏喹h(huán)節(jié)都需要投入巨額資本。因此,我們的職責(zé)就是全盤考量這些問(wèn)題。我們會(huì)展望未來(lái)一年、三年、五年,思考如何確保我們的業(yè)務(wù)和客戶擁有支持其發(fā)展所需的電力,如何讓他們能獲得充足且多樣化的算力資源,以及如何確保他們擁有所需的網(wǎng)絡(luò)連接。這要求我們?nèi)ヮA(yù)測(cè)未來(lái)數(shù)年人們到底需要多大規(guī)模的資源。有時(shí)我們會(huì)判斷失誤,導(dǎo)致資源不足,但這正是我們替客戶承擔(dān)的責(zé)任,讓他們不必為這些復(fù)雜問(wèn)題而分心。
(關(guān)于用量增長(zhǎng)的來(lái)源)當(dāng)前絕大部分的增長(zhǎng)最終都源于推理,也就是客戶使用終端產(chǎn)品的環(huán)節(jié)。大家都很熱衷于討論各種模型構(gòu)建的新技術(shù),無(wú)論是強(qiáng)化學(xué)習(xí)還是微調(diào),雖然這些技術(shù)很有趣,但絕大多數(shù)的用量實(shí)際上來(lái)自最終用戶,也就是對(duì)模型結(jié)果的推理調(diào)用。此外,還有一系列工作是關(guān)于如何創(chuàng)造出更好、成本更低、效率更高、能力更強(qiáng)、性價(jià)比更高的模型。這屬于模型構(gòu)建的范疇:在這個(gè)領(lǐng)域,我們有大量高度專注的初創(chuàng)公司,也有一批大型企業(yè)在思考如何創(chuàng)建自定義模型以及如何將多個(gè)模型組合應(yīng)用。但實(shí)際上,一旦模型開(kāi)發(fā)完成并投入使用,絕大部分的算力消耗都是由終端應(yīng)用驅(qū)動(dòng)的,比如用戶提出一個(gè)問(wèn)題、與應(yīng)用程序交互或運(yùn)行某個(gè)工作流。這才是用量的主要來(lái)源。我們對(duì)所有這些環(huán)節(jié)都給予同等關(guān)注。
從根本上說(shuō),對(duì)于基礎(chǔ)設(shè)施或電力而言,這些用途之間的區(qū)別并不大。計(jì)算機(jī)并不在乎你用它來(lái)做強(qiáng)化學(xué)習(xí)、微調(diào)還是推理。如今,大多數(shù)平臺(tái)實(shí)際上正在趨于融合,可能只是在網(wǎng)絡(luò)層面會(huì)有些許差異,比如大規(guī)模訓(xùn)練任務(wù)可能需要特殊的網(wǎng)絡(luò)配置。
(關(guān)于芯片的通用性)完全可以。以我們自研的 Trainium 芯片為例,它就是一個(gè)絕佳的平臺(tái),事實(shí)證明,它在推理和訓(xùn)練方面都表現(xiàn)出色。許多 Nvidia 的芯片也是如此,同一套服務(wù)器可以同時(shí)勝任這兩種任務(wù)。
05
AWS史上最成功的一筆收購(gòu)
與競(jìng)爭(zhēng)對(duì)手相比,你們自研芯片的獨(dú)特之處是什么?你們是否認(rèn)為Nvidia的CUDA構(gòu)成了難以逾越的護(hù)城河?有傳言稱Google可能出售TPU,AWS是否考慮過(guò)向第三方銷售自研芯片?最后,我想深入聊聊對(duì)Annapurna的收購(gòu),外界可能低估了其重要性。在遠(yuǎn)早于生成式AI的時(shí)代,是怎樣的洞察讓你們決定自研芯片,并看中了Annapurna團(tuán)隊(duì)的哪些特質(zhì)?
Matt Garman:在自研芯片方面,我們的出發(fā)點(diǎn)始終是客戶,而非競(jìng)爭(zhēng)對(duì)手。我們關(guān)注的是客戶到底需要什么。通過(guò)與客戶交流,我們發(fā)現(xiàn)他們需要最廣泛的選擇。他們關(guān)心可以獲得哪些不同的功能,有哪些不同的成本選項(xiàng),以及如何在價(jià)格和性能之間權(quán)衡。我們幾乎從未見(jiàn)過(guò)一個(gè)單一解決方案能夠完美適配每一位客戶的每一個(gè)工作負(fù)載。因此,我們的自研芯片之旅,實(shí)際上始于我們最初打造的產(chǎn)品——我們稱之為 Nitro 卡。我們?cè)缭谑昵熬脱邪l(fā)出了第一款自研芯片。我們收購(gòu) Annapurna 后,我們的芯片團(tuán)隊(duì)就此起步。這次收購(gòu)讓我們能夠?qū)⑺械奶摂M化功能從主處理器上卸載下來(lái)。我們不再使用昂貴的 x86 核心來(lái)處理網(wǎng)絡(luò)虛擬化、虛擬機(jī)虛擬化、存儲(chǔ)虛擬化等任務(wù)。通過(guò)將這些功能從處理器中分離出去,我們?yōu)榭蛻魩?lái)了顯著的性能提升?,F(xiàn)在,客戶可以從 EC2 實(shí)例中獲得媲美裸金屬服務(wù)器的性能,同時(shí)我們的安全架構(gòu)也遠(yuǎn)超同行,這一點(diǎn)與其他任何云服務(wù)商在其產(chǎn)品中采用的方式都截然不同。時(shí)至今日,也就是十年后,這依然是我們一個(gè)極為重要的差異化優(yōu)勢(shì)。
在此基礎(chǔ)上,我們決定更進(jìn)一步,著手打造一款通用處理器。我們選擇了 ARM 核心架構(gòu),最終研發(fā)出了名為 Graviton 的定制 ARM 處理器。我認(rèn)為,Graviton2 是我們第一款真正達(dá)到企業(yè)級(jí)標(biāo)準(zhǔn)的通用處理器,并取得了巨大的成功。事實(shí)上,在我們最重要的客戶中,絕大多數(shù)都已將部分甚至全部的 CPU 工作負(fù)載遷移到了 Graviton 上。當(dāng)然,為了給客戶提供充分的選擇,我們依然銷售大量的 Intel 處理器和 AMD 處理器。但 Graviton 作為一個(gè)高性價(jià)比選項(xiàng),優(yōu)勢(shì)非常明顯。以我們當(dāng)前最新一代的 Graviton4 處理器為例,其絕對(duì)性能比市面上頂級(jí)的 x86 處理器還要快 20%,而價(jià)格卻要低 20%。這對(duì)客戶而言是極具吸引力的價(jià)值主張。當(dāng)然,也有些工作負(fù)載仍然依賴于為 Intel 或 AMD 平臺(tái)特定優(yōu)化的代碼或設(shè)計(jì),許多客戶也依然在這些平臺(tái)上運(yùn)行,并獲得了出色的性能,他們對(duì)此非常滿意。
時(shí)間快進(jìn)到大約五年前,我們預(yù)見(jiàn)到 AI 工作負(fù)載的興起——當(dāng)時(shí)還不是生成式 AI,而是傳統(tǒng)的 AI。我們意識(shí)到,應(yīng)該著手研發(fā)自己的 AI 芯片,以補(bǔ)充現(xiàn)有的產(chǎn)品線。我們是全球第一家在云環(huán)境中提供 Nvidia 產(chǎn)品的服務(wù)商,因此我們親眼見(jiàn)證了其廣受歡迎的程度,同時(shí)也認(rèn)為客戶可能需要 Nvidia GPU 之外的替代方案。因此,我們著手打造了第一款 AI 加速器芯片 Inferentia。這款芯片專門用于推理,功耗相對(duì)較低。事實(shí)證明,它最大的客戶是 Alexa。通過(guò)使用 Inferentia,Alexa 團(tuán)隊(duì)在處理用戶語(yǔ)音交互時(shí)的推理成本降低了約 70%。那一刻,我們意識(shí)到自己正走在一條正確的道路上。隨后,我們開(kāi)發(fā)了第一代我們定位為訓(xùn)練芯片的 Trainium 1。我們從中積累了大量經(jīng)驗(yàn),其主要目的其實(shí)是建立軟件生態(tài)系統(tǒng),讓開(kāi)發(fā)者能夠?yàn)槲覀兊男酒帉懗绦颉,F(xiàn)在,我們已經(jīng)推出了第二代產(chǎn)品 Trainium 2。
盡管如此,如今在 AWS 上,絕大多數(shù)客戶運(yùn)行的仍然是 Nvidia 的方案,我們相信這種情況在未來(lái)很長(zhǎng)一段時(shí)間內(nèi)都不會(huì)改變。Nvidia 擁有出色的團(tuán)隊(duì)、卓越的產(chǎn)品和強(qiáng)大的執(zhí)行力,我們的許多客戶也確實(shí)非常享受并習(xí)慣于使用其生態(tài)系統(tǒng)。
(關(guān)于CUDA護(hù)城河)CUDA 絕對(duì)是一款卓越的軟件產(chǎn)品。它為開(kāi)發(fā)者提供了一個(gè)與芯片編程的優(yōu)秀接口,非常出色。但同時(shí),我們一些最大的客戶非常青睞 Trainium 帶來(lái)的性價(jià)比優(yōu)勢(shì)。像 Anthropic 這樣的公司正在積極擁抱并大規(guī)模使用 Trainium。我們自己也在底層使用 Trainium 來(lái)支持 Bedrock 平臺(tái)的許多模型,尤其是在無(wú)服務(wù)器推理的場(chǎng)景下,客戶無(wú)需關(guān)心底層芯片,我們就能將成本與性能的優(yōu)勢(shì)直接交付給他們。因此,我們認(rèn)為,為客戶提供選擇的權(quán)利是極其重要的,未來(lái)我們也將持續(xù)增加更多選項(xiàng),努力為客戶創(chuàng)造更多價(jià)值。
(關(guān)于出售自研芯片)我的原則是,永遠(yuǎn)不說(shuō)“絕不”。我認(rèn)為那是一種有趣的商業(yè)模式,或許未來(lái)某天我們也會(huì)這么做。但目前,我們的芯片只在自有環(huán)境中使用,這能帶來(lái)諸多好處,其中最關(guān)鍵的一點(diǎn)就是極大地簡(jiǎn)化了復(fù)雜性。你想想,如果你要研發(fā)一款商用芯片,也就是要在不同環(huán)境中運(yùn)行的產(chǎn)品,你就必須為各種不同的服務(wù)器平臺(tái)、數(shù)據(jù)中心環(huán)境做適配,還要操心固件更新等一系列問(wèn)題。而我只需要為一種環(huán)境進(jìn)行設(shè)計(jì):它運(yùn)行在 AWS 的數(shù)據(jù)中心,部署在 AWS 的服務(wù)器上,連接著 AWS 的網(wǎng)絡(luò)。這是一個(gè)高度簡(jiǎn)化的技術(shù)棧。對(duì)外銷售產(chǎn)品會(huì)引入巨大的復(fù)雜性。但話又說(shuō)回來(lái),我永遠(yuǎn)不會(huì)把話說(shuō)死。
(關(guān)于收購(gòu)Annapurna的洞察)我們欣賞那個(gè)團(tuán)隊(duì)的一個(gè)重要原因,就是他們極具使命感,并且能與 Amazon 的文化完美融合。當(dāng)時(shí),正如我之前提到的,我們正構(gòu)思將虛擬化功能轉(zhuǎn)移到一張專門的卸載卡上。我們環(huán)顧市場(chǎng),想看看誰(shuí)在做類似的產(chǎn)品。結(jié)果發(fā)現(xiàn),根本沒(méi)人有這個(gè)想法,自然也就沒(méi)有這樣的產(chǎn)品。但 Annapurna 當(dāng)時(shí)正在研發(fā)一種可以提供網(wǎng)絡(luò)虛擬化功能的高性能網(wǎng)卡,上面搭載了可進(jìn)行通用編程的 ARM 核心。在研究這款產(chǎn)品時(shí),我們萌生了一個(gè)想法:或許也可以利用它來(lái)卸載 EBS 卷 (我們的外部塊存儲(chǔ)產(chǎn)品) 的虛擬化。于是,我們開(kāi)始與他們探討方案的可行性。我們就像合作伙伴一樣,與當(dāng)時(shí)還是初創(chuàng)公司的他們共同進(jìn)行設(shè)計(jì),合作過(guò)程中我們發(fā)現(xiàn)彼此的團(tuán)隊(duì)一拍即合。他們極其聰明,富有遠(yuǎn)見(jiàn),堅(jiān)韌不拔,并且始終以客戶為中心,對(duì)未來(lái)的構(gòu)想也非常宏大。當(dāng)我們意識(shí)到這背后蘊(yùn)藏的巨大機(jī)遇時(shí),便決定發(fā)起收購(gòu)。這無(wú)疑是我們有史以來(lái)最成功的一筆收購(gòu)。坦率地說(shuō),我認(rèn)為這是商業(yè)史上最成功的收購(gòu)案之一。而且值得一提的是,十年后的今天,當(dāng)時(shí)團(tuán)隊(duì)的大部分核心成員仍然在 Amazon 工作。這正體現(xiàn)了我們?cè)谶M(jìn)行收購(gòu)時(shí)非??粗氐囊稽c(diǎn):你是否真正認(rèn)同我們想要共同成就的事業(yè)?我們欣賞 Annapurna 的地方在于,他們渴望與我們共同成就一番偉大的事業(yè),共同建設(shè) AWS。我們對(duì)此充滿激情,他們也同樣如此,所以直到今天他們?nèi)耘c我們并肩作戰(zhàn)。
06
“單一模型主導(dǎo)一切”是過(guò)時(shí)觀點(diǎn)
當(dāng)您評(píng)估一個(gè)新模型并決定是否為其提供推理服務(wù)時(shí),決策過(guò)程是怎樣的?關(guān)于模型市場(chǎng)的未來(lái),OpenAI的一些人認(rèn)為將是一個(gè)全能模型的時(shí)代,但我個(gè)人傾向于我們將擁有更多專業(yè)化的模型,您對(duì)此有何看法?
Matt Garman:雖然在當(dāng)前快速擴(kuò)張的階段,我們必須做出一些資源上的權(quán)衡,但我們的最終愿景是為客戶提供每一個(gè)可用的模型。我希望客戶能夠從全世界所有最頂尖的模型中自由選擇。我認(rèn)為未來(lái)模型的數(shù)量會(huì)極其龐大。當(dāng)然,由于構(gòu)建成本高昂,真正的大型前沿模型可能只有少數(shù)幾個(gè),但與此同時(shí),會(huì)有大量針對(duì)特定用途構(gòu)建的模型。事實(shí)上,僅在上個(gè)月,我們就剛剛在 Bedrock 平臺(tái)上引入了幾家新的初創(chuàng)公司,例如開(kāi)發(fā) AI Agent 工作流的 Writer,以及專注于視頻理解的 12 Labs。未來(lái)我們會(huì)不斷引入更多合作伙伴。我們還有像 Poolside 這樣專注于代碼生成的客戶,形成了龐大的長(zhǎng)尾生態(tài)。Stability 在持續(xù)推出有趣的圖像和視頻生成模型,而 Luma 則擁有目前市面上最頂尖的視頻生成模型之一,非常出色。因此,我們會(huì)繼續(xù)在 Bedrock 上添加和支持各類模型,我們對(duì)模型的種類不設(shè)限制,希望能支持所有開(kāi)發(fā)者。這與我們 AWS Marketplace 的理念如出一轍。
你可以把模型類比為 SaaS 應(yīng)用或其他軟件,我們的目標(biāo)就是讓所有應(yīng)用——從 Salesforce、ServiceNow 這樣的大型企業(yè)級(jí)應(yīng)用,到僅由一兩人團(tuán)隊(duì)開(kāi)發(fā)的小型應(yīng)用,都能在 Marketplace 上架。我們的目標(biāo),就是為客戶提供世界上所有的模型。當(dāng)然,這需要模型提供方的合作,所以并非所有模型目前都已上線,有些模型仍由其他平臺(tái)獨(dú)家提供。但假以時(shí)日,我們希望能將一切變?yōu)榭赡堋?/p>
(關(guān)于單一模型與專業(yè)模型之爭(zhēng))“單一模型主導(dǎo)一切”的觀點(diǎn),大概是兩三年前的主流看法。而我們從生成式AI發(fā)展之初就一直認(rèn)為:客戶需要使用多種模型。觀察當(dāng)今大多數(shù)客戶的系統(tǒng),你會(huì)發(fā)現(xiàn)他們就在使用很多模型。通常,他們會(huì)用一個(gè)大型的頂級(jí)模型進(jìn)行推理和規(guī)劃,然后將具體任務(wù)分派給那些更擅長(zhǎng)理解特定工作流程的專業(yè)模型。這些專業(yè)模型可能是在 Llama 模型基礎(chǔ)上定制微調(diào)的,也可能是從 Anthropic 或 Nova 模型蒸餾而來(lái)的??蛻粜枰诔杀竞湍芰χg進(jìn)行權(quán)衡,所以他們實(shí)際使用的是一種混合各類專家模型的系統(tǒng)。我認(rèn)為,這一趨勢(shì)目前尚處于早期階段。我們看到,現(xiàn)在許多企業(yè)都希望模型能深度理解他們自身的數(shù)據(jù)集。因此,他們會(huì)和我們探討如何進(jìn)行更好的微調(diào),從而讓模型真正理解他們的業(yè)務(wù)數(shù)據(jù)。比如在保險(xiǎn)或支付等工作流程中,企業(yè)對(duì)其特定領(lǐng)域、客戶和業(yè)務(wù)流程有深入的了解,并希望模型也具備這些知識(shí)。他們需要一個(gè)通用模型來(lái)提供強(qiáng)大的基礎(chǔ)智能,但同時(shí)希望用自己的數(shù)據(jù)去優(yōu)化它。此外,他們還希望在成本和性能間取得平衡,將某些任務(wù),例如圖像生成,交給專門的模型完成,而不是全部依賴那個(gè)通用模型。我們發(fā)現(xiàn),這樣的應(yīng)用模式正變得越來(lái)越普遍。
此外,我認(rèn)為隨著我們進(jìn)入一個(gè)更加以AI Agent為中心的世界,模型固然至關(guān)重要,它是驅(qū)動(dòng)這一切的引擎,但并非全部。如今,大家之所以如此追捧模型開(kāi)發(fā)者,是因?yàn)檫@個(gè)領(lǐng)域新穎又有趣。但我認(rèn)為,我們正快速進(jìn)入這樣一個(gè)時(shí)代:人們真正需要的是在底層調(diào)用模型來(lái)完成特定任務(wù)的應(yīng)用程序。為此,你需要考慮應(yīng)用框架、工作流程以及各種為實(shí)現(xiàn)特定業(yè)務(wù)目標(biāo)而定制的模塊。你需要為這個(gè)目標(biāo)整合不同的組件。例如,像 ADP 這樣處理薪資發(fā)放的公司,其工作流程與 Netflix 管理電影制作的工作流程截然不同。既然是不同的工作流程,就需要有定制化的設(shè)計(jì)來(lái)適配。因此,在與客戶的交流中我們發(fā)現(xiàn),人們能從 AI中獲得的大部分投資回報(bào),將來(lái)自那些能夠代為執(zhí)行實(shí)際工作的 AI Agent 工作流程。而這些工作流程需要一整套全新的能力,例如,你需要管理系統(tǒng)的內(nèi)存、管理交互過(guò)程、需要有操作的審計(jì)日志,以及一系列根據(jù)具體業(yè)務(wù)定制的功能模塊。
07
模型選擇開(kāi)源是一種商業(yè)模式選擇,與技術(shù)是否領(lǐng)先沒(méi)有必然聯(lián)系
如何看待開(kāi)源與閉源路線的權(quán)衡,以及AWS與Anthropic、OpenAI、Meta等公司的合作關(guān)系?您是否認(rèn)為AWS會(huì)打造一個(gè)最前沿的模型來(lái)與閉源實(shí)驗(yàn)室競(jìng)爭(zhēng)?如果AWS真的這么做,與Anthropic或Meta的關(guān)系會(huì)發(fā)生變化嗎?許多人認(rèn)為模型定價(jià)本質(zhì)上是一場(chǎng)競(jìng)相壓價(jià)的游戲,最終將趨同于芯片和電力成本,您對(duì)此有何看法?最后,開(kāi)源模型在基準(zhǔn)測(cè)試上似乎總是落后閉源模型三到六個(gè)月,您認(rèn)為這個(gè)趨勢(shì)會(huì)持續(xù)嗎?
Matt Garman:我們希望能與所有公司合作,并且我們與他們都建立了良好的合作關(guān)系。實(shí)際上,我認(rèn)為這些模型大多是開(kāi)放權(quán)重,而非開(kāi)源。問(wèn)題的核心在于,用戶能在多大程度上根據(jù)自己的應(yīng)用場(chǎng)景去定制化這個(gè)模型。像 Llama、Mistral 等模型的一大優(yōu)勢(shì)就是提供了高度的定制化能力。你可以引入自己的數(shù)據(jù)。真正的價(jià)值在于,將你自己的數(shù)據(jù)與模型結(jié)合,根據(jù)目標(biāo)應(yīng)用場(chǎng)景來(lái)強(qiáng)化模型能力,并最終形成一個(gè)定制化的工作流程。無(wú)論是直接提供開(kāi)放權(quán)重讓你自己動(dòng)手,還是通過(guò) API 讓你能對(duì)所謂的“閉源”模型進(jìn)行蒸餾或微調(diào),你實(shí)際上都可以按自己的需求去定制它。這在某種程度上就是我們通過(guò) Nova 提供的能力,你可能看不到模型權(quán)重,但依然可以進(jìn)行大量的定制化。這也是現(xiàn)在有些人非常喜歡使用 Nova 的原因。我確實(shí)認(rèn)為,未來(lái)每個(gè)人都會(huì)想要定制自己的模型。至于用戶是選擇通過(guò) API、尋求專業(yè)服務(wù),還是直接獲取權(quán)重自行定制,這僅僅是定價(jià)以及托管環(huán)境不同所帶來(lái)的差異。但從根本上說(shuō),人們都希望定制模型,我相信所有模型最終都會(huì)以某種形式允許用戶這樣做。
(關(guān)于自研前沿模型)我們始終認(rèn)為,為客戶提供選擇至關(guān)重要。我們相信,通過(guò)我們正在打造的 Nova,能夠提供一些獨(dú)特且差異化的能力,并對(duì)其已取得的成果感到非常興奮。同時(shí),我們也非常珍視與眾多在 Bedrock 平臺(tái)上運(yùn)行的伙伴,例如 Anthropic,的合作關(guān)系。因此,我們認(rèn)為,為客戶提供豐富的模型組合至關(guān)重要。這在今天非常重要,未來(lái)只會(huì)更加重要。所以,只要我們認(rèn)為能為客戶持續(xù)提供差異化的能力,我們就會(huì)繼續(xù)在該領(lǐng)域投資。
(關(guān)于與合作伙伴的競(jìng)合關(guān)系)亞馬遜有一項(xiàng)非常出色的能力,這也是過(guò)去 19 年來(lái)我在 AWS 引以為傲的成就之一:我們建立了一個(gè)獨(dú)特的合作伙伴生態(tài)系統(tǒng)。在這個(gè)生態(tài)系統(tǒng)中,我們與合作伙伴建立信任,有時(shí)也會(huì)與他們競(jìng)爭(zhēng),但我們始終堅(jiān)持共同服務(wù)客戶。我希望并相信,在 AI 模型這個(gè)領(lǐng)域也會(huì)如此。從一開(kāi)始我們就清楚,會(huì)有人在我們的平臺(tái)之上構(gòu)建服務(wù),我們構(gòu)建我們的能力,他們也構(gòu)建他們的能力,這其中難免會(huì)產(chǎn)生沖突。有時(shí),即便是像 Snowflake 或 MongoDB 這樣的優(yōu)秀合作伙伴,也存在競(jìng)爭(zhēng)關(guān)系,類似情況還有很多。再比如在聯(lián)絡(luò)中心領(lǐng)域,像 Genesis 這樣的客戶,他們與我們的 Connect 產(chǎn)品存在競(jìng)爭(zhēng),但同時(shí)他們也是我們非常出色的合作伙伴。他們?cè)谖覀兊钠脚_(tái)上構(gòu)建業(yè)務(wù),而我們承諾:絕不會(huì)在任何方面讓合作伙伴處于劣勢(shì)。我們會(huì)為他們提供最好的計(jì)算、存儲(chǔ)和模型資源。我們不會(huì)因?yàn)槟銟?gòu)建了與我們競(jìng)爭(zhēng)的產(chǎn)品,就不給你優(yōu)惠的價(jià)格。只要你有相應(yīng)的業(yè)務(wù)體量,業(yè)務(wù)發(fā)展良好,并且我們的客戶對(duì)此感興趣,我們就會(huì)給你一個(gè)極具競(jìng)爭(zhēng)力的價(jià)格。實(shí)際上,我們已經(jīng)與許多這類合作伙伴建立了非常成功的市場(chǎng)推廣策略。坦白說(shuō),我們也是花了一段時(shí)間才摸索出正確的方法:如何讓一個(gè)團(tuán)隊(duì)可以與對(duì)手激烈競(jìng)爭(zhēng),而另一個(gè)團(tuán)隊(duì)又能成為同一個(gè)對(duì)手在全球范圍內(nèi)最好的渠道伙伴。這正是我們錘煉出的核心能力。這種能力至關(guān)重要,我相信在當(dāng)前的情況下,它將繼續(xù)適用。
(關(guān)于模型定價(jià))將趨同于芯片和電力成本,我認(rèn)為這不太可能成為現(xiàn)實(shí)。這些模型如今并非同質(zhì)化商品,我看不出未來(lái)它們?yōu)楹螘?huì)變成那樣。以云計(jì)算為例,當(dāng)我們最初推出云服務(wù)時(shí),所有人都告訴我們,這不過(guò)是一兩年的事,云服務(wù)很快就會(huì)變成同質(zhì)化的商品。但時(shí)至今日,它并沒(méi)有。不同的云服務(wù)在可用性、功能和能力上都存在差異。我們必須持續(xù)創(chuàng)新,通過(guò)提供新的性價(jià)比優(yōu)勢(shì)和功能來(lái)贏得客戶的青睞。我認(rèn)為模型提供商也是如此。如果你今天去問(wèn)客戶,他們是否認(rèn)為 Llama、Claude 和 GPT 是完全一樣的同質(zhì)化商品,他們肯定會(huì)說(shuō):“當(dāng)然不是,它們?cè)诤芏喾矫娑冀厝徊煌?。?你可以繼續(xù)問(wèn)下去,它們和 Luma 的模型一樣嗎?當(dāng)然不一樣。你會(huì)發(fā)現(xiàn)每個(gè)模型都有其獨(dú)特性。即便是開(kāi)源模型,比如你問(wèn)大家 Mistral 和 Llama 是否同質(zhì)化,我想他們也會(huì)說(shuō)不是,因?yàn)樵诓煌膽?yīng)用場(chǎng)景下,人們會(huì)各有偏好。所以,我認(rèn)為所有人都必須不斷增加新功能、持續(xù)創(chuàng)新。你所運(yùn)營(yíng)的云環(huán)境以及不斷迭代能力的模型本身,都在創(chuàng)造巨大的價(jià)值。這里面有很大的價(jià)值空間,人們完全可以從中盈利。
(關(guān)于開(kāi)源與閉源的差距)其實(shí),成為閉源或開(kāi)源模型,本身并沒(méi)有什么內(nèi)在的優(yōu)劣之分,這純粹是一種選擇。我認(rèn)為,中國(guó)的模型開(kāi)發(fā)者開(kāi)源了他們最好的模型,我們的許多客戶都喜歡用 DeepSeek,Qwen 也是一個(gè)非常好的模型,還有一些其他模型都給我留下了深刻的印象。你看,這只是一種選擇。OpenAI 也開(kāi)源了他們的模型,雖然是一個(gè)比其前沿模型規(guī)模更小的版本。Anthropic 則選擇不開(kāi)源任何模型。而 Llama (Meta) 選擇開(kāi)源其所有模型。那么,Llama 的落后是因?yàn)樗x擇了開(kāi)源嗎?我認(rèn)為不是。只是碰巧,他們目前的模型還沒(méi)能趕上最頂尖的水平。但我相信 Meta 正計(jì)劃做到這一點(diǎn)。至于他們未來(lái)會(huì)不會(huì)開(kāi)源那個(gè)頂尖模型,我無(wú)從知曉。但這背后沒(méi)有必然規(guī)律,這只是一種關(guān)乎價(jià)值創(chuàng)造的選擇,取決于你作為一家企業(yè)的目標(biāo)是什么,以及你認(rèn)為價(jià)值捕獲點(diǎn)在哪里。未來(lái)究竟會(huì)如何,誰(shuí)也說(shuō)不準(zhǔn)?;蛟S您的猜測(cè)比我的更準(zhǔn),我也不知道。我認(rèn)為 Llama 的情況或許有所不同,但對(duì)于一些模型,特別是來(lái)自中國(guó)的那些模型,這個(gè)說(shuō)法是完全正確的。
08
在真實(shí)應(yīng)用場(chǎng)景中評(píng)估模型的真正標(biāo)準(zhǔn)
現(xiàn)在的模型在很多基準(zhǔn)測(cè)試上表現(xiàn)已接近飽和,這是否意味著我們需要一套新的基準(zhǔn)測(cè)試?您理想中的新基準(zhǔn)測(cè)試是怎樣的?您個(gè)人在拿到一個(gè)新模型時(shí),評(píng)測(cè)標(biāo)準(zhǔn)又是怎樣的?
Matt Garman:我認(rèn)為,基準(zhǔn)測(cè)試特別適合用來(lái)衡量同質(zhì)化商品。比如,如果你想衡量一塊 SSD 的速度,基準(zhǔn)測(cè)試就非常有效。你可以測(cè)出它的 IO 速率、流式吞吐率,基本上就能全面了解其性能。但是,系統(tǒng)的復(fù)雜性越高,基準(zhǔn)測(cè)試的效果就越差。以數(shù)據(jù)庫(kù)早期發(fā)展為例,當(dāng)時(shí)大家普遍使用像 TPC-B 這樣的基準(zhǔn)測(cè)試。但現(xiàn)在,你幾乎聽(tīng)不到任何數(shù)據(jù)庫(kù)廠商再提它了,因?yàn)榇蠹叶家呀?jīng)過(guò)了那個(gè)只看基準(zhǔn)測(cè)試的階段,轉(zhuǎn)而需要結(jié)合自己的應(yīng)用場(chǎng)景來(lái)進(jìn)行測(cè)試。我認(rèn)為,AI 模型領(lǐng)域最終也會(huì)走向這個(gè)方向,你必須親自測(cè)試,找出哪個(gè)模型最適合你的特定需求。因?yàn)榛鶞?zhǔn)測(cè)試有一個(gè)特點(diǎn):一旦一個(gè)問(wèn)題可以被基準(zhǔn)測(cè)試所定義和解決,它就不再是那個(gè)最核心、最有趣的問(wèn)題了。我認(rèn)為我們正迅速接近這個(gè)臨界點(diǎn)。因?yàn)樽屇P歪槍?duì)性地在基準(zhǔn)測(cè)試上取得高分其實(shí)相當(dāng)容易,但這并不能讓它成為最好用的模型。
(關(guān)于個(gè)人評(píng)測(cè)標(biāo)準(zhǔn))我可能不是評(píng)測(cè)這些模型的最佳人選,因?yàn)槲艺J(rèn)為評(píng)估模型需要綜合考量多個(gè)方面。我個(gè)人的測(cè)試方法,是將其置于實(shí)際應(yīng)用中進(jìn)行評(píng)估。當(dāng)我對(duì)一個(gè)模型進(jìn)行初步測(cè)試時(shí),我喜歡把它作為某個(gè)應(yīng)用程序的一部分來(lái)使用。你可以從研究能力的角度來(lái)評(píng)估它,比如,它在多大程度上能整合各種想法,將其撰寫成文檔,并最終生成邏輯連貫的內(nèi)容。這是我喜歡測(cè)試的方面之一,因?yàn)樗軝z驗(yàn)?zāi)P偷亩鄠€(gè)維度:信息檢索能力、提出新創(chuàng)意的能力,以及交互的流暢度。速度也是其中一個(gè)考量因素,當(dāng)我想要了解一個(gè)新模型的表現(xiàn)時(shí),速度是我最關(guān)注的指標(biāo)之一。此外,我個(gè)人也喜歡測(cè)試這些模型的集成情況,所以評(píng)估的不僅是模型本身,還有它與系統(tǒng)集成的效果。以我們的合作伙伴 Perplexity 為例,有時(shí)你甚至不知道他們背后用的是哪個(gè)模型。我認(rèn)為他們做得非常出色,擁有一個(gè)極佳的用戶界面 ,它在回答問(wèn)題和進(jìn)行后臺(tái)工作時(shí),會(huì)讓你感知到它正在“思考”。我認(rèn)為,UI 的重要性正日益凸顯,幾乎與模型本身同等重要。Perplexity 團(tuán)隊(duì)在 UI 設(shè)計(jì)以及將其融入搜索體驗(yàn)方面做得非常出色。所以,我認(rèn)為測(cè)試模型不僅僅是進(jìn)行純粹的基準(zhǔn)測(cè)試,盡管那些也很有趣。實(shí)際上,延遲有時(shí)也是關(guān)鍵。如果一個(gè)模型速度太慢,那就無(wú)法滿足實(shí)際應(yīng)用場(chǎng)景的需求。因此,對(duì)于如何測(cè)試模型這個(gè)問(wèn)題,我并沒(méi)有一個(gè)標(biāo)準(zhǔn)答案,我更傾向于將模型應(yīng)用到我們嘗試解決的各種具體問(wèn)題中,然后看哪個(gè)能帶來(lái)更好的結(jié)果。
您認(rèn)為“速度”這個(gè)因素被低估了,大家都在談?wù)撡|(zhì)量,但很多應(yīng)用場(chǎng)景中獲得答案的速度至關(guān)重要,您怎么看?
Matt Garman:在某些情況下確實(shí)如此。如今,消費(fèi)者的大多數(shù)用例都是實(shí)時(shí)的,對(duì)吧?你提出一個(gè)問(wèn)題,就希望能立即得到答案。所以,速度在一定程度上總是很重要的。但是,我們?cè)賮?lái)看 ADP 這樣的例子。如果你有一個(gè) AI Agent負(fù)責(zé)處理所有的工資單并執(zhí)行相關(guān)的全部工作流,那么你實(shí)際上會(huì)更關(guān)心準(zhǔn)確性,而不是速度。因?yàn)檫@些任務(wù)可以在月底統(tǒng)一處理,你可能有好幾天的時(shí)間來(lái)完成。它并不需要瞬間完成,你知道任務(wù)的時(shí)間點(diǎn),可以從容處理,但準(zhǔn)確性是第一位的。實(shí)際上,我們幾周前剛發(fā)布了一項(xiàng)功能,它能夠采用一種名為“自動(dòng)推理” 的方法,這是一種基于數(shù)學(xué)證明的方式來(lái)執(zhí)行一系列規(guī)則,并將其應(yīng)用于大語(yǔ)言模型,是的,超級(jí)酷。這正是一個(gè)追求準(zhǔn)確性而非速度的典型例子。在這種情況下,或者說(shuō)在許多 AI Agent工作流的場(chǎng)景下,異步模式是完全可以接受的。即便是在編程領(lǐng)域,情況也是如此。如今,當(dāng)你在進(jìn)行實(shí)時(shí)交互式編程時(shí),延遲至關(guān)重要,對(duì)吧?你輸入代碼,就期望馬上得到反饋。但在一個(gè)以 AI Agent為中心的工作模式中,你可以對(duì)它說(shuō):“好了,你去執(zhí)行這項(xiàng)任務(wù),再去執(zhí)行那項(xiàng)任務(wù),然后再執(zhí)行這項(xiàng)任務(wù)?!?在此期間,你可以繼續(xù)處理其他工作。AI Agent可能在一小時(shí)后返回結(jié)果,這完全沒(méi)問(wèn)題,因?yàn)槟阏诿e的事情。當(dāng)它返回結(jié)果后,你再來(lái)審閱。當(dāng)然,如果它三周后才返回結(jié)果,那可能就太慢了。所以延遲在某種程度上始終是需要考慮的。但我確實(shí)認(rèn)為,如果因?yàn)槿蝿?wù)是異步的,或者因?yàn)槟P涂梢曰ǜL(zhǎng)的時(shí)間思考從而給你帶來(lái)成本更低、質(zhì)量更高的結(jié)果,這完全取決于具體場(chǎng)景。因此,對(duì)于消費(fèi)者的用例來(lái)說(shuō),其實(shí)時(shí)性和同步性的本質(zhì)決定了速度的絕對(duì)優(yōu)先。但我認(rèn)為,對(duì)于大量的企業(yè)用例而言,異步交付結(jié)果是可以接受的。
09
AI Agent將解放人力,但目前尚未實(shí)現(xiàn)完全的自主運(yùn)行
在哪些用例中,已經(jīng)出現(xiàn)了可規(guī)模化、結(jié)果可靠、并能帶來(lái)明確投資回報(bào)的AI Agent應(yīng)用?最后,對(duì)于那些擔(dān)心工作被AI取代的人,您會(huì)對(duì)他們說(shuō)些什么鼓勵(lì)的話?
Matt Garman:我可以從幾個(gè)方面來(lái)說(shuō)明。首先是我之前提到過(guò)的編程用例。我認(rèn)為 AI Agent輔助編程擁有巨大的機(jī)會(huì),能夠真正釋放開(kāi)發(fā)者的潛力,讓他們創(chuàng)造出更多價(jià)值。所以我對(duì) AI Agent在編程領(lǐng)域的應(yīng)用感到非常興奮,我們?cè)谶@個(gè)領(lǐng)域看到了巨大的商業(yè)潛力和客戶需求。其次,一直以來(lái)阻礙 AI Agent 發(fā)展的一個(gè)難題是,從頭構(gòu)建一個(gè) AI Agent 本身就相當(dāng)困難。而且即使你構(gòu)建出來(lái)了,又該如何以可擴(kuò)展的方式去運(yùn)維它?當(dāng)然,你可以為自己構(gòu)建一些簡(jiǎn)單的、類似自動(dòng)化腳本的 AI Agent,比如“讀取我的郵件,然后把內(nèi)容整理到指定位置”。這些更像是簡(jiǎn)單的、基于規(guī)則的 AI Agent。但當(dāng)你要構(gòu)建一個(gè)企業(yè)級(jí)的 AI Agent 時(shí),管理起來(lái)就變得相當(dāng)復(fù)雜。
我們?cè)?Amazon Bedrock 中推出了一套名為 Agent Core 的功能,它為開(kāi)發(fā)者提供了一系列構(gòu)建模塊,用于打造可擴(kuò)展、安全、可審計(jì)、可衡量的 AI Agent。這些模塊包括:一個(gè)完全無(wú)服務(wù)器化的安全運(yùn)行時(shí)環(huán)境,它可以按需擴(kuò)展至成百上千個(gè)實(shí)例,也能在沒(méi)有任務(wù)時(shí)自動(dòng)縮減至零,并確保 AI Agent始終在一個(gè)完全隔離的安全容器中運(yùn)行。我們還內(nèi)置了短期和長(zhǎng)期記憶功能,使其能夠記住當(dāng)前和歷史的交互內(nèi)容。我們提供了 AI Agent網(wǎng)關(guān)等組件,允許 AI Agent與外部其他系統(tǒng)或其他 AI Agent進(jìn)行安全的身份驗(yàn)證和交互,你甚至可以托管一個(gè) MCP 服務(wù)器或處理其他復(fù)雜的交互場(chǎng)景,從而同時(shí)建立起安全和身份驗(yàn)證的雙重邊界。此外,我們還提供了內(nèi)置的流程管理和“可觀察性”功能,你可以方便地將監(jiān)控?cái)?shù)據(jù)接入 AWS 或第三方的服務(wù)。這是一個(gè)完全開(kāi)放的框架,它兼容任何模型,無(wú)論你使用 Gemini、OpenAI 還是 Bedrock 的模型,它也兼容任何主流框架,比如我們自家的開(kāi)源框架 Strands,或是 LangChain 等。
我們發(fā)現(xiàn),過(guò)去企業(yè)之所以沒(méi)有大規(guī)模構(gòu)建AI Agent工作流,是因?yàn)樗麄儽仨氉约捍罱ㄋ羞@些底層的基礎(chǔ)設(shè)施,這非常困難。現(xiàn)在有了 Agent Core,我們看到開(kāi)發(fā)者正蜂擁而至,開(kāi)始真正思考如何利用它來(lái)釋放業(yè)務(wù)潛力。我看到了它在處理企業(yè)工作流、提升個(gè)人生產(chǎn)力、市場(chǎng)營(yíng)銷、銷售等多個(gè)領(lǐng)域的應(yīng)用案例。幾乎每個(gè)行業(yè)的人們都在利用它構(gòu)建各種 AI Agent。當(dāng)然,目前這些 AI Agent工作流大多仍包含“人在回路” (human in the loop) 的環(huán)節(jié),尚未實(shí)現(xiàn)完全的自主運(yùn)行。但我已經(jīng)看到了一條清晰的路徑——未來(lái)它們將變得更加自主,從而真正地解放人力,讓人們能夠成就更多。
(給焦慮者的鼓勵(lì))我認(rèn)為這最終要回歸到核心:如何讓自己變得更有價(jià)值。這是一個(gè)不斷創(chuàng)造價(jià)值的世界,AI 和 AI Agent本身并不會(huì)創(chuàng)造價(jià)值,它們的價(jià)值在于能夠賦能員工,讓你們每個(gè)人都能創(chuàng)造更大的價(jià)值。如果一個(gè)人非常擅長(zhǎng)市場(chǎng)營(yíng)銷,我們希望他能專注于營(yíng)銷策略,而不是被組織營(yíng)銷活動(dòng)等繁雜的瑣事所困擾。如果一個(gè)人是出色的程序員,他真正的價(jià)值在于構(gòu)建卓越的應(yīng)用程序,而不僅僅是因?yàn)樗銮烧莆樟四骋婚T特定的編程語(yǔ)言。這正是人們需要去學(xué)習(xí)和提升的能力所在。你越是能夠?qū)W⒂诮鉀Q客戶的實(shí)際問(wèn)題,并學(xué)習(xí)如何利用這些新技術(shù)和新工具,我就越不擔(dān)心所謂的工作會(huì)消失,或者世界會(huì)變成一個(gè)只有機(jī)器人在工作的樣子。
| 文章來(lái)源:數(shù)字開(kāi)物
【AI技術(shù)與應(yīng)用交流群|僅限受邀加入】
AI算力領(lǐng)域TOP級(jí)從業(yè)者專屬圈層
√ 與頭部算力企業(yè)深度對(duì)話
√ 與AI上下游企業(yè)深度對(duì)話
√ 獲取一手全球AI與算力產(chǎn)業(yè)信息
√ 獲取AI熱點(diǎn)及前沿產(chǎn)業(yè)獨(dú)家信息
√ 隨時(shí)了解全球AI領(lǐng)域高管最新觀點(diǎn)及實(shí)錄全文
√ 有機(jī)會(huì)參與AI主題產(chǎn)業(yè)交流活動(dòng)
掃碼驗(yàn)證身份(需備注姓名/公司/職務(wù))
不止有 DeepSeek,更有 AI產(chǎn)業(yè)的未來(lái)!
? END?
【專欄】精品再讀
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.