智東西
作者 陳駿達
編輯 云鵬
這位擁有25億美元(約合人民幣179億元)身家的大學教授,為何還堅守在一線課堂?
智東西9月2日報道,近日,AI數(shù)據(jù)平臺Databricks在最新一輪融資后,估值突破1000億美元(約合人民幣7162億元),有望成為全球估值第四高的AI獨角獸,這也讓外界關注到其聯(lián)合創(chuàng)始人兼董事長、加州大學伯克利分校(后簡稱UCB)教授Ion Stoica,以及他橫跨產(chǎn)業(yè)與學術界的傳奇經(jīng)歷。
Stoica現(xiàn)年60歲,自2000年起開始在UCB任教,此后25年來均未離開這一校園。2010年至今,Stoica在UCB計算機學院參與了3所重要實驗室的創(chuàng)辦和管理。這些實驗室在大數(shù)據(jù)、云計算和AI時代貢獻了118個科研項目,其中不乏影響力廣泛、幾乎成為AI領域核心基礎設施的項目,如大數(shù)據(jù)框架Spark、分布式執(zhí)行框架Ray、大模型推理框架vLLM等。
▲Ion Stoica(圖源:YouTube)
他還通過親自參與創(chuàng)業(yè)、指導創(chuàng)業(yè)或是提供人脈與資金支持的方式,創(chuàng)辦或孵化了至少7家知名創(chuàng)企,分布于數(shù)據(jù)基礎設施、生成式AI等行業(yè)。
除了估值已經(jīng)突破1000億美元的Databricks,Stoica聯(lián)合創(chuàng)辦了估值10億美元的AI托管計算平臺Anyscale、估值6億美元的LMArena(大模型競技場)和估值3億美元的視頻流分析技術公司Conviva等企業(yè)。
Stoica是高性能AI與數(shù)據(jù)分析平臺Alluxio創(chuàng)始人李浩源、數(shù)據(jù)中心操作系統(tǒng)創(chuàng)企Mesosphere創(chuàng)始人Benjamin Hindman的博士生導師,這兩家創(chuàng)企均發(fā)源于開源項目,曾得到Stoica的指導。目前,Stoica還在大模型記憶技術創(chuàng)企Letta擔任顧問。
盡管取得了商業(yè)上的成功,但Stoica仍然心系教育、科研。今年秋天,Stoica將繼續(xù)留在課堂,教授操作系統(tǒng)和系統(tǒng)編程的本科課程。
通過在硅谷的人脈,Stoica給自己的實驗室拉來了極為豪華的贊助商陣容,包括英偉達、Meta、螞蟻集團、AMD、谷歌、亞馬遜、華為等知名企業(yè)。他還給將自己創(chuàng)業(yè)獲得的資產(chǎn)投入科研,給實驗室提供資金支持。
在向《福布斯》分析自己成功的原因時,Stoica稱,這要歸功于他對科研的專注:“這是一種創(chuàng)造的過程,不斷探索新想法。”在本文中,我們將回顧Stoica傳奇的創(chuàng)業(yè)與科研經(jīng)歷,并了解他對自己成功經(jīng)歷的思考和總結(jié)。
一、師從北大計算機校友張暉,06年首次開啟創(chuàng)業(yè)
Stoica于2000年在卡耐基梅隆大學(后簡稱CMU)完成博士學業(yè),導師是該校史上最年輕的終身教授張暉(北大計算機學院84級院友)。
同年,他加入UCB,并從教至今。UCB地處硅谷,有極為濃厚的創(chuàng)業(yè)氛圍,Stoica也在2006年了自己的第一個創(chuàng)業(yè)項目——Conviva。
▲Conviva的創(chuàng)始團隊(圖源:Conviva官網(wǎng))
2006年,流媒體內(nèi)容逐漸興起,YouTube已經(jīng)成為主流平臺之一。Stoica與他的導師張暉看到了市場對在線視頻體驗優(yōu)化的需求,并在CMU和UCB的科研成果基礎之上開始創(chuàng)業(yè),聯(lián)合創(chuàng)辦了Conviva。
早期,Conviva專注于實時視頻流分析,成為全球最早實現(xiàn)視頻播放自適應的平臺之一。該公司通過AI技術識別視頻平臺的播放質(zhì)量問題,并收集用戶的觀看數(shù)據(jù)(包括正在觀看的內(nèi)容、用戶喜好等),形成分析報告。
Conviva的主要客戶包括美國福克斯公司(FOX)、NBC環(huán)球集團旗下的流媒體平臺Peacock等。
Stoica原本在Conviva擔任CTO一職,但目前已經(jīng)不在Conviva擁有正式管理層職位。他仍然留在董事會,每周都會與團隊見面。
成立以來,Conviva已經(jīng)完成了7輪融資,總?cè)谫Y額為1.1億美元。其上一輪融資于2017年完成,當時投后估值約為3億美元。
二、給大數(shù)據(jù)時代打造核心基礎設施,成果轉(zhuǎn)化為千億估值創(chuàng)企
在創(chuàng)辦Conviva的同時,Stoica也沒有停下學術與科研的腳步。UCB計算機科學學部有每5年成立一個合作實驗室的傳統(tǒng),Stoica深度參與了該學部近15年來成立的三大實驗室,帶領成員做出了頗具學術與行業(yè)影響力的成果。
2011年,UCB成立了AMP(算法、機器與人)實驗室。在官宣實驗室成立的演講中,Stoica稱,AMP實驗室希望通過緊密集成算法、機器和人力,實現(xiàn)對大數(shù)據(jù)的理解。
在其存續(xù)的5年間,AMP實驗室打造了25個科研項目,包括開源分布式資源管理框架Apache Mesos、開源分布式大數(shù)據(jù)處理框架Apache Spark、開源分布式數(shù)據(jù)編排平臺Alluxio(原名Tachyon)等,成為大數(shù)據(jù)基礎設施領域的重要貢獻者。
這三大開源項目,最后都轉(zhuǎn)化為創(chuàng)企:
Databricks(總?cè)谫Y208億美元,估值超1000億美元)
Databricks是Stoica參與創(chuàng)辦的第二家創(chuàng)企,主營業(yè)務是AI數(shù)據(jù)分析平臺。其創(chuàng)始團隊由七位加州大學伯克利分校的教授和研究生組成,大都來自Stoica所管理的AMP實驗室。
▲Databricks創(chuàng)始團隊,Stoica為左數(shù)第二位(圖源:Databricks)
2009年,Databricks的創(chuàng)始團隊開發(fā)出開源分布式大數(shù)據(jù)處理框架Spark,并不斷維護、更新這一項目,還一度創(chuàng)下了數(shù)據(jù)排序速度的世界紀錄。
在將Spark作為開源項目運營一段時間后,Databricks的聯(lián)合創(chuàng)始人、UCB副教授的Matei Zaharia稱,Stoica希望將Spark變成一家初創(chuàng)公司,以鼓勵用戶更認真地對待此類來自高校實驗室的研究。
2013年,Databricks正式成立。憑借著開源項目Spark的成功,Databricks在A輪融資時便獲得來自a16z的1400萬美元融資。2013年-2016年,Stoica擔任Databricks CEO一職,深度參與公司日常管理與決策。
他在2016年將CEO一職交棒給了曾在AMP實驗室擔任訪問學者的Ali Ghodsi。對于這一決定,他在接受《福布斯》采訪時說道:“超過這個時間就意味著離開伯克利,所以我必須做出選擇,我選擇了回去?!?/p>
如今,Databricks已經(jīng)成長為估值超過1000億美元的超級獨角獸,服務超過60%的財富500強企業(yè)。Stoica仍在這一公司擔任董事會執(zhí)行主席的職務。
▲Stoica擔任Databricks董事會執(zhí)行主席(圖源:Databricks)
Alluxio(總?cè)谫Y額7300萬美元,估值暫未披露)
Alluxio原名Tachyon,是一個以內(nèi)存為中心、容錯的虛擬分布式存儲系統(tǒng),旨在解決Apache Spark生態(tài)系統(tǒng)內(nèi)的數(shù)據(jù)共享挑戰(zhàn)。
2015年,Alluxio正式成立,早期投資者為a16z——這是一家與Stoica關系密切的投資機構。其創(chuàng)始人兼CEO李浩源在AMPLab完成了相關研究,論文指導者便包括其博士生導師Stoica。
▲Alluxio目前的管理團隊,上排左一為李浩源(圖源:Alluxio官網(wǎng))
隨著技術趨勢轉(zhuǎn)向混合云和多云架構以及AI,Alluxio不斷發(fā)展,為AI和數(shù)據(jù)密集型工作負載的數(shù)據(jù)訪問提供解決方案。如今,Alluxio的AI加速平臺為全球十大互聯(lián)網(wǎng)公司中的九家提供支持。
Alluxio已經(jīng)完成4輪融資,其最近一輪融資于2021年底完成,由高瓴創(chuàng)投領投,融資額達5000萬美元。不過,其估值暫時未對外披露。
Mesosphere/D2iQ(總?cè)谫Y2.5億美元,最高估值7.75億美元)
Mesosphere成立于2013年,Stoica的學生Benjamin Hindman在其中擔任CIPO(首席知識產(chǎn)權官)的職務。這家公司的主要技術來自于開源項目Apache Mesos,而Benjamin Hindman是這一項目的核心作者。
DCOS(數(shù)據(jù)中心操作系統(tǒng))是Mesosphere的核心產(chǎn)品。Mesosphere將數(shù)據(jù)中心抽象為“單一大機器”,通過分布式內(nèi)核調(diào)度和資源管理,為大規(guī)模計算與數(shù)據(jù)密集型工作負載提供統(tǒng)一的運行平臺。
2015年,Mesosphere宣布獲得a16z等頂級風投的投資。隨著容器化、微服務和云原生趨勢的興起,Mesosphere后續(xù)在產(chǎn)品上逐漸轉(zhuǎn)型,支持Kubernetes,并在2019年正式更名為D2iQ。D2iQ的解決方案主要面向混合云與企業(yè)級Kubernetes平臺,幫助客戶簡化云原生應用的部署與運維。
迄今為止,D2iQ融資總額接近2.5億美元,投資方包括a16z、Khosla創(chuàng)投、惠普等,其估值曾經(jīng)在2018年完成的D輪融資后達到7.75億美元。微軟、谷歌等都曾傳出有收購D2iQ的意向,但因D2iQ管理層反對而未能完成交易。
2023年底,D2iQ宣布終止運營,公司資產(chǎn)將進行清盤,并分配給債權人。
三、指導高性能分布式執(zhí)行框架Ray科研,衍生創(chuàng)企估值已達10億美元
2017年初,Stoica參與到了UCB RISE(實時智能安全執(zhí)行)實驗室的創(chuàng)建與管理工作中。當時,Stoica等人已經(jīng)意識到,數(shù)據(jù)生成、計算和執(zhí)行之間的循環(huán)正在閉合,AI已成現(xiàn)實,計算的影響正在擴展到世界的每一個角落。
RISE實驗室與AMP實驗室一脈相承,期望能在大數(shù)據(jù)分析的基礎上,進一步發(fā)展相關技術棧,幫助應用程序?qū)崟r地、智能地且安全地與環(huán)境進行交互。
在大規(guī)模機器學習和強化學習領域,RISE實驗室貢獻了超41個開源項目,其中影響力最大的當屬高性能分布式執(zhí)行框架Ray,這一項目成功轉(zhuǎn)化為創(chuàng)企Anyscale。
Anyscale(總?cè)谫Y2.59美元,估值10億美元)
2019年,Anyscale成立,創(chuàng)始團隊包括Stoica、Philipp Moritz(Stoica的博士生)和Robert Nishihara等人。Stoica目前在Anyscale擔任董事會執(zhí)行主席的職位。
Philipp Moritz和Robert Nishihara是Ray的主要作者,這一項目大幅度提升了分布式計算的易用性,讓開發(fā)者能夠用簡單的API,把單機Python程序擴展到大規(guī)模分布式環(huán)境。Stoica指導這兩位作者完成了Ray的相關研究。
▲Stocia與Anyscale其他聯(lián)合創(chuàng)始人的合影(圖源:Anyscale官網(wǎng))
Ray提供了統(tǒng)一的編程方式,開發(fā)者不必關心底層分布式細節(jié)。相比于傳統(tǒng)的Spark、Hadoop,Ray更靈活,支持低延遲的任務調(diào)度和多種計算模式(批處理、流式、在線推理等)。
這一項目在AI/ML領域影響力尤其大,業(yè)內(nèi)許多流行的庫都是基于Ray構建的,如Ray Tune超參數(shù)調(diào)優(yōu)框架、Ray RLlib強化學習庫等。
在此基礎上,Anyscale為Ray提供了完全托管計算平臺,添加了優(yōu)化、可觀察性、數(shù)據(jù)治理和開發(fā)人員工具等,使其成為運行Ray工作負載的最佳平臺之一。
目前,Uber、OpenAI、Shopify和亞馬遜等頭部企業(yè)的開發(fā)人員正在使用Ray構建機器學習平臺。Anyscale成立6年來共完成4輪融資,總?cè)谫Y額達2.59億美元。2022年完成C輪融資后,其最新估值為10億美元。
四、實驗室3年貢獻52個項目,幫大模型造擂臺、記憶庫
2022年,Stoica又推動了天空計算實驗室(Sky Computing Lab)的成立。天空計算是云平臺之上的一層,其目標是實現(xiàn)云之間的相互協(xié)作,讓應用程序能夠在任何云提供商上實現(xiàn)“一次寫入,隨處運行”。
天空計算實驗室近年來已經(jīng)貢獻了52個項目,打造了本輪生成式AI浪潮中重要的基礎設施,包括大模型推理引擎vLLM、AI作業(yè)框架SkiPilot、大模型評估平臺Chatbot Arena(現(xiàn)名LMArena)、視頻生成模型評估平臺Video Arena、智能體記憶系統(tǒng)MemGPT等,其中,LMArena和MemGPT已經(jīng)實現(xiàn)公司化運作。
LMArena(總?cè)谫Y1億美元,估值6億美元)
LMArena由Stoica和他的學生Wei-Lin Chiang、Anastasasios N. Angelopoulos等人聯(lián)合創(chuàng)辦,Stoica擔任LMArena的董事長。
這一平臺通過“人類偏好投票”方式,公開評估大語言模型性能。當用戶在這一平臺上提交提示詞后,會有兩個匿名模型作答,然后基于用戶選擇判斷哪個模型表現(xiàn)更佳。LMArena的數(shù)據(jù)與排行榜廣受業(yè)界關注,甚至成為不少模型發(fā)布前的重要參考。
目前,LMArena托管了400多個AI模型,平臺用戶投票數(shù)達到350多萬張。今年年初,LMArena完成1億美元的種子輪融資,領投機構為a16z,投后估值達6億美元。
融資完成后,LMArena團隊發(fā)布了全新設計的平臺,優(yōu)化了界面和投票流程,并逐步加入登錄、聊天記錄保存、WebDev Arena等功能模塊。
Letta(總?cè)谫Y1000萬美元,估值7000萬美元)
Letta成立于2024年,由天空計算實驗室的兩位博士生Sarah Wooders和Charles Packer創(chuàng)辦。其中,Stoica是Sarah Wooders的博士生導師,并在該公司擔任顧問。
▲Letta創(chuàng)始團隊(圖源:Letta)
Letta的核心技術源自MemGPT,后者是天空計算實驗室的一個開源項目。MemGPT提出了“大模型操作系統(tǒng)”的概念,專注于大模型的上下文管理和長期記憶能力,讓大模型變得“有狀態(tài)”(Stateful)。
2023年10月,MemGPT項目在正式發(fā)布論文和代碼之前,就憑借一份白皮書迅速走紅。該項目正式發(fā)布在GitHub上后,已經(jīng)收獲1.8萬星標收藏,有近2000個分支項目。
Letta目前的主要產(chǎn)品包括Letta云(打造和部署有狀態(tài)Agent的云平臺)和用于增強Agent處理外部文件能力的Letta文件系統(tǒng)。
2024年9月,Letta獲得1000萬美元種子輪融資,估值達7000萬美元。
五、靠拉贊助和創(chuàng)業(yè)反哺科研,80多名學生從中受益
Stoica過去15年內(nèi)主持工作的三所實驗室,擁有不少共同的特點:開源、前沿、與產(chǎn)業(yè)密切結(jié)合。這些特點讓它們不止停留在學術機構的層面,還擁有孵化器般的能力。
自2011年的AMP實驗室以來,Stoica就特別注重與產(chǎn)業(yè)界的密切合作。AMP實驗室拉來了谷歌、SAP、亞馬遜、華為、IBM、英特爾、微軟、VMWare等企業(yè)作為贊助商。
此后,Stoica的實驗室還獲得了英偉達、Meta、螞蟻集團、AMD、博通、三星、Lambda等企業(yè)的支持。
同時,通過不斷創(chuàng)業(yè),Stoica的創(chuàng)業(yè)項目還使他成為了億萬富翁,現(xiàn)資產(chǎn)大約有25億美元,他將一部分個人資產(chǎn)投入實驗室的運營工作中。
這些真金白銀的支持讓Stoica的實驗室擁有資金和資源,得以同時開展大量研究項目。
目前,Stoica在UCB擔任研究資金削減問題工作組的主席。他鼓勵其他教授向他一樣通過創(chuàng)業(yè)獲取資金,在美國政府削減科研資助的大背景下繼續(xù)科研。
但成為億萬富翁并非Stoica的目標。Stoica在接受《福布斯》采訪時稱:“我仍然是一名學者,如果賺錢是唯一的驅(qū)動力,那我就去IPO了。這是最簡單的方法,但我不是出于這一目的而創(chuàng)業(yè),我想創(chuàng)造有意義的東西。”
他還認為,自己在創(chuàng)業(yè)中獲得的成功,得益于對科研的專注:“這是一種創(chuàng)造的過程,不斷探索新想法。”此外,大學的科研項目大多具有開源性質(zhì),能吸引企業(yè)使用,而大部分公司不會開源最佳系統(tǒng)?;陂_源項目打造的企業(yè),在起步階段就能獲得不少聲量。
將Stoica留在學術界的原因,可能是他的學生們。他向《福布斯》說道:“這些處在成長期的年輕人不知道什么做的成,什么做不成,但他們有信念,能做出讓人出乎意料的解決方案。”
由Stoica親自指導的80多名學生從他的資源和關系網(wǎng)中受益,他們絕大多數(shù)都在學術界、大公司就職,或是擁有自己的初創(chuàng)公司,其中包括在Databricks工作的至少7名學生。
結(jié)語:高校前沿探索仍有望轉(zhuǎn)化為巨大商業(yè)價值
當今的AI浪潮中,有越來越多頗具影響力的成果,誕生在產(chǎn)業(yè)界,這也讓外界一度懷疑:在計算資源要求越來越高、規(guī)模效應越來越強烈的AI領域,學術界的價值何在?
而Stoica教授的成功經(jīng)歷證明,在高校進行的開源、前沿探索項目,往往能對產(chǎn)業(yè)界起到極為重要的補充和啟發(fā)性作用。在以適當?shù)姆绞睫D(zhuǎn)化為企業(yè)后,仍然可以貢獻巨大的產(chǎn)業(yè)和商業(yè)價值。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.