網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

MiniMax閆俊杰：通往AGI的長期最優(yōu)解

2024-10-23 15:03:41　來源: 新莓daybreak

廣東舉報

分享至

“這位AGI「信徒」，必須在噪音中發(fā)現(xiàn)最本質(zhì)、最長遠的解題思路?！?br/>

撰文｜何聆箏

編輯｜翟文婷

從互聯(lián)網(wǎng)大模型基礎裝備競賽，到落地應用混戰(zhàn)，不過一年時間。

一年前，包括李彥宏、王小川等人還在放話，他們所推出的大模型技術能力對標GPT，但是不知不覺中，不論巨頭還是創(chuàng)業(yè)公司，都把目光聚焦在如何放大產(chǎn)品的用戶規(guī)模。

從技術到產(chǎn)品，這不是非此即彼的選擇題，而是兩手抓兩手都要硬的充分必要題。

移動互聯(lián)網(wǎng)時代，頭頂「APP工廠」的字節(jié)自然是最受關注的，豆包的月活很早前就破兩千萬，成為規(guī)模最大的通用型應用。

國內(nèi)現(xiàn)有的六家大模型獨角獸公司：月之暗面、MiniMax、智譜 AI、百川智能、零一萬物、階躍星辰，其中月之暗面旗下的kimi賺足了眼球，獲得一定的用戶基礎和口碑。除此之外，就是MiniMax的星野和海螺 AI。

MiniMax創(chuàng)始人閆俊杰旗幟鮮明地表示，在技術快速進化的窗口關閉前，創(chuàng)業(yè)公司要做出用戶量巨大的to C產(chǎn)品。

他還說，一個擁有很強技術的公司不應該是個賣技術的公司，而是一家「技術驅(qū)動產(chǎn)品」的公司。

所以MiniMax身上有幾個特點：早于GPT出現(xiàn)前成立，創(chuàng)始人出身于AI公司商湯；最早同時發(fā)力技術和產(chǎn)品的創(chuàng)業(yè)公司；早于生成式人工智能備案條例就開發(fā)出應用Glow，可能是目前唯一有過產(chǎn)品下架命運的公司。同時得到騰訊、阿里、高瓴和紅杉等一線公司的投資。

這些標簽似乎指向，這是一家冉冉升起的明星創(chuàng)業(yè)公司。但可能也側(cè)面說明，AI大模型時代創(chuàng)新門檻在被抬高，留給公司的時間和空間都會比較有限。

一、尋找長期最優(yōu)解

閆俊杰講過一個小故事。

他80歲的外公曾經(jīng)想要寫一本書，講述自己的人生經(jīng)歷，但因為沒有辦法書寫，也不會打字，就此作罷。當時的閆俊杰還在商湯帶技術團隊，每天AI領域的論文已經(jīng)多到他看不完。技術進展超出理解范圍，然而在現(xiàn)實中，自己做的事情卻甚至無法幫助外公寫一本書。

像大多數(shù)如真如幻的創(chuàng)業(yè)故事那樣，在巨大的落差之間，閆俊杰看到了機會。MiniMax由此誕生。他還定下了一個愿景：Intelligence with Everyone（用最好的技術服務每一個人）。

MiniMax是國內(nèi)第一個講出「AI 2 C」的公司，也是國內(nèi)少有同時發(fā)力大模型技術和產(chǎn)品的公司。這被李彥宏認為是創(chuàng)業(yè)公司并不適合的選擇，甚至有「自殺式」發(fā)展的嫌疑。

閆俊杰卻大膽與之唱反調(diào)，「對創(chuàng)業(yè)公司，至少對中國的創(chuàng)業(yè)公司來說，更好的方式是同時思考技術和產(chǎn)品?！挂驗?，如果沒有足夠好的產(chǎn)品能力承接，即使公司有了一些技術進展，這些東西最終也不是你的。一個獨立發(fā)展的創(chuàng)業(yè)公司一定要考慮產(chǎn)品。

此外，在他看來AI并非核彈一樣的「大殺器」，而是普通人每天會用的產(chǎn)品和服務。要完成更廣泛的覆蓋，MiniMax需要在技術快速進化的窗口關閉前，做出用戶量巨大的 2C 產(chǎn)品。

迄今為止，MiniMax先后打造的4款產(chǎn)品，既有AI內(nèi)容社區(qū)應用，也有問答等生產(chǎn)力應用。300-400人的團隊中，有一半以上是技術團隊，另有40%負責產(chǎn)品。

作為下架產(chǎn)品Glow的升級版，星野自2023年9月8日上線，在不到一年時間里安裝量突破了1000萬，DAU高峰接近80萬，是國內(nèi)C端AI應用為數(shù)不多有此突破的產(chǎn)品。

單看星野的玩法和定位，基本對標國外的虛擬陪伴式應用Character.AI。用戶根據(jù)自己的偏好，生成陪伴式「智能體」。根據(jù)月狐數(shù)據(jù)，星野全網(wǎng)用戶的人均使用時長已經(jīng)達43.29分鐘，其中女性用戶占比已經(jīng)超過55%。

但與Character.AI寥落的付費意愿相比，星野已經(jīng)毫不掩飾發(fā)力商業(yè)化。充值抽卡片「虛擬物品」、月卡12元的付費會員……星野差不多是眾多AI智能體中，商業(yè)化最積極的。

MiniMax旗下另一款應用海螺AI也有拿得出手的數(shù)據(jù)，9月MAU接近500萬。

閆俊杰的觀點是，評判一項技術是否優(yōu)秀，最重要的標準便是「是否可以每天使用和交互」。但應用只是表象，他的最終愿景是AGI ，做一家以產(chǎn)品驅(qū)動的大模型公司。

因此，MiniMax一邊自研底層大模型，一邊做上層應用，通過底層技術提升應用體驗，再通過應用讓技術得以推廣，獲得驅(qū)動大模型獲取數(shù)據(jù)「燃料」，并反哺底層模型技術，最終形成正循環(huán)。

除了APP矩陣，MiniMax開放平臺也開始進賬B端企業(yè)的Tokens使用費。有媒體援引投資人士消息表示，MiniMax今年預計收入將達到7000萬美元。

隨著使用頻次的加深，以及對多模態(tài)的持續(xù)探索，MiniMax的底層模型能力還在持續(xù)得到升級。一個月前，MiniMax在「伙伴日」上發(fā)布了一條長達2分鐘的多模態(tài)視頻，正是基于新一代abab模型技術應用創(chuàng)造的。

二、沒有別的選擇

如果不刻意強調(diào)身份，第一眼看到閆俊杰時，你可能很難意識到這是一位AI從業(yè)者。

除了稀疏的毛發(fā)，閆俊杰的外在沒有太多傳統(tǒng)意義上的「理工特色」。一張含笑的圓臉，很少出現(xiàn)大開大合的表情。

與這種波瀾不驚所相對的，卻是閆俊杰在做決策時的「手起刀落」。但每一次押注，他似乎都走在行業(yè)前列。

閆俊杰創(chuàng)立MiniMax時，距離OpenAI發(fā)布ChatGPT還有1年多時間。此前，閆俊杰一直在商湯科技任職，這也是他的第一份工作，一路做到副總裁。2021年12月，商湯成為「AI視覺第一股」，在股價翻飛之際，閆俊杰卻轉(zhuǎn)頭成立自己的AGI企業(yè)，也就是MiniMax。

這種先發(fā)優(yōu)勢還體現(xiàn)在，大模型還沒集體狂熱的時候，MiniMax又以相對便宜的價格找字節(jié)火山引擎租用大量 GPU 算力。兵馬未動，「彈藥」已到位。

2023年6月，閆俊杰又做出一個大膽決定：押上公司80%的可用算力資源做MoE「混合-多專家模型」。

傳統(tǒng)的Dense模型因為生成token成本過高，延時嚴重，大模型廠商為此陷入焦慮。閆俊杰同樣感到崩潰，「我們那個時候發(fā)現(xiàn)每天處理幾百億token。如果是Dense模型，我們沒有辦法每天出這么多token。很快會因為推理成本問題，耗盡所有錢。」

就在這時候，一篇名為《MoE Meets Instruction Tuning》的論文發(fā)布。文中提出一個以技術軟實力突破硬件護城河的破局思路：MoE模型可以在不增加太多計算資源的情況下，讓模型變得更加復雜和強大。

這個作者只是提出了破局的可能性。MiniMax的早期投資人、明勢資本合伙人黃明明認為「MoE的提出者自己都不太相信MoE這條路徑」。

2023年下半年，閆俊杰投注了公司80%可用的資源開始死磕MoE。而且他跟大多數(shù)股東都沒有溝通，甚至沒有保留plan B。

資金實力和早期獲取的便宜算力大概是支撐閆俊杰調(diào)轉(zhuǎn)方向的底氣之一。彼時的MiniMax正在進行一場10億美金左右估值的融資。在此之前，MiniMax已經(jīng)經(jīng)過了兩輪融資，總金額7億美金，投資方包括高瓴資本、明勢資本。但在燒錢如流水的AI賽道，時刻需要注入新的彈藥。

兩次失敗使得MiniMax砸進去了大量的資金。比如有一次模型訓了半個月，才發(fā)現(xiàn)一些指標離前期估測的越來越遠。閆俊杰形容「就像發(fā)了一個火箭，本來以為它可以到三萬米，但它偏航了」。

盡管收獲了許多經(jīng)驗，但還是失去了寶貴的時間。因為競爭對手一直在優(yōu)化Dense模型，一旦失敗，意味著原本處于先發(fā)優(yōu)勢的MiniMax將全面落后于競爭對手。

矛盾總是最先在內(nèi)部發(fā)生。一些高管坐不住，向閆俊杰表達疑問。閆俊杰自己并不總是氣定神閑。

在與黃明明的一次對話中，他坦言押注MOE時多少是有些慌的，甚至最初也懷疑過自己是不是在「賭」。但是他別無他選，也清楚這是唯一的路，甚至認為「做不出來就完了」。

現(xiàn)實情況是，2022年以來，英偉達芯片價格不斷上漲，互聯(lián)網(wǎng)巨頭也開始吃不消。紐約時報曾爆料，為了支撐ChatGPT，OpenAI需要使用3萬塊英偉達A100的算卡，而且每天的耗電超過50萬度。

作為應對策略，微軟、OpenAI、Meta、谷歌等巨頭紛紛宣布自研芯片計劃。但效果和時間未知。

MiniMax向來秉持「只租卡，不買GPU」，如果要繼續(xù)探索上限，就只能改變模型底層架構(gòu)，換一種無需耗費太多資源就能達到很好的訓練和推理效果的模型架構(gòu)。

結(jié)果是，閆俊杰走通了。MOE+Linear Attention讓MiniMax大模型的訓練與反饋變得更快，對比GPT-4o同一代模型能力，新一代模型處理10萬token時，效率可提升2-3倍，長度越長，提升越明顯。

這一次，閆俊杰似乎又「賭對了」。

三、AGI「信徒」

時間倒退回2021年，在MiniMax創(chuàng)立的原點。閆俊杰講出自己的夢想時，鮮少有人聽得懂。

明勢資本的黃明明曾透露2021年首次見到閆俊杰時，面對對話、語音、數(shù)字人這些概念，聯(lián)想到的卻是元宇宙。好在同行之中有人意會。因為險些錯過MiniMax，明勢資本還定了一個規(guī)則：見比較重磅的創(chuàng)始人時，至少帶三個人一起去。

直到2022年11月，ChatGPT橫空出世，AGI 概念大熱。全中國的風險投資機構(gòu)都在尋找「誰是中國的 ChatGPT」，MiniMax和它的第一款智能體對話交互產(chǎn)品Glow，走進了資本的視野中。

閆俊杰不再需要向每個人解釋他的夢了，但激進的技術路線依然使他時處于被誤解的境遇中。

與大部分逐浪而來的人不同，閆俊杰對技術的理解顯現(xiàn)出一種超越現(xiàn)實的簡單。他認為技術，特別是研發(fā)投入很大的技術，追求的不應該是10%的提升，而是數(shù)倍變化的提升。

「像造芯片一樣，是一個巨大的系統(tǒng)工程，不能只做 5%、10% 的提升，需要能帶來數(shù)量級提升的技術突破?！?/p>

因此他會選擇「上限最高」的技術路線，幾乎沒有退路，算力方式也激進。

MiniMax通過「產(chǎn)品化APP+開放平臺」的方式，覆蓋2C+2B的用戶圈層，這是大多數(shù)創(chuàng)業(yè)公司都選擇回避的路徑。因為資金彈藥有限，這種嘗試過于奢侈。

除了覆蓋廣度，閆俊杰還在意使用深度，把多模態(tài)視作核心判斷標準。因為他始終認為，文字交互只是很小的一部分，AI就像一個人，整合了聲音、圖文和視頻的多模態(tài)能力才能帶來完整的體驗。

一個月前MiniMax在「伙伴日」上發(fā)布的那條兩分鐘視頻，正是由語言模型、視頻模型等整合生成的多模態(tài)視頻。在此之前，即便是OpenAI也只能將語音模型和語言模型整合到一起生成結(jié)果。

和曾經(jīng)多次早于行業(yè)做出的預判一樣，閆俊杰在很早之前就意識到，大模型在多模態(tài)的進步，會帶來用戶體驗的提升、獲得更高的用戶滲透率。而多模態(tài)融合，同樣也是閆俊杰所找到的長期最優(yōu)解。

無論是技術研發(fā)、C端產(chǎn)品運營還是B端服務，都需消耗大量資源，然而也正是這條厚重的發(fā)展路徑，為MiniMax贏得了時間。

2024年1月，MiniMax發(fā)布了大語言模型abab6.0版本，隨后迭代加速，4月便發(fā)布abab6.5版本，并同步上線AI助手「海螺AI」。到9月初日均 30 億次 AI 交互量，處理 3 萬億 Token。

但對于現(xiàn)在的產(chǎn)品到底是不是最終那個Super App，閆俊杰認為不重要。更重要的還是技術能夠足夠快地進步。

這位AGI「信徒」，必須在噪音中發(fā)現(xiàn)最本質(zhì)、最長遠的解題思路。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.