作者| 小 貓
編輯| 硬 AI
正值全球科技巨頭在人工智能領(lǐng)域展開激烈軍備競(jìng)賽之際,阿里巴巴內(nèi)部的排兵布陣再次出現(xiàn)關(guān)鍵變動(dòng)。
華爾街見聞·硬AI獲悉,近期備受矚目的AI頂尖科學(xué)家、阿里集團(tuán)副總裁許主洪(Steven Hoi)已從智能信息事業(yè)群首席科學(xué)家的職位上,轉(zhuǎn)崗至阿里集團(tuán)的核心AI研發(fā)機(jī)構(gòu)——通義實(shí)驗(yàn)室。
阿里方面向華爾街見聞·硬AI證實(shí)了這一消息,并表示許主洪將負(fù)責(zé)多模態(tài)交互模型方向的研究,后續(xù)向通義實(shí)驗(yàn)室負(fù)責(zé)人、阿里云CTO周靖人匯報(bào)。
這一內(nèi)部調(diào)動(dòng)釋放出重要信號(hào):在吳泳銘“AI驅(qū)動(dòng)”的核心戰(zhàn)略下,阿里正進(jìn)一步將頂尖人才向AI基礎(chǔ)模型研發(fā)的核心戰(zhàn)場(chǎng)集結(jié),而多模態(tài)交互則被視為下一階段AI突破的關(guān)鍵隘口。
對(duì)于許主洪而言,這次轉(zhuǎn)崗意味著他將從更貼近C端應(yīng)用的“前線陣地”轉(zhuǎn)向更為核心和底層的“研發(fā)心臟”。
時(shí)間拉回至今年2月,這位在學(xué)術(shù)界和工業(yè)界均享有盛譽(yù)的AI大牛(IEEE Fellow、斯坦福大學(xué)評(píng)選的“全球前1%的AI科學(xué)家”)正式加盟阿里,在當(dāng)時(shí)引發(fā)了業(yè)內(nèi)不小的轟動(dòng)。他最初的落腳點(diǎn)是智能信息事業(yè)群,一個(gè)囊括了夸克、UC瀏覽器、書旗小說等億級(jí)用戶產(chǎn)品的業(yè)務(wù)集群,直接向“85后”總裁吳嘉匯報(bào)。
彼時(shí),業(yè)界的普遍解讀是,阿里意圖明顯——借助許主洪在多模態(tài)基礎(chǔ)模型及Agents領(lǐng)域的深厚積累,快速提升C端產(chǎn)品與AI結(jié)合的應(yīng)用能力,打造出能與用戶直接對(duì)話的“超級(jí)應(yīng)用”。這也符合阿里在AI C端應(yīng)用上“軟硬一體”的生態(tài)構(gòu)想,即整合“通義”APP、夸克、天貓精靈等核心業(yè)務(wù),搶占AI應(yīng)用賽道先機(jī)。
然而,僅僅半年多后,許主洪便調(diào)離了這個(gè)被視為阿里AI應(yīng)用重要出口的事業(yè)群,轉(zhuǎn)而投身于更為基礎(chǔ)和前沿的通義實(shí)驗(yàn)室。這一變化背后,是阿里對(duì)AI戰(zhàn)略優(yōu)先級(jí)的再聚焦。
一位接近阿里的人士向華爾街見聞·硬AI分析稱:“這可以看作是阿里集中優(yōu)勢(shì)兵力,全力攻堅(jiān)核心基礎(chǔ)模型能力的體現(xiàn)。應(yīng)用創(chuàng)新固然重要,但基礎(chǔ)模型的持續(xù)領(lǐng)先才是決定未來(lái)戰(zhàn)局的關(guān)鍵。讓最頂尖的科學(xué)家回到最核心的研發(fā)崗位,是確保技術(shù)引擎持續(xù)強(qiáng)大的必然選擇。”
阿里“亮劍”多模態(tài)交互
許主洪的新戰(zhàn)場(chǎng)——通義實(shí)驗(yàn)室,是阿里“通義”系列大模型的“孵化器”,由阿里云CTO周靖人親自掛帥。周靖人同樣是AI領(lǐng)域的重量級(jí)人物,擁有哥倫比亞大學(xué)計(jì)算機(jī)博士學(xué)位,曾任微軟研發(fā)合伙人,是阿里云大數(shù)據(jù)平臺(tái)和人工智能研究的靈魂人物。
在周靖人的帶領(lǐng)下,通義實(shí)驗(yàn)室已經(jīng)構(gòu)建了包括語(yǔ)言、視覺、語(yǔ)音等在內(nèi)的“全尺寸”和“全模態(tài)”模型矩陣,其開源模型在全球范圍內(nèi)獲得了巨大的影響力。
而許主洪此次負(fù)責(zé)的“多模態(tài)交互模型”,正是當(dāng)前全球大模型研發(fā)的前沿陣地。所謂多模態(tài),即讓AI能夠像人一樣,同時(shí)理解和處理文本、圖像、音頻、視頻等多種信息形式,并以更自然、更智能的方式與人類進(jìn)行交互。這被認(rèn)為是AI從“能聽會(huì)說”邁向“能看會(huì)想”的關(guān)鍵一步,也是通往通用人工智能(AGI)的必經(jīng)之路。
無(wú)論是谷歌的Gemini、OpenAI的GPT-4o,還是阿里自身發(fā)布的Qwen-VL、Qwen-Audio等模型,都已展現(xiàn)出強(qiáng)大的多模態(tài)能力。而許主洪在加入阿里之前,其研究便長(zhǎng)期聚焦于此,尤其以“多模態(tài)預(yù)訓(xùn)練”領(lǐng)域的突破性研究聞名。他提出的低成本預(yù)訓(xùn)練策略,曾深刻影響全球大模型的研發(fā)進(jìn)程。
此次履新,意味著阿里將整合許主洪在多模態(tài)領(lǐng)域的學(xué)術(shù)遠(yuǎn)見和工業(yè)界經(jīng)驗(yàn),與通義實(shí)驗(yàn)室現(xiàn)有的工程和研發(fā)能力相結(jié)合,意圖在多模態(tài)這一核心賽道上建立起更強(qiáng)的技術(shù)壁壘。其未來(lái)的研究成果,不僅將為夸克、淘寶等前端應(yīng)用提供更強(qiáng)大的AI能力支持,更有可能催生出全新的交互范式和產(chǎn)品形態(tài),例如更智能的個(gè)人助理、更沉浸的AI硬件等。
“巨頭”的邏輯:人才、資源與戰(zhàn)略定力
許主洪的轉(zhuǎn)崗,是阿里AI戰(zhàn)略在“聚光燈”下的又一次微調(diào),也折射出當(dāng)前AI巨頭競(jìng)爭(zhēng)的普遍邏輯。
首先,頂尖人才的流向即是戰(zhàn)略方向的指針。從吳泳銘親自兼任阿里云CEO,到此次將許主洪這樣的戰(zhàn)略級(jí)科學(xué)家部署到基礎(chǔ)模型研發(fā)的一線,都顯示出阿里最高層對(duì)底層技術(shù)掌控力的極度重視。
其次,資源正以前所未有的力度向核心模型集中。知情人士透露,此次調(diào)整是“正常的集團(tuán)內(nèi)部轉(zhuǎn)崗”,其背后邏輯是“集中資源投入基礎(chǔ)模型能力建設(shè)”。這意味著,相較于在應(yīng)用層面的多點(diǎn)開花,阿里當(dāng)前更傾向于將寶貴的研發(fā)資源和人才投入到底層模型的“深井”中,以求獲得更具顛覆性的技術(shù)突破。
最后,這體現(xiàn)了巨頭在喧囂的AI浪潮中尋求戰(zhàn)略定力。AI應(yīng)用的商業(yè)化路徑仍在探索之中,但基礎(chǔ)模型的代際競(jìng)爭(zhēng)卻已白熱化。在這樣的背景下,是否選擇長(zhǎng)期投入、夯實(shí)技術(shù)根基,考驗(yàn)著每一家公司的戰(zhàn)略遠(yuǎn)見與決心。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.