可靈 AI 在快手的重要性進(jìn)一步上升。
文丨高洪浩
《晚點(diǎn) LatePost》獨(dú)家了解到,快手今日發(fā)布組織架構(gòu)調(diào)整公告,宣布由快手高級(jí)副總裁、可靈 AI 事業(yè)部負(fù)責(zé)人兼社區(qū)科學(xué)線負(fù)責(zé)人蓋坤兼任可靈 AI 技術(shù)部負(fù)責(zé)人,繼續(xù)向快手科技創(chuàng)始人兼首席執(zhí)行官程一笑匯報(bào)。
一位快手人士告訴我們,此次由事業(yè)部一號(hào)位向下兼任可靈 AI 技術(shù)負(fù)責(zé)人,體現(xiàn)出可靈 AI 在快手大模型整體戰(zhàn)略中有著非常重要的地位,也意味著可靈將堅(jiān)持 “技術(shù)驅(qū)動(dòng)” 戰(zhàn)略。
在快手,蓋坤被認(rèn)為是一位以技術(shù)見(jiàn)長(zhǎng)的高管。他在清華大學(xué)就讀本科與博士期間的研究方向?yàn)樽R(shí)別與智能系統(tǒng);在阿里巴巴擔(dān)任廣告算法與 AI 技術(shù)研發(fā)負(fù)責(zé)人時(shí),曾提出 “深層用戶網(wǎng)絡(luò)興趣分布” 模型,并幫助淘寶、天貓等平臺(tái)優(yōu)化了用戶點(diǎn)擊偏好預(yù)測(cè)能力;到快手后,他主導(dǎo)了內(nèi)容理解應(yīng)用、推薦大模型及視頻生成大模型等技術(shù)落地,并應(yīng)用在了快手的算法、主站與商業(yè)化產(chǎn)品中。
此前,蓋坤在快手任職時(shí)間最長(zhǎng)的崗位是推薦廣告搜索技術(shù)體系和大模型技術(shù)。外界對(duì)蓋坤認(rèn)知也源自通過(guò)推薦技術(shù)改革,推動(dòng)了快手的人均時(shí)長(zhǎng)快速趕到了和抖音差距不大的水位。
蓋坤也是可靈崛起的重要推手。可靈大模型最早便是由蓋坤帶隊(duì)的社區(qū)科學(xué)線團(tuán)隊(duì)開(kāi)發(fā)的,這個(gè)團(tuán)隊(duì)許多成員原本的日常工作就是處理千萬(wàn)量級(jí)的視頻內(nèi)容,包括對(duì)視頻的畫(huà)質(zhì)和內(nèi)容做分析、標(biāo)注等,而在做大模型時(shí),“這種能力和工作流程是可以直接復(fù)用的?!?/p>
2023 年下半年,多數(shù)互聯(lián)網(wǎng)公司的重心都在應(yīng)用前景更明朗的大語(yǔ)言模型和圖片模型上,但在蓋坤的主導(dǎo)下,快手堅(jiān)定將資源投入到了視頻模型的研發(fā)上。次年 6 月,可靈大模型上線,這是全球第一個(gè)與 Sora 一致采用 DiT 路線,且直接面向普通用戶開(kāi)放的視頻大模型?!巴耆珱](méi)想到是快手最先做出來(lái)?!?一位字節(jié)跳動(dòng)大模型研發(fā)人士說(shuō)。
“我們知道這個(gè)賽道將會(huì)激烈,所以在發(fā)布之后,可靈 AI 就進(jìn)入了 ‘狂奔’ 模式。” 蓋坤曾在可靈 2.0 模型發(fā)布會(huì)現(xiàn)場(chǎng)回憶當(dāng)時(shí)的情景。
可靈是快手當(dāng)前優(yōu)先級(jí)最高的業(yè)務(wù)之一。今年 4 月,我們?cè)?dú)家提到,快手基于可靈 AI 組建了獨(dú)立事業(yè)部,成為了與主站、商業(yè)化、電商、國(guó)際化、本地生活并列的一級(jí)業(yè)務(wù)部門(mén),向快手董事長(zhǎng)兼 CEO 程一笑匯報(bào)。
一位可靈人士告訴我們,在上半年的一場(chǎng)干部會(huì)上,蓋坤要求可靈在 AI 視覺(jué)生產(chǎn)領(lǐng)域做到 “全球領(lǐng)先”。在發(fā)展路徑上,他提出,要優(yōu)先保證模型效果,并聚焦 P 端付費(fèi)訂閱會(huì)員,這也是包括 Runway 等在內(nèi)的全球頭部視頻生成公司主要瞄準(zhǔn)的客戶群。“蓋坤在內(nèi)部多次提到,希望能用 AI 把《三體》的場(chǎng)景復(fù)現(xiàn)出來(lái)?!?/p>
蓋坤也積極為可靈的發(fā)展?fàn)幦?nèi)部資源。上述可靈人士稱,蓋坤在內(nèi)部一直往可靈聚焦算力卡投入,協(xié)作部門(mén)也要給予可靈項(xiàng)目最積極地配合。
據(jù)了解,可靈 AI 在誕生后的一年時(shí)間里已迭代 30 余次。今年 4 月和 5 月,可靈分別推出模型的 2.0 和 2.1 版本,進(jìn)一步強(qiáng)化了模型在可控性方面的能力。8 月 15 日,可靈 2.1 模型開(kāi)啟了全新首尾幀功能的內(nèi)測(cè),用戶可以通過(guò)自定義首尾幀圖像,生成連貫且高質(zhì)量的視頻內(nèi)容,可靈官方稱,這可以解決 AI 視頻生成中的轉(zhuǎn)場(chǎng)生硬、文本響應(yīng)不足等痛點(diǎn)問(wèn)題。
在技術(shù)迭代之外,可靈也在積極探索商業(yè)化。一位可靈人士稱,這是為了保證產(chǎn)品能更健康與可持續(xù)地發(fā)展。今年 3 月,蓋坤就曾在可靈 2.0 發(fā)布前的公司干部會(huì)上提出, 2025 年可靈在營(yíng)收規(guī)模上要實(shí)現(xiàn) “跨越式增長(zhǎng)” 。
根據(jù)官方數(shù)據(jù),自商業(yè)化以來(lái)至今年 2 月,可靈 AI 累計(jì)營(yíng)業(yè)收入已超過(guò) 1 億元?!锻睃c(diǎn) LatePost》了解到,可靈 AI 今年前三個(gè)月的營(yíng)收,已超過(guò) 2024 年下半年的總和,其中 P 端付費(fèi)訂閱會(huì)員為可靈貢獻(xiàn)了將近 70% 的營(yíng)業(yè)收入。
公告中還提到,張迪將不再擔(dān)任可靈 AI 事業(yè)部技術(shù)部負(fù)責(zé)人。一位快手的人士評(píng)價(jià),快手歷來(lái)重視技術(shù)人才儲(chǔ)備,在人才密度和厚度上也有足夠積累。據(jù)《晚點(diǎn) LatePost》了解,目前快手直接從事技術(shù)研發(fā)工作的員工占到全體員工的近半。
“做好基礎(chǔ)模型,仍然是整個(gè)團(tuán)隊(duì)最核心的事。” 一位快手人士稱,整個(gè)行業(yè)里面視頻模型雖然發(fā)展很快,但還是有很大的優(yōu)化空間,而基礎(chǔ)模型的質(zhì)量,無(wú)疑決定著可靈 AI 在競(jìng)爭(zhēng)中的身位。
題圖來(lái)源:快手
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.