出品 | 創(chuàng)業(yè)最前線
作者 | 馮羽
編輯 | 蛋總
美編 | 邢靜
審核 | 頌文
“這個老羅竟然是數(shù)字人,完全看不出來!”
1300萬人次觀看,GMV突破5500萬元,是超頭IP羅永浩在百度電商平臺6月15日打下的直播戰(zhàn)績。
這一成績甚至超過了5月23日羅永浩本人直播帶貨GMV 5000萬的數(shù)據(jù)。
當(dāng)數(shù)字人老羅可以在直播間里無間斷直播近7小時,不時和搭檔蹦出一些羅氏風(fēng)格的幽默段子、動作同步配合直播間產(chǎn)品講解,還能同步上鏈接、發(fā)福袋,對彈幕公屏上的問題進(jìn)行回應(yīng)甚至結(jié)合熱點(diǎn)進(jìn)行調(diào)侃,這也意味著,AI數(shù)字人已經(jīng)為傳統(tǒng)電商打開了全新的想象空間。
這一切都基于文心4.5Turbo的技術(shù)迭代。
整場直播AI調(diào)用知識庫1.3萬次,生成9.7萬字產(chǎn)品講解內(nèi)容,雙數(shù)字人搭檔做出超8300個動作,最終實(shí)現(xiàn)了對羅氏幽默的1:1復(fù)刻。
當(dāng)數(shù)字人直播從只會對口型,發(fā)展到大動作都不崩的新階段,百度AI數(shù)字人的業(yè)務(wù)邊界也在持續(xù)外擴(kuò):羅永浩只有一個,但需要AI數(shù)字人賦能的主播和商家還有千萬個。
1、1:1復(fù)刻“羅氏幽默”
老羅在百度的首場數(shù)字人直播效果顯然超出了預(yù)期。
在這場直播中,有40%的動作片段是由AI生成,老羅和朱蕭木組成了數(shù)字人搭檔做出了8300個動作,符合物理運(yùn)動規(guī)律且沒有“崩”;同時100%腳本由AI生成,其中包括調(diào)用了1.3萬次知識庫,以及9.7萬字的產(chǎn)品講解內(nèi)容。
從數(shù)據(jù)表現(xiàn)看,數(shù)字人老羅似乎比真人老羅更受歡迎——該場直播訂單量較真人直播增長150%,在近7小時的直播長跑中,人均觀播時長也增長了30%。
那么,一場兼具個人幽默感與塑品專業(yè)度的數(shù)字人直播是如何練成的?
直播間里的雙人CP高度配合率先實(shí)現(xiàn)了數(shù)字人直播的體驗(yàn)新突破。
“老羅和朱蕭木兩個數(shù)字人生動還原了主播和助播的真實(shí)狀態(tài),配合得像真人一樣自然。這次數(shù)字人直播間實(shí)現(xiàn)了雙音軌,可以還原現(xiàn)實(shí)情況下雙人互動語言相互打斷等復(fù)雜場景?!卑俣雀笨偛?、百度電商總經(jīng)理平曉黎對「創(chuàng)業(yè)最前線」表示,“無論是商品講解過程中的節(jié)奏切換,還是應(yīng)對突發(fā)的互動需求,兩個數(shù)字人都能自然應(yīng)對。”
基于文心4.5T的技術(shù)升級和深度訓(xùn)練,這場數(shù)字人直播也實(shí)現(xiàn)了對“羅氏幽默”1:1復(fù)刻。
復(fù)刻的基礎(chǔ)則來源于龐大的劇本生成能力。
“我們首先基于真人高克隆技術(shù)來生成數(shù)字人,通過上傳真人視頻回放,可以選擇單人或是雙人主播,確定好角色分配后,再進(jìn)行選品?!卑俣入娚躺虡I(yè)業(yè)務(wù)部負(fù)責(zé)人、數(shù)字人創(chuàng)新業(yè)務(wù)部總監(jiān)吳晨霞對「創(chuàng)業(yè)最前線」表示。
在選品方面,直播間會根據(jù)主推品、次推品、福利品等不同屬性來設(shè)置腳本,團(tuán)隊會將所有產(chǎn)品的詳情頁信息和電商知識庫的信息喂給大模型從而生成劇本,接著再進(jìn)行下一步的劇本創(chuàng)作。
“數(shù)字人的幽默屬性可以分為兩種,一種是淺層幽默,另一種是深層幽默。”百度集團(tuán)副總裁吳甜進(jìn)一步解釋道,淺層幽默指的是老羅的調(diào)侃、語言習(xí)慣和風(fēng)格,大模型通過對羅永浩本人歷史數(shù)據(jù)的挖掘和學(xué)習(xí),以及規(guī)劃模仿他的關(guān)鍵幽默元素進(jìn)行復(fù)刻;深層幽默則更加復(fù)雜,要聯(lián)系社會文化和社會熱點(diǎn)等。
復(fù)刻“羅氏幽默”的難點(diǎn)在于,既要保證其人設(shè)的一致性,還要維持?jǐn)?shù)字人的可控性。
“針對這兩點(diǎn),我們針對性地對老羅數(shù)字人進(jìn)行訓(xùn)練和學(xué)習(xí),一方面學(xué)習(xí)什么叫‘羅氏幽默’,最重要的是學(xué)習(xí)他的語言風(fēng)格;另外還會學(xué)習(xí)他的口頭禪、小動作,并進(jìn)行針對性的特化訓(xùn)練?!眳翘鹧a(bǔ)充道,“最終要讓羅永浩本人都覺得像才可以?!?/p>
而要保證劇本創(chuàng)作的高互動性,一個關(guān)鍵點(diǎn)還在于對直播間里多模態(tài)信息的收集和反饋。
“劇本里融入了多模態(tài)元素,因此才能實(shí)現(xiàn)多模態(tài)和全模態(tài)的高度統(tǒng)一。”吳晨霞表示,老羅數(shù)字人在直播間的表現(xiàn)非常流暢,他在介紹產(chǎn)品時,講的內(nèi)容和動作完全匹配,而不像上一代數(shù)字人只能靠視頻循環(huán)使用。
她還介紹道,此前的數(shù)字人是由唇形驅(qū)動,腳本改變后只有唇形跟著修改,而老羅數(shù)字人則能生成新的動作來匹配新的腳本,實(shí)現(xiàn)了動作和文本的高度統(tǒng)一。
在主副直播數(shù)字人之外,AI大腦還能在直播間里實(shí)現(xiàn)多智能體的配置——鏡頭外的主播、副播、場外音、場控、運(yùn)營甚至水軍等智能體角色都可以通過AI大腦來實(shí)現(xiàn)。
“我們通過流式生成的設(shè)計,讓大模型有能力感知直播間的環(huán)境信號,讓智能體們決定何時需要發(fā)起互動,例如發(fā)福袋、回復(fù)彈幕評論、與用戶互動等。”吳甜表示。
(圖 / 百度直播)
通過體驗(yàn)、內(nèi)容和視覺上的技術(shù)突破,羅永浩數(shù)字人直播間的GMV也超越此前的真人直播間,而從該項(xiàng)目籌備到上線直播,百度團(tuán)隊僅用了三周時間。
2、數(shù)字人電商3.0
AI對傳統(tǒng)電商的賦能并非新鮮事。
在電商領(lǐng)域,從智能客服、智能營銷,到數(shù)字人主播、AI導(dǎo)購,各大電商平臺正在如火如荼地進(jìn)行著AI改造。
麥肯錫、艾瑞等行業(yè)咨詢報告顯示,目前92%的消費(fèi)者在電商場景中接觸過AI應(yīng)用,商家端的AI工具使用率已經(jīng)超過60%。
AI應(yīng)用的爆發(fā)正在驅(qū)動智能電商加速演化,數(shù)字人也從最開始的行為笨拙成長為能夠補(bǔ)充甚至替代真人主播。
早在數(shù)字人1.0時代,AI數(shù)字形象人物僵硬、動作循環(huán),對于錄制素材要求高,大多采用通用型文案,整體缺乏互動。
進(jìn)入到數(shù)字人2.0超擬真時代,AI數(shù)字人已經(jīng)能夠?qū)崿F(xiàn)動作擬真和人物的克隆,從語音和動作上仿真度更高,無論是腳本還是互動都更加靈活。
如今進(jìn)入到3.0高說服力數(shù)字人階段,也就是羅永浩數(shù)字人的表現(xiàn)階段,不僅能夠?qū)崿F(xiàn)智能腳本創(chuàng)作,在神形音容上保持高度一致,還能通過AI大腦進(jìn)行決策思考,實(shí)現(xiàn)對多智能體的合理調(diào)度。
(圖 / 百度慧播星)
不妨展望一下數(shù)字人4.0階段,在可預(yù)測的未來,數(shù)字人或?qū)⒊蔀槌秸嫒说拇嬖?,非但擁有真人不具備的超大知識庫,還能多任務(wù)作業(yè),最終實(shí)現(xiàn)直播間內(nèi)容的千人千面。
百度優(yōu)選作為百度集團(tuán)旗下的智能電商平臺,也在AI賦能方面持續(xù)探索。
面向用戶,百度優(yōu)選陸續(xù)上線了搜索智能導(dǎo)購、全網(wǎng)商品對比等能力,為用戶提供了更高效的購物決策服務(wù)。如今,每天有超過2000萬用戶在百度使用智能導(dǎo)購進(jìn)行購買決策;
面向商家,百度優(yōu)選還發(fā)布了慧播星數(shù)字人、天樞智能營銷平臺、AI商家端等產(chǎn)品。截至目前,有超過10萬的商家使用數(shù)字人開播,每天有超過600萬的用戶在數(shù)字人直播間購物。
今年618剛剛收官,不難從中發(fā)現(xiàn)數(shù)字人的身影。
在今年百度優(yōu)選618省心好物節(jié),平臺頭部商家采用真人+數(shù)字人混播,百萬級以上商家GMV同比增長375%,腰部商家GMV同比增長344%,中小商家多采用純數(shù)字人直播,GMV同比增長116%。百度優(yōu)選的直播轉(zhuǎn)化率同比提升31%,開播成本下降80%。
(圖 / 百度慧播星)
數(shù)字人不僅成為新質(zhì)生產(chǎn)力,真人和數(shù)字人協(xié)同直播也成為百度優(yōu)選的平臺特色。
“如果以帶貨GMV為評判標(biāo)準(zhǔn),現(xiàn)在市面上數(shù)字人直播效果有一半能超越真人,還有一般直播效果持平,但未來高說服力數(shù)字人的直播效果一定會完全超越真人?!逼綍岳璞硎?。
在她看來,數(shù)字人直播在某些品類上存在明顯優(yōu)勢,例如保健品銷售在塑品環(huán)節(jié),數(shù)字人知識面更廣,能夠講解得更加透徹;教育公司的主播大多是老師,真正的名師無法天天開播,數(shù)字人就很好地解決了這個問題,讓名師可以退居幕后從事教研工作。
“未來一定是數(shù)字人和真人共存的協(xié)同狀態(tài)?!逼綍岳柩a(bǔ)充道。
3、從羅永浩,到AI數(shù)字人普惠
數(shù)字人在直播間的引入不僅可以提升GMV和直播效率,在降低成本方面也頗有成效。
“數(shù)字人直播的成本較真人直播能夠降低80%,對于中腰部的電商品牌可能節(jié)約得更多?!逼綍岳璞硎?,尤其像老羅這樣的超頭主播準(zhǔn)備一場真人直播的時間和成本都非常高,數(shù)字人直播則可以很好地解決這一問題。
從技術(shù)角度看,吳甜則更加篤定數(shù)字人等新技術(shù)在未來將進(jìn)一步降低直播成本。
(圖 / 攝圖網(wǎng),基于VRF協(xié)議)
“數(shù)字人包括兩部分成本,一部分來自生產(chǎn)制作數(shù)字人的成本,另一部分則是在線服務(wù)的成本?!眳翘鸨硎?,隨著技術(shù)系統(tǒng)的完善和發(fā)展,未來數(shù)字人的制作成本會進(jìn)一步下降,尤其是在羅永浩之外更廣泛的沒有強(qiáng)IP的主播,制作成本會有更大的降本空間。
隨著開播時間越長、開播場次越多,數(shù)字人直播的邊際收益也會越高,畢竟數(shù)字人只需要付出IT成本和現(xiàn)場運(yùn)營成本,解放了真人主播。
“目前百度單個數(shù)字人的制作成本已經(jīng)控制在千元左右,而一個普通商家真人直播的場地、設(shè)備、人工成本最低一個月也要上萬元?!逼綍岳枵f道。
對百度數(shù)字人來說,老羅無疑是一個標(biāo)桿。
“大模型是具有泛化能力的,其在學(xué)習(xí)相應(yīng)直播場景的大量數(shù)據(jù)后,同時也具備了遷移能力,可以把知名主播的學(xué)習(xí)能力遷移到普通主播身上?!眳翘鸨硎?,這也讓百度數(shù)字人有了更多市場化以及規(guī)模化的空間。
而用AI普惠更多平凡主播和中小商家,正是百度打造數(shù)字人體系的初心。
近日,百度電商推出兩大計劃:夢蝶計劃將通過流量扶持,超頭主播數(shù)字人打造、預(yù)算扶持,實(shí)現(xiàn)百度優(yōu)選超頭主播的數(shù)量倍增;繁星計劃則將再次追加10萬個慧播星數(shù)字人,投入1億元數(shù)字人消費(fèi)補(bǔ)貼、千萬級別的運(yùn)營扶持,幫助更多的普通人、中小企業(yè)開啟數(shù)字人直播。
“百度電商通過數(shù)字人幫商家賣貨服務(wù)目前已經(jīng)實(shí)現(xiàn)了商業(yè)化,一年純數(shù)字人也貢獻(xiàn)了幾十億的收入。”平曉黎表示。
老羅的數(shù)字人并非個例。數(shù)字人的價值是服務(wù)于人,當(dāng)人人都可以當(dāng)主播,智能電商的門檻被不斷降低,百度數(shù)字人將真正實(shí)現(xiàn)AI普惠的終極目標(biāo)。
*注:文中題圖來自百度智能云官網(wǎng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.