百度下場 超寫實(shí)數(shù)字人改變直播帶貨?

文丨包蘊(yùn)涵

編輯丨董金鵬

百度下場,數(shù)字人直播帶貨迎來重量級(jí)玩家;直播戰(zhàn)場再起硝煙,賽道內(nèi)卷逐漸加劇。

7月26日,2022百度世界大會(huì)期間,百度聯(lián)合創(chuàng)匠科技發(fā)布“百度智能云曦靈數(shù)字人直播帶貨平臺(tái)”,最大亮點(diǎn)是由SaaS驅(qū)動(dòng)的“超寫實(shí)數(shù)字人”,它可以24小時(shí)全天候直播。

其實(shí),2019年正式進(jìn)軍數(shù)字人以來,百度就一直是數(shù)字人領(lǐng)域的頭部玩家。不過此前,百度主要服務(wù)KA客戶,主打高度定制化的超寫實(shí)數(shù)字人,一直沒有直播帶貨場景的數(shù)字人。

此次發(fā)布的數(shù)字人平臺(tái),格外引人矚目。它不僅是百度首次針對(duì)電商賣家與MCN機(jī)構(gòu),推出的直播場景數(shù)字人,也是首次以標(biāo)準(zhǔn)化SaaS的形式,將“超寫實(shí)數(shù)字人”應(yīng)用于電商直播。

隨著重量級(jí)玩家的加入,數(shù)字人直播帶貨行業(yè)的技術(shù)基準(zhǔn),可能將提升到一個(gè)新高度。

01

超寫實(shí)數(shù)字人,僅僅是顏值高嗎?

電腦屏幕上,一位女性數(shù)字人正微笑著向來訪者致意,她的發(fā)梢到毛孔都清晰可見。

一位女性記者無意間走近電腦,攝像頭立刻捕捉到她的面部表情。于是,屏幕上數(shù)字人的表情也隨之變化,從微笑到困惑、驚訝,再到恍然大悟、哈哈大笑。

轉(zhuǎn)瞬間,記者的數(shù)十種小表情在數(shù)字人的臉上同步展現(xiàn)出來。稍后,當(dāng)面部捕捉對(duì)象轉(zhuǎn)移到另一位靠過來的男性時(shí),盡管性別和臉型都不同,但熒幕上的數(shù)字人同樣精確再現(xiàn)了他的表情。

這是億邦動(dòng)力所看到的百度數(shù)字人直播軟件的現(xiàn)場演示?,F(xiàn)場的工作人員還通過直播軟件展示了類似于3A大作游戲中的“捏臉”功能,例如微調(diào)數(shù)字人的發(fā)色、睫毛和瞳孔顏色、皮膚質(zhì)地等細(xì)節(jié),還可以對(duì)嗓音、服裝風(fēng)格等進(jìn)行自定義。

“我們數(shù)字人的精度極高,光是頭發(fā)的模型面數(shù)就高達(dá)數(shù)十萬。與此同時(shí),運(yùn)用百度的Smile Talk口型合成算法、Smart Rig面部綁定技術(shù),以及動(dòng)作捕捉系統(tǒng),可使得數(shù)字人動(dòng)作更加流暢自然?!卑俣葦?shù)字人與機(jī)器人業(yè)務(wù)負(fù)責(zé)人李士巖介紹說。

百度實(shí)驗(yàn)室展示現(xiàn)場

“讓影視級(jí)超寫實(shí)數(shù)字人能夠無人值守、全天候、全年無休地直播”。這是百度對(duì)于此次發(fā)布的數(shù)字人直播平臺(tái)核心功能的描述。

什么是超寫實(shí)數(shù)字人?行業(yè)對(duì)此還沒有權(quán)威定義。不過,在描述數(shù)字人的模型精度時(shí),“超寫實(shí)”與“影視級(jí)”這兩個(gè)形容詞常常一起出現(xiàn)。它們也常??梢酝x互換,用來形容數(shù)字人的模型與動(dòng)作高度細(xì)膩,幾乎可以假亂真,類似影視作品中高精度CG合成技術(shù)的效果。實(shí)際上,現(xiàn)在仍有不少虛擬人公司在使用影視CG技術(shù)打造超寫實(shí)數(shù)字人形象。

“影視級(jí)”往往也意味著“燒錢”。通常,超寫實(shí)數(shù)字人的模型費(fèi)用定制為數(shù)十萬元,而一次直播營銷活動(dòng)的總預(yù)算,可達(dá)數(shù)十萬到百萬元,運(yùn)營一年的預(yù)算則可能達(dá)到五六百萬元。

因此,超寫實(shí)數(shù)字人多見于廣告、短視頻制作或單場大型直播活動(dòng)。而與之相反,注重“二十四小時(shí)全年無休直播”的電商日常直播場景,從技術(shù)和成本多方面考慮,通常不會(huì)使用超寫實(shí)數(shù)字人,多數(shù)會(huì)采用模型較為簡單粗糙,以AI自動(dòng)驅(qū)動(dòng)的數(shù)字人主播。

而將超寫實(shí)數(shù)字人和無人值守直播兩種形態(tài)結(jié)合在一起,并以SaaS形式推出,百度數(shù)字人直播平臺(tái)可以說開辟了行業(yè)之先。

那么,百度為何要選擇超寫實(shí)數(shù)字人,進(jìn)行無人值守的直播帶貨?這是一種“高射炮打蚊子”的行為嗎?

02

百度數(shù)字人,向真人導(dǎo)購更近一步?

百度將外形自定義、動(dòng)作和腳本設(shè)置、導(dǎo)播等數(shù)字人直播功能集成為SaaS,這讓編輯和操控?cái)?shù)字人變得更為便捷、易用。

“我們對(duì)這個(gè)軟件的期望是,必須要做到像Office一樣易用,不需要配備運(yùn)營團(tuán)隊(duì),一名具有基礎(chǔ)技能的普通員工就可以去操作。”李士巖表示。

而在價(jià)格方面,雖然目前還無法公布具體收費(fèi)檔位,但李士巖透露,“月費(fèi)將不超過5000元”。從價(jià)格和門檻來看,百度等數(shù)字人直播平臺(tái)均已具備將“高不可攀”的超寫實(shí)數(shù)字人帶入普通商家的條件。

但與此同時(shí),億邦動(dòng)力也了解到,目前京東、淘寶天貓、唯品會(huì)等都在直播系統(tǒng)中集成自家或第三方服務(wù)商提供的工具。而24小時(shí)上播的AI數(shù)字人SaaS類工具,市面上也有不少選擇。

那么,百度發(fā)布的數(shù)字人直播工具有何不同?

數(shù)字人直播系統(tǒng)操作界面

“首先,超寫實(shí)數(shù)字人的表現(xiàn)力更強(qiáng),更漂亮、更細(xì)膩,對(duì)用戶來講意味著更好的體驗(yàn)和更長的停留時(shí)長。第二,它的交互能力有很大提升。從能夠延長用戶的閑時(shí)播放時(shí)長這個(gè)角度來講,對(duì)于商家和平臺(tái)來說都具有很大的價(jià)值。”李士巖說。

不僅外形“養(yǎng)眼”,百度數(shù)字人的互動(dòng)能力也處于行業(yè)領(lǐng)先水平。該系統(tǒng)可以在真人驅(qū)動(dòng)和AI驅(qū)動(dòng)中自由切換,真人驅(qū)動(dòng)時(shí)可采用“單目動(dòng)捕技術(shù)”,只需一個(gè)RGB攝像頭就可完成對(duì)超寫實(shí)數(shù)字人的驅(qū)動(dòng)。而AI驅(qū)動(dòng)時(shí),則通過搭載的“PLATO百億參數(shù)對(duì)話模型”,保證數(shù)字人在無人值守時(shí)展示產(chǎn)品、與觀眾聊天和實(shí)時(shí)智能問答。

“但這些其實(shí)還不是最關(guān)鍵的”,李士巖說,超寫實(shí)數(shù)字人的能力將在服裝、美妝、假發(fā)等垂直品類帶貨中最大體現(xiàn)。過去,受困于2D類、卡通類等低精度模型,數(shù)字人直播無法展現(xiàn)很多復(fù)雜場景。

“卡通數(shù)字人不可能把真實(shí)質(zhì)地的布料穿在身上,也不可能戴上效果非常真實(shí)的假發(fā),這些都是過去技術(shù)所限。而超寫實(shí)數(shù)字人能夠用數(shù)字化的形式展現(xiàn)這些產(chǎn)品,玩法也會(huì)更多,表現(xiàn)力會(huì)更強(qiáng)。”他具體解釋道。

甚至于在某些情況下,數(shù)字人還可能遠(yuǎn)遠(yuǎn)超過真人帶貨主播。

李士巖以真人主播帶貨服裝的場景舉例:真人主播一般最多能在攝像頭前給觀眾展示面料,或者親自試穿服裝。但在數(shù)字直播中,超寫實(shí)數(shù)字人不僅可以做到上述事情,還可以通過安排多個(gè)數(shù)字人模特走秀,用專業(yè)的運(yùn)鏡來展現(xiàn)服裝,這是僅在數(shù)字空間才能做到的。

李士巖表示,百度非??春梅b、美妝、假發(fā)等品類與超寫實(shí)數(shù)字人結(jié)合的帶貨效果。他還透露,百度正與一家知名假發(fā)品牌探討合作。

03

數(shù)字人直播逐漸“卷”起來

是商家的福音?

根據(jù)中商產(chǎn)業(yè)研究院預(yù)計(jì),2022年中國電商直播市場規(guī)模將上升至15073億元。直播已經(jīng)成為企業(yè)及品牌獲客、轉(zhuǎn)化不可或缺的手段。展望數(shù)字人的未來,“電商帶貨、娛樂直播,這兩大賽道增長率極高,我們非常的看好,也會(huì)持續(xù)進(jìn)行投入”,李士巖說。

談及百度此次推出數(shù)字人產(chǎn)品的契機(jī),李士巖表示,雖然直播營銷的形式對(duì)于企業(yè)來說越來越重要,但客戶普遍反饋,行業(yè)中沒有一個(gè)標(biāo)準(zhǔn)化的超寫實(shí)數(shù)字人產(chǎn)品可以實(shí)現(xiàn)快速交付。另一方面,百度也發(fā)現(xiàn)客戶有降低成本的訴求。

“有很多商家受困于直播間搭建成本、雇主播成本包括必須有專業(yè)運(yùn)營團(tuán)隊(duì),使得他們無法搭建專業(yè)的直播間。”李士巖說。而根據(jù)他的的估算,“在一線城市雇一名比較好的主播月薪一般在1萬元左右,場地費(fèi)用一年3-4萬,這些成本加起來每年就需要大概15萬?!比绻麘?yīng)用數(shù)字人直播平臺(tái),直播間的場景裝修、燈光、服裝、化妝都可以運(yùn)用數(shù)字場景實(shí)現(xiàn),“成本可下降30%以上,甚至達(dá)到50%以上”。

當(dāng)前,無人值守、7x24小時(shí)直播的數(shù)字人服務(wù)已逐漸成為許多數(shù)字電商直播間的標(biāo)配,而其最主要的作用仍然局限于幫助店家提高閑時(shí)流量、延長直播時(shí)長兩方面。但李士巖直言,“這僅是行業(yè)技術(shù)還尚未取得突破時(shí),早期階段的一個(gè)產(chǎn)品形態(tài)?!?/p>

當(dāng)超寫實(shí)數(shù)字人在行業(yè)內(nèi)下沉后,數(shù)字人在直播電商的應(yīng)用將會(huì)出現(xiàn)更大的想象空間。

但百度技術(shù)人員也坦言,此次發(fā)布的產(chǎn)品還只是“1.0版本階段”,有許多尚且不完善的地方。而隨著產(chǎn)品的快速迭代升級(jí),產(chǎn)品將推出2.0、3.0版本,在諸如數(shù)字人外形的模版可選數(shù)量、數(shù)字直播間的場景豐富度等方面進(jìn)行重點(diǎn)升級(jí)。

而在人與虛擬人AI的互動(dòng)方面,李士巖也說,“相信經(jīng)過我們的持續(xù)努力,在可預(yù)見的1~2年內(nèi)非常有可能讓我們的數(shù)字人的表現(xiàn)力跟交互能力無限制的趨近于真人的水平。”

從外形到交互能力,再到使用成本,百度這樣國內(nèi)數(shù)字人頭部玩家,正在推動(dòng)電商直播間中的數(shù)字人快速迭代升級(jí)。但在流量枯竭的時(shí)代,數(shù)字人廠商“卷”得越厲害,也意味著品牌和商家在營銷工具上擁有越多的選擇空間。

在這樣的大趨勢(shì)下,未來,電商直播間甚至主播本人都可能會(huì)逐漸“數(shù)字化”、“元宇宙化”,而過去難以想象的帶貨形式也將化為可能?;蛟S,那時(shí)屬于電商直播的新機(jī)遇也將隨之浮現(xiàn)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-07-27
百度下場 超寫實(shí)數(shù)字人改變直播帶貨?
百度下場,數(shù)字人直播帶貨迎來重量級(jí)玩家;直播戰(zhàn)場再起硝煙,賽道內(nèi)卷逐漸加劇。

長按掃碼 閱讀全文