解析百度“高說服力數(shù)字人”:AI技術(shù)如何說服用戶“買買買”?

4月25日消息(南山)作為AI技術(shù)的重要應(yīng)用方向,數(shù)字人去年以來迅速崛起,憑借“24小時(shí)直播”、“只需一部手機(jī)即可直播”、“低成本高收益”等賣點(diǎn),成為電商、營銷、文旅等一眾行業(yè)的新寵。但問題也隨之浮現(xiàn):數(shù)字人不夠真實(shí),直播效果不佳;供應(yīng)商魚龍混雜,軟件價(jià)格暗藏陷阱;電商平臺態(tài)度不一等,為商家采用這一新型AI技術(shù)帶來了很多困擾。

很顯然,電商直播數(shù)字人市場還處于草創(chuàng)時(shí)期。百度嘗試通過AI技術(shù)創(chuàng)新實(shí)現(xiàn)引領(lǐng),在4月25日舉辦的“Create 2025百度AI開發(fā)者大會”上,百度創(chuàng)始人李彥宏發(fā)布了高說服力數(shù)字人,他介紹說,高說服力數(shù)字人具備聲形超擬真、內(nèi)容更專業(yè)、互動更靈活的特點(diǎn),相比傳統(tǒng)數(shù)字人文案枯燥、動作少、機(jī)器音重等問題,高說服力數(shù)字人在表情、語氣、動作等都非常自然,甚至表現(xiàn)力超過真人。

而在這背后,發(fā)揮作用的重要是 “劇本生成”能力,能讓表情、語氣、動作都匹配臺詞內(nèi)容實(shí)時(shí)調(diào)整,讓數(shù)字人的情緒轉(zhuǎn)折和動作切換順暢。


比如現(xiàn)場演示的高說服力數(shù)字人講《蘇軾十講》視頻,可以看到慧播星生成的艾彌兒數(shù)字人非常逼真,表情、語氣、動作都十分真實(shí),和真人無異,匹配臺詞實(shí)時(shí)調(diào)整,情緒轉(zhuǎn)折和動作切換都很順暢,直播表現(xiàn)力甚至超越真人。

據(jù)悉,在文心4.5 Turbo和文心X1升級版的基礎(chǔ)上,通過視頻生成、劇本驅(qū)動多模匹配、高感染力TTS等能力建設(shè),打造出的一種超擬真、會思考、能協(xié)同的數(shù)字人。

讓數(shù)字人超越真人,無疑極具吸引力,帶來了巨大的想象空間。問題在于,這是現(xiàn)在,還是未來?

逼近真人與超越真人

相比以前的數(shù)字人,在百度App電商平臺中直播的數(shù)字人,不僅外形如同真人,言談舉止甚至一些不經(jīng)意的小動作,也和真人一般無異,還能夠和買家互動,渾然讓人忘記對面其實(shí)是一個虛擬人物,

可以看到不少數(shù)字人主播已經(jīng)“營業(yè)”,效果極為擬真,不僅外形如同真人,言談舉止甚至一些不經(jīng)意的小動作,也和真人一般無異,還能夠和買家互動,渾然讓人忘記對面其實(shí)是一個虛擬人物。

筆者基于個人的4分鐘視頻信息,創(chuàng)建了一個自己的慧播星電商直播數(shù)字人,并基于自己撰寫的文案一鍵開播。視頻直播中如同一個全新的自己:相貌一模一樣,說話方式也幾乎一樣,談?wù)摰膬?nèi)容則遠(yuǎn)非自己所能,讓筆者感到新鮮的同時(shí)也感到震驚。

在動態(tài)的直播環(huán)境中,慧播星數(shù)字人的呈現(xiàn)效果,足夠驚艷。百度副總裁、百度電商總經(jīng)理平曉黎接受C114等媒體采訪時(shí)表示,慧播星數(shù)字人直播基于真人底板,因而視覺感知實(shí)現(xiàn)了和真人直播一樣的效果;同時(shí),基于語音大模型,聲音也實(shí)現(xiàn)了類似真人的表達(dá)感染力;基于預(yù)設(shè)的劇本,數(shù)字人的動作也更加協(xié)調(diào)、自然,除了直播,也會通過一些細(xì)節(jié),例如翻看手機(jī),展現(xiàn)出更好的親和力。

百度慧播星數(shù)字人不僅擁有擬真的外貌和表現(xiàn),它還擁有基于龐大云端知識庫的豐富知識儲備,從而做到“美貌與實(shí)力并存”。因此,在某種程度上來看,畫慧播星數(shù)字人直播能夠?qū)崿F(xiàn)超越真人直播的效果。

上述逼近真人的表現(xiàn)之外,慧播星數(shù)字人還有龐大的云端知識庫,無疑比真人主播更加“博學(xué)”、更具文采,從而在某些方面實(shí)現(xiàn)超越真人直播的效果。平曉黎提到,電商直播具有一定的門檻,滲透率還比較低,而通過慧播星數(shù)字人,大量商家將直接擁有直播能力,切入這一領(lǐng)域,從而實(shí)現(xiàn)銷售額的增長。百度采取開放的態(tài)度,為商家打造了強(qiáng)大的數(shù)字人直播平臺。

數(shù)字人有望迎來“DeepSeek時(shí)刻”

高說服力數(shù)字人的概念,建立在多項(xiàng)AI技術(shù)取得突破的基礎(chǔ)之上。相比建模、綁定、渲染等傳統(tǒng)數(shù)字人技術(shù),以及上一代的語音交互、自然語言處理、視覺等AI技術(shù),新一代大模型帶來了多模態(tài)融合、腳本智能創(chuàng)作、自主思考決策、多智能體調(diào)度等核心技術(shù),使得數(shù)字人能力、制作時(shí)間、成本等一降再降低,效果也迎來質(zhì)的飛躍。

平曉黎重點(diǎn)講解了兩大新應(yīng)用:一方面基于多模態(tài)融合,從大模型驅(qū)動的腳本模式,演進(jìn)到了劇本模式。劇本模式在生成上不僅指導(dǎo)數(shù)字人主播表達(dá)的語言腳本,更是進(jìn)入了劇本,直播時(shí)用什么樣的表情和動作,語調(diào)是激情澎拜還是娓娓道來,均可通過“克隆”實(shí)現(xiàn),以及業(yè)內(nèi)領(lǐng)先的唇動生成技術(shù),用戶上傳真人視頻,可一鍵克隆真人聲音、形象與直播間裝修,0門檻開啟24小時(shí)數(shù)字人直播。

另一方面多智能體協(xié)同實(shí)現(xiàn)了AI大腦,配合主播的口播文案,AI大腦能夠?qū)崟r(shí)調(diào)度素材,展現(xiàn)和文本一一對應(yīng)的內(nèi)容。而當(dāng)用戶提問時(shí),AI大腦也能及時(shí)根據(jù)用戶需求,調(diào)度視頻來呈現(xiàn)用戶想要看到的畫面。這種毫秒級的響應(yīng)能力,讓專業(yè)講解變得可視化、記憶點(diǎn)十足,同時(shí)主播還能夠根據(jù)用戶歷史行為,主動發(fā)起提問和用戶互動,且能夠持續(xù)互動,從而說服用戶“買買買”。

基于文心4.5turbo等大模型作為底座能力,百度慧播星上線了“一鍵開播”、“一鍵克隆”等新功能,每一位入駐百度電商平臺的商家,無需付費(fèi)購買軟件,均可0成本制作數(shù)字人主播,且靈活切換主播風(fēng)格,從而帶來業(yè)務(wù)的增長。亂象橫生的電商直播數(shù)字人市場,可能迎來了“DeepSeek時(shí)刻”,人人皆可直播,帶來了巨大的創(chuàng)造力。

AI大模型的“殺手級應(yīng)用”

在Create 2025上演講時(shí),李彥宏認(rèn)為數(shù)字人是2025 年最令人激動的突破性應(yīng)用之一。

基于高說服力數(shù)字人所呈現(xiàn)的突破性創(chuàng)新,筆者看到了數(shù)字人徹底擺脫傳統(tǒng)動作神情呆板、聲音機(jī)械化缺乏情感等形象,變得“有血有肉”,甚至展現(xiàn)出一個有趣的靈魂,有望成為AI大模型的“殺手級應(yīng)用”。

百度做了大量工作。在技術(shù)側(cè),百度慧播星在IDC評選的綜合實(shí)力排名行業(yè)第一基礎(chǔ)上再度升級,高說服力數(shù)字人首先說服的是廣大商家,再由商家說服顧客;在市場側(cè),據(jù)平曉黎透露,百度正在通過業(yè)務(wù)部署,正在與外貿(mào)商家密切溝通,幫助他們出口轉(zhuǎn)內(nèi)銷,打開新渠道。數(shù)字人是重要一環(huán),可以幫助外貿(mào)商家更低成本、更快地適應(yīng)國內(nèi)電商市場,無需招聘直播團(tuán)隊(duì)、準(zhǔn)備直播場地,即可開展直播電商業(yè)務(wù)。


盡管和真人主播、尤其是頭部大主播的人設(shè)打造、粉絲經(jīng)營相比,數(shù)字人主播還存在不足,但從新一輪技術(shù)突破的角度看,數(shù)字人主播已能成為商家直播電商的重要幫手,起到輔助甚至主攻的作用,也擁有了成為頭部主播的潛力。尤其是教育、圖書、醫(yī)療、法律等考驗(yàn)主播的文化素養(yǎng)或知識技能的領(lǐng)域,數(shù)字人直播憑借擁有云端知識庫的AI大腦,能力已整體超過真人主播。

用戶用百度慧播星創(chuàng)造一個數(shù)字人直播,或者在百度App上觀看幾場數(shù)字人直播,就會直觀地感受到數(shù)字人技術(shù)的巨大突破。隨著AI技術(shù)迭代,數(shù)字人直播電商市場有望快速越過草創(chuàng)期,進(jìn)入行業(yè)走向規(guī)范、繁榮的發(fā)展期。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2025-04-25
解析百度“高說服力數(shù)字人”:AI技術(shù)如何說服用戶“買買買”?
解析百度“高說服力數(shù)字人”:AI技術(shù)如何說服用戶“買買買”?,C114訊 4月25日消息(南山)作為AI技術(shù)的重要應(yīng)用方向,數(shù)字人去年以來迅速崛起,憑借“24

長按掃碼 閱讀全文