原標(biāo)題:Web3.0時代,數(shù)字人如何突破規(guī)模落地三大難點?
元宇宙無疑是2021年的概念頂流,在巨頭下場、web 3.0加速構(gòu)建過程中,虛擬數(shù)字人作為元宇宙的場景入口與連接紐帶也備受矚目。今年的江蘇衛(wèi)視跨年晚會上,周深與鄧麗君跨時空合唱《大魚》刷屏。面對數(shù)字人展現(xiàn)出的眾多可能性,2022年1月14日,百度科技沙龍《AI呀,我去!》第四期以數(shù)字人為主題,為百余位媒體、專家學(xué)者展現(xiàn)了數(shù)字人產(chǎn)業(yè)的全景。
會上,百度智能云AI人機交互實驗室負(fù)責(zé)人李士巖基于多年經(jīng)驗,圍繞當(dāng)前數(shù)字人產(chǎn)業(yè)的發(fā)展格局、技術(shù)難點和底層驅(qū)動力進行了系統(tǒng)分享。李士巖表示,虛擬數(shù)字人產(chǎn)業(yè)格局中,提供建模、渲染、動態(tài)捕捉等服務(wù)于數(shù)字人制作的基礎(chǔ)設(shè)施服務(wù)商已形成穩(wěn)固格局,大多由海外巨頭把持。但在工具、應(yīng)用層,中國企業(yè)已開始嶄露頭角。
不過,數(shù)字人規(guī)模化落地還面臨三大難點:產(chǎn)業(yè)鏈割裂、服務(wù)場景與演藝場景沒有有效打通、滿足高頻需求成本高。為系統(tǒng)解決這些難題,百度推出數(shù)字人平臺“曦靈”,未來數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)將可以在一個平臺上實現(xiàn)全鏈路制作和調(diào)優(yōu),降本增效。“我們近兩年的奮斗目標(biāo)是,通過百度智能云曦靈平臺的開放,讓每個人實現(xiàn)數(shù)字人自由?!崩钍繋r表示。
數(shù)字人大規(guī)模落地要突破三大難題
目前,數(shù)字人經(jīng)歷了以“紙片人”為代表的1.0階段,以Vtuber主播為代表的2.0時代,已進化至3.0階段,具備模型高精、人工智能驅(qū)動特點的數(shù)字人3.0成為行業(yè)主流。李士巖介紹,第三代數(shù)字人的建模和內(nèi)容生產(chǎn)均有AI參與,這使得數(shù)字人的制作效率更高,也更智能,能面向更多應(yīng)用場景??擅嫦蛉后w用戶,可由視頻、直播、chatbot等載體承載,更具備千人千面的互動能力。
數(shù)字人3.0已展現(xiàn)出巨大的市場空間。根據(jù)次元光譜不完全統(tǒng)計,2021年國內(nèi)虛擬偶像/數(shù)字人領(lǐng)域里至少發(fā)生19筆融資,2021年產(chǎn)業(yè)上下游也紛紛從自己擅長的角度切入市場。虛擬數(shù)字人產(chǎn)業(yè)格局中,提供建模、渲染、動態(tài)捕捉等服務(wù)于數(shù)字人制作的基礎(chǔ)設(shè)施服務(wù)商已形成穩(wěn)固格局,大多由海外巨頭把持。不過,在工具、應(yīng)用層,中國企業(yè)已開始嶄露頭角。
中國企業(yè)中,數(shù)量最多的是資產(chǎn)制作和策劃運營類的公司,比如推出超寫實數(shù)字人的AYAYI燃麥科技,推出虛擬人物柳夜熙的創(chuàng)壹視頻,但這類公司面臨的挑戰(zhàn)是門檻較低、可替代性高。此外,掌握技術(shù)和場景的互聯(lián)網(wǎng)公司則扮演綜合性技術(shù)服務(wù)商的角色,一邊推出基于自身優(yōu)勢場景的數(shù)字人,打造應(yīng)用標(biāo)桿;一邊推出數(shù)字人平臺,將產(chǎn)品繼續(xù)落地到更細化的場景中,點、線互相推進。
李士巖表示,數(shù)字人產(chǎn)業(yè)有三大核心推動力,第一級火箭是用戶需求與技術(shù)升級、第二級是政策支持與資本涌入、第三級是計算平臺的迭代?!懊恳淮螖?shù)字人發(fā)展本質(zhì)上都是技術(shù)推動的,用戶從平面的圖文影音獲取信息與交互,向?qū)崟r3D交互反饋的需求轉(zhuǎn)變,將成為數(shù)字人長期發(fā)展的根本動能,未來也將創(chuàng)造大量需求?!袄钍繋r說。
雖然數(shù)字人行業(yè)擁有強勁的驅(qū)動力,但李士巖認(rèn)為,當(dāng)下國內(nèi)數(shù)字人要大規(guī)模產(chǎn)業(yè)落地還面臨三大難題。
首先,數(shù)字人產(chǎn)業(yè)鏈各個節(jié)點相對割裂,不能高效協(xié)同,導(dǎo)致數(shù)字人在制作和調(diào)優(yōu)上存在較高壁壘,目前行業(yè)中大多數(shù)公司只是數(shù)字人制作與運營全流程上的一環(huán)或其中幾環(huán)。其次,服務(wù)場景與演藝場景沒有有效打通,表現(xiàn)為演藝型數(shù)字人不具備客戶所需的業(yè)務(wù)能力,而服務(wù)型數(shù)字人缺乏人設(shè),難以與用戶進行情感交流。第三是滿足高機動性、高頻需求的成本依舊很高,這一問題歸根結(jié)底還是數(shù)字人的生產(chǎn)效率問題。
百度推出數(shù)字人平臺“曦靈”
面對當(dāng)前數(shù)字人制作的高門檻,2021年12月,百度create大會(百度AI開發(fā)者大會)上,百度CTO王海峰正式發(fā)布了“百度智能云曦靈數(shù)字人平臺”, 搭建集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)為一體的平臺級產(chǎn)品。目前該產(chǎn)品已具備標(biāo)準(zhǔn)平臺的快速交付能力,幫助不同領(lǐng)域客戶快速實現(xiàn)敏捷型需求,降本增效。百度的數(shù)字人平臺曦靈具有全場景、一站式、平臺化的特點,能支持從最初數(shù)字人形象定制、人設(shè)管理再到業(yè)務(wù)編排、內(nèi)容創(chuàng)作,最后到多種驅(qū)動模式下與用戶互動的全部需求,這也意味著在一個平臺上即可實現(xiàn)數(shù)字人的全鏈路調(diào)優(yōu),從而將效果做到最好。
李士巖以數(shù)字人生成環(huán)節(jié)為例,演示了百度智能云曦靈平臺的功能。用戶在百度智能云曦靈平臺上傳一張照片,就能快速生成一個可被AI驅(qū)動的2D數(shù)字人像,以前需要兩三個月時間做出來的3D數(shù)字人,現(xiàn)在可以壓縮到小時級,同時還可以通過一句話語音描述或簡單捏臉等多種形式快速生產(chǎn)數(shù)字人。數(shù)字人個性化功能開發(fā)也較之前更加完善,以百度剛剛發(fā)布的3D超寫實口語數(shù)字人為例,其口型合成準(zhǔn)確率高達98.5%。
在技術(shù)催生的數(shù)字人3.0階段,虛擬人可與不同行業(yè)產(chǎn)生更緊密的融合?;谑袌鍪褂脠鼍埃瑪?shù)字人可以分為演藝型數(shù)字人、服務(wù)型數(shù)字人兩類。
演藝術(shù)型數(shù)字人包括虛擬主播、虛擬偶像以及數(shù)字孿生的虛擬品牌代言人。目前百度已經(jīng)打造了AI手語主播、央視網(wǎng)虛擬主持人小C、航天局火星車數(shù)字人祝融號、百度虛擬代言人希加加、百度APP代言人龔俊數(shù)字人。
服務(wù)型數(shù)字人包括數(shù)字員工、虛擬員工、虛擬業(yè)務(wù)員等,可以幫助金融、運營商、政府、零售等行業(yè)提供基于數(shù)字人的新一代客戶服務(wù)能力,解決排隊長、回應(yīng)慢、人力成本大等問題。目前,百度已經(jīng)和浦發(fā)銀行、光大銀行、中國聯(lián)通合作,推出了一對一服務(wù)型數(shù)字人。
百度在數(shù)字人技術(shù)上的突破也得益于其在行業(yè)內(nèi)的持續(xù)布局。早在2019年,百度就開始了“虛擬數(shù)字人戰(zhàn)略”?;诙嗄甑腁I技術(shù)沉淀, AI能力已成為百度智能云曦靈平臺的核心能力,現(xiàn)在百度也在把這種能力開放給外界。李士巖表示,“我們近兩年的奮斗目標(biāo)是通過百度智能云曦靈平臺的開放,讓每個人實現(xiàn)數(shù)字人自由?!?/p>
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準(zhǔn)AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。