近兩年,小雀斑、柳夜熙、AYAYI等大量網(wǎng)紅數(shù)字人的相繼出現(xiàn),以及虛擬數(shù)字技術(shù)在《指環(huán)王》和《阿凡達(dá)》以及《刺殺小說(shuō)家》等電影中的廣泛應(yīng)用,還有北京冬奧會(huì)期間數(shù)字人在手語(yǔ)解說(shuō)、節(jié)目直播等眾多場(chǎng)合亮相,使得公眾對(duì)數(shù)字人的認(rèn)知上升到了一個(gè)新的臺(tái)階。
作為數(shù)字經(jīng)濟(jì)的重要環(huán)節(jié),數(shù)字人為數(shù)字經(jīng)濟(jì)的發(fā)展注入了新的動(dòng)能。于是,各個(gè)行業(yè)企業(yè)便涌現(xiàn)出了多個(gè)玩家,紛紛基于已有的相關(guān)技術(shù)和業(yè)務(wù)基礎(chǔ),開始進(jìn)軍數(shù)字人賽道,數(shù)字人行業(yè)也由此迎來(lái)了一波新的發(fā)展熱潮。
數(shù)字人乘風(fēng)而起
隨著數(shù)字人在各行各業(yè)中的應(yīng)用越來(lái)越廣泛,國(guó)內(nèi)數(shù)字人市場(chǎng)規(guī)模也在持續(xù)穩(wěn)步增長(zhǎng)。根據(jù)IDC在《中國(guó)AI數(shù)字人市場(chǎng)現(xiàn)狀與機(jī)會(huì)分析2022》報(bào)告中預(yù)計(jì),到2023年中國(guó)AI數(shù)字人市場(chǎng)規(guī)模將達(dá)102.4億元。而數(shù)字人市場(chǎng)之所以將呈現(xiàn)高速增長(zhǎng)的態(tài)勢(shì),則與三大利好不無(wú)關(guān)系。
從政策層面來(lái)看,國(guó)家政策的大力支持,預(yù)示著數(shù)字人的前景一片大好。近年來(lái),國(guó)內(nèi)虛擬現(xiàn)實(shí)相關(guān)產(chǎn)業(yè)備受外界關(guān)注,自2016年起,國(guó)家就發(fā)布了多項(xiàng)政策支持我國(guó)虛擬現(xiàn)實(shí)產(chǎn)業(yè)的發(fā)展,并將虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)與云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、區(qū)塊鏈、人工智能一起列為了數(shù)字經(jīng)濟(jì)重點(diǎn)產(chǎn)業(yè)。而虛擬數(shù)字人作為虛擬現(xiàn)實(shí)產(chǎn)業(yè)重要的應(yīng)用之一,自然也有望享受到政策利好所帶來(lái)的紅利釋放期。
從技術(shù)層面來(lái)看,數(shù)字技術(shù)的融合發(fā)展,驅(qū)動(dòng)了數(shù)字人進(jìn)入發(fā)展快車道。其實(shí)數(shù)字人出現(xiàn)的時(shí)間并不算晚,只是受技術(shù)應(yīng)用水平的限制,早期的數(shù)字人制作周期長(zhǎng)且成本高。而近幾年,隨著CG、語(yǔ)音合成、深度學(xué)習(xí)算法、自然語(yǔ)言處理等技術(shù)的進(jìn)步,數(shù)字人各環(huán)節(jié)制作周期大大縮短、制作成本明顯降低,數(shù)字人制作也走向了智能化。堅(jiān)實(shí)的技術(shù)基礎(chǔ),不僅創(chuàng)新了數(shù)字人行業(yè)的發(fā)展應(yīng)用,更是加速了數(shù)字人場(chǎng)景化的應(yīng)用落地。
從環(huán)境層面來(lái)看,AIGC技術(shù)的逐漸成熟,助力了數(shù)字人行業(yè)規(guī)模的拓展。數(shù)字人雖然最初多應(yīng)用于影視、游戲等行業(yè),但隨后應(yīng)用場(chǎng)景將會(huì)不斷拓展。只不過(guò),越復(fù)雜的環(huán)境對(duì)數(shù)字人的信息處理能力、即時(shí)互動(dòng)能力,以及表達(dá)能力等都有著更高的要求。而在AIGC的賦能下,數(shù)字人內(nèi)容生產(chǎn)流程將有望得到創(chuàng)新,可助力數(shù)字人廣泛與各行業(yè)領(lǐng)域相結(jié)合,為數(shù)字人描繪出了極大的創(chuàng)作及交互想象空間。
在政策、技術(shù)、環(huán)境的多輪驅(qū)動(dòng)下,數(shù)字人應(yīng)用場(chǎng)景將持續(xù)得到拓展與深化。而隨著數(shù)字人行業(yè)進(jìn)入高速發(fā)展期,國(guó)內(nèi)也已出現(xiàn)了諸多相當(dāng)有競(jìng)爭(zhēng)力的玩家,這其中,以百度為代表的綜合類互聯(lián)網(wǎng)技術(shù)廠商,以及以科大訊飛代表的專長(zhǎng)類AI廠商的表現(xiàn)最為突出,優(yōu)勢(shì)也最為明顯。
百度“雙輪驅(qū)動(dòng)”
目前來(lái)看,數(shù)字人雖然已經(jīng)應(yīng)用于多個(gè)領(lǐng)域,但當(dāng)前市場(chǎng)上大多的數(shù)字人產(chǎn)品精度依舊較低,而百度不僅上線了具備較強(qiáng)的視覺感知和動(dòng)作控制能力,能夠通過(guò)手勢(shì)、語(yǔ)音等方式與用戶進(jìn)行互動(dòng)的虛擬數(shù)字人,還搭建了百度智能云曦靈智能數(shù)字人平臺(tái),提供虛擬形象智能交互解決方案,而這些產(chǎn)品的生成,都源于百度為數(shù)字人相關(guān)開發(fā)提供了絕佳的土壤。
一方面,百度在AI技術(shù)上的領(lǐng)先優(yōu)勢(shì),能夠高效率、高質(zhì)量地推動(dòng)其數(shù)字人技術(shù)的迭代升級(jí)。眾所周知,數(shù)字人的發(fā)展離不開計(jì)算機(jī)視覺、智能語(yǔ)音、自然語(yǔ)言處理等AI技術(shù)的支持,而作為國(guó)內(nèi)唯一一家既有視覺能力,又有語(yǔ)音、語(yǔ)義相關(guān)包括計(jì)算機(jī)圖形學(xué)自動(dòng)生成全鏈路AI能力平臺(tái)型的公司,百度已經(jīng)積累了大量全棧AI能力,而這無(wú)疑是其數(shù)字人成功落地的實(shí)力與底氣。
另一方面,百度標(biāo)準(zhǔn)化、平臺(tái)化的優(yōu)勢(shì),可以有效降低運(yùn)營(yíng)門檻,助其數(shù)字人實(shí)現(xiàn)廣泛應(yīng)用。想要實(shí)現(xiàn)“人均一個(gè)”數(shù)字人,產(chǎn)品標(biāo)準(zhǔn)化、平臺(tái)化必不可少。得益于百度在視覺、NLP、語(yǔ)音交互等底層全棧AI技術(shù)優(yōu)勢(shì)的長(zhǎng)期積累,以及PLATO百億參數(shù)對(duì)話大模型,百度智能云已經(jīng)將這一能力平臺(tái)化、標(biāo)準(zhǔn)化,這不僅使其部署成本更低,周期更短,還可以做到一次部署、一次建設(shè),并在多個(gè)場(chǎng)景下形成虛擬數(shù)字人能力,實(shí)現(xiàn)端到端軟硬一體的商業(yè)應(yīng)用。
百度憑借無(wú)可比擬的AI能力,加之在標(biāo)準(zhǔn)化、平臺(tái)化中服務(wù)穩(wěn)定、成本低廉等特點(diǎn),在數(shù)字人領(lǐng)域先發(fā)制人,在產(chǎn)品力、市場(chǎng)上走在了行業(yè)前列。據(jù)了解,百度智能數(shù)字人平臺(tái)是世界上首個(gè)在線語(yǔ)音交互注意力模型,實(shí)現(xiàn)與數(shù)字人自然暢通交流,高準(zhǔn)確度的音畫同步,逐字口型準(zhǔn)確率>98.5%。另外,目前百度終端虛擬人產(chǎn)品,也已經(jīng)以智能客服的形象,成功落地在了深圳、重慶、鄭州等多個(gè)城市的各大地鐵站,全天候?yàn)閬?lái)往的乘客提供最便利的智能咨詢服務(wù)。
科大訊飛“三線出擊”
數(shù)字人已經(jīng)成為多家廠商發(fā)力的重點(diǎn),凡是進(jìn)入的玩家都在機(jī)器視覺、語(yǔ)音交互和自然語(yǔ)言處理等方面有著或多或少的技術(shù)積累,而盡管國(guó)內(nèi)諸多互聯(lián)網(wǎng)大廠和科技巨頭都瞄準(zhǔn)了數(shù)字人賽道,但作為亞太地區(qū)知名的智能語(yǔ)音和人工智能上市企業(yè),科大訊飛同樣在推動(dòng)數(shù)字人產(chǎn)品和場(chǎng)景應(yīng)用落地上,建立起了自己的優(yōu)勢(shì)。
一是,科大訊飛所具有的豐富的技能和問(wèn)答知識(shí)儲(chǔ)備,可以讓其數(shù)字人變得更加聰慧智能。一直以來(lái),科大訊飛都在致力于讓機(jī)器“能聽會(huì)說(shuō),能理解會(huì)思考”,其開發(fā)的星火大模型不僅在開放式知識(shí)問(wèn)答上取得了突破,其多輪對(duì)話、邏輯和數(shù)學(xué)能力也有所升級(jí)。而科大訊飛語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理等各項(xiàng)能力的持續(xù)提升,能夠使其數(shù)字人準(zhǔn)確地理解用戶問(wèn)題,并給出自然、準(zhǔn)確的回答,為用戶帶來(lái)更為豐富的使用體驗(yàn)。
二是,科大訊飛在智能語(yǔ)音技術(shù)方面的深厚積淀,可以為其數(shù)字人的落地提供全鏈路保障。科大訊飛自成立以來(lái),就一直從事著智能語(yǔ)音、自然語(yǔ)言理解、計(jì)算機(jī)視覺等核心技術(shù)的研究,并且其在語(yǔ)音、圖像、自然語(yǔ)言理解、機(jī)器認(rèn)知推理能力、多語(yǔ)種多模態(tài)人機(jī)交互等方面的技術(shù)和產(chǎn)業(yè)化應(yīng)用已具有業(yè)界領(lǐng)先水平。得益于此,科大訊飛的數(shù)字人也就能得到語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音合成、形象驅(qū)動(dòng)、視頻渲染服務(wù)的全鏈路保障。
三是,科大訊飛專屬的數(shù)字人定制能力,有助其在眾多廠商中形成差異化優(yōu)勢(shì)。科大訊飛可以根據(jù)客戶要求,在客戶的不同業(yè)務(wù)場(chǎng)景下進(jìn)行AI虛擬人賦能,為客戶提供一站式、定制化AI虛擬人服務(wù)。比如,在服務(wù)部署上,可以靈活采用公有云或私有云的部署方案,保障交互服務(wù)的安全穩(wěn)定;在形象聲音上,可以根據(jù)客戶音色、風(fēng)格的需求靈活定制專屬的個(gè)性化語(yǔ)音庫(kù);在虛擬人形象上,可以支持2D真人形象,從而為客戶定制專有IP形象。
仍需負(fù)重前行
在數(shù)字時(shí)代,數(shù)字人已經(jīng)開始在各個(gè)企業(yè)中扮演關(guān)鍵角色。然而對(duì)于數(shù)字人企業(yè)而言,打通產(chǎn)業(yè)鏈各環(huán)節(jié)、修煉技術(shù)“內(nèi)功”,才是打造競(jìng)爭(zhēng)優(yōu)勢(shì)、強(qiáng)化競(jìng)爭(zhēng)壁壘的關(guān)鍵。因此,即便是國(guó)內(nèi)數(shù)字人發(fā)展較為成熟的公司,已經(jīng)在客戶積累、技術(shù)實(shí)力、銷售渠道、資金供給等方面具備了一定積累,但由于數(shù)字人行業(yè)天花板依舊較高,想要維持長(zhǎng)期和衍生發(fā)展并不容易。
一方面,國(guó)內(nèi)數(shù)字人尚處于起步階段,距離商業(yè)化規(guī)模推廣仍有一定距離。盡管國(guó)內(nèi)諸多企業(yè)的數(shù)字人已經(jīng)實(shí)現(xiàn)了場(chǎng)景化應(yīng)用,但就整體而言,我國(guó)數(shù)字人行業(yè)發(fā)展仍處于起步階段,不僅尚未跑出一個(gè)覆蓋全產(chǎn)業(yè)鏈的數(shù)字人企業(yè),大多數(shù)企業(yè)在數(shù)字人情緒感知、語(yǔ)義理解、情感連接等方面仍有所欠缺。另外,國(guó)內(nèi)各家數(shù)字人在細(xì)分市場(chǎng)上的產(chǎn)品也都還仍處于試驗(yàn)可行性的階段,大規(guī)模商業(yè)化暫時(shí)還難以實(shí)現(xiàn)。
另一方面,海外巨頭的數(shù)字人優(yōu)勢(shì)明顯,國(guó)內(nèi)企業(yè)想要追趕還需更加努力。國(guó)內(nèi)領(lǐng)先企業(yè)的數(shù)字人產(chǎn)品雖然已經(jīng)頗具特色,但國(guó)內(nèi)企業(yè)更側(cè)重AI技術(shù)的開發(fā)與內(nèi)容應(yīng)用,因此數(shù)字人產(chǎn)品大多探索的是其在社交活動(dòng)、新聞媒體、文旅等領(lǐng)域的應(yīng)用。而海外巨頭多聚焦于數(shù)字人的基礎(chǔ)建設(shè),技術(shù)優(yōu)勢(shì)較為明顯。比如英偉達(dá)、Unity等均基于自身技術(shù)優(yōu)勢(shì)向下游生產(chǎn)技術(shù)服務(wù)平臺(tái)延伸,相較于國(guó)內(nèi),其技術(shù)壁壘就更為深厚。
目前來(lái)看,國(guó)內(nèi)以百度、科大訊飛為代表的科技企業(yè)在數(shù)字人上的探索雖然還有一定難度,但值得注意的是,在各個(gè)大廠的不斷發(fā)力,以及人工智能技術(shù)的大力加持下,數(shù)字人的制作運(yùn)營(yíng)效率有望得到持續(xù)優(yōu)化,其應(yīng)用價(jià)值也將得到不斷釋放。而隨著百度、科大訊飛不遺余力地加速數(shù)字人的進(jìn)程,其數(shù)字人的未來(lái)也將會(huì)非常值得期待。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美國(guó)無(wú)人機(jī)禁令升級(jí)?當(dāng)?shù)乜茖W(xué)家率先“喊疼”:我們離不開大疆
- iQOO Neo10 Pro:性能特長(zhǎng)之外,亦有全能實(shí)力
- 自動(dòng)駕駛第一股的轉(zhuǎn)型迷途:圖森未來(lái)賭上了AIGC
- 明星熱劇、品牌種草、平臺(tái)資源,京東讓芬騰雙11的熱度“沸騰”了
- 一加 Ace 5 Pro明牌:游戲手機(jī)看它就夠了!
- 游戲體驗(yàn)天花板,一加 Ace 5 系列售價(jià) 2299 元起
- 16個(gè)月沒(méi)工資不敢離職,這些打工人“自費(fèi)上班”
- 怎樣利用微信小店“送禮”功能賺錢?
- 鴻蒙智行問(wèn)界M9,中國(guó)豪華車的龍門一躍
- 科技云報(bào)道:人工智能時(shí)代“三大件”:生成式AI、數(shù)據(jù)、云服務(wù)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。