科大訊飛虛擬技術(shù)再突破:讓A.I.虛擬人幫你更有愛(ài)拜年

當(dāng)科技遇上新年,會(huì)有怎樣的火花?

近日,科大訊飛最新上線了A.I.虛擬人愛(ài)加幫你送新春祝福的H5《你用A.I.拜年了嗎?》,把最暖心的新春祝福通過(guò)愛(ài)加聲情并茂地送到家人朋友眼前,讓你今年的拜年更酷炫。和以往的虛擬人不一樣的是,愛(ài)加的形象更加活潑可愛(ài),行動(dòng)也更靈活,還熟悉更多種語(yǔ)言和方言,能給天南海北的朋友傳達(dá)更親切的拜年祝福。(在微信公眾號(hào)“科大訊飛”后臺(tái)回復(fù)“愛(ài)加”即刻體驗(yàn),還有機(jī)會(huì)獲得千元驚喜A.I.禮物)

百節(jié)年為首,回家過(guò)年是每個(gè)在外打拼的人一年中最大的期盼。然而,今年情況特殊,很多地方都倡議“原地過(guò)年”。通過(guò)愛(ài)加傳達(dá)你的新春祝福,讓今年的“屏”上拜年將更具科技感和真實(shí)感。

科大訊飛虛擬技術(shù)再突破:讓A.I.虛擬人幫你更有愛(ài)拜年

個(gè)性化科技拜年,這個(gè)虛擬人更逼真

集成語(yǔ)音合成、語(yǔ)義理解、機(jī)器翻譯、人臉建模、口唇預(yù)測(cè)、圖像生成等多項(xiàng)人工智能技術(shù)不斷發(fā)展,使得A.I.虛擬人能根據(jù)文本語(yǔ)義做出相對(duì)應(yīng)的面部表情及肢體動(dòng)作,并逐漸走入尋常生活中。對(duì)于虛擬人,很多人并不陌生,2001年,英國(guó) PA New Media公司推出了世界上第一個(gè)虛擬主持人“阿娜諾娃”,三年后央視推出了國(guó)內(nèi)首位虛擬電視節(jié)目主持人“小龍”,都是虛擬人的應(yīng)用案例。

相比于愛(ài)加來(lái)說(shuō),此前科大訊飛推出的A.I.虛擬主播小晴表情動(dòng)作相對(duì)比較單一,使用場(chǎng)景很受限制。而當(dāng)前推出的虛擬人愛(ài)加在風(fēng)格上更多樣,在聲音、肢體動(dòng)作乃至于微表情的表達(dá)上更豐富,使用虛擬人愛(ài)加來(lái)幫你送上拜年祝福視頻,讓接收者更能真切感受到濃濃的新春祝福。另外,特別關(guān)注到的一點(diǎn),這次的愛(ài)加拜年活動(dòng)視頻,除了愛(ài)加本身形象更多樣表達(dá)更靈動(dòng),還創(chuàng)新性的引入了語(yǔ)義理解技術(shù)根據(jù)文本實(shí)現(xiàn)背景、音效等更多豐富視頻元素的自動(dòng)搭配,引領(lǐng)了AI驅(qū)動(dòng)多模態(tài)視頻合成方向,這一突破,也意味著A.I.虛擬人技術(shù)有望實(shí)現(xiàn)更加多元的拓展應(yīng)用,各行業(yè)大范圍應(yīng)用虛擬形象交互的時(shí)代,或許不遠(yuǎn)將至。

攻克合成技術(shù)壁壘,拜年虛擬人體現(xiàn)“人性化”

人工智能不斷進(jìn)步,A.I.早已不再是冷冰冰的科技,而是演變成為能幫助人類享受智慧生活、守護(hù)情感世界的好幫手。虛擬人的應(yīng)用前景可期,但由于技術(shù)限制,其肢體動(dòng)作、語(yǔ)言、情感表達(dá)效果還不能滿足人們期待。

那么科大訊飛是如何攻克合成難點(diǎn),讓其A.I.虛擬人有更高的觸達(dá)率?

首先,拓展A.I.虛擬人的“本事”,讓其“能說(shuō)會(huì)道”“能歌善舞”。在科大訊飛A.I.虛擬人已有的多語(yǔ)種、多方言合成能力之外,科大訊飛提出了基于歌唱音準(zhǔn)的無(wú)監(jiān)督歌唱標(biāo)注方法,將發(fā)音和音準(zhǔn)分離,利用神經(jīng)網(wǎng)絡(luò)分層級(jí)預(yù)測(cè),結(jié)合高精度神經(jīng)網(wǎng)絡(luò)聲碼器合成高品質(zhì)歌曲,同時(shí)提出姿態(tài)自適應(yīng)的表情合成技術(shù),解決了舞動(dòng)狀態(tài)面部姿態(tài)大角度以及多角度快速切換場(chǎng)景下的唇形合成難題,在使得虛擬人在精通各種語(yǔ)言的同時(shí),還能傾情演唱。

其次,增強(qiáng)虛擬人的“人性化”。為了給虛擬人注入情感,使其在互動(dòng)表達(dá)中更有人情味,科大訊飛結(jié)合認(rèn)知心理學(xué)理論對(duì)虛擬人進(jìn)行交互情感設(shè)計(jì),利用無(wú)監(jiān)督表征學(xué)習(xí)方法,分離并獲取語(yǔ)音中的情感表征。同時(shí),利用海量文本無(wú)監(jiān)督語(yǔ)義模型對(duì)各類文本進(jìn)行情感分類預(yù)測(cè),實(shí)現(xiàn)人性化的端到端情感合成系統(tǒng),讓虛擬人“活潑”起來(lái)。

最后,提升虛擬人的“表現(xiàn)力”。為使拜年視頻更具個(gè)性化,科大訊飛提出結(jié)合場(chǎng)景的背景音樂(lè)、音效疊加方案。通過(guò)對(duì)常用場(chǎng)景分類分析,構(gòu)建豐富多元的背景音樂(lè)、音效資源庫(kù),結(jié)合具體應(yīng)用場(chǎng)景,進(jìn)行背景音樂(lè)、音效的預(yù)測(cè)、疊加,從而實(shí)現(xiàn)高表現(xiàn)力的虛擬形象合成,用戶能定制理想狀態(tài)中的拜年場(chǎng)景,讓A.I.拜年場(chǎng)景更加生動(dòng)多元。

值得一提的是,基于科大訊飛提出的海量說(shuō)話人的音視頻數(shù)據(jù)預(yù)訓(xùn)練技術(shù),虛擬人愛(ài)加能夠做到基于少量數(shù)據(jù)就完成快速的建模,滿足多種場(chǎng)景多種風(fēng)格形象的快速定制,同時(shí),當(dāng)前虛擬人實(shí)時(shí)合成的速度以及并發(fā)一直是業(yè)界的痛點(diǎn),科大訊飛本次的虛擬人拜年活動(dòng)支持了高并發(fā)在線高質(zhì)量視頻生成,從而大幅提升虛擬人視頻制作的效率。用戶只需要等待幾秒鐘就可以完成一個(gè)A.I.虛擬人合成視頻,有效突破了A.I.虛擬人因?yàn)椴l(fā)路數(shù)有限而不能大規(guī)模推廣的難題,同時(shí)也展現(xiàn)出A.I.虛擬人從toB向toC推廣應(yīng)用的可能。

可以預(yù)見(jiàn),虛擬人愛(ài)加只是一個(gè)科大訊飛在虛擬人技術(shù)突破的一個(gè)新起點(diǎn),它的出現(xiàn)為下一步A.I.虛擬人的大范圍、規(guī)?;瘧?yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。

接棒人機(jī)交互領(lǐng)域,虛擬交互已大勢(shì)所驅(qū)

5G時(shí)代的到來(lái),讓科大訊飛人工智能科技與各行業(yè)有了更深的融合。通過(guò)人機(jī)協(xié)作,把人從重復(fù)性工作中解放出來(lái),更好地解放社會(huì)生產(chǎn)力,虛擬人技術(shù)如今正在匹配不同行業(yè)的更多場(chǎng)景需求,助推各行業(yè)“服務(wù)力”提升。

目前,科大訊飛基于A.I.交互能力的虛擬形象解決方案已經(jīng)應(yīng)用于多個(gè)場(chǎng)景,如虛擬站務(wù)員、虛擬金融理財(cái)顧問(wèn)、虛擬面試官,科大訊飛虛擬人的多模態(tài)得到了廣泛應(yīng)用。在教育場(chǎng)景中,科大訊飛一對(duì)一的A.I.虛擬老師”面對(duì)面“現(xiàn)場(chǎng)教學(xué),大大提高了教學(xué)效率、豐富了教學(xué)的內(nèi)容形式。

在視頻內(nèi)容生產(chǎn)上,通過(guò)A.I.虛擬主播系統(tǒng)提供的一站式視頻智能生產(chǎn)服務(wù),目前已累計(jì)為150多家媒體提供高效率、低成本的新聞內(nèi)容生產(chǎn),保障了傳統(tǒng)媒體往移動(dòng)化、快速化新媒體陣營(yíng)的內(nèi)容遷移,為未來(lái)視頻的生產(chǎn)提供更快捷的方式。

隨著A.I.虛擬人愛(ài)加的應(yīng)用,科大訊飛也將進(jìn)一步推動(dòng)技術(shù)的發(fā)展,拓展更多領(lǐng)域的虛擬人落地應(yīng)用。在智能交互領(lǐng)域,科大訊飛將不斷拓展,并將更多視頻融合元素、虛擬人情感、豐富虛擬人技能、場(chǎng)景化主題、情感化決策融入虛擬人設(shè)計(jì)中,讓其有望變換成A.I.客服、A.I.經(jīng)理、A.I.店長(zhǎng)、A.I.演示員等多種社會(huì)角色,陸續(xù)在不同行業(yè)、不同領(lǐng)域上崗,并有望接棒下一個(gè)時(shí)代的人機(jī)交互領(lǐng)域。

科技時(shí)代,以人工智能為驅(qū)動(dòng)的虛擬人的技能越來(lái)越豐富,能夠適用的場(chǎng)景也將越來(lái)越多元,或許某天,虛擬人會(huì)是我們的理財(cái)顧問(wèn)、健康管理師......未來(lái),科大訊飛將持續(xù)堅(jiān)持“頂天立地”戰(zhàn)略,用人工智能建設(shè)美好世界。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )