Blizzard Challenge 2019國(guó)際語音合成大賽,靈伴斬獲亞軍

在剛剛落幕的“Blizzard Challenge 2019”國(guó)際語音合成大賽中,靈伴科技的語音合成系統(tǒng)榮獲綜合評(píng)測(cè)指標(biāo)第二的優(yōu)異成績(jī)。這是繼靈伴在“Blizzard Challenge 2013”比賽中獲得綜合評(píng)測(cè)指標(biāo)排名第一后,時(shí)隔6年第二次參賽,再次斬獲殊榮。

史上最難“中文合成”挑戰(zhàn)

“Blizzard Challenge”國(guó)際語音合成大賽由美國(guó)卡耐基-梅隆大學(xué)和日本名古屋工業(yè)大學(xué)聯(lián)合發(fā)起,是語音合成領(lǐng)域最具權(quán)威性的國(guó)際技術(shù)評(píng)測(cè)比賽。它旨在構(gòu)建一個(gè)公開、統(tǒng)一的語音合成技術(shù)評(píng)測(cè)平臺(tái),加強(qiáng)研究機(jī)構(gòu)之間的技術(shù)交流與溝通,推動(dòng)語音技術(shù)快速發(fā)展。

與往屆比賽相比,本屆大賽的難度再創(chuàng)新高。大賽要求各參賽方利用大約8小時(shí)的羅振宇脫口秀聲音素材,合成出自然、易懂,并和羅振宇本人的特點(diǎn)盡量相似的語音。

更為重要的是,主辦方對(duì)聲音樣本的來源進(jìn)行了嚴(yán)格的約束:羅振宇本人的聲音素材只允許使用主辦方提供的8小時(shí)錄音,禁止使用從其他渠道收集的數(shù)據(jù);羅振宇以外的說話人聲音素材可以隨意使用。

因此,本屆參賽方主要面對(duì)兩個(gè)挑戰(zhàn):如何用好羅振宇本人的為數(shù)不多的8小時(shí)錄音;如何利用其它說話人的語音來幫助算法更好地學(xué)習(xí)羅振宇本人的講話特點(diǎn)。

超穩(wěn)健合成系統(tǒng),語音“可懂度”最佳

在任務(wù)難度高、競(jìng)爭(zhēng)對(duì)手實(shí)力強(qiáng)的情況下,靈伴提交的合成系統(tǒng)在自然度、相似度、可懂度三項(xiàng)評(píng)測(cè)指標(biāo)中均表現(xiàn)優(yōu)秀,獲得了關(guān)鍵指標(biāo)自然度第4名、相似度第2名、合成語音可懂度第2名、綜合排名第2名的優(yōu)異成績(jī)。

自然度和相似度分別表示合成聲音的自然程度以及與羅振宇本人的相似程度,分?jǐn)?shù)越高表示合成的語音越自然、和羅振宇本人的相似程度越高。從分?jǐn)?shù)角度來看,在自然度和相似度上靈伴分別獲得了4分和3.9分,共計(jì)7.9分,以微弱的差距落后于M。

Blizzard Challenge 2019國(guó)際語音合成大賽,靈伴斬獲亞軍

從排名角度來看,靈伴在自然度、相似度和可懂度方面分別排在第4、第2以及第2名。

在同時(shí)考慮自然度和相似度的情況下,靈伴的排名為并列第2名。

在同時(shí)考慮自然度、相似度以及可懂度的情況下,靈伴的排名為第2名。

值得一提的是,靈伴的可懂度分?jǐn)?shù)在相似度和自然度前十的隊(duì)伍中排名最高,這意味著靈伴的語音合成最能夠被“聽懂”。

Blizzard Challenge 2019國(guó)際語音合成大賽,靈伴斬獲亞軍

人工智能技術(shù)落地的道路,往往是對(duì)系統(tǒng)能力的全方位考核。從語音合成需求的角度來看,自然度、相似度和可懂度都是實(shí)際應(yīng)用場(chǎng)景中的關(guān)鍵指標(biāo):其中相似度是語音合成模型定制業(yè)務(wù)中主要考察的對(duì)象;而可懂度在人機(jī)交互過程中,直接決定了客戶能否輕松而準(zhǔn)確地理解機(jī)器人所表述的內(nèi)容。

因此,靈伴在本次比賽中的技術(shù)選型主要考慮真實(shí)落地場(chǎng)景,選擇了相對(duì)穩(wěn)健的“不偏科”的解決方案。比賽的結(jié)果也充分體現(xiàn)了靈伴合成技術(shù)的全面優(yōu)勢(shì)。

Blizzard Challenge 2019國(guó)際語音合成大賽,靈伴斬獲亞軍

  自然度、相似度、可懂度三項(xiàng)指標(biāo)累加排名(越低越好)

“路漫漫其修遠(yuǎn)兮,吾將上下而求索”,此次比賽的成績(jī)對(duì)靈伴人來說,既是榮譽(yù),亦是鞭策。語音交互的探索之途,靈伴人和世界上同道科研工作者們還有很長(zhǎng)的路要走。靈伴人將繼續(xù)腳踏實(shí)地,開拓創(chuàng)新,實(shí)現(xiàn)技術(shù)與產(chǎn)品的雙重提升,開創(chuàng)人類與智能機(jī)器人共同發(fā)展的美好未來。

Blizzard Challenge2013精彩回顧

2013年是靈伴這支新銳團(tuán)隊(duì)首次參賽,在時(shí)間緊、任務(wù)重、對(duì)手強(qiáng)的多重困難下,團(tuán)隊(duì)一舉戰(zhàn)勝諸多國(guó)際頂尖科研機(jī)構(gòu),在自然度、相似度兩個(gè)評(píng)測(cè)領(lǐng)域以絕對(duì)優(yōu)勢(shì)獲勝,斬獲當(dāng)年Blizzard Challenge國(guó)際語音合成大賽綜合評(píng)測(cè)第一名的桂冠,這也是主辦方公認(rèn)的語音合成領(lǐng)域第三次里程碑式技術(shù)突破。

在自然度方面,靈伴(隊(duì)伍代碼為M)得分3.9分,超出第二名0.6分。

Blizzard Challenge 2019國(guó)際語音合成大賽,靈伴斬獲亞軍

Blizzard Challenge 2019國(guó)際語音合成大賽,靈伴斬獲亞軍

  自然度得分情況(靈伴隊(duì)伍代碼為M)

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-08-05
Blizzard Challenge 2019國(guó)際語音合成大賽,靈伴斬獲亞軍
在剛剛落幕的“Blizzard Challenge 2019”國(guó)際語音合成大賽中,靈伴科技的語音合成系統(tǒng)榮獲綜合評(píng)測(cè)指標(biāo)第二的優(yōu)異成績(jī)。

長(zhǎng)按掃碼 閱讀全文