出門問(wèn)問(wèn)發(fā)布AI音頻生產(chǎn)工具“魔音工坊” 加速布局企業(yè)級(jí)市場(chǎng)

9月7日消息,人工智能公司出門問(wèn)問(wèn)在2020年服貿(mào)會(huì)上發(fā)布兩款全新魔音系列產(chǎn)品:AI音頻內(nèi)容生產(chǎn)一站式解決方案——“魔音工坊”,AI虛擬主播——“魔影主播”。目前這兩款產(chǎn)品已經(jīng)應(yīng)用于光明日?qǐng)?bào)的音視頻內(nèi)容生產(chǎn)中。

作為一家AI技術(shù)驅(qū)動(dòng)型公司,出門問(wèn)問(wèn)已經(jīng)推出過(guò)系列消費(fèi)級(jí)智能硬件產(chǎn)品,包括AI智能手表TicWatch系列、AI真無(wú)線智能耳機(jī)TicPods系列、智能音箱TicKasa系列等。憑借在消費(fèi)級(jí)場(chǎng)景積累的AI能力和經(jīng)驗(yàn),此次出門問(wèn)問(wèn)推出兩款A(yù)I音視頻內(nèi)容生產(chǎn)工具,意味著其加速向To B企業(yè)級(jí)場(chǎng)景延伸。

出門問(wèn)問(wèn)CEO李志飛在接受TechWeb采訪時(shí)透露,目前,出門問(wèn)問(wèn)公司營(yíng)收主要來(lái)自消費(fèi)級(jí)產(chǎn)品,而且公司海外營(yíng)收占比超過(guò)60%,現(xiàn)在企業(yè)級(jí)市場(chǎng)也是公司主要發(fā)力的一塊。

李志飛介紹,盡管受疫情影響,今年前2個(gè)季度出門問(wèn)問(wèn)的業(yè)績(jī)受到一定影響,但是銷售業(yè)績(jī)?cè)诘谌疽呀?jīng)出現(xiàn)強(qiáng)勢(shì)反彈,預(yù)計(jì)全年?duì)I收同比去年仍略有增長(zhǎng)。

可編輯的AI音視頻生產(chǎn)工具

魔音工坊是一款主打AI音頻生產(chǎn)的產(chǎn)品, 旨在以AI助力音頻內(nèi)容創(chuàng)作,通過(guò)獨(dú)創(chuàng)的產(chǎn)品和交互,成為AI音頻內(nèi)容生產(chǎn)一站式解決方案,打造AI音頻時(shí)代的WORD編輯器。

事實(shí)上,市面上已經(jīng)有包括科大訊飛、搜狗等公司推出了類似AI產(chǎn)品,李志飛向TechWeb表示,魔音工坊最大的特色是后臺(tái)有一個(gè)靈活的編輯工具。

李志飛介紹,盡管AI能力已經(jīng)越來(lái)越強(qiáng),但是不可否認(rèn)的是目前由AI直接生成的音頻內(nèi)容還是會(huì)存在一些誤差,在新聞播報(bào)等嚴(yán)肅場(chǎng)合是無(wú)法直接使用的。魔音工坊通過(guò)引入音頻編輯工具,既能實(shí)現(xiàn)AI將文字轉(zhuǎn)為音頻的快速性,又能實(shí)現(xiàn)人工矯正編輯的準(zhǔn)確性,這個(gè)價(jià)值非常大。

據(jù)介紹,魔音工坊增加的后臺(tái)編輯功能,能夠非常個(gè)性化的對(duì)AI生成的語(yǔ)音內(nèi)容進(jìn)行定點(diǎn)編輯。利用端到端MeetVoice語(yǔ)音合成引擎,魔音工坊設(shè)計(jì)了交互友好的產(chǎn)品形態(tài),用戶可以快速導(dǎo)入要合成聲音的文章,通過(guò)類似微軟WORD文檔的編輯操作,即可快速解決拼音、韻律等中文配音問(wèn)題,讓用戶一站式快捷生產(chǎn)出專業(yè)精品的音頻。

魔音工坊后臺(tái)編輯不僅能夠提供定制發(fā)音人、糾正多音字、背景音和音效、多發(fā)音人配音等核心功能,還具備數(shù)字糾錯(cuò)、變速、韻律糾錯(cuò)、創(chuàng)建個(gè)性“隨身聽”微信小程序等各種便捷有效的工具。

目前魔音工坊已為眾多頭部媒體提供隨身聽小程序,將文字內(nèi)容升級(jí)為更有深度和感染力的聲音形態(tài)。提升自媒體用戶體驗(yàn),讓粉絲用戶留存、時(shí)長(zhǎng)和長(zhǎng)期忠誠(chéng)度、活躍度得到更大提升。

此外,出門問(wèn)問(wèn)此次發(fā)布的另一款全新產(chǎn)品“AI虛擬主播——魔影主播”,可通過(guò)語(yǔ)音驅(qū)動(dòng)虛擬形象說(shuō)話及反饋動(dòng)作。通過(guò)將深度學(xué)習(xí)和計(jì)算機(jī)圖形學(xué)結(jié)合,讓計(jì)算機(jī)能夠理解語(yǔ)音的內(nèi)容并精細(xì)驅(qū)動(dòng)虛擬形象的口唇動(dòng)作、面部表情、肢體姿態(tài),生成極具逼真感的虛擬形象動(dòng)畫。結(jié)合TTS技術(shù),能夠?yàn)榭蛻籼峁┚邆湄S富表情動(dòng)作反饋的AI虛擬互動(dòng)助手。編輯人員僅需輸入文字內(nèi)容,即可快速生成具備同步口型、豐富面部表情及模型動(dòng)作的AI虛擬主播視頻。

加速布局賦能新聞媒體業(yè)

借助魔音工坊和魔影主播兩款產(chǎn)品,出門問(wèn)問(wèn)成功實(shí)現(xiàn)AI驅(qū)動(dòng)的“文字與音頻”、“文字與視頻”之間的快速轉(zhuǎn)換。

出門問(wèn)問(wèn)高級(jí)技術(shù)總監(jiān)葉順平表示,希望通過(guò)這些AI產(chǎn)品幫助傳統(tǒng)媒體更好地適應(yīng)音頻和視頻形態(tài),多渠道分發(fā),讓優(yōu)質(zhì)內(nèi)容觸達(dá)到更多用戶,實(shí)現(xiàn)內(nèi)容價(jià)值最大化,為新聞媒體業(yè)賦能。未來(lái),在AI的加持下,人人皆可玩轉(zhuǎn)多媒體,多種媒體之間也能實(shí)現(xiàn)自由融合與轉(zhuǎn)換。

此外,葉順平強(qiáng)調(diào),出門問(wèn)問(wèn)深耕語(yǔ)音賽道,擁有完整的“端到端”人機(jī)交互相關(guān)技術(shù)棧。在魔影主播與魔音工坊兩款產(chǎn)品背后,是出門問(wèn)問(wèn)自主研發(fā)的全CPU低時(shí)延端到端語(yǔ)音合成系統(tǒng)MeetVoice (Mobvoi End-to-End TTS Voice) 。其采用基于神經(jīng)網(wǎng)絡(luò)的聲碼器 Meet-Vocoder,可以實(shí)現(xiàn)高度接近真人的聲音素質(zhì)。

出門問(wèn)問(wèn)使用多發(fā)音人基礎(chǔ)模型,提升語(yǔ)音合成效果,漢字發(fā)音準(zhǔn)確率提升至99.6%以上,保持業(yè)界領(lǐng)先水平。在此基礎(chǔ)上,MeetVoice最大限度地提高效率,1秒時(shí)間能夠合成近10秒音頻,且無(wú)需額外配置GPU。

李志飛表示,目前出門問(wèn)問(wèn)可為客戶量身定制全棧式的人工智能解決方案,目前已為物聯(lián)網(wǎng)、金融、電信、餐飲、車載等企業(yè)級(jí)場(chǎng)景提供服務(wù)。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-09-07
出門問(wèn)問(wèn)發(fā)布AI音頻生產(chǎn)工具“魔音工坊” 加速布局企業(yè)級(jí)市場(chǎng)
9月7日消息,人工智能公司出門問(wèn)問(wèn)在2020年服貿(mào)會(huì)上發(fā)布兩款全新魔音系列產(chǎn)品:AI音頻內(nèi)容生產(chǎn)一站式解決方案——“魔音工坊”,AI虛擬主播——“魔影主播”。目

長(zhǎng)按掃碼 閱讀全文