9月7日消息,人工智能公司出門問問在2020年服貿(mào)會(huì)上發(fā)布兩款全新魔音系列產(chǎn)品:AI音頻內(nèi)容生產(chǎn)一站式解決方案——“魔音工坊”,AI虛擬主播——“魔影主播”。目前這兩款產(chǎn)品已經(jīng)應(yīng)用于光明日報(bào)的音視頻內(nèi)容生產(chǎn)中。
作為一家AI技術(shù)驅(qū)動(dòng)型公司,出門問問已經(jīng)推出過系列消費(fèi)級(jí)智能硬件產(chǎn)品,包括AI智能手表TicWatch系列、AI真無線智能耳機(jī)TicPods系列、智能音箱TicKasa系列等。憑借在消費(fèi)級(jí)場景積累的AI能力和經(jīng)驗(yàn),此次出門問問推出兩款A(yù)I音視頻內(nèi)容生產(chǎn)工具,意味著其加速向To B企業(yè)級(jí)場景延伸。
出門問問CEO李志飛在接受TechWeb采訪時(shí)透露,目前,出門問問公司營收主要來自消費(fèi)級(jí)產(chǎn)品,而且公司海外營收占比超過60%,現(xiàn)在企業(yè)級(jí)市場也是公司主要發(fā)力的一塊。
李志飛介紹,盡管受疫情影響,今年前2個(gè)季度出門問問的業(yè)績受到一定影響,但是銷售業(yè)績在第三季已經(jīng)出現(xiàn)強(qiáng)勢反彈,預(yù)計(jì)全年?duì)I收同比去年仍略有增長。
可編輯的AI音視頻生產(chǎn)工具
魔音工坊是一款主打AI音頻生產(chǎn)的產(chǎn)品, 旨在以AI助力音頻內(nèi)容創(chuàng)作,通過獨(dú)創(chuàng)的產(chǎn)品和交互,成為AI音頻內(nèi)容生產(chǎn)一站式解決方案,打造AI音頻時(shí)代的WORD編輯器。
事實(shí)上,市面上已經(jīng)有包括科大訊飛、搜狗等公司推出了類似AI產(chǎn)品,李志飛向TechWeb表示,魔音工坊最大的特色是后臺(tái)有一個(gè)靈活的編輯工具。
李志飛介紹,盡管AI能力已經(jīng)越來越強(qiáng),但是不可否認(rèn)的是目前由AI直接生成的音頻內(nèi)容還是會(huì)存在一些誤差,在新聞播報(bào)等嚴(yán)肅場合是無法直接使用的。魔音工坊通過引入音頻編輯工具,既能實(shí)現(xiàn)AI將文字轉(zhuǎn)為音頻的快速性,又能實(shí)現(xiàn)人工矯正編輯的準(zhǔn)確性,這個(gè)價(jià)值非常大。
據(jù)介紹,魔音工坊增加的后臺(tái)編輯功能,能夠非常個(gè)性化的對(duì)AI生成的語音內(nèi)容進(jìn)行定點(diǎn)編輯。利用端到端MeetVoice語音合成引擎,魔音工坊設(shè)計(jì)了交互友好的產(chǎn)品形態(tài),用戶可以快速導(dǎo)入要合成聲音的文章,通過類似微軟WORD文檔的編輯操作,即可快速解決拼音、韻律等中文配音問題,讓用戶一站式快捷生產(chǎn)出專業(yè)精品的音頻。
魔音工坊后臺(tái)編輯不僅能夠提供定制發(fā)音人、糾正多音字、背景音和音效、多發(fā)音人配音等核心功能,還具備數(shù)字糾錯(cuò)、變速、韻律糾錯(cuò)、創(chuàng)建個(gè)性“隨身聽”微信小程序等各種便捷有效的工具。
目前魔音工坊已為眾多頭部媒體提供隨身聽小程序,將文字內(nèi)容升級(jí)為更有深度和感染力的聲音形態(tài)。提升自媒體用戶體驗(yàn),讓粉絲用戶留存、時(shí)長和長期忠誠度、活躍度得到更大提升。
此外,出門問問此次發(fā)布的另一款全新產(chǎn)品“AI虛擬主播——魔影主播”,可通過語音驅(qū)動(dòng)虛擬形象說話及反饋動(dòng)作。通過將深度學(xué)習(xí)和計(jì)算機(jī)圖形學(xué)結(jié)合,讓計(jì)算機(jī)能夠理解語音的內(nèi)容并精細(xì)驅(qū)動(dòng)虛擬形象的口唇動(dòng)作、面部表情、肢體姿態(tài),生成極具逼真感的虛擬形象動(dòng)畫。結(jié)合TTS技術(shù),能夠?yàn)榭蛻籼峁┚邆湄S富表情動(dòng)作反饋的AI虛擬互動(dòng)助手。編輯人員僅需輸入文字內(nèi)容,即可快速生成具備同步口型、豐富面部表情及模型動(dòng)作的AI虛擬主播視頻。
加速布局賦能新聞媒體業(yè)
借助魔音工坊和魔影主播兩款產(chǎn)品,出門問問成功實(shí)現(xiàn)AI驅(qū)動(dòng)的“文字與音頻”、“文字與視頻”之間的快速轉(zhuǎn)換。
出門問問高級(jí)技術(shù)總監(jiān)葉順平表示,希望通過這些AI產(chǎn)品幫助傳統(tǒng)媒體更好地適應(yīng)音頻和視頻形態(tài),多渠道分發(fā),讓優(yōu)質(zhì)內(nèi)容觸達(dá)到更多用戶,實(shí)現(xiàn)內(nèi)容價(jià)值最大化,為新聞媒體業(yè)賦能。未來,在AI的加持下,人人皆可玩轉(zhuǎn)多媒體,多種媒體之間也能實(shí)現(xiàn)自由融合與轉(zhuǎn)換。
此外,葉順平強(qiáng)調(diào),出門問問深耕語音賽道,擁有完整的“端到端”人機(jī)交互相關(guān)技術(shù)棧。在魔影主播與魔音工坊兩款產(chǎn)品背后,是出門問問自主研發(fā)的全CPU低時(shí)延端到端語音合成系統(tǒng)MeetVoice (Mobvoi End-to-End TTS Voice) 。其采用基于神經(jīng)網(wǎng)絡(luò)的聲碼器 Meet-Vocoder,可以實(shí)現(xiàn)高度接近真人的聲音素質(zhì)。
出門問問使用多發(fā)音人基礎(chǔ)模型,提升語音合成效果,漢字發(fā)音準(zhǔn)確率提升至99.6%以上,保持業(yè)界領(lǐng)先水平。在此基礎(chǔ)上,MeetVoice最大限度地提高效率,1秒時(shí)間能夠合成近10秒音頻,且無需額外配置GPU。
李志飛表示,目前出門問問可為客戶量身定制全棧式的人工智能解決方案,目前已為物聯(lián)網(wǎng)、金融、電信、餐飲、車載等企業(yè)級(jí)場景提供服務(wù)。
- 美科技七巨頭遭特朗普關(guān)稅血洗 市值蒸發(fā)14萬億
- 特斯拉市值一夜蒸發(fā)超6400億元,美股科技“七巨頭”陷入調(diào)整區(qū)間
- 阿里巴巴于上海新設(shè)智信普惠科技公司,布局多領(lǐng)域技術(shù)服務(wù)
- 馬化騰短暫登頂中國富豪榜,騰訊科技與股價(jià)雙輪驅(qū)動(dòng)成關(guān)鍵
- 本地生活賽道:2025年紅海變“血海”,平臺(tái)競逐白熱化
- 義烏哪吒小商品熱賣:緊跟《哪吒2》熱潮,一天賣幾百套
- 美恢復(fù)接收中國包裹,貿(mào)易政策突變引發(fā)物流界震蕩
- DeepSeek或再掀波瀾,可能對(duì)美股市場造成新一輪打擊
- 谷歌股價(jià)暴跌:收入增長放緩,人工智能支出引投資者擔(dān)憂
- 華為去年銷售收入超8600億元:ICT基礎(chǔ)設(shè)施穩(wěn)健,新業(yè)務(wù)快速發(fā)展
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。