據(jù)微軟官方發(fā)布,近期,Azure 認知服務中的語音服務的一部分——自定義神經(jīng)語音 (Custom Neural Voice)——文本到語音功能已普遍推出。該功能將允許用戶使用微軟開創(chuàng)性的神經(jīng)文本到語音模型,為應用創(chuàng)建高度逼真、類似人類的自定義語音。由于創(chuàng)建的語音非常逼真,微軟限制了訪問權(quán)限,以便用戶負責任地使用這項技術(shù)。
微軟表示,“作為微軟對負責任的人工智能承諾的一部分,我們設計和發(fā)布自定義神經(jīng)語音的目的是保護個人和社會的權(quán)利,促進透明的人機交互,抵制有害的深層偽裝和誤導性內(nèi)容的擴散。為此,我們對自定義神經(jīng)語音的訪問和使用進行了限制。”
IT之家獲悉,要創(chuàng)建自定義語音,你只需錄制音頻并上傳作為訓練數(shù)據(jù)即可。Azure 語音服務將為你的錄音創(chuàng)建一個獨特的語音調(diào)整。自定義神經(jīng)語音的聲音逼真自然,可以代表品牌,讓用戶以自然的方式與應用進行對話互動。
微軟強調(diào),以下客戶已經(jīng)在使用這項最新的 TTS 功能。
AT&T / 華納兄弟:他們最近在德克薩斯州達拉斯的 AT&T 體驗店推出了一個首創(chuàng)的創(chuàng)意和互動體驗,客戶可以直接與兔八哥對話。
Progressive:利用標志性的 Progressive 保險發(fā)言人 Flo 的聲音,創(chuàng)建了 Flo 聊天機器人,以簡化客戶咨詢流程,提供個性化體驗。
Duolingo:為了讓學習一門新的語言感到可實現(xiàn)性和適用性,Duolingo 使用課程創(chuàng)建了多樣化的風格化聲音。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 中國移動2024年一級集采供應商分級評定:A級35家,B級97家
- 劉正利任中國移動財務公司董事長,王濤任首席合規(guī)官
- 美的樓宇科技美控智慧建筑:空間場景智能低碳方案實踐與革新
- 沃達豐完成80億歐元意大利子公司出售 重塑歐洲業(yè)務又進一步
- 之江實驗室公開一項量子糾錯專利
- 沃達豐完成80億歐元意大利子公司出售 重塑歐洲業(yè)務又進一步
- 12種最常用的物聯(lián)網(wǎng)協(xié)議和標準
- 關(guān)于數(shù)字化轉(zhuǎn)型的10個常見問題:您需要了解的一切
- 2025年及以后值得關(guān)注的7大物聯(lián)網(wǎng)趨勢
- 2025年的云計算:我們是在構(gòu)建未來還是重復過去?
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。