AI突破新邊界王小川在香港亮出全球首個虛擬主播

有著"科技界達(dá)沃斯"之稱的Web Summit團(tuán)隊來到香港,開啟了為期四天的RISE科技大會。包括微軟總裁Brad Smith、亞馬遜CTOWerner Vogels在內(nèi)的上百位全球頂級科技企業(yè)高管和先鋒創(chuàng)業(yè)者齊聚一堂,就人工智能、大數(shù)據(jù)、區(qū)塊鏈等時下熱門主題,進(jìn)行思想和靈感的交流,分享全球科技領(lǐng)域最新發(fā)展情況。

2018年7月11日,搜狗CEO王小川作為國內(nèi)AI領(lǐng)軍人物代表,受邀出席此次峰會并進(jìn)行了題為《人工智能的下一個應(yīng)用突破》的演講,分享了他對"人工智能的意義"、"語言與AI的關(guān)系"等問題的新銳思考,并通過多款產(chǎn)品全面秀出了搜狗的"AI肌肉"。

AI突破新邊界王小川在香港亮出全球首個虛擬主播

  (圖1:搜狗CEO在RISE大會發(fā)表演講)

自然交互+知識計算 搜狗的語言AI版圖

在王小川看來,“語言”是AI的未來,“掌握一種語言就是掌握了一種靈魂”,而語言則是人工智能皇冠上的明珠。無論是百箱大戰(zhàn)中Amazon Echo、GoogleHome等多款圍繞著語音交互打造的智能音箱,還是會打電話的Google Duplex、會辯論的IBMProjector Debater,都聚焦于讓機(jī)器擁有“語言”這顆明珠。

搜狗以“讓表達(dá)與獲取信息更簡單”為使命,多年堅持以語言為核心,圍繞于自然交互和知識計算兩大方向,在語音、圖像、翻譯等語言類AI技術(shù)上不斷突破。王小川認(rèn)為,通過自然交互,人與機(jī)器能夠更自由地表達(dá);通過知識計算,讓機(jī)器來幫助人類,實現(xiàn)智能的體外進(jìn)化。

在自然交互版塊,搜狗不斷在語音識別和語音合成方面進(jìn)行開拓創(chuàng)新。搜狗輸入法是中國最大的語音輸入法,目前語音識別準(zhǔn)確率已超98%;日均語音輸入調(diào)用次數(shù)峰值達(dá)4億次;支持外文多語種和中文方言識別;智能斷句、標(biāo)點預(yù)測、識別結(jié)果順滑等功能也領(lǐng)先于業(yè)界。語音合成支持多種音色選擇,通過少量數(shù)據(jù)即可生成說話者自己的合成音色,還可實現(xiàn)說話人風(fēng)格的遷移。

王小川現(xiàn)場展示了用“王小川講話訓(xùn)練數(shù)據(jù)”,結(jié)合龐麥郎的《我的滑板鞋》歌曲素材,經(jīng)機(jī)器進(jìn)行語音識別、語音合成后,生成王小川版的《我的滑板鞋》。這版歌曲中既包含了歌曲的曲調(diào)和節(jié)奏,也融入了王小川的聲線及語言風(fēng)格,生動有趣地呈現(xiàn)了搜狗語音合成和情感遷移技術(shù)。

AI突破新邊界王小川在香港亮出全球首個虛擬主播

  (圖2:搜狗CEO王小川現(xiàn)場展示語音合成與情感遷移技術(shù))

虛擬主播生動播報RISE新聞 搜狗語音技術(shù)的最新嘗試

在此次活動上,王小川展示了搜狗推出的全球首個高度實用化、定制化的虛擬主播。結(jié)合唇語合成、語音合成、音視頻聯(lián)合建模與深度學(xué)習(xí)技術(shù),可驅(qū)動機(jī)器生成對應(yīng)的唇語圖像與聲音,進(jìn)而輸出統(tǒng)一的音視頻素材。此次展示的虛擬主播,是搜狗使用央視新聞主播姚雪松數(shù)十個小時的音視頻素材進(jìn)行訓(xùn)練與計算的結(jié)果,最終生成了一段音視頻同步的RISE大會新聞播報,與真人播報無異。

AI突破新邊界王小川在香港亮出全球首個虛擬主播

  (圖3:虛擬主播新聞播報畫面)

AI技術(shù)為搜狗全線產(chǎn)品賦能 問答、對話、翻譯是搜狗的產(chǎn)品方向

除了新產(chǎn)品外,搜狗已讓AI技術(shù)為搜狗的全線產(chǎn)品賦能,無論是搜狗搜索,還是搜狗輸入法,都做到了更懂用戶,給出的選項和推薦也能直搗用戶內(nèi)心的需求。王小川認(rèn)為,AI時代企業(yè)要做的不是多面開花,而是應(yīng)該認(rèn)準(zhǔn)戰(zhàn)略方向讓技術(shù)有的放矢。

對于未來,王小川的判斷是:搜索會升級為問答,輸入法會演化成輔助對話系統(tǒng)。當(dāng)輸入關(guān)鍵詞或問句后,搜索引擎將會直接給出你想了解的答案;用機(jī)器幫助人類完成更便捷、更高質(zhì)量的對話。

AI突破新邊界王小川在香港亮出全球首個虛擬主播

  (圖4:RISE大會參會者)

此外,隨著人們跨國交流需求的增加,翻譯的需求將會激增。運用領(lǐng)先的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù),加之以上億級雙語平行語料訓(xùn)練,搜狗目前已經(jīng)支持61種語言的互譯,憑借豐富的產(chǎn)品場景,翻譯技術(shù)已經(jīng)運用在了輸入法和搜索產(chǎn)品中。結(jié)合用戶出國和學(xué)習(xí)工作的使用場景,搜狗在今年連續(xù)推出了搜狗旅行翻譯寶和搜狗錄音翻譯筆兩款智能硬件,進(jìn)一步推動了AI翻譯技術(shù)的實用化。

提及搜狗AI的下一步,王小川說:“以語言為核心,一方面我們在年底之前還會再發(fā)布四款新的智能硬件;另一方面會把這種計算能力用到醫(yī)療、法律這些垂直的領(lǐng)域,使得機(jī)器在垂直領(lǐng)域會變得更加的聰明。”

關(guān)于AI整體技術(shù)發(fā)展和產(chǎn)業(yè)落地,王小川有著這樣的判斷:美國固有的優(yōu)勢在于頂尖的科研技術(shù),而中國的優(yōu)勢在于用戶規(guī)模和應(yīng)用領(lǐng)域。目前全球已實現(xiàn)知識共享的聯(lián)通,前沿的人工智能學(xué)術(shù)論文發(fā)布后,中國可以學(xué)習(xí)和借鑒前沿的學(xué)術(shù)成果,并把它轉(zhuǎn)化為生產(chǎn)力。所以在人工智能領(lǐng)域,中國有機(jī)會跟美國在應(yīng)用層面上齊頭并進(jìn)。同時,應(yīng)用層面生態(tài)的進(jìn)化,可以反過來推動整個系統(tǒng)的發(fā)展,最終實現(xiàn)良性循環(huán)。

“技術(shù)改變世界”正在成為現(xiàn)實,搜狗不僅持續(xù)在技術(shù)領(lǐng)域開拓創(chuàng)新,更驅(qū)動著技術(shù)的不斷落地化、打造消費級產(chǎn)品,將“中國制造”轉(zhuǎn)變?yōu)?ldquo;中國智造”。相信在未來,搜狗可以持續(xù)“讓表達(dá)和獲取信息更簡單”,讓科技真正地惠及人們的生活。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-07-12
AI突破新邊界王小川在香港亮出全球首個虛擬主播
有著"科技界達(dá)沃斯"之稱的Web Summit團(tuán)隊來到香港,開啟了為期四天的RISE科技大會。

長按掃碼 閱讀全文