搜狗王小川:2020年 機器翻譯的某些指標(biāo)可以趕上人類翻譯

北京時間5月20日,2018全球人工智能技術(shù)大會(GAITC)在北京召開。作為中國人工智能技術(shù)和產(chǎn)業(yè)領(lǐng)域規(guī)模最大、影響力最強的專業(yè)會議之一,GAITC邀請到了中國工程院院士李德毅、圖靈獎得主姚期智、歐洲科學(xué)院院士漢斯·烏思克爾特等數(shù)十位業(yè)界專家,共同獻(xiàn)上了數(shù)場精妙絕倫的主題演講和對話。搜狗CEO王小川應(yīng)邀在活動上發(fā)表了主題為《語言AI之路與挑戰(zhàn)》的演講。他回顧了人工智能在語言領(lǐng)域取得的進(jìn)展,并指出“到2020年,機器翻譯在一些指標(biāo)上可以趕上人類翻譯。”

搜狗王小川:2020年 機器翻譯的某些指標(biāo)可以趕上人類翻譯

作為國內(nèi)用戶量第四大的互聯(lián)網(wǎng)公司,搜狗多款產(chǎn)品獲得了市場的認(rèn)可,搜狗輸入法市場占有率多年保持第一的位置,搜狗搜索引擎市場份額為中國第二?;谠谡Z言領(lǐng)域積累的海量數(shù)據(jù)和領(lǐng)先能力,搜狗率先布局了以語言為核心的人工智能戰(zhàn)略。

從軟件到硬件,搜狗讓AI技術(shù)能夠融入每個人的生活,構(gòu)建起翻譯、問答、輔助對話等使用場景。

搜狗翻譯:讓華語世界連接全世界

翻譯是搜狗近兩年來著力發(fā)展的方向。搜狗CEO王小川介紹道:“搜狗機器翻譯是以搜狗獨創(chuàng)的基于神經(jīng)網(wǎng)絡(luò)的機器翻譯技術(shù)為算法;同時,憑借搜狗輸入法、搜狗搜索引擎多年用戶使用積累,產(chǎn)生了豐富語料供AI自主學(xué)習(xí)。”經(jīng)過大量的訓(xùn)練和積累后,搜狗神經(jīng)網(wǎng)絡(luò)機器翻譯的準(zhǔn)確率愈發(fā)提高,屢獲國際大獎。在國際學(xué)術(shù)賽事WMT 2017中,獲中譯英系統(tǒng)八項機器評價指標(biāo)中的七項第一。

神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù),目前已經(jīng)在搜狗的核心產(chǎn)品中進(jìn)行應(yīng)用:搜狗輸入法上線翻譯功能,用戶可在聊天場景中進(jìn)行中、英、日、韓等語言的翻譯;搜狗搜索中的英文搜索頻道,可以幫助用戶用英文搜索全世界。此外,搜狗還上線了翻譯App,幫助有專業(yè)需求的用戶進(jìn)行聲音、圖片和文字的翻譯。

2018年,搜狗的兩款智能硬件——旅行翻譯寶、錄音翻譯筆正式發(fā)售。這兩款產(chǎn)品是搜狗神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù)、語音識別技術(shù)、OCR圖像識別等高精尖技術(shù)的集合性落地,讓AI機器翻譯技術(shù)融入到生活和工作場景中,讓每個人都可以享受AI技術(shù)給生活帶來的便利。

值得一提的是,本次大會的所有中英互譯同傳字幕均由搜狗機器同傳提供。隨著演講者的話語,字幕條即刻滾動更新,因其迅速的反應(yīng)、準(zhǔn)確的翻譯,獲得了參會嘉賓的認(rèn)可。王小川表示:“機器和翻譯人員還是有距離的。我們內(nèi)部研發(fā)人員認(rèn)為,在2020年時,可以在一些指標(biāo)上趕上真人翻譯,一些地方甚至?xí)茫恍┑胤竭€有不足。”

搜索的未來是問答 讓回答一步到位

作為國內(nèi)第二大搜索引擎公司,搜狗一直致力于搜索技術(shù)的深耕和應(yīng)用。去年,搜狗問答機器人汪仔參加《一站到底》,與節(jié)目中頂尖選手同場競技并取得勝利;今年的搜狗答題助手也幫許多人在“直播答題”類競賽中獲得了名次和獎金。但王小川顯然并不滿足于現(xiàn)有成績,他斷言:“搜索的未來是問答。未來搜索引擎不應(yīng)該只給用戶一個網(wǎng)頁,而是給用戶直接提供答案,這中間包含著知識推理和檢索的能力。”

對此,他進(jìn)行了更多的闡釋:“搜索引擎所做的不僅僅是搜索、檢索,更需要完成閱讀理解,因為用戶輸入的關(guān)鍵詞五花八門,問題的真實意思是機器所不能確定的。”比如,有網(wǎng)友搜索“王者榮耀排位上分最好的時間段”而最佳答案其實是“需要組隊、有給力的隊友”。這些語言的多樣性、問題的不確定性,都是搜索引擎、問答產(chǎn)品在未來需要面臨的問題。在這個方面,搜狗和學(xué)界持續(xù)合作,共同搭建數(shù)據(jù)庫、解決更多的問題。在雙方的通力合作下,相信搜狗會帶來更加貼合用戶心理的問答產(chǎn)品。

AI輔助對話:不炒“自動回復(fù)”冷飯

日前,在谷歌I/O大會上,主講人請?zhí)摂M語音助手Duplex自行預(yù)約理發(fā),測試中的Duplex在思維邏輯、對答正確性和速度方面,甚至還有極其類似真人的語音語調(diào),都令業(yè)界驚嘆。

與這款虛擬語音助手類似的“搜狗輔助對話”,或許是被大多數(shù)人忽略的一項功能,它不同于以往的“任務(wù)型對話”如siri,“聊天機器人”如微軟小冰,不再是機器按照模板對人類的問題進(jìn)行反饋,而是基于大數(shù)據(jù),對人類對話時最可能出現(xiàn)的回復(fù)進(jìn)行提示,由人類來掌控最終決定權(quán),敲定最終回復(fù)的話語。機器所做的是為人類提高效率,而不是代替人類去回復(fù)、去思考。

而人類點選的動作和主動輸入的動作,也是對機器提供答案的評價,這類評價數(shù)據(jù),可以為機器的自主學(xué)習(xí)、自主更新提供資料,便于機器輔助對話性能的優(yōu)化提升。如今,機器輔助對話的應(yīng)用場景已由手機短信擴展到聊天軟件,針對用戶多樣化、趣味性、個性化的表達(dá)需求,搜狗也在持續(xù)研究更復(fù)雜的檢索模型、深度學(xué)習(xí)模型,讓“搜狗輔助對話”實現(xiàn)更好的效果。

在演講的最后,搜狗公司CEO王小川透露,搜狗輸入法致力于自然交互,搜狗搜索則以知識計算為主,搜狗會考慮將二者的功能結(jié)合——“搜狗將不斷研發(fā)新的智能硬件產(chǎn)品,會在各種垂直領(lǐng)域推出虛擬個人助理,幫助用戶更好地表達(dá)和獲取信息。”

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-05-23
搜狗王小川:2020年 機器翻譯的某些指標(biāo)可以趕上人類翻譯
北京時間5月20日,2018全球人工智能技術(shù)大會(GAITC)在北京召開。

長按掃碼 閱讀全文