搜狗IoT產(chǎn)品總監(jiān)李健濤:搜狗如何在AI翻譯領(lǐng)域接連突破并成為行業(yè)第一?

誰(shuí)是大數(shù)據(jù)賽道上的“最強(qiáng)大腦”?人工智能領(lǐng)域高端對(duì)話聚焦于哪些話題?一年一度的國(guó)家級(jí)博覽會(huì)——貴陽(yáng)數(shù)博會(huì)正如火如荼得舉行。作為全球首個(gè)大數(shù)據(jù)主題的博覽會(huì),數(shù)博會(huì)已經(jīng)成為權(quán)威的研討平臺(tái),不僅云集了國(guó)內(nèi)各大互聯(lián)網(wǎng)公司、科技公司掌門(mén)人,來(lái)自全球的業(yè)界頂尖專(zhuān)家也應(yīng)邀參會(huì)。搜狗IoT產(chǎn)品總監(jiān)李健濤作為AI創(chuàng)新的翹楚,在數(shù)博會(huì)上進(jìn)行了主題為《搜狗AI進(jìn)擊之路》的演講,向全球的參會(huì)嘉賓展示了搜狗在AI翻譯領(lǐng)域的前沿科技成果。

他表示,搜狗在搜索和輸入法領(lǐng)域的業(yè)務(wù)已持續(xù)十三、四年的時(shí)間,擁有龐大的數(shù)據(jù)積淀,搜狗以“語(yǔ)言”為核心的AI布局具備強(qiáng)大的競(jìng)爭(zhēng)力。搜狗的語(yǔ)音和圖像識(shí)別技術(shù)的日趨成熟、從搜索到問(wèn)答的變化、從輸入法到對(duì)話的發(fā)展、以及搜狗在AI翻譯領(lǐng)域的推陳出新,都代表著搜狗在AI領(lǐng)域的創(chuàng)新和“進(jìn)擊”。

做“語(yǔ)言”,搜狗比其他公司更專(zhuān)業(yè)

在演講的開(kāi)篇,搜狗IoT產(chǎn)品總監(jiān)李健濤介紹道:搜狗是中國(guó)用戶數(shù)第四大的互聯(lián)網(wǎng)公司,搜狗輸入法市場(chǎng)占有率多年蟬聯(lián)第一,搜狗搜索引擎市場(chǎng)份額穩(wěn)居第二位。他認(rèn)為:“搜狗是中國(guó)搜索行業(yè)的挑戰(zhàn)者,是AI領(lǐng)域的創(chuàng)新者?!彼压份斎敕ê退阉饕媸畮啄甑姆e累,為搜狗在AI領(lǐng)域的發(fā)展,提供了大量的文字和語(yǔ)音數(shù)據(jù)支持,搜狗每日語(yǔ)音調(diào)用次數(shù)超3億,峰值超3.6億次以上,這些數(shù)據(jù)背景是其他公司所不具備的。

為什么數(shù)據(jù)對(duì)人工智能至關(guān)重要?李健濤對(duì)相關(guān)技術(shù)了如指掌:“對(duì)人工智能來(lái)說(shuō),有兩個(gè)重要的影響,一個(gè)是算法,一個(gè)是數(shù)據(jù)。在算法方面,行業(yè)里面各家的差異并不大。但是人類(lèi)需要通過(guò)數(shù)據(jù)訓(xùn)練機(jī)器,讓機(jī)器懂得識(shí)別到底是什么處理機(jī)制。所以數(shù)據(jù)是很多人工智能公司能否產(chǎn)生重大技術(shù)突破的一個(gè)關(guān)鍵因素。”

所以,對(duì)搜狗的人工智能算法來(lái)說(shuō),多年積累的海量數(shù)據(jù)是得天獨(dú)厚的深度學(xué)習(xí)資料,幫助AI在語(yǔ)音識(shí)別、圖像識(shí)別、機(jī)器翻譯等方面日漸趨于精準(zhǔn)、接近真人水平。

李健濤介紹道:“搜狗整體人工智能布局圍繞‘語(yǔ)言’展開(kāi)。主要是兩大方面——語(yǔ)言的兩種載體,一種是語(yǔ)音,一種是圖像?!?/p>

搜狗的AI語(yǔ)音技術(shù),融合了語(yǔ)音識(shí)別、語(yǔ)義理解和語(yǔ)音合成三個(gè)密不可分的部分,將傳統(tǒng)機(jī)器的識(shí)別和運(yùn)算能力升級(jí),成為了“更靈敏的耳朵”和“更聰明的大腦”。目前,搜狗語(yǔ)音識(shí)別準(zhǔn)確率已達(dá)97%。

搜狗的圖像識(shí)別技術(shù)同樣不可小覷,它收集了數(shù)十萬(wàn)張圖像進(jìn)行系統(tǒng)訓(xùn)練,最終實(shí)現(xiàn)了80%的圖像識(shí)別高準(zhǔn)確率,可完成對(duì)犬類(lèi)、花卉等類(lèi)似圖片的識(shí)別。更加“黑科技”的點(diǎn)在于,搜狗還實(shí)現(xiàn)了唇語(yǔ)的識(shí)別,支持10萬(wàn)+非特定人詞匯量、口語(yǔ)測(cè)試集60%以上準(zhǔn)確率,在車(chē)載或智能家居等垂直場(chǎng)景的命令集中,準(zhǔn)確率超過(guò)90%以上。

此外,李健濤透露,搜狗輸入法加入了“機(jī)器輔助對(duì)話”元素,具備詞補(bǔ)全、智能回復(fù)、智能分享等多個(gè)實(shí)用功能;搜狗搜索也會(huì)向“問(wèn)答”方向發(fā)展,搜狗問(wèn)答機(jī)器人汪仔、搜狗答題助手、搜狗立知等產(chǎn)品就是“問(wèn)答”的落地應(yīng)用。

AI翻譯在硬件上的施展機(jī)會(huì)更多

李健濤在AI翻譯技術(shù)方面有著深入的了解:“在翻譯方面,我們認(rèn)為技術(shù)程度已經(jīng)達(dá)到臨界點(diǎn),可以真正的大眾民用化。” 搜狗獨(dú)創(chuàng)的基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯技術(shù) ,實(shí)現(xiàn)了語(yǔ)音翻譯、對(duì)話翻譯、文字翻譯、圖像翻譯等豐富的交互翻譯方式,可完成61種語(yǔ)言互譯。優(yōu)秀的技術(shù)能力,也收獲了市場(chǎng)的廣泛認(rèn)可,李健濤提到:“搜狗翻譯相關(guān)產(chǎn)品日均翻譯請(qǐng)求已超1.5億次,覆蓋全球超過(guò)1000萬(wàn)用戶。” 在國(guó)際學(xué)術(shù)賽事WMT 2017中,搜狗機(jī)器翻譯獲得了人工評(píng)價(jià)指標(biāo)的雙向第一名。

基于神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù),搜狗輸入法已上線翻譯功能,用戶可在聊天場(chǎng)景中進(jìn)行中、英、日、韓等語(yǔ)言的翻譯;搜狗搜索中上線了英文搜索頻道,幫助用戶用中文搜索全世界,現(xiàn)在還支持對(duì)日語(yǔ)、韓語(yǔ)信息的檢索。此外,搜狗還上線了翻譯App,在不同場(chǎng)景下進(jìn)行聲音、圖片和文字的翻譯;搜狗機(jī)器同傳是全球首個(gè)商用機(jī)器同傳,在達(dá)沃斯、世界互聯(lián)網(wǎng)大會(huì)等百余場(chǎng)國(guó)際化會(huì)議中被廣泛應(yīng)用,同樣也被本次數(shù)博會(huì)聘為同傳指定服務(wù)商之一,為發(fā)言人和演講者提供了準(zhǔn)確的同傳服務(wù),獲得了與會(huì)嘉賓的交口稱(chēng)贊。

李健濤著重介紹了搜狗旅行翻譯寶和搜狗錄音翻譯筆,這兩款智能硬件翻譯產(chǎn)品,針對(duì)了不同的場(chǎng)景和群體。李健濤著重對(duì)它們進(jìn)行了區(qū)分:搜狗旅行翻譯寶首創(chuàng)離線翻譯模式,翻譯效果與在線效果持平,同時(shí)具備實(shí)景拍照翻譯,“解決了不會(huì)說(shuō)、聽(tīng)不懂、看不懂的痛點(diǎn)?!倍压蜂浺舴g筆主要面向?qū)W生、記者和商務(wù)人士,不僅支持實(shí)時(shí)錄音轉(zhuǎn)文字,還可以完成同傳翻譯、對(duì)話翻譯功能?!罢Z(yǔ)音識(shí)別準(zhǔn)確率超過(guò)97%,每分鐘400字的轉(zhuǎn)寫(xiě)速度, 支持分享給朋友和社交平臺(tái)?!?/p>

最后,李健濤表示,搜狗的使命是讓人們表達(dá)和獲取信息更簡(jiǎn)單,“萬(wàn)物互聯(lián)時(shí)代到來(lái),搜狗在AI方面會(huì)繼續(xù)探索,未來(lái)會(huì)不斷將人工智能技術(shù)落地,真正做到民用化?!弊鳛殚_(kāi)拓者和領(lǐng)軍者,搜狗還將為行業(yè)帶來(lái)突破,為大眾創(chuàng)造驚喜,讓我們拭目以待。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2018-05-25
搜狗IoT產(chǎn)品總監(jiān)李健濤:搜狗如何在AI翻譯領(lǐng)域接連突破并成為行業(yè)第一?
誰(shuí)是大數(shù)據(jù)賽道上的“最強(qiáng)大腦”?人工智能領(lǐng)域高端對(duì)話聚焦于哪些話題?一年一度的國(guó)家級(jí)博覽會(huì)——貴陽(yáng)數(shù)博會(huì)正如火如荼得舉行。

長(zhǎng)按掃碼 閱讀全文