2018 AI Challenger機(jī)器翻譯大賽 金山團(tuán)隊(duì)一舉包攬冠亞軍

12月19日,“2018 AI Challenger全球AI挑戰(zhàn)賽”總決賽答辯暨頒獎(jiǎng)典禮上傳來了好消息: 金山軟件集團(tuán)(以下簡稱“金山”)旗下AI Lab的兩支隊(duì)伍第一次參加此項(xiàng)大賽,便以黑馬姿態(tài)一路領(lǐng)先,與來自全球81個(gè)國家的企業(yè)、高校研發(fā)團(tuán)隊(duì)經(jīng)過多輪比拼,最終以大比分優(yōu)勢包攬了本年度AI Challenger“英中文本機(jī)器翻譯”比賽的冠亞軍。

創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)與金山辦公副總裁姚冬、金山AI Lab負(fù)責(zé)人李長亮博士合影

創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)與金山辦公副總裁姚冬、金山AI Lab負(fù)責(zé)人李長亮博士合影

AI Challenger旨在“用AI挑戰(zhàn)真實(shí)世界的問題”,架設(shè)了面向全球人工智能人才的開源數(shù)據(jù)集和編程競賽平臺,致力于推動(dòng)AI在科研與商業(yè)領(lǐng)域結(jié)合,打造良性可持續(xù)的AI科研與應(yīng)用新生態(tài)。

此次金山派出的兩支參賽隊(duì)伍雙雙獲獎(jiǎng),不僅證明了金山團(tuán)隊(duì)在人工智能科技領(lǐng)域的團(tuán)隊(duì)實(shí)力與創(chuàng)新潛能,還以出色的成績?yōu)榻鹕匠闪⑷苣攴钌狭艘环葙R禮。

全球AI挑戰(zhàn)賽2018冠軍團(tuán)隊(duì)合影

全球AI挑戰(zhàn)賽2018冠軍團(tuán)隊(duì)合影

機(jī)器翻譯技術(shù)領(lǐng)域 新生力量崛起

機(jī)器翻譯被譽(yù)為自然語言處理領(lǐng)域“皇冠上的明珠”,它能夠促進(jìn)消弭文化隔閡、加強(qiáng)世界交流,使語言不再成為妨礙不同語言文化民眾的溝通壁壘。

1954年,IBM啟動(dòng)了“Georgetown-IBM”實(shí)驗(yàn),用一臺大型機(jī)將60個(gè)俄語句子翻譯成英文。這項(xiàng)實(shí)驗(yàn)被學(xué)術(shù)界視為歷史上首次機(jī)器翻譯。其后的幾十年里,許多科學(xué)家不斷嘗試各種技術(shù)思路,如基于樣例、基于規(guī)則、基于統(tǒng)計(jì)等等,機(jī)器翻譯的研究幾經(jīng)起落,直到基于神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)的機(jī)器翻譯技術(shù)出現(xiàn),才讓“全世界無障礙溝通”的夢想成為可能。

2018 AI Challenger“英中文本機(jī)器翻譯”賽道上,所有的參賽隊(duì)伍均可自由選擇機(jī)器翻譯技術(shù),但都需要根據(jù)評測方提供的數(shù)據(jù),訓(xùn)練自己的機(jī)器翻譯系統(tǒng)。評測方使用機(jī)器翻譯的客觀考核指標(biāo)(BLEU、NIST、TER)來評分,其中BLEU是最主要的評估指標(biāo)。在今年的比賽中,數(shù)據(jù)總量達(dá)到1300萬句對,且其中具有上下文情景的中英雙語數(shù)據(jù)達(dá)到300萬句對,相比去年大幅擴(kuò)容。

來自金山AI Lab的一支參賽隊(duì)伍以客觀成績領(lǐng)先其他對手3個(gè)BLEU值,答辯成績超過其他隊(duì)伍30分的明顯優(yōu)勢獲得冠軍;另一支參賽團(tuán)隊(duì)則以優(yōu)異成績獲得亞軍。

第一次參加這樣的世界性大賽,就能與斯坦福大學(xué)、清華大學(xué)、中科院、BAT、科大訊飛、網(wǎng)易等“頂級豪門”同享人工智能盛宴,并且在機(jī)器翻譯主賽道取得不俗的成績,這表明,近年來堅(jiān)決投入AI研發(fā)的金山開始逐漸收獲回報(bào)。機(jī)器翻譯技術(shù)領(lǐng)域,新生力量已然崛起。

金山AI Lab年輕且富于朝氣,事實(shí)上,團(tuán)隊(duì)參與本次比賽的初衷就是用獎(jiǎng)項(xiàng)來檢驗(yàn)團(tuán)隊(duì)能力——2017年5月,由雷總親自掛帥,金山開始加大在AI領(lǐng)域的研發(fā)投入,成立了涵蓋圖像、語音、語言等多個(gè)研究方向的AI團(tuán)隊(duì),匯集了來自中科院、北京大學(xué)、墨爾本大學(xué)、哈工大等高校的優(yōu)秀畢業(yè)生。金山AI團(tuán)隊(duì)在短時(shí)間里建立了魯棒的機(jī)器翻譯框架,搭建了訓(xùn)練和調(diào)優(yōu)的基礎(chǔ)設(shè)施,并且配備了強(qiáng)大的底層計(jì)算服務(wù)能力,最終在本次大賽中全程領(lǐng)跑、一舉折桂。

探索核心技術(shù) 加速AI落地

百年前,嚴(yán)復(fù)先生提出“信達(dá)雅”的翻譯質(zhì)量三原則,當(dāng)前由機(jī)器翻譯的文字剛剛觸及“信”與“達(dá)”的層次,還遠(yuǎn)達(dá)不到“雅”的要求,但從實(shí)用的角度考慮,機(jī)器翻譯技術(shù)已足以打造出高效、可依賴的跨語言智能輔助翻譯服務(wù)。今后,金山將努力為WPS、詞霸等產(chǎn)品的用戶提供穩(wěn)定的、接近人工水平的翻譯,用戶將可以體驗(yàn)即時(shí)文本轉(zhuǎn)譯、同聲語音傳譯等智能服務(wù)。

除機(jī)器翻譯以外,金山AI Lab還在圖像、文本、語音等多個(gè)方向展開深入探索。金山邀請中科院李長亮博士加盟,主持AI Lab。正是在李博士的帶領(lǐng)下,在此次大賽上,幾名年輕研究人員才能創(chuàng)新出層次注意力機(jī)制、高斯搜索等獨(dú)特算法,在工程細(xì)節(jié)、特征提取等方面積累先進(jìn)經(jīng)驗(yàn)。目前,金山已為相關(guān)算法、技術(shù)申請專利,并在國際頂級會議上發(fā)表相關(guān)論文。與此同時(shí),金山更關(guān)注將技術(shù)與產(chǎn)品服務(wù)深度融合,完成技術(shù)落地。目前金山正在探索集成多種人工智能技術(shù),實(shí)現(xiàn)人機(jī)協(xié)作,助力金山辦公場景智能化。

周雖舊邦,其命維新。今天,三十歲的金山始終堅(jiān)持技術(shù)立業(yè),不斷自我突破轉(zhuǎn)型,不斷打造創(chuàng)新產(chǎn)品,服務(wù)億萬用戶。當(dāng)前,AI已成為金山的長期戰(zhàn)略,公司正全力以赴探索核心技術(shù),尋求持續(xù)突破。

金山未來,AI在路上。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-12-20
2018 AI Challenger機(jī)器翻譯大賽 金山團(tuán)隊(duì)一舉包攬冠亞軍
12月19日,“2018 AI Challenger全球AI挑戰(zhàn)賽”總決賽答辯暨頒獎(jiǎng)典禮上傳來了好消息: 金山軟件集團(tuán)(以下簡稱“金山”)旗下AI Lab的兩支隊(duì)伍第一次參加此項(xiàng)大賽

長按掃碼 閱讀全文