原標(biāo)題:我們采訪了三位深度用戶,找到了機(jī)器翻譯進(jìn)入專業(yè)領(lǐng)域的最佳路徑
如果說(shuō)人工智能已經(jīng)能在哪些領(lǐng)域中超越人類,相信一定要提到的就是機(jī)器翻譯。從技術(shù)理論層面上來(lái)看,機(jī)器翻譯已經(jīng)在逐步超越人類的能力——在今年3月,微軟就宣稱他們研發(fā)的機(jī)器翻譯系統(tǒng)在通用新聞漢譯英能力上已經(jīng)達(dá)到了人類專業(yè)水平。
理論上,機(jī)器翻譯在不斷接近專業(yè)翻譯能力。但仔細(xì)想想,我們今天應(yīng)用最多的還是簡(jiǎn)單的對(duì)話翻譯、拍照翻譯等等。例如出門旅游用搜狗旅行翻譯寶一類的產(chǎn)品幫助對(duì)話交流,或者在輸入法搞不定非英語(yǔ)單詞時(shí)拍下照片進(jìn)行翻譯。
實(shí)際上機(jī)器翻譯不斷追求的是接近人類的翻譯能力——能處理更長(zhǎng)的文檔、文字通順流暢符合上下文。但不斷專業(yè)化的機(jī)器翻譯,究竟應(yīng)該如何進(jìn)入專業(yè)領(lǐng)域?針對(duì)這個(gè)問(wèn)題,我們對(duì)幾位在生活中常常與專業(yè)翻譯打交道的粉絲進(jìn)行了采訪。
職業(yè):研究僧
翻譯需求:專業(yè)期刊論文的學(xué)術(shù)翻譯
一提到提到機(jī)器翻譯,小A表示這是AI技術(shù)里最“迷”的領(lǐng)域。小A的原話是:“技術(shù)明明達(dá)到了一定高度,應(yīng)用時(shí)最大的作用,還是幫老年旅游團(tuán)出國(guó)時(shí)能拍張照片看懂菜譜?!毙認(rèn)為機(jī)器翻譯目前最大的問(wèn)題還是不同機(jī)器翻譯軟件翻譯水平層次不齊,有些機(jī)器翻譯軟件的水平連四、六級(jí)都過(guò)不了,自然難以進(jìn)入專業(yè)領(lǐng)域。
小A告訴我們,作為研究生常常需要翻譯期刊論文,面對(duì)學(xué)術(shù)文章里的復(fù)雜的長(zhǎng)句子和專業(yè)單詞,很多機(jī)器翻譯軟件都表現(xiàn)不好。尤其是很多期刊論文都是PDF格式,很不方便通過(guò)復(fù)制粘貼進(jìn)行翻譯。大部分時(shí)候最高效的方式還是一邊查單詞一邊“人肉翻譯”。
受訪者B君-“我一眼就看穿了你結(jié)構(gòu)混亂的產(chǎn)品原型圖”
職業(yè):正在向機(jī)器學(xué)習(xí)方向發(fā)展的碼農(nóng)
翻譯需求:開(kāi)發(fā)者社區(qū)的文檔翻譯
正在朝機(jī)器學(xué)習(xí)方向努力進(jìn)修的B君,是腦極體粉絲里的典型一員。B君告訴我們,他對(duì)機(jī)器翻譯的能力是認(rèn)可的,但日常使用中還是會(huì)遇到不少問(wèn)題。尤其是當(dāng)他在翻譯一些開(kāi)發(fā)者社區(qū)文檔時(shí),一些專業(yè)詞匯常常會(huì)出現(xiàn)歧義,常常需要用中英文對(duì)照才能完全理解。
以碼農(nóng)的嚴(yán)謹(jǐn)眼光來(lái)看,目前很多機(jī)器翻譯產(chǎn)品的主要問(wèn)題不是在翻譯技術(shù),而是在產(chǎn)品交互設(shè)計(jì)上。B君說(shuō)“可能很多機(jī)器翻譯產(chǎn)品都是技術(shù)人員主導(dǎo)產(chǎn)品設(shè)計(jì),能明顯看出不成熟的感覺(jué),用戶體驗(yàn)也很糟糕?!本湍弥杏⑽膶?duì)照這個(gè)簡(jiǎn)單的需求來(lái)說(shuō),很多產(chǎn)品都不能滿足。
加上還有很多有分段錯(cuò)誤、格式混亂等等問(wèn)題,B君需要翻譯整篇文章時(shí),大多數(shù)時(shí)候還是會(huì)按段落甚至句子翻譯。
受訪者C君-“如果有錢付給你,我干嘛還要工作?。俊?/p>
職業(yè):兼職法務(wù)
翻譯需求:長(zhǎng)文檔的免費(fèi)翻譯
作為兼職法務(wù),受訪者C君的職業(yè)看起來(lái)是和人工智能距離最遠(yuǎn)的了,但他同樣也會(huì)應(yīng)用到機(jī)器翻譯軟件。在兼職法務(wù)的工作中遇到涉及到外貿(mào)方面的工作,常常要對(duì)外文合同進(jìn)行互譯。這時(shí)利用機(jī)器翻譯對(duì)文件進(jìn)行大致翻譯,然后再人工優(yōu)化通常是效率最高的方式。
但C君所遇到的問(wèn)題除了翻譯技術(shù)以外,還有費(fèi)用。他發(fā)現(xiàn)很多平臺(tái)會(huì)把機(jī)器翻譯作為一種噱頭,翻譯較長(zhǎng)的文檔時(shí)則會(huì)很“心機(jī)”的向用戶推薦人工收費(fèi)翻譯服務(wù)。C君告訴我們,對(duì)于一些Freelancer法務(wù)和小公司的法務(wù)來(lái)說(shuō),這是一個(gè)很大的問(wèn)題,通常小公司并沒(méi)有能力配備專業(yè)的翻譯人員,如果選擇和第三方合作,除了有商業(yè)機(jī)密泄露風(fēng)險(xiǎn),還要簽一大堆免責(zé)合同。本來(lái)機(jī)器翻譯應(yīng)該是解決這個(gè)問(wèn)題的最好方法,結(jié)果現(xiàn)在卻成了人工翻譯的引流入口。
總的來(lái)說(shuō),機(jī)器翻譯水平、產(chǎn)品易用性和收費(fèi)是阻礙機(jī)器翻譯進(jìn)入專業(yè)應(yīng)用領(lǐng)域的主要原因。這樣看來(lái),機(jī)器翻譯能否進(jìn)入專業(yè)應(yīng)用領(lǐng)域,考驗(yàn)的其實(shí)產(chǎn)品,或者說(shuō)產(chǎn)品背后企業(yè)的綜合實(shí)力。不光要有技術(shù),還要有足夠產(chǎn)品設(shè)計(jì)能力,如果能讓用戶免費(fèi)使用,那就更好了。
結(jié)合這些原因,從技術(shù)、產(chǎn)品、費(fèi)用三個(gè)角度評(píng)估,我們判斷最有希望幫助機(jī)器翻譯進(jìn)入專業(yè)領(lǐng)域的產(chǎn)品是搜狗文檔翻譯。
一直技術(shù)黨,怎么會(huì)讓你失望?
從機(jī)器翻譯水平來(lái)看,搜狗是一家較早進(jìn)入NLP和機(jī)器翻譯行業(yè)的企業(yè)。
我們知道搜索引擎企業(yè)是最容易在AI技術(shù)上獲得成就的,因?yàn)樗阉饕嫒肟诒旧砭褪且粋€(gè)巨大的語(yǔ)料累積庫(kù)。而搜狗不光擁有搜索引擎,還有輸入法產(chǎn)品,兩款產(chǎn)品為搜狗累積了海量語(yǔ)料,讓搜狗搭建了基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)框架。搜狗翻譯App、搜狗旅行翻譯寶、搜狗錄音翻譯筆等產(chǎn)品都應(yīng)用了這一框架。在去年的第二屆機(jī)器翻譯大會(huì)(WMT2017)上,搜狗機(jī)器翻譯團(tuán)隊(duì)還獲得了中英機(jī)器翻譯冠軍。
深度學(xué)習(xí)中長(zhǎng)短期記憶網(wǎng)絡(luò)技術(shù)的應(yīng)用,帶來(lái)的不僅僅是日常應(yīng)用短句的精準(zhǔn)翻譯,還可以實(shí)現(xiàn)結(jié)合上下文語(yǔ)義理解推理翻譯結(jié)果。在期刊文章、合同這類長(zhǎng)文檔中表現(xiàn)更為突出。對(duì)于小A這種經(jīng)常要翻譯學(xué)術(shù)文章的用戶來(lái)說(shuō),這一點(diǎn)格外實(shí)用。
例如上圖中是對(duì)生物學(xué)家Robert A. Weinberg論文《The Hallmarks of Cancer》的翻譯節(jié)選??梢钥吹郊词乖卺t(yī)學(xué)這種充滿大量專業(yè)名詞的領(lǐng)域,搜狗長(zhǎng)文檔翻譯依然沒(méi)有讓人失望。
十四年C端經(jīng)驗(yàn),產(chǎn)品屆老司機(jī)了解一下?
在我們看來(lái),相比技術(shù),其實(shí)產(chǎn)品體驗(yàn)才是搜狗文檔翻譯的最大優(yōu)勢(shì)。在AI技術(shù)領(lǐng)域,不管是機(jī)器翻譯水平還是圖像水平,所有玩家都在窮追猛趕,追求著百分之零點(diǎn)幾的體驗(yàn)提升。但其實(shí)從技術(shù)到產(chǎn)品的過(guò)程,對(duì)于很多技術(shù)出身的AI企業(yè)才是最難的,所以才會(huì)出現(xiàn)B君所反映的產(chǎn)品邏輯混亂問(wèn)題。
搜狗的優(yōu)勢(shì)在于,搜索引擎、輸入法加上翻譯硬件,都是面向C端用戶的產(chǎn)品,而C端用戶往往又是對(duì)產(chǎn)品體驗(yàn)要求最高、最苛刻的。所以我們?cè)谒压肺臋n翻譯上,也能看到搜狗的產(chǎn)品設(shè)計(jì)體系的成熟和游刃有余。
在產(chǎn)品設(shè)計(jì)上,我們可以看到搜狗文檔翻譯完美還原了原來(lái)合同中的段落,以雙屏對(duì)照顯示。同時(shí)每一個(gè)段落都可以隨著鼠標(biāo)移動(dòng)在兩屏對(duì)照點(diǎn)亮,讓用戶清楚地看到每一句中文和對(duì)應(yīng)的英文,方便進(jìn)行修改和核查。對(duì)于行文嚴(yán)謹(jǐn)、需要反復(fù)修正的科研期刊、合同文件來(lái)說(shuō),可以節(jié)省很多反復(fù)查看文檔的時(shí)間。
更重要的是,搜狗文檔翻譯可以實(shí)現(xiàn)Doc、Docx、PDF三種格式文檔的中英互譯,像PDF這種不能編輯的文檔,在過(guò)去是一大難題,很多學(xué)術(shù)資料都以PDF的形式出現(xiàn),卻又不方便通過(guò)復(fù)制粘貼將文字挪騰到翻譯軟件中,現(xiàn)在可以直接翻譯PDF格式,省去了手動(dòng)轉(zhuǎn)換成可編輯文檔的過(guò)程。
免費(fèi)不難,但就此一家
最后最重要的一點(diǎn)是,目前雖然做文檔翻譯的企業(yè)很多,但只有搜狗文檔翻譯當(dāng)前獨(dú)家支持免費(fèi)預(yù)覽、下載翻譯結(jié)果。
或許對(duì)于很多企業(yè)而言,除了向使用者收費(fèi),他們找不到其他變現(xiàn)途徑。這時(shí)就能體現(xiàn)出搜狗這樣產(chǎn)品和技術(shù)布局完善的企業(yè)的優(yōu)勢(shì)了:免費(fèi)使用能夠吸引更多用戶,語(yǔ)料庫(kù)累積的增加可以進(jìn)一步提升搜狗機(jī)器翻譯的能力,讓每個(gè)人都能成為機(jī)器翻譯走向?qū)I(yè)領(lǐng)域的見(jiàn)證者。同時(shí)更多用戶了解到搜狗機(jī)器翻譯的實(shí)力,也能間接促進(jìn)翻譯硬件這類收費(fèi)產(chǎn)品的銷售。
盡管現(xiàn)在人工智能只是在替代一些簡(jiǎn)單的體力和腦力勞動(dòng),但人工智能逐漸走向復(fù)雜、專業(yè)的領(lǐng)域已經(jīng)是必然的趨勢(shì),搜狗的文檔翻譯就是很好的例子。作為普通人,不妨對(duì)這類工具多加嘗試,畢竟能夠駕馭專業(yè)領(lǐng)域的人工智能,是和未來(lái)共同協(xié)作的第一步。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。