跨越AI大門,一本翻譯藍(lán)皮書、一場人機(jī)共譯比賽投射出怎樣的未來?

大語言模型LLM是這幾個(gè)月熱度最高的全球明星。目前看來,AI逐漸走向復(fù)雜專業(yè)的白領(lǐng)型崗位,已經(jīng)是必然的趨勢。

OpenAI剛剛發(fā)布的35頁論文中,提到了最容易受到LLM影響的職業(yè)中譯員和筆譯員排名第二。

以前機(jī)器翻譯就是出國旅游時(shí)拍拍路標(biāo)、看看菜譜,現(xiàn)在GPT-4連學(xué)術(shù)論文里的復(fù)雜長難句、專業(yè)術(shù)語都能理解,“人肉翻譯”越來越?jīng)]優(yōu)勢。

生成式AI能直接模擬已故的翻譯家,輸出大師風(fēng)格的譯文,一般人做翻譯還有什么前途?

調(diào)用ChatGPT翻譯一本中等部頭的英文書,只需要花大概十個(gè)小時(shí)、四美元,人工翻譯卷到天際也達(dá)不到這樣的性價(jià)比……

這段時(shí)間,外語專業(yè)學(xué)生和翻譯從業(yè)者們有類似心情的人不在少數(shù)。

根據(jù)中國翻譯協(xié)會(huì)的調(diào)查,中國的翻譯人才的規(guī)模是538萬人,其中本科以上的中青年為主,這些年輕、專業(yè)、高素質(zhì)的人才如果離開了翻譯行業(yè),豈不可惜?

所以,我們應(yīng)該盡快回答這些問題:AI時(shí)代,我們?yōu)槭裁催€需要人工翻譯?翻譯人才要怎么跨入AI的大門?譯者+機(jī)器的人機(jī)協(xié)作,有哪些必要條件?

幸好,翻譯行業(yè)的反應(yīng)速度遠(yuǎn)比我們想象得快。4月3日至4日,2023中國翻譯協(xié)會(huì)年會(huì)舉辦,百度翻譯聯(lián)合中國外文局翻譯院、中國翻譯協(xié)會(huì)翻譯技術(shù)委員會(huì),共同發(fā)布了《2023機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書》。

《藍(lán)皮書》系統(tǒng)闡述了機(jī)器翻譯的發(fā)展歷程和方向,介紹了產(chǎn)業(yè)級機(jī)器翻譯系統(tǒng)和產(chǎn)品形式,并通過實(shí)際案例展示了機(jī)器翻譯產(chǎn)業(yè)應(yīng)用現(xiàn)狀,對機(jī)器翻譯未來發(fā)展提出建議。為推動(dòng)機(jī)器翻譯技術(shù)與各行業(yè)的深度融合提供有益借鑒,為機(jī)器翻譯技術(shù)的產(chǎn)業(yè)應(yīng)用提供有力支持,其客觀、全面、權(quán)威的信息,也成為翻譯人才把握當(dāng)下趨勢的權(quán)威參考。

(《2023機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書》視頻簡介)

同時(shí),在譯協(xié)年會(huì)上,由百度翻譯提供技術(shù)和平臺(tái)支持的“首屆全國翻譯技術(shù)大賽”正式啟動(dòng),預(yù)計(jì)賽制持續(xù)到8月,也為中國翻譯人才擁抱技術(shù)提供了競技舞臺(tái)和窗口期。

沒有人會(huì)懷疑,我們正處在一個(gè)非常重要的歷史轉(zhuǎn)折點(diǎn)。面對大語言模型等最新AI技術(shù)帶來的無數(shù)可能性,中國翻譯人才可以不焦慮、不盲目、有底氣的進(jìn)入人機(jī)共譯新階段。

不焦慮:“見識(shí)過‘珍妮紡紗機(jī)’,我還是選擇當(dāng)翻譯”

在翻譯行業(yè)工作多年的小A表示:太陽底下無新事,翻譯人見過的“AI威脅論”并不少。

2016年,翻譯領(lǐng)域就曾出現(xiàn)過類似的“珍妮紡紗機(jī)時(shí)刻”。當(dāng)時(shí),一篇名為《翻譯界的重大突破!作為一個(gè)翻譯,此刻我理解了18世紀(jì)紡織工人看到蒸汽機(jī)時(shí)的憂慮和恐懼!》的文章,傳遍了翻譯人的朋友圈。

不少譯員和外語系學(xué)生就像在手工棉紡織時(shí)代,看到了由蒸汽機(jī)帶動(dòng)的珍妮紡紗機(jī),能同時(shí)紡8卷線一樣,感到非常擔(dān)憂。

原來,百度于2015年發(fā)布了全球首個(gè)互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng)。隨后,谷歌、微軟相繼部署了以神經(jīng)網(wǎng)絡(luò)作為基礎(chǔ)的機(jī)器翻譯系統(tǒng)。這種機(jī)器翻譯技術(shù),通過建立深度神經(jīng)網(wǎng)絡(luò)模擬人類的翻譯過程,在語言表示、語義理解、譯文生成等方面有顯著進(jìn)步,讓機(jī)器翻譯的質(zhì)量大幅提升。結(jié)果呢?今天人類翻譯依然存在,而大眾使用翻譯服務(wù)的門檻則大大降低了。

更早一點(diǎn),上世紀(jì)末的翻譯人,也曾遇到過“珍妮紡紗機(jī)”。九十年代,統(tǒng)計(jì)機(jī)器翻譯方法的出現(xiàn),可以基于大規(guī)模語料自動(dòng)訓(xùn)練模型參數(shù),這種方式不需要人工專家來構(gòu)建翻譯規(guī)則,比基于規(guī)則的機(jī)器翻譯效率更高、效果更好,彌補(bǔ)了當(dāng)時(shí)國內(nèi)高水平的專業(yè)翻譯人才匱乏、不能滿足實(shí)際需求的問題,讓更多高質(zhì)量的譯著走出了國門,走進(jìn)大眾視野。

作為一種更古早的機(jī)器翻譯技術(shù),基于規(guī)則的機(jī)器翻譯,其實(shí)也曾是人類眼中的“珍妮紡紗機(jī)”。上世紀(jì)五十年代,哪怕窮盡全球翻譯家們一生的力量,也只能掌握幾十種語言,譯著只占人類作品總量的冰山一角,通過計(jì)算機(jī)自動(dòng)完成翻譯,解決全球溝通和交流的問題,也帶來了翻譯業(yè)態(tài)的快速發(fā)展。

把時(shí)間拉回到當(dāng)下,以 ChatGPT、文心一言為代表的新一代預(yù)訓(xùn)練模型技術(shù),通過超大規(guī)模的數(shù)據(jù)和充分訓(xùn)練實(shí)現(xiàn)了智能涌現(xiàn)效應(yīng),大幅提升了機(jī)器翻譯的魯棒性和容錯(cuò)能力。

所以說,機(jī)器翻譯從來沒有真正消滅人工翻譯,這是歷史上被多次證明的,反而機(jī)器翻譯讓高質(zhì)量翻譯人才的需求更加旺盛。

面對新的機(jī)器翻譯技術(shù),翻譯人才對于“珍妮紡紗機(jī)”的恐懼,更多是源于對于自身發(fā)展的不確定。幸好,這種“不確定”正在被“國家隊(duì)”所改變。

在剛剛發(fā)布的《2023機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書》中,中國翻譯協(xié)會(huì)的調(diào)研數(shù)據(jù)顯示,有超過 85% 的受訪者認(rèn)為“機(jī)器翻譯 + 譯后編輯”的工作模式會(huì)在更大范圍內(nèi)應(yīng)用。

《藍(lán)皮書》認(rèn)為,機(jī)器翻譯成為人類譯員的得力助手和有效補(bǔ)充,促使翻譯行業(yè)催生出更多如譯后編輯、機(jī)翻質(zhì)量控制等新職業(yè),正在多種場景中被應(yīng)用。

簡單舉幾例:

1.加速短視頻、網(wǎng)絡(luò)文學(xué)等中國優(yōu)質(zhì)內(nèi)容出海。人人譯視界助力 B 站的海外達(dá)人項(xiàng)目,完成三百多個(gè)頻道的譯制工作;晉江文學(xué)城、米讀小說 APP使用針對網(wǎng)絡(luò)文學(xué)垂直領(lǐng)域定制優(yōu)化的機(jī)器翻譯系統(tǒng),將大量本土網(wǎng)絡(luò)文學(xué)作品翻譯成英語、西班牙語、葡萄牙語等語種,獲得海外用戶的青睞。

2.助力企業(yè)海外市場經(jīng)營。中石化的企業(yè)智能翻譯平臺(tái),支撐境外財(cái)務(wù)票據(jù)核銷、重大項(xiàng)目審計(jì)、合規(guī)備案等翻譯工作;新華社的“新華絲路”, 引入智能翻譯平臺(tái),輔助人工譯員提高翻譯效率。

3.支撐各行各業(yè)數(shù)字化建設(shè)。譯馬網(wǎng)引入“AI+人工” 的譯后編輯模式,日均翻譯字?jǐn)?shù)可提升近 4倍,翻譯成本降低 34%;邁迪培爾開發(fā)的醫(yī)藥等垂直領(lǐng)域機(jī)器翻譯,為科研人員的研究工作提供了極大便利。

總之,翻譯領(lǐng)域的新機(jī)會(huì)還有很多,更詳細(xì)的信息,大家可以在《藍(lán)皮書》中閱覽。

機(jī)器翻譯大有用武之地,高端翻譯人才也是時(shí)代所需。二者相輔相成,可以滿足不同層次的翻譯需求,在獲取全球信息、對外交流等方面將發(fā)揮越來越重要的作用。

作為普通人,要做的是學(xué)習(xí)駕馭最新的“珍妮紡紗機(jī)”,把機(jī)器翻譯用好,不是留戀做一個(gè)“手工紡紗人”。

不盲目:從朦朧到清晰的人機(jī)協(xié)作之路

那么,“AI+人工” 的譯后編輯工作模式下,究竟怎樣才算用好AI技術(shù)?人機(jī)共譯,需要具備哪些技能?

《藍(lán)皮書》提供了方法論,呼吁培養(yǎng) “翻譯 + 技術(shù) +N”的精翻譯、懂技術(shù)、能力強(qiáng)的新時(shí)代高端翻譯人才。首屆全國翻譯技術(shù)大賽,則提供了具體的實(shí)現(xiàn)路徑。

要將AI技術(shù)和機(jī)器翻譯作為得力助手,人類譯員想要提高技能,也不能盲目。

“首屆全國翻譯技術(shù)大賽”,由中國外文局、全國翻譯專業(yè)學(xué)位研究生教育指導(dǎo)委員會(huì)指導(dǎo),中國翻譯協(xié)會(huì)、中國外文局翻譯院、大連外國語大學(xué)主辦。百度翻譯作為承辦單位之一,提供翻譯技術(shù)與比賽平臺(tái)支持。

從陣容中不難看到,賽事為推動(dòng)行業(yè)各方對機(jī)器翻譯技術(shù)的了解和應(yīng)用,提供了清晰的方向和路徑:

1.清晰的培養(yǎng)方向。

舉辦方是百度翻譯,和翻譯行業(yè)的“國家隊(duì)”,保證了比賽涉及內(nèi)容的前沿性和權(quán)威性,同時(shí),賽事向各類翻譯愛好者開放,高校學(xué)生、翻譯機(jī)構(gòu)、企業(yè)單位等都可以參與,人才覆蓋面廣。

由此證明,復(fù)合型翻譯人才的培養(yǎng),AI+翻譯融合學(xué)科的建設(shè),離不開政產(chǎn)學(xué)研用多方形成合力,提供更充沛的實(shí)踐機(jī)會(huì)和更明確的方向引導(dǎo)。

2.清晰的技能標(biāo)準(zhǔn)。

中國的翻譯人才要開啟“人機(jī)共譯”工作新范式,需要具備哪些核心能力?比賽考核點(diǎn)的設(shè)計(jì),也給出了清晰的答案,讓人才能夠不再迷茫,提早培養(yǎng)自身的競爭力。

比如以往的翻譯比賽,主要考察人類譯文的準(zhǔn)確性、優(yōu)美性,而此次比賽,還將對機(jī)器翻譯的掌握,納入了考核,包括對機(jī)器翻譯軟件內(nèi)置功能是否熟悉,操作熟練度如何,是否充分運(yùn)用了技術(shù),做到真正以賽促學(xué),幫助大家掌握先進(jìn)的機(jī)器翻譯工具。

(譯后編輯能力考察:術(shù)語替換題)

3.清晰的產(chǎn)業(yè)基石。

大賽由百度翻譯提供技術(shù)和平臺(tái)支持,背后也有著深度的考量:中國翻譯綜合能力的提高,要建立在怎樣的機(jī)器翻譯底座上?

選擇百度翻譯,一是技術(shù)領(lǐng)先,百度于2015年自主研發(fā)的全球首個(gè)互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng),能夠快速提高翻譯產(chǎn)能,是較為先進(jìn)的機(jī)器翻譯工具。

二是平臺(tái)能力,百度智能文檔翻譯平臺(tái)的創(chuàng)新人機(jī)共譯模式,將機(jī)器翻譯(Machine Translation)+ 譯后編輯(post-editing)+ 模型自學(xué)習(xí)相結(jié)合,讓機(jī)器翻譯結(jié)果越用越準(zhǔn),效率不斷提升。

三是應(yīng)用豐富。百度智能文檔翻譯平臺(tái),提供術(shù)語參考、翻譯記憶、智能糾錯(cuò)等功能,內(nèi)置權(quán)威術(shù)語,查證更省力,在工作中真正為人類譯員減負(fù)。

從底層技術(shù)到上層應(yīng)用的優(yōu)勢,是百度智能文檔翻譯平臺(tái)“被選擇”的原因,也為翻譯行業(yè)和翻譯人才接下來的發(fā)展提供牢靠的支持。

翻譯人才如何跨入AI的大門,從首屆全國翻譯技術(shù)大賽開始,路徑正從朦朧走向清晰。

(產(chǎn)業(yè)級機(jī)器翻譯系統(tǒng)流程圖)

有底氣:從一群人的比賽,到全民的新可能

你可能會(huì)問:我又不當(dāng)譯員,機(jī)器翻譯的發(fā)展跟我又有什么關(guān)系呢?

當(dāng)然有。

從基于規(guī)則的機(jī)器翻譯,到大語言模型驅(qū)動(dòng)的機(jī)器翻譯,機(jī)器翻譯技術(shù)的每一次更迭,都會(huì)讓全社會(huì)、全世界廣泛受益。

你讀到的一部譯本,與海外朋友的一次對話,境外旅游時(shí)的無礙溝通,前沿論文的快速傳播……翻譯成本不斷降低,以前需要請一個(gè)翻譯,現(xiàn)在手機(jī)app/翻譯筆就能搞定;體驗(yàn)越來越絲滑,原本要分段復(fù)制粘貼的學(xué)術(shù)論文,現(xiàn)在整個(gè)丟進(jìn)百度智能文檔翻譯,就能直出全部譯文,還帶還原版式,閱讀效率也高多了。

對于個(gè)人來說,跨語言溝通、學(xué)習(xí)和交流,是成長和進(jìn)步的基礎(chǔ),通過百度翻譯這樣的智能產(chǎn)品獲得更高質(zhì)量、更低成本的翻譯服務(wù),減少了很多不必要的時(shí)間和操作,某種程度上來說,是一種人生的提速。

對于企業(yè)來說,產(chǎn)品出?;蚩缇迟Q(mào)易,需要在翻譯上投入高成本,有時(shí)還不能快速到位,一些翻譯相關(guān)業(yè)務(wù)場景需要定制化開發(fā),缺乏相應(yīng)的人才。

《藍(lán)皮書》中提到國內(nèi)某世界500強(qiáng)企業(yè),需要通過海外媒體報(bào)道和電商渠道的消費(fèi)者評論等信息,進(jìn)行海外市場經(jīng)營決策,涵蓋近百種語言,每月翻譯需求超百億詞,涵蓋文本、文檔、圖片等多種形態(tài),海量而冗雜的翻譯任務(wù),全靠人工根本沒辦法及時(shí)跟進(jìn)最新市場動(dòng)向。

中國企業(yè)要“走出去”,AI+機(jī)器翻譯,是必不可少的輔助。

百度翻譯從模型到應(yīng)用的豐富能力,背靠百度生態(tài),可與計(jì)算機(jī)視覺、語音處理等人工智能技術(shù)深度融合,全面、及時(shí)、深入響應(yīng)不同行業(yè)不同場景的業(yè)務(wù)需求。

對國家來說,翻譯能力是國家軟實(shí)力的一部分。

中國外文局局長、中國翻譯協(xié)會(huì)會(huì)長杜占元指出,國家翻譯能力,是通過翻譯行為建構(gòu)對外話語、開展文化傳播、塑造國家形象的綜合能力,是文化軟實(shí)力和國際傳播能力的重要組成部分,也是發(fā)揮大國作用、提升國際話語權(quán)的重要保障。

從這個(gè)角度看,加強(qiáng)國家翻譯能力建設(shè),除了傳統(tǒng)手段之外,機(jī)器翻譯的技術(shù)領(lǐng)先性、安全性、可用性愈發(fā)重要。

百度在大模型技術(shù)、大語言模型(LLM)、自然語言處理(NLP)方面深耕多年的技術(shù)儲(chǔ)備和領(lǐng)先實(shí)力,從芯片、深度學(xué)習(xí)框架到翻譯模型的核心模塊自研能力,讓百度翻譯有望成為首屈一指的產(chǎn)業(yè)級機(jī)器翻譯系統(tǒng),在翻譯行業(yè)智能化、數(shù)字經(jīng)濟(jì)交流中發(fā)揮作用。

這些力量融合起來,才推動(dòng)中國翻譯來到新的轉(zhuǎn)折點(diǎn)。而一個(gè)溝通無礙、高效的新世界,會(huì)讓一個(gè)人、一個(gè)企業(yè)、乃至一個(gè)國家,都獲得新的機(jī)會(huì)與可能。

1999年,萬維網(wǎng)的發(fā)明者、互聯(lián)網(wǎng)之父Tim Berners-Lee,就曾提出過一個(gè)概念:social machine(社會(huì)機(jī)器),即人與機(jī)器的協(xié)作體。人負(fù)責(zé)創(chuàng)造,而機(jī)器負(fù)責(zé)執(zhí)行。當(dāng)時(shí),最熱的機(jī)器是家用電腦,全國都興起一股“電腦熱”,各種電腦培訓(xùn)班、電腦操作書籍紛紛問世,和今天的“AI熱”差不多。

如果你不會(huì)恐懼電腦、抗拒電腦,那當(dāng)然也不應(yīng)該恐懼AI。AI時(shí)代,我們?nèi)匀恍枰祟愖g者,語言的通天塔一天沒有越過,翻譯的火種便會(huì)生生不息。

個(gè)人對機(jī)器翻譯的不同態(tài)度和選擇,將迎來不同的命運(yùn),但愿你的選擇,映射的是你的希望,而非恐懼。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-04-04
跨越AI大門,一本翻譯藍(lán)皮書、一場人機(jī)共譯比賽投射出怎樣的未來?
大語言模型LLM是這幾個(gè)月熱度最高的全球明星。目前看來,AI逐漸走向復(fù)雜專業(yè)的白領(lǐng)型崗位,已經(jīng)是必然的趨勢。 OpenAI剛剛發(fā)布的35頁論文...

長按掃碼 閱讀全文