原標(biāo)題: 英語(yǔ)寫(xiě)作的“苦”,AI能幫你嘗?
文|李北辰
這個(gè)世界上有多少人在學(xué)習(xí)英文?
根據(jù)德國(guó)知名語(yǔ)言學(xué)家烏爾里?!ぐ⒚桑║lrich Ammon)的估計(jì),答案是15億,是學(xué)習(xí)法語(yǔ),漢語(yǔ),西班牙語(yǔ),德語(yǔ),意大利語(yǔ)和日語(yǔ)人數(shù)總和的10倍左右。
具體到中國(guó),拋去全球互聯(lián)網(wǎng)上80%的信息,60%的廣播節(jié)目,75%的電視節(jié)目都是英文的宏觀背景不談,一代代學(xué)生被英文“折磨”的最直接原因是考試,在升學(xué)的推動(dòng)下,英語(yǔ)已經(jīng)是數(shù)代中國(guó)學(xué)生的必修課。
而眾所周知,在“聽(tīng)說(shuō)讀寫(xiě)”這四大英文核心要素中,最考驗(yàn)英文綜合能力的“寫(xiě)”,無(wú)疑“折磨”學(xué)生最多。無(wú)論是中小學(xué)英語(yǔ)考試,四六級(jí),還是國(guó)際標(biāo)準(zhǔn)化測(cè)試,那些不易覺(jué)察的語(yǔ)法問(wèn)題,不易調(diào)配的“高級(jí)”詞匯,都是橫亙?cè)趯W(xué)生與一篇“漂亮”作文面前的絆腳石。
想要踢開(kāi)這些絆腳石,除了日趨高昂的私教錢(qián),很多學(xué)生都缺少一個(gè)貼身的作文老師。而在另一邊,對(duì)于在校任教的英文老師而言,考慮到現(xiàn)在一個(gè)學(xué)生的課業(yè)負(fù)擔(dān),需要逐句批改的作文量也已堪稱卷帙浩繁,這往往會(huì)讓負(fù)責(zé)任的老師苦不堪言。
事實(shí)上,這也是為什么去年年底,當(dāng)?shù)弥④泚喼扪芯吭和瞥鑫④洝皭?ài)寫(xiě)作”網(wǎng)頁(yè)版時(shí),許多學(xué)生,家長(zhǎng),和老師都倍感欣喜的原因,“愛(ài)寫(xiě)作”在語(yǔ)法批改和評(píng)估反饋等方面的技術(shù)幫襯,委實(shí)令他們感到輕松許多。
而就在幾天前,“愛(ài)寫(xiě)作”手機(jī)端也已正式上線,更便捷的批改與寫(xiě)作,讓人能更好地用碎片化時(shí)間完成學(xué)習(xí),且與網(wǎng)頁(yè)端一樣,從語(yǔ)法,用詞,到文章結(jié)構(gòu);從中小學(xué),四六級(jí),到雅思托福,它能根據(jù)不同年級(jí)和類型的作文標(biāo)準(zhǔn),有針對(duì)性地匹配反饋建議,幫助不同學(xué)習(xí)者提升英文寫(xiě)作水平。
1
事實(shí)上,基于微軟亞洲研究院在自然語(yǔ)言處理和OCR(光學(xué)字符識(shí)別)等領(lǐng)域的研究成果,加之微軟小英多年以來(lái)的技術(shù)積淀,針對(duì)英文寫(xiě)作的不同痛點(diǎn),“愛(ài)寫(xiě)作”逐漸探索出了不同亮點(diǎn)。
依我之見(jiàn),其中應(yīng)用最廣泛的是語(yǔ)法檢查功能。
你或許知道,人類語(yǔ)言學(xué)一個(gè)最經(jīng)典的命題就是:語(yǔ)言限定了人類思維的邊界。就像哲學(xué)家維特根斯坦所言,由于每個(gè)人都是在語(yǔ)言的邊界內(nèi)寫(xiě)作與思辨,很難覺(jué)察到語(yǔ)言工具的局限。譬如終身只用漢語(yǔ)寫(xiě)作的人通常不會(huì)意識(shí)到,漢語(yǔ)中沒(méi)有主賓格和單復(fù)數(shù)等邏輯信息,所以斯坦福大學(xué)教授雷拉·波洛狄特斯基(Lera Boroditsky)才說(shuō):“每種語(yǔ)言都包含著一種獨(dú)特的世界觀,反映了使用者數(shù)千年來(lái)的思想,傾向和認(rèn)知方式?!?/p>
這種“思想,傾向和認(rèn)知方式”,許多時(shí)候會(huì)讓語(yǔ)法成為英文寫(xiě)作的最大障礙。例如時(shí)態(tài)等語(yǔ)法錯(cuò)誤,倘若只是日常聊天,有點(diǎn)錯(cuò)沒(méi)啥大不了,但當(dāng)文字落于紙上,還是不出錯(cuò)為好。
讓學(xué)生避免語(yǔ)法錯(cuò)誤,也是“愛(ài)寫(xiě)作”首先想要解決的?!皭?ài)寫(xiě)作”在快速完成全文語(yǔ)法檢查的同時(shí),會(huì)將提交作文中的語(yǔ)法問(wèn)題用紅色下劃線標(biāo)記出來(lái),學(xué)生點(diǎn)擊紅線,就可獲得有針對(duì)性的語(yǔ)法講解,且還能看到修改后作為參考的正確表達(dá)。
在英文寫(xiě)作中,比“正確”更難的,是“高級(jí)”。
這就要說(shuō)到“愛(ài)寫(xiě)作”的另一項(xiàng)重要功能:詞語(yǔ)替換。
有個(gè)著名的段子。家長(zhǎng)問(wèn)老師:“我家孩子4歲,英語(yǔ)詞匯量大概只有1500個(gè)左右,是不是不太夠?”。老師回答:“在美國(guó)肯定夠了,在海淀區(qū)肯定不夠?!?/p>
這個(gè)段子當(dāng)然充滿了中國(guó)式家長(zhǎng)的焦慮,但你得承認(rèn),從英文的角度,掌握更多單詞確實(shí)能豐富描述同一事物的維度,在日常練習(xí)中,老師也確實(shí)經(jīng)常會(huì)問(wèn):“還有沒(méi)有更高級(jí)的詞可以用在這里?”
因?yàn)樵S多時(shí)候,僅僅是替換一個(gè)單詞,就會(huì)生出一種賞心悅目的高級(jí)感(我相信看過(guò)《綠皮書(shū)》的人會(huì)對(duì)此深有體會(huì)),只可惜有些中國(guó)學(xué)生背了不少單詞,卻不能在最該用的時(shí)候信手拈來(lái),這也極大影響了作文的美感。
針對(duì)于此,微軟“愛(ài)寫(xiě)作”的詞語(yǔ)替換功能,可以根據(jù)上下文篩選出多個(gè)高級(jí)詞匯供你選擇使用,譬如讓你不再只會(huì)用“good”和“nice”這種簡(jiǎn)單詞匯,而是能看到諸如“impressive”和“admirable”這種更高級(jí)復(fù)雜的詞匯進(jìn)行替換。
嗯,作為一個(gè)專業(yè)的中文寫(xiě)作者,我當(dāng)然知道,有些時(shí)候“直抒胸臆”是最好的表達(dá),但也有些時(shí)候,“豈曰無(wú)衣,與子同袍”會(huì)因更具美感而更具力量。
最后,再來(lái)簡(jiǎn)單了解下“愛(ài)寫(xiě)作”的分類作文打分和手寫(xiě)圖片識(shí)別功能。
打分功能不僅能對(duì)所有文章進(jìn)行一般性評(píng)分,還能測(cè)試同一篇作文在不同考試類型中的得分狀況,因?yàn)椴煌目荚囋谠~匯語(yǔ)法,文章結(jié)構(gòu)和切題程度等方面有著不同的考量標(biāo)準(zhǔn),所以“愛(ài)寫(xiě)作”在給出分?jǐn)?shù)的同時(shí),還可有針對(duì)性地評(píng)價(jià)一篇作文在不同方面的表現(xiàn),并給出反饋建議。
而手寫(xiě)圖片識(shí)別功能,能讓學(xué)生只需用手機(jī)給作文拍照上傳,就可將其轉(zhuǎn)換成可用智能終端編輯的文字,語(yǔ)法檢查,作文打分,詞語(yǔ)替換等批改功能也可全部實(shí)現(xiàn)。你可以想見(jiàn),除了方便學(xué)生,老師也可借助此功能,輕松識(shí)別學(xué)生們各不相同的手寫(xiě)字體,讓作文批改工作事半功倍。
為了測(cè)試上述功能,我找了一篇手寫(xiě)英文段落,下面就是手寫(xiě)稿和系統(tǒng)自動(dòng)識(shí)別的對(duì)比,不難發(fā)現(xiàn),除了僅有的一個(gè)單詞錯(cuò)誤(your 識(shí)別成 year),以及需要把標(biāo)題歸到標(biāo)題欄,識(shí)別結(jié)果非常完美,你可以直接編輯修改。
而完成編輯后,點(diǎn)擊“批改”,系統(tǒng)會(huì)讓你選擇級(jí)別,我選了初中,批改結(jié)果如下。
可以發(fā)現(xiàn),我選的這篇文章“十分優(yōu)秀”只有一個(gè)語(yǔ)法錯(cuò)誤,用紅線標(biāo)注,建議改為is——但為了錦上添花,系統(tǒng)給出了詞語(yǔ)替換的建議(藍(lán)線標(biāo)注詞語(yǔ),這點(diǎn)真的很好用)。另外,點(diǎn)擊“詳細(xì)報(bào)告”,系統(tǒng)還會(huì)從文章流暢度和文章內(nèi)容兩方面提供建議。
最后值得一提的是,上述功能不但會(huì)持續(xù)得到優(yōu)化,且“愛(ài)寫(xiě)作”同一賬號(hào)手機(jī)端和網(wǎng)頁(yè)端數(shù)據(jù)是打通的,用戶可以在PC端練習(xí)寫(xiě)作,在手機(jī)端更方便地查看檢索,完成英文寫(xiě)作的全場(chǎng)景覆蓋。
2
不難發(fā)現(xiàn),對(duì)于學(xué)習(xí)者而言,“愛(ài)寫(xiě)作”讓英文寫(xiě)作訓(xùn)練變得更簡(jiǎn)單,而在這種簡(jiǎn)單背后,蘊(yùn)含著微軟自身AI技術(shù)的深厚積淀。
很多人知道,在AI輔助英語(yǔ)學(xué)習(xí)領(lǐng)域,微軟亞洲研究院有著多年的經(jīng)驗(yàn):2009年就發(fā)布英庫(kù)詞典(必應(yīng)詞典的前身);2016年發(fā)布英語(yǔ)學(xué)習(xí)助手微軟小英;2018年將“作文打分”功能嵌入微軟小英。
而“愛(ài)寫(xiě)作”也經(jīng)歷了很長(zhǎng)的研究階段。如今,研究員在不斷對(duì)自然語(yǔ)言處理等AI領(lǐng)域的算法模型進(jìn)行迭代后,終于讓其成為提升英語(yǔ)寫(xiě)作能力的利器。
以語(yǔ)法檢查功能為例,其采用了微軟亞洲研究院全新的學(xué)習(xí)和推斷機(jī)制Fluency Boost Learning and Inference(流暢度提升學(xué)習(xí)與推斷),幫助用戶“找茬”。通過(guò) Fluency Boost Learning(流暢度提升學(xué)習(xí))生成的大量糾錯(cuò)數(shù)據(jù),結(jié)合 seq2seq 預(yù)訓(xùn)練技術(shù),語(yǔ)法糾錯(cuò)模型在 CoNLL-2014 和 JFLEG 兩個(gè)權(quán)威語(yǔ)法糾錯(cuò)數(shù)據(jù)集上都率先超越了人類參考水平,并且持續(xù)保持著業(yè)界領(lǐng)先的技術(shù)水準(zhǔn)。
再比如,在詞語(yǔ)替換功能中,研發(fā)人員提出了基于預(yù)訓(xùn)練語(yǔ)言模型的詞替換方法,并結(jié)合微軟原創(chuàng)的預(yù)訓(xùn)練語(yǔ)言模型——UniLM作為詞替換的解決方案。該方法通過(guò)半遮蓋(partial masking)等策略讓預(yù)訓(xùn)練語(yǔ)言模型能夠同時(shí)考慮原目標(biāo)詞詞義以及上下文語(yǔ)境,從而選出合適的替換詞。
我知道,普通讀者很難理解這些復(fù)雜的技術(shù)名詞——你只需要知道,正是這些“復(fù)雜”,醞釀出用戶練習(xí)英文寫(xiě)作時(shí)的簡(jiǎn)單。
另外你要知道的是,微軟亞洲研究院是一個(gè)計(jì)算機(jī)技術(shù)的研究機(jī)構(gòu),而非一個(gè)“教育機(jī)構(gòu)”,這也意味著,他們打造“愛(ài)寫(xiě)作”的目的,不是向市場(chǎng)推出一個(gè)“教育產(chǎn)品”去賺錢(qián)(順便一提,微軟小英自2016年推出至今都是免費(fèi)的),而是通過(guò)與不同領(lǐng)域機(jī)構(gòu)(尤其教育領(lǐng)域)的充分合作,更好地理解教育行業(yè)和用戶痛點(diǎn),探尋AI技術(shù)在教育行業(yè)的廣闊可能。
核心就是兩個(gè)字:賦能?!皭?ài)寫(xiě)作”是在以技術(shù)為長(zhǎng)板,以場(chǎng)景為核心,賦能合作伙伴,讓其掌握最新的技術(shù)工具,在AI時(shí)代發(fā)現(xiàn)新機(jī)遇,最終雙方再共同賦能用戶,解決中國(guó)英語(yǔ)寫(xiě)作學(xué)習(xí)者在移動(dòng)和AI時(shí)代的需求。
事實(shí)上,“愛(ài)寫(xiě)作”的這種角色,很容易令人想到微軟賦予自身的使命:通過(guò)提供平臺(tái)和生產(chǎn)力工具,賦能地球上的每個(gè)人和每家組織,幫助他們?nèi)〉酶喑删汀?/p>
結(jié)語(yǔ)
我一直說(shuō),判斷一款產(chǎn)品優(yōu)良的方法從來(lái)不拘一格,但有種方法深得我心,即它是否具備“若我年輕時(shí)就有它,該有多好”的屬性,這種產(chǎn)品通常出現(xiàn)在教育領(lǐng)域。
是啊,包括我在內(nèi),無(wú)數(shù)中國(guó)學(xué)生經(jīng)歷過(guò)學(xué)習(xí)英語(yǔ)的煎熬,每個(gè)人學(xué)習(xí)英文寫(xiě)作的過(guò)程,也都像是一部“血淚史”,因?yàn)槭聦?shí)就像海明威說(shuō)的那樣:“寫(xiě)作沒(méi)什么秘訣,你要做的只是在打字機(jī)前流血?!?/p>
對(duì)于中國(guó)的英文寫(xiě)作學(xué)習(xí)者來(lái)說(shuō),這句話仍然是對(duì)的,提高寫(xiě)作能力沒(méi)有捷徑,沒(méi)人能繞開(kāi)平日枯燥的大量練習(xí)——但如今,新技術(shù)的加持,至少可以在你“流血”時(shí),少一些痛苦,多一些回報(bào)。
“若我年輕時(shí)就有它,該有多好”。
作者:李北辰,獨(dú)立撰稿人,國(guó)內(nèi)數(shù)十家媒體專欄作家,曾供職《南都周刊》《華夏時(shí)報(bào)》《財(cái)經(jīng)》等媒體
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋(píng)果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢(qián)通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋(píng)果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤(pán)初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。