人工智能時(shí)代來(lái)襲,輸入法如何決勝下一個(gè)10年

原標(biāo)題:人工智能時(shí)代來(lái)襲,輸入法如何決勝下一個(gè)10年

近日,訊飛輸入法新版本正式上線,在隨聲譯和快捷翻譯功能里增加了日譯中、韓譯中、泰、越、西、法、德、俄與中文互譯,合計(jì)18種翻譯,這也使得訊飛輸入法成為中文與外語(yǔ)互譯最多的輸入法產(chǎn)品。

不得不說,語(yǔ)音輸入已經(jīng)越來(lái)越受歡迎。艾媒《2019-2020中國(guó)第三方手機(jī)輸入法市場(chǎng)監(jiān)測(cè)報(bào)告》顯示,29%的受訪者表示2019年使用語(yǔ)音輸入的頻率明顯增加,是增長(zhǎng)最快的輸入方式。

面對(duì)輸入方式的變遷,訊飛輸入法、百度輸入法、搜狗輸入法三大輸入法,也一直在圍繞AI技術(shù)不斷加碼語(yǔ)音輸入服務(wù),使其不斷實(shí)現(xiàn)準(zhǔn)確率的突破,比如訊飛輸入法的語(yǔ)音識(shí)別準(zhǔn)確率已經(jīng)高達(dá)98%。

輸入法越來(lái)越智能的背后,各家的AI技術(shù)加持至為關(guān)鍵。而面對(duì)每天數(shù)億次甚至數(shù)十億次的使用需求,今天的輸入法產(chǎn)品已經(jīng)嵌滿了令人意想不到的五彩黑科技。

輸入法的重?fù)?dān)

輸入法越來(lái)越智能的代價(jià),就是要背負(fù)越來(lái)越重的使命。追溯市面上幾款主流輸入法產(chǎn)品的發(fā)展歷史,可以發(fā)現(xiàn)這些產(chǎn)品已經(jīng)不年輕,至少都有十年或以上的產(chǎn)品迭代時(shí)間。以此推算,輸入法產(chǎn)品與移動(dòng)互聯(lián)網(wǎng)的發(fā)展同步,可以說是跟著移動(dòng)互聯(lián)網(wǎng)一路走來(lái)的。

最早的輸入法,不論是設(shè)備自帶輸入法,還是第三方輸入法,功能普遍比較簡(jiǎn)單,比如只支持9鍵和26鍵鍵盤輸入、手寫輸入等非智能機(jī)時(shí)代沿襲的輸入方式,主要是為了滿足最普遍的用戶需求。

但移動(dòng)社交、移動(dòng)趨勢(shì)的明晰,以及智能手機(jī)的普及,徹底改變了輸入法產(chǎn)品們的發(fā)展路徑。個(gè)人用戶在多元場(chǎng)景下不斷衍生出更多的輸入需求,開始特別注意到輸入體驗(yàn)的進(jìn)步,希望更快和更好,比如能否根據(jù)拼音首字母快速預(yù)測(cè)想打的字。特別是在移動(dòng)社交場(chǎng)景下,個(gè)人用戶使用輸入法的頻率越來(lái)越高,用戶對(duì)輸入法體驗(yàn)的感知非常明顯,輸入法好不好用,效率高不高,用戶其實(shí)心知肚明。

這讓輸入法的擔(dān)子越來(lái)越重,原本定位于輕服務(wù)工具的輸入法,不得不開始思考如何滿足不同用戶不同場(chǎng)景下的個(gè)性化需求。于是,為巨大體量的用戶大規(guī)模同步提供優(yōu)質(zhì)的輸入服務(wù),成為輸入法產(chǎn)品們發(fā)展的核心目標(biāo)。

愈發(fā)全能的輸入法

場(chǎng)景和需求之變,不斷倒逼著輸入法產(chǎn)品的進(jìn)化,結(jié)果就是,輸入法變得越來(lái)越全能,越來(lái)越精致,越來(lái)越個(gè)性。以目前的三大輸入法產(chǎn)品為例,十年前的它們與十年后的它們,已經(jīng)“判若兩人”。

一方面,不斷的功能增加使得產(chǎn)品能夠適應(yīng)許多輸入場(chǎng)景。除了傳統(tǒng)的手寫和鍵盤輸入外,三大輸入法還加入了OCR掃描、智能預(yù)測(cè)/糾錯(cuò)等功能。其中,OCR掃描指的是用戶可以通過掃描將圖片或手寫稿轉(zhuǎn)換成文字,而智能預(yù)測(cè)功能則可以提前根據(jù)輸入拼音預(yù)測(cè)用戶想打的字,智能糾錯(cuò)則可以根據(jù)詞庫(kù)、語(yǔ)境快速糾正用戶的錯(cuò)誤。

各種功能的豐富,使得輸入法可以服務(wù)于用戶的全輸入過程,在輸入前、中、后每個(gè)環(huán)節(jié)提供對(duì)應(yīng)的服務(wù)。

另一方面,產(chǎn)品能力的極限突破為用戶帶來(lái)了全面的體驗(yàn)。以從語(yǔ)音起家的訊飛輸入法為例,目前訊飛輸入法已經(jīng)做到了一分鐘400字的輸入速度,以及語(yǔ)音識(shí)別準(zhǔn)確率達(dá)98%的水平,也就是說整段輸入的出錯(cuò)率非常小,為用戶帶來(lái)的是極速和流暢的綜合輸入體驗(yàn)。

可以說,這些功能所達(dá)到的極限顛覆了以往低效低質(zhì)的輸入體驗(yàn),從感官上彌補(bǔ)了用戶對(duì)輸入法的體驗(yàn)缺乏。

黑科技成就輸入法

無(wú)論是功能上的全能,還是體驗(yàn)上的全能,輸入法產(chǎn)品能夠?qū)崿F(xiàn)質(zhì)變,甚至能夠適應(yīng)一些極限和極端的輸入場(chǎng)景,除了產(chǎn)品本身的創(chuàng)新外,不斷的技術(shù)迭代是最核心的原因。用戶之所以能夠只花一半的時(shí)間完成整個(gè)輸入過程,都依賴于輸入法們背后的黑科技。

訊飛輸入法可以說是“科技成就輸入法”的最佳代言人。一方面,其背靠有20多年智能語(yǔ)音技術(shù)沉淀的科大訊飛,已有20萬(wàn)小時(shí)訓(xùn)練數(shù)據(jù)積累;另一方面,科大訊飛有太多的國(guó)際賽事頂尖榮譽(yù),比如在2018年由國(guó)際計(jì)算語(yǔ)言學(xué)協(xié)會(huì)(ACL)下屬組織主辦的第十二屆國(guó)際語(yǔ)義評(píng)測(cè)比賽(SemEval2018)中,科大訊飛斬獲了基于常識(shí)的機(jī)器閱讀理解全球第一;2018年的國(guó)際權(quán)威英文語(yǔ)音識(shí)別大賽“CHiME-6”中,科大訊飛包攬了兩項(xiàng)第一名;2019年在ICDAR2019舉辦的場(chǎng)景文本視覺問答挑戰(zhàn)賽ST-VQA中,科大訊飛包攬了三項(xiàng)冠軍;2020年初在德國(guó)The 20BN-Jester Dataset手勢(shì)識(shí)別評(píng)測(cè)中,科大訊飛以97.26%的準(zhǔn)確率斬獲冠軍,且刷新了世界紀(jì)錄……訊飛輸入法背后的黑科技可以從四方面來(lái)看。

一、語(yǔ)音輸入

語(yǔ)音輸入講究快速和準(zhǔn)確,訊飛輸入法之所以能達(dá)到一分鐘400字、識(shí)別準(zhǔn)確率98%的水平,主要在于其自研的“記憶增強(qiáng)的多通道全端到端語(yǔ)音識(shí)別框架”,這項(xiàng)技術(shù)簡(jiǎn)單來(lái)說就是能夠完全將前端語(yǔ)音處理過程深度學(xué)習(xí)化,并使用深度卷積神經(jīng)網(wǎng)絡(luò)和后端識(shí)別模型進(jìn)行混合訓(xùn)練,從而大大提高了語(yǔ)音識(shí)別的效率。

至于能夠使用23種方言進(jìn)行精準(zhǔn)語(yǔ)音輸入,一方面要靠通過多方言共享方式訓(xùn)練的Multi-lingual多語(yǔ)言建模技術(shù),另一方面要靠GlobalPhone全球音素集,這項(xiàng)技術(shù)從聲學(xué)層面的相似性來(lái)統(tǒng)一各方言的音素定義,使方言“語(yǔ)圖譜”模型進(jìn)一步精進(jìn),從而使得方言識(shí)別效果有效提升。多語(yǔ)種互譯功能則對(duì)技術(shù)提出了更大的挑戰(zhàn)性,以中英互譯為例,訊飛輸入法基于對(duì)抗樣本訓(xùn)練方法提出了融合副語(yǔ)言特征的“高魯棒性語(yǔ)音翻譯技術(shù)”,并在模型中結(jié)合特定技術(shù),有效提高了最終翻譯結(jié)果。

二、拼音輸入

在拼音輸入上,訊飛輸入法創(chuàng)新性引入了Encoder-Decoder框架,構(gòu)建了新一代拼音識(shí)別引擎,極大簡(jiǎn)化了傳統(tǒng)拼音識(shí)別模型,同時(shí)在Attention機(jī)制和長(zhǎng)短期記憶網(wǎng)絡(luò)的門控機(jī)制,以及Transformer等模塊的共同作用下,長(zhǎng)句輸入識(shí)別效果有效提升,能夠提前預(yù)測(cè)用戶想輸入的內(nèi)容,還能有效實(shí)現(xiàn)智能糾錯(cuò)。

此外,這一模型由于采用的是序列建模,建模不再依賴詞典,更易實(shí)現(xiàn)中英文混合建模,因而讓訊飛輸入法在中英混輸上實(shí)現(xiàn)了非常出色混輸表現(xiàn)。值得注意的是,不論是智能預(yù)測(cè),還是智能糾錯(cuò),背后都有可實(shí)時(shí)更新的百萬(wàn)詞庫(kù)。

三、手寫輸入

同樣是手寫,體驗(yàn)卻完全不一樣,這是因?yàn)橛嶏w輸入法的手寫識(shí)別可支持兩萬(wàn)多類中文字符、52類英文字符、10類阿拉伯?dāng)?shù)字以及100多種特殊符號(hào),這種超級(jí)識(shí)別能力的背后,是訊飛輸入法的“HWR手寫識(shí)別技術(shù)”,這項(xiàng)技術(shù)采用的是CNN卷積神經(jīng)網(wǎng)絡(luò)技術(shù),可支持實(shí)時(shí)手寫軌跡,邊寫邊出字,而且單個(gè)字符識(shí)別僅需15ms,響應(yīng)迅速無(wú)延遲。

四、掃描輸入

掃描輸入的技術(shù)支撐是計(jì)算機(jī)視覺,面對(duì)復(fù)雜的手寫文字、中英混合文字,“OCR文字檢測(cè)技術(shù)”可檢測(cè)任意方向和形狀的文字,“OCR文字識(shí)別技術(shù)”則可以有效緩解因環(huán)境問題造成的識(shí)別效果低下問題。

綜上,基于AI和大數(shù)據(jù)的組合技術(shù),如今的輸入法不再死板堅(jiān)硬,即使面對(duì)輸入場(chǎng)景的復(fù)雜需求,也能夠在不同語(yǔ)種、不同語(yǔ)境、不同語(yǔ)調(diào)下滿足不同用戶的需求。過去的輸入法只能輔助,而現(xiàn)在,科技加持下的輸入法,更像是一個(gè)“一站式”的輸入管家。

輸入法的智能普惠

黑科技成就了輸入法,也成就了輸入法的地位。根據(jù)相關(guān)報(bào)告提供的數(shù)據(jù),以三大輸入法為代表的第三方輸入法,已經(jīng)覆蓋了超過90%的中國(guó)網(wǎng)民。

要是放大到整個(gè)輸入法行業(yè),可以說人人都是輸入法的受益者,移動(dòng)設(shè)備也好,個(gè)人電腦也好,日常交流必然離不開輸入法的幫助??梢哉f,輸入法已經(jīng)成為一個(gè)互聯(lián)網(wǎng)溝通的基礎(chǔ)設(shè)施。而且值得慶幸的是,訊飛輸入法等頭部產(chǎn)品在技術(shù)上的進(jìn)化,讓這個(gè)基礎(chǔ)設(shè)施不斷產(chǎn)生質(zhì)變,越來(lái)越智能。

應(yīng)該說,像訊飛輸入法這樣始終癡迷于“科技驅(qū)動(dòng)”的輸入法產(chǎn)品,是輸入法作為工具產(chǎn)品在價(jià)值上得到躍進(jìn)式提升的關(guān)鍵,因?yàn)樗鼈冇眉夹g(shù)無(wú)限拔高了輸入法產(chǎn)品的價(jià)值上限。換言之,訊飛輸入法們的“科技大法”一定程度上改善了整個(gè)互聯(lián)網(wǎng)世界的溝通協(xié)作效率。

技術(shù)無(wú)上限,輸入法產(chǎn)品也無(wú)上限。對(duì)9.04億中國(guó)互聯(lián)網(wǎng)網(wǎng)民而言,黑科技持續(xù)加持下的輸入法工具,會(huì)繼續(xù)為每個(gè)用戶提供獨(dú)一無(wú)二的使用體驗(yàn),真正實(shí)現(xiàn)全方位的智能普惠。

文/劉曠公眾號(hào),ID:liukuang110

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-05-29
人工智能時(shí)代來(lái)襲,輸入法如何決勝下一個(gè)10年
面對(duì)輸入方式的變遷,訊飛輸入法、百度輸入法、搜狗輸入法三大輸入法,也一直在圍繞AI技術(shù)不斷加碼語(yǔ)音輸入服務(wù),使其不斷實(shí)現(xiàn)準(zhǔn)確率的突破,比如訊飛輸入法的語(yǔ)音識(shí)別準(zhǔn)確率已經(jīng)高達(dá)98%。

長(zhǎng)按掃碼 閱讀全文