為何專(zhuān)注語(yǔ)音識(shí)別的科大訊飛會(huì)成為AI領(lǐng)先者?

對(duì)于文字工作者而言,如何將演講者/被采訪人的語(yǔ)音轉(zhuǎn)化為文字是一個(gè)痛點(diǎn)、一個(gè)剛需。求助于速錄員是一個(gè)不錯(cuò)的選擇,尤其是那些專(zhuān)業(yè)領(lǐng)域的速錄員,比如在科技行業(yè),不懂AI或者VR等專(zhuān)業(yè)名詞的速錄員很容易在速記中鬧出笑話。

在今年9月份錘子手機(jī)的發(fā)布會(huì)上,錘子科技產(chǎn)品總監(jiān)朱蕭木秀了一段語(yǔ)音識(shí)別,這也讓科大訊飛的語(yǔ)音識(shí)別技術(shù)一下子增加了眾多“錘粉”。借助語(yǔ)音識(shí)別,原本需要一點(diǎn)點(diǎn)聆聽(tīng)的語(yǔ)音可以轉(zhuǎn)變成快速閱讀的文字,這無(wú)疑是文字工作者的一大福利;但似乎也是速錄員這一職業(yè)的終結(jié)者。

在著名資訊公司麥肯錫最新發(fā)布的一項(xiàng)全球研究發(fā)現(xiàn),約45%的工作可以實(shí)現(xiàn)自動(dòng)化,這將影響到60%的崗位,其中三分之一的工作將被機(jī)器人替代。但與此同時(shí),麥肯錫也安慰人們,技術(shù)變革往往需要幾十年的時(shí)間才能被整個(gè)社會(huì)廣泛接納,人們還有時(shí)間去慢慢適應(yīng)。

不過(guò),語(yǔ)音識(shí)別并非替代速錄員那么簡(jiǎn)單,與人們?cè)谶^(guò)去用文字觸達(dá)虛擬世界的方式不同;未來(lái),人們只需要通過(guò)語(yǔ)音就可以實(shí)現(xiàn)與虛擬世界的連接。因此,專(zhuān)注于語(yǔ)音識(shí)別的科大訊飛更有機(jī)會(huì)成為未來(lái)人工智能大爆發(fā)時(shí)代的領(lǐng)先者。

人類(lèi)正在從文字時(shí)代進(jìn)入語(yǔ)音時(shí)代

計(jì)算機(jī)出現(xiàn)以來(lái),人們與計(jì)算機(jī)之間的交互幾乎都是通過(guò)文字來(lái)實(shí)現(xiàn)。即便是代碼階段,某種程度上也可以看作是文字的交互方式;如今,語(yǔ)音正在替代文字。對(duì)此,“互聯(lián)網(wǎng)女皇”瑪麗· 米克( Mary Meeker )認(rèn)為,語(yǔ)音應(yīng)該是最有效的計(jì)算輸入形式。因?yàn)閷?duì)于消費(fèi)者,語(yǔ)音可以快速溝通、簡(jiǎn)單方便、個(gè)性化并且無(wú)需鍵盤(pán)。

有統(tǒng)計(jì)數(shù)據(jù)顯示,機(jī)器對(duì)語(yǔ)音識(shí)別的正確率從2010年的約70%,提高到2016年的約90%。從這樣的速度看,語(yǔ)音時(shí)代可以說(shuō)已經(jīng)到來(lái),未來(lái)人們與智能終端的交互方式除了傳統(tǒng)的鍵盤(pán)文字輸入,語(yǔ)音將逐漸成為新的主流。

語(yǔ)音技術(shù)時(shí)代的開(kāi)啟,所帶來(lái)的不僅僅是輸入的革命。在科大訊飛輪值總裁胡郁看來(lái),語(yǔ)音技術(shù)將帶來(lái)7個(gè)層面的變革:1、輸入法,2、語(yǔ)音轉(zhuǎn)文字,3、翻譯,4、智能家居,5、自動(dòng)駕駛,6、機(jī)器人,7、教育。

嚴(yán)格來(lái)說(shuō),在不同的領(lǐng)域,語(yǔ)音技術(shù)都是基礎(chǔ)所在,是語(yǔ)音技術(shù)在這些領(lǐng)域的應(yīng)用所帶來(lái)的變革,每一個(gè)領(lǐng)域都不容小覷。以機(jī)器人為例,語(yǔ)音將一改計(jì)算機(jī)時(shí)代的鍵盤(pán)錄入,成為人機(jī)互動(dòng)的主流方式,這里所說(shuō)的機(jī)器人不止是我們常見(jiàn)的人形機(jī)器人,很多時(shí)候,“系統(tǒng)”也可以稱之為機(jī)器人,而且不同的應(yīng)用場(chǎng)景可以誕生出不同類(lèi)型的機(jī)器人,它們都能夠深入應(yīng)用到語(yǔ)音技術(shù)。

在不久的將來(lái),IOT充分普及后,人們無(wú)需再通過(guò)手機(jī)這樣的智能終端與整個(gè)世界連接,只需要借助手表、紐扣等,你只需告訴他們:我想去吃飯,附近有什么好吃的?你就可以迅速獲得回復(fù),機(jī)器會(huì)告訴你附近有哪些好吃的地方,距離多遠(yuǎn),有沒(méi)有優(yōu)惠或者排隊(duì)人數(shù)多少的等信息。當(dāng)你確定去哪里時(shí),系統(tǒng)會(huì)告訴你如何到達(dá)那里,需要多少時(shí)間,并為你安排預(yù)約甚至是提前點(diǎn)菜等等。

不過(guò),我們也大可不必?fù)?dān)心語(yǔ)音會(huì)完全替代文字作為主要的輸入方式,畢竟有很多的應(yīng)用場(chǎng)景里并不適合語(yǔ)音輸入,比如在公共場(chǎng)所,每個(gè)人都在與機(jī)器互相交流、自言自語(yǔ),這樣的場(chǎng)面也是蠻怪異的。

科大訊飛打算成為怎樣的領(lǐng)先者?

嚴(yán)格來(lái)說(shuō),語(yǔ)音技術(shù)在未來(lái)的人工智能時(shí)代更像是一種基礎(chǔ)技術(shù),單純推動(dòng)技術(shù)的發(fā)展和應(yīng)用,最終很有可能只是為其他企業(yè)做嫁衣。如何在語(yǔ)音技術(shù)的基礎(chǔ)上孵化出更多的產(chǎn)品和應(yīng)用,才是像科大訊飛這樣的企業(yè)最大限度挖掘人工智能潛能的關(guān)鍵。

為此,日前科大訊飛基于“訊飛超腦”人工智能最新技術(shù)發(fā)布了一系列新品,包括萬(wàn)物互聯(lián)輸入解決方案、訊飛聽(tīng)見(jiàn)多語(yǔ)種翻譯、智能家居、智能服務(wù)機(jī)器人、智能車(chē)機(jī)、個(gè)性化語(yǔ)音合成、智慧教育等技術(shù)產(chǎn)品,更多是從科大訊飛人工智能技術(shù)在社會(huì)生活的創(chuàng)新應(yīng)用出發(fā)。

在翻譯領(lǐng)域,科大訊飛的中英互譯神器——“曉譯翻譯機(jī)”,可以快速、準(zhǔn)確地實(shí)現(xiàn)了中英口語(yǔ)的即時(shí)互譯,并支持漢維互譯功能,未來(lái)科大訊飛還將為之增加更多語(yǔ)種,實(shí)現(xiàn)不同語(yǔ)言之間的便捷交流。

在汽車(chē)領(lǐng)域,科大訊飛的汽車(chē)智能車(chē)載系統(tǒng)——飛魚(yú)助理,則將遠(yuǎn)場(chǎng)識(shí)別、全雙工、多輪交互、方言識(shí)別等技術(shù)應(yīng)用于汽車(chē),可以在復(fù)雜的行車(chē)環(huán)境中輕松進(jìn)行通訊、導(dǎo)航操作,收聽(tīng)了解多媒體娛樂(lè)信息,對(duì)車(chē)身進(jìn)行控制和信息查詢等服務(wù)。

在智能機(jī)器人領(lǐng)域,科大訊飛的智能客服機(jī)器人——曉曼,更是集合了科大訊飛的語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)義理解和人臉識(shí)別等多種技術(shù),結(jié)合麥克風(fēng)陣列、3D攝像頭、身份證讀卡器、取號(hào)小票機(jī)等外設(shè)應(yīng)用,以語(yǔ)音、觸屏、動(dòng)作等多模態(tài)的交互方式為用戶服務(wù)。

在智能家居領(lǐng)域,科大訊飛的超腦魔盒打造了一個(gè)通過(guò)語(yǔ)音便捷控制家居設(shè)備的智能環(huán)境;而在教育領(lǐng)域,科大訊飛通過(guò)學(xué)業(yè)數(shù)據(jù)采集和教學(xué)過(guò)程性數(shù)據(jù)分析,實(shí)現(xiàn)多維度教學(xué)發(fā)展性評(píng)價(jià)和基于知識(shí)點(diǎn)的學(xué)生個(gè)性化學(xué)習(xí)。

從以上種種可以看出,科大訊飛的野心是以語(yǔ)音技術(shù)這一基礎(chǔ)技術(shù)作為切入點(diǎn),由此衍生出更多的產(chǎn)品和應(yīng)用出來(lái),在幫助人們視線智能生活的同時(shí),謀求更大的市場(chǎng)空間。這也正是科大訊飛所倡導(dǎo)的“人工智能+”,嚴(yán)格來(lái)說(shuō)應(yīng)該叫“語(yǔ)音技術(shù)+”。

不管怎樣,科大訊飛都在一定程度上掌握了語(yǔ)音技術(shù)的“核心科技”,正如科大訊飛董事長(zhǎng)劉慶峰所說(shuō),在人工智能時(shí)代,各細(xì)分領(lǐng)域的創(chuàng)業(yè)英雄更容易成功,只要你有創(chuàng)意、有品位、有感覺(jué),能夠精準(zhǔn)滿足每一個(gè)人的個(gè)性化需求,你就再也不用擔(dān)心被別人的數(shù)據(jù)入口和資金瞬間血洗出場(chǎng)。

本文為科技新媒體“常言道”(微信公眾號(hào):changyandao1)出品,作者丁常彥。原創(chuàng)作品,歡迎轉(zhuǎn)載,轉(zhuǎn)載或引用請(qǐng)注明作者及來(lái)源。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2016-11-25
為何專(zhuān)注語(yǔ)音識(shí)別的科大訊飛會(huì)成為AI領(lǐng)先者?
語(yǔ)音識(shí)別并非替代速錄員那么簡(jiǎn)單,與人們?cè)谶^(guò)去用文字觸達(dá)虛擬世界的方式不同;未來(lái),人們只需要通過(guò)語(yǔ)音就可以實(shí)現(xiàn)與虛擬世界的連接。

長(zhǎng)按掃碼 閱讀全文