“語音進化論”干貨分享:智能語音的前世今生之語音技術(shù)(行業(yè)篇)

9月28日,京東智能在北京京東JD+智能奶茶館舉辦“遇見未來-智能語音進化論”主題分享活動,旨在通過對智能語音技術(shù)、應(yīng)用場景及未來趨勢的分析和討論助推行業(yè)發(fā)展。

會上,靈隆科技首席科學(xué)家湯博士就智能語音技術(shù)的歷史及行業(yè)的發(fā)展進程進行了生動的解析,同時,科大訊飛云平臺事業(yè)部商務(wù)總監(jiān)湯熙、北京小魚兒科技合伙人兼銷售市場副總裁李傳剛、北京方正信息技術(shù)有限公司數(shù)碼外設(shè)事業(yè)部總經(jīng)理余斌、京東智能市場總監(jiān)李俊周等行業(yè)大咖也對智能語音的現(xiàn)狀及未來趨勢進行了圓桌分享。

靈隆科技首席科學(xué)家湯博士

以下是靈隆科技首席科學(xué)家湯博士“智能語音的前世今生”演講實錄

1、軟件、硬件、設(shè)計的發(fā)展成熟促使語音技術(shù)產(chǎn)品化

我們總結(jié)一下語音技術(shù)的發(fā)展歷史,以語音識別為例,其第一個高潮到來?首先是算法的進步,研究人員在算法研究上,比如說,HMM模型、N元文法的提出,在方法論上做了突破。其次是硬件的進步,90年代初服務(wù)器運算水平提高了,90年代中出現(xiàn)了奔騰級的PC機。,算法進步加上運算能力足夠的硬件帶來了語音識別的進步。

第二次高潮的也是如此,首先是DNN在算法上的突破,另外的原因就是GPU的普及,有了GPU以后,才能支撐它的巨大計算量,這兩個因素都是不可或缺的。

當(dāng)然,除此之外,另一個關(guān)鍵是網(wǎng)絡(luò)技術(shù)迅猛發(fā)展,尤其是移動互聯(lián)網(wǎng)的發(fā)展,隨著帶寬的增加,大量的計算可以放在網(wǎng)上,這樣手持設(shè)備可以相對比較簡單,而把大量計算放在云上,而并不影響用戶的體驗。

還有一個巨大的變化,是各個公司對產(chǎn)品設(shè)計、用戶體驗的重視。目前各種產(chǎn)品,不光是語音產(chǎn)品,都講究用戶體驗,對用戶各種需求的挖掘。

軟件、硬件、設(shè)計等的進步,使得語音技術(shù)現(xiàn)在已經(jīng)到了產(chǎn)品化階段,我們看得見,現(xiàn)在已經(jīng)有了一些非常不錯的智能語音的產(chǎn)品,比如說Amazon的Echo、Apple的Siri、谷歌的Home,微軟的小冰,當(dāng)然還有我們的叮咚,還有很多的機器人。

再回到京東,一般的印象是電商,其實京東對人工智能一向是比較看重的,京東認(rèn)為人工智能是大趨勢,所以京東必須順勢而為。我這里列了一下京東在人工智能領(lǐng)域做的部分布局,比如說大數(shù)據(jù)、云,京東的數(shù)據(jù)量非常大,所以要進行用戶畫像等;在圖像處理方面,京東也在做很多的探索;自然語言處理方面,京東有一個JIMI對話機器人,它的核心就是自然語言處理;京東也開始了對VR技術(shù)的研發(fā)投入,以提高用戶體驗;無人機,大家都知道京東在研究用它來送貨;機器人,目前已經(jīng)用在京東的倉庫里;當(dāng)然還有智能硬件,比如說我們的叮咚,京東的微聯(lián),還有一些別的相關(guān)智能硬件。

2、京東和訊飛為什么在一起成立公司?

智能語音是人工智能中比較成熟的技術(shù)之一,而且我們看到,用戶的需求在那里,所以開發(fā)智能語音產(chǎn)品是雙方的共同追求。雙方有各自的優(yōu)勢:京東在市場上,對市場上用戶的把握,供應(yīng)鏈的控制,還有京東有一個微聯(lián),是智能家居的控制平臺,這也是京東的優(yōu)勢。    訊飛在語音技術(shù)上有巨大的優(yōu)勢,,訊飛內(nèi)部對于各種各樣的解決方案,都有大量探索,經(jīng)驗非常成熟,雙方互補性很強,經(jīng)營理念也非常接近。

京東和訊飛從第一次接觸到?jīng)Q定成立合資公司,花的時間不到一個月,效率非常高。

3、為什么第一個產(chǎn)品是叮咚(DingDong)?

我覺得從前面的描述來看,這個是順理成章的事。有語音技術(shù),有音樂內(nèi)容,有微聯(lián)控制平臺。所以說基于這些條件,開發(fā)作為一個智能家居入口的叮咚智能音箱,這就是順理成章的事情。

那么叮咚(DingDong)現(xiàn)在怎么樣呢?我們這么說,叮咚(DingDong)在國內(nèi)智能音箱市場大概占70%的市場。但我們從來不認(rèn)為它只是一個音箱,它應(yīng)該是一個平臺入口,所以說我們和微聯(lián),還和別的一些智能家居的控制平臺也已經(jīng)打通。同時,我們不光是自己做產(chǎn)品,還輸出了方案,比如說和哈曼、飛利浦等合作品牌的音箱也已經(jīng)上市。

同時,我們也在積極建立開放平臺,我們即將上線的開放平臺,就是為了支持把第三方的服務(wù)接進來,比如打車服務(wù)、洗衣服務(wù)、信息查詢服務(wù)等,甚至包括游戲。

最后說一下,對于智能語音產(chǎn)品,不管是京東還是訊飛都覺得這是一個大有可為的領(lǐng)域,技術(shù)上語音已經(jīng)到了產(chǎn)品化的階段,當(dāng)然還有巨大的提高空間,比如說帶口音的識別,甚至是方言,合成方面需要更自然、更有情感。目前深度學(xué)習(xí)的方法用在自然語言理解正在大量投入,但還沒有取得巨大突破,但值得期待。

同時,除了技術(shù)以外,我們也非常注重交互設(shè)計,我們即將推出的AIUI,就是技術(shù)+設(shè)計。很多的用戶都知道,目前使用我們的產(chǎn)品,每次要喚醒它,以后只要喚醒一次就可以了,升級的版本馬上就會推出來,現(xiàn)在正在內(nèi)部測試當(dāng)中。

我們從來沒有把自己看成是純粹的音箱公司,我們給自己制定的產(chǎn)品raodmap就是從智能音箱,到智能家庭助手,最后發(fā)展家庭機器人。

最后,在這個互聯(lián)互通時代,合作是必由之路,我們目前已經(jīng)和很多的內(nèi)容提供商、音箱品牌廠商、家電廠商開展了大量的合作。隨著第三方開放平臺的建立,我們會和更多的伙伴一起共同進步,迎接中國人工智能時代的到來。
 

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-09-29
“語音進化論”干貨分享:智能語音的前世今生之語音技術(shù)(行業(yè)篇)
9月28日,京東智能在北京京東JD+智能奶茶館舉辦“遇見未來-智能語音進化論”主題分享活動,旨在通過對智能語音技術(shù)、應(yīng)用場景及未來趨勢的分析和討論助推行業(yè)發(fā)展。會上,靈隆科技首席科學(xué)家湯博士就智能語音技術(shù)的歷史及行業(yè)的發(fā)展進程進行了生動的解析,同時,科大訊飛云平臺事業(yè)部

長按掃碼 閱讀全文