3月8日,阿里宣布自家的智能音箱銷量已經(jīng)超過千萬,成為中國第一,全球第三的智能手機(jī)廠商。
從Strategy Analytics最新發(fā)布的研究報(bào)告指出,智能音箱是的確是2018年最熱門的消費(fèi)電子產(chǎn)品。
2018年第四季度,全球智能音箱出貨量增長了95%,達(dá)到3850萬臺。超過2017年的全年總出貨量,這種增長率堪比2012年前后的智能手機(jī)。
從市場份額看,國外的亞馬遜與谷歌還有明顯優(yōu)勢,2018年四季度,亞馬遜的銷量是1350萬,谷歌的銷量是1150萬,而中國的阿里、百度、小米銷量都在200萬左右。
有意思的是,如果我們把中國三家廠商每季度的銷量分開來看,就會發(fā)現(xiàn)中國智能音箱增長最快的并不是阿里,而是百度。
百度是全球前五中入場最晚的廠商,到了2018年二季度才開始發(fā)力,但是在短短幾個(gè)月,百度就成為智能音箱的世界級巨頭,這種增長速度是爆炸性的。
智能音箱這款產(chǎn)品始于2014年亞馬遜的Echo,國內(nèi)廠商紛紛仿效,經(jīng)過數(shù)年優(yōu)勝劣汰,阿里和小米到了2018年初已經(jīng)傲視所有國內(nèi)廠商。
百度真正發(fā)力智能音箱是在2018年中,“小度在家“這款全球首款帶屏智能音箱在2018年4月份才公開招募內(nèi)測。
而短短幾個(gè)月,百度的智能音箱就如核彈爆炸一般急速增長,到了2018年底,已經(jīng)是三巨頭之一,而且銷量幾乎與阿里和小米持平。
2019年一季度有春晚的加成,百度拿下一季度銷量第一應(yīng)該不是問題。
百度成立已經(jīng)很多年了,但是它最基本不做硬件,從互聯(lián)網(wǎng)跨界智能硬件,百度在幾個(gè)月內(nèi)就從“青銅“一躍成為“王者“,這個(gè)奇跡是如何創(chuàng)造出來的呢?
一、 厚積而薄發(fā)
智能硬件看似是一個(gè)硬件產(chǎn)品,而實(shí)際上它的核心技術(shù)并不是硬件,而是AI的語音識別與搜索。
語音識別技術(shù)已經(jīng)存在很久了,但是要讓智能音箱有優(yōu)秀的體驗(yàn),不僅僅是正確識別語音就夠了,而是要判別說話者的意圖,給予正確的回應(yīng)。
國內(nèi)很多所謂的智能音箱,只是買了科大訊飛的語音識別技術(shù),而百度的智能音箱核心技術(shù)是自己研發(fā)的。
百度對AI的研發(fā),可以追溯到多年之前。
人工智能科技發(fā)展很早,但是一度遇到瓶頸,難以突破。互聯(lián)網(wǎng)發(fā)展起來之后,人們發(fā)現(xiàn)人工智能科技中深度學(xué)習(xí)技術(shù),可以依靠互聯(lián)網(wǎng)的大數(shù)據(jù)不斷進(jìn)步,同時(shí)硬件的發(fā)展,特別是GPU通用計(jì)算的發(fā)展,讓計(jì)算能力不再是瓶頸,AI有了進(jìn)一步發(fā)展的可能。
于是,百度在硅谷等地成立實(shí)驗(yàn)室,投入重金,招募全球最好的AI專家,搭建百度大腦,開始AI的深度研發(fā)。
早在2014年(亞馬遜推出Echo之前),百度的研發(fā)團(tuán)隊(duì),就利用深度學(xué)習(xí)技術(shù),研發(fā)出Deep Speech系統(tǒng)。
到了2016年,百度的Deep Speech系統(tǒng)已經(jīng)進(jìn)化到第三代。
傳統(tǒng)上,對語音識別的人工智能技術(shù)是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))。RNN是在DNN(深度神經(jīng)網(wǎng)絡(luò))的基礎(chǔ)上發(fā)展出時(shí)間戳,發(fā)展出長短時(shí)記憶單元,可以有解決時(shí)間序列的應(yīng)用。語音識別是有時(shí)間序列的,所以業(yè)界對RNN用于語音識別的研究比較多。
而百度將深層卷積神經(jīng)網(wǎng)絡(luò)技術(shù)(Deep CNN)應(yīng)用于語音識別聲學(xué)建模中,將其與基于長短時(shí)記憶單元(LSTM)和連接時(shí)序分類(CTC)的端對端語音識別技術(shù)相結(jié)合,大幅度提升語音識別產(chǎn)品性能。這項(xiàng)技術(shù)借鑒了圖像識別在近些年的成果,以及語音與圖像在利用 CNN 模型訓(xùn)練的共通性,在語音識別技術(shù)上取得了革命性的進(jìn)展。
《麻省理工科技評論》(MIT Technology Review)雜志在2016年度十大突破技術(shù)的榜單中把百度語音識別技術(shù)列為十大突破技術(shù)。
實(shí)際上早在2016年,百度已經(jīng)有了頂尖的語音識別技術(shù)。李彥宏在百度科技大會的上發(fā)言可以由AI同聲傳譯。李彥宏在Tech World大會上展示了AI與人的多輪對話。這些展示,遠(yuǎn)遠(yuǎn)超過市面上在售的智能音箱所擁有的水平,百度只是缺少一款轉(zhuǎn)化的產(chǎn)品。
12下一頁>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )