剛剛結(jié)束的百度大腦語音能力引擎論壇,向外界披露了這樣一個數(shù)字:百度大腦的語音能力引擎日均調(diào)用量已經(jīng)超過100億次。
對照國內(nèi)8.54億的網(wǎng)民規(guī)模,平均每個人要和百度大腦的語音能力引擎每天接觸12次,場景涉及輸入法的語音輸入、智能音箱的語音對話、百度地圖的語音導(dǎo)航、與各種機(jī)器人的有趣互動……無論是覆蓋范圍還是使用頻次,早已超過99%的互聯(lián)網(wǎng)服務(wù)。
可能在不少人的印象里,人工智能還是遙不可及的新事物,百度大腦用數(shù)據(jù)告訴了我們這樣一個事實(shí):人工智能并不遙遠(yuǎn),甚至已經(jīng)是生活中不可或缺的一部分。
01 日均調(diào)用100億次的背后
如果僅僅盯著數(shù)字來看,100億不可謂不龐大,也奠定了百度大腦語音應(yīng)用規(guī)模第一的成績。但比數(shù)字本身更有價值的是,百度大腦如何做到語音能力引擎日均調(diào)用量超過100億次的規(guī)模,以及100億次的語音到底“喚醒”了什么?
第一個問題的答案是開放。截止到目前,百度大腦已經(jīng)開放了云、端、芯的全棧全場景語音開放能力,廣泛應(yīng)用于文娛、金融、政務(wù)等多個行業(yè)和場景,開發(fā)者們只需要一個簡單的調(diào)用,即可為產(chǎn)品接入百度大腦的智能語音能力。
而從百度大腦語音能力引擎論壇傳遞的消息來看,百度大腦的語音引擎全新發(fā)布和升級了14大產(chǎn)品內(nèi)容,包括基于百度鴻鵠語音芯片的4款硬件模組、開發(fā)板,針對智能家居、智能車載、智能IoT設(shè)備等端到端的軟硬一體遠(yuǎn)場語音交互場景解決方案,語音自訓(xùn)練平臺、呼叫中心語音解決方案的升級,以及6個在線語音合成精品音庫和5個離線語音合成精品音的發(fā)布。
簡單來說,百度大腦已經(jīng)為語音能力引擎打造了一條應(yīng)用落地的生態(tài)鏈,而且生態(tài)鏈所覆蓋的場景和能力還在不斷拓展。
至于第二個問題的答案,不妨先來看三個具體的應(yīng)用案例。
創(chuàng)維AIoT研究院產(chǎn)品經(jīng)理李凱在演講中談及創(chuàng)維和百度大腦的合作,在百度鴻鵠語音芯片等軟硬件的賦能下,創(chuàng)維為產(chǎn)品增加了語音交互能力,涉及2500萬臺的電視裝機(jī)量,用戶只需要一個語音指令就能找到自己喜歡的電視節(jié)目,讓電視的交互從遙控器直接進(jìn)化到智能語音時代。
北京子杰寶貝科技有限公司將百度大腦的語音能力引擎帶到了醫(yī)療領(lǐng)域,之前60%的醫(yī)護(hù)人員每天要花費(fèi)45分鐘到90分鐘的時間填寫表單數(shù)據(jù)。依靠百度大腦的語音識別、自然語言處理等技術(shù),醫(yī)護(hù)人員如今用語音就能完成表單的錄入。
善行智能在百度大腦的智能語音技術(shù)、智能OCR識別、智能物體識別等技術(shù)的加持下,打造了可以智能識別障礙物、物品、錢幣等物體,并通過語音播報(bào)給用戶的小Q智能導(dǎo)盲眼鏡,幫助盲人群體獨(dú)立的認(rèn)知世界。
誠然,“100億次日均調(diào)用量”的背后是人工智能落地應(yīng)用的生態(tài)圈,為合作伙伴帶來了轉(zhuǎn)型的契機(jī),為醫(yī)護(hù)人員解決了工作的痛點(diǎn),也讓盲人群體感受到了AI的溫暖。而這些僅僅是百度大腦技術(shù)賦能的冰山一角。
02 AI賽道中的“學(xué)霸”人設(shè)
除了智能語音的落地應(yīng)用,百度大腦還在不斷推動語音技術(shù)的發(fā)展,比如百度語音首席架構(gòu)師賈磊提出的基于復(fù)數(shù)CNN網(wǎng)絡(luò)的語音增強(qiáng)和語音識別一體化端到端建模技術(shù),相較于傳統(tǒng)基于數(shù)字信號處理的麥克陣列算法,新技術(shù)的錯誤率降低了30%以上,并且已經(jīng)被集成到最新發(fā)布的百度鴻鵠芯片中。
身為人工智能賽道里的“學(xué)霸”,百度大腦并非是擅長語音技術(shù)的偏科生,而是一個典型的“別人家的孩子”。
在烏鎮(zhèn)智庫出品的《全球人工智能發(fā)展報(bào)告》中,專門羅列了中國AI專利ToP 10的企業(yè),百度以935件的專利數(shù)量,毋庸置疑的成了榜單上的頭名選手,并與騰訊、阿里等同一陣營的玩家們拉開了較大的差距。
在國際權(quán)威研究機(jī)構(gòu)Forrester發(fā)布的計(jì)算機(jī)視覺公有云報(bào)告中,在百度大腦的AI視覺技術(shù)加持下,百度智能云處于中國市場“領(lǐng)導(dǎo)者”領(lǐng)域最上方 ,在數(shù)據(jù)、解決方案、應(yīng)用場景、管理能力等多維度領(lǐng)先于阿里云、騰訊云等廠商。另一份《IDC MarketScape:2019中國AI云服務(wù)市場廠商評估》中,憑借在能力和市場兩個維度的優(yōu)異表現(xiàn),百度智能云同樣位居領(lǐng)導(dǎo)者象限最上方。
在4月初結(jié)束的ICME人臉106關(guān)鍵點(diǎn)檢測比賽中,百度大腦力壓阿里、華為、美團(tuán)、中科大等選手拿到冠軍;6月份的CVPR 2019上,百度大腦又在視頻理解與分析、目標(biāo)檢測、圖像超分辨、智能城市車輛識別、人臉&人體檢測等領(lǐng)域斬獲了10項(xiàng)冠軍;11月份的ICCV 2019上,百度大腦視覺團(tuán)隊(duì)以mAP值57.13%的成績奪得人臉檢測的冠軍,超過第二名0.47%……
如果從時間上看,2016年百度大腦對外開放至今不過三年時間,縱然離不開百度長期的技術(shù)積累,這么短時間里的全面開花無疑佐證了百度大腦的“學(xué)霸”人設(shè)。這樣的成長速度與百度的技術(shù)基因、工程師文化等不無關(guān)系,或許還有另外一重原因。
2017年的時候,就有人將中美在人工智能賽道中的角色比作星球大戰(zhàn)里的Luke和Darth Vader,甚至為雙方進(jìn)行了“戰(zhàn)力”對比:美國AI公司的數(shù)量比中國高出1.82倍,流向美國的資金份額比中國高1.54倍,美國的AI人才庫亦是中國的2.01倍……美國在人工智能領(lǐng)域的強(qiáng)力基礎(chǔ),有賴于Google、亞馬遜、IBM、微軟等先行者,中國人工智能的擔(dān)子自然就落到了BAT身上。
某種程度上說,“學(xué)霸”百度大腦還肩負(fù)著抹平中美AI力量鴻溝的義務(wù),而從一系列國際賽事上的表現(xiàn)、國際權(quán)威機(jī)構(gòu)的認(rèn)證來看,百度大腦也是中國AI領(lǐng)域當(dāng)之無愧的頭雁,構(gòu)建起AI的全棧技術(shù)布局,平等的賦能每一位開發(fā)者,將是百度大腦現(xiàn)在和未來身體力行的使命所在。
03 百度大腦在持續(xù)刷新
百度首席技術(shù)官王海峰在百度大腦語音能力引擎論壇講到進(jìn)化和賦能:“AI技術(shù)的進(jìn)化和產(chǎn)業(yè)賦能正向循環(huán),相互促進(jìn),AI在應(yīng)用場景中不斷進(jìn)化。”可以理解為這就是百度大腦對自身的使命,也促使百度大腦在持續(xù)“刷新”。
猶記得2016年的百度世界大會上,李彥宏用了相當(dāng)長的篇幅來講述這個“新概念”,彼時還只是記住了“百度大腦”這個名字,至于會產(chǎn)生什么樣的影響,恐怕很多人并沒有答案。然而短短三年的時間里,百度大腦早已成了生活中的一部分,百度輸入法的語音輸入,入住酒店時的刷臉認(rèn)證,農(nóng)田里的遙感無人機(jī),工廠里的智能零件分揀……在那些看得到和看不見的生產(chǎn)生活場景中,都有著百度大腦的身影。
截止到目前,百度大腦已經(jīng)開放了228項(xiàng)AI能力,擁有超過150萬的開發(fā)者用戶,當(dāng)年李彥宏對百度大腦的寄托已經(jīng)逐步實(shí)現(xiàn)。但百度大腦并沒有止步于此,在完成AI能力與應(yīng)用場景融合創(chuàng)新的第一步后,百度大腦在5.0升級時被定義為“軟硬一體的AI大生產(chǎn)平臺”,讓AI邁入產(chǎn)業(yè)世界與工業(yè)大生產(chǎn)進(jìn)行融合。
與之對應(yīng)的是,語音技術(shù)推出了風(fēng)格遷移的語音合成技術(shù),僅需20句話就可以制作一個人的專屬聲音;視覺方面形成了適用于不同應(yīng)用場景的技術(shù)矩陣,諸如車輛識別、物體識別、風(fēng)格轉(zhuǎn)化、人流量統(tǒng)計(jì)等等;語言與知識方面,構(gòu)建了世界上最大的多元異構(gòu)知識圖譜……除了技術(shù)能力的刷新,百度還將算力、算法和數(shù)據(jù)打通,以百度智能云為依托,以百度大腦為核心,以飛槳為基礎(chǔ)底座,為各行各業(yè)的智能化轉(zhuǎn)型升級提供強(qiáng)有力的支撐。
市場的反映也印證了百度的正確性,僅以百度大腦人臉公有云服務(wù)為例,公有云日均調(diào)用量超過1億,開發(fā)者超過13萬,用戶使用規(guī)模穩(wěn)居業(yè)界第一。并且百度大腦在人臉識別領(lǐng)域積累了1000多家合作伙伴,落地了超過10萬個項(xiàng)目,形成了豐富、完整的人臉產(chǎn)品矩陣。
同樣“刷新”的還有百度大腦的人才體系。就在不久前,著名的計(jì)算機(jī)和大數(shù)據(jù)理論領(lǐng)域?qū)<襃effrey Vitter加入到百度研究院顧問委員會,美國俄勒岡大學(xué)教授竇德景也加盟百度研究院擔(dān)任大數(shù)據(jù)實(shí)驗(yàn)室主任。從世界級科學(xué)家組成的頂級智囊,到百度龐大的一線工程師,百度大腦在為行業(yè)賦能,驅(qū)動AI走進(jìn)工業(yè)大生產(chǎn)時代的同時,也在不斷將AI技術(shù)做透、做精、做深。
“刷新”是百度大腦的底色,也是持續(xù)修煉內(nèi)功讓AI走進(jìn)真實(shí)世界的態(tài)度。
04 寫在最后
從2016到2019,人們對AI的理解已經(jīng)不再局限于圍棋大戰(zhàn),可在談?wù)揂I的時候,核心算法上的瓶頸仍然是不少開發(fā)者的錐心之痛。百度大腦就像一個扛著挑戰(zhàn)一路向前的勇士,在每一個關(guān)鍵節(jié)點(diǎn)上為業(yè)界開辟出一條條新路。
讀懂了這一點(diǎn),語音能力引擎的100億次日均調(diào)用,注定只是百度大腦的一個小目標(biāo),因?yàn)椤白岄_發(fā)者平等地獲取AI能力”這條路本就沒有終點(diǎn)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。