2019年的第一個(gè)工作日,云知聲創(chuàng)始人、CEO黃偉以一句“少有人走的路”,為其多模態(tài)AI芯片戰(zhàn)略拉開帷幕。
2014年人工智能還遠(yuǎn)未如此火熱,黃偉在面向B端市場的商業(yè)探索中,就意識(shí)到算力、算法結(jié)合在一起的重要性,于是確定了“云端芯”一體化的戰(zhàn)略,并于2015年啟動(dòng)自研AI芯片。
在AI前夜的那個(gè)節(jié)點(diǎn)來看,作為一家剛成立2年的創(chuàng)業(yè)公司,云知聲當(dāng)時(shí)的策略無疑飽受質(zhì)疑。
然而隨著阿爾法狗(AlphaGo)戰(zhàn)勝世界頂級(jí)圍棋選手李世石后,AI浪潮襲來,并逐漸落地走向應(yīng)用。2018年在場景驅(qū)動(dòng)、中美貿(mào)易摩擦的背景下,AI芯片走向時(shí)代前臺(tái)。
歷時(shí)3年,云知聲也終于2018年5月推出第一款語音AI芯片雨燕,交出造芯答卷。而2019年,云知聲將在云端芯戰(zhàn)略的基礎(chǔ)上再邁進(jìn)一步,并提出多模態(tài)AI芯片的構(gòu)想。
先行業(yè)一步提出多模態(tài)AI芯片戰(zhàn)略,這背后是云知聲怎樣的思考,這一構(gòu)想又能否引領(lǐng)云知聲下一階段的發(fā)展?
一、多模態(tài)AI芯片戰(zhàn)略浮出水面
過去6年來,云知聲大概走過了四個(gè)階段,2012~2014年即剛成立的前兩年,布局算法平臺(tái)構(gòu)建技術(shù)優(yōu)勢(shì);緊接著云知聲確立“云端芯”一體化的策略,并啟動(dòng)自研AI芯片;到了2017~2018年云知聲加速AI的商業(yè)擴(kuò)展和應(yīng)用,并推出首款語音AI芯片雨燕。
站在2019年的起跑線上,黃偉稱,接下來就是依托云知聲的AI算法與AI芯片構(gòu)建場景優(yōu)勢(shì)。而構(gòu)建場景優(yōu)勢(shì)的關(guān)鍵就在于多模態(tài)AI芯片戰(zhàn)略。
之所以提出這一戰(zhàn)略,黃偉重點(diǎn)講述了他面向5G與AIoT的思考。他認(rèn)為,5G將推動(dòng)行業(yè)產(chǎn)生質(zhì)變,引發(fā)連接大爆炸、應(yīng)用大爆炸,尤其是工業(yè)領(lǐng)域。
可以預(yù)見,隨著5G的到來,語音、圖像、視頻等多維數(shù)據(jù)將會(huì)海量增長,此時(shí)多維數(shù)據(jù)的處理能力成為剛需。
與此同時(shí),IoT場景下AI應(yīng)用對(duì)于端云互動(dòng)有著強(qiáng)需求,強(qiáng)大的云會(huì)讓端側(cè)能力更強(qiáng),而強(qiáng)大的端則可提升數(shù)據(jù)處理的實(shí)時(shí)性和有效性,進(jìn)而增強(qiáng)云的能力。
在多維數(shù)據(jù)處理能力與邊緣計(jì)算的需求下,具備更強(qiáng)算力的多模態(tài)AI芯片就成為了場景的關(guān)鍵競爭力之一。
黃偉指出,面向5G場景,只有更強(qiáng)的算力還不夠,還需要有深入場景提供服務(wù)的能力,并在此基礎(chǔ)上對(duì)傳統(tǒng)SOC(System On Chip,片上系統(tǒng))做了進(jìn)一步的解讀。
他認(rèn)為,S應(yīng)該代表不同的 AI 服務(wù)能力即 Skills,O 代表云端與邊緣側(cè)的互動(dòng) On/Off Cloud,C 代表具備智能處理能力的 AI 芯片。
從云端芯一體化,到多模態(tài)AI芯片戰(zhàn)略,再到對(duì)SoC全新的理解,云知聲對(duì)AI芯片的理解和布局都保持著行業(yè)領(lǐng)先性。
二、戰(zhàn)略背后是多模態(tài)AI技術(shù)的積淀
從2018年開始,多模態(tài)交互就成為業(yè)界研究的一個(gè)重點(diǎn)。簡單來說,模態(tài)可以理解為感官,多模態(tài)交互即是調(diào)用多種感官的交互方式,它跨過了自然語言,其方式也更加貼近人,也代表了AI未來的一個(gè)發(fā)展方向。
云知聲在2019年開年提出多模態(tài)AI芯片戰(zhàn)略,無疑在多模態(tài)探索的道路上又邁出一步,但多模態(tài)不應(yīng)該成為一句口號(hào),而應(yīng)該真正落實(shí)到技術(shù)研發(fā)中。
智東西發(fā)現(xiàn),在語音技術(shù)主賽道外,云知聲在2018年也加緊布局圖像識(shí)別、機(jī)器翻譯等領(lǐng)域,進(jìn)行多模態(tài)技術(shù)的儲(chǔ)備。
去年,在國際權(quán)威人臉識(shí)別標(biāo)準(zhǔn)評(píng)測數(shù)據(jù)庫 LFW 和 MegaFace 上,云知聲團(tuán)隊(duì)研發(fā)的人臉識(shí)別系統(tǒng),在上述兩項(xiàng)標(biāo)準(zhǔn)評(píng)測中,性能分別達(dá)到 99.80%和 98.47%,得分位居業(yè)內(nèi)前列。去年5月份的WMT2018國際機(jī)器翻譯大賽的中英翻譯比賽中,組建不足1年的云知聲機(jī)器翻譯團(tuán)隊(duì),也拿下英中第二、中英第四,綜合第三的優(yōu)異成績。
本次發(fā)布會(huì)上,云知聲聯(lián)合創(chuàng)始人李霄寒進(jìn)一步分享了云知聲在人臉識(shí)別、表情分析、標(biāo)簽化、多目標(biāo)唇動(dòng)狀態(tài)追蹤等視覺AI方面的進(jìn)展,進(jìn)一步儲(chǔ)備多模態(tài)技術(shù)基礎(chǔ)。
另一方面,云知聲還發(fā)布了多模態(tài)人工智能核心 IP——DeepNet2.0,其AI處理能力也有1.0的語音進(jìn)化到2.0的多模態(tài),支持語音、圖像等處理能力。DeepNet2.0可兼容 LSTM/CNN/RNN/TDNN 等多種推理網(wǎng)絡(luò),支持可重構(gòu)計(jì)算與 Winograd 處理,最高可配置算力達(dá) 4T。目前云知聲 DeepNet2.0 已在 FPGA 上得到驗(yàn)證,將在2019年落地多模態(tài)AI芯片海豚(Dolphin)。
可見,在硬件層面與算法層面,云知聲都在儲(chǔ)備多模態(tài)技術(shù),為其多模態(tài)AI芯片的落地打下地基。
三、造芯之路:從云端芯一體化到多模態(tài)AI芯片
2014年,云知聲就確定了“云端芯”的發(fā)展戰(zhàn)略,2015年推出IVM(通用芯片方案),并落地格力、美的、海爾、長虹等一線家電廠商,從客戶需求切入,布局AI芯片更具場景優(yōu)勢(shì)和時(shí)間窗口優(yōu)勢(shì)。
在此基礎(chǔ)上,云知聲在2015年啟動(dòng)AI芯片研發(fā),歷時(shí)3年終于推出第一代語音AI芯片雨燕?;诖?,云知聲又在去年9月推出Turnkey方案,加速雨燕芯片的落地。李霄寒透露,預(yù)計(jì)落地產(chǎn)品最快會(huì)在今年Q1季度面世。
針對(duì)面向物聯(lián)網(wǎng)時(shí)代的AI芯片,云知聲又在2019開年之分享了一些新的思考。李霄寒指出,當(dāng)前物聯(lián)網(wǎng)產(chǎn)品線的 AI 芯片越來越明顯地體現(xiàn)出三個(gè)趨勢(shì):
l場景化。所謂場景化是芯片設(shè)計(jì)要堅(jiān)持場景導(dǎo)向、需求導(dǎo)向,面向垂直領(lǐng)域的具體場景,通過芯片以及解決方案解決實(shí)際場景中的問題。
l端云互動(dòng)。在物聯(lián)網(wǎng)的不同應(yīng)用場景下,海量終端設(shè)備要實(shí)現(xiàn)功能智能化必須端云配合,即形成邊緣算力和云端算力的動(dòng)態(tài)平衡。這意味著從芯片設(shè)計(jì)開始,就要考慮端云互動(dòng)能力。
l數(shù)據(jù)多模態(tài)。在5G驅(qū)動(dòng)的萬物智聯(lián)場景下,數(shù)據(jù)類型由原來的單一化走向多元化,芯片所需處理的數(shù)據(jù)也由單模態(tài)變成多模態(tài)。
以此來看,面向物聯(lián)網(wǎng)終端場景的AI芯片核心是解決垂直場景問題的能力,其呈現(xiàn)形式將不再是一個(gè)單一的硬件,而是承載著邊緣能力與云端能力的多模態(tài)AI軟硬一體解決方案。
在此基礎(chǔ)上,云知聲在多模態(tài)AI芯片戰(zhàn)略的引領(lǐng)下,拋出2019年的AI芯片布局藍(lán)圖,今年將推出3款芯片,搶灘IoT場景。
在去年5月份發(fā)布的雨燕芯片的基礎(chǔ)上,今年云知聲將面向智能語音場景,推出一款適用性更廣的輕量級(jí)AI芯片雨燕Lite,比如可以應(yīng)用在智能開關(guān)、智能燈泡等場景,實(shí)現(xiàn)設(shè)備的智能化,相比第一代其成本也將更低。
面向智慧城市場景,云知聲將推出支持語音和圖像等計(jì)算的多模態(tài)AI芯片海豚(Dolphin),預(yù)計(jì)將在今年Q3季度投產(chǎn)。
面向智慧出行場景,云知聲將與吉利集團(tuán)旗下生態(tài)鏈企業(yè)億咖通科技共同打造車規(guī)級(jí) AI 芯片雪豹(Leopard),預(yù)計(jì)將在2019年Q3/Q4季度投產(chǎn)。
相比行業(yè)其他公司造芯,云知聲的優(yōu)勢(shì)在于自主設(shè)計(jì),尤其是DSP、深度神經(jīng)網(wǎng)絡(luò)處理器都為云知聲自主研發(fā),能夠真正面向場景,使AI芯片滿足真實(shí)場景中的需求。
而AI芯片戰(zhàn)略布局的領(lǐng)先性,雨燕芯片在行業(yè)的率先推出,給了云知聲更多的時(shí)間窗口優(yōu)勢(shì)。把握這一優(yōu)勢(shì),從而率先導(dǎo)入客戶,搶占場景,則更有利于率先在行業(yè)中形成規(guī)模優(yōu)勢(shì)。
今年云知聲再進(jìn)一步,面向語音、視覺、車載等場景再推3款A(yù)I芯片,可見其對(duì)AI芯片的戰(zhàn)略積極且堅(jiān)定,在芯片落地的節(jié)奏上領(lǐng)先行業(yè)。
結(jié)語:場景落地戰(zhàn)剛剛打響!
物聯(lián)網(wǎng)時(shí)代是一個(gè)場景導(dǎo)向的時(shí)代,很難形成PC時(shí)代或者移動(dòng)互聯(lián)網(wǎng)時(shí)代在芯片領(lǐng)域形成一家獨(dú)大的局面,因此業(yè)內(nèi)也有一種觀點(diǎn),物聯(lián)網(wǎng)時(shí)代是應(yīng)用定義算法,算法定義硬件(芯片)。
這一觀點(diǎn)也與云知聲強(qiáng)調(diào)的場景化、端云互動(dòng)不謀而合。以云知聲為代表的AI技術(shù)公司,最早面向行業(yè)場景探索技術(shù)落地,能夠率先發(fā)現(xiàn)場景中客戶的真實(shí)需求,從而定制出更加滿足行業(yè)需求的AI芯片。這也是AI技術(shù)公司布局AI芯片的優(yōu)勢(shì)所在。
從云知聲2019年布局的三款A(yù)I芯片可以看出,輕量版的雨燕Lite面向智能語音場景,成本更低,可以與第一代雨燕(算力更強(qiáng))配合,滿足智慧家庭領(lǐng)域更廣闊的終端設(shè)備。車規(guī)級(jí)的雪豹AI芯片是面向智慧出行領(lǐng)域,多模態(tài)語音和圖像的海豚AI芯片則是面向智慧城市領(lǐng)域。
通過這三款A(yù)I芯片,云知聲正在搭建一整套滿足語音、多模態(tài)、車載等場景的AI芯片能力。
目前AI芯片正處于場景落地的初期,場景的真正需求尚不明確,哪些場景最終能夠成為有潛力的市場也尚需探索。可以看出云知聲的策略是,從自身深耕的智能家居、車載、醫(yī)療、教育出發(fā),快速搭建一整套覆蓋語音、視覺等能力的AI芯片,搭建好能力框架之后,就可以在市場中一面探索場景需求,一面快速基于能力框架量體裁衣,推出更加適合場景需求的AI芯片。
而雨燕Lite這款輕量級(jí)、低成本的語音AI芯片,很有可能就是這一打法下的產(chǎn)物。
無論是在多模態(tài)AI芯片戰(zhàn)略,還是AI芯片的推出、落地速度上,云知聲都走到了行業(yè)前列,但迎接它的是更加艱巨的AI芯片落地戰(zhàn)、卡位戰(zhàn)。
只有經(jīng)受場景與市場的考驗(yàn),真正解決現(xiàn)實(shí)場景的實(shí)際痛點(diǎn),才能真正被行業(yè)與市場認(rèn)可,而這一戰(zhàn)役剛剛打響。
- ChatGPT推出圖片管理功能:AI創(chuàng)作更高效!
- 抵御關(guān)稅沖擊,美國PC市場2025年Q1逆襲:出貨量激增12.6%,庫存量將大增
- 全球電車風(fēng)潮涌動(dòng):中國與歐洲領(lǐng)跑,同比增長29%的電動(dòng)汽車銷量新篇章
- AI編程大勢(shì)所趨:半年內(nèi)90%,一年內(nèi)幾乎全部代碼由AI編寫
- iPhone 17系列機(jī)模意外曝光,小米SU7 Pro交付時(shí)間嚇壞用戶
- 福耀科技大學(xué)獲批,曹德旺回應(yīng):壓力山大,批下來就要做好,求真務(wù)實(shí)才是關(guān)鍵
- 特斯拉Cybertruck新功能:FSD大更新,輕松實(shí)現(xiàn)停車啟動(dòng)、智能召喚與倒車,駕駛更智能!
- 大眾汽車裁員風(fēng)暴來襲:軟件部門Cariad大刀揮向三成崗位,風(fēng)雨飄搖中的裁員序幕?
- 保時(shí)捷扛不住壓力裁員3900人:全球跑車銷量王也難逃經(jīng)濟(jì)寒冬?
- 小米SU7 Pro交付時(shí)間“神話”被打破:承諾變泡影,小米王化緊急回應(yīng)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。