原標(biāo)題:國(guó)產(chǎn)手機(jī)的AI視覺(jué)革命
最近,在仔細(xì)琢磨了兩大巨頭蘋(píng)果和谷歌發(fā)布的旗艦手機(jī)之后,老冀對(duì)國(guó)產(chǎn)手機(jī)的未來(lái)前景有了一份擔(dān)憂(yōu)。
從表面上看起來(lái),現(xiàn)在國(guó)產(chǎn)手機(jī)是形勢(shì)一片大好:全球前10大智能手機(jī)廠(chǎng)商中有7家國(guó)產(chǎn)廠(chǎng)商,前5大中則有3家國(guó)產(chǎn)品牌,這3家加起來(lái)的市場(chǎng)份額已經(jīng)超過(guò)了三星+蘋(píng)果兩大國(guó)際品牌,有什么好擔(dān)憂(yōu)的?
AI加持下的視覺(jué)應(yīng)用:手機(jī)的未來(lái)戰(zhàn)場(chǎng)
殊不知正所謂“盛極必衰”,尤其是“盛世”的基礎(chǔ)并不牢固的時(shí)候。舉個(gè)別的行業(yè)的例子。2003年年底的時(shí)候,中國(guó)彩電行業(yè)可謂達(dá)到了頂峰,當(dāng)時(shí)TCL通過(guò)收購(gòu)法國(guó)湯姆遜的彩電業(yè)務(wù)成為僅次于三星的全球第二,康佳、長(zhǎng)虹、海信、創(chuàng)維等其他國(guó)產(chǎn)廠(chǎng)商也都如日中天。結(jié)果呢?隨著彩電從CRT向LCD的技術(shù)變革,國(guó)產(chǎn)彩電廠(chǎng)商很快又被韓國(guó)廠(chǎng)商拋在了后面。
其實(shí),當(dāng)年國(guó)產(chǎn)手機(jī)也經(jīng)歷過(guò)同樣的事情。2012年的時(shí)候,國(guó)產(chǎn)手機(jī)中涌現(xiàn)了中華酷聯(lián)、天宇、金立等眾多知名品牌;而到了今天,除了華為仍然傲立潮頭之外,其他國(guó)產(chǎn)手機(jī)品牌集體掉了隊(duì)。
因此,老冀認(rèn)為,雖然目前國(guó)產(chǎn)手機(jī)看似不錯(cuò),實(shí)則面臨技術(shù)升級(jí)的巨大挑戰(zhàn),而這個(gè)挑戰(zhàn)來(lái)自于一項(xiàng)偉大的技術(shù)變革,它就是人工智能(AI)。
實(shí)際上,從蘋(píng)果和谷歌發(fā)布的智能手機(jī)新品上,我們已經(jīng)看到了AI的巨大威力:iPhone X將3D結(jié)構(gòu)光與AI緊密結(jié)合起來(lái),實(shí)現(xiàn)了3D頭像和刷臉支付,并為AR/VR應(yīng)用做好了準(zhǔn)備,而國(guó)產(chǎn)手機(jī)直到一年之后才推出了類(lèi)似的功能。谷歌前不久剛剛發(fā)布的Pixel 3,雖然只搭載了一顆1220萬(wàn)像素的后置單攝,卻能夠借助谷歌獨(dú)有的AI能力,拍照水平照樣吊打眾多配備了雙攝甚至三攝的國(guó)產(chǎn)旗艦手機(jī)。
這說(shuō)明了什么?說(shuō)明智能手機(jī)的競(jìng)爭(zhēng)焦點(diǎn)已經(jīng)從國(guó)產(chǎn)手機(jī)廠(chǎng)商最擅長(zhǎng)的堆砌硬件、美化UI、追求性?xún)r(jià)比轉(zhuǎn)向了AI能力。老冀認(rèn)為,如果國(guó)產(chǎn)手機(jī)廠(chǎng)商到現(xiàn)在還沒(méi)有認(rèn)識(shí)到AI的重要性,下一輪又將集體掉隊(duì)。
老冀注意到,10月19日,知名研究機(jī)構(gòu)IDC聯(lián)合曠視科技發(fā)布了一份白皮書(shū)《AI+手機(jī):“視”界革命》(以下簡(jiǎn)稱(chēng)“《AI+白皮書(shū)》”)。IDC對(duì)中國(guó)2018年上半年出貨量前100名的手機(jī)型號(hào)(占中國(guó)上半年智能機(jī)出貨量的91%)共計(jì)1.6億部手機(jī)進(jìn)行分類(lèi)統(tǒng)計(jì),其中提供AI功能的手機(jī)占比已經(jīng)接近90%。這也說(shuō)明,AI手機(jī)正在成為市場(chǎng)主流。
那么,AI在智能手機(jī)上都有哪些應(yīng)用?《AI+白皮書(shū)》的消費(fèi)者調(diào)查發(fā)現(xiàn),視覺(jué)應(yīng)用(包括美顏、夜景攝影、立體成相、增強(qiáng)現(xiàn)實(shí)等)是手機(jī)AI應(yīng)用中最主要的訴求。
2017年《IDC Consumerscape 360°》調(diào)研更是顯示,51%的用戶(hù)會(huì)將拍照作為購(gòu)買(mǎi)手機(jī)的七大選擇因素之一。
視覺(jué)應(yīng)用的“關(guān)鍵四環(huán)”
由此可見(jiàn),視覺(jué)應(yīng)用正在成為提升用戶(hù)體驗(yàn),影響用戶(hù)購(gòu)買(mǎi)行為的重要指標(biāo)。那么,在這場(chǎng)關(guān)系到未來(lái)的AI視覺(jué)應(yīng)用的競(jìng)爭(zhēng)中,國(guó)產(chǎn)手機(jī)如何才能把握住自己的命運(yùn)?
《AI+白皮書(shū)》認(rèn)為,想要給最終用戶(hù)帶來(lái)超預(yù)期的視覺(jué)體驗(yàn),需要產(chǎn)業(yè)鏈的協(xié)同發(fā)展。視覺(jué)技術(shù)的推陳出新,與產(chǎn)業(yè)鏈的發(fā)展緊密相連,“應(yīng)用”、“算法”、“解決方案”、“硬件”這“關(guān)鍵四環(huán)”中任何一環(huán)的短板都會(huì)使技術(shù)創(chuàng)新的價(jià)值大打折扣。下面,讓我們具體看一下這“關(guān)鍵四環(huán)”都是什么:
1. 應(yīng)用:目前主要包括識(shí)別與認(rèn)證、AI攝影、3D感知。此外,通過(guò)3D鏡頭(傳感器)、增強(qiáng)算法、算力(AI芯片)和視覺(jué)解決方案的整合,AI手機(jī)可以實(shí)現(xiàn)美體、整形、虛化、光效、超級(jí)夜攝、標(biāo)簽等多種拍攝功能,讓用戶(hù)使用手機(jī)就可以拍出來(lái)專(zhuān)業(yè)相機(jī)和專(zhuān)業(yè)攝影師的水準(zhǔn),拓展更多創(chuàng)造性的應(yīng)用。
2. 算法:算法是應(yīng)用的靈魂,算法的優(yōu)劣決定著應(yīng)用體驗(yàn)的差異。目前,計(jì)算機(jī)視覺(jué)普遍采用基于深度學(xué)習(xí)的算法,它彌補(bǔ)了手工設(shè)計(jì)特征的缺陷,非線(xiàn)性變換可以做非常多次,特征表示能力顯著提高,并且可以自動(dòng)地訓(xùn)練所有參數(shù),大幅提升了視覺(jué)算法的效率。此外,手機(jī)由于受到成本、外觀(guān)、電池容量、供應(yīng)鏈等多種因素的限制,需要保持性能、體驗(yàn)和價(jià)格的平衡,這對(duì)算法提出了更高的要求。
3. 解決方案:解決方案層更多地是為硬件層提供支撐。隨著視覺(jué)應(yīng)用的場(chǎng)景化,不同的場(chǎng)景需要不同的視覺(jué)解決方案,底層算法需要根據(jù)不同的應(yīng)用場(chǎng)景提供深度計(jì)算、深度修復(fù)、深度優(yōu)化、標(biāo)定、畸變校正等不同的能力,并針對(duì)雙攝、三攝、深攝等不同光學(xué)器件提供個(gè)性化的優(yōu)化方案。
4. 硬件:當(dāng)然,所有的視覺(jué)應(yīng)用都必須具備相應(yīng)的硬件才能實(shí)現(xiàn),如芯片、模組、傳感器、光學(xué)組件、結(jié)構(gòu)光器件、TOF器件,等等。
正如《AI+白皮書(shū)》所言,超預(yù)期的視覺(jué)體驗(yàn)需要產(chǎn)業(yè)鏈的協(xié)同發(fā)展,尤其需要國(guó)產(chǎn)手機(jī)廠(chǎng)商和上游AI廠(chǎng)商的通力合作。所幸的是,在大眾創(chuàng)業(yè)、萬(wàn)眾創(chuàng)新的大環(huán)境之下,中國(guó)本土已經(jīng)崛起了一批包括曠視科技在內(nèi)的優(yōu)秀AI廠(chǎng)商,他們正在與國(guó)產(chǎn)手機(jī)廠(chǎng)商、世界領(lǐng)先的芯片廠(chǎng)商及光學(xué)器件、模組廠(chǎng)商通力合作,一起打通視覺(jué)應(yīng)用的“關(guān)鍵四環(huán)”。
AI廠(chǎng)商助攻國(guó)產(chǎn)手機(jī)
老冀注意到,近日第一手機(jī)界研究院發(fā)布了手機(jī)戰(zhàn)報(bào),OPPO Find X成為8月中國(guó)手機(jī)市場(chǎng)上4000元以上最暢銷(xiāo)的安卓手機(jī)。要知道,OPPO Find X是安卓陣營(yíng)第一款真正意義上量產(chǎn)的搭載3D結(jié)構(gòu)光的手機(jī),同時(shí)支持3D人臉解鎖和3D人臉支付,一舉拉高了安卓旗艦手機(jī)標(biāo)準(zhǔn)。
OPPO Find X手機(jī)上的人臉識(shí)別應(yīng)用,就是曠視科技與OPPO研究院上海軟件研究中心AI實(shí)驗(yàn)室通力合作的結(jié)晶。搭載曠視科技3D結(jié)構(gòu)光人臉識(shí)別方案的OPPO Find X可通過(guò)前置的RGB、紅外和結(jié)構(gòu)光攝像頭同時(shí)采集到人臉的色彩圖片、紅外圖片和3D信息,并快速?gòu)妮斎氲娜四樇t外特征信息與深度信息中提取個(gè)人的安全識(shí)別特征,安全特征具有10000+的維度信息,算法會(huì)將提取的安全信息與錄入時(shí)的安全信息進(jìn)行匹配決定是否安全認(rèn)證通過(guò)。在體驗(yàn)上,錄入和解鎖都可以在0.1秒內(nèi)完成,誤識(shí)別率低于百萬(wàn)分之一,且?guī)缀醪皇馨倒猸h(huán)境影響。而在安全性上,曠視給出的3D結(jié)構(gòu)光人臉識(shí)別方案無(wú)論是在解鎖還是支付應(yīng)用中都可以有效抵御照片、視頻甚至定制化硅膠面具和3D打印面具等形式的攻擊。
再舉另一款最近大賣(mài)的國(guó)產(chǎn)手機(jī)vivo X23的例子。這款手機(jī)有一項(xiàng)廣受歡迎的功能——“AI人像”。為滿(mǎn)足對(duì)人像影像處理與光效運(yùn)用的更高要求,完善二維人臉重建帶來(lái)的人像處理不足,vivo X23采用了基于上百萬(wàn)張覆蓋全人種的人臉數(shù)據(jù)訓(xùn)練的升級(jí)版AI人像光效處理技術(shù),并新增倫勃朗光與彩虹光兩款定制光效。在實(shí)際體驗(yàn)中,vivoX23采用的AI人像光效處理技術(shù)在完成智能打光的同時(shí),保護(hù)人像畫(huà)面的胡須、眉眼、唇部和背景等必要細(xì)節(jié),使其不會(huì)因?yàn)榇蚬舛魅趸蜃兩?,人像虛化過(guò)渡更自然。
此外,曠視的 AI 視覺(jué)解決方案還能滿(mǎn)足對(duì)用戶(hù)面部的光線(xiàn)檢測(cè)、T區(qū)高光提亮以及對(duì)局部陰影的處理,即使在逆光環(huán)境下也能讓人像處理更立體。以倫勃朗光為例,在布光時(shí)從人像側(cè)前方45°向面部打光,以勾勒人物,突出人物的立體、深邃感,并且在打光同時(shí),手機(jī)能對(duì)原始畫(huà)面中的面部進(jìn)行左右臉的光強(qiáng)、光源、大小分析,從而判斷出光到底該從左打還是從右打,做到智能布光,讓用戶(hù)輕松駕馭自然的光,通過(guò)簡(jiǎn)單的手機(jī)攝影便能享受影棚體驗(yàn)。
老冀發(fā)現(xiàn)《AI+白皮書(shū)》中還提到,目前具備全部AI能力的手機(jī)還不足10%,這也意味著國(guó)產(chǎn)手機(jī)在A(yíng)I能力上還有非常大的提升空間。如今,在曠視等本土AI公司的幫助下,國(guó)產(chǎn)手機(jī)廠(chǎng)商正在視覺(jué)應(yīng)用等AI領(lǐng)域奮起直追,一步步縮小與蘋(píng)果等國(guó)際廠(chǎng)商的差距。正是基于這樣的觀(guān)察,老冀對(duì)國(guó)產(chǎn)手機(jī)的未來(lái)持謹(jǐn)慎樂(lè)觀(guān)的態(tài)度。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋(píng)果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢(qián)通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱(chēng)塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠(chǎng)60%股份 并接管日常運(yùn)營(yíng)
- 蘋(píng)果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車(chē)整車(chē)股盤(pán)初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。