雷鋒網(wǎng)按:卡內(nèi)基梅隆大學(xué)剛剛發(fā)布了其關(guān)于人臉識(shí)別的最新研究,由其改進(jìn)的算法能夠從圖片中提取并編碼關(guān)鍵信息,也就是說能從人海中迅速提取面部信息。目前是人臉識(shí)別最熱門的創(chuàng)業(yè)方向之一,卡內(nèi)基梅隆大學(xué)的這項(xiàng)技術(shù)研究對(duì)于產(chǎn)業(yè)界的應(yīng)用將起到很大的推動(dòng)作用。
無論是在茫茫人海中提取面部信息,還是在大圖中識(shí)別出遠(yuǎn)處/細(xì)小的物體,都對(duì)計(jì)算機(jī)視覺圖形提出了非常大的挑戰(zhàn)。憑借著多年的技術(shù)積淀,來自卡內(nèi)基梅隆大學(xué)的科研團(tuán)隊(duì)終于找到了其中的訣竅——成功識(shí)別細(xì)小對(duì)象的關(guān)鍵就是尋找與之匹配的更大物體。
這種能夠從圖片中提取并編碼關(guān)鍵信息的改進(jìn)算法,是由副教授 Deva Ramanan 和博士生 Peiyun Hu 共同推進(jìn)的,可謂是識(shí)別微型人臉里程上的重大進(jìn)步。
在面部的基準(zhǔn)測(cè)試集中,此前的方法只能識(shí)別出 29% 到 64% 之間的正確人類面孔,而她們所提出的改進(jìn)版算法減少了兩個(gè)導(dǎo)致誤差的隱私,從而將正確率提高到了 81%。
Ramanan 說道:「這就像是尋找在某個(gè)人手中的一根牙簽。當(dāng)你提示對(duì)象可能會(huì)使用牙簽的時(shí)候你就會(huì)非常容易看到它。手指的方位,手部的動(dòng)作和位置都為我們最終找到這根牙簽提供了非常重要的線索?!?/p>
同樣,為了尋找那些只有極少像素點(diǎn)的的面部,更大照片中的身體或者人群照片都能提供諸多線索。
對(duì)于微型面部的提取擁有廣闊的應(yīng)用前景,例如統(tǒng)計(jì)人群數(shù)量等等。而延伸至微型物體的需求日益突顯,就拿自動(dòng)駕駛汽車來說當(dāng)車速越來越快,必然需要時(shí)刻監(jiān)視和評(píng)估交通狀況,必然需要對(duì)遠(yuǎn)處的物體進(jìn)行充分且正確的識(shí)別,才能做出正確的反應(yīng)。
Ramanan 表示通過輔助關(guān)聯(lián)信息來幫助識(shí)別對(duì)象并不是什么新鮮的概念。然而,在實(shí)際系統(tǒng)中很難去闡述和表達(dá)這種直覺。這是因?yàn)閷?duì)關(guān)聯(lián)信息的編碼通常涉及到「高緯度描述」(High-Dimensional Descriptors),其中包含大量信息但是使用起來卻是非常的麻煩。
他和 Hu 所研發(fā)的方法是使用了「中央凹描述」(Foveal Descriptors),模擬人類視覺結(jié)構(gòu)對(duì)關(guān)聯(lián)信息進(jìn)行編碼。中央凹是視網(wǎng)膜中視覺(辨色力、分辨力)最敏銳的區(qū)域,這種方法為圖片的小塊區(qū)域提供了清晰的細(xì)節(jié),而周圍區(qū)域則比較的模糊。
通過模糊外部圖像,中心凹描述提供了充足的關(guān)聯(lián)信息,在高度聚焦下幫助理解這個(gè)區(qū)域所展示的內(nèi)容,而且極大的降低了計(jì)算負(fù)擔(dān)?;谶@種方式,Hu 和 Ramanan 的系統(tǒng)能夠在更少像素點(diǎn)的圖形塊中尋找并確認(rèn)是否存在人臉。
簡單的增加一張圖片的分辨率可能并不是尋找微型物體的最佳解決方案。伴隨著高分辨率會(huì)帶來「Where『s Waldo」的問題,目標(biāo)對(duì)象包含大量的像素點(diǎn),極有可能在像素點(diǎn)中迷失。在這種情況下,充分利用關(guān)聯(lián)信息就能夠幫助系統(tǒng)關(guān)注到包含面部的圖像區(qū)塊。除了上文提及的關(guān)聯(lián)信息之外,Ramanan和Hu表示如果在同一個(gè)圖像區(qū)域中數(shù)次檢測(cè)到鼻子,那么利用檢測(cè)器在擁有少數(shù)像素點(diǎn)的圖像區(qū)域中找出面部是非常困難的。因此他們針對(duì)不同尺寸的對(duì)象培訓(xùn)了多個(gè)獨(dú)立檢測(cè)器,從而大大提高了檢測(cè)微型物體的能力。
今年 7 月 21 日至 26 日在美國夏威夷州的首府火奴魯魯將會(huì)舉辦計(jì)算機(jī)視覺與模式識(shí)別國際會(huì)議(CVPR 2017),科研團(tuán)隊(duì)屆時(shí)將會(huì)發(fā)表詳細(xì)的報(bào)告。目前網(wǎng)絡(luò)版報(bào)告已經(jīng)發(fā)布,雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))將持續(xù)關(guān)注后續(xù)動(dòng)態(tài)。
- 海信CES2025黑科技突破:液晶電視首發(fā)彩色光源
- TCL創(chuàng)新設(shè)計(jì)Playcube投影儀:立方體旋轉(zhuǎn)設(shè)計(jì),便攜內(nèi)置電池,打破傳統(tǒng)投影限制
- 華為小豚當(dāng)家室外攝像頭升級(jí)版:WiFi+網(wǎng)線雙連接,800萬像素真實(shí)監(jiān)控,329元超值體驗(yàn)
- LG新款便攜式電視StanbyME 2:輕裝出行,時(shí)尚新選擇
- 五軸折疊仿生機(jī)械手,石頭 G30 Space 探索版自清潔掃地機(jī)器人顛覆傳統(tǒng),開啟家居清潔新篇章
- 石頭G30掃地機(jī)器人:避障能力強(qiáng)悍、底盤升降黑科技,真實(shí)體驗(yàn)顛覆想象,僅售5499元
- 小米人車家全生態(tài)引領(lǐng)未來,高通驍龍跨端互聯(lián)生態(tài)重塑智能生活
- 貴金屬智能戒指追蹤心率,價(jià)格高達(dá)1500英鎊,你還愿意戴上它嗎?
- 海外新秀閃極子品牌loomos AI眼鏡:低調(diào)奢華,揭開GPT-4o神秘面紗
- 聯(lián)發(fā)科與谷歌聯(lián)手推出 Matter 標(biāo)準(zhǔn)芯片組:智能家居無線連接新篇章
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。