[新智元導(dǎo)讀]近日,在國際計算機視覺競賽PASCAL VOC,中星微以89.0分的總成績位列第一,獲得目標(biāo)檢測單模型第一名。獲勝的模型是一步法的目標(biāo)檢測模型,本文帶來技術(shù)詳解。
近日,在PASCAL VOC comp4目標(biāo)檢測競賽中,中星微再創(chuàng)佳績,獲得了目標(biāo)檢測單模型第一名。
Pascal VOC是世界計算機視覺領(lǐng)域知名的競賽,比賽中,參賽者要對人、貓、鳥、飛機、汽車、船、盆栽等20類物體進行檢測。由于訓(xùn)練樣本較少,場景變化多端,非常具有挑戰(zhàn)性。中星微人工智能參賽團隊VIM_SSD以89.0分的總成績位列第一。
中星微人工智能芯片技術(shù)公司董事長兼總經(jīng)理張韻東表示:“本次參賽的模型適合終端設(shè)備部署的簡單模型一步法算法,能夠取得與云端服務(wù)器復(fù)雜多模型算法相媲美的結(jié)果,實屬不易。作為人工智能芯片公司,我們不僅要在芯片設(shè)計方面精益求精,同時更要在算法的精簡優(yōu)化方面取得突破,為客戶提供前端智能設(shè)備的整體解決方案。”
一步法目標(biāo)檢測模型
中星微本次提交的深度學(xué)習(xí)模型和上次參加比賽的深度學(xué)習(xí)模型基本一致,仍然沿用了一步法的目標(biāo)檢測模型,基礎(chǔ)網(wǎng)絡(luò)采用VGG16,并未使用ResNet-101, ResNet-152等更復(fù)雜的網(wǎng)絡(luò),保證精度的情況下速度更快。第一次參加比賽的成績是87.6,這次是89.0,精度提高很多。該結(jié)果不僅領(lǐng)先于所有的一步法算法,同時擊敗了所有的二步法算法。
中星微人工智能芯片技術(shù)公司研發(fā)副總裁艾國表示:“本次我們深度學(xué)習(xí)模型是上次模型的全面升級,仍然沿用了一步法的網(wǎng)絡(luò)架構(gòu),重點改進和優(yōu)化了訓(xùn)練相關(guān)的方法和技術(shù),在不增加算法復(fù)雜度的情況下,使得網(wǎng)絡(luò)的精度越來越高,這是我們公司要打造的核心技術(shù)。在前端嵌入式設(shè)備計算資源受限的情況下,我們通過調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練的方法提高精度,而不是不斷增加網(wǎng)絡(luò)復(fù)雜度。”
VOC 2012數(shù)據(jù)集圖片測試結(jié)果
不僅是單模型,而且是一步法,尤其適用于嵌入式NPU
多模型融合是深度學(xué)習(xí)比賽中經(jīng)常使用到的一個利器,它通常可以在各種不同的機器學(xué)習(xí)任務(wù)中使結(jié)果獲得提升。顧名思義,多模型融合就是綜合考慮多個不同模型的情況,并將它們的結(jié)果融合到一起。
雖然通過模型進行融合往往效果較好,但是其實現(xiàn)代價和計算開銷也比較大。目前,中星微主要是從實際項目應(yīng)用的角度來考慮,特別是前端應(yīng)用,一般都是單模型。當(dāng)然,后期也會考慮使用模型融合,來提升比賽結(jié)果的精度。
下表是目前PASCAL VOC競賽前十名,可以看出,下面算法中大部分應(yīng)用了更復(fù)雜的基礎(chǔ)網(wǎng)絡(luò)ResNet-101和ResNet-152,并且是兩步法,也有多模型融合(ensemble)。而中星微的模型不僅是單模型,而且是一步法,在嵌入式NPU可以達到很高的幀率。
阿里巴巴達摩院多模型融合網(wǎng)絡(luò)Ali_DCN_SSD_ENSEMBLE的得分是89.2,只比中星微單模型網(wǎng)絡(luò)高了0.2點,而阿里巴巴達摩院FF_CSSD(VOC+COCO, one-stage, single model)一步法單模型的精度是88.4,基礎(chǔ)網(wǎng)絡(luò)是ResNet101,和中星微差了0.6個點。
從安防監(jiān)控到保護瀕危野生動物,應(yīng)用場景廣泛
目標(biāo)檢測技術(shù)應(yīng)用廣泛,是AI場景落地的關(guān)鍵性技術(shù)之一。中星微的深度學(xué)習(xí)模型運行在前端智能設(shè)備(如智能攝像頭上),廣泛用于安防監(jiān)控、安全生產(chǎn)、環(huán)境保護、個人健康監(jiān)測等領(lǐng)域。
下面是一個環(huán)境保護的例子,在我國西部及藏區(qū)應(yīng)用,其采用人工智能、深度學(xué)習(xí)對野生保護動物進行檢測、識別、統(tǒng)計。從而達到對野生動物保護,生態(tài)環(huán)境平衡的目標(biāo)。根據(jù)國家要求,增強保護野生動物、保護環(huán)境的意識,特別是對瀕臨滅絕的野生動物的研究和保護,更要加大力度;要從科研、技術(shù)角度解決野生動物保護和數(shù)量的實時狀態(tài)。
如下圖,是對藏羚羊的檢測、識別、統(tǒng)計:
如下圖,是對藏野驢的監(jiān)測、識別、統(tǒng)計:
概念說明
精度:目標(biāo)檢測中衡量識別精度的指標(biāo)是mAP(mean average precision)。在多個類別物體檢測中,每一個類別都可以根據(jù)recall和precision繪制一條曲線,AP就是該曲線下的面積,mAP是多個類別AP的平均值,理論上最高mAP為1.0,也就是我們說的100分,89分其實就是0.89 mAP,下面是示例說明。
前端智能和云端智能:前端智能是將智能分析算法嵌入到前端設(shè)備,拿安防攝像機舉例,就是攝像機采集的視頻內(nèi)容立即進行分析,提取出畫面中關(guān)鍵的、感興趣的、有效的信息,形成結(jié)構(gòu)化的數(shù)據(jù)。前端智能因受各種資源限制,需要對算法復(fù)雜度、網(wǎng)絡(luò)模型大小等有限制。
云端智能是將前端傳感器采集的數(shù)據(jù)通過云端來完成智能分析,一般通過大型的GPU服務(wù)器來完成。因此相對于前端智能,計算資源、內(nèi)存資源、存儲資源、網(wǎng)絡(luò)資源等都較大,因此對算法模型的限制比較小,可以部署很大的很復(fù)雜網(wǎng)絡(luò)模型。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 為什么年輕人不愛換手機了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應(yīng)欠薪有補償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進,核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。