近年來,在視頻采集傳感器以及信息科學領域技術蓬勃發(fā)展的前提下,基于計算機視覺的視頻分析任務,尤其是人體行為識別技術在虛擬現實、視頻監(jiān)控、視頻檢索、醫(yī)療和游戲等方面有著廣泛的應用。人體行為識別是計算機視覺的一個熱門研究話題。
人類行為識別(HAR)是通過復雜技術破譯人類行為的過程,以使機器能夠理解、分析、理解和分類這些行為,并給出任何形式的有效輸入或刺激。深度學習對于解決識別與分類問題非常有效,因為它執(zhí)行端到端優(yōu)化,且相關任務可以相互受益(轉移學習)。
據悉,微美全息(NASDAQ:WIMI)以具有良好的表征能力的卷積神經網絡CNN為基礎,開發(fā)了基于卷積神經網絡的三維人體行為識別算法系統(tǒng)。
首先,從骨骼關節(jié)的相對運動中提取四個獨特的時空特征向量,將這些特征隨后被編碼到圖像中,然后將這些圖像送入CNN進行深層特征提取。更具體地說,該系統(tǒng)是將骨架數據用于3D人類行為識別任務,從三維骨架數據中提取四種類型的信息特征(距離、距離速度、角度和角度速度特征),并使用合適的編碼方案將其編碼為圖像。另外WIMI微美全息還使用反離子優(yōu)化從特征空間中刪除冗余和誤導性信息。最后,WIMI微美全息使用分類對操作進行最終預測。
基于卷積神經網絡的三維人體行為識別算法系統(tǒng)的應用流程主要包括數據收集、數據預處理、特征提取、分類、預測決策等。
第一步是為基于卷積神經網絡的三維人體行為識別算法系統(tǒng)收集適當的數據。適當、結構化和正確標記的數據集是訓練模型的最基本要求之一。神經網絡會將數據集作為母體學習其相應特征信息,保存為深度神經網絡訓練后的記憶,并以此記憶為依托對其他相應數據集進行預測。因此數據集質量的高低會直接影響到神經網絡訓練的質量,一個覆蓋面廣、信息全、分辨率高的數據集訓練出的神經網絡要遠比簡單、低分辨率、背景復雜的數據集訓練出的網絡效果好。人體行為識別網絡對于數據集的要求包括行為類別要全面、行為質量要高、視頻要清晰等等。
第二步是數據的預處理,特征變換、特征選擇和特征提取耦合在一起,通常稱為數據預處理模塊。特征的提取和正確表示是提高模型性能的關鍵步驟。對于高維數據,模型過擬合的可能性相對增加,因此需要選擇相關特征。為分類模型選擇所需的特征是正確的關鍵步驟。接下來是分類,將提取的特征用于訓練模型,以完成對不同形式的人類行為識別和分類的任務。最后是預測分析,從卷積神經網絡模型的輸入中提取更多信息特征,使模型可以在不考慮類別之間的視覺差異的情況下進行決策。
WIMI微美全息的基于卷積神經網絡的三維人體行為識別算法技術可實現對個體及群體進行高精準度的行為識別,對設定的異常行為進行預判并及時預警,其可廣泛運用于人員識別、車輛識別、區(qū)域入侵、目標異常檢測等運用場景。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )