在計算機視覺領域中,人體運動行為識別是一個被廣泛關注的熱點問題,在智能監(jiān)控、機器人、人機交互、虛擬現實,智能家居,智能安防,運動員輔助訓練等方面有巨大應用價值。行為識別問題一般遵從如下基本過程:數據圖像預處理,運動人體檢測、運動特征提取、特征訓練與分類、行為識別。著重從這幾方面逐一回顧了近年來人體行為識別的發(fā)展現狀和常有方法。并對當前該研究方向上待解決的問題和未來趨勢做了分析。行為理解可以簡單地認為是時變數據的分類問題,即將測試序列與預先標定的代表典型行為的參考序列進行匹配。通過對大量行為理解研究文獻的整理發(fā)現:人行為理解研究一般遵從特征提取與運動表征、行為識別、高層行為與場景理解等幾個基本過程。
特征提取與運動表征是在對目標檢測、分類和跟蹤等底層和中層處理的基礎上,從目標的運動信息中提取目標圖像特征并用來表征目標運動狀態(tài);行為識別則是將輸入序列中提取的運動特征與參考序列進行匹配,判斷當前的動作處于哪種行為模型;高層行為與場景理解是結合行為發(fā)生的場景信息和相關領域知識,識別復雜行為,實現對事件和場景的理解。
智能監(jiān)控:系統(tǒng)能夠監(jiān)視一定場所中人的活動,并對其行為進行分析和識別,跟蹤可疑行為(如經常在重要地點徘徊等等行為)從而采取相應的報警措施。通常把報警系統(tǒng)設置于監(jiān)獄、戒毒場所、銀行、機場、車站、碼頭、超市、辦公大樓、住宅小區(qū)等地,以實現對這些場所的智能監(jiān)控。
虛擬現實:跟蹤現實世界人的姿態(tài),從而創(chuàng)建一個虛擬的仿真場景,實現人與這個虛擬世界的交互。該領域的具體應用涉及視頻游戲、虛擬攝影棚、計算機動畫等方面。
高級用戶接口:可以通過對用戶手勢的識別來代替?zhèn)鹘y(tǒng)的鼠標和鍵盤輸入,從而實現人與計算機之間的智能交互。此外,通過對手勢語言的理解,還可以進行聾人與計算機之間的手語交流。
運動分析:人體運動分析可以運用于基于內容的視頻檢索領域。例如可以檢索在運動會上單杠比賽中運動員的杠上動作。這樣可以節(jié)省用戶大量的查詢視頻資料的時間和精力。另外一種應用是用于各種體育項目中,提取運動員的各項技術參數(如關節(jié)位置、角度和角速度,等等),通過分析這些信息,可以為運動員的訓練提供指導和建議,有助于提高運動員的訓練水平。此外,還可以用于體育舞蹈動作的分析,以及臨床矯形術的研究等領域。
基于模型的視頻編碼:通過提取一定的靜態(tài)場景中人物的形態(tài)特征參數和3D姿態(tài)參數,以較低的數據量對視頻數據流加以描述,實現視頻數據的壓縮和低比特率傳送??梢杂糜谠谝蛱鼐W上展開遠程視頻會議以及視頻點播。
高精準預判:3D行為識別技術可實現對個體及群體進行高精準度的行為識別,對設定的異常行為進行預判并及時預警。
空間矢量化:該技術可實現對監(jiān)控區(qū)域進行3D空間矢量化、事件化。
非接觸式測量:對實現對物體進行非接觸式生物特征測量。
安全穩(wěn)定:不易受周圍環(huán)境影響。
監(jiān)獄、戒毒所、公安監(jiān)所、社區(qū)、學校、園區(qū)、銀行