一種基于視頻序列的人流量統(tǒng)計方法
【技術領域】
[0001]本發(fā)明屬于圖像處理與視頻監(jiān)控技術領域,涉及一種基于視頻序列的人流量統(tǒng)計方法。
【背景技術】
[0002]隨著人類智慧不斷推動科技的快速發(fā)展,各種智能設備也在日趨進步與完善,智能技術也因此正不斷地影響與改變著人們的學習生活與工作方式。在各個方面得到了廣泛應用的圖像處理與視頻監(jiān)控系統(tǒng)作為人們學習與生活中的一部分,起到了不可磨滅的作用。人流量統(tǒng)計系統(tǒng)作為評估某一特定場景中,某些方向上人流量多少的計數(shù)系統(tǒng),在實際生活應用中具有非常重要的作用。例如,通過對進出教室人群進行自動統(tǒng)計不僅能考察各科的出勤率,從而合理的評估教學質量,而且可以幫助同學們快速選擇合適的自習教室。通過對地鐵站內進出客流人數(shù)的統(tǒng)計,可以方便地鐵運營方以及安保方有效地控制客流,做好應對措施。通過對每路公交車的各個站點、各個時間段的人流量統(tǒng)計,可以使交通運營者采取最合理的調度制度以及運營模式,這樣給乘客提供最方便、快捷的服務。
[0003]但是,傳統(tǒng)的人工計數(shù)方式不僅會耗費大量的人力資源,而且可能由于各種因素造成錯誤統(tǒng)計,特別是對于那些人群出入密集場所,使得人工計數(shù)更加困難,而自動人流量統(tǒng)計系統(tǒng)則能解決以上問題,給學習和生活帶來巨大便利,提高生活質量。因此,目前急需一種能夠克服人工計數(shù)方式劣勢的實時自動人流量統(tǒng)計方法。
【發(fā)明內容】
[0004]有鑒于此,本發(fā)明的目的在于提供一種基于視頻序列的人流量統(tǒng)計方法,該方法可以節(jié)約大量的人力資源,而且避免了由于人為因素所造成的錯誤統(tǒng)計,同時很好地克服了人工計數(shù)在某些場景下的計數(shù)劣勢,并且該方法能夠準確定位到單個行人,給后續(xù)分析工作帶來了重大意義。
[0005]為達到上述目的,本發(fā)明提供如下技術方案:
[0006]—種基于視頻序列的人流量統(tǒng)計方法,包括以下步驟:1)獲取視頻,通過采樣得到視頻序列;2)通過候選區(qū)域檢測模塊進行粗檢測得到候選目標區(qū)域;3)利用基于迀移學習的卷積神經(jīng)網(wǎng)絡+支持向量機分類器模型對候選區(qū)域進行進一步篩選得到檢測目標;4)根據(jù)航跡預測對待關聯(lián)的候選目標范圍進行限制;5)通過特征匹配進行目標航跡關聯(lián);6)利用航跡信息進行人流量統(tǒng)計。
[0007]進一步,在步驟2)中,通過候選區(qū)域檢測模塊進行粗檢測得到候選區(qū)域,采用以下幾類方法得到候選區(qū)域:
[0008]21)基于檢測的方法:這類方法利用訓練好的目標分類器,對圖像進行掃描得到疑似目標區(qū)域;例如級聯(lián)的自適應增強(Adaboost,Adaptive Boosting)檢測方法、方向梯度直方圖(H0G,Histogram of oriented gradient)+支持向量機(SVM,Support VectorMachine)等方法;
[0009]22)基于碎片聚合的方法:這類方法首先將圖片打碎,然后再聚合;例如選擇性搜索算法(Selective Search),該方法無需學習,直接利用圖像分割方法獲得一些粗分割結果,然后根據(jù)給定的相似度準則進行聚合;
[0010]23)基于給滑動窗口打分的方法:這類方法是先生成候選框,然后利用某些方法或者準則直接打分排序來過濾掉低分的候選框;例如Bing、EdgeBoxes等方法。
[0011]在步驟3)中,提取出步驟S102所得到的候選區(qū)域,由于候選區(qū)域目標存在錯誤正樣本,因而需要對候選區(qū)域目標重新加以挑選,從而得到正負樣本訓練集,然后利用基于迀移學習的卷積神經(jīng)網(wǎng)絡+支持向量機分類器模型對候選區(qū)域進行目標判別確認,這樣能夠保證較高的目標檢測率。
[0012]進一步,在步驟3)中,基于迀移學習的卷積神經(jīng)網(wǎng)絡+支持向量機分類器模型中迀移學習是在已有卷積神經(jīng)網(wǎng)絡結構模型的基礎上進行微調后重新訓練,且卷積神經(jīng)網(wǎng)絡采用多層網(wǎng)絡結構,取全連接層特征向量作為卷積神經(jīng)網(wǎng)絡提取到的特征,輸入到支持向量機進行模型訓練,輸出即為基于迀移學習的卷積神經(jīng)網(wǎng)絡+支持向量機分類器模型。
[0013]進一步,在步驟4)中,對篩選得到的檢測目標航跡進行預測,根據(jù)航跡預測對待關聯(lián)的候選目標范圍進行限制;由于相鄰幀間行人目標的空間位置變化不大,因而通過設置合適的閾值進行距離區(qū)域限制,或者可以利用均值漂移、卡爾曼濾波、粒子濾波等方法預測當前幀的指定目標在下一幀可能出現(xiàn)的空間位置,從而以此目標為中心進行區(qū)域限制處理。
[0014]進一步,在步驟5)中,通過步驟4)得到候選區(qū)域,對候選區(qū)域內所有中心點在區(qū)域范圍內的待關聯(lián)候選目標一一進行特征匹配,通過特征匹配進行目標航跡關聯(lián);在此過程中,通過設置兩個閾值,若匹配分數(shù)達到最高設限閾值,且得到的匹配分數(shù)最高,說明該目標最相關,則將該檢測目標確定為當前幀指定目標的關聯(lián)對象,若匹配分數(shù)未達到最低設定閾值,則說明當前幀指定目標為虛假目標,應當舍棄。
[0015]進一步,對于匹配分數(shù)在兩個設定閾值之間的檢測目標,若在匹配區(qū)域范圍內仍存在未匹配對象,則可根據(jù)分數(shù)高低與匹配分數(shù)最高的檢測目標進行匹配,否則,若在匹配區(qū)域范圍內不存在未匹配對象或匹配區(qū)域范圍內不存在檢測目標,則暫時保存該目標,使之與后面隔幀圖像進行匹配關聯(lián),若隔幀圖像在限定區(qū)域內存在未與其上一幀匹配關聯(lián)目標,且滿足達到最低閾值,則可與其匹配分數(shù)最高者進行關聯(lián)即可,若此時仍未達到要求,仍先保存該目標,反復進行匹配關聯(lián),直到連續(xù)N幀均未匹配到,則被視為無效目標,進行舍棄。
[0016]進一步,在步驟6)中,通過能夠匹配關聯(lián)到的相應目標航跡信息進行跟蹤,當檢測目標通過指定檢測線或興趣區(qū)域時進行雙向流計數(shù),從而最終得到人流量統(tǒng)計結果并顯示出來,在這里,通過標志位的變化、位移差或光流方向等方法來判斷行人運動方向,從而根據(jù)其相應的變化進行計數(shù)。
[0017]本發(fā)明的有益效果在于:本發(fā)明提供的方法可以節(jié)約大量的人力資源,而且避免了由于人為因素所造成的錯誤統(tǒng)計,同時很好地克服了人工計數(shù)在某些場景下的計數(shù)劣勢,并且該方法能夠準確定位到單個行人,給后續(xù)分析工作帶來了重大意義。
【附圖說明】
[0018]為了使本發(fā)明的目的、技術方案和有益效果更加清楚,本發(fā)明提供如下附圖進行說明:
[0019]圖1為本發(fā)明所述方法的流程示意圖;
[°02°]圖2為Adaboost的算法流程示意圖;
[0021 ]圖3為基于迀移學習的卷積神經(jīng)網(wǎng)絡+支持向量機分類器模型示意圖;
[0022]圖4為特征匹配模塊示意圖;
[0023]圖5為人流量計數(shù)模塊示意圖。
【具體實施方式】
[0024]下面將結合附圖,對本發(fā)明的優(yōu)選實施例進行詳細的描述。
[0025]本發(fā)明是為了更好地利用已有視頻資源,通過人流量統(tǒng)計技術達到實時計數(shù)的效果,方便多種場合下的人流量統(tǒng)計。該方法根據(jù)采集到的監(jiān)控序列圖像或視頻,對其圖像進行處理,從而將檢測出來的人流量統(tǒng)計結果在線顯示出來。
[0026]由于人頭是身體部分中最為明顯的部位,特別是在人流量比較大的場所,此時由于受遮擋、光照、像素分辨率等因素的影響,使得準確檢測身體其他部位變得更加困難,甚至幾乎很難進行目標檢測。由此可見,目標的可視性尤為重要。因此,在本實施例中,本發(fā)明具體針對人頭進行檢測,通過對檢測結果進行準確匹配關聯(lián),進而通過跟蹤計數(shù)得到人流量統(tǒng)計結果。