主頁(http://www.130131.com):從技術(shù)到產(chǎn)品應(yīng)用,深度解析IVS
縱觀國內(nèi)市場形形色色的IVS宣傳中,我們遺憾的是核心技術(shù)缺乏,而聲稱擁有自我知識產(chǎn)權(quán)的廠家也屈指可數(shù)。IVS的基本原理如何,其應(yīng)用情況如何,其產(chǎn)品形式有哪些,未來可能存在的產(chǎn)品形式等,本文將圍繞以上問題對IVS做一次全面的闡述,并借此拋磚引玉。
IVS(IntelligentVideoSurveillance智能視頻監(jiān)控)起源于CV(ComputerVision計算機視覺),而CV則是AI(ArtificialIntelligence人工智能)的一部分。從科學(xué)的角度來講,CV的目的是了解自然,尋找和開發(fā)能夠從影像源中提取有效信息的方法。從技術(shù)的角度,CV的目的則是構(gòu)建計算視覺系統(tǒng),能夠輔助人類完成控制、監(jiān)測、組織信息、建模和交互等功能。作為CV的一個重要的分支,IVS涉及了圖像處理、建模、物體跟蹤、識別等等諸多領(lǐng)域,以下將逐一論述。
IVS基本原理
IVS的基本原理是利用計算機視覺技術(shù),對視頻畫面進行分析、處理、應(yīng)用的過程,IVS的實現(xiàn)一般包含以下幾個層次。
移動目標(biāo)提取
移動目標(biāo)提取的目的是有效地排除外界干擾,找到并抽取畫面中移動的物體。換句話說,它是一個取證的過程,取得我們視頻分析所需要的依據(jù)。正是因為如此,它的穩(wěn)定性與魯棒性直接決定了后面跟蹤、識別,以及行為分析的表現(xiàn),可以說它是IVS的最基礎(chǔ)數(shù)據(jù)分析的來源。從技術(shù)實現(xiàn)的角度講,它可以分成三個層次。
視頻畫面的變化分析
第一層是對原始視頻流(壓縮或非壓縮)進行簡單的視頻分析,得到一些隨著時間發(fā)生相對變化的區(qū)域。通常采用的算法包括相鄰幀做差或建立背景模型做差,以及光流法等等。
過濾噪聲
過濾噪聲的目的在于排除光線變化以及自然與非自然環(huán)境變化的擾動。毫不夸張地說,噪音可以給后面的視頻分析過程帶來災(zāi)難性的影響。例如圖2A中靠左側(cè)正在向右行走的人已經(jīng)很難在辨認(rèn)出他的形狀。如何消除這些噪聲的干擾是有效抽取移動目標(biāo)的一項重要任務(wù)。
大體上,噪聲出現(xiàn)的原因可以分為三種。其一,攝像機自噪聲,信號干擾,攝像機抖動,如前景圖中的一些細(xì)小而又不很連續(xù)的亮點基本屬于這一類。
其二,光線變化包括室內(nèi)、外光線的變化。室外的光線變化包括天氣變化(由陰天轉(zhuǎn)晴天,晴轉(zhuǎn)陰,太陽位置移動)、晝夜變化、陰影(云,建筑等)的移動;室內(nèi)光線變化包括燈光的明暗變化、光源的位置及方向的變化。而光線變化所造成的噪音往往比較明顯,在前景圖中會表現(xiàn)成大片面積的誤報。
其三,自然環(huán)境干擾。它包括樹葉的搖動、水面的波紋、海浪、浮動的云朵、雨、雪;還有一些非自然環(huán)境的干擾包括旗子、條幅、窗簾的飄動,以及建筑物玻璃墻的反射等等?可戏剿娴牟▌泳褪莻很好的例子。
區(qū)域提取
一方面,由上兩個環(huán)節(jié)處理過所得到的前景圖往往是以像素為單位的,沒有一個“物體”的整體概念。另一方面,這樣處理過的前景圖區(qū)域內(nèi)部很可能存在許多空隙,給描述物體的形狀帶來不便。在這一環(huán)節(jié),區(qū)域提取的主要目的就是利用一些基本的二值圖像(黑與白)的處理算法對得到的前景圖進行加工,填補空隙,并將連接好的區(qū)域區(qū)分開,最后作為一個個整體返回給系統(tǒng)。返回給系統(tǒng)的內(nèi)容可以包括區(qū)域大小、位置、形狀、顏色、圖案等等關(guān)鍵特征描述信息,供下一步有針對性的分析?梢钥吹轿矬w里面包含的大部分空隙已經(jīng)被添上,而且物體的整體形狀變得更加平滑。有了這樣的結(jié)果,我們就能進入下一步的處理。
移動目標(biāo)的跟蹤
對目標(biāo)的跟蹤是實現(xiàn)任何一項智能視頻分析功能(越界、入侵、遺留、盜竊、徘徊、流量統(tǒng)計等等)所需要的前提,因為我們必須要知道是哪個物體,在什么時間,什么地點出現(xiàn)過,出現(xiàn)了多久,運動的方向怎樣,等等信息,而這些都只能通過跟蹤得到。
目標(biāo)的表示
通過上一節(jié)“區(qū)域提取”我們得到了移動目標(biāo)的一系列與表象相關(guān)的靜態(tài)描述,如形狀、顏色等等。然而,要跟蹤目標(biāo)以及了解他們的運動信息,我們必須利用這些描述建立運動模型。
目標(biāo)跟蹤
移動目標(biāo)的提取與跟蹤其實是兩個互利互惠的過程。一方面,如果提取做得很精確,跟蹤就會變得很簡單,只要選擇目標(biāo)的中心就可以了;另一方面,如果跟蹤做得很理想,我們就可以在移動目標(biāo)在下一個時間點可能出現(xiàn)的地方著重提取,這樣得到的結(jié)果會更精確。然而,正是由于這兩方面都存在很大的不確定性,我們需要權(quán)衡雙方以得到最好的表現(xiàn)。當(dāng)然,一個穩(wěn)定的跟蹤算法是得到最好表現(xiàn)的必要前提。
跟蹤的算法有很多,有基于物體顏色位置的,有根據(jù)物體運動方程的,有級連其它物體輔助跟蹤的,還有采用模板的等等。但言而總之,目的只有一個,那就是根據(jù)移動物體以前的運動狀態(tài)(包括速度,加速度,方向等)來推測它可能的下一個位置。再通過前面提取到的移動區(qū)域信息進行更正補償,然后確認(rèn)最終位置并更新物體的運動狀態(tài)以供下個時間點處理。
顯示的是截取的一幀行人跟蹤畫面。在這里,移動物體(行人)用簡單的矩形框表示,過去5秒鐘內(nèi)矩形框的中心被連成一條軌跡。圖中存在很多噪音,包括樹葉的大幅擺動和遮陽傘的飄動,這些都被成功地過濾掉了。
復(fù)雜情況處理
以上所述的只是一些跟蹤的簡單情況,往往只涉及到對一個或者幾個獨立目標(biāo)的跟蹤。然而,現(xiàn)實情況要復(fù)雜很多。這包括單個目標(biāo)的遮擋、消失、重現(xiàn)、以及多個目標(biāo)的聚合、分離等等。我們不僅需要實現(xiàn)個體的穩(wěn)定跟蹤,而且需要對這些復(fù)雜情況做出判斷,從而采取相應(yīng)的措施以保證不會出現(xiàn)混淆、遺漏、重復(fù)等錯誤現(xiàn)象。
在顯示的是一個移動目標(biāo)被部分遮擋的跟蹤情況。圖中行人身體的下半部被遮擋住,也就是說,我們所得到的提取出來的移動物體只有原來的一部分,然而,穩(wěn)定的跟蹤算法能夠正確地推算出物體的實際大小并判斷出該物體被遮擋。
高級跟蹤技術(shù)
(中國集群通信網(wǎng) | 責(zé)任編輯:陳曉亮) |