主頁(yè)(http://www.130131.com):視頻圖像識(shí)別分析軟件簡(jiǎn)析 近年來(lái),隨著信號(hào)處理技術(shù)的進(jìn)步,視頻和圖像處理技術(shù)得到迅速發(fā)展,并逐步滲透到我們的社會(huì)生活中。大量的視頻監(jiān)控應(yīng)用已經(jīng)出現(xiàn),我們可能都已經(jīng)看到,視頻監(jiān)控幾乎無(wú)所不在:銀行柜臺(tái)和ATM機(jī),小區(qū)、酒店、寫(xiě)字樓、機(jī)場(chǎng)等公共場(chǎng)所的安全管理,高速公路和停車(chē)場(chǎng)的車(chē)輛收費(fèi)管理,以及道路交通的流量管理等等。 與此同時(shí),大規(guī)模視頻監(jiān)控帶來(lái)的海量視頻信息成為了系統(tǒng)安裝后的處理難題。系統(tǒng)利用率低、有效信息提取困難,而視頻圖像識(shí)別分析技術(shù)則可以解決這個(gè)問(wèn)題,智能視頻分析軟件就是基于此點(diǎn)迅速發(fā)展起來(lái)。 技術(shù)發(fā)展?fàn)顩r 人臉辨識(shí)技術(shù) Eigenface法是假設(shè)所有人臉可以用一組基底人臉的線性組合所表示,作者以PCA組成分析原理(Principle Components Analysis)找出這組基底。 Fisherface法則是進(jìn)一步利用LDA線性判別式分析法(Linear Discriminant Analysis ),強(qiáng)制將不同的人臉在投射空間中盡量分開(kāi),因而提高了辨識(shí)率。 基本上人臉辨識(shí)可以分為兩種主要方法,一是整體特征方法,一是局部特征方法。 整體特征方法:直接將整張人臉當(dāng)作單一特征來(lái)做辨識(shí);局部特征方法:先找出臉上的局部特征,通常是眼睛、鼻子和嘴巴,然后分別根據(jù)這些局部特征做辨識(shí),最后將個(gè)別局部特征的結(jié)果統(tǒng)合而得到最后結(jié)果。近來(lái)的研究發(fā)現(xiàn)局部特征方法要比整體特征方法有更高的準(zhǔn)確率,但局部特征方法存在局部特征的對(duì)位問(wèn)題,在實(shí)際應(yīng)用上有較高的困難度。 大部分的人臉辨識(shí)方法會(huì)先將原始影像數(shù)據(jù)經(jīng)過(guò)降維的程序,在投射的子空間進(jìn)行辨識(shí),如此一來(lái)降低了運(yùn)算量,例如前述的利用PCA或LDA方法。 近來(lái)也有方法是利用不連續(xù)余弦轉(zhuǎn)換法DCT(Discrete Cosine Transform)來(lái)做降維,其與PCA 和LDA不同處在于DCT法抽取的是影像的低頻部分作為特征,并且不用象PCA或LDA需要很多樣本(sample)來(lái)計(jì)算轉(zhuǎn)置矩陣,而是利用單一公式直接對(duì)每個(gè)樣本降維。 在抽取出特征后(不管是原始影像或是降維空間),做辨識(shí)通常是利用最近鄰居法( Nearest-Neighbor),Eigenface以及Fisherface皆屬于這種方式。比較快速的方式是利用中樞網(wǎng)絡(luò)法(Neural Network),再配合DCT的處理結(jié)果作為特征后,在Yale以及ORL人臉數(shù)據(jù)庫(kù)有不錯(cuò)的辨識(shí)率。 近來(lái)非常熱門(mén)的Support Vector Machine(SVM)方法也被應(yīng)用到人臉辨識(shí)的題目上,其直接取原始影像作為特征,或是經(jīng)過(guò)PCA降維后當(dāng)作特征,再訓(xùn)練出SVM來(lái)做辨識(shí)。 一個(gè)很有創(chuàng)意的人臉辨識(shí)方法是利用DCT加上Hidden Markov Model(HMM)來(lái)做人臉辨識(shí),其是利用了人臉由上而下,眼睛、鼻子和嘴巴這些特征是有一定順序的性質(zhì)。 人臉辨識(shí)目前公認(rèn)存在的難題有兩個(gè),一是不同光源的問(wèn)題,一是不同角度的問(wèn)題。由于同一張人臉在不同光線以及角度下常常會(huì)有很大的差別,所以傳統(tǒng)的方法通常會(huì)失敗。 近來(lái)有不少方法致力于處理上述兩問(wèn)題,在處理光線問(wèn)題方面有Illumination Cone、 Quotient Image以及Self Quotient Image和Intrinsic Illumination Subspace四種方法。 Illumination Cone提出建立3D臉部模型,理論上可以重建固定視角下所有光源的臉2D樣貌,因而處理了光線變化的問(wèn)題。 Quotient Image、Self Quotient Image和Intrinsic Illumination Subspace概念上都是一種前處理的手段,三者皆先將欲辨識(shí)的人臉轉(zhuǎn)成刪除光源信息的格式,再做人臉辨識(shí)。 在處理不同角度方面有Morphable model、View-Base Eigenspaces、Elastic Bunch Graph Matching和Active appearance model四種方法。 Morphable model 與Active appearance model提供將視角為非正面輸入影像轉(zhuǎn)換成正面影像,因而去除了不同視角的因素,在此條件下做人臉辨識(shí)自然有較高的精確度。 View-Base Eigenspaces是基于Eigenface的方法,但根據(jù)不同的視角都個(gè)別去做,因而數(shù)據(jù)庫(kù)中儲(chǔ)存了同一人在不同視角下的數(shù)據(jù)。 Elastic Bunch Graph Matching方法則是根據(jù)人臉上的特征點(diǎn)建立一個(gè)圖(graph),藉由允許此圖變形而使得不同視角下臉部的特征點(diǎn)仍位于臉上相同位置,因此藉由這些特征點(diǎn)來(lái)做人臉辨識(shí)便排除了不同視角的因素。 上述的這些方法皆是利用2D的模型來(lái)進(jìn)行人臉辨識(shí)。另外一類(lèi)的方法使用3D模型來(lái)進(jìn)行人臉辨識(shí),如在FRVT 2002中三維Morphable模型的測(cè)試被證明可以有效地改善不同視角的辨識(shí)率。 傳統(tǒng)的人臉辨識(shí)使用單張影像,相對(duì)于此種靜態(tài)影像辨識(shí)方法外,利用影片中連續(xù)的多張影像來(lái)做辨識(shí)的方法則稱(chēng)為動(dòng)態(tài)影像辨識(shí)。動(dòng)態(tài)影像相對(duì)于靜態(tài)影像有許多優(yōu)勢(shì),一是多張影像提供的信息比單張影像豐富,其中包括了不同的視角,相鄰影像的信息等,這些信息都能夠增加人臉辨識(shí)的準(zhǔn)確度。 總結(jié)來(lái)說(shuō),光線和視角仍是目前人臉辨識(shí)的難題,雖然有相當(dāng)多的研究是針對(duì)這兩點(diǎn)的,但并沒(méi)有完全解決。近來(lái)的研究趨向利用動(dòng)態(tài)影像來(lái)得到更高的精確度,而利用3D的人臉模型來(lái)進(jìn)行辨識(shí)也因?yàn)樵谝暯歉淖兊臓顩r下有不錯(cuò)的表現(xiàn),在近幾年也受到重視。
|




