圖像內(nèi)容分析——安防系統(tǒng)智能化的突破口(2)

時間：2008-08-08　來源：李仲男　作者：張?zhí)焯臁?small>點擊：次

主頁（http://www.130131.com）：圖像內(nèi)容分析——安防系統(tǒng)智能化的突破口(2)

圖像內(nèi)容分析
實現(xiàn)智能監(jiān)控，各廠家提出了不同的技術(shù)方案，但關(guān)鍵點都集中于圖像內(nèi)容分析技術(shù)。這是正確的方向，可以說圖像內(nèi)容分析技術(shù)的發(fā)展過程就是智能監(jiān)控的發(fā)展過程。智能監(jiān)控的實現(xiàn)必須有圖像內(nèi)容分析技術(shù)的突破作為支撐。

圖像具有極大的信息量，它同時具有空間分辨和時間分辨的能力，但真正把這些信息提取和挖掘出來是復(fù)雜和困難的。前面講了圖像系統(tǒng)智能化的主要標志之一是：系統(tǒng)從目視解釋（視讀）走向機器解釋（機讀）。它意味著：視頻監(jiān)控將改變系統(tǒng)對圖像信息不作任何處理的現(xiàn)狀，處理就是對圖像信息自動的解讀，是理解（understanding）圖像，這就是圖像內(nèi)容分析（video understanding）的含義所在�，F(xiàn)在市場上出現(xiàn)了一些IV（intelligent video）產(chǎn)品，都是對圖像內(nèi)容進行基本的分析，如目標的分離、分類、統(tǒng)計，簡單背景下單目標的行為分析和跟蹤。研究機構(gòu)則把它作為重要的課題，開展深入的研究，國家“十一五”科技攻關(guān)就列入了相關(guān)的課題。根據(jù)安全的需求，智能監(jiān)控技術(shù)的發(fā)展過程或圖像內(nèi)容分析技術(shù)的研究可分為以下幾個階段：

1、將（運動）目標從視頻圖像中分離出來。這是體現(xiàn)圖像技術(shù)的優(yōu)勢，實現(xiàn)目標探測的前題。傳統(tǒng)的視頻（運動）探測其實是亮度探測，并沒有發(fā)揮圖像技術(shù)的特點。確定圖像中是否有探測目標（人、物等），并將目標從背景圖像中分離出來是圖像內(nèi)容分析的首要任務(wù)，進而對目標分類、統(tǒng)計、關(guān)聯(lián)。判斷圖像中有無目標、目標的復(fù)合或離散等也是圖像過濾的基礎(chǔ)。

2、對目標進行行為分析，判定其運動的方向、方式，并能發(fā)現(xiàn)和告警異常的行為；產(chǎn)生目標的運動軌跡，并能進行目標的自動跟蹤。實現(xiàn)運動目標的跟蹤是很難的事，它要求系統(tǒng)能分析、預(yù)測目標的運動軌跡,并能實時地作出修正。同時，由于運動過程與伺服機構(gòu)間傳遞函數(shù)的非線性，伺服系統(tǒng)也是很復(fù)雜的。

3、在復(fù)雜環(huán)境下實現(xiàn)目標的分離、行為分析和運動跟蹤，特別是實現(xiàn)多目標的跟蹤。

上述兩點目前已有產(chǎn)品和應(yīng)用，但基本上在簡單環(huán)境下，針對少數(shù)目標的情況。在復(fù)雜環(huán)境（既通常的視頻監(jiān)控環(huán)境）下實現(xiàn)這些功能，是圖像內(nèi)容分析技術(shù)具有真正應(yīng)用價值的關(guān)鍵。同時、解決多個圖像的綜合分析，圖像間目標的關(guān)聯(lián)，目標跟蹤的連續(xù)。這都是市場迫切需要，目前還沒有解決的問題。

4、實現(xiàn)視頻語義的解析，圖像內(nèi)容分析的最高層次。通過對一個圖像序列作出分析，得出其包含的真實信息，可以與話音的語義解析（已有了初步的成果）結(jié)合起來，逐步實現(xiàn)視頻語義的解析，如通過對大量的、多渠道的圖像資料的分析，得出社會對某一事件的反映程度；分析和統(tǒng)計某類事件發(fā)生，發(fā)展的規(guī)律（概率及時間、地域分布等）。能夠進行這樣分析，表明機器具有了與人一樣的理解圖像的能力，但具有人所不能達到的效率。

這個過程是逐步發(fā)展、與時俱進的，沒有終極的結(jié)果。實現(xiàn)智能監(jiān)控的目標，要經(jīng)過不斷的技術(shù)積累，特別是核心技術(shù)的突破，它需要一個過程，不可能一蹴而就，認為監(jiān)控技術(shù)智能化已經(jīng)實現(xiàn)的觀點是不確切的。

智能監(jiān)控的突破口
通常會把圖像內(nèi)容分析與圖像識別混淆起來，或把圖像識別作為智能監(jiān)控的目標。確實圖像識別技術(shù)在安防系統(tǒng)中應(yīng)用前景是非常廣闊的，也是安防系統(tǒng)智能化的一個主要方向。但是，對于通常的視頻監(jiān)控應(yīng)用找不到合適的切入點。下面我們從圖像識別的主要應(yīng)用說起，首先明確：圖像識別是指采用圖像技術(shù)對目標的個體識別，如認定某一個人，找到某一輛車或某一件物。以圖像生物特征識別為例，就是采用圖像（模式識別）技術(shù)識別人體自身載有的、具有唯一性和相對穩(wěn)定性的特征（如人臉、視網(wǎng)膜、虹膜、指紋、掌紋/形及步態(tài)等），確定個體的身份。目前，它們的應(yīng)用主要有兩種方式：

1、驗證：是把當事人的身份與正在發(fā)生的行為聯(lián)系在一起，確認其合法性。這是安全防范系統(tǒng)的典型應(yīng)用，把人的生物特征視作一把鑰匙或一張卡。

驗證系統(tǒng)因可對特征的輸入加以更多的控制，系統(tǒng)的可靠性和穩(wěn)定性好，也相對成熟，已廣泛地應(yīng)用于出入管理系統(tǒng)中。它的基本工作方式是把特征輸入裝置讀取的特征與系統(tǒng)存貯的有限量的特征樣本（這些樣本代表了一定的授權(quán)）進行比對，來確定請求合法性。通常系統(tǒng)的存貯樣本的數(shù)量不是很多，現(xiàn)場特征輸入的條件又可以加以控制，所以，系統(tǒng)的識別率很高（誤識率和誤拒率很低）。由于生物特征來自人自身，不需要進行同一認證，具有極高的安全性，因此、適用于高安全性要求的場所，如貴重物品的庫房、重要活動或要人訪客的出入管理。

2、識別：對輸入特征與存貯在數(shù)據(jù)庫中的大量的參考進行比對，來確定目標的身份。這樣的系統(tǒng)首先要建立一個海量的基礎(chǔ)樣本數(shù)據(jù)庫，如各城市人口的指紋庫等。對于人臉等生物特征，要求輸入的環(huán)境與建庫的環(huán)境具有足夠的相關(guān)性，以保證輸入特征與樣本特征的可比性。所以，建立一個稍加控制的環(huán)境，以排除或限制影響特征采集不真實（失真、不完整、偽裝）的各種因素是系統(tǒng)應(yīng)用的必要條件。如邊防檢查系統(tǒng)設(shè)立專門的人員通道來采集出入境人員的面部特征；機場安檢信息系統(tǒng)在驗征臺處攝取旅客的面部圖像。

兩者都是對個體身份的認證，都要求有一個限定的工作環(huán)境，這一點通常的視頻監(jiān)控系統(tǒng)是做不到的，而且，它們的工作目標也不是對人體的身份認證。所以，必須在驗證與識別之間選擇新的切入點。

圖像內(nèi)容分析成為智能監(jiān)控的突破口就在于：它是在通常的視頻監(jiān)控的環(huán)境下（如3111工程所建的系統(tǒng)）實現(xiàn)上述的功能。它對現(xiàn)行系統(tǒng)是錦上添花的方式，不影響現(xiàn)行系統(tǒng)的運行和使用，逐步完善、增加系統(tǒng)功能實現(xiàn)安防系統(tǒng)的智能化。更重要的是，它不僅是提取圖像的表面信息（生物特征），而是挖掘并表述圖像承載的深層信息，通過對圖像序列的分析和多源圖像的綜合得出預(yù)測性、趨勢性的判斷。而在技術(shù)上正是數(shù)字視頻與特征識別安全防范兩大箭頭技術(shù)的交匯點。

安全科技是圍繞打、防兩個方面展開的，基礎(chǔ)都是獲得信息。事發(fā)后的信息是證據(jù)；事發(fā)前的信息是情報，具有預(yù)警的價值。視頻監(jiān)控技術(shù)要加強后者的研究，就是智能化的方向。技術(shù)的發(fā)展是循序漸進的，不會在一夜之間出現(xiàn)革命性的變化。但一個重大的事件帶來的機遇、產(chǎn)生的推動力將會極大地激勵和催化技術(shù)的進步。視頻監(jiān)控技術(shù)正處于這樣的時期，我們應(yīng)該抓住機遇，追求技術(shù)創(chuàng)新、把視頻監(jiān)控技術(shù)提高到一個嶄新的階段。
(中國集群通信網(wǎng) | 責任編輯：陳曉亮)

資訊

方案

會展

招標

終端

企業(yè)

知識堂

對講機

評測

報告

GoTa

TETRA

PDT

DMR

English

圖像內(nèi)容分析——安防系統(tǒng)智能化的突破口(2)