主頁(http://www.130131.com):圖像內(nèi)容分析——安防系統(tǒng)智能化的突破口(2) 圖像內(nèi)容分析 圖像具有極大的信息量,它同時具有空間分辨和時間分辨的能力,但真正把這些信息提取和挖掘出來是復(fù)雜和困難的。前面講了圖像系統(tǒng)智能化的主要標志之一是:系統(tǒng)從目視解釋(視讀)走向機器解釋(機讀)。它意味著:視頻監(jiān)控將改變系統(tǒng)對圖像信息不作任何處理的現(xiàn)狀,處理就是對圖像信息自動的解讀,是理解(understanding)圖像,這就是圖像內(nèi)容分析(video understanding)的含義所在,F(xiàn)在市場上出現(xiàn)了一些IV(intelligent video)產(chǎn)品,都是對圖像內(nèi)容進行基本的分析,如目標的分離、分類、統(tǒng)計,簡單背景下單目標的行為分析和跟蹤。研究機構(gòu)則把它作為重要的課題,開展深入的研究,國家“十一五”科技攻關(guān)就列入了相關(guān)的課題。根據(jù)安全的需求,智能監(jiān)控技術(shù)的發(fā)展過程或圖像內(nèi)容分析技術(shù)的研究可分為以下幾個階段: 1、將(運動)目標從視頻圖像中分離出來。這是體現(xiàn)圖像技術(shù)的優(yōu)勢,實現(xiàn)目標探測的前題。傳統(tǒng)的視頻(運動)探測其實是亮度探測,并沒有發(fā)揮圖像技術(shù)的特點。確定圖像中是否有探測目標(人、物等),并將目標從背景圖像中分離出來是圖像內(nèi)容分析的首要任務(wù),進而對目標分類、統(tǒng)計、關(guān)聯(lián)。判斷圖像中有無目標、目標的復(fù)合或離散等也是圖像過濾的基礎(chǔ)。 2、對目標進行行為分析,判定其運動的方向、方式,并能發(fā)現(xiàn)和告警異常的行為;產(chǎn)生目標的運動軌跡,并能進行目標的自動跟蹤。實現(xiàn)運動目標的跟蹤是很難的事,它要求系統(tǒng)能分析、預(yù)測目標的運動軌跡,并能實時地作出修正。同時,由于運動過程與伺服機構(gòu)間傳遞函數(shù)的非線性,伺服系統(tǒng)也是很復(fù)雜的。 3、在復(fù)雜環(huán)境下實現(xiàn)目標的分離、行為分析和運動跟蹤,特別是實現(xiàn)多目標的跟蹤。 上述兩點目前已有產(chǎn)品和應(yīng)用,但基本上在簡單環(huán)境下,針對少數(shù)目標的情況。在復(fù)雜環(huán)境(既通常的視頻監(jiān)控環(huán)境)下實現(xiàn)這些功能,是圖像內(nèi)容分析技術(shù)具有真正應(yīng)用價值的關(guān)鍵。同時、解決多個圖像的綜合分析,圖像間目標的關(guān)聯(lián),目標跟蹤的連續(xù)。這都是市場迫切需要,目前還沒有解決的問題。 4、實現(xiàn)視頻語義的解析,圖像內(nèi)容分析的最高層次。通過對一個圖像序列作出分析,得出其包含的真實信息,可以與話音的語義解析(已有了初步的成果)結(jié)合起來,逐步實現(xiàn)視頻語義的解析,如通過對大量的、多渠道的圖像資料的分析,得出社會對某一事件的反映程度;分析和統(tǒng)計某類事件發(fā)生,發(fā)展的規(guī)律(概率及時間、地域分布等)。能夠進行這樣分析,表明機器具有了與人一樣的理解圖像的能力,但具有人所不能達到的效率。 這個過程是逐步發(fā)展、與時俱進的,沒有終極的結(jié)果。實現(xiàn)智能監(jiān)控的目標,要經(jīng)過不斷的技術(shù)積累,特別是核心技術(shù)的突破,它需要一個過程,不可能一蹴而就,認為監(jiān)控技術(shù)智能化已經(jīng)實現(xiàn)的觀點是不確切的。 智能監(jiān)控的突破口 1、驗證:是把當事人的身份與正在發(fā)生的行為聯(lián)系在一起,確認其合法性。這是安全防范系統(tǒng)的典型應(yīng)用,把人的生物特征視作一把鑰匙或一張卡。 驗證系統(tǒng)因可對特征的輸入加以更多的控制,系統(tǒng)的可靠性和穩(wěn)定性好,也相對成熟,已廣泛地應(yīng)用于出入管理系統(tǒng)中。它的基本工作方式是把特征輸入裝置讀取的特征與系統(tǒng)存貯的有限量的特征樣本(這些樣本代表了一定的授權(quán))進行比對,來確定請求合法性。通常系統(tǒng)的存貯樣本的數(shù)量不是很多,現(xiàn)場特征輸入的條件又可以加以控制,所以,系統(tǒng)的識別率很高(誤識率和誤拒率很低)。由于生物特征來自人自身,不需要進行同一認證,具有極高的安全性,因此、適用于高安全性要求的場所,如貴重物品的庫房、重要活動或要人訪客的出入管理。 2、識別:對輸入特征與存貯在數(shù)據(jù)庫中的大量的參考進行比對,來確定目標的身份。這樣的系統(tǒng)首先要建立一個海量的基礎(chǔ)樣本數(shù)據(jù)庫,如各城市人口的指紋庫等。對于人臉等生物特征,要求輸入的環(huán)境與建庫的環(huán)境具有足夠的相關(guān)性,以保證輸入特征與樣本特征的可比性。所以,建立一個稍加控制的環(huán)境,以排除或限制影響特征采集不真實(失真、不完整、偽裝)的各種因素是系統(tǒng)應(yīng)用的必要條件。如邊防檢查系統(tǒng)設(shè)立專門的人員通道來采集出入境人員的面部特征;機場安檢信息系統(tǒng)在驗征臺處攝取旅客的面部圖像。 兩者都是對個體身份的認證,都要求有一個限定的工作環(huán)境,這一點通常的視頻監(jiān)控系統(tǒng)是做不到的,而且,它們的工作目標也不是對人體的身份認證。所以,必須在驗證與識別之間選擇新的切入點。 圖像內(nèi)容分析成為智能監(jiān)控的突破口就在于:它是在通常的視頻監(jiān)控的環(huán)境下(如3111工程所建的系統(tǒng))實現(xiàn)上述的功能。它對現(xiàn)行系統(tǒng)是錦上添花的方式,不影響現(xiàn)行系統(tǒng)的運行和使用,逐步完善、增加系統(tǒng)功能實現(xiàn)安防系統(tǒng)的智能化。更重要的是,它不僅是提取圖像的表面信息(生物特征),而是挖掘并表述圖像承載的深層信息,通過對圖像序列的分析和多源圖像的綜合得出預(yù)測性、趨勢性的判斷。而在技術(shù)上正是數(shù)字視頻與特征識別安全防范兩大箭頭技術(shù)的交匯點。 安全科技是圍繞打、防兩個方面展開的,基礎(chǔ)都是獲得信息。事發(fā)后的信息是證據(jù);事發(fā)前的信息是情報,具有預(yù)警的價值。視頻監(jiān)控技術(shù)要加強后者的研究,就是智能化的方向。技術(shù)的發(fā)展是循序漸進的,不會在一夜之間出現(xiàn)革命性的變化。但一個重大的事件帶來的機遇、產(chǎn)生的推動力將會極大地激勵和催化技術(shù)的進步。視頻監(jiān)控技術(shù)正處于這樣的時期,我們應(yīng)該抓住機遇,追求技術(shù)創(chuàng)新、把視頻監(jiān)控技術(shù)提高到一個嶄新的階段。
|




