主頁(http://www.130131.com):視頻分析技術(shù)與產(chǎn)品初探 視頻分析與識別(video analyzing and recognition)技術(shù)指的是使用計算機從視頻中通過運算和分析,提取視頻中的有用信息的一項技術(shù),也就是對視頻的“內(nèi)容”的提取和理解。就好像人看到某一段視頻中“有一輛車”、“有一輛白色的車”、“有一輛白色的捷達車”、“有一輛白色的捷達車正在打著右轉(zhuǎn)向燈準(zhǔn)備向右轉(zhuǎn)”。對于人來說,這段視頻是有意義的,是包含了一定信息量的,并且人可以智能化地提取這些信息,獲取“有一輛白色的捷達車正在打著右轉(zhuǎn)向燈準(zhǔn)備向右轉(zhuǎn)”這一信息,而且這一信息包含了“車、白色、捷達、轉(zhuǎn)向燈、開燈、開右轉(zhuǎn)向燈、準(zhǔn)備右轉(zhuǎn)”這一系列的子信息。而視頻分析與識別技術(shù)則是讓計算機來完成這一信息提取和理解的過程,通常也可以簡稱為“視頻分析技術(shù)”。 這里要特別指出的是兩點:一是有時候“視頻分析技術(shù)”也稱為“視頻圖像分析技術(shù)”,為什么呢?這是因為視頻本身是由一系列連續(xù)的圖像組成的(這里不討論視頻壓縮技術(shù),僅指視頻信號通過解壓縮還原后的幀圖像序列),對于視頻內(nèi)容的理解,則建立在對這個“圖像序列”的分析與識別上,因此,二者是等同的,是同樣的含義;二是很多時候視頻中的信息都是十分豐富的,就如上面提到的這段視頻,除了這輛白色捷達車之外,也許還有另外的信息,比如“路邊上站著的是一位穿著深藍色風(fēng)衣的中年男人戴著墨鏡抽著一根煙”,對于同樣一段視頻,我們關(guān)注的對象不同,需要提取的信息也就不同,人的大腦可以處理很復(fù)雜的工作,可以同時將視頻中的大部分信息量一次性提取出來,而對于計算機來說,其智能化水平還比較低,也許只能有針對性地提取部分信息,比如只是提取車的信息或只提取人的信息。但無論是提取什么樣的信息,都屬于一種“視頻分析技術(shù)”。 視頻分析技術(shù) 由于習(xí)慣上的原因,當(dāng)前的視頻分析技術(shù)一般特指從視頻中目標(biāo)運動行為的分析、提取和識別。其所指的含義比之字面意思的含義已大幅縮小。 技術(shù)研究方向 另一個研究方向則以目標(biāo)的局部部分的運動為研究目標(biāo),提取其局部“肢體語言”特征,如視頻的手語識別,步態(tài)識別,表情識別,或者判斷其是否在完成某種行為,如打電話,放下一個包,從某個地方取出或入下一件東西等等。此外,公共場所或文物古跡范圍是否有涂抹蹬踏行為,體育運動里的運動姿態(tài)或運動動作是否最佳,甚至于艦載火炮炮管的旋轉(zhuǎn)運動曲線的研究,所有這些都是屬于這一方向。這一研究方向通常針對的是小視野場景的近景視頻進行研究,而且其研究對象只是屬于目標(biāo)物的局部部分,如分析人的手、腳、頭的動作,其最核心的實現(xiàn)步驟通常包括對研究對象的三維建模。這一研究方向由于要分析的動作比較細致和具體,因此大多屬于那種針對某一具體需求的開發(fā)和應(yīng)用,比較難以出現(xiàn)普適性略高一些的成形產(chǎn)品。 市場發(fā)展?fàn)顩r 雖然針對不同的應(yīng)用需求,產(chǎn)品有著不同的目標(biāo)市場和目標(biāo)用戶,其功能也不盡相同,但其實現(xiàn)過程中很多的核心技術(shù)或?qū)崿F(xiàn)思路卻是一樣的,都需要解決一些共同的難題,然后再針對具體需求來增加一些特殊的處理和運算,使之精度更高,速度更快,準(zhǔn)確率更高。 以第一類的研究方向,即以目標(biāo)整體的運動軌跡的提取和分析為例,雖然其處理的技巧或方法各有不同,各有特色,但從整體的解決方案框架設(shè)計來說,都是先獲取背景,然后提取前景目標(biāo),再分析前景目標(biāo)的運動軌跡曲線,最后由該軌跡曲線的特征來實現(xiàn)對于異常行為的分析。在這一過程中,必然要涉及到的是對于光照、陰影、抖動、模糊等異常狀態(tài)的處理和適應(yīng),使之能適應(yīng)室外光照變化或室內(nèi)的燈泡強弱變化;適應(yīng)各種陰影,包括外界陰影和目標(biāo)物本身的陰影;適應(yīng)攝像頭的抖動和樹葉、水波、光的折射等造成的抖動;適應(yīng)焦距不準(zhǔn)或是雨雪霧天造成的視頻的模糊等。在這些不利的外界環(huán)境條件下仍然能夠準(zhǔn)確地提取目標(biāo)軌跡,分析目標(biāo)行為,能準(zhǔn)確報警并盡可能減少虛警誤警,保證自動監(jiān)測的有效性。在這一同時,又須盡量考慮到運算的速度,算法的復(fù)雜性,以保證報警的及時性。只有這樣,才可能將所開發(fā)的視頻分析技術(shù)轉(zhuǎn)化為可以實際應(yīng)用的產(chǎn)品。
|




