AVS-S音視頻監(jiān)控標準介紹及展望

時間：2008-07-30　來源：胡瑞敏、牟曉弦、路依莎武漢大　作者：顧小軍　點擊：次

主頁（http://www.130131.com）：AVS-S音視頻監(jiān)控標準介紹及展望

繼上一期刊登《AVS視頻和音頻編碼標準的應用》之后，本期通過分析安防產(chǎn)業(yè)的發(fā)展現(xiàn)狀以及其對視頻監(jiān)控的特殊需求，介紹了國有自主知識產(chǎn)權面向安防的音視頻標準AVS-S在安防視頻監(jiān)控核心技術上的重要性，制定的目的意義及其關鍵技術，進一步分析了需要解決的技術問題和相關技術方案，希望有助于推動安防監(jiān)控產(chǎn)業(yè)的健康可持續(xù)發(fā)展。
文/胡瑞敏、牟曉弦、路依莎武漢大學國家多媒體軟件工程技術研究中心

面向安防的數(shù)字音視頻監(jiān)控標準（AVS-S）是中國制定的具有自主知識產(chǎn)權的新一代音視頻編解碼標準。相對于現(xiàn)存標準如MPEG-2、MPEG-4、MPEG-4 AVC（簡稱AVC，也稱JVT、H.264）、AVS，及其它私有標準而言，其特有的最大優(yōu)點就是能夠滿足目前安防產(chǎn)業(yè)的特殊需求，以解決阻礙國內(nèi)安防產(chǎn)業(yè)健康持續(xù)發(fā)展的專利壁壘等問題，為安防產(chǎn)業(yè)發(fā)展帶來了新的契機。

標準傾向于接受比較成熟的技術，因此有些技術比如面向?qū)ο蟮木幋a，雖然是安防領域所需要的技術，但不宜寫入標準中。制定AVS-S的總體目標是為迅速發(fā)展的公共安全與監(jiān)控領域設備提供音視頻解碼、系統(tǒng)、版權保護和文件格式等方面的規(guī)范，而需要滿足的公共安全與監(jiān)控領域的音視頻編碼需求為：能適應多種網(wǎng)絡情況，支持通過專網(wǎng)、互聯(lián)網(wǎng)、無線網(wǎng)絡等傳輸，支持實時的碼率可調(diào)，支持感興趣區(qū)域的高質(zhì)量編碼，支持光線環(huán)境變化的優(yōu)化編碼，支持位置信息等輔助信息疊加，面向存儲的優(yōu)化編碼。

信息產(chǎn)業(yè)部科學技術司早就在2002年12月正式發(fā)文成立“數(shù)字音視頻編解碼技術標準AVS工作組”，負責數(shù)字音視頻等多媒體設備與產(chǎn)品中的壓縮、解壓縮、處理和表示等技術標準的制定工作。AVS標準組聯(lián)合公安部第一研究所、武漢大學國家多媒體軟件工程技術研究中心、TC100、北京大學等單位綜合了安防需求，經(jīng)過專家和企業(yè)代表多次討論與一致認同，抽象出視頻監(jiān)控領域?qū)?shù)字音視頻編解碼技術標準的需求，并作為輸出文檔進行標準化，成為今后AVS-S制定的需求目標。

新標準為安防產(chǎn)業(yè)打造嶄新的前景

安防行業(yè)的特殊需求
視頻編解碼技術是視頻監(jiān)控的實現(xiàn)基礎和關鍵技術，視頻監(jiān)控在不斷發(fā)展的同時，對視頻編解碼技術的需求也在不斷提高。在最初的監(jiān)控系統(tǒng)中，視頻處理技術僅僅用來壓縮存儲數(shù)字化的視頻信息。隨著監(jiān)控系統(tǒng)網(wǎng)絡化和智能化的發(fā)展，安防領域有著壓縮存儲需求、顯示和播放需求、網(wǎng)絡QoS需求、安全性需求、交互性需求等一系列新的應用需求。對于每一類應用需求來說，會有不同層次的技術需求來不同程度地滿足應用需求，表1為應用需求到技術需求的映射。根據(jù)標準的性質(zhì)，不同的技術在標準中實現(xiàn)的優(yōu)先級是不一樣的。一般說來，成熟且迫切需要的技術是優(yōu)先采用，不夠成熟的技術或者實際需求有限的技術暫緩考慮。

新標準能夠彌補現(xiàn)存標準的瓶頸
目前安防產(chǎn)業(yè)可以選擇的信源編碼標準有四個：MPEG-2、MPEG-4、MPEG-4 AVC（簡稱AVC，也稱JVT、H.264）、AVS。從制訂者分，前三個標準是由MPEG專家組完成的，第四個是我國自主制定的。從發(fā)展階段分，MPEG-2是第一代信源標準，其余三個為第二代標準。從主要技術指標——編碼效率比較：MPEG-4是MPEG-2的1.4倍，AVS和AVC相當，都是MPEG-2兩倍以上�？梢酝茰y，MPEG-2技術陳舊需要更新及收費較高；MPEG-4出臺的新專利許可政策被認為過于苛刻令人無法接受；H.264編碼效率較高但是專利收費較為昂貴；同時目前的AVS標準不滿足安防領域的特殊需求，而其它私有標準又無法實現(xiàn)不同系統(tǒng)的互通。因此，即使專利收費問題能夠得到解決，這些現(xiàn)存標準也并不能夠有效地適合安防行業(yè)的各種特殊需求，現(xiàn)實迫切需要制定新的標準。

AVS-S的關鍵技術

目前，TC100和AVS兩個標準化已經(jīng)同意共同開展面向安防監(jiān)控的音視頻編解碼標準（AVS-S）的制定。AVS-S現(xiàn)在的技術處于制定階段，預計明年可以制定完畢。

AVS-S在視頻編碼的混合框架基礎之上，研究空域時域和質(zhì)量可分級技術，實現(xiàn)多碼流和時間空間分辨率的調(diào)整。然后，以此編碼框架為基礎，結合安防的特殊需求，逐項研究其解決算法，并在編碼框架中添加對于這些特殊技術的語法語義和編解碼結構上的支持。具體的技術要點敘述如下。

可分級視頻編碼框架
圖1所示的編碼框架基于現(xiàn)有的編碼技術進行擴展，首先對視頻流進行空域上的下采樣，實現(xiàn)空域上的分層，其中，空間分辨率最小的層為基本層，每層可按照現(xiàn)有的編碼技術分別編碼。由于各層之間存在一定的相關性，考慮到計算復雜度，增強層可以復用基本層的運動信息。對于每一層可以進一步劃分時域上的層次，通過調(diào)整視頻序列結構，調(diào)整B幀的數(shù)量，以實現(xiàn)時域上的可分級性。而質(zhì)量上的可分級性可以分別在每一層的變化和量化模塊，通過調(diào)整量化系數(shù)來實現(xiàn)。通過這樣的編碼框架，視頻流具有一定的帶寬自適應能力、抗誤碼性能和更好的解決安防特殊需求的能力。

重點監(jiān)控對象區(qū)域的分割
將可分級技術和對象編碼技術相結合，對重點監(jiān)控對象分配較多的碼率進行高質(zhì)量的壓縮，而對于背景或其它不重要的監(jiān)控區(qū)域進行一般的壓縮。這樣，在保證視頻質(zhì)量的基礎上大幅地提高視頻壓縮率，減少需要的存儲空間和傳輸帶寬。
需要提出的是，目前對象分割算法的復雜度是非常高的，精細準確的分割對象很難實際應用。

研究具有防偽功能的數(shù)字視頻水印技術及視頻加密算法
視頻水印技術在壓縮視頻流中提供防偽信息，并提供時間、地點信息的疊加等功能，支持OSD、LOGO和區(qū)域屏蔽，以及日期和時間的設置。它利用數(shù)據(jù)隱藏技術將特定的信息嵌入到視頻數(shù)據(jù)中，保證重要數(shù)據(jù)的安全，防止資料被篡改和被偽造�？山梃b圖像水印技術大量的研究成果，同時基于視頻與圖像某些本質(zhì)的差異，重點研究視頻水印和圖像水印不同的技術特征。

面向環(huán)境的優(yōu)化編碼和快速檢索技術
為了進一步提高編碼壓縮效率，可以根據(jù)光線環(huán)境的變化來調(diào)節(jié)編碼器模式。為了達到優(yōu)化編碼的目的，可以考慮構建編解碼標準的時候，將幾類典型的應用環(huán)境分級，對不同的級別設定不同的編碼級別�？煞旨壘幋a技術能夠比較方便地解決檢索的速度問題。由于基本層的視頻序列具有比較小的分辨率和幀率，所以可以在基本層上進行檢索。當檢索到需要的內(nèi)容的時候，再解碼出相應的增強層信息，以最好的質(zhì)量來供調(diào)查取證。這樣既可以降低檢索的復雜度，又保證了取證的質(zhì)量。
(中國集群通信網(wǎng) | 責任編輯：陳曉亮)

資訊

方案

會展

招標

終端

企業(yè)

知識堂

對講機

評測

報告

GoTa

TETRA

PDT

DMR

English

AVS-S音視頻監(jiān)控標準介紹及展望