主頁(http://www.130131.com):淺談現(xiàn)行國際標(biāo)準(zhǔn) 【中國集群通信網(wǎng)】現(xiàn)行國際視頻編碼標(biāo)準(zhǔn) 近年來,視頻編碼技術(shù)得到了迅速發(fā)展和廣泛應(yīng)用,并且日臻成熟,其標(biāo)志是多個(gè)關(guān)于視頻編碼的國際標(biāo)準(zhǔn)的制定。其可分為兩大系列:即國際標(biāo)準(zhǔn)化組織(ISO)和國際電工委員會(huì)(IEC)的運(yùn)動(dòng)圖像專家組MPEG(Motion Picture Expert Group)關(guān)于活動(dòng)圖像的編碼標(biāo)準(zhǔn)MPEG系列,以及國際電信聯(lián)盟(ITU)的視頻編碼專家組VCEG(Video Coding Expert Group)制定的視頻編碼標(biāo)準(zhǔn)H.26X系列。 MPEG4/H.264/AVC標(biāo)準(zhǔn) MPEG4/H.264/AVC是一種有損壓縮,以處理后的圖像無限接近和還原真實(shí)圖像為目標(biāo)。MPEG4/H.264/AVC對(duì)編解碼器如何實(shí)現(xiàn)并沒有明確規(guī)定,而是規(guī)定編碼視頻比特流的句法和該比特流的解碼方法。這種技術(shù),使得各個(gè)廠商的編碼器和解碼器在此框架下應(yīng)能夠互通,在實(shí)現(xiàn)上具有較大靈活性,而且有利于相互競爭。 從圖1和圖2可以看出,MPEG4/H.264/AVC和以前標(biāo)準(zhǔn)(如H.261、H.263、MPEG-1、MPEG-4)的編解碼器功能塊組成并沒有什么區(qū)別,仍是變換和預(yù)測(cè)相結(jié)合的混合編碼法,不同點(diǎn)在于各功能塊的細(xì)節(jié)。
由圖1可見,輸入的幀或場Fn以宏塊為單位被編碼器處理。首先,判定幀是否按幀內(nèi)還是幀間預(yù)測(cè)編碼方式進(jìn)行預(yù)測(cè)。如果采用幀間預(yù)測(cè),其預(yù)測(cè)值PRED(圖中用P表示)由當(dāng)前序列中已編碼并解碼重建和濾波的圖像作為參考圖像(如圖1中的F'n-1),經(jīng)運(yùn)動(dòng)補(bǔ)償(MC)得到。為了提高預(yù)測(cè)精度,從而提高壓縮比,實(shí)際的參考圖像可在過去或未來(指顯示次序上)的重建幀中進(jìn)行選擇。參考圖像選擇的準(zhǔn)確與否,很大程度決定了真實(shí)圖像與呈現(xiàn)圖像之間的差值大小。 預(yù)測(cè)值PRED和當(dāng)前塊的相應(yīng)值相減后,產(chǎn)生一個(gè)殘差塊Dn,經(jīng)塊變換、量化后產(chǎn)生一組量化后的變換系數(shù)X,再經(jīng)熵編碼,與解碼所需的一些信息(如預(yù)測(cè)模式量化參數(shù)、運(yùn)動(dòng)矢量等)一起組成一個(gè)壓縮后的碼流,經(jīng)NAL(網(wǎng)絡(luò)自適應(yīng)層)供傳輸和存儲(chǔ)用。 正如上述,為了提供進(jìn)一步預(yù)測(cè)用的參考圖像,編碼器必須有重建圖像的功能。因此必須使殘差圖像經(jīng)反量化、反變換后得到的Dn'與預(yù)測(cè)值P相加,得到uFn'(未經(jīng)濾波的幀)。為了去除編碼解碼環(huán)路中產(chǎn)生的噪聲,提高參考幀的圖像質(zhì)量和壓縮圖像性能,設(shè)置了一個(gè)環(huán)路濾波器,濾波后的輸出重建圖像Fn'可用作參考圖像。在這一步驟中,重建圖像是通過預(yù)測(cè)值來實(shí)現(xiàn)的,雖然從算法上降低了失誤性,卻進(jìn)一步加大了人為改變?cè)紙D像的因素。 由圖1可知,編碼器的NAL輸出一個(gè)壓縮比特流。該比特流在圖2中經(jīng)熵解碼得到量化后的一組變換系數(shù)X,再經(jīng)反量化、反變換,得到殘差Dn'。 Dn'和該解碼器產(chǎn)生的PRED(與編碼器產(chǎn)生的PRED相同)相加后,得到uFu',經(jīng)濾波后,最后得Fn',F(xiàn)n'即最后的解碼輸出圖像。 JPEG標(biāo)準(zhǔn) 1991年3月ISO/IEC正式通過了靜止圖像壓縮編碼標(biāo)準(zhǔn),稱為JPEG建議。JPEG標(biāo)準(zhǔn)分為基本系統(tǒng)、擴(kuò)展系統(tǒng)和信息保持系統(tǒng)三個(gè)部分。基本系統(tǒng)提供對(duì)順序掃描靜止圖像的高效有損編碼,輸入圖像精度為8bit/像素。 (1)圖3為JPEG基本系統(tǒng)的編解碼器方框圖,輸入的彩色圖像為Y、U、V三個(gè)分量,JPEG對(duì)他們分別進(jìn)行編碼。
(2)編碼時(shí),先將一幀圖像分為互不重疊的8×8像素塊,接著對(duì)各塊進(jìn)行DCT變換,然后對(duì)各變換系數(shù)進(jìn)行線性量化。 量化步長Q應(yīng)結(jié)合人眼視覺敏感性,亮度和色差信號(hào)的量化步長矩陣見表1和表2。
量化后系數(shù)為: 反量化后DCT系數(shù)為: (3)熵編碼,一般采用哈夫曼(VLC)編碼。AC系數(shù)量化后為少數(shù)稀疏的值,大部分為零,采用鋸齒形(Zig-Zag)掃描,然后以游程編碼表示方式進(jìn)行變長的哈夫曼編碼。 (4)數(shù)據(jù)交換格式 熵編碼后得到變長度的碼流。為便于數(shù)據(jù)的交換,JPEG規(guī)定了統(tǒng)一的壓縮后數(shù)據(jù)交換格式,如圖4所示。
第一行:SOI表示圖像數(shù)據(jù)開始;EOI為一幀圖像結(jié)束,各占兩個(gè)字節(jié)。 第二行:表/雜項(xiàng)中放置量化表、哈夫曼表;幀首包括編碼方法、取樣精度、量化系數(shù)、源圖像行數(shù)、每行取樣數(shù)等;DNL重新定義幀內(nèi)的行數(shù)。 第三行:掃描首說明掃描起始信息、分量圖像號(hào)碼、參數(shù)、熵編碼表選擇(ECS);RST為重新開始標(biāo)志。 第四行:為熵編碼區(qū),MCV為最小編碼單元,包括4個(gè)亮度塊,1個(gè)Cr塊和1個(gè)Cb塊。 熵編碼是無損壓縮編碼方式,它生成的碼流可以經(jīng)解碼無失真地恢復(fù)出原數(shù)據(jù)。熵編碼是建立在隨機(jī)過程的統(tǒng)計(jì)特性的基礎(chǔ)上的。 上述可見,JPEG標(biāo)準(zhǔn)的編碼方式,是一種以DCT(Discrete Cosine Transform)為基礎(chǔ)的壓縮方法的壓縮格式,也稱為基線順序編解碼(Baseline Sequential Codec)方法,通過各種算式來降低圖像數(shù)據(jù)量。缺點(diǎn)在于壓縮量有限。這種方法的優(yōu)點(diǎn)是先進(jìn)、有效、簡單、易于交流,因此應(yīng)用廣泛。
M-JPEG標(biāo)準(zhǔn) MJPEG全名為“Motion”JPEG,Motion JPEG技術(shù)是將來自攝像機(jī)的模擬視頻信號(hào)“翻譯”成視頻流,并存儲(chǔ)在硬盤上。典型的應(yīng)用如數(shù)字視頻記錄器等。MJPEG不像MPEG,不使用幀間編碼,因此用一個(gè)非線性編輯器就很容易編輯。MJPEG的壓縮算法與MPEG一脈相承,功能很強(qiáng)大,能發(fā)送高質(zhì)圖片,生成完全動(dòng)畫視頻等。但相應(yīng)地,MJPEG對(duì)帶寬的要求也很高,相當(dāng)于T-1,MJPEG信息是存儲(chǔ)在數(shù)字媒體中的龐然大物,需要大量的存儲(chǔ)空間以滿足如今多數(shù)用戶的需求。因此從另一個(gè)角度說,在某些條件下,MJPEG也許是效率最低的編碼/解碼器之一。 兼顧碼率控制與圖像真實(shí) 視頻是利用人的視覺獲取的信息,它具有直觀性的特點(diǎn),不易和其他信息相混淆,保證了信息的準(zhǔn)確性。同時(shí),由于視覺,可以并行地觀察圖像,因而獲取信息的效率比音頻高得多。
|












