主頁(http://www.130131.com):4G圖傳移動執(zhí)法視頻壓縮技術(shù)淺述 視頻壓縮淺述 對于算法研究而言,本身就是要先知道哪個地方可以努力,哪些地方行不通。這些原理,就是指明方向的。 一.視頻壓縮的可行性 1.空間冗余 一幅靜態(tài)圖像,比如人臉。背景,人臉,頭發(fā)等處的亮度,顏色,都是平緩變化的。相鄰的像素和色度信號值比較接近。具有強相關(guān)性,如果直接用采樣數(shù)來表示亮度和色度信息,數(shù)據(jù)中存在較多的空間冗余。如果先去除冗余數(shù)據(jù)再編碼,表示每個像素的平均比特數(shù)就會下降,這就是通常說的圖像的幀內(nèi)編碼,即以減少空間冗余進行數(shù)據(jù)壓縮。 2.時間冗余 視頻是時間軸方向的幀圖像序列,相鄰幀圖像的相關(guān)性也很強。通常用降低幀間的方法來減少時間冗余。采用運動估計和運動補償?shù)募夹g(shù)滿足解碼重建圖像的質(zhì)量要求。 3.符號冗余 用相同碼表示概率不同的符號,會造成比特數(shù)的浪費。比如10,11,13三個數(shù),如果我們都用1bytes來表示,就是3bytes(即3×8 = 24bits),但是如果我們表00b表示10,01b表示11,02b表示13,這樣,三個數(shù)合起來才用了6bits,較之前可以節(jié)省18bits。 可變長編碼技術(shù)的原理就如此,概論大的用較短的碼字,概率小的用較長的碼字。 4.結(jié)構(gòu)冗余 對于圖像內(nèi)部,各個部分也存在某種關(guān)系。我們可以通過這種關(guān)系,減少信息的碼字表達。比如:分形圖像編碼 5.視覺冗余 1),人眼對彩色信號的亮度分辨率高于色彩分辨率,比如rgb-->yuv就是這個原理 2),人眼對靜止圖像的空間的分辨率大于運動圖像的分辨率。 3),人眼對亮度的細小變化不敏感 4),中心敏感,四周不敏感。 其實我們雖然知道了這些,我們知道有冗余,但是如何把這些冗余找出來,是個很復(fù)雜的過程。也是我們的算法不斷追求的過程。 上面的一段,是所有視頻壓縮標(biāo)準的基石。mpeg2,mpeg4,h264,h265這些標(biāo)準,與其說他們是標(biāo)準,不如他們提供了一些算法的組合,或簡單或復(fù)雜,當(dāng)然簡單的算法壓縮掉的冗余小,復(fù)雜的壓縮掉的冗余大。通過算法找到冗余信息在哪,然后壓縮掉,實現(xiàn)數(shù)據(jù)量的減小。這就是我們的目錄。 更近一步的說,就是我們?nèi)绾握页鰯?shù)據(jù)的相關(guān)性。 二,常見算法的名詞解釋 大的分類有兩種,一個變換,一個是編碼。 先說變換 我們要找出信號的相關(guān)性,時間上不好找怎么辦,變換到另外一個空間上去。這就是我們在信號與系統(tǒng),數(shù)字信號處理,高等數(shù)學(xué)得到的結(jié)論 變 換
對于這些變換來說,很多東西只在數(shù)學(xué)上有意義,對于工程來說,或者沒有快速算法,或者變換后相關(guān)性比較低,或者其他原因。只有余弦變換是最最廣泛的,為了減小我們的學(xué)習(xí)壓力(當(dāng)然如果你是要對比其中的差異的另當(dāng)別論),我們只掌握余弦變換就可以了。 編 碼 又分無失真編碼與限失真編碼,從名字上我們就可以看出差異了。呵呵,不多解釋 無失真編碼的種類:
對于編碼這塊,上述的算法,基本要全部掌握才行。 jpeg/mpeg2先用了游程編碼減小的0這個數(shù)占用的比特位,然后用了哈夫曼壓縮。 h264用了算術(shù)編碼來做最后一道壓縮工序 運動補償與運動估計,用到預(yù)測編碼。 mpeg4用到了基于模型的編碼 變換完成后,進行了矢量量化。 (中國集群通信網(wǎng) | 責(zé)任編輯:李俊勇) |



