1.1視頻壓縮與傳輸技術(shù)
視頻壓縮原理 : 運動估算與補償預測
基于塊的視頻編碼技術(shù),假定圖像塊的運動是平移,即認為當前幀中某塊是由參考幀中的某塊按照水平和垂直方向的平移而得到的,這個平移的距離和方向稱為運動向量。

從參考幀中查找與當前編碼塊的最佳匹配塊的過程稱為運動估算。估算的前提是假設(shè)兩幀圖像塊在時間和空間上沒有光線的變化,即對應(yīng)像素亮度和顏色是一致的。

設(shè)計色標識別
塊尺寸的劃分和選擇
傳統(tǒng)標準的塊尺寸為:16×16像素
H.264將塊尺寸分為:7種


H.264/AVC介紹
JVT(Joint Video Team,視頻聯(lián)合工作組)于2001年12月在泰國Pattaya成立。它由ITU-T和ISO兩個國際標準化組織的有關(guān)視頻編碼的專家聯(lián)合組成。JVT的工作目標是制定一個新的視頻編碼標準,以實現(xiàn)視頻的高壓縮比、高圖像質(zhì)量、良好的網(wǎng)絡(luò)適應(yīng)性等目標。目前JVT的工作已被ITU-T接納,新的視頻壓縮編碼標準稱為H.264標準,該標準也被ISO接納,稱為AVC(Advanced Video Coding)標準,是MPEG-4的第10部分。
H.264/AVC的技術(shù)特征
• 分層設(shè)計
H.264的算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內(nèi)容表示,網(wǎng)絡(luò)提取層(NAL:Network Abstraction Layer)負責以網(wǎng)絡(luò)所要求的恰當?shù)姆绞綄?shù)據(jù)進行打包和傳送。在VCL和NAL之間定義了一個基于分組方式的接口,打包和相應(yīng)的信令屬于NAL的一部分。這樣,高編碼效率和網(wǎng)絡(luò)友好性的任務(wù)分別由VCL和NAL來完成。
• 高精度、多模式運動估計
H.264支持1/4或1/8像素精度的運動矢量。在1/4像素精度時可使用6抽頭濾波器來減少高頻噪聲,對于1/8像素精度的運動矢量,可使用更為復雜的8抽頭的濾波器。在進行運動估計時,編碼器還可選擇"增強"內(nèi)插濾波器來提高預測的效果。
在H.264的運動預測中,一個宏塊(MB)可以按圖2被分為不同的子塊,形成7種不同模式的塊尺寸。這種多模式的靈活和細致的劃分,更切合圖像中實際運動物體的形狀,大大提高了運動估計的精確程度。
在H.264中,允許編碼器使用多于一幀的先前幀用于運動估計,這就是所謂的多幀參考技術(shù)。
• 4×4塊的整數(shù)變換
H.264與先前的標準相似,對殘差采用基于塊的變換編碼,但變換是整數(shù)操作而不是實數(shù)運算,其過程和DCT基本相似。這種方法的優(yōu)點在于:在編碼器中和解碼器中允許精度相同的變換和反變換,便于使用簡單的定點運算方式。
• 統(tǒng)一的VLC
H.264中熵編碼有兩種方法,一種是對所有的待編碼的符號采用統(tǒng)一的VLC(UVLC :Universal VLC),另一種是采用內(nèi)容自適應(yīng)的二進制算術(shù)編碼(CABAC:Context-Adaptive Binary Arithmetic Coding)。
• 幀內(nèi)預測
在先前的H.26x系列和MPEG-x系列標準中,都是采用的幀間預測的方式。在H.264中,當編碼Intra圖像時可用幀內(nèi)預測。它不是在時間上,而是在空間域上進行的預測編碼算法,可以除去相鄰塊之間的空間冗余度,取得更為有效的壓縮。
• 面向IP和無線環(huán)境
H.264草案中包含了用于差錯消除的工具,便于壓縮視頻在誤碼、丟包多發(fā)環(huán)境中傳輸,如移動信道或IP信道中傳輸?shù)慕研浴?br />
1.2 圖形圖像處理
數(shù)字圖像處理又稱為計算機圖像處理,它是指將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機對其進行處理的過程。數(shù)字圖像處理主要研究的內(nèi)容包括:
• 圖像變換
• 圖像編碼壓縮
• 圖像增強和復原
• 圖像分割
• 圖像描述
• 圖像分類(識別)
上一篇:建好網(wǎng)站對企業(yè)信息化建設(shè)的至關(guān)作用
下一篇:視頻采集、截圖多媒體處理工具FFmpeg