You are on page 1of 4

Capitolo 12

Compressione e standard Video
12.1 Introduzione
Un informazione video, o un video in generale, può essere visto come una sequezna di fotogrammi. Dunque possiamo facilmente intuire che la compressione video è una compressione basata sulla compressione dei precedenti fotogrammi, rispetto a un fotogramma al tempo attuale. E’ dunque una tecnica a sottrazione d’immagine, e l’errore viene successivamente codificato. Dall’analisi di un video come una sequenza di fotogrammi capiamo bene che un video presenta una certa ridondanza temporale: non tutti i fotogrammi sono diversi per cui non devono essere codificati tutti come nuove immagini. Ciò è un aspetto positivo, in quanto andremo a codificare solo l’errore tra fotogrammi successivi, a vantaggio del rateo di compressione. La tecnica di compressione è una tecnica chiamata Motion Compensation (MC) che si basa su alcuni stemp molto importanti:    Stima del movimento con estrazione del vettore di movimento MV; Predizione MC – based Stima dell’errore di predizione

Motion Compensation e ricerca del vettore di movimento MV Ogni fotogramma viene diviso in macroblocchi di dimensione N x N dove per immagini di luminanza N = 16 , mentre N = 8 per immagini di Crominanza. Il meccanismo di ricerca avviene a livello di macroblocchi. Il frame al tempo corrente è detto Target Frame e la ricerca avviene considerando la similarità tra i macroblocchi dei frame antecedenti o successivi al macroblocco del Target Frame. Una volta identificata una corrispondenza il vettore che unisce i due macroblocchi è detto vettore di movimento.

Solitamente il vettore di movimento è nell’intorno di una finestra quadrata tra [-p;p], per cui si prevede che la ricerca debba essere fatta in una finestra piu grande, di dimensioni 2p + 1 x 2p + 1. FASE OPERATIVA DI RICERCA La differenza tra i macroblocchi è misurato con la differenza media asoluta. L’obiettivo principale è quello di trovare un vettore di cordinate (i,j) simile al vettore di movimento MV = (u,v), ossia sia minima la distanza media assoluta.

12.2 Meccanismi di ricerca
I meccanismi di ricerca sono molteplici    Ricerca lineare Ricerca Logaritmica Ricerca gerarchica

Ricerca Lineare Nel caso della ricerca lineare si considerano finestre di ricerca di dimensioni 2p + 1 x 2p + 1 e si effettua: 1. confronto tra macroblocchi pixel a pixel nelle vicinanze di un macroblocco di un frame target, ricordanco che il macroblocco è il blocco centrale della finestra. 2. Si calcola poi la distanza media assoluta e la minore definisce il vettore di movimento MV Il meccanismo di ricerca è però molto dispendioso in quanto la ricerca si definisce con 3 operazioni per ogni pixel, e ricordando che il numero di pixel è ((2p + 1 x 2p + 1)* N*N), allora la complessità è dell’ordine . Ricerca Logaritmica Il meccanismo di ricerca logaritmica è meno dispendioso ma anche meno efficiente del precedente. Non tutti i macroblocchi vengono subito comparati, ma ne vengono comparati solo 9, contrassegnati da un 1. Quello a minore MAD diventa il macroblocco centrale, e ne vengono comparati altri 9 nelle vicinanze del centrale, contrassegnandoli con un 2. Il metodo procede iterativamente fino alla minore MAD che definisce l’effettivo MV. Ricerca Gerarchica La ricerca gerarchica si avvale della struttura gerarchica del ridimensionamento delle immagini. Il metodo infatti permete la valutazione del vettore di movimento considerando immagini riscalate in risoluzione, che definiscono opportuni livelli a partire dal Livello 0 dell’immagine originale.

12.3 Primi standard Video
H.261
L’H.261 è uno dei primi standard video. Inizialmente realizzato per i cellulari, è stato poi utilizzato per le videoconferenze attraverso l’ISDN. Utilizza un meccanismo di compressione del tipo Motion Compensation. Analizziamo la sequenza di frame che compongono un video in H.261.

I frame possono essere di due tipi:   I – Frame: detto anche frame indipendente o Intra Frame utilizza una codifica di trasformazione ti tipo DCT; P – Frame: detto frame dipendente e utilizza una codifica di tipo predittivo

Per quanto riguarda l’I- Frame si implementano caratteristiche per la rimozione di ridondanze temporali, mentre per i P – Frame ridondanze spaziali.

La struttura di un I – Frame è la seguente:    4 macroblocchi di 16 x 16 pixel Un macroblocco 8 x 8 Cb Un macroblocco 8 x 8 Cr

I blocchi 8 x 8 sono processati con DCT, quantizzati, scanditi con tecnica zigzag e ne viene calcolata in fine l’entropia. Per i P – Frame invece dobbiamo ricavare la differenza tra frame target e riferimento, considerando pre ogni macroblocco, la differenza tra taget e riferimento, infine il vettore di movimento considerando le tecniche di ricerca precedentemente prese in cosiderazione. Il risultato è un insieme di macroblocchi che sono di struttura simile agli I – Frame.