You are on page 1of 8

Comparatives de codificació de vídeo

PLATAFORMES DE PUBLICACIÓ I DISTRIBUCIÓ: PAC 1
Jordi Llonch Esteve | CC BY-NC-SA

PLATAFORMES DE PUBLICACIÓ I DISTRIBUCIÓ

PAC 1: Comparatives de codificació de vídeo

Índex
Exercici 1 ............................................................................................................................ 2 Exercici 2 ............................................................................................................................ 3 Exercici 3 ............................................................................................................................ 5 Bibliografia i altres recursos ............................................................................................. 7

JORDI LLONCH ESTEVE

CC BY-NC-SA

PÀGINA 1/7

PLATAFORMES DE PUBLICACIÓ I DISTRIBUCIÓ

PAC 1: Comparatives de codificació de vídeo

Exercici 1
Com a primer pas, ens agradaria obtenir un format del vídeo per a poder emmagatzemar, visualitzar y editar el vídeo des de l'ordinador d’una manera òptima. Per portar-ho a terme, escollim el format M-JPEG amb una resolució de 1024x576. A nivell conceptual, en aquest exercici a més de familiaritzar-nos amb l’entorn de l’eina, treballarem el submostratge de color.

En aquest exercici hem creat dos vídeos nous codificant el vídeo original en M-JPEG i utilitzant dos espais de color diferents: YUV420 i YUV422. Aquests vídeos es diferencien entre si pel procés de mostratge del color aplicat a cada fotograma de cadascun d’ells, la qual cosa resulta en un vídeo amb millor qualitat i més grandària i en un altre de menor qualitat i menor grandària. El vídeo amb YUV422 té un submostratge de 4:2:2 el qual presenta dos components de crominància per cada quatre de luminància. L’altre vídeo, el YUV420 té un submostratge de 4:2:0, que presenta un component de crominància per cada quatre de luminància. Així doncs, tenim que el vídeo que utilitza el submostratge de 4:2:2 disposa de més informació i, per tant, ocupa més espai perquè la compressió és menor que l’altre amb un submostratge de 4:2:0, que ha de comprimir més cada fotograma, resultant en un vídeo amb menys informació i menys espai.

Submostratge 4:2:2

Submostratge 4:2:0

Per veure el descrit anteriorment de manera gràfica, podem comprovar com la poma de la primera imatge està més ben definida que la de la segona.

JORDI LLONCH ESTEVE

CC BY-NC-SA

PÀGINA 2/7

PLATAFORMES DE PUBLICACIÓ I DISTRIBUCIÓ

PAC 1: Comparatives de codificació de vídeo

Exercici 2
En aquest segon cas l’objectiu és realitzar una versió que pugui ser visualitzada en un telèfon intel·ligent de pantalla 800 × 450 píxels. Per aquest entorn, la codificació MPEG-4 AVC es la més habitual. A nivell conceptual, treballarem els dos tipus de bit rate (fixe i variable) i, en el cas del variable, veurem els efectes de manipular la mida del GOP. En aquest exercici hem creat dos vídeos nous codificant el vídeo original en MPEG4 AVC/H.264. Un d’ells s’ha exportat amb una tassa de bits constant (CBR) a 800 kbps i l’altre, amb una de variable (VBR) amb una tassa mitjana de 400 kbps. La variació de mida entre ells dos és espectacular, es pot comprovar una relació de gairebé el doble entre ells, més precisament d’1,82 a 1, deixant el clip que utilitza la tassa variable en només 1,56 MB (davant els 2,84 MB de l’altre). Com hem estudiat, tota reducció de mida sol anar acompanyada d’un sacrifici de qualitat, però en aquest cas la pèrdua de qualitat no resulta massa elevada i el resultat final es pot tolerar tenint en compte que la reproducció serà en un mòbil. Tècnicament, la decisió d’emprar una tassa de bits variable amb una tassa mitjana de la meitat que la de la tassa constant és l’elecció més encertada, ja que permet molta més flexibilitat de compressió, tant en fotogrames amb molt de detall on fa falta una tassa més elevada, com en els que en tenen tan poc que es pot reduir.

En aquesta captura de pantalla es pot veure la imatge diferència dels dos vídeos i es pot comprovar com el vídeo amb la tassa variable presenta errors de compressió a les vores dels objectes i a les zones amb més nivell de detall.
JORDI LLONCH ESTEVE CC BY-NC-SA PÀGINA 3/7

PLATAFORMES DE PUBLICACIÓ I DISTRIBUCIÓ

PAC 1: Comparatives de codificació de vídeo

En la segona part d’aquest exercici partirem de la configuració de l’arxiu de sortida de tassa variable amb una tassa mitjana de 400 kbps al qual li modificarem el GOP per a crear dos clips nous: un amb un GOP de 40 i un altre amb 10. En el nou clip amb GOP de 40 notem una pèrdua de qualitat poc considerable amb respecte amb el clip de 400 kbps de tassa mitjana, de tota manera la mida del clip final s’ha mantingut intacta. Això succeeix perquè la reducció del GOP implica l’existència de més imatges I, les quals ocupen més espai que la resta, però en mantenir la tassa de bits baixa s’han de desar amb una pitjor qualitat. A més a més, les imatges P pateixen una altra reducció de qualitat, ja que es formen a partir de les imatges I. Per acabar, les imatges B acaben rebaixant la qualitat ja que es formen a partir de les imatges de tipus I o P. En el cas del clip amb GOP de 10 succeeix exactament el mateix, però reduint el grup d’imatges de manera encara més dràstica. Això resulta en una qualitat visual molt baixa però obligant a mantenir la mida del clip final pel mateix principi que s’ha explicat al paràgraf anterior.

Imatge diferència 400 kbps / GOP 40

Imatge diferència 400 kbps / GOP 10

Per plasmar el que afirmem en els paràgrafs anteriors, aquestes imatges diferència demostren que la reducció del grup d’imatges disminueix dràsticament la qualitat final del vídeo.

JORDI LLONCH ESTEVE

CC BY-NC-SA

PÀGINA 4/7

PLATAFORMES DE PUBLICACIÓ I DISTRIBUCIÓ

PAC 1: Comparatives de codificació de vídeo

Exercici 3
Com últim cas, ens interessa poder enviar el vídeo a diversos canals de televisió. Per a realitzar això escollirem el còdec MPEG-2 per al vídeo resultant, ja que aquest és l’estàndard actual per a la transmissió de vídeo per televisió. Com que en aquest exercici volem obtenir un GOP amb M=3 i N=9, primer calculem els valors que s’han de posar als camps Number of B frames i Gop Size en el panell de configuració avançada de la configuració del còdec MPEG-2 ff.

Per a fer-ho ens basem en la il·lustració 31 de la pàgina 55 del mòdul Codificació, que disposa de les mateixes característiques que les que demana l’enunciat: M = 3 i N = 9. Això significa que hi ha 6 imatges B i la mida del grup d’imatges és de 9. El resultat d’aquesta compressió és un clip de 47,2 MB, un arxiu 1,63 vegades més gran que l’original, però amb una pèrdua de dades molt superior. Aquesta és la limitació del còdec MPEG-2 si es compara amb el còdec MPEG-4 AVH/h.264, utilitzat en el clip original. La imatge següent mostra la diferència entre el nou clip i l’original.

JORDI LLONCH ESTEVE

CC BY-NC-SA

PÀGINA 5/7

PLATAFORMES DE PUBLICACIÓ I DISTRIBUCIÓ

PAC 1: Comparatives de codificació de vídeo

Si canviem els valors de GOP podem obtenir altres resultats, com ara l’obtingut amb M = 0 i N = 1, el qual representa la compressió mínima possible. Amb aquesta disminució del grup d’imatges s’aconsegueix un clip amb una pèrdua de dades inferior, però amb una mida 3,36 vegades superior. A la imatge diferència següent es pot comprovar aquesta disminució de compressió.

Si comparem les dues imatges diferència anteriors podem comprovar que la diferència de qualitat és gairebé imperceptible a l’ull humà, però la mida del clip final varia substancialment. Per a contrastar, codifiquem el vídeo amb M = 10 i N = 30 (el valor més elevat que permet l’Avidemux). Amb aquesta configuració obtenim un arxiu amb la compressió més gran possible, però sense repercutir amb un descens de la mida de l’arxiu respecte al que hem obtingut amb M = 3 i N = 9. La imatge següent mostra la diferència entre aquest nou clip i l’original:

JORDI LLONCH ESTEVE

CC BY-NC-SA

PÀGINA 6/7

PLATAFORMES DE PUBLICACIÓ I DISTRIBUCIÓ

PAC 1: Comparatives de codificació de vídeo

Bibliografia i altres recursos
Ribelles García, Alexandre. (2013). Plataformes de publicació i distribució. FUOC. Wikipedia. Bit rate. http://en.wikipedia.org/wiki/Bit_rate [data de consulta: març 2013]

La imatge de la portada és de Mourad Mokrane (CC BY 3.0) i el logotip de la UOC és propietat de la Universitat Oberta de Catalunya. La resta d’imatges són variacions d’un fotograma del vídeo Big Buck Bunny, propietat de la Blender Foundation i s’acullen al dret a cita o ús raonable.

JORDI LLONCH ESTEVE

CC BY-NC-SA

PÀGINA 7/7