You are on page 1of 5

Principii ale codarii digitale în MPEG

În televiziunea digitală standard SDTV (Standard Definition Television)semnalul digital are un debit de
informatie de 270 Mbit/s, mult prea mare pentrua putea fi transmis prin canalele de televiziune. Este necesara
compresia acestuiade la 270 Mbit/s la (2-6) Mbit/s, pentru aceasta utilizându-se mai multemecanisme de
reducere a informatiei redundante şi a informatiei irelevante din fluxul de date.
Informatia redundanta este informatia care se repeta de mai multe ori în fluxul de date, sau informatie
care poate fi reconstituita la receptie prin procedee matematice.
Informatia irelevanta, în cazul semnalului video, este informatia care nu poate fi perceputa de simturile
umane. Astfel, daca tinem cont ca ochiul uman contine mai putini receptori sensibili la culoare decât la lumina
se poate renunta la a transmite detaliile fine de culoare, ceea ce înseamna o reducere a benzii semnalului
corespunzator informatiei de culoare.
Tehnicile de compresie utilizate în codarea imaginilor TV prin aplicarea MPEG se bazeaza pe urmatoarele
particularitati:
· sistemul vizual uman este mai sensibil la luminanta imaginii decât la crominanta acesteia. Ca urmare,
se vor transmite mult mai putine informatii (date) despre culoare;
· ariile adiacente din interiorul unei zone de imagine au pixeli cu aceeaşi luminanta şi aceeaşi
crominanta. Ca urmare, pentru aceste arii codarea va contine mai putine informatii (date);
· cuantizare – codificarea se va aplica numai diferentelor dintre imaginea unui cadru şi a urmatorului
cadru. Aceste proces este precis definit printr-o structura GOPs (Group Of Pictures) formata din 12 cadre de
imagine, rezultat al diferentei de predictie precedate de un cadru de imagine complet cuantizat – codificat;
· adoptarea formatului digital de codare 4:2:0 MP@ML (Main Profile @ Main Level) prin care la
fiecare 4 eşantioane de luminanta se transmit numai 2 eşantioane de crominanta.

Procedee de compresie a semnalului video folosite în MPEG


Potrivit standardului ISO/IEC 13818 (MPEG-2) reducerea vitezei de transmisie, prin micşorarea
debitului de informatie, se face parcurgând urmatorii paşi [ISO95]:
a. Reducerea cuantizarii semnalului obtinut conform standardului ITU-R BT 601 de la 10 biti la 8 biti
(reducerea irelevantei);
b. Excluderea intervalelor de stingere pe verticala şi pe orizontala (reducerea redundantei);
c. Reducerea rezolutiei pe verticala a semnalului de culoare (reducerea irelevantei);
d. Modularea diferentiala în cod a impulsurilor pentru imaginile în mişcare (reducerea redundantei);
e. Utilizarea transformatei cosinus discrete (DCT) urmata de cuantizare (reducerea irelevantei);
f. Scanare în zig-zag
g. Codare Huffman, codarea cu lungime variabila (reducerea redundantei);
a. Reducerea vitezei de transmisie prin reducerea cuantizarii semnalului obtinut conform
standardului ITU-R BT 601 de la 10 biti la 8 biti.
În cazul semnalului video analogic, daca raportul semnal/ zgomot ponderat referitor la nivelul de alb
este mai bun de 48 dB (valori normale de peste 63dB) zgomotul nu este perceput de ochiul uman. În cazul
semnalului digital video, daca se realizeaza conversia analog digitala utilizând pentru cuantizare 8 biti în loc de
10, va creşte zgomotul de cuantizare fara a fi depaşit pragul de perceptibilitate al ochiului. Reducerea debitului
de informatie rezulta din urmatoarele calcule:
- Debitul semnalului de luminanta = 13,5 MHz • 8 (10) biti = 108 (135) Mbit/s
- Debitul semnalelor de crominanta = 2 • (6,75 MHz • 8 (10)) biti = 108 (135) Mbit/s
- Debtiul total al semnalului video = 2 • 108 (135) Mbit/s = 216 (270)Mbit/s
Prin trecerea de la cuantizarea cu 10 biti la 8 biti se obtine o reducere a debitului de informatie, deci a vitezei de
transmisie, cu 54 Mbit/s, ceea ce reprezinta, în procente, o reducere cu 20% a debitului de 270 Mbit/s.
b. Reducerea vitezei de transmisie prin excluderea intervalelor de stingere pe verticala şi pe orizontala
Potrivit standardului ITU-R BT 601 intervalele de stingere pe orizontala şi pe verticala nu contin nicio
informatie relevanta, nici macar teletext, care se insereaza în fluxul digital TV sub forma de pachete de date
intercalate cu celelate pachete cu informatii video sau audio.
În urma eşantionarii rezulta un numar de 864 de eşantioane / linie, respectiv de pixeli, iar daca se
renunta la intervalul de stingere pe orizontala H se obtin 720 pixeli activi pe o linie digitala. Pentru semnalele
de culoare numarul de pixeli / linie activa va fi de 360.
Pentru standardul cu 625 de linii pentru un cadru de imagine, pentru durata activa a cadrului de 18,4 ms
sunt dedicate 576 de linii active vizibile şi deci tot atâtia pixeli pe verticala cadrului de imagine.
Deci, în MPEG intervalele de stingere pe orizontala şi pe verticala sunt scoase complet din continutul de
date al cadrelor şi înlocuite prin codurile SAV (Start Active Video Line) şi EAV (End Active Video Line).
Intervalele de stingere pe orizontala şi pe verticala pot fi reconstituite la receptie pe baza pachetelor digitale
SAV şi EAV (fig. 1.).
În figura 1 se prezinta imaginea locatiei eşantioanelor şi a pachetelor digitale de cod EAV şi SAV în
concordanta cu un cadru TV. Informatia de sincronizare de timp pentru linii este purtata de pachetele de sfârşit
de linie activa video (EAV) şi de început de linie activa video (SAV), motiv pentru care nu este nevoie de
semnale conventionale de sincronizare. Intervalul de stingere pe orizontala şi intervalele tuturor liniilor cuprinse
pe durata intervalului de stingere pe verticala pot fi folosite pentru transportul unor date auxiliare.

Pachetele de sincronizare SAV şi EAV, pentru televiziunea digitala standard sunt identificate în fluxul de date
printr-un header format numai din 4 cuvinte (pentru HDTV sunt 8 cuvinte) începând de la: 3FFh, 000h, 000h.
Pachetele de sincronizare SAV şi EAV sunt necesare a fi transmise pentru ca la receptie sa poata fi
refacuta, la nevoie, structura liniei analogice pentru sistemele de televiziune cu redare analogica.
În concluzie, tinând cont de poderile celor doua intervale de stingere H şi V, prin netransmiterea lor se
realizeaza o reducere a vitezei de transmisie cu aproximativ 25%. Astfel, prin excluderea intervalelor de
stingere pe orizontala H şi pe verticala V, debitul de informatie scade la 166 Mbit/s.
c. Reducerea vitezei de transmisie prin reducerea rezolutiei pe verticala a semnalului de culoare
Standardul digital principal 4:2:2 se refera prin seria de trei numere la raportul frecventei de eşantionare
(precum şi pentru alti parametri) pentru semnalul de culoare fata de componenta de luminanta. Pentru
transmisiile de televiziune digitala (DVB) este folosit standardul de codare 4:2:0 prin care se reduce informatia
de crominanta ce se transmite de la o linie la alta comparativ cu standardul primar 4:2:2 şi cu standardul
superior de conversie 4:4:4.
Reprezentarile din figura 2 pun în evidenta modul de asociere şi de preluare ca informatie a pixelilor de
luminanta Y şi de crominanta pentru componentele de culoare Cr, Cb în procesul de eşantionare – cuantizare –
codare a imaginilor (cadrelor) TV, în cazul standardelor mai sus mentionate.
În cazul standardului superior 4:4:4 pentru fiecare eşantion din imagine se transmite ca informatie un
pixel de luminanta, un pixel pentru componenta de culoare Cr şi un pixel pentru componenta de culoare Cb.
În cazul standardului primar 4:2:2 pentru fiecare eşantion din imagine se transmite ca informatie un pixel de
luminanta, apoi din doua în doua eşantioane ale fiecarei linii TV se mai transmit doi pixeli de crominanta unul
Cr şi altul Cb.

Figura 2 Gruparea pixelilor de informație în funcție de standardul de codare

În cazul standardului 4:2:0 adopatat în codificarea MPEG pentru reducerea debitului de informatie,
bazat pe sensibilitatea mult mai mica la culoare fata de luminanta a sistemului vizual uman, informatia de
crominanta se transmite doar din doua în doua linii şi doar pentru fiecare al doilea eşantion din linie. Astfel, la
fiecare grupare de 4 pixeli de luminanta se transmit câte doi pixeli de crominanta, unul pentru componenta Cr şi
altul pentru componenta Cb. Din reprezentare se desprinde observatia ca în cazul MPEG 4:2:0, informatia de
crominanta Cr şi Cb se transmite din 3 în 3 linii.
Exemplu de calcula ratei de bit
Calculul ratei de bit pentru doua standarde des utilizate (4:2:2 şi 4:2:0) în acord cu eşantionarea unui cadru de
imagine cu 576 de linii şi 720 eşantioane pelinie (pentru sistemul PAL), la o frecventa de cadre de 25 Hz şi o
codare cu 8 biti pe eşantion, presupune:
· pentru 4:2:2 ((720x576)eşY x 8 biti x 25Hz) + ((360x576)eşCr x 8 biti x 25Hz) + ((360x576)eşCb x 8 biti x
25Hz) = 166 Mbit/s
· pentru 4:2:0 ((720x576)eşY x 8 biti x 25Hz) + ((360x288)eşCr x 8 biti x 25Hz) + ((360x288)eşCb x 8 biti x
25Hz) = 124 Mbit/s
Ca urmare, prin reducerea pe verticala a rezolutiei informatiei decrominanta (Cr, Cb) se realizeaza o
reducerea cu înca 25% a debitului de informatie transmis, ceea ce are ca rezultat o scadere a debitului de
informatie la 124 Mbit/s în cazul standardului de definitie 4:2:0, ceea ce confera capabilitatii MPEG-2 o
compresie a ratei de bit cuprinsa între 3 şi 15 Mbit/s. Pentru televiziunea digitala terestra standardul de definitie
4:2:0 asigura o compresie a ratei de bit la 6 Mbit/s ceea ce reprezinta un bun compromis între calitatea imaginii
TV şi o banda de transmisie utilizata eficient.
Recapitulând, prin aplicarea unor procedee relativ simple, au fost realizate urmatoarele reduceri:
Ø de la Semnal de studiou (conform ITU-R BT 601) = 270 Mbit/s
Ø Reducerea cuantizarii de la 10 la 8 biti (-20%) = 216 Mbit/s
Ø Excluderea intervalelor de stingere H şi V (-25%) = 166 Mbit/s
Ø Reducerea rezolutiei pe verticala a semnalelor de culoare (-25%) = 124 Mbit/s
Debitul de informatie de 124,5 Mbit/s obtinut prin aplicarea procedeelor de mai sus este înca mare
pentru a fi utilizat în procesul de prelucrare în vederea transmisiei TV ceea ce impune parcurgerea şi a altor
procese cu un grad mai mare de reducere a debitului de informatie, fara alterarea continutului acesteia.

d. Reducerea vitezei de transmisie prin modularea diferentiala în cod a impulsurilor pentru imaginile în
mişcare
De regula, în televiziune imaginile în mişcare (cadrele consecutive) difera foarte putin între ele. Cadrele
de imagine pot contine arii stationare în care continutul nu se schimba de la un cadru la altul, arii care îşi
schimba doar pozitia şi arii sau elemente noi care apar în continutul imaginii. În cazul în care s-ar transmite
fiecare cadru complet de fiecare data, s-ar transmite şi informatia care se repeta de la un cadru de iamgine la
altul. Astfel s-ar acumula un debit tot mai mare de informatie. Ca urmare se poate micşora debitul de informatie
daca se va transmite numai informatia diferenta de la un cadru la altul. Aceasta metoda se numeşte modularea
diferentiala a impulsurilor în cod - DPCM (Differential Pulse Code Modulation).
În MPEG principiul modularii diferentiale a impulsurilor în cod se aplica în blocurile şi
macroblocurile în care este structurata imaginea (cadrul) de televiziune. Blocurile sunt rezultatul explorarii
imaginii captate pe suprafata senzorului de imagine din dispozitivul video captor de televiziuine. În urma
acestui proces de explorare imaginea captata (cadrul TV) este descompusa în fâşii, fiecare având pe verticala 16
eşantioane (pixeli). Fâşiile sunt şi ele împartite în blocuri patrate cu dimensiunea de 16x16 pixeli pentru
semnalul de luminanta şi cu dimensiunea de 8x8 pixeli pentru semnalele de culoare (fig.2).
Pentru semnalul MPEG-2 eşantionarea se face potrivit formatului 4:2:0 astfel încât fiecarui bloc de
luminanta de 16x16 pixeli, care în fapt contine 4 blocuri de 8x8 pixeli, îi corespunde câte un bloc de 8x8 pixeli
pentru componenta de culoare Cb, respectiv 8x8 pixeli pentru componenta Cr. Acest tip de aranjament poarta
denumirea de macrobloc (fig.2), fiecare macrobloc 4:2:0 este format din 4 blocuri de luminanta a 8x8 pixeli
fiecare şi 2 blocuri de crominanta Cr şi Cb, fiecare tot din câte 8x8 pixeli. Procesul de împartire pe blocuri şi
macroblocuri are loc înaintea procesului de codare a imaginii.
Un singur cadru TV este compus dintr-un numar fix de macroblocuri, functie de rezolutia imaginii,
astfel încât numarul de pixeli pe orizontala şi pe verticala trebuie sa fie divizibil cu 16, respectiv cu 8, de aici şi
standardul privind numarul de pixeli pe orizontala şi verticala (de exemplu standardul 720x576 pixeli).

Fig. 2 Dtructura unui macrobloc dintr-o fâșie a unui cadru TV pentru standardul 4:2:0 în procesare
MPEG
Codarea imaginii în MPEG se face utilizând trei algoritmi diferiti, algoritmi care se bazeaza pe utilizarea
transformatei cosinus discrete şi care are ca rezultat obtinerea a trei tipuri de cadre de imagine:
Ø Cadru de tip I, obtinut prin codare intracadru, este un cadru la care eşantioanele sunt codate complet şi este
folosit ca referinta de baza. Cadrele de tip I sunt inserate aleator în fluxul de date şi au cea mai scazuta rata de
compresie;
Ø Cadru de tip P, obtinut prin codare cu predictie temporala înainte, se compara cadrul actual cu un cadru de
referinta anterior care poate fi de tip I sau P. Acest cadru are raportul de compresie net superior cadrelor de tip
I;
Ø Cadru de tip B, obtinut prin codare bidirectionala cu predictie temporala înapoi şi înainte. Elementele
cadrului actual se comparaatât cu elementele unui cadru anterior cât şi cu elementele cadruluiurmator (aflate
într-o memorie), aceste cadre putând fi de tip I sauP. Se obtine astfel cel mai mare grad de compresie.

Figura 3 Tipurile de cadre și predicția folosită


Calcularea diferentei de informatie de la un cadru la altul se face la nivel de macrobloc, respectiv fiecare
macrobloc al cadrului este comparat cu macroblocul corespunzator cadrului precedent. Din compararea a doua
macroblocuri pot rezulta urmatoarele situatii:
· Elementele imaginii s-au deplasat într-o directie oarecare, ceea ce înseamna ca este o imagine în mişcare
pentru care se determina vectorii de mişcare;
· Elementele imaginii nu s-au deplasat, ceea ce înseamna ca nu rezulta diferente în procesul de predictie şi nu
apar informatii noi de transmis;
· Elementele de imagine din macrobloc sunt complet noi fata de cele din precedentul, ceea ce înseamna ca
diferentele de predictie sunt mari, debitul de informatie obtinut este maxim.

You might also like