You are on page 1of 82

OPENITO O KOMPRESIJI

Svaki programski materijal (audio i videosignal) je na neki nain ograniene


kvalitete, to zbog samog nastanka, to zbog prijenosnog kanala kojim taj signal
mora proi. U sluaju analognog signala, ogranienja predstavljaju irina pojasa i
odnos signal-um; kod digitalnog signala ogranienja proizlaze iz frekvencije
uzorkovanja i broja bita po uzorku signala, tj. iz njihovog umnoka (brzine
prijenosa).

Zbog svih tih ogranienja pribjegava se kompresiji signala kao tehnici koja
omoguava da kvaliteta signala poslanog kroz kanal ili snimljenog npr. na
magnetsku vrpcu bude vea nego to taj kanal sam po sebi omoguava bez
kompresije. Na odailjakoj strani se signal komprimira prije slanja kroz kanal,
dok se na prijemnoj strani taj komprimirani signal mora vratiti u izvorno stanje
postupkom dekompresije (slika 1.).


Slika 1. Prijenosni sustav





Pojam kompresije moe imati dvojako znaenje: u analognoj tehnici moe znaiti
i namjerno smanjivanje dinamikog opsega signala, bez naknadnog vraanja u
izvorno stanje (npr. radio-prijenosi).
U daljnjem razmatranju, takav oblik kompresije nee se razmatrati, ve e biti
rije iskljuivo o digitalnim sustavima kompresije i dekompresije, koji na
odailjakoj strani smanjuju potrebnu brzinu prijenosa signala, i koji na prijemnoj
strani vraaju komprimirani signal u izvorno stanje.
Odnos izmeu brzine prijenosa izvornog signala i brzine prijenosa
komprimiranog signala naziva se stupanj kompresije.



PRIMJENE KOMPRESIJE

Uz neku zadanu kvalitetu signala, primjenom kompresije postiu se manje brzine
prijenosa (redukcija brzine prijenosa, BRR = bit-rate reduction).
U radiodifuziji, manja brzina prijenosa znai manju irinu kanala, manju potrebnu
snagu odailjaa ili oboje, to donosi utedu. Uz sve veu zauzetost
frekvencijskog spektra, daljnje poveanje broja raznovrsnih usluga nije mogue
bez primjene nekog oblika kompresije signala. S druge strane, na primjer, u
kabelskim distribucijskim sustavima snienje brzine prijenosa sniava cijenu
sustava.
Pri snimanju signala, upotreba kompresije smanjuje potrebni kapacitet medija za
pohranu, direktno proporcionalno omjeru kompresije. Za arhivske potrebe, to
znatno smanjuje potreban prostor i cijenu same arhive. U elektronikom
novinarstvu (ENG = electronic news gathering), upotreba kompresije smanjuje
veliinu i teinu ureaja za snimanje (npr. MiniDisc (audio); MiniDV, MicroMV...
(video)). U serverima za video na zahtjev (VOD = video on demand) primjena
kompresije omoguava ublaavanje mehanikih zahtjeva na vrste diskove, te
manju potrebu za odravanjem.
Iz svega do sada reenog, moe se zakljuiti da je upotreba kompresije signala
svuda prisutna, te da je gotovo nemogue zamisliti suvremene suvremene
digitalne sustave bez primjene barem nekog od sustava za kompresiju.


RAZLOZI ZA PRIMJENU KOMPRESIJE

Da bi se stekao dojam zbog ega je nuno koristiti kompresiju digitalnog
videosignala, potrebno je rei nekoliko rijei o postupku analogno-digitalne
pretvorbe videosignala.

Frekvencije uzorkovanja za komponente videosignala definirane su ITU-R
preporukom BT.601 i iznose 13,5 MHz za sustav s omjerom stranica 4:3,
odnosno 18 MHz za sustav s omjerom stranica 16:9.
Ove frekvencije se primjenjuju i na sustav 625/50 i na sustav 525/60.

Najee koritene strukture uzorkovanja prikazane su na slici 2.
Horizontalni redovi na slici predstavljaju linijsku strukturu slike.

Slika 2. Strukture uzorkovanja videosignala


Osim struktura prikazanih na slici, postoji i struktura 4:4:4, koja se koristi za
uzorkovanje komponentnog videosignala, pri emu se uzorkuju R, G i B
komponente, a ne signal luminancije i signali razlika boja.

Primjenjuje se kvantizacija sa 8 ili 10 bitova po uzorku.
Uz najee koritenu strukturu uzorkovanja 4:2:2 dobivaju se slijedee brzine
prijenosa (brzina prijenosa = broj bitova po uzorku frekvencija uzorkovanja):
uz 8 bitova po uzorku: 216 Mbit/s;
uz 10 bitova po uzorku: 270 Mbit/s.

Ovako velike brzine veoma je teko prenositi standardnim prijenosnim kanalima,
a osim toga, za pohranu nekomprimiranog videosignala bili bi potrebni ogromni
kapaciteti medija. Stoga je kompresija neophodna u gotovo svim podrujima
primjene digitalnog videosignala.

OSNOVE POSTUPAKA KOMPRESIJE

OPENITI PRINCIP KOMPRESIJE

Kako se provodi kompresija? Za odgovor na to pitanje potrebno je znati da su u
svim konvencionalnim digitalnim sustavima ogranieni i broj bitova po uzorku,
kao i brzina prijenosa. Brzina prijenosa ograniava koliinu podataka koja se
moe prenijeti u nekom vremenskom intervalu, no za veinu primjena, odnosno
veinu programskog materijala, ta se granica ne dostie.
Prema Shannonovom teoremu, signal koji se ne mijenja, ne sadri informaciju.
Uzmimo za primjer sinusni valni oblik: svaki period signala jednak je slijedeem,
dakle, sinusni signal ne nosi nikakvu informaciju zbog injenice da nema irinu
pojasa.

U sluaju videosignala, prisutnost prepoznatljivih objekata u slici rezultira skupom
elemenata slike slinih karakteristika. Ti elementi slike daju kao rezultat
frekvenciju signala koja je daleko ispod maksimalne koju je mogue prenijeti
sustavom. Na primjer, u sluaju stacionarne slike, svaka slika je jednaka
prethodnoj, tako da, u stvari, ne treba prenositi nove podatke jednom kad je prva
slika ve poslana.

Cilj sustava za kompresiju jest prepoznati i odailjati samo korisni, promjenjivi dio
ulaznog signala. Taj korisni dio signala naziva se entropija. Preostali,
nepromjenjivi dio ulaznog signala naziva se redundancija (slika 3.).

Slika 3. Entropija i redundancija


U principu, redundanciju nije uope potrebno prenositi. Meutim, u realnim
uvjetima prijenosa dio redundancije se prenosi kako bi se omoguila
rekonstrukcija informacija koje su se izgubile u prijenosu, tj. signal je otporniji na
smetnje ako redundancija ipak postoji.

Slika 4. a) pokazuje sluaj idealne kompresije: ako koder poalje svu entropiju, a
u prijenosu ne doe do gubitka, primljeni signal se ne moe razlikovati od
originala. Ukoliko doe do bilo kakvih smetnji u prijenosu, dio informacije se gubi,
i dekodirani signal e biti slabije kvalitete u odnosu na original.
Druga stvar na koju treba obratiti panju jest stupanj kompresije. U sluaju
prevelikog stupnja kompresije, dolazio do oteenja entropije, jer je ve sva
redundancija u potpunosti uklonjena (slika 4. b)). Stoga se postavlja zahtjev da
se stupanj kompresije mora prilagoditi sadraju slike.


Slika 4. Problem odabira stupnja kompresije



Poto je entropija funkcija ulaznog signala, potrebna brzina prijenosa u sluaju
idealne kompresije e biti promjenjiva. Nije uvijek mogue imati prijenosni kanal
promjenjive brzine prijenosa, tako da mnogi ureaji za kompresiju imaju
memorijske spremnike na oba kraja lanca. To usrednjuje brzinu prijenosa, no
uzrokuje i kanjenja. Takva kanjenja mogu biti neprihvatljiva u nekim
sluajevima (npr. videokonferencije) pa se koristi kanal sa stalnom brzinom
prijenosa, ime se izbjegava potreba za memorijskim spremnicima. Takav sustav
ima manja kanjenja signala.
IDEALNI I REALNI SUSTAV KOMPRESIJE

Sve do sada, razmatranja su se zasnivala na idealnom koderu, koji je uvijek
sposoban razluiti entropiju od redundancije. Naalost, takav koder nije mogu,
jer bi bio beskonano sloen i imao bi beskonano kanjenje. Stoga smo u praksi
prisiljeni posegnuti za realnim koderom, koji e uvijek odstupati od idealnog, bez
obzira na primjenu. Ta injenica znai da emo uvijek morati odabrati manji
stupanj kompresije od idealnog (najveeg mogueg), jer koder nije u stanju tono
razlikovati entropiju od redundancije.

Slika 4. c) pokazuje sluaj realnog kodera: uz entropiju se prenosi jo dio
informacije koji moe, ali i ne mora biti redundantan. to je koder jednostavniji,
taj dio informacije je vei. Dekoder, meutim, mora moi obraditi signal u bilo
kojem sluaju. Zbog toga, sve odluke o nainu i stupnju kompresije donose se na
razini kodera, a dekoder samo mora dekodirati primljeni signal to je bolje
mogue. Takav sustav je dakle asimetrian: koder je najee sloen, a dekoder
je znatno jednostavniji.

Iz svega do sada navedenog, moe se zakljuiti da je sloenost kodera, za neku
traenu kvalitetu, to vea to je zahtijevana brzina prijenosa manja. Zbog toga se
u primjeni nalazi velik broj razliitih kodera.


REDUNDANCIJE U VIDEOSIGNALU

Osnovne vrste redundancije koje se pojavljuju u videosignalu su:

a) a) statistika redundancija:
prostorna (unutar svake pojedine slike);
vremenska (izmeu slika);

b) b) subjektivna redundancija (vezana za svojstva ljudskog vizualnog
sustava).


NAELA KOMPRESIJE VIDEOSIGNALA

Kompresija videosignala zasniva se na uklanjanju redundancije iz toka podataka
koji je potrebno poslati kroz kanal. Drugim rijeima, iskoritavaju se dvije
pretpostavke koje definiraju redundanciju u nekom videosignalu.
Prva pretpostavka odnosi se na svojstvo ljudskog vizualnog sustava da je
osjetljivost na um u slici ovisna o frekvenciji, tj. oko slabije zapaa sitne detalje
(visoke frekvencije).
Druga pretpostavka je da u nizu pokretnih slika uvijek postoji znatna slinost
izmeu trenutne i slijedee slike.

Slika 5. Ovisnost prostorne frekvencije o veliini objekta u slici






Slika 6. Osjetljivost oka na detalje



Iz slika 5. i 6. vidljivo je da se zbog karakteristika ljudskog oka mogu iz slike pri
kompresiji ukloniti sitni detalji, budui da daju kao rezultat vie frekvencije, koje
oko manje zapaa.

Kompresija u naelu radi tako da reducira broj bitova digitalne rijei. To dovodi
do smanjenja rezolucije i poveanja uma, tako da se postupak mora provoditi
pazei da um ne postane vidljiv, tj. pazei na prostornu frekvenciju (frekvenciju
generiranu sadrajem slike). Videokoderi zbog toga moraju provoditi analizu
frekvencija koje se pojavljuju u ulaznom signalu, te obraivati svaku frekvenciju
posebno. Ako neke frekvencije u ulaznom signalu nema, nee biti prenesen
nikakav podatak.
Dekoder se izvodi kao potpuno inverzni sklop u odnosu na koder (slika 7.)

Slika 7. Kompresija i dekompresija (osnovno naelo)


Postupak prikazan na ovoj slici tretira svaku pojedinu sliku zasebno i naziva se
kodiranje unutar slike (intra-frame coding). Na taj nain rade sustavi za
kompresiju mirnih slika npr. JPEG (Joint Photographic Experts Group).

Pri kodiranju videosignala, osim kodiranja unutar slike, primjenjuje se i postupak
kodiranja izmeu slika (inter-frame coding), koji iskoritava vremensku
redundanciju koja se pojavljuje izmeu dviju slika u nizu. Na taj nain mogu se
postii vei stupnjevi kompresije.

Slika 8. prikazuje jednostavan sustav za kodiranje izmeu slika. Poevi sa
slikom kodiranom postupkom kodiranja unutar slike, sve slijedee slike opisane
su samo razlikama o odnosu na trenutnu sliku. Dekoder zbraja razliku slika s
trenutnom slikom i na taj nain stvara slijedeu sliku. Slika koja predstavlja
razliku dobiva se oduzimanjem vrijednosti elementa slike u jednoj slici i
vrijednosti istog elementa slike u drugoj slici. Ta slika se moe, kao i svaka druga
slika, komprimirati postupkom kodiranja unutar slike.

Postoje mnogi problemi koji spreavaju ovakvu jednostavnu izvedbu. Na primjer,
bilo koja pogreka koja se pojavi u toku prijenosa u samo jednoj slici, bit e
vidljiva u svim slijedeim slikama (propagacija pogreaka). Osim toga, nije
mogue dekodirati signal ako se on ne prati od poetka emitiranja, tj. nije
mogue mijenjanje kanala. To sve dovodi do potrebe da se povremeno prenose i
slike dobivene samo kodiranjem unutar slike (I-slike).

Ovaj nain prijenosa oteava i naknadnu obradu videosignala jer toke rezova
moraju biti tako odabrane da svaki isjeak poinje I-slikom.

Slika 8. Kodiranje izmeu slika


Sustav kodiranja izmeu slika nije pogodan za prijenos videosignala u kojem
postoje velike razlike izmeu pojedinih slika (npr. nagli pokreti) jer su razlike
prevelike da bi ih se moglo uinkovito kodirati. To dovodi do potrebe za
uvoenjem nadomjetanja pokreta (motion compensation).

Nadomjetanje pokreta provodi se tako da se na strani kodera usporeuju
prethodna i trenutna slika, te se mjeri pomak podruja slike za dobivanje vektora
pomaka. Koder modelira objekt na novom poloaju pomicanjem elemenata
prethodne slike pomou vektora pomaka. Odstupanja od stvarne situacije
korigiraju se usporedbom modelirane i stvarne slike (slika 9.).

Koder alje vektore pomaka i signal razlike slika. Dekoder pomie objekt iz
prethodne slike pomou vektora pomaka i dodaje signal razlike da bi dobio
slijedeu sliku.

Nadomjetanje pokreta omoguava vei stupanj kompresije, uz veu sloenost
samog sustava.

Slika 9. Kodiranje s nadomjetanjem pokreta









MPEG NORME


UVODNI POJMOVI


Prostorna i vremenska redundancija

Kompresija videosignala zahtijeva postupak identifikacije redundancije u
programskom materijalu koji se prenosi. Taj postupak obino se provodi u dva
koraka:
1. 1. pronalaenje i uklanjanje prostorne redundancije vri se unutar svake
pojedinane slike, bez referenci na prethodne ili slijedee slike;
2. 2. vremenska redundancija pronalazi se i uklanja pomou usporedbe
trenutne i prethodne slike.


Diskretna kosinusna transformacija

Prostorna redundancija postoji u svim realnim programskim materijalima. Ako u
slici postoji neki prepoznatljivi objekt, tada e svi elementi slike koji ga
predstavljaju imati slinu vrijednost amplitude. Veliina objekata u slici odreuje
prostornu frekvenciju koja e se pojaviti u signalu. U realnim situacijama
prevladavaju nie frekvencije, a osim toga, u signalu se najee ne pojavljuje
cijeli spektar frekvencija. Nuno je dakle provesti frekvencijsku analizu. U tu
svrhu koristi se diskretna kosinusna transformacija (DCT = Discrete Cosine
Transform) da bi se vrijednosti elemenata slike pretvorile u koeficijente koji se
dalje lake mogu podvrgnuti postupku kompresije.

Izvorna slika najprije se dijeli u blokove veliine 88 elemenata slike. Na svaki
blok se primjenjuje dvodimenzijska DCT koja daje 64 DCT koeficijenta:


|
.
|

\
| +
|
.
|

\
| +
=

= =
16
) 1 2 (
cos
16
) 1 2 (
cos ) , (
4
) ( ) (
) , (
7
0
7
0
t t v k u j
k j f
v C u C
v u F
j k


,
2
1
) ( = u C
za u = 0, C(u) = 1, za u = 1, 2, ... , 7;

,
2
1
) ( = v C
za v = 0, C(v) = 1, za v = 1, 2, ... , 7.

U gornjoj formuli F(u,v) su DCT koeficijenti, a f(j,k) izvorne vrijednosti amplitude
elemenata slike.
F(0,0) naziva se istosmjerni (DC) koeficijent i najee se rauna prema formuli:

= =
=
7
0
7
0
) , (
8
1
) 0 , 0 (
j k
k j f F


Ova formula govori nam da je DC koeficijent zapravo jednak osmerostrukoj
srednjoj vrijednosti elemenata slike u bloku.


Slika 10. Prikaz bloka DCT koeficijenata



Na slici 10. gornji lijevi kut predstavlja DC koeficijent, a sputajui se dolje i
desno dolazi se do koeficijenata koji predstavljaju visoke prostorne frekvencije
signala nastalog iz izvorne slike. Pomak prema desno predstavlja porast
horizontalne prostorne frekvencije, a pomak prema dolje predstavlja porast
vertikalne prostorne frekvencije.

Na strani dekodera vrijednosti elemenata slike mogu se rekonstruirati pomou
inverzne diskretne kosinusne transformacije (IDCT):

|
.
|

\
| +
|
.
|

\
| +
=

= =
16
) 1 2 (
cos
16
) 1 2 (
cos ) , (
4
) ( ) (
) , (
7
0
7
0
t t v k u j
v u F
v C u C
k j f
u v



Diskretnom kosinusnom transformacijom ne provodi se kompresija. Pomou te
transformacije samo se izvorni elementi slike pretvaraju u oblik iz kojega je
mogue jasno odrediti redundanciju. Poto sve prostorne frekvencije nisu
istodobno prisutne u signalu, DCT e dati skup koeficijenata od kojih e neki biti
jednaki ili vrlo bliski nuli. Koeficijente koji su jednaki nuli ne treba uope prenositi,
a koliko e se koeficijenata bliskih nuli odbaciti, ovisi o eljenoj kvaliteti slike i
stupnju kompresije koji se eli postii. Ukoliko se neki koeficijent ne moe
odbaciti, mogue ga je, u cilju postizanja veeg stupnja kompresije, prenijeti s
manjim brojem bita, ime se manje naruava kvaliteta slike nego potpunim
odbacivanjem.


Kvantizacija

Vidljivost prostornih frekvencija u signalu znatno varira u cijelom rasponu.
Ljudsko oko moe tolerirati mnogo veu koliinu uma na visokim frekvencijama
nego na niskim. Zbog toga se rabi kvantizacija, kako bi se sav eventualno nastali
um koncentrirao u podruju visokih frekvencija, gdje je slabo uoljiv. DCT
koeficijenti se dijele faktorom koji je funkcija poloaja koeficijenta u bloku (faktor
dijeljenja se poveava pri kretanju prema desno i prema dolje u tablici
koeficijenata). Istosmjerni (DC) koeficijent se ne kvantizira. Na strani dekodera
visokofrekvencijski koeficijenti se mnoe najveim faktorom, tako da je utjecaj
uma prebaen najveim dijelom u to podruje, koje je oku najmanje vidljivo.
Nakon kvantizacije, vrijednosti koeficijenata bit e jo manje, tako da e veina
njih biti vrlo bliska nuli. U tipinom programskom materijalu, veina velikih
koeficijenata se nalazi u gornjem lijevom kutu bloka. Zbog takvog rasporeda
koeficijenata prikladno je koeficijente oitavati metodom cik-cak analiziranja (slika
11.), poevi od gornjeg lijevog kuta tablice.

Slika 11. Cik-cak analiziranje



Pritom se dobiva niz koeficijenata koji na poetku sadri koeficijente razliite od
nule, dok su koeficijenti jednaki nuli koncentrirani na kraju niza. Takav oblik
omoguava da se umjesto krajnjih koeficijanata (koji su ionako jednaki nuli) u
daljnji tok signala alje samo oznaka koja predstavlja te koeficijente.
Kodiranje s promjenjivom duinom niza

U nizu podataka dobivenom nakon cik-cak analiziranja koeficijenti manje
vrijednosti imaju ispred sebe vie nula nego koeficijenti vee vrijednosti. Zbog
toga je pogodno koristiti algoritam kodiranja koji e takvu raspodjelu znati
iskoristiti.

Huffmanov nain kodiranja dodjeljuje krai kod onim vrijednostima koje se ee
pojavljuju, a dui kod onim vrijednostima koje se pojavljuju rijetko. Time se
postie vea uinkovitost pri prijenosu veine realnih informacija.

Pri upotrebi diskretne kosinusne transformacije est je sluaj da mnogi
koeficijenti imaju vrijednost jednaku nuli, te je uinkovito takav niz kodirati
pomou kodiranja duine niza. Na taj nain koder jednostavno alje podatak
koliko je koeficijenata zaredom jednako nuli.


Kodiranje unutar slike (intra-kodiranje)

Slika 12. Kodiranje unutar slike

Slika 12. prikazuje potpunu blok-shemu kodiranja unutar slike. Kodiranjem unutar
slike nastaju tzv. I-slike (Intra-coded pictures) Ulazna slika se dijeli u blokove
veliine 88 elemenata. Na svaki blok se primjenjuje DCT, ime se dobiva tablica
koeficijenata koji se potom kvantiziraju. Cik-cak analizom se iz tablice dobiva niz
koji se alje na kodiranje duine niza i rezultat se alje u prijenosni kanal.

U dekoderu se izvorni signal ponovno rekonstruira postupkom koji je potpuno
inverzan postupku pri kodiranju.

Kodiranje izmeu slika (inter-kodiranje)

Sustav prikazan na slici 11. uklanja samo prostornu redundanciju sadranu
unutar pojedine slike. Kodiranje unutar slike ne iskoritava postojanje
redundancije izmeu dviju slika u nizu. Kako iskoristiti i tu (vremensku
redundanciju?

Rjeenje lei u diferencijalnom kodiranju (slika 13.)

Slika 13. Dobivanje razlike slika


Da bi se mogla dobiti razlika izmeu dvije slike, nuno je imati kanjenje
realizirano u sklopu kodera. Vrijednost svakog elementa prethodne slike se
oduzima od odgovarajueg elementa u trenutnoj slici, ime se dobiva razlika
slika, koja je takoer dvodimenzijska slika, i moe se podvrgnuti postupku
kompresije unutar slike primjenom diskretne kosinusne transformacije.

U dekoderu se takoer koristi kanjenje prethodne slike, s kojom se potom zbraja razlika
slika da bi se dobila trenutna slika. Ta trenutna slika zatim ponovno ulazi u krug
kanjenja da bi se dobila slijedea slika.

Pri ovakvom postupku kodiranja izmeu slika nuno je sprijeiti gomilanje sitnih
pogreaka zbog opasnosti da se one akumuliraju tijekom procesa kompresije izvornog
videosignala. Najznaajniji uzrok pojave pogreaka je kompresija razlike slika.

Radi uklanjanja pogreaka koje bi uzrokovale potpun gubitak informacije nakon
nekog vremena, nuno je da koder i dekoder imaju identini dekoder razlike
slika. U trenutku kada dekoder oduzima ptrethodnu sliku od trenutne, on u stvari
oduzima lokalno dekodiranu sliku, identinu onoj koju e dobiti stvarni dekoder
na drugoj strani prijenosnog puta. Na taj nain e biti uklonjene sve pogreke
uzrokovane prethodnom kompresijom razlike slika. Sustav je prikazan na slici 14.

Slika 14. Uklanjanje kumulativne pogreke pri kodiranju izmeu slika





Nadomjetanje pokreta; P-slike

Diferencijalno kodiranje prikazano na slici 14. daje dobre rezultate ukoliko izvorni
videosignal ne sadri znatan broj pokretnih objekata u slici. Ukoliko to nije sluaj, razlika
slika e sadravati gotovo istu koliinu podataka kao da se uope nije koristilo kodiranje
izmeu slika. Najbolji primjer za to je pomak kamere u jednom smjeru. Pri takvom
pomaku vrijednosti veine elemenata slike se ne mijenjaju, nego samo dolazi do njihovog
pomaka na drugo mjesto. Da bi se i takav videosignal mogao uspjeno komprimirati,
nuno je uvesti nadomjetanje (kompenzaciju) pokreta.

Pri upotrebi kodera koji omoguava nadomjetanje pokreta, usporeuju se
podruja dvaju susjednih slika u nizu, kako bi se ustanovio smjer i veliina
relativnog pomaka izmeu slika. Tako se dobivaju podaci u obliku
dvodimenzijskog vektora pomaka (slika 15.).

Slika 15. Kodiranje uz nadomjetanje pokreta



(1) Mjerenje pomaka izmeu slika A i B
(2) Pomicanje slike A pomou vektora pomaka
(3) Oduzimanje slike A od slike B
(4) Odailjanje vektora i podataka razlike slika u prijenosni kanal


Koder rabi vektore pomaka za pomicanje elemenata prethodne slike i stvaranje
predviene slike (P-slike, Predicted Frames) prije nego to njihove vijednosti oduzme od
vrijednosti elemenata trenutne slike. Ukoliko je pocjene pokreta bila tona, proces
pomaka e dovesti objekte u predvienoj slici na isto mjesto na kojem se nalaze u
stvarnoj slici, te e preostati samo mala koliina podataka o razlikama izmeu slika.

Poto se vektori pomaka alju zajedno s podacima razlike slika, dekoder na
prijemnoj strani ih moe upotrijebiti za jednaki pomak prethodne slike ime
dobiva odgovarajuu P-sliku. Zbrajanjem signala razlike dobiva se dekodirana
trenutna slika.

Za potrebe nadomjetanja pokreta slika je razbijena u pravokutna podruja koja se
nazivaju makroblokovi. Svaki makroblok ima vlastiti vektor pomaka koji se primjenjuje
na cijeli blok. U ovisnosti o poloaju objekata, neki makroblokovi se pomiu, a neki ne.
Zato nije uvijek nuno koristiti nadomjetanje pokreta, ve se koder treba ''odluiti'' da li
takav postupak daje manju potrebnu brzinu prijenosa ili je bolje raditi bez nadomjetanja
pokreta, prenosei samo razlike slika.

Zbog injenice da je kretanje nekog objekta u realnom programskom materijalu relativno
konstantno u trajanju od nekoliko slika, vektori pomaka se odailju diferencijalno, tj.
ukoliko nema promjene u nainu pomaka, vrijednost parametra vektora pomaka jednaka
je nuli, te se vektori jednostavno kopiraju iz prethodne slike. Ako kretanje mijenja brzinu
ili smjer, tada se alju razlike vektora pomaka.


Dvosmjerno predvianje; B-slike

U svrhu dodatnog smanjenja zahtjeva na brzinu prijenosa, odnosno za postizanje
jo veeg stupnja kompresije, uvodi se koncept dvosmjernog kodiranja (slika
16.), ime se dobivaju B-slike (Bidirectionally Coded Frames).

Slika 16. Dvosmjerno kodiranje


Trenutna slika se usporeuje i sa prethodnom i sa buduom slikom; izvode se dvosmjerni
vektori pomaka. Podruje oznaeno kvadratiem na trenutnoj slici dobiva se tako iz
budue slike.

Dvosmjerno predvianje zahtijeva promjenu rasporeda slika pri prijenosu jer do dekodera
moraju prvo stii budue slike potrebne u procesu predvianja, a zatim trenutna slika.

Najee grupe slika (uz mnogo ostalih rasporeda):
IIII...
IPIP...
IBPIBP... (prijenosni raspored IPBIPB...)
IBIB...

Razlozi za prijenos I-slika

U praksi nije mogue koristiti isto diferencijalno kodiranje, budui da dekoder
moe primati signal samo od njegovog poetka. Osim toga, svaka pogreka u
prijenosu samo jedne slike prenosi se na sve slijedee slike.
Zbog toga je nuno povremeno u prijenosni tok ubaciti slike koje su kodiranje iskljuivo
metodom kodiranja unutar slike, bez predvianja (I-slike), tako da se dobiva struktura
toka podataka kao na slici 17.

Slika 17. Primjer strukture prijenosnog toka podataka


U nizu slika nije apsolutno nuno da se I-slike pojavljuju u strogo odreenom rasporedu,
budui da svaka slika ima oznaku koja govori dekoderu kako je treba obraditi.

Ureivanje i naknadna obrada ovakvog signala mogua je samo u trenucima u kojima se
pojavljuju I-slike. Zbog toga, u sluaju kad je potrebna naknadna obrada videosignala, I-
slike se moraju koristiti u znatnijoj mjeri, te nisu mogui veliki omjeri kompresije.

OPENITO O MPEG NORMAMA

MPEG (Moving Pictures Experts Group) je radna grupa unutar ISO/IEC
(International Standardization Organisation / International Electrotechnical
Committee), zaduena za razvoj meunarodnih standarda za kompresiju,
dekompresiju, obradu i prezentaciju pokretnih slika i prateih audio sadraja.
Do sada su doneene slijedee norme:
MPEG-1 kodiranje pokretnih slika i prateih audiosignala za digitalno
pohranjivanje pri brzinama do 1,5 Mbit/s (1992. godine);
MPEG-2 generiko kodiranje pokretnih slika i prateih audiosignala
(1995.);
MPEG-4 kodiranje audio-vizualnih objekata (verzija 1: 1998., verzija 2:
1999.);
MPEG-7 suelje za opis multimedijskih sadraja (2001.);
MPEG-21 multimedijski sustav.

MPEG norme same po sebi se ne mogu jednostavno definirati. U svojoj biti,
MPEG je skup standardnih alata, precizno definiranih algoritama i naina na koji
se oni mogu kombinirati kako bi se napravio stvarni sustav za kompresiju
signala.

Suprotno oekivanju, MPEG norme ne propisuju egzaktni nain na koji se kompresija
mora provesti. Umjesto toga, MPEG precizno propisuje nain na koji dekoder mora
obraditi skup razliitih komprimiranih tokova podataka. MPEG ne propisuje kako treba
prenositi sam signal, jer e to biti odreeno karakteristikom sustava u primjeni. Razlog za
takav pristup je omoguavanje velike fleksibilnosti, uz istovremeneo zadravanje
kompatibilnosti meu sustavima. Razni proizvoai opreme mogu razvijati razliite
algoritme kompresije, ali izlazni komprimirani videosignal mora biti sukladan MPEG
standardu. To omoguava da se sami algoritmi kompresije neprekidno usavravaju, a da
istovremeno komprimirani signal ostane kompatibilan sa svim postojeim dekoderima.

Primjena kompresije videosignala na zadrava se samo na televizijskim sustavima;
kompresija se koristi za niz primjena, poevi od prikaza videosignala na monitorima
raunala, pa sve do raznih prezentacijskih primjena. Zahtjevi za kvalitetom variraju od
vrlo malih (npr. videotelefoni, videonadzor, ...) do vrlo velikih (transparentnost potrebna
u TV produkciji).
U razliitim primjenama tako se moe dopustiti razliit stupanj sloenosti kodera i
dekodera, to je dovelo do potrebe za slojevitom strukturom kodiranja.

MPEG-1 (ISO/IEC IS 11172)

Formati slike

ITU-R preporuka BT.601:

odreuje frekvencije uzorkovanja za komponente videosignala u 525/60 i
625/50 standardima uz omjer stranica 4:3 i 16:9
definira formate uzorkovanja 4:4:4 (frekvencija uzorkovanja za sve
komponente signala iznosi 13,5 MHz (4:3), odnosno 18 MHz (16:9)) i 4:2:2
(frekvencija uzorkovanja 13,5/18 Mhz za luminantnu komponentu i 6,75/9
MHz za svaku od krominantnih komponenti)
576 linija u aktivnom dijelu slike za 625/50 sustav i 480 linija u aktivnom
dijelu slike za 525/60 sustav
svaka digitalna linija u aktivnom intervalu sadri 720 luminantnih uzoraka,
te 720 (4:4:4) ili 360 (4:2:2) uzoraka krominantnih komponenti

Osim formata 4:4:4 i 4:2:2 u upotrebi su i formati 4:1:1 i 4:2:0 (nije dio preporuke
BT.601, ali se koristi u MPEG normi).

Kao polazini format pri kompresiji prema MPEG-1 normi, upotrebljava se SIF
(Source Input Format), izveden iz ITU-R preporuke BT.601.

Tablica 1. SIF i BT.601 formati slike

Vertikalna frekvencija 25 Hz 30 Hz
Luminantna komponenta:
ITU-R BT.601
SIF

720 576
360 288

720 480
360 240
Krominantna komponenta:
ITU-R BT.601
SIF

360 576
180 144

360 480
180 120

Iz tablice je vidljivo kako je rezolucija slike koja se koristi u postupku MPEG-1
kodiranja smanjena na polovicu, u odnosu na rezoluciju slike propisanu
preporukom BT.601.


Slika 18. Postupak dobivanja SIF formata iz BT.601 oblika



Brojke u zagradama na slici se odnose na 525/60 sustav, a izvan zagrada na sustav
625/50.

Postupkom prikazanim na slici 18. dobiva se SIF format (strukture uzorkovanja 4:2:0),
koji ipak nije jo uvijek mogue direktno upotrijebiti za kompresiju, jer horizontalna
rezolucija od 360 elemenata slike nije djeljiva sa 16, to je nuno zbog podjele slike na
makroblokove. Prilagoenje se izvodi odbacivanjem krajnjih lijevih i krajnjih desnih
elemenata slike, ime se dobiva format 352 288 (za 625/50 sustav) ili 352 240 (za
525/60 sustav).

Hijerarhijska struktura kodiranja

Kodiranje po MPEG normi organizirano je u est slojeva (slika 19.):

Blok najmanja jedinica koja se podvrgava kodiranju; veliine 88 elemenata
slike
Makroblok osnovna jedinica za kodiranje s nadomjetanjem pokreta; veliine
1616 elemenata slike
Isjeak slike (slice) horizontalni niz makroblokova
Slika osnovna jedinica u MPEG kodiranju; etiri vrste:
I-slike slike kodirane samostalno unutarnjim kodiranjem
P-slike kodirane s predvianjem uz nadomjetanje pokreta
B-slike kodirane s predvianjem uz nadomjetanje pokreta, pri emu se
predvianje vri iz prethodnih i iz buduih slika
D-slike slike dobivene kodiranjem samo istosmjernog (DC) koeficijenta;
koriste se izuzetno rijetko
Grupa slika (GOP = Group of pictures) niz od jedne ili vie slika pri kodiranju
i/ili prijenosu
Sekvenca niz od odreenog broja grupa slika

Slika 19. Hijerarhijska struktura kodiranja


U grupi slika pojedine slike su rasporeene prema slijedeem rasporedu:

I
1
B
1
B
2
P
1
B
3
B
4
P
2
B
5
B
6
P
3
B
7
B
8
I
2


Za rekonstrukciju B-slika nuno je imati i prethodne i budue I i P-slike, te se prijenosni
raspored mora tome prilagoditi (slika 20.):

I
1
P
1
B
1
B
2
P
2
B
3
B
4
P
3
B
5
B
6
I
2
B
7
B
8


Slika 20. Raspored slika pri kodiranju i pri prijenosu




Postupak kodiranja

Postupak MPEG kodiranja provodi se u vie faza (blok-shema je prikazana na
slici 21.):

1. Slika se dijeli u blokove veliine 8 8 elemenata slike.

2. Provodi se diskretna kosinusna transformacija (uklanjanje prostorne redundancije)
koriste se 64 koeficijenta transformacije
provodi se kvantizacija DCT koeficijenata

3. Provodi se kodiranje s predvianjem uz nadomjetanje pokreta (uklanjanje
vremenske redundancije)
DCT koeficijenti se inverzno kvantiziraju, transformiraju i pohranjuju
izvorna slika se usporeuje s prethodnom I ili P-slikom
u sklopu za predvianje pokreta proraunavaju se vektori pokreta
vektori pokreta se primjenjuju na prethodnu sliku
makroblok iz prethodne slike pomaknut vektorom pokreta postaje prediktor
(osnova za daljnje predvianje)
pogreka predvianja (razlika slika) kodira se primjenom DCT
provodi se kvantizacija DCT koeficijenata (korak kvantizacije za sve koeficijente
je 16)





Slika 21. Blok-shema MPEG kodera:




Znaenje kratica na slici:

Q = kvantizacija,
DCT = diskretna kosinusna transformacija,
VLC = kodiranje s promjenjivom duinom rijei,
Q
-1
= inverzna kvantizacija,
DCT
-1
= inverzna DCT.



Osnovna namjena MPEG-1 norme: kodiranje pokretnih slika i prateih
audiosignala za digitalno pohranjivanje pri brzinama do 1,5 Mbit/s.

Koristi se iskljuivo progresivno analiziranje.

MPEG-2 (ISO/IEC IS 13818)

Opa svojstva MPEG-2 norme

MPEG-2 je norma za generiko (aplikacijski neovisno) kodiranje videosignala i prateih
audio sadraja. Algoritam koji se primjenjuje za kodiranje slian je algoritmu u MPEG-1
normi.

Osnovna razlika izmeu MPEG-1 i MPEG-2 normi:

MPEG-1 je prilagoen videosignalu s progresivnim analiziranjem, osnovna
namjena mu je bila snimanje videosignala na CD, brzina prijenosa do 1,5 Mbit/s.
MPEG-2 je opi standard namijenjen i videosignalima s progresivnim
analiziranjem i videosignalima koji koriste analiziranje s proredom (slika se dijeli na
dvije poluslike);
MPEG-2 nudi slojevitu strukturu profila (podskup sintakse toka podataka) i razina
(odreuje parametre koji su doputeni unutar odabranog profila.



Struktura MPEG-2 kodiranja

MPEG-2 norma sadri slijedee profile i razine:

1. 1. Profili:

osnovni (SP = Simple Profile) daje najniu kvalitetu signala, ne podrava
slojevito kodiranje, ne ukljuuje dvosmjerno predvianje, format slike je 4:2:0;
glavni (MP = Main Profile) ne podrava slojevito kodiranje, ali postoji
dvosmjerno predvianje; format slike je takoer 4:2:0;
4:2:2 (4:2:2P) format slike je 4:2:2, omogueno je koritenje veih brzina
prijenosa nego u glavnom profilu;
profil sa slojevitou u odnosu na omjer signal/um (SNR) omoguava razliite
kvalitete slike s obzirom na odnos signala i uma;
profil s prostornom slojevitou (Spatial) podrava razliite prostorne rezolucije
slike;
vrni profil (HP = High Profile) podrava potpunu slojevitost i najviu kvalitetu
slike.


2. Razine:

niska (LL = Low Level) SIF format slike
glavna (ML = Main Level) standardni formati TV slike
visoka 1440 (High-1440) videosignal sa 1440 uzoraka po liniji
visoka (HL = High Level) videosignal sa 1920 uzoraka po liniji

Tablica 2. Profili i razine u MPEG-2 normi

Razina
Profil
Osnovni Glavni 4:2:2 SNR Prostorni Vrni
Visoka
Uzoraka/liniji
Linija/slici
Format
Vrste slika
Mbit/s

1920
1152
4:2:0
I, P, B
80
1920
1152
4:2:2
I, P, B
80

1920
1152
4:2:2,4:2:0
I, P, B
100
Visoka
1440
Uzoraka/liniji
Linija/slici
Format
Vrste slika
Mbit/s

1440
1152
4:2:0
I, P, B
60

1440
1152
4:2:0
I, P, B
60
1440
1152
4:2:0,4:2:2
I, P, B
80
Glavna
Uzoraka/liniji
Linija/slici
Format
Vrste slika
Mbit/s
720
576
4:2:0
I, P
15
720
576
4:2:0
I, P, B
15
720
576
4:2:2
I, P, B
50
720
576
4:2:0
I, P, B
15

720
576
4:2:0,4:2:2
I, P, B
20
Niska
Uzoraka/liniji
Linija/slici
Format
Vrste slika
Mbit/s

352
288
4:2:0
I, P, B
4

352
288
4:2:0
I, P, B
4



MPEG koder dobivanje I, P i B slika

Na slikama 22a, 22b i 22c prikazana je tipina izvedba MPEG kodera, koja sadri
dvosmjerno nadomjetanje pokreta. Digitalni videosignal ulazi kroz seriju
sklopova za kanjenje, koje je mogue zaobii, ovisno o eljenom rasporedu
slika. Signal zatim ulazi u sklop za oduzimanje i u sklop za procjenu pomaka.

Ukoliko se eli dobiti I-slika, ulazno kanjenje je ukljueno u tok signala, a sklop
za oduzimanje je iskljuen, tako da signal direktno prolazi do sklopa za prostorno
kodiranje (kodiranje unutar slike). Signal se zatim alje u slikovnu memoriju, gdje
se pohranjuje nastala I-slika (slika 22a).

Slika 22a. MPEG koder dobivanje I-slike





Slijedei korak pri kodiranju videosignala je dobivanje P-slike (slika 22b). U tu
svrhu, ulazni sklopovi za kanjenje se iskljuuju, kako bi se odabrala budua
slika, to je potrebno zbog strukture grupe slika pri prijenosu. Sklop za procjenu
pomaka usporeuje I-sliku (koja se nalazi u izlaznoj memoriji) sa P-slikom u
ulaznoj memoriji, kako bi se dobili vektori pomaka. Pomou tih vektora pomaka
pomie se I-slika ime se dobiva predviena P-slika.

Predviena P-slika se oduzima od stvarne P-slike radi dobivanja iznosa
pogreke predvianja. Pogreka predvianja se prostorno kodira i alje zajedno
s vektorima pomaka. Osim toga, pogreka predvianja se dodaje predvienoj P-
slici, ime se dobiva lokalno dekodirana P-slika koja se pohranjuje u izlaznoj
memoriji.

Izlazna memorija sada sadri I-sliku i P-sliku, tako da se moe prijei na
kodiranje B-slika.

Slika 22b. MPEG koder dobivanje P-slike




Nakon kodiranja I i P-slike, u ulazni memorijski spremnik dolazi B-slika. Sklop za
nadomjetanje pokreta usporeuje B-sliku s prethodnom I-slikom i buduom P-
slikom (koje su pohranjene u izlaznoj memoriji), ime se dobivaju dvosmjerni
vektori pomaka (slika 22c).

Postupkom nadomjetanja pokreta provedenim u oba smjera dobivaju se dvije
predviene B-slike, koje se oduzimaju od trenutne B-slike. Na razini
makroblokova odabire se pomak prema naprijed ili prema natrag, ovisno o tome
koji daje najmanju razliku. Razlike se potom prostorno kodiraju i alju zajedno s
vektorima pomaka.

Nakon to se kodiraju sve B-slike, prelazi se na stvaranje nove P-slike iz
prethodno pohranjene P-slike. Postupak se zatim nastavlja.


Slika 22c. MPEG koder dobivanje B-slike




Kvaliteta slike; primjene MPEG-2 norme

Cilj koji se eli postii pri prijenosu videosignala jest visoka kvaliteta uz to je mogue
manju brzinu prijenosa. Pritom neizbjeno dolazi do problema i razliitih naina pristupa
rjeenju.

Smanjenjem brzine prijenosa konstantnu kvalitetu slike mogue je postii
promjenom strukture grupe slika. Grupa slika koja se sastoji samo od I-slika
zahtijeva najveu brzinu prijenosa, to znai da je pri smanjivanju brzine
prijenosa nuno ubacivati B i P-slike. Visoku kvalitetu pri brzinama prijenosa
niim od 20 Mbit/s mogue je ostvariti jedino uz primjenu B i P-slika (slika 23).

Slika 23. Krivulja konstantne kvalitete




U normi MPEG-2 primjenjuje se slojevito kodiranje podaci se u koderu dijele na
dva ili vie tokova s razliitim informacijama o videosignalu. Time je omoguen
rad kodera i dekodera razliitih kvaliteta.

Slojevito kodiranje jedna je od najznaajnijih osobina MPEG-2 norme. Poseban
znaaj slojevito kodiranje ima pri prijenosu videosignala putem raunalne mree,
jer se postupak kodiranja moe prilagoditi ovisno o trenutnom prometu u mrei,
odnosno o raspoloivoj brzini prijenosa i kanjenju paketa uzrokovanom
prilikama u mrei.

Dekoder moe dekodirati samo dio podataka iz ukupnog toka podataka, ukoliko
je dovoljna nia kvaliteta slike.
Podaci se u koderu dijele po kriteriju koji moe biti odnos signal/um, prostorna ili
vremenska rezolucija. Takvu slojevitost podravaju SNR profil, profil s
prostornom slojevitou i vrni profil.

Kvaliteta slike je odreena brzinom prijenosa i rasporedom slika u grupi slika, to
se odreuje ovisno o primjeni.
Ukoliko je potrebno naknadno obraivati videosignal, koriste se kratke grupe
slika (IBIB...) uz brzine prijenosa 30-50 Mbit/s, a ukoliko se radi samo ogranien
broj generacija snimke, tada se moe upotrijebiti i grupa slika IBBP... uz brzinu
prijenosa od priblino 20 Mbit/s.

Primjene 4:2:2P@ML (4:2:2 profil, glavna razina):
terenska snimanja i vijesti (18 Mbit/s, struktura grupe slika IB)
primarna distribucija (20 Mbit/s, struktura IBBP)
pohranjivanje (30 Mbit/s, struktura IP)
postprodukcija (50 Mbit/s, samo I slike).

Primjena MP@ML (glavni profil, glavna razina):
distribucija do krajnjih korisnika (TV gledatelja) putem zemaljskih,
kabelskih i satelitskih distribucijskih sustava uz brzine prijenosa 4-9 Mbit/s.

Uz manje brzine prijenosa (manje od 15 Mbit/s), 4:2.2 profil daje loije rezultate
nego glavni profil (slika 23.), a razlog za to jest vei broj krominantnih uzoraka u
4:2:2 profilu, koji zahtijeva vei stupanj kompresije da bi se postigla ista brzina
prijenosa nego glavni profil (4:2:0).

Slika 24. Ovisnost kvalitete o brzini prijenosa i strukturi grupe slika


Iz slike je vidljivo da struktura grupe slika znatno utjee na kvalitetu slike.
Takoer je vidljivo da, ak ni uz visoke brzine prijenosa, nije mogue postii
visoku kvalitetu slike bez upotrebe predvianja pokreta.


Prijenos i pohranjivanje MPEG-2 signala

Da bi se pristupilo prijenosu ili pohranjivanju MPEG-2 signala, tokovi podataka
(videosignal, audiosignal) moraju se multipleksirati.

Multipleksiranjem se dobiva:
Prijenosni tok podataka (TS = Transport Stream) namijenjen prijenosu
signala zemaljskim, kabelskim ili satelitskim vezama
Programski tok podataka (PS = Program Stream) namijenjen
pohranjivanju podataka na digitalni medij (DVD, magnetska vrpca, ...)

Multipleksiranje audio i videosignala potrebno je kako bi se omoguio njihov
zajedniki prijenos, te ispravno dekodiranje i prikazivanje.

U programskom toku podataka se multipleksira videosignal s prateim
audiosignalima (viekanalni zvuk) i podacima, pri emu ti svi signali pripadaju
jednom programu.

U prijenosnom toku mogue je multipleksiranje audiosignala, videosignala i
podataka koji pripadaju razliitim programima.

Hijerarhija multipleksiranja odreena MPEG-2 normom sastoji se od tri vrste
tokova podataka:
osnovni tok podataka (ES = Elementary Stream)
paketizirani osnovni tok podataka (PES = Packetized Elementary Stream)
prijenosni (TS) ili programski (PS) tok podataka (slika 25.).


Slika 25. Dobivanje programskog i prijenosnog toka podataka



Programski tok dobiven multipleksiranjem sadri pakete nastale iz jednog ili vie
osnovnih tokova podataka koji pripadaju jednom programu; moe sadravati
jedan tok podataka videosignala i vie tokova podataka audiosignala.

Paketi programskog toka imaju promjenjivu duljinu to uzrokuje potekoe
budui da dekoder mora prepoznati toan poetak i kraj paketa. Da bi se to
omoguilo, u zaglavlju paketa se nalaze podaci o duljini paketa. Primjer
programskog toka prikazan je na slici 26.

Slika 26. Paketi programskog toka podataka



Za razliku od programskog toka podataka, prijenosni tok moe sadravati jedan
ili vie razliitih programa, tj. on moe nastati multipleksiranjem vie programskih
tokova podataka ili multipleksiranjem PES paketa koji pripadaju razliitim
programima. Osim toga, prijenosni tok je namijenjen prijenosu MPEG signala
kroz mreu, tako da mora biti oblikovan tako da bude to manje osjetljiv na
smetnje i pogreke u prijenosu. Zbog toga se koriste paketi fiksne duljine koji se
mogu brzo komutirati u irokopojasnim mreama.

Paketi programskog toka podataka imaju konstantnu duljinu od 188 bajta, od
ega zaglavlje sadrava 4 bajta, a ostalih 184 bajta je podijeljeno na adaptacijsko
podruje i podruje podataka (slika 27.)

Slika 27. Paket prijenosnog toka podataka

Paket prijenosnog toka (188 bajta)
Zaglavlje (4 bajta) Adaptacijsko podruje Podaci

Adaptacijsko podruje sadri vremenske oznake i reference kao i informacije koje
omoguuju dohvat podataka; definira izgled ostalih dijelova paketa i sadri informaciju o
vrsti signala koji se prenosi u paketu.

Primjena MPEG-2 norme u radiodifuziji digitalnog TV signala

Prijenos digitalnog TV signala definiran je u okviru DVB (Digital Video
Broadcasting) projekta. Kao rezultat DVB projekta nastale su europske ETSI
norme za satelitsku, kabelsku i zemaljsku radiodifuziju digtalnog TV signala.
Opa blok-shema sustava za radiodifuziju digitalnog TV signala prikazana je na
slici 28.

Slika 28. Sustav za prijenos digitalnog TV signala



Izvorno kodiranje obuhvaa postupke smanjenja koliine podataka i brzine prijenosa.
Prenose se tri vrste podataka: videosignali, audiosignali i pratee informacije (vremenske,
sigurnosne, identifikacijske...). Kao rezultat izvornog kodiranja dobivaju se osnovni
tokovi podataka (ES = Elementary Stream).

MPEG-2 normom definiran je postupak ukljuivanja osnovnih tokova podataka u
prijenosnu mreu. Podaci se paketiziraju, pri emu se paketi prijenosnog toka (TS) alju
na kanalno kodiranje, ime se osigurava zatita od pogreke, i priprema signal za
modulaciju VF nosioca.

U svim zemaljskim, kabelskim i satelitskim sustavima za radiodifuziju digitalnog TV
signala za izvorno kodiranje rabi se MPEG-2 norma, dok se kanalno kodiranje i
modulacijski postupak razlikuju, ovisno o prijenosnom mediju:
za satelitsku radiodifuziju rabi se modulacijski postupak QPSK (Quadrature Phase
Shift Keying)
glavna karakteristika tog modulacijskog postupaka je djelotvornost po snazi, to
je vano zbog male snage odailjaa na satelitu i velikog guenja signala pri prolasku
kroz atmosferu;

za kabelsku distribuciju digitalnih TV signala rabi se QAM (Quadrature
Amplitude Modulation kvadraturna amplitudna modulacija) sa 16, 32 ili 64
diskretna stanja;
glavna osobina QAM postupka jest spektralna djelotvornost, koja omoguava
prijenos signala kanalom ija je irina ograniena na 8 MHz;

za zemaljsku radiodifuziju rabi se OFDM (Orthogonal Frequency Division
Multiplex) frekvencijski multipleks ortogonalnih podnosilaca;
OFDM postupak koristi veliki broj frekvencijski vrlo bliskih podnosilaca, pri
emu je mogue pojedine podnosioce modulirati razliitim modulacijskim
postupcima.


MPEG kodiranje test

Test kvalitete slike kodirane primjenom MPEG normi obavljen je pomou programa
VcDemo, koji omoguava definiranje svih neophodnih parametara kodiranja (brzina
prijenosa, vrsta grupe slika, odabir MPEG-1 ili MPEG-2 norme). Cilj ovog testa je dati
uvid u ovisnost kvalitete slike o brzini prijenosa te strukturi grupe slika, a kao parametar
kvalitete uzima se vrni odnos signal-um u komprimiranom signalu (PSNR = Peak
Signal to Noise Ratio). Ispitne sekvence koje se koriste u ovom testu dobivene su uz sam
program.

PSNR se temelji na razlici izvorne i dekodirane slike, prema slijedeoj formuli:
MSE
PSNR
n
) 1 2 (
log 10

=
,

pri emu je n broj bitova koritenih za kodiranje uzorka slike, a MSE parametar definiran
formulom:

2
1 1
, ,
) ' (
1

= =
=
M
j
N
k
k j k j
x x
MN
MSE


Znaenje oznaka u formuli: M, N dimenzije slike,
x
j,k
uzorak izvorne slike,
x'
j,k
uzorak dekodirane slike.


Rezultat testa je prikazan na slikama 29a i 29b. Na x-osi se nalaze vrste grupe slika, a na
y-osi vrijednosti PSNR izraene u decibelima.

Slika 29a. Rezultat kodiranja ispitne sekvence ''Suzie''
30
35
40
45
50
55
I IBB IPP IBB3(PBB)
Grupa slika
P
S
N
R

[
d
B
]
MPEG-1, 0,128 Mbit/s
MPEG-1, 0,384 Mbit/s
MPEG-1, 0,768 Mbit/s
MPEG-1, 1,15 Mbit/s
MPEG-1, 2,0 Mbit/s
MPEG-1, 3,5 Mbit/s
MPEG-1, 5,0 Mbit/s
MPEG-1, 8,0 Mbit/s

30
35
40
45
50
55
I IBB IPP IBB3(PBB)
Grupa slika
P
S
N
R

[
d
B
]
MPEG-2, 0,128 Mbit/s
MPEG-2, 0,384 Mbit/s
MPEG-2, 0,768 Mbit/s
MPEG-2, 1,15 Mbit/s
MPEG-2, 2,0 Mbit/s
MPEG-2, 3,5 Mbit/s
MPEG-2, 5,0 Mbit/s
MPEG-2, 8,0 Mbit/s


Slika 29b. Rezultat kodiranja ispitne sekvence ''Car phone''
25
30
35
40
45
50
I IBB IPP IBB3(PBB)
Grupa slika
P
S
N
R

[
d
B
]
MPEG-1, 0,128 Mbit/s
MPEG-1, 0,384 Mbit/s
MPEG-1, 0,768 Mbit/s
MPEG-1, 1,15 Mbit/s
MPEG-1, 2,0 Mbit/s
MPEG-1, 3,5 Mbit/s
MPEG-1, 5,0 Mbit/s
MPEG-1, 8,0 Mbit/s

25
30
35
40
45
50
I IBB IPP IBB3(PBB)
Grupa slika
P
S
N
R

[
d
B
]
MPEG-2, 0,128 Mbit/s
MPEG-2, 0,384 Mbit/s
MPEG-2, 0,768 Mbit/s
MPEG-2, 1,15 Mbit/s
MPEG-2, 2,0 Mbit/s
MPEG-2, 3,5 Mbit/s
MPEG-2, 5,0 Mbit/s
MPEG-2, 8,0 Mbit/s



Iz dobivenih rezultata moe se zakljuiti slijedee:

najvei utjecaj na kvalitetu slike (predstavljenu vrnim odnosom signal-
um) ima brzina prijenosa koju je mogue ostvariti u nekom prijenosnom
kanalu;
utjecaj strukture grupe slika je jasno vidljiv: uz dodavanje P i B-slika u
grupu slika, kvaliteta se poboljava, to je naroito vano pri malim brzinama
prijenosa;
vrsta kodiranja (MPEG-1 ili MPEG-2) ne utjee vidljivo na kvalitetu slike (u
testiranim uvjetima);
sadraj slike utjee na kvalitetu slike (uz inae jednake uvjete kodiranja).


Dobiveni rezultati jasno govore da je poeljno, kad god je to mogue, koristiti
vee grupe slika, uz primjenu i P-slika i B-slika. Nedostatak takve strukture
pokazuje se jedino u sluaju da je videosignal potrebno naknadno obraivati. U
tom sluaju poeljno je (zbog uvjeta da rez mora zapoeti I-slikom) da grupe
slika budu to krae, odnosno da se koriste samo I-slike. Takav sustav zahtijeva
velike brzine prijenosa.

OSNOVE POSTUPAKA KOMPRESIJE

OPENITI PRINCIP KOMPRESIJE

Kako se provodi kompresija? Za odgovor na to pitanje potrebno je znati da su u
svim konvencionalnim digitalnim sustavima ogranieni i broj bitova po uzorku,
kao i brzina prijenosa. Brzina prijenosa ograniava koliinu podataka koja se
moe prenijeti u nekom vremenskom intervalu, no za veinu primjena, odnosno
veinu programskog materijala, ta se granica ne dostie.
Prema Shannonovom teoremu, signal koji se ne mijenja, ne sadri informaciju.
Uzmimo za primjer sinusni valni oblik: svaki period signala jednak je slijedeem,
dakle, sinusni signal ne nosi nikakvu informaciju zbog injenice da nema irinu
pojasa.

U sluaju videosignala, prisutnost prepoznatljivih objekata u slici rezultira skupom
elemenata slike slinih karakteristika. Ti elementi slike daju kao rezultat
frekvenciju signala koja je daleko ispod maksimalne koju je mogue prenijeti
sustavom. Na primjer, u sluaju stacionarne slike, svaka slika je jednaka
prethodnoj, tako da, u stvari, ne treba prenositi nove podatke jednom kad je prva
slika ve poslana.

Cilj sustava za kompresiju jest prepoznati i odailjati samo korisni, promjenjivi dio
ulaznog signala. Taj korisni dio signala naziva se entropija. Preostali,
nepromjenjivi dio ulaznog signala naziva se redundancija (slika 3.).

Slika 3. Entropija i redundancija


U principu, redundanciju nije uope potrebno prenositi. Meutim, u realnim
uvjetima prijenosa dio redundancije se prenosi kako bi se omoguila
rekonstrukcija informacija koje su se izgubile u prijenosu, tj. signal je otporniji na
smetnje ako redundancija ipak postoji.

Slika 4. a) pokazuje sluaj idealne kompresije: ako koder poalje svu entropiju, a
u prijenosu ne doe do gubitka, primljeni signal se ne moe razlikovati od
originala. Ukoliko doe do bilo kakvih smetnji u prijenosu, dio informacije se gubi,
i dekodirani signal e biti slabije kvalitete u odnosu na original.
Druga stvar na koju treba obratiti panju jest stupanj kompresije. U sluaju
prevelikog stupnja kompresije, dolazio do oteenja entropije, jer je ve sva
redundancija u potpunosti uklonjena (slika 4. b)). Stoga se postavlja zahtjev da
se stupanj kompresije mora prilagoditi sadraju slike.


Slika 4. Problem odabira stupnja kompresije



Poto je entropija funkcija ulaznog signala, potrebna brzina prijenosa u sluaju
idealne kompresije e biti promjenjiva. Nije uvijek mogue imati prijenosni kanal
promjenjive brzine prijenosa, tako da mnogi ureaji za kompresiju imaju
memorijske spremnike na oba kraja lanca. To usrednjuje brzinu prijenosa, no
uzrokuje i kanjenja. Takva kanjenja mogu biti neprihvatljiva u nekim
sluajevima (npr. videokonferencije) pa se koristi kanal sa stalnom brzinom
prijenosa, ime se izbjegava potreba za memorijskim spremnicima. Takav sustav
ima manja kanjenja signala.
IDEALNI I REALNI SUSTAV KOMPRESIJE

Sve do sada, razmatranja su se zasnivala na idealnom koderu, koji je uvijek
sposoban razluiti entropiju od redundancije. Naalost, takav koder nije mogu,
jer bi bio beskonano sloen i imao bi beskonano kanjenje. Stoga smo u praksi
prisiljeni posegnuti za realnim koderom, koji e uvijek odstupati od idealnog, bez
obzira na primjenu. Ta injenica znai da emo uvijek morati odabrati manji
stupanj kompresije od idealnog (najveeg mogueg), jer koder nije u stanju tono
razlikovati entropiju od redundancije.

Slika 4. c) pokazuje sluaj realnog kodera: uz entropiju se prenosi jo dio
informacije koji moe, ali i ne mora biti redundantan. to je koder jednostavniji,
taj dio informacije je vei. Dekoder, meutim, mora moi obraditi signal u bilo
kojem sluaju. Zbog toga, sve odluke o nainu i stupnju kompresije donose se na
razini kodera, a dekoder samo mora dekodirati primljeni signal to je bolje
mogue. Takav sustav je dakle asimetrian: koder je najee sloen, a dekoder
je znatno jednostavniji.

Iz svega do sada navedenog, moe se zakljuiti da je sloenost kodera, za neku
traenu kvalitetu, to vea to je zahtijevana brzina prijenosa manja. Zbog toga se
u primjeni nalazi velik broj razliitih kodera.


REDUNDANCIJE U VIDEOSIGNALU

Osnovne vrste redundancije koje se pojavljuju u videosignalu su:

c) a) statistika redundancija:
prostorna (unutar svake pojedine slike);
vremenska (izmeu slika);

d) b) subjektivna redundancija (vezana za svojstva ljudskog vizualnog
sustava).


NAELA KOMPRESIJE VIDEOSIGNALA

Kompresija videosignala zasniva se na uklanjanju redundancije iz toka podataka
koji je potrebno poslati kroz kanal. Drugim rijeima, iskoritavaju se dvije
pretpostavke koje definiraju redundanciju u nekom videosignalu.
Prva pretpostavka odnosi se na svojstvo ljudskog vizualnog sustava da je
osjetljivost na um u slici ovisna o frekvenciji, tj. oko slabije zapaa sitne detalje
(visoke frekvencije).
Druga pretpostavka je da u nizu pokretnih slika uvijek postoji znatna slinost
izmeu trenutne i slijedee slike.

Slika 5. Ovisnost prostorne frekvencije o veliini objekta u slici






Slika 6. Osjetljivost oka na detalje



Iz slika 5. i 6. vidljivo je da se zbog karakteristika ljudskog oka mogu iz slike pri
kompresiji ukloniti sitni detalji, budui da daju kao rezultat vie frekvencije, koje
oko manje zapaa.

Kompresija u naelu radi tako da reducira broj bitova digitalne rijei. To dovodi
do smanjenja rezolucije i poveanja uma, tako da se postupak mora provoditi
pazei da um ne postane vidljiv, tj. pazei na prostornu frekvenciju (frekvenciju
generiranu sadrajem slike). Videokoderi zbog toga moraju provoditi analizu
frekvencija koje se pojavljuju u ulaznom signalu, te obraivati svaku frekvenciju
posebno. Ako neke frekvencije u ulaznom signalu nema, nee biti prenesen
nikakav podatak.
Dekoder se izvodi kao potpuno inverzni sklop u odnosu na koder (slika 7.)

Slika 7. Kompresija i dekompresija (osnovno naelo)


Postupak prikazan na ovoj slici tretira svaku pojedinu sliku zasebno i naziva se
kodiranje unutar slike (intra-frame coding). Na taj nain rade sustavi za
kompresiju mirnih slika npr. JPEG (Joint Photographic Experts Group).

Pri kodiranju videosignala, osim kodiranja unutar slike, primjenjuje se i postupak
kodiranja izmeu slika (inter-frame coding), koji iskoritava vremensku
redundanciju koja se pojavljuje izmeu dviju slika u nizu. Na taj nain mogu se
postii vei stupnjevi kompresije.

Slika 8. prikazuje jednostavan sustav za kodiranje izmeu slika. Poevi sa
slikom kodiranom postupkom kodiranja unutar slike, sve slijedee slike opisane
su samo razlikama o odnosu na trenutnu sliku. Dekoder zbraja razliku slika s
trenutnom slikom i na taj nain stvara slijedeu sliku. Slika koja predstavlja
razliku dobiva se oduzimanjem vrijednosti elementa slike u jednoj slici i
vrijednosti istog elementa slike u drugoj slici. Ta slika se moe, kao i svaka druga
slika, komprimirati postupkom kodiranja unutar slike.

Postoje mnogi problemi koji spreavaju ovakvu jednostavnu izvedbu. Na primjer,
bilo koja pogreka koja se pojavi u toku prijenosa u samo jednoj slici, bit e
vidljiva u svim slijedeim slikama (propagacija pogreaka). Osim toga, nije
mogue dekodirati signal ako se on ne prati od poetka emitiranja, tj. nije
mogue mijenjanje kanala. To sve dovodi do potrebe da se povremeno prenose i
slike dobivene samo kodiranjem unutar slike (I-slike).

Ovaj nain prijenosa oteava i naknadnu obradu videosignala jer toke rezova
moraju biti tako odabrane da svaki isjeak poinje I-slikom.

Slika 8. Kodiranje izmeu slika


Sustav kodiranja izmeu slika nije pogodan za prijenos videosignala u kojem
postoje velike razlike izmeu pojedinih slika (npr. nagli pokreti) jer su razlike
prevelike da bi ih se moglo uinkovito kodirati. To dovodi do potrebe za
uvoenjem nadomjetanja pokreta (motion compensation).

Nadomjetanje pokreta provodi se tako da se na strani kodera usporeuju
prethodna i trenutna slika, te se mjeri pomak podruja slike za dobivanje vektora
pomaka. Koder modelira objekt na novom poloaju pomicanjem elemenata
prethodne slike pomou vektora pomaka. Odstupanja od stvarne situacije
korigiraju se usporedbom modelirane i stvarne slike (slika 9.).

Koder alje vektore pomaka i signal razlike slika. Dekoder pomie objekt iz
prethodne slike pomou vektora pomaka i dodaje signal razlike da bi dobio
slijedeu sliku.

Nadomjetanje pokreta omoguava vei stupanj kompresije, uz veu sloenost
samog sustava.

Slika 9. Kodiranje s nadomjetanjem pokreta





MPEG NORME


UVODNI POJMOVI


Prostorna i vremenska redundancija

Kompresija videosignala zahtijeva postupak identifikacije redundancije u
programskom materijalu koji se prenosi. Taj postupak obino se provodi u dva
koraka:
3. 1. pronalaenje i uklanjanje prostorne redundancije vri se unutar svake
pojedinane slike, bez referenci na prethodne ili slijedee slike;
4. 2. vremenska redundancija pronalazi se i uklanja pomou usporedbe
trenutne i prethodne slike.


Diskretna kosinusna transformacija

Prostorna redundancija postoji u svim realnim programskim materijalima. Ako u
slici postoji neki prepoznatljivi objekt, tada e svi elementi slike koji ga
predstavljaju imati slinu vrijednost amplitude. Veliina objekata u slici odreuje
prostornu frekvenciju koja e se pojaviti u signalu. U realnim situacijama
prevladavaju nie frekvencije, a osim toga, u signalu se najee ne pojavljuje
cijeli spektar frekvencija. Nuno je dakle provesti frekvencijsku analizu. U tu
svrhu koristi se diskretna kosinusna transformacija (DCT = Discrete Cosine
Transform) da bi se vrijednosti elemenata slike pretvorile u koeficijente koji se
dalje lake mogu podvrgnuti postupku kompresije.

Izvorna slika najprije se dijeli u blokove veliine 88 elemenata slike. Na svaki
blok se primjenjuje dvodimenzijska DCT koja daje 64 DCT koeficijenta:


|
.
|

\
| +
|
.
|

\
| +
=

= =
16
) 1 2 (
cos
16
) 1 2 (
cos ) , (
4
) ( ) (
) , (
7
0
7
0
t t v k u j
k j f
v C u C
v u F
j k


,
2
1
) ( = u C
za u = 0, C(u) = 1, za u = 1, 2, ... , 7;

,
2
1
) ( = v C
za v = 0, C(v) = 1, za v = 1, 2, ... , 7.

U gornjoj formuli F(u,v) su DCT koeficijenti, a f(j,k) izvorne vrijednosti amplitude
elemenata slike.
F(0,0) naziva se istosmjerni (DC) koeficijent i najee se rauna prema formuli:

= =
=
7
0
7
0
) , (
8
1
) 0 , 0 (
j k
k j f F


Ova formula govori nam da je DC koeficijent zapravo jednak osmerostrukoj
srednjoj vrijednosti elemenata slike u bloku.


Slika 10. Prikaz bloka DCT koeficijenata



Na slici 10. gornji lijevi kut predstavlja DC koeficijent, a sputajui se dolje i
desno dolazi se do koeficijenata koji predstavljaju visoke prostorne frekvencije
signala nastalog iz izvorne slike. Pomak prema desno predstavlja porast
horizontalne prostorne frekvencije, a pomak prema dolje predstavlja porast
vertikalne prostorne frekvencije.

Na strani dekodera vrijednosti elemenata slike mogu se rekonstruirati pomou
inverzne diskretne kosinusne transformacije (IDCT):

|
.
|

\
| +
|
.
|

\
| +
=

= =
16
) 1 2 (
cos
16
) 1 2 (
cos ) , (
4
) ( ) (
) , (
7
0
7
0
t t v k u j
v u F
v C u C
k j f
u v



Diskretnom kosinusnom transformacijom ne provodi se kompresija. Pomou te
transformacije samo se izvorni elementi slike pretvaraju u oblik iz kojega je
mogue jasno odrediti redundanciju. Poto sve prostorne frekvencije nisu
istodobno prisutne u signalu, DCT e dati skup koeficijenata od kojih e neki biti
jednaki ili vrlo bliski nuli. Koeficijente koji su jednaki nuli ne treba uope prenositi,
a koliko e se koeficijenata bliskih nuli odbaciti, ovisi o eljenoj kvaliteti slike i
stupnju kompresije koji se eli postii. Ukoliko se neki koeficijent ne moe
odbaciti, mogue ga je, u cilju postizanja veeg stupnja kompresije, prenijeti s
manjim brojem bita, ime se manje naruava kvaliteta slike nego potpunim
odbacivanjem.


Kvantizacija

Vidljivost prostornih frekvencija u signalu znatno varira u cijelom rasponu.
Ljudsko oko moe tolerirati mnogo veu koliinu uma na visokim frekvencijama
nego na niskim. Zbog toga se rabi kvantizacija, kako bi se sav eventualno nastali
um koncentrirao u podruju visokih frekvencija, gdje je slabo uoljiv. DCT
koeficijenti se dijele faktorom koji je funkcija poloaja koeficijenta u bloku (faktor
dijeljenja se poveava pri kretanju prema desno i prema dolje u tablici
koeficijenata). Istosmjerni (DC) koeficijent se ne kvantizira. Na strani dekodera
visokofrekvencijski koeficijenti se mnoe najveim faktorom, tako da je utjecaj
uma prebaen najveim dijelom u to podruje, koje je oku najmanje vidljivo.
Nakon kvantizacije, vrijednosti koeficijenata bit e jo manje, tako da e veina
njih biti vrlo bliska nuli. U tipinom programskom materijalu, veina velikih
koeficijenata se nalazi u gornjem lijevom kutu bloka. Zbog takvog rasporeda
koeficijenata prikladno je koeficijente oitavati metodom cik-cak analiziranja (slika
11.), poevi od gornjeg lijevog kuta tablice.

Slika 11. Cik-cak analiziranje



Pritom se dobiva niz koeficijenata koji na poetku sadri koeficijente razliite od
nule, dok su koeficijenti jednaki nuli koncentrirani na kraju niza. Takav oblik
omoguava da se umjesto krajnjih koeficijanata (koji su ionako jednaki nuli) u
daljnji tok signala alje samo oznaka koja predstavlja te koeficijente.
Kodiranje s promjenjivom duinom niza

U nizu podataka dobivenom nakon cik-cak analiziranja koeficijenti manje
vrijednosti imaju ispred sebe vie nula nego koeficijenti vee vrijednosti. Zbog
toga je pogodno koristiti algoritam kodiranja koji e takvu raspodjelu znati
iskoristiti.

Huffmanov nain kodiranja dodjeljuje krai kod onim vrijednostima koje se ee
pojavljuju, a dui kod onim vrijednostima koje se pojavljuju rijetko. Time se
postie vea uinkovitost pri prijenosu veine realnih informacija.

Pri upotrebi diskretne kosinusne transformacije est je sluaj da mnogi
koeficijenti imaju vrijednost jednaku nuli, te je uinkovito takav niz kodirati
pomou kodiranja duine niza. Na taj nain koder jednostavno alje podatak
koliko je koeficijenata zaredom jednako nuli.


Kodiranje unutar slike (intra-kodiranje)

Slika 12. Kodiranje unutar slike

Slika 12. prikazuje potpunu blok-shemu kodiranja unutar slike. Kodiranjem unutar
slike nastaju tzv. I-slike (Intra-coded pictures) Ulazna slika se dijeli u blokove
veliine 88 elemenata. Na svaki blok se primjenjuje DCT, ime se dobiva tablica
koeficijenata koji se potom kvantiziraju. Cik-cak analizom se iz tablice dobiva niz
koji se alje na kodiranje duine niza i rezultat se alje u prijenosni kanal.

U dekoderu se izvorni signal ponovno rekonstruira postupkom koji je potpuno
inverzan postupku pri kodiranju.

Kodiranje izmeu slika (inter-kodiranje)

Sustav prikazan na slici 11. uklanja samo prostornu redundanciju sadranu
unutar pojedine slike. Kodiranje unutar slike ne iskoritava postojanje
redundancije izmeu dviju slika u nizu. Kako iskoristiti i tu (vremensku
redundanciju?

Rjeenje lei u diferencijalnom kodiranju (slika 13.)

Slika 13. Dobivanje razlike slika


Da bi se mogla dobiti razlika izmeu dvije slike, nuno je imati kanjenje
realizirano u sklopu kodera. Vrijednost svakog elementa prethodne slike se
oduzima od odgovarajueg elementa u trenutnoj slici, ime se dobiva razlika
slika, koja je takoer dvodimenzijska slika, i moe se podvrgnuti postupku
kompresije unutar slike primjenom diskretne kosinusne transformacije.

U dekoderu se takoer koristi kanjenje prethodne slike, s kojom se potom zbraja razlika
slika da bi se dobila trenutna slika. Ta trenutna slika zatim ponovno ulazi u krug
kanjenja da bi se dobila slijedea slika.

Pri ovakvom postupku kodiranja izmeu slika nuno je sprijeiti gomilanje sitnih
pogreaka zbog opasnosti da se one akumuliraju tijekom procesa kompresije izvornog
videosignala. Najznaajniji uzrok pojave pogreaka je kompresija razlike slika.

Radi uklanjanja pogreaka koje bi uzrokovale potpun gubitak informacije nakon
nekog vremena, nuno je da koder i dekoder imaju identini dekoder razlike
slika. U trenutku kada dekoder oduzima ptrethodnu sliku od trenutne, on u stvari
oduzima lokalno dekodiranu sliku, identinu onoj koju e dobiti stvarni dekoder
na drugoj strani prijenosnog puta. Na taj nain e biti uklonjene sve pogreke
uzrokovane prethodnom kompresijom razlike slika. Sustav je prikazan na slici 14.

Slika 14. Uklanjanje kumulativne pogreke pri kodiranju izmeu slika





Nadomjetanje pokreta; P-slike

Diferencijalno kodiranje prikazano na slici 14. daje dobre rezultate ukoliko izvorni
videosignal ne sadri znatan broj pokretnih objekata u slici. Ukoliko to nije sluaj, razlika
slika e sadravati gotovo istu koliinu podataka kao da se uope nije koristilo kodiranje
izmeu slika. Najbolji primjer za to je pomak kamere u jednom smjeru. Pri takvom
pomaku vrijednosti veine elemenata slike se ne mijenjaju, nego samo dolazi do njihovog
pomaka na drugo mjesto. Da bi se i takav videosignal mogao uspjeno komprimirati,
nuno je uvesti nadomjetanje (kompenzaciju) pokreta.

Pri upotrebi kodera koji omoguava nadomjetanje pokreta, usporeuju se
podruja dvaju susjednih slika u nizu, kako bi se ustanovio smjer i veliina
relativnog pomaka izmeu slika. Tako se dobivaju podaci u obliku
dvodimenzijskog vektora pomaka (slika 15.).

Slika 15. Kodiranje uz nadomjetanje pokreta



(1) Mjerenje pomaka izmeu slika A i B
(2) Pomicanje slike A pomou vektora pomaka
(3) Oduzimanje slike A od slike B
(4) Odailjanje vektora i podataka razlike slika u prijenosni kanal


Koder rabi vektore pomaka za pomicanje elemenata prethodne slike i stvaranje
predviene slike (P-slike, Predicted Frames) prije nego to njihove vijednosti oduzme od
vrijednosti elemenata trenutne slike. Ukoliko je pocjene pokreta bila tona, proces
pomaka e dovesti objekte u predvienoj slici na isto mjesto na kojem se nalaze u
stvarnoj slici, te e preostati samo mala koliina podataka o razlikama izmeu slika.

Poto se vektori pomaka alju zajedno s podacima razlike slika, dekoder na
prijemnoj strani ih moe upotrijebiti za jednaki pomak prethodne slike ime
dobiva odgovarajuu P-sliku. Zbrajanjem signala razlike dobiva se dekodirana
trenutna slika.

Za potrebe nadomjetanja pokreta slika je razbijena u pravokutna podruja koja se
nazivaju makroblokovi. Svaki makroblok ima vlastiti vektor pomaka koji se primjenjuje
na cijeli blok. U ovisnosti o poloaju objekata, neki makroblokovi se pomiu, a neki ne.
Zato nije uvijek nuno koristiti nadomjetanje pokreta, ve se koder treba ''odluiti'' da li
takav postupak daje manju potrebnu brzinu prijenosa ili je bolje raditi bez nadomjetanja
pokreta, prenosei samo razlike slika.

Zbog injenice da je kretanje nekog objekta u realnom programskom materijalu relativno
konstantno u trajanju od nekoliko slika, vektori pomaka se odailju diferencijalno, tj.
ukoliko nema promjene u nainu pomaka, vrijednost parametra vektora pomaka jednaka
je nuli, te se vektori jednostavno kopiraju iz prethodne slike. Ako kretanje mijenja brzinu
ili smjer, tada se alju razlike vektora pomaka.


Dvosmjerno predvianje; B-slike

U svrhu dodatnog smanjenja zahtjeva na brzinu prijenosa, odnosno za postizanje
jo veeg stupnja kompresije, uvodi se koncept dvosmjernog kodiranja (slika
16.), ime se dobivaju B-slike (Bidirectionally Coded Frames).

Slika 16. Dvosmjerno kodiranje


Trenutna slika se usporeuje i sa prethodnom i sa buduom slikom; izvode se dvosmjerni
vektori pomaka. Podruje oznaeno kvadratiem na trenutnoj slici dobiva se tako iz
budue slike.

Dvosmjerno predvianje zahtijeva promjenu rasporeda slika pri prijenosu jer do dekodera
moraju prvo stii budue slike potrebne u procesu predvianja, a zatim trenutna slika.

Najee grupe slika (uz mnogo ostalih rasporeda):
IIII...
IPIP...
IBPIBP... (prijenosni raspored IPBIPB...)
IBIB...

Razlozi za prijenos I-slika

U praksi nije mogue koristiti isto diferencijalno kodiranje, budui da dekoder
moe primati signal samo od njegovog poetka. Osim toga, svaka pogreka u
prijenosu samo jedne slike prenosi se na sve slijedee slike.
Zbog toga je nuno povremeno u prijenosni tok ubaciti slike koje su kodiranje iskljuivo
metodom kodiranja unutar slike, bez predvianja (I-slike), tako da se dobiva struktura
toka podataka kao na slici 17.

Slika 17. Primjer strukture prijenosnog toka podataka


U nizu slika nije apsolutno nuno da se I-slike pojavljuju u strogo odreenom rasporedu,
budui da svaka slika ima oznaku koja govori dekoderu kako je treba obraditi.

Ureivanje i naknadna obrada ovakvog signala mogua je samo u trenucima u kojima se
pojavljuju I-slike. Zbog toga, u sluaju kad je potrebna naknadna obrada videosignala, I-
slike se moraju koristiti u znatnijoj mjeri, te nisu mogui veliki omjeri kompresije.

OPENITO O MPEG NORMAMA

MPEG (Moving Pictures Experts Group) je radna grupa unutar ISO/IEC
(International Standardization Organisation / International Electrotechnical
Committee), zaduena za razvoj meunarodnih standarda za kompresiju,
dekompresiju, obradu i prezentaciju pokretnih slika i prateih audio sadraja.
Do sada su doneene slijedee norme:
MPEG-1 kodiranje pokretnih slika i prateih audiosignala za digitalno
pohranjivanje pri brzinama do 1,5 Mbit/s (1992. godine);
MPEG-2 generiko kodiranje pokretnih slika i prateih audiosignala
(1995.);
MPEG-4 kodiranje audio-vizualnih objekata (verzija 1: 1998., verzija 2:
1999.);
MPEG-7 suelje za opis multimedijskih sadraja (2001.);
MPEG-21 multimedijski sustav.

MPEG norme same po sebi se ne mogu jednostavno definirati. U svojoj biti,
MPEG je skup standardnih alata, precizno definiranih algoritama i naina na koji
se oni mogu kombinirati kako bi se napravio stvarni sustav za kompresiju
signala.

Suprotno oekivanju, MPEG norme ne propisuju egzaktni nain na koji se kompresija
mora provesti. Umjesto toga, MPEG precizno propisuje nain na koji dekoder mora
obraditi skup razliitih komprimiranih tokova podataka. MPEG ne propisuje kako treba
prenositi sam signal, jer e to biti odreeno karakteristikom sustava u primjeni. Razlog za
takav pristup je omoguavanje velike fleksibilnosti, uz istovremeneo zadravanje
kompatibilnosti meu sustavima. Razni proizvoai opreme mogu razvijati razliite
algoritme kompresije, ali izlazni komprimirani videosignal mora biti sukladan MPEG
standardu. To omoguava da se sami algoritmi kompresije neprekidno usavravaju, a da
istovremeno komprimirani signal ostane kompatibilan sa svim postojeim dekoderima.

Primjena kompresije videosignala na zadrava se samo na televizijskim sustavima;
kompresija se koristi za niz primjena, poevi od prikaza videosignala na monitorima
raunala, pa sve do raznih prezentacijskih primjena. Zahtjevi za kvalitetom variraju od
vrlo malih (npr. videotelefoni, videonadzor, ...) do vrlo velikih (transparentnost potrebna
u TV produkciji).
U razliitim primjenama tako se moe dopustiti razliit stupanj sloenosti kodera i
dekodera, to je dovelo do potrebe za slojevitom strukturom kodiranja.

MPEG-1 (ISO/IEC IS 11172)

Formati slike

ITU-R preporuka BT.601:

odreuje frekvencije uzorkovanja za komponente videosignala u 525/60 i
625/50 standardima uz omjer stranica 4:3 i 16:9
definira formate uzorkovanja 4:4:4 (frekvencija uzorkovanja za sve
komponente signala iznosi 13,5 MHz (4:3), odnosno 18 MHz (16:9)) i 4:2:2
(frekvencija uzorkovanja 13,5/18 Mhz za luminantnu komponentu i 6,75/9
MHz za svaku od krominantnih komponenti)
576 linija u aktivnom dijelu slike za 625/50 sustav i 480 linija u aktivnom
dijelu slike za 525/60 sustav
svaka digitalna linija u aktivnom intervalu sadri 720 luminantnih uzoraka,
te 720 (4:4:4) ili 360 (4:2:2) uzoraka krominantnih komponenti

Osim formata 4:4:4 i 4:2:2 u upotrebi su i formati 4:1:1 i 4:2:0 (nije dio preporuke
BT.601, ali se koristi u MPEG normi).

Kao polazini format pri kompresiji prema MPEG-1 normi, upotrebljava se SIF
(Source Input Format), izveden iz ITU-R preporuke BT.601.

Tablica 1. SIF i BT.601 formati slike

Vertikalna frekvencija 25 Hz 30 Hz
Luminantna komponenta:
ITU-R BT.601
SIF

720 576
360 288

720 480
360 240
Krominantna komponenta:
ITU-R BT.601
SIF

360 576
180 144

360 480
180 120

Iz tablice je vidljivo kako je rezolucija slike koja se koristi u postupku MPEG-1
kodiranja smanjena na polovicu, u odnosu na rezoluciju slike propisanu
preporukom BT.601.


Slika 18. Postupak dobivanja SIF formata iz BT.601 oblika



Brojke u zagradama na slici se odnose na 525/60 sustav, a izvan zagrada na sustav
625/50.

Postupkom prikazanim na slici 18. dobiva se SIF format (strukture uzorkovanja 4:2:0),
koji ipak nije jo uvijek mogue direktno upotrijebiti za kompresiju, jer horizontalna
rezolucija od 360 elemenata slike nije djeljiva sa 16, to je nuno zbog podjele slike na
makroblokove. Prilagoenje se izvodi odbacivanjem krajnjih lijevih i krajnjih desnih
elemenata slike, ime se dobiva format 352 288 (za 625/50 sustav) ili 352 240 (za
525/60 sustav).

Hijerarhijska struktura kodiranja

Kodiranje po MPEG normi organizirano je u est slojeva (slika 19.):

Blok najmanja jedinica koja se podvrgava kodiranju; veliine 88 elemenata
slike
Makroblok osnovna jedinica za kodiranje s nadomjetanjem pokreta; veliine
1616 elemenata slike
Isjeak slike (slice) horizontalni niz makroblokova
Slika osnovna jedinica u MPEG kodiranju; etiri vrste:
I-slike slike kodirane samostalno unutarnjim kodiranjem
P-slike kodirane s predvianjem uz nadomjetanje pokreta
B-slike kodirane s predvianjem uz nadomjetanje pokreta, pri emu se
predvianje vri iz prethodnih i iz buduih slika
D-slike slike dobivene kodiranjem samo istosmjernog (DC) koeficijenta;
koriste se izuzetno rijetko
Grupa slika (GOP = Group of pictures) niz od jedne ili vie slika pri kodiranju
i/ili prijenosu
Sekvenca niz od odreenog broja grupa slika

Slika 19. Hijerarhijska struktura kodiranja


U grupi slika pojedine slike su rasporeene prema slijedeem rasporedu:

I
1
B
1
B
2
P
1
B
3
B
4
P
2
B
5
B
6
P
3
B
7
B
8
I
2


Za rekonstrukciju B-slika nuno je imati i prethodne i budue I i P-slike, te se prijenosni
raspored mora tome prilagoditi (slika 20.):

I
1
P
1
B
1
B
2
P
2
B
3
B
4
P
3
B
5
B
6
I
2
B
7
B
8


Slika 20. Raspored slika pri kodiranju i pri prijenosu




Postupak kodiranja

Postupak MPEG kodiranja provodi se u vie faza (blok-shema je prikazana na
slici 21.):

4. Slika se dijeli u blokove veliine 8 8 elemenata slike.

5. Provodi se diskretna kosinusna transformacija (uklanjanje prostorne redundancije)
koriste se 64 koeficijenta transformacije
provodi se kvantizacija DCT koeficijenata

6. Provodi se kodiranje s predvianjem uz nadomjetanje pokreta (uklanjanje
vremenske redundancije)
DCT koeficijenti se inverzno kvantiziraju, transformiraju i pohranjuju
izvorna slika se usporeuje s prethodnom I ili P-slikom
u sklopu za predvianje pokreta proraunavaju se vektori pokreta
vektori pokreta se primjenjuju na prethodnu sliku
makroblok iz prethodne slike pomaknut vektorom pokreta postaje prediktor
(osnova za daljnje predvianje)
pogreka predvianja (razlika slika) kodira se primjenom DCT
provodi se kvantizacija DCT koeficijenata (korak kvantizacije za sve koeficijente
je 16)





Slika 21. Blok-shema MPEG kodera:




Znaenje kratica na slici:

Q = kvantizacija,
DCT = diskretna kosinusna transformacija,
VLC = kodiranje s promjenjivom duinom rijei,
Q
-1
= inverzna kvantizacija,
DCT
-1
= inverzna DCT.



Osnovna namjena MPEG-1 norme: kodiranje pokretnih slika i prateih
audiosignala za digitalno pohranjivanje pri brzinama do 1,5 Mbit/s.

Koristi se iskljuivo progresivno analiziranje.

MPEG-2 (ISO/IEC IS 13818)

Opa svojstva MPEG-2 norme

MPEG-2 je norma za generiko (aplikacijski neovisno) kodiranje videosignala i prateih
audio sadraja. Algoritam koji se primjenjuje za kodiranje slian je algoritmu u MPEG-1
normi.

Osnovna razlika izmeu MPEG-1 i MPEG-2 normi:

MPEG-1 je prilagoen videosignalu s progresivnim analiziranjem, osnovna
namjena mu je bila snimanje videosignala na CD, brzina prijenosa do 1,5 Mbit/s.
MPEG-2 je opi standard namijenjen i videosignalima s progresivnim
analiziranjem i videosignalima koji koriste analiziranje s proredom (slika se dijeli na
dvije poluslike);
MPEG-2 nudi slojevitu strukturu profila (podskup sintakse toka podataka) i razina
(odreuje parametre koji su doputeni unutar odabranog profila.



Struktura MPEG-2 kodiranja

MPEG-2 norma sadri slijedee profile i razine:

3. 1. Profili:

osnovni (SP = Simple Profile) daje najniu kvalitetu signala, ne podrava
slojevito kodiranje, ne ukljuuje dvosmjerno predvianje, format slike je 4:2:0;
glavni (MP = Main Profile) ne podrava slojevito kodiranje, ali postoji
dvosmjerno predvianje; format slike je takoer 4:2:0;
4:2:2 (4:2:2P) format slike je 4:2:2, omogueno je koritenje veih brzina
prijenosa nego u glavnom profilu;
profil sa slojevitou u odnosu na omjer signal/um (SNR) omoguava razliite
kvalitete slike s obzirom na odnos signala i uma;
profil s prostornom slojevitou (Spatial) podrava razliite prostorne rezolucije
slike;
vrni profil (HP = High Profile) podrava potpunu slojevitost i najviu kvalitetu
slike.


4. Razine:

niska (LL = Low Level) SIF format slike
glavna (ML = Main Level) standardni formati TV slike
visoka 1440 (High-1440) videosignal sa 1440 uzoraka po liniji
visoka (HL = High Level) videosignal sa 1920 uzoraka po liniji

Tablica 2. Profili i razine u MPEG-2 normi

Razina
Profil
Osnovni Glavni 4:2:2 SNR Prostorni Vrni
Visoka
Uzoraka/liniji
Linija/slici
Format
Vrste slika
Mbit/s

1920
1152
4:2:0
I, P, B
80
1920
1152
4:2:2
I, P, B
80

1920
1152
4:2:2,4:2:0
I, P, B
100
Visoka
1440
Uzoraka/liniji
Linija/slici
Format
Vrste slika
Mbit/s

1440
1152
4:2:0
I, P, B
60

1440
1152
4:2:0
I, P, B
60
1440
1152
4:2:0,4:2:2
I, P, B
80
Glavna
Uzoraka/liniji
Linija/slici
Format
Vrste slika
Mbit/s
720
576
4:2:0
I, P
15
720
576
4:2:0
I, P, B
15
720
576
4:2:2
I, P, B
50
720
576
4:2:0
I, P, B
15

720
576
4:2:0,4:2:2
I, P, B
20
Niska
Uzoraka/liniji
Linija/slici
Format
Vrste slika
Mbit/s

352
288
4:2:0
I, P, B
4

352
288
4:2:0
I, P, B
4



MPEG koder dobivanje I, P i B slika

Na slikama 22a, 22b i 22c prikazana je tipina izvedba MPEG kodera, koja sadri
dvosmjerno nadomjetanje pokreta. Digitalni videosignal ulazi kroz seriju
sklopova za kanjenje, koje je mogue zaobii, ovisno o eljenom rasporedu
slika. Signal zatim ulazi u sklop za oduzimanje i u sklop za procjenu pomaka.

Ukoliko se eli dobiti I-slika, ulazno kanjenje je ukljueno u tok signala, a sklop
za oduzimanje je iskljuen, tako da signal direktno prolazi do sklopa za prostorno
kodiranje (kodiranje unutar slike). Signal se zatim alje u slikovnu memoriju, gdje
se pohranjuje nastala I-slika (slika 22a).

Slika 22a. MPEG koder dobivanje I-slike





Slijedei korak pri kodiranju videosignala je dobivanje P-slike (slika 22b). U tu
svrhu, ulazni sklopovi za kanjenje se iskljuuju, kako bi se odabrala budua
slika, to je potrebno zbog strukture grupe slika pri prijenosu. Sklop za procjenu
pomaka usporeuje I-sliku (koja se nalazi u izlaznoj memoriji) sa P-slikom u
ulaznoj memoriji, kako bi se dobili vektori pomaka. Pomou tih vektora pomaka
pomie se I-slika ime se dobiva predviena P-slika.

Predviena P-slika se oduzima od stvarne P-slike radi dobivanja iznosa
pogreke predvianja. Pogreka predvianja se prostorno kodira i alje zajedno
s vektorima pomaka. Osim toga, pogreka predvianja se dodaje predvienoj P-
slici, ime se dobiva lokalno dekodirana P-slika koja se pohranjuje u izlaznoj
memoriji.

Izlazna memorija sada sadri I-sliku i P-sliku, tako da se moe prijei na
kodiranje B-slika.

Slika 22b. MPEG koder dobivanje P-slike




Nakon kodiranja I i P-slike, u ulazni memorijski spremnik dolazi B-slika. Sklop za
nadomjetanje pokreta usporeuje B-sliku s prethodnom I-slikom i buduom P-
slikom (koje su pohranjene u izlaznoj memoriji), ime se dobivaju dvosmjerni
vektori pomaka (slika 22c).

Postupkom nadomjetanja pokreta provedenim u oba smjera dobivaju se dvije
predviene B-slike, koje se oduzimaju od trenutne B-slike. Na razini
makroblokova odabire se pomak prema naprijed ili prema natrag, ovisno o tome
koji daje najmanju razliku. Razlike se potom prostorno kodiraju i alju zajedno s
vektorima pomaka.

Nakon to se kodiraju sve B-slike, prelazi se na stvaranje nove P-slike iz
prethodno pohranjene P-slike. Postupak se zatim nastavlja.


Slika 22c. MPEG koder dobivanje B-slike




Kvaliteta slike; primjene MPEG-2 norme

Cilj koji se eli postii pri prijenosu videosignala jest visoka kvaliteta uz to je mogue
manju brzinu prijenosa. Pritom neizbjeno dolazi do problema i razliitih naina pristupa
rjeenju.

Smanjenjem brzine prijenosa konstantnu kvalitetu slike mogue je postii
promjenom strukture grupe slika. Grupa slika koja se sastoji samo od I-slika
zahtijeva najveu brzinu prijenosa, to znai da je pri smanjivanju brzine
prijenosa nuno ubacivati B i P-slike. Visoku kvalitetu pri brzinama prijenosa
niim od 20 Mbit/s mogue je ostvariti jedino uz primjenu B i P-slika (slika 23).

Slika 23. Krivulja konstantne kvalitete




U normi MPEG-2 primjenjuje se slojevito kodiranje podaci se u koderu dijele na
dva ili vie tokova s razliitim informacijama o videosignalu. Time je omoguen
rad kodera i dekodera razliitih kvaliteta.

Slojevito kodiranje jedna je od najznaajnijih osobina MPEG-2 norme. Poseban
znaaj slojevito kodiranje ima pri prijenosu videosignala putem raunalne mree,
jer se postupak kodiranja moe prilagoditi ovisno o trenutnom prometu u mrei,
odnosno o raspoloivoj brzini prijenosa i kanjenju paketa uzrokovanom
prilikama u mrei.

Dekoder moe dekodirati samo dio podataka iz ukupnog toka podataka, ukoliko
je dovoljna nia kvaliteta slike.
Podaci se u koderu dijele po kriteriju koji moe biti odnos signal/um, prostorna ili
vremenska rezolucija. Takvu slojevitost podravaju SNR profil, profil s
prostornom slojevitou i vrni profil.

Kvaliteta slike je odreena brzinom prijenosa i rasporedom slika u grupi slika, to
se odreuje ovisno o primjeni.
Ukoliko je potrebno naknadno obraivati videosignal, koriste se kratke grupe
slika (IBIB...) uz brzine prijenosa 30-50 Mbit/s, a ukoliko se radi samo ogranien
broj generacija snimke, tada se moe upotrijebiti i grupa slika IBBP... uz brzinu
prijenosa od priblino 20 Mbit/s.

Primjene 4:2:2P@ML (4:2:2 profil, glavna razina):
terenska snimanja i vijesti (18 Mbit/s, struktura grupe slika IB)
primarna distribucija (20 Mbit/s, struktura IBBP)
pohranjivanje (30 Mbit/s, struktura IP)
postprodukcija (50 Mbit/s, samo I slike).

Primjena MP@ML (glavni profil, glavna razina):
distribucija do krajnjih korisnika (TV gledatelja) putem zemaljskih,
kabelskih i satelitskih distribucijskih sustava uz brzine prijenosa 4-9 Mbit/s.

Uz manje brzine prijenosa (manje od 15 Mbit/s), 4:2.2 profil daje loije rezultate
nego glavni profil (slika 23.), a razlog za to jest vei broj krominantnih uzoraka u
4:2:2 profilu, koji zahtijeva vei stupanj kompresije da bi se postigla ista brzina
prijenosa nego glavni profil (4:2:0).

Slika 24. Ovisnost kvalitete o brzini prijenosa i strukturi grupe slika


Iz slike je vidljivo da struktura grupe slika znatno utjee na kvalitetu slike.
Takoer je vidljivo da, ak ni uz visoke brzine prijenosa, nije mogue postii
visoku kvalitetu slike bez upotrebe predvianja pokreta.


Prijenos i pohranjivanje MPEG-2 signala

Da bi se pristupilo prijenosu ili pohranjivanju MPEG-2 signala, tokovi podataka
(videosignal, audiosignal) moraju se multipleksirati.

Multipleksiranjem se dobiva:
Prijenosni tok podataka (TS = Transport Stream) namijenjen prijenosu
signala zemaljskim, kabelskim ili satelitskim vezama
Programski tok podataka (PS = Program Stream) namijenjen
pohranjivanju podataka na digitalni medij (DVD, magnetska vrpca, ...)

Multipleksiranje audio i videosignala potrebno je kako bi se omoguio njihov
zajedniki prijenos, te ispravno dekodiranje i prikazivanje.

U programskom toku podataka se multipleksira videosignal s prateim
audiosignalima (viekanalni zvuk) i podacima, pri emu ti svi signali pripadaju
jednom programu.

U prijenosnom toku mogue je multipleksiranje audiosignala, videosignala i
podataka koji pripadaju razliitim programima.

Hijerarhija multipleksiranja odreena MPEG-2 normom sastoji se od tri vrste
tokova podataka:
osnovni tok podataka (ES = Elementary Stream)
paketizirani osnovni tok podataka (PES = Packetized Elementary Stream)
prijenosni (TS) ili programski (PS) tok podataka (slika 25.).


Slika 25. Dobivanje programskog i prijenosnog toka podataka



Programski tok dobiven multipleksiranjem sadri pakete nastale iz jednog ili vie
osnovnih tokova podataka koji pripadaju jednom programu; moe sadravati
jedan tok podataka videosignala i vie tokova podataka audiosignala.

Paketi programskog toka imaju promjenjivu duljinu to uzrokuje potekoe
budui da dekoder mora prepoznati toan poetak i kraj paketa. Da bi se to
omoguilo, u zaglavlju paketa se nalaze podaci o duljini paketa. Primjer
programskog toka prikazan je na slici 26.

Slika 26. Paketi programskog toka podataka



Za razliku od programskog toka podataka, prijenosni tok moe sadravati jedan
ili vie razliitih programa, tj. on moe nastati multipleksiranjem vie programskih
tokova podataka ili multipleksiranjem PES paketa koji pripadaju razliitim
programima. Osim toga, prijenosni tok je namijenjen prijenosu MPEG signala
kroz mreu, tako da mora biti oblikovan tako da bude to manje osjetljiv na
smetnje i pogreke u prijenosu. Zbog toga se koriste paketi fiksne duljine koji se
mogu brzo komutirati u irokopojasnim mreama.

Paketi programskog toka podataka imaju konstantnu duljinu od 188 bajta, od
ega zaglavlje sadrava 4 bajta, a ostalih 184 bajta je podijeljeno na adaptacijsko
podruje i podruje podataka (slika 27.)

Slika 27. Paket prijenosnog toka podataka

Paket prijenosnog toka (188 bajta)
Zaglavlje (4 bajta) Adaptacijsko podruje Podaci

Adaptacijsko podruje sadri vremenske oznake i reference kao i informacije koje
omoguuju dohvat podataka; definira izgled ostalih dijelova paketa i sadri informaciju o
vrsti signala koji se prenosi u paketu.

Primjena MPEG-2 norme u radiodifuziji digitalnog TV signala

Prijenos digitalnog TV signala definiran je u okviru DVB (Digital Video
Broadcasting) projekta. Kao rezultat DVB projekta nastale su europske ETSI
norme za satelitsku, kabelsku i zemaljsku radiodifuziju digtalnog TV signala.
Opa blok-shema sustava za radiodifuziju digitalnog TV signala prikazana je na
slici 28.

Slika 28. Sustav za prijenos digitalnog TV signala



Izvorno kodiranje obuhvaa postupke smanjenja koliine podataka i brzine prijenosa.
Prenose se tri vrste podataka: videosignali, audiosignali i pratee informacije (vremenske,
sigurnosne, identifikacijske...). Kao rezultat izvornog kodiranja dobivaju se osnovni
tokovi podataka (ES = Elementary Stream).

MPEG-2 normom definiran je postupak ukljuivanja osnovnih tokova podataka u
prijenosnu mreu. Podaci se paketiziraju, pri emu se paketi prijenosnog toka (TS) alju
na kanalno kodiranje, ime se osigurava zatita od pogreke, i priprema signal za
modulaciju VF nosioca.

U svim zemaljskim, kabelskim i satelitskim sustavima za radiodifuziju digitalnog TV
signala za izvorno kodiranje rabi se MPEG-2 norma, dok se kanalno kodiranje i
modulacijski postupak razlikuju, ovisno o prijenosnom mediju:
za satelitsku radiodifuziju rabi se modulacijski postupak QPSK (Quadrature Phase
Shift Keying)
glavna karakteristika tog modulacijskog postupaka je djelotvornost po snazi, to
je vano zbog male snage odailjaa na satelitu i velikog guenja signala pri prolasku
kroz atmosferu;

za kabelsku distribuciju digitalnih TV signala rabi se QAM (Quadrature
Amplitude Modulation kvadraturna amplitudna modulacija) sa 16, 32 ili 64
diskretna stanja;
glavna osobina QAM postupka jest spektralna djelotvornost, koja omoguava
prijenos signala kanalom ija je irina ograniena na 8 MHz;

za zemaljsku radiodifuziju rabi se OFDM (Orthogonal Frequency Division
Multiplex) frekvencijski multipleks ortogonalnih podnosilaca;
OFDM postupak koristi veliki broj frekvencijski vrlo bliskih podnosilaca, pri
emu je mogue pojedine podnosioce modulirati razliitim modulacijskim
postupcima.


MPEG kodiranje test

Test kvalitete slike kodirane primjenom MPEG normi obavljen je pomou programa
VcDemo, koji omoguava definiranje svih neophodnih parametara kodiranja (brzina
prijenosa, vrsta grupe slika, odabir MPEG-1 ili MPEG-2 norme). Cilj ovog testa je dati
uvid u ovisnost kvalitete slike o brzini prijenosa te strukturi grupe slika, a kao parametar
kvalitete uzima se vrni odnos signal-um u komprimiranom signalu (PSNR = Peak
Signal to Noise Ratio). Ispitne sekvence koje se koriste u ovom testu dobivene su uz sam
program.

PSNR se temelji na razlici izvorne i dekodirane slike, prema slijedeoj formuli:
MSE
PSNR
n
) 1 2 (
log 10

=
,

pri emu je n broj bitova koritenih za kodiranje uzorka slike, a MSE parametar definiran
formulom:

2
1 1
, ,
) ' (
1

= =
=
M
j
N
k
k j k j
x x
MN
MSE


Znaenje oznaka u formuli: M, N dimenzije slike,
x
j,k
uzorak izvorne slike,
x'
j,k
uzorak dekodirane slike.


Rezultat testa je prikazan na slikama 29a i 29b. Na x-osi se nalaze vrste grupe slika, a na
y-osi vrijednosti PSNR izraene u decibelima.

Slika 29a. Rezultat kodiranja ispitne sekvence ''Suzie''
30
35
40
45
50
55
I IBB IPP IBB3(PBB)
Grupa slika
P
S
N
R

[
d
B
]
MPEG-1, 0,128 Mbit/s
MPEG-1, 0,384 Mbit/s
MPEG-1, 0,768 Mbit/s
MPEG-1, 1,15 Mbit/s
MPEG-1, 2,0 Mbit/s
MPEG-1, 3,5 Mbit/s
MPEG-1, 5,0 Mbit/s
MPEG-1, 8,0 Mbit/s

30
35
40
45
50
55
I IBB IPP IBB3(PBB)
Grupa slika
P
S
N
R

[
d
B
]
MPEG-2, 0,128 Mbit/s
MPEG-2, 0,384 Mbit/s
MPEG-2, 0,768 Mbit/s
MPEG-2, 1,15 Mbit/s
MPEG-2, 2,0 Mbit/s
MPEG-2, 3,5 Mbit/s
MPEG-2, 5,0 Mbit/s
MPEG-2, 8,0 Mbit/s


Slika 29b. Rezultat kodiranja ispitne sekvence ''Car phone''
25
30
35
40
45
50
I IBB IPP IBB3(PBB)
Grupa slika
P
S
N
R

[
d
B
]
MPEG-1, 0,128 Mbit/s
MPEG-1, 0,384 Mbit/s
MPEG-1, 0,768 Mbit/s
MPEG-1, 1,15 Mbit/s
MPEG-1, 2,0 Mbit/s
MPEG-1, 3,5 Mbit/s
MPEG-1, 5,0 Mbit/s
MPEG-1, 8,0 Mbit/s

25
30
35
40
45
50
I IBB IPP IBB3(PBB)
Grupa slika
P
S
N
R

[
d
B
]
MPEG-2, 0,128 Mbit/s
MPEG-2, 0,384 Mbit/s
MPEG-2, 0,768 Mbit/s
MPEG-2, 1,15 Mbit/s
MPEG-2, 2,0 Mbit/s
MPEG-2, 3,5 Mbit/s
MPEG-2, 5,0 Mbit/s
MPEG-2, 8,0 Mbit/s



Iz dobivenih rezultata moe se zakljuiti slijedee:

najvei utjecaj na kvalitetu slike (predstavljenu vrnim odnosom signal-
um) ima brzina prijenosa koju je mogue ostvariti u nekom prijenosnom
kanalu;
utjecaj strukture grupe slika je jasno vidljiv: uz dodavanje P i B-slika u
grupu slika, kvaliteta se poboljava, to je naroito vano pri malim brzinama
prijenosa;
vrsta kodiranja (MPEG-1 ili MPEG-2) ne utjee vidljivo na kvalitetu slike (u
testiranim uvjetima);
sadraj slike utjee na kvalitetu slike (uz inae jednake uvjete kodiranja).


Dobiveni rezultati jasno govore da je poeljno, kad god je to mogue, koristiti
vee grupe slika, uz primjenu i P-slika i B-slika. Nedostatak takve strukture
pokazuje se jedino u sluaju da je videosignal potrebno naknadno obraivati. U
tom sluaju poeljno je (zbog uvjeta da rez mora zapoeti I-slikom) da grupe
slika budu to krae, odnosno da se koriste samo I-slike. Takav sustav zahtijeva
velike brzine prijenosa.

You might also like