You are on page 1of 94

Kompresija pokretnih slika

Kompresija se zasniva na osnovu dve predpostavke:


Prva pretpostavka se odnosi na svojstvo ljudskog oka, da je
osetljivost oka na um u slici zavisna od frekvencije, a to znai da
oko slabije zapaa sitne detalje odnosno visoke frekvencije.
Druga pretpostavka je da u nizu pokretnih slika uvek postoji znatna
slinost izmeu trenutne i sledee ili predhodne slike. A to
praktino znai da u video signalu uvek ima redundanse. Osnovne
vrste redundansi koje se pojavljuju u video signalu su:

prostorna, statistika, subjektivna, vremenska.

Prostorna redundansa

Prostorna redundansa: vri se pronalaenje i uklanjanje redudanse unutar


svake pojedine slike (frejma).

Redundansa je suvinost, deo informacije koja nam nije korisna jer se ve jednom
pojavila i poznajemo njen sadraj.

Ako posmatramo sliku koja ima velike povrine sa istom bojom i sjajnou,
(nebo ili panjaci na primer) vidi se da su elementi susedne slike skoro isti
Umesto prenoenja podataka od 720 piksela koji opisuju jednu liniju plavog
neba, na primer, potrebno je preneti samo kod koji opisuje prvi element, a
zatim drugi koji kae koliko puta treba duplirati ovaj piksel du TV linije. Na
ovaj nain se znatno redukuje ukupna koliina podataka

Prostorna redundansa
Redundansa suvini deo informacije

Ponavljanje istih detalja slike


na vie njenih delova
nebo,more, jedro, pesak
na slici imaju velike povrine
sa pikselima koji nose istu
ili slinu informaciju, stoga je
moemo ponoviti na novoj
poziciji umesto da je iznova
aljemo sa punim sadrajem

Statistika redundansa
Statistika redundansa: kada TV signal slike sadri
veliku koliinu identinih informacija koje se uvek
ponavljaju (blanking period, sinhronizacija ..),
vrednosti video semplova su do neke mere predvidljive.
Statistika verovatnoa narednog sempla podatka koji
ima poznatu vezu sa svojim prethodnikom se stoga
moe iskoristiti za redukovanje ukupne koliine podataka
koje je potrebno preneti.
Broj bitova se takoe moe redukovati, jer nije
neophodno preneti informaciju koja je sadrana u
blanking periodima kod analogne TV slike. Jedino to je
potrebno jeste preneti kodove koji oznaavaju
sinhronizaciju linija i slika. tedi se oko 26,75%.

Vremenska redundansa
Vremenska redundansa: odnosi se na redundansu
izmeu slika i zato je nije potrebno prenositi.
Nije potrebno prenositi istu sliku dvadeset pet puta u
sekundi, ve je dovoljno prenositi razliku (diferencu)
izmeu sukcesivnih slika.
Pronalazi se i uklanja na povrinama uzastopnih slika
odnosno uporeivanjem predhodne i trenutne slike.

Dobar primer je prezenter vesti na televiziji, gde imamo minimalnu


izmenu detalja u kadru, jer je ona sve vreme u mirnom sedeem
poloaju i jedina izmena u kadru su njene usne koje se pomiu.

Vremenska redundansa
Redundansa suvini deo informacije

Vremenska redundansa

Ponavljanje slika sa istim


sadrajem (tipino za statine
kadrove u video materijalu)

Prezenter vesti na televiziji


je statian, jedina izmena u
kadru je sadrana u
pokretima usana i blagoj
facijalnoj mimikriji

Subjektivna redundansa
Subjektivna redundansa: vezana je za
svojstva ljudskog oka, pa se iz slike uklanjaju
sitni detalji.
pa se zbog karakteristike ljudskog oka mogu iz
slike ukloniti sitni detalji (visoke uestanosti), jer
ih oko manje zapaa
Ljudsko oko ne vidi sve vrednosti digitalnih
odmeraka na isti nain, pa neki odmerci mogu
da se odbace, a da ne doe do degradacija
slike.

DCT-pokretnih slika
Kod pokretnih slika svaki blok veliine 8x8 piksela iz tekue
slike se uporeuje sa svim blokovima iz definisane oblasti
pretraivanja (obuhvata celu sliku ili samo susedne blokove,
to zavisi od ureaja za kompresiju) predhodne slike.
Blok koji po vrednosti amplituda najvie odgovara
posmatranom bloku tekue slike se koristi za predikciju, a
eventualna razlika u poloaju u okviru slike izmeu ova dva
bloka se registruje promenom adrese bloka, tkz. vektorom
pokreta, on se koduje i prenosi do dekodera.
Ako se blok pronae u predhodnoj slici, onda se za njega
prenose samo vektori pokreta, koji pokazuju gde se na
predhodnoj slici nalazi dati blok, a ako se blok ne pronae u
predhodnoj slici, onda se prenosi kompletan blok.

MPEG video signal se sastoji od etiri tipa frejmova


(slike) i to:

I frejmovi , P frejmovi , B frejmovi , D frejmovi


I frejmovi (inter, intra, anker frejmovi) nose

kompletnu informaciju potrebnu za rekonstrukciju drugih


slika.
I slika se dobija primenom DCT i belei se kao cela slika
vri se kompresija samo unutar jedne slike
Kodira se kompletna slika i prenosi sama za sebe bez
referentnosti sa drugim slikama, nezavisno od svih
ostalih.
Sadre sve potrebne informacije potrebne za njihovu
rekonstrukciju u dekoderu.
Oni predstavljaju osnovnu taku jedne video sekvence.
Najmanji je stepen kompresije oko 8%

P frejmovi se dobijaju kao

razlika uporeivanja
sadraja trenutne I i predhodne predpostavljene P slike.
Na taj nain se dobija vektor pomeraja (predikcija u
jednom smeru)
Kodira se pomou kompenzacije pokreta iz prethodnog
frejma.
Zbog greaka u predikciji ne moe se koristiti veliki broj P
slika izmeu dve uzastopne I slike (obino 3-5 slika).
Predikcija se obavlja obino na osnovu svake 3 slike (M=3)

Predikcija je predvianje sadraja naredne slike na


osnovu poznatog sadraja predhodne slike - na osnovu
matematikih modela.
Kompresioni odnos izmeu dve P slike je mnogo vei
nego kod I slika i iznosi oko 25%

Redosled prikazivanja slika u


MPEG toku podataka

B frejmovi se dobijaju na osnovu

uporeivanja trenutne slike I sa prethodnom P i


buduom B slikom.
Na taj nain se dobijaju dvosmerni vektori
pomeraja (predikcija unapred i unazad)
Kompresioni odnos kod B slika je najvei i iznosi
oko 65%
D frejmovi ili DC frejmovi namenjeni su
samo za brzo pregledanje i premotavanje slike i
u njih je implementirana samo niskofrekventna
komponenta.

kompresija video signala se zasniva na razlici izmeu


pojedinih frejmova.
Ako u sekundi ima 25 frejmova (slika), logino je
pretpostaviti da e razlika izmeu pojedinih slika biti vrlo
mala.
MPEG koder zbog toga ne belei svaku sliku, ve belei
samo prvu, a za svaku sledeu belei samo razlike u
izgledu slike.
Dve susedne slike u grupi slika, pokazuju veliku
slinost.
Zato nije potrebno prenositi celu sliku kao celinu, ve se
prenosi samo razlika izmeu susednih slika.
Razlika je manja to su slike slinijeg sadraja.

Vektor pokreta nije validan za celu sliku.


Slika se deli na makroblokove od 16x16
piksela. Svaki makroblok ima svoj
sopstveni vektor pokreta.
makroblokovi u slikama B mogu biti
predvieni unapred ili reverzno,i interno
kodovani.

Zamislimo neku sliku I na kojoj je prikazan trougao na


beloj pozadini.
Na slici P koja sledi prikazan je isti taj trougao, ali u
drugoj poziciji. Predvianje znai odreivanje vektora
pokreta koji odreuje kako trougao sa slike I treba da se
pomeri da bi se dobio trougao na slici P.
Ovaj vektor pokreta je deo MPEG toka i podeljen je na
horizontalni i vertikalni deo. Ti delovi mogu biti pozitivni ili
negativni. Pozitivna vrednost ponaosob oznaava pokret
udesno ili pokret na dole. Negativna vrednost ponaosob
oznaava pokret ulevo ili pokret na gore.

Dodavanje rezultatu kompenzacije greke u predvianju

Razlika koeficijenata

Pretpostavimo da je DC vrednost prethodnog bloka 9.


Razlika trenutnog i prethodnog DC koeficijenta je 30-9=21.

Ako pretpostavimo da je trenutni DC koeficijent


68, a prethodni 65, razlika je 3. Za prikazivanje
broja 68 potrebno je 7 bita, dok je za prikaz
broja 3 potrebno samo 2 bita.
U koderu DPCM-a rezultat kodovanja razlike dva
susedna DC koeficijenta prikazuje se pomou
dva simbola.
Na ovaj nain (DPCM) smanjuje se broj bitova,
jer se razlika koeficijenata kodira sa manje
bitova nego to su imali kvantovani DC
koeficijenti.

Hofmanovo kodiranje

Ideja Hofmanovog kodiranja je u tome da brojevi imaju kodove


razliite duine tako da brojevi koji se pojavljuju esto imaju krai
kod, a oni koji se pojavljuju retko dui kod.
Hofmanovo kodiranje zahteva jednu ili vie tabela s Hofmanovim
kodom.
Ista tabela koja je upotrebljena u procesu kompresije mora biti
upotrebljena u procesu dekompresije.
-

( ).
Run-length -
:
,

Intrafrejm kompresija je kompresija unutar jedne slike.


Slika se samostalno kodira bez obzira na ostale slike iz
grupe slika. Zasniva se na dvema karakteristikama
sadraja slike, a to su: da su u slici razliito zastupljene
prostorne komponente (frekvencije) i druga
karakteristika je da komponente sa viim frekvencijama
sadre manju energiju.
Interfrejm komprimovanje je kompresija izmeu slika.
Koristi princip slinosti izmeu dve uzastopne slike. Na
taj nain, umesto da se prenosi sadraj dve uzastopne
slike, prenosi se samo razlika naredne u odnosu na
prethodnu ili sledeu sliku, ime je koliina informacija
znatno nia.

Redosled postupaka u algoritmu kompresije putem MPEG


standarda

DC koeficijenti se tretiraju odvojeno, jer oni nose najvei deo


energije slike.
Prvi element u svim blokovima je DC koeficijent.
Nakon sprovedene DCT analize (transformacijsko kodovanje) i cikcak analize svih blokova slike dobija se onoliko jednodimenzijskih
vektora koliko ima blokova u slici, za Y signal: 90x72=6480 blokova.
Izmeu DC koeficijenata dva susedna bloka postoji jaka korelacija
(slicnost). Zbog toga se oni kodiraju diferencijalom impulsnokodnom modulacijom DPCM.
Prvi DC koeficijent se kodira kompletno (on predstavlja
referentni) dok se dalje kodira samo razlika trenutnog i
prethodnog DC koeficijenta (bloka)
DPCM koder kao ulazne veliine uzima redom kvantovane DC
koeficijente iz jednodimenzijalnih vektora.

Parametar N" predstavlja meusobno rastojanje


izmeu dve uzastopne I slike i definisane grupe slika GOP, parametar M" meusobno rastojanje izmeu I i P
slike
U praksi se obino uzima za N od 12 do 15 a za M=3
Standardna struktura kodera sadri meavinu I, P i B
frejmove i to tako da se za visok stepen kompresije I
frejm pojavljuje posle svakih 12 do 15 frejmova, a P
frejmovi od 4-5.
Kod niskih stepena kompresije za I se uzima 10 ili
manje, a za P 2 frejma.
Obino grupa slika (Group of Pictures-GOP) ima jedan I
frejm i vie P i B frejmova.

Tipovi slika kod MPEG-1 standarda

Primer MPEG grupe za N=12 i M=3

Reprodukcija (dekompresija, depredikcija ) slike se vri


po istom algoritmu kao i kod kompresije.

B i P frejmovi ne mogu se reprodukovati sami jer ne


sadre celu sliku
reprodukcija kompletne slike se zasniva na podacima

smetenim u

I frejmu i B i P frejmovima

Zavisno od stepena sloenosti kodera, mogue je


generisati samo I, ili I i P, ili I, P i B slike, s vrlo razliitim
odnosima kompresije, vremenima kodovanja i kvaliteta.
Raspored I, P, i B frejma opisuju parametri N i M

Osnovni delovi slike


Blok je najmanja jedinica kodiranja i sastavljen je od
8x8 =64 elemenata slike (piksela). Sastoji se od 8x8
piksela i moe biti: Y,Cr,Cb.
To je osnovna jedinica na koju se primenjuje Diskretna
kosinusna transformacija.

Makroblok je osnovna jedinica za kodiranje slike, a


sastoji se iz 4 luminentna bloka i 2 hrominentna.Grupisu
se blokovi u makroblokove pa se vrsi uporedjivanje.

Odseak (odrezak ili iseak slike) je osnovna

jedinica za uspostavljanje sinhronizacije izmeu


postupaka kodiranja koji se sprovode na nivou bloka i
makrobloka.

Slika se deli na iseke (odseke, slajsove) ukupno 36


Svaki iseak na makroblokove sastoje se od 4 dct
bloka ukupno 45
Makroblokovi na blokove 8x8, za Y signal ima 4 bloka
576/8=72 DCT bloka (8x8) po vertikali i 720/8 = 90 DCT
bloka (8x8) po horizontali
36 iseka od po 45 makrobloka (16x16)

Vri se uporedjivanje svakog makrobloka u trenutno procesiranoj


slici s odgovarajuim makroblokom u prethodno procesiranoj slici.
Ako je razlika izmeu trenutno procesiranog bloka i prethodno
procesiranog bloka manja od zadate vrednosti praga, za taj blok
se ne prenose nikakvi podaci.

Slika je osnovna jedinica u MPEG postupku kodiranja.


Deli se na I, P, B i D slike.

Grupa slika (GOP) predstavlja najmanju jedinicu


koja moe biti nezavisno dekodirana unutar video
sekvence, a sastoji se iz jedne ili vie slika.
Uvek startuje sa I slikom.

Video sekvenca je najvii sloj u hijerarhijskoj


strukturi kodiranja, a sastoji se iz zaglavlja i odreenog
broja grupa slika.

Model kodiranja video signala MPEG postupkom

Uticaj redosleda I,P,B, slike na stepen kompresije


Grupa slika GOP sadri sve slike od I do I slike

Standardi za kompresiju video signala


Da bi se omoguilo meusobno povezivanje
opreme razliitih proizvoaa, definisani su
standardi za kompresiju i prenos video signala
najpoznatiji su : H.261,H.263 i H.264 za prenos
video konferencija i videofonije - u
telekomunikacijama

MPEG standardi (MPEG-1, MPEG-2 i MPEG-4)


su namenjeni za standardizaciju multimedijalnih
sistema i digitalne televizije u TV.

H.261 standard
Standard H.261 je namenjen standardizaciji prenosa
slike kroz irokopojasnu digitalnu telefonsku mreu
(ISDN).
za prenos se koristi p ISDN kanal kapaciteta 64 Kb/s.
gde p lei u granicama od 1-30.
Uglavnom je namenjen za video telefoniju i video
konferencije.
On opisuje organizaciju podataka za vizuelne
komunikacije sa niskim bitskim protocima.
U H.261 standardu su definisana dva formata slike QCIF
i CIF

H.261- QCIF format


QCIF (Quarter CIF) je format slike rezolucije
180144 za luminentni signal, i 9072 za
hrominentne komponente.
potreban bitski protok za nekomprimovani signal
je 9.12 Mb/s, a za komprimovan 64 -128 Kb/s.
Ostvaruje se stepen kompresije od oko 100
puta.
Koristi se za video telefone.
Namenjen je za videofonske aplikacije i video
konferencije gde se uglavnom vidi samo lice
sagovornika,
uestanost slika se obino sniava na 10 slika/s.

H.261- CIF format


CIF (Common Intermediate Format), ima rezoluciju
360288 za luminentnu komponentu (Y) i 180144 za
hrominentne komponente (Cr i Cb) video signala.
Koristi se za video konferencije.
S obzirom da je uestanost slika standardizovana na 25/30
slika/s, i da se za svaku komponentu slike koristi po 8 bita,
potreban bitski protok za prenos nekomprimovanog CIF
video signala je 36,45 Mb/s.a komprimovanog signala
n384 Kb/s, n= 6.

H.263 standard
Nastao je modifikacijama H.261 standarda
Standard H.263 je namenjen standardizaciji prenosa
slike po standardnim telefonskim linijama pri bitskom
protoku ispod 64 Kb/s
Osnovna razlika izmeu H.261 i H.263 standarda je u
bitskom protoku.
H.261 se koristi za bitski protok iznad 64 Kb/s, a H.263
za bitski protok ispod 64 Kb/s, najee 22 Kb/s.
Ova dva standarda su kompatibilna.
Kod standarda H.263 uveden je jo jedan format slike
sub-QCIF, koji je namenjen videofoniji loijeg kvaliteta
pri vrlo niskom bitskom protoku manjim od 64 Kb/s
obino je oko 10 Kb/s

H.263 Sub-QCIF
Sub-QCIF ima rezoluciju luminentne komponente
12896 piksela, a rezolucija hrominentnih komponenata
je 6448 piksela.
Uestanost slika je 5-30 slika/s.
Kvalitet slike dobijene primenom H.263 standarda zbog
savrenijih algoritama, prevazilazi kvalitet slike dobijen
H.261 standarom pri svim bitskim protocima, a ne samo
ispod 64 Kb/s.
Uporednom analizom pokazalo se da pri prenosu jedne
QCIF sekvence sa 12.5 slika/s, pri protoku od 64 Kb/s,
da je H.263 standard bolji po kvalitetu slike za oko 2 4dB od standarda H.261.

MPEG standardi
Kvalitet slike definisan standardima H.261 i H.263 nije
dovoljan za primenu u digitalnoj televiziji i multimedijalnim
sistemima, pa su za bolji kvalitet slike razvijeni MPEG
standardi.
MPEG grupa je definisala standarde za kompresiju
podataka pokretnih slika.
Njihovi rezultati se nadovezuju na rezultate JPEG grupe,
ali pored intrafrejm kompresije dodaje se jo i interfrejm
kompresija, odnosno kompresija izmeu slika koja je
mogua zbog slinosti pojedinih slika.
Koristi se ista tehnike kao i kod JPEG standarda.

MPEG-1 standard
Dizajniran je za kodovanje pokretnih slika i prateih
audio signala.
Algoritam je baziran na prostorno i vremensko
komprimovanje.
prostorno komprimovanje je usmereno na otklanjanju
monotonih delova u okviru jednog frejma.
Vremensko komprimovanje se oslanja na slinost
izmeu dva sukcesivna frejma
Izvorni format u MPEG 1 standardu je SIF koji ima
rezoluciju 360 x 288
MPEG1 je namenjen za snimanje digitalnog audio i
video signala na CD-ROM-u pri brzinama do 1,5
Mbit/s, a koristi se i za prenos signala telefonskim
linijama

MPEG 1
Kvalitet je neto bolji od VHS, ali nije dovoljan za TV
radiodifuziju, jer se radi o niskim rezolucijama slike.
Kvalitet MPEG1 audio zapisa je vrlo blizak kvalitetu CD-a.
Prednost MPEG1 u odnosu na VHS je zvuk.
Digitalizacija signala zvuka preuzeta je iz radiofonske
studijske tehnike.
Frekvencija odmeravanja zvuka je 32 KHz; 44,1kHz i
48kHz.

MPEG 2

Namenjen je profesionalnoj digitalnoj televiziji. Donet je 1999 godine.


kompatibilan sa MPEG1 standardom, koristi iste alate i dodaje neke
nove.
Ima irok raspon rezolucije.
Najea rezolucija u ovom standardu je 720486 kod NTSC sistema,
odnosno 720x576 kod PAL sistema i 1920x1080 kod HDTV
Kodiranje video signala je vrlo sloeno, za razliku od dekodiranja na
prijemnoj strani koje je relativno jednostavno i jeftino
Za studijsku produkciju koristi se 25-50Mb/s, a za prenos 2-4Mb/s,
kod HDTV studijska produkcija je oko 1,5Gb/s, a za prenos oko
20Mb/s (34Mb/s)
3bita/s po jednom Hz - za 1RF kanal 8x3=24Mb/s, to je oko
10 TV digitalna kanala

Struktura podataka u MPEG-2 standardu

Makroblok se sastoji od etiri bloka luminentne (Y) komponente video


signala i odgovarajueg broja blokova hrominentnih komponenata Cb
i Cr :

4:1:1 format, Y 4 bloka 1 blok Cr i 1 blok Cb


4:2:2 format, Y 4 bloka 2 bloka Cr i 2 bloka Cb
4:4:4 format, Y 4 bloka 4 bloka Cr i 4 bloka Cb

Grupa slika se moe sastojati od meavine sva tri tipa slika, meutim
ako se grupa sastoji od poluslika, one se uvek moraju pojaviti u paru.

Sloena sintaksa je teka za implemetaciju na jednom ipu, definisani


su profili koji su namenjeni razliitim aplikacijama: jednostavni profil,
glavni profil, prostorno skalabilni, SNR skalabilni, visoki profil

MPEG-2 standard definie razliite profile i nivoe


kompresije i u zavisnosti od toga i razliite bitske brzine.
Nivo kompresije definie uestanost ponavljanja slike i
poluslike i prostornu rezoluciju,
profil definie strukturu odmeravanja slike i sintaksu cele
binarne povorke

Nivoi

Nivo kompresije definie uestanost ponavljanja slike i poluslike i


prostornu rezoluciju.
MPEG 2 standard ima 4 nivoa koji su definisani rezolucijom slike, i to u
rasponu od najnieg do najvieg formata.
Nii nivo (low level - LL) kompresije, poseduje najniu rezoluciju
(360 x 288). Koristi se u uslovima mobilnog prijema.
Glavni nivo (main - ML ), predvien je za televiziju standardne
rezolucije 720x576.
Visoki 1440 nivo (high -1440 - H14L), kompresije namenjen je za
EDTV (TV proirene rezolucije 1440x1152).
Visoki nivo (high level - HL), kompresije optimiziran je za HDTV
sisteme.

Profili

Profil definie strukturu odmeravanja slike i sintaksu cele binarne


povorke.
Najnii sloj nosi osnovu na osnovu koje se moe dekodovati signal,
dok vii slojevi nose dodatne informacije (detalje).
Da SDTV bude kompatibilan sa HDTV prijemnikom, a da se ne
prenose dva signala.
Prenosi se najvisi kvalitet a nizi kvalitet se dobija iz njega
Poseban znaaj, slojevito kodovanje ima pri prenosu video signala
putem kompjuterske mree, jer se postupak kodovanja moe
prilagoditi zavisno od trenutnog saobraaja u mrei.
Profili postoje na velikom broju nivoa

Jednostavni profil, Glavni profil, SNR skalabilni profil, Visoki


profil
dekoder vieg nivoa uvek moe reprodukovati profil nieg
nivoa,
Jednostavni profil predvien je da pojednostavi enkoder na strani
predajnika i dekoder na strani prijemnika, uz cenu smanjenja
binarnog protoka (brzine prenosa), (ne postoje B slike). Podrava
samo I i P predikciju.
Glavni profil predstavlja optimalan kompromis izmeu
kompresionog odnosa i cene. Podrava sve tri vrste predikcije I, P,
B, to automatski vodi ka uslonjavanju enkodera i dekodera. Glavni
profil podrava sva etiri nivoa, sa maksimalnim bitskim protocima
od 4, 15, 60 i 80 Mb/s, za niski, glavni, visoki-1440 i visoki nivo,
respektivno. Veina radio-difuznih aplikacija predviena je za rad u
glavnom (main profile) profilu. Terestrijalna digitalna televizija koristi
MP&ML i standardnom rezolucijom slike (Standard definition TV).

Prostorno skalabilni profil 4:2:2 naziva se skalabilni profili, podrava


samo visoki-1440 nivo sa maksimalnim protokom od 60 Mb/s, od ega
15 Mb/s otpada na osnovni sloj. On omoguava prenos osnovnog
kvaliteta slike u zavisnosti od prostorne rezolucije Time je omogueno
istovremeno emitovanje nekog programa u vioj i osnovnoj rezoluciji,
tako da se u sluaju oteanih uslova prijema moe primati signal slabijeg
kvaliteta (nie rezolucije) umesto vieg. Namenjeni su za televiziju
proirene rezolucije (EDTV - Extended Definition TV)
SNR skalabilni profil podrava samo niski i glavni nivo sa maksimalnim
bitskim protokom od 4 Mb/s i 15 Mb/s, respektivno. Tada je bitski protok u
osnovnom sloju 3 Mb/s ili 10 Mb/s, respektivno.
Visoki profil (naziva se i professional) predvien je za kasniju upotrebu
s hijerarhijskim kodovanjem za aplikacije izuzetno visoke definicije
(HDTV - High Definition TV) u formatu odmeravanja 4:2:2 ili 4:2:0. Visoki
profil podrava glavni, visoki-1440 i visoki nivo, sa maksimalnim
protocima od 20 Mb/s, 80 Mb/s i 100 Mb/s, respektivno. Protok osnovnog
sloja je 4 Mb/s, 20 Mb/s i 25 Mb/s, respektivno.

Trodimenzionalna predstava rezolucije u MPEG-2

64kb / s

Audio signal

Sloj 1 (Layer 1) je prvenstveno razvijen za potrebe snimanja kod digitalnih


kompakt kaseta. Mogu je izbor 14 fiksnih binarnih protoka (od 32 kb/s do
448 kb/s). Za realizaciju stereofonskog prenosa, neophodan je protok 192
kb/s po kanalu, odnosno, 348 kb/s ukupno. Glavna prednost ovog sloja je
relativna jednostavnost enkodera i dekodera.
Sloj 2 (Layer 2) je glavni modus rada u terestrijalnoj digitalnoj televiziji. Za
isti kvalitet, u odnosu Sloj 1, potreban je nii protok (30%-50%) uz
poveano uslonjavanje kola za kodovanje i dekodovanje. Za stereofonski
prenos potrebno je 128kb/s po kanalu, odnosno 256 kb/s ukupno, to ini
66% u odnosu na sloj1.
Sloj 3 (Layer 3) je naprednija verzija koristi se za stereofonski prenos,
potrebno je svega 64kb/s po kanalu, to je svega 50% protoka iz Sloja2,
ali je proces kodovanja znatno dui, a ureaji skuplji.

Veliina
Maks.
Broj Nivoa rezolucije- Frame rate kompress.
slike
bitrejt
3
3.1
3.2
4
4.1
4.2
5
5.1

SD
1280x720p
1280x720p
HD (720p
or 1080i)
HD (720p
or 1080i)
1920x1080
p
2kx1k
2kx1k or
4kx2k

Maks. broj
na
referentni
h frejmova

......
30 / 25
30
60

10 Mbps
14 Mbps
20 Mbps

5
5
4

60p / 30i

20 Mbps

60p / 30i

50 Mbps

60p

50 Mbps

72

135 Mbps

120/30

240 Mbps

MPEG4
U svim prethodnim standardima za kompresiju video sadraja slika je
posmatrana kao jedinstvena celina.
U ovom standardu se sreemo sa pojmom video objekta,
pri tome se razlikuju dve vrste vizuelnih objekata - prirodni i sintetiki vizuelni objekti.

Ovaj standard se primenjuje u digitalnoj TV, video telefoniji u


mobilnim komunikacijama i raunarskim mreama, u multimedijalnim
prezentacijama, u KDS-u za video na zahtev i video konferencijama.
Ovaj standard se koristi za kompresiju video i audio signala vrlo niske
rezolucije, i male bitske brzine.
definie standarde za prenos slike i tona kroz kanale malog
kapaciteta, odnosno kroz linije malog propusnog opsega
Algoritmi koji su primenjeni u MPEG-4 standardu predstavljaju scenu
kao skup audio vizuelnih objekata, izmeu kojih postoje neke
hijerarhijske relacije u prostoru i vremenu.
Razlikuju su dve vrste vizuelnih objekata: prirodni i sintetiki vizuelni
objekti.
Ovakav pristup donosi poveanje stepena kompresije, poveanu
interaktivnost i omoguava integraciju objekata razliite prirode, kao
to su: prirodna slika ili video, grafika, tekst, zvuk, itd.

Posmatrajmo sliku koja sadri enu koja stoji, radni sto, tablu,
glas ene i muziku podlogu.
Svaki individualni objekat se kodira posebno u slojevima i sa
razliitim rezolucijama i stepenima kompresije
Objekti se dele na 8x8 ili 16x16 blokova
Objekti se kodiraju i kako su ukomponovani u kompletnu scenu
(koristi se poseban jezik za opis scene BiFS- Binarni format za
scene, da se neki objekat zavrti ili zameni jedan drugim)
U prvom frejmu se prenosi neutralno lice, a u sledeem podaci o
poloaju lica, gde se animacijom dobija neogranieni broj
modela
Prenos se vri tako to se prenose razliite povorke signala, gde
svaka od ovih povorki sadri jedan ili vie objekata.
Algoritmi predstavljaju scenu kao skup audio/vizuelnih objekata
Na najniem nivou se nalaze mirne slike i audio objekti

Pretpostavlja se da se objekat u prvom planu (teniski igra, slika


gore desno) moe segmentirati (izdvojiti) od pozadine i da se sprajt
panoramske slike (mirna slika koja opisuje sadraj pozadine tokom
svih frejmova u sekvenci) moe izdvojiti iz sekvence pre kodovanja.
Velika panoramska slika se prenosi do prijemnika samo jedan put,
kao prvi frejm koji opisuje pozadinu, i ona se uva u sprajt baferu. U
svakom narednom frejmu se prenose samo parametri kamere u
odnosu na pozadinu, to omoguuje prijemniku da rekonstruie
pozadinsku sliku za svaki frejm sekvence na osnovu sprajta.
Pokretan objekat u prvom planu se prenosi posebno kao video
objekat proizvoljnog sadraja. Prijemnik komponuje slike pozadine i
objekta da bi rekonstruisao svaki frejm (slika na dnu). Za aplikacije
koje zahtevaju malo kanjenje, sprajt moe da se prenosi kao vei
broj manjih delova preko uzastopnih frejmova ili moe progresivno
da se generie u dekoderu.

MPEG4

teniski igra se odvaja od pozadine


Pozadina kao prvi frejm se prenosi samo jedanput
U svakom narednom frejmu se prenose samo parametri kamere u odnosu na
pozadinu to omoguuje prijemniku da rekonstruie pozadinsku sliku za
svaki frejm
Razliiti objekti mogu da budu kompresovani razliitim bitskim protocima,
Svi objekti se koduju uz pomo optimalne eme kodovanja-video kao video,
tekst kao tekst, grafika kao grafika, umesto da se svi pikseli tretiraju kao
pokretne slike
Na osnovu podatka o opisu scene prijemnik vri rekonstrukciju slike
Prijemnik komponuje slike pozadine i objekta sa kamere da bi rekonstruisao
svaki frejm

Video objekti i slojevi video objekata

Slika predstavlja
scenu formiranu od
vie audio vizuelnih
objekata

Postoje prirodni i
sintetiki video
objekti

Video objekt se moe kodovati u jednom ili vie slojeva, to nam


omoguava promenljivu rezoluciju (skalabilnost) kodovanja.

Video objekt je diskretizovan u vremenu tako da svaki vremenski odbirak


predstavlja jednu ravan video objekta (Video Object Plane - VOP).

Vremenski odbirci video objekta se grupiu u grupe video objekata (Group


of Video Object planes - GOV).

Globalna kompenzacija pokreta


Globalna kompenzacija pokreta
je zasnovana na prenosu statike
sprajt slike
Sprajt panoramska slika je mirna
slika koja predstavlja statiku
pozadinu na svim slikama u
sekvenci

Velika sprajt panoramska slika se najee prenosi do prijemnika samo


jednom, kao prva slika u sekvenci. Ova slika se uva u sprajt baferu.
U svakoj narednoj slici, do prijemnika se prenose samo parametri pokreta
kamere koji se odnose na transformaciju sprajt slike.

Pokretni objekat se prenosi


zasebno, kao video objekat
proizvoljnog oblika.
Pri rekonstrukciji slike, prijemnik
dekoder sastavlja odgovarajue
slike objekta i pozadine.

MPEG 4 specifikacije
Generiki standard za kodovanje audiovizuelnih informacija i
prezentovan je 1998. godine pod oznakom ISO/IEC 14496
Algoritmi predstavljaju scenu kao skup audiovizuelnih objekata, izmeu
kojih postoje neke hijerarhijske relacije u prostoru i vremenu
Ovakav pristup donosi poveanje stepena kompresije, poveanu
interaktivnost i omoguava integraciju objekata razliite prirode, kao to
su: prirodna slika ili video, grafika, tekst, zvuk, itd.
Podrana su oba naina skeniranja slike, progresivni i sa proredom.
Koristi se format bloka sa odmeravanjem 4:2:0. Svaka komponenta se
predstavlja sa 4 do 12 bita po pikselu slike.
Podrane su razliite vremenske rezolucije, kao i kontinualno
promenljiv broj slika u sekundi.
Optimiziran za primenu u tri opsega bitskih protoka: ispod 64 Kb/s, od
64 Kb/s do 384 Kb/s i od 384 Kb/s do 4 Mb/s

Kodovanje sintetikih vizuelnih objekata

Sintetiki objekti predstavljaju podskup ire klase vizuelnih objekata


iz raunarske grafike

Definisane su 84 karakteristine
take, koje predstavljaju parametre
definicije lica - Facial Definition
Parameters Korienjem parametara
iz ovog skupa menjaju se oblik i
tekstura lica

Animacija lica se vri promenom vrednosti 68


parametara animacije lica. Ovim tehnikama postie
se realistika animacija lica sa bitskim protokom u
opsegu od 300 b/s do 2 Kb/s. U sluajevima kada se
animacija lica vri na osnovu izgovorenog teksta,
potreban bitski protok se moe smanjiti na manje od
200 b/s.

Originalna slika

MPEG 2

MPEG 4

Divx

Odlian kvalitet slike i zvuka prema bitskoj brzini kod Divx - a


Kod MPEG 2 kompresije na svakih 12 frejmova dolazi po jedan I
frejm
Kod Divx, I frejm dolazi na svaki rez nove scene
Vektori pokreta kod MPEG1 su precizni 1/2 piksela, Kod H261
1 piksel, kod MPEG 4 piksela
MPEG4 verzija 10 ili H264AV sa dvaputa manjim protokom dobija
se isti kvalitet kao kod MPEG2
H264AVC koristi se za DVB, IP i DVB-H
Progrma je pisan u C++ jeziku i u poziciji svakog frejma definie
se gde je predhodni i naredni frejm

DTV Standardi prema ATSC i DVB Europe


Rezolucija

Odnos strana

slika u sekundi (I = sprepletano, p =


progresivno)
USA

Europe

1920 x 1080

16:9

24p, 30i/p

24p, 25i/p, 30i/p

1280 x 720

16:9

24p, 30p, 60p

24p, 25p, 30p, 50p,


60p

720 x 576

4:3 / 16:9

24p, 25i/p, 30p, 50p

704 x 480

4:3 / 16:9

24p, 30i/p, 60p

640 x 480

4:3

24p, 30i/p, 60p

HDTV

SDTV

Tabela 1. DTV Standardi prema ATSC i DVB Europe

MPEG 21 Osnovni pojmovi

Prezentovan javnosti 2004. godine u angaju, sa oznakom ISO/IEC TR


21000-1 poznat i kao Digital item declaration

Definie tehnologije potrebne da podri korisnike da razmenjuju,


pristupaju, koriste, menjaju i na druge naine manipuliu digitalnim
predmetima na efikasan i transparentan nain.

Definie open framework.

Definie osnovne jedinice za distribuciju i prenos koju predstavlja


digitalni predmet (digital item)

Definie naine kako korisnici mogu da rade sa digitalnim predmetima

Standard ne pravi razliku izmeu korisnika i kreatora sadraja. Korisnik


je bilo koji entitet iz MPEG 21 okruenja koji vri interakciju u tom
okruenju ili koristi digitalni predmet

Budunost kompresije

Makroblokovi e smanjiti dimenzije na 4x4


piksela
Umesto DCT koristie se wavelet transformacije
Italijanska grupacija Eco Controllo, je predstavila
Cappelli, novi format HDTV video kompresije
koji igranu sekvencu rezolucije 1920x1080
piksela, 60 Hz smeta na 1,44 MB i u iji razvoj
se do sada potroilo 5 000 000 eura

Povezivanje digitalnih ureaja

Paralelni prenos (interfjs) - standardizovan prenos podataka po


simetrinim vodovima (od 8 do10 paralelna simetrina voda).
Zahteva vieilni kabl. Koristi se za rastojanja do 50m, bez
ekvalizacije kabla, a do 200m sa ekvalizacijom.
Serijski prenos (interfejs) koristi se za prenos na vea rastojanja
preko jednog prenosnog voda ili kanala (koaksijalni kabl do 500m
ili optika do 10km).
Bitska brzina je 270Mb/s za 10bita. Vri se multipleksiranje Y,Cb,Cr
signala tako da se dobije samo jedan signal i on se kodira NRZ
kodom.
Serijski interfejs je standardizovan kao SMPTE 259M i poznat je
kao SDI (Serial Digital Interface).
SDI omoguuje prenos nekomprimovanih A/Vsignala izmeu
ureaja
SDTI omoguuje prenos nekomprimovanih i komprimovanih A/V
signala (paketa) izmeu ureaja u bilo kom formatu (DV, DVCAM,
DVCPRO...)

Multipleksiranje signala

Multipleksovanje signala predstavlja postupak


"pakovanja" binarnih nizova u paket (binarni niz)
odgovarajue duine.
Posmatrajmo multipleksiranje i dobijanje CVB signala iz
komponentnih sig. bez kompresije.
stepen za kompresiju bi se nalazio izmeu A/D
konvertora i multipleksera
Svaki paket poinje sa fiksnim zaglavljem duine 6
bajtova: sa prva tri koduju se komande za startovanje
paketa, etvrti bajt znai dali se prenosi video ili audio
informacija, peti i esti znae bitsku duinu paketa.

Video-podaci

MPEG-2
videokoder

Formiranje
paketa

Osnovna povorka
video signala
Programska
povorka
Multipleks
programske
povorke

Audio-podaci

MPEG-2
audiokoder

Formiranje
paketa

Osnovna povorka
audio signala

Povorka
za prenos
Multipleks
povorke
za prenos

Multipleksiranje signala

U praksi, postupak multipleksovanja je znatno


sloeniji, jer su digitalizovani elementarni nizovi
audio, video i ostalih podataka razliite duine, a njih
je potrebno sve zajedno objediniti (multipleksovati) u
sloeni signal u formi transportnog niza, koji se dalje
pakuju u transportne pakete podataka.
Na dva naina se reavaju problemi multipleksovanja:
korienje paketa promenljive duine ili
upotrebom paketa fiksne duine.
Na interfejsima ureaja postoji transportni i
programski niz

Programski niz (Program Stream PS, programska

povorka), formira se od paketizovanih audio i video strimova sa


dodatkom podataka za teletekst, sinhronizaciju .....
Programska povorka moe da sadri vie audio i video osnovnih
povorki, gde svaka ima svoju vremensku bazu.
PS moe preneti 32 audio strima, 16 video strimova i 16
strimova podataka.
Osetljivi su na greke

Transportni niz Transport Stream TS, povorka za prenos),

formira se za prenos signala na velike daljine.


Transportni niz sadri jedan ili vie paketa osnovnih povorki.
Osnovni paketi su grupisani po servisima: video, audio i druge
podatke (teletekst)

formira se spajanjem jednog ili vie programskih PS


strimova sa nezavisnim vremenskim bazama ili
kombinacijom PES paketa
Zaglavlje se sastoji od: sinhronizacionog bita, indikatora
greki, podatke o prioritetu prenosa, identifikaciji paketa I
kontrole za adaptaciono polje.

Videopodaci

Sekvenca
zaglavlja

Proirenje
sekvence

Korisnicki
i dodatni
podaci

Zaglavlje
grupe
slika

Korisnicki
i dodatni
podaci

Zaglavlje
slike

Dodatno
kodovanje
slike

Korisnicki
i dodatni
podaci

Podaci o
slici

Sekvenca
zavrnog
koda

A)

Audiopodaci

Zaglavlje

Provera
greke

Audio
podaci

Dodatak za
vie kanala

Pomocni
podaci

B)

sadrzi:
podatak o horizontalnoj veliini slike,
podatak o vertikalnoj veliini slike,
informaciju o odnosu irina/visina slike,
kod uestanosti ponavljanja slike,
vrednost binarnog protoka, marker, veliinu bafera.

Generisanje programskog niza

PES
Video

Audio

Video PES

Kodovanje i
Kompresija

Pakovanje

Kodovanje i
Kompresija

Pakovanje

Formatiranje

Pakovanje

Audio PES

Usluni i
kontrolni
podatak

Video

Programski
strim

Multiplekser

Podatak PES

Kodovanje i
Kompresija

TS
Multipiekser

Video PES
Pakovanje
Multiplekser

Audio

#1

Kodovanje i
Kompresija

Transportni
strim
#1

#2

Audio PES
Pakovanje

#3

TS
Multipiekser

Transportni
strim
#2

Generisanje transportnog niza

H TIME analognog i digitalnog video signala

Slika pokazuje greku H faze


analognog i digitalnog video
signala
Sekvenca za tajmovanje
digit.v. signala u svakoj liniji
odreena je sa SAV i EAV
SAV (Start of Aktive video)
poetak aktivnog video signala
EAV (End of Aktive video) kraj
aktivnog video signala
Digitalna aktivna linija sadri
720 odmeraka luminentnog
signala i po 360 odmeraka
hrominentnog signala za 4:2:2
standard

You might also like