You are on page 1of 7

FAKULTET TEHNIKIH NAUKA

GRAFIKO INENJERSTVO I DIZAJN

Digitalna obrada slike


izvetaj sa 4.vebe

Student:
AnaHalas
GI 51/2011

Zadatak nam je kako se izdvajanje obojenih elemenata vri u RGB prostoru boja, to je
mnogo komplikovano jer sad radimo sa tri kanala umesto sa jednim. Sada RGB prostor smetamo
u kocku, ije jedno teme e biti koordinatni poetak odnosno 0 ili crna boja. Njemu suprotno teme,
koje se nalazi na kraju glavne dijagonale kocke ima vrednost 255 odnosno bela boja. To zna i da
se na glavnoj dijagonali ove kocke nalazi 256 nijansi sive. Levo, desno i gore od 0 nalaze se R, G i
B komponente, a izmeu svih ovih vrednosti nalaze se razne nijanse ovih osnovnih boja. Poto siva
nije boja mi emo, onda sve to nije sivo poseduje neku boju. Mi emo ispitati koje su to vrednosti,
napraviti odgovarajuu masku i izdvojiti obojene elemente. Prvo emo napraviti monohromatsku
sliku usrednjavanjem i to pomou Utilities / Convert / Color to Gray / Average.

Elementi
Monohromatski elementi
Na ovaj nain od trokanalne slike dobili smo monohromatsku jednokanalnu sliku u kojoj
svaki piksel ima vrednost srednje vrednosti piksela trokanalne slike na istom tom mestu. Da bi
ovakvu dobijenu sliku mogli da koristimo nad originalnom slikom moramo je pretvoriti u trokanalnu i
to pomou opcije Utilities / Create / Assemble Bands. Onda emo sliku oduzeti od originalne
pomou opcije Utilities / Arit/Logic / Substract.

Trokanalna slika elementata

Elementi nakon oduzimanja

Primeujemo negativine vrednosti do kojih je dolo zbog oduzimanja uproseene vrednosti


piksela slike u boji od originalne vrednosti tog piksela na svakom kanalu. Ako je u nekoj boji
dominantan samo jedan kanal, druga dva kanala imaju veoma male vrednosti te se usled
oduzimanja iste uproseene vrednosti (koja je zbog velike vrednosti najzastupljenjijeg kanala vea
od stvarne vrednosti piksela u tom kanalu) na nekim kanalima moe pojaviti negativan broj - tako
dobijamo negativne vrednosti piksela. Poto nam ne odgovara da imamo negativne vrednosti
piksela izraunaemo njihovu apsolutnu vrednost i to pomou opcije Enhancement / Histograms /
Linear Modifi cations.
Pikseli u polaznoj slici imali su vrednosti izmeu -144 i 120. Deo opsega od 0 do 120 bi se
usled izraunavanja apsolutne vrednosti preslikao u iste te vrednosti pa je s toga

nepotrebno raditi tu transformaciju. Meutim, vrednosti od -144 do 0 bi se preslikale u


njihove pozitivne vrednosti od 144 od 0. Zato emo transformaciju raditi samo na ovom
delu opsega sa koefi cijentom pravca -1 i selektovaemo pociju Keep out of range data.
Parametri za ovaj korak su nam sledei:
Start = -144 End = 0 Initial value = 144 Slope = -1

Elementi nakon linearne modifikacije


Da bi ovako dobijenu sliku mogli da koristimo kao masku moramo je binarizovati.
Prvo emo je opet pretvoriti u monohromatsku pa na njoj raditi binarizaciju poreenjem
sa pragom T=20. I to pomou opcije Utilities / Convert / Binari Threshold.

Modifikovani monohromatski elementi


Binarna slika elemenata
Dobili smo sliku koja ima bela polja na onim mestima koji imaju vrednosti veu od
20. Tako smo definisali udaljenost od glavne dijagonale i sve boje koje imaju vrednost
piksela veu od 20 e se smatrati bojama, a objekti obojeni njima e biti izdvojeni. Kada
masku pretvorimo u trokanalunu i pomnoimo je sa originalnom slikom dobiemo
izdvojene samo one elemente koji imaju neku boju.

Elementi nakon mnoenja sa maskom


Pomou opcije Analzsis / Features moemo da dobijemo odreene informacije o
objektima u slici. Kada aktiviramo ovu opciju odaberemo one informacije koje elimo da
dobijemo o nekom objektu. Zatim kiliknemo na taj objekat i komandom Apply
omoguimo zapisivanje svih tih informacija o selektovanom objektu u prethodno
generisani fajl (Feature File Name). Ako to uradimo za svaki objekat po na osob kao
rezultat dobiemo jedan txt fajl koji sadi sve traene informacije.
CVIPtools feature fi le for image with 3 band
1. Image name
2. Objects row coordinate
3. Objects column coordinate
4. Area
5. Centroid (row, column)
6. Orientation (Axis of least second moment)
7. Perimeter
*** END OF HEADER; CLASS (optional) SHOWN AT THE END OF DATA ***
elementi.bmp 102 55 5115 109 56 24 373
elementi.bmp 254 65 3573 245 87 -61 465
elementi.bmp 375 75 4779 399 134 51 404
elementi.bmp 131 244 273230 240 324 8 2236
elementi.bmp 131 244 273230 240 324 8 2236
elementi.bmp 131 244 273230 240 324 8 2236
elementi.bmp 326 269 3348 336 275 1 504
elementi.bmp 58 407 4685 62 391 -86 437
elementi.bmp 190 400 3549 193 408 34 470
elementi.bmp 359 410 4864 345 398 23 358
elementi.bmp 197 558 4039 195 564 41 455
elementi.bmp 352 528 273230 240 324 8 2236
Dobijene informacije poreane su po sledeem redosledu: ime slike; kolona na
koju smo kliknuli; red na koji smo kliknuli; povrina; teite; orjentacija; obim. Moemo
zakljuiti o kom objektu je re bez toga da znamo redosled kliktanja miem. Prvi element
je uti element u gornjem levom uglu slike. To vidimo na osnovu informacije o koloni i

redu slike. Na osnovu informacija o obimu i povrini elemenata moemo zakljuiti da li


se radi o objektima koji imaju kuglu na svojim krajevima ili o onima koji je nemaju.
Kompresija podrazumeva odbacivanje onih podataka o slici koji su nepotrebni za
njen opis. Ona se deli na kompresiju sa (lossy) i bez (lossless) gubitaka. Mi radimo
kompresiju sa gubicima. Za definisanje jednog bajta koristi se 8 bitova to nam
omoguava rad sa 256 nijansi jedne boje. Ovi bitovi nemaju istu teinu i istu vanost u
obradi slike, tako da je najtei osmi bit, a najmanji po teini je prvi. To moemo dokazati
ukoliko originalnu sliku podelimo na njene bitske ravni. Svaka bitska ravan izdvaja samo
one bite koji imaju istu teinu. Tako prva radavn ima ili vrednosti 1, a osma ravan
vrednost 128 to automatski objanjava da osma ravan poseduje vie podataka o slici.
Opcijom Compression / Lossy / Bit-Plane Lenght Coding moemo izdvojiti svaku
bitsku ravan ove slike posebno. Da bismo videli ta koja ravan sadri moramo je
binarizovati sa pragom koji se dobija kao teina bita u reprezentaciji pririodnog broja
minus jedan: T=2 broj ravni -1
Na slikama su predstavljene bitske ravni od prve do osme i Binary Treshold.

Posmatranjem moemo zaklju iti da osma ravan ima mnogo vie pondataka o
slici nego prva, zbog njene teine 128. Zbog toga je ona najznaajnija i uvek treba da se
uva. Prva, druga i trea ravan imaju najmanje znaajnih podataka o slici pa ukoliko njih
odstranimo neemo imati velike gubitke u kvalitetu prikaza slike, ali emo postii
kompresiju. Vidimo da se prve konture naziru tek na etvrtoj ravni te ako nju odbacimo

izgubiemo neke informacije o ivicama i bitnim detaljima u slici. Na sledeim slikama je

pokazano ta se deava ukoliko odbacimo neku ravan koja nam je od znaaja.


Nakon odbacivanja prve 4 bitske ravni
Nakon odbacivanja prve 3 bitske ravni
Ako odbacimo prve etiri ravni vidimo da se pojavljuju lane konture na slici.
Znai da etvrta ravan poseduje neke informacije o finim prelazima koje smo odbacili.
Ako odbacimo samo prve tri ravni vidimo da je slika skoro ista kao i originalna. Neke
razlike se mogu primetiti, ali one su neznatne. Znai da se odbacivanjem nee mnogo
gubiti na kvalitetu slike. Zakljuujemo da se odbacivanjem bitskih ravni najmanje teine
postie kompresija jer je krai kod kojim se zapisuje slika.
Sledee vrste kompresije su DCT i FFT transformacije. Slika se prvo deli na
blokove u koje se upisuju vrednosti koeficijenata dobijeni odgovaraju im
transformacijama, pa dobijene vrednosti se kvantizuju. Veliki broj tih koeficijenata su
male vrednosti pa se mogu eliminisati bez velikih gubitaka. Sledei korak u kompresiji je
formiranje maske u odgovarajuem obliku koja se popunjava jedinicama i nulama. Zatim
se vri mnoenje blokova sa vrednostima maske, pritom se prenose samo one vrednosti
koeficijenata koje se mnoe sa brojem jedan u masci.
Faktor kompresije predstavlja kolinik ukupnog broja koeficijenata i broja
koeficijenata koje prenosimo u novu sliku. A uteda koji emo na ovaj nain postii je
kolinik broja koeficijenata koje odbacujemo i ukupnog broja koeficijenata. Odabirom
komande Compression / Lossy / Zonal moemo izvriti kompresiju sa faktorom 32 i
veliinom bloka 8x8.
Faktor kompresije je bio jako velik rezultat i nije najbolji, ali se vidi da je DCT
(Diskretna kosinusna transformacija) mnogo bolja od FFT. Na obe slike se javlja blok
efekat upravo zbog tog deljenja slike na blokove. Problem u FFT transformaciji nastaje
na mestima prelaza sa jednog bloka na drugi. Ova funkcija pravi veu graku pri
eliminaciji koeficijenata na ovim mestima. Kod DCT blok efekat postoji, ali je on manji
zato to je perioda DCT transformacije ve a i ne pravi toliku graku na prelazima
izmeu dva bloka. Znai da je DCT bolja od FFT i prikazaemo slike kompresovane sa
faktorima
kompresije 16, 8 i 4.
FFT kompresija
DCT kompresija

DCT Faktor 4

DCT Faktor 8

DCT Faktor 16

Vidimo da je blok efekat manji ukoliko je faktor kompresije manji zato to na taj
nain odbacujemo manji broj koeficijenata i zadravamo vie podataka o ivicama u slici.
Ako uradimo razliku kompresovanih slika i originalne dobiemo sve one podatke o slici
koje smo kompresijom izgubili. Ona nam tako e pokazuje greku u slici usled
kompresije. Slike e biti prikazane istim redosledom faktora.

Vidimo da smo najvie podataka izgubili pri kompresiji sa faktorom 16, a


najmanje pri kompresiji sa faktorom 4 zato to smo smanjenjem faktora kompresije
sauvali vei broj koefi cijenata. Postignuta kompresija se smanjuje smanjenjem faktora
kompresije, ali je kvalitet slike bolji, a greka pri kompresiji sve manja. Vidi se da su
najvei gubici nastali na mestima gde su prelazi sa jednog bloka na drugi blok odnosno
ivice u slici. Zakljuujemo da ouvanjem veeg broja koeficijenata u slici nakon
odgovarajue transformacije uvamo i detalje originalne slike, ali postiemo manju
kompresiju. Od namene krajnje slike e zavisiti u kojoj meri je moemo kompresovati.