Professional Documents
Culture Documents
pitanje
1. Subjektivne karakteristike zvuka
Svojim fizičkim veličinama zvuk djeluje na čovjeka preko organa sluha. Nastale
fizičke promjene stvaraju određene subjektivne osjećaje, koje u izvjesnoj mjeri zavise od
odgovarajućih fizičkih veličina zvuka i njihovih promjena. Karakteristike zvuka u domenu
subjektivnog osjećaja (tzv. subjektivne psihološke ili biofizičke karakteristike zvuka) koje
odgovaraju objektivnim veličinama su: visina tona, boja zvuka i glasnoća (subjektivna mjera
jačine zvuka).
Visina tona je osjećaj na osnovu koga se može reći da je jedan ton visok ili nizak
(dubok) vezana je prvenstveno za frekvenciju. Kod složenog tona bitna je frekvencija
osnovnog tona. Postoji diferencijalni prag visine tona koji se može zapaziti (df / f). On je
konstantan samo na srednjim frekvencijama. Na osjećaj visine tona utiče i intenzitet zvuka.
Zvuk vrlo malog intenziteta na pragu čujnosti ne daje osjećaj visine tona. Po usvojenoj
akustičkoj terminologiji, koncertni ton (ton A iznad srednjeg C) ima frekvenciju od 440 Hz.
Najveća muzička mjera opsega tonova je oktava. Ton koji je za oktavu viši od nekog datog
tona ima zapravo dva puta veću frekvenciju, dok ton koji je za oktavu niži ima dva puta
manju frekvenciju. Oktava je podijeljena u 12 polustepeni koji odgovaraju notama (C, Cis, D,
Dis, E, F, Fis, G, Gis, A, Ais, H).
Boja zvuka je kvalitet koji dopušta da se prepoznaju dva zvuka iste visine i istog
osjećaja jačine kada su emitovani iz dva različita zvučna izvora. Ona je određena brojem
viših harmonika, odnosom njihovih intenziteta i njihovom faznom razlikom u odnosu na
osnovni ton.
Glasnoća zvuka je fiziološka veličina koja opisuje osjećaj jačine zvuka u našem uhu.
Odnos između objektivne jačine zvuka (L) i subjektivnog osjećaja, glasnoće (Λ), određuje se
eksperimentalno. Nivo glasoće se izražava bezdimenzionalnom jedinicom fon koja je
analogna decibelu. Naime, nivo glasnoće od n fona ima onaj zvuk čija je glasnoća jednaka
glasnoći koju izaziva zvuk frekvencije od 1000 Hz i nivoa zvučnog pritiska n dB iznad praga
čujnosti. Fonska skala oslanja se na subjektivni osjećaj glasnoće, dok je decibelska skala
usmjerena ka mjerenju jačine zvuka. Krive koje uspostavljaju vezu između objektivne jačine
i subjektivnog osjećaja glasnoće dobijene su na osnovu ispitivanja grupe slušalaca koji su,
slušajući sa oba uha, upoređivali glasnoće tonova različite visine sa glasnoćom referentnog
tona frekvencije 1 kHz. Pri tome se jačina zvuka mijenja dok se glasnoća oba tona ne
izjednači. Nivoi zvučnih pritisaka izmjereni u tim trenucima u decibelima na raznim
frekvencijama određuju jednu krivu sa konstantnim subjektivnim osjećajem glasnoće.
7. Reverberacije
Zvučni talasi koji se prostiru od izvora do prijemnika mogu da prođu različitim putevima.
Ako talas na svom putu ne nailazi na prepreke govorima o direktnom zvuku. Eho nastupa kad
do slušaoca dolazi zvuk koji se odbija (prelama) od neke prepreke. Ako prelamanje proizvodi
signale koji kasne manje od 100 ms govorimo o refleksiji, a ako je kašnjenje signala koji
nastaju usljed prelamanja veće, to označavamo kao reverberacije.
Zvuk se odbija od ravne čvrste plohe. Refleksija zvuka je bolja, ako je površina plohe
glatkija i veće gustoće. Ako je ploha konveksna, dolazi do disperzije (raspršivanja) zvuka, a
ako je površina konkavna, dolazi do usnopljavanja zvuka.
Difrakcija je pojava savijanja zvuka oko prepreke. Difrakcija je obrnuto
proporcionalna visini tona (frekvenciji zvučnog talasa), te je više izražena na nižim
frekvencijama.
Refrakcija je pojava loma zvučnog talasa, odnosno promjene smjera zvuka , a događa
se uslijed promjene medija kojim se zvuk kreće (temperatura, pritisak vazduha i sl.). Tipični
primjer je skretanje zvuka pod uticajem vjetra.
Apsorpcija je pojava upijanja zvuka. Prilikom udara zvučnog talasa u neku površinu
jedan dio zvučne energije se predaje materiji, dok se drugi reflektuje.
Doplerov efekt je pojava koja se očituje u promjeni visine tona zbog kretanja izvora
zvuka. Ako nam se izvor zvuka približava zvučni talasi se zgušnjavaju, tj. povećava im se
frekvencija, a ako se izvor zvuka udaljava, talasi se prorjeđuju, a zvuk ima sve manju
frekvenciju.
Interferencija nastaje uzajamnim djelovanje dva talasa koji se susreću, pri čemu im
se amplitude sabiraju ili oduzimaju, zavisno od faze.
Stojeći talas je pojava kad zbog intrferencije direktnog i reflektovanog talasa nastaje
mjestimično poništavanje (nule) i maksimalno pojačavanje (maksimumi) zvuka. Pojava se
očituje kao potpuna odsutnost zvuka u nekim dijelovima prostora. Izbjegava se tako da se
zidovi prostorije ne postavljaju paralelno.
Jasno je da na kvalitet zvuka utiče ambijent u kom se nalaze izvor zvuka i slušalac.
Ambijent se može posmatrati kao sistem kroz koji zvuk prolazi do slušaoca pa se, prema
tome, može opisati impulsnim odzivom. Na sljedećim slikama su prikazani impulsni odzivi
koncertne hale i obične sobe. Impulsni odziv koncertne hale je dužeg trajanja što znači da će i
zvuk koji nastane da se duže čuje u koncertnoj hali nego u sobi.
2p p
20log − 20log = 20log2 ≈ 6[dB]
p0 p0
Prema tome, 8 bitni audio može da pokrije dinamički opseg audio kasete (48 dB), dok
je 16 bita dovoljno za dinamički opseg audio CDa (96dB), što je približno jednako
dinamičkom opsegu ljudskog uha.
2. pitanje
1. Histogram slike i operacije nad histogramom
Histogram h[a] je funkcija svjetline koja daje broj piksela za svaku vrijednost svjetline
u posmatranom regionu. Histogram se može normalizovati ukupnim brojem piksela, tako da
je ukupna oblast ispod histograma jednaka jedinici. Tada je procijenjena funkcija gustine:
1
p[a] = h[a], Λ = � h[a]
Λ
a
Važna klasa operacija se zasniva na manipulaciji nad histogramom slike ili regiona.
Na Slici 34 su su dati primjeri histograma slika.
Na slikama 1.1 i 1.2 vidi se ideja detekcije ivice korišćenjem gradijenta. Ivica na slici
znači naglu promenu intenziteta tačaka, a upravo je to područje u kome prvi izvod ima
maksimum. Slike u digitalnoj obradi nisu kontinuirane nego diskretne pa se ne može
izračunati prava vrednost izvoda. Da bi se to moglo slika bi morala imati analitički opis.
Uprkos diskretnosti slike, postoji mnogo metoda za procenu iznosa prvog izvoda. Nakon
procene izvoda, kod gradijentnih metoda koristi se prag koji određuje koliki treba da bude
iznos izvoda da bi tačku na tom mestu smatrali ivičnom.
Drugi izvod je prikazan na slici 1.3. Na njoj se može primetiti nedostatak metoda koje
rade s drugim izvodom, a to je da se na područjima slike koja ne predstavljaju ivice ali se
javljaju sitne promene u intenzitetu tačaka javljaju nule u drugom izvodu i detektuju lažne
ivice. Laplaceove metode su stoga osetljive na šum.
Gradijentne metode obično se zasnivaju na definisanju operatora za procenu
gradijenta. Svaki operator detektuje ivice samo u jednom smeru i zato se koriste u parovima.
Dva operatora u jednom paru operatora detektuju ivice u međusobno ortogonalnim
smerovima. Računanje ivica u slici obavlja se operacijom konvolucije slike i maski
gradijentnih operatora. Ako su maske operatora h1 i h2 tada su ivice g1 i g2 definisane sa:
5. Reprezentacija boje
Mnoge aplikacije koje koriste obradu slike generišu sliku koju će posmatrati čovjek
(za razliku od, recimo, automatske inspekcije u industriji). Zbog toga je veoma važno
poznavati karakteristike i ograničenja ljudskog vida – “prijemnika” 2D signala. Važno je
znati da:
- ljudski vizuelni sistem nije dovoljno ispitan,
- ne postoji objektivna mjera kvaliteta slike koja odgovara ljudskoj prosudbi o
kvalitetu slike,
- “tipični” posmatrač ne postoji.
Uprkos svemu, istraživanja u oblasti perceptualne psihologije obezbjeđuju neka važna
sagledavanja vizuelnog sistema. Uopštena građa ljudskog oka je prikazana na Slici 5. Retina
ljudskog oka je prekrivena fotoreceptorskim ćelijama. Fotoreceptorske ćelije apsorbuju
svjetlost od slike koju na retinu fokusiraju leća i rožnica (cornea). One generišu nervne
impulse koji putuju ka mozgu kroz optičke nerve od kojih se svaki sastoji od oko milion
vlakana. Frekvencija ovih impulsa je funkcija osvjetljenosti retine. Fotoreceptorske ćelije su
najgušće u području žute mrlje (fovea). Pri jakoj svjelosti, otvor zjenice je mali i svjetlost je
fokusirana na žutu mrlju, što omogućava dobro razaznavanje detalja. Pri slaboj svjetlosti,
otvor zjenice je veći, te je svjetlost rasuta po većem dijelu retine i slika je loše fokusirana.
Slika 5. Uproštena građa ljudskog oka
Fotoreceptorske ćelije su mješavina ćelija dva tipa: štapića i čunića (konusnog oblika),
tako nazvanih po njihovom obliku. Štapići su mnogo osjetljiviji i omogućavaju
monohromatski vid u noći. Čunići omogućavaju gledanje u boji, ali samo pri visokom nivou
osvjetljenosti. Postoje tri tipa konusnih ćelija. One dijele vidljivi dio spektra u tri opsega:
crveni, zeleni i plavi. Zbog toga su ove tri boje označene kao osnovne boje ljudskog vida.
Slika 6 prikazuje osjetljivost ova tri tipa konusnih ćelija po talasnim dužinama svjetlosti iz
vidljivog dijela spektra.
Zasnovano na psihofizičkim mjerenjima, CIE (Commision Internationale de
I’Eclairage) je prihvatila ove krive kao kao krive osjetljivosti “tipičnog” posmatrača za tri
navedena pigmenta.
Sive slike imaju više nivoa sivila, što znači da je svjetlini u svakoj tački pridružena
jedna brojčana vrijednost iz konačnog skupa. Često se koristi opseg vrijednosti 0-255, gdje je
0- crno, a 255-bijelo, ili 0-1, kao na Slici 21, gdje je 0-crno a 1-bijelo. Uobičajeno se ove
slike nazivaju crno-bijele slike (kao kod crno-bijele fotografije ili crno-bijele televizijske
slike). Mi ćemo zadržati naziv sive slike da bi ih razlikovali od binarnih slika. Siva slika
dimenzija 640 x 480 zauzima oko 300 KB memorijskoh prostora.
Osnovu ovog kodovanja čini kompenzacija pokreta pri kojoj se formira vector
pomjeraja. Posmatra se luminentna komponenta makrobloka tekućeg frejma. U šemi 4:1:1 to
je blok veličine 16x16 piksela (4 bloka luminanse). Posmatranom makrobloku tekućeg frejma
se traži najsličniji dio na ograničenom području referentnog (prethodnog, mada ćemo kasnije
vidjeti da to može biti i sljedeći) frejma. Kada se pronađe najbolje preklapanje formira se
razlika vrijednosti luminantnih i hrominentnih blokova pronađenog i tekućeg makrobloka.
Makroblok razlike se koduje preko DCT. Prije Hafmanovog kodovanja, kvantovanim
koeficijentima DCT se dodaje vector pomjeraja.
3400
udaljenost ≈ × PH
LA
gdje je sa PH označena visina slike (picture height), a sa LA broj redova piksela (linija) slike.
Televizija standardne definicije (Standard definition television - SDTV) ima oko 480 redova
slike. Razmak između linija slike zahvata šezdesetinu stepena na udaljenosti od oko sedam
puta većoj od visine slike, kao što je skicirano na sljedećoj slici. Za format slike 4:3, i SDTV
sa 480 linija slike dobijamo 480·(4:3)=640 piksela po širini slike. Ako jedna linija, odnosno
piksel zahvata 1/60o stepena vidnog polja posmatrača onda po širini slike dobijamo ugao
gledanja od 640·(1/60o)=10.667o≈11o , dok po vertikali imamo 480·(1/60o)=8o
JPEG koder
Koder se sastoji od tri osnovna bloka:
1. Blok za računanje direktne diskretne kosinusne transformacije,
2. Kvantizer,
3. Entorpijski koder.
Na ulazu kodera, originalne vrijednosti piksela, koje su pozitivni cijeli brojevi iz
opsega [0, 2p-1], se pomijeraju u opseg [ -2p-1, 2p-1 -1]. Na primjer, za sive slike kod kojih je
p=8, originalni odmjerci iz opsega [0, 255] se oduzimanjem 128 pomijeraju u opseg [-128,
+127].
Zatim se slika dijeli na blokove dimenzija 8x8. Dimenzija blokova je odabrana na bazi
opsežnih ispitivanja subjektivnog osjećaja kvaliteta kompresovane slike sa različitim
deimenzijama blokova. Svaki od blokova se transformiše diskretnom kosinusnom
transformacijom u skup od 64 DCT koeficijenata.
Diskretna kosinusna transformacija je diskretna funkcija dvije prostorne dimenzije, k i l, koje
nazivamo prostornim frekvencijama. Vrijednosti ove funkcije nazivamo DCT koeficijentima.
Koeficijent F(0,0) se naziva DC koeficijent, dok se preostala 63 koeficijenta nazivaju AC
koeficijenti. Za sive slike DCT koeficijenti su iz opsega vrijednosti [-1024, 1023], što znači
da u poređenju sa originalnim vrijednostima piksela slike trebamo 3 bita više za njihov zapis.
Za tipičan 8x8 blok većina DCT koeficijenata je jednaka nuli, ili ima vrijednost blisku
nuli, odnosno znatno manju od koeficijenata na niskim prostornim frekvencijama, (vidi
sljedeću sliku), te ih ne treba kodovati. Ova osobina se koristi za postizanje kompresije slike.
Matrica vrijednosti originale slike i DCT koeficijenti. U sljedećem bloku, kvantizeru, 64
DCT koeficijenta se kvantujnu koristeći kvantizacione matrice (zavisno od aplikacije) koje
redukuju amplitudu koeficijenata koji malo ili nimalo ne utiču na kvalitet slike, s ciljem da se
poveća broj nultih vrijednost u matrici DCT koeficijenata. Kvantizacijom se gube informacije
koje nisu vizualno od značaja. Kvantovanje se vrši dijeljenjem svakog DCT koeficijenta sa
odgovarajućim elementom neke od kvantizacionih matrica (prikazane na sljedećoj slici) i
zaokruživanjem na najbliži cio broj:
𝐹𝐹(𝑘𝑘, 𝑙𝑙)
𝐹𝐹𝑞𝑞 (𝑘𝑘, 𝑙𝑙) = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 � �
𝑄𝑄(𝑘𝑘, 𝑙𝑙)