Professional Documents
Culture Documents
Psihoakustika 2009
Psihoakustika 2009
Psihoakustika 2009
SADRŽAJ
GLASNOĆA
TONSKA VISINA
DIFERENCIJALNI PRAG
MASKIRANJE
Na slici gornja krivulja predstavlja prag prema prvoj, a donja krivulja prag prema
drugoj uputi. U okolini 4000 Hz, razlika između krivulja je oko 7 dB. Autori
napominju da je varijabilitet (nesigurnost) u oba slučaja podjednak.
Normalni prag
Ima mnogo teorijskih i praktičnih razloga da se definira što se smatra normalnim
pragom sluha. Međutim, unatoč mnogobrojnim laboratorijskim eksperimentima s
malim grupama i istraživanjima na velikim grupama ispitanika nije ustanovljena
jedinstvena vrijednost (krivulja) koja bi se smatrala pragom normalnog sluha.
Klinički dijagnostičari, unatoč ovako nedefiniraj situaciji nisu sasvim bez oslonca.
Važno je da upotrebljavaju istu metodu a proizvođači opreme za audiometriranje
već su ugradili standardizirane vrijednosti u uređaje. Ovim vrijednostima dodaje se
korekcija za konkretne slušalice ili zvučnik.
Slika 2.3 prikazuje prag sluha mladih zdravih osoba. Najniža crtkana linija odnosi
se na 10% najosjetljivijih. To znači da većina neće registrirati zvuk tih razina
intenziteta. Puna linija smatra se pragom zato jer 50% ispitanika može registrirati
intenzitete koje povezuje ta krivulja. Samo mali dio frekvencijskog spektra može se
čuti ispod razine referentnoga zvučnoga intenziteta. Naročita osjetljivost oko 4 kHz
tumači se utjecajem rezonancijske frekvencije slušnoga kanala.
Desna strana dijagrama praga slušanja, prema visokim frekvencijama, strmo se
penje i jako je zavisna o dobi ispitanika. Za osobe od 20 godina, za frekvenciju od
17 kHz, prag sluha je 50 dB iznad referentnog zvučnog tlaka, a za osobe od 65
godina već je frekvenciji od 8 kHz prag sluha 50 dB iznad referentnog zvučnog
tlaka (Stevens, 1998).
Brownovo gibanje molekula zraka kod obične temperature uzrokuje "zvučni tlak"
koji je u području 1000 do 6000 Hz samo 10 dB ispod referentnog zvučnog tlaka.
To znači da bi veća osjetljivost ljudskog uha bila nekorisna. Zbog toga možemo
pretpostaviti da niti životinje u tom frekvencijskom dijapazonu nemaju bolju slušnu
osjetljivost.
Prag boli
Ako se intenzitet čujnog zvuka povećava slušatelj (ispitanik) doživljava zvuk kao
glasniji ali ako se zvučni intenzitet već vrlo jakog zvuka i dalje povećava, počinje
primjećivati neslušni, taktilni osjet. Priroda tog osjeta mnogo ovisi o frekvenciji, a
različiti ispitanici imaju različito iskustvo. Na niskim frekvencijama osjeća se
lagana vibracija superponirana zvuku. U nekim slučajevima pojavljuje se lagana
vrtoglavica zbog pobude polukružnih kanala. Na visokim frekvencijama osjeća se
najprije škakljanje, svrbež u srednjem uhu a potom jak bol. Zbog graničnih uvjeta
(nehumani eksperimenti) prag boli utvrđen je u eksperimentima u kojima su
ispitanici sami pojačavali zvuk dok ne primjete ekstraauditivni osjet. Prag boli
iznosi oko 120 fona razine glasnoće (oko 120 dB razine zvučnog tlaka) i
predstavlja gornju granicu dinamike slušanja.
REFERENCIJE
Zwicker- Fastl .....
Atkinson, R.C., R.J. Herrnstein, G. Lindzey, R.D. Luce, eds. (1988) Stevens'
Handbook of Experimental Psychology, John Wiley & Sons.
Hirsh, I.J. (1952) The Measurement of hearing, Mc Grow-Hill Co. Inc.
Moore, B.C.J. (1994) Psychology of hearing, Academic Press.
Seto, W.W. (1971) Acoustics, McGrow-Hill
Sivian, A.M. & White, S.D. (1933) On minimum audible sound fields, J. Acoust.
Soc.Am. 4, 288-321. (prema Moore, 1994)
Stevens, K. N. (1998) Acoustic Phonetics, MIT Press.
Stevens, S.S. & H. Davis (1960) Hearing (Its Psychology and Physiology), John
Wiley & Sons, Inc.
GLASNOĆA
(Zwicker-Fastl)
Razina glasnoće
Razina glasnoće nekog zvuka (loudness level) jest razina zvučnog tlaka (sound
preassure level, SPL) tona od 1 kHz koji je isto glasan kao taj zvuk. Jedinica takve
dimenzije zove se "fon" (phon). Razina glasnoće može se izmjeriti i izraziti za bilo
koji zvuk. Najčešće se ilustrira za čiste tonove različitih frekvencija. Linije krivulje
koje povezuju mjesta iste razine glasnoće zovu se izofone.
Slika 8.1 Linije iste glasnoće - izovone za čiste tonove. Brojevi kojima su krivulje
označene izraženi su u fonima (jedinica za razinu glasnoće) i u sonima (jedinica za
glasnoće).
Prema definiciji, sve krivulje neke razine glasnoće (parametar označen nad
krivuljom) na mjestu koje označava frekvenciju od 1000 Hz imaju isti broj fona i
decibela. Prag sluha, koji je također krivulja iste glasnoće, označen je crtkanom
linijom. Zbog toga što je razina zvučnog tlaka (SPL) na pragu sluha za 1000 Hz 3
dB, a ne 0 dB, parametar nad crtkanom krivuljom je 3 fona. Za tihe zvukove, oko
20 fona, krivulje iste glasnoće gotovo su paralelne s krivuljom koja označava prag
sluha. Za tonove iznad 200 Hz krivulje su paralelne i na većim intenzitetima. Za
frekvencije ispod 200 Hz, krivulje na većim intenzitetima sve su položenije, među
njima je manji razmak. Ton od 50 Hz 50 dB razine zvučnog tlaka dosiže razinu
glasnoće od 20 fona, dok 50 Hz 110 dB (SPL) doseže 100 fona. Razlika u broju
fona i broju decibela na malim intenzitetima je 30 a na velikim samo 10.
Najosjetljivije mjesto u spektru, između 2 i 5 kHz označeno je na pragu sluha
snižavanjem krivulje. Na velikim intenzitetima taj je udolina još izraženija.
Funkcija glasnoće
Šum razine gustoće (density level) od 30 dB (po hercu) djeluje kao maskirajući
zvuk i podiže prag čujnosti tona od 1 kHz tako da je tek čujan uz razinu zvučnog
tlaka od 50 dB. Dakle, njegova je glasnoća u tom slučaju nula sona. Da nema
maskirajućeg tona, takav zvuk imao bi glasnoću od 2 sona. Međutim, ako se razina
tona od 1 kHz poveća uz prisustvo istog maskirajućeg šuma, do 80 dB, provocirati
će osjet glasnoće sličan kao da nema maske. To znači da je krivulja glasnoće u tom
slučaju strmija.
Slika 8.10. Glasnoća tona od 1 kHz u funkciji njegove razine. Crtkana linija
predstavlja funkciju glasnoće u tihim uvjetima. Druge dvije krivulje predstavljaju
glasnoću tona od 1 kHz uz prisustvo ružičastog šuma razine intenziteta od 40 i 60
dB po 1/3 oktave. Vidimo da su uz višu razinu šuma krivulje strmije i da uz veće
razine tona od 1 kHz konvergiraju sličnim vrijednostima.
Za oba zdrava uha funkcija zapravo nije pravac nagiba 1, nego je malo na velikim
intenzitetima krivulja malo blažeg nagiba zbog toga jer ipistanici izbjegavaju jako
glasne zvukove.
Pogledamo li dijagram, ton od 60 dB SPL u oštećenom uhu čini se jednako glasnim
kao ton od 27 dB SPL u zdravom uhu. Tu se vidi razlika u apsolutnom pragu
između oba uha. Međutim, ton od 90 dB SPL u oštećenom uhu čini se jednako
glasnim kao ton od 80 dB u zdravom uhu. Treba pretpostaviti da bi se uz veće
intenzitete eksperimentiranja krivulja susrela s onom za normalno slušanje.
slika 8.12 Glasnoća isječaka zvuka iz tona od 2 kHz 57 dB SPL u funkciji trajanja
tih isječaka.
Usporedimo li podatke slike 8.12 sa slikom 8.13, vidimo prije opisanu zavisnost,
ovdje na drugi način prikazanu. Razina glasnoće (izražena fonima) opada za 10
fona ako se trajanje smanji 10 puta. Slična se zavisnost nalazi ako se
eksperimentira i drugim frekvencijama.
Kako vidimo na dijagramu 8.13, ton 2 kHz trajanja 5 ms ima razinu glasnoće od
47.5 fona. Takav je zvučni isječak upotrijebljen za promatranje zavisnosti o
njegovu ponavljanju (repetition rate).
Do otprilike 5 ponavljanja u sekundi takav tonski isječak ima približno istu razinu
glasnoće kao i jedan izolirano emitiran, to jest 47.5 fona. Uz veću učestalost
tonskih isječaka razina glasnoće raste postepeno sve do učestalosti od 200 puta u
sekundi, kad se niz impulsa pretvara u kontinuirani ton, a razina glasnoće dosegne
razinu dugotrajnih tonova 60 fona.
TONSKA VISINA
(Zwicker-Fastl)
Na slici 5.24 prikazana je shema različitih tipova zvukova, rangiranih prema jačini
osjeta tonske visine koji pobuđuju, od čistog tona, preko različitih kompleksnih
harmoničnih zvukova do šumova na različite načine filtriranih.
Fig. 5.24 Shematski prikaz zvukova upotrebljenih za promatranje jačine tonske
visine.
Slika 5.25 a-c prikazuje relativnu jačinu osjeta tonske visine za različite tipove
zvukova 1 – 11. Svaki dijagram odnosi se na drugu frekvencijsku zonu (125 Hz,
250 Hz i 500 Hz). Vidimo da jačina osjeta tonske visine opada na sva tri dijagrama,
uz veći redni broj (tip zvuka). Najjači osjet tonske visine pobuđuje čisti ton (zvuk
br. 1). Jačina tonske visine kompleksnih tonova prosječno postiže upola slabiji osjet
tonske visine. Različite vrste šumova (zvukovi 7 –11) pobuđuju 5–10 puta slabiji
osjet tonske visine od čistog tona. Zvuk br. 4, uskopojasni šum jedini je izuzetak, i
njegov “pitch strength” može se usporediti s onim kompleksnih tonova.
Širokopojasni šumovi ne pobuđuju nikakav osjet tonske visine, slično kao visoko-
propušteni ako je granična frekvencija relativno nisko (zvuk br. 11).
Slika 5.25 a,bc
Slika 5.27 Relativna jačina tonske visine čistog tona od 1 kHz, trajanja 500
milisekundi u funkciji njegove razine.
Najizraženiji osjet tonske visine pobuđuju tonovi srednjih frekvencija. Prama slici
5.28 vidimo da tonovi niskih frekvenicija (125 Hz) i tonovi viskokoih (8-10 kHz)
pobuđuju tri puta slabiji osjet tonske visine nego tonovi oko 1,5 kHz.
Frekvencija od 8 kHz odgovarati će 2100 mela. Kako se upola niži ton od 8 kHz
namješta na oko 1300 Hz, to znači, da 1300 Hz predstavlja 1050 mela.
fig.5.3 Pomak tonske visine čistog tona (parametar, 0,2, 1, 4 i 6 kHz) u zavisnosti o
razini reprodukcije u odnosu na tonsku visinu pri razini od 40 fona.
Prema tome ako se tonska visina čistog tona treba točno precizirati, treba navesti
osim frekvencije i razinu reprodukcije.
Pomak (promjena) osjeta tonske visine može se dogoditi ako je uz test ton prisutan
i neki drugi ton, koji ga djelomično maskira. Slika 5.4 prikazuje pomak tonske
visine čistim tonovima u prisustvu širokopojasnog šuma. Tonska visina u prisustvu
maskirajućeg šuma čini se višom i do 3 %. Višim frekvencijama pomak u tonskoj
visini je veći.
fig.5.5 Pomak tonske visine čistog tona koju uzrokuje maskirajući tona niže
frekvencije, u funkciji razlike razina između test tona i maskirajućeg tona.
Parametar je frekvencija test tona.
Maskirajući zvuk je čisti ton upola niže frekvencije od test tona. Dijagram
prikazuje zavisnost veličine pomaka tonske visine od razlike razina maskirajućeg i
test tona. Za ton od 300 Hz može se primijetiti pomak tonske visine do 8 %. Za
tonove od 1-4 kHz samo 1 %. Međutim ako se ton od 4 kHz maskira (ne upola
nižim nego s 3 kHz, dobiava se povišenje tonske visine za 6 %.
fig. 5.6 Pomak tonske visine čistih tonova u prisustvnu maskirajućeg tona više
frekvencije, u funkciji razlike njihovih razina. Parametar je frekvencija test tona.
Kompleksan ton može se promatrati kao suma nekoliko čistih tonova. Ako su
frekvencije čistih tonova koji su sastavnice kompleksnoga cjelobrojni umnošci
frekvencije osnovnog tona, onda je takav kompleksan ton harmoničan. Zapravo su
kompleksni tonovi daleko češći u svakodnevnoj pojavnosti nego čisti tonovi (npr.
vokalski govora, glazbeni tonovi).
Tonska visina kompleksnim tonovima može se ustanoviti usporedbom s čistim
tonom. Naime, kompleksni tonovi unatoč tome što se sastoje od više sastavnih
komponenata, ne pobuđuju i simultano više tonskih visina nego samo jednu ili
barem jednu koja je najistaknutija. U slučaju harmoničnih tonova, tonska visina
zavisi o frekvencijskom razmaku između sastavnih komponenata, odnosno o
frekvenciji osnovnog tona. Međutim, pogleda li se pažljivije, nije baš tako: čisti
tonovi po tonskoj visini jednaki kompleksnima mogu biti i do 3% niže frekvencije
od frekvencije osnovnog tona. Primjer tomu vidimo na slici 5.8.
fig. 5.8 Relativna frekvencijska razlika između frekvencije osnovnog tona
kompleksnog zvuka i čistog tona koji ima jednaku tonsku visinu, u funkciji
fundamentalne frekvencije. Razina kompleksnog tona je 50 dB a čistog tona 60 dB
(ispod 100 Hz, 70 dB).
Za frekvencije ispod 1000 Hz, ta je razlika sve veća. Na primjer, kompleksan ton
fundamentalne frekvencije 60 Hz pobuđuje jednaku tonsku visinu kao čisti ton od
58,2 Hz. Ili, kompleksan ton fundamentalne frekvencije 400 Hz po tonskoj se visini
izjednačuje s čistim tonom frekvencije 1% niže, odnosno s 396 Hz. Iznad 1000 Hz,
kompleksni tonovi i čisti tonovi pobuđuju jednaku tonsku visinu.
iz Houtsma:
Ako sastavne komponente kompleksnog tona nisu harmonično organizirane
(cjelobrojni umnošci) tada do osjeta tonske visine dolazi se različitim strategijama.
«Odvaguje» se što ima na osjet tonske visine jači utjecaj: najsnažnija komponenta,
ili približno harmoničan odnos ili...
Na primjer, kompleksan ton sastavljen od 800 Hz, 1000 i 1200 Hz, pobuđuje osjet
visine koji se uspoređuje s tonom od 200 Hz (nepostojećim fundamentalnim
tonom). Međutim, što se dogodi kad svakoj od sastavnih komponenata povisimo
frekvenciju za 20 Hz? U tom slučaju, frekvencije 820, 1020 i 1220 Hz više nisu
cjelobrojni umnošci niti jedne moguće zajedničke fundamentalne frekvencije.
Slušni sustav u takvom slučaju prihvaća «približnu harmoničnost».
820/4=205
1020/5=204
1220/6=203.3
850/4=212,5
1050/5=210
1250/6=208,27
(212,5+210+208.27)/3=210,93
Šum koji je frekvencijski strmo omeđen (filtriran) može pobuditi osjet tonske
visine. U tom slučaju tonska visina nisko ili visoko propuštenog šuma odgovara
graničnoj frekvenciji.
fig. 5.14 Tonska visina nisko propuštenog i visoko propuštenog šuma. Frekvencija
po tonskoj visini usporedivog tona u funkciji granične frekvencije (cut-off ).
Kružići se odnose na nisko propušten šum, a trokuti na visokopropušten šum.
Rezultati na dijagramu 5.14 dobiveni su vrlo strimim filtriranjem šuma, 120 dB/oc.
Prema ovome, trebalo bi očekivati da pojasno propušten šum pobuđuje dvostruk
osjet tonske visine: jedan koji proizlazi iz donje granične frekvencije i jedan za koji
je odgovorna gornja granična frekvencija pojasa. Rezultati eksperimenata s pojasno
propusnim filtrima prikazani su na fig. 5.15.
fig. 5.15 a-c Tonska visina pojasno propuštenog šuma. Razlika između frekvencije
čistog tona izjednačene po tonskoj visini u funkciji središnje frekvencije pojasno
propuštenog šuma. Točke predstavljaju pojedine usporedbe tonske visine. pune
linije predstavljaju granične frekvencije pojasa. Širina pojasa šuma na dijagramima
je: a – 3kHz, b - 600 Hz i c – 200 Hz.
U slučaju kad je širina pojasa šuma 3 kHz, većina usporedbi poklapa se s donjom
ili gornjom graničnom frekvencijom pojasa. No, ako je središnja frekvencija pojasa
1700 Hz, samo je gornja granična frekvencija pobudila osjet tonske visine. Što je
središnja frekvencija viša, i što je pojas šuma uži, sve je više izjednačavanja tonske
visine sa središnjom frekvencijom ili nekom unutar pojasa.
Tonska visina vrlo uskog pojasa šuma zavisi o njegovoj središnoj frekvenciji.
DIFERENCIJALNI PRAG
prema Zwicker-Fastl
Promijene amplitude
S dijagrama na slici 7.1 možemo očitati da u slučaju kad se razina čistog tona od 1
kHz (puna linija) varira 4 puta u sekundi (fmod=4 Hz) onda na malim razinama
(tihi zvuk) potrebne su velike varijacije da bi se mogle primijetiti, do 20 % (0,2 na
lijevoj ordinati). Uz razinu od 40 dB stupanj modulacije koji se može primijetiti je
oko 6%. Za veće razine potrebna veličina modulacije da bi se mogla primijetiti i
dalje opada, tako da na razini od 100 dB iznosi oko 1%.
Za bijeli šum (crtkana linija) situacija je drugačija. Za niske razine, slično kao za
čisti ton, potrebna je promjena od 20% da bi se primijetila. Porastom razine šuma
kojim se eksperimentira, prag vrlo brzo opada i na 30 dB može se primijetiti već
promjena od 4%. Ta sa veličina daljnjim porastom razine više ne mijenja sve do
razine od 100 dB.
Ako promatramo čisti ton od 1 kHz, veličina modulacije od 6% , što odgovara
razlici razine od 1 dB ima tendenciju stabiliziranja. Ta se veličina često ponavlja u
psihoakustičkim pokusima. Ipak, za više razine ta je veličina još manja.
Slika 7.6 Jedva primjetljiva razlika u razini tona od 1 kHz u odnosu na rezultate
dobivene uz trajanje od 200 ms, u zavisnosti od trajanja signala (tone burst)
Na slici 6.10 vidi se velika podudarnost između veličine kritičnog pojasa i veličine
diferencijalnog praga (vidi diskusiju uz sliku 6.1)
Slika 7.9 Broj "frekvencijskih stepenica" temeljenih na veličini diferencijalnog
praga za frekvencijsku modulaciju, koji su nanizani jedan do drugoga. Svaka točka
na dijagramu predstavlja 25 konsekutivnih veličina dif. praga. Crtkana linija
predstavlja aproksimaciju proporcionalnosti za niske frekvencije.
Na dijagramu nije bilo moguće ucrtati svaki diferencijalni prag, nego je označen
svaki dvadestpeti. Ako promatramo od nule, broj pragova proporcionalan je
frekvenciji (zato je crtkana linija pravac). Nakon 500 Hz, funkcija ocrtana nizom
točaka počinje odstupati od pravca proporcionalnosti i čini se da se ponaša
logaritamski: frekvencijski pomak (dijapazon) od jedne oktave odgovara zbroju
100 diferencijalnih pragova (4 točke). Ukupno je moguće nadovezati 640 stepenica
u dijapazonu do 16 kHz.
S obzirom na to da je od helikotreme do ovalnog prozora s razmakom od po 9
mikrona smješteno 3600 unutarnjih osjetnih stanica, možemo deducirati da razmak
jednog diferencijalnog praga obuhvaća 6 unutarnjih osjetnih stanica. Slična
funkcija dobiva se i u vezi s kritičnim pojasima (vidi poglavlje 6).
Posebno treba naglasiti da se ove dvije vrste podataka, rezultati koji se dobiju
mjerenjem frekvencijske modulacije i rezultati koji se dobiju usporedbom dvaju
pauzom odvojenih tonova, u literaturi se često miješaju.
//kod Zwickera originalno piše 25 dB, ali to bi onda vrijedilo samo za određeno
frekvencijsko područje, jer za niske frekvencije 25 dB ne mora doprijeti niti do
praga sluha - Bakran//
Ako tonovi kojima se uspoređuje frekvencija traju kraće od 200 ms, diferencijalni
se prag povećava. To je povećanje, međutim, frekvencijski zavisno.
MASKIRANJE
Slika 4.1 predstavlja razinu praga (threshold level) u funkciji frekvencije test tona
uz prisustvo bijelog šuma nekoliko različitih razina gustoće (denity level).
slika 4.1 Razina upravo maskiranog test tona (prag) bijelim šumom. Crtkana
krivulja predstavlja prag u tihim uvjetima (bez šuma). Parametar inad uz krivulja je
razina gustoće šuma. Dodamo li tim vrijednostima 40 dB dobijemo razinu zvučnog
tlaka.
U ovom kontekstu, uskopojasnim šumom smatra se šum širine pojasa jednakim ili
manjim od širine kritčnog pojasa za neku frekvenciju. To znači da je za frekvencije
do 500 Hz uži od 100 Hz, a za više frekvencije 0,2 f. Kad se radi o uskopojasnom
šumu, za izražavanje razine šuma bolje je koristiti ukupnu razinu šuma umjesto
razine gustoće. Ako se zna širina pojasa, razina gustoće jednostavno se transformira
u ukupnu razinu.
Slika 4.3 prikazuje prag čistog tona maskirnog bijelim šumom širine kritičnog
pojasa, središnjih frekvencija 0,25, 1 i 4 kHz. Razina maskirajućih šumova je 60 dB
a njihova širina 100, 160 i 700 Hz. Strmina gušenja filtara je više od 200 dB/oc, što
je više nego je frekvencijska selektivnost ljudskog uha. Frekvencijska ovisnost
maskirajućeg praga za uskopojasni šum centriran oko 1 kHz slična je onoj za 4
kHz, dok je za 250 Hz krivulja nešto šira. Osim toga maksimalan efekt maskiranja
se za više središnje frekvencije maskirajućeg šuma smanjuje unatoč tome što je
svaki od tri maskirajuća pojasa šuma iste razine intenziteta od 60 dB. Za 250 Hz
maksimum je 2 dB ispod crtkane linije koja predstavlja razinu intenziteta od 60 dB,
za 1000 Hz 3 dB, a za 4 kHz 5 dB manje. Lijevi bok krivulje maskiranja vrlo je
strm, oko 100 dB po oktavi. Desni bok nešto je manje strm.
Slika 4.3 Razina test tona tek maskiranog šumom širine kritičnog pojasa razine 60
dB, središnjih frekvencija 250 Hz, 1 kHz i 4 kHz. Crtkana linija predstavalja prag
bez prisustva maske.
Slika 4.4 Razina test tona (tek) maskiranog šumom širine kritičnog pojasa središnje
frekvencije 1 kHz i različitih razina intenziteta u zavisnosti o frekvenciji test tona.
Slika 4.5 Razina test tona upravo maskiranog niskopropusnim (low pass) šumom
(pune linije), i visokopropusnim šumom (točkaste linije) za različite razine gustoće
šuma, u funkciji frekvencije test tona. Granične frekvencije visokopropusno i
niskopropusno filtriranog šuma su 900 Hz i 1100 Hz.
Slika 4.6 Razina test tona maskiranog čistim tonom (1 kHz, 80 dB SPL) u funkciji
frekvencije test tona. Crtkanu zonu predstavlja područje treptaja a sivu (točkastu)
područje pojave diferencijalnog tona.
Čisti tonovi u prirodi su jako rijetki. Najsličniji su čistom tonu zvuk flaute i pijev
nekih ptica. Većina glazbenih instrumenata proizvodi uz osnovni ton i niz
harmonika. Razlika u boji glazbenih instrumenata proizlazi iz različitih
frekvencijskih spektara njihovih harmonika. Za razliku od flaute koja uglavnom
proizvodi osnovni ton bez viših harmonika, truba proizvodi širok spektar
harmonika pa može i maskirajući jače djelovati.
Slika 4.10 Razina test tona maskiranog kompleksnim tonom 200 Hz s deset
harmonika
Razine pojedinih harmonika označene su kao parametar uz krivulje.
Prag sluha u tihim uvjetima kao i maskirajući prag zavise o trajanju test tona. To
moramo imati posebno na umu za promatranje nesimultanog maskiranja.
slika 4.18 Razina tek čujnog tona (Lt) u funkciji trajanja, za 3 različite frekvencije
(0,2, 1 i 4 kHz) u tihim uvjetima, prikazano točkastim krivuljama, i uz dvije razine
jednoliko maskirajućeg šuma (40 u 60 dB). Napomena: Lt je razina kontinuiranog
tona iz kojeg su uzeti kraći isječci (tone bursts)
Slika 4.23 Maskiranje unaprijed zavisi o trajanju maskirajućeg zvuka. Razina test
tona od 2 kHz i trajanja 5 ms označena je u zavisnosti od vremenskog razmaka
nakon prestanka maskirajućeg šuma razine 60 dB i dva trajanja - 5 ms (točkasta
linija) i 200 ms (puna linija)
KRITIČNI POJAS - Critical Badwidth
Kao što je pokazano na slici 4.1 maskiranje bijelog šuma zavisno je o frekvenciji,
unatoč tomu što mu je razina gustoće neovisna o frekvenciji. Prag maskiranja
neovisan je o frekvenciji samo do 500 Hz, a za više frekvencije prag maskiranja
povisuje se 10 dB po dekadi (za deset puta veću frekveciju). Slušni sistem procesira
zvukove relativno uskim frekvencijskim pojasima. S obzirom na to da je prag
maskiranja do 500 Hz neovisan o frekvenciji, treba pretpostaviti da su u tom
frekvencijskom dijapazonu frekvencijski pojasevi koji djeluju maskirajuće, iste
širine. Nadalje, s obzirom na to da je bijeli šum iste razine gustoće u čitavom
spektru, a iznad 500 Hz prag maskiranja se povisuje, možemo pretpostaviti da je za
efekt maskiranja odgovoran širi frekvencijski pojas šuma, i to proširenje je
proporcionalno povišenju praga od 10 dB po dekadi.
Za niske frekvencije kritični pojas je konstantne širine od 100 Hz. Iznad 500 Hz
širna kritičnog pojasa iznosi oko 20 % središnje frekvencije pojasa, odnosno, širina
kritičnog pojasa povećava se proporcionalno frekvenciji.
Ima različitih metoda određivanja širine kritičnog pojasa. Na slici 6.3 prikazana je
jedna od metoda.
Slika 6.3. Prag uskopojasnog šuma smještenog između dva maskirajuća tona iste
razine (50 dB) u funkciji frekvenijskog razmaka između dvaju tonova.
Šum, centriran oko 2 kHz uskog je pojasa, manje od pretpostavljene veličine
kritičnog pojasa. Vidimo da je krivulja maskiranja neovisna o frekvencijskom
razmaku među maskirajućim tonovima do neke frekvencije (oko 300 Hz), a nakon
toga, uz veći razmak između maskirajućih tonova, prag maskiranja se smanjuje.
Slika 6.4. Prag detekcije test tona maskiranog dvama uskopojasnim šumovima
raspoređenim oko test tona, u funkciji razmaka graničnih frekvencija maskirajuših
šumova.
Na slici 6.4 prikazan je obrnut slučaj. Test ton je čisti ton od 2000 Hz, a lijevo i
desno su uskopojasni šumovi koji ga maskiraju. Vidimo da se rezultati podudaraju
s onima prikazanim na slici 6.3 (oko 300 Hz).
Točka, mjesto gdje se ukrštaju horizontalni dio i nagnuti dio krivulje frekvencijski
je razmak koji se naziva kritičnom pojasom. Ta je vrijednost neovisna o razini
maskirajućeg zvuka.
Još jedna metoda određivanja kritičnog pojasa, koja je prikazana na slici 6.7, sastoji
se u procjeni glasnoće pojasa šuma u funkciji širine pojasa. Šum je pojasno
propušten oko središnje frekvencije 2 kHz. Njegova razina (SPL) drži se
konstantnom na 47 dB, tako da se kod šireg pojasa mora smanjivati "intesity
density level" - relativni intenzitet po hercu širine pojasa.
Slika 6.7. Glasnoća (u sonima) pojasno propuštenog šuma oko središnje frekvencije
2 kHz (razine 47 dB) u funkciji širine pojasa šuma.
Slika 6.8. Širina kritičnog pojasa u funkciji (središnje) frekvencije. Crtkana linija
predstavlja pojednostavljen prikaz za niski i visoki dio spektra.
Kako se na slici 6.8 vidi, do 500 Hz, širina kritičnog pojasa je nepromijenjena i
iznosi 100 Hz. Nakon toga, uz više frekvencije kritični se pojas postepeno
proširuje, najprije nešto sporije, a nakon 3 kHz brže. Crtkanom linijom označeno je
povećanje proporcionalno frekvenciji, i to, 0,2 f. To znači, za središnju frekvenciju
2 kHz, širina kritičnog pojasa je 0,2*2000 = 400 Hz.
Ako se granične frekvencije kritičnih pojasa nadovežu tako da se gornja granica
jednog kritičnog pojasa poklopi s donjom granicom sljedećega, dobiva se Bark
frekvencijska skala (prema Barkhausenu, tvorcu jedinice za razinu glasnoće – fon)
Tablica 6.1 Bark skala tabelarno: z predstavlja redni broj Barka, fl i fu donja i
gornja granična frekvencija, delta fg je širina pojasa a fc središnja frekvencija
pojasa.
Sažetak
Uvod
Tema o kojoj se ovdje raspravlja do sada kod nas nije sustavno obrađivana, unatoč
tome što je poznata i stalno prisutna. Neka od kod nas objavljenih temeljnih
istraživanja, pridonijela su ovoj raspravi, ali nisu interpretirana u tom svjetlu.
Neprestano smo izloženi mnoštvu simultanih, pomiješanih zvukova. Da bismo se u
toj mješavini mogli snalaziti, moramo biti u stanju prepoznavati pojedine smislene
cjeline. U tom procesu važnu ulogu ima odluka o tome koji dijelovi osjetilnog
stimulusa pripadaju istom objektu ili događaju iz okoline. O čemu se zapravo radi,
o kojem pojedinom, konkretnom zvuku, može se prepoznati samo u slučaju prave
kombinacije osjetilnih elemenata. Gestalt psiholozi početkom ovog stoljeća otvorili
su pitanje organizacije percepcije, ali u svojim istraživanjima pretežno su se bavili
vizulanim kanalom, dok je problem auditivne organizacije ostao zapostavljen.
Jedan od razloga za to je i relativno zaostajenje tehnike manipuliranja zvukom. Tek
zamahom digitalne tehnologije obrade zvuka posljednjih desetljeća omogućeno je
sustavno laboratorijsko proučavanje auditivne percepcije. Problem o kojem se
ovdje govori ne odnosi se samo na govor, već je to univerzalan auditivni problem.
Ono što Cherry (1953) naziva coctail party efektom, Bregman (1994) na globalnom
auditivnom (akustičkom) planu naziva problemom analize zvučnog okruženja
(auditory scene analysis).
Da bismo pobliže definirali temu koja nas ovdje zanima, potrebno je uvesti jedan
novi pojam (termin). Što mi kao slušatelji zapravo radimo? Mi neprestano iz
mješavine zvukova koji nas okružuju izdvajamo i u cjeline povezujemo akustičke
elemente koji pripadaju istom izvoru. To je posebna vrsta filtriranja koju klasični
(elektro) akustički filtri ne mogu obaviti, osim u sasvim specifičnom slučaju kad
zvukovi koje treba odvojiti iz mješavine zapremaju različite, ne-preklapajuće
dijelove zvučnog spektra. Opisujući kompleksne zvukove kojima smo okruženi, pa
i govorni zvuk, koristimo se nizom termina kao što su: tonovi, šumovi, harmonici,
tranzijenti, formanti itd. Ono što nedostaje za opis zvučnog okruženja ili coctail
party problema jest izraz koji će označiti skup ili niz zvučnih elemenata koji
predstavljaju cjelinu, odnosno, najčešće zvučne elemente koji pripadaju istom
izvoru zvuka. Da bi označio pripadnost zvučnih elemenata jednoj cjelini, Bregman
(1994) predlaže izraz stream, što se najneposrednije može prevesti kao "zvučni
tok". Kriterij po kojem nešto predstavlja jedan (isti) zvučni tok ili cjelinu u smislu
ove rasprave, isključivo je perceptivan, dakle ne radi se o objektivnom akustičkom
nego o psihoakustičkom određenju pojma. Uvedeni pojam, "zvučni tok" ili "zvučna
cjelina", ne može se zamijeniti nekim od postojećih. U glazbi jedan zvučni tok
može biti jedna melodija (tema), jedna ritmička figura ili zvuk istog instrumenta. U
opisu govornog zvuka to može biti jedan vokal, riječ ili rečenica. Načelo se jednako
odnosi na cjelokupno auditivno područje, na cjelokupno zvučno okruženje.
Zajedničko svim ovim primjerima jest to da mora postojati unutarnja kohezija koja
ujedinjuje akustičke elemente.
Zanimljivo je da ljudi mogu razumjeti brzu izmjenu glasnika govora unatoč tome
što je govor slijed kvalitativno različitih zvukova (frikativ je različiti tip zvuka od
vokala), a nisu u stanju percipirati redoslijed nepovezanih zvukova (fićuk, šum,
zujanje, vokal). Slijed takvih zvukova mora biti mnogo sporiji od slijeda glasnika
govora da bi se ispravno identificirao. Za razumijevanje govora slušatelj mora
ispravno odrediti redoslijed glasnika jer izmijenjeni redoslijed može predstavljati
drugu riječ ili ne-riječ. Warren (1982) upozorava da se kod slušanja govora ne mora
nužno prepoznati svaki konstitutivni element nego da slušatelji provode vrstu
globalne analize, a rezultat uspoređuju s pohranjenim podacima u memoriji. Djeca
prepoznaju riječi a da ne moraju biti svjesna od kojih su elemenata one sastavljene.
Međutim, ovakvo objašnjenje ne rješava problem odjeljivanja zvučnih tokova u
govoru.
Kontinuitet frekvencije osnovnog tona može u jedan zvučni tok objediniti dva
vokala između kojih je interpoliran bezvučni konsonant. Pitanje je po čemu je taj
interpolirani konsonant dio istoga zvučnoga toka, odnosno kako to da spektralni
diskontinuitet koji predstavlja interpolirani konsonant ne signalizira drugi zvučni
tok. Vjerojatan odgovor na to pitanje jest da se radi o kontinuiranosti spektralnih
promjena (vidjeti iduće poglavlje). Prekid zvuka za okluziju, odnosno rubovi toga
prekida sadrže spektralni kontinuum. Međutim, u ovom slučaju simultano djeluje
spektralni kontinuum koji se manifestira adekvatnim tranzijentima i kontinuum
fundamentalne frekvencije. Ekstrapoliramo li rezultate Darwina i Bethell-Foxa,
možemo zamisliti što će se u sintetiziranoj riječi čuti ako se razbije kontinuitet
toka fundamentalne frekvencije prije i poslije bezvučnog okluziva: moguće je da će
se to čuti kao dva različita glasnika, kao što je moguće i da se uopće ne pecipira
okluziv interpoliran između dvaju vokala. To znači da je upravo kontinuitet
fundamentalne frekvencije zaslužan za percepciju bezvučnog okluziva u takvom
okruženju.
Postoji iznimka u tom općem ponašanju. Naime, kada postoje različite mogućnosti
percepcije ovisno o tome koji se formanti grupiraju zajedno, podudarnost u
frekvenciji osnovnog tona pomaže, priklanja se jednoj od mogućih percepcija. Ima
slučajeva kad F1, F2 i F3 zajedno daju jedan perceptivni rezultat, a F1, F3 i F4
drugačiji. Ishod percepcije (identifikacije) ovisi o tome koja kombinacija formanata
ima zajedničku frekvenciju osnovnog tona. Prema tome, frekvencija osnovnog
tona, koja predstavlja važan čimbenik za mehanizam "primitivnoga" grupiranja, u
problematičnim slučajevima može pomoći prepoznavanju fonema, premda je ono
prvenstveno proces koji se temelji na obrascima (shema-based), dakle na
naučenom.
I kada govornici nastoje tonsku visinu održati stabilnom, frekvencija osnovnog tona
neprestano se mijenja. Ta se pojava naziva mikromodulacijom ili jitter. Pokazalo se
da dodavanje malih frekvencijskih nepravilnosti sintetiziranom glasu djeluje, ne
samo tako da glas zvuči prirodnije, nego i tako da se harmonici bolje integriraju u
jedan zvučni tok. Sintetizirani su različiti vokali, svaki svojim osnovnim tonom.
Jedan skup stimulusa nije sadržavao nikakve frekvencijske nepravilnosti, a drugi
skupovi stimulusa varirali su frekvencijski, pravilno (vibrato) ili nepravilno (jitter).
Rezultati su pokazali da slušatelji jednostavnije prepoznaju, to jest odvajaju, vokale
ako su frekvencijski modulirani, bez obzira na to kakve su vrste bile modulacije,
pravilne ili nepravilne. Osim toga, u slučaju kad F0 nije bila modulirana,
slušateljima je bilo teško procijeniti o kojim se tonskim visinama radi, a kad su
stimulusi bili modulirani, čuli su točno koje su to različite tonske visine. U
ponovljenim pokusima, u jednom slučaju sintetizirani vokal modulira se tako da se
mijenjanjem frekvencije F0 bolje ocrtava spektralni oblik (mijenjaju se amplitude
harmonika tako da uz promjenu frekvencije slijede spektralni oblik), a u drugom
slučaju tako da amplitude harmonika ostaju nepromijenjene s promjenom F0 (pa se
prema tomu mijenja spektralni oblik).
U oba slučaja podjednako je olakšana identifikacija vokala. To znači da modulirani
vokali nisu jasniji samo zbog detaljnije ocrtanog spektralnog oblika. Vjerojatno je
da modulacija snažnije pobuđuje živčani sustav.
Slušatelji ne slušaju pojedine fomante i nisu ih svjesni kao zasebne boje zvuka,
nego njihova kombinacija predstavlja jednu boju. Takvo je slušanje u skladu s
načinom nastajanja formanata. Formanti ne nastaju neovisno - mijenja se zapravo
oblik rezonancijskog sustava. Pri tome, pojedini dijelovi artikulacijskog trakta,
rezonantne šupljine, nisu neovisno zaslužne za frekvencije pojedinih formanata.
Zbog toga govornici ne mogu svojom voljom mijenjati frekvenciju pojednog
formanta.
Dosad smo promatrali grupiranje i odvajanje u govornom zvuku u slučaju kad zvuk
dolazi u različito vrijeme (sukcesivno). Postoje mehanizmi za grupiranje i
odvajanje akustičkih komponenata koje do uha stižu istovremeno. Ti mehanizmi
moraju odvajati akustičke elemente različitih glasova (govornika) kako ne bismo
čuli zvuk koji je slučajna smjesa različitih glasova. Oni također tako moraju
integrirati komponente zvuka koji pripadaju istom glasu (govorniku) tako da se ne
bi dogodilo da se kao odvojeni zvukovi (zvučni tokovi) čuju formanti ili harmonici
istoga glasa. Pretpostavimo li da auditivni mehanizam najprije oformi nešto nalik
neuralnom spektrogramu, kako bi detektirao i prepoznao neki glasnik, on mora
objediniti spektralne komponente koje mu pripadaju. Simultane komponente kod
negovornog zvuka mogu se odvajati na temelju različitih faktora: tonskom visinom,
prostornim smještajem, spektralnim regijama, neovisnošću promjena.
U slučaju izmjene vokala i nazala događa se da viši formanti budu naglo utišani (na
početku nazala), odnosno pojačani (na početku vokala). To bi trebalo potaknuti
odvajanje na taj način da se jedan zvuk čini kontinuiranim, a drugi pridodanim. To
zaista možemo introspekcijom osjetiti ponavljamo li sekvencu /mamamama.../.
Međutim, taj je efekt razdvajanja znatno manji od efekta objedinjavanja koji
uzrokuje harmonički kontinuitet.
Pokusima je ustanovljeno da u slučaju maskiranja jednog vokala drugim, onda kad
onaj maskirani počne nekoliko desetinki sekunde nakon maske, vokal se
identificira kao da maske nema. Dapače, u tom slučaju efikasnost identifikacije ne
ovisi više o razlici fundamentalnih frekvencija dvaju vokala. U prirodnom govoru
nagle promjene energije događaju se na granicama okluziva i to okluzive čini
otpornima na maskiranje.
Zaključak
Referencije
Cherry, E. C. (1953). Some experiments on the recognition of speech with one and
with two ears. Journal of the Acoustical Society of America, 25, 975-979.
Darwin, C.J., Bethell.Fox, C.E. (1977). Pitch continuity and speech source
attribution. Journal of Experimental Psychology: Human Perception and
Performance, 3, 665-672.
Potter, R.K., Kopp, G.A., i Green, H.C. (1947). Visible Speech. Van Nostrand.
Stevens, K.N., Blumstein, S.E. (1981). The search for invariant acoustic correlates
of phonetic features. In P.D. Eimas and J. L. Miller (eds.) Perspective in the Study
of Speech. Hillsdale, N.J.: Erlbaum.
Stevens, S.S., Davis, H. (1960). Hearing, its Psychology and Physiology, Wiley.
Naslov na engleskom:
AUDITORY SCENE ANALYSIS
za summary: