You are on page 1of 4

PERCEPCE ZVUKU

• zkoumá vztahy mezi fyzikálními jevy a jejich tělesnou odezvou


Ucho
(viz též kapitola Fyziologická fonetika: Stavba sluchového ústrojí)

Anatomie ucha.
Vnější ucho
• boltec
- možnost lokalizace zvuku
• zevní zvukovod
- rezonance asi 3 000–5 000 Hz
- asi 2–3 cm dlouhý
• bubínek
- blána, na niž dopadají vibrace
Střední ucho
• kůstky kladívko + kovadlinka + třmínek
• převod vibrací z řídkého prostředí vzduchu do hustého prostředí kapaliny
• rezonanční frekvence 1 000 Hz – při ní kůstky nejlépe kmitají
Vnitřní ucho
• kůstky středního ucha navazují na hlemýžď (kochleu) přes oválné okénko
• každé místo bazilární membrány je schopné přenášet jen některé frekvence (na začátku nejvyšší zvuky,
uprostřed nejnižší)
• Cortiho ústrojí – z něj vedou řasinkovité buňky a jejich pohyb dráždí nervy
• první spektrální filtr v cestě zvuku → excitační vzorce

Akustické hledisko
• z hlediska akustiky můžeme sledovat vnímání výšky, hlasitosti a kvality
• ! neplést výšku a frekvenci – přesná veličina × objektivní vjem !

Vnímání výšky
• závisí na základní frekvenci, ale vztah není lineární
• i když základní frekvence chybí, slyšíme ji
• při vnímání výšky hraje malou roli i amplituda – láme se to kolem 1 500 Hz – silnější hlubší tóny zní ještě
hlubší, silnější vyšší tóny zní ještě vyšší
• nejnižší slyšitelná frekvence je asi (16)-20 Hz
• nejvyšší slyšitelná frekvence je asi 20 000 Hz
• < 20 Hz = infrazvuk – lze vnímat taktilně (vibrace na pokožce)
• > 20 000 Hz = ultrazvuk (protože kůstky nedokážou rychleji vibrovat) (netopýři slyší asi až 100 kHz)
• presbyakuse – snižování horní hranice slyšitelnosti s rostoucím věkem

Diference limen
• = nejmenší vnímatelný rozdíl
• liší se v závislosti na frekvenci
• nejefektivnější v nízkých frekvencích asi kolem 100 Hz (pak rovnoměrně stoupá)
• počítá se jako x/200 → u větších čísel větší hodnoty
• Hz nejsou pro percepci tolik relevantní
• asi do 800 Hz vnímáme lineárně, nad 800 se začíná logaritmovat (větší rozdíl se vnímá jako menší) (graf se
jakoby zplošťuje)
• pro různé druhy akustické analýzy se hodí různé stupnice:
- pro analýzu intonace půltóny
- pro formanty např. mely (nejstarší), barky, erby (nejnovější)

Melová stupnice
• vynalezena ve 30. letech 20. století
• dvojice zvuků, které jsou od sebe vzdáleny stejný počet melů, vnímáme jako stejný interval (→ rozdíl třeba
100 melů je vždycky percepčně stejný)
• stejně jako u diference limen se do 800 Hz vnímá lineárně, pak se logaritmuje
• na rozdíl od oktávové stupnice (která zahrnuje i libozvučnost) využívá jen výšku
• 20 kHz = 2 400 melů

Barková a erbová stupnice


• pojem "kritické pásmo slyšení" (CB – „critical bandwidth“)
- jak reaguje bazilární membrána na zvuky s podobnou frekvencí?
- nejblíže jsou rázy, pak nějaká ošklivá kombinace, od hranice pak relativně melodické (z
jednoho vrcholku se stanou dva odlišné, a to je právě to kritické pásmo)
- průběh diference limen a kritického pásma je stejný (tvarem)
- v rámci jednoho kritického pásma rozlišíme asi 20-30 diferencí limen
• vzdálenost kritických pásem se udává právě v barcích / erbech
- frekvenčně může být jiná, ale percepčně je vždy stejná stejná
Barky
• odfiltrovaný bílý šum vystředěný kolem tónu → postupně rozšiřovali pásmo toho šumu – šlo o to, najít, v
jakém okamžiku už nebude tón slyšet nebo kdy se začne měnit jeho detekce = šířka kritického pásma (šum
zaplní celý filtr kolem tónu → tón už není slyšet) = 1 bark
• asi do 500 Hz pořád stejná šířka kritického pásma (asi 100 Hz), nad 500 Hz se zvyšuje (asi 20% f)
- některé osoby se zhoršeným sluchem mají kritické pásmo širší → hůře slyší jednotlivé
tóny, slévá se to
• převod: 200 melů = 2 barky, 1 000 melů = 10 barků
• nevýhoda barků – rozlišení až od 500 Hz → rozlišení v nízkých frekvencích je špatné
Erby
• signální tón, kus od něj na obě strany šum (mezi nimi „průslech“) → šum se postupně přibližuje tónu (průslech
se zužuje)
• v okamžiku, kdy je to moc blízko a začne to ovlivňovat jeho detekci = šířka kritického pásma (= opačný
postup než u barků → odstraňuje problém s rázováním) → lepší rozlišení v nízkých frekvencích
• ve středních frekvencích je šířka pásma asi 12% f
• problém barků i erbů je, že jejich průběh byl nějak zjištěn a až pak se musela najít rovnice, která by tomu
průběhu odpovídala → víc různých rovnic
• pro zjednodušení se používá:
- bark = 1/3 oktávy
- erb = 1/6 oktávy
Objektivní popis síly zvuku
• RMS („root mean square“) → umocnit max. výchylky, ze součtu vypočítat průměr a odmocnit = překlopení
záporných hodnot do kladných a zprůměrovat → efektivní amplituda
- efektivní amplituda - průměrný tlak působící např. na bubínek
- průměr sinusovky je 0

Dynamické rozpětí zvuku


• nejmenší změna tlaku vnímaná jako zvuk je asi 10 mikropaskalů (asi 10 mld× míň než atmosferický tlak)
• největší změna tlaku, co ještě není vnímáno jako bolest, je 64 paskalů
• → ne moc vhodné pro hodnocení, moc velký rozdíl hodnot
• zvuk se sílou 10 (něčeho nedefinovaného) je 2× silnější než zvuk se sílou 1
• poměrové, ne lineární vnímání
• logaritmická stupnice - porovnává intenzitu dvou zvuků:
- dB = 10 * log ( intenzita 1 / intenzita 2 )
- decibely nemají žádnou referenční jednotku, slouží jen jako poměrná jednotka
Intenzita
• energie, která za 1 s dorazí na plochu 1 m2 (zvuk za sekundu urazí 340 m)
• ta samá energie po 2 s dorazí na 4 m2
• → intenzita klesá kvadraticky se vzdáleností (po 3 s 1/9 intenzity) („inverse square law“)
- dB = 20 * log (tlak 1 / tlak 2)
• např. rozdíl 60 dB je milionkrát větší intenzita
• aby se mohly uvádět konkrétní hodnoty, musela se stanovit 0:
- 0 dB = 10-12 W/m2
= intenzita 1 000 Hz tónu, který těsně nebyl zachycen
- je-li stanovena intenzita, používá se termín hladina zvuku (ang. SPL)

Subjektivní popis síly zvuku


Hladina hlasitosti
• značka "H"
• týká se čistých tónů
• vyjadřuje se ve fonech
• jako reference byla stanovena hodnota 1 000 Hz
- 1 000 Hz tón o 35 dB = 35 fonů
• izofona = křivka stejné hlasitosti – v závislosti na Hz musí mít zvuk různou sílu v dB, aby byl slyšet jako
stejně silný
- nejlépe se vnímají frekvence asi 1 000 – 4 000 Hz (pro pocit stejné hlasitosti stačí menší
intenzita než u jiných frekvencí)
- další propad kolem 13 000 Hz = druhá rezonance zevního zvukovodu
• práh bolesti asi 120–130 dB
• asi 10–15 dB pod tím je práh nepříjemnosti
• celková percepční dynamika (fony) je ve všech frekvencích stejná, i když podle dB se to třeba zplošťuje

Hlasitost
• týká se celkové hlasitosti (zkratka "L")
• jednotka son
- 1 son = 40 dB tisícihertzového tónu
→ rozdíl o 40 dB = 1 son, 50 dB = 2 sony, 60 dB = 4 sony, 70 dB = 8 sonů
• je to poměrové vnímání → zvýšení o 10 dB = 2 × L
• jednotky jako takové se nepoužívají, ale vztahy platí
• pokud má zvuk pásmo širší než je šířka kritického pásma, je slyšet jako silnější
• hlasitost je ovlivněna i trváním – pod 100 ms dochází k integraci a síla zvuku se nevnímá objektivně (jinak
delší tóny jsou vnímány jako silnější)

Praktický výpočet
• dB SPL = rozdíl obou hodnot (např. dva zvuky o 40 dB a 100 dB) → vznikne číslo (zde 60) → vydělit 10 (→
zde 6)
• poměr intenzit: 10n (zde 106) → kolikrát je silnější = intenzita
• poměr hlasitosti: 2n (zde 26) → kolikrát silněji vnímáme = hlasitost

Vnímání kvality zvuku


• kvalita hlasu = barva, témbr
• jak něco vnímáme, závisí na tom, jaké to má frekvenční složení
• objektivní korelát je zvukové spektrum
• kvalita je velmi složitá, definice je vždy negativní (např. něco ve smyslu „pokud jsou dva zvuky stejné, ale
vnímáme je jinak, je to rozdíl v kvalitě)
• rozdíl v kvalitě je např. stejný tón zahraný na různé nástroje
• zajímá nás poloha spektrálního těžiště = které frekvence jsou nejsilnější, je v nich nejvíce energie (= nejvyšší
amplituda)?
- temný zvuk – nejvíc energie je v nízkých frekvencích
- ostrý zvuk – nejvíc energie je v nejvyšších frekvencích
- středně ostrý zvuk – nejvíc energie je ve středních frekvencích
• schematická spektrální obálka – vyrovnání obloučků (úzkopásmová maxima = formanty) do jednoho velkého
oblouku
• formanty = úzkopásmová maxima, která přispívají ke vnímání kvality zvuku
• HNR = harmonicita („harmonic-to-noise ratio“) – poměr harmonických a šumových složek ve spektru
- údaj, který vypovídá o periodičnosti signálu
- používá se pro popis patologické fonace
- udává se v dB – pokud má harmonicita 20 dB, jsou harmonické složky 100× silnější než
šumové
Reference
• Ptáček, M. (1993): Úvod do fonetické akustiky. Praha: Karolinum.
• Palková, Z. (1994): Fonetika a fonologie češtiny. Praha: Karolinum. (vybrané části)
• Fant, G. (1970): Acoustic theory of speech production. The Hague: Mouton.
• Ladefoged, P. (1996): Elements of acoustic phonetics. Chicago: University of Chicago Press.
• Johnson, K. (2003): Acoustic and auditory phonetics. Oxford: Blackwell Publishing.
• Kent, R. D. - Read, C. (1992): The acoustic analysis of speech. San Diego: Whurr Publishers.
• Syrový, V. (2003): Hudební akustika. Praha: Akademie múzických umění. (vybrané části)
Zpět na rozcestník: Akustika | Fonetika

You might also like