You are on page 1of 12

Fakultet elektrotehnike Komunikacije

- ZADAA- I PREDMET: MULTIMEDIJSKI SISTEMI I KOMUNIKACIJE

Rudi Peri III-21/07

Zadatak 1. Potrebno je analizirati govorni signal, uoiti razlike izmeu njegovih zvunih i bezvunih glasova.

Slika 1.1. Talasni oblik zvunog signala Seven Analiza glasa S

Slika1. 2. Talasni oblik bezvunog glasa S

Slika 1. 3. Frekvetni spektar glasa S Slika 1.3. predstavlja frekventni spektar glasa S koji je inae bezvuni suglasnik. Sa slike vidimo da je frekventni spektar kontinualan tj. nemamo jasno istaknute frekvencije niti moemo uoiti pravilnost u frekvencijskoj domeni. Analiza glasa N

Slika 1.4 Slika 1.4 predstavlja talasni oblik govornog signala Seven dok markirani dio predstavlja talasni oblik glasa N.

Slika 1.5. Frekventni spektar glasa N Suglasnik N spada u grupu zvunih glasova pri ijem stvaranju glasnice titraju to za posljedicu ima periodinost zvunog signala koju uoavamo i na slici 1.4. U frekvencijskoj domeni pojavljeju se karakteristine frekvencije odnosno rezonantne frekvencije tj. Formanti koje uoavamo i na slici 1.5. Analiza glasa E

Slika 1.6. Frekventni spektar glasa E Harmonici odnosno viekratnici osnovne frekvencije (f ,2f , 3f...) za samoglasnik E se pojavljuju na frekvencijama f1 607 Hz , f2 1871, f3 2490 Hz ...to je predstavljeno na slici 1.6. i u rangu sa oekivanim vrijednostima. Zadatak 2. Va zadatak je snimiti vlastiti govorni signal i analizirati ga. Cilj je uoiti razlike izmeu zvunih i bezvunih glasova te karakteristine formante pojedinih glasova. Odgovorite na sljedea pitanja:

a) Na vremenskom prikazu signala pronaite po jedan zvuni i bezvuni glas (po izboru) te uoite razlike izmeu odabranih signala. Po potrebi uveajte prikaz dijela signala opcijom View->Zoom In. U sluaju pojave umova u snimljenom govornom signalu, provedite opciju fitriranja uma Efect->Noise Removal. Filtriranjem uma e se jasnije uoiti razlike izmeu signala zvunih i bezvunih glasova. Kopirajte sliku iz aplikacije, na kojoj ste oznaili posmatrane signale te opiite uoene razlike. b) Odabrane signale glasova prikaite u frekventnom domenu (opcija Analyze -> Plot Spectrum). Objasnite prikazane razlike u spektru. Kopirajte sliku sa frekventnim spektrom koji ste dobili ovom analizom te na njemu oznaite specifinosti vezane za te glasove. c) Identificirajte (priblino) formante jednog od sljedeih glasova: "a", "e", "i" koji se pojavljuju u vaem govornom signalu. Na kojim se frekvencijama pojavljuju formanti? Kopirajte sliku iz aplikacije sa uoenim formantima i naznaite o kojem je glasu rije.

a)

Slika 2.1 Vremenski prikaz snimljene rijei Solenar Analiza glasa S

Slika 2.2 Slika 2.2 predstavlja vremenski prikaz glasa S a budui da je u pitanju bezvuni glas nemamo nikakvu pravilnost signala to se dobro uoava i na samoj slici.

Slika 2.3. Vremenski oblik glasa N Sa slike 2.3. uoavamo da glas N ima odreenu periodinost u svom vremenskom domenu iako nismo odstranili prisutni um a koji e biti jo oitij nakon uklanjanja uma. Razlog tome je to to N spada u grupu zvunih glasova pri ijem stvaranju glasnice titraju. Nakon uklanjanja uma

Slika 2.4 Vremenski oblik signala Solenar nakon uklanjanja uma

Slika 2.5. Vremenski oblik glasa S i glasa N nakon uklanjanja uma Sa slika 2.4. i 2.5. koje predstavljaju sluaj kada smo odstranili um uoavamo da se karakteristike zvunih i bezvunih glasova bolje uoavaju. Tako na slici 2.5. bolje moemo primjetiti nepravilnost bezvunog glasa S a periodinost zvunog signala N.

b)

Slika 2.6. Frekvencijski spektar glasa S

Slika 2.7. Frekvencijski spektar glasa N Na slikama 2.6. i 2.7. su predstavljeni frekvencijski spektri glasa S i glasa N signala Solenar sa kojih uoavamo, slino kao kod analize signala Seven, da bezvuni glas S ima kontinualan frekvencijski spektar dok se kod zvunog glasa N pojavljuju rezonantne frekvencije odnosno formanti.

c)

Slika 2.8 Vremenski oblik glasa E

Slika 2.9. Frekvencijski spektar glasa E

Na slici 2.9. je predstavljen frekvencijski spektar glasaE sa kojeg se mogu uoiti formanti a koji su na frekvencijama f1 560 Hz f2 1954 Hz f3 2812 Hz ...

Zadatak 3 Va je zadatak analizirati neku od ponuenih izgovorenih fraza mijenjajui broj koeficijenata LPC kodera. Prvo odaberite izgovorenu frazu, a zatim snimite vlastiti glas (upustvo u nastavku). Odgovoriti na sljedea pitanja za oba sluaja. a) ta zakljuujete, kako broj koeficijenata utjee na kvalitetu zvuka (govornog signala)? ta se dogaa sa frekventnim spektrom u zavisnosti od broja koeficijenata? Obrazloite. b) Za odabranu frazu (snimljeni glas) odaberite prikaz osnovne frekvencije i pomou ponuenih opcija modificirajte osnovnu frekvenciju. Objasnite uticaj promjena na doivljaj i kvalitetu zvuka? c) Odaberite zvunu datoteku Beethoven (muzika) u padajuem meniju te je analizirajte (promjenom broja koeficijenata). Postoji li razlika u kvaliteti kodiranja govornog i muzikog signala s koderom LPC? Obrazloite. d) Izraunati brzinu (engl. bitrate) kodera LPC za sluaj u kojem je linearni filter odreen sa 10 koeficijenata. a)

Slika 3.1 Izvorni signal mog snimljenog glasa

Slika 3.2. Izvorni signal reenice They took a test for school sa prikazom amplitude

Slika 3.2.a

Slika 3.2.b

Slika 3.2.c

Slika 3.2.d Zakljuak : Za oba sluaja sam moglao zakljuiti da zavisnost izmeu broja koeficijenata i kvalitete zvuka je takva da sa poveanjem broja koeficijenata dobija kvalitetniji zvuk gotovo isti izvornom. Za sluaj kada koristimo manji broj koeficienata za kodiranje govornog signala pojavljuje

nam se um koji naravno degradira kvalitet zvuka a dobro se moe primjetiti i na frekvencijskom spektru koji postaje u tom sluaju iri (slike 3.2.a, 3.2.b, 3.2.c, 3.2.d ) . b) Takoer za oba sluaja (snimljeni glas i ponuenu reenicu ) promjenom osnovne frekvencije uoavamo da dolazi do izoblienja signala i to na nain da kako mjenjamo visinu glasa dobijamo dublji ili vii glas te dolazi do pojave harmonika vieg reda. c)

Slika 3.3 Izvorni i kodirani signal zvune datoteke Beethoven Zakljuak: Analizom muzike datoteke Beethoven moemo zakljuiti da LPC koder nije pogodan za kodiranje muzikog signala jer ni sa promjenom odnosno poveanjem broja koeficijenata ne postiemo zadovoljavajui nivo kvalitete ta vie izvorni signal je teko prepoznatljiv. d) LPC koder Parametri modela: Frekvencija pobude: 6 bita Jaina pobude: 5 bita Zvuni/bezvuni glas: 1 bit Za sluaj kada uzimamo 10 koeficijenata: 10 koeficijenata filtra :42 bita Frekvencija uzorkovanja: 8 kHz Duina okvira:180 uzoraka = 22.5ms Ukupan broj bita za jedan okvir :54 Brzina = 54*(1000/22.5) = 2400 bita/s = 2.4 kbita/s

Zadatak 4. Va je zadatak meusobno uporediti odabrane kodeke s obzirom na brzinu (bitrate) i subjektivnu kvalitetu. a) Presluajte sve verzije datoteke Fox i popunite tablicu 1. Za ocjenu subjektivne kvalitete mjerila ( ocjene ) spomenuta na predavanjima. Izraunajte priblinu brzinu za svaku datoteku. b) Usporedite veliine datoteka i ocjene njihove subjektivne kvalitete, ta zakljuujete? a)

Brzina Fox.aiff = 192 kB / 17s = 11.3 kB/s Brzina Fox_gsm.wav = 39.2 kB / 17s = 2.3 kB/s Brzina Fox_adpcm.wav = 98.8 kB / 17s = 5.8 kB/s Brzina Fox_pcm.wav = 192 kB/ 17s = 11.3 kB/s b) Uporeivanjem veliine datoteke moemo zakljuiti da je Fox_pcm.wav iste veliine kao i original Fox.aiff a presluavanjem nisam mogao primjetiti nikakvu razliku u kvalitetu te shodno tome sam ih ocjenio sa subjektivnom ocjenom 5 . Preostale dvije verzije Fox_gsm.wav i Fox_adpcm.wav imaju veliine datoteka 39,2 kB i 98,8 kB respektivno. Iako to predstavlja znaajno smanjenje veliine u odnosu na original kvalitet je izuzetno dobar ak je teko uoiti razliku u kvaliteti stoga sam im dao ocijenu 4.

You might also like