Professional Documents
Culture Documents
Murat KZ ve dierleri
ZET
Bu almada amalanan, mikrofon yardm ile kayt edilen ses sinyallerinden wavelet dnm ve yapay
sinir a yardm ile konumac kimliinin tespit edilmesidir. Bu ama dorultusunda ses sinyalleri PC
ortamna mikrofon yardm ile alnd, n ileme ve grltden temizleme Wavepad ve Wave Flow programlar ile yapld. Matlab tabanl hazrlanan model yardm ile hazrlanan ses dosyalarndan veriler paracklara
ayrtrlmtr ve hazrlanan YSA program ile snflandrma ilemi gerekletirilmitir.
Anahtar Kelimeler : Wavelet, YSA, Konumac Tanma, Ses leme
__________________________________________________________________________________________________________________________________________________
1. GR
Konumann temeli ierdii sesli ifadelerdir.
Ancak sesli ifadenin etki snrlar ortamla kstl olduundan sesli ifadenin elektriksel sinyallere dntrlmesi gereklidir. Bu amaca ynelik ilk gerekletirim telefon ile salanmtr. Telefon seslerin
elektriksel sinyallere dntrlmesine dayanr. Telefonun icad iletiimin tarihsel geliimi iinde en
nemli admdr. Sesli ifade zerinde aratrmalar
telefonun icad ile balamtr. Bu aratrmalar sonucunda ilk sesli ifade kodlama teknii olarak 1938de
Genlik kodlamas modlasyon (PCM, Pulse Code
Modulation) teknii bulunmutur. Bu yntemle sesli
ifade rneksel olarak kodlanmaktadr. 1960dan
sonra saysal elektronik devrelerin ve bilgisayarlarn
gelimesiyle sesli ifadenin saysal olarak kodlanmas da mmkn olabilmitir. Sesli ifade tanma, bir
sesli ifade sinyalinin snrl sayda simgelerle ifade
edilmesi olarak tanmlanabilir. Ama ses sinyalinin
yazl edeerinin bulunmasdr. Sesli ifadenin yazl
karlnn bulunmas insan-bilgisayar aras iletiimi ok daha kolay bir hale getireceinden, bilgisayarn daha kullanl bir duruma gelmesini salar.
Yani insan-bilgisayar aras iletiim doal bir olay
haline gelir. Bu nedenle, bu konu ok rabet grmtr [4], [5], [8], [11], [12].
Tez almas konusu olarak ele alnan ses tanma, ses ilemenin bir alt basama olarak dn-
lebilir. Ses ileme ve ses tanma konularn dzenleyen tipik bir snflandrma ekil 1de verilmitir
[7], [8], [11].
nsanlarn ses retme ve sesi alglama sistemlerindeki organlarn yaplarndan kaynaklanan baz
snrlamalardan dolay, ses dalga eklinde deiime
sebep olan yaplarn pozisyonlarnn ksa zaman aralklarnda deimedii farz edilebilir [7]. Konuma
grtlan, titreen ses telleri tarafndan rettii hava
vurularyla tahrik edilmesi sonucu oluur. Ses telleri periyodik salnmlar oluturur ve bu salnmlarn
frekanslarna temel frekans ad verilir [1]. Konuma
reten ve kodlayan sistemler bu karakteristik modelleri gz nnde bulundurarak hazrlanrlar.
Murat KZ ve dierleri
2.3.YSANIN ETLMES
Hata geri yaylml yapay sinir ann eitim
srecindeki renme iterasyonlarna gre sistem
hatasnn deiimi ekil 1.2de gsterilmitir. An
eitim sresince herhangi bir kararszlk ve prz
olmamtr.
2. YNTEM
2.1.SESLERN DOSYALARA KAYDEDLMES
Bilgisayar ve sound blaster pro 16 bit stereo
ses kart ve dinamik mikrofon yardm ile sesler mono olarak kaydedilmitir. Mono olarak kaydedilmesinin nedeni kayt dosyalarnn daha az yer tutmas
iindir. Kayt frekans 11025 Hz olarak kullanlmtr.
Wavepad ve Waveflow programlar yardm
ile ses dosyalar grltden temizlenmi ve kayt olmayan bo ksmlar kaytlardan karlmtr. Seslerin kayt ortam normal ev ortamdr. Tamamyla
olmasa bile bilgisayar fannn sesi hari sessiz kabul
edilebilir. Grltden arndrma ilemi esnasnda
%5 eik deeri kullanlmtr. %5 eik deeri denemeler sonunda yeterli olarak grlmtr.
Her konumacya ait ard arda seslendirilen 10
szck ieren esas ses kayd iin ses kaydnn ilk
harfinden itibaren ayrm iin gerekli olan kadar ve
seslendirilen szck kullanlarak ses dosyalarnn
adlar oluturulmutur. 10 adet szck ieren her bir
dosya tekrar 10 dosya olacak ekilde yine ayn
program yardm ile kesimlenmitir.
2.2. SES DOSYALARINDAN VER DOSYALARININ ELDE EDLMES :
Dosyalanm ve rneklenmi ses bilgisinin
YSA ile tanma ilemine geilebilmesi iin veri haline dntrlmesi gerekir[4]. Windows altnda kayt yaplan ses rnekleri .wav uzantl dosyalar haline gelmitir. Daha sonra bu dosyalar Matlab program yardm ile veri dosyalar haline dntrlmtr.
Veri gruplar oluturulmadan nce Matlab
Wavelet Toolbox yardm ile ses sinyalinde analiz
almalar yaplm ve orijinal sinyali en iyi temsil
eden sinyalin Db2 ve 10ncu seviye yaklam olduu grlmtr. Analiz almas esnasnda sesler
kiilere gre ve ayr gruplar halinde incelenmi ve
en uygun ayrtrma parametresi ve seviyesi tespit
edilmeye allmtr [13].
Ses rneklerine ait Db2 ve a10 (Level 10
Approximation) sinyalinin seslerin karakteristii tad ve konumac tanmada ses karakteristii olarak kullanlabileceini sylemek teorik olarak mmkn grlmtr. Bu n almalardan yola karak
tm ses rnekleri iin Db2 a10 sinyali ses rneklerinden elde edilmi, 2nci seviye ayrm ile 4 alt
bant elde edilmi ve bu 4 alt banda ayrtrlmtr.
Verinin son hali almada snflandrc olarak kullanlacak YSAnn giri sinyalleri olarak kullanlmtr.
3. BULGULAR VE TARTIMA
Tablo 1. Test-1 Grubuna Ait Baar Yzdeleri
37
Murat KZ ve dierleri
4. SONU
Tm bu almalar insan sesinin ses oluumunda etkin rol olan grtlak ve ses yolu yapsnn
farkl olduunu ve kii iin zaman zaman eitli nedenlerden dolay (hastalk gibi) yapsnda deiiklik
olsa bile esas itibar ile deimedii ve her kii iin
ifade edilebilecek bir karakter taddr.
Bu sonular neticesinde YSAnn, konumaclarn DENEME kelimesi temel alnarak eitilmesi
sonucunda, iarete baml bir ortam baars %
99,30 olarak olumutur. Kelimeden bamsz olarak YSAnn baar yzdesi % 85.41 olarak bulunmutur.
Tablo 3den kan sonu, almada kullanlan YSAnn kii baml sistemler iin uygun sonular retebildiidir. Kii bamsz olarak deerlendirildiinde kan sonularn deerlendirilemeyecek seviyede ktlar olduu gzlenmitir.
Yaplan bu alma ile olduka baarl bir
oranda Wavelet ve YSA kullanarak ses sinyallerinden konumac kimliinin tespit edilmesi salanmtr.
5. KAYNAKLAR
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
38