You are on page 1of 26

Y 

  

Araş. Gör. Süleyman Baykut


İTÜ
Elektronik ve Haberleşme A.B.D.
° et

ð Konuşma Sesi Nedir?


ð Ses Üretim Sistemi
ð Ses Telleri
ð °rnekler
ð Ses Üretim Modeli
Ses Nedir?

ð Konuşma Sesi: Ses üretim sistemini oluşturan


organların istemli hareketleri sonucu meydana
gelen akustik bir basınç dalgasıdır.
ð Akciğerler
ð Nefes borusu
ð Ses telleri
ð Gırtlak
ð Boğa
ð Ağı boşluğu ve burun boşluğu
ð Üretilen akustik dalga anlamlı bir mesaj içermelidir!
Ses Üretim Sistemi
Ses Yolu
Ses Telleri
ð Ses Telleri Tarafından Uyarıcı Sinyal Üretimi

ð Uyarıcı Sinyalin Şekillendirilmesi (Ağı Yolu & Geni Yolu)


Konuşma Sesi
ð Konuşmacı Hakkında bilgi verir:
ð Cinsiyet, Yaş, Sağlık, Ruh Hali..
Î j    
   
       

ü 


ü 


Konuşma Sesi
ð İstatistiksel ö ellikleri çok kısa aman aralıklarında
değişir (Durağan değildir). Bu yü den küçük
bloklara ayrılarak işlenir: B°MEEME

Ά kH ile örneklenmiş ses sinyali.


Î32 ms¶lik bölmeler (5†2 örnek).
Î25 ms örtüşme (400 örnek).
Ses Üretim Modeli
ð Basit olarak akustik bir sü geçleme işlemi gibi
düşünülebilir:
Zamanla Değişen Ses
Uyarıcı Sinyal Doğrusal Sistem Sinyali

°  
 
°     

Zamanla Değişen Doğrusal Sü geç

ð Doğrusal sü geç ses yolunu modelleyen sü geçtir.


ð ses telleri,
ð küçük dil,
ð damaklar,
ð burun,
ð dil,
ð dişler ve dudaklar
sesin niteliğini belirleyen önemli unsurlar olup değişik
konumlara girerek farklı seslerin oluşmasını sağlarlar.
Uyarım Sinyallerine Göre Sınıflandırma

ð yarı-periyodik uyarım sinyali


ð gürültü uyarım sinyali
ð darbe uyarım sinyali
ð Bu üçünün karışımı
ð Karışık
ð Fısıltı
ð Sessi uyarım sinyalleri
°tümlü ve °tümsü Sesler

ð Ses tellerinin titreşimiyle oluşan sö de periyodik


(quasi-periodic) sinyalin ses yolunu uyarması
sonucunda oluşan seslere ³ötümlü (voiced) sesler´
denir. Ses üretimi durumunda ses telleri belli bir
periyotta açılıp kapanarak yarı periyodik uyarım
sinyalini üretirler.
ð Hava akımının daraltılmış ses yolundan geçmeye
orlanmasıyla bir gürültü sinyali oluşur. Bu gürültü
uyarım sinyali kullanılarak üretilen seslere de
³ötümsü (unvoiced) sesler´ adı verilir. °tümsü
seslerin üretiminde ses tellerinde bir titreşim
olmamaktadır.
°tümlü / °tümsü Sesler
°tümlü / °tümsü Sesler (Güç
İ geleri)

° 

° 
³Gö lerindeki anlamı çö emedi´
G ö l e r i nde k ian l a m ı ç ö e me d i

Õ°Õ Õ Õ
Formantlar

ð °tümlü seslerin güç i geleri incelendiğinde, ses


yolunun tınlama frekanslarına karşı gelen
frekanslarda yüksek genlikli tepecikler görülür. Bu
frekans değerlerine ³formant´ adı verilir.
ð Ses yolu işlevindeki her bir değişken (dilin yeri,
dudakların şekli vs.) değiştikçe oluşan sese ait
formant değerleri de değişir. Bir seste sayısı
formant mevcuttur. Buna karşılık, ses telleri
tarafından üretilen akustik enerji 5000 H ¶in altındaki
frekanslarda yoğunlaştığı için ses ilk 3-4 formant ile
tanımlanmaktadır.
Formantlar
ð †. Formant: Frekans değeri en düşük fakat şiddeti en yüksek
formanttır. Ünlü seslerde 300 H ile †000 H arasında değerler
alır. Dil, ağı tavanına ne kadar yakınsa yani ağı boşluğu ne
kadar küçükse formant¶ın değeri o kadar düşüktür. Ağı
boşluğunun hacmi arttıkça bu formantın değeri de yükselir
[2,3].
ð 2. Formant: Ses yolunun u unluğuyla ilgilidir. 850 H ile 2500
H arasında değerler alır. Ses yolunun u unluğu arttıkça 2.
Formantın değeri a alır. °rneğin ³boot´ sö cüğündeki /U/ sesi
oluşumunda dudaklar yuvarlatılıp öne doğru u atılır bu da ses
yolunun boyunu u atmış olur. Bu sesin 2. formant değeri 850
H gibi küçük bir değerdir [2,3].
ð 3. Formant: †. ve 2. Formant değerlerinden daha yüksek
değerler alır. Sesin kalitesini belirlemede önemlidir.
Fonemler

ð Dilin ayırt edici en temel birimine fonem (phoneme)


adı verilir.
ð Fonemler ses tellerinin hareketleri ve ses yolunun
şekil ö elliklerine göre birbirlerinden farklılık
gösterirler. °rneğin ses tellerinin titreşimi, dilin ağı
içerisindeki yeri ve şekli, küçük dilin durumu,
dudakların durumu gibi etmenler farklı fonemlerin
oluşmasını sağlarlar.
Fonem Grupları

ü 

   


Õ ÕÕÕÕÕÕÕ 
 
Õl  ÕÕÕÕÕ
Õ ÕÕ
ÕÕ ÕÕ Õ

     
           
       

     
      
ÕÕÕÕ 
Ünlü seslerin üretiminde, dilin ağı içindeki
konumu




 



   





 
Konuşma Sesinin Ayırt Edici
° ellikleri

ð Temel Frekans (Perde Frekansı)


ð Ses tellerinin † saniyede oluşturduğu bir tam açılıp kapanma
periyodu sayısına ³sesin temel frekansı´ denir.
ð Ses tellerinin u unluğu, kalınlığı, kütlesi, gerginliği, elastikiyet
kıvamı ve nefes borusunda oluşan basınç temel frekansı
belirleyen etmenlerdir. Ses tellerinin u unluğu, kalınlığı ve kütlesi
arttıkça, üretilen sesin temel frekansı düşük olur. Ses tellerinin
gerginliğinin ve ses telleri ü erinde oluşan hava basıncının
artması ise temel frekansı yükseltir. Temel frekans arttıkça
üretilen ses incelir (ti leşir). Erkek ve kadın sesleri arasındaki en
belirgin ayrım, ses tellerinin yapısından ve şeklinden kaynaklanan
perde frekansı faklılığıdır. Erkeklerde perde frekansı ††0-†50 H
arasında değişirken kadınlarda 200-300 H arasında değişir.
ð Sesin Şiddeti
ð Sesin Genişliği
ð Tını
°tümlü / °tümsü / Sessi lik Ayrımı
ë 
 
    
Konuşma Sesi İşleme Uygulamaları
ð Ses Tanıma & Anlama & Doğrulama
ð Güvenlik Amaçlı uygulamalar
ð Ses Sente leme (Üretme)
ð Gürültü Temi leme (Ses İyileştirme)
ð Kodlama
ð ³Metinden ĺ Sese´, ³Sesten ĺ Metine´ çevirme
ð Arşivleme
ð Ses kayıtlarını saklama ve gerektiğinde
tarama yapabilme
ð Tercüme
ð Yavaşlatma & Hı landırma
ð Sayısal İm a (Watermarking)
Metinden ĺ Sese (Text to Speech)
ð Ya ılar ilk olarak belirli perde frekansına sahip sesbirimlerine
(fonem) dönüştürülür ve bu fonmeler ardarda sıralanarak ses
sente lenir.
ð Doğallıktan u ak mekanik bir ses üretilir.

Hi. How are you doing? Is everything alright at your side of the
world?
Konuşma Sesi İşlemenin Zorlukları
ð Kelimeler arası geçişin tam belirgin olmaması
ð Sinyalin ³durağan´ olmaması
ð Birbirine çok yakın telaffu lar:
ð ³O           ´
ð ´O  !  O  "  ´

ð Ses Sinyalinin ö elliklerinin konuşmacıya aşırı bağımlı


olması:
ð Cinsiyet, yaş, aksan, konuşma hı ı..
Ses İşleme Araçları

You might also like