You are on page 1of 9

BESZÉDLÁNC

A beszéd az emberi kommunikáció legalapvetőbb formája.

A természetes emberi beszédlánc elemei:

      beszélő

   átviteli közeg

   hallgató

A BESZÉD KÖRFOLYAMATA
1.   nyelvi kódolás az agyban (szavak, nyelvtan, hangsúly, dallam stb.)
2.   a hangképző szervek (tüdő, hangszalagok, nyelv, állkapocs, ajkak)
vezérlése

3.   akusztikus terjedés (eljut a hang a hallgatóhoz és visszahalljuk saját


hangunkat)

4.   hallás (fül, idegi jelzések, szájmozgás, mimika, gesztusok)

5.   beszédmegértés (bonyolult agyi folyamat)

Párbeszéd (dialógus) során a szerepek váltakoznak.

A hangképzés folyamata

1.   a tüdő biztosítja a hangképzéshez szükséges levegőáramot

2.   a gégeműködéstől függ a hang zöngés (rezegnek a hangszálak) vagy


zöngétlen (nincs rezgés) jellege

a hang továbbhalad a száj és/vagy orrüreg felé, ahol frekvenciaszerkezete


módosul.

GERJESZTÉSI FORMÁK
1.   kváziperiodikus gerjesztés: a hangszalagok rezegnek, tipikus hangjai a
magánhangzók (a, á, e, é, i, o, ö, u, ü)

2.   turbulens gerjesztés: a réshangok gerjesztési formája (f, sz, s, h)

3.   lökéshullám gerjesztés: így keletkeznek a felpattanó zárhangok (p, t, ty,


k)

4.   vegyes gerjesztések

-          kváziperiodikus + turbulens: zöngés réshangok (v, z, zs)

-          kváziperiodikus + lökéshullám: a zár felpattanása előtt nem szünet,


hanem fojtott zönge hallható (b, d, gy, g)

-          lökéshullám + turbulens: zár-réshangok (affrikáták), a zár nem


pattan fel teljesen, csak résnyire (c, cs)

-          mindhárom gerjesztés jelen van: zöngés affrikáták (dz, dzs)

A hangok nem önmagukban hangzanak, a kapcsolódó hangok idomulnak egymáshoz,


ezt koartikulációnak nevezzük.

BESZÉDHANGOK CSOPORTOSÍTÁSA
A BESZÉDHANGOK IDŐSZERKEZETE
A beszéd tempóját sok tényező befolyásolja:

-          a beszélő személye;

-          a beszélő kora (gyerekek és idősek lassabban beszélnek, mint a


középkorúak);

-          a beszédforma (felolvasás – spontán beszéd);

-          témakör (pl. cselekménymesélés – értékelő, elemző mondanivaló).

Egy hang időtartama az emberi beszédben odafigyelés nélkül alakul ki. A mesterséges
beszédgenerálás (beszédszintézis) során azonban könnyen kialakulhat a természetestől
eltérő időzítés, ami a minőséget jelentősen rontja. 

A beszédhangok specifikus időtartama hangfüggő. Ezen belül:

-          a mássalhangzók általában rövidebbek, mint a magánhangzók;

-          a zöngés zárhangok rövidebbek, mint a zöngétlenek;

-          a rövid és hosszú hangok időtartama természetesen eltérő;

-          a félmagánhangzók (m, n, ny,  l, j, r) rövidek , legrövidebb az „r”.

A hangsorban ténylegesen mérhető konkrét hangidőtartamok eltérnek a specifikustól


-          a hangot megelőző és követő hang függvényében kell vizsgálni;

-          a hosszabb szavakban rövidebbek a hangok

az első szótag magánhangzója általában hosszabb, mint szó belsejében lévő.

A BESZÉDHANGOK IDŐSZERKEZETE
A beszéd tempóját sok tényező befolyásolja:

-          a beszélő személye;

-          a beszélő kora (gyerekek és idősek lassabban beszélnek, mint a


középkorúak);

-          a beszédforma (felolvasás – spontán beszéd);

-          témakör (pl. cselekménymesélés – értékelő, elemző mondanivaló).

Egy hang időtartama az emberi beszédben odafigyelés nélkül alakul ki. A mesterséges
beszédgenerálás (beszédszintézis) során azonban könnyen kialakulhat a természetestől
eltérő időzítés, ami a minőséget jelentősen rontja. 

A beszédhangok specifikus időtartama hangfüggő. Ezen belül:

-          a mássalhangzók általában rövidebbek, mint a magánhangzók;

-          a zöngés zárhangok rövidebbek, mint a zöngétlenek;

-          a rövid és hosszú hangok időtartama természetesen eltérő;

-          a félmagánhangzók (m, n, ny,  l, j, r) rövidek , legrövidebb az „r”.

A hangsorban ténylegesen mérhető konkrét hangidőtartamok eltérnek a specifikustól

-          a hangot megelőző és követő hang függvényében kell vizsgálni;

-          a hosszabb szavakban rövidebbek a hangok

az első szótag magánhangzója általában hosszabb, mint szó belsejében lévő.

A BESZÉDHANGOK FREKVENCIA SZERKEZETE

A Fourier transzformáció alkalmazásával határozhatjuk meg a hangok spektrumát


(Fourier transzformáltját). Egy időben változó jel előállítható különböző frekvenciájú,
amplitúdójú (időben változó jel legnagyobb eltérése az egyensúlyi állapottól) és
fázisú jelek összegeként. A Fourier-transzformáció egy olyan művelet, amely
megadja ezt a felbontást egy adott jelhez. Szűkebb értelemben spektrumon a
Fourier transzformált abszolút értékét értjük. A beszédhangoknál ez sokkal fontosabb
jellemző, mint a fázis.

Periodikus jelek spektruma vonalas: az alapharmonikus egész számú


többszöröseiénél van értelmezve. A beszéd alapfrekvenciáját (F0) a hangszalagok
rezgési frekvenciája határozza meg. Ez személyfüggő, férfiaknál 100 Hz közelébe
esik az átlag, nőknél ennek csaknem kétszerese. A periodikus jelekre jellemző
spektrum a zöngés hangoknál figyelhető meg. Ezek frekvenciaszerkezete a
gégeszintű hangforrás és az artikulációs csatorna, mint rezonáló üregrendszer
tulajdonságaiból alakul ki.

Nem periodikus jelek spektruma folytonos: bármilyen frekvenciájú összetevője lehet.


A turbulens és lökéshullám gerjesztésű hangok tartoznak ide.

A beszéd frekvenciatartománybeli elemzése nehézségekbe ütközik:

 A beszéd jellemzői folyamatosan változnak (nem


stacionárius).

 Ha rövid ideig stacionáriusnak tekinthető, a beszédből


ezt az időintervallumot kivágó ún. ablakfüggvény torzítja a spektrumot.

A magánhangzók spektrum burkolójának maximumait a hangszalagok és a


szájnyílás közötti toldalékcső (vokális traktus), mint szűrő kiemeléseinél jelennek
meg. Ezeket a maximumokat formánsoknak nevezzük, és frekvenciájukkal,
valamint sávszélességükkel írjuk le őket. 5-6 formánst szokás megkülönböztetni a
frekvencia növekvő sorrendjében.  Az alsó 2-3 formáns a hangra jellemző, a
magasabb formánsok a beszélőre.

Zöngétlen hangoknál a rés-, illetve zárképzés helyéről kiinduló turbulens


áramlás vagy lökéshullám gerjeszti az artikulációs csatornát, így alakulnak
ki a zörejgócok.

FELADAT
Az Audacity egy ingyenes hangszerkesztő program könnyen kezelhető
felülettel. A program támogatja az összes népszerű fájlformátumot (MP3,
FLAC, WAV, Ogg és AIFF).

Ahhoz, hogy eddig szerzett tudásunkat elmélyítsük, a következőkben


hangvizsgálatokat fogunk végezni. Ehhez először töltsük le a
hangszerkesztő telepítőjét és installáljuk.
ElőzőKövetkező

HANGFELVÉTEL KÉSZÍTÉSE

Indítsuk el az Audacity-t.

A felvétel  gombbal indíthatjuk a felvételt, a leállítás gombbal befejezhetjük.

Hozzunk létre egy könyvtárat a felvételeinknek!

Rögzítsük a százas szót a saját bemondásban. Szükség esetén töröljük a szünetet.


(Szokványos kijelölés az egérrel, majd Del.)

Mentsük el a felvételt az imént létrehozott könyvtárba:

-          File

-          Exportálás

A  gombokkal állítsuk az aktív beszédszakaszt, hogy kitöltse a hullámforma ablakot.

Figyeljük meg, hogy a kváziperiodikus magánhangzók és a zajszerű réshangok hullámformái


mennyire elkülönülnek. Ezek alapján könnyen kijelölhetők a hangok határai (szegmentálás).

Az előbbi műveleteket a hangfelvételtől a megjelenítésig végezzük el


a manó szóra. Figyeljük meg, hogy az orrhangú (nazális) mássalhangzók
akusztikailag nem különülnek el a magánhangzóktól. Ezért nevezik őket
egyes szakirodalmakban félmagánhangzóknak. A megkülönböztetés
nyelvtani: a magánhangzók szótagképzők, a félmagánhangzók nem.

IDŐSZERKEZET GYAKORLAT
Indítsuk el az Audacity-t.

Töltsük be a szél hangfájlt:

-          Fájl

-          Importálás

-          Audió

Hallgassuk meg a felvételt a Lejátszás  gombbal.

Kattintással helyezzük az időmutatót a szó elején látható, zajszerű „sz” hang utolsó

harmadához. Nyomjuk meg a Lejátszás   gombot.

Mit hallottunk?

Újabb kattintással tegyük az időmutatót az „sz” hang utolsó tizedére. Játsszuk le újra.

Mit hallottunk?

Az „sz”, a „c” és a „t”, mivel ugyanazt a felvételt hallgattuk, jellegében azonos, csak
időszerkezetében eltérő hangok. (az „sz” fokozatosan növekvő amplitúdóval indul,
időtartama a leghosszabb. A „c” hang hirtelen indul, időtartama rövidebb. A „t” hang hirtelen
indul, időtartama a legrövidebb.

A következő gyakorlathoz az előbbiek szerint töltsük be a kettő hangfájlt.


Hallgassuk meg az elejétől. Figyeljük meg az első kváziperiodikus „e” hang előtti
zajszerű (burst) jelet. Ez a „k” zárfelpattanása. Az „e” után hosszú szünet
következik, majd a második kváziperiodikus „ő” előtti zárhang, a „t”. Az „e” utáni
szünettől kezdve az egérrel jelölje ki a szünet 90%-át. A Del gombbal töröljük a
szünet nagy részét. Helyezzük az időmutatót a szó elejére, indítsuk el a
Lejátszást.

Mit hallottunk?
A hosszú „t” helyett a rövid párját hallottuk. A zárhang tehát azért volt eredetileg
hosszú, mert hosszú szünet volt előtte. A szünet időtartama is kritikus jellemzője
a beszédnek. (Kilépéskor ne mentsük el a változtatást.)

A PRAAT PROGRAM

A Praat program egy teljesen ingyenesen és szabadon letölthető, nyílt forráskódú


szoftver, ami telepítést nem igényel. A  hivatalos weboldalról letöltött csomagból
kitömörített bináris állomány bárhonnan futtatható.

A program indítása és vezérlése többféle módon lehetséges:

 Grafikus interfész indítása (Praat Objects és Praat Picture ablak)

 Praat szkriptek futtatása parancssorból (Praatcon)

  Külső vezérlés (Sendpraat)

FELADAT
Töltsük le a programot és ismerkedjünk meg vele.

FREKVENCIASZERKEZET VIZSGÁLAT
Mivel a hangok jellemzői beszéd közben folyamatosan változnak, a spektrum csak egy rövid
szakaszra lehet érvényes. Az időben változó spektrum megjelenítése nem egyszerű feladat.
Szellemes megoldás a problémára a spektrogram. A spektrogram vízszintes tengelyén az
idő, függőleges tengelyén a frekvencia található. Az adott frekvenciájú komponens
amplitúdóját a pont világossága reprezentálja: minél sötétebb a pont, annál nagyobb az
amplitúdó.
FELADAT
Indítsuk el a praat programot.

Open/Read from file… - válasszuk ki a „százas” szót

View & Edit

Az új ablak alsó részében figyeljük meg az idő/frekvencia szerkezetet. A


formánsok azonosítását piros pontok segítik. Ha ráklikkelünk egy pontra, az ábra
oldalán leolvashatjuk a hozzá tartozó adatokat.

Válasszunk másik szót és végezzük el  az analízisét.

You might also like