You are on page 1of 8

Statisztikai hipotzisvizsglatok

1. Milyen problmknl hasznlatos?


A gyakorlatban nagyon gyakran szksgnk lehet arra, hogy mintkbl szrmaz
informcik alapjn hozzunk sokasgra vonatkoz dntseket. Pldul egy tltgp
megfelelen van-e belltva; a cigarettban lev ktrny alatta marad-e az elrt rtkeknek.
Ezekben az esetekben azt vizsgltuk, hogy az adott minta szrmazhat-e egy adott paramter
sokasgbl, illetve, hogy a minta egyik paramtere azonos-e egy elmleti rtkkel. A sokasg
adott tulajdonsgt nem mrhetjk le kzvetlenl, hanem csak a sokasgbl vett minta alapjn
becslhetjk. A becsls azonban vletlen hibkkal terhelt, ezrt szmszer eltrs a mintbl
szmtott rtk (pl. tlag) s az adott rtk kztt nem szksgszeren jelenti azt, hogy a
sokasgra jellemz rtk is eltr az adott rtktl.
Ms esetekben kt sokasg valamely paramtert hasonltjuk ssze: kt populci
jvedelmi viszonyai azonosnak tekinthet-e; tovbb lnek-e a nk, mint a frfiak.
Amikor dntst akarunk hozni, felttelezseket fogalmazunk meg, melyek lehetnek
igazak vagy hamisak, ezeket hvjuk statisztikai hipotziseknek. Dntsnket a minta alapjn
kalkullt rtk segtsgvel tudjuk meghozni. Mivel a mintavtelt a vletlen befolysolja,
ezek a szmolt statisztikai mutatk valsznsgi vltozk lesznek.
A statisztikai prbnak nevezzk azt az eljrst, aminek a segtsgvel eldnthetjk,
hogy az adott hipotzis elfogadhat-e vagy sem. A mdszer alkalmazsa sorn
sszehasonltunk kt szmot: a szmtott prbastatisztika rtkt s egy tblzatbeli (kritikus)
rtket.
A nullhipotzis a felttelezsnk matematikai megfogalmazsa. Alakja egyenlsg,
kt rtk azonossgt lltja. (Nevt onnan kapta, hogy e kt rtk klnbsge nulla.) Pldul:
a sokasg vrhat rtke () megegyezik egy elre rgztett rtkkel (m0). H0 : = m0 . Ezzel
szemben ll msik llts az alternatv hipotzis. Az alternatv hipotzis lehet ktoldali
alternatv hipotzis vagy egyoldali alternatv hipotzis. Az elz pldnl maradva:
Ktoldali alternatv hipotzis: H1 : m0.
Egyoldali alternatv hipotzis: H1 : < m0 (baloldali)
H1 : > m0 (jobboldali).
Megbzhatsgi szint (konfidencia szint) (1-) a nullhipotzis elfogadsra
vonatkoz dnts helyessgnek valsznsgt fejezi ki, amennyiben a nullhipotzis igaz. A
szignifikancia szint () a hibs dnts valsznsge ugyancsak igaz nullhipotzis esetn.
Empirikus szignifikancia szint (P rtk) annak a valsznsge, hogy a prbastatisztika a
mintbl kiszmtott rtket veszi fel. Az empirikus szignifikancival a statisztikai szoftverek
alkalmazsnl tallkozhatunk. Minl kisebb a P rtk, annl nagyobb a valsznsge hogy a
H0 hipotzis hamis.
A prbastatisztika rtke a nullhipotzis rvnyessgtl, a kritikus rtk nagysga a
megbzhatsgi szinttl fgg.
Mivel a minta a vletlentl fgg, ezrt soha nem lehetnk biztosak abban, hogy a
hipotzis igaz vagy sem. A statisztikai dnts sorn ktfle hibt kvethetnk el. Els faj
hiba () esetn a nullhipotzist elutastjuk, pedig igaz. Az els faj hiba elkvetsnek
valsznsge a szignifikancia szinttel megegyezik. A hiba nagysga a szignifikancia szint
cskkentsvel cskkenthet. Msodfaj hiba () esetn a nullhipotzist elfogadjuk, pedig
nem igaz. A hiba nagysga cskken, ha nveljk a szignifikancia szintet. Ha nveljk a
kritikus rtket, akkor az esetek tbbsgben cskkentjk -t, s egyttal nveljk -t. Ha

cskkentjk a kritikus rtket, akkor _ cskken, de n. Az -t ltalban 5%-nak szoks


megadni. Ezen hibk egyttes cskkentse csak a minta elemszm nvelsvel rhet el.
H0 hipotzis
Elfogads
Elvets

Igaz
Helyes kvetkeztets
Els faj hiba ()

Hamis
Msodfaj hiba ()
Helyes kvetkeztets

Elfogadsi tartomny: az az intervallum ahov ha a prbastatisztika rtke kerl, a


nullhipotzist elfogadjuk.
Kritikus tartomny: az az intervallum ahov ha a prbastatisztika rtke kerl, a
nullhipotzist elvetjk.
Kritikus rtk: az a szm, amivel a prbastatisztika rtkt sszehasonlthatjuk, s
dnthetnk, hogy az elfogadsi vagy a kritikus tartomnyba esik.
Kritikus s elfogadsi tartomny egyoldali alternatv hipotzis esetn:

kritikus
tartomny
/2

elfogadsi
tartomny

kritikus
tartomny
/2

1-

Kritikus s elfogadsi tartomny baloldali alternatv hipotzis esetn:

kritikus
tartomny

elfogadsi
tartomny
1-

Kritikus s elfogadsi tartomny jobboldali alternatv hipotzis esetn:

elfogadsi
tartomny
1-

A statisztikai prba algoritmusa:

kritikus
tartomny

A krds megfogalmazsa, a prbastatisztika kivlasztsa.


A nullhipotzis s az alternatv hipotzis fellltsa.
A szignifikancia szint () megvlasztsa.
A prbastatisztika rtknek kiszmtsa.
A (tblzatbeli) kritikus rtk meghatrozsa.
A dnts meghozatala a nullhipotzis elfogadsrl vagy elvetsrl.
A kvetkeztetsek levonsa.

Paramteres statisztikai prbk


Ha az eloszls jellege ismert, s a nullhipotzisnk az eloszls valamely paramterre
vonatkozik, paramteres prbrl, ellenkez esetben nemparamteres prbrl beszlnk. A
paramteres prbk alkalmazsa nominlis s ordinlis vltozkon nem ajnlott.
Kzprtkekre vonatkoz prbk (z-prba; t-prba)
Egy mints prbk:
A nullhipotzis a kvetkez lehet: szrmazhatott-e a minta egy adott kzprtk
sokasgbl?
z-prba (vagy u prba): Akkor hasznljuk, ha a sokasg normlis eloszls, az
alapsokasg szrsa ismert vagy tetszleges eloszls sokasg, de a minta elemszm kellen
nagy.
A prbastatisztika kiszmtsa:
x
z=
, ahol

n
x
a minta tlaga,

a sokasg tlaga,

a sokasg szrsa,
n
a minta elemszma.
Elfogadsi tartomny: z emp < z krit
t-prba: normlis eloszls sokasg esetn hasznlhat, amikor a szrs nem ismert valamint
a minta elemszm kicsi (n < 30).
x
, a szabadsgi fok szma: n-1, ahol
t=
s
n
x
a minta tlaga,

a sokasgi tlag,
s
a sokasg becslt szrsa,
n
a minta elemszma.
Elfogadsi tartomny: t emp < t krit
Plda:
Egy ksrletben egy j gygyszer testtmegre gyakorolt hatst szeretnk leellenrizni.
Egereken tesztelik az j vegyletet. A laboratriumi populciban genercirl genercira az

egerek adott ids korukra 20 grammosak voltak, tmegk szrsa 2,5 g volt. Felttelezhetjk,
hogy az egerek tmege normlis eloszls = 20 g tlaggal s = 2,5 g szrssal. A
vizsglathoz kivlasztanak egy vletlen mintt 10 egeret, s megnzik, hogy mekkora lesz az
adott korban a tmegk. Azt tapasztaljk, hogy a 10 egr tlagosan 21 grammosok lettek.
Vletlennek vagy a vegyletnek ksznhet-e a vltozs? Felmerl a krds, hogy a
mintavtelezsi hibt figyelembe vve a 10 egr tmegnek legalbb mekkornak kell lennie
ahhoz, hogy az j vegyletet hatsosnak lehessen nyilvntani.
Megolds:
Nullhipotzis: a vegylet nem okozott vltozst.
Alternatv hipotzis: a vegylet hatssal van a testtmegre.
Vagyis: H0 : = 20; H1 : 20. Ez egy ktoldali alternatv hipotzis.
A hipotzis elfogadsrl vagy elvetsrl egy ismert eloszls n. prbastatisztika
segtsgvel dntnk.
x 21 20
z emp =
=
= 1,26
2,5

10
n
A dntsi szablyunk az, hogy H0-t elfogadjuk, ha a zemp kisebb, mint a 2,5%-hoz tartoz
kritikus rtk (azaz 1,96), elutastjuk, ha zemp meghaladja ezt az rtket. Ez 5%-os
szignifikancia szintet jelent, hiszen ktoldali alternatv hipotzisnk van, hiszen 2,5% eslyt
adunk annak, hogy helytelenl dntsnk a pozitv effektusrl, s 2,5%-ot annak, hogy
helytelenl dntsnk a negatv effektusrl. Esetnkben zemp < zkrit, teht elfogadhatjuk a
nullhipotzist, miszerint a vegylet nem okozott vltozst.

Megjegyzs:
Mi van akkor, ha nem ismerjk a szrst? Nyilvn becslst kell adnunk r. Ha nagy mintbl
becsljk, akkor felttelezhetjk, hogy a becsls elegenden pontos, s alkalmazhatjuk az
eddig lertakat. Ha a populci eloszlsa normlis, akkor kis minta esetn a t-eloszls
hasznlatval korriglhatjuk a mdszert. Ennek az lesz a hatsa, hogy a kritikus rtkek
tvolabb fognak esni a H0-ban felttelezett 0 tlagrtktl. Pldul, ha az egrtmegek esetn
nem ismerjk a szrst, csak becsltk a 10 elem mintbl, s az 2,5-nek addott, akkor
egyoldali prba esetn a kritikus rtk:
x 21 20
t emp =
=
= 1,26
s
2,5
n
10
A tkrit. rtket a t-tblzat alapjn hatrozzuk meg. A szabadsgi fok n - 1 = 9, a szignifikancia
szint 0,05. A kritikus rtket a tblzat /2 = 0,025 rsznl kell keresni a ktoldali alternatv
hipotzis miatt. gy tkrit. =2,26.
Ktmints prbk:
Elz pldnkban azt vizsgltuk, hogy egy j vegylet hatsra vltoznak-e az egrtmegek
az elz genercik adatai alapjn megllaptott, elmleti rtkhez kpest. Nagyon gyakran
azonban nem ll rendelkezsnkre ilyen elmleti rtk. Ilyen esetekben clszer egy msik
(kontroll) csoporthoz viszonytanunk az eredmnyeinket. Szinte mindig ez az eljrs
gygyszer-hats vizsglatnl. Gyakran elfordul az is, hogy egyszeren csak kt csoportot
(populcit) szeretnnk sszehasonltani.
Pldul, szeretnnk megtudni, hogy vajon a dohnyosok rvidebb ideig lnek-e, mint a nem
dohnyosok, a Holstein-Frzek tejtermelse nagyobb-e Nmetorszgban, mint nlunk A
kt sszehasonltand csoportnak nem tudjuk a populci tlagait, csak a bellk kivlasztott

mintk tlagait tudjuk sszehasonltani, s azt vizsgljuk, hogy a kett szignifiknsan


klnbzik-e.
A nullhipotzis a kvetkez lehet: kt minta kzprtke azonosnak tekinthet-e?
H0 : x1 = x2
z-prba: Akkor hasznljuk, ha mind a kt sokasg normlis eloszls, az
alapsokasgok szrsai ismertek vagy a mintk elemszmai kellen nagyok.
x1 x 2
z=

12

22

n1 n2
t-prba: Normlis eloszls sokasgok esetn, amikor a szrsok nem ismertek, de
kzel azonosak.
x1 x 2
t=
, a szabadsgi fok szma: n1+n2-2
1 1
Sp
+
n1 n2
Sp =

(n1 1)s12 + (n2 1)s22


n1 + n2 2

Plda:
Kt halastbl szrmaz halak zsrtartalmt szeretnnk sszehasonltani. Az egyik tbl 22
elem mintnk van, a minta tlaga 27%, szrsa 4%. A msik esetben 25 elem minta alapjn
az tlagos zsrtartalom 24%, szrsa 3%. A szmok alapjn gy tnik, hogy az els t esetn
nagyobb a zsrtartalom. Krds, hogy ez a klnbsg szignifikns-e, vagy csak a mintavteli
hiba okozta a klnbsget?
Megolds:
Nullhipotzis: nincs klnbsg a kt zsrtartalom kztt H0 : 1 = 2.
Alternatv hipotzis: van klnbsg a kt zsr-tartalom kztt H1 : 1 2.
Ha a mintink elg nagyok, akkor a mintatlagok normlis eloszlsak lesznek. (Nem tl
nagy mintk esetn, az egymints esethez hasonlan, itt is a t-eloszlst kell hasznlni a
normlis eloszls helyett.)
Mintatlag
x1

Vrhat rtke
1

x2

Szrsa
1
n1
2
n2

Ha a mintk fggetlenek, akkor a mintatlagok klnbsge is normlis eloszls. Ha a


12 22
. Pldnkban x1 szrsukat ismerjk, akkor x1 - x 2 vrhat rtke 1-2, szrsa
+
n1 n2
x 2 eloszlsa N(0, (1.04)2).

z emp =

x1 x 2

12
n1

22

n2

0,27 0,24
0,03
=
= 2,886
0,0016 0,0009
0,000108
+
22
25

zkrit = 1,96 a t eloszls tblzatnak szabadsgi fok sora s /2 = 0,025 oszlopbl, mivel
ktoldali alternatv hipotzisnk van. (Ez 5%-os szignifikancia szintet jelent. Esetnkben
zemp > zkrit, teht elutastjuk a nullhipotzist, az eltrs nem a vletlennek ksznhet.
Plda:
Egy vizsglatban arra kerestek vlaszt, hogy vajon a vrosi vagy a falvakban lak kismamk
maradnak-e tovbb otthon gyermekeikkel. Egy nagyvrosban vletlenszeren 20 kismamt
krdeztek meg, a krnyken lev kisebb teleplseken pedig 40-et. A vrosiak tlagosan 26
hnapig, 3 hnap szrssal, a falvakban pedig tlagosan 30 hnapig 4 hnap szrssal.
Szignifikns-e a klnbsg a tapasztalt rtkek kztt?
Megolds:
Nullhipotzis: H0: falusi = vrosi; H1 : falusi > vrosi .
x1 x 2
A megoldshoz a t-prbt alkalmazhatjuk: t =
1 1
Sp
+
n1 n2
Sp =

(n1 1)s12 + (n2 1)s22


n1 + n2 2
Sp =

, ahol

s a szabadsgi fok szma: n1+n2-2.

(n1 1)s12 + (n2 1)s22


n1 + n2 2

39 16 + 19 9
795
=
= 3,702
40 + 20 2
58

x1 x 2
30 26
= 3,945
=
1
1
1 1
+
Sp
+
3,702
40 20
n1 n2
A szabadsgi fok szma 58, s a 95%-os megbzhatsgi szinthez tkrit = 1,672 rtk tartozik.
Mivel temp > tkrit, teht elutastjuk a nullhipotzist, a kisebb teleplseken tovbb maradtak
otthon a kismamk.
t emp =

Pros t-prba
Tegyk fel, hogy egy mintn vizsgljuk valamilyen kezelsnek a hatst. Ilyen esetekben nem
a mintatlagokat hasonltjuk ssze, hanem a kezels eltti s utni rtk klnbsgrl
llaptjuk meg, hogy szignifiknsan klnbzik-e nulltl.
Plda.
Egy lzcsillapt gygyszer hatsossgt vizsgljuk. A betegek hmrsklett ktszer, a
lzcsillapt bevtele eltt illetve utn mrjk meg. A mrt rtkeket s a vltozst a
kvetkez tblzat tartalmazza.
Lzcsillapts
eltt
utn
39,2
38,6
38,7
37,2
37,9
36,8
38,8
37,9

Klnbsg
0,6
1,5
1,1
0,9

39,4
38,2
38,6
38,8
39,0
38,5

38,2
38,0
36,9
37,8
37,9
37,6

1,2
0,2
1,7
1,0
1,1
0,9

Megolds:
A hipotziseket formlisan felrva: H0 : d = 0, H1 : d 0.
A klnbsgek tlaga: d = 1,02 , szrsa sd = 0,42.
Vagyis a nullhipotzis szerint a gygyszer hatstalan. Ettl kezdve mindent gy kell
csinlnunk, mint az egymints prba esetn. Ezek szerint az x d mintatlag eloszlsa
normlis, vrhat rtke 0. A szabadsgi fok esetnkben n-1 = 9, az ehhez s a 95%-os
valsznsghez tartoz t rtk 2,26. Ha igaz a nullhipotzis, akkor temp < tkrit.
x 1,02 0
=
= 7,68
t emp =
0,42
s
10
n
Ez nem teljesl, ezrt elutastjuk a nullhipotzist. Teht azt mondhatjuk, hogy a lzcsillapt
gygyszer hatsos.
Szrsokra, variancikra vonatkoz prbk (F-prba.)
A t-prba trgyalsnl mr volt arrl sz, hogy a prbt mskpp kell elvgezni, ha a kt
sokasg szrsa (szrsngyzete) megegyezik, s mskpp akkor, ha nem. Felmerl a krds,
hogy hogyan lehet eldnteni, hogy a szrsngyzetek megegyeznek-e.
Legyen 21 az els, 22 a msodik populci variancija (szrsngyzete). Ekkor a null- s az
alternatv hipotzisek a kvetkezk lesznek:
H0 : 21 = 22 ,
H1 : 21 22.
Ha H0 igaz, akkor a kt populci szrsngyzetnek hnyadosa 1. Kt minta alapjn
s2
becsljk ezt a hnyadost. A becslst F-statisztiknak nevezzk, ahol F = 12 , s s21 az els,
s2
2
s 2 a msodik minta korriglt tapasztalati szrsngyzete, ahol s1 > s2. Ha ez az F rtk elg
kzel van 1-hez, akkor azt mondhatjuk, hogy az eltrst csupn a vletlen mintavtelbl
szrmaz hiba okozta, gy elfogadhatjuk a H0-t, egybknt pedig elutastjuk. Minl
nagyobbak a mintink, annl jobban megkzelti a mintk szrsngyzete a sokasg
szrsngyzett. Ilyen esetekben az 1-tl csak kis eltrst engednk meg. Ha a mintink
viszonylag kicsik, akkor pedig mg nagyobb eltrs esetn is elfogadjuk a nullhipotzist. Az
is elfordulhat, hogy az egyik minta kicsi, a msik pedig nagy. Ebbl is kitnik, hogy mind a
kt minta elemszmtl fgg, hogy az 1 krli mekkora intervallumban fogadjuk el a H0
hipotzist. Az F-statisztika eloszlsa klnbz minta elemszmok esetn ms s ms lesz.
Hasonlan a t-statisztikhoz, itt is a szabadsgi fok mutatja meg, hogy melyik F-eloszlst kell
vlasztanunk. A kt minta szabadsgi foka (n1 - 1, n2 - 1), ahol n1 az els minta, n2 pedig a
msodik minta elemszma. A tblzatokat ltalban 5%-os szignifikancia szintre kzlik a
klnbz statisztika knyvek.
Plda:

A jvedelmek differencildsval kapcsolatos felmrs alapjn azt talltk hogy egy adott
rgiban az 1000 egyni vllalkoz adbevallsa alapjn a jvedelmek szrsa 15 400 Ft volt.
A kvetkez vben ugyanitt, egy 25 elem vletlen minta alapjn mr 19 100 Ft volt.
Igazolhat-e statisztikailag a jvedelmek differencildsrl szl elmlet?
Megolds:
H0 : 21 = 22 , vagyis a szrsok (szrsngyzetek) megegyeznek.
H1 : 21 22, klnbzek a szrsngyzetek.
s12 19100 2
= 1,538 , a szmll szabadsgi foka 24, a nevez pedig 999. Fkrit = 1,53.
Femp = 2 =
s2 15400 2
Mivel Femp > Fkrit gy a nullhipotzist elvethetjk, a jvedelmek valban differencildtak.
Megllaptsunkat 95%-os megbzhatsgi szinten tettk.
Felhasznlt irodalom
Barth Cs. Ittzs A. Ugrsdy Gy.: Biometria. Mezgazda Kiad 1996
Kiss A. Manczel J. Pintr L. Varga K.: Statisztikai mdszerek alkalmazsa a
mezgazdasgban. Mezgazdasgi Kiad 1983
Kovcs Istvn: Statisztika. Szent Istvn Egyetem Gazdlkodsi s Mezgazdasgi Fiskolai
Kar jegyzete. Gyngys 2000
Kriszt Varga Kenyeres: ltalnos statisztika II. Nemzeti tanknyvkiad 1997.
Fodor Jnos: Biomatematika http://www.univet.hu/users/jfodor/index_h.html
Meszna Gyrgy Ziermann Margit: Valsznsgelmlet s matematikai statisztika
Kzgazdasgi s Jogi Knyvkiad 1981
Murray R. Spiegel: Statisztika. Elmlet s gyakorlat. Panem McGraw Hill 1995
Szcs Istvn: Alkalmazott statisztika. Agroinform Kiad 2002

You might also like