You are on page 1of 62

Biostatisztika

Biostatisztika
Sndor Jnos, dny Rza

A kiadvny a kvetkez program keretben jelent meg:


TMOP-4.1.2-08/1/A-2009-0054

A kzirat lezrva: 2011. janur 31.

Lektor:
Dr. Bres Judit, Dr. Bdecs Tams

A kiadsrt felel a Medicina Knyvkiad Zrt. igazgatja

Medicina Knyvkiad Zrt Budapest, 2011


Dr. Sndor Jnos, Dr. dny Rza, 2011

Felels szerkeszt: Pobozsnyi gnes


Mszaki szerkeszt: Dczi Imre
brk szma: 22
Az brkat rajzolta: Olgyai Gza
Terjedelem: 11 (A/5) v
Azonossgi szm: 3598

Tartalomjegyzk

Elsz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Ksrletek s megfigyelsek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
A nem ler jelleg vizsglatok fbb lpsei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
A vltozk tpusai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Dichotm, binris adatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Nominlis skln mrt adatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Ordinlis skln mrt adatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Intervallumskln mrt adatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Arnyskln mrt adatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Ler statisztika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Hisztogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Centrlis rtk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Szrds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Szabadsgi fok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Normlis eloszls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Megbzhatsgi tartomny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Hipotzistesztels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Dntsi kszb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Els- s msodfaj hiba . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Statisztikai tesztek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Csoportok kztti sszehasonlts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Kt csoport kvantitatv adatainak sszehasonltsa . . . . . . . . . . . . . . . . . . . . . . . . 41
Tbb csoport kvantitatv adatainak sszehasonltsa . . . . . . . . . . . . . . . . . . . . . . 47
Csoportok kvalitatv adatainak sszehasonltsa . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Vrhat rtk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Csoportok kzti klnbsg elemzse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Prba rendezett kvalitatv adatok elemzse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Folytonos vltozk kztti kapcsolat elemzse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Korrelci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Lineris regresszi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5

Biostatisztika

Determincis koefficiens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Nem paramteres prbk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Eljelteszt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Wilcoxon prostott teszt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
MannWhitney U-teszt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
KruskalWallis H-teszt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
Spearman-rangkorrelci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Tbbvltozs elemzsek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Ktszempontos varianciaelemzs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
Tbbvltozs lineris regresszi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Oksgi sszefggsek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Az ok-okozati kapcsolat irnya . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Koch-posztultumok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
Hill-szempontrendszer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

Elsz
Azok a hallgatk, akik orvos- s egszsgtudomnyi terleten folytatjk tanulmnyaikat, meglehets tvolsgtartssal viszonyulnak a biostatisztikhoz. Ez a vilg minden
rszn gy van, s egyltaln nem meglep, ha a kt tudomnyterlet gondolkodsmdjnak igen lnyeges eltrseibe belegondolunk. Nem is lehet relis cl, hogy megszerettesse valaki a biostatisztikt ebben a hallgati krben. De
Az orvos- s egszsgtudomnyi terleten hihetetlen mennyisgben keletkeznek
kutatsi eredmnyek, amelyek alapjn a szakembereknek sajt gyakorlatukat folyamatosan fejleszteni kell. Ehhez elengedhetetlen, hogy valamilyen szinten rtsk a szakterletkn megjelen j eredmnyeket elllt vizsglatok bels logikjt, s pontosan tudjk rtelmezni azok vgeredmnyeit. Ez elkpzelhetetlen korrekt biostatisztikai
ismeretek nlkl.
Az orvos- s egszsgtudomnyi terleten dolgoz szakembereknek meglehetsen
nagy szabadsga van munkahelykn a rjuk bzott terleten a gyakorlat formlsban.
Sok dntst kell nllan meghozniuk. Elny, ha kpesek a felmerl problmkra tnyeken alapul megoldsokat javasolni. Ehhez sokszor a sajt munkval kapcsolatban,
sajt munkahelyen keletkez adatok korrekt feldolgozsa szksges. Ez elkpzelhetetlen korrekt biostatisztikai ismeretek nlkl.
Az orvos- s egszsgtudomnyi terleten dolgoz szakembereknek egyre gyakrabban kell bizonytaniuk, hogy az a gyakorlat, amit kvetnek, hatkony. Ilyen feladatokat
csak akkor tudnak sznvonalasan elltni, ha rendszeresen monitorozzk sajt tevkenysgket, s a sajt teljestmnyt ler adatokat korrekt mdon prezentljk. Ez is elkpzelhetetlen korrekt biostatisztikai ismeretek nlkl.
A tapasztalat az, hogy az orvos- s egszsgtudomnyi terleten dolgoz szakemberek gyakorlati problmk kezelsekor nem hasznljk kell gyakorisggal a statisztikai
eszkzket, mert nem ismerik kellen ket. Ha ptolni akarjk a hinyossgaikat, akkor
pedig mr a biostatisztikai knyvek bevezet fejezetnl feladjk a kzdelmet a teljesen
idegen terminolgia miatt.
Ugyanakkor sok a statisztikai szmtgpes program, amelyek hasznlata bizonyos
szinten egyre egyszerbb, s egyre tbb az elektronikus adatbzisokba rendezett adat
is az orvos- s egszsgtudomnyi terleten. Nagy a csbts a kt lehetsg sszekapcsolsra. Sok fligazsg, flrevezet statisztika szlethet, ha ezek a lehetsgek nem
prosulnak a biostatisztikai alapelvek ismeretvel.
7

Biostatisztika

A jegyzet arrl szeretn meggyzni a hallgatkat, hogy nem lehetetlen vllalkozs a


biostatisztikai alapelvek s a legalapvetbb eljrsok menetnek megrtse, mg akkor
sem, ha valaki nem vonzdik a matematikhoz.
A jegyzet nem elriasztani akar, ezrt nem elmleti ignnyel, nem a valsznsgszmts elvont alapjairl indtott magyarzatokkal, hanem ahol lehet, a biostatisztikai
eljrsok szemlletes rtelmezsre trekedve prbl gyakorlati jelentsggel br ismereteket tadni; s taln btortja az elmlyltebb, teoretikusan jobban megalapozott
tanulmnyokra a fogkonyabb hallgatkat.
A jegyzet a hallgatk elkpzettsghez igazod, de a majdani szakemberek feladatait is szemmel tart kompromisszum eredmnye. De biztosan nem knny olvasmny!
Sajnos ignyli az elmlylt feldolgozst, egy-kt gyors tolvass helyett az alapos tanulmnyozst.
Debrecen, 2011.

Ksrletek s megfigyelsek

Ha olyan vizsglatot vgznk, aminek rsze a statisztikai rtkels, ltalban egy specifikus krds (vagy mskppen hipotzis) megvlaszolsa a clunk. Ezek a krdsek
(hipotzisek) felrhatk egy befolysol tnyez s egy kivltott hats kzti kapcsolatknt: van-e hatsa az adott befolysol tnyeznek az adott paramterre. A befolysol
tnyez az egszsgtudomnyok terletn lnyegben brmilyen, a szervezetre hatssal
lev faktor lehet. A kivltott hats pedig tulajdonkppen brmilyen biolgiai, klinikai
paramter.
A krdsekre adott vlaszhoz szksges adatokat alapveten kt mdszerrel lehet
sszegyjteni. Egyfell lehetsg van arra, hogy a vizsgl hozza ltre az expozcit
(pl. szvettenyszetben dziscsoportokat alakt ki, llatksrletben kezelt s nem kezelt
csoportokat hoz ltre; klinikai vizsglatban kezelt s placebocsoportba sorolja a betegeket), s a vizsglati krlmnyeket is megprblja szablyozni. Ilyenkor ksrletrl,
experimentlis vizsglatrl beszlnk. Msfell vannak vizsglatok, ahol nem befolysoljuk a rsztvevk viselkedst, nem mi hozzuk ltre a vizsglati krlmnyeket. Az
adatgyjts ilyen esetben a tlnk fggetlenl zajl folyamatok megfigyelsn alapul.
Orvostudomnyi, egszsgtudomnyi tudsunk egyik legfontosabb forrsa a nem
humn rendszerekben elvgzett ksrlet. In vitro ksrletekben, szvettenyszetekben
vagy llatksrletekben pontosan kezelhet s szablyozhat a kls expozci nagysga. St, a clszervi dzis is mrhet, hiszen lnyegben nincsenek korltjai az invazivitsnak. A kialakul biolgiai elvltozs, betegsg igen rszletesen, invazv mdszerek
felhasznlsval vizsglhat. A ksrlet sorn a folyamatban rsztvev biolgiai rendszerekre hat egyb tnyezk hatsa kontrolllhat. A genetikai httr zavar hatsait
megfelelen kivlasztott llattrzsekkel jelentsen cskkenteni lehet. A vizsglatokban
elvileg nagyszm llatot is fel lehet hasznlni, de erre gyakran nincs szksg, hiszen a
ksrletekben a biolgiai folyamatok termszetes variabilitsa szk tartomnyon bell
tarthat. Ilyenkor pedig kis hatsok is jl kimutathatk viszonylag kevs llat felhasznlsval. De ha szksges, az llatszm nvelsvel a precizits javthat.
Az ilyen ksrletekben magas dzisokat hasznlnak, hogy a biolgiai vlasz nagy
szzalkban fellpjen, illetve a vlasz knnyen mrhet nagysg legyen. Ezrt, ha a ksrleti eredmnyeket humn viszonyok megrtsre akarjuk felhasznlni, szmolnunk
kell a kvetkez problmkkal: (1) a humn expozcik ltalban nagysgrendekkel
9

Biostatisztika

Ksrletek s megfigyelsek

alacsonyabbak, mint a ksrletekben alkalmazott dzisok, (2) a ksrleti rendszer s az


ember biolgiai alapstruktri jelentsen klnbzhetnek. Ezeknek megfelelen a ksrletes adatok humn felhasznlsakor kt extrapolcival lnk: (1) a magas ksrleti
dzisok hatsai alapjn becsljk az alacsony dzisok hatsait, s (2) nem humn rendszerben mrt adatokbl kvetkeztetnk a humn hatsokra.
Amikor megfigyelsen alapul humn vizsglatokkal prblunk a betegsgek patolgiai alapjainak termszetrl adatokat szerezni, alapveten ms vizsglati helyzetben
talljuk magunkat. Itt a vizsglt szemlyek kls expozcija csak ritkn adhat meg
pontosan, a clszervi dzisok meghatrozsnak pedig korltot szab az invazv vizsglatok korltozott hasznlata. Az expozcik hatsainak detektlsa az invazv vizsglatok korltozott hasznlhatsga, a hossz ltenciaid s a vizsglt szemlyekkel
kapcsolatos nyilvntarts adminisztratv problmi miatt sokszor nem pontos. A zavar
tnyezk kontrolllsa sokszor csak rszben, kzelt mdszerekkel oldhat meg. A
genetikai httr sokflesge jelents hibval terhelheti a vizsglatot (br vannak olyan

vizsglati elrendezsek, ahol ezzel gyakorlatilag nem kell szmolnunk, pldul ikervizsglatok esetn). A humn megfigyelsen alapul vizsglatokhoz gyakran nagy mintt kell sszelltani. Ez knyszer, hiszen csak gy ellenslyozhatk azok a kzelt
jelleg becslsekbl add hibk, amiket az elbb emltettnk. Ha a vizsglatot sikerl
gy kivitelezni, hogy a felsorolt hibaforrsok ltal okozott torztsok bizonyos korltok
kztt maradjanak, akkor az eredmny extrapolcik nlkl alkalmazhat, azaz (szemben a nem humn rendszerbl szrmaz adattal) kzvetlenl humn relevns.
A fenti rtelemben teht a ksrletes s megfigyelsen alapul vizsglatok kiegsztik egymst (1. tblzat). Ennek j pldja, hogy az egyes kmiai anyagokat csak akkor
soroljk a bizonytottan a humn karcinognek kz, ha ehhez mind a ksrletes, mind
pedig az epidemiolgiai bizonytkok rendelkezsre llnak.

1. tblzat. Ksrletes s epidemiolgiai vizsglatok elnys s htrnyos tulajdonsgokbl add kiegszt termszete
Ksrlet

Megfigyels

Kls dzis

Bellthat, szablyozhat

Nehz pontosan becslni

Clszervi dzis

Kzvetlenl mrhet

ltalban nem mrhet

Korai biolgiai vlasz

Invazvan vizsglhat

Indirekt markerekbl becslhet

Kifejldtt hats

Rszletesen vizsglhat

Diagnosztikus tvedsek,
nyilvntartsi hibk miatt
korltozott pontossg

Zavar tnyezk

Effektven kontrolllhat
a vizsglati elrendezsben,
kzvetlenl, invazvan
mrhet

A vizsglati elrendezsben,
adatfeldolgozsban kezelhet, de
gyakran csak indirekten mrhet

rzkenysgbeli
variabilits

Kezelhet (a kezelsi
csoportokban azonos
rzkenysg biztosthat)

Nehezen kezelhet

Vizsglt minta
nagysga

ltalban kis esetszmok

ltalban nagy mintk

Humn relevancia

Indirekt

Direkt

10

A nem ler jelleg vizsglatok fbb lpsei


A vizsglatok mindig gyakorlati jelentsggel br problma megoldsra irnyulnak.
Annak a problmakrnek a jelentsgt, aminek az egyik rszre fkuszl a vizsglati
krds, alapveten a problma elfordulsnak gyakorisgval, az egszsgkrosods
rintettek kzti slyossgval, illetve az intervencis (preventv vagy gygyt) potencillal (van-e relis megelzsi lehetsg, milyenek a gygyts lehetsgei) tudjuk lerni.
A munkja sorn mindenki szembesl megoldatlan krdsekkel. Ezek lehetnek alapvet biolgiai folyamatokra vonatkoz, nagyon nehz alapkutatsi feladatok (Milyen
mdon lehet a daganatok kemoterpijt clszvet-specifikusabb tenni?), de lehetnek
egszen egyszer, a napi munkval kapcsolatos, gyakorlati jelleg krdsek. (A rgebben vagy az jabban hasznlt ferttlent szer mellett alakul ki kevesebb sebfertzs?) A
vizsglatok alapveten mindegyik esetben ugyanazokat az elemi lpseket tartalmazzk.
A nem ler jelleg vizsglatok alapkrdse mindig egy ok-okozati sszefggsre
vonatkozik. A kutatsi krds akkor kellen specifikus, ha abban mind a felttelezett
ok (befolysol tnyez, expozci), mind pedig a vizsglat kzppontjban ll kivltott hats pontosan azonosthat. A kivltott hats szleskren rtelmezend: gyermekek elhzsa, HiB okozta hallozs, dohnyzs gyakorisga, influenzajrvny idejn
az idskorak hospitalizcija, foglalkozsi tdrk, hipertniagondozs hatkonysga,
emlrk okozta hallozs, stroke-betegek hallozsi eslye. A vizsglt befolysol tnyezk is hasonlan nagyon klnbz termszet tnyezk lehetnek: iskolai egszsgfejlesztsi program, tmeges vdolts, alacsony trsadalmi gazdasgi sttusz, in
11

Biostatisztika

Ksrletek s megfigyelsek

1. bra. Vizsglati modellek egy zavar tnyezvel

Lnyegben az gy kapott sszefggsrendszer tartalmazza az ltalunk feltett krds


krnyezetrl eddig rendelkezsnkre ll tudst. Ennek a modellnek a felvzolsval
sszegezzk az eddigi ismereteket. A modell pontos fellltsa azrt meghatroz jelentsg, mert a vizsglat sorn a modell elemeire kell majd adatot gyjteni.
A zavar tnyezk hatstl valamilyen mdon meg kell tiszttani a vizsglatunkat.
(Kontrolllni kell a zavar tnyezket.) Megfigyelsen alapul vizsglatok esetn lehetsgnk van arra, hogy a zavar tnyezkre vonatkozan adatot gyjtsnk, s hatsukat a statisztikai elemzs sorn semlegestsk. A ksrletek sorn pedig olyan vizsglati
krlmnyeket hozunk ltre, hogy a kezelt s a kontrollcsoport tnylegesen csak a vizsglt befolysol tnyez szempontjbl klnbzzn.
Az adatgyjts sorn arra kell trekedni, hogy a valsgot minl pontosabban tkrz adatbzist kapjunk, aminek az a feladata, hogy a vizsglatunk szmra szmszeren
rja le a vals viszonyokat.
Ezt kveten kerl sor a vizsglati krdsnknek megfelel hipotzis tesztelsre.
Ez tulajdonkppen abbl ll, hogy kiszmtjuk annak a valsznsgt, hogy a valsg
tnyei a mi ltalunk felttelezett sszefggsnek megfelelen jnnek ltre. Statisztikai
eszkzk segtsgvel lerjuk a hipotzis s a valsg kzti sszhang mrtkt, s vlemnyt alkotunk a hipotzis helytllsgrl.

fluenzafertzs, nikkel tartalm fst bellegzse, orvosi team kpzsnek sznvonala,


szrprogram szervezsi mdja, intenzv osztly felszereltsge.
Ha csak a befolysol tnyezre s a kivltott hatsra gyjtnk adatot, akkor a biolgiai folyamatok bonyolultsga miatt nem fogunk jl hasznlhat vlaszokat kapni.
Pldul ha az alapkrdsnk az, hogy a jelents alkoholfogyaszts nveli-e a tdrk
kialakulsnak kockzatt, s csak az alkoholfogyasztsra s a tdrk jelenltre gyjtnk adatot, akkor az elemzsnk megmutatja, hogy az alkoholistk kzt gyakrabban
alakul ki a tdrk, mint a nem alkoholistk kzt. Ezt viszont nem tudjuk az alkohol
karcinogn hatsnak bizonytkaknt elfogadni, hiszen nyilvnval, hogy az alkoholistk tbbet is dohnyoznak, mint a nem alkoholistk, s kztk a tdrktbbletet a tbb
elszvott cigaretta is okozhatja. Ebben az esetben a dohnyzs (ami a vizsglt befolysol tnyezvel, az alkoholfogyasztssal sszekapcsoldik, s a vizsglt betegsgnek
nmagban is rizikfaktora) zavar tnyez. A zavar tnyez is sokfle faktor lehet
az alapkrdstl fggen: a csald tkezsi szoksai, fertzbeteg-ellts fejlettsge,
dohnytermkek reklmozsnak szablyozsa, influenza elleni vdolts elrhetsge,
munksok dohnyzsi szoksai, hipertnis betegek kpzettsge, korbbi terhessgek
szma, lakhely s intenzv ellt szkhelye kzti tvolsg.

2. bra. A vizsglatok lpsei

12

13

Biostatisztika

Biostatisztika

A vizsglatok sorn gyjttt adatok sohasem tkrzik pontosan a valsgot. Ennek


megfelelen, a statisztikai rtkelst kveten meg kell vizsglnunk, hogy az adatgyjts mennyire volt j, az adatbzis s a belle szmtott statisztikai eredmny mennyire
megbzhat, azaz valid. A validitst a minta megfelelsge, a zavar tnyezk megfelel kontrollja s a mrsek megbzhatsga mentn rtkeljk.
Ha az elrt eredmnyek a vizsglt kapcsolat megltt vagy hinyt meggyzen bizonytjk, akkor a kapcsolat ok-okozati jellegt kln kell rtkelni. (Ha kt jelensg
kapcsoltan fordul el, az mg nem bizonytja, hogy valamilyen mechanizmus rvn az
egyik befolyssal van a msik alakulsra. Lehet, hogy mindkt paramterre hatssal
van egy harmadik tnyez, ami ltszlagos kapcsolatot eredmnyez kztk.)
Ha a statisztikai rtkels utn a validits rtkelse kellen megbzhatnak minsti
a vizsglatot, akkor kerl sor annak rtkelsre, hogy a sajt eredmny mennyire terjeszthet ki, milyen mrtkben generalizlhat.
Mindezek utn tudunk vlaszolni a vizsglat alapkrdsre: van-e ok-okozati kapcsolat a befolysol tnyez s a kivltott hats kzt. Az ilyen mdon megalapozott,
kellen megbzhat vlasz birtokban tudunk konkrt kvetkeztetseket levonni a vizsglat alapjt jelent gyakorlati problmval kapcsolatban. J esetben gyakorlati beavatkozsokat tudunk megalapozni a krltekinten kivitelezett vizsglat rvn.

A vltozk tpusai
Vizsglatok sorn vagy ksrlet sorn generlt, vagy megfigyelsek sorn rgztett adatokat gyjtnk ssze. Az adatokat adatbzisba rendezzk, amelynek a feladata a valsg
szmszer lekpezse.
Az egyes jelensgeket klnbz mrsi technikkkal, klnbz sklkkal lehet
mrni. Ennek megfelelen klnbz termszet adatokat fogunk kapni. Egyes mrsek nagyon rszletesen mutatjk be a vizsglt jelensget, mg msok durvbb kpet
adnak csak. A mrsi technika megvlasztsa a vizsglatok tervezsi fzisnak feladata.
Fontos dnts ez, hiszen az adatgyjts ez alapjn zajlik majd, s ez fogja meghatrozni
a statisztikai feldolgozs sorn alkalmazhat mdszereket.
Az adattpusok kzt hierarchia rtelmezhet, amennyiben a legegyszerbb tpusok
ltal hordozott informci mindig elllthat a hierarchiban felette llkbl (3. bra).
Fordtott irnyban ez lehetetlen. A tervezskor ezrt clszer vatosnak lenni, s ktsg
esetn inkbb kicsit informatvabb adattpus mellett kell dnteni, ha erre lehetsgnk
van. Reduklni lehet majd az adattpust, de ha az adatgyjts sorn egyszerbb formt
hasznlunk, s a feldolgozs sorn derl ki, hogy rszletesebb adatra lenne szksgnk
ahhoz, hogy meg tudjuk vlaszolni az alapkrdsnket, akkor mr csak a vizsglat jrakezdse ll nyitva elttnk. Ezt a nyilvnval hibt (pazarlst) el kell kerlni!

Dichotm, binris adatok


A legegyszerbb adatgyjts az, amikor a vizsglat rsztvevje esetben egy tulajdonsg
megltt vagy hinyt kell megllaptanunk. A krdsnk mindsszesen annyi, hogy valaki lzas-e vagy nem, dohnyzik vagy nem, hipertnis-e vagy nem, elhzott-e vagy nem.
Ugyanezek a kategrik megfogalmazhatk egymst klcsnsen kizr pozitv megfogalmazsok rvn is. Azaz beszlhetnk lzas s norml hmrsklet rsztvevkrl,
dohnyzkrl s nem dohnyzkrl, hipertnisokrl s normotenzvekrl. s vannak
dichotm kategrik, amelyeknl eleve csak pozitv megfogalmazsokkal adjuk meg a
kategrik nevt: a nem lehet frfi vagy n, a lakhely jellege lehet vidki vagy vrosi.
Ez az adattpus kvalitatv jelleg. Csak gyakorisgi mutatk segtsgvel sszegezhetek. A rsztvevk nemi arnya, a dohnyzs prevalencija, a hipertnia kialakulsnak kumulatv incidencija lehet a mintkat bemutat ler statisztika.
14

15

Biostatisztika

Biostatisztika

Nominlis skln mrt adatok

A sorba rendezs lehetsge miatt ennl az adattpusnl, a gyakorisgok megoszlsn tlmenen, mr sszegezhetk a vizsglati eredmnyek medin s kvantilisek segtsgvel is.

Ha a mrsi sklnkon kettnl tbb, egymst kizr kategrink van, akkor az adatunk mr tbb informcit hordoz, a dichotm vltozkhoz kpest rszletgazdagabban
mutatja be a vizsglt jelleget. Ha ezek a kategrik nem rendezhetk valamilyen elv
alapjn sorrendbe, akkor nominlis adatrl beszlnk. Pldul csaldi llapot (hajadon,
hzas, elvlt, zvegy), foglalkozs, vallsi irnyultsg mrsre alakthatunk ki kategrikat. A kategrik egyikbe, s csak az egyikbe be kell tudnunk sorolni minden vizsglati alanyt. Ez a kvalitatv jelleg adattpus is csak gyakorisgi mutatk segtsgvel
sszegezhet. A rsztvevk csaldi llapotnak megoszlsa, az egyes munkahelyeken
dolgozk rszarnya, az egyes vallsi csoportokhoz tartozk arnya a mintban lehet a
mintkat bemutat ler statisztika.
Termszetesen a kategrikat valamilyen meggondols alapjn sszevonhatjuk, az
adatot dichotm formba hozhatjuk, ezltal reduklhatjuk az informcitartalmat (pl. csaldi llapot esetben definilhatunk egyedl l s trsas kapcsolatban l csoportot).

Ordinlis skln mrt adatok


Amennyiben kettnl tbb, egymst klcsnsen kizr kategrit definilunk a sklnkon, olyan mdon, hogy a kategrik sorba rendezhetk, akkor tovbb bvtettk az
adataink informcitartalmt. Ilyen skla mrheti a kpzettsgi kategrikat, lerhatja
az jszltt szlets utni llapott (Apgar score) vagy a koponyasrls utni klinikai
sttuszt (Glasgow Coma Scale, GCS).
Ordinlis skln mrt adatok esetben a sorrendisg ellenre is csak kvalitatv adatrl
beszlhetnk. A kategrik egymshoz viszonytott tvolsga ugyanis nem egyforma.
Ezrt nem is szerencss, ha az adatokat szmknt kdolt formban rgztjk az adatbzisban. Pldul az a ltszat keletkezhet, hogy az 1-gyel kdolt kpzettsg vizsglati
rsztvev fele olyan kpzett, mint a 2-vel kdolt, s harmadannyira, mint a 3-mal kdolt, ami termszetesen nem igaz. (A tapasztalat szerint figyelmetlen feldolgozs sorn
kvantitatv adatknt kerlhet felhasznlsra az adat!)
Ennl az adattpusnl definilhatunk olyan dichotomizlsi kszbt, ami felett s alatt
egyestve a kategrikat, dichotm adatt reduklhatjuk az eredeti eredmnyeinket (pl.
megklnbztethetnk felsfok vgzettsggel rendelkezket s azzal nem rendelkezket
az adatbzisban lv, a kpzettsgi szintet rendezett kategrikkal mr adatok alapjn.)
16

Intervallumskln mrt adatok


Ha olyan sklt alkalmazunk, amelyik sok sorba rendezhet kategrit tartalmaz, s a
sorba rendezett kategrik kzti klnbsg lland, akkor mr kvantitatv jelleg az
adatunk. A kategrik miatt diszkrt adatrl beszlhetnk (pl. a testhmrsklet rtkt
1 Celsius fokos pontossggal mrjk, s az 1 Celsius fokos szles kategrik egyikbe
soroljuk be a vizsglatban rsztvevket). Ha finomtjuk a mrsnket, javul a mrsi
pontossg, szklnek a kategrik. Bizonyos mrsi pontossg elrse utn mr nincs
rtelme kategrikrl beszlni, hiszen gyakorlatilag brmilyen rtk lehet a mrs eredmnye. Ez a vltoz mr folytonos termszet. (A diszkrt, csak bizonyos rtkeket
felvev s a folytonos vltoz kzti megklnbztetsnek nincs elmleti alapja. Gyakorlati szempontokat figyelembe vve, a konkrt vizsglati helyzethez kell igaztani a
dntsnket, hogy adott vltozt minek tekintnk. A besorols termszetesen nem ncl, hanem azt hatrozza meg, hogy milyen statisztikai eszkzzel lehet majd az adatot
rtkelni. Ha llst kell foglalni a kt vltoztpus kzti hatrrl, akkor valsznleg gy
nem tvednk, ha a tbb mint 20 kategriba sorolt vltozkat kezeljk folytonosknt.)
Az intervallumskla az egyes mrsi eredmnyek kzti tvolsgot rtelmezhetv teszi. Ezltal lehetsgnk van a vizsglati eredmnyek sszegzsre tlagrtk s szrs
segtsgvel is. Az intervallumskln azonban nincs kitntetett kezdpont, ezrt nem
rtelmezhet az egyes eredmnyek hnyadosa. A testhmrsklet-cskkens egy kezels hatsra kt mrsi eredmny kzti klnbsgknt rtelmezhet. De nincs semmi rtelme arrl beszlni, hogy hny szzalkkal cskkent a testhmrsklet a kezels sorn.
Az intervallumskln bell termszetesen definilhatunk ordinlis kategrikat, ezltal
reduklhatjuk kvalitatv jellegv az adatunkat. St, ha egy dichotomizlsi kszbt
hatrozunk meg, akkor a legegyszerbb dichotm adatot is elllthatjuk.

Arnyskln mrt adatok


Ha olyan intervallumskln mrnk, aminek van kezd pontja, azaz, ahol a 0 rtk rtelmezhet, akkor arnysklnk van. Ez is lehet diszkrt vagy folytonos a mrsi pontos 17

Biostatisztika

Biostatisztika

sgtl fggen. Az adatokat itt is tlag s szrs segtsgvel tudjuk sszegezni. Ebben
az esetben viszont mr nem csak a mrsi eredmnyek klnbsgeit tudjuk rtelmezni,
hanem azok arnyt is. A tllsi idk elemzsekor rtelmezhet az, hogy mennyi idvel lett hosszabb a tlls egy j eljrs bevezetse utn, de az is, hogy hnyszorosra
ntt a tllsi id.
Az adattpus meghatrozza az alkalmazhat statisztikai eljrst. Gyakran van arra
szksg, hogy adatainkat az eljrs ignyeihez igaztsuk. Az adattpusok hierarchija
hatrozza meg ilyenkor a lehetsgeinket. Csak az egyszersts irnyba tudunk talaktani. Ez pedig kategrikba sorolssal, illetve kategriahatrok definilsval egyenrtk.
A kategriahatrok, illetve a dichotomizlsi kszbk kijellse trtnhet valamilyen biolgiailag, klinikailag definilt normlrtk segtsgvel (a tnylegesen mrt
vrnyomsrtkek helyett hasznlhatjuk a hipertnis, normotenzv, vagy ennl rszletesebb beosztsokat, amikhez a hatrrtkeket a prognosztikai vizsglatok eredmnyei
alapjn hatroztk meg). Ha erre nincs lehetsg, akkor statisztikai eszkz segtsgvel
prblkozhatunk, kszbrtk-definilssal. Pldul a kontrollcsoportban megfigyelt
eloszls alapjn hatrozhatunk meg dichotomizlsi kszbt (egy jszer laboratriumi adat esetn, aminek mg nem ismert pontosan a klinikai jelentsge s a norml
tartomnya, a kontrollcsoport 97,5 percentilis rtkt hasznlhatjuk kszbknt, ha a
magas rtk tnik krjelznek, s a 2,5 percentilist, ha az alacsony.

Ler statisztika

3. bra. Statisztikai vltozk legalapvetbb tulajdonsgai


18

A ksrleteken vagy megfigyelsen alapul vizsglatok eredmnyeinek rtkelsekor


statisztikai eszkzk segtsge nlkl nem tudunk kvetkeztetseket levonni. A vizsglatok sorn keletkez adatokbl levont kvetkeztetsek nem csak a statisztikai elemzsek eredmnyeire tmaszkodnak, de a megalapozott statisztikai kvetkeztetsek nlkl
nem lehet a vizsglatok vgn rdemi konklzira jutni. Mirt ktelez elemei a j biostatisztikai elemzsek minden kutatsi, vizsglati projektnek? A vlasz tulajdonkppen
roppant egyszer, ha vgiggondoljuk azt a kt problmt, amivel akkor szembeslnk,
ha egy kutatsi krdst kell pontossggal meg szeretnnk vlaszolni.
Az egyik az, hogy akrmilyen krltekinten is jrunk el a vizsglati minta sszelltsakor, s akrmennyire is treksznk az elemszmnvelsre, soha nem tudunk azon
az elvi korlton tlpni, amit a minta s a populci kzti hatrvonal jelent. A populci
egszre jellemz, teht a valsg tnyleges paramtereinek a megismersre treksznk (azt szeretnnk tudni, hogy mennyi az egszsges emberek vrsvrtestszma,
milyen szoros a kapcsolat az elhzs s a vastagblrk kialakulsnak kockzata kztt
stb.), de csak a valsg egy kis szelett jelent mintt tudjuk tnylegesen megvizsglni.
A minta soha nem tudja pontosan megjelenteni a valsgot, ezrt a kvetkeztetseink
soha nem teljesen pontosak.
A msik problma, hogy az l szervezet rendkvl bonyolult. Nagyon sok tnyez egyttmkdse rvn llnak el a legelemibb jelensgei is. A vrnyoms egyszer
lettani paramter. Ha meg akarjuk rteni, hogy valakinek mirt ppen annyi a vrnyomsa, amennyit mrtnk, akkor szembeslnk azzal, hogy ha csak a mr megismert
szablyoz rendszereket, s az ezekre hat kls tnyezk egymsra hatst szeretnnk
sszefoglalni, akkor is sz szerint csak a knyvtrakban trolt, egy ember ltal mr valban ttekinthetetlen szakirodalmat kellene ismernnk. Ehhez az is hozzjrul, hogy
mg a vrnyomssal kapcsolatban sincs olyan rzse senkinek, hogy majdnem mindent
tudunk rla (kell mg hely a knyvtrban a jvben feltrt ismereteknek).
A legegyszerbb szervezetek elemi tulajdonsgai is sok folyamat eredjeknt alakulnak ki. Ennek kvetkeztben a mrhet tulajdonsgok vltozatos rtkeket mutatva
jelennek meg. Ha krdsnk van ezekkel a tulajdonsgokkal kapcsolatban, pldul azt
szeretnnk tudni, hogy milyen szoros a kapcsolat az elhzs s a vastagblrk kialakulsnak kockzata kztt, akkor jelents vltozkonysgot mutat testtmegindex s
19

Biostatisztika

Biostatisztika

egymstl jelents mrtkben eltr, egyni megbetegedsi kockzatot hordoz emberek adatai alapjn kell vlaszt adnunk. gy, hogy nem is tudjuk mrseinkkel lefedni
az sszes olyan tnyezt, ami alaktja a testtmeget s a megbetegedsi kockzatot.
Egyfell a forrsok elgtelenek arra, hogy minden ismert befolysol tnyezt tnylegesen mrjnk, msfell nem is ismernk minden tnyezt. Ha akarnnk, se tudnnk
teht mindenre kiterjed vizsglatot vezetni, amiben matematikai sszefggsek rvn
s hiba nlkl tudnnk lerni a folyamatok dinamikjt s vgeredmnyt.
Rviden sszefoglalva, olyan a vilg, hogy nem lehet benne a jelensgeket minden
rszlet vonatkozsban megismerni, s el kell fogadnunk, hogy ezek a jelensgek vltozatos formban vesznek minket krl.
Keznket feltartva mgsem adhatjuk fel, hogy az emberi szervezet mkdsre vonatkoz krdsekre vlaszoljunk, mert azt azrt valamilyen mdon el kell rnnk, hogy
ha nem is teljesen, de minl jobban rtsk az egszsges s a beteg szervezet mkdsi
sajtossgait. Hiszen a betegeket szeretnnk gygyultan, az egszsgeseket pedig minl tovbb egszsgesnek ltni. Ehhez pedig tudomnyosan megalapozott ismereteken
nyugv eljrsok alkalmazsra van szksg.
A megrts knyszere s a jelensgek vltozkonysga ltal berendezett terepen akkor tudunk elrehaladni, ha tmegjelensgknt kezeljk a vrnyomst, a csontok kalciumtartalmt, a daganatos betegsgek 5 ves tllst, az inzulinszrum koncentrcijt. Tmegjelensgknt, amelyet nem mutat egy pontos rtk (mint a fnysebessg
esetben), hanem vltozkony. Emiatt nem egyszeri (de nagyon pontos) mrssel lehet
ket meghatrozni, hanem a szrdsuk meghatrozsval. Utbbi feladatra dolgoztk
ki a statisztikai mdszereket. Ezek a vizsglati eszkzk teszik lehetv, hogy lerjuk
a biolgiai tulajdonsgokat azok szrdsnak bemutatsn keresztl, s kapcsolatot
keressnk a klnbz tulajdonsgok kztt, vagyis megrtsk, hogy az egyes tulajdonsgok vltozkonysga miknt kapcsoldik a msik jelensg vltozkonysghoz.
A jelensgek szrdsnak bemutatsa a legelemibb statisztikai feladat, amit meg kell
oldani az elemzseink sorn. Aztn majd erre lehet felpteni azokat a vizsglatokat,
amik sszefggst keresnek szintn statisztikai eszkzkkel a szrdst mutat jelensgek kzt.
A gondolatmenet zrsaknt meg kell jegyezni, hogy a vizsglataink tervezsekor
igyeksznk olyan krlmnyeket teremteni, hogy a vizsglt jelensgek vltozkonysga minl kisebb mrtkben korltozzon minket, minl szkebb legyen a variabilits.
A vizsglati krlmnyek kzt megmarad teljes vltozkonysgot aztn alapveten
kt rszre bontjuk: az egyik rsz, ami a nem ismert s az ppen kivitelezett vizsglatban nem figyelt folyamatok rvn ll el; a msik, ami a mr ismert, s a vizsglatban

tekintetbe vett folyamatokkal kapcsolatos. Utbbi vltozkonysgi forrst prbljuk


a vizsglatokban kiiktatni, hogy minl kisebb legyen a nem magyarzott rsze a variabilitsnak. Ezen a mdon javul a kpessgnk arra, hogy megvlaszoljuk vizsglatunk alapkrdst. A ksrletek vgzsekor arra treksznk, hogy a bonyolult rendszer legmeghatrozbb elemeit standardizljuk (azaz minden vizsglati alany szmra
azonos krlmnyeket teremtsnk, a kezelsi csoportok kzti eltrsek vizsglatakor a
variabilits forrsa csak a nem standardizlt tnyezk hatsaibl addjon). Megfigyelsen alapul vizsglatok alkalmval pedig ltalban adatokat gyjtnk a legfontosabb
befolysol tnyezkre, s ezekre az adatokra tmaszkodva korrigljuk a megfigyels
eredmnyeit (eltvoltjuk valamilyen tbbvltozs statisztikai mdszer segtsgvel a
variabilits ismert, befolysol faktorokkal kapcsolatos rszt).

20

Hisztogram
A vizsglt jelensgek szrdst els lpsknt rdemes bra segtsgvel szemlltetni. A hisztogram az egyes megfigyelt rtkek elfordulsi gyakorisgt, valsznsgt
brzolja (4. bra).

4. bra. Egy biolgiai paramter (tlag: 5; szrs: 1,5) hisztogramja a mrs pontossgnak fggvnyben az egsz rtkek (10 kategriba osztott mrsi eredmnyek), a tizedek (100 kategriba osztott mrsi eredmnyek) s a szzadok (1000 kategriba osztott eredmnyek) mrsre
kpes mrmszerek segtsgvel nyert adatok alapjn (mindhrom sorozatban 1000 a tnylegesen kivitelezett mrsek szma)
21

Biostatisztika

Biostatisztika

Diszkrt adatfajta esetben az eleve adott kategrikat brzoljuk az x-tengelyen,


s az egyes kategrikhoz tartoz esetek szmt mutat oszlopokbl addik a diagram.
Folytonos vltoz esetn a kategriahatrokat mestersgesen kell ellltani. Ezek szmt az adott helyzethez igazodan kell meghatrozni, az adatok tartomnya alapjn
egyenl szlessg kategrikat definilva. Ha sok adat ll rendelkezsnkre, akkor
a folytonos adatot egyre keskenyebb kategrik definilsa utn, egyre finomabb felbontsban brzolva, az oszlopdiagram talakul folytonos vonall. Ezek az brk nmagukban nem elgsgesek a vizsglt jelensgek lersra, de sok informcit hordoznak. Pldul megmutatjk, hogy az lettani paramterek dnt tbbsge olyan eloszlst
mutat, aminek centruma van (ami kzelben srsdnek az egyes mrsi eredmnyek),
s aminek a centrumtl tvolodva fokozatosan egyre kevesebb lesz a mrsi eredmnyek szma.

Az adatok eloszlsnak jellegtl fggen teht hasznlhatjuk az eloszlsrl rszletesebb informcit ad tlagot, vagy az eloszls rszleteirl keveset mond, de az extrm rtkekre kevss rzkeny medint.
Inkbb csak a teljessg kedvrt kell megemlteni, hogy diszkrt adatoknl a legnagyobb szmban elfordul rtk, illetve folytonos adatnl a hisztogram cscshoz
tartoz rtk a mdusz. A tipikus eset lersra ezt a mrszmot egszsgtudomnyi
terleten alig hasznljuk.

Szrds

Ez csak akkor szokott problms lenni, ha az adataink kztt van nhny extrm rtk,
ami kilg a hisztogrambl is. Ezek az extrm rtkek igen nagy hatssal vannak az tlagra. Ha ilyen adatokkal egytt szmolunk, akkor az lesz az rzsnk, hogy a szmtott
tlag nem jl tkrzi a tipikus vizsglati alanyt. Az extrm adattal kapcsolatban pedig,
hogy valami oknl fogva specilis volt a szlssges rtket mutat vizsglati alany, s
jobb lenne megrteni a specilis rtk mgtt ll specilis krlmnyt, mint figyelembe venni a tipikus rtk szmtsakor! Vagyis jobb lenne kizrni a szlssges adatot a
feldolgozsbl.
Extrm adatok jelenltben a tipikus rsztvevt jobban bemutat mrszmhoz jutunk, ha a vizsglat eredmnyeit sorba rendezzk, s kivlasztjuk az ppen kzpen
lvt. Az gy kapott rtk a medin. Mivel a medin szmtsakor nincs jelentsge a
szomszdos adatok kzti klnbsg nagysgnak, az extrm rtkek hatsa sem fog rvnyeslni olyan nagymrtkben, mint az tlag esetben. Ugyanezrt viszont a medin
nem tkrzi a tnyleges adatok kzti klnbsget.

A centrlis rtk nmagban nem rja le azt a jelensget, amivel foglalkozunk, hiszen a
tipikus rtk krl szrdnak a tnyleges adataink. A szrds pedig klnbz adatok
esetben jelentsen eltr lehet. A szrds szmszerstse ugyanolyan alapfeladat,
mint a centrlis rtk meghatrozsa.
A legegyszerbben az adatok tartomnyt szmthatjuk (a minimum s maximum
rtkek alapjn). Sajnos az egyszer szmthatsg nem prosul komoly gyakorlati rtkkel. Ez a mrszm ugyanis mindsszesen kt adatot, radsul kt extrm adatot
hasznost. Egyltaln nem szl az adatok tlnyom tbbsgrl.
Informatvabb szrds-mrszmokhoz jutunk, ha az adatok sorba rendezse utn
egyenl darabszm adatot tartalmaz tartomnyokat definilunk, s ezek hatrait, azaz
kvantiliseket adunk meg. Ha hrom, ngy, t vagy tz egyenl tartomnyt adunk meg
akkor tercilisekrl, kvartilisekrl, kvintilisekrl, illetve decilisekrl beszlhetnk. A
kvantilisek hatrai mr tbbet mondanak a tartomnyon belli eloszlsrl. De ez a mutat sincs tekintettel arra, hogy milyen a kategrikon bell az adatok eloszlsa.
rdemes olyan szrds-mrszmot kialaktani, ami az sszes adat eloszlst tkrzi, gy, hogy tekintetbe veszi az adatok kzti tnyleges klnbsgeket is. Ilyen mutat
a centrlis rtk krli szrdst kell, hogy szemlltesse, azaz az adatok alapjn szmtott tlag krli szrdst kell lernia. Ehhez az els lps az egyes adatok tlagtl
val ( x x ) eltrsnek szmtsa. Ha ezeket a tvolsgokat sszegezzk, akkor sszessgben kpet kapunk arrl, hogy milyen mrtk a szrds. Ha csak egyszeren
sszeadjuk az egyes tlagtl val eltrseket, akkor akrmilyen is az adatok szrdsa,
az sszeg ppen nulla lesz, mivel az tlag alatti s az tlag feletti adatokhoz tartoz eltrsek ppen kioltjk egymst: ( x x ) = 0 . Kt md is knlkozik arra, hogy ezt
az eljelproblmt megoldjuk. Az eltrsek abszolt rtkt vagy ngyzett hasznlva
csupa pozitv szmot kapunk, amiket sszegezve mr olyan mutatkat kapunk (abszolt

22

23

Centrlis rtk
A hisztogramok segtsgvel szemlltethet, hogy mi a tipikus vizsglati alany jellemz
rtke, mi az eloszls centruma, amit x rtkek N elem mintja esetn legkzenfekvbb

x szmtani tlagknt megadni:

x=

x.
N

Biostatisztika

Biostatisztika

( x x ) ; ngyzetes eltrsek sszege: ( x x ) 2 ), amelyek naeltrsek sszege:


gyobb rtkei tkrzik a nagyobb szrdst. Ezek a mutatk flrevezetek lehetnek, ha
egy kicsi elemszm s egy nagy elemszm vizsglat adatait hasonltjuk ssze, mert a
nagyobb elemszm mellett tbb eltrsbl add sszegzett klnbsget ltunk. (Ha a
nagy s a kicsi mintn ugyanolyan az adatok tlag krli szrdsa, akkor a nagy mintn nagyobbnak addnak ezek a szrdst mr kifejezsek.) Valamilyen mdon a vizsglat mrett is figyelembe kellene teht vennnk ahhoz, hogy ne csak az azonos nagysg mintk adatait tudjuk sszehasonltani. Kzenfekv lenne egyszeren az adatok
szmval osztani az abszolt vagy a ngyzetes eltrsek sszegt. Ehelyett a vizsglat
mrett szabadsgi fokkal rjuk le, ami az elemszm korriglt rtke. gy definiljuk a
Vx variancit (az egyes adatok szmtani tlagtl val ngyzetes eltrseinek tlagt) s a
Dx tlagos eltrst (az egyes adatok szmtani tlagtl val abszolt eltrseinek tlagt):

Vx

(x x)
=
N 1

Dx =

(x x) .
N 1

Az tlagos eltrs szemlletes rtelmezse elg egyszer. A varianci a ngyzetre emelt


rtk (s a ngyzetre emelt dimenzi) miatt nem ilyen egyszer. A variancia gyke viszont mr szemlletes mrszm (az egyes adatok szmtani tlagtl val eltrseinek
tlaga, standard devici, SDx ):

Szabadsgi fok
A mrsi eredmnyek feldolgozsakor statisztikai mutatkat, mrszmokat hatrozunk meg. Vannak mrszmok (pl. minta tlaga), amelyek kiszmtsa kzvetlenl
a minta egyes elemeibl trtnik. Ms esetekben nem csak magukbl a vizsglat sorn nyert elemi adatokbl, hanem kztes mutatkbl (pl. csoporttlagokbl) szmtjuk
a mrszmot (Jellemzen ilyen statisztikai tesztek mrszmai a teszt-statisztikk).
Ilyenkor a mrszm meghatrozsakor nem a minta nagysgval rjuk le a vizsglat
mrett, hanem a szabadsgi fokkal (degree of freedom; df). Annyival lesz kevesebb a
minta elemszmnl a mrszm szabadsgi foka, amennyi (mintbl szmtott) kztes
mrszm rtkt felhasznljuk a vgs mutat rtknek meghatrozshoz.
Minden statisztikai elemzs a teljes populcira vonatkozan szeretne kvetkeztetst levonni az elemzett minta adatai alapjn. A minta nagysga meghatrozza, hogy
mennyire megbzhat a levont kvetkeztets. Ezrt minden statisztikai mutat rtkelsekor figyelembe kell vennnk a vizsglat mrett megad szabadsgi fokot.
Az egyes statisztikai mrszmok szabadsgi foknak szmtsi mdjt taln clszerbb minden mrszm esetben megjegyezni, mint a szmts menetnek tgondolsa
rvn kikvetkeztetni.
Ha egy kezelt s egy kontrollcsoport sszehasonltsa rvn szeretnnk rtkelni egy
beavatkozs hatkonysgt, akkor t-prba segtsgvel hasonlthatjuk ssze a beavatkozs eredmnyt jelz klinikai paramter tlagt. A t-rtk kiszmtshoz felhasznljuk
a kt csoport tlagait, ezrt a statisztikai mutat rtkelsekor nem azt vesszk figyelembe, hogy milyen nagy volt a vizsglt minta, hanem annak kettvel cskkentett rtkt.

Normlis eloszls
A szrs s az tlagos eltrs szmszeren kzeli, de nem azonos rtk. nmagban
mindegyik alkalmas a szrds szemlletes lersra. A statisztikai feldolgozsok tovbbi lpsei viszont lnyegben csak a szrst hasznljk. Emiatt az tlagos eltrs
nem tekinthet lnyeges statisztikai mrszmnak.

24

Ha klnbz mintkon megmrjk egy biolgiai paramter rtkt, s elksztjk a


mintk hisztogramjt, akkor azt ltjuk, hogy a hisztogramok alakja nagyon hasonl.
ltalnos az a tapasztalat, hogy a biolgiai paramterek jellemz eloszlsmintzattal
rendelkeznek.
Szintn az a tapasztalat, hogy a legtbb paramter eloszlsa szimmetrikus, harang
alak grbt r le. A harangalak abbl addik, hogy az eredmnyek az tlagrtk krl
srsdnek, attl tvolodva fokozatosan ritkulnak. Ezt az ltalnosan megfigyelhet
haranggrbe-eloszlsmintt (Gauss-grbt) matematikai fggvnyknt is le lehet rni.
25

Biostatisztika

Biostatisztika

A vizsglati eredmny s annak elfordulsi valsznsge kzti kapcsolatot ler fggvny a normlis eloszls srsgfggvnye:
m

ahol x a vizsglati eredmny, f(x) a vizsglati eredmny elfordulsi valsznsge, a


vizsglt paramter tlaga, a vizsglt paramter szrsa (-vel s -val a vizsglati paramter populcis szinten jellemz, teht valdi tlagt s standard devicijt jelli,
amiket meg kell klnbztetnnk a mintn mrt
x tlagtl s SDx szrstl).
Ha azt brzoljuk, hogy egy adott mrsi eredmnynl kisebb mrsi eredmny milyen valsznsggel fordul el, akkor a normlis eloszlsfggvnyt kapjuk.
A normlis eloszls szimmetrikus, kzppontja az tlag (ami itt egyenl a medinnal). A haranggrbe inflexis pontjaihoz (ahol sszekapcsoldnak a srsgfggvny
kifel dombor s homor szakaszai) tartoz vizsglati eredmny s az tlag kzti
tvolsg a szrs. Az tlaghoz 1 szrsnyinl kzelebb van a vizsglati eredmnyek
68,26%-a, 1,96 szrsnyira pedig a 95%-a. Azokat az eredmnyeket, amik az tlagnl
legalbb 1,96 szrsnyival kisebbek, extrmen alacsonynak tekintjk. Az sszes adat
2,5%-a tartozik ebbe a csoportba. Az tlagnl legalbb 1,96 szrsnyival nagyobb eredmnyeket tekintjk extrmen magasnak. Ezek is 2,5%-t adjk az sszes mrsi eredmnynek (5. bra).
Klnbz vizsglt jelensgek eltr tlaggal s szrssal rendelkeznek, ezrt maga
a srsgfggvny minden adatra ms s ms lesz. A fggvnyek alakja azonban fggetlen az eloszlsi paramterektl (az tlagtl s a szrstl).
Ha az egyes mrsi eredmnyeinkrl szeretnnk vlemnyt mondani (mennyire tekinthet az szlssgesnek vagy a centrumhoz tartoznak), akkor knyelmesebb, ha
nem az eredeti adatok segtsgvel ksztett, hanem a standardizlt vizsglati eredmnyek segtsgvel felvett srsgfggvnyt hasznljuk. Azaz minden mrsi eredmnybl kivonva az tlagot, eltoljuk a haranggrbt gy, hogy alakjt megtartva, annak kzppontja pont 0 legyen. Majd ezeket az tlaggal cskkentett vizsglati eredmnyeket
a szrssal osztva, a grbe alakjt gy alaktjuk, hogy annak szrsa ppen 1 legyen.
Ilyenkor a mrsi mrtkegysgtl, annak tlagtl s szrstl fggetlenl, maga a
standardizlt rtk (z rtk) lerja a centrumhoz val viszonyt. A standardizlt z rtk
tlaga mindig 0, a 1,96-nl alacsonyabb rtkek extrmen alacsonynak, az 1,96-nl
nagyobbak szlssgesen magasnak tekinthetk.

26

5. bra. Normlis eloszls s srsgfggvny

27

Biostatisztika

Biostatisztika

Az brn szerepl adat normlis eloszls, tlaga 5, szrsa 1,5. Ha A s B vizsglati


rsztvev esetben a mrs szerint xA = 8x s xB = 2,5, akkor mit tudunk mondani a kt
rsztvev mrsi eredmnyrl? Az eredeti mrsi eredmnyeknek megfelelen leolvashatjuk az eloszlsfggvny rtkt ennl a kt pontnl. xA magasabb annl a pontnl,
ahol az eloszlsfggvny rtke 0,975, azaz extrm magasnak tekinthet. xB magasabb,
mint az az rtk, ahol az eloszlsfggvny rtke 0,025, ezrt ezt nem tekinthetjk extrmen alacsonynak. Knyelmesebb azonban a standardizlt rtkeket szmtani:

Megbzhatsgi tartomny

zB =

x x 2,5 5
=
= 1,66
SDx
1,5

Mivel zA nagyobb, mint 1,96, az A rsztvev adata extrmen magasnak tekinthet. B


rsztvev viszont a tbbsghez sorolhat, mert a zB = 1,66 nem kisebb, mint 1,96.

28

Statisztikai elemzst azrt vgznk, hogy a vizsglat krdst segtsk megvlaszolni.


Az alapkrds lehet egyszeren egy jelensg gyakorisgnak a meghatrozsa (mennyi
folsavat visznek be tlagosan tpllkozs sorn a felsfok vgzettsggel rendelkez
nk a terhessg korai szakaszban?), vagy lehet kt jelensg kzti kapcsolat igazolsa (rontja-e a sejtmembrn teresztkpessgt, ha a szvettenyszethez nagy dzis
bta-karotint adunk?)
Ha a vizsglati eredmnynk ismeretben tnzzk a szakirodalmat, ha konferencin beszlgetnk a kollginkkal, akik hasonl krdseket tanulmnyoznak, mint mi,
akkor azt fogjuk ltni s hallani, hogy msok hasonl, de a mienktl szmszeren klnbz eredmnyeket kaptak. Mindaddig nyugodtak maradunk, amg az eredmnyek
alapjn levont kvetkeztetsek ugyanazok, mint amire mi is jutottunk. Mirt is van ez?
Ha valban vizsglatot akarunk vgezni a mennyi folsavat visznek be tlagosan
tpllkozs sorn a felsfok vgzettsggel rendelkez nk a terhessg korai szakaszban? krds megvlaszolsra, akkor gyorsan rjvnk, hogy csak a fizikai lehetsgeink ltal megszabott korltok kzt tudjuk azt a vizsglati csoportot sszelltani, aminek
a tpllkozsi szoksait majd fel fogjuk mrni. Brmennyire is szeretnnk nagyon nagy
elemszm mintt vizsglni, meg kell majd elgednnk valamilyen kompromisszumos
megoldssal. Termszetesen azrt szeretnnk minl nagyobb mintt vizsglni, mert azt
gondoljuk, ha nagy a minta, akkor megbzhat a belle szrmaz eredmny, s tisztban vagyunk azzal is, hogy a mintnk nem kpes az sszes elvileg lehetsges vizsglati
alanyra jellemz viszonyokat tkletesen reprezentlni. Vagyis tudjuk, hogy a mintn
kapott eredmnyeink csak tbb-kevesebb pontossggal tkrzik a vals, megllaptani
kvnt paramtert. Ezrt nem lepdnk meg, ha egy msik mintn vgrehajtott (egybknt a mienkhez teljesen hasonl s kifogstalan mdszertani kvetkezetessggel kivitelezett) vizsglat eredmnye csak hasonlt a mi eredmnyeinkre. Ha tbb eredmnyt ltunk, akkor azokat fogjuk megbzhatbbnak rezni, melyek nagyobb mintt vizsgltak.
sszefoglalva mindezt elmondhat, hogy a valsgra jellemz paramterek megllaptsra treksznk, de ehhez nem tudjuk az sszes potencilisan szba jhet vizsglati alanyt, azaz a teljes populcit megvizsglni. Ehelyett csak egy reprezentatv mintt
tanulmnyozunk. A mintn kapott eredmnyek szoros kapcsolatban lesznek ugyan a
vals paramterekkel, de azzal szmszeren nem egyeznek meg, csak tbb-kevesebb
pontossggal tkrzik a vals viszonyokat.
29

Biostatisztika

Biostatisztika

Addik a krds, hogy akkor rdemes-e brmit vizsglni? A vlasz igen, ha kpesek
vagyunk arra, hogy az eredmnyek bizonytalansgt szmszeren kifejezzk, ezltal
adva lehetsget az eredmnyek gyakorlati hasznostsra. A kvantifiklshoz vgezznk el gondolatban egy ksrletet a folsavbeviteli krds megvlaszolsra! A populci, amit meg szeretnnk vizsglni, az sszes korai terhessg idszakban lv n.
Ennek a populcinak termszetesen van tlaggal s szrssal jellemezhet folsavbevitele. Objektv, ltez szm mindkett. A gondolatksrletben az tlagot prbljuk majd
meghatrozni.
A teljes populcibl vletlenszeren vlogassunk ki sok, azonos N elemszm
mintt, s ezeken mrjk fel a folsavbevitelt, majd szmoljuk ki az tlagokat. (Nyilvnvalan ez a valsgban kivitelezhetetlen!) Nem lepdnk meg azon, hogy a kapott
tlageredmnyek szrdst mutatnak, s normlis eloszlsak. A szrds centruma az
a vals tlagos folsavbevitel, aminek a meghatrozsa egybknt a clunk. Az tlagrtkek szrdsnak a mrtke attl fgg, hogy mekkora volt az egyes nk folsavbevitelnek szrsa. Ha szles tartomnyon bell varildik az egyni folsavbevitel, akkor
a gondolatksrletben kapott mintnknti tlagok is szlesen szrdnak. (Br nyilvnvalan nem annyira szlesen, mint az eredeti adatok!) Azt is gondoljuk, hogy minl
nagyobb a gondolatksrletben hasznlt mintanagysg, annl megbzhatbbak lesznek
az egyes mintk tlagai, ez annyit jelent, hogy jobban tkrzik a valsgot, kzelebb
helyezkednek a vals tlaghoz, szkebb tartomnyon bell szrdnak. Vgs soron azt
tudjuk megllaptani, hogy a szrds mrtke egyenesen arnyos az elemi adatok standard devicijval, s fordtottan arnyos az elemszmmal, pontosabban (nem rdemes
itt a matematikai magyarzatra kitrni, de) annak gykvel. A nevezktani koszt elkerlend a standard devicit fenntartjuk az egyni szinten meghatrozott vizsglati
eredmnyek eloszlsnak lersra (SDx), a gondolatksrletbl szrmaz mintatlagok
SDx standard devicijt pedig tkereszteljk SE standard hibnak. (De tudjuk, hogy
egybknt ez a mintatlagok Gauss-grbjnek a szrsval egyenl!) A szemlletes
jelents matematikai megalapozstl eltekintve, meg tudjuk llaptani, hogy:

a T tartomnynak a szlessgt, amin bell jellemzen (95%-os valsznsggel) elfordulnak a gondolatksrlet eredmnyei:

.
Tudjuk, hogy az tlagok eloszlsa normlis, aminek a kzppontjban az ltalunk
keresett valdi X tlagos folsavbevitel van (nagybetvel a val populcira jellemz,
kis betvel a mintn megfigyelt adatokat szoktuk jellni), s hogy ilyen eloszls mellett
az adatok 95%-a az tlag 1,96 szrsnyi kzelben van. Azaz, meg tudjuk adni annak
30

T = X 1,96SE = X 1,96

SDx
.
N

A gondolatksrletnek az volt az rtelme, hogy levezessk ezt az sszefggst, amely


szerint T tartomny kiterjedse

. Ha ez a tartomny szles, akkor a mintk

tlagai szles tartomnyon bell varildnak, ami alapjn az egyes vizsglati eredmnyeket kevss megbzhatnak rezzk. Ha viszont a T tartomny szk, akkor az eredmnyek is szk tartomnyon bell varildnak, amibl azt kvetkezik, hogy a gondolatksrletbl szrmaz mintatlagok kzel helyezkednek el a vals tlaghoz, s ezrt
megbzhatbbnak rezzk ket. A tartomnynak nem csak az a pozitvuma, hogy kifejezi, hogy mennyire megbzhat egy vizsglatnak az eredmnye, hanem az is, hogy
olyan adatoktl fgg (elemszm s szrs) amelyeket egyetlen minta segtsgvel is
meg tudunk llaptani. (Ezt a kijelentst majd a tovbbiakban pontostani kell!)
Ha teht egyetlen vizsglatot vgznk el, akkor annak segtsgvel ez a T tartomny
meghatrozhat. Az egyetlen komoly gond a T tartomnnyal, hogy nem tudjuk, hol helyezkedik el a szmegyenesen, csak azt, hogy milyen szles. Ha r tudnnk illeszteni
a szmegyenesre, akkor nem csak a hatrait, hanem a kzppontjt is pontosan (rtsd:
hiba nlkl!) meg tudnnk adni. Ez annyit jelentene, hogy a valsgnak ezt a paramtert pontosan meg tudtuk hatrozni. A bevezetben pont arrl beszltnk, hogy ez elvileg
nem lehetsges!
Milyen a viszony a szmegyenes s T tartomny kzt? Ennek megvlaszolsban
segt minket az az adat, amit az egyetlen sajt vizsglatunkbl kapunk, de ebben a gondolatmenetben mg nem is vettnk figyelembe: a sajt mintnk adataibl szmtott
x.
Errl csak annyit tudunk, hogy egy a lehetsges nagyon sok, a gondolatksrletben elvgzett vizsglat eredmnybl, azaz valahol benne van a T tartomnyban (pontosabban 95%-os valsznsggel van a T tartomnyban). Segtsgvel hozzkapcsolhatjuk
a T tartomnyt a szmegyeneshez, mert azt gy kell illeszteni, hogy akrhol is lehet, de
legyen benne az
x , ami eleve a szmegyenesen is van. Ez annyit jelent, hogy a T tartomny kt szlsrtkt (Tals s Tfels) tudjuk felvenni, azaz rgzteni tudjuk a T tartomnyt a szmegyenesre, de nem egy fix helyen, hanem kt szlsrtk kzt.
A 6. brbl elg vilgosan kitnik, hogy a T tartomny kt szls helyzete a kzppontjukban lev vals tlag szls pozciit is (xals ;
x fels) meghatrozza, mely pozcik
a sajt mintk tlagtl 1,96 SE tvolsgra vannak.
31

Biostatisztika

Biostatisztika

ez a minta alapjn meghatrozott SDx szrs a populcira jellemz vals szrssal


azonos. Pedig nyilvnval, hogy a szrsok is varibilisak lennnek a gondolatksrletben. A mintnk adatai alapjn szmtott szrs csak tbb-kevesebb pontossggal kzelten a vals, populcira jellemz szrst.
A 95%-os megbzhatsgi tartomny kpletnek valamilyen korrekcijra van ezrt
szksg. A levezetett kplet alapjn ugyanis szkebb T tartomnyt kapunk, mint ami valban tartalmazza a gondolatksrletbl szrmaz mintatlagok 95%-t. A korrekci az
1,96-os konstans mdostsval vgezhet el, aminek a matematikai rszleteit nem trgyaljuk, csak az eredmnyt llaptjuk meg. A kpletben szerepl konstanst az N 1 szabadsgi fok t-eloszlsbl szmtott rtkkel helyettestjk. gy az tlag 95%-os megbzhatsgi tartomnyt az albbi mdon tudjuk sajt vizsglatunk vgn szmtani:

A kpletben szerepl standard devicival kapcsolatban nyitva hagytunk azonban


egy krdst! A gondolatksrletben csak annyit emltettnk vele kapcsolatban, hogy a
sajt mintnkon szmtott szrst hasznljuk a szmtsainkhoz, azt felttelezve, hogy

Egyetlen vizsglat vgn teht meg tudjuk mondani, hogy a valsg egy paramtere
milyen hatrok kzt helyezkedik el 95%-os megbzhatsggal. A vizsglat eredmnye
tulajdonkppen az, hogy be tudjuk szortani a korbban nem ismert rtket ebbe a tartomnyba. Nyilvnval, hogy minl nagyobb mintt vizsglunk, annl szkebb lesz ez a tartomny, ami teljesen sszhangban van azzal a gondolatksrlet eltt megfogalmazott rzsnkkel, hogy, minl nagyobb mintt vizsgltunk, annl megbzhatbb az eredmnynk.
Meg kell jegyezni mg, hogy a 95%-os megbzhatsg a precizits s a megbzhatsg kzti gyakorlati kompromisszum. A kutatsi programok eredmnyeinek sikeres
gyakorlati alkalmazsa bizonytja, hogy ez a megbzhatsgi szint ltalban megfelel.
(Ha nem is vd meg minden tvedstl! Rszletesebben kvetjk majd ezt a gondolatmenetet a hipotzistesztels rtelmezsekor.) Esetenknt azonban nem elgsznk meg a
95%-os megbzhatsggal, s szeretnnk megadni azt a tartomnyt, amin bell 99%-os
valsznsggel van a vals tlag. A nagyobb megbzhatsgnak az lesz az ra, hogy
szlesteni kell a megbzhatsgi tartomnyt. A t-rtk = 0,01 -re megadott rtkeit
hasznlva mr tudjuk a 99%-os megbzhatsgi tartomnyt is szmtani.
A mintnkon vgzett vizsglat sorn nem csak tlagrtket tudunk meghatrozni, hanem brmilyen ler statisztikai vagy sszefggs-elemzst szolgl statisztikai mrszmot. A fenti gondolatmenet vgigvezethet brmelyik mrszmra. A vgeredmny
mindig egy megbzhatsgi tartomny lesz, aminek a kplete is teljesen azonos lesz a
levezettel. Egyetlen klnbsget fogunk tallni, ami a meghzhatsgi tartomnyokat
mrszm-specifikuss teszi. Ez a standard hiba szmtsnak a mdja. Az egyes mr-

32

33

6. bra. Megbzhatsgi tartomny hatrainak rtelmezse

Ezzel a mdszerrel meg tudjuk hatrozni, hogy milyen szlsrtkek kzt helyezkedik el a folsavbeviteli tlag vals rtke. Meg tudunk adni egy tartomnyt, amin bell
van valahol (nem tudjuk, hogy hol!) a vals tlag. Ezzel az intervallummal kvantifikltuk a sajt vizsglati mintkon meghatrozott tlag megbzhatsgnak mrtkt, megnyitva a lehetsget az eredmny gyakorlati alkalmazsra. (Nem mellesleg gy tettk
ezt, hogy harmniban maradtunk azokkal a filozfiai gondolatmenetekkel is, amelyek
szerint teljes rszletessggel nem lehet megismerni a valsgot!) A szrmaztatott intervallumot az tlag 95%-os megbzhatsgi tartomnynak definiljuk:

Biostatisztika

Biostatisztika

szmokhoz tartoz standard hiba ismeretben mr megadhat brmelyik M mrszm


(1 )%-os megbzhatsgi tartomnya N elem minta vizsglata utn:
.
A 95%-os megbzhatsgi tartomny gyakorlati alkalmazsa egyszer. Komoly elnye a rjuk alapozott statisztikai kvetkeztetseknek, hogy a vizsglati eredmnyeket a
megbzhatsgukkal egytt kezelik s mutatjk be.
Kt vrnyomscskkent gygyszer (A, B) hatkonysgt szeretnk sszehasonltani. Az A gygyszert 45 betegen prbltk ki, ahol a vrnyomscskkens tlagosan 23
Hgmm volt (SDA = 4,2 Hgmm). A 67 betegen vizsglt B gygyszer esetben az tlagos
terpis hats 27 Hgmm volt (SDB = 8 Hgmm). Az tlagos terpis hats 95%-os megbzhatsgi tartomnyait szmtottk:

.
Az A gygyszerre valjban jellemz, tlagos terpis hats teht nagyobb, mint
21,74 Hgmm, s kisebb, mint 24,26 Hgmm. B gygyszer tlagos hatkonysga nagyobb, mint 25,05 Hgmm, s kisebb, mint 28,95 Hgmm. A kt 95%-os megbzhatsgi
tartomny nem fed t egymssal, azaz annak ellenre, hogy nem tudjuk pontosan egyik
gygyszer hatst sem meghatrozni, azt a krdst, hogy melyik jobb, mgis meg tudjuk vlaszolni: B gygyszer terpis hatsa jobb. Gyakorlati rtkkel br megllaptst
tudtunk teht tenni, azaz kellen pontosak tudtunk lenni a vizsglat sorn, Tulajdonkppen ez a jl kivitelezett vizsglatok egyik legfontosabb ismrve: kellen pontosak, de
nem fecsrlik az erforrsokat olyan mrtk precizits elrsre, amire mr nincs is
szksg az ppen vizsglt krds megvlaszolshoz (7. bra).
Egy msik helyzetben C s D gygyszerek hatst hasonltjk ssze. Itt az adatok az
albbiak: NC = 9; xC = 17,5 Hgmm; SDC = 7,2 Hgmm; ND = 16; xD = 17,5 Hgmm; SDD =
7,2 Hgmm. A megbzhatsgi tartomnyok tfedtk egymst:
,

34

7. bra. Ngy vrnyomscskkent gygyszer (A, B, C, D) tlagos terpis hatsnak 95%-os megbzhatsgi tartomnya

.
Az tfeds miatt lehet, hogy olyan vals rtke van a kt gygyszernek, ami egyforma
hatserssget jelez; az is lehet, hogy a D gygyszer a hatsosabb, hiszen sok olyan
pontja van a D megbzhatsgi tartomnynak, amihez vlaszthat kisebb rtk a C megbzhatsgi tartomnybl; de az is lehet, hogy C a hatkonyabb, mert vannak olyan rtke is a C megbzhatsgi tartomnynak, amihez vlaszthat nla kisebb rtk a D megbzhatsgi tartomnybl. sszegezve vagy egyformk a gygyszerek, vagy C, vagy D
a hatkonyabb. (Ennyit rul el neknk a vizsglat! Ezt tudtuk korbban is, ezrt nem
volt rdemes belefogni a vizsglatba!) A statisztikai kvetkeztetsnk az lesz, hogy nem
talltunk klnbsget a kt gygyszer hatserssgben.

35

Biostatisztika

Biostatisztika

Hipotzistesztels

A teljesen biztos vlemnyalkots hinya miatt a statisztikai eljrsok konzervatv


szemlletek. Egy megllaptst mindaddig nem tartunk megalapozottnak, amg nagy
valsznsggel meg nem gyznek minket az eredmnyek. Ugyanakkor, mindaddig azt
gondoljuk, hogy a megllaptsunk, elkpzelsnk nem igaz, amg erre akr csak kicsi eslyt is ltunk. A helyzet analgija az rtatlansg vlelme. Mindaddig rtatlannak
minstnk valakit, amg ers bizonytk nincs a bnssgre. Ugyanakkor, ha gyenge
ktsg merl fel a bnssggel kapcsolatban, akkor mr elmarad az tlet. A bnssget
kell meggyzen bizonytani, nem az rtatlansgot azt eleve felttelezzk. Statisztikai
elemzsek esetn eleve felttelezzk, hogy az elkpzelsnk nem igaz, s a vizsglati

eredmnyektl vrjuk, hogy meggyz bizonytkot adjanak arra, hogy mgis megalapozott a feltevsnk. Ha a meggyz bizonytkot nem tudjuk ellltani, akkor knytelenek vagyunk annak megfelelen cselekedni, hogy nem volt igaz az elkpzelsnk.
Vegynk egy egszen konkrt pldt erre! Azt gondoljuk, hogy az ltalunk kidolgozott eljrssal javtani lehet a betegek gygyulsi eslyt. Vizsglatot vgznk ennek
igazolsra, azaz adatokat gyjtnk, amiket feldolgozunk. Ha a statisztikai eredmnyek
szerint nagy biztonsggal llthat, hogy az alkalmazott eljrs javtotta a betegek llapott, akkor kezdjk szleskren alkalmazni a mdszer. Ha kis bizonytalansg marad
a vizsglat vgn a gygytsi hatkonysgot illeten, akkor viszont nem kezdemnyezzk a korbbi gyakorlat mdostst, az j mdszer alkalmazst maradunk a rgi
gyakorlatnl, konzervatv mdon.
A bri gyakorlatban vannak nagyon knnyen megtlhet gyek. Ha ktsg merl
fel a bnssget illeten, akkor az egybknt meglv terhel bizonytkok ellenre
sem tlik el a vdlottat. Knny eset az is, ha az sszes bizonytk a bnssg mellett
szl. Az olyan tmeneti eset kezelhet nehezen, amikor vannak bven bizonytkok a
bnssg mellett, de az rtatlansg mellett is szlnak rvek. A statisztikai eredmnyek
rtkelsekor is hasonl a helyzet. A knnyen megtlhet extrm helyzetek kzti znban nehz dntseket hozni. Segtsgnkre van az, hogy a statisztikai eljrs a valsgot reprezentl adatok segtsgvel szmszersti annak a valsznsgt, hogy az
elkpzelsnkben szerepl kapcsolatok, sszefggsek mentn jnnek ltre a valsg
tnyei. Ezt a szmszerstett valsznsget lehet egy kritikus valsznsgi kszbrtkhez hasonltani: ha nagyobb az llts igazsgnak valsznsge, mint a kszb,
akkor igaznak tekintjk; ha kisebb, mint a kszb, akkor nem tekintjk igaznak.
A szrke znban a jl megvlasztott dntsi kszb segt eligazodni. A kszb is
egy szmrtk, amit gy kell megvlasztani, hogy kellen nagy biztonsgot jelentsen a
nem megalapozott elkpzelsek elfogadsa ellen, de azrt ne lltson lehetetlenl szigor felttelt a vizsglatot vgzk szmra. Az elz azrt fontos, mert a rossz elkpzels alapjn bevezetett eljrsokat betegeken fogjk alkalmazni, akiknek a gygyulsi
eslyt ez jobb esetben nem javtja, rosszabb esetben kifejezetten rontja. Utbbi pedig
azrt fontos, mert a gygyt eljrsokat fejleszteni kell, akkor is, ha elvileg lehetetlen
100%-ig biztos tudomnyos bizonytkok ellltsa.
Hol tallhat ennek a kt felttelnek megfelel dntsi kszb? Sajnos, nem lehet
valamilyen elmletbl levezetni ezt a kszbvalsznsget! De a gyakorlati tapasztalat
az, hogy a biomedicinlis vizsglatok szmra az 5%-os hibahatr megfelel. Ez annyit
jelent, hogy csak abban az esetben gondolunk egy elkpzelst megalapozottnak, ha a
statisztikai rtkels szerint az legalbb 95%-os valsznsggel igaz. Ennl kisebb va-

36

37

Statisztikai elemzsre minden megfigyelsen s ksrleten alapul vizsglat esetben


szksg van. Ennek oka, hogy vizsglataink sorn a valsgra vonatkoz, ltalnos
rvnnyel br megllaptst szeretnnk tenni, ami megalapoz valamilyen gyakorlati
beavatkozst. (Nem lehet elgg hangslyozni a statisztikai eljrsok rszleteinek tanulmnyozsakor sem, hogy a vizsglatok nem nclak. Vals, gyakorlati jelentsggel br krdsek megvlaszolsra szolglnak. Az egsz vizsglati folyamat, benne a
statisztikai rtkels is, vgs soron csak az alapproblma megoldshoz val hozzjruls szempontjbl rtkelhet.) A teljes valsg viszont egy-egy vizsglat szmra
nem ragadhat meg. Nem csak gyakorlati akadlyok miatt (korltozott a vizsglatba
vonhat rsztvevk, az elvgezhet ksrletek szma), hanem (meggyz tudomnyfilozfiai ttelek alapjn) elvileg sem.
A statisztikai eljrsok rvn egy minta segtsgvel tesznk megllaptst a teljes
populcira vonatkozan. Mivel a minta csak kzelten reprezentlja a populcit, ez
a megllapts soha nem lehet 100%-ig biztos. A statisztikai eljrsok menett azrt kell
jl rteni, mert ismernnk kell az eljrshoz kapcsold problmkat, azaz rtennk
kell, hogy milyen szempontbl informatvak, s milyen szempontbl nem hasznosthatk a statisztikai elemzsek eredmnyei. A mindig meglev korltokkal egytt kell
rtelmezni az eredmnyeket.

Dntsi kszb

Biostatisztika

Biostatisztika

lsznsg esetn nem. Mskppen fogalmazva, amg 5%-nl nagyobb a valsznsge


annak, hogy nem helyes a feltevsnk, akkor nem fogadjuk el azt. A dntsi filozfia
termszett jl szemllteti, hogy ha a vizsglatunk szerint 8% a valsznsge annak,
hogy nem megalapozott az elkpzelsnk, s ennek megfelelen 92% annak a valsznsge, hogy megalapozott, akkor ezt a vizsglati eredmnyt nem tekintjk elg meggyz adatnak az elkpzelsnk mellett. Ezrt nem is fogjunk a gyakorlatot az elkpzelseinknek megfelelen alaktani. Igen komoly meggyz ert kell teht felmutatni
ahhoz, hogy valaminek a megvltoztatsba belekezdjnk.
Elkpzelseinket hipotzisek formjban tudjuk megfogalmazni. Ha egy gerincsrlt betegekkel foglalkoz szakember megoldatlan problmt lt, s van valamilyen
elkpzelse az ellts hatkonysgnak javtsval kapcsolatban, akkor hipotzise (H1)
az lesz, hogy a hagyomnyos eljrsnl hatkonyabb az ltala kidolgozott mdszer. A
statisztikai hipotzistesztels ltalban nem kzvetlenl ezt a H1-et vizsglja, hanem indirekt mdon azt prblja kizrni, hogy H1 ellentettje az igaz. A H1 ellentte az a megllapts, hogy a rgi s az j mdszer ugyanolyan hatkony. Ezt hvjuk nullhipotzisnek
(H0), s ennek valsznsgt adjk meg a statisztikai tesztek p-rtk formjban. (A
p-rtk teht azt fejezi ki, hogy a vizsglt minta adatai alapjn mekkora annak a valsznsge, hogy a kt mdszer egyforma hatkonysg.)
Ha a p-rtk szerint 5%-nl kisebb a valsznsge (p < 0,05) annak, hogy igaz H0,
akkor azt gondoljuk, hogy ez mr elg kicsi valsznsggel igaz ahhoz, hogy ne gondoljuk helyesnek. H0 elutastsa viszont maga utn vonja az ellenttes llts elfogadst. Ha nem hisszk, hogy a kt eljrs egyforma hatkonysg, akkor azt gondoljuk,
hogy eltr a kt hatkonysg: elfogadjuk, megalapozottnak gondoljuk H1-et. Vgs soron az lesz a vlemnynk, hogy nem magyarzhat pusztn a vletlennel, hogy a mintkban a kt mdszer hatkonysga eltr volt. Rviden, szignifikns teszteredmnyrl
s szignifikns klnbsgrl beszlnk.
Ha viszont 5%-nl nem kisebb H0 valsznsge (p 0,05), akkor nem tartjuk elg
meggyznek a vizsglatot ahhoz, hogy H0-t elutastsuk, s ennek kvetkeztben a H1-et
gondoljuk helyesnek. Ilyen esetben a rvid rtkels nem szignifikns teszteredmny s
nem szignifikns klnbsg.

mindig! Az 5%-os hibahatr nem egy elmletileg megalapozott, a tvedsek ellen biztos vdelmet nyjt eszkz.
Elfordulhat, hogy a vizsglatunk p = 0,08 eredmnnyel zrul, azaz 8%-nak talljuk
a H0 valsznsgt. Ezt a szigor kszb miatt mg nem utastjuk el br termszetesen nem hisszk el azt sem, hogy igaz! Ebben a helyzetben elfordulhat, hogy valjban
a H1 volt a j hipotzis (ami nem meglep, hiszen mgiscsak 92%-nak talltuk annak
a valsznsgt, hogy igaz!), s hibt kvettnk el, amikor nem utastottuk el H0-t. A
hiba azrt jhet ltre, mert nem volt szerencsnk a minta sszelltsakor (a sok lehetsges mintbl pont egy szlssges sszettelt sikerlt kivlasztanunk), vagy azrt,
mert kicsi volt a minta elemszma (ennek rszletes magyarzatt az egyes statisztikai
teszteknl kln trgyaljuk). Amikor nem talljuk megalapozottnak az egybknt igaz
H1-et, akkor msodfaj hibt kvetnk el: vizsglatunk lnegatv eredmnyre vezet.
Olyan helyzet is addhat, amikor a vizsglatunk eredmnye p < 0,02, teht elg kicsinek tnik a H0 valsznsge, s elvetjk (egyben elfogadjuk H1-et), annak ellenre,
hogy H0 volt igaz. Ha az egybknt megalapozatlan H1-et elfogadjuk, akkor elsfaj
hibt kvetnk el: vizsglatunk lpozitv eredmnyre vezet. Ennek magyarzata szintn
a szlssges mintasszettel.
Az els s msodfaj hibval kapcsolatban le kell szgezni, hogy ezek nem a vizsglatot vgz ltal elkvetett hibk, hanem a dntsi folyamat termszetbl kvetkeznek. Egy minden szakmai szablyt tiszteletben tart, lelkiismeretesen elvgzett vizsglat eredmnye is lehet hibs statisztikai kvetkeztets.
Teljes populci vizsglata helyett szelektlt mintn vgzett vizsglat generlja a hibt! Ha nagyon sok azonos szm mintt vlasztunk ki a teljes populcibl, akkor ezek
tbbsge hasonl (de nem azonos) sszettel lesz, mint maga a populci, de pusztn
a vletlennek ksznheten, akad nhny szlssges sszettel minta is. A legjobban
felkszlt kutatcsoport is tallkozhat extrm mintval, s hozhat rossz dntst a helyesen szmtott statisztikai eredmnyekre tmaszkodva, az abszolt korrekt vizsglata vgn. Azt ugyanis egy vizsglat elvgzse utn nem tudjuk megmondani, hogy az ppen
vizsglt minta tipikus volt vagy szlssges.
Ezrt nem lehet nmagban egy vizsglat eredmnye alapjn egy kutatsi krdst
megnyugtatan megvlaszolni, mg akkor sem, ha nagyon jl vezetett a vizsglat.
Ugyanazt a krdst tbbszr is meg kell vizsglni (megerst jelleg vizsglatokat kell
vgezni) ahhoz, hogy kpet alkossunk az eredmnyek eloszlsa alapjn arrl, hogy milyen is H1 megalapozottsga.

Els- s msodfaj hiba


A tapasztalat az, hogy sszessgben s ltalban a fenti dntsi mechanizmussal ksbb helyesnek bizonyul gyakorlati lpseket tudunk megalapozni. De sajnos nem
38

39

Biostatisztika

Biostatisztika

Statisztikai tesztek

Csoportok kztti sszehasonlts

A p-rtk generlsra statisztikai tesztek szolglnak. Ezek egy specilis vizsglati helyzetre (pl. kt tlagrtk sszehasonltsra, csoportokban megfigyelt gyakorisgok sszehasonltsra, kt folytonos vltoz kztti kapcsolat erssgnek meghatrozsra
stb.) kidolgozott statisztikai mrszmot (teszt-statisztikt) lltanak el. A mrszm
nagysga attl fgg, hogy vletlenszer vagy lnyeges a vizsglt csoportok kzti eltrs, vagy a vizsglt paramterek kzti kapcsolat. A mrszmok egy ponton (kritikus rtk) tl mr a szignifikns hatst jelzik. A kritikus rtkeket tblzatokban talljuk meg
(az internetrl brmelyik knnyen elrhet), vagy szmtgpes program segtsgvel
szmthatjuk.
A mrszmokat gy dolgoztk ki, hogy azok valamilyen ismert eloszlst (pl. t-, 2-,
F-eloszlst) kvessenek. Az eloszlsfggvnyek segtsgvel hatrozhatjuk meg azokat
a pontokat, amin tl mr vletlennel nem magyarzhat, azaz 5%-nl kisebb valsznsggel fordulnak el a teszteredmnyek, ha a H0 igaz. Ha szmtgpes programot
hasznlunk (alapveten ez a helyzet), akkor a szmtsok mennyisge nem korltoz
minket. Ezrt nem csak a kritikus rtkhez tudjuk hasonltani a teszteredmnyt, hanem
azt is szmthatjuk, hogyH0 esetn a teszt milyen valsznsggel vezet a szmtott rtknl extrmebb eredmnyre. Vagyis megadhatjuk, hogy mekkora a valsznsge annak, hogy ha nincs szignifikns klnbsg a vizsglt csoportok kztt, vagy nincs szignifikns kapcsolat a vizsglt paramterek kztt, akkor a teszt eredmnye nagyobb lesz
annl, mint amit a mintnk adatai alapjn szmtottunk. (Pldul, ha 2-prbt vgznk,
akkor a minta jellemzi alapjn egy 2-fggvnyt tudunk megadni. Ez a fggvny azt
mutatja meg, hogy ha nagyon sokszor elvgeznnk ugyanazt a vizsglatot, mint ami a
2-rtket eredmnyezte, csak mindig ms mintn, akkor a klnbz teszteredmnyek
milyen gyakorisggal fordulnnak el, ha H0 igaz. Ennek a fggvnynek az ltalunk
szmtott 2-helyen vett rtke alapjn kapjuk meg a keresett p-valsznsget.) Ennek
alapjn termszetesen pontosabb statisztikai kvetkeztetst tudunk levonni, mintha csak
tblzatokat hasznlnnk.

A ksrletek vagy megfigyelsek sorn gyjttt adatokat legalapvetbben kt csoportra lehet osztani a biostatisztikai feldolgozs menete szempontjbl. Egyfell kvantitatv (valamilyen folytonos skln mrt) adatokkal dolgozhatunk (vrnyoms, szrum
HDL-szint, FEV1 stb.). Msfell (kett vagy tbb) kategriba rendezett, kvalitatv
adataink lehetnek (dohnyzsi szoksok gyakorisga, a gygyszerrel szemben allergisok rszarnya, 5 ves tllk szzalka stb.) Folytonos vltozk elemzsekor ltalban
abbl a krlmnybl indulunk ki, hogy ezek az adatok normlis eloszlst mutatnak. Ez
az eloszls tlaggal s szrssal lerhat, mely paramterek vizsglatval oldjuk meg a
csoportok kzti klnbsgek (vletlennel magyarzhat, vagy vletlennel nem magyarzhat) termszetnek rtkelst. Kvalitatv adatok esetben nem az eloszls paramtereinek elemzse, hanem az egyes kategrikba sorolt esetszmok, illetve az esetszmokhoz tartoz gyakorisgi adat kzvetlen rtkelse a biostatisztikai eljrs alapja.
Ilyen vltoztpusnl maguk a gyakorisgi adatok sszegzik a vizsglati eredmnyek
eloszlst amint a folytonos vltozk esetben ezt az eloszls-paramterek teszik.

Kt csoport kvantitatv adatainak sszehasonltsa


Az egyik legltalnosabb biostatisztikai feladat az, amikor kt, valamilyen szempontbl eltr (klnbz kezelsben rszesl, a betegsg klnbz stdiumban lev,
klnbz genetikai rzkenysg) csoport kzti biolgiai, klinikai klnbsget szeretnnk rtkelni. Ha a vizsglt biolgiai/klinikai jelleg folytonos vltozknt mrhet (pl.
vrnyoms, szrum-kreatininszint, carotis-falvastagsg), akkor ezt legegyszerbben a
csoportok (a, b) tlagainak sszehasonltsa rvn tehetjk meg:
k = xa xb .

A vizsglat termszetesen kt mintn zajlik. Emiatt az a s b kezelsben rszesltekre,


expozcinak kitettekre stb. valban jellemz tlagot csak tbb-kevesebb pontatlansggal tkrzik az tlagok. Emiatt az tlagok kzti klnbsg is csak kzelti az a-ra s
b-re jellemz vals tlagok kzti klnbsget. Mrpedig termszetesen mi mindig a
40

41

Biostatisztika

vals klnbsgre vagyunk kvncsiak, hiszen


a vizsglat alapkrdsnek megvlaszolsval
valamilyen gyakorlati beavatkozst szeretnnk
megalapozni.
Kt mintt vizsglva szinte soha nem kapunk szmszeren egyenl tlagot. nmagban
ez nem gyz meg minket arrl, hogy a klnbsg ltalban is megvan. (Valamilyen klnbsget mindig ltunk!) Szeretnnk tudni, hogy ha
sokszor megismtelnnk az adatgyjtst, akkor
is hasonl irny s mrtk lenne-e az tlagok
kzti klnbsg.
A sokszor megismtelt ksrlet sorn annl szlesebb tartomnyon bell varildnak
az tlagrtkek, minl nagyobb szrdsak
az eredeti vizsglati eredmnyek. Ha nagy a
csoportokra jellemz variabilits, akkor mg
viszonylag jelents klnbsg esetn sem gondoljuk azt, hogy ismtelt vizsglat esetn is
biztosan hasonl eljel s mrtk eltrst
ltnnk. Ha kicsi a variabilits, akkor mr szerny eltrst is a csoportok kzt meglv valdi
klnbsg jeleknt tudunk rtelmezni. Vagyis a
kt csoport tlaga kzti klnbsg csak az tlagok klnbsgnek variabilitsa fggvnyben
rtkelhet (8. bra).
Ugyanakkora tlagklnbsg kis szrs
adatoknl kevs ktsget hagy a csoportok kzt
meglv lnyeges eltrst illeten. A szrds
nvekedsvel egyre bizonytalanabb vlik a
benyomsunk. Amikor a 8. brn szerepl hisz-

Biostatisztika

togramok mr jelents mrtkben tfednek, kevs ktsgnk lesz afell, hogy nincs
lnyeges eltrs a vizsglt csoportok kzt.
Az tlagok k klnbsgt a szrds mrtkhez viszonyt mrszm szrmaztatshoz az a s a b csoport vizsglati eredmnyeinek varianciit (Va, Vb) hasznljuk:
.
Mivel a k kt csoport adatainak egyttes felhasznlsval ellltott statisztikai mrszm, variabilitst a kt csoport varianciinak mintanagysggal (pontosabban a mintk szabadsgi fokval) slyozott kzs variancijval kell szmtanunk (Vk ):
Vk =

Vk =

(na

(na 1)Va + (nb 1)Vb


,
(na 1 + nb 1)
( xb xb ) 2
xa ) 2

+ (nb 1)
,
(nb 1)
(na 1)
(na 1 + nb 1)

(x
1)

Vk =

(x

xa ) 2 + ( xb xb ) 2
.
(na + nb 2)

A kzs variancia mutatja meg, hogy sokszor ismtelt vizsglat k eredmnyei milyen mrtkben szrdnnak. (Az ismtelt vizsglatok alkalmval k szrdst nagyobb
mrtkben hatrozn meg az a csoport, aminek nagyobb a ltszma. Ez tkrzdik a
szabadsgi fok szerinti slyozsban.)
A variancik s a mintk elemszma hatrozza meg a csoporttlagok standard hibjt:
...........

Ehhez hasonlan a k klnbsg standard hibjt a kzs variancia s a kt csoport


elemszma egyttesen hatrozza meg:
8. bra. Az tlagok vltozatlan klnbsge (k = 10)
eltr szrs mellett
42

43

Biostatisztika

Biostatisztika

A k klnbsg 95%-os megbzhatsgi tartomnyt ezek alapjn megadhatjuk (a


t-rtk szabadsgi foka a szmtsok sorn a vizsglati eredmnyek mellett felhasznlt
kt csoporttlag miatt na + nb 2):

klnbsgnek. Ha ez a hnyados nem elg nagy, akkor azt gondoljuk, hogy ismtelt
vizsglatokban ppen ellenkez eljel eltrst is lthatnnk. A kt csoportot nem tekinthetjk eltrnek.
Az elg nagy klnbsg rtelmezst a k standardizlsval tehetjk egyszerv,
amikor a standard hiba rvn a klnbsget egysgnyi variabilits-mrtkegysgben
fejezzk ki! A standardizlt klnbsg, azaz a t-rtk:

.
Ha ez a tartomny tartalmazza a 0-t (als hatra negatv szm, a fels hatra pozitv), akkor a vizsglatunk alapjn nem tarthatjuk kizrtnak, hogy: (1) a vals eltrs a kt
csoport tlaga kzt ppen ellenkez eljel, mint amit a sajt vizsglatunkban lttunk,
(2) valjban nincs semmi eltrs a kt csoport kzt (erre utal, hogy a vizsglat alapjn
a k = 0 a valszn eredmnyek kzt van). Ha a 95%-os megbzhatsgi tartomny nem
tartalmazza a 0-t, akkor a klnbsg nagysgrl ugyan nem lesz pontos kpnk (arrl
csak annyit tudunk, hogy az nagy valsznsggel a 95%-os megbzhatsgi tartomnyon bell van valahol), de azt azrt meg tudjuk llaptani, hogy valban van eltrs a
kt csoport kzt (hiszen minden valszn vizsglati eredmny szerint hasonl eljel
az eltrs a csoportok kzt, mint amit a sajt vizsglatunkban is talltunk, 9. bra).
A klnbsget kzvetlenl is viszonythatjuk sajt variancijhoz. Ha ez a statisztikai mrszm kellen nagy, akkor az meggyz minket arrl, hogy az ltalunk tallt k
klnbsg nem a vletlennek tulajdonthat, hanem a csoportok kzt meglev lnyeges

9. bra. Az els vizsglati eredmny szerint a 95% MT vgig pozitv tartomnyban van. Minden
valszn k rtk arra utal, hogy pozitv eljel az eltrs a csoportok tlagai kzt: biztosak lehetnk abban, hogy a sajt vizsglatunkban kapott pozitv klnbsg nem a vletlennek ksznhet. A msodik vizsglatban a 95% MT a kt csoport kzti klnbsg hinyra utal 0-t s a kt
csoport kzti negatv eljel klnbsget is valsznst negatv rtkeket tartalmaz: ebben az
esetben azt gondoljuk, hogy pusztn a vletlennek ksznhet, hogy sajt vizsglatunkban pozitv eljel volt a klnbsg

Ha a standardizlt klnbsg nagyobb a kritikus t;df rtknl, akkor meggyzen


nagynak tekintjk az eltrst. Ha ennl kisebb a statisztikai mrszm, akkor mg nem
tekintjk szignifiknsnak a klnbsget. Az adott dntsi kszbnek s szabadsgi
foknak megfelel t-rtket tblzatbl kereshetjk ki, vagy a szmtgp segtsgvel
szmthatjuk ki. A t-rtk kiszmtsn alapul hipotzistesztels a t-prba (vagy Student-prba). A fentebb ismertetett formja a ktmints t-prba, ami arra utal, hogy kt
kln minta vizsglata sorn nyert tlagokat hasonltottunk ssze a segtsgvel.
Az asztms gyerekek kpzsnek segtsgvel elrhet, hogy a gyerekek jobban rt2. tblzat
sk llapotukat, s sajt maguk gondozsban
Oktats nem
Oktatsban
rszt vllaljanak. Az oktatsi protokollok hat
volt (b)
rszesltek (a)
konysga azonban klnbz, ezrt vllalkoz 3
2
tak egy j kpzsi protokoll hatkonysgnak
4
2
tesztelsre. 10 gyermeket vettek fel a kpzsi
6
4
programba (a), 12, oktatsban nem rszes 8
8
l gyermek kpezte a kontrollcsoportot (b).
5
6
A gyermekek slyos rosszullteinek szmt a
1
7
szlk napli segtsgvel llaptottk meg. A
8
5
2. tblzat mutatja a 12 hnap alatti rosszull 7
1
tek szmt.
7
6
Az oktatsban rszesltek tlagos ros 8
3
szulltszma 4,4 volt (SD = 2,37; variancia =
6
5,60). A kontrollcsoportban pedig 5,36 (SD =
3
2,32; variancia = 5,36). A kpzett csoportban

44

45

Biostatisztika

Biostatisztika

1,1-gyel kisebb volt az tlag. A kzs variancia 5,47, a klnbsg standard hibja 1,001
volt.

Ugyanezt a szmtsi mdot kvetjk, ha a kezels eltti s utni llapotot ler


eredmnyek nem ugyanabbl a szemlybl, ksrleti llatbl, in vitro rendszerbl szrmaznak, de a prba rendezett vizsglati alanyok kellen hasonlak ahhoz, hogy a kezelt
vs. nem kezelt klnbsget a prok kzt meglev egyb eltrsek ne befolysoljk.
Ilyen vizsglati elrendezsben is a prok kzti eltrs alapjn vonunk le statisztikai kvetkeztetst.
A t-prbk kiindulsi lpse a variancik szmtsa, amit a normlis eloszlst mutat
vltozkra vonatkoz kplet segtsgvel tudunk szmtani. A t-prba alkalmazsnak
ezrt alapfelttele, hogy az adatok normlis eloszlsak legyenek. (Ezt ellenrizni is
kell az alkalmazs eltt; pl. KolmogorovSzmirnov-prbval.) Ha kt fggetlen mintk
van, abban az esetben tovbbi felttel, hogy a kt csoportban gyjttt adatok variancija
egyenl legyen, azaz homoszkedasztikus legyen a vizsglati helyzet. (Ezt is ellenrizni
kell az alkalmazs eltt; pl. F-prbval.) Ha kt variancia nem egyezik, akkor a kzs
variancia szmolsakor nem hasznlhat a szabadsgi fokokkal slyozott varianciatlag. Helyette a csoportonknt kln-kln szmtott variancik sszegt kell szmtanunk. Vagyis az alapstatisztika, a t-rtk szmtsa nmileg vltozik:

A t = 1,098 kisebb volt, mint a kritikus rtk (t[0,05;20] = 1,098), azaz az eredmnyt nem
tudjuk az oktatsi protokoll hatkonysgnak bizonytkaknt felhasznlni, mg akkor
sem, ha ltjuk, hogy kevesebb volt a kpzsben rszesl gyerekek kzt a komplikcik szma.
Gyakran elfordul, hogy egy kezels hatkonysgt gy tudjuk vizsglni, hogy a
betegek kezels eltti s utni llapott mrjk fel. Elvileg lehetsg volna arra, hogy a
kezels eltti s utni adatokat a ktmints t-prba segtsgvel hasonltsuk egymshoz,
s ezltal rtkeljk a kezels hatkonysgt. Az nkontrollos vizsglatban azonban
ennl hatkonyabb rtkelsre is van lehetsg. A hatkonysgnvekeds (kisebb hatsok kimutatsra val kpessg) alapja, hogy prba rendezett adatok, adatprok alapjn
szmolt eltrseket (d) rtkelnk:
d

d
= .
N

Egyszeren, az ltalnos kplet alapjn adhat meg a variancija, standard hibja,


illetve maga a t-rtk, a standardizlt klnbsgtlag:
Vd =

Az gy kapott t-rtkhez kapcsold szabadsgi fok:

(( ((

2.

(d d ) ,
N 1

Tbb csoport kvantitatv adatainak sszehasonltsa

A t teszt-statisztikai rtkelse teljesen azonos mdon zajlik, mint a kt fggetlen


csoport sszehasonltsn alapul elemzsnl. Az sszes eltrs az, hogy itt a szabadsgi fok N-1 (hiszen itt csak 1 tlagrtket hasznltunk a t-rtk kiszmtshoz).

Ha tbb csoport eredmnyeinek elemzse rvn szeretnnk valamilyen kvetkeztetst


levonni, akkor tapasztaljuk, hogy a kt csoport sszehasonltsra kidolgozott mdszerek tulajdonkppen alkalmazhatk. Ha pldul 5 csoportot vizsglunk, akkor pronknt
elemezhetjk a csoportok kzti klnbsgeket: 10 t-prba rn tudunk kvetkeztetst
levonni. [k-csoport esetn k(k 1)/2 prelemzst kell vgrehajtani]. Azonban elvgezve
a teszteket nehzsgbe tkznk a szignifikns eredmnyek rtelmezsekor. Nem lesz

46

47

Biostatisztika

Biostatisztika

egyrtelm, hogy a pozitv eredmny valban lnyeges csoportok kzti klnbsgnek


tulajdonthat, vagy csak a tbb statisztikai teszt sszeadd hibjaknt ltrejv, lpozitv eredmny.
A statisztikai jelleg kvetkeztetseink 5%-os elsfaj hibval terheltek. Ahny statisztikai kvetkeztetst vonunk le egy adott vizsglat sorn, annyiszor felmerl ennek
az 5%-os hibnak a lehetsge. 10 vizsglat esetn mr 10 5% = 50% az elsfaj hiba
valsznsge (50% annak a valsznsge, hogy akkor is szignifikns klnbsget ltunk a tesztek vgeredmnyeknt, ha egybknt semmilyen hatst nem fejt ki a vizsglt
befolysol tnyez). Emiatt, lnyeges eltrsre utal teszteredmny esetn, kt magyarzat is felmerl: (1) vagy tnyleges eltrst mutatott ki a teszt, (2) vagy a sok tesztels
miatt megnvekedett hibalehetsg miatt ltunk statisztikailag szignifikns eredmnyt.
Elz esetben a gyakorlati kvetkeztetsnk az, hogy a kt csoport kzti eltrsre val
tekintettel beavatkozsokat kezdemnyezhetnk. Msodik esetben az, hogy a klnbsg csak ltszlagos s gyakorlati kvetkeztetst nem alapozhatunk a vizsglatunk eredmnyre. A krdst ebben a formban teht nem tudtuk megoldani ezzel a mdszerrel.
Megoldsi lehetsget jelent, ha a tesztelt prok szmhoz igazodva szigorbb dntsi kszbket alkalmazunk. Ha 5 csoportunk van, s 10 pr kzti eltrst kell tesztelnk, akkor 0,05/10 = 0,005 dntsi kszbt alkalmazva minden egyes t-prbnl,
sszessgben a vizsglat elsfaj hibja 5% lesz. Emiatt az lpozitv teszteredmnyek
megnvekedett valsznsge nem terheli a kvetkeztetseinket. Ennek az ra, hogy
jelentsen cskkent az egyes prok kzti klnbsg kimutatsra jut statisztikai rzkenysg: kisebb az eslynk arra, hogy a valban meglev klnbsget szlelni tudjuk.
A tbbszrs hipotzistesztels nll fejezete a biosztatisztiknak. Ennl az egyszer
dntsi kszb korrekcinl (Bonferoni-korrekci) hatkonyabb mdszerek is rendelkezsre llnak, de ezek ismertetse meghaladja az alapoz tanfolyamok kerett.
A prok elemzse helyett rdemes visszanylnunk ahhoz a ponthoz, hogy valjban
mirt is kezdemnyeztk a vizsglatot? Voltakppen nem az az alapkrdsnk, hogy
egyes kezelsi csoportok kzt vannak-e eltrsek, hanem az, hogy az alkalmazott eljrs hatkony-e. Ha a hatkonysgra mr van bizonytkunk, akkor lehet feltenni kvetkez krdsknt, hogy melyik dzisban hatkony, s melyikben nem. Az els krds
megvlaszolshoz az elz fejezetben trgyalt mdszerekhez kpest j statisztikai eljrst kell kialaktanunk, melynek alapgondolata, hogy azt kell megrtennk s elemeznnk, hogy milyen tnyezk hatsra alakul ki az egyes vizsglati rsztvevk mrsi
eredmnye.
Teljesen termszetesnek vesszk, hogy mg a teljesen azonos dzisokkal kezelt betegek esetben sem ugyanazt a terpis hatst ltjuk. Termszetesnek vesszk, mert

tudjuk, hogy a biolgiai rendszerek rendkvl sszetettek, sok szablyozottan mkd


rendszer egyttes hatsnak az eredje minden lettani paramter. Mivel a vizsglati
alanyok klnbzek, a vlaszaik is klnbzek lesznek. Ez az egyni variabilits jellemz minden biolgiai rendszerre.
Ha egy betegcsoportot kezelnk, akkor a hatkony kezels hatsra elmozdul a betegekben a terpis hatst kifejez paramter: a csoporton bell szrd mrsi eredmnyek tlaga kedvez irnyba fog eltoldni. Ezrt, ha a beavatkozs hatst szeretnnk
igazolni, akkor az tlagok elmozdulsra kell bizonytkot tallnunk.
Minl nagyobb az egyni vlaszok variabilitsa, annl szlesebb a mrsi eredmnyek szrdsa, s annl nehezebb az tlag elmozdulst bizonytani. Kicsi variabilits esetn a viszonylag kicsi tlagrtk-eltolds is meggyz minket arrl, hogy a
beavatkozs hatkony volt, megvltoztatta a mrt paramtert; nagy variabilits esetn
mr csak nagyobb tlagrtk-vltozs esetn lesz az a benyomsunk, hogy volt hatsa a
kezelsnek. A vltozkonysg fggvnyben tudjuk teht rtkelni az tlagok eltrst.
Ha egy gygyszer klnbz dzisaival (Da, Db, Dc, Dd, Da) kezelnk azonos klinikai llapot betegeket, akkor minden csoporton bell bizonyos variabilitst mutatnak
a kezelsi eredmnyek. Ezt a kezelsi csoporton belli variabilitst a csoporton belli
,
tlagtl (x
xb,
xc,
xd) val eltrs ngyzetnek sszegvel tudjuk legegyszerbben lerni
a
(ngyzetes eltrsek sszege, sum of square; SS):

48

49

.
Ha a kezels nem hatkony, akkor a csoportokon belli tlagok nem trnek el egy) fejezi ki a vizsglt
mstl. Ilyen esetben az sszes kezelt betegre szmtott tlag (x
t
klinikai paramter tlagrtkt:

x =
x =
x =
x =
x.
a

Ebben az esetben a csoportokon bell szmtott ngyzetes eltrsek sszege is szmthat gy, hogy a csoporton belli tlagot a teljes betegcsoport tlagval helyettestjk:
.
Mivel minden egyes beteg esetben meghatroztuk az tlagtl val eltrs ngyzett, s ugyanazt az tlagot hasznltuk mindig, a ngy csoportban mrt ngyzetes eltr-

Biostatisztika

Biostatisztika

sek sszege ugyanazt a szmot adja, mintha az egyes betegek eredmnyeit a teljes vizsglati csoport tlaghoz viszonytva szmtottuk volna a ngyzetes eltrsek sszegt:

Felhasznlva a variabilitssal kapcsolatos gondolatmenet eredmnyeit, azt mondhatjuk, hogy akkor gyz meg minket a vizsglat a beavatkozs hatkonysgrl, ha a
csoportok kzti variabilits nagyobb, mint a csoportokon belli. Ha a csoportok kzti
variabilits kicsi a csoporton belliekhez viszonytva, akkor ez amellett szl, hogy nem
befolysolja a kezels a klinikai eredmnyt.
Valamilyen mdon teht a klnbz variabilitsi adatokat egymshoz kell hasonltanunk. Lehetne egyszeren a ngyzetes eltrsek sszegnek hnyadosait hasznlni.
A megolds kzenfekv, de nem j! A ngyzetes eltrsek sszege ugyanis nem csak
attl fgg, hogy milyen mrtk a vizsglati eredmnyek szrdsa, hanem attl is,
hogy hny beteg volt egy-egy csoportban. (Nagy csoport kicsi variabilits eredmnyei
ugyanakkora ngyzetes eltrs sszeget adhatnak, mint a kis csoport nagy variabilits
adatai. Hasonlan elmondhat ez a csoportok kzti variabilitsrl is: sok csoport kzti kis eltrs ugyanakkora ngyzetes eltrs sszeget adhat, mint a kevs csoport kzti
jelents eltrs.) Valamilyen mdon teht figyelembe kell venni a csoportnagysgot,
pontosabban azt a szmot, ami megmutatja, hogy hny fggetlen adat felhasznlsval
kaptuk a variabilitsi mrszmokat, azaz a szabadsgi fokokat.
A csoportokon belli variabilits szmtsa esetn egyszer a helyzet. Itt az tlagrtkhez viszonytva szmtottuk a ngyzetes eltrsek sszegt. Emiatt az utols beteg
esetn az elz betegek adataibl s az tlagbl mr pontosan tudjuk az eredmnyt. Ennek az egy betegnek az adata mr nem ad j informcit az elemzshez (ha az adata
elveszne, de az tlag megmaradna, akkor ennek az egy betegnek a mrsi eredmnye
mg pontosan kiszmthat lenne). A szabadsgi fok teht a pldnkban szerepl ngy
csoportra:

.
Ha viszont a kezels hatkony, akkor az tlagrtkek nem egyenlk (pontosabban vannak kztk klnbzek, ami miatt mg lehetnek kztk egyenlk is). Ilyen esetben a
csoportokon bell a ngyzetes eltrssszegek szmtsakor nem hasznlhatjuk a teljes
betegcsoportra jellemz tlagot, s a csoportokon bell szmtott ngyzetes eltrsek
sszege nem is lesz egyenl az sszes vizsglatba vont beteg eredmnynek s a teljes
csoport tlagnak felhasznlsval szmtott teljes variabilitssal:
.
Az egyes betegek vizsglati eredmnyei rszben a kezelstl fggenek, rszben
mindazoktl az egyni jellemzktl, amelyek befolysoljk a vizsglt klinikai paramtert, de amelyet a vizsglatunkban nem vettnk figyelembe. A vizsglati eredmnyek
teljes variabilitsa ebbl a kt forrsbl szrmazik. A kezelsi csoportokon bell megfigyelhet variabilits fggetlen a kezelstl, hiszen a csoporton bell minden beteg
azonos elltsban rszeslt. A csoportok kzti tlagok klnbsgei fejezik ki a kezels
okozta variabilitst. A teljes variabilits teht felbonthat a csoportokon belli (Si) s a
csoportok kzti (Se) komponensre:
.
A csoportokon belli s a teljes vizsglt betegcsoportra vonatkoz ngyzetes eltrssszeget szmthatjuk a fentebb mr emltett kpletek segtsgvel. A csoportok kzti
variabilitst pedig egyszeren ezek klnbsgeknt kapjuk meg:

.
A csoporton belli teljes variabilits szmtsakor (Si) ezeket a csoportonknti szabadsgi fokokat kell sszegezni. A csoporton belli variabilits szabadsgi foka:

A variabilits elemzst azrt kezdtk, mert arra gondoltunk, hogy ha a csoportok


kzti tlagok kzti klnbsg nagy a vizsglt csoportokon belli adat variabilitshoz
kpest, akkor az meggyz minket arrl, hogy a beavatkozs hatkony. Ha az tlagok
kzti eltrs kicsi az adat variabilitshoz viszonytva, akkor ez amellett szl rv, hogy
a kezels nem volt hatkony, s a ltott eltrs pusztn vletlennel magyarzhat.

ltalban, ha a vizsglt csoportok szma k, akkor k alkalommal kell kivonni 1-et az


elz egyenletben, s az egyes csoportelemszmok sszessgben a teljes minta nagysgt (nt) adjk. Ezrt az ltalnos helyzetre vonatkoz szabadsgi fok:

50

51

Biostatisztika

Biostatisztika

A csoporton belli szabadsgi fokhoz viszonytott ngyzetes eltrsek sszege (ami egyszeren variancia, de hvjk mg a ngyzetes eltrsek tlagnak is, mean squares, MS):

A kritikus F-rtket termszetesen szmtgp segtsgvel is szmthatjuk. Igazbl nem is nagyon rdemes a tblzatokat forgatni, amikor egy konkrt feladatot oldunk
meg. A varianciaelemzs gondolatmenethez viszont a tblzatok hozztartoznak, ezrt
ezek hasznlatt rteni kell.
A fenti varianciaelemzs (analysis of variance, ANOVA) eredmnyeit szoks tblzatos formban sszefoglalni (3. tblzat). Ez a tblzat kiegszl mg az adott helyzetre vonatkoz kritikus F-rtkkel (ami azt mutatja meg, hogy a szban forg, nt elemszm vizsglatnl k csoportba rendezett vizsglati alany esetn legalbb mekkornak
kell lennie a csoportok kzti variancinak a csoporton bellihez viszonytva, ahhoz,
hogy legalbb 95%-os bizonyossggal llthassuk, hogy hatsos a kezels). Ha szigorbb dntsi kszbt kvetel meg a vizsglati helyzet, akkor magasabb lesz a kritikus
F-rtk (a csoportok kzti klnbsgnek nagyobbnak kell lennie, mintha csak 95%-os
bizonyossggal szerettnk volna valamit megllaptani.)
Szmtgpek segtsgvel termszetesen nem csak kritikus F-rtket tudunk szmtani, hanem azt is meg tudjuk hatrozni, hogy az elemzs sorn szmtott varianciahnyados (F-rtk) milyen dntsi kszb esetn szmt kritikus rtknek. (Milyen
kritikus rtkre szmtott F-tblzatbl tudnnk kiolvasni a vizsglatunkhoz tartoz
F-rtket!) Ebben az esetben mr egy p-rtk szmtsrl, s F-rtkek sszehasonltsa helyett F-prbrl beszlhetnk. (Ahol kt variancia hnyadost a nekik megfelel
szabadsgi fokok fggvnyben sszevetve megllaptjuk, hogy a szmllban lv variancia szignifiknsan nagyobb-e, mint a nevezben lv.)
sszessgben teht elmondhatjuk, hogy ha kettnl tbb csoportot alaktottunk ki
a vizsglatunk sorn, s arra vagyunk kvncsiak, hogy a kezels (amit klnbz dzisokban alkalmaztunk) hatkony-e, akkor a varianciaelemzssel olyan mdon tudjuk

.
A teljes variabilitsra a szabadsgi fok ugyanazzal a gondolatmenettel vezethet le,
mint a csoporton belli variabilits esetn. Itt sem ad mr egy beteg adata informcit a
mutat kiszmtshoz. Ezrt a szabadsgi fok s a variancia ebben az esetben:

.
A csoportok kzti variabilits szmtsakor k csoport tlagrrtkeinek ftlagtl
val eltrst rtkeljk. A k tlagbl is egyet veszthetnnk el bntetlenl, ha a teljes
vizsglat tlagos eredmnye megmaradna. Ezrt a csoportok kzti variabilits szabadsgi foka s a variancia:

.
A variancik rtke mr a vizsglt elemek szmtl fggetlenl kifejezi, hogy mekkora az elemi adatok szrdsa. Ezek segtsgvel kzvetlenl viszonythat egymshoz a csoportok kzti s a csoportokon belli variabilits, egyszeren a variancik
hnyadost kell szmtanunk. Ha ez a hnyados kellen nagy, akkor az a kezels hatkonysgnak a bizonytka. Ha ez a hnyados kicsi, akkor ez az ellen szl, hogy a
kezels hatkony volt.
Mr csak azt a krdst kell megvlaszolnunk, hogy mikor tekinthet egy varianciahnyados kellen nagynak? Ennek a megvlaszolsa olyan matematikai ismereteket ignyel, amelyeket eddig prbltuk megkerlni, amikor a biostatisztikai problmk megoldsi lehetsgeirl gondolkodtunk. Itt is elkerljk a matematikai vlasz
ismertetst, s csak utalni tudunk a valsznsg-szmtssal foglalkoz tanknyvekre.
Ugyanakkor felhasznljuk az ilyen knyvek vgn tallhat tblzatot, ami kzli a kritikus hatrvonalnak szmt rtket a szabadsgi fokok s a dntsi kszb fggvnyben (http://www.socr.ucla.edu/Applets.dir/F_Table.html). A kritikus rtknl nagyobb
varianciahnyadost rtelmezzk kellen nagynak.
52

3. tblzat. Az ANOVA-tbla ltalnos szerkezete


Variabilits
forrsa

Variabilits (ngyzetes
eltrsek sszege, SS)

Csoportok kzti
variabilits (e)

SSe = SSt SSi

Csoporton belli
variabilits (i)

SSi = SSa + SSb + ... + SSk

Teljes
variabilits (t)

Szabadsgi
fokok

Variancia (tlagos ngyzetes


eltrs)

Varianciahnyados (F)
F=

MSi =

53

SSa + SSb + ... + SSk


nt k

MSe
MSi

Biostatisztika

a krdst megvlaszolni, hogy fel sem merl a tbbszrsen alkalmazott t-prbval


kapcsolatban emltett dntsi hiba krdse. Ilyen helyzetekben teht egyrtelmen ez a
preferland biostatisztikai mdszer.
Ha a varianciaelemzs szerint nincs hatsa a kezelsnek, akkor az adott kezelsrl
valban azt gondolhatjuk, hogy nem kpes befolysolni a betegek llapott. De ha a varianciaelemzs szerint van hatsa a kezelsnek, akkor addik a kvetkez krds, hogy
milyen csoportokban volt hatsos, s milyen csoportokban nem volt hatsos a kezels.
Ezt a szignifikns eredmnyre vezet alapelemzst kveten feltett krdst clszer
mr a Bonferoni-korrekcival vgzett t-prba segtsgvel tisztzni (post-hoc elemzs).
A varianciaelemzs alkalmazsnak az alapadatok eloszlsra vonatkoz elfelttelei vannak. Gondolatmenetnek bemutatsakor abbl indultunk ki, hogy a vizsglt
adatok normlis eloszlst mutatnak, s ennek megfelelen vlasztottunk kpleteket a
variabilits s a variancia szmtshoz. Emiatt a normlis eloszls ellenrzse a varianciaelemzs elfelttele.
Amikor a csoportokon belli variabilitst sszegeztk, s egyszeren sszeadtuk a
csoportonknti ngyzetes klnbsgsszegeket, akkor nem beszltnk arrl, hogy ha
jelents az eltrs az egyes csoportokon belli varianciban, akkor ezek sszevonsa
kerlend. Ezrt a varianciaelemzs msik felttele, hogy legyenek egyformk a csoportokon belli variancik. (Ennek a felttelnek nem kell szigoran megfelelni, de a
nagy varianciaeltrsek esetn tulajdonkppen az a legfontosabb krds, hogy mi lehet
az oka, milyen mechanizmus rvn, milyen folyamat miatt alakul ki jelents csoportok
kzti varianciaklnbsg. Az egyik dziscsoportban mirt szrdik jobban a betegek
reakcija, mint a msikban? Nem kerltek-e a vizsglatba specilis llapot betegek?
Nincs-e valamilyen interakci egyes dzistartomnyokban olyan gygyszerekkel, genetikai fogkonysggal, krnyezeti expozcival, aminek a vizsglatra egybknt nem
terjedt ki a ksrletvezetk figyelme?)
j rtgt eszkzk kialaktshoz 4 j
fmtvzetet fejlesztettek ki. A hagyomnyos
tvzetet kiegsztettk egy adalkanyag klnbz koncentrcijt alkalmazva (A: 0,1%,
B: 0,5%, C: 1%, D: 5%), s ugyanolyan krlmnyek kzt ptik be a bellk kszlt stenteket. Ezt kveten az erek megfelel kapacits

Biostatisztika

tjrhatsgnak idejt (nap) regisztrltk. A 4. tblzat az egyes


stentek esetben regisztrlt napok
szmt sszegzi. A csoportok kzti tlagos idtartamok dzis-hats
kapcsolatot mutattak a grafikonon
(10. bra).
A varianciaelemzs sorn nyert
adatok szerint (5. tblzat) a relatv csoportok kzti variancia (F =
3,116) nagyobb, mint a kritikus rtk (F(0,05;3;75] = 2,727). A csoportok
kzt teht nagyobb a klnbsg,
mint amit pusztn a vletlennel
meg lehetne magyarzni, azaz az
adalkanyag koncentrcija hatssal volt a kezelsek eredmnyre.
A magasabb koncentrcikhoz trsul jobb eredmnyek alapjn rdemes hasznlni az adalkanyagot.

4. tblzat
A

98

14

86

25

126

73

124

401

102

70

82

81

98

378

169

86

76

38

211

552

150

65

275

321

52

33

13

236

20

47

433

167

16

28

45

37

75

157

143

169

132

258

10

537

43

46

156

174

10

68

116

70

491

583

177

101

656

375

757

77

22

38

212

89

124

13

129

46

39

62

30

165

109

19

45
90
34

5. tblzat
Ngyzetes eltrsek sszege

Szabadsgi fokok

Variancia

(F)

Csoportok kzti variabilits

226 240

75 413,2

3,116

Csoporton belli variabilits

1815 229

75

24 203,1

Teljes variabilits

2041 469

78

10. bra
54

202

55

Biostatisztika

Biostatisztika

Csoportok kvalitatv adatainak sszehasonltsa

azt felttelezzk, hogy a kezelt betegek nemi arnyt fogjuk ltni a sikeresen kezelt betegek kzt is.)
Ebben az rtelemben beszlhetnk arrl, hogy az egyes vizsglati kategrikban
az elemszmok elre megjsolhat arnyban fordulnak el. Adott vizsglat esetn, a
vizsglatba vontak szmt ezeknek az elmletileg megalapozott arnyoknak megfelelen tudjuk felosztani. Az gy kapott esetszmok elfordulst vrjuk a vizsglat vgn
majd. Ezrt definiljuk ket vrhat rtknek (E). A vizsglat vgn kapott tnyleges
esetszmokat pedig megfigyelt esetszmnak (O).
Abban az esetben, ha a megfigyelt s a vrhat esetszmok kzti eltrs kicsi, akkor
tulajdonkppen az elmlet s a tapasztalat kzti sszhangra kaptunk biostatisztikai bizonytkot. Ilyen esetben a feltevsnk killta a valsg prbjt. Ha viszont a klnbsg
kellen nagy, akkor nyilvnval, hogy nincs sszhang a tapasztalat s a vrakozsaink
kzt. Ha pedig a valsg prbjt nem llta ki az elkpzelsnk, akkor be kell ltnunk,
hogy tvedtnk.
Az elkpzelsnk s a valsg kzti klnbsg szmszerstsre els kzeltsben a
megfigyelt s vrhat rtkek kzti klnbsg megfelel: (OE). Az sszes vizsglt kategria adatainak megfigyelt-vrhat rtkprjai adjk majd egyttesen a tapasztalat s
az elkpzelseink kzti kapcsolat mrszmt: (OE). Az egyszer sszegzs azonban az eltr eljelek miatt nem hasznlhat. Helyette a ngyzetes eltrsek sszegt
szmtjuk kategrinknt, s ezeket sszegezzk:

Gyakran kell olyan krdsekkel foglalkoznunk, ahol nem folytonos vltozk, kvantitatv adatok segtsgvel rjuk le a kivltott hatsokat, hanem kt vagy tbb kategriba sorolt, kvalitatv adatokkal. Vizsglhatjuk pldul, hogy adott gygyszer hatsra emelkedik-e a gygyult betegek arnya; passzv dohnyzk gyerekei gyakrabban
szenvednek-e kzpflgyulladstl; a hatrrtk feletti szrum-trigliceridszint esetn
magasabb-e a szvinfarktus kialakulsnak kockzata; egy elltsi protokoll kvetkezetes alkalmazsa javtja-e a kedvez klinikai kimenetel valsznsgt.
A kvalitatv adatok esetben az egyes kategrikban regisztrlt esetek szma sszegzi a vizsglat eredmnyt. A vizsglati beszmolk ler-statisztikai tblzataiban
is ezek az esetszmok, illetve a nekik megfelel gyakorisgi adatok szerepelnek.
Vrhat rtk
Az RhD-antign jelenlte alapjn Rh-pozitv s Rh-negatv vrcsoportokat klnbztetnk meg. A tulajdonsg autoszomlis dominns rklsmenetet mutat. Rh-negatv csak
az lehet, aki mindkt szltl ezt a jelleget rkli. Ha heterozigta szlknek gyereke
szletik, akkor 25% valsznsggel lesz a gyermek Rh-negatv (homozigta). A gyerekek 75%-a Rh-pozitv lesz (50% heterozigta, 25% homozigta). Ha 60 heterozigta
szlprtl szrmaz gyereket vizsglunk, akkor azt vrjuk, hogy 60 0,25 = 15 gyerek
lesz Rh-negatv s 60 0,75 = 45 Rh-pozitv.
Ha egy monognes genetikai betegsg esetn azt ttelezzk fel, hogy az rklsmenet autoszomlis dominns, s megvizsgljuk 60 heterozigta szltl szrmaz gyermek egszsgi llapott, akkor azt vrjuk, hogy a gyerekek negyede lesz egszsges. Ha
azt ltjuk, hogy a vizsglatunk nem pontosan a vrt esetszmokat (15 egszsges s 45
beteg) tallta, akkor kicsi eltrs esetn egyszeren a vletlen hatsval magyarzzuk a
megfigyelt s a vrt rtk kzti eltrst. Az eredmnyt pedig az alapfeltevsnk mellett
szl rvknt hasznljuk. Ha viszont az eltrs nagy, akkor az merl fel bennnk, hogy
a betegsg nem az ltalunk felttelezett autoszomlis dominns mdon rkldik.
Az rklsmenettel kapcsolatos pldk azt szemlltetik, hogy vannak olyan gyakorisgi adatok, amik levezethetek valamilyen biolgiai, orvostudomnyi elmletbl,
vagy egy sajt magunk ltal kidolgozott elkpzelsbl. (Pldul, ha felttelezzk, hogy
a nemek kzt nincs klnbsg egy gygyszerfajta hatkonysgban, akkor a frfiak s
a nk kzt ugyanolyan gyakorisggal vrjuk a kezelsre adott kedvez reakcit. Emiatt

56

.
Adott vizsglati helyzetben minl nagyobb a ngyzetes klnbsgek sszege, annl nagyobb az eltrs tapasztalat s valsg kzt. Ez az sszeg azonban nem csak akkor
lehet nagy, ha jelents a tapasztalat s a hipotzis kzti tvolsg, hanem akkor is, ha
nagy elemszm a vizsglat. (Ha az sszegzett ngyzetes eltrsek ugyanakkora eltrst
mutatnak egy 20 fs vizsglatnl, mint egy 2000 fsnl, akkor a 20 fsnl ez mr igen
jelents eltrs lehet, mg a 2000 fsnl elenysz.) A vizsglat nagysghoz kell teht
viszonytanunk a ngyzetes klnbsgek sszegt, amit a vrhat esetszmokkal adunk
meg. A vizsglat nagysghoz viszonytott ngyzetes eltrsek sszege minden kategriban sszegezve olyan statisztikai mrszm, ami mr megbzhatan s a vizsglat
mrettl fggetlenl rja le a tapasztalat s a vrakozsaink (kutatsi hipotzisnk)
kzti klnbsget. Ez a mutat a 2:
.
57

Biostatisztika

Biostatisztika

Ha a 2 kicsi, akkor lnyegben ugyanazt lttuk a valsgban, amit a nullhipotzis


alapjn vrtunk, ezrt a nullhipotzist elfogadjuk. Ha a 2 kellen nagy, akkor a nullhipotzist elvetve sajt kutatsi hipotzisnket tartjuk megalapozottnak. A kicsi s kellen
nagy 2 rtk kzti hatrt jelent kritikus rtket a 2-fggvny segtsgvel szmthatjuk, vagy tblzatbl kereshetjk ki. Mivel a 2 rtke a megfigyelt-vrhat rtkprokbl szmtott eredmnyek sszege, ezrt egy kategria adatai alapjn szmtott relatv
ngyzetes klnbsg sszeg mr nem ad kln informcit a vizsglathoz. (Ha elvesztennk egy ilyen rszsszeget, akkor az a tbbi rszsszeg s a 2 segtsgvel pontosan
szmthat lenne.) A szabadsgi fok teht a kategrik szmnl egyel kevesebb lesz.
Vegyk szre, hogy szemben a megfigyelt rtkekkel, amik minden esetben egsz
pozitv szmok, a vrhat rtkek a csoportltszm-arnyok s a vizsglt minta elemszmnak szorzataknt addnak, azaz ltalban trt szmok. Ennek megfelelen a leggyakrabban elfordul helyzet az, hogy ha a valsg tnyei s az elkpzelsnk kzt
teljes az sszhang, akkor is ltunk nmi klnbsget a megfigyelt s a vrhat rtkek
kzt. Kicsit nagyobbnak addik a 2, mint amilyennek valjban lennie kellene. Emiatt
a kritikus rtket egy kicsit knnyebben lpi t a 2, s egy kicsit knnyebben jutunk
arra a kvetkeztetsre, hogy a vizsglat szignifikns eredmnyre vezetett. A fellbecslt
2 miatt nvekszik az elsfaj hiba valsznsge.
A fellbecsls mrtke az egyes megfigyelt-vrhat rtkprok esetben maximum
0,5 lehet. (A s A + 1 = B egsz szmok kzt lev szmok kzl A + B / 2 = A + 0,5 van
legmesszebb A-tl s B-tl) Ha minden egyes kategriban szmtott (OE) klnbsg
abszolt rtkt 0,5-del cskkentjk, akkor maximlisan kompenzltuk a hibt. Az gy
szmolt 2 biztosan nem becsli fell a pontos rtket. Ugyanakkor, a legnagyobb hiba
lehetsgre korrigltunk, emiatt viszont az ilyen mdon szmtott 2nl biztosan nagyobb a vals rtk. Ezzel a megoldssal alulbecsltk a 2t, ami annyit jelent, hogy
egy kicsit nehezebben lp t a statisztikai mutat a kritikus rtken, s egy kicsit nehezebben jutunk arra a kvetkeztetsre, hogy szignifikns eltrs volt a megfigyelt s
vrhat esetszmok kzt. A szmts menetnek ilyen mdon elvgzett mdostsa a
Yates-korrekci:

nifiknsknt val rtkelst, mg azon az ron is, hogy nem vesznk szre meglev
szignifikns eltrst. (Inkbb nem vltoztatjuk a gyakorlatot megalapozatlanul azaz
konzervatv szemllettel kzeltnk a problmkhoz.)
Egy vizsglatban Magyarorszg 5064 ves npessgre reprezentatv lakossgi
mintjra van szksg. A minta reprezentativitst 2 rtk szmtsval rtkeltk a
kt nemre kln-kln (6. tblzat). A szabadsgi fok mindkt nemnl 2 volt, mivel 3
korcsoportot rtkeltek. A kritikus 2[0,05;2] = 5,991-nl mindegyik esetben kisebb volt a
szmtott 2, ami alapjn nem tudtk igazolni, hogy a referencianpessg sszetteltl
eltrt a sajt minta sszettele. A mintt reprezentatvnak tekintettk.
A megfigyelt s a vrhat rtk kzti eltrs arra hvta fel a figyelmnket, hogy
valami nincsen rendben azzal a 2 kplettel, amit levezettnk az elzekben. Lttuk,
hogy rtelmezsi problmk is felmerlnek a vgeredmnnyel kapcsolatban. Ennek oka
tulajdonkppen egyszer, de rszleteiben itt most nem trgyalhat. Elgedjnk meg
annyival, hogy az ltalunk levezetett kpletek kzelt jellegek. Csak akkor adnak
megbzhat eredmnyt, ha az egyes kategrikban a vrhat esetszm legalbb 5. Ez
alatt a kzelt s a pontos megfigyelt-vrhat klnbsgek kzt mr jelents az eltrs.
(Csak a teljessg kedvrt jegyezzk meg, hogy ilyenkor mr csak a Fisher-exact eljrs
alkalmazhat.)
A fenti eljrs sorn egy elmletileg vagy valamilyen kutatsi hipotzisnek megfelelen meghatrozott esetszm-eloszlshoz viszonytottuk a vizsglatunk sorn megfigyelt esetszm-eloszlst. Az eljrst a valsg s a kutatsi hipotzis illeszkedsnek
a vizsglataknt rtelmezhetjk (goodness of fit test).
6. tblzat
Nem
Frfiak

.
Nyilvnval, hogy a korriglatlan s a korriglt kztt van valahol a pontos 2, s
akrmelyik szmtsi mdszert is hasznljuk, hibt kvetnk el. A kt hiba kzl az
utbbit kell elvllalnunk, mivel a biostatisztikai gondolkods menetben egyrtelmen
annak adunk prioritst, hogy lehetleg elkerljk a nem szignifikns eltrsek szig 58

Nk

Korcsoport

Referencia
esetszmok

Referencia
gyakorisgok

Sajt minta
esetszmai (O)

Vrhat
(|(OE|0,5)2/E
esetszmok (E)

5054

515406

0,414

8378

8427,4

0,284

5559

419839

0,337

6797

6864,8

0,660

6064

310858

0,249

5200

5082,8

2,679

sszesen

1246103

20375

20375,0

=3,623

5054

584629

0,410

9800

9943,7

2,062

5559

474511

0,333

8089

8070,8

0,039

6064

366198

0,257

6354

6228,5

2,509

sszesen

1425338

24243

24243,0

=4,610

59

Biostatisztika

A vrhat esetszm-eloszlst eloszlsfggvny alapjn is generlhatjuk, ha ismerjk,


hogy milyen a vizsglt vltoznk eloszlsa, s annak melyek az eloszls-paramterei.
Pldul, ha tudjuk, hogy az adat, amivel dolgozunk, Poisson-eloszls, akkor a teoretikusan vrhat esetszm-eloszlst azeltt kiszmthatjuk, mieltt mg a sajt adatainkat
tnylegesen feldolgoznnk. A Poisson-eloszls egyparamteres: ha egy jelensg teljes
vizsglatunkban megfigyelhet gyakorisgt szmtjuk, akkor megkaptuk az eloszls
paramtert. Ennek segtsgvel szmthatjuk mr, hogy egyes esetszmok elfordulsnak mekkora az elmletileg vrhat valsznsge.
Problmt fog jelenteni ennl a megkzeltsnl, hogy a Poisson-eloszls a 0 esetszm elfordulsi valsznsgnek szmtstl indul, de tulajdonkppen vgtelen
nagy esetszmig folytatdik. Korbban mr lttuk, hogy az ltalunk levezett 2-rtk
szmtsa csak addig megbzhat, amg a kategrikban legalbb 5 a vrhat esetek
szma. A vrhat rtkek szmtst ezrt a vgtelensgig semmikppen nem folytatjuk.
(Nem kell minden nagy esetszmra kiszmtani az elforduls vrhat valsznsgt.)
Radsul, eleve csak addig a hatrig kellene folytatni a valsznsgi rtkek szmtst, amennyi a vizsglati minta elemszma. Ha 100 az elemszmunk, akkor nem fordulhat el, hogy 101 vizsglati alany produkl egy bizonyos reakcit. Az utols kategria,
amire mg szmtjuk a vrhat esetszmot, ltalban sszevont (pl. annak a valsznsge, hogy 15 vagy annl tbb esetben kapunk pozitv reakcit), ami mg legalbb 5
esetet tartalmaz. Az sszevons esetenknt a kicsi esetszmok fel is indokolt lehet, ha
ott is 5 alatti vrhat esetszmokat szmtunk.
A vrhat-megfigyelt rtkprokra szmtott 2 a korbban megbeszlteknek megfelelen rtelmezhet. Annyi specialitsa van ennek az illeszkedsvizsglatnak, hogy a
Poisson-eloszls paramtert is a sajt minta adatai alapjn szmtottuk. Emiatt a szabadsgi fokot nem csak azrt kell eggyel cskkentennk, mert az utols relatv ngyzetes eltrs sszeg mr nem ad j informcit az elemzshez, hanem azrt is, mert a
Poisson-eloszls paramtere is szmtott rtk. sszessgben a szabadsgi fok itt kettvel lesz kisebb a kategrik szmnl.
A ltterenknti baktriumtelepek szma Poisson-eloszlst kvet egy standardizlt
vizsglati rendszerben, ahol a ltterenknti tlagos telepszmnak 3,6-nak kell lennie
ahhoz, hogy jl mkdjn a vizsglat. Minden vizsglat elejn ellenrizni kell, hogy
megfelel-e a tenyszet. 50 ltteret olvastak le. A 7. tblzat tartalmazza a ltterekben megszmolt telepek szmnak eloszlst s a 3,6-es tlag alapjn szmtott vrhat
esetszmokat. A 0 s az 1 telepszmhoz mr kevesebb, mint 5 eset tartozott, ezrt a
kezd kategria a 0 vagy 1 telep/lttr lett. A 6 az els magasabb esetszm, amihez
mr 5 alatti vrhat esetszm tartozott, ezrt a 6 vagy annl tbb telep/lttr lett a
60

Biostatisztika

7. tblzat
Telepek szma/lttr

Vrhat esetszmok (E)

Megfigyelt esetszmok (O)

(|(OE|0,5)2/E

0 vagy 1

6,3

2,279

8,9

0,014

10,6

12

0,072

9,6

0,118

6,9

0,021

6 vagy annl tbb

7,8

12

1,762

legfels elemzett kategria. A szmtott 2 = 4,267 kisebb volt, mint a kritikus 2[0,05;4] =
9,488-nl. (A szabadsgi fok a 6 csoport miatt volt 4.) A telepszm-eloszls teht megfelelt a vrtnak, nem trt el attl szignifiknsan. A vizsglati rendszer alkalmas volt a
feladat elvgzsre.
Gyakran kell azt ellenrizni, hogy egy folytonos vltoz normlis eloszls-e. Ilyenkor is alkalmazhatjuk a fenti megoldsokat. Azaz a mintk adatai alapjn szmtjuk adataink eloszls-paramtereit (tlagot s szrst). Ezt kveten kategrikat hatrozunk
meg (felosztjuk a folytonos sklt kategrikra). A kategrik szmnak, szlessgnek
kialaktsakor az 5-s vrhat elemszmszablyra kell tekintettel lennnk. A szls kategrit pedig itt is vgtelenig bvtve kell definilni. A 2 szmtsa ettl kezdve kveti
a fenti mintt. A kritikus rtk megllaptsakor azt kell figyelembe venni, hogy itt kett
eloszls-paramtert hatrozunk meg a minta adatai alapjn, emiatt a szabadsgi fok a
kategrik szmnl hrommal lesz kisebb.

11. bra. A ltterenknti baktriumtelepek megfigyelt s vrhat szma


61

Biostatisztika

Biostatisztika

Csoportok kzti klnbsg elemzse

9. tblzat

Kvalitatv adatok elemzsekor azonban a leggyakrabban megvlaszoland krds az,


hogy adott jelleg elfordulsa eltrst mutat-e klnbz csoportokban? (Klnbz-e
a betegsg gyakorisga dohnyosok kzt s nem dohnyzk kzt, egy brelvltozs gyakoribb-e egy foglalkozsi csoportban, mint ms foglalkozsak kzt stb.) Ilyen vizsglatok adatfeldolgozsa sorn els lpsknt az elemi adatokat (a vizsglati csoportokon
bell megfigyelt kategrinknti esetszmokat) tblzatba rendezzk. Az oszlopokba a
befolysol tnyezt (a vizsglat sorn sszehasonltand csoportok megnevezst), a
sorokba a kivltott hats kategriit szoks elhelyezni. Az gy kapott kontingenciatblzat minimum 2 2-es, de akrhny oszlopbl, illetve sorbl is llhat (8. tblzat).
A kontingenciatblzat adatainak felhasznlsval kell vlaszolni a vizsglat alapkrdsre: van-e kapcsolat a befolysol tnyez s a kivltott hats kztt? Nullhipotzisnk itt is az, hogy nincs ilyen kapcsolat, azaz a vizsglt befolysol tnyez s a
kivltott hats fggetlen egymstl.
A nullhipotzis alapjn vrhat rtkeket tudunk szmtani a kontingenciatblzat
minden celljra, azaz a Hnyan lennnek adott csoporton bell az adott kategriban? krdst minden cella esetben meg tudjuk vlaszolni. Ha ugyanis a csoportok
kzt nincs klnbsg a kivltott hats szempontjbl, akkor az egyes kivltott hats
kategrikban sszesen megfigyelt esetszm (K1 = N11 + N21 s K2 = N12 + N22) a csoportok ltszmnak arnyban oszlik meg (B1-csoport rszarnya B1/N; B2-csoport
B2/N). Ha pldul kt csoportot vizsglunk, s a kt csoportba sszesen 100 beteg tar-

Megfigyelt esetszmok
B1

B2

K1

N11

N21

K2

N12

Mind

B1 = N11 + N12 =
= 250

Vrhat esetszmok
Mind

B1

B2

K1 = N11+N21 =
K1
= 100

= 100 0,5
= 50

= 100 0,5 =
= 50

N22

K2 = N12 + N22
= 400

= 400 0,5
= 200

= 400 0,5 =
200

B2 = N21 + N22 =
= 250

N = 500

K2

Csoportok B1/N = 250/500 = B2/N = 250/500 =


rszarnya
= 0,5
= 0,5

tozik (K1 = N11 + N21 = 100), a kt csoport pedig 250-250 fs (B1 = 250 s B2 = 250),
akkor, mivel a csoportok ltszma egyforma, a betegek is egyforma szmban fordulnak
el a kt csoportban a nullhipotzis alapjn. Ebben az esetben a vrhat rtk a kt cellra (N11-re s N12-re) 50-50 lesz. Ebben az 500 fs vizsglatban az egszsgesek szma
K2 = 500 100 = 400, akiket a csoportltszmok arnyban sztosztva 200-es vrhat
esetszmot kapunk N12-re s N22-re is (9. tblzat).
Ha ugyanebben a helyzetben a csoportok ltszma B1 = 400 s B2 = 100 lenne, akkor a 100 beteg is ennek megfelelen oszlana meg: 80 beteg lenne a nagyobbik s 20
beteg a kisebbik csoportban. Az egszsgesek szma is ebben az arnyban fordulna el
(10. tblzat).

8. tblzat. 2 x 2-es kontingenciatblzat szerkezete


10. tblzat
Csoportok
(befolysol tnyez)

(kivltott hats)

Kategrik

B1
K1

B2

N11

N21

Megfigyelt esetszmok
B2

K1

N11

N21

K2

N12

Mind

B1 = N11 + N12 =
= 400

K1 = N11 + N21

K2

N12

N22

K2 = N12 + N22

Mind

B1 = N11 + N12

B2 = N21 + N22

62

B1

Mind

Vrhat esetszmok
Mind

B1

B2

K1 = N11+N21 =
K1
= 100

= 100 0,8
= 80

= 100 0,2 =
= 20

N22

K2 = N12 + N22
= 400

= 400 0,8
= 320

= 400 0,2
= 80

B2 = N21 + N22 =
= 100

N = 500

Csoportok B1/N = 400/500 = B2/N = 100/500 =


rszarnya
= 0,8
= 0,2

63

K2

Biostatisztika

Biostatisztika

A vrhat esetszmok kpzsnl az egyes kategrikban sszesen megfigyelt esetszmokat teht sztosztjuk a csoportnagysgnak megfelelen. Az gy kapott vrhat
rtkek azt fejezik ki, hogy milyen lenne az esetek eloszlsa csoportokon bell kategrinknt, ha a csoportkpz faktor nem befolysoln a betegsg kialakulst.
Ezek utn mr a 2 szoksos mdon szmthat, s segtsgvel a tapasztalat s az elmleti feltevs (nullhipotzis) kzti kapcsolat termszete mr rtkelhet. Az itt kapott
2 kritikus rtknek meghatrozshoz szksgnk van mg a szabadsgi fokra. Ha
egy n m kontingenciatblzat sor- s oszlopsszegeit tudjuk, akkor a vrhat rtkek
kzl nagyon sokat nem kell mr felhasznlni a szmtsaink sorn. Minden sorban 1
adat van, ami ha elveszne, akkor a sor egyb tagjaibl s a sorsszegbl mg szmthat
lenne. Ugyanez igaz az oszlopokra is. Ennek megfelelen a 2 szmtsakor a szabadsgi fok:

dett terletek kztt milyen a gondozsba vtel hatkonysga (11. tblzat). A szmtott
2 = 7,095 nagyobb a kritikus 2[0,05;1] = 3,841 kszbnl, ezrt a megfigyelt s a vrhat
rtkek kzti klnbsg szignifikns. Mivel a szakelltsban gondozottak arnya 67% a
civil szervezet ltal elltott, s 59% az ltaluk nem elltott terleten, a szervezet mkdst kedvez hatsnak rtkeljk az eredmny alapjn. (A 2 =7,095-hoz tartoz p =
0,008 rtket szmtgp segtsgvel kapjuk.)
Ha 2 2-es a kontingenciatblzat, akkor az alapkrdsnkre kzvetlenl vlaszolni
tudunk a 2-prba segtsgvel. Ha azonban ennl nagyobb a tblzat (tbb kategriba soroltuk a befolysol tnyezt s/vagy a kivltott hatst), akkor a vizsglati krds
csak az lehet, hogy van-e egyltaln hatsa a csoportkpz faktornak a vizsglt paramterre? Erre a 2-prba vlaszt is ad. Arra viszont nem kapunk gy vlaszt, hogy melyik
csoportok kzt s melyik kivltott hats szempontjbl jelentkezik valjban az eltrs? A tblzat mrettl fggen nagyon sok specifikus krdst lehet az ilyen post hoc
elemzsek sorn feltenni. A specifikus krds megvlaszolsakor a dntsi kszbt
kell cskkentennk annak rdekben, hogy sszessgben a vizsglatban az els faj
hiba szintje ne emelkedjen 5% fl, azaz, hogy ne rtkeljnk a sokszoros hipotzistesztels kvetkeztben ltszlagos szignifikns eredmnyt valban szignifiknsnak.
Szvinfarktuson tesett betegek elltsra egy elltsi krzetben 3 lehetsg ll rendelkezsre. A hromflekppen kezelt betegek 1 ven belli llapotjavulst vizsgltk,
annak rdekben, hogy megllaptsk, melyik elltsi forma szolglja hatkonyabban a
betegek rdekeit (12. tblzat).

.
A ciszts fibrzis korszer gondozsa jelentsen javtja a betegek letminsgt. A
diagnzis fellltsa utn ezrt alapveten fontos a gondozsi kzpontokba val bekerls. Sokan azonban alapelltsi krlmnyek kztt kerlnek elltsra. A ciszts fibrzisos gyermekek szlei ltal ltrehozott civil szervezet prblja felkutatni s a szakellt
kzpontok fel irnytani az rintetteket. A szervezet azonban nem plt ki az egsz
orszgban. Megvizsgltk, hogy a szervezet ltal lefedett s a szervezet ltal le nem fe11. tblzat
Megfigyelt esetszmok
Civil szervezet
mkdsi
terlete

Civil szervezet
ltal le nem
fedett terlet

Vrhat esetszmok
Mind

Alapelltsban
gondozott gyermekek
szma

155

Szakellt
kzpontban
gondozott gyermekek
szma

318

301

619

Mind

473

510

983

Csoportok rszarnya

0,48

0,52

209

64

364

Civil szervezet
mkdsi
terlete
175,15

297,85

Civil szervezet
ltal le nem
fedett terlet

12. tblzat
Megfigyelt esetszmok
Kezels1

Kezels2

Kezels3

Mind

Kezels1

Kezels2

Kezels3

Kedvez
kimenetel

41

21

104

166

35,38

33,20

97,42

Kedveztlen
kimenetel

24

40

75

139

29,62

27,80

81,58

Mind

65

61

179

305

65

61

179

Csoportok
rszarnya

0,21

0,20

0,59

188,85

321,15

Vrhat esetszmok

65

Biostatisztika

Biostatisztika

A 2-prba szignifikns eredmnyre vezetett (p = 0,002). Ennek alapjn meg tudtk


llaptani, hogy egyltaln nem mindegy, hogy melyik protokoll szerint kezeltk a betegeket (12. bra). A preferland, illetve kerlend elltsi forma azonostsa rdekben rszletes elemzst vgeztek. Pronknt az albbi teszteredmnyeket kaptk: p1vs2 =
0,001 (13. tblzat); p1vs3 = 0,484 (14. tblzat); p2vs3 = 0,001 (15. tblzat). Megllaptottk, hogy a 2-es protokoll helyett, az egymssal egyenrtk 1-es s 3-as protokollt
kell a jvben hasznlni, mert a p1vs2 = 0,001 s a p2vs3 = 0,001 mg a 0,05/3 = 0,017
dntsi kszbnl is szignifiknsnak jelezte a hatkonysgbeli klnbsgeket.

14. tblzat
Megfigyelt esetszmok

Vrhat esetszmok

Kezels-1

Kezels-3

Mind

Kezels-1

Kezels-3

Kedvez kimenetel

41

104

145

38,63

106,37

Kedveztlen
kimenetel

24

75

99

26,37

72,63

Mind

65

179

244

Csoportok
rszarnya

0,27

0,73

15. tblzat
Megfigyelt esetszmok

12. bra

13. tblzat
Megfigyelt esetszmok

Kezels-2

Kezels-3

Mind

Kezels-2

Kezels-3

Kedvez kimenetel

41

104

125

31,77

93,23

Kedveztlen
kimenetel

40

75

115

29,23

85,77

Mind

61

179

240

Csoportok
rszarnya

0,25

0,75

Vrhat esetszmok

Kezels-1

Kezels-2

Mind

Kezels-1

Kezels-2

Kedvez kimenetel

41

21

62

31,98

30,02

Kedveztlen
kimenetel

24

40

64

33,02

30,98

Mind

65

61

126

65,00

61,00

Csoportok
rszarnya

0,52

0,48

66

Vrhat esetszmok

Prba rendezett kvalitatv adatok elemzse


Kvalitatv vizsglatoknl is hatkonysgnvel, ha nem kt, egymstl fggetlen csoportot vizsglunk, hanem prba rendezett adatokat lltunk el. Vagy eltte-utna tpus
vizsglatot hajtunk vgre, ahol az egy-egy vizsglati alany kezels/expozci eltti s
utni adatai kztti eltrst vizsgljuk, vagy nhny zavar tnyez szempontjbl prba rendezett, de egy csoportok kztti klnbsget meghatroz, csoportkpz faktor
szempontjbl eltr csoport tagjain hajtjuk vgre a vizsglatot. Mindkt esetben adatprok adjk az indul informcit.

67

Biostatisztika

Biostatisztika

A legegyszerbb helyzetet alapul vve (amikor kt csoportot s ktfle kategriba sorolt vizsglati eredmnyt elemznk), a prokat ngy csoportba sorolhatjuk: a pr
hasonl sttusz (mindkettnl kialakult a vizsglt hats: N++, vagy mindkettnl elmaradt a hats kifejldse: N ), eltr sttusz (az egyik csoporthoz tartoz tagban
kifejldtt a hats, a msik csoportba tartoznl nem: N+ , s fordtva: N +) lehet.
Ha a csoportkpz faktor befolysol szerept akarjuk rtkelni, akkor rdemi informcival azok a prok szolglnak, akiknl eltr volt a kivltott hats (N+ , N +).
Ha kt kategriban hasonl a prok szma, akkor nincs klnbsg a kt csoport kzt a
kivltott hats szempontjbl (mindkt csoport ugyanolyan gyakran adja a pozitv vlaszt produkl tagot). Ha viszont jelentsen eltr egymstl ez a kt elemszm, akkor
az egyik csoportba tartozk gyakrabban alaktanak ki pozitv vlaszt, jobban reaglnak
a befolysol tnyezre, mint a msik csoport tagjai. Emiatt az alapkrds megvlaszolshoz ennek a kt esetszmnak a klnbsgt kell rtkelni.
Az rtkels menete megfelel a fentebb mr tbb alaphelyzetben kvetett mintnak.
A kt esetszm ngyzetes klnbsgt viszonytjuk a vizsglat mrethez:

.
Az eredmny nagyobb, mint a 2[0,05;1] = 3,841 kritikus rtk. Az elsdleges benyomsokat igazolta a vizsglat. Valban szignifikns a kapcsolat az els munkafzis okozta
expozcik s az allergis betegsgek kifejldse kzt.

16. tblzat
Els fzisban dolgoz

Msodik fzisban dolgoz

Allergis betegsg +

Allergis betegsg +

48

Allergis betegsg +

Allergis betegsg

52

Allergis betegsg

Allergis betegsg +

32

Allergis betegsg

Allergis betegsg

80

.
A statisztikai eljrs neve McNemar-teszt. Mivel sszesen kt kategrit vizsgltunk, a szabadsgi fok 1 lesz. A vizsglatot itt is rdemes Yates-korrekci segtsgvel
jobban interpretlhatv tenni:

.
Egy zemben 424 alkalmazott dolgozik. A gyrts kt fzisban zajlik. Az elsben alkalmazott vegyszerek allergis reakcit okozhatnak. Megvizsgltk, hogy az els fzisban
dolgozk tnylegesen veszlyeztetettebbek-e. Az alkalmazottakat 212 prba sorsoltk
vletlenszeren, s rgztettk beosztsukat s allergis anamnzisket (16. tblzat).
Azt lttk, hogy gyakrabban fordul el, hogy az els fzisban dolgoz allergis, de a
msodik fzisban dolgoz prja nem, mint az, hogy a msodik fzisban dolgoz allergis, de az els fzisban dolgoz prja nem. Az eltrs vletlenszersgre McNemar-tesztet vgeztek:

68

69

Biostatisztika

Biostatisztika

Folytonos vltozk kztti kapcsolat elemzse

nehz a vlemnynket megfogalmazni. Termszetes teht, hogy a kapcsolat erssgnek a lersra valamilyen kvantitatv paramtert kell hasznlni.
Kt paramter kapcsolt vltozkonysgt ugyanazzal a gondolatmenettel tudjuk
szmszersteni, amit egyetlen vltoz esetben alkalmaztunk. Egy vltoz (x) esetn
) krli variancia (V ), szrs
Nx mintanagysg mellett a variabilits lersa az tlag (x
x
(SDx) meghatrozst jelentette, ahol az tlagtl
val ngyzetes eltrsek sszege (Sx) volt a variabilits elemi mrszma:

Ha kt intervallum vagy arnyskln mrt folytonos vltoz kzti kapcsolat termszett


szeretnnk lerni (arra vagyunk kvncsiak, hogy a szrumban mrhet gygyszerszint
milyen kapcsolatban van a gygyulshoz szksges idvel; az elfogyasztott alkohol
mennyisge milyen mrtkben rontja a reakciidt; az ivvzben lev szennyez anyag
milyen mrtkben rontja a vese kivlaszt kpessgt; a felnttek letkora milyen kapcsolatban van a csontok kalciumtartalmval stb.), akkor tulajdonkppen azt a fggvnyt
keressk, amelyik a lehet legpontosabban megmutatja, hogy az egyik paramter vltozsa milyen mrtkben mdostja a msik paramter rtkt.
A biolgiai rendszerek tagjainak egymsra hatsa rendkvl vltozatos, emiatt sokfajta fggvnnyel lehet csak a folyamatokat lerni. Ezek kzl legegyszerbb a lineris
kapcsolat. A kvetkezkben a folytonos vltozk kztti lineris kapcsolat elemzsekor
hasznlhat statisztikai alapismereteket tekintjk t. Nem foglalkozunk nem lineris
kapcsolatok elemzsvel azon tl, hogy megemltjk: sok nem lineris viszony elemzsekor lehetsg van arra, hogy a vltozk megfelel transzformlsval linearizljuk
a kapcsolatot, ami utn semmi akadlya nincs az albbiakban sszefoglalt eljrsok
alkalmazsnak.

Korrelci
A legegyszerbb krds, amelyet a fenti krdsek vizsglatakor meg kell vlaszolnunk,
hogy kt jelensg kztt van-e egyltaln kapcsolat, az egyik jelensg vltozsa maga
utn vonja-e a msik vltozst? Ilyen krds megvlaszolst clszer a lehet legegyszerbb mdon kezdeni: brzoljuk a megfigyelt adatprokat egy diagramon. A kt
tengelyen szerepelnek a vizsglt vltozk. gy minden vizsglati alanynak egy pont felel meg a koordintarendszerben. Az ilyen szrsdiagram sokszor knnyen rtkelhet
kapcsolatot tr fel, mert szemmel is jl rtkelhet pozitv vagy inverz kapcsolat olvashat le a szmprok elhelyezkedsbl. Termszetesen vals adatoknl csak trendet ltunk, az adatok soha nem illeszkednek egy egyenesre. A trendnek megfelel vonal krl
kisebb-nagyobb mrtkben szrdnak a tnylegesen mrt rtkek (13. bra).
ltalban a vizulis benyomsunk csak nagyon ers kapcsolat esetn nyjt megbzhat tmpontot. Gyakoribb eset, hogy ilyen mdon mg a trend irnyra vonatkozan is
70

,
.
Kt vltoz variabilitsnak kapcsoltsgt
kovariancival (Cxy) rhatjuk le. Ennek szrmaztatsa nem az egyik paramter tlagtl, hanem
mindkt paramter tlagtl indul el: azaz nem

x s nem
y krli elhelyezkedst, hanem a meg;
figyelt (x;y) rtkprok (x
y ) rtkprhoz viszonytott elhelyezkedst vizsgljuk. Ahhoz, hogy
;
az ppen rtkelt (x;y) pontba jussunk a (x
y)
pontbl, kt lpst kell megtennnk. Elszr
x-tengely mentn kell elmozdulnunk (x
x ) t
volsgra, utna y-tengely mentn (y y ) tvolsgra. [Ha a vizsglt x nagyobb, mint az
x , akkor az
(x
x ) pozitv eljel lesz, s pozitv irnyba kell
mozdulni. Ha a vizsglt x kisebb, akkor az (x
x)
negatv eljel lesz, s negatv irnyba kell mozdulni. Hasonlan rtelmezzk az y-tengely menti
mozgst is.] A kt tvolsg nvekedsvel egytt
jr a kt vizsglt pont kzti eltrs nvekedse. A
kt tvolsg szorzata pedig olyan rtk, ami sszessgben fejezi ki az adatpr tvolsgt a tipikus vizsglati alanytl. Ezek a tvolsgok minden
71

13. bra. Kt folytonos vltoz (x, y)


kztti szrds kapcsolt szrsdiagramon

Biostatisztika

Biostatisztika

adatprra meghatrozhatk. sszegk annl nagyobb lesz, minl jelentsebb a tipikus


pont krli szrds. Ennek a variabilitsi mrszmnak az rtke azonban nem csak
attl fgg, hogy milyen az adatok elhelyezkedse a szrsdiagramon, hanem attl is,
hogy hny elem a minta. Minl tbb az adat, annl nagyobb lesz a mutat. Ezt a problmt a mutat elemszmhoz (N) viszonytott rtknek hasznlatval lehet kezelni.
Pontosabban a szabadsgi fokhoz viszonytott rtket, ami a tipikus pontszmtsokban
val alkalmazsa miatt 1-gyel kisebb lesz, mint az elemszm.

ked, cskken vagy vzszintes jellegrl ad felvilgostst, de arra is alkalmas, hogy


rtkelje a trendvonal krli szrds mrtkt, azaz a kt paramter kzti kapcsolat
szorossgt. Minl nagyobb pozitv vagy negatv szm a kovariancia, annl szorosabb
a kapcsolat.
A kovariancia mrtkegysggel rendelkez mutat. Ha egy toxin koncentrcijt s
egy immunolgiai marker koncentrcijt vizsgljuk, akkor a kt koncentrci mrtkegysgnek a szorzata lesz a kovariancia dimenzija. Ha a toxinkoncentrci nmol/
ml, a marker pedig IU/l, akkor a kovariancia mrszma nmol IU/ml l, amit nem
egyszer rtelmezni. Ha a mrtkegysgeket vltoztatjuk, hogy knnyebb legyen a kovariancia
rtelmezse, akkor a kovariancia mrszma is
mdosul. Ez knyelmetlenn teszi a kovariancia
alap kapcsolatelemzst. Szerencsre a vltozk
standardizlsa rvn dimenzi nlkli, a paramter egysgnyi szrshoz viszonytott, ezrt a
klnbz paramterek esetben sszehasonlthat (ms vizsglatok eredmnyeivel is egyszeren sszehasonlthat) mrszmhoz juthatunk.
Minden x helyett x/SDx-et, s minden y helyett
y/SDy-t (s a tipikus rtkekre is
x /SDx-et illetve

y /SDy-t) hasznlva, az eredeti kovarianciakplet


mdosul:

A kovariancia mr sokat elrul a kt paramter kzti kapcsolatrl. Ha a tipikus pont


kzpontjval ngy kvadrnsra osztjuk a szrsdiagramot, akkor a ngy mezben elhelyezked pontokhoz tartoz kovarianciatag (x
x ) (y
y ) eljele a jobb fels s a bal
als mezben pozitv, a bal fels s a jobb als mezben negatv lesz. rtelemszeren
a kovariancia negatv rtk is lehet (szemben a variancival, ami soha nem negatv
szm). Ha mindezek mellett figyelembe vesszk, hogy az adatainkra illesztett trendvo;
nal mindig illeszkedik az (x
y ) tipikus pontra, akkor megllapthatjuk, hogy, ha teljesen
illeszkednek az adataink egy emelked trendvonalra, akkor az sszes pont a bal als s a
jobb fels mezbe esik, azaz az sszes kovarianciatag pozitv szm lesz, ami miatt maga
a kovariancia is pozitv rtket vesz fel. Azonban, ha cskken trendvonalra illeszkednek a vizsglati eredmnyek, akkor a bal fels s a jobb als mezben talljuk a negatv
eljel tagokat, amelyek negatv eljel kovariancit eredmnyeznek. Ha az egyik paramter vltozsa nem kapcsoldik a msik paramter valamilyen mdosulshoz, akkor
a szrsdiagramon egy vzszintes vonalra illeszked trendvonalat ltunk. Ilyen esetben
az adatok a ngy kvadrns kzt egyenletesen oszlanak meg, ami a negatv s pozitv tagok egymst kiolt hatsa miatt sszessgben nulla lesz. A hrom szlssges helyzet
termszetesen soha nem fordul el vals biolgiai rendszerekben. Az eredmnyek nem
illeszkednek tkletesen a trendvonalakra. A szrdsuk miatt emelked trend esetn is
ltunk bal fels s jobb als mezben adatprokat (14. bra).
Minl jelentsebb a szrds, annl tbb adat jelenik meg ebben a kt, negatv eljel kovarianciatagot eredmnyez mezben, s a tbb negatv kovarianciatag miatt
kisebb lesz a szmtott kovariancia. (A szrdsnvekeds vgpontja az, amikor mr
kicsit sem tbb a pozitv kovarianciatagok slya, s kiegyenltdnek a negatv s pozitv
rszsszegek. Hasonl gondolatmenet vezethet le a cskken trendekre vonatkozan
is.) Ezek alapjn megllapthatjuk, hogy a kovariancia nem csak a trendvonal emel 72

.
gy mr nem csak a kapcsolat irnyt, hanem
a szorossgt is jl ler mrszmhoz jutunk,
amit korrelcis koefficiensnek hvunk (r). Abban az esetben, ha emelked trendvonalat lttunk a szrsdiagramon, s az sszes adat ehhez
a trendvonalhoz illeszkedett, akkor a korrelcis
koefficiens rtke 1 lesz. Ilyenkor teljes pozitv
;
14. bra. Vizsglati eredmnyek tipikus (x
y ) pont
krli elrendezdse a trendvonalakkal
73

Biostatisztika

Biostatisztika

korrelcirl beszlnk. Ebben a helyzetben ugyanis az egyik paramter pontosan meghatrozza msik paramter rtkt (adott x-hez csak egy adott y tartzhat, s fordtva.)
Ha cskken trendvonalra illeszkednek tkletesen a vizsglati eredmnyek, akkor tkletes inverz korrelcirl beszlnk, amit a korrelcis koefficiens 1-es rtke jelez.
Ha a koefficiens rtke ppen nulla, akkor az illesztett trendvonal vzszintes, s ez jelzi
a kt vizsglt paramter tkletes fggetlensgt (akrmilyen rtket is vesz fel x, ahhoz
mindig ugyanaz a jellemz y-rtk fog hozztartozni; x vltozsa nem hozza magval y
mdosulst). Az interpretcis szablyok rtelmezshez ezek a szlssges helyzetek
hozzsegtenek, de vals mintkon soha nem tallkozunk velk. Emelked vagy cskken trendvonal krl tbb-kevsb szrd eredmnyeket ltunk a szrsdiagramon.
A korrelcis koefficiensek pedig valahol 0 s 1 kztt, illetve 0 s +1 kztt helyezkednek el. Minl szorosabb a korrelci, annl tvolabb kerl nulltl a korrelcis
koefficiens.
Annak eldntsre, hogy az adott korrelcis koefficiens eltrse a semleges nulltl
vletlennek tulajdonthat-e, vagy pedig annak, hogy a kt vltoz valban kapcsolatban van (szignifikns-e a trendvonal ltal sugallt ltszlagos kapcsolat), a korrelcis
koefficiens konfidencia-intervallumnak megadsval tudunk vlaszolni. A korrelcis
koefficiens nagysga ugyanis nmagban nem elg annak eldntsre, hogy van-e kapcsolat egyltaln a paramterek kzt. Egy biolgiai rendszerben ugyanazt a hatst tbb
befolysol tnyez is kpes elidzni. A klnbz faktorok klnbz hatkonysggal kpesek vltozst generlni. Ebben az rtelemben vannak gyenge s vannak ers
determinnsok. Az ers determinns esetben nulltl tvoli korrelcis koefficienseket kapunk, a gyenge determinnsoknl pedig a nullhoz kzelebb levt. Ugyanakkor
mindegyik tnylegesen faktor kapcsolatban van a kivltott hatssal.
A korrelcis koefficiens standard hibja (SEr) s 95%-os megbzhatsgi tartomnya MT95%;r, ahol (N-2) a szabadsgi fokot, t pedig a t-eloszls megfelel rtkt jelli:

17. tblzat
letkor, v (x)

Szisztols vrnyoms, Hgmm (y)

(x x)

( y y)

( x x )( y y )

53

170

12

31,6

379,2

54

143

11

4,6

50,6

54

89

11

49,4

543,4

55

138

10

0,4

57

113

25,4

203,2

59

98

40,4

242,4

61

126

12,4

49,6

63

160

21,6

43,2

65

175

36,6

65

133

5,4

68

95

43,4

130,2

68

208

69,6

208,8

68

114

24,4

73,2

69

112

26,4

105,6

70

170

31,6

158

70

171

32,6

163

72

131

7,4

51,8

72

116

22,4

156,8

77

189

12

50,6

607,2

80

117

15

21,4

321

Ez a megbzhatsgi tartomny tartalmazza 95%-os valsznsggel azt a korrelcis koefficienst, ami pontosan lerja a kt paramter kzti kapcsolat erssgt. Ha
ez az intervallum teljes egszben pozitv tartomnyban van, akkor minden valszn
korrelcis koefficiens pozitvnak mutatja a vltozk viszonyt, vagyis szignifikns-

nak interpretlhatjuk a kapcsolatot. (Negatv tartomnyban, inverz kapcsolatok esetn


hasonl a helyzet.) Ha a megbzhatsgi tartomny pozitv s negatv rtkeket is tartalmaz, azaz valsznnek ltunk pozitv s negatv trendet ler rtkeket egyarnt,
akkor a nyilvnval ellentmonds miatt nem llthatjuk, hogy bizonytkot talltunk a
kt vltoz kztti kapcsolatra.
A korrelcis koefficiensek is rtkelhetk dntsi kszbt s mintanagysgot figyelembe vev kritikus rtkeket tartalmaz tblzatok segtsgvel. Ezek a tblzatok
csak a pozitv kritikus rtkeket tartalmazzk. Negatv korrelcis koefficiensek eset-

74

75

Biostatisztika

Biostatisztika

ben az abszolt rtket kell a kritikus rtkhez viszonytani (http://www.gifted.uconn.


edu/siegle/research/Correlation/corrchrt.htm).
Egy nefrolgiai centrumban a betegek megvizsgltk, hogy milyen kapcsolat van a
betegek letkora s szisztols vrnyomsa kztt. Az tlagletkor 65 v (SD = 7,83), az
tlagos vrnyoms 138,4 Hgmm (SD = 33,55) volt (17. tblzat). A szrsdiagram (15.
bra), a kovariancia s a korrelcis koefficiens is pozitv trend megltt jelezte:

sszessgben teht a korrelcis koefficiens szmtsa rvn meg tudjuk llaptani,


hogy kt vltoz kztt (1) van-e kapcsolat, (2) milyen a kapcsolat irnya, st meg tudjuk mondani, hogy (3) mennyire szoros a kapcsolat.
A kapcsolat erssge a trend egyenese krli szrds mrtktl fgg. Minl jobban szrdnak az adatok, annl kisebb a korrelci. Ez azt eredmnyezi tbbek kztt,
hogy kt, eltr meredeksg trend esetn is hasonl lehet a korrelcis koefficiens.
Vagyis, van egy olyan adat (a meredeksg), ami fontos a vltozk kapcsolatnak lersakor, de nem szl rla a korrelcis koefficiens.

.
A 95%-os megbzhatsgi tartomny azonban tartalmazta a nullt, ezrt a trendet nem
lehet az letkor s a szisztols vrnyoms kzti kapcsolat bizonytkaknt rtelmezni.
Tblzatot hasznlva, a 18-as szabadsgi fokhoz s az 5%-os dntsi kszbhz a
kritikus rtk 0,444. Ennl kisebb koefficienst szmtottunk az eredmnyeinkre, ezrt
nem tekintjk elg meggyznek a vizsglatot annak bizonytsra, hogy az letkorral
emelkedik a vesebetegek szisztols vrnyomsa, hiba volt ez a benyomsunk a szrsdiagram tanulmnyozsakor.

15. bra. Vesebetegek szisztols vrnyomsa az letkor fggvnyben


76

Lineris regresszi
A korrelcis koefficiens szrmaztatshoz kiindulpontknt hasznlt szrsdiagram
trendjnek meredeksge szmszersti, hogy az x egysgnyi vltozsa mekkora y vltozst von maga utn. Tl azon, hogy ennek a meredeksgnek a vizsglatval is vlaszolni
tudunk arra a krdsre, hogy a kt vizsglt vltoz kapcsolatban van-e, a regresszis egyenes arra is felhasznlhat, hogy egy tetszleges x rtkhez tartoz y rtket megadjunk
anlkl, hogy azt megmrnnk. Az ilyen predikcinak nagy jelentsge van pldul olyan
esetekben, amikor egy viszonylag knnyen mrhet paramter szoros kapcsolatban van
egy nehezen mrhetvel. Ilyenkor a vizsglati szakaszban kell csak prhuzamosan mrni
mindkt paramtert, aztn a vizsglat vgeredmnyeknt kapott regresszis egyenletet
hasznlva mr elg lesz csak az x-et mrni, s az y-t csak szmolni kell.
Az x-tengelyen brzolt paramtert regresszis elemzs esetn magyarz vltoznak, illetve fggetlen vltoznak nevezzk, megklnbztetve az y-tengelyen brzolt
fgg vltoztl. Ennek oka, hogy a regresszis elemzs sorn a paramterek kzti
kapcsolatnak irnya van. Nem azt vizsgljuk, hogy kt vltoz milyen kapcsolatban
van egymssal, hanem azt, hogy az egyik (magyarz, fggetlen) vltoz miknt befolysolja a msik (fgg) vltoz rtkt. A kapcsolat irnyt a vizsglt paramterek
kzti kapcsolat felttelezett mechanizmusa alapjn hatrozhatjuk meg. Ha az letkor
s a csontok kalciumtartalma kzti kapcsolatot korrelcis elemzssel vizsgljuk, akkor azokat a krdseket tudjuk megvlaszolni, hogy van-e kapcsolat a kt paramter
kzt, pozitv vagy negatv a kapcsolat irnya, milyen szoros a paramterek kzti kapcsolat. Utbbi alatt azt rtjk, hogy milyen mrtkben hatrozza meg az letkor a kalciumtartalmat, vagy milyen kapcsolatban van a csontok kalciumtartalma az letkorral.
Szmszeren ugyanaz a korrelcis koefficiens adja meg a vlaszt mindkt krdsre. Ha
ugyanezt a kapcsolatot lineris regresszis elemzssel prbljuk rtkelni, akkor nem
77

Biostatisztika

Biostatisztika

mindegy, hogy milyen irny kapcsolatot tesztelnk. Mert az illesztett trendvonal meredeksge nem ugyanaz akkor, ha az letkor a magyarz vltoz, s ezt brzoljuk a
x-tengelyen, vagy ha a csontok kalciumtartalmt tekintjk magyarz tnyeznek. (Termszetesen az utbbi krdsfelvets megalapozatlan, s csak az elbbinek van rtelme.)
Az x fggetlen vltoz s y fgg vltoz kzti kapcsolatot szemlltet szrsdiagram pontjaira illesztett trendet ler egyenes (regresszis egyenes) egyenlete:

kapcsolatot vizsgljuk, akkor nyilvn nincs szemlletesen rtelmezsi lehetsge az a


metszspontnak, mivel nincsenek olyan emberek, akiknek 0 a BMI-je. Utbbi esetben
csak a matematikai rtelmezs lehetsges (16. bra).
A trendvonal, a regresszis egyenes, pontosabban a regresszis egyenes paramtereinek
(a; b) meghatrozshoz a legkisebb ngyzetek elvet hasznljuk (17. bra).
Azt az egyenest kell megtallnunk, amelyik a vizsglatban elfordul magyarz
vltoz rtkeknl (x) olyan yr-rtkeket vesz fel, amelyek eltrse a tnyleges fgg
vltoz rtkektl (y) a lehet legkisebb. Amikor a deviancik (y yr) minimlisak, akkor kapjuk az adatainkra legjobban illeszked, teht a kapcsolatot legpontosabban ler
egyenest, a regresszis egyenest. A deviancik egyarnt lehetnek pozitv s negatv szmok, ezrt ezek egyszer sszeadsa sorn a pozitv rtkek kioltank a negatvakat, s
nem kapnnk kpet arrl, hogy mekkora is a trendvonal s a vizsglati eredmnyeket
megjelent pontok kzti tvolsg. Ennek elkerlsre az eltrsek ngyzett sszegezzk (ami mindig pozitv), vagyis az egyes megfigyelt rtkek regresszis egyenestl
mrhet tvolsgainak ngyzeteit sszegezzk, s keressk azt az egyenest, ami esetben ez az sszeg minimlis:
. Szerencsre, az egyenes paramtereinek szmtshoz nem kell klnbz egyenesek illeszkedst elemeznnk. Egyszeren szmthatk a ngyzetes eltrsek sszegt minimalizl (a; b) paramterek.
A meredeksg megadhat a kovariancia s a magyarz vltoz variancijnak hnyadosval, aminek ismeretben az y-tengellyel val metszspont azrt szmthat,
;
mert kihasznljuk, hogy a tipikus vizsglati alanyt reprezentl (x
y ) ponton mindig
tmegy a regresszis egyenes:

ahol b a trendvonal meredeksge (regresszis koefficiens). Szmszeren megadja, hogy


az x egysgnyi vltozsa esetn az y hogyan mdosul. Mrtkegysggel rendelkez mutat, aminek rtke a mrtkegysgek tvltsakor megvltozik. Szemben a korrelcis
koefficienssel, ez nem standardizlt mutat, ezrt rtke nem (1; +1) intervallumon belli szm, hanem a mrtkegysgtl fggen brmekkora pozitv szm lehet, emelked,
s brmekkora negatv szm, cskken trend esetn. Nulla az rtke, ha nem befolysolja a fgg vltoz rtkt a magyarz vltoz.
Az a rtk a regresszis egyenes y-tengellyel val metszspontja, azaz az egyenlet
megoldsa x = 0 esetre. Szintn dimenzival rendelkez paramter, aminek konkrt
rtke fgg az ppen hasznlt mrtkegysgtl. Nem mindig van biolgiailag rtelmezhet szemlletes jelentse. Ha pldul a naponta elszvott cigarettk szmval rjuk le
a dohnyzs intenzitst egy dohnyzs hatsait vizsgl epidemiolgiai tanulmnyban (a dohnyzs intenzitsa az x vltoz), akkor az a metszspont a nemdohnyzkra
jellemz y rtket jelenti. Ha azonban a BMI-vel mrt elhzs s a vrnyoms kzti

16. bra. A regresszis egyenes egyenletnek meredeksge (b = 157,69 134,60 = 23,09) s y


tengelymetszete
78

17. bra. Regresszis egyenes illesztse a legkisebb ngyzetek elve alapjn

79

Biostatisztika

Biostatisztika

,
,
.
Ezt kveten mr csak arra kell vlaszolnunk, hogy a trend, a kt vltoz kztti
kapcsolat magyarzhat-e a vletlennel vagy nem. (A semleges viszonyt ler nulltl
szignifiknsan eltr-e a megfigyelt meredeksg?)
Varianciaelemzssel tudunk vlaszolni a krdsre. Kvetnnk kell azt az utat, amit
;
a tipikus (x
y ) vizsglati alanytl indulva a tnyleges eredmny (x; y) rtkprjig bejrunk (18. bra).
Az t els szakasza a regresszis egyenes mentn az (x; yR) pontig tart.

Az tnak megfelelen, els lpsknt a fgg vltoz variabilitst kt rszre osztjuk. Meghatrozzuk azt a rszt, amit a regresszis sszefggssel meg tudunk magyarzni, vagyis azt a vltozkonysgot, amit a magyarz vltoztl val fggse idz
el. Ennek s a teljes variancinak a klnbsgeknt pedig megadhatjuk a regresszis
kapcsolattal nem magyarzhat variabilitst. A variabilits felosztst legegyszerbben
a ngyzetes eltrsek sszegeinek (SS) segtsgvel tudjuk rtelmezni. A fgg vltoz
teljes variabilitsa (SSy) s a regresszival magyarzhat variabilits (SSR) ezek alapjn:
,
.
A variabilitsnak az a rsze (SSE), ami pedig nem magyarzhat a regresszival (a
kt vltoz kztti kapcsolattal):
.

A msodik szakasz az x helyen, a trendvonal ltal jelzett tipikus yR ponttl tart fgglegesen pozitv vagy negatv irnyba a vizsglat (x; y) eredmnyig. Az y-tengely vetletben nzve a mozgs kt szakasza is szmszersthet (minden vizsglati alanyra,
azaz minden x rtkre):
.

18. bra. A lineris regresszival magyarzhat (3,03 3,29) s nem magyarzhat (3,29 3,9)
variabilits szrmaztatsa
80

Utbbi egyszeren klnbsgknt is felrhat:


.

A teljes variabilits regresszival magyarzhat s azzal nem magyarzhat rszeinek arnya mutatja meg szmunkra, hogy lnyeges befolyssal van-e a magyarz vltoz a fgg vltoz alakulsra. (Ha van befolysa, akkor a trend nem ltszlagos. Ebben az esetben az egyes vizsglati eredmnyek rtkt elg nagymrtkben a magyarz
vltoz hatrozza meg, s a regresszis hatsra kialakul rtk csak tovbb varildik,
a vizsglatban nem rtkelt egyb tnyezk hatsra. A trend csak ltszlagos, ha nincs
lnyeges hatsa a magyarz vltoznak. Ilyen esetben a fgg vltoz teljes variancijnak tlnyom rsze fggetlen lesz a regresszis kapcsolattl, a vizsglati eredmnyek
alapveten olyan tnyezk miatti szrdst mutatnak, amit nem a magyarz vltoz,
hanem ms, a vizsglatban nem rtkelt faktorok hoznak ltre.)
A ngyzetes eltrsek sszegei alapjn a variancik szmthatk (18. tblzat). A
szabadsgi fokok az egyes komponensekhez a kvetkezk: regresszis sszefggssel
magyarzott variancira 1; teljes variancia szabadsgi foka (N-1), a nem magyarzott
rsz szabadsgi foka (N-2). gy a regresszival magyarzhat (VR) s nem magyarzhat
variancia (VE):
81

Biostatisztika

Biostatisztika

18. tblzat

Ezek segtsgvel a variancik hnyadosa mr megadhat:


.
Ha a hnyados kellen nagy szm, akkor a regresszival magyarzhat varianciarsz
nagy a regresszival nem magyarzhat rszhez kpest, vagyis (lineris) kapcsolat van
a kt paramter kztt. Ha ez az arny kicsi szm, akkor a regresszival nem tudjuk lnyeges rszben magyarzni a teljes variancit, azaz nincs kapcsolat a kt vltoz kztt.
Az F kritikus rtkt, ami felett mr szignifikns a regresszis kapcsolat magyarzereje, tblzatbl lehet meghatrozni, ahol a kt szabadsgi fok F szmtsnak megfelelen 1 s (N-2).
A kapcsolat szignifikancijt, a trend valdisgt vagy ltszlagos jellegt a regresszis koefficiens megbzhatsgi tartomnya segtsgvel is rtkelhetjk:
,

Variabilits forrsa

Variabilits (ngyzetes
eltrsek sszege, SS)

Szabadsgi
fokok

Variancia (tlagos
ngyzetes eltrs)

Variancia
hnyados (F)

Regresszis
kapcsolattal
magyarzhat (R)
Regresszis
kapcsolattal nem
magyarzhat (E)
Teljes (y)

talmazza a nullt, azaz teljes egszben vagy negatv, vagy pozitv tartomnyban helyezkedik el, akkor a diagram trendje valdi, irnynak megfelel mdon valban kapcsolat van a vizsglt paramterek kzt.
Miutn elvgeztk a megfigyelseinket, a regresszis egyenlet segtsgvel a magyarz vltoz tetszleges xp rtkhez szmthatjuk a vrhat fgg vltoz rtket,
pontosabban egy legvalsznbb yp vrhat rtket:

ahol a az elsfaj hibt, t pedig a t-eloszls a s N-2 szabadsgi foknak megfelel rtkt jelli, s ahol a koefficiens standard hibja SEb:

A megbzhatsgi tartomny rtkelshez ugyanazokat a szempontokat kell figyelembe venni, amiket a korrelcis koefficienseknl mr emltettnk. Ha az 5%-os
megbzhatsgi tartomny tartalmazza a nullt, azaz egyik rsze negatv, msik pozitv
tartomnyban van, akkor a vizsglati eredmnyeink alapjn nem zrhatjuk ki, hogy a
valdi regresszis koefficiens (ami tnylegesen lerja a magyarz s a fgg vltoz
kzti kapcsolat jellegt) negatv szm (ami szerint a magyarz vltoz nvekedse a
fgg vltoz cskkenst vonja maga utn), vagy pozitv szm (ami szerint a magyarz vltoz nvekedse a fgg vltoz nvekedsvel jr egytt), vagy nulla (ami
szerint a magyarz vltoz hatsra nem vltozik a fgg vltoz). Akrmilyen is volt
a szrsdiagramon a trend, ilyen eredmny birtokban nem llthatjuk, hogy valban
kapcsolat van a kt paramter kztt. Ha viszont a megbzhatsgi tartomny nem tar-

Az gy szmtott rtk megbzhatsgnak rtkelsekor azonban figyelembe kell


vennnk, hogy a regresszis egyenes meredeksgt s y-tengelymetszett csak tbb-kevesebb pontatlansggal tudtuk a minta vizsglata utn megllaptani. Ennek kvetkeztben minl tvolabb kerlnk a vizsglat sorn hasznlt minta
x tlagos magyarz
vltoz rtktl, annl pontatlanabbak lesznek a becslseink. (A valdi s a minta alapjn becslt regresszis egyenes a vizsglt intervallum tlagnl lesz egymshoz a legkzelebb, attl tvolodva egyre tvolabb futnak egymstl.)
Radsul nem csak a becslt meredeksggel van a problma, hanem maga a vizsglat sorn meghatrozott egyenes sincs j helyen. Ennek oka, hogy a vizsglati eredm;
nyek feldolgozsakor a minta alapjn kpzett tipikus (x
y ) vizsglati alanyhoz ktttk
a regresszis egyenest. Mindezekhez a bizonytalansgokhoz addik hozz, hogy eleve
csak egy befolysol tnyez hatsait vizsgltuk. A nem vizsglt tbbi faktor hatsa vletlenszer variabilits forrsaknt okozta a vizsglati eredmnyek regresszis egyenes
krli szrdst, s ugyanez a hats fokozza a jsolt rtk bizonytalansgt.

82

83

Biostatisztika

Biostatisztika

Ezeket a hibkat figyelembe vve adhat meg a jsolt rtk, amihez a paramterek
becslst biztost minta tlagos magyarz rtktl tvolodva, fokozatosan romlik a
megbzhatsga, ami a jsolt rtkhez kapcsold, fokozatosan bvl, 95%-os megbzhatsgi tartomnyokban tkrzdik:

Egy 13 fs labdarg csapatnl rtkelik a tavaszi szezonban vgzett munkt. Tbbek kztt elemzik, hogy a teljestett edzsek szma milyen kapcsolatban volt egy fittsgi teszten elrt pontszmmal. Az tlagos edzsszm 32,69 (SD = 4,64), az tlagos
fittsgi teljestmny 142,78 (SD = 30,49) pont volt (19. tblzat).
A lineris trendvonal paramtereit szmtottk (19. bra).
A kovariancia 98,84 volt. Meghatroztk a trend szignifikancijt.

.
Jsolt rtket csak a paramterek megllaptsra hasznlt minta magyarz rtkeinek tartomnyban lehet szmtani. Az eredeti tartomnyon kvlre extrapollni nagyon
kockzatos. Egyltaln nem biztos, hogy a vizsglt tartomnyon kvl ugyanolyan a paramterek kzti kapcsolat, mint a vizsglt tartomnyon bell. (Szmos plda van arra,
hogy klnbz dzistartomnyokban ugyanaz a hats ms intenzitssal idz el biolgiai vlaszokat.) St, az is elfordulhat, hogy a vizsglt tartomnyon kvl rtelmetlen
mr maga a magyarz vltoz is. (Ha a testmagassg s a testsly kzti kapcsolatot
vizsgljuk, akkor szignifikns trendet ltunk. De a matematikai lehetsg ellenre nyilvnvalan rtelmetlen a 10 m magas emberek vrhat testtmegt szmtani.)

a = ybx = 142,784,5832,69 = 7,07

19. tblzat
Edzsek szma (x)

Fittsgi teszt (y)

(x x)

( y y)

( x x )( y y )

27

122

5,69

20,77

118,22

30

155

2,69

12,23

32,93

39

192

6,31

49,23

310,53

38

186

5,31

43,23

229,46

27

114

5,69

28,77

163,76

28

120

4,69

22,77

106,84

39

147

6,31

4,23

26,69

27

120

5,69

22,77

129,61

33

118

0,31

24,77

7,62

31

120

1,69

22,77

38,53

36

168

3,31

25,23

83,46

35

183

2,31

40,23

35

111

2,31

31,77

84

19. bra. Lineris regresszis kapcsolat az edzsek szma s a fittsgi teszten elrt teljestmny
kztt
20. tblzat
Variabilits (ngyzetes
eltrsek sszege)

Szabadsgi
fokok

Variancia (tlagos
ngyzetes eltrs)

Variancia
hnyados

Regresszis kapcsolattal
magyarzhat

5436,42

5436,42

10,46

92,84

Regresszis kapcsolattal
nem magyarzhat

5715,89

11

519,62

73,31

Teljes

11 152,3

12

Variabilits forrsa

85

Biostatisztika

Biostatisztika

Standardizlt regresszis koefficiensek

21. tblzat
Sportol neve

Edzsek szma

Jsolt fittsgi teszt (95%-os megbzhatsgi tartomny)

TH

29

126

(73; 179)

ZV

34

149

(97; 201)

ESz

37

163

(109; 216)

A regresszis koefficiens standard hibja 1,42 (95%-os megbzhatsgi tartomnya


1,467,70) volt (20. tblzat).
Ezek alapjn megllaptottk, hogy: (1) a diagram alapjn gy tnik, a tbb edzssel magasabb teljestmny rhet el; (2) a megbzhatsgi tartomny teljesen a pozitv
tartomnyban volt, emiatt az emelked trend vletlennel nem magyarzhat, tnyleges
kapcsolat van az edzsek szma s a teljestmny kztt; (3) minden edzs 4,58 pontos
teljestmnyjavulst eredmnyezett. Annak a 3 csapattagnak, akik nem tudtak rszt venni a fittsgi teszten, de akik v kzben rendszeresen ltogattk az edzst, megjsoltk a
fittsgi pontszmukat (21. tblzat).

Determincis koefficiens
A trend valdisgnak vagy ltszlagos termszetnek rtkelsekor hasznlt varianciaelemzs alkalmval definiltuk a teljes variabilits lershoz SSy-t, melynek regresszival magyarzhat rsze SSR volt. Az SSR/SSy hnyadossal tudjuk lerni, hogy az y
fgg vltoz teljes variancijnak hnyadrszt kpes megmagyarzni az x magyarz
vltoz a kztk lv kapcsolat kvetkeztben, ezrt ezt definiljuk determincis koefficiensknt. (Az SSE /SSy hnyados pedig a magyarz vltoztl fggetlen hnyadt
adja a teljes fgg vltoz variabilitsnak.) Az SSR /SSy hnyados a korrelcis koefficiens ngyzetvel egyenl:
.
A sportolk adatainak elemzsekor azt talltk, hogy a fittsgi index 49%-ban az edzseken val rszvtel gyakorisgval magyarzhat:

A regresszis egyenes meghatrozsval jl jellemezhetnk egy egyszer kapcsolatot.


A valsgban azonban nagyon ritkn fordul el, hogy egy fgg vltoz rtkt alapveten egyetlen fggetlen vltoz hatrozza meg. A biolgiai jelensgek sokkal bonyolultabb klcsnhatsok eredmnyeknt alakulnak ki. Ezrt, ha vals problmkat akarunk
eredmnyesen vizsglni, akkor az egyvltozs elemzsek helyett olyan mdszerre van
szksgnk, amellyel egyszerre tbb determinns hatst is vizsglhatjuk.
Ezt elvgezhetnnk gy, hogy az sszes determinnsra kln-kln kiszmtjuk
a regresszis koefficienseket. Ezek azonban dimenzival rendelkez szmok, amik
kzvetlenl nem hasonlthatk ssze. (Az egyves letkor-nvekedsre es vrnyoms-emelkeds nem hasonlthat ssze az egysgnyi testtmegindex-nvekedsre es
vrnyoms-emelkeds mrtkvel. A regresszis koefficiensek rtke nem segti annak
megtlst, hogy melyik faktor br nagyobb befolyssal a vrnyoms meghatrozsban.) Emiatt az egyes fggetlen vltozk relatv slyt ilyen mdon nem tudjuk meghatrozni.
Egymssal kzvetlenl sszehasonlthat, dimenzi nlkli, regresszis koefficienseket gy kaphatunk, ha standardizljuk a vizsglati eredmnyeinket. Ilyenkor az ppen
hasznlatos mrtkegysgek elvesztik jelentsgket, s a standardizlt regresszis koefficiensek () mr kzvetlenl sszehasonlthatk: a nagyobb standardizlt regresszis
koefficiens ersebb hatst jelez. A standardizlst utlag is elvgezhetjk:

.
Ezzel a megkzeltssel mindaddig semmi gondunk nem is lesz, amg az egyes magyarz vltozk egymstl fggetlenek. Amikor viszont ezek egymssal is kapcsolatban
vannak (nagyon gyakran ez a helyzet), akkor az adott fggetlen vltozkra szmtott
regresszis koefficiens nem csak az adott magyarz vltoz sajt hatst fogja tartalmazni, hanem az egyb determinnsok rajta keresztl kifejtett hatsait is. Ilyen esetben
a standardizls helyett olyan eljrsra van szksgnk, amely a determinnsok nll
hatst szmszersti. (Ez az eljrs a tbbvltozs lineris regresszis elemzs.)

.
86

87

Biostatisztika

Biostatisztika

Nem paramteres prbk

az NU meggyz mrtkben meghaladja az NE-t. A meggyz mrtk megadshoz,


azaz a kritikus statisztikai mrszm kiszmtshoz ebben az esetben is a 2 szmtst
hvjuk segtsgl, ahol a vrhat rtk termszetesen (NU + NE)/2 (tkrzve azt az llapotot, amikor nincs semmilyen hatsa a kezelsnek, s ezrt a javul s roml betegek
szma egyenl), a szabadsgi fok pedig 1:

A kvantitatv adatok elemzsekor korbban olyan elemzsi technikkat ismertnk meg,


amelyek az adatok normlis eloszlst felttelezve a normlis eloszls tlagt, szrst (eloszls-paramtereit) elemeztk valamilyen gondolatmenet mentn. A normalitst
azonban kifejezetten azrt kell ellenrizni, mert nem minden esetben rvnyesl. Ha
nem normlis eloszlsak az adataink (pldul kiugr rtkek vagy aszimmetrikus eloszls miatt), akkor nem lehet alkalmazni t-prbt, varianciaelemzst, korrelcis koefficiens s regresszis egytthat szmtst. Ezekben az esetekben olyan statisztikai
eljrsokat alkalmazunk, melyek nem felttelezik a normlis eloszlst, s amelyek menete nem ignyli eloszls-paramterek szmtst. Ezek a nem paramteres eljrsok.
Alkalmazsuk egyszersgnek az ra a kisebb hatkonysg. Az alapvet paramteres
prbk nem paramteres alternatvi ltalban knnyen alkalmazhatk, de a regresszis
elemzsek nem helyettesthetk nem paramteres mdszerekkel (hiszen ennl a statisztikai eszkznl ppen az egysgnyi fggetlen vltoz nvekedshez kapcsold fgg
vltoz vltozsnak megllaptsa van a fkuszban.)
Alapszablyknt elmondhat, hogy ha lehetsg van r, akkor trekedni kell olyan
vizsglattervezsre, ami a normalits kritriumnak megfelel adatokat eredmnyez.
Ha az adataink nem normlis eloszlsak mgsem, akkor meg kell prblni valamilyen
transzformci segtsgvel normalizlni ket.

Eljelteszt

Yates-korrekcival rdemes ezt a szmtst is kiegszteni a konzervatv szemllet


rvnyestse rdekben:

Kritikus rtknl nagyobb teszteredmny arra utal, hogy jelents az eltrs a javul s roml llapot betegek szma kztt. Szmtgp segtsgvel pedig meg tudjuk
hatrozni, hogy 1-es szabadsgi fok esetn a szmtott 2 milyen dntsi kszb esetn
felel meg a kritikus rtknek (azaz kiszmthatjuk a p-rtket).
12 beteget kezelnek, s egy letminsg-skln mrik a kezels hatst (22. tblzat). A kezels eltti s utni rtkek nem normlis eloszlsak. 8 beteg javulsrl,
4 pedig az letminsge romlsrl szmolt be. A szmtott 2 kisebb, mint a kritikus
.
Nem rtkelhetjk a vizsglati eredmnyt gy, hogy a beavatkozs javtja a betegek
letminsgt, s a vizsglati eredmny nem ad alapot arra, hogy a vizsglt eljrst alkalmazzk.

Ha prba rendezett kvantitatv adataink vannak, melyek kezels eltti s utni llapotot,
vagy zavar tnyezk szempontjbl hasonl kt szemly reakciit vizsgljk, melyekre nem teljesl a normalits felttele, akkor legegyszerbb, ha a prokon bell az adatok
klnbsgnek irnyt elemezzk.
Ha pldul a kezels eltt (H) s a kezels utn (U) megfigyelt adatprokat nzzk,
akkor megllapthatjuk a kezels hatsra javul (NU), illetve roml (NE) llapot betegek szmt. Termszetesen lehetnek betegek, akik nem szmolnak be vltozsrl ket
a mostani elemzsben figyelmen kvl is hagyjuk!
Amennyiben a kezels valjban nem befolysolta a beteg llapott, akkor a javul
s roml llapot betegek szma hasonl lesz. Ha a kezels javtja a kimenetelt, akkor

Az eljelteszt inkbb didaktikai szempontbl rdekes. Egyszersge, ami a szmtsi igny s az eredmny (2) rtelmezse szempontjbl is egyrtelm, bartsgoss
teszi a mdszert. Gyakorlati alkalmazsra ma mr csak ritkn kerl sor. Ennek oka,

88

89

Biostatisztika

Biostatisztika

A prba rendezett, nem normlis eloszls kvantitatv adatok rtkelsekor alkalmazhat eljrs a Wilcoxon prostott teszt, ami a prok kzti eltrsnek nem csak az irnyt
veszi figyelembe, hanem a prok kzt meglev klnbsg nagysgt is. Mivel a vizsglati eredmnyek nem normlis eloszlsak, ezrt a megfigyelt adatok kzti klnbsg
nagysga helyett (amely t-prba esetn volna a statisztikai szmts kiindulsi pontja)
azok egymshoz viszonytott sorrendjt (rangjt) hasznljuk. Ennl a pontnl nyilvn-

valan informcit vesztnk a tnyleges klnbsgek nagysghoz viszonytva, de a


vesztesg nem olyan jelents, mint az eljelteszt esetn.
A vizsglat sorn az adatprok, az E- s U-csoporthoz tartoz vizsglati alanyok adatai kzti klnbsget szmtjuk, a klnbsg irnyt figyelmen kvl hagyva, azaz az eltrs abszolt rtkt hatrozzuk meg. Az abszolt rtkek alapjn nvekv sorrendbe,
rangsorba lltjuk a prokat. A legkisebb klnbsget mutat pr lesz az els a sorban,
ez a pr kapja az 1-es rangot. Elfordul, hogy tbb abszolt klnbsg is szmszeren
azonos. Ilyenkor a rangok tlagt kapja mindegyik rtk. Pl. ha az 5. s 6. adatpr azonos abszolt klnbsget mutatott, akkor mindkt prt 5,5-es ranggal [(5 + 6)/2 = 5,5]
vesszk majd figyelembe a tovbbi szmtsok sorn. Ha a 810. helyeken kaptunk
azonos rtkeket, akkor mindhrom pr a 9-es rangot [(8 + 9 + 10)/3 = 9] fogja kapni.
Ha a vizsglat sorn olyan adatprt is tallunk, ahol a kt rtk egyforma, akkor ezeket
a prokat a feldolgozsbl ki kell zrni.
Az gy szmtott rangok eljelet kapnak: az eredeti klnbsgek eljelt. Ha egy
adatprnl az E-adat nagyobb volt, mint az U, akkor a pozitv eljel eltrs miatt a
rang eljele is pozitv lesz. Ha az E-rtk volt a kisebb, akkor az eltrs negatv eljelt
kapja az adatpr rangszma is. Ha a kt csoport kzt nem volt lnyeges eltrs (pldul
nem volt hatkony az alkalmazott kezels), akkor a klnbsgek vletlenszeren oszlanak meg, emiatt a klnbsgek negatv s a pozitv eljel rangszmainak sszege
kzel azonos lesz. Ha az eljeles rangokat sszeadjuk, akkor 0 krli rtket kapunk.
Ha a kt csoport kzt lnyeges klnbsg van (pldul a kezels hatsos volt), akkor
az adatprok klnbsgei eltoldnak pozitv irnyba, tbb lesz a pozitv eljel rangszm, illetve nagyobb lesz a pozitv rangszmok sszege. Ha kellen nagy az eltrs a
pozitv s negatv eljel rangszmok sszege kzt, akkor tekintjk a vletlennel mr
nem magyarzhatnak a kt csoport kzti klnbsget. Vagyis eljutottunk ismt ahhoz
a ponthoz, ahol valamilyen statisztikai mrszm segtsgvel szmszerstennk kell
egy eltrst, s ennek az eltrsnek a kritikus rtkt is meg kell tudnunk hatrozni.
A klnbz eljel rangszmok sszege kzti klnbsg termszetesen nem csak
az adatprok kzti klnbsgektl fgg, hanem attl is, hogy hny adatprt elemeztnk. Minl nagyobb elemszm a vizsglat, annl nagyobb rangszmsszeget kapunk.
A vizsglat mrett a minta elemszmval adhatjuk meg. Ennek (s termszetesen a
dntsi kszbnek) a figyelembe vtelvel rtkeljk majd a teszt eredmnyt.
A teszt eredmnye Wilcoxon-tesztnl a kisebbik rangszmsszeg. (A pozitv s negatv eljel rangszmsszegek kzl a kisebbik abszolt rtkt vlasztjuk ki.) Ha a
kt csoport kzt lnyeges a klnbsg, akkor a klnbsgek eltoldsa miatt az egyik
oldalon a sok rangszm nagy rangszmsszeget eredmnyez, a msik oldalon viszont

90

91

22. tblzat
Beavatkozs eltti indiktor
(E)

Beavatkozs utni indiktor


(U)

Vltozs mrtke
(UE)

Vtozs eljele

2,11

3,68

1,57

2,12

3,63

1,51

2,14

4,05

1,91

2,83

3,56

0,73

2,85

2,38

0,47

3,40

3,21

0,19

3,88

3,35

0,53

6,66

5,95

0,71

6,87

9,08

2,21

7,96

10,17

2,21

8,75

20,63

11,88

13,95

16,45

2,50

hogy a teszt egyltaln nem veszi figyelembe, hogy milyen nagyok voltak azok a klnbsgek, amelyek alapjn a prokon belli klnbsgek irnyt meghatroztuk. Nyilvnvalan komoly informci vsz el ezzel a megoldssal. Radsul olyan informci,
amelyet az adatgyjts sorn egyszer mr megszereztnk. A vizsglatok statisztikai tmogatsa pedig nem szlhat az ltalnos vizsglati hatkonysg cskkentsrl. A mai
szmtstechnikai felttelek mellett pedig a szmts egyszersge s a vgeredmny
rtelmezsnek egyszersge nem lehet szempont a mdszerek megvlasztsakor.

Wilcoxon prostott teszt

Biostatisztika

Biostatisztika

23. tblzat
Beavatkozs
eltti rtk
(E)

Beavatkozs
utni rtk
(U)

Vltozs
mrtke
(UE)

Vltozs
eljele

Vltozs
abszolt
rtke |UE|

Rangszm

Eljeles
rangszm

Pozitv
eltrsek
rangszmai

Negatv
eltrsek
rangszmai

2,11

3,68

1,57

+1

1,57

2,12

3,63

1,51

+1

1,51

2,14

4,05

1,91

+1

1,91

2,83

3,56

0,73

+1

0,73

2,85

2,38

0,47

0,47

3,4

3,21

0,19

0,19

3,88

3,35

0,53

0,53

6,66

5,95

0,71

0,71

6,87

9,08

2,21

+1

2,21

9,5

9,5

9,5

7,96

10,17

2,21

+1

2,21

9,5

9,5

9,5

8,75

20,63

11,88

+1

11,88

12

12

12

13,95

16,45

2,5

+1

2,5

11

11

11

kevs klnbsg lesz (ritkn fordul el, hogy az ltalban hatsos kezels alkalmazsa
utn egyes betegek llapota romlik), abszolt rtkt tekintve kicsi rangszmsszeget
eredmnyez. Minl kisebb ez a kisebbik rangszmsszeg, annl biztosabbak lehetnk
a csoportok kzti eltrs szignifikancijban. A kritikus rtkeket tblzatokbl tudjuk
megkeresni (http://www.sussex.ac.uk/Users/grahamh/RM1web/WilcoxonTable2005.
pdf), vagy szmtgp segtsgvel tudjuk szmtani.
Az eljelteszt pldjnak adatait felhasznlva a pozitv rangszmok sszege 68, a
negatv rangszmok 10. sszesen 12 adatprt vizsgltunk. A kritikus rtk 12 adatprnl s 5%-os dntsi kszbnl 14. A klnbsg teht elg nagy a kt csoport kzt
ahhoz, hogy meggyzzn minket arrl, hogy a beavatkozs hatsos volt (23. tblzat).

MannWhitney U-teszt
Abban az esetben, ha kt fggetlen csoport folytonos vltozinak klnbsgt szeretnnk rtkelni, de az adatok nem normlis eloszlsak, vagy a csoportokon belli variabilits jelentsen eltr, akkor az adataink eloszlsra az tlagrtk s a szrs nem
hasznlhat. Helyette a medin segtsgvel tudjuk lerni az adatok centrlis rtkt, s
92

rangszmok segtsgvel az egyes adatok elhelyezkedst. A klnbsg rtkelsre a


MannWhitney U-tesztet alkalmazhatjuk.
A teszt a kt vizsglati csoport (A, B) adatainak sszevonsval s az egyestett adatsoron belli rangsorolsval kezddik. (A legkisebb rtk kapja az 1-es sorszmot.)
Az egyestett mintban kapott sorszmokat a kt csoportban kln-kln sszegezve
lthatjuk, hogy melyik csoportban fordulnak el jellemzbben a magas, s melyikben
inkbb az alacsony rangszmok. Ha nincs lnyeges klnbsg a kt csoport kzt, akkor
a rangsorban is vletlenszeren szrdnak a csoportok adatai, s a csoportonknti rangszmok sszege (TA, TB) is hasonl lesz. Ha jelents a kt csoport kzti klnbsg, akkor
az egyik csoport adatai eltoldnak a kicsi sorszmok fel, a msik csoport adatai pedig
inkbb a nagyobb sorszmok irnyba. Emiatt lesz nagy a kt rangszmsszeg kzti
eltrs. Ha ez a klnbsg kellen nagy, akkor rtkeljk szignifiknsnak, vletlennel
nem magyarzhatnak a csoportok kzti klnbsget.
A statisztikai mrszm nmagban nem lehet a rangszmsszegek klnbsge,
mert ez az rtk nem fggetlen a vizsglat elemszmtl. Minl nagyobb az egyes csoportok ltszma, annl nagyobbak a rangszmok sszegei is, emiatt tendenciaszeren
nagyobb lesz a kt rangszmsszeg klnbsge.
Az elvileg lehetsges minimlis rangszmsszeggel korriglt rangszmsszeget kell
helyette alkalmaznunk. (Ha az egyik csoportban kapott adatok mind kisebbek, mint a
msik csoportban, akkor az els csoport tagjai kapjk 1-tl kezdve folyamatosan a legkisebb sorszmokat. Ebben az extrm helyzetben 1, 2, 3, 4, , n lesz a csoport tagjainak sorszma. A rangszmok sszege az n elem szmtani sorok sszege, azaz n(n-1)/2
lesz.) Az ezzel a korrekcival kapott U-rtkek minimuma 0, azaz a szmtott U-rtkek
mindegyikt ugyanahhoz a kiindulsi ponthoz tudjuk viszonytani.
.
U-rtket kapunk mindkt csoport esetben. A statisztikai mrszm vgl csak
a kisebbik U-t hasznostja, a nagyobbikat figyelmen kvl hagyjuk. Ennek az elemszmokra s a dntsi kszbre vonatkoz kritikus rtkt tblzatokbl tudjuk megkeresni. (http://www.lesn.appstate.edu/olson/stat_directory/Statistical%20procedures/
Mann_Whitney%20U%20Test/Mann-Whitney%20Table.pdf)
Ha az U kisebb, mint a tblzatban szerepl hatrrtk, akkor tekinthetjk a kt csoport kzti klnbsget szignifiknsnak. Termszetesen egy sor statisztikai szmtgpes
program segt a szmtsok kivitelezsben s a teszt eredmnynek rtkelsben.
93

Biostatisztika

Biostatisztika

Cukorbetegek HgbA1c-szintjeit vizsgljk kt terpis protokoll (A, B) alkalmazsa


mellett (24. tblzat). A 18 A s 17 B protokollal kezelt beteg medinrtke 7,87%, illetve 7,72% volt. A rangszmok sszege a B-csoportban volt magasabb: TA = 261, TB
= 369. Az A-csoport U-rtke alapjn lehetett a csoportok kzti klnbsg szignifikancijt rtkelni:
,

Mivel 5%-os dntsi kszb mellett s 18-as, illetve 17-es csoportltszmoknl a


kritikus rtk 93, aminl kisebb az UA, a kt csoport kzt vletlennel nem magyarzhat
a klnbsg. Lnyegesen alacsonyabbak a HgbA1c-eredmnyek az A-protokoll szerint
gondozott betegek kzt.
rdemes megemlteni, hogy a MannWhitney U-teszt nem a medinok klnbsgeit
vizsglja, amint azt eseteknt mondani szoktk. A fenti plda is jl szemllteti, hogy
lnyegben azonos medinok mellett is lehet lnyegesen eltr az adatok eloszlsa.
(Akkor szoktk a medinok kzti klnbsg tesztelseknt ismertetni a MannWhitney
U-tesztet, amikor a ktmints t-prbval val hasonlsgot magyarzzk, ami az tlagok kzti klnbsget teszteli. Mint minden hasonlat, ez is csak egy bizonyos pontig
segti a megrtst a tanuls idejn. A tanuls clja viszont vgs soron a statisztikai eljrs gondolatmenetnek tisztnltsa.)

KruskalWallis H-teszt
Amennyiben kettnl tbb csoportba rendezett kvantitatv adatainak elemzsvel szeretnnk egy befolysol tnyez hatsra vonatkozan megllaptst tenni, de az adatok
nem normlis eloszlsak, s emiatt az egyszempontos varianciaelemzs nem hasznlhat, akkor a nem paramteres alternatvt a KruskalWallis H-teszt jelenti. Az eloszls
mdjra tekintet nlkl az egyes mrsi eredmnyek sorba rendezse rvn nyert rangsor segtsgvel rtkelhetjk a csoportok kzti eltrst. Az eredmnyek kzti tnyleges klnbsg nagysgra vonatkoz informcit emiatt elvesztjk, de ilyen mdon
elkerljk az a csapdt, amit az alkalmazsi felttelek teljeslse nlkl alkalmazott
paramteres eljrs alkalmazsa sorn nyert eredmnyek lltanak! Sokszor ez a nem
paramteres teszt jelenti a leghatkonyabb megoldst.
A vizsglat nullhipotzise, hogy a vizsglati csoportok ugyanabbl a populcibl
szrmaznak, nincs kztk a vizsglt jelleg szempontjbl lnyeges klnbsg. (Nem a
94

24. tblzat
Csoport

Eredmny

Rang

Rangszmsszeg-A

6,09

6,41

6,43

6,60

6,63

6,77

6,79

6,91

Rangszmsszeg-B

7,08

7,10

10

10

7,12

11

11

7,33

12

12

7,42

13

13

7,44

14

14

7,70

15

15

7,71

16

16

7,72

17

7,80

18

18

17

7,94

19

19

8,19

20

20

8,37

21

21

8,43

22

22

8,67

23

23

9,07

24

24

9,08

25

25

9,16

26

26

9,17

27

27

9,20

28

28

9,46

29

29

9,53

30

30

9,62

31

31

9,62

32

32

9,73

33

33

9,74

34

34

9,91

35

35

95

Biostatisztika

Biostatisztika

csoportok tlagai kzti klnbsg termszetrl szl a vizsglat, de mg csak nem is a


medinok kzti eltrsekrl!)
A nullhipotzist kvetve az N elem csoportokat egyestjk, s az gy nyert mintn
bell sorba rendezzk az eredmnyeket. A legkisebb eredmny kapja az 1. sorszmot.
A rangszmokat aztn csoportonknt sszegezzk. A csoportonknti rangszmsszegek
(T) felhasznlsval pedig szmthatjuk H-t:

Teht a rangszmsszegek (felttelezve, hogy az egyik csoport rangszmsszege nem


vltozik) felrhatk az albbi formban:
,
s emiatt a vizsglt kifejezs is egyszersdik:

.
A kplet szemlletes rtelmezse taln nem a legegyszerbb feladat, de azrt arra
fel kell hvni a figyelmet, hogy az egyes csoportok ltszmhoz viszonytott ngyzetes
rangszmsszegek hatrozzk meg adott vizsglatnagysg mellett a statisztikai mrszm rtkt. Ha felttelezzk, hogy minden rszcsoport egyforma, akkor knny beltni, hogy a

kifejezs akkor minimlis, ha a rangszmsszegek egyformk, azaz, ha teljesen vletlenszeren oszlanak meg az egyes mrsi eredmnyek az egyestett adathalmaz rangsorban. Minl egyenetlenebb a csoportonknti adatok eloszlsa az egyestett rangsorban, annl nagyobb az eltrs a csoportonknti rangszmsszegekben, s ez a ngyzetre
emels miatt sszessgben a kifejezs rtknek az emelkedst vonja maga utn. Ha
kellen nagy a szmtott H, akkor a klnbsget mr nem magyarzhatja vletlen.
Ha 3 csoportba soroltuk az adatainkat (A, B, C), s mindegyik csoport ugyanakkora
(NA = NB = NC = n), akkor az emltett kifejezs egyszersdik:

.
Jl lthat, hogy minl egyenetlenebb a csoportok egyestett rangsoron belli helyzete, s ennek kvetkeztben minl jobban eltr a csoportok rangszmsszege egymstl (minl nagyobb x rtke), annl nagyobb lesz az egyes csoportok rangszmsszeg
ngyzeteinek sszege.
sszessgben a nagyobb H-rtk szl a csoportok kzti klnbsgek mellett. Az
rtkelshez hasznlhat kszbrtk a csoportok szmnl eggyel kisebb szabadsgi fok 2-tel kell pontossggal megadhat (ha minden csoportban legalbb 5 volt a
vizsglt elemek szma). Kisebb elemszmoknl rszben tblzatok (http://www.watpon.com/table/kruskalwallis.pdf), rszben a statisztikai szoftverek segtsgvel tudunk
statisztikai kvetkeztetst levonni.
Ezt a kpletet addig lehet hasznlni, amg a rangszmok kiosztsakor nem tallunk
egyenl eredmnyeket. Ilyenkor a rangszmok tlagt kell az egyes adatok rangszmaknt kpezni (ami ezrt lehet trtrtk is!) Az ilyen mdon kapcsolt rangszmok miatt
azonban a H-rtket is korriglni kell. Ha egy rtk t esetben fordul el, akkor a K korrekcis tag

.
Ha a csoportok kzt nincs klnbsg, s az eredmnyek vletlenszeren oszlanak el
az egyestett rangsorban, akkor az azonos elemszm csoportok mindegyikben ugyanannyi lesz a rangszmok sszege (TA = TB = TC = T). A kifejezs tovbb egyszersthet:

mdon szmthat. Minden kapcsolt rangszmra kln ki kell szmtani ezeket a korrekcis tagokat. A korriglt HK ezek utn mr szmthat:
.

.
Ha a csoportok kztt van szignifikns eltrs, akkor a rangszmok sszege nem vltozik, de egyes csoportok rangszmsszege cskken, a msik csoport pedig nvekszik.

Ha a vizsglat vgeredmnye szerint szignifikns klnbsg van a csoportok kzt,


akkor ennek pontosabb rtelmezshez a kt-kt csoportra kiterjed MannWhitney
U-teszt ad segtsget. A rszletes elemzs sorn a tbbszrs hipotzistesztels miatt

96

97

Biostatisztika

Biostatisztika

cskkenteni kell az egyes rszelemzsek dntsi kszbt. Ha k vizsglati csoportunk


volt, akkor a lehetsges prok szma
pedig

, az egyedi rszelemzsek dntsi kszbe

lesz.

Zaj hatsra roml reakciidk tanulmnyozsakor 30 nkntessel oldatnak meg


gyessgi feladatot klnbz zajszinten (A-csoport: nincs zavar hang; B-csoport:
kisforgalm kzti zajszint; C-csoport: nagy forgalm kzt zajszintje). A reakciidket a 25. tblzat tartalmazza (ms).
Az egyestett mintban kiosztott rangszmok csoportonknti sszege 100,5 az
A-csoportban, 150,5 a B-csoportban s 214 a C-csoportban. A 71,1 ms-os reakciid
kt alkalommal fordult el, a 93,4 ms-os pedig 3 alkalommal. A 26. tblzat mr a kapcsolt rangszmokat tartalmazza.
25. tblzat

26. tblzat
Csoport

Eredmny (ms)

Rang

RangA

RangB

RangC

42,4

49,6

52

53,5

58,5

60,3

63,5

66,4

68

70,7

10

10

71,1

11,5

11,5

71,1

11,5

11,5

75,4

13

13

75,8

14

14

76,3

15

15

77,2

16

16

84

17

17

60,3

70,7

93,4

71,1

95,3

75,8

52

93,4

109

42,4

58,5

90,7

86,8

18

18

49,6

77,2

99,5

89,9

19

19

63,5

76,3

84

90,7

20

20

53,5

71,1

97,4

92,8

21

21

93,4

89,9

68

93,4

23

23

117,2

86,8

92,8

93,4

23

23

75,4

66,4

105,4

93,4

23

23

95,3

25

25

97,4

26

26

99,5

27

27

98

105,4

28

28

109

29

29

117,2

30

30

99

Biostatisztika

Biostatisztika

A korrekci nlkl szmtott H rtk:

egyes adatprok rangszmai kzti klnbsget (d) szmtjuk, akkor a koefficiens az


albbi egyszer mdon is szmthat:
.

A korrekcis tag a kt 11,5 ms-os (t1 = 2) s a hrom 93,4 ms-os (t2 = 3) kapcsolt
rang miatt:

A korriglt HK pedig:
.
Mivel a csoportok szma 3 volt, a 2-es szabadsgi fok 2 = 5,991 a kritikus rtke a teszt eredmnynek. A teszt-statisztika rtke nagyobb, mint a kritikus rtk, azaz
a csoportok kzti rangeloszls vletlennel nem magyarzhat, a zajnak van hatsa a
reakciidre.

Spearman-rangkorrelci
Folytonos vltozk kzti kapcsolat erssgnek vizsglatra alapveten a korrelcis
egytthatk szmtst hasznljuk. Ha a paramteres prbk alkalmazsra az adatok
normalitsnak hinya miatt nincs lehetsg (a Pearson korrelcis koefficiens szmtsa nem vgezhet el), akkor az eredeti fgg s fggetlen vltozk helyett azok rangsort rtkel rangkorrelcis mdszereket kell hasznlnunk. Legelterjedtebb a Spearman
rangkorrelcis egytthat () meghatrozsa.
A rangkorrelci rtkelsekor egyszeren a legkisebbtl a legnagyobb fel haladva
kln-kln rangszmot adunk mind a fggetlen, mind a fgg vltoz rtkeinek. Az
ilyen mdon kapott rangszmok kzti korrelcit mr ugyangy vgezzk el, mint a
Pearson korrelcis koefficiens szmtsakor. Legalbbis elvileg.
A tnyleges adatok helyett hasznlt rangokkal sok informcit vesztnk, leegyszerstjk a vizsglati helyzetet. Ez baj abbl a szempontbl, hogy romlik a vizsglatunk
hatkonysga, de j abbl a szempontbl, hogy egyszersthet a szmts menete. (A
szmtgpek segtsgvel vgzett elemzseknl ez persze nem valdi elny!) Ha az
100

.
Ez a koefficiens is 1 s +1 kzti rtket vehet fel. Teljesen fggetlen paramterek
esetn 0 az rtke. Interpretcis szablyai megegyeznek a Pearson korrelcis koefficiens rtkelsnl ismertetettel. Ugyanazt a tblzatot is lehet hasznlni a kritikus rtk
megllaptsra. Ha abszolt rtke nagyobb, mint a kritikus rtk, akkor rtkeljk
a kt vltoz kzti kapcsolatot szignifiknsnak, s minl nagyobb ez az abszolt rtk,
annl ersebb a kapcsolat. Pozitv koefficiens esetn a kt rangsor kzt kzvetlen, negatv eljel esetn fordtott kapcsolat van.
Abban az esetben, ha a vltozk sorba rendezsekor azonos rtkeket tallunk, akkor
kapcsolt rangszmok kiosztsra kerl sor, s a szmts menete is sszetettebb vlik.
Ha egy rtk t esetben fordul el, akkor a K korrekcis tag

mdon szmthat. Minden kapcsolt rangszmra kln ki kell szmtani ezeket a korrekcis tagokat, s kln a fggetlen (x) s fgg vltozra (y) is sszegezni kell (K x ,
K y ). A korriglt koefficiens (aminek rtelmezsi szablyai a korriglatlan mutatval
megegyeznek) ezek utn szmthat:

Egy hziorvos felmrte sajt ids betegei kzt a diabetesgondozs hatkonysgt


(27. tblzat). Tbbek kztt a betegsg fennllsnak idtartama (T) fggvnyben
vizsglta a diasztols vrnyomsrtkeket (V). A rangszmok kiosztsakor figyelembe
vette, hogy 3 betegt gondozta 20 ve, kt-kt betegnek volt a vrnyomsa 104, illetve
111 Hgmm.
A rangklnbsgek ngyzeteinek sszege 235,5 volt, s pozitv eljel korrekci
nlkli koefficienst kapott eredmnyl:

101

Biostatisztika

Biostatisztika

Tbbvltozs elemzsek

27. tblzat
Gondozs
tartama (T)

Diasztols
vrnyoms (V)

RangT

RangV

Rangklnbsg
(d)

Rangklnbsg
ngyzet (d2)

17

88

18

90

14

92

19

98

5,5

1,5

2,25

16

104

5,5

3,5

12,25

21

104

10

5,5

4,5

20,25

25

106

13

36

26

107

14

36

20

111

9,5

1,5

2,25

23

111

12

9,5

2,5

6,25

19

114

5,5

11

5,5

30,25

20

119

12

16

28

120

15

13

22

123

11

14

20

130

15

49

A korbbi fejezetekben bemutatott statisztikai elemzsek krdse mindig az volt, hogy


kt paramter kapcsolatban van-e egymssal (ha t-prba segtsgvel vizsgltuk, hogy
a frfiak kzt magasabb-e a szrum-trigliceridszint vagy a nk kzt, akkor a nem s a
szrum-trigliceridszint kzti kapcsolatot rtkeltk; ha egy prognosztikai faktor jelenltben alacsonyabbnak talltuk az 5 ven tl mg l betegek rszarnyt 2-tesztben, akkor a prognosztikai faktor s a betegsg kimenetele kzti kapcsolatot elemeztk; ha azt
analizltuk, hogy az letkor s a nyaki verr falvastagsga hogyan korrell egymssal,
akkor az letkor s az r falvastagsga kzti kapcsolatot vizsgltuk). A kapcsolat igazolsa kikerlhetetlen lps a vizsglt problma megrtse szempontjbl. Ezen a mdon el tudjuk klnteni az egymssal valamilyen kapcsolatban lev (teht valamilyen
mechanizmus rvn egymsra hat) s az egymstl fggetlen (egymssal semmilyen
mechanizmus rvn nem kapcsold) faktorokat. Meg tudjuk hatrozni azokat a tnyezket, amiknek valamilyen szerepe van a vizsglt jelensg alaktsban.
A szereplk ismerete utn a tnyleges funkcik megrtse a feladat. Ehhez rdemes
vgiggondolnunk, hogy a kapcsolt elforduls milyen mdokon jhet ltre! (20. bra.)
Ha igazolni tudtuk, hogy x paramter kapcsolatban van y-nal, akkor erre alapveten
kt magyarzatot adhatunk. Vagy tnylegesen hat x az y-ra, vagy van egy faktor (f ),
ami egyarnt befolyssal van x-re s y-ra. Ha az f hatsra x s y egyforma irnyba
vltozik (mindkett rtkt nveli, vagy mindkettt cskkenti), akkor x s y kzt gy
jn ltre kapcsolat (x s y pozitv korrelcit fog mutatni), hogy kzttk semmilyen

A kapcsolt rangszmok miatt a korrekcis tagokat meg kellett hatrozni:


,

A korriglt koefficiens pontos rtkt ezek utn lehetett szmtani:

.
A tblzat alapjn 0,482 az ehhez az elemszmhoz tartoz kritikus rtk. Mivel ennl
nagyobb eredmnyre vezetett az elemzs, a vletlennel nem magyarzhat kapcsolatra
tallt bizonytkot a hziorvos. Megllaptotta, hogy minl hosszabb a gondozsban eltlttt id, annl magasabb a betegei diasztols vrnyomsa.
102

20. bra. Kzvetlen s kzvetett kapcsolat a magyarz vltoz s a fgg vltoz kztt
103

Biostatisztika

fizikai kapcsolat nincs, s x vltozsa nem befolysolja y rtkt. Ha a kt faktorra ellenttesen hat f , akkor azok inverz korrelcit fognak mutatni. Gygyszerek tmadspontjnak meghatrozsakor nyilvnvalan nem mindegy, melyik kapcsolatrendszer ll
az x y kapcsolat htterben. Az els modellnl x-en hat gygyszer hatsos lehet,
a msodik modellben biztosan hatstalan lenne. A kt helyzet megklnbztetse ezrt
elengedhetetlen.
Megoldhat a feladat olyan statisztikai eszkzkkel, amelyek nem csak x-re s y-ra,
hanem f -re gyjttt adatokat is egy elemzsen bell rtkelik. Ha tbb befolysol tnyez hatst rtkeljk egyszerre, akkor tbbvltozs statisztikai eljrsrl beszlnk.
A korbbi fejezetekben bemutatott tesztek mind egyvltozs eljrsok voltak; egy befolysol tnyez kapcsolatt vizsgltk a fgg vltozval. A tbbvltozs elemzseknek az a clja, hogy x-nek y-ra kifejtett hatst f hatstl fggetlenl szmszerstse.
Elvileg a legegyszerbb mdja annak, hogy f zavar hatstl vdjk a vizsglatunkat, ha olyan mdon vlogatjuk megfigyelsen alapul vizsglatainkhoz a mintt, hogy
az f faktorral rendelkezk ne kerljenek a vizsglatba. Vagy ennek analgijra, olyan
ksrleti krlmnyeket teremtnk, amikor az f nincs jelen. Ezeknl a mdszereknl
nem is gyjtnk adatot f -re.
Az egyvltozs statisztikai tesztek kzt tbb is van, amit prostott adatok elemzsre fejlesztettek ki. nkontrollos elemzsekben adott, hogy aki a beavatkozs eltt rendelkezett f faktorral, az utna is. A x y kapcsolatot rtkel teszt eredmnyt nem
befolysolhatja f . Ha fggetlen mintkat illesztnk egymshoz, akkor mindazoknak a
faktoroknak a hatstl megtiszttjuk a vizsglatot, amiket a prok sszekapcsolsakor
figyelembe vettnk. (A pontossg kedvrt megjegyzend, hogy ezeknek felttele, hogy
x s f kzt ne legyen interakci, x hatsa f -tl fggetlen legyen.)

Ktszempontos varianciaelemzs
Az egyszempontos varianciaelemzs is kiterjeszthet tbb befolysol tnyez egyttes vizsglatra. Legegyszerbb eljrs a ktszempont varianciaelemzs ismtls nlkl. Ezt olyan esetben hasznlhatjuk, ha a ksrletet kt (kategorizlt vltozknt rtkelhet) befolysol tnyez hatsnak egyttes elemzsre szeretnnk felhasznlni.
Az ismtlsnlklisg arra utal, hogy a kt kategorizlt befolysol tnyez lehetsges
kombinciinak egy-egy vizsglati alanyt tesznk ki. A ksrlet vgn a 28. tblzat
mintjra tudjuk a mrsi eredmnyeinket sszefoglalni.

104

Biostatisztika

28. tblzat
x magyarz vltoz
x1
f1
f faktor

x2

xn

y11

f2
..
.

y22
yxf

fm
x tlagok

x1

x2

f tlagok

f1

f2

ynm

fm

xn

Az x magyarz tnyezt n-fle, az f-et m-fle dzisban alkalmaztuk. Minden lehetsges befolysol tnyez kombincihoz egy yxf vizsglati eredmnyt kaptunk a
vizsglat sorn. Az egyes x n dzisokhoz kapcsold tlagos eredmnyek (xn ) kzti klnbsg azt fogja megmutatni, hogy milyen mrtkben befolysolja x a fgg vltoz

rtkt. Hasonlan, f hatst az egyes f m dzisokhoz tartoz tlagos f m eredmnyek kzti


eltrs fogja lerni.
Ha x tnyleges hatssal br, akkor az egyes dzisaihoz kapcsold tlagos eredmnyek kzti klnbsg kellen nagy lesz. Ha x nem hatsos, akkor ezek az tlagok csak
kis mrtkben klnbznek egymstl. Hasonlan rtelmezhet az egyes f dzisokhoz
tartoz tlagos vizsglati eredmnyek kzti variabilits is. Termszetesen az is elfordulhat, hogy mindkt magyarz vltoz befolysolja a fgg vltozt, vagy egyik sem.
Variancik elemzsvel tudjuk meghatrozni, hogy a sor- s oszloptlagok kzti variabilits elg nagy-e ahhoz, hogy azt mr ne rtelmezhessk pusztn vletlen hatsknt, vagy mg nem rte el a variabilits a kritikus rtket, s a vizsglt tnyez nem
) s ennek
fejt ki szignifikns hatst. Az sszes vizsglati eredmny alapjn ftlagot (Y
segtsgvel a teljes variabilitst ler ngyzetes eltrsek sszegt (SSy) szmtjuk ki
els lpsben:

Az x ltal elidzett variabilitst az egyes dzisokhoz kapcsold tlagok s a f tlag


kzti ngyzetes eltrsek sszegvel tudjuk lerni. nmagban ez az sszeg mg nincs
tekintettel arra, hogy mennyi adat felhasznlsval szmoltuk az tlagot. Az x-hez kap 105

Biostatisztika

Biostatisztika

csold variabilits ezrt az elemszmot (amit f faktor dzisainak szma hatroz meg)
is tekintetbe vev ngyzetes eltrssszeg az albbi lesz:

rtket is meg tudunk hatrozni. (A lpsekhez tartoz rszletesebb magyarzat a korbban ismertetett egyszempontos varianciaelemzs lersnl tallhat.)
Ha Fx nagyobb, mint amit mg vletlen hatssal magyarzni tudunk, akkor az x magyarz vltoz s az y fgg vltoz kzt kapcsolatot tudtunk kimutatni. Ugyangy
rtkeljk az f faktort is. (A ktszempontos, ismtls nlkli varianciaelemzsnek alkalmazsi felttele az adatok normlis eloszlsn tlmenen, hogy ne legyen interakci a
kt befolysol tnyez kztt.)
Kt gygyszer kombincijnak hatkonysgt szeretnk meghatrozni. Ennek rdekben egy in vitro ksrleti modellben 4-4 dzist alkalmaznak mindegyikbl. A ksrletek sorn egy reaktv metabolit mennyisgt mrik. Az eredmnyt a 30. tblzat
foglalja ssze.
F kritikus rtke mindkt vizsglt gygyszer esetn F[0,05;3;9] = 3,863, aminl a esetben kisebb, b esetben nagyobb a szmtott teszt-statisztika (31. tblzat).

.
Hasonlan rjuk le az f dzisai ltal elidzett variabilitst:
.
A teljes variancia x s f dzisklnbsgeivel magyarzhat variabilits egszl ki a
kt tnyeztl fggetlenl, teht a ms befolysol tnyezk hatsra ltrejv variabilitssal (SSE), melyet a teljes variabilits segtsgvel tudunk szmtani:
.

30. tblzat

A szabadsgi fokok figyelembe vtelvel az x-nek s f-nek tulajdonthat variancia,


illetve a kt tnyez ltal nem magyarzott variancia szmthat ki. A nem magyarzott
variancihoz viszonytva kapjuk meg azokat az F-rtkeket (29. tblzat), amelyek kifejezik az egyes faktorok variabilitst magyarz kpessgt, s amelyekhez kritikus

a gygyszer klnbz dzisai


a1

a2

a3

a4

b tlagok

b1

39,7

34,8

22,5

26,6

30,9

b2

28,5

39,9

28,5

29,6

31,7

b3

41,8

35,7

33,6

36,7

37,0

b4

41,0

41,4

35,2

39,3

39,2

a tlagok

37,7

38,0

30,0

33,1

34,7

b gygyszer
klnbz
dzisai

29. tblzat
Variabilits
forrsa

Variabilits (Ngyzetes
eltrsek sszege, SS)

Szabadsgi fokok

Variancia (tlagos
ngyzetes eltrs)

Variancia
hnyados (F)

Vizsglt
magyarz
vltoz (x)

31. tblzat

Vizsglt
magyarz
vltoz (f )

Ff =

Nem
magyarzott
variabilits (E)
Teljes
variabilits (y)

106

MS f
MSE

Variabilits forrsa

Variabilits (ngyzetes
eltrsek sszege, SS)

Szabadsgi
fokok

Variancia (tlagos
ngyzetes eltrs)

Variancia
hnyados (F)

Vizsglt magyarz
vltoz (a)

180,88

60,29

3,544715

Vizsglt magyarz
vltoz (b)

198,68

66,23

3,893627

Nem magyarzott
variabilits

153,08

17,01

Teljes variabilits

532,65

15

107

Biostatisztika

Ezrt a vizsglat elegend bizonytkot szolgltatott arra, hogy b gygyszer hatssal


van a reaktv metabolit termeldsre, mg a gygyszer esetn a vizsglat nem volt ebbl a szempontbl teljesen meggyz. Ugyanakkor ezen a pldn jl demonstrlhat,
hogy milyen problmt okoz, ha mereven alkalmazzuk az 5%-os dntsi kszbt a
statisztikai kvetkeztetsek levonsakor. A kt szmtott F-rtk s a hozzjuk tartoz
p-rtkek ugyanis alig klnbznek egymstl: pa = 0,061; pb = 0,049. Rszben azt ltjuk, hogy a kt gygyszer lnyegben nem klnbzik a metabolit termeldst befolysol kpessg szempontjbl. Az a gygyszer esetben annak a valsznsge, hogy
a klnbz dzisban alkalmazott hatanyag nem eredmnyezett vltozst a metabolit
termeldsben, 6,1%. Ugyanez a valsznsg b gygyszerre 4,9%. Nyilvn nem lehet
a vlemnynk ezek utn az, hogy a kt gygyszer kzt lnyeges eltrs van!

Biostatisztika

.
Az eredeti egyenlethez kpest annyi csak a klnbsg, hogy mindkt fggetlen vltozra kln regresszis koefficienst (bx, bz) kapunk. Ezek a koefficiensek csak azt a hatst
fejezik ki, amit az adott fggetlen vltoz nmagban kifejt. Vagyis mr nem rvnyesl ezekben a szmokban a fggetlen vltozk egymshoz fzd kapcsolata. Emiatt az
egyes fggetlen vltozkra kapott regresszis koefficienseket kln-kln interpretlhatjuk az egyvltozs elemzsnl elmondottak alapjn.
A variancik elemzsekor is hasonlan jrunk el, mint egyvltozs elemzseknl tettk. Felbontjuk az y teljes (a ngyzetes eltrsek sszegvel szmszerstett) variabilitst az x s z paramterekkel magyarzhat, s ezekkel nem magyarzhat rszre (SSE):
.

Tbbvltozs lineris regresszi


A lineris regresszis elemzs is alkalmas arra, hogy egyszerre tbb magyarz vltoz
hatst rtkelje. Egyvltozs elemzssel kln-kln elemezve egy-egy magyarz
vltoz s a vizsglt fgg vltoz kzti kapcsolatot, majd standardizlva a regresszis
koefficienst, egymshoz kpest rtkelhetjk az egyes befolysol tnyezk hatserssgt. Ilyen mdon egszen addig helyes statisztikai kvetkeztetseket tudunk levonni,
amg a magyarz vltozk egymstl fggetlenek. Ha ezek kzt valamilyen kapcsolat
van (egymssal is korrellnak a magyarz vltozk, azaz multikollinearits ll fenn),
akkor az egyvltozs elemzsben szmtott regresszis koefficiens rtkt nem csak az
ppen tesztelt magyarz vltoz hatrozza meg, hanem a vizsglt magyarz vltozval egytt alakul ms (az adott tesztben ppen nem rtkelt) magyarz vltoz is.
Tbbvltozs lineris regresszis elemzs kpes arra, hogy egy elemzsbe egyszerre
tbb befolysol tnyez hatst rtkelje olyan mdon, hogy minden egyes magyarz vltoz nll (ms vltozk hatstl fggetlen) hatst szmszerstse. A mdszer
megrtshez legegyszerbb a kt magyarz vltozt egyszerre elemz lineris regresszis elemzst vgigkvetni.
Ha x s z magyarz vltozk hatst vizsgljuk y-ra, akkor hasonlan jrunk el,
mint az egyvltozs regresszis elemzseknl tettk. Elszr brzoljuk a szmhrmasokat egy hromdimenzis koordintarendszerben, s keressk azt a regresszis egyenletet, ami a legjobban lerja az brzolt pontok trendjt. Az illesztsmdszer itt is a
legkisebb ngyzetek elve.

108

Hasonlan az egyvltozs elemzsekhez, itt is szmthatjuk a korrelcis koefficiens


ngyzett minden egyes fggetlen vltozra. Az gy kapott parcilis korrelcis koefficiens azt fejezi ki, hogy nmagban az egyes magyarz vltozk milyen mrtkben
(hny szzalkban) hatrozzk meg a fgg vltoz rtkt.

A kt fggetlen vltozval magyarzott ngyzetes eltrsek sszege s a mintra


jellemz teljes ngyzetes eltrs hnyadosa a teljes modellre vonatkoz determincis
koefficienst adja meg. Ez fejezi ki, hogy a kt vltoz egyttesen milyen mrtkben
hatrozza meg a vizsglati modellben a fgg vltoz rtkt, azaz a kt vltoz rvn
mennyire vagyunk kpesek megrteni a vizsglt paramter rtknek alakulst.

Ugyanezeket az elveket kvetve jutunk el az igazi, tbbvltozs, lineris regresszis


elemzshez. A konkrt szmtsok elvgzse ilyen esetekben mr biztosan valamilyen
software feladata, ezrt ennl rszletesebben nem foglalkozunk a kpletek megadsval.

109

Biostatisztika

Biostatisztika

A feladat kettnl tbb fggetlen vltoz esetn mr elveszti azt a szemlletes fogdzkodt is, amit az eredeti adatok koordintarendszerben trtn brzolsa rvn
nyertnk. s br a tbbdimenzis regresszis egyenletek megadsa is az emltett alapelveket kveti, a feladat matematikailag alapveten mskppen alakul, mint egy- vagy
ktvltozs elemzseknl.

Oksgi sszefggsek
A jl kivitelezett vizsglatokban valdi problmra fkuszl krdsre kapunk kellen
megbzhat, a magyarz vltoz s a kivltott hats kzti kapcsolat vletlenszersgrl, statisztikai eszkzk segtsgvel levont, kvetkeztetsen alapul vlaszt. A kutatsi krdsre adott vlasznak azonban csak egyik alapja a statisztikai elemzs eredmnye.
Ugyanilyen fontos, hogy a vizsglat krlmnyeit kellen mrlegeljk: nem lehet-e az
eredmnyt a mintavlaszts hibjval, a zavar tnyezk nem megfelel kontrolljval,
vagy a mrsek, az adatgyjts pontatlansgval magyarzni. Ezen tlmenen azt is
rtkelni kell, hogy az eredmnyeink sszhangban vannak-e a vizsglatunkkal kapcsolatos elmletekkel.
A statisztikai eljrsok eredmnyeknt alapveten arrl adnak informcit, hogy a
klnbz paramterek kztt van-e kapcsolat. A kapcsolat termszetre, a kapcsolatot ltrehoz mechanizmusra vonatkozan nem. Emiatt a vletlennel (s a vizsglati
hinyossggal) nem magyarzhat kapcsolatok feltrsa esetn sem llthatjuk, hogy
ok-okozati sszefggst talltunk. St, esetenknt mg azt sem tudjuk rtelmezni pusztn a statisztikai eredmnyek segtsgvel, hogy adott vizsglatban melyik volt a magyarz s melyik a fgg vltoz.

Az ok-okozati kapcsolat irnya


Ha egy vizsglatban rtkeljk a csaldf alkoholizmusa s a csald instabilitsa kzti
kapcsolatot, akkor minden bizonnyal knnyen tudjuk bizonytani a kt jelensg vletlennel nem magyarzhat kapcsolatt, de tvolrl sem ilyen egyrtelm annak eldntse, hogy a kapcsolat alapjt a csaldf alkoholizmusa miatt kialakul csaldi diszfunkci, vagy a csald mkdsi zavarnak kvetkeztben felpl csaldfi alkoholista
karrier, esetleg mindkt mechanizmus egyszerre jelenti (21. bra). A valdi kivlt ok
pontos meghatrozsa azrt fontos, mert csak az oksgi lncolat megszaktsval lehet
eredmnyt elrni. A hrom modellhez hrom beavatkozsi stratgia tartozik. A hatkony
segtsgnyjts megszervezshez alapveten fontos a modellek kzti helyes vlaszts,
a folyamatot valban elindt faktor kezelsre koncentrlva rhetnk el csak sikert.
Rosszul rtkelt helyzet rossz beavatkozsi pontokat hatroz meg, ami csak az erforrsok elherdlshoz s a beavatkozstl vrt nyeresg elmaradshoz vezet.
110

111

Biostatisztika

21. bra. Lehetsges kapcsoldsi irnyok a csaldf alkoholizmusa s a csald instabilitsa kztt

Ha konzekvens kapcsolatot ltunk a napozs utni legs s a melanoma kialakulsnak kockzata kzt, akkor elvileg nmagban a brt r UV-expozci vagy a legs
patolgiai folyamatai is magyarzatul szolglhatnak az sszefggsre (22. bra).
A ktfle modellhez ktfle beavatkozsi stratgia tartozik. Az els esetben a legs megelzse vagy kezelse egyarnt hatkony preventv beavatkozs. A msodik
modellben a legs kezelst nem, csak az UV-expozci kerlst tekintjk preventv
eszkznek.
A hatkony beavatkozsi pont azonostsa a valdi oksgi lncolat meghatrozsn
alapul. Minl sszetettebb problmval llunk szemben, annl nehezebb az oksgi lncolatok feltrsa, de soha nem tekinthetnk el ettl, vizsglatunk ktelez rsze az oksgi rtelmezs.

Biostatisztika

1. A krokoz a beteg szervezetbl kimutathat, de nem mutathat ki az egszsgesekbl.


2. A betegbl izollt krokoz tenyszthet.
3. A kitenysztett krokozval megbetegthet az egszsges szervezet.
4. Az inokullt krokoz kitenyszthet a tenysztett krokozval megbetegtett
szervezetbl.
Szmos jrvnygyi problmt sikeresen oldottak meg az ezekre az elvekre ptett kutatsokra alapozva. Ugyanakkor mr a tuberkulzis vizsglata sorn vilgoss
vlt, hogy a posztultumai nem tekinthetk ltalban rvnyesnek. (Hiszen tnetmentes szervezetbl is kitenyszthet a Mycobacterium, az egszsges szervezetbe juttatott
Mycobacterium pedig nem felttlenl vlt ki betegsget.) A Koch-posztultumok akkor
mkdnek jl, ha a krokoz szksges (krokoz nlkl nem alakul ki adott betegsg)
s nmagban elgsges (a fertzttekben mindig kifejldik az adott krkp) oka is a
betegsgnek. A Mycobacterium-fertzs szksges a tuberkulzis kialakulshoz (nlkle nincs tuberkulzis), de nmagban nem elgsges, hiszen nem minden fertztt
lesz beteg (egyb tnyezknek is jelen kell lenni a betegsg kialakulshoz.)

Hill-szempontrendszer

Szmos olyan fertz betegsgeket ismernk, amik jellemz klinikai kppel jrnak, s
amiket egy krokoz kpes csak kivltani. Az ilyen monokauzlis betegsgek vizsglatra dolgozta ki Koch azokat a kritriumokat, amiknek meg kell felelnie a krokoznak
ahhoz, hogy azt a betegsg okozjnak tekintsk:

A betegsgek tbbsge multikauzlis, htterkben szmos kivlt hats ll. A legtbb


daganatra pldul igaz, hogy nincs olyan gens, ami nlkl biztosan nem fejldik ki,
azaz nincs szksges oka. Ezzel szemben tbb olyan kls hats is ltezik, ami kpes
elindtani a malignus kln kialakulst, amelyek viszont nmagukban nem elegendek
a betegsg kifejldshez. Az sszetett biolgiai folyamatok bonyolult oksgi hlzatba
rendezdnek, melyeken bell az egyes hlzati csompontok (faktorok) kzti kapcsolat
azonostsa (egyik faktor vltozsa kapcsolatban van a msik vltozsval) mg tvolrl sem jelenti a kztk lv ok-okozati ktelk bizonytst s a beavatkozsi pont
azonostst.
Sajnos nem rendelkeznk olyan kritriumrendszerrel, aminek a segtsgvel a kapcsolatok ok-okozati vagy nem ok-okozati termszett hiba nlkl meg tudnnk tlni.
Ugyanakkor szksg van olyan szempontrendszerre, amely gyakorlati krdsek megoldsakor ltalban helyes dntst eredmnyez. Ennek az ignynek megfelel rendszert
dolgozott ki Austin Bradford Hill. Az ltala javasolt szempontok alapjn rtelmezni kell
minden vizsglati eredmnyt, de hangslyozni kell, hogy (az idbelisgtl eltekintve)

112

113

22. bra. Az UV-expozci, a legs s a melanoma kialakulsa kztti kapcsolat htterben ll


hatsmechanizmusok

Koch-posztultumok

Biostatisztika

egyik szempont sem perdnt nmagban az oksgot illeten. Maga Hill is a kutatsi eredmnyek rtelmezst segt szempontrendszernek s nem az oksg megtlst
szolgl kritriumrendszernek tartotta az ajnlst.

Biostatisztika

kzt elvgzett vizsglatok s a sajt eredmnyeink kzt sszhang van, akkor beszlnk konzisztencirl. Minl tbb vizsglat ltal rajzoldik ki egy konzisztens kp,
annl inkbb meggyzdnk az oksgi kapcsolatrl.
Teljesen mindegy, hogy milyen mdszerrel vizsgljk a HPV jelenltt a mhnyakrkos szvetekben, mindig arra az eredmnyre jutnak, hogy a vrus kockzatnvel jelleg. Mivel nagyon sok vizsglatot hajtottak mr vgre nagyon sok orszgban, ez a konzisztencia az oksg melletti ers rvet jelent. Nincs is irodalmi adat, ami
ezzel ellenttes megllaptsra jutott volna.
A konzisztenciahiny azonban egyltaln nem zrja ki az oksgi kapcsolatot.
Elfordulhat, hogy egy faktor nmagban nem kpes kivltani a vizsglt hatst, csak
ha egyttesen hat ms tnyezkkel. Azokban a vizsglatokban, ahol a kiegszt hats is jelen van, ltni fogjk a kapcsolatot; ahol a kiegszt tnyez nincs jelen, ott
nem ltjk. Az eredmnyek teht nem lesznek konzisztensek.
Ha azt vizsgltk, hogy a transzfzi nveli-e a HIV-fertzs kockzatt, akkor
azokon a helyeken, ahol a vrksztmnyek biztonsgosak voltak, nem lttk a kapcsolatot; ahol nem vizsgltk a vrksztmnyeket, s a HIV-hordoz tnetmentessg
prevalencija nagy volt, ott szleltk a vletlennek nem tulajdonthat kapcsolatot.

1. Az sszefggs erssge
ltalban igaz, hogy szoros sszefggst mutat mrszmokat akkor eredmnyez egy vizsglat, ha ok-okozati kapcsolat van a vizsglt paramterek kzt.
A HPV mhnyakrkot okoz hatsa melletti alapos rv, hogy daganatepidemiolgiban szokatlanul magas kapcsolati mutatkat (100 feletti eslyhnyadosokat, incidenciahnyadosokat) tallnak az epidemiolgiai vizsglatokban.
De szmos plda van arra, hogy egy magyarz vltoz tnylegesen befolyssal
van egy fgg vltozra, de annak rtkt csak kis mrtkben vltoztatja meg. Az
ilyen gyenge befolysol tnyezk vizsglata komoly nehzsget jelent, mert a nem
megfelelen kontrolllt zavar tnyezk okozta torzt hats is elidzheti a gyenge,
de szignifikns kapcsolatot. A passzv dohnyzsrl ma mr jl tudjuk, hogy megnveli a tdrk kialakulsnak kockzatt. Ez a hats azonban gyenge, ezrt nagyon
hossz idt vett ignybe a megfelel bizonytkok ellltsa, olyan vizsglatok vgrehajtsa, amelyekben a gyenge hats szlelshez szksges nagy mintaelemszm
biztosthat volt, s ahol a tdrk kialakulst segt, egyb kockzatnvel tnyezk kontrollja is hatkonyan megvalsthat volt.
Ugyanakkor arra is szmos plda akad, hogy szoros kapcsolatban lev tnyezk
kzt nincs ok-okozati sszefggs. Ha azt vizsgljuk, hogy a csaldon bell hnyadik gyermeknek a legnagyobb az eslye arra, hogy Down-szindrms legyen, akkor
azt ltjuk, hogy a szletsi sorrenddel fokozatosan emelkedik a betegsg kockzata.
Igen ers a statisztikai kapcsolat. A kapcsolat htterben azonban nem a szletsi
sorrend, hanem a szletsi sorrenddel szintn szoros kapcsolatot mutat anyai letkor ll. Valjban az anyai letkorral emelkedik a Down-szindrma kockzata, s ettl teljesen fggetlenl, a gyermekek szletsi sorrendje s az anya letkora szintn
szoros kapcsolatot mutat a betegsg kialakulsval.
Az ers kapcsolat inkbb csak annak kizrsra ad alapot, hogy valamilyen ismeretlen, vagy a vizsglatban nem figyelt zavar tnyez torzt hatsnak tulajdonthat a paramterek kzt lert sszefggs.

3. Specificits
Ha egy befolysol tnyez csak egy elvltozst, betegsget kpes kivltani, akkor beszlnk a kapcsolat specifikus jellegrl.
A tbb mint szzfle HPV nem csak mhnyakrkos szvetekben mutathat ki,
hanem egy sor ms daganatnl is kockzatnvelnek tnik. Legalbb 15 (de elssorban 2) HPV-szerotpus kapcsolhat a mhnyakrkhoz. Az egyes szvettani tpusokhoz viszont sajtos HPV-spektrum tartozik, ami a kapcsolat specificitst mutatja.
A fertz betegsgeknl tipikus ers specificits nagyon ritkn fordul el nem
fertz betegsgek esetben, ezrt a vizsglati eredmnyek rtkelsekor ez a szempont ltalban nem segti az rtelmezst. Inkbb kivtelesnek mondhat az a helyzet,
amikor ez a szempont segti a helyes kvetkeztets levonst.
A dohnyzs taln a legjobb plda arra, hogy egy tnyez kpes nagyon sok ponton krostani az lettani funkcikat. Az egyes funkcionlis vesztesgek s a dohnyzs kzti kapcsolatot rtkel vizsglatok eredmnyei akkor is ok-okozati termszetek, ha ez a specificits egyltaln nem rvnyesl.

2. Konzisztencia
Sajt vizsglatunk eredmnyt ssze kell hasonltani a msok ltal kivitelezett
vizsglatok eredmnyeivel. Ha a hasonl krdsre fkuszl, de ms krlmnyek

4. Idbelisg
Az oknak meg kell elzni az okozatot. Ez az egyetlen szempont, aminek mindig
teljeslnie kell. Klnsebben ezt nem is kell rtelmezni.

114

115

Biostatisztika

A szrsi programok sorn nyert mintk vizsglata alapjn jl ismert, hogy vekkel a mhnyakrk kialakulsnak megkezddse eltt mr HPV-fertztt a mhnyak
hmja.
Taln azt rdemes csak megjegyezni, hogy ha egy felttelezett ok ksbb jelenik
csak meg, mint az okozat, akkor ez nem jelenti azt, hogy az oki tnyez nem kpes
kivltani az elvltozst. Azaz, ha fordtott idbelisget ltunk a vizsglatunkban, az
mg nem zrja ki az ok-okozati kapcsolat lehetsgt. (Vannak vesebetegek, akiknek
a hipertnija a vesebetegsg szvdmnyeknt alakul ki. Ez mg nem jelenti annak
a bizonytkt, hogy a hipertnia nem tud vesebetegsgeket elidzni.)
5. Dzis-hats kapcsolat
Ha azt tapasztaljuk, hogy a magasabb dzisokhoz intenzvebb kivltott hatsok
tartoznak, akkor ez az ok-okozati jelleg melletti ers rv, az egybknt kimutatottan
ltez kapcsolat esetben. Elssorban a dzissal monoton mdon ersd vlasz a
meggyz.
Br egy fertz gens esetben nem biztos, hogy a magasabb vrusszmtl magasabb kockzatot vrunk, a manapsg elindtott s kvantitatv vrus DNS-mrsen
alapul vizsglatok azt mutatjk, hogy a HPV magasabb dzisaihoz fokozottabb
mhnyakrk-kialakulsi kockzat trsul.
A monotonits azonban nem mindig teljesl. Nagyon sok toxikus anyag csak akkor fejti ki a hatst, ha egy bizonyos mennyisgnl tbb kerl a szervezetbe. A hats kifejldse valamilyen kszbdzishoz ktdik. Az ilyen kszbkhz igaztjk
pldul a krnyezet-egszsggyi hatrrtkeket.
Az alkohol s hallozs kzti kapcsolat sem monoton jelleg. A moderlt alkoholfogyasztk kzt alacsonyabb a hallozs, mint az absztinenseknl. A legmagasabb hallozsi adatokat a sok alkoholt fogyasztk kztt ltjuk (J-alak dzis-hats
grbe). Mivel a grbe egyes rszeihez ms-ms rtelmezs tartozik, valjban ez a
vizsglati eredmny is az alkohol egszsgkrost hatst bizonytja. (Az absztinencia oka meglehetsen gyakran egy letet veszlyeztet alapbetegsg. Az absztinensek kzti emelkedett hallozs nem az alkohol protektv hatsnak elmaradst
tkrzi, hanem az absztinencit is megalapoz alapbetegsg kvetkezmnye.)
Msfell monoton dzis-hats kapcsolat esetn sem kell felttlenl ok-okozati
kapcsolat megltre gondolnunk. Magyarorszgon a 90-es vekben folyamatosan
emelkedett az antidepressznsfogyaszts, s folyamatosan cskkent az ngyilkossg
miatti hallozs. A kt trend kzt nagyon szoros a kapcsolat. Magasabb gygyszerfo-

116

Biostatisztika

gyasztshoz konzekvensen alacsonyabb hallozs prosul. A kapcsolat nmagban


mgsem bizonytk az oksgi viszonyra, mert nagyon sok trsadalmi-gazdasgi tnyez is monoton mdon vltozott ugyanebben az idszakban, amik elvben szintn
magyarzhatjk az ngyilkossg cskken trendjt.
6. Biolgiai plauzibilits
Ha kapcsolatot llaptunk meg kt tnyez kzt, s egyb vizsglatok alapjn
ismerjk meg azt a biolgiai mechanizmust, ami mentn a kapcsolat tnylegesen
mkdik, akkor ez ers rv a feltrt kapcsolat ok-okozati jellege mellett.
Nagyon rszletesen ismertek azok a molekulris mechanizmusok, amik a HPV-infekci kvetkeztben indulnak meg, s a mhnyakrk kialakulshoz vezetnek.
Az ismert pathomechanizmus hinya viszont nmagban nem vonja maga utn az
oksgi kapcsolat elvetst, hiszen lehet, hogy egyszeren eddig fel nem trt biolgiai
folyamat adja az alapjt a statisztikai eszkzkkel lert kapcsolatnak. Semmelweis
Ignc sem tudta biolgiai alapfolyamatok mentn rtelmezni, hogy mirt hatkony a
gyermekgyi lz megelzsre a klrmeszes kzmoss, de ltta az sszefggst. Az
ok-okozati jelleg mellett pedig kivl rvet szolgltatott a kzferttlents hatkonysga. John Snow gy tudott hatkonyan beavatkozni a kolera megelzsnek rdekben, hogy azt sem tudta, hogy lteznek baktriumok. Csak annyit tudott, hogy kapcsolat van bizonyos helyekrl szrmaz ivvz fogyasztsa s a betegsg terjedse
kzt. James Lind tpllkozsi emberksrletei utn (citromlvel kiegsztett tpllk
fogyasztsa esetn meggygyultak a skorbutos tengerszek) a matrzok citromlevet
kaptak a hossz hajutakon, hogy megelzzk a betegsg kialakulst, pedig senki
nem tudott mg akkor a C-vitaminrl.
7. Koherencia
Sajt eredmnyeinket ssze kell vetnnk a vizsglat-elvltozsrl szl egyb
ismeretekkel. Ha sszhang van a kivltott hatssal kapcsolatos rgebbi kutatsi eredmnyek, illetve az elmleti megfontolsok s a sajt vizsglatban lert sszefggs
kzt, akkor beszlnk koherencirl.
A mhnyakrk a szexulis ton terjed betegsgekre jellemz epidemiolgiai jellegzetessggel br. Ennek teljesen megfelel a HPV, mint etiolgiai gens, ami szexulis ton terjed.
(A koherencit nll szempontknt nevezte meg annak idejn Hill. De azrt a
koherencia s a plauzibilits kzti jelents tfeds egszen nyilvnval.)

117

Biostatisztika

8. Ksrletes bizonytkok
Ha olyan vizsglat alapjn vonjuk le kt tnyez kapcsolatra vonatkoz kvetkeztetsnket, ahol a magyarz vltoz eltvoltsa utn helyrell lettani funkcit mrjk, akkor ez Hill rtelmezsben ksrletes bizonytk arra, hogy a
magyarz vltoz oki gens.
A HPV elleni vakcinls utn cskken mhnyakrk-incidencia adja a ksrleti
jelleg bizonytkot a HPV etiolgiai szerepre.
Nem vitatva, hogy sok esetben ez az rvels helytll, nem tekinthet ez a szempont sem ltalnos kritriumnak; s nem csak azrt, mert a befolysol faktor ksrletes krlmnyek kzti eltvoltsa nem mindig oldhat meg.
A malria elnevezse is arra utal, hogy sokig azt gondoltk, a mocsarak rossz
levegjnek bellegzse okozza a betegsget. Ha erre egy mocsr-lecsapolsi ksrletet hajtottak volna vgre, akkor ltszlag igazolni lehetett volna az oksgi kapcsolatot, hiszen a mocsarak lecsapols utn a betegsg visszaszorul. Ennek ellenre
nincs ok-okozati sszefggs a mocsr levegje s a malria kzt. A mocsr lecsapolsval a krokozt terjeszt sznyog veszti el lhelyt, s emiatt cskkent a
betegsg gyakorisga.
9. Analgia
Az analgik (sajt vizsglati krdsnkre hasonlt helyzetekkel kapcsolatos ismeretek) keresse nagyon fontos a hipotzisek fellltsakor, de ersen ktsges,
hogy sajt eredmnyeink ok-okozati jellegnek elbrlsakor ezt a szempontot komolyan lehet-e egyltaln venni. (Mindenesetre Hill ezt a szempontot is javasolta.
Arra hvta fel a figyelmet, hogy ha egy gygyszerrel kapcsolatban igazoltuk, hogy
az fejldsi rendellenessget kpes okozni, akkor ezt ms gygyszerrl is el tudjuk
kpzelni.)
A HPV-cervixrk etiolgiai viszonnyal kapcsolatban emlthet analgik az albbiak: (1) vannak ms DNS-vrusok is (pl. HBV), melyek kpesek humn daganatot
induklni; (2) vannak olyan llati papillmavrusok, melyek kpesek daganatot elidzni; (3) vannak olyan karcinogn vrusok, amelyek hasonl elemi hatsokat vltanak ki, mint a HPV (interakci p53- s RB-fehrjkkel).

A tananyag elsajttsnak ellenrzshez segtsget nyjtanak


a http://tamop.etk.pte.hu/adatbazis/ cmen elrhet krdsek.

118

Trgymutat

A,
abszolt rtk 74, 89
adat 13
~, dichotm 13
~, nominlis skln mrt 14
~, ordinlis skln mrt 14
~, diszkrt 15
~, kvalitatv 54, 60
~, kvantitatv 39
adatbzis 11, 13
adatgyjts 11
adatpr 65
analgia 116
ANOVA-tbla 51
Apgar score 14
arnyskla 15
tlag 16, 39, 40
tlagklnbsg 40
tlagos eltrs 22

B
befolysol tnyez 7, 10
biolgiai plauzibilits 115
Bonferoni-korrekci 46, 52

centrlis rtk 20

Cs
csoportvariabilits 49, 50
D
determincis koefficiens 84
deviancia 77
dichotomizlsi kszb 1416
dzis-hats kapcsolat 114
dntsi kszb 3436
E,
egyni variabilits 47
eloszls 39
eloszlsfggvny 38, 58
eloszls-paramter
eljel 89
eljelteszt 8688
elsfaj hiba 36, 37, 46
rtkpr 58
119

Biostatisztika

esetszm-eloszls 57
extrm rtk 20

Biostatisztika

J
jsolt rtk 82

F
K
F-rtk 51
Fisher-exact eljrs 57
folytonos vltoz 20, 68, 69
F-prba 45, 51
fggetlen vltoz 75, 85, 107
fgg vltoz 75, 79, 80, 85, 101, 106

G
Glasgow Coma Scale 14
goodness of fit test 57

H
haranggrbe-eloszlsminta (Gaussgrbe) 23
hatkonysgnvekeds 44
Hill-szempontrendszer 111
hipotzis 7
hipotzistesztels 11, 34, 36
hisztogram 19

I
idbelisg 113
intervallumskla 15

kapcsolat 101
kategria 59
ktmints t-prba 43, 92
ktszempontos varianciaelemzs 102
ksrlet 7, 8
ksrletes bizonytk 116
kivltott hats 7, 9
Koch-posztultumok 110
koherencia 115
KolmogorovSzmirnov-prba 45
konfidencia-intervallum 72
kontingenciatblzat 60
konzisztencia 112, 113
konzisztenciahiny 113
korrelci 68
~ teljes pozitv 72
~ inverz 72
korrelcis koefficiens 7175, 84
kovariancia 6971, 83
kritikus rtk 38, 56, 74, 87
~ statisztikai mrszm 87
KruskalWallis H-teszt 92
kutatsi krds 9
klnbsg 39, 40
kszbrtk-definils 16
kszbdzis 114

120

ok 113, 114
ok-okozati kapcsolat 12, 109, 112, 114
okozat 113, 114
oksgi sszefggs 109
~ lncolat 109, 110
~ kapcsolat 113

legkisebb ngyzetek elve 77, 106


ler statisztika 17
lineris kapcsolat 68
~ regresszi 75, 78, 83

M
magyarz vltoz 79, 80, 101, 16
MannWhitney U-teszt 9092
msodfaj hiba 36, 37
McNemar-teszt 66
medin 20, 90, 92
megbzhatsgi tartomny 2735, 72, 73,
80
megfigyels 7, 8
megfigyelt esetszm 55
mrsi technika 13
mdusz 21
monotonits 114

sszegzs 55
sszefggs erssge 112

P
prelemzs 45
Pearson korrelcis koefficiens 98, 99
p-rtk 36, 38, 87
Poisson-eloszls 58

N
ngyzetes eltrs tlaga 50
~ ~ sszege 47, 48, 79, 103
~ klnbsgek sszege 55
nem paramteres eljrs 86
normlis eloszls 23, 25, 86
nullhipotzis 56, 60

rangszm 89
rangszmsszeg 89, 90
regresszi 79
regresszis egyenes 76, 77, 85
~ elemzs 75
~ koefficiens 80, 84
reprezentatv minta 27

121

Biostatisztika

S
Spearman rangkorrelcis egytthat 98
Spearman-rangkorrelci 98
specifits 113
standard devici 28, 30
~ hibaszmts 31
standardizlt rtk 24
~ klnbsg (t-rtk) 43, 45
~ regresszis koefficiens 85
statisztikai teszt 38
~ vltoz 16
srsgfggvny 24, 25

vrhat rtk 54
~ esetszm 55
variabilits 18, 40, 49, 52, 78, 79
variancia 22, 41, 52
varianciaelemzs 5153, 78
varianciahnyados 50, 80
vizsglat lpsei 11

W
Wilcoxon prostott teszt 8890

Sz
Y
szabadsgi fok 22, 23, 45, 49, 87
szrs 16, 39
szrsdiagram 68, 69
szrds 18, 70
teljes variabilits 50

Yates-korrekci 56, 66, 87

T
teszt-statisztika 98, 105
t-rtk 23
tbbszrs hipotzistesztels 46
tbbvltozs elemzs 101
~ lineris regresszi 106
~ ~ regresszis elemzs 85
t-prba, Student-prba 23, 43, 45

122

You might also like