Professional Documents
Culture Documents
Biostatisztika
Biostatisztika
Biostatisztika
Sndor Jnos, dny Rza
Lektor:
Dr. Bres Judit, Dr. Bdecs Tams
Tartalomjegyzk
Elsz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Ksrletek s megfigyelsek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
A nem ler jelleg vizsglatok fbb lpsei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
A vltozk tpusai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Dichotm, binris adatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Nominlis skln mrt adatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Ordinlis skln mrt adatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Intervallumskln mrt adatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Arnyskln mrt adatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Ler statisztika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Hisztogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Centrlis rtk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Szrds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Szabadsgi fok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Normlis eloszls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Megbzhatsgi tartomny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Hipotzistesztels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Dntsi kszb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Els- s msodfaj hiba . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Statisztikai tesztek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Csoportok kztti sszehasonlts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Kt csoport kvantitatv adatainak sszehasonltsa . . . . . . . . . . . . . . . . . . . . . . . . 41
Tbb csoport kvantitatv adatainak sszehasonltsa . . . . . . . . . . . . . . . . . . . . . . 47
Csoportok kvalitatv adatainak sszehasonltsa . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Vrhat rtk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Csoportok kzti klnbsg elemzse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Prba rendezett kvalitatv adatok elemzse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Folytonos vltozk kztti kapcsolat elemzse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Korrelci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Lineris regresszi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5
Biostatisztika
Determincis koefficiens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Nem paramteres prbk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Eljelteszt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Wilcoxon prostott teszt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
MannWhitney U-teszt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
KruskalWallis H-teszt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
Spearman-rangkorrelci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Tbbvltozs elemzsek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Ktszempontos varianciaelemzs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
Tbbvltozs lineris regresszi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Oksgi sszefggsek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Az ok-okozati kapcsolat irnya . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Koch-posztultumok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
Hill-szempontrendszer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
Elsz
Azok a hallgatk, akik orvos- s egszsgtudomnyi terleten folytatjk tanulmnyaikat, meglehets tvolsgtartssal viszonyulnak a biostatisztikhoz. Ez a vilg minden
rszn gy van, s egyltaln nem meglep, ha a kt tudomnyterlet gondolkodsmdjnak igen lnyeges eltrseibe belegondolunk. Nem is lehet relis cl, hogy megszerettesse valaki a biostatisztikt ebben a hallgati krben. De
Az orvos- s egszsgtudomnyi terleten hihetetlen mennyisgben keletkeznek
kutatsi eredmnyek, amelyek alapjn a szakembereknek sajt gyakorlatukat folyamatosan fejleszteni kell. Ehhez elengedhetetlen, hogy valamilyen szinten rtsk a szakterletkn megjelen j eredmnyeket elllt vizsglatok bels logikjt, s pontosan tudjk rtelmezni azok vgeredmnyeit. Ez elkpzelhetetlen korrekt biostatisztikai
ismeretek nlkl.
Az orvos- s egszsgtudomnyi terleten dolgoz szakembereknek meglehetsen
nagy szabadsga van munkahelykn a rjuk bzott terleten a gyakorlat formlsban.
Sok dntst kell nllan meghozniuk. Elny, ha kpesek a felmerl problmkra tnyeken alapul megoldsokat javasolni. Ehhez sokszor a sajt munkval kapcsolatban,
sajt munkahelyen keletkez adatok korrekt feldolgozsa szksges. Ez elkpzelhetetlen korrekt biostatisztikai ismeretek nlkl.
Az orvos- s egszsgtudomnyi terleten dolgoz szakembereknek egyre gyakrabban kell bizonytaniuk, hogy az a gyakorlat, amit kvetnek, hatkony. Ilyen feladatokat
csak akkor tudnak sznvonalasan elltni, ha rendszeresen monitorozzk sajt tevkenysgket, s a sajt teljestmnyt ler adatokat korrekt mdon prezentljk. Ez is elkpzelhetetlen korrekt biostatisztikai ismeretek nlkl.
A tapasztalat az, hogy az orvos- s egszsgtudomnyi terleten dolgoz szakemberek gyakorlati problmk kezelsekor nem hasznljk kell gyakorisggal a statisztikai
eszkzket, mert nem ismerik kellen ket. Ha ptolni akarjk a hinyossgaikat, akkor
pedig mr a biostatisztikai knyvek bevezet fejezetnl feladjk a kzdelmet a teljesen
idegen terminolgia miatt.
Ugyanakkor sok a statisztikai szmtgpes program, amelyek hasznlata bizonyos
szinten egyre egyszerbb, s egyre tbb az elektronikus adatbzisokba rendezett adat
is az orvos- s egszsgtudomnyi terleten. Nagy a csbts a kt lehetsg sszekapcsolsra. Sok fligazsg, flrevezet statisztika szlethet, ha ezek a lehetsgek nem
prosulnak a biostatisztikai alapelvek ismeretvel.
7
Biostatisztika
Ksrletek s megfigyelsek
Ha olyan vizsglatot vgznk, aminek rsze a statisztikai rtkels, ltalban egy specifikus krds (vagy mskppen hipotzis) megvlaszolsa a clunk. Ezek a krdsek
(hipotzisek) felrhatk egy befolysol tnyez s egy kivltott hats kzti kapcsolatknt: van-e hatsa az adott befolysol tnyeznek az adott paramterre. A befolysol
tnyez az egszsgtudomnyok terletn lnyegben brmilyen, a szervezetre hatssal
lev faktor lehet. A kivltott hats pedig tulajdonkppen brmilyen biolgiai, klinikai
paramter.
A krdsekre adott vlaszhoz szksges adatokat alapveten kt mdszerrel lehet
sszegyjteni. Egyfell lehetsg van arra, hogy a vizsgl hozza ltre az expozcit
(pl. szvettenyszetben dziscsoportokat alakt ki, llatksrletben kezelt s nem kezelt
csoportokat hoz ltre; klinikai vizsglatban kezelt s placebocsoportba sorolja a betegeket), s a vizsglati krlmnyeket is megprblja szablyozni. Ilyenkor ksrletrl,
experimentlis vizsglatrl beszlnk. Msfell vannak vizsglatok, ahol nem befolysoljuk a rsztvevk viselkedst, nem mi hozzuk ltre a vizsglati krlmnyeket. Az
adatgyjts ilyen esetben a tlnk fggetlenl zajl folyamatok megfigyelsn alapul.
Orvostudomnyi, egszsgtudomnyi tudsunk egyik legfontosabb forrsa a nem
humn rendszerekben elvgzett ksrlet. In vitro ksrletekben, szvettenyszetekben
vagy llatksrletekben pontosan kezelhet s szablyozhat a kls expozci nagysga. St, a clszervi dzis is mrhet, hiszen lnyegben nincsenek korltjai az invazivitsnak. A kialakul biolgiai elvltozs, betegsg igen rszletesen, invazv mdszerek
felhasznlsval vizsglhat. A ksrlet sorn a folyamatban rsztvev biolgiai rendszerekre hat egyb tnyezk hatsa kontrolllhat. A genetikai httr zavar hatsait
megfelelen kivlasztott llattrzsekkel jelentsen cskkenteni lehet. A vizsglatokban
elvileg nagyszm llatot is fel lehet hasznlni, de erre gyakran nincs szksg, hiszen a
ksrletekben a biolgiai folyamatok termszetes variabilitsa szk tartomnyon bell
tarthat. Ilyenkor pedig kis hatsok is jl kimutathatk viszonylag kevs llat felhasznlsval. De ha szksges, az llatszm nvelsvel a precizits javthat.
Az ilyen ksrletekben magas dzisokat hasznlnak, hogy a biolgiai vlasz nagy
szzalkban fellpjen, illetve a vlasz knnyen mrhet nagysg legyen. Ezrt, ha a ksrleti eredmnyeket humn viszonyok megrtsre akarjuk felhasznlni, szmolnunk
kell a kvetkez problmkkal: (1) a humn expozcik ltalban nagysgrendekkel
9
Biostatisztika
Ksrletek s megfigyelsek
vizsglati elrendezsek, ahol ezzel gyakorlatilag nem kell szmolnunk, pldul ikervizsglatok esetn). A humn megfigyelsen alapul vizsglatokhoz gyakran nagy mintt kell sszelltani. Ez knyszer, hiszen csak gy ellenslyozhatk azok a kzelt
jelleg becslsekbl add hibk, amiket az elbb emltettnk. Ha a vizsglatot sikerl
gy kivitelezni, hogy a felsorolt hibaforrsok ltal okozott torztsok bizonyos korltok
kztt maradjanak, akkor az eredmny extrapolcik nlkl alkalmazhat, azaz (szemben a nem humn rendszerbl szrmaz adattal) kzvetlenl humn relevns.
A fenti rtelemben teht a ksrletes s megfigyelsen alapul vizsglatok kiegsztik egymst (1. tblzat). Ennek j pldja, hogy az egyes kmiai anyagokat csak akkor
soroljk a bizonytottan a humn karcinognek kz, ha ehhez mind a ksrletes, mind
pedig az epidemiolgiai bizonytkok rendelkezsre llnak.
1. tblzat. Ksrletes s epidemiolgiai vizsglatok elnys s htrnyos tulajdonsgokbl add kiegszt termszete
Ksrlet
Megfigyels
Kls dzis
Bellthat, szablyozhat
Clszervi dzis
Kzvetlenl mrhet
Invazvan vizsglhat
Kifejldtt hats
Rszletesen vizsglhat
Diagnosztikus tvedsek,
nyilvntartsi hibk miatt
korltozott pontossg
Zavar tnyezk
Effektven kontrolllhat
a vizsglati elrendezsben,
kzvetlenl, invazvan
mrhet
A vizsglati elrendezsben,
adatfeldolgozsban kezelhet, de
gyakran csak indirekten mrhet
rzkenysgbeli
variabilits
Kezelhet (a kezelsi
csoportokban azonos
rzkenysg biztosthat)
Nehezen kezelhet
Vizsglt minta
nagysga
Humn relevancia
Indirekt
Direkt
10
Biostatisztika
Ksrletek s megfigyelsek
12
13
Biostatisztika
Biostatisztika
A vltozk tpusai
Vizsglatok sorn vagy ksrlet sorn generlt, vagy megfigyelsek sorn rgztett adatokat gyjtnk ssze. Az adatokat adatbzisba rendezzk, amelynek a feladata a valsg
szmszer lekpezse.
Az egyes jelensgeket klnbz mrsi technikkkal, klnbz sklkkal lehet
mrni. Ennek megfelelen klnbz termszet adatokat fogunk kapni. Egyes mrsek nagyon rszletesen mutatjk be a vizsglt jelensget, mg msok durvbb kpet
adnak csak. A mrsi technika megvlasztsa a vizsglatok tervezsi fzisnak feladata.
Fontos dnts ez, hiszen az adatgyjts ez alapjn zajlik majd, s ez fogja meghatrozni
a statisztikai feldolgozs sorn alkalmazhat mdszereket.
Az adattpusok kzt hierarchia rtelmezhet, amennyiben a legegyszerbb tpusok
ltal hordozott informci mindig elllthat a hierarchiban felette llkbl (3. bra).
Fordtott irnyban ez lehetetlen. A tervezskor ezrt clszer vatosnak lenni, s ktsg
esetn inkbb kicsit informatvabb adattpus mellett kell dnteni, ha erre lehetsgnk
van. Reduklni lehet majd az adattpust, de ha az adatgyjts sorn egyszerbb formt
hasznlunk, s a feldolgozs sorn derl ki, hogy rszletesebb adatra lenne szksgnk
ahhoz, hogy meg tudjuk vlaszolni az alapkrdsnket, akkor mr csak a vizsglat jrakezdse ll nyitva elttnk. Ezt a nyilvnval hibt (pazarlst) el kell kerlni!
15
Biostatisztika
Biostatisztika
A sorba rendezs lehetsge miatt ennl az adattpusnl, a gyakorisgok megoszlsn tlmenen, mr sszegezhetk a vizsglati eredmnyek medin s kvantilisek segtsgvel is.
Ha a mrsi sklnkon kettnl tbb, egymst kizr kategrink van, akkor az adatunk mr tbb informcit hordoz, a dichotm vltozkhoz kpest rszletgazdagabban
mutatja be a vizsglt jelleget. Ha ezek a kategrik nem rendezhetk valamilyen elv
alapjn sorrendbe, akkor nominlis adatrl beszlnk. Pldul csaldi llapot (hajadon,
hzas, elvlt, zvegy), foglalkozs, vallsi irnyultsg mrsre alakthatunk ki kategrikat. A kategrik egyikbe, s csak az egyikbe be kell tudnunk sorolni minden vizsglati alanyt. Ez a kvalitatv jelleg adattpus is csak gyakorisgi mutatk segtsgvel
sszegezhet. A rsztvevk csaldi llapotnak megoszlsa, az egyes munkahelyeken
dolgozk rszarnya, az egyes vallsi csoportokhoz tartozk arnya a mintban lehet a
mintkat bemutat ler statisztika.
Termszetesen a kategrikat valamilyen meggondols alapjn sszevonhatjuk, az
adatot dichotm formba hozhatjuk, ezltal reduklhatjuk az informcitartalmat (pl. csaldi llapot esetben definilhatunk egyedl l s trsas kapcsolatban l csoportot).
Biostatisztika
Biostatisztika
sgtl fggen. Az adatokat itt is tlag s szrs segtsgvel tudjuk sszegezni. Ebben
az esetben viszont mr nem csak a mrsi eredmnyek klnbsgeit tudjuk rtelmezni,
hanem azok arnyt is. A tllsi idk elemzsekor rtelmezhet az, hogy mennyi idvel lett hosszabb a tlls egy j eljrs bevezetse utn, de az is, hogy hnyszorosra
ntt a tllsi id.
Az adattpus meghatrozza az alkalmazhat statisztikai eljrst. Gyakran van arra
szksg, hogy adatainkat az eljrs ignyeihez igaztsuk. Az adattpusok hierarchija
hatrozza meg ilyenkor a lehetsgeinket. Csak az egyszersts irnyba tudunk talaktani. Ez pedig kategrikba sorolssal, illetve kategriahatrok definilsval egyenrtk.
A kategriahatrok, illetve a dichotomizlsi kszbk kijellse trtnhet valamilyen biolgiailag, klinikailag definilt normlrtk segtsgvel (a tnylegesen mrt
vrnyomsrtkek helyett hasznlhatjuk a hipertnis, normotenzv, vagy ennl rszletesebb beosztsokat, amikhez a hatrrtkeket a prognosztikai vizsglatok eredmnyei
alapjn hatroztk meg). Ha erre nincs lehetsg, akkor statisztikai eszkz segtsgvel
prblkozhatunk, kszbrtk-definilssal. Pldul a kontrollcsoportban megfigyelt
eloszls alapjn hatrozhatunk meg dichotomizlsi kszbt (egy jszer laboratriumi adat esetn, aminek mg nem ismert pontosan a klinikai jelentsge s a norml
tartomnya, a kontrollcsoport 97,5 percentilis rtkt hasznlhatjuk kszbknt, ha a
magas rtk tnik krjelznek, s a 2,5 percentilist, ha az alacsony.
Ler statisztika
Biostatisztika
Biostatisztika
egymstl jelents mrtkben eltr, egyni megbetegedsi kockzatot hordoz emberek adatai alapjn kell vlaszt adnunk. gy, hogy nem is tudjuk mrseinkkel lefedni
az sszes olyan tnyezt, ami alaktja a testtmeget s a megbetegedsi kockzatot.
Egyfell a forrsok elgtelenek arra, hogy minden ismert befolysol tnyezt tnylegesen mrjnk, msfell nem is ismernk minden tnyezt. Ha akarnnk, se tudnnk
teht mindenre kiterjed vizsglatot vezetni, amiben matematikai sszefggsek rvn
s hiba nlkl tudnnk lerni a folyamatok dinamikjt s vgeredmnyt.
Rviden sszefoglalva, olyan a vilg, hogy nem lehet benne a jelensgeket minden
rszlet vonatkozsban megismerni, s el kell fogadnunk, hogy ezek a jelensgek vltozatos formban vesznek minket krl.
Keznket feltartva mgsem adhatjuk fel, hogy az emberi szervezet mkdsre vonatkoz krdsekre vlaszoljunk, mert azt azrt valamilyen mdon el kell rnnk, hogy
ha nem is teljesen, de minl jobban rtsk az egszsges s a beteg szervezet mkdsi
sajtossgait. Hiszen a betegeket szeretnnk gygyultan, az egszsgeseket pedig minl tovbb egszsgesnek ltni. Ehhez pedig tudomnyosan megalapozott ismereteken
nyugv eljrsok alkalmazsra van szksg.
A megrts knyszere s a jelensgek vltozkonysga ltal berendezett terepen akkor tudunk elrehaladni, ha tmegjelensgknt kezeljk a vrnyomst, a csontok kalciumtartalmt, a daganatos betegsgek 5 ves tllst, az inzulinszrum koncentrcijt. Tmegjelensgknt, amelyet nem mutat egy pontos rtk (mint a fnysebessg
esetben), hanem vltozkony. Emiatt nem egyszeri (de nagyon pontos) mrssel lehet
ket meghatrozni, hanem a szrdsuk meghatrozsval. Utbbi feladatra dolgoztk
ki a statisztikai mdszereket. Ezek a vizsglati eszkzk teszik lehetv, hogy lerjuk
a biolgiai tulajdonsgokat azok szrdsnak bemutatsn keresztl, s kapcsolatot
keressnk a klnbz tulajdonsgok kztt, vagyis megrtsk, hogy az egyes tulajdonsgok vltozkonysga miknt kapcsoldik a msik jelensg vltozkonysghoz.
A jelensgek szrdsnak bemutatsa a legelemibb statisztikai feladat, amit meg kell
oldani az elemzseink sorn. Aztn majd erre lehet felpteni azokat a vizsglatokat,
amik sszefggst keresnek szintn statisztikai eszkzkkel a szrdst mutat jelensgek kzt.
A gondolatmenet zrsaknt meg kell jegyezni, hogy a vizsglataink tervezsekor
igyeksznk olyan krlmnyeket teremteni, hogy a vizsglt jelensgek vltozkonysga minl kisebb mrtkben korltozzon minket, minl szkebb legyen a variabilits.
A vizsglati krlmnyek kzt megmarad teljes vltozkonysgot aztn alapveten
kt rszre bontjuk: az egyik rsz, ami a nem ismert s az ppen kivitelezett vizsglatban nem figyelt folyamatok rvn ll el; a msik, ami a mr ismert, s a vizsglatban
20
Hisztogram
A vizsglt jelensgek szrdst els lpsknt rdemes bra segtsgvel szemlltetni. A hisztogram az egyes megfigyelt rtkek elfordulsi gyakorisgt, valsznsgt
brzolja (4. bra).
4. bra. Egy biolgiai paramter (tlag: 5; szrs: 1,5) hisztogramja a mrs pontossgnak fggvnyben az egsz rtkek (10 kategriba osztott mrsi eredmnyek), a tizedek (100 kategriba osztott mrsi eredmnyek) s a szzadok (1000 kategriba osztott eredmnyek) mrsre
kpes mrmszerek segtsgvel nyert adatok alapjn (mindhrom sorozatban 1000 a tnylegesen kivitelezett mrsek szma)
21
Biostatisztika
Biostatisztika
Az adatok eloszlsnak jellegtl fggen teht hasznlhatjuk az eloszlsrl rszletesebb informcit ad tlagot, vagy az eloszls rszleteirl keveset mond, de az extrm rtkekre kevss rzkeny medint.
Inkbb csak a teljessg kedvrt kell megemlteni, hogy diszkrt adatoknl a legnagyobb szmban elfordul rtk, illetve folytonos adatnl a hisztogram cscshoz
tartoz rtk a mdusz. A tipikus eset lersra ezt a mrszmot egszsgtudomnyi
terleten alig hasznljuk.
Szrds
Ez csak akkor szokott problms lenni, ha az adataink kztt van nhny extrm rtk,
ami kilg a hisztogrambl is. Ezek az extrm rtkek igen nagy hatssal vannak az tlagra. Ha ilyen adatokkal egytt szmolunk, akkor az lesz az rzsnk, hogy a szmtott
tlag nem jl tkrzi a tipikus vizsglati alanyt. Az extrm adattal kapcsolatban pedig,
hogy valami oknl fogva specilis volt a szlssges rtket mutat vizsglati alany, s
jobb lenne megrteni a specilis rtk mgtt ll specilis krlmnyt, mint figyelembe venni a tipikus rtk szmtsakor! Vagyis jobb lenne kizrni a szlssges adatot a
feldolgozsbl.
Extrm adatok jelenltben a tipikus rsztvevt jobban bemutat mrszmhoz jutunk, ha a vizsglat eredmnyeit sorba rendezzk, s kivlasztjuk az ppen kzpen
lvt. Az gy kapott rtk a medin. Mivel a medin szmtsakor nincs jelentsge a
szomszdos adatok kzti klnbsg nagysgnak, az extrm rtkek hatsa sem fog rvnyeslni olyan nagymrtkben, mint az tlag esetben. Ugyanezrt viszont a medin
nem tkrzi a tnyleges adatok kzti klnbsget.
A centrlis rtk nmagban nem rja le azt a jelensget, amivel foglalkozunk, hiszen a
tipikus rtk krl szrdnak a tnyleges adataink. A szrds pedig klnbz adatok
esetben jelentsen eltr lehet. A szrds szmszerstse ugyanolyan alapfeladat,
mint a centrlis rtk meghatrozsa.
A legegyszerbben az adatok tartomnyt szmthatjuk (a minimum s maximum
rtkek alapjn). Sajnos az egyszer szmthatsg nem prosul komoly gyakorlati rtkkel. Ez a mrszm ugyanis mindsszesen kt adatot, radsul kt extrm adatot
hasznost. Egyltaln nem szl az adatok tlnyom tbbsgrl.
Informatvabb szrds-mrszmokhoz jutunk, ha az adatok sorba rendezse utn
egyenl darabszm adatot tartalmaz tartomnyokat definilunk, s ezek hatrait, azaz
kvantiliseket adunk meg. Ha hrom, ngy, t vagy tz egyenl tartomnyt adunk meg
akkor tercilisekrl, kvartilisekrl, kvintilisekrl, illetve decilisekrl beszlhetnk. A
kvantilisek hatrai mr tbbet mondanak a tartomnyon belli eloszlsrl. De ez a mutat sincs tekintettel arra, hogy milyen a kategrikon bell az adatok eloszlsa.
rdemes olyan szrds-mrszmot kialaktani, ami az sszes adat eloszlst tkrzi, gy, hogy tekintetbe veszi az adatok kzti tnyleges klnbsgeket is. Ilyen mutat
a centrlis rtk krli szrdst kell, hogy szemlltesse, azaz az adatok alapjn szmtott tlag krli szrdst kell lernia. Ehhez az els lps az egyes adatok tlagtl
val ( x x ) eltrsnek szmtsa. Ha ezeket a tvolsgokat sszegezzk, akkor sszessgben kpet kapunk arrl, hogy milyen mrtk a szrds. Ha csak egyszeren
sszeadjuk az egyes tlagtl val eltrseket, akkor akrmilyen is az adatok szrdsa,
az sszeg ppen nulla lesz, mivel az tlag alatti s az tlag feletti adatokhoz tartoz eltrsek ppen kioltjk egymst: ( x x ) = 0 . Kt md is knlkozik arra, hogy ezt
az eljelproblmt megoldjuk. Az eltrsek abszolt rtkt vagy ngyzett hasznlva
csupa pozitv szmot kapunk, amiket sszegezve mr olyan mutatkat kapunk (abszolt
22
23
Centrlis rtk
A hisztogramok segtsgvel szemlltethet, hogy mi a tipikus vizsglati alany jellemz
rtke, mi az eloszls centruma, amit x rtkek N elem mintja esetn legkzenfekvbb
x=
x.
N
Biostatisztika
Biostatisztika
Vx
(x x)
=
N 1
Dx =
(x x) .
N 1
Szabadsgi fok
A mrsi eredmnyek feldolgozsakor statisztikai mutatkat, mrszmokat hatrozunk meg. Vannak mrszmok (pl. minta tlaga), amelyek kiszmtsa kzvetlenl
a minta egyes elemeibl trtnik. Ms esetekben nem csak magukbl a vizsglat sorn nyert elemi adatokbl, hanem kztes mutatkbl (pl. csoporttlagokbl) szmtjuk
a mrszmot (Jellemzen ilyen statisztikai tesztek mrszmai a teszt-statisztikk).
Ilyenkor a mrszm meghatrozsakor nem a minta nagysgval rjuk le a vizsglat
mrett, hanem a szabadsgi fokkal (degree of freedom; df). Annyival lesz kevesebb a
minta elemszmnl a mrszm szabadsgi foka, amennyi (mintbl szmtott) kztes
mrszm rtkt felhasznljuk a vgs mutat rtknek meghatrozshoz.
Minden statisztikai elemzs a teljes populcira vonatkozan szeretne kvetkeztetst levonni az elemzett minta adatai alapjn. A minta nagysga meghatrozza, hogy
mennyire megbzhat a levont kvetkeztets. Ezrt minden statisztikai mutat rtkelsekor figyelembe kell vennnk a vizsglat mrett megad szabadsgi fokot.
Az egyes statisztikai mrszmok szabadsgi foknak szmtsi mdjt taln clszerbb minden mrszm esetben megjegyezni, mint a szmts menetnek tgondolsa
rvn kikvetkeztetni.
Ha egy kezelt s egy kontrollcsoport sszehasonltsa rvn szeretnnk rtkelni egy
beavatkozs hatkonysgt, akkor t-prba segtsgvel hasonlthatjuk ssze a beavatkozs eredmnyt jelz klinikai paramter tlagt. A t-rtk kiszmtshoz felhasznljuk
a kt csoport tlagait, ezrt a statisztikai mutat rtkelsekor nem azt vesszk figyelembe, hogy milyen nagy volt a vizsglt minta, hanem annak kettvel cskkentett rtkt.
Normlis eloszls
A szrs s az tlagos eltrs szmszeren kzeli, de nem azonos rtk. nmagban
mindegyik alkalmas a szrds szemlletes lersra. A statisztikai feldolgozsok tovbbi lpsei viszont lnyegben csak a szrst hasznljk. Emiatt az tlagos eltrs
nem tekinthet lnyeges statisztikai mrszmnak.
24
Biostatisztika
Biostatisztika
A vizsglati eredmny s annak elfordulsi valsznsge kzti kapcsolatot ler fggvny a normlis eloszls srsgfggvnye:
m
26
27
Biostatisztika
Biostatisztika
Megbzhatsgi tartomny
zB =
x x 2,5 5
=
= 1,66
SDx
1,5
28
Biostatisztika
Biostatisztika
Addik a krds, hogy akkor rdemes-e brmit vizsglni? A vlasz igen, ha kpesek
vagyunk arra, hogy az eredmnyek bizonytalansgt szmszeren kifejezzk, ezltal
adva lehetsget az eredmnyek gyakorlati hasznostsra. A kvantifiklshoz vgezznk el gondolatban egy ksrletet a folsavbeviteli krds megvlaszolsra! A populci, amit meg szeretnnk vizsglni, az sszes korai terhessg idszakban lv n.
Ennek a populcinak termszetesen van tlaggal s szrssal jellemezhet folsavbevitele. Objektv, ltez szm mindkett. A gondolatksrletben az tlagot prbljuk majd
meghatrozni.
A teljes populcibl vletlenszeren vlogassunk ki sok, azonos N elemszm
mintt, s ezeken mrjk fel a folsavbevitelt, majd szmoljuk ki az tlagokat. (Nyilvnvalan ez a valsgban kivitelezhetetlen!) Nem lepdnk meg azon, hogy a kapott
tlageredmnyek szrdst mutatnak, s normlis eloszlsak. A szrds centruma az
a vals tlagos folsavbevitel, aminek a meghatrozsa egybknt a clunk. Az tlagrtkek szrdsnak a mrtke attl fgg, hogy mekkora volt az egyes nk folsavbevitelnek szrsa. Ha szles tartomnyon bell varildik az egyni folsavbevitel, akkor
a gondolatksrletben kapott mintnknti tlagok is szlesen szrdnak. (Br nyilvnvalan nem annyira szlesen, mint az eredeti adatok!) Azt is gondoljuk, hogy minl
nagyobb a gondolatksrletben hasznlt mintanagysg, annl megbzhatbbak lesznek
az egyes mintk tlagai, ez annyit jelent, hogy jobban tkrzik a valsgot, kzelebb
helyezkednek a vals tlaghoz, szkebb tartomnyon bell szrdnak. Vgs soron azt
tudjuk megllaptani, hogy a szrds mrtke egyenesen arnyos az elemi adatok standard devicijval, s fordtottan arnyos az elemszmmal, pontosabban (nem rdemes
itt a matematikai magyarzatra kitrni, de) annak gykvel. A nevezktani koszt elkerlend a standard devicit fenntartjuk az egyni szinten meghatrozott vizsglati
eredmnyek eloszlsnak lersra (SDx), a gondolatksrletbl szrmaz mintatlagok
SDx standard devicijt pedig tkereszteljk SE standard hibnak. (De tudjuk, hogy
egybknt ez a mintatlagok Gauss-grbjnek a szrsval egyenl!) A szemlletes
jelents matematikai megalapozstl eltekintve, meg tudjuk llaptani, hogy:
a T tartomnynak a szlessgt, amin bell jellemzen (95%-os valsznsggel) elfordulnak a gondolatksrlet eredmnyei:
.
Tudjuk, hogy az tlagok eloszlsa normlis, aminek a kzppontjban az ltalunk
keresett valdi X tlagos folsavbevitel van (nagybetvel a val populcira jellemz,
kis betvel a mintn megfigyelt adatokat szoktuk jellni), s hogy ilyen eloszls mellett
az adatok 95%-a az tlag 1,96 szrsnyi kzelben van. Azaz, meg tudjuk adni annak
30
T = X 1,96SE = X 1,96
SDx
.
N
tlagai szles tartomnyon bell varildnak, ami alapjn az egyes vizsglati eredmnyeket kevss megbzhatnak rezzk. Ha viszont a T tartomny szk, akkor az eredmnyek is szk tartomnyon bell varildnak, amibl azt kvetkezik, hogy a gondolatksrletbl szrmaz mintatlagok kzel helyezkednek el a vals tlaghoz, s ezrt
megbzhatbbnak rezzk ket. A tartomnynak nem csak az a pozitvuma, hogy kifejezi, hogy mennyire megbzhat egy vizsglatnak az eredmnye, hanem az is, hogy
olyan adatoktl fgg (elemszm s szrs) amelyeket egyetlen minta segtsgvel is
meg tudunk llaptani. (Ezt a kijelentst majd a tovbbiakban pontostani kell!)
Ha teht egyetlen vizsglatot vgznk el, akkor annak segtsgvel ez a T tartomny
meghatrozhat. Az egyetlen komoly gond a T tartomnnyal, hogy nem tudjuk, hol helyezkedik el a szmegyenesen, csak azt, hogy milyen szles. Ha r tudnnk illeszteni
a szmegyenesre, akkor nem csak a hatrait, hanem a kzppontjt is pontosan (rtsd:
hiba nlkl!) meg tudnnk adni. Ez annyit jelentene, hogy a valsgnak ezt a paramtert pontosan meg tudtuk hatrozni. A bevezetben pont arrl beszltnk, hogy ez elvileg
nem lehetsges!
Milyen a viszony a szmegyenes s T tartomny kzt? Ennek megvlaszolsban
segt minket az az adat, amit az egyetlen sajt vizsglatunkbl kapunk, de ebben a gondolatmenetben mg nem is vettnk figyelembe: a sajt mintnk adataibl szmtott
x.
Errl csak annyit tudunk, hogy egy a lehetsges nagyon sok, a gondolatksrletben elvgzett vizsglat eredmnybl, azaz valahol benne van a T tartomnyban (pontosabban 95%-os valsznsggel van a T tartomnyban). Segtsgvel hozzkapcsolhatjuk
a T tartomnyt a szmegyeneshez, mert azt gy kell illeszteni, hogy akrhol is lehet, de
legyen benne az
x , ami eleve a szmegyenesen is van. Ez annyit jelent, hogy a T tartomny kt szlsrtkt (Tals s Tfels) tudjuk felvenni, azaz rgzteni tudjuk a T tartomnyt a szmegyenesre, de nem egy fix helyen, hanem kt szlsrtk kzt.
A 6. brbl elg vilgosan kitnik, hogy a T tartomny kt szls helyzete a kzppontjukban lev vals tlag szls pozciit is (xals ;
x fels) meghatrozza, mely pozcik
a sajt mintk tlagtl 1,96 SE tvolsgra vannak.
31
Biostatisztika
Biostatisztika
Egyetlen vizsglat vgn teht meg tudjuk mondani, hogy a valsg egy paramtere
milyen hatrok kzt helyezkedik el 95%-os megbzhatsggal. A vizsglat eredmnye
tulajdonkppen az, hogy be tudjuk szortani a korbban nem ismert rtket ebbe a tartomnyba. Nyilvnval, hogy minl nagyobb mintt vizsglunk, annl szkebb lesz ez a tartomny, ami teljesen sszhangban van azzal a gondolatksrlet eltt megfogalmazott rzsnkkel, hogy, minl nagyobb mintt vizsgltunk, annl megbzhatbb az eredmnynk.
Meg kell jegyezni mg, hogy a 95%-os megbzhatsg a precizits s a megbzhatsg kzti gyakorlati kompromisszum. A kutatsi programok eredmnyeinek sikeres
gyakorlati alkalmazsa bizonytja, hogy ez a megbzhatsgi szint ltalban megfelel.
(Ha nem is vd meg minden tvedstl! Rszletesebben kvetjk majd ezt a gondolatmenetet a hipotzistesztels rtelmezsekor.) Esetenknt azonban nem elgsznk meg a
95%-os megbzhatsggal, s szeretnnk megadni azt a tartomnyt, amin bell 99%-os
valsznsggel van a vals tlag. A nagyobb megbzhatsgnak az lesz az ra, hogy
szlesteni kell a megbzhatsgi tartomnyt. A t-rtk = 0,01 -re megadott rtkeit
hasznlva mr tudjuk a 99%-os megbzhatsgi tartomnyt is szmtani.
A mintnkon vgzett vizsglat sorn nem csak tlagrtket tudunk meghatrozni, hanem brmilyen ler statisztikai vagy sszefggs-elemzst szolgl statisztikai mrszmot. A fenti gondolatmenet vgigvezethet brmelyik mrszmra. A vgeredmny
mindig egy megbzhatsgi tartomny lesz, aminek a kplete is teljesen azonos lesz a
levezettel. Egyetlen klnbsget fogunk tallni, ami a meghzhatsgi tartomnyokat
mrszm-specifikuss teszi. Ez a standard hiba szmtsnak a mdja. Az egyes mr-
32
33
Ezzel a mdszerrel meg tudjuk hatrozni, hogy milyen szlsrtkek kzt helyezkedik el a folsavbeviteli tlag vals rtke. Meg tudunk adni egy tartomnyt, amin bell
van valahol (nem tudjuk, hogy hol!) a vals tlag. Ezzel az intervallummal kvantifikltuk a sajt vizsglati mintkon meghatrozott tlag megbzhatsgnak mrtkt, megnyitva a lehetsget az eredmny gyakorlati alkalmazsra. (Nem mellesleg gy tettk
ezt, hogy harmniban maradtunk azokkal a filozfiai gondolatmenetekkel is, amelyek
szerint teljes rszletessggel nem lehet megismerni a valsgot!) A szrmaztatott intervallumot az tlag 95%-os megbzhatsgi tartomnynak definiljuk:
Biostatisztika
Biostatisztika
.
Az A gygyszerre valjban jellemz, tlagos terpis hats teht nagyobb, mint
21,74 Hgmm, s kisebb, mint 24,26 Hgmm. B gygyszer tlagos hatkonysga nagyobb, mint 25,05 Hgmm, s kisebb, mint 28,95 Hgmm. A kt 95%-os megbzhatsgi
tartomny nem fed t egymssal, azaz annak ellenre, hogy nem tudjuk pontosan egyik
gygyszer hatst sem meghatrozni, azt a krdst, hogy melyik jobb, mgis meg tudjuk vlaszolni: B gygyszer terpis hatsa jobb. Gyakorlati rtkkel br megllaptst
tudtunk teht tenni, azaz kellen pontosak tudtunk lenni a vizsglat sorn, Tulajdonkppen ez a jl kivitelezett vizsglatok egyik legfontosabb ismrve: kellen pontosak, de
nem fecsrlik az erforrsokat olyan mrtk precizits elrsre, amire mr nincs is
szksg az ppen vizsglt krds megvlaszolshoz (7. bra).
Egy msik helyzetben C s D gygyszerek hatst hasonltjk ssze. Itt az adatok az
albbiak: NC = 9; xC = 17,5 Hgmm; SDC = 7,2 Hgmm; ND = 16; xD = 17,5 Hgmm; SDD =
7,2 Hgmm. A megbzhatsgi tartomnyok tfedtk egymst:
,
34
7. bra. Ngy vrnyomscskkent gygyszer (A, B, C, D) tlagos terpis hatsnak 95%-os megbzhatsgi tartomnya
.
Az tfeds miatt lehet, hogy olyan vals rtke van a kt gygyszernek, ami egyforma
hatserssget jelez; az is lehet, hogy a D gygyszer a hatsosabb, hiszen sok olyan
pontja van a D megbzhatsgi tartomnynak, amihez vlaszthat kisebb rtk a C megbzhatsgi tartomnybl; de az is lehet, hogy C a hatkonyabb, mert vannak olyan rtke is a C megbzhatsgi tartomnynak, amihez vlaszthat nla kisebb rtk a D megbzhatsgi tartomnybl. sszegezve vagy egyformk a gygyszerek, vagy C, vagy D
a hatkonyabb. (Ennyit rul el neknk a vizsglat! Ezt tudtuk korbban is, ezrt nem
volt rdemes belefogni a vizsglatba!) A statisztikai kvetkeztetsnk az lesz, hogy nem
talltunk klnbsget a kt gygyszer hatserssgben.
35
Biostatisztika
Biostatisztika
Hipotzistesztels
eredmnyektl vrjuk, hogy meggyz bizonytkot adjanak arra, hogy mgis megalapozott a feltevsnk. Ha a meggyz bizonytkot nem tudjuk ellltani, akkor knytelenek vagyunk annak megfelelen cselekedni, hogy nem volt igaz az elkpzelsnk.
Vegynk egy egszen konkrt pldt erre! Azt gondoljuk, hogy az ltalunk kidolgozott eljrssal javtani lehet a betegek gygyulsi eslyt. Vizsglatot vgznk ennek
igazolsra, azaz adatokat gyjtnk, amiket feldolgozunk. Ha a statisztikai eredmnyek
szerint nagy biztonsggal llthat, hogy az alkalmazott eljrs javtotta a betegek llapott, akkor kezdjk szleskren alkalmazni a mdszer. Ha kis bizonytalansg marad
a vizsglat vgn a gygytsi hatkonysgot illeten, akkor viszont nem kezdemnyezzk a korbbi gyakorlat mdostst, az j mdszer alkalmazst maradunk a rgi
gyakorlatnl, konzervatv mdon.
A bri gyakorlatban vannak nagyon knnyen megtlhet gyek. Ha ktsg merl
fel a bnssget illeten, akkor az egybknt meglv terhel bizonytkok ellenre
sem tlik el a vdlottat. Knny eset az is, ha az sszes bizonytk a bnssg mellett
szl. Az olyan tmeneti eset kezelhet nehezen, amikor vannak bven bizonytkok a
bnssg mellett, de az rtatlansg mellett is szlnak rvek. A statisztikai eredmnyek
rtkelsekor is hasonl a helyzet. A knnyen megtlhet extrm helyzetek kzti znban nehz dntseket hozni. Segtsgnkre van az, hogy a statisztikai eljrs a valsgot reprezentl adatok segtsgvel szmszersti annak a valsznsgt, hogy az
elkpzelsnkben szerepl kapcsolatok, sszefggsek mentn jnnek ltre a valsg
tnyei. Ezt a szmszerstett valsznsget lehet egy kritikus valsznsgi kszbrtkhez hasonltani: ha nagyobb az llts igazsgnak valsznsge, mint a kszb,
akkor igaznak tekintjk; ha kisebb, mint a kszb, akkor nem tekintjk igaznak.
A szrke znban a jl megvlasztott dntsi kszb segt eligazodni. A kszb is
egy szmrtk, amit gy kell megvlasztani, hogy kellen nagy biztonsgot jelentsen a
nem megalapozott elkpzelsek elfogadsa ellen, de azrt ne lltson lehetetlenl szigor felttelt a vizsglatot vgzk szmra. Az elz azrt fontos, mert a rossz elkpzels alapjn bevezetett eljrsokat betegeken fogjk alkalmazni, akiknek a gygyulsi
eslyt ez jobb esetben nem javtja, rosszabb esetben kifejezetten rontja. Utbbi pedig
azrt fontos, mert a gygyt eljrsokat fejleszteni kell, akkor is, ha elvileg lehetetlen
100%-ig biztos tudomnyos bizonytkok ellltsa.
Hol tallhat ennek a kt felttelnek megfelel dntsi kszb? Sajnos, nem lehet
valamilyen elmletbl levezetni ezt a kszbvalsznsget! De a gyakorlati tapasztalat
az, hogy a biomedicinlis vizsglatok szmra az 5%-os hibahatr megfelel. Ez annyit
jelent, hogy csak abban az esetben gondolunk egy elkpzelst megalapozottnak, ha a
statisztikai rtkels szerint az legalbb 95%-os valsznsggel igaz. Ennl kisebb va-
36
37
Dntsi kszb
Biostatisztika
Biostatisztika
mindig! Az 5%-os hibahatr nem egy elmletileg megalapozott, a tvedsek ellen biztos vdelmet nyjt eszkz.
Elfordulhat, hogy a vizsglatunk p = 0,08 eredmnnyel zrul, azaz 8%-nak talljuk
a H0 valsznsgt. Ezt a szigor kszb miatt mg nem utastjuk el br termszetesen nem hisszk el azt sem, hogy igaz! Ebben a helyzetben elfordulhat, hogy valjban
a H1 volt a j hipotzis (ami nem meglep, hiszen mgiscsak 92%-nak talltuk annak
a valsznsgt, hogy igaz!), s hibt kvettnk el, amikor nem utastottuk el H0-t. A
hiba azrt jhet ltre, mert nem volt szerencsnk a minta sszelltsakor (a sok lehetsges mintbl pont egy szlssges sszettelt sikerlt kivlasztanunk), vagy azrt,
mert kicsi volt a minta elemszma (ennek rszletes magyarzatt az egyes statisztikai
teszteknl kln trgyaljuk). Amikor nem talljuk megalapozottnak az egybknt igaz
H1-et, akkor msodfaj hibt kvetnk el: vizsglatunk lnegatv eredmnyre vezet.
Olyan helyzet is addhat, amikor a vizsglatunk eredmnye p < 0,02, teht elg kicsinek tnik a H0 valsznsge, s elvetjk (egyben elfogadjuk H1-et), annak ellenre,
hogy H0 volt igaz. Ha az egybknt megalapozatlan H1-et elfogadjuk, akkor elsfaj
hibt kvetnk el: vizsglatunk lpozitv eredmnyre vezet. Ennek magyarzata szintn
a szlssges mintasszettel.
Az els s msodfaj hibval kapcsolatban le kell szgezni, hogy ezek nem a vizsglatot vgz ltal elkvetett hibk, hanem a dntsi folyamat termszetbl kvetkeznek. Egy minden szakmai szablyt tiszteletben tart, lelkiismeretesen elvgzett vizsglat eredmnye is lehet hibs statisztikai kvetkeztets.
Teljes populci vizsglata helyett szelektlt mintn vgzett vizsglat generlja a hibt! Ha nagyon sok azonos szm mintt vlasztunk ki a teljes populcibl, akkor ezek
tbbsge hasonl (de nem azonos) sszettel lesz, mint maga a populci, de pusztn
a vletlennek ksznheten, akad nhny szlssges sszettel minta is. A legjobban
felkszlt kutatcsoport is tallkozhat extrm mintval, s hozhat rossz dntst a helyesen szmtott statisztikai eredmnyekre tmaszkodva, az abszolt korrekt vizsglata vgn. Azt ugyanis egy vizsglat elvgzse utn nem tudjuk megmondani, hogy az ppen
vizsglt minta tipikus volt vagy szlssges.
Ezrt nem lehet nmagban egy vizsglat eredmnye alapjn egy kutatsi krdst
megnyugtatan megvlaszolni, mg akkor sem, ha nagyon jl vezetett a vizsglat.
Ugyanazt a krdst tbbszr is meg kell vizsglni (megerst jelleg vizsglatokat kell
vgezni) ahhoz, hogy kpet alkossunk az eredmnyek eloszlsa alapjn arrl, hogy milyen is H1 megalapozottsga.
39
Biostatisztika
Biostatisztika
Statisztikai tesztek
A p-rtk generlsra statisztikai tesztek szolglnak. Ezek egy specilis vizsglati helyzetre (pl. kt tlagrtk sszehasonltsra, csoportokban megfigyelt gyakorisgok sszehasonltsra, kt folytonos vltoz kztti kapcsolat erssgnek meghatrozsra
stb.) kidolgozott statisztikai mrszmot (teszt-statisztikt) lltanak el. A mrszm
nagysga attl fgg, hogy vletlenszer vagy lnyeges a vizsglt csoportok kzti eltrs, vagy a vizsglt paramterek kzti kapcsolat. A mrszmok egy ponton (kritikus rtk) tl mr a szignifikns hatst jelzik. A kritikus rtkeket tblzatokban talljuk meg
(az internetrl brmelyik knnyen elrhet), vagy szmtgpes program segtsgvel
szmthatjuk.
A mrszmokat gy dolgoztk ki, hogy azok valamilyen ismert eloszlst (pl. t-, 2-,
F-eloszlst) kvessenek. Az eloszlsfggvnyek segtsgvel hatrozhatjuk meg azokat
a pontokat, amin tl mr vletlennel nem magyarzhat, azaz 5%-nl kisebb valsznsggel fordulnak el a teszteredmnyek, ha a H0 igaz. Ha szmtgpes programot
hasznlunk (alapveten ez a helyzet), akkor a szmtsok mennyisge nem korltoz
minket. Ezrt nem csak a kritikus rtkhez tudjuk hasonltani a teszteredmnyt, hanem
azt is szmthatjuk, hogyH0 esetn a teszt milyen valsznsggel vezet a szmtott rtknl extrmebb eredmnyre. Vagyis megadhatjuk, hogy mekkora a valsznsge annak, hogy ha nincs szignifikns klnbsg a vizsglt csoportok kztt, vagy nincs szignifikns kapcsolat a vizsglt paramterek kztt, akkor a teszt eredmnye nagyobb lesz
annl, mint amit a mintnk adatai alapjn szmtottunk. (Pldul, ha 2-prbt vgznk,
akkor a minta jellemzi alapjn egy 2-fggvnyt tudunk megadni. Ez a fggvny azt
mutatja meg, hogy ha nagyon sokszor elvgeznnk ugyanazt a vizsglatot, mint ami a
2-rtket eredmnyezte, csak mindig ms mintn, akkor a klnbz teszteredmnyek
milyen gyakorisggal fordulnnak el, ha H0 igaz. Ennek a fggvnynek az ltalunk
szmtott 2-helyen vett rtke alapjn kapjuk meg a keresett p-valsznsget.) Ennek
alapjn termszetesen pontosabb statisztikai kvetkeztetst tudunk levonni, mintha csak
tblzatokat hasznlnnk.
A ksrletek vagy megfigyelsek sorn gyjttt adatokat legalapvetbben kt csoportra lehet osztani a biostatisztikai feldolgozs menete szempontjbl. Egyfell kvantitatv (valamilyen folytonos skln mrt) adatokkal dolgozhatunk (vrnyoms, szrum
HDL-szint, FEV1 stb.). Msfell (kett vagy tbb) kategriba rendezett, kvalitatv
adataink lehetnek (dohnyzsi szoksok gyakorisga, a gygyszerrel szemben allergisok rszarnya, 5 ves tllk szzalka stb.) Folytonos vltozk elemzsekor ltalban
abbl a krlmnybl indulunk ki, hogy ezek az adatok normlis eloszlst mutatnak. Ez
az eloszls tlaggal s szrssal lerhat, mely paramterek vizsglatval oldjuk meg a
csoportok kzti klnbsgek (vletlennel magyarzhat, vagy vletlennel nem magyarzhat) termszetnek rtkelst. Kvalitatv adatok esetben nem az eloszls paramtereinek elemzse, hanem az egyes kategrikba sorolt esetszmok, illetve az esetszmokhoz tartoz gyakorisgi adat kzvetlen rtkelse a biostatisztikai eljrs alapja.
Ilyen vltoztpusnl maguk a gyakorisgi adatok sszegzik a vizsglati eredmnyek
eloszlst amint a folytonos vltozk esetben ezt az eloszls-paramterek teszik.
41
Biostatisztika
Biostatisztika
togramok mr jelents mrtkben tfednek, kevs ktsgnk lesz afell, hogy nincs
lnyeges eltrs a vizsglt csoportok kzt.
Az tlagok k klnbsgt a szrds mrtkhez viszonyt mrszm szrmaztatshoz az a s a b csoport vizsglati eredmnyeinek varianciit (Va, Vb) hasznljuk:
.
Mivel a k kt csoport adatainak egyttes felhasznlsval ellltott statisztikai mrszm, variabilitst a kt csoport varianciinak mintanagysggal (pontosabban a mintk szabadsgi fokval) slyozott kzs variancijval kell szmtanunk (Vk ):
Vk =
Vk =
(na
+ (nb 1)
,
(nb 1)
(na 1)
(na 1 + nb 1)
(x
1)
Vk =
(x
xa ) 2 + ( xb xb ) 2
.
(na + nb 2)
A kzs variancia mutatja meg, hogy sokszor ismtelt vizsglat k eredmnyei milyen mrtkben szrdnnak. (Az ismtelt vizsglatok alkalmval k szrdst nagyobb
mrtkben hatrozn meg az a csoport, aminek nagyobb a ltszma. Ez tkrzdik a
szabadsgi fok szerinti slyozsban.)
A variancik s a mintk elemszma hatrozza meg a csoporttlagok standard hibjt:
...........
43
Biostatisztika
Biostatisztika
klnbsgnek. Ha ez a hnyados nem elg nagy, akkor azt gondoljuk, hogy ismtelt
vizsglatokban ppen ellenkez eljel eltrst is lthatnnk. A kt csoportot nem tekinthetjk eltrnek.
Az elg nagy klnbsg rtelmezst a k standardizlsval tehetjk egyszerv,
amikor a standard hiba rvn a klnbsget egysgnyi variabilits-mrtkegysgben
fejezzk ki! A standardizlt klnbsg, azaz a t-rtk:
.
Ha ez a tartomny tartalmazza a 0-t (als hatra negatv szm, a fels hatra pozitv), akkor a vizsglatunk alapjn nem tarthatjuk kizrtnak, hogy: (1) a vals eltrs a kt
csoport tlaga kzt ppen ellenkez eljel, mint amit a sajt vizsglatunkban lttunk,
(2) valjban nincs semmi eltrs a kt csoport kzt (erre utal, hogy a vizsglat alapjn
a k = 0 a valszn eredmnyek kzt van). Ha a 95%-os megbzhatsgi tartomny nem
tartalmazza a 0-t, akkor a klnbsg nagysgrl ugyan nem lesz pontos kpnk (arrl
csak annyit tudunk, hogy az nagy valsznsggel a 95%-os megbzhatsgi tartomnyon bell van valahol), de azt azrt meg tudjuk llaptani, hogy valban van eltrs a
kt csoport kzt (hiszen minden valszn vizsglati eredmny szerint hasonl eljel
az eltrs a csoportok kzt, mint amit a sajt vizsglatunkban is talltunk, 9. bra).
A klnbsget kzvetlenl is viszonythatjuk sajt variancijhoz. Ha ez a statisztikai mrszm kellen nagy, akkor az meggyz minket arrl, hogy az ltalunk tallt k
klnbsg nem a vletlennek tulajdonthat, hanem a csoportok kzt meglev lnyeges
9. bra. Az els vizsglati eredmny szerint a 95% MT vgig pozitv tartomnyban van. Minden
valszn k rtk arra utal, hogy pozitv eljel az eltrs a csoportok tlagai kzt: biztosak lehetnk abban, hogy a sajt vizsglatunkban kapott pozitv klnbsg nem a vletlennek ksznhet. A msodik vizsglatban a 95% MT a kt csoport kzti klnbsg hinyra utal 0-t s a kt
csoport kzti negatv eljel klnbsget is valsznst negatv rtkeket tartalmaz: ebben az
esetben azt gondoljuk, hogy pusztn a vletlennek ksznhet, hogy sajt vizsglatunkban pozitv eljel volt a klnbsg
44
45
Biostatisztika
Biostatisztika
1,1-gyel kisebb volt az tlag. A kzs variancia 5,47, a klnbsg standard hibja 1,001
volt.
A t = 1,098 kisebb volt, mint a kritikus rtk (t[0,05;20] = 1,098), azaz az eredmnyt nem
tudjuk az oktatsi protokoll hatkonysgnak bizonytkaknt felhasznlni, mg akkor
sem, ha ltjuk, hogy kevesebb volt a kpzsben rszesl gyerekek kzt a komplikcik szma.
Gyakran elfordul, hogy egy kezels hatkonysgt gy tudjuk vizsglni, hogy a
betegek kezels eltti s utni llapott mrjk fel. Elvileg lehetsg volna arra, hogy a
kezels eltti s utni adatokat a ktmints t-prba segtsgvel hasonltsuk egymshoz,
s ezltal rtkeljk a kezels hatkonysgt. Az nkontrollos vizsglatban azonban
ennl hatkonyabb rtkelsre is van lehetsg. A hatkonysgnvekeds (kisebb hatsok kimutatsra val kpessg) alapja, hogy prba rendezett adatok, adatprok alapjn
szmolt eltrseket (d) rtkelnk:
d
d
= .
N
(( ((
2.
(d d ) ,
N 1
46
47
Biostatisztika
Biostatisztika
48
49
.
Ha a kezels nem hatkony, akkor a csoportokon belli tlagok nem trnek el egy) fejezi ki a vizsglt
mstl. Ilyen esetben az sszes kezelt betegre szmtott tlag (x
t
klinikai paramter tlagrtkt:
x =
x =
x =
x =
x.
a
Ebben az esetben a csoportokon bell szmtott ngyzetes eltrsek sszege is szmthat gy, hogy a csoporton belli tlagot a teljes betegcsoport tlagval helyettestjk:
.
Mivel minden egyes beteg esetben meghatroztuk az tlagtl val eltrs ngyzett, s ugyanazt az tlagot hasznltuk mindig, a ngy csoportban mrt ngyzetes eltr-
Biostatisztika
Biostatisztika
sek sszege ugyanazt a szmot adja, mintha az egyes betegek eredmnyeit a teljes vizsglati csoport tlaghoz viszonytva szmtottuk volna a ngyzetes eltrsek sszegt:
Felhasznlva a variabilitssal kapcsolatos gondolatmenet eredmnyeit, azt mondhatjuk, hogy akkor gyz meg minket a vizsglat a beavatkozs hatkonysgrl, ha a
csoportok kzti variabilits nagyobb, mint a csoportokon belli. Ha a csoportok kzti
variabilits kicsi a csoporton belliekhez viszonytva, akkor ez amellett szl, hogy nem
befolysolja a kezels a klinikai eredmnyt.
Valamilyen mdon teht a klnbz variabilitsi adatokat egymshoz kell hasonltanunk. Lehetne egyszeren a ngyzetes eltrsek sszegnek hnyadosait hasznlni.
A megolds kzenfekv, de nem j! A ngyzetes eltrsek sszege ugyanis nem csak
attl fgg, hogy milyen mrtk a vizsglati eredmnyek szrdsa, hanem attl is,
hogy hny beteg volt egy-egy csoportban. (Nagy csoport kicsi variabilits eredmnyei
ugyanakkora ngyzetes eltrs sszeget adhatnak, mint a kis csoport nagy variabilits
adatai. Hasonlan elmondhat ez a csoportok kzti variabilitsrl is: sok csoport kzti kis eltrs ugyanakkora ngyzetes eltrs sszeget adhat, mint a kevs csoport kzti
jelents eltrs.) Valamilyen mdon teht figyelembe kell venni a csoportnagysgot,
pontosabban azt a szmot, ami megmutatja, hogy hny fggetlen adat felhasznlsval
kaptuk a variabilitsi mrszmokat, azaz a szabadsgi fokokat.
A csoportokon belli variabilits szmtsa esetn egyszer a helyzet. Itt az tlagrtkhez viszonytva szmtottuk a ngyzetes eltrsek sszegt. Emiatt az utols beteg
esetn az elz betegek adataibl s az tlagbl mr pontosan tudjuk az eredmnyt. Ennek az egy betegnek az adata mr nem ad j informcit az elemzshez (ha az adata
elveszne, de az tlag megmaradna, akkor ennek az egy betegnek a mrsi eredmnye
mg pontosan kiszmthat lenne). A szabadsgi fok teht a pldnkban szerepl ngy
csoportra:
.
Ha viszont a kezels hatkony, akkor az tlagrtkek nem egyenlk (pontosabban vannak kztk klnbzek, ami miatt mg lehetnek kztk egyenlk is). Ilyen esetben a
csoportokon bell a ngyzetes eltrssszegek szmtsakor nem hasznlhatjuk a teljes
betegcsoportra jellemz tlagot, s a csoportokon bell szmtott ngyzetes eltrsek
sszege nem is lesz egyenl az sszes vizsglatba vont beteg eredmnynek s a teljes
csoport tlagnak felhasznlsval szmtott teljes variabilitssal:
.
Az egyes betegek vizsglati eredmnyei rszben a kezelstl fggenek, rszben
mindazoktl az egyni jellemzktl, amelyek befolysoljk a vizsglt klinikai paramtert, de amelyet a vizsglatunkban nem vettnk figyelembe. A vizsglati eredmnyek
teljes variabilitsa ebbl a kt forrsbl szrmazik. A kezelsi csoportokon bell megfigyelhet variabilits fggetlen a kezelstl, hiszen a csoporton bell minden beteg
azonos elltsban rszeslt. A csoportok kzti tlagok klnbsgei fejezik ki a kezels
okozta variabilitst. A teljes variabilits teht felbonthat a csoportokon belli (Si) s a
csoportok kzti (Se) komponensre:
.
A csoportokon belli s a teljes vizsglt betegcsoportra vonatkoz ngyzetes eltrssszeget szmthatjuk a fentebb mr emltett kpletek segtsgvel. A csoportok kzti
variabilitst pedig egyszeren ezek klnbsgeknt kapjuk meg:
.
A csoporton belli teljes variabilits szmtsakor (Si) ezeket a csoportonknti szabadsgi fokokat kell sszegezni. A csoporton belli variabilits szabadsgi foka:
50
51
Biostatisztika
Biostatisztika
A csoporton belli szabadsgi fokhoz viszonytott ngyzetes eltrsek sszege (ami egyszeren variancia, de hvjk mg a ngyzetes eltrsek tlagnak is, mean squares, MS):
A kritikus F-rtket termszetesen szmtgp segtsgvel is szmthatjuk. Igazbl nem is nagyon rdemes a tblzatokat forgatni, amikor egy konkrt feladatot oldunk
meg. A varianciaelemzs gondolatmenethez viszont a tblzatok hozztartoznak, ezrt
ezek hasznlatt rteni kell.
A fenti varianciaelemzs (analysis of variance, ANOVA) eredmnyeit szoks tblzatos formban sszefoglalni (3. tblzat). Ez a tblzat kiegszl mg az adott helyzetre vonatkoz kritikus F-rtkkel (ami azt mutatja meg, hogy a szban forg, nt elemszm vizsglatnl k csoportba rendezett vizsglati alany esetn legalbb mekkornak
kell lennie a csoportok kzti variancinak a csoporton bellihez viszonytva, ahhoz,
hogy legalbb 95%-os bizonyossggal llthassuk, hogy hatsos a kezels). Ha szigorbb dntsi kszbt kvetel meg a vizsglati helyzet, akkor magasabb lesz a kritikus
F-rtk (a csoportok kzti klnbsgnek nagyobbnak kell lennie, mintha csak 95%-os
bizonyossggal szerettnk volna valamit megllaptani.)
Szmtgpek segtsgvel termszetesen nem csak kritikus F-rtket tudunk szmtani, hanem azt is meg tudjuk hatrozni, hogy az elemzs sorn szmtott varianciahnyados (F-rtk) milyen dntsi kszb esetn szmt kritikus rtknek. (Milyen
kritikus rtkre szmtott F-tblzatbl tudnnk kiolvasni a vizsglatunkhoz tartoz
F-rtket!) Ebben az esetben mr egy p-rtk szmtsrl, s F-rtkek sszehasonltsa helyett F-prbrl beszlhetnk. (Ahol kt variancia hnyadost a nekik megfelel
szabadsgi fokok fggvnyben sszevetve megllaptjuk, hogy a szmllban lv variancia szignifiknsan nagyobb-e, mint a nevezben lv.)
sszessgben teht elmondhatjuk, hogy ha kettnl tbb csoportot alaktottunk ki
a vizsglatunk sorn, s arra vagyunk kvncsiak, hogy a kezels (amit klnbz dzisokban alkalmaztunk) hatkony-e, akkor a varianciaelemzssel olyan mdon tudjuk
.
A teljes variabilitsra a szabadsgi fok ugyanazzal a gondolatmenettel vezethet le,
mint a csoporton belli variabilits esetn. Itt sem ad mr egy beteg adata informcit a
mutat kiszmtshoz. Ezrt a szabadsgi fok s a variancia ebben az esetben:
.
A csoportok kzti variabilits szmtsakor k csoport tlagrrtkeinek ftlagtl
val eltrst rtkeljk. A k tlagbl is egyet veszthetnnk el bntetlenl, ha a teljes
vizsglat tlagos eredmnye megmaradna. Ezrt a csoportok kzti variabilits szabadsgi foka s a variancia:
.
A variancik rtke mr a vizsglt elemek szmtl fggetlenl kifejezi, hogy mekkora az elemi adatok szrdsa. Ezek segtsgvel kzvetlenl viszonythat egymshoz a csoportok kzti s a csoportokon belli variabilits, egyszeren a variancik
hnyadost kell szmtanunk. Ha ez a hnyados kellen nagy, akkor az a kezels hatkonysgnak a bizonytka. Ha ez a hnyados kicsi, akkor ez az ellen szl, hogy a
kezels hatkony volt.
Mr csak azt a krdst kell megvlaszolnunk, hogy mikor tekinthet egy varianciahnyados kellen nagynak? Ennek a megvlaszolsa olyan matematikai ismereteket ignyel, amelyeket eddig prbltuk megkerlni, amikor a biostatisztikai problmk megoldsi lehetsgeirl gondolkodtunk. Itt is elkerljk a matematikai vlasz
ismertetst, s csak utalni tudunk a valsznsg-szmtssal foglalkoz tanknyvekre.
Ugyanakkor felhasznljuk az ilyen knyvek vgn tallhat tblzatot, ami kzli a kritikus hatrvonalnak szmt rtket a szabadsgi fokok s a dntsi kszb fggvnyben (http://www.socr.ucla.edu/Applets.dir/F_Table.html). A kritikus rtknl nagyobb
varianciahnyadost rtelmezzk kellen nagynak.
52
Variabilits (ngyzetes
eltrsek sszege, SS)
Csoportok kzti
variabilits (e)
Csoporton belli
variabilits (i)
Teljes
variabilits (t)
Szabadsgi
fokok
Varianciahnyados (F)
F=
MSi =
53
MSe
MSi
Biostatisztika
Biostatisztika
4. tblzat
A
98
14
86
25
126
73
124
401
102
70
82
81
98
378
169
86
76
38
211
552
150
65
275
321
52
33
13
236
20
47
433
167
16
28
45
37
75
157
143
169
132
258
10
537
43
46
156
174
10
68
116
70
491
583
177
101
656
375
757
77
22
38
212
89
124
13
129
46
39
62
30
165
109
19
45
90
34
5. tblzat
Ngyzetes eltrsek sszege
Szabadsgi fokok
Variancia
(F)
226 240
75 413,2
3,116
1815 229
75
24 203,1
Teljes variabilits
2041 469
78
10. bra
54
202
55
Biostatisztika
Biostatisztika
azt felttelezzk, hogy a kezelt betegek nemi arnyt fogjuk ltni a sikeresen kezelt betegek kzt is.)
Ebben az rtelemben beszlhetnk arrl, hogy az egyes vizsglati kategrikban
az elemszmok elre megjsolhat arnyban fordulnak el. Adott vizsglat esetn, a
vizsglatba vontak szmt ezeknek az elmletileg megalapozott arnyoknak megfelelen tudjuk felosztani. Az gy kapott esetszmok elfordulst vrjuk a vizsglat vgn
majd. Ezrt definiljuk ket vrhat rtknek (E). A vizsglat vgn kapott tnyleges
esetszmokat pedig megfigyelt esetszmnak (O).
Abban az esetben, ha a megfigyelt s a vrhat esetszmok kzti eltrs kicsi, akkor
tulajdonkppen az elmlet s a tapasztalat kzti sszhangra kaptunk biostatisztikai bizonytkot. Ilyen esetben a feltevsnk killta a valsg prbjt. Ha viszont a klnbsg
kellen nagy, akkor nyilvnval, hogy nincs sszhang a tapasztalat s a vrakozsaink
kzt. Ha pedig a valsg prbjt nem llta ki az elkpzelsnk, akkor be kell ltnunk,
hogy tvedtnk.
Az elkpzelsnk s a valsg kzti klnbsg szmszerstsre els kzeltsben a
megfigyelt s vrhat rtkek kzti klnbsg megfelel: (OE). Az sszes vizsglt kategria adatainak megfigyelt-vrhat rtkprjai adjk majd egyttesen a tapasztalat s
az elkpzelseink kzti kapcsolat mrszmt: (OE). Az egyszer sszegzs azonban az eltr eljelek miatt nem hasznlhat. Helyette a ngyzetes eltrsek sszegt
szmtjuk kategrinknt, s ezeket sszegezzk:
Gyakran kell olyan krdsekkel foglalkoznunk, ahol nem folytonos vltozk, kvantitatv adatok segtsgvel rjuk le a kivltott hatsokat, hanem kt vagy tbb kategriba sorolt, kvalitatv adatokkal. Vizsglhatjuk pldul, hogy adott gygyszer hatsra emelkedik-e a gygyult betegek arnya; passzv dohnyzk gyerekei gyakrabban
szenvednek-e kzpflgyulladstl; a hatrrtk feletti szrum-trigliceridszint esetn
magasabb-e a szvinfarktus kialakulsnak kockzata; egy elltsi protokoll kvetkezetes alkalmazsa javtja-e a kedvez klinikai kimenetel valsznsgt.
A kvalitatv adatok esetben az egyes kategrikban regisztrlt esetek szma sszegzi a vizsglat eredmnyt. A vizsglati beszmolk ler-statisztikai tblzataiban
is ezek az esetszmok, illetve a nekik megfelel gyakorisgi adatok szerepelnek.
Vrhat rtk
Az RhD-antign jelenlte alapjn Rh-pozitv s Rh-negatv vrcsoportokat klnbztetnk meg. A tulajdonsg autoszomlis dominns rklsmenetet mutat. Rh-negatv csak
az lehet, aki mindkt szltl ezt a jelleget rkli. Ha heterozigta szlknek gyereke
szletik, akkor 25% valsznsggel lesz a gyermek Rh-negatv (homozigta). A gyerekek 75%-a Rh-pozitv lesz (50% heterozigta, 25% homozigta). Ha 60 heterozigta
szlprtl szrmaz gyereket vizsglunk, akkor azt vrjuk, hogy 60 0,25 = 15 gyerek
lesz Rh-negatv s 60 0,75 = 45 Rh-pozitv.
Ha egy monognes genetikai betegsg esetn azt ttelezzk fel, hogy az rklsmenet autoszomlis dominns, s megvizsgljuk 60 heterozigta szltl szrmaz gyermek egszsgi llapott, akkor azt vrjuk, hogy a gyerekek negyede lesz egszsges. Ha
azt ltjuk, hogy a vizsglatunk nem pontosan a vrt esetszmokat (15 egszsges s 45
beteg) tallta, akkor kicsi eltrs esetn egyszeren a vletlen hatsval magyarzzuk a
megfigyelt s a vrt rtk kzti eltrst. Az eredmnyt pedig az alapfeltevsnk mellett
szl rvknt hasznljuk. Ha viszont az eltrs nagy, akkor az merl fel bennnk, hogy
a betegsg nem az ltalunk felttelezett autoszomlis dominns mdon rkldik.
Az rklsmenettel kapcsolatos pldk azt szemlltetik, hogy vannak olyan gyakorisgi adatok, amik levezethetek valamilyen biolgiai, orvostudomnyi elmletbl,
vagy egy sajt magunk ltal kidolgozott elkpzelsbl. (Pldul, ha felttelezzk, hogy
a nemek kzt nincs klnbsg egy gygyszerfajta hatkonysgban, akkor a frfiak s
a nk kzt ugyanolyan gyakorisggal vrjuk a kezelsre adott kedvez reakcit. Emiatt
56
.
Adott vizsglati helyzetben minl nagyobb a ngyzetes klnbsgek sszege, annl nagyobb az eltrs tapasztalat s valsg kzt. Ez az sszeg azonban nem csak akkor
lehet nagy, ha jelents a tapasztalat s a hipotzis kzti tvolsg, hanem akkor is, ha
nagy elemszm a vizsglat. (Ha az sszegzett ngyzetes eltrsek ugyanakkora eltrst
mutatnak egy 20 fs vizsglatnl, mint egy 2000 fsnl, akkor a 20 fsnl ez mr igen
jelents eltrs lehet, mg a 2000 fsnl elenysz.) A vizsglat nagysghoz kell teht
viszonytanunk a ngyzetes klnbsgek sszegt, amit a vrhat esetszmokkal adunk
meg. A vizsglat nagysghoz viszonytott ngyzetes eltrsek sszege minden kategriban sszegezve olyan statisztikai mrszm, ami mr megbzhatan s a vizsglat
mrettl fggetlenl rja le a tapasztalat s a vrakozsaink (kutatsi hipotzisnk)
kzti klnbsget. Ez a mutat a 2:
.
57
Biostatisztika
Biostatisztika
nifiknsknt val rtkelst, mg azon az ron is, hogy nem vesznk szre meglev
szignifikns eltrst. (Inkbb nem vltoztatjuk a gyakorlatot megalapozatlanul azaz
konzervatv szemllettel kzeltnk a problmkhoz.)
Egy vizsglatban Magyarorszg 5064 ves npessgre reprezentatv lakossgi
mintjra van szksg. A minta reprezentativitst 2 rtk szmtsval rtkeltk a
kt nemre kln-kln (6. tblzat). A szabadsgi fok mindkt nemnl 2 volt, mivel 3
korcsoportot rtkeltek. A kritikus 2[0,05;2] = 5,991-nl mindegyik esetben kisebb volt a
szmtott 2, ami alapjn nem tudtk igazolni, hogy a referencianpessg sszetteltl
eltrt a sajt minta sszettele. A mintt reprezentatvnak tekintettk.
A megfigyelt s a vrhat rtk kzti eltrs arra hvta fel a figyelmnket, hogy
valami nincsen rendben azzal a 2 kplettel, amit levezettnk az elzekben. Lttuk,
hogy rtelmezsi problmk is felmerlnek a vgeredmnnyel kapcsolatban. Ennek oka
tulajdonkppen egyszer, de rszleteiben itt most nem trgyalhat. Elgedjnk meg
annyival, hogy az ltalunk levezetett kpletek kzelt jellegek. Csak akkor adnak
megbzhat eredmnyt, ha az egyes kategrikban a vrhat esetszm legalbb 5. Ez
alatt a kzelt s a pontos megfigyelt-vrhat klnbsgek kzt mr jelents az eltrs.
(Csak a teljessg kedvrt jegyezzk meg, hogy ilyenkor mr csak a Fisher-exact eljrs
alkalmazhat.)
A fenti eljrs sorn egy elmletileg vagy valamilyen kutatsi hipotzisnek megfelelen meghatrozott esetszm-eloszlshoz viszonytottuk a vizsglatunk sorn megfigyelt esetszm-eloszlst. Az eljrst a valsg s a kutatsi hipotzis illeszkedsnek
a vizsglataknt rtelmezhetjk (goodness of fit test).
6. tblzat
Nem
Frfiak
.
Nyilvnval, hogy a korriglatlan s a korriglt kztt van valahol a pontos 2, s
akrmelyik szmtsi mdszert is hasznljuk, hibt kvetnk el. A kt hiba kzl az
utbbit kell elvllalnunk, mivel a biostatisztikai gondolkods menetben egyrtelmen
annak adunk prioritst, hogy lehetleg elkerljk a nem szignifikns eltrsek szig 58
Nk
Korcsoport
Referencia
esetszmok
Referencia
gyakorisgok
Sajt minta
esetszmai (O)
Vrhat
(|(OE|0,5)2/E
esetszmok (E)
5054
515406
0,414
8378
8427,4
0,284
5559
419839
0,337
6797
6864,8
0,660
6064
310858
0,249
5200
5082,8
2,679
sszesen
1246103
20375
20375,0
=3,623
5054
584629
0,410
9800
9943,7
2,062
5559
474511
0,333
8089
8070,8
0,039
6064
366198
0,257
6354
6228,5
2,509
sszesen
1425338
24243
24243,0
=4,610
59
Biostatisztika
Biostatisztika
7. tblzat
Telepek szma/lttr
(|(OE|0,5)2/E
0 vagy 1
6,3
2,279
8,9
0,014
10,6
12
0,072
9,6
0,118
6,9
0,021
7,8
12
1,762
legfels elemzett kategria. A szmtott 2 = 4,267 kisebb volt, mint a kritikus 2[0,05;4] =
9,488-nl. (A szabadsgi fok a 6 csoport miatt volt 4.) A telepszm-eloszls teht megfelelt a vrtnak, nem trt el attl szignifiknsan. A vizsglati rendszer alkalmas volt a
feladat elvgzsre.
Gyakran kell azt ellenrizni, hogy egy folytonos vltoz normlis eloszls-e. Ilyenkor is alkalmazhatjuk a fenti megoldsokat. Azaz a mintk adatai alapjn szmtjuk adataink eloszls-paramtereit (tlagot s szrst). Ezt kveten kategrikat hatrozunk
meg (felosztjuk a folytonos sklt kategrikra). A kategrik szmnak, szlessgnek
kialaktsakor az 5-s vrhat elemszmszablyra kell tekintettel lennnk. A szls kategrit pedig itt is vgtelenig bvtve kell definilni. A 2 szmtsa ettl kezdve kveti
a fenti mintt. A kritikus rtk megllaptsakor azt kell figyelembe venni, hogy itt kett
eloszls-paramtert hatrozunk meg a minta adatai alapjn, emiatt a szabadsgi fok a
kategrik szmnl hrommal lesz kisebb.
Biostatisztika
Biostatisztika
9. tblzat
Megfigyelt esetszmok
B1
B2
K1
N11
N21
K2
N12
Mind
B1 = N11 + N12 =
= 250
Vrhat esetszmok
Mind
B1
B2
K1 = N11+N21 =
K1
= 100
= 100 0,5
= 50
= 100 0,5 =
= 50
N22
K2 = N12 + N22
= 400
= 400 0,5
= 200
= 400 0,5 =
200
B2 = N21 + N22 =
= 250
N = 500
K2
tozik (K1 = N11 + N21 = 100), a kt csoport pedig 250-250 fs (B1 = 250 s B2 = 250),
akkor, mivel a csoportok ltszma egyforma, a betegek is egyforma szmban fordulnak
el a kt csoportban a nullhipotzis alapjn. Ebben az esetben a vrhat rtk a kt cellra (N11-re s N12-re) 50-50 lesz. Ebben az 500 fs vizsglatban az egszsgesek szma
K2 = 500 100 = 400, akiket a csoportltszmok arnyban sztosztva 200-es vrhat
esetszmot kapunk N12-re s N22-re is (9. tblzat).
Ha ugyanebben a helyzetben a csoportok ltszma B1 = 400 s B2 = 100 lenne, akkor a 100 beteg is ennek megfelelen oszlana meg: 80 beteg lenne a nagyobbik s 20
beteg a kisebbik csoportban. Az egszsgesek szma is ebben az arnyban fordulna el
(10. tblzat).
(kivltott hats)
Kategrik
B1
K1
B2
N11
N21
Megfigyelt esetszmok
B2
K1
N11
N21
K2
N12
Mind
B1 = N11 + N12 =
= 400
K1 = N11 + N21
K2
N12
N22
K2 = N12 + N22
Mind
B1 = N11 + N12
B2 = N21 + N22
62
B1
Mind
Vrhat esetszmok
Mind
B1
B2
K1 = N11+N21 =
K1
= 100
= 100 0,8
= 80
= 100 0,2 =
= 20
N22
K2 = N12 + N22
= 400
= 400 0,8
= 320
= 400 0,2
= 80
B2 = N21 + N22 =
= 100
N = 500
63
K2
Biostatisztika
Biostatisztika
A vrhat esetszmok kpzsnl az egyes kategrikban sszesen megfigyelt esetszmokat teht sztosztjuk a csoportnagysgnak megfelelen. Az gy kapott vrhat
rtkek azt fejezik ki, hogy milyen lenne az esetek eloszlsa csoportokon bell kategrinknt, ha a csoportkpz faktor nem befolysoln a betegsg kialakulst.
Ezek utn mr a 2 szoksos mdon szmthat, s segtsgvel a tapasztalat s az elmleti feltevs (nullhipotzis) kzti kapcsolat termszete mr rtkelhet. Az itt kapott
2 kritikus rtknek meghatrozshoz szksgnk van mg a szabadsgi fokra. Ha
egy n m kontingenciatblzat sor- s oszlopsszegeit tudjuk, akkor a vrhat rtkek
kzl nagyon sokat nem kell mr felhasznlni a szmtsaink sorn. Minden sorban 1
adat van, ami ha elveszne, akkor a sor egyb tagjaibl s a sorsszegbl mg szmthat
lenne. Ugyanez igaz az oszlopokra is. Ennek megfelelen a 2 szmtsakor a szabadsgi fok:
dett terletek kztt milyen a gondozsba vtel hatkonysga (11. tblzat). A szmtott
2 = 7,095 nagyobb a kritikus 2[0,05;1] = 3,841 kszbnl, ezrt a megfigyelt s a vrhat
rtkek kzti klnbsg szignifikns. Mivel a szakelltsban gondozottak arnya 67% a
civil szervezet ltal elltott, s 59% az ltaluk nem elltott terleten, a szervezet mkdst kedvez hatsnak rtkeljk az eredmny alapjn. (A 2 =7,095-hoz tartoz p =
0,008 rtket szmtgp segtsgvel kapjuk.)
Ha 2 2-es a kontingenciatblzat, akkor az alapkrdsnkre kzvetlenl vlaszolni
tudunk a 2-prba segtsgvel. Ha azonban ennl nagyobb a tblzat (tbb kategriba soroltuk a befolysol tnyezt s/vagy a kivltott hatst), akkor a vizsglati krds
csak az lehet, hogy van-e egyltaln hatsa a csoportkpz faktornak a vizsglt paramterre? Erre a 2-prba vlaszt is ad. Arra viszont nem kapunk gy vlaszt, hogy melyik
csoportok kzt s melyik kivltott hats szempontjbl jelentkezik valjban az eltrs? A tblzat mrettl fggen nagyon sok specifikus krdst lehet az ilyen post hoc
elemzsek sorn feltenni. A specifikus krds megvlaszolsakor a dntsi kszbt
kell cskkentennk annak rdekben, hogy sszessgben a vizsglatban az els faj
hiba szintje ne emelkedjen 5% fl, azaz, hogy ne rtkeljnk a sokszoros hipotzistesztels kvetkeztben ltszlagos szignifikns eredmnyt valban szignifiknsnak.
Szvinfarktuson tesett betegek elltsra egy elltsi krzetben 3 lehetsg ll rendelkezsre. A hromflekppen kezelt betegek 1 ven belli llapotjavulst vizsgltk,
annak rdekben, hogy megllaptsk, melyik elltsi forma szolglja hatkonyabban a
betegek rdekeit (12. tblzat).
.
A ciszts fibrzis korszer gondozsa jelentsen javtja a betegek letminsgt. A
diagnzis fellltsa utn ezrt alapveten fontos a gondozsi kzpontokba val bekerls. Sokan azonban alapelltsi krlmnyek kztt kerlnek elltsra. A ciszts fibrzisos gyermekek szlei ltal ltrehozott civil szervezet prblja felkutatni s a szakellt
kzpontok fel irnytani az rintetteket. A szervezet azonban nem plt ki az egsz
orszgban. Megvizsgltk, hogy a szervezet ltal lefedett s a szervezet ltal le nem fe11. tblzat
Megfigyelt esetszmok
Civil szervezet
mkdsi
terlete
Civil szervezet
ltal le nem
fedett terlet
Vrhat esetszmok
Mind
Alapelltsban
gondozott gyermekek
szma
155
Szakellt
kzpontban
gondozott gyermekek
szma
318
301
619
Mind
473
510
983
Csoportok rszarnya
0,48
0,52
209
64
364
Civil szervezet
mkdsi
terlete
175,15
297,85
Civil szervezet
ltal le nem
fedett terlet
12. tblzat
Megfigyelt esetszmok
Kezels1
Kezels2
Kezels3
Mind
Kezels1
Kezels2
Kezels3
Kedvez
kimenetel
41
21
104
166
35,38
33,20
97,42
Kedveztlen
kimenetel
24
40
75
139
29,62
27,80
81,58
Mind
65
61
179
305
65
61
179
Csoportok
rszarnya
0,21
0,20
0,59
188,85
321,15
Vrhat esetszmok
65
Biostatisztika
Biostatisztika
14. tblzat
Megfigyelt esetszmok
Vrhat esetszmok
Kezels-1
Kezels-3
Mind
Kezels-1
Kezels-3
Kedvez kimenetel
41
104
145
38,63
106,37
Kedveztlen
kimenetel
24
75
99
26,37
72,63
Mind
65
179
244
Csoportok
rszarnya
0,27
0,73
15. tblzat
Megfigyelt esetszmok
12. bra
13. tblzat
Megfigyelt esetszmok
Kezels-2
Kezels-3
Mind
Kezels-2
Kezels-3
Kedvez kimenetel
41
104
125
31,77
93,23
Kedveztlen
kimenetel
40
75
115
29,23
85,77
Mind
61
179
240
Csoportok
rszarnya
0,25
0,75
Vrhat esetszmok
Kezels-1
Kezels-2
Mind
Kezels-1
Kezels-2
Kedvez kimenetel
41
21
62
31,98
30,02
Kedveztlen
kimenetel
24
40
64
33,02
30,98
Mind
65
61
126
65,00
61,00
Csoportok
rszarnya
0,52
0,48
66
Vrhat esetszmok
67
Biostatisztika
Biostatisztika
A legegyszerbb helyzetet alapul vve (amikor kt csoportot s ktfle kategriba sorolt vizsglati eredmnyt elemznk), a prokat ngy csoportba sorolhatjuk: a pr
hasonl sttusz (mindkettnl kialakult a vizsglt hats: N++, vagy mindkettnl elmaradt a hats kifejldse: N ), eltr sttusz (az egyik csoporthoz tartoz tagban
kifejldtt a hats, a msik csoportba tartoznl nem: N+ , s fordtva: N +) lehet.
Ha a csoportkpz faktor befolysol szerept akarjuk rtkelni, akkor rdemi informcival azok a prok szolglnak, akiknl eltr volt a kivltott hats (N+ , N +).
Ha kt kategriban hasonl a prok szma, akkor nincs klnbsg a kt csoport kzt a
kivltott hats szempontjbl (mindkt csoport ugyanolyan gyakran adja a pozitv vlaszt produkl tagot). Ha viszont jelentsen eltr egymstl ez a kt elemszm, akkor
az egyik csoportba tartozk gyakrabban alaktanak ki pozitv vlaszt, jobban reaglnak
a befolysol tnyezre, mint a msik csoport tagjai. Emiatt az alapkrds megvlaszolshoz ennek a kt esetszmnak a klnbsgt kell rtkelni.
Az rtkels menete megfelel a fentebb mr tbb alaphelyzetben kvetett mintnak.
A kt esetszm ngyzetes klnbsgt viszonytjuk a vizsglat mrethez:
.
Az eredmny nagyobb, mint a 2[0,05;1] = 3,841 kritikus rtk. Az elsdleges benyomsokat igazolta a vizsglat. Valban szignifikns a kapcsolat az els munkafzis okozta
expozcik s az allergis betegsgek kifejldse kzt.
16. tblzat
Els fzisban dolgoz
Allergis betegsg +
Allergis betegsg +
48
Allergis betegsg +
Allergis betegsg
52
Allergis betegsg
Allergis betegsg +
32
Allergis betegsg
Allergis betegsg
80
.
A statisztikai eljrs neve McNemar-teszt. Mivel sszesen kt kategrit vizsgltunk, a szabadsgi fok 1 lesz. A vizsglatot itt is rdemes Yates-korrekci segtsgvel
jobban interpretlhatv tenni:
.
Egy zemben 424 alkalmazott dolgozik. A gyrts kt fzisban zajlik. Az elsben alkalmazott vegyszerek allergis reakcit okozhatnak. Megvizsgltk, hogy az els fzisban
dolgozk tnylegesen veszlyeztetettebbek-e. Az alkalmazottakat 212 prba sorsoltk
vletlenszeren, s rgztettk beosztsukat s allergis anamnzisket (16. tblzat).
Azt lttk, hogy gyakrabban fordul el, hogy az els fzisban dolgoz allergis, de a
msodik fzisban dolgoz prja nem, mint az, hogy a msodik fzisban dolgoz allergis, de az els fzisban dolgoz prja nem. Az eltrs vletlenszersgre McNemar-tesztet vgeztek:
68
69
Biostatisztika
Biostatisztika
nehz a vlemnynket megfogalmazni. Termszetes teht, hogy a kapcsolat erssgnek a lersra valamilyen kvantitatv paramtert kell hasznlni.
Kt paramter kapcsolt vltozkonysgt ugyanazzal a gondolatmenettel tudjuk
szmszersteni, amit egyetlen vltoz esetben alkalmaztunk. Egy vltoz (x) esetn
) krli variancia (V ), szrs
Nx mintanagysg mellett a variabilits lersa az tlag (x
x
(SDx) meghatrozst jelentette, ahol az tlagtl
val ngyzetes eltrsek sszege (Sx) volt a variabilits elemi mrszma:
Korrelci
A legegyszerbb krds, amelyet a fenti krdsek vizsglatakor meg kell vlaszolnunk,
hogy kt jelensg kztt van-e egyltaln kapcsolat, az egyik jelensg vltozsa maga
utn vonja-e a msik vltozst? Ilyen krds megvlaszolst clszer a lehet legegyszerbb mdon kezdeni: brzoljuk a megfigyelt adatprokat egy diagramon. A kt
tengelyen szerepelnek a vizsglt vltozk. gy minden vizsglati alanynak egy pont felel meg a koordintarendszerben. Az ilyen szrsdiagram sokszor knnyen rtkelhet
kapcsolatot tr fel, mert szemmel is jl rtkelhet pozitv vagy inverz kapcsolat olvashat le a szmprok elhelyezkedsbl. Termszetesen vals adatoknl csak trendet ltunk, az adatok soha nem illeszkednek egy egyenesre. A trendnek megfelel vonal krl
kisebb-nagyobb mrtkben szrdnak a tnylegesen mrt rtkek (13. bra).
ltalban a vizulis benyomsunk csak nagyon ers kapcsolat esetn nyjt megbzhat tmpontot. Gyakoribb eset, hogy ilyen mdon mg a trend irnyra vonatkozan is
70
,
.
Kt vltoz variabilitsnak kapcsoltsgt
kovariancival (Cxy) rhatjuk le. Ennek szrmaztatsa nem az egyik paramter tlagtl, hanem
mindkt paramter tlagtl indul el: azaz nem
x s nem
y krli elhelyezkedst, hanem a meg;
figyelt (x;y) rtkprok (x
y ) rtkprhoz viszonytott elhelyezkedst vizsgljuk. Ahhoz, hogy
;
az ppen rtkelt (x;y) pontba jussunk a (x
y)
pontbl, kt lpst kell megtennnk. Elszr
x-tengely mentn kell elmozdulnunk (x
x ) t
volsgra, utna y-tengely mentn (y y ) tvolsgra. [Ha a vizsglt x nagyobb, mint az
x , akkor az
(x
x ) pozitv eljel lesz, s pozitv irnyba kell
mozdulni. Ha a vizsglt x kisebb, akkor az (x
x)
negatv eljel lesz, s negatv irnyba kell mozdulni. Hasonlan rtelmezzk az y-tengely menti
mozgst is.] A kt tvolsg nvekedsvel egytt
jr a kt vizsglt pont kzti eltrs nvekedse. A
kt tvolsg szorzata pedig olyan rtk, ami sszessgben fejezi ki az adatpr tvolsgt a tipikus vizsglati alanytl. Ezek a tvolsgok minden
71
Biostatisztika
Biostatisztika
.
gy mr nem csak a kapcsolat irnyt, hanem
a szorossgt is jl ler mrszmhoz jutunk,
amit korrelcis koefficiensnek hvunk (r). Abban az esetben, ha emelked trendvonalat lttunk a szrsdiagramon, s az sszes adat ehhez
a trendvonalhoz illeszkedett, akkor a korrelcis
koefficiens rtke 1 lesz. Ilyenkor teljes pozitv
;
14. bra. Vizsglati eredmnyek tipikus (x
y ) pont
krli elrendezdse a trendvonalakkal
73
Biostatisztika
Biostatisztika
korrelcirl beszlnk. Ebben a helyzetben ugyanis az egyik paramter pontosan meghatrozza msik paramter rtkt (adott x-hez csak egy adott y tartzhat, s fordtva.)
Ha cskken trendvonalra illeszkednek tkletesen a vizsglati eredmnyek, akkor tkletes inverz korrelcirl beszlnk, amit a korrelcis koefficiens 1-es rtke jelez.
Ha a koefficiens rtke ppen nulla, akkor az illesztett trendvonal vzszintes, s ez jelzi
a kt vizsglt paramter tkletes fggetlensgt (akrmilyen rtket is vesz fel x, ahhoz
mindig ugyanaz a jellemz y-rtk fog hozztartozni; x vltozsa nem hozza magval y
mdosulst). Az interpretcis szablyok rtelmezshez ezek a szlssges helyzetek
hozzsegtenek, de vals mintkon soha nem tallkozunk velk. Emelked vagy cskken trendvonal krl tbb-kevsb szrd eredmnyeket ltunk a szrsdiagramon.
A korrelcis koefficiensek pedig valahol 0 s 1 kztt, illetve 0 s +1 kztt helyezkednek el. Minl szorosabb a korrelci, annl tvolabb kerl nulltl a korrelcis
koefficiens.
Annak eldntsre, hogy az adott korrelcis koefficiens eltrse a semleges nulltl
vletlennek tulajdonthat-e, vagy pedig annak, hogy a kt vltoz valban kapcsolatban van (szignifikns-e a trendvonal ltal sugallt ltszlagos kapcsolat), a korrelcis
koefficiens konfidencia-intervallumnak megadsval tudunk vlaszolni. A korrelcis
koefficiens nagysga ugyanis nmagban nem elg annak eldntsre, hogy van-e kapcsolat egyltaln a paramterek kzt. Egy biolgiai rendszerben ugyanazt a hatst tbb
befolysol tnyez is kpes elidzni. A klnbz faktorok klnbz hatkonysggal kpesek vltozst generlni. Ebben az rtelemben vannak gyenge s vannak ers
determinnsok. Az ers determinns esetben nulltl tvoli korrelcis koefficienseket kapunk, a gyenge determinnsoknl pedig a nullhoz kzelebb levt. Ugyanakkor
mindegyik tnylegesen faktor kapcsolatban van a kivltott hatssal.
A korrelcis koefficiens standard hibja (SEr) s 95%-os megbzhatsgi tartomnya MT95%;r, ahol (N-2) a szabadsgi fokot, t pedig a t-eloszls megfelel rtkt jelli:
17. tblzat
letkor, v (x)
(x x)
( y y)
( x x )( y y )
53
170
12
31,6
379,2
54
143
11
4,6
50,6
54
89
11
49,4
543,4
55
138
10
0,4
57
113
25,4
203,2
59
98
40,4
242,4
61
126
12,4
49,6
63
160
21,6
43,2
65
175
36,6
65
133
5,4
68
95
43,4
130,2
68
208
69,6
208,8
68
114
24,4
73,2
69
112
26,4
105,6
70
170
31,6
158
70
171
32,6
163
72
131
7,4
51,8
72
116
22,4
156,8
77
189
12
50,6
607,2
80
117
15
21,4
321
Ez a megbzhatsgi tartomny tartalmazza 95%-os valsznsggel azt a korrelcis koefficienst, ami pontosan lerja a kt paramter kzti kapcsolat erssgt. Ha
ez az intervallum teljes egszben pozitv tartomnyban van, akkor minden valszn
korrelcis koefficiens pozitvnak mutatja a vltozk viszonyt, vagyis szignifikns-
74
75
Biostatisztika
Biostatisztika
.
A 95%-os megbzhatsgi tartomny azonban tartalmazta a nullt, ezrt a trendet nem
lehet az letkor s a szisztols vrnyoms kzti kapcsolat bizonytkaknt rtelmezni.
Tblzatot hasznlva, a 18-as szabadsgi fokhoz s az 5%-os dntsi kszbhz a
kritikus rtk 0,444. Ennl kisebb koefficienst szmtottunk az eredmnyeinkre, ezrt
nem tekintjk elg meggyznek a vizsglatot annak bizonytsra, hogy az letkorral
emelkedik a vesebetegek szisztols vrnyomsa, hiba volt ez a benyomsunk a szrsdiagram tanulmnyozsakor.
Lineris regresszi
A korrelcis koefficiens szrmaztatshoz kiindulpontknt hasznlt szrsdiagram
trendjnek meredeksge szmszersti, hogy az x egysgnyi vltozsa mekkora y vltozst von maga utn. Tl azon, hogy ennek a meredeksgnek a vizsglatval is vlaszolni
tudunk arra a krdsre, hogy a kt vizsglt vltoz kapcsolatban van-e, a regresszis egyenes arra is felhasznlhat, hogy egy tetszleges x rtkhez tartoz y rtket megadjunk
anlkl, hogy azt megmrnnk. Az ilyen predikcinak nagy jelentsge van pldul olyan
esetekben, amikor egy viszonylag knnyen mrhet paramter szoros kapcsolatban van
egy nehezen mrhetvel. Ilyenkor a vizsglati szakaszban kell csak prhuzamosan mrni
mindkt paramtert, aztn a vizsglat vgeredmnyeknt kapott regresszis egyenletet
hasznlva mr elg lesz csak az x-et mrni, s az y-t csak szmolni kell.
Az x-tengelyen brzolt paramtert regresszis elemzs esetn magyarz vltoznak, illetve fggetlen vltoznak nevezzk, megklnbztetve az y-tengelyen brzolt
fgg vltoztl. Ennek oka, hogy a regresszis elemzs sorn a paramterek kzti
kapcsolatnak irnya van. Nem azt vizsgljuk, hogy kt vltoz milyen kapcsolatban
van egymssal, hanem azt, hogy az egyik (magyarz, fggetlen) vltoz miknt befolysolja a msik (fgg) vltoz rtkt. A kapcsolat irnyt a vizsglt paramterek
kzti kapcsolat felttelezett mechanizmusa alapjn hatrozhatjuk meg. Ha az letkor
s a csontok kalciumtartalma kzti kapcsolatot korrelcis elemzssel vizsgljuk, akkor azokat a krdseket tudjuk megvlaszolni, hogy van-e kapcsolat a kt paramter
kzt, pozitv vagy negatv a kapcsolat irnya, milyen szoros a paramterek kzti kapcsolat. Utbbi alatt azt rtjk, hogy milyen mrtkben hatrozza meg az letkor a kalciumtartalmat, vagy milyen kapcsolatban van a csontok kalciumtartalma az letkorral.
Szmszeren ugyanaz a korrelcis koefficiens adja meg a vlaszt mindkt krdsre. Ha
ugyanezt a kapcsolatot lineris regresszis elemzssel prbljuk rtkelni, akkor nem
77
Biostatisztika
Biostatisztika
mindegy, hogy milyen irny kapcsolatot tesztelnk. Mert az illesztett trendvonal meredeksge nem ugyanaz akkor, ha az letkor a magyarz vltoz, s ezt brzoljuk a
x-tengelyen, vagy ha a csontok kalciumtartalmt tekintjk magyarz tnyeznek. (Termszetesen az utbbi krdsfelvets megalapozatlan, s csak az elbbinek van rtelme.)
Az x fggetlen vltoz s y fgg vltoz kzti kapcsolatot szemlltet szrsdiagram pontjaira illesztett trendet ler egyenes (regresszis egyenes) egyenlete:
79
Biostatisztika
Biostatisztika
,
,
.
Ezt kveten mr csak arra kell vlaszolnunk, hogy a trend, a kt vltoz kztti
kapcsolat magyarzhat-e a vletlennel vagy nem. (A semleges viszonyt ler nulltl
szignifiknsan eltr-e a megfigyelt meredeksg?)
Varianciaelemzssel tudunk vlaszolni a krdsre. Kvetnnk kell azt az utat, amit
;
a tipikus (x
y ) vizsglati alanytl indulva a tnyleges eredmny (x; y) rtkprjig bejrunk (18. bra).
Az t els szakasza a regresszis egyenes mentn az (x; yR) pontig tart.
Az tnak megfelelen, els lpsknt a fgg vltoz variabilitst kt rszre osztjuk. Meghatrozzuk azt a rszt, amit a regresszis sszefggssel meg tudunk magyarzni, vagyis azt a vltozkonysgot, amit a magyarz vltoztl val fggse idz
el. Ennek s a teljes variancinak a klnbsgeknt pedig megadhatjuk a regresszis
kapcsolattal nem magyarzhat variabilitst. A variabilits felosztst legegyszerbben
a ngyzetes eltrsek sszegeinek (SS) segtsgvel tudjuk rtelmezni. A fgg vltoz
teljes variabilitsa (SSy) s a regresszival magyarzhat variabilits (SSR) ezek alapjn:
,
.
A variabilitsnak az a rsze (SSE), ami pedig nem magyarzhat a regresszival (a
kt vltoz kztti kapcsolattal):
.
A msodik szakasz az x helyen, a trendvonal ltal jelzett tipikus yR ponttl tart fgglegesen pozitv vagy negatv irnyba a vizsglat (x; y) eredmnyig. Az y-tengely vetletben nzve a mozgs kt szakasza is szmszersthet (minden vizsglati alanyra,
azaz minden x rtkre):
.
18. bra. A lineris regresszival magyarzhat (3,03 3,29) s nem magyarzhat (3,29 3,9)
variabilits szrmaztatsa
80
A teljes variabilits regresszival magyarzhat s azzal nem magyarzhat rszeinek arnya mutatja meg szmunkra, hogy lnyeges befolyssal van-e a magyarz vltoz a fgg vltoz alakulsra. (Ha van befolysa, akkor a trend nem ltszlagos. Ebben az esetben az egyes vizsglati eredmnyek rtkt elg nagymrtkben a magyarz
vltoz hatrozza meg, s a regresszis hatsra kialakul rtk csak tovbb varildik,
a vizsglatban nem rtkelt egyb tnyezk hatsra. A trend csak ltszlagos, ha nincs
lnyeges hatsa a magyarz vltoznak. Ilyen esetben a fgg vltoz teljes variancijnak tlnyom rsze fggetlen lesz a regresszis kapcsolattl, a vizsglati eredmnyek
alapveten olyan tnyezk miatti szrdst mutatnak, amit nem a magyarz vltoz,
hanem ms, a vizsglatban nem rtkelt faktorok hoznak ltre.)
A ngyzetes eltrsek sszegei alapjn a variancik szmthatk (18. tblzat). A
szabadsgi fokok az egyes komponensekhez a kvetkezk: regresszis sszefggssel
magyarzott variancira 1; teljes variancia szabadsgi foka (N-1), a nem magyarzott
rsz szabadsgi foka (N-2). gy a regresszival magyarzhat (VR) s nem magyarzhat
variancia (VE):
81
Biostatisztika
Biostatisztika
18. tblzat
Variabilits forrsa
Variabilits (ngyzetes
eltrsek sszege, SS)
Szabadsgi
fokok
Variancia (tlagos
ngyzetes eltrs)
Variancia
hnyados (F)
Regresszis
kapcsolattal
magyarzhat (R)
Regresszis
kapcsolattal nem
magyarzhat (E)
Teljes (y)
talmazza a nullt, azaz teljes egszben vagy negatv, vagy pozitv tartomnyban helyezkedik el, akkor a diagram trendje valdi, irnynak megfelel mdon valban kapcsolat van a vizsglt paramterek kzt.
Miutn elvgeztk a megfigyelseinket, a regresszis egyenlet segtsgvel a magyarz vltoz tetszleges xp rtkhez szmthatjuk a vrhat fgg vltoz rtket,
pontosabban egy legvalsznbb yp vrhat rtket:
ahol a az elsfaj hibt, t pedig a t-eloszls a s N-2 szabadsgi foknak megfelel rtkt jelli, s ahol a koefficiens standard hibja SEb:
A megbzhatsgi tartomny rtkelshez ugyanazokat a szempontokat kell figyelembe venni, amiket a korrelcis koefficienseknl mr emltettnk. Ha az 5%-os
megbzhatsgi tartomny tartalmazza a nullt, azaz egyik rsze negatv, msik pozitv
tartomnyban van, akkor a vizsglati eredmnyeink alapjn nem zrhatjuk ki, hogy a
valdi regresszis koefficiens (ami tnylegesen lerja a magyarz s a fgg vltoz
kzti kapcsolat jellegt) negatv szm (ami szerint a magyarz vltoz nvekedse a
fgg vltoz cskkenst vonja maga utn), vagy pozitv szm (ami szerint a magyarz vltoz nvekedse a fgg vltoz nvekedsvel jr egytt), vagy nulla (ami
szerint a magyarz vltoz hatsra nem vltozik a fgg vltoz). Akrmilyen is volt
a szrsdiagramon a trend, ilyen eredmny birtokban nem llthatjuk, hogy valban
kapcsolat van a kt paramter kztt. Ha viszont a megbzhatsgi tartomny nem tar-
82
83
Biostatisztika
Biostatisztika
Ezeket a hibkat figyelembe vve adhat meg a jsolt rtk, amihez a paramterek
becslst biztost minta tlagos magyarz rtktl tvolodva, fokozatosan romlik a
megbzhatsga, ami a jsolt rtkhez kapcsold, fokozatosan bvl, 95%-os megbzhatsgi tartomnyokban tkrzdik:
Egy 13 fs labdarg csapatnl rtkelik a tavaszi szezonban vgzett munkt. Tbbek kztt elemzik, hogy a teljestett edzsek szma milyen kapcsolatban volt egy fittsgi teszten elrt pontszmmal. Az tlagos edzsszm 32,69 (SD = 4,64), az tlagos
fittsgi teljestmny 142,78 (SD = 30,49) pont volt (19. tblzat).
A lineris trendvonal paramtereit szmtottk (19. bra).
A kovariancia 98,84 volt. Meghatroztk a trend szignifikancijt.
.
Jsolt rtket csak a paramterek megllaptsra hasznlt minta magyarz rtkeinek tartomnyban lehet szmtani. Az eredeti tartomnyon kvlre extrapollni nagyon
kockzatos. Egyltaln nem biztos, hogy a vizsglt tartomnyon kvl ugyanolyan a paramterek kzti kapcsolat, mint a vizsglt tartomnyon bell. (Szmos plda van arra,
hogy klnbz dzistartomnyokban ugyanaz a hats ms intenzitssal idz el biolgiai vlaszokat.) St, az is elfordulhat, hogy a vizsglt tartomnyon kvl rtelmetlen
mr maga a magyarz vltoz is. (Ha a testmagassg s a testsly kzti kapcsolatot
vizsgljuk, akkor szignifikns trendet ltunk. De a matematikai lehetsg ellenre nyilvnvalan rtelmetlen a 10 m magas emberek vrhat testtmegt szmtani.)
19. tblzat
Edzsek szma (x)
(x x)
( y y)
( x x )( y y )
27
122
5,69
20,77
118,22
30
155
2,69
12,23
32,93
39
192
6,31
49,23
310,53
38
186
5,31
43,23
229,46
27
114
5,69
28,77
163,76
28
120
4,69
22,77
106,84
39
147
6,31
4,23
26,69
27
120
5,69
22,77
129,61
33
118
0,31
24,77
7,62
31
120
1,69
22,77
38,53
36
168
3,31
25,23
83,46
35
183
2,31
40,23
35
111
2,31
31,77
84
19. bra. Lineris regresszis kapcsolat az edzsek szma s a fittsgi teszten elrt teljestmny
kztt
20. tblzat
Variabilits (ngyzetes
eltrsek sszege)
Szabadsgi
fokok
Variancia (tlagos
ngyzetes eltrs)
Variancia
hnyados
Regresszis kapcsolattal
magyarzhat
5436,42
5436,42
10,46
92,84
Regresszis kapcsolattal
nem magyarzhat
5715,89
11
519,62
73,31
Teljes
11 152,3
12
Variabilits forrsa
85
Biostatisztika
Biostatisztika
21. tblzat
Sportol neve
Edzsek szma
TH
29
126
(73; 179)
ZV
34
149
(97; 201)
ESz
37
163
(109; 216)
Determincis koefficiens
A trend valdisgnak vagy ltszlagos termszetnek rtkelsekor hasznlt varianciaelemzs alkalmval definiltuk a teljes variabilits lershoz SSy-t, melynek regresszival magyarzhat rsze SSR volt. Az SSR/SSy hnyadossal tudjuk lerni, hogy az y
fgg vltoz teljes variancijnak hnyadrszt kpes megmagyarzni az x magyarz
vltoz a kztk lv kapcsolat kvetkeztben, ezrt ezt definiljuk determincis koefficiensknt. (Az SSE /SSy hnyados pedig a magyarz vltoztl fggetlen hnyadt
adja a teljes fgg vltoz variabilitsnak.) Az SSR /SSy hnyados a korrelcis koefficiens ngyzetvel egyenl:
.
A sportolk adatainak elemzsekor azt talltk, hogy a fittsgi index 49%-ban az edzseken val rszvtel gyakorisgval magyarzhat:
.
Ezzel a megkzeltssel mindaddig semmi gondunk nem is lesz, amg az egyes magyarz vltozk egymstl fggetlenek. Amikor viszont ezek egymssal is kapcsolatban
vannak (nagyon gyakran ez a helyzet), akkor az adott fggetlen vltozkra szmtott
regresszis koefficiens nem csak az adott magyarz vltoz sajt hatst fogja tartalmazni, hanem az egyb determinnsok rajta keresztl kifejtett hatsait is. Ilyen esetben
a standardizls helyett olyan eljrsra van szksgnk, amely a determinnsok nll
hatst szmszersti. (Ez az eljrs a tbbvltozs lineris regresszis elemzs.)
.
86
87
Biostatisztika
Biostatisztika
Eljelteszt
Kritikus rtknl nagyobb teszteredmny arra utal, hogy jelents az eltrs a javul s roml llapot betegek szma kztt. Szmtgp segtsgvel pedig meg tudjuk
hatrozni, hogy 1-es szabadsgi fok esetn a szmtott 2 milyen dntsi kszb esetn
felel meg a kritikus rtknek (azaz kiszmthatjuk a p-rtket).
12 beteget kezelnek, s egy letminsg-skln mrik a kezels hatst (22. tblzat). A kezels eltti s utni rtkek nem normlis eloszlsak. 8 beteg javulsrl,
4 pedig az letminsge romlsrl szmolt be. A szmtott 2 kisebb, mint a kritikus
.
Nem rtkelhetjk a vizsglati eredmnyt gy, hogy a beavatkozs javtja a betegek
letminsgt, s a vizsglati eredmny nem ad alapot arra, hogy a vizsglt eljrst alkalmazzk.
Ha prba rendezett kvantitatv adataink vannak, melyek kezels eltti s utni llapotot,
vagy zavar tnyezk szempontjbl hasonl kt szemly reakciit vizsgljk, melyekre nem teljesl a normalits felttele, akkor legegyszerbb, ha a prokon bell az adatok
klnbsgnek irnyt elemezzk.
Ha pldul a kezels eltt (H) s a kezels utn (U) megfigyelt adatprokat nzzk,
akkor megllapthatjuk a kezels hatsra javul (NU), illetve roml (NE) llapot betegek szmt. Termszetesen lehetnek betegek, akik nem szmolnak be vltozsrl ket
a mostani elemzsben figyelmen kvl is hagyjuk!
Amennyiben a kezels valjban nem befolysolta a beteg llapott, akkor a javul
s roml llapot betegek szma hasonl lesz. Ha a kezels javtja a kimenetelt, akkor
Az eljelteszt inkbb didaktikai szempontbl rdekes. Egyszersge, ami a szmtsi igny s az eredmny (2) rtelmezse szempontjbl is egyrtelm, bartsgoss
teszi a mdszert. Gyakorlati alkalmazsra ma mr csak ritkn kerl sor. Ennek oka,
88
89
Biostatisztika
Biostatisztika
A prba rendezett, nem normlis eloszls kvantitatv adatok rtkelsekor alkalmazhat eljrs a Wilcoxon prostott teszt, ami a prok kzti eltrsnek nem csak az irnyt
veszi figyelembe, hanem a prok kzt meglev klnbsg nagysgt is. Mivel a vizsglati eredmnyek nem normlis eloszlsak, ezrt a megfigyelt adatok kzti klnbsg
nagysga helyett (amely t-prba esetn volna a statisztikai szmts kiindulsi pontja)
azok egymshoz viszonytott sorrendjt (rangjt) hasznljuk. Ennl a pontnl nyilvn-
90
91
22. tblzat
Beavatkozs eltti indiktor
(E)
Vltozs mrtke
(UE)
Vtozs eljele
2,11
3,68
1,57
2,12
3,63
1,51
2,14
4,05
1,91
2,83
3,56
0,73
2,85
2,38
0,47
3,40
3,21
0,19
3,88
3,35
0,53
6,66
5,95
0,71
6,87
9,08
2,21
7,96
10,17
2,21
8,75
20,63
11,88
13,95
16,45
2,50
hogy a teszt egyltaln nem veszi figyelembe, hogy milyen nagyok voltak azok a klnbsgek, amelyek alapjn a prokon belli klnbsgek irnyt meghatroztuk. Nyilvnvalan komoly informci vsz el ezzel a megoldssal. Radsul olyan informci,
amelyet az adatgyjts sorn egyszer mr megszereztnk. A vizsglatok statisztikai tmogatsa pedig nem szlhat az ltalnos vizsglati hatkonysg cskkentsrl. A mai
szmtstechnikai felttelek mellett pedig a szmts egyszersge s a vgeredmny
rtelmezsnek egyszersge nem lehet szempont a mdszerek megvlasztsakor.
Biostatisztika
Biostatisztika
23. tblzat
Beavatkozs
eltti rtk
(E)
Beavatkozs
utni rtk
(U)
Vltozs
mrtke
(UE)
Vltozs
eljele
Vltozs
abszolt
rtke |UE|
Rangszm
Eljeles
rangszm
Pozitv
eltrsek
rangszmai
Negatv
eltrsek
rangszmai
2,11
3,68
1,57
+1
1,57
2,12
3,63
1,51
+1
1,51
2,14
4,05
1,91
+1
1,91
2,83
3,56
0,73
+1
0,73
2,85
2,38
0,47
0,47
3,4
3,21
0,19
0,19
3,88
3,35
0,53
0,53
6,66
5,95
0,71
0,71
6,87
9,08
2,21
+1
2,21
9,5
9,5
9,5
7,96
10,17
2,21
+1
2,21
9,5
9,5
9,5
8,75
20,63
11,88
+1
11,88
12
12
12
13,95
16,45
2,5
+1
2,5
11
11
11
kevs klnbsg lesz (ritkn fordul el, hogy az ltalban hatsos kezels alkalmazsa
utn egyes betegek llapota romlik), abszolt rtkt tekintve kicsi rangszmsszeget
eredmnyez. Minl kisebb ez a kisebbik rangszmsszeg, annl biztosabbak lehetnk
a csoportok kzti eltrs szignifikancijban. A kritikus rtkeket tblzatokbl tudjuk
megkeresni (http://www.sussex.ac.uk/Users/grahamh/RM1web/WilcoxonTable2005.
pdf), vagy szmtgp segtsgvel tudjuk szmtani.
Az eljelteszt pldjnak adatait felhasznlva a pozitv rangszmok sszege 68, a
negatv rangszmok 10. sszesen 12 adatprt vizsgltunk. A kritikus rtk 12 adatprnl s 5%-os dntsi kszbnl 14. A klnbsg teht elg nagy a kt csoport kzt
ahhoz, hogy meggyzzn minket arrl, hogy a beavatkozs hatsos volt (23. tblzat).
MannWhitney U-teszt
Abban az esetben, ha kt fggetlen csoport folytonos vltozinak klnbsgt szeretnnk rtkelni, de az adatok nem normlis eloszlsak, vagy a csoportokon belli variabilits jelentsen eltr, akkor az adataink eloszlsra az tlagrtk s a szrs nem
hasznlhat. Helyette a medin segtsgvel tudjuk lerni az adatok centrlis rtkt, s
92
Biostatisztika
Biostatisztika
KruskalWallis H-teszt
Amennyiben kettnl tbb csoportba rendezett kvantitatv adatainak elemzsvel szeretnnk egy befolysol tnyez hatsra vonatkozan megllaptst tenni, de az adatok
nem normlis eloszlsak, s emiatt az egyszempontos varianciaelemzs nem hasznlhat, akkor a nem paramteres alternatvt a KruskalWallis H-teszt jelenti. Az eloszls
mdjra tekintet nlkl az egyes mrsi eredmnyek sorba rendezse rvn nyert rangsor segtsgvel rtkelhetjk a csoportok kzti eltrst. Az eredmnyek kzti tnyleges klnbsg nagysgra vonatkoz informcit emiatt elvesztjk, de ilyen mdon
elkerljk az a csapdt, amit az alkalmazsi felttelek teljeslse nlkl alkalmazott
paramteres eljrs alkalmazsa sorn nyert eredmnyek lltanak! Sokszor ez a nem
paramteres teszt jelenti a leghatkonyabb megoldst.
A vizsglat nullhipotzise, hogy a vizsglati csoportok ugyanabbl a populcibl
szrmaznak, nincs kztk a vizsglt jelleg szempontjbl lnyeges klnbsg. (Nem a
94
24. tblzat
Csoport
Eredmny
Rang
Rangszmsszeg-A
6,09
6,41
6,43
6,60
6,63
6,77
6,79
6,91
Rangszmsszeg-B
7,08
7,10
10
10
7,12
11
11
7,33
12
12
7,42
13
13
7,44
14
14
7,70
15
15
7,71
16
16
7,72
17
7,80
18
18
17
7,94
19
19
8,19
20
20
8,37
21
21
8,43
22
22
8,67
23
23
9,07
24
24
9,08
25
25
9,16
26
26
9,17
27
27
9,20
28
28
9,46
29
29
9,53
30
30
9,62
31
31
9,62
32
32
9,73
33
33
9,74
34
34
9,91
35
35
95
Biostatisztika
Biostatisztika
.
A kplet szemlletes rtelmezse taln nem a legegyszerbb feladat, de azrt arra
fel kell hvni a figyelmet, hogy az egyes csoportok ltszmhoz viszonytott ngyzetes
rangszmsszegek hatrozzk meg adott vizsglatnagysg mellett a statisztikai mrszm rtkt. Ha felttelezzk, hogy minden rszcsoport egyforma, akkor knny beltni, hogy a
kifejezs akkor minimlis, ha a rangszmsszegek egyformk, azaz, ha teljesen vletlenszeren oszlanak meg az egyes mrsi eredmnyek az egyestett adathalmaz rangsorban. Minl egyenetlenebb a csoportonknti adatok eloszlsa az egyestett rangsorban, annl nagyobb az eltrs a csoportonknti rangszmsszegekben, s ez a ngyzetre
emels miatt sszessgben a kifejezs rtknek az emelkedst vonja maga utn. Ha
kellen nagy a szmtott H, akkor a klnbsget mr nem magyarzhatja vletlen.
Ha 3 csoportba soroltuk az adatainkat (A, B, C), s mindegyik csoport ugyanakkora
(NA = NB = NC = n), akkor az emltett kifejezs egyszersdik:
.
Jl lthat, hogy minl egyenetlenebb a csoportok egyestett rangsoron belli helyzete, s ennek kvetkeztben minl jobban eltr a csoportok rangszmsszege egymstl (minl nagyobb x rtke), annl nagyobb lesz az egyes csoportok rangszmsszeg
ngyzeteinek sszege.
sszessgben a nagyobb H-rtk szl a csoportok kzti klnbsgek mellett. Az
rtkelshez hasznlhat kszbrtk a csoportok szmnl eggyel kisebb szabadsgi fok 2-tel kell pontossggal megadhat (ha minden csoportban legalbb 5 volt a
vizsglt elemek szma). Kisebb elemszmoknl rszben tblzatok (http://www.watpon.com/table/kruskalwallis.pdf), rszben a statisztikai szoftverek segtsgvel tudunk
statisztikai kvetkeztetst levonni.
Ezt a kpletet addig lehet hasznlni, amg a rangszmok kiosztsakor nem tallunk
egyenl eredmnyeket. Ilyenkor a rangszmok tlagt kell az egyes adatok rangszmaknt kpezni (ami ezrt lehet trtrtk is!) Az ilyen mdon kapcsolt rangszmok miatt
azonban a H-rtket is korriglni kell. Ha egy rtk t esetben fordul el, akkor a K korrekcis tag
.
Ha a csoportok kzt nincs klnbsg, s az eredmnyek vletlenszeren oszlanak el
az egyestett rangsorban, akkor az azonos elemszm csoportok mindegyikben ugyanannyi lesz a rangszmok sszege (TA = TB = TC = T). A kifejezs tovbb egyszersthet:
mdon szmthat. Minden kapcsolt rangszmra kln ki kell szmtani ezeket a korrekcis tagokat. A korriglt HK ezek utn mr szmthat:
.
.
Ha a csoportok kztt van szignifikns eltrs, akkor a rangszmok sszege nem vltozik, de egyes csoportok rangszmsszege cskken, a msik csoport pedig nvekszik.
96
97
Biostatisztika
Biostatisztika
lesz.
26. tblzat
Csoport
Eredmny (ms)
Rang
RangA
RangB
RangC
42,4
49,6
52
53,5
58,5
60,3
63,5
66,4
68
70,7
10
10
71,1
11,5
11,5
71,1
11,5
11,5
75,4
13
13
75,8
14
14
76,3
15
15
77,2
16
16
84
17
17
60,3
70,7
93,4
71,1
95,3
75,8
52
93,4
109
42,4
58,5
90,7
86,8
18
18
49,6
77,2
99,5
89,9
19
19
63,5
76,3
84
90,7
20
20
53,5
71,1
97,4
92,8
21
21
93,4
89,9
68
93,4
23
23
117,2
86,8
92,8
93,4
23
23
75,4
66,4
105,4
93,4
23
23
95,3
25
25
97,4
26
26
99,5
27
27
98
105,4
28
28
109
29
29
117,2
30
30
99
Biostatisztika
Biostatisztika
A korrekcis tag a kt 11,5 ms-os (t1 = 2) s a hrom 93,4 ms-os (t2 = 3) kapcsolt
rang miatt:
A korriglt HK pedig:
.
Mivel a csoportok szma 3 volt, a 2-es szabadsgi fok 2 = 5,991 a kritikus rtke a teszt eredmnynek. A teszt-statisztika rtke nagyobb, mint a kritikus rtk, azaz
a csoportok kzti rangeloszls vletlennel nem magyarzhat, a zajnak van hatsa a
reakciidre.
Spearman-rangkorrelci
Folytonos vltozk kzti kapcsolat erssgnek vizsglatra alapveten a korrelcis
egytthatk szmtst hasznljuk. Ha a paramteres prbk alkalmazsra az adatok
normalitsnak hinya miatt nincs lehetsg (a Pearson korrelcis koefficiens szmtsa nem vgezhet el), akkor az eredeti fgg s fggetlen vltozk helyett azok rangsort rtkel rangkorrelcis mdszereket kell hasznlnunk. Legelterjedtebb a Spearman
rangkorrelcis egytthat () meghatrozsa.
A rangkorrelci rtkelsekor egyszeren a legkisebbtl a legnagyobb fel haladva
kln-kln rangszmot adunk mind a fggetlen, mind a fgg vltoz rtkeinek. Az
ilyen mdon kapott rangszmok kzti korrelcit mr ugyangy vgezzk el, mint a
Pearson korrelcis koefficiens szmtsakor. Legalbbis elvileg.
A tnyleges adatok helyett hasznlt rangokkal sok informcit vesztnk, leegyszerstjk a vizsglati helyzetet. Ez baj abbl a szempontbl, hogy romlik a vizsglatunk
hatkonysga, de j abbl a szempontbl, hogy egyszersthet a szmts menete. (A
szmtgpek segtsgvel vgzett elemzseknl ez persze nem valdi elny!) Ha az
100
.
Ez a koefficiens is 1 s +1 kzti rtket vehet fel. Teljesen fggetlen paramterek
esetn 0 az rtke. Interpretcis szablyai megegyeznek a Pearson korrelcis koefficiens rtkelsnl ismertetettel. Ugyanazt a tblzatot is lehet hasznlni a kritikus rtk
megllaptsra. Ha abszolt rtke nagyobb, mint a kritikus rtk, akkor rtkeljk
a kt vltoz kzti kapcsolatot szignifiknsnak, s minl nagyobb ez az abszolt rtk,
annl ersebb a kapcsolat. Pozitv koefficiens esetn a kt rangsor kzt kzvetlen, negatv eljel esetn fordtott kapcsolat van.
Abban az esetben, ha a vltozk sorba rendezsekor azonos rtkeket tallunk, akkor
kapcsolt rangszmok kiosztsra kerl sor, s a szmts menete is sszetettebb vlik.
Ha egy rtk t esetben fordul el, akkor a K korrekcis tag
mdon szmthat. Minden kapcsolt rangszmra kln ki kell szmtani ezeket a korrekcis tagokat, s kln a fggetlen (x) s fgg vltozra (y) is sszegezni kell (K x ,
K y ). A korriglt koefficiens (aminek rtelmezsi szablyai a korriglatlan mutatval
megegyeznek) ezek utn szmthat:
101
Biostatisztika
Biostatisztika
Tbbvltozs elemzsek
27. tblzat
Gondozs
tartama (T)
Diasztols
vrnyoms (V)
RangT
RangV
Rangklnbsg
(d)
Rangklnbsg
ngyzet (d2)
17
88
18
90
14
92
19
98
5,5
1,5
2,25
16
104
5,5
3,5
12,25
21
104
10
5,5
4,5
20,25
25
106
13
36
26
107
14
36
20
111
9,5
1,5
2,25
23
111
12
9,5
2,5
6,25
19
114
5,5
11
5,5
30,25
20
119
12
16
28
120
15
13
22
123
11
14
20
130
15
49
.
A tblzat alapjn 0,482 az ehhez az elemszmhoz tartoz kritikus rtk. Mivel ennl
nagyobb eredmnyre vezetett az elemzs, a vletlennel nem magyarzhat kapcsolatra
tallt bizonytkot a hziorvos. Megllaptotta, hogy minl hosszabb a gondozsban eltlttt id, annl magasabb a betegei diasztols vrnyomsa.
102
20. bra. Kzvetlen s kzvetett kapcsolat a magyarz vltoz s a fgg vltoz kztt
103
Biostatisztika
fizikai kapcsolat nincs, s x vltozsa nem befolysolja y rtkt. Ha a kt faktorra ellenttesen hat f , akkor azok inverz korrelcit fognak mutatni. Gygyszerek tmadspontjnak meghatrozsakor nyilvnvalan nem mindegy, melyik kapcsolatrendszer ll
az x y kapcsolat htterben. Az els modellnl x-en hat gygyszer hatsos lehet,
a msodik modellben biztosan hatstalan lenne. A kt helyzet megklnbztetse ezrt
elengedhetetlen.
Megoldhat a feladat olyan statisztikai eszkzkkel, amelyek nem csak x-re s y-ra,
hanem f -re gyjttt adatokat is egy elemzsen bell rtkelik. Ha tbb befolysol tnyez hatst rtkeljk egyszerre, akkor tbbvltozs statisztikai eljrsrl beszlnk.
A korbbi fejezetekben bemutatott tesztek mind egyvltozs eljrsok voltak; egy befolysol tnyez kapcsolatt vizsgltk a fgg vltozval. A tbbvltozs elemzseknek az a clja, hogy x-nek y-ra kifejtett hatst f hatstl fggetlenl szmszerstse.
Elvileg a legegyszerbb mdja annak, hogy f zavar hatstl vdjk a vizsglatunkat, ha olyan mdon vlogatjuk megfigyelsen alapul vizsglatainkhoz a mintt, hogy
az f faktorral rendelkezk ne kerljenek a vizsglatba. Vagy ennek analgijra, olyan
ksrleti krlmnyeket teremtnk, amikor az f nincs jelen. Ezeknl a mdszereknl
nem is gyjtnk adatot f -re.
Az egyvltozs statisztikai tesztek kzt tbb is van, amit prostott adatok elemzsre fejlesztettek ki. nkontrollos elemzsekben adott, hogy aki a beavatkozs eltt rendelkezett f faktorral, az utna is. A x y kapcsolatot rtkel teszt eredmnyt nem
befolysolhatja f . Ha fggetlen mintkat illesztnk egymshoz, akkor mindazoknak a
faktoroknak a hatstl megtiszttjuk a vizsglatot, amiket a prok sszekapcsolsakor
figyelembe vettnk. (A pontossg kedvrt megjegyzend, hogy ezeknek felttele, hogy
x s f kzt ne legyen interakci, x hatsa f -tl fggetlen legyen.)
Ktszempontos varianciaelemzs
Az egyszempontos varianciaelemzs is kiterjeszthet tbb befolysol tnyez egyttes vizsglatra. Legegyszerbb eljrs a ktszempont varianciaelemzs ismtls nlkl. Ezt olyan esetben hasznlhatjuk, ha a ksrletet kt (kategorizlt vltozknt rtkelhet) befolysol tnyez hatsnak egyttes elemzsre szeretnnk felhasznlni.
Az ismtlsnlklisg arra utal, hogy a kt kategorizlt befolysol tnyez lehetsges
kombinciinak egy-egy vizsglati alanyt tesznk ki. A ksrlet vgn a 28. tblzat
mintjra tudjuk a mrsi eredmnyeinket sszefoglalni.
104
Biostatisztika
28. tblzat
x magyarz vltoz
x1
f1
f faktor
x2
xn
y11
f2
..
.
y22
yxf
fm
x tlagok
x1
x2
f tlagok
f1
f2
ynm
fm
xn
Az x magyarz tnyezt n-fle, az f-et m-fle dzisban alkalmaztuk. Minden lehetsges befolysol tnyez kombincihoz egy yxf vizsglati eredmnyt kaptunk a
vizsglat sorn. Az egyes x n dzisokhoz kapcsold tlagos eredmnyek (xn ) kzti klnbsg azt fogja megmutatni, hogy milyen mrtkben befolysolja x a fgg vltoz
Biostatisztika
Biostatisztika
csold variabilits ezrt az elemszmot (amit f faktor dzisainak szma hatroz meg)
is tekintetbe vev ngyzetes eltrssszeg az albbi lesz:
rtket is meg tudunk hatrozni. (A lpsekhez tartoz rszletesebb magyarzat a korbban ismertetett egyszempontos varianciaelemzs lersnl tallhat.)
Ha Fx nagyobb, mint amit mg vletlen hatssal magyarzni tudunk, akkor az x magyarz vltoz s az y fgg vltoz kzt kapcsolatot tudtunk kimutatni. Ugyangy
rtkeljk az f faktort is. (A ktszempontos, ismtls nlkli varianciaelemzsnek alkalmazsi felttele az adatok normlis eloszlsn tlmenen, hogy ne legyen interakci a
kt befolysol tnyez kztt.)
Kt gygyszer kombincijnak hatkonysgt szeretnk meghatrozni. Ennek rdekben egy in vitro ksrleti modellben 4-4 dzist alkalmaznak mindegyikbl. A ksrletek sorn egy reaktv metabolit mennyisgt mrik. Az eredmnyt a 30. tblzat
foglalja ssze.
F kritikus rtke mindkt vizsglt gygyszer esetn F[0,05;3;9] = 3,863, aminl a esetben kisebb, b esetben nagyobb a szmtott teszt-statisztika (31. tblzat).
.
Hasonlan rjuk le az f dzisai ltal elidzett variabilitst:
.
A teljes variancia x s f dzisklnbsgeivel magyarzhat variabilits egszl ki a
kt tnyeztl fggetlenl, teht a ms befolysol tnyezk hatsra ltrejv variabilitssal (SSE), melyet a teljes variabilits segtsgvel tudunk szmtani:
.
30. tblzat
a2
a3
a4
b tlagok
b1
39,7
34,8
22,5
26,6
30,9
b2
28,5
39,9
28,5
29,6
31,7
b3
41,8
35,7
33,6
36,7
37,0
b4
41,0
41,4
35,2
39,3
39,2
a tlagok
37,7
38,0
30,0
33,1
34,7
b gygyszer
klnbz
dzisai
29. tblzat
Variabilits
forrsa
Variabilits (Ngyzetes
eltrsek sszege, SS)
Szabadsgi fokok
Variancia (tlagos
ngyzetes eltrs)
Variancia
hnyados (F)
Vizsglt
magyarz
vltoz (x)
31. tblzat
Vizsglt
magyarz
vltoz (f )
Ff =
Nem
magyarzott
variabilits (E)
Teljes
variabilits (y)
106
MS f
MSE
Variabilits forrsa
Variabilits (ngyzetes
eltrsek sszege, SS)
Szabadsgi
fokok
Variancia (tlagos
ngyzetes eltrs)
Variancia
hnyados (F)
Vizsglt magyarz
vltoz (a)
180,88
60,29
3,544715
Vizsglt magyarz
vltoz (b)
198,68
66,23
3,893627
Nem magyarzott
variabilits
153,08
17,01
Teljes variabilits
532,65
15
107
Biostatisztika
Biostatisztika
.
Az eredeti egyenlethez kpest annyi csak a klnbsg, hogy mindkt fggetlen vltozra kln regresszis koefficienst (bx, bz) kapunk. Ezek a koefficiensek csak azt a hatst
fejezik ki, amit az adott fggetlen vltoz nmagban kifejt. Vagyis mr nem rvnyesl ezekben a szmokban a fggetlen vltozk egymshoz fzd kapcsolata. Emiatt az
egyes fggetlen vltozkra kapott regresszis koefficienseket kln-kln interpretlhatjuk az egyvltozs elemzsnl elmondottak alapjn.
A variancik elemzsekor is hasonlan jrunk el, mint egyvltozs elemzseknl tettk. Felbontjuk az y teljes (a ngyzetes eltrsek sszegvel szmszerstett) variabilitst az x s z paramterekkel magyarzhat, s ezekkel nem magyarzhat rszre (SSE):
.
108
109
Biostatisztika
Biostatisztika
A feladat kettnl tbb fggetlen vltoz esetn mr elveszti azt a szemlletes fogdzkodt is, amit az eredeti adatok koordintarendszerben trtn brzolsa rvn
nyertnk. s br a tbbdimenzis regresszis egyenletek megadsa is az emltett alapelveket kveti, a feladat matematikailag alapveten mskppen alakul, mint egy- vagy
ktvltozs elemzseknl.
Oksgi sszefggsek
A jl kivitelezett vizsglatokban valdi problmra fkuszl krdsre kapunk kellen
megbzhat, a magyarz vltoz s a kivltott hats kzti kapcsolat vletlenszersgrl, statisztikai eszkzk segtsgvel levont, kvetkeztetsen alapul vlaszt. A kutatsi krdsre adott vlasznak azonban csak egyik alapja a statisztikai elemzs eredmnye.
Ugyanilyen fontos, hogy a vizsglat krlmnyeit kellen mrlegeljk: nem lehet-e az
eredmnyt a mintavlaszts hibjval, a zavar tnyezk nem megfelel kontrolljval,
vagy a mrsek, az adatgyjts pontatlansgval magyarzni. Ezen tlmenen azt is
rtkelni kell, hogy az eredmnyeink sszhangban vannak-e a vizsglatunkkal kapcsolatos elmletekkel.
A statisztikai eljrsok eredmnyeknt alapveten arrl adnak informcit, hogy a
klnbz paramterek kztt van-e kapcsolat. A kapcsolat termszetre, a kapcsolatot ltrehoz mechanizmusra vonatkozan nem. Emiatt a vletlennel (s a vizsglati
hinyossggal) nem magyarzhat kapcsolatok feltrsa esetn sem llthatjuk, hogy
ok-okozati sszefggst talltunk. St, esetenknt mg azt sem tudjuk rtelmezni pusztn a statisztikai eredmnyek segtsgvel, hogy adott vizsglatban melyik volt a magyarz s melyik a fgg vltoz.
111
Biostatisztika
21. bra. Lehetsges kapcsoldsi irnyok a csaldf alkoholizmusa s a csald instabilitsa kztt
Ha konzekvens kapcsolatot ltunk a napozs utni legs s a melanoma kialakulsnak kockzata kzt, akkor elvileg nmagban a brt r UV-expozci vagy a legs
patolgiai folyamatai is magyarzatul szolglhatnak az sszefggsre (22. bra).
A ktfle modellhez ktfle beavatkozsi stratgia tartozik. Az els esetben a legs megelzse vagy kezelse egyarnt hatkony preventv beavatkozs. A msodik
modellben a legs kezelst nem, csak az UV-expozci kerlst tekintjk preventv
eszkznek.
A hatkony beavatkozsi pont azonostsa a valdi oksgi lncolat meghatrozsn
alapul. Minl sszetettebb problmval llunk szemben, annl nehezebb az oksgi lncolatok feltrsa, de soha nem tekinthetnk el ettl, vizsglatunk ktelez rsze az oksgi rtelmezs.
Biostatisztika
Hill-szempontrendszer
Szmos olyan fertz betegsgeket ismernk, amik jellemz klinikai kppel jrnak, s
amiket egy krokoz kpes csak kivltani. Az ilyen monokauzlis betegsgek vizsglatra dolgozta ki Koch azokat a kritriumokat, amiknek meg kell felelnie a krokoznak
ahhoz, hogy azt a betegsg okozjnak tekintsk:
112
113
Koch-posztultumok
Biostatisztika
egyik szempont sem perdnt nmagban az oksgot illeten. Maga Hill is a kutatsi eredmnyek rtelmezst segt szempontrendszernek s nem az oksg megtlst
szolgl kritriumrendszernek tartotta az ajnlst.
Biostatisztika
kzt elvgzett vizsglatok s a sajt eredmnyeink kzt sszhang van, akkor beszlnk konzisztencirl. Minl tbb vizsglat ltal rajzoldik ki egy konzisztens kp,
annl inkbb meggyzdnk az oksgi kapcsolatrl.
Teljesen mindegy, hogy milyen mdszerrel vizsgljk a HPV jelenltt a mhnyakrkos szvetekben, mindig arra az eredmnyre jutnak, hogy a vrus kockzatnvel jelleg. Mivel nagyon sok vizsglatot hajtottak mr vgre nagyon sok orszgban, ez a konzisztencia az oksg melletti ers rvet jelent. Nincs is irodalmi adat, ami
ezzel ellenttes megllaptsra jutott volna.
A konzisztenciahiny azonban egyltaln nem zrja ki az oksgi kapcsolatot.
Elfordulhat, hogy egy faktor nmagban nem kpes kivltani a vizsglt hatst, csak
ha egyttesen hat ms tnyezkkel. Azokban a vizsglatokban, ahol a kiegszt hats is jelen van, ltni fogjk a kapcsolatot; ahol a kiegszt tnyez nincs jelen, ott
nem ltjk. Az eredmnyek teht nem lesznek konzisztensek.
Ha azt vizsgltk, hogy a transzfzi nveli-e a HIV-fertzs kockzatt, akkor
azokon a helyeken, ahol a vrksztmnyek biztonsgosak voltak, nem lttk a kapcsolatot; ahol nem vizsgltk a vrksztmnyeket, s a HIV-hordoz tnetmentessg
prevalencija nagy volt, ott szleltk a vletlennek nem tulajdonthat kapcsolatot.
1. Az sszefggs erssge
ltalban igaz, hogy szoros sszefggst mutat mrszmokat akkor eredmnyez egy vizsglat, ha ok-okozati kapcsolat van a vizsglt paramterek kzt.
A HPV mhnyakrkot okoz hatsa melletti alapos rv, hogy daganatepidemiolgiban szokatlanul magas kapcsolati mutatkat (100 feletti eslyhnyadosokat, incidenciahnyadosokat) tallnak az epidemiolgiai vizsglatokban.
De szmos plda van arra, hogy egy magyarz vltoz tnylegesen befolyssal
van egy fgg vltozra, de annak rtkt csak kis mrtkben vltoztatja meg. Az
ilyen gyenge befolysol tnyezk vizsglata komoly nehzsget jelent, mert a nem
megfelelen kontrolllt zavar tnyezk okozta torzt hats is elidzheti a gyenge,
de szignifikns kapcsolatot. A passzv dohnyzsrl ma mr jl tudjuk, hogy megnveli a tdrk kialakulsnak kockzatt. Ez a hats azonban gyenge, ezrt nagyon
hossz idt vett ignybe a megfelel bizonytkok ellltsa, olyan vizsglatok vgrehajtsa, amelyekben a gyenge hats szlelshez szksges nagy mintaelemszm
biztosthat volt, s ahol a tdrk kialakulst segt, egyb kockzatnvel tnyezk kontrollja is hatkonyan megvalsthat volt.
Ugyanakkor arra is szmos plda akad, hogy szoros kapcsolatban lev tnyezk
kzt nincs ok-okozati sszefggs. Ha azt vizsgljuk, hogy a csaldon bell hnyadik gyermeknek a legnagyobb az eslye arra, hogy Down-szindrms legyen, akkor
azt ltjuk, hogy a szletsi sorrenddel fokozatosan emelkedik a betegsg kockzata.
Igen ers a statisztikai kapcsolat. A kapcsolat htterben azonban nem a szletsi
sorrend, hanem a szletsi sorrenddel szintn szoros kapcsolatot mutat anyai letkor ll. Valjban az anyai letkorral emelkedik a Down-szindrma kockzata, s ettl teljesen fggetlenl, a gyermekek szletsi sorrendje s az anya letkora szintn
szoros kapcsolatot mutat a betegsg kialakulsval.
Az ers kapcsolat inkbb csak annak kizrsra ad alapot, hogy valamilyen ismeretlen, vagy a vizsglatban nem figyelt zavar tnyez torzt hatsnak tulajdonthat a paramterek kzt lert sszefggs.
3. Specificits
Ha egy befolysol tnyez csak egy elvltozst, betegsget kpes kivltani, akkor beszlnk a kapcsolat specifikus jellegrl.
A tbb mint szzfle HPV nem csak mhnyakrkos szvetekben mutathat ki,
hanem egy sor ms daganatnl is kockzatnvelnek tnik. Legalbb 15 (de elssorban 2) HPV-szerotpus kapcsolhat a mhnyakrkhoz. Az egyes szvettani tpusokhoz viszont sajtos HPV-spektrum tartozik, ami a kapcsolat specificitst mutatja.
A fertz betegsgeknl tipikus ers specificits nagyon ritkn fordul el nem
fertz betegsgek esetben, ezrt a vizsglati eredmnyek rtkelsekor ez a szempont ltalban nem segti az rtelmezst. Inkbb kivtelesnek mondhat az a helyzet,
amikor ez a szempont segti a helyes kvetkeztets levonst.
A dohnyzs taln a legjobb plda arra, hogy egy tnyez kpes nagyon sok ponton krostani az lettani funkcikat. Az egyes funkcionlis vesztesgek s a dohnyzs kzti kapcsolatot rtkel vizsglatok eredmnyei akkor is ok-okozati termszetek, ha ez a specificits egyltaln nem rvnyesl.
2. Konzisztencia
Sajt vizsglatunk eredmnyt ssze kell hasonltani a msok ltal kivitelezett
vizsglatok eredmnyeivel. Ha a hasonl krdsre fkuszl, de ms krlmnyek
4. Idbelisg
Az oknak meg kell elzni az okozatot. Ez az egyetlen szempont, aminek mindig
teljeslnie kell. Klnsebben ezt nem is kell rtelmezni.
114
115
Biostatisztika
A szrsi programok sorn nyert mintk vizsglata alapjn jl ismert, hogy vekkel a mhnyakrk kialakulsnak megkezddse eltt mr HPV-fertztt a mhnyak
hmja.
Taln azt rdemes csak megjegyezni, hogy ha egy felttelezett ok ksbb jelenik
csak meg, mint az okozat, akkor ez nem jelenti azt, hogy az oki tnyez nem kpes
kivltani az elvltozst. Azaz, ha fordtott idbelisget ltunk a vizsglatunkban, az
mg nem zrja ki az ok-okozati kapcsolat lehetsgt. (Vannak vesebetegek, akiknek
a hipertnija a vesebetegsg szvdmnyeknt alakul ki. Ez mg nem jelenti annak
a bizonytkt, hogy a hipertnia nem tud vesebetegsgeket elidzni.)
5. Dzis-hats kapcsolat
Ha azt tapasztaljuk, hogy a magasabb dzisokhoz intenzvebb kivltott hatsok
tartoznak, akkor ez az ok-okozati jelleg melletti ers rv, az egybknt kimutatottan
ltez kapcsolat esetben. Elssorban a dzissal monoton mdon ersd vlasz a
meggyz.
Br egy fertz gens esetben nem biztos, hogy a magasabb vrusszmtl magasabb kockzatot vrunk, a manapsg elindtott s kvantitatv vrus DNS-mrsen
alapul vizsglatok azt mutatjk, hogy a HPV magasabb dzisaihoz fokozottabb
mhnyakrk-kialakulsi kockzat trsul.
A monotonits azonban nem mindig teljesl. Nagyon sok toxikus anyag csak akkor fejti ki a hatst, ha egy bizonyos mennyisgnl tbb kerl a szervezetbe. A hats kifejldse valamilyen kszbdzishoz ktdik. Az ilyen kszbkhz igaztjk
pldul a krnyezet-egszsggyi hatrrtkeket.
Az alkohol s hallozs kzti kapcsolat sem monoton jelleg. A moderlt alkoholfogyasztk kzt alacsonyabb a hallozs, mint az absztinenseknl. A legmagasabb hallozsi adatokat a sok alkoholt fogyasztk kztt ltjuk (J-alak dzis-hats
grbe). Mivel a grbe egyes rszeihez ms-ms rtelmezs tartozik, valjban ez a
vizsglati eredmny is az alkohol egszsgkrost hatst bizonytja. (Az absztinencia oka meglehetsen gyakran egy letet veszlyeztet alapbetegsg. Az absztinensek kzti emelkedett hallozs nem az alkohol protektv hatsnak elmaradst
tkrzi, hanem az absztinencit is megalapoz alapbetegsg kvetkezmnye.)
Msfell monoton dzis-hats kapcsolat esetn sem kell felttlenl ok-okozati
kapcsolat megltre gondolnunk. Magyarorszgon a 90-es vekben folyamatosan
emelkedett az antidepressznsfogyaszts, s folyamatosan cskkent az ngyilkossg
miatti hallozs. A kt trend kzt nagyon szoros a kapcsolat. Magasabb gygyszerfo-
116
Biostatisztika
117
Biostatisztika
8. Ksrletes bizonytkok
Ha olyan vizsglat alapjn vonjuk le kt tnyez kapcsolatra vonatkoz kvetkeztetsnket, ahol a magyarz vltoz eltvoltsa utn helyrell lettani funkcit mrjk, akkor ez Hill rtelmezsben ksrletes bizonytk arra, hogy a
magyarz vltoz oki gens.
A HPV elleni vakcinls utn cskken mhnyakrk-incidencia adja a ksrleti
jelleg bizonytkot a HPV etiolgiai szerepre.
Nem vitatva, hogy sok esetben ez az rvels helytll, nem tekinthet ez a szempont sem ltalnos kritriumnak; s nem csak azrt, mert a befolysol faktor ksrletes krlmnyek kzti eltvoltsa nem mindig oldhat meg.
A malria elnevezse is arra utal, hogy sokig azt gondoltk, a mocsarak rossz
levegjnek bellegzse okozza a betegsget. Ha erre egy mocsr-lecsapolsi ksrletet hajtottak volna vgre, akkor ltszlag igazolni lehetett volna az oksgi kapcsolatot, hiszen a mocsarak lecsapols utn a betegsg visszaszorul. Ennek ellenre
nincs ok-okozati sszefggs a mocsr levegje s a malria kzt. A mocsr lecsapolsval a krokozt terjeszt sznyog veszti el lhelyt, s emiatt cskkent a
betegsg gyakorisga.
9. Analgia
Az analgik (sajt vizsglati krdsnkre hasonlt helyzetekkel kapcsolatos ismeretek) keresse nagyon fontos a hipotzisek fellltsakor, de ersen ktsges,
hogy sajt eredmnyeink ok-okozati jellegnek elbrlsakor ezt a szempontot komolyan lehet-e egyltaln venni. (Mindenesetre Hill ezt a szempontot is javasolta.
Arra hvta fel a figyelmet, hogy ha egy gygyszerrel kapcsolatban igazoltuk, hogy
az fejldsi rendellenessget kpes okozni, akkor ezt ms gygyszerrl is el tudjuk
kpzelni.)
A HPV-cervixrk etiolgiai viszonnyal kapcsolatban emlthet analgik az albbiak: (1) vannak ms DNS-vrusok is (pl. HBV), melyek kpesek humn daganatot
induklni; (2) vannak olyan llati papillmavrusok, melyek kpesek daganatot elidzni; (3) vannak olyan karcinogn vrusok, amelyek hasonl elemi hatsokat vltanak ki, mint a HPV (interakci p53- s RB-fehrjkkel).
118
Trgymutat
A,
abszolt rtk 74, 89
adat 13
~, dichotm 13
~, nominlis skln mrt 14
~, ordinlis skln mrt 14
~, diszkrt 15
~, kvalitatv 54, 60
~, kvantitatv 39
adatbzis 11, 13
adatgyjts 11
adatpr 65
analgia 116
ANOVA-tbla 51
Apgar score 14
arnyskla 15
tlag 16, 39, 40
tlagklnbsg 40
tlagos eltrs 22
B
befolysol tnyez 7, 10
biolgiai plauzibilits 115
Bonferoni-korrekci 46, 52
centrlis rtk 20
Cs
csoportvariabilits 49, 50
D
determincis koefficiens 84
deviancia 77
dichotomizlsi kszb 1416
dzis-hats kapcsolat 114
dntsi kszb 3436
E,
egyni variabilits 47
eloszls 39
eloszlsfggvny 38, 58
eloszls-paramter
eljel 89
eljelteszt 8688
elsfaj hiba 36, 37, 46
rtkpr 58
119
Biostatisztika
esetszm-eloszls 57
extrm rtk 20
Biostatisztika
J
jsolt rtk 82
F
K
F-rtk 51
Fisher-exact eljrs 57
folytonos vltoz 20, 68, 69
F-prba 45, 51
fggetlen vltoz 75, 85, 107
fgg vltoz 75, 79, 80, 85, 101, 106
G
Glasgow Coma Scale 14
goodness of fit test 57
H
haranggrbe-eloszlsminta (Gaussgrbe) 23
hatkonysgnvekeds 44
Hill-szempontrendszer 111
hipotzis 7
hipotzistesztels 11, 34, 36
hisztogram 19
I
idbelisg 113
intervallumskla 15
kapcsolat 101
kategria 59
ktmints t-prba 43, 92
ktszempontos varianciaelemzs 102
ksrlet 7, 8
ksrletes bizonytk 116
kivltott hats 7, 9
Koch-posztultumok 110
koherencia 115
KolmogorovSzmirnov-prba 45
konfidencia-intervallum 72
kontingenciatblzat 60
konzisztencia 112, 113
konzisztenciahiny 113
korrelci 68
~ teljes pozitv 72
~ inverz 72
korrelcis koefficiens 7175, 84
kovariancia 6971, 83
kritikus rtk 38, 56, 74, 87
~ statisztikai mrszm 87
KruskalWallis H-teszt 92
kutatsi krds 9
klnbsg 39, 40
kszbrtk-definils 16
kszbdzis 114
120
ok 113, 114
ok-okozati kapcsolat 12, 109, 112, 114
okozat 113, 114
oksgi sszefggs 109
~ lncolat 109, 110
~ kapcsolat 113
M
magyarz vltoz 79, 80, 101, 16
MannWhitney U-teszt 9092
msodfaj hiba 36, 37
McNemar-teszt 66
medin 20, 90, 92
megbzhatsgi tartomny 2735, 72, 73,
80
megfigyels 7, 8
megfigyelt esetszm 55
mrsi technika 13
mdusz 21
monotonits 114
sszegzs 55
sszefggs erssge 112
P
prelemzs 45
Pearson korrelcis koefficiens 98, 99
p-rtk 36, 38, 87
Poisson-eloszls 58
N
ngyzetes eltrs tlaga 50
~ ~ sszege 47, 48, 79, 103
~ klnbsgek sszege 55
nem paramteres eljrs 86
normlis eloszls 23, 25, 86
nullhipotzis 56, 60
rangszm 89
rangszmsszeg 89, 90
regresszi 79
regresszis egyenes 76, 77, 85
~ elemzs 75
~ koefficiens 80, 84
reprezentatv minta 27
121
Biostatisztika
S
Spearman rangkorrelcis egytthat 98
Spearman-rangkorrelci 98
specifits 113
standard devici 28, 30
~ hibaszmts 31
standardizlt rtk 24
~ klnbsg (t-rtk) 43, 45
~ regresszis koefficiens 85
statisztikai teszt 38
~ vltoz 16
srsgfggvny 24, 25
vrhat rtk 54
~ esetszm 55
variabilits 18, 40, 49, 52, 78, 79
variancia 22, 41, 52
varianciaelemzs 5153, 78
varianciahnyados 50, 80
vizsglat lpsei 11
W
Wilcoxon prostott teszt 8890
Sz
Y
szabadsgi fok 22, 23, 45, 49, 87
szrs 16, 39
szrsdiagram 68, 69
szrds 18, 70
teljes variabilits 50
T
teszt-statisztika 98, 105
t-rtk 23
tbbszrs hipotzistesztels 46
tbbvltozs elemzs 101
~ lineris regresszi 106
~ ~ regresszis elemzs 85
t-prba, Student-prba 23, 43, 45
122