You are on page 1of 30

A

ROPst
at
statisztikai
menrendszere

Vargha Andrs
2016
A ROPstat statisztikai menrendszere
2

Tartalomjegyzk

Bevezets: A ROPstat ltalnos jellemzi


Fbb vonsok
A ROPstat installlsa
Adatimport s adatexport a ROPstatban

1. Alapok (egymints elemzsek)


Alapstatisztikk
Rszletesebb statisztikk szmtsa
Gyakorisgi eloszls, hisztogram ksztse
Kzprtkekre vonatkoz hipotzisek vizsglata
Normalitsvizsglat

2. Csoportok s vltozk sszehasonltsa


Fggetlen mintk egyszempontos sszehasonltsa
sszetartoz mintk egyszempontos sszehasonltsa
tlagok ktszempontos sszehasonltsa
Ktszempontos vegyes varianciaanalzis
Ktszempontos rang-varianciaanalzis
Inter-rater reliabilits kvantitatv sklkkal

3. Vltozk kapcsolatnak vizsglata


Korrelci, egyszer regresszi
Korrelcis s parcilis korrelcis mtrixok ksztse
Diszkrt vltozk kapcsolatvizsglata
Itemanalzis
Tbbszrs lineris regresszi

4. Mintzatfeltr elemzsek
Adatlers
Hinyz adatok ptlsa
Rezidulanalzis
Hierarchikus klaszteranalzis
Relokci: nemhierarchikus K-kzpont klaszteranalzis
Konfigurcianalzis (CFA)
ExaCon
Centroid
DensePoint: sssdspont-elemzs
A ROPstat statisztikai menrendszere
3

Idszeparci
Idegyests
A ROPstat statisztikai menrendszere
4

Bevezets: A ROPstat ltalnos jellemzi

Fbb vonsok
A ROPstat egy ltalnos s szles spektrum statisztikai programcsomag, mely hrom
terleten nyjt klnleges lehetsgeket:
- robusztus eljrsok (R),
- ordinlis elemzsek (O),
- mintzat/pattern feltr mdszerek (P).
Sok kzlk semmilyen ms ismertebb programcsomagban nem rhet el. A jelen cikk
szerzje az elmlt vtizedekben mindhrom terleten szmos jdonsggal gazdagtotta a
statisztikai adatfeldolgozs eszkztrt (pl. Vargha [1988], [1996], [2002], [2004], [2005],
[2011], VarghaDelaney [1998], VarghaTormaBergman [2015], VarghaBergmanTakcs
[2016]). A nem statisztikus felhasznlk azonban nem tudjk felhasznlni a legjobb, st
legegyszerbb mdszereket sem, ha nem ll rendelkezskre megfelel statisztikai szoftver,
mgpedig oly mdon, hogy az j mdszerek a rgi, hagyomnyosan hasznltakkal egytt,
kzs programcsomagban legyenek elrhetk. Egy msik motivcija j statisztikai
programcsomag ltrehozsnak az egyetemi oktats volt, ahol hinycikk volt a magyar
nyelven kommunikl, az egyvltozs statisztikt teljesen lefed, szles spektrum
statisztikai programcsomag a pszicholgia s a trsadalomtudomnyok szakjain.
Els prblkozsknt a PSZICHOSTAT statisztikai programcsomagot alkottuk meg
Spektrum s Commodore-64 szmtgpekre a 80-as vek kzepn (VarghaIzs, 1989).
Ahogy fejldtek az asztali szmtgpek, gy ntt meg az igny a fejlettebb szoftverekre is.
gy kszlt el a 90-es vek kzepre a Microsoft DOS opercis rendszere alatt futtathat
MiniStat (Vargha [1999], [2000], VarghaCzigler [1999]). Tz vvel ksbb, a Windows
rendszerhez val igazodsknt szletett meg a MiniStat Windows vltozata, a ROPstat, mely
amellett, hogy eldje minden kedvez tulajdonsgt megrizte, szmos j funkcival s
statisztikai elemzstpussal bvtette palettjt.
A ROPstat jelenlegi vltozata kt (magyar s angol) nyelven kommunikl szoftver,
melyet a jelen cikk szerzje tervezett s rta klnbz statisztikai moduljainak a programjait
(Delphi programozsi nyelven). Bnsgi Pter matematikus mrnknek ksznhet a
programok Windows rendszerhez igaztsa s a teljes kperny-kezels. Lars Bergman
szakmai konzultnsknt segtett a mintzatfeltr modulok tbbsgnek a kidolgozsban.
A ROPstat teljesen menvezrelt s hasznlata nem ignyel programozi ismeretet. A
programcsomag hasznlatnak egyik fontos felttele, hogy a felhasznl ismerje vltozinak
mrsi szintjt (pszichometriai sklatpust), valamint legyen tudatban annak, hogy milyen
A ROPstat statisztikai menrendszere
5

szakmai krdsre szeretne adatai felhasznlsval vlaszt kapni. A ROPstat moduljainak


kzs jellemzje, hogy a statisztikk kiszmthatk kln, egy n. feltteles csoportost
vltoz meghatrozott szintjeire is (pl. kln frfiakra s nkre, vagy csak azokra a
szemlyekre, akiknek 120 s 150 kztti az IQ-ja).
A ROPstatot az SPSS-sel sszevetve azt mondhatjuk, hogy az SPSS teljesebb krben
tartalmazza a tbbvltozs statisztikai eljrsokat. Ezek krbl a ROPstatban csak a
tbbszrs lineris regresszit, a ktszempontos varianciaanalzist s a szemlyek klnbz
klasszifikcis elemzseit (pl. a szemlyek klaszteranalzist) talljuk meg. Ugyanakkor a
klasszifikcis elemzseket is tartalmaz mintzatfeltr elemzsekbl a ROPstat gazdagabb
vlasztkot knl a felhasznl szmra, tbb olyan elemzssel (pl. konfigurcielemzs,
srsdspont-elemzs, centroidok sszehasonltsa stb.), melyek az SPSS-ben nem
elrhetk. A ROPstat gazdagabb a robusztus s a nemparamteres mdszerekben is, melyekre
rszletekbe menen majd ksbb fogunk kitrni, viszont nem tallhatk meg benne olyan
specilis elemzsek, mint az idsorelemzsek (Time Series Analyses), tllgrbk ksztse
(Survival Analysis), ROC-grbe elemzs (ROC Curve Analysis) vagy minsg-ellenrzs
(Quality Control). A ROPstatban egybknt az SPSS-hez hasonlan egy adathalmazt
mintnak s nem sokasgnak (teljes populcinak) tekintnk. Vgl a ROPstat s az SPSS
kapcsolatrl megjegyezzk, hogy az esetleges programozi hibk kiszrse cljbl a
ROPstat minden olyan eljrst, amely az SPSS-ben is megtallhat (ilyen pl. az sszes
hagyomnyos egyvltozs statisztikai elemzs, a tbbszrs regresszi-elemzs vagy a
ktszempontos varianciaanalzis), a programfejleszts sorn konkrt pldk segtsgvel az
SPSS-sel sszevetettk, hogy ugyanarra a numerikus eredmnyre vezetnek-e, s ahol kellett,
javtottunk.
Hasonlkat mondhatunk a ROPstat s az Excel sszehasonltsa tern is. Mindamellett
az Excel hasznlata kitntetett a ROPstatban, ugyanis ez utbbiban brmely statisztikai
elemzs teljes eredmnylistja egy gombnyomsra tkldhet az Excelbe, aminek kt fontos
elnye van. Az egyik az, hogy az Excelben megjelentett tblzatok ugyanilyen tblzatos
formban tmsolhatk Word dokumentumokba, ami mhelymunkk, szakdolgozatok,
publikland tanulmnyok esetben igen hasznos. A msik j tulajdonsga ennek a
lehetsgnek az, hogy az Excelben a megjelentett ROPstat-tblzatokbl igen knnyen lehet
tetszets brkat, grafikonokat szerkeszteni. Maga az adattvitel (adat export-import)
egybknt igen egyszer a ROPstat, valamint az SPSS s az Excel kztt, melynek
technikjt az albbiakban majd kiss rszletezzk is.
A ROPstat ksztsekor elssorban a pszicholgiai oktats s kutats szempontjait
vettk figyelembe, de ezt a szoftvert jl hasznlhatjk trsadalomtudsok (nyelvszek,
A ROPstat statisztikai menrendszere
6

szociolgusok, pedaggusok, kzgazdszok), de ms szakterletek kpviseli (pldul


orvosok, biolgusok stb.) is.

A ROPstat installlsa
A ROPstat installlsnak els lpseknt a szoftver dem verzijt kell letlteni a
ROPstat sajt honlapjrl (www.ropstat.com). Ennek installlsa sorn a ROPstat futshoz
szksges sszes fjl a szmtgp c meghajtjnak c:\_vargha\ropstat nev mappjba
msoldik be. A ROPstat futshoz az itt megtallhat ropstat.exe programot kell elindtani.
Maga a dem verzi is mr egy tkletesen mkd ROPstat program, mely csupn egy
korltozsnak van alvetve: az elemzend adatfjl nem tartalmazhat 5-nl tbb vltozt s
500-nl tbb esetet (nagyobb beolvasott fjlok erre a mretre lesznek reduklva). A profi
verzi kpes 1000 klnbz vltoz s esetenknt 100000 szemly statisztikai elemzsre. A
norml s profi verzik elrhetsgrl minden informci megtallhat a szoftver honlapjn.

Adatimport s adatexport a ROPstatban


A ROPstat sajt tpus s kiterjeszts msw adatfjlokkal dolgozik, ilyeneket hoz
ltre s olvas be. Egy msw egybknt egy egyszer szvegfjl, amelyben a vltozjellemzk
s az adatok egy specilis formtumban troldnak. Ezenkvl van mg kt olyan fjltpus,
melyet a ROPstat kzvetlenl be tud olvasni a Fjl/Megnyit menpontban: az SPSS portable
(*.por) s az Excel tabultorral tagolt szvegfjl (*.txt) tpust. Megjegyezzk, hogy az SPSS
legfrissebb verziiban (21. verzi s e felett), a portable formtumban val elmentshez a
ments eltt a unicode character set belltsa szksges a local character set opciban az
Edit/Options/General menpontban, mgpedig az tkonvertland SPSS fjl betltse eltt 1.
Excelbl importlt szvegfjlok esetn az els sorban kell elhelyezni a vltozk rvid
(maximum 8 karakter hossz) neveit. Hosszabb nevek esetn a ROPstat hossz nvknt rzi
meg ket s az els 8 karakter alapjn kpezi a rvid nevet.
A ROPstatban a vltozk egyarnt lehetnek numerikus s szveg tpusak, de a ROPstat
csak numerikusan kdolt vltozkkal tud statisztikai elemzseket vgezni. Specilis opciknt
azrt a ROPstat kpes egy szveges vltoz automatikus numerikus tkdolsra egyszer
szveges cmkk (pl. frfi s n) alkalmazsa esetn a Vltozk deklarcii ablak Tpus
oszlopban. Ugyanebben az ablakban szerkeszthetk a vltozk rvid (maximum 8 karaktert
tartalmaz) s hossz (gyakorlatilag akrmekkora) nevei, jellhetk ki kdokkal vagy
vezetekkel a vltozk csoportjai, tovbb adhatk meg vltoznknt a nem rtelmes
hinyz (missing) adatokat jell adatkdok vagy vezetek. A ROPstat emellett kpes a
1
Ugyanez a hats elrhet gy is, ha az SPSS sima indts utni res llapotban egy syntax ablakot nyitunk s
ott a SET UNICODE OFF. parancsot berjuk s futtatjuk.
A ROPstat statisztikai menrendszere
7

beolvasott vltozk sokfle talaktsra (pldul tkdolsra), valamint segtsgkkel j


(pldul klnfle eloszls random) vltozk ltrehozsra.
Ha egy adatfjlt SPSS-be vagy Excelbe szeretnnk tkonvertlni, akkor a Fjl men
Ments SPSS formtumban, illetve Ments tabullt szvegfjl formtumban menpontjt
kell hasznlnunk.

1. Alapok (egymints elemzsek): az adatllomnyok egyszer ler


statisztikai jellemzi s eloszlsvizsglatok

Alapstatisztikk
Ez a modul vltoznknt alapstatisztikkat szmt. A statisztikk kiszmthatk kln,
egy feltteles csoportost vltoz meghatrozott szintjeire (pl. kln frfiakra s nkre, vagy
csak azokra a szemlyekre, akiknek 120 s 150 kztti az IQ-ja). Az eredmnylista a
kvetkez statisztikkat tartalmazza: rvnyes rtkek (esetek) szma minden kijellt
vltozra; tlag s szrs; varicis egytthat (relatv szrs); legkisebb s legnagyobb rtk;
legkisebb s legnagyobb standardizlt rtk (z-rtk).

Rszletesebb statisztikk szmtsa


Ez a modul minden fgg vltozra kiszmtja a kvetkez statisztikkat: medin, az
tlag standard hibja (az elmleti tlagra vonatkoz becsls vrhat hibja), konfidencia-
intervallum az tlagra, ferdesgi egytthat (az aszimmetria standardizlt mutatja) s
cscsossgi egytthat (v. Vargha [2007] 3. fejezet s 5.3.5. alpont). A program egyben azt is
teszteli, hogy a vltoz ferdesge s cscsossga eltr-e a normlis eloszlstl.
Mg rszletesebb lesz az eredmnylista, ha trimmelst (nyesst) is belltunk (1 s 25
kztti trimmelsi szzalkkal). Az eredmnylista ilyenkor a kvetkez statisztikkat
tartalmazza: tlag, szrs, trimmelt tlag, Winsorizlt szrs, medin; konfidencia-intervallum
(intervallumbecsls) az elmleti tlagra; konfidencia-intervallum az elmleti trimmelt tlagra;
ferdesgi egytthat; cscsossgi egytthat; normalitsvizsglat a ferdesgi s a cscsossgi
egytthat segtsgvel. Megjegyezzk, hogy az SPSS a ferdesgi s a cscsossgi
egytthatra standard hibt s konfidencia-intervallumot is megad, azt azonban az SPSS nem
emlti meg, hogy ez csak a normalits ritkn fennll teljeslse esetn rvnyes.

Gyakorisgi eloszls, hisztogram ksztse


Ez a modul minden kijellt vltozra gyakorisgi eloszlst kszt.
A ROPstat statisztikai menrendszere
8

- Folytonosknt definilt vltozk esetben egy beptett algoritmus segtsgvel a


program hatrozza meg az osztlyokat, s ezekre nzve hatrozza meg a gyakorisgokat,
szzalkos gyakorisgokat s kumulatv szzalkos gyakorisgokat. Az osztlyok szma az
osztlyszm szorz paramter rtknek mdostsval nvelhet.
- Diszkrtknt definilt vltozk esetben a program a vltoz minden rtkre
meghatrozza a gyakorisgokat. E kt vltoztpus esetn hisztogram is brzolja a mintabeli
eloszlst. Ezen vltoztpus esetn lehetsg van minden kivlasztott X vltozbl specilis j
vltozk kpzsre s elmentsre:
(i) X binarizlsa: az X vltoz minden tallt c rtkre olyan j binris vltoz (Xc)
kpzdik, melynek rtke 1, ha X = c s 0, ha X c.
(ii) X percentilis transzformltjnak kpzse: az X vltoz minden c rtkhez
hozzrendeljk a mintabeli kumulatv szzalkos gyakorisgot, vagyis a mintban a c-nl
kisebb vagy vele egyenl rtkek szzalkos arnyt.
Ezek az j vltozk az elemzs utn az adattblzat vgn jelennek meg.
- Csop.def. vltoztpus belltsa esetn a program kilistzza az illet vltoz
klnbz csoportjait, azok gyakorisgt, tovbb kln krsre a khi-ngyzet-prba
segtsgvel teszteli, hogy a definilt csoportok/kategrik elmleti gyakorisgai
megegyeznek-e. Ha a vltozhoz nincsenek csoportok rendelve, a program a tallt klnbz
rtkek gyakorisgt hatrozza meg, s ezek segtsgvel teszteli, hogy a vltoz eloszlsa
egyenletes-e (v. Vargha [2007] 17.1. alfejezet).

Kzprtkekre vonatkoz hipotzisek vizsglata


Ez a modul minden kijellt vltoz esetben vgrehajtja az egymints t-prbt, annak
kt robusztus vltozatt (Johnson- s Gayen-prba), kln krsre a trimmelt t-prbt,
valamint a Wilcoxon-prbt s az eljelprbt (v. Vargha [2007] 7. fejezet). A tesztelend
hipotzis: a populci tlaga (t-prba s robusztus vltozatai), trimmelt tlaga (trimmelt t-
prba), illetve medinja (Wilcoxon- s eljelprba) megegyezik a feladatablakban bellthat
hipotetikus rtkkel (A). Diszkrt vltozk esetn az eljelprba nullhipotzise: P(X > A) =
P(X < A). Eredmnylista: tlag, szrs, minimum s maximum; egymints t-prba; Johnson-
s Gayen-prba (csak 500-at meg nem halad mintanagysg s |t| 10 esetn); trimmelt t-
prba; Wilcoxon-prba; eljelprba. A program a Wilcoxon-, illetve eljelprba esetben
egzakt p-rtket szmt ki akkor, ha a hipotetikus rtktl (A-tl) val nem nulla eltrsek
szma nem haladja meg a 20-at (Wilcoxon-prba), illetve 50-et (eljelprba), egybknt a
normlis eloszlssal val kzeltst alkalmazzuk.
A ROPstat statisztikai menrendszere
9

Normalitsvizsglat
Ezt az elemzst legfeljebb 100 elem mintk esetn a Kolmogorov-prba, 100-nl
nagyobb elemszm mintk esetn pedig a 2-prba segtsgvel vgzi el a program (v.
Vargha [2007] 17.1.3. alpont). Megjegyezzk, hogy a normalits tesztelsre a legtbb
esetben rzkenyebb s hatkonyabb eljrs a ferdesgi s a cscsossgi egytthat
segtsgvel vgzett elemzs a Rszletesebb statisztikk szmtsa modulban.
Ebben a menpontban lehetsg van lineris transzformcival minden kivlasztott
vltoz kt specilis standardizltjnak kpzsre s elmentsre:
(i) Egyszer standardizls: ebben az esetben az j vltoz tlaga 0, szrsa 1 lesz.
(ii) T-skla kszts: ebben az esetben az j vltoz tlaga 50, szrsa 10 lesz.
Ezek az j vltozk az elemzs utn az adattblzat vgn jelennek meg.
A ROPstat statisztikai menrendszere
10

2. Csoportok s vltozk sszehasonltsa

Fggetlen mintk egyszempontos sszehasonltsa


Intervallum-skljnak belltott vltozkra a program az elmleti szrsok s
tlagok egyenlsgt vizsglja. A populcik (sokasgok) szrsainak sszehasonltsra
az OBrien s a Levene-prba (ezeknek is a robusztus, Welch-fle vltozata) ll
rendelkezsre, amelyek a normalits megsrtsre nzve kevsb rzkenyek, mint a
hagyomnyos eljrsok (lsd Vargha [2007] 9.7. s 13.3. alfejezet). Az elmleti tlagok
(vrhat rtkek) sszehasonltsra a ROPstat ktfle eljrstpust alkalmaz. Elszr egy
hagyomnyos eljrst, mely rzkeny a szrsok klnbzsgre. Ez kt csoport esetn a
ktmints t-prba, tbb csoport esetn pedig az egyszempontos varianciaanalzis (VA)
fggetlen mints eljrsa. Ennek az elemzsnek az eredmnyt klnsen szmotteven
eltr elemszmok esetn csak akkor tekinthetjk rvnyesnek, ha a szrsok nem
klnbznek tlsgosan nagy mrtkben egymstl (v. Vargha [2007] 9. s 13. fejezet).
Kettnl tbb csoport esetn a program kiszmtja a korrelcis hnyadost
(nemlineris korrelcis egytthatt) is, mely azt mri, hogy a fgg vltoz milyen
mrtkben fgg a csoportost vltoztl. E mutat ngyzete a nemlineris determincis
egytthat, mely azt jelzi, hogy a csoportost vltoz a fgg vltoz variancijnak hnyad
rszt magyarzza meg.
A hagyomnyos eljrs mellett az elmleti tlagok sszehasonltsra a ROPstat olyan
robusztus mdszereket is alkalmaz, amelyek rvnyessgt nem cskkenti jelentsen az
elmleti szrsok esetleges klnbzsge. Kt csoport esetn az alkalmazott eljrs a Welch-
fle d-prba, tbb csoport esetn pedig a Welch-, a James-, s a Brown-Forsythe-fle
robusztus VA. Ezek kzl 20-nl kisebb mintk esetn a Welch-, nagyobb mintk esetn pedig
a James-prba tnik a legmegfelelbbnek. A Brown-Forsythe-fle eljrs csak legfeljebb
mrskelten klnbz szrsok esetn megbzhat (v. Vargha [2007] 13.2. alfejezet).
Ha kettnl tbb csoport sszehasonltsa esetn az elmleti tlagok azonossgnak
hipotzise elvethet, a program pronknt sszehasonltja az sszes mintatlagot.
Szignifiknsan klnbz szrsok esetn (lsd Levene-prba eredmnye) a Games-Howell-
fle mdszer, egybknt a Tukey-Kramer-fle mdszer eredmnyt clszer figyelembe venni
(v. Vargha [2007] 13.4. alfejezet).
Ha a normalits ersen srl amiatt, hogy az adatmintban a tbbi kzl nagyon
kilg extrm (outlier) adatok is vannak, clszer a mintk szlssges elemeit trimmelssel
levgni (trimmelni) a mintkrl. Ezt 0-tl klnbz trimmelsi szzalk belltsval
A ROPstat statisztikai menrendszere
11

tehetjk meg. Ilyenkor a program kettnl tbb csoport sszehasonltsa esetn trimmelt VA-
t, kt csoport sszehasonltsa esetn pedig trimmelt ktmints t-prbt (Yuen-prba) is
vgrehajt.
Ha kovarins vltozt jellnk ki, ennek hatst a program kovarianciaanalzissel
szri ki. Ezen elemzs felttelezi, hogy a kovarins s a fgg vltoz kztt ugyanolyan
lineris kapcsolat van a klnbz mintkban. Ennek rszleges ellenrzsre e kt vltoz
kzti korrelcit a program csoportonknt kiszmtja s sszehasonltja.
Ordinlis skljnak belltott vltozk esetn a program az elmleti rangszrsok
megegyezst s a sztochasztikus homogenitst teszteli. Populcik (sokasgok)
sszehasonltsa esetn egy-egy populci sztochasztikus dominancija (az n. sztochasztikus
kezelsi hats) annak a valsznsgt jelzi, hogy egy random megfigyels ebbl a
populcibl (Xj) nagyobb lesz, mint egy random megfigyels a populcik egyestsbl (X),
plusz az egyenlsg valsznsgnek a fele:

Pj = P(Xj > X) + 0,5P(Xj = X).

A sztochasztikus homogenits egyik defincija: P1 = P2 = P3 = ... = 0,50. Egy-egy Pj rtk


szignifikancija azt jelenti, hogy a Hj: Pj = 0,5 hipotzis elvethet. A sztochasztikus
homogenits egybknt ekvivalens az elmleti rangtlagok egyenlsgvel s kznapi
szavakkal azt jelenti, hogy brmelyik populci esetn egy innen vletlenszeren kivlasztott
adat ugyanolyan valsznsggel nagyobb a tbbi populci egyestsbl kivlasztott
vletlen adatnl, mint kisebb. E populcik egyestse trtnhet a mintaelemszmokkal
arnyos slyokkal, illetve azonos slyokkal. Ez utbbit akkor clszer alkalmazni, ha a
mintaelemszmok arnya nem felel meg a csoportok sszpopulcibeli valdi arnyainak.
A sztochasztikus homogenitst hagyomnyosan a Mann-Whitney-prba (kt minta),
illetve a Kruskal-Wallis-prba (kettnl tbb minta) segtsgvel lehet tesztelni, amelyek a
ktmints t-prba, illetve az egyszempontos VA rangszmokon elvgzett megfeleli.
Szignifiknsan klnbz szrsok esetn azonban e hipotzis vizsglatra a Fligner-
Policello-prba s a Brunner-Munzel-prba (kt minta), illetve a korriglt rang Welch-prba,
s a Kulle-fle aszimptotikusan egzakt prbk (kettnl tbb minta) a legmegfelelbbek (v.
Vargha [2002], [2007] 10. s 15. fejezet).
A program a Kruskal-Wallis-prba H mennyisgnek szignifikancijt a 2-eloszlssal
rtkeli ki, a Mann-Whitney-prba U mennyisgnek szignifikancijt kisebb mintk esetn
egy egzakt eljrssal, nagy mintk esetn pedig a normlis eloszlssal val kzelts
segtsgvel llaptja meg.
A ROPstat statisztikai menrendszere
12

Ha kettnl tbb minta sszehasonltsa esetn a sztochasztikus homogenits


hipotzise elvethet, a program a Brunner-Munzel-prbval pronknt sszehasonltja az
sszes csoportot, az elsfaj hiba megnvekedse, vagyis az alfa-inflci elkerlsre minden
esetben kiszmtva a Bonferroni-fle korriglt p-rtket is. A szignifikancia mrtktl
fggetlenl a program minden ordinlis sklj vltoz esetn csoportonknt becslst ad a
sztochasztikus dominancia nagysgra, s ezeknek a 0,5-tl val eltrst is teszteli.
Ha a csoportost vltoznak csak kt rvnyes csoportja van, akkor a program
kiszmtja az
A(1, 2) = P(X1 > X2) + 0,5P(X1 = X2)

valsznsgi flny mutatnak, valamint a P(Csop1 > Csop2), P(Csop1 < Csop2)
valsznsgeknek a pontbecslst, illetve A(1, 2)-re 95%-os intervallumbecslst is kszt.
Ha a feladatablakban krjk az eloszlsok rszletes sszehasonltst, akkor a program
osztpontelemzst is vgrehajt, vagyis a fgg vltoz rtkskljnak maximum 10
pontjban (n. binarizl osztpontokban) sszehasonltja az empirikus eloszlsokat azt
tesztelve, hogy az osztpont alatti rtkek arnya szignifiknsan eltr-e a klnbz
csoportokban. Ezen sszehasonltsok p-rtkeit sszevetve megllapthat, hogy a csoportok
az rtkskla milyen dichotomizlsval klnbznek egymstl a leglesebben. Az alfa-
inflci elkerlsre a program Bonferroni-fle korriglt p-rtkeket szmol ki. Az
osztpontelemzssel sok esetben rzkenyebben lehet pldul kt eloszlst sszehasonltani,
mint az erre a clra hagyomnyosan alkalmazott Kolmogorov-Szmirnov-prbval (v. Vargha
[2005], [2008] s VarghaBergman [2012]), melyet a ROPstat ebben az esetben szintn
elvgez.
A ROPstat klnleges vonsa, hogy ha az sszehasonltand csoportok szma 2 s 10
kz esik s a kivlasztott fgg vltozk szma legalbb kett, akkor intervallum s ordinlis
tpus vltozk esetn a program az eredmnylista vgn kzs tmr tblzatban foglalja
ssze az sszehasonltsok eredmnyeit (alapstatisztikk, hatsmrtkek, prbastatisztikk, p-
rtkek).
Nominlis skljnak belltott vltozk esetben a program elkszti a csoportost
vltoz (G) s a fgg vltoz (X) csoportjai ltal meghatrozott ktdimenzis
gyakorisgi/kontingencia tblzatot s 2-prbval (kis elemszmok esetn Fisher-egzakt-
prbval) teszteli, hogy X fgg-e G-tl (v. Vargha [2007] 17. fejezet).

sszetartoz mintk egyszempontos sszehasonltsa


A ROPstat statisztikai menrendszere
13

E modul segtsgvel sszetartoz mintk hasonlthatk ssze egymssal (pl.


ugyanazon vltozk klnbz idpontokban mrt szintjei). Az sszehasonlts statisztikai
mdszere attl fgg, hogy mi a kijellt fgg vltozk belltott kzs sklatpusa
(intervallum, ordinlis vagy nominlis).
Intervallum sklj vltozkra a program kettnl tbb fgg vltoz esetn az
egyszempontos sszetartoz mints varianciaanalzis (VA) eljrsval teszteli az elmleti
tlagok megegyezst s Friedman-prbval, illetve rangszmokon vgrehajtott VA-val a
sztochasztikus homogenitst, mely a fggetlen mints esettel analg mdon definilhat (v.
Vargha [2007] 14. fejezet). A hagyomnyos VA mellett a program szabadsgfok korrekcis
(Greenhouse-Geisser s Huynh-Feldt-fle) robusztus VA-t is vgrehajt. Tekintettel arra, hogy
az sszetartoz mints VA szrshomogenitsi felttele igen gyakran nem teljesl, az
eredmnyek rtelmezst clszer ezen robusztus VA-k figyelembevtelvel vgezni. A kt
robusztus VA kzl a Greenhouse-Geisser-fle eljrs ltalban egy picit konzervatv (a
kelletnl ritkbban szignifikns), a Huynh-Feldt-fle pedig ltalban enyhn liberlis (a
kelletnl gyakrabban szignifikns).
A program a Friedman-prba G mennyisgnek szignifikancijt a 2-eloszlssal val
kzeltssel llaptja meg. Ez tznl nagyobb elemszm mintk esetn megbzhatnak
tekinthet. Ha az elmleti tlagok azonossgnak, illetve a sztochasztikus homogenitsnak a
hipotzise elvethet, a program Tukey mdszervel pronknt is sszehasonltja az sszes
mintatlagot, illetve rangtlagot. A szignifikancia mrtktl fggetlenl a program
vltoznknt becslst ad a tbbi vltoz egyttestl val sztochasztikus eltrs nagysgra
(A(k, u) 0,5)2, s ezen eltrsek szignifikancijt is megvizsglja.
Kt fgg vltoz esetn a program az elmleti tlagok megegyezsre a VA helyett a
vele ekvivalens egymints t-prbt, illetve annak robusztus vltozatait (Johnson- s Gayen-
prba), a medinok egyenlsgnek tesztelsre a Wilcoxon-prbt, a sztochasztikus
egyenlsg tesztelsre pedig az eljelprbt hajtja vgre (v. Vargha [2007] 8. fejezet). A
Wilcoxon-prba rvnyessgnek felttele ebben az esetben az, hogy a kt vltoz
klnbsge szimmetrikus eloszls legyen. Ez teljesl pldul abban az esetben, ha a kt
vltoz legfeljebb az adatok nagysgszintjben klnbzik egymstl (az eloszls alakjban
nem). Ilyenkor a Wilcoxon-prba ugyanazt a nullhipotzist teszteli, mint az egymints t-
prba. Folytonos eloszls vltozk esetn az eljelprba nullhipotzise ekvivalens azzal a
megllaptssal, hogy a kt vltoz klnbsgnek medinja nulla.

2
A(k, u) annak a valsznsge, hogy a k-adik vltoznak egy random rtke nagyobb, mint a tbbi vltoz
rtkeibl vletlenszeren kivlasztott rtk, plusz az rtkegyenlsg valsznsgnek a fele.
A ROPstat statisztikai menrendszere
14

Ha a normalits ersen srl amiatt, hogy az adatmintban a tbbi kzl nagyon


kilg extrm (outlier) adatok is vannak, clszer a vltozk szlssges elemeit trimmelssel
lenyesni (trimmelni). Ilyenkor a program kettnl tbb vltoz sszehasonltsa esetn
trimmelt VA-t, kt vltoz sszehasonltsa esetn pedig trimmelt egymints t-prbt is
vgrehajt.
Ordinlis vltozkra a program csak a medinok sszehasonltst s a sztochasztikus
egyenlsget (kt vltoz), illetve csak a sztochasztikus homogenitst (kettnl tbb vltoz)
teszteli (v. Vargha [2007] 8. s 15. fejezet). E sztochasztikus sszehasonltsok elmleti
rtelmezse ugyangy trtnik, mint a fggetlen mints esetben.
Nominlis vltozk esetn a vltozs/eltrs vizsglatra a program a fgg vltozk
s a tallt klnbz rtkek szmtl fggen klnbz diszkrt elemzseket vgez (v.
Vargha [2007] 17.4. alfejezet, illetve Vargha [2001]). Ha kt fgg vltozt jellnk ki, akkor
a program az eloszlsok sszehasonltsra a McNemar-prbt (ms nven Bowker-fle
szimmetria-prbt) hajtja vgre, kettnl tbb fgg vltoz esetn pedig a fgg vltozk
minden tallt klnbz rtkre a Cochran-fle Q-prbt. Ha pldul a fgg vltozk szma
hrom, s ezek mindegyike olyan trtk vltoz, melynek lehetsges rtkei az 1, 2, 3, 4, 5
egsz szmok, akkor a program a Cochran-fle Q-prbval mind az t rtkre vonatkozan
teszteli, hogy az rtk ugyanolyan valsznsggel fordul-e el a hrom fgg vltoznl.

tlagok ktszempontos sszehasonltsa


Ezzel a modullal fggetlen mintk ktszempontos varianciaanalzise (VA) vgezhet
el a slyozatlan tlagok mdszervel (v. Vargha [2007] 16.1. s 16.2. alfejezet). A
mintaelemszmok eltrek is lehetnek a csoportost faktorok klnbz kombinciiban. A
csoportost faktoroknak keresztezetteknek kell lennik (s nem begyazottnak). A program a
VA szrshomogenitsi felttelnek fennllst a Levene-prba robusztus Welch-fle
vltozatval teszteli. Ha ez a prba szignifikns, clszer a program ltal szintn elvgzett
robusztus VA-k (Welch-Johansen-fle robusztus vltozatok) eredmnyt alapul venni. Ha 0-
tl klnbz trimmelsi szzalkot lltunk be, a program robusztus ktszempontos trimmelt
VA-t is vgrehajt, ami extrm rtkek jelenlte esetn lehet gygyr a normalits felttelnek a
srlsre. Ha a VA valamely kettnl tbb szint faktora szignifikns, akkor a program
utelemzsek segtsgvel knnyti meg a hats rtelmezst.
Megjegyezzk, hogy az itt elrhet robusztus VA-k nem tallhatk meg ms kzismert
programcsomagokban. Az SPSS ugyan felajnlja opciknt a szrshomogenits tesztelst,
de nem szmt ki alternatv rvnyes VA-t, ha ez a felttel srl.
A ROPstat statisztikai menrendszere
15

Ktszempontos vegyes varianciaanalzis


Ezzel a modullal olyan ktszempontos VA vgezhet el, amelynek egyik szempontja
fggetlen mints (csoportost faktor), msik szempontja pedig sszetartoz mints
(ismtlses faktor) (v. Vargha [2007] 16.1. s 16.3. alfejezet). A mintaelemszmok eltrek
is lehetnek.
A program a hagyomnyos VA mellett automatikusan elvgez egy robusztus
ktszempontos VA-t is, mely a csoporthatst Welch mdszervel teszteli, az ismtls
szempontjnak hatst, valamint a kt szempont interakcijt pedig szabadsgfok-korrekcis
VA-kkal (Greenhouse-Geisser s Huynh-Feldt-fle robusztus VA).

Ktszempontos rang-varianciaanalzis
Ezzel a modullal fggetlen mintk ktszempontos sztochasztikus homogenits-
vizsglata (v. Vargha [2004]) vgezhet el. Egy (i, j) alpopulci (rszsokasg) Pij
sztochasztikus dominancia rtke annak a valsznsge, hogy egy ebbl az alpopulcibl
vletlenszeren kivlasztott Xij rtk nagyobb lesz, mint az egsz populcibl
vletlenszeren kivlasztott X rtk, plusz annak a fele, hogy egyenlk lesznek:
Pij = P(Xij > X) + 0,5P(Xi = X).
A sztochasztikus dominancia rtk az X fgg vltoz nagysgszintjt mri a kt szempont
(jellje ket mondjuk A s B) szintjeinek minden kombincijra. Az A szempont
sztochasztikus homogenitsa (az A szempont szintjeinek szmt a-val jellve) gy nz ki:
P1. = P2. = ... = Pa,
ami azt jelenti, hogy az A szempont egyik szintjn sem nagyobbak (s nem is kisebbek) az
adatok, mint a tbbi egyttesben. Analg mdon definiljuk a B szempont sztochasztikus
homogenitst is.
A kt szempont nincs sztochasztikus interakciban, ha a sztochasztikus dominancia
rtkek mintzata a szempontok klnbz szintjein ugyanolyan, vagyis ha szintenknti
grafikonjaik prhuzamosak. A sztochasztikus interakci s a sztochasztikus homogenits
tesztelst mindkt csoportost vltozra a program a Kulle-fle kzelt eljrssal hajtja
vgre.
Megjegyezzk, hogy ilyen elemzs semmilyen ms kzismert programcsomagban
nem tallhat, pedig a pszicholgiban s a trsadalomtudomnyokban szp szmmal
fordulnak el ordinlis sklj vltozk, melyek ktszempontos fggsvizsglata sokszor
fontos kutatsi krds.
A ROPstat statisztikai menrendszere
16

Inter-rater reliabilits vizsglat kvantitatv sklkkal


Ezzel a modullal kvantitatv sklk inter-rater reliabilitsa (a brli egyetrts
mrtke) vizsglhat az ICC intraklaszter (intraclass) korrelcis egytthat segtsgvel (v.
Bartko [1976] vagy Landers [2015]). Az ICC segtsgvel azt lehet tesztelni, hogy az azonos
szemlyek klnbz brlktl kapott minstsei kztt nagyobb hasonlsg van-e, mint a
klnbz szemlyek rtktlagai kztt. A brli egyetrts akkor tekinthet
elfogadhatnak, ha ICC nagysga elri a 0,70-es szintet. Sokak (pl. Bartko [1976]) szerint
ICC helyett annak korriglt rtke, ICC(U) a megbzhatbb.
Az elemzshez kett vagy tbb brlnak ugyanazokat a szemlyeket kell rtkelnie
ugyanazon kvantitatv vltozk (sklk) szerint, de nem szksges minden brlnak minden
szemlyt minstenie. Egy-egy szemly egy-egy brltl szrmaz rtkelseit mindig kln
sorban kell elhelyezni s a sorokban kln vltozban kell jellni a vizsglt szemlyek
azonost kdjt is (esetazonost vltoz). A brlk azonostjt nem ktelez megadni, de a
hiteles tjkoztats szempontjbl clszer akr numerikus, akr szveges formban
feltntetni.

3. Vltozk kapcsolatnak vizsglata

Az sszes ebbe a f menpontba tartoz modulra (az itemanalzis s a tbbszrs


lineris regresszi kivtelvel) igaz a kvetkez. Ha a feladatablakban csak X vagy csak Y
vltozk vannak kijellve, a program az e csoporton belli sszes prra vizsglja a vltozk
kapcsolatt. Ha X s Y vltozt is kijellnk s a Keresztben opci van rvnyben, akkor a
program megvizsglja az sszes kijellt X s Y vltoz kztti kapcsolatot (ekkor X-eken s
Y-okon bell nem). Ha a kijellt X s Y vltozk szma megegyezik s a Prban opci van
rvnyben, akkor a program csak az egymssal sszetartoz (X, Y) prok kzti kapcsolatot
vizsglja.

Korrelci, egyszer regresszi


Ez a modul vltozprokra szmtja ki az egyszer lineris regresszis egyenletet s a
kt vltoz kzti kapcsolat szorossgnak mrsre egy sor korrelcis mrszmot,
intervallumbecslskkel egytt (v. Vargha [2007] 11. s 12. fejezet). A kijellt vltozkbl
kpezett prokra a program az egyszer (Pearson-fle) lineris korrelcin kvl mg hrom
kapcsolati mutatt szmthat ki. Az els a Pearson-fle korrelcis egytthat egyik legjobb
robusztus paramteres vltozatnak tekinthet Wilcox-fle rpb korrelci (percentage bend
A ROPstat statisztikai menrendszere
17

correlation), mely nagy szli sly eloszlsok, illetve extrm rtkek elfordulsa esetn
javallt. A program ezt minden esetben automatikusan kiszmtja. Ha belltottuk a
monotonitsi mutatk kiszmtst, a Kendall-fle tau, illetve tau-b is kiszmtsra kerl.
Elbbi csak folytonos vltozk esetn javasolt mutat. Folytonos esetben tau s tau-b
megegyezik. A Kendall-fle tau, illetve tau-b mutat kiszmtsa esetn a program mindig
kiszmtja az adott mintban a pozitv kapcsolati arnyt (konkordancia %), illetve a negatv
kapcsolati arnyt (diszkordancia %). A program az sszes kiszmtott kapcsolati mutat
elmleti rtkeire megad (bellthat szint) konfidencia-intervallumot is.
A program a fentieken kvl regresszit szmt (X-bl Y-ra s Y-bl X-re egyarnt), ha
ez a lehetsg nincs letiltva. A regresszik jsgnak megtlshez a program kiszmtja az
X- s az Y-hibavariancit is, vagyis X, illetve Y regresszis becslsnek tlagos ngyzetes
hibjt.
E modul feladatablakban lehetsg van egy rvid korrelcis output krsre is. Ezt
kijellve a program minden kijellt X vltoz esetn egyms alatt listzza ki X-nek a kijellt
Y vltozkkal val legfontosabb korrelciit, a hagyomnyos Pearson-fle r, a Wilcox-fle
robusztus rpb s a Kendall-fle tau-b mutatt. Ezen opcihoz az szksges, hogy legyen mind
X, mind Y vltoz kijellve. Ilyen esetben a program sem regresszit nem szmol, sem
intervallumbecslst nem kszt, de vltozpronknt feltnteti a konkordancia % s a
diszkordancia % rtkt.

Korrelcis s parcilis korrelcis mtrixok ksztse


Ezzel a modullal a kijellt vltozprok korrelcijt s parcilis korrelcijt
szmthatjuk ki hrom klnbz korrelcis egytthat tpusra (Pearson, Spearman s
Kendall; v. Vargha [2007] 11. s 12. fejezet). Az utbbi kt tpust leginkbb ordinlis
vltozk esetn clszer hasznlni. A szmtsokat a modul csak azokra az esetekre vgzi el,
amelyeknek rvnyes rtkk van minden kijellt vltoz esetn.
A korrelcikat (parcilis korrelcikat) a program alapesetben az X s az Y vltozk
kztt szmtja ki (teht X-eken, illetve Y-okon bell nem). Viszont ha csak X vagy csak Y
vltozk vannak kijellve, a program az e csoporton belli sszes prra vizsglja a vltozk
kapcsolatt, valamint a Pearson-korrelci tpus kivlasztsa esetn elvgzi a Bartlett-fle
fggetlensgvizsglatot. Ez azt teszteli, hogy van-e a vletlennl szorosabb lineris kapcsolat
a kijellt vltozk csoportjban legalbb kt vltoz kztt.
Ha a feltteles csoportok szma nem haladja meg az 5-t, akkor a program kln
krsre pronknt sszehasonltja az ugyanazon vltozprokhoz tartoz korrelcis
A ROPstat statisztikai menrendszere
18

egytthatkat is. A program kln krsre nagysg szerinti sorba is rendezi a kiszmtott
korrelcikat.

Diszkrt vltozk kapcsolatvizsglata


Ez a modul diszkrt (pl. nominlis sklj) vltozk kapcsolatnak vizsglatra
alkalmas (v. Vargha [2007] 17. fejezet). Segtsgvel a kijellt vltozprok ktszempontos
gyakorisgi tblzata kszthet el, tesztelhet a vltozpr fggetlensgnek nullhipotzise
(2-, illetve Fisher-egzakt-prbval) s mrhet a vltozk klnfle tpus kapcsolatnak
szorossga is. Ezen mutatk, valamint klnfle specilis gyakorisgi tblzatok (vrt
gyakorisgok, sor- s oszlopsszegek szerinti szzalkok, sszelemszm szerinti szzalkok)
kilistzsa opcionlisan bellthat. No bellts esetn sosincs kilistzs, Yes bellts
esetn mindig van, If signif. bellts esetn pedig a program csak akkor listzza ki a szban
forg tblzatot, illetve mutatkat, ha a fggetlensg nullhipotzise elutasthat legalbb
10%-os szinten.
A modulban az albbi kapcsolati mutatk szmthatk ki (pontos defincijukkal s
rtelmezskkel kapcsolatban lsd Vargha [2007] 17.2.4. alpont).
Brmilyen tpus diszkrt vltozk esetn a Cramr-fle V, mely 2x2-es tblzatok
esetn a kontingencia-egytthatra egyszersdik.
Ordinlis sklj vltozk esetn rtelmes a monoton asszocicis mrszmok
(Kendall-fle tau s tau-b, Goodman-Kruskal-fle gamma, Somers-fle egyirny
monotonitsi egytthatk) lekrse.
Ktrtk, illetve kt csoportra belltott vltozk (2x2-es tblzatok) esetn az
alfa eslyhnyados.
Tetszleges diszkrt vltozk esetn a Goodman s Kruskal ltal javasolt tau s
lambda predikcis mutatk.
Kzs informci-hnyad.
Ha a gyakorisgi tblzat sorainak s oszlopainak a szma megegyezik, akkor a
program opcionlisan Cohen-fle brli (interrater) kappa reliabilitst is szmol.
Ebben a modulban lehetsg van arra is, hogy a program az elemzseket egy bert
(bemsolt) gyakorisgi tblzat alapjn vgezze el. Ha a tblzatnak J sora s K oszlopa van,
akkor ehhez a kvetkezket kell megtenni.
Nyissunk meg egy j adatfjlt a ROPstatban J sorral (esettel) s K+1 oszloppal
(vltozval). Az els vltozt szveges vltozknt definiljuk s ennek oszlopba
rjuk be az ehhez tartoz csoportneveket (a sorvltoz cmkit).
A ROPstat statisztikai menrendszere
19

A tbbi (K szm) vltoz legyen numerikus (ez az alaprtelmezs), neveik


legyenek az oszlopvltoz cmki (az oszlopnevek).
Vgl a modul feladatablakban jelljk be az Adatmtrix gyakorisgi tblzat
opcit, s indtsuk el az elemzst.

Itemanalzis
A program a kijellt vltozk, mint tesztttelek egyttese ltal definilt n.
additv skla hagyomnyos megbzhatsgi (reliabilitsi) vizsglatt vgzi (v. Nagybnyai
[2006]). Ennek keretben vizsglja a skla bels egysgessgt (konzisztencijt) a Cronbach-
alfa segtsgvel, illetve az egyes ttelek (itemek) jsgt az item-totl s item-maradk
korrelcikkal. A Cronbach-alfa azt mri, hogy a kijellt vltozk mennyire hznak egy
irnyba, mennyire mrik tartalmilag ugyanazt. Hogy mit, az itt most nem rdekes, azt
validitsvizsglattal lehet kiderteni.
A skla tartalmazhat pozitv s negatv tteleket (itemeket) is, amelyeket kln
ablakban kell kijellni. Negatv ttelek kijellse esetn a ttelek tfordtshoz meg kell adni
a sklk kzs elvi minimumt s maximumt. Ha ez nem azonos a klnbz negatv ttelek
esetn, az elemzsek brmely rtk belltsa esetn rvnyesek maradnak (Cronbach-alfa,
item-maradk korrelcik), csak a sklartkhez hozzaddik egy bizonyos pozitv vagy
negatv konstans. A modulban definilt skla kiszmthat s elmenthet.
Az eredmnylista minden esetben tartalmazza a Cronbach alfa rtkt, valamint
itemenknt az item-totl (IT), az item-maradk (IM) korrelcit, tovbb a Cronbach-alfa
rtkt abban az esetben, ha az illet itemet elhagynnk a sklbl. IT az item s a teljes skla
kzti Pearson-korrelci, IM pedig az item s a tbbi item sszege, vagyis az item s az adott
item rtkvel cskkentett sklartk korrelcija. Ez utbbit szoktk (pl. az SPSS-ben)
korriglt item-totl korrelcinak is nevezni. Az SPSS-ben egybknt a Scale statisztikai
menpont Reliability Analysis elemzsvel lehet ugyanezeket a szmtsokat elvgezni.

Tbbszrs lineris regresszi


A modulban tbb kvantitatv fggetlen vltozk (X-vltozk) segtsgvel
elkszthetjk egy kvantitatv fgg vltoz (Y vltoz) regresszis becslst. Ez a regresszis
becsls (az n. regresszis fggvny) az X-vltozk olyan slyozott sszege (lineris
kombincija), melynek az Y vltoztl val tlagos ngyzetes eltrse az adott mintban a
lehet legkisebb, vagyis amellyel ebben a mintban az Y vltoz az X-vltozk segtsgvel
lineris kplet alkalmazsval a legkisebb hibval, vagyis a legpontosabban becslhet (v.
A ROPstat statisztikai menrendszere
20

Vargha [2007] 11. alfejezet, SzkelyiBarna [2003] 5. fejezet). Ez a minimalizlt tlagos


ngyzetes eltrs a regresszis becsls hibavariancija, ennek ngyzetgyke pedig a
regresszis becsls standard hibja. Az X-vltozk slyait (szorztnyezit) regresszis
egytthatknak, a regresszis fggvny s az Y vltoz kzti Pearson-fle korrelcit pedig
tbbszrs korrelcis egytthatnak (szoksos jele: R) nevezzk. A tbbszrs lineris
regresszis becslsre az is igaz, hogy az X-vltozk olyan slyozott sszege, amely az Y
vltozval a lehet legersebben korrell. Az elemzsben a regresszis becsls kln
vltozknt ltrehozhat s beilleszthet az adattblzatba.
Ha a feladatablakban a lpsenknti (stepwise) mdszert vlasztjuk, ami az SPSS-sel
szemben itt alaprtelmezs, a regresszis egyenletbe csak azok a vltozk kerlnek be,
amelyeknek nll szignifikns lineris elrejelz informcijuk van. A lpsenknti
regresszi eredmnylistja hrom blokkra tagoldik.
1. Az els blokkban a program lpsenknt tjkoztat a bevlasztott fggetlen vltozrl,
az eddig a lpsig bevlasztott vltozk tbbszrs korrelcijrl (R) s ennek
ngyzetrl, a tbbszrs determincis egytthatrl (R2), valamint az e lpshez
tartoz regresszis becsls hibavariancijrl (Res) s standard hibjrl (SH).
2. A msodik blokkban a program tjkoztat arrl, hogy az egyes lpsekben a
regresszis egyenletbe be nem vlasztott fggetlen vltozknak mi lesz a parcilis
korrelcija a fgg vltozval a mr bevlasztott fggetlen vltozk hatsnak
kiszrse utn. Ebbl minden lpsben megtudhatjuk, hogy melyek azok a fggetlen
vltozk, amelyek az ppen bevlasztott vltozval azonos elrejelz informcit
tartalmaznak.
3. A harmadik blokkban a program megadja a regresszis egyenletbe bekerlt vltozk
regresszis egytthatit eredeti s standardizlt formban (bta-egytthatk), valamint
a regresszis egytthatk standard hibjt s szignifikancijt.
Ha nem a lpsenknti regresszis mdszert vlasztjuk, akkor a regresszis egyenletbe
minden olyan fggetlen vltoz bekerl, amelynek nem nulla a szrsa s nem fejezhet ki
ms vltozk slyozott sszegeknt. Ilyenkor az eredmnylista megadja a tbbszrs
korrelcit (R) s a determincis egytthatt (R2), a regresszis becsls hibavariancijt s
standard hibjt, valamint a lpsenknti elemzs harmadik blokkjban kzlt informcit. Az
R2 tbbszrs korrelci ngyzet (determincis egytthat) egyben az a varianciaarny,
melyet az X fggetlen vltozk lineris predikcival magyarznak az Y vltoz
variancijbl. Mivel ez az adott konkrt mintra van optimalizlva, ez az elmleti R2
rtknek kisebb-nagyobb mrtkben (minl kisebb a minta, illetve minl tbb a fggetlen
vltoz, annl inkbb) torztott becslse. Az elmleti rtkre jobb becslst ad a program ltal
A ROPstat statisztikai menrendszere
21

szintn mindig kiszmtott korriglt R2 rtk. R2 egybknt a kvetkezt jelenti: a tbbszrs


lineris regresszis becsls Y-ra vonatkoz hibavariancija ilyen arnyban kisebb, mint ha Y-t
minden szemly esetn az Y-tlaggal becslnnk.

4. Mintzatfeltr elemzsek
Adatlers
Ebben a modulban a program alapstatisztikkat szmol s tjkoztat a hinyz adatok
mintzatrl (v. VarghaTormaBergman [2015]). Az eredmnylista tartalmazza a vltozk
alapstatisztikit, opcionlisan a kivlasztott vltozk pronknti korrelciit, valamint a
hinyz adatok szmt vltoznknt s vltozpronknt. Az elemzsbl megtudhatjuk, hogy
egy-egy vltoz elhagysa esetn mennyivel n a minden vltozra rvnyes rtkkel
rendelkez esetek szma. A modulban lehetsg van arra is, hogy az elemzsre kivlasztott
vltozk tetszleges slyozott sszegt, mint egy j vltozt a program ltrehozza s
elhelyezze az adattblzat utols oszlopban. Ha a feltteles csoportok szma nem haladja
meg az 5-t, s a feladatablakban krjk a kijellt vltozk korrelcis mtrixnak
elksztst, akkor a program kln krsre pronknt ssze is hasonltja az ugyanazon
vltozprokhoz tartoz korrelcis egytthatkat.

Hinyz adatok ptlsa


Ennek a modulnak a segtsgvel hinyz adatok ptolhatk az albbi hrom mdszer
valamelyikvel (v. BergmanMagnussonEl-Khouri [2003] 107-111. old., VarghaTorma
Bergman [2015]).
1. Adathelyettests az tlaggal. Ebben az esetben minden vltoz esetben minden
hinyz adat helyre az adott vltoz rvnyes rtkeinek tlagt teszi a program.
2. Adathelyettests a leghasonlbb eset (iker/legkzelebbi szomszd) adataival. Ebben
az esetben a program minden hinyz adat esetn megnzi, hogy az rvnyes rtkek
mintzata mely eset rtkmintzatra hasonlt a leginkbb azok kzl, amelyeknek a
kijellt vltozk kzl mindegyik rtke rvnyes. A hinyz adatot a program ennek
a megfelel vltozrtkvel helyettesti. A hasonlsg mrtke lehet a szoksos
euklideszi tvolsg, vagy az rtkmintzatok Pearson-fle korrelcija. A
feladatablakban krhet a vltozk standardizlsa, mely felttlenl indokolt abban az
esetben, amikor az elemzsre kivlasztott vltozk klnbz dimenzijak
(mrtkegysgek). A tvolsg kiszmtsakor lehetsg van arra is, hogy a program a
vltozkat klnbz mrtkben slyozza.
A ROPstat statisztikai menrendszere
22

3. Adathelyettests tbbszrs lineris regresszival. Ezt leginkbb akkor clszer


alkalmazni, ha a hinyz rtkekkel rendelkez vltozk kzepes vagy ers lineris
korrelciban vannak egy vagy tbb ms vltozval. Ha ez nem teljesl, inkbb az
elz mdszer alkalmazsa javasolt. E tpus vlasztsa esetn a program vltoznknt
kiszmtja a tbbi vltoz ltal megmagyarzott variancia-arnyt is.

Rezidulanalzis
Ebben a modulban az adatllomny extrm, kilg szemlyei (tbbdimenzis outlier
adatsorok) azonosthatk a hozzjuk leghasonlbb ms esetek (legkzelebbi szomszdok)
megkeresse segtsgvel (v. BergmanMagnussonEl-Khouri [2003] 109-110. old.,
VarghaTormaBergman [2015]). A program azt tekinti kilg szemlynek, akinek nincs
legalbb k szm olyan szomszdja, aki a feladatablakban bellthat kszbtvolsgnl
kzelebb van hozz. A k paramter rtke 1 s 5 kztt bellthat szm. Az elemzs alapjn
olyan indiktorvltoz kszthet, amely a kilg rtkek esetn 0, a megmaradk esetben 1.
Ezt a program krsre hozzilleszti az adattblzathoz, s ennek felhasznlsval a kilg
esetek ms elemzsekbl kihagyhatk. A programban krhet srsdsi vltozk ltrehozsa
is, melyek esetenknt megadja klnbz sugar szomszdsgi krket alkalmazva az
eset szomszdsgi srsgt (sok kzeli szomszd esetn nagy, kevs szomszd esetn kis
rtkkel).
A hasonlsg mrtke lehet a szoksos euklideszi tvolsg (pontosabban a
vltozrtkek tlagos ngyzetes eltrse = ASED), vagy az rtkmintzatok Pearson-fle
korrelcija. A feladatablakban krhet a tvolsgok kiszmtsa esetn a vltozk
standardizlsa, mely felttlenl indokolt abban az esetben, amikor az elemzsre kivlasztott
vltozk klnbz dimenzijak (mrtkegysgek). A tvolsg kiszmtsakor lehetsg
van arra is, hogy a program a vltozkat klnbz mrtkben slyozza.

Hierarchikus klaszteranalzis
Ez a modul hierarchikus klaszteranalzist vgez a szemlyeken (eseteken) a kijellt
vltozk felhasznlsval. A klaszteranalzis tpusfeltr tbbvltozs statisztikai eljrs,
amely szemlyek, vltozk vagy ms objektumok mintjban olyan csoportokat (n.
klasztereket) hoz ltre, amelyek a lehet legjobban klnbznek egymstl, mikzben a
klasztereken bell az elemek viszonylag kis tvolsgra vannak egymstl. A klaszteranalzis
clja teht egy nagy mintn bell olyan homogn alcsoportok ltrehozsa, amelyek egymstl
a lehet legjobban klnbznek. A hierarchikus klaszterelemzs fbb lpsei a kvetkezk
A ROPstat statisztikai menrendszere
23

(v. BergmanMagnussonEl-Khouri [2003] 4. fejezet s 113-115. old., SzkelyiBarna


[2003] 3. fejezet, VarghaTormaBergman [2015]).
1. A program minden esetprnak meghatrozza a tvolsgt a megadott
tvolsgmrtk felhasznlsval. Ez lehet a szoksos euklideszi tvolsg (ASED), vagy az
rtkmintzatok Pearson-fle korrelcija (kt szemly esetn a kijellt vltozk rtkeire az
sszetartoz rtkprok kzti Pearson-korrelci). A feladatablakban krhet a tvolsgok
kiszmtsa esetn a vltozk standardizlsa, mely felttlenl indokolt abban az esetben,
amikor az elemzsre kivlasztott vltozk klnbz dimenzijak. A tvolsg
kiszmtsakor lehetsg van arra is, hogy a program a vltozkat klnbz mrtkben
slyozza. Ebben a 0. lpsben minden szemlyt egy egyelem klaszternek tekintnk.
2. Ezutn a program sszevonja, vagyis kzs klaszterbe egyesti az egymshoz
legkzelebbi kt szemly klasztert (1. lps).
3. Ezutn a program lpsrl-lpsre sszevonja az egymshoz legkzelebbi kt
klasztert. Ezen sszevons mdszert a feladatablakban llthatjuk be (alaprtelmezs: Ward-
fle mdszer). A lehetsgek az albbiak:
- tlagos tvolsg mdszere: ekkor az a kt klaszter kerl sszevonsra, amely
esetben a kt klaszterbe tartoz szemlyek tlagos tvolsga a legkisebb.
- Minimlis tvolsg (legkzelebbi szomszd) mdszere: ekkor az a kt klaszter
kerl sszevonsra, amely esetben a legkisebb a kt klaszter egymshoz
legkzelebb lv kt szemlynek a tvolsga.
- Maximlis tvolsg (legtvolabbi szomszd) mdszere: ekkor az a kt klaszter
kerl sszevonsra, amely esetben a legkisebb a kt klaszter egymstl
legtvolabb lv kt szemlynek a tvolsga.
- Centroid mdszer: ekkor az a kt klaszter kerl sszevonsra, amely esetben a kt
klaszter centroidjnak (tlagvektornak) a tvolsga a legkisebb.
- Medin mdszer: ekkor az a kt klaszter kerl sszevonsra, amely esetben a kt
klaszterbe tartoz szemlyek tvolsgainak a medinja a legkisebb.
- Ward-fle mdszer (csak euklideszi tvolsggal): ekkor az a kt klaszter kerl
sszevonsra, amely esetben a kt klaszter sszevonsval a legkisebb mrtkben
n a klaszterek sszheterogenitsa (ESS = error sum of square = ngyzetes
sszhiba). Az sszheterogenitst gy hatrozzuk meg, hogy minden klaszter esetn
kiszmtjuk a klaszterbe tartoz szemlyek klasztercentroidtl val tvolsgainak
ngyzetsszegt, majd ezeket sszeadjuk. Rviden: ennl a mdszernl minden
lpben azt a kt klasztert vonjuk ssze, amely esetben az ESS nvekeds
(ESSnv.) a legkisebb.
A ROPstat statisztikai menrendszere
24

- Bta flexibilis mdszer: ez egy viszonylag bonyolult, de nha igen sikeres


klasszifikcit eredmnyez sszevonsi mdszer (a rszletekrl lsd Bergman
MagnussonEl-Khouri [2003] 67. old.).
4. A program minden lpsben feltnteti az sszevons lpst, az adott lpsben
ltez klaszterek szmt (KL#), az ESS nvekedst (ESSnv.), a megmagyarzott variancia-
arnyt (EESS%), egy sor ms klaszter adekvcis mutatt (PB, XBmod, SC, HCtlag, HC-
terjedelem; v. VarghaBergmanTakcs [2016], TakcsMakraiVargha [2015], illetve
VarghaBorbly [2016]), valamint az sszevonsra kerl kt klaszter kdjt s a kd utn
zrjelben a klaszter elemszmt.
EESS% az euklideszi tvolsgmrtk esetn rtelmes s jelzi az adott lpsben az
osztlyozs, vagyis a klaszterstruktra jsgt. rtkt gy definiljuk, hogy sszevetjk az
adott osztlyozs sszheterogenitst (ESS) s a lehet legnagyobb sszheterogenitst
(ESSmax), amelyet nyilvn akkor kapunk, amikor minden szemlyt egyetlen nagy kzs
klaszterben egyestnk. Kplettel:

EESS% = 100(ESSmax ESS)/ESSmax.

EESS% rtke fgg az elemzsbe bevont vltozk szmtl (tbb vltoz esetn
ltalban kisebb) s az sszelemszmtl (nagyobb minta esetn ltalban kisebb). Sikeres
osztlyozs esetn EESS% rtke elri a 0,65-s szintet. A klaszterkd a klaszterbeli
szemlyek kzl a legkisebb sorszm, vagyis amelyik az adattblzatban a klaszterbeli
szemlyek kzl a legfell foglal helyet.
5. Az utols lpsben a program minden szemlyt egyetlen nagy kzs klaszterben
egyest.
A feladatablakban krhet, hogy program listzza ki a klaszterek fbb jellemzit
(klaszternagysg, vltoznknt tlag, szrs, minimum s maximum), tovbb a klaszterbeli
szemlyek tlagos tvolsga (HC=homogenitsi egytthat).
A kapott hierarchikus klaszterstruktrn a struktra tovbbi optimalizlsa cljbl
relokcis elemzs (K-kzpont klaszteranalzis) is vgrehajthat. Ebben az elemzsben a
kilistzsra krt minimlis klaszterszmot (alaprtk: 5) fixen tartva addig cserlgetjk a
klnbz klaszterek elemeit egyms kztt, amg EESS% rtke nvelhet. Ez utn a
program kilistzza a klaszterek alapstatisztikit, a standardizlt tlagok tblzatt, valamint a
standardizlt tlagok mintzatt, melybl kiolvashat, hogy az egyes klaszterek mely vltozk
szerint trnek el leginkbb flfele (M) vagy lefele (A) az tlagostl.

Relokci: nemhierarchikus k-kzpont klaszteranalzis


A ROPstat statisztikai menrendszere
25

Ebben a modulban relokcis elemzs, vagyis K-kzpont (K-means) klaszteranalzis


vgezhet (v. BergmanMagnussonEl-Khouri [2003] 4. fejezet s 115-117. old., Szkelyi
Barna [2003] 3. fejezet, VarghaTormaBergman [2015]). Tbb itercis lpsben a program
megprblja az esetek egyik klaszterbl a msikba val thelyezsvel a klasztereket minl
homognebb alaktani. Az elemzshez meg kell adni vagy a klaszterszmot, vagy egy olyan
vltozt, amely tartalmazza az esetek indul klaszterbesorolst. Ha nem adunk meg kezdeti
klasztervltozt, akkor a program elszr a Ward-fle mdszerrel hierarchikus elemzst vgez
s megll abban a lpsben, amikor elri a feladatablakban megadott klaszterszmot. A
relokcis elemzs ez utn kezddik. A program hasonl eredmnyeket listz ki, mint a
nemhierarchikus elemzs relokci utn. Ha olyan kezdeti klasztervltozt adunk meg,
melynek 0 rtke is van (egy vagy tbb esetre), akkor a program nem vgez klaszterelemzst,
csak a 0 kd eseteket sztosztja (besorolja) a tbbi kd ltal meghatrozott klaszterekbe,
minden szemlyt a hozz legkzelebbi nem 0 kd klaszterbe tve be.
Ebben a modulban lehetsg van arra is, hogy a program tesztelje, vajon a kapott
klaszterstruktra jobb-e, mint egy vletlenszeren sszelltott adatllomnybl ltrehozott
struktra. Ez oly mdon trtnik, hogy a program egyms utn, egymstl fggetlenl
tbbszr (a fggetlen ismtlsek szma bellthat) ltrehoz egy random adatllomnyt,
elvgez azon egy K-kzpont klaszteranalzist s kiszmtja a kapott megoldshoz tartoz
klnbz klaszter adekvcis mutatk (QC-k) rtkt. A randomizls trtnhet gy, hogy a
program egyms utn, egymstl fggetlenl tbbszr vletlenszeren sszekeveri a
vltozoszlopok adatait az oszlopokon bell (random permutci), vagy a program maga
generl random egyenletes vagy normlis eloszls fggetlen vltozkat. Ezutn a program
egymints t-prbval teszteli, hogy a vletlenszer besorolsokkal nyert QC-rtkek
szignifiknsan kisebbek-e, mint az eredeti adatokon vgrehajtott klaszterelemzs QC-rtkei.
A program minden QC-re kiszmtja a MORI relatv javulsi arnyt is (v. VarghaBergman
Takcs [2016], VarghaBorbly [2016]).

Konfigurcianalzis (CFA)
Ezzel a modullal diszkrt vltozk tipikus s atipikus rtkkombinciinak
azonostsa vgezhet el. E modul vlasztsa esetn a program a vletlennl szignifiknsan
gyakrabban s ritkbbal elfordul rtkszekvencikat azonostja binomilis prbval. A
program minden rtkszekvencinak meghatrozza a gyakorisgt s teszteli, hogy ez az rtk
szignifiknsan eltr-e attl a gyakorisgtl, amelyet akkor kapnnk, ha a kijellt diszkrt
vltozk fggetlenek lennnek egymstl (v. von EyeMairMun [2010], VarghaTorma
Bergman [2015]).
A ROPstat statisztikai menrendszere
26

A CFA tulajdonkppen egy srsdspont-elemzs kvalitatv vltozkkal, hiszen a


szignifikns rtkszekvencik az input diszkrt vltozk tbbdimenzis ternek azon pontjai
(a tpusok), ahol a vrtnl tbben tmrlnek. Azok a pontok pedig, ahol pedig a fggetlensg
esetn vrtnl szignifiknsan kevesebben vannak (az antitpusok), azok e tr fekete lyukaiknt
rtelmezhetk.

ExaCon
Ezen elemzs clja ktszempontos gyakorisgi tblzatok cellinak elemzse egzakt
prbkkal. Ebben a modulban a fggetlensg esetn elvrtnl szignifiknsan nagyobb s
kisebb cellagyakorisgok azonosthatk (v. BergmanMagnussonEl-Khouri [2003] 5.
fejezet s 125-127. old.). Ezzel az elemzssel meg lehet vizsglni pldul, hogy klnbz
klaszterkd vltozk ltal kpviselt klaszterezsek milyen mrtkben fedik t egymst. A
hasonlsg egyik mrtke a RAND s a korriglt RAND (ARAND) egytthat, melyeket a
program mindig kiszmt. Az ExaCon elemzs emellett arra is alkalmas, hogy megvizsgljuk
egy kapott kedveznek tn klasztermegolds kapcsolatt az adatllomny egyb diszkrt
vltozival (pl. nemmel, iskolai vgzettsggel, letkori szinttel stb.).

Centroid
Ennek a modulnak a segtsgvel sszehasonlthat kt klnbz klasztervltoz
tlagmintzata, n. centroidja (v. BergmanMagnussonEl-Khouri [2003] 5. fejezet s 125-
126. old.). A program ennek rdekben kiszmtja a kt klasztervltoz ltal definilt
klaszterek centroidjai kzti pronknti tvolsgokat (ASED mrtkkel) s sorba rendezi
ezeket, amibl megllapthat, hogy a kt megolds mely klasztereinek kzppontjai esnek
egybe.
A modul elemzse arra is alkalmas, hogy megnzzk: egyetlen klasztervltoz
tlagmintzata egy csoportost vltoz ltal definilt tbb klnbz csoportban (pl.
frfiaknl s nknl) mennyire ugyanaz, illetve eltr.

DensePoint: sssdspont-elemzs
Ezzel a modullal olyan szemlyek azonosthatk, akiknek sok szomszdjuk van. A
szomszdsgot egy bellthat kszbrtk (szomszdsg kszbe) segtsgvel definiljuk.
Brmely szemly (eset) szomszdsga azon szemlyek egyttese, akik az illet szemlytl a
megadott kszbnl nem nagyobb tvolsgra vannak. A tvolsgmrtk tpusa a
feladatablakban bellthat. Ez lehet a szoksos euklideszi tvolsg (kt szemly esetn a
kijellt vltozk rtkeire az sszetartoz rtkprok tlagos ngyzetes eltrse), vagy az
A ROPstat statisztikai menrendszere
27

rtkmintzatok Pearson-fle korrelcija (kt szemly esetn a kijellt vltozk rtkeire az


sszetartoz rtkprok kzti Pearson-korrelci). A feladatablakban krhet a tvolsgok
kiszmtsa esetn a vltozk standardizlsa, mely felttlenl indokolt abban az esetben,
amikor az elemzsre kivlasztott vltozk klnbz dimenzijak. A tvolsg
kiszmtsakor lehetsg van arra is, hogy a program a vltozkat klnbz mrtkben
slyozza.
A program elszr is meghatrozza, hogy az adott mintban az adott felttelek mellett
minden szemlynek hny szomszdja van, majd ezeknek elkszti a gyakorisgi eloszlst.
Ezutn a program ezen eloszls alapjn kivlasztja a legtbb szomszddal rendelkez
szemlyeket gy, hogy ezek szma sszesen ne haladja meg a srsdspontok maximlis
szmt, mely a feladatablakban llthat be (alaprtk: 15). Ezen szemlyek adatsort
(adatvektort) nevezzk srsdspontnak. Ha kt srsdspont nagyon kzel van
egymshoz (a srsdspontok sszevonsi kszbe szintn a feladatablakban llthat be),
akkor a program sszevonja ket. Az j srsdspont ezek tlaga (tlagvektora) lesz. Ha
kijellnk egy kontroll klasztervltozt, akkor a program megadja, hogy az ezen vltoz ltal
meghatrozott klnbz klaszterekbe az azonostott srsdspontok szomszdsga milyen
mrtkben esik bele. Ezzel a ms elemzsekben ltrehozott klaszterek altpusai (prototpusai)
azonosthatk.
A srsdspont-elemzssel kapcsolatban lsd mg Vargha [2008].

Idszeparci
Ezen modul segtsgvel az ismtelt mrsek vltozegyttese feldarabolhat az
idpont alapjn kln rekordokra, mintha azok fggetlen megfigyelsek lennnek. Az egy
idpontban felvett adatok ekkor kln rekordba, vagyis az adattblzat kln soraiba kerlnek
(kln esetknt lesznek szmon tartva). Az elemzs vgrehajtshoz els lpsben az
idpontok szmt (T) s az egy idponthoz tartoz vltozk szmt (V) kell megadni. Ezutn
minden idponthoz megjelenik egy vltozablak, amelybe be kell tenni az idetartoz
vltozkat. Ez hromflekppen hajthat vgre.
(1) Ha az tteend vltozk (sszesen TV darab vltoz) a vltozk listjban olyan
sorrendben helyezkednek el, hogy idpontonknt ugyanolyan sorrendben egyms
mellett vannak a megfelel vltozk (pl. testsly, testmagassg, fejkerlet s lbmret
6 ves korban, 8 ves korban, 10 ves korban stb.), akkor ezeket egytt mind kijellve
a Vltozk egytt felirat ikonablakra kell kattintani ahhoz, hogy mind a helykre
kerljenek.
A ROPstat statisztikai menrendszere
28

(2) Ha az tteend vltozk a vltozk listjban olyan sorrendben helyezkednek el, hogy
egyms mellett vannak egy-egy vltoz klnbz idpontokhoz tartoz mrsei (pl.
testsly 6, 8 s 10 ves korban, testmagassg 6, 8 s 10 ves korban, fejkerlet 6, 8 s
10 ves korban stb.), akkor ezeket egytt mind kijellve az Idpontok egytt felirat
ikonablakra kell kattintani ahhoz, hogy minden kijellt vltoz a helyre kerljn.
(3) Minden ms esetben a vltozkat egyenknt vagy kisebb csoportokban kell a
megfelel idpont ablakba betenni, a kvetkez szablyok figyelembevtelvel.
- Elszr r kell kattintani arra az idpontablakra, ahova a kijellt vltozt
(vltozkat) t akarjuk tenni. E kattintsra az adott idpontablak srga sznnel
kijelldik.
- Ezutn ki lehet jellni maximlisan V szm vltozt.
- Vgl r kell kattintani az Egy idpont egyszerre felirat ikonablakra.
Ha mondjuk 5 attitdvltozt mrnk 3 alkalommal (3 egymst kvet hnapban) s
ez a 15 vltoz szerepel esetlegesen ms vltozk trsasgban minden szemly
adatsorban, akkor ezzel az idszeparcis elemzssel ltrehozhatunk egy olyan j
adattblzatot, melyben a klnbz idpontok 5-5 adata kln sorokban, kln esetekknt
szerepel. Az j adatllomny gy 3-szor annyi sorbl (esetbl) ll. Az 5 vltozval klnbz
elemzsek vgezhetk (pl. klaszteranalzis), mely az adatllomny mrsi idponttl
fggetlen struktrjt derti fel. Ugyanez a fjl tmenthet termszetesen SPSS-be s ott is
lehet relevns elemzseket (pl. faktoranalzist) vgezni. A klnbz idpontokhoz tartoz
adatok ismtelt egyestse az idegyests modul segtsgvel vgezhet el (lsd albb).

Idegyests
E modul segtsgvel az idszeparcival ltrehozott j fjlon vgzett elemzsek j
vltozi (pl. klasztervltozk) visszakerlnek egy eredetivel megegyez rekordstruktrj
fjlba. Ez alkalmat teremt arra, hogy pl. megvizsgljuk egy klaszterstruktra idbeli
stabilitst, illetve vltozst, valamint ugyanezt az egyes szemlyek vonatkozsban.
rdekes lehet azonostani a minden idpontban ugyanabba a klaszterbe tartoz szemlyeket s
megvizsglni jellemziket, vagy azokat, akik a legnagyobbat vltoztak a vizsglt idszakban.
Ezzel s az elz modullal knnyen vgrehajthat az ISOA komplex klasszifikcis elemzs
(v. BergmanNurmivon Eye [2012]) is.
A ROPstat statisztikai menrendszere
29

Irodalom

BARTKO, J. J. [1976]: On Various Intraclass Correlation Reliability Coefficients.


Psychological Bulletin, Vol. 83. No. 5, pp. 762765.
BERGMAN, L. R. MAGNUSSON, D. EL-KHOURI, B. M. [2003]: Studying individual
development in an interindividual context. A Person-oriented approach. Mahwa, New
Jersey, London: Lawrence-Erlbaum Associates.
BERGMAN L. R. NURMI J.-E. VON EYE , A. A. [2012]: I-states-as-objects-analysis (ISOA):
Extensions of an approach to studying short-term developmental processes by analyzing
typical patterns. International Journal of Behavioral Development, Vol. 36. No. 3, pp.
237246.
COHEN, J. [1992]: A power primer. Psychological Bulletin, Vol. 112. No. 1, pp. 155159.
LANDERS, R. N. [2015]: Computing intraclass correlations (ICC) as estimates of interrater
reliability in SPSS. The Winnower 2:e143518.81744. DOI: 10.15200/winn.143518.81744
NAGYBNYAI, N. O. [2006]: A pszicholgiai tesztek reliabilitsa. In: Rzsa Sndor,
Nagybnyai Nagy Olivr s Olh Attila (Szerk.): A pszicholgiai mrs alapjai. Elmlet,
mdszer s gyakorlati alkalmazs. ELTE, CD tanknyv, Budapest, 6. fejezet.
SZKELYI M. BARNA I. [2003]: Tllkszlet az SPSS-hez. Budapest: Typotex Kiad.
TAKCS, SZ. MAKRAI, B. VARGHA, A. [2015]: Klasszifikcis mdszerek mutati.
Psychologia Hungarica Caroliensis, 3. vf. 1. sz. pp. 6788.
VARGHA A. [1988]: Jogos-e tbbszempontos varianciaanalzist alkalmazni dichotm fgg
vltozk esetn? Pszicholgia, 8. vf. 3. sz. pp. 409-446.
VARGHA A. [1996]: Az egymints t-prba rvnyessge s javthatsga. Magyar
Pszicholgiai Szemle, 52. vf. pp. 317-345.
VARGHA A. [1999]: MiniStat 3.1 verzi. Felhasznli kziknyv. Plya Kiad, Budapest.
VARGHA A. [2000]: Matematikai statisztika pszicholgiai, nyelvszeti s biolgiai
alkalmazsokkal. PLYA KIAD. BUDAPEST.
VARGHA A. [2001]: Ksrleti helyzetek s csoportok sszehasonltsa j statisztikai
mdszerekkel. In: Plh Cs. Lszl J. Olh A. (szerk.), Tanuls, kezdemnyezs, alkots.
Budapest: ELTE Etvs Kiad, 371386.
VARGHA A. [2002]: Fggetlen mintk egyszempontos sszehasonltsa j rangsorolsos
eljrsok segtsgvel. Statisztikai Szemle, 80. vf. 4. sz. pp. 328353.
VARGHA A. [2004]: A ktszempontos sztochasztikus sszehasonlts modellje. Statisztikai
Szemle, 82. vf. 1. sz. pp. 6782.
A ROPstat statisztikai menrendszere
30

VARGHA A. [2005]: Sokasgok sszehasonltsa j mdszerekkel. Statisztikai Szemle, 83. vf.


5. sz. pp. 429448.
VARGHA A. [2007]: Matematikai statisztika pszicholgiai, nyelvszeti s biolgiai
alkalmazsokkal (2. kiads). Plya Kiad. Budapest.
VARGHA A. [2008]: j statisztikai mdszerekkel j lehetsgek: a ROPstat a pszicholgiai
kutatsok szolglatban. Pszicholgia. 28. vf. 1. sz. pp. 81103.
http://dx.doi.org/10.1556/Pszi.28.2008.1.5
VARGHA A. [2011]: A parcilis korrelcis egytthat rtelmezsi problmi a tbbdimenzis
normalits felttelnek srlse esetn. Statisztikai Szemle, 89. vf. 3. sz. pp. 275-293.
VARGHA, A. BERGMAN, L. R. [2012]: A method to maximize the information of a
continuous variable in relation to a dichotomous grouping variable: Cutpoint Analysis.
Hungarian Statistical Review, Vol. 90, Special Number 16, pp. 101122.
http://www.ksh.hu/statszemle_archive/2012/2012_K16/2012_K16_001.pdf
VARGHA, A. BERGMAN, L. R. TAKCS, S. [2016]: Performing cluster analysis within a
person-oriented context: Some methods for evaluating the quality of cluster solutions.
Journal for Person-Oriented Research, Vol. 2. No 12. pp. 7886.
http://www.personresearch.ouradmin.se/articles/volume2_1_2/filer/5.pdf
VARGHA, A. BORBLY, A. [2016]: Modern mintzatfeltr mdszerek alkalmazsa a
ktnyelvsg kutatsban. In: Kissn Viszket M. Pusks-Vajda Zs. Rcz J. Tth V.
(szerk.) [2016]. A pszicholgiai tancsads perspektvi. Tisztelg ktet Ritok Magda 80.
szletsnapjra. LHarmattan, Budapest, pp. 173-186.
VARGHA A. CZIGLER B. [1999]: A MiniStat statisztikai programcsomag: 3.2 verzi. Plya
Kiad, Budapest.
VARGHA, A. DELANEY, H. D. [1998]: The Kruskal-Wallis test and stochastic homogeneity.
Journal of Educational and Behavioral Statistics, Vol. 23, No 2, pp. 170-192.
VARGHA A. IZS L. [1989]: PSZICHOSTAT statisztikai programcsomag felhasznli fzet
(Commodore-64 vltozat). Munkagyi Kutatintzet, Budapest.
VARGHA, A. TORMA, B. BERGMAN, L. R. [2015]: ROPstat: A general statistical package
useful for conducting person-oriented analyses. Journal for Person-Oriented Research.
Vol. 1. No. 12. pp. 8798.
von Eye, A. Mair, P. Mun, E.-Y. [2010]: Advances in Configural Frequency Analysis. New
York: Guilford Press.

You might also like