You are on page 1of 26

Matematikai alapok s

valsznsgszmts
Statisztikai vltozk
Adatok megtekintse

Statisztikai vltozk

A statisztikai elemzsek sorn a vizsglati, vagy megfigyelsi


egysgeket klnbz jellemzk mentn vizsgljuk, adatokat
gyjtnk (pl. az iskolai vgzettsg s a kreativits).
Ezek a jellemzk ltalban vizsglati egysgrl vizsglati egysgre
vltoznak, ezrt ezeket statisztikai vltozknak nevezzk.

Adatmtrix
Nem

Iskolai
vgzettsg

Szemly 1

Frfi

alapfok

95

190

Szemly 2

Frfi

felsfok

123

173

Szemly 3

alapfok

111

178

Szemly 4

kzpfok

109

162

Szemly 5

Frfi

kzpfok

130

169

Szemly 6

posztgradulis

95

165

Szemly 7

Frfi

felsfok

104

184

Intelligencia Testmagassg

Adatmtrix
A statisztikai vltozk rtkeirl beszlnk, s ezeket az rtkeket
konvencionlisan szmokkal reprezentljuk.
Nem

Iskolai
vgzettsg

Intelligencia

Testmagassg

Szemly 1

95

190

Szemly 2

123

173

Szemly 3

111

178

Szemly 4

109

162

Szemly 5

130

169

Szemly 6

95

165

Szemly 7

104

184

Statisztikai vltozk tpusai I.


Szmoknak szmos klnbz tulajdonsga van:
Sorba rendezhetk
sszegk is rtelmes
Hnyadosuk is rtelmes

A statisztikai vltozk megklnbztethetk aszerint, hogy a fenti


tulajdonsgok kzl melyekkel rendelkeznek!
Ez alapjn ngy n. mrsi sklrl beszlhetnk statisztikai
vltozk esetn.

Nominlis skla
A vltoz a szmok egyetlen tulajdonsgval sem rendelkezik


Kit kedvel a leginkbb a kvetkez festk kzl?


1.

Dal

2.

Klimt

3.

Van Gogh

4.

Da Vinci

Biolgiai nem
1.

Frfi

2.

Milyen cigarettt szv?

Ordinlis skla
A szmok tulajdonsgai kzl rendelkezik a sorba
rendezhetsggel.


Pl. Iskolai vgzettsg:


1.

Alapfok, vagy az sem

2.

Kzpfok

3.

Felsfok

4.

Posztgradulis

Ordinlis skla esetn igaz az, hogy 1<2<3<4


DE: nem mondhatjuk, hogy: 2-1=4-3

Intervallum skla
rtkei sorba rendezhetk s sszegk (klnbsgk) is rtelmes.
 Intelligencia teszten elrt pontszmok
Sorba rendezhet: 99<100<101
A klnbsgk rtelmes: 75-70=120-115
DE: az arnyuk mr nem rtelmezhet:
NEM mondhatjuk, hogy a 90-es IQ a 180-as IQ fele

Arny skla
A vltoz rtkei sorba rendezhetk, klnbsgk s arnyuk is
rtelmes
 Testmagassg
Sorba rendezhet: 160<170<171
A klnbsgk rtelmes: 75-70=190-185
Az arnyuk is rtelmes: 80cm ppen 160cm fele

Skla-tpusok sszefoglalsa

sorbarendezhet

klnbsg
rtelmes

arny
rtelmes

nominlis

nem

nem

nem

ordinlis

igen

nem

nem

intervallum

igen

igen

nem

arny

igen

igen

igen

Statisztikai vltozk tpusai II.


Az alapjn, hogy hny klnbz rtket vehet fel egy adott vltoz
kt tpust klnbztethetnk meg:

Diszkrt vltoz: vges szm klnbz rtket vehet fel, s


az rtkek egymstl jl elklnlnek.
Pl.: iskolai vgzettsg, csaldi llapot

Folytonos vltoz: rtkei folytonosan helyezkednek el.


Pl.: reakciid, testmagassg

Statisztikai vltozk tpusai III.


Attl fggen, hogy szmszersthet-e egy adott vltoz szintn kt
tpust klnbztethetnk meg:


Kvalitatv vltoz: br a vltoz rtkei szmokk


konvertlhatk, m ezek a szmok nem rendelkeznek a szmok
egyetlen tulajdonsgval sem. A vltoz rtkei nem
szmszersthet minsget fejeznek ki.
Pl.: biolgiai nem, csaldi llapot

Kvantitatv vltoz: A vltoz rtkei szmszersthet


minsget fejeznek ki.
Pl.: reakciid, testmagassg

Statisztikai vltozk tpusai


Sklatpus?
Kvalitatv vagy kvantitatv vltoz?
Diszkrt vagy folytonos vltoz?

Dohnyzsi szoksokat mr krdv alapjn a fggsg


szmszerstett mrtke (20 fok skln).

Dohnyzssal tlttt id naponta

Milyen cigarettt szv?

Dohnyzik?
Gyakran, ritkn, soha.

A vltozk eloszlsa a populciban s a


mintban


Az adatmtrixbl minden szemlyrl szmos informcit


leolvashatunk
pl. neme, vgzettsge, depresszi mrtke

Alapveten azonban a populci rdekel bennnket


pl. mekkora hnyada milyen nem, vgzettsg, depresszi tekintetben milyen
az eloszls

Adataink azonban csak a mintrl vannak, ennek szerepe, hogy


segtsgvel becsljk a populci jellemzit. Minl
reprezentatvabb a minta, annl sikeresebb a becslsnk
pl. mekkora hnyada milyen nem, vgzettsg, depresszi tekintetben milyen
az eloszls

Ler statisztikk
Vizsglataink sorn teht krdseket fogalmazunk meg, meghatrozzuk azon
populcit, amelyre az rdekldsnk irnyul, majd a sokasgbl mintt vesznk
(lehetleg nagyszm, vletlen mintt) s a mintba kerlt megfigyelsi
egysgeinkrl adatokat gyjtnk klnbz statisztikai vltozk (a megfigyelsi
egysgek jellemzi, ismrvei) mentn.
Az sszegyjttt adatokat adatmtrixban rgztjk, melyben jellemzen egy
megfigyelsi egysg (eset) egy sor, mg az egyes oszlopok egy-egy vltozt
reprezentlnak.
Minthogy azonban az idelis minta nagyszm megfigyelsi egysget tartalmaz, az
adatmtrix ltalban tlontl terjedelmes ahhoz, hogy egyszer megtekints tjn
megllapthassuk az adatok lnyeges tulajdonsgait.
Az adatok lnyeges ismrveinek jellemzsre, lersra n. ler statisztikkat
hasznlunk. Erre a clra hasznlhatunk:
Grafikus mdszereket
Az adatokbl szmolt sszegz statisztikkat

Gyakorisgi eloszls (nominlis vltoz)


Egy vltoz jellemezhet azzal, hogy klnbz rtkei hnyszor, milyen
gyakran fordulnak el az adott mintban. A gyakorisgi eloszls ppen ezt,
a vltoz rtkeinek gyakorisgt fejezi ki.
Pl. Etnikai hovatartozs
1.
2.
3.
4.
5.
6.
7.

Latin
Fehr
zsiai
Afrikai
Indin
Multietnikai
Egyb

gyakorisg relatv gyakorisg


135
309
5
9
9
13
38

.26
.60
.01
.02
.02
.03
.07

szzalk
26 %
60 %
1%
2%
2%
3%
7%

Oszlopdiagram

Oszlopdiagram

Gyakorisgi eloszls (ordinlis vltoz)


Pl. iskolai vgzettsg:
gyak
kzpiskola
2 v fiskola
4 v fiskola
master
PhD

210
118
143
38
10

rel. gyak.
.40
.23
.28
.07
.02

kum. gyak.

40
23
28
7
2

210
328
471
509
519

Kum. %
40
63
91
98
100

Oszlopdiagram

Gyakorisgi eloszls (folytonos vltoz)


Pl. naponta elszvott cigarettk
szma
rtk
1
2
4
5
6
7
8
9
10
12
14
15
16
17
18
20

gyakorisg
1
2
5
7
4
2
2
1
35
14
2
36
2
1
12
138

rtk
22
23
24
25
28
29
30
32
33
35
40
45
50
60
65
80

gyakorisg
6
1
2
53
1
2
75
1
1
23
54
11
16
11
1
1

Oszlopdiagram
Folytonos vltozk esetn az
oszlopdiagram nem a megfelel
megolds az adatok grafikus
megjelentsre, mert a vltoznak
tl nagyszm rtke van, amelyek
gyakorisga meglehetsen kicsi
lesz, mg nagy minta esetn is.

Hisztogram
Az rtkeket intervallumokba soroljuk,
s az egyes intervallumokba es rtkek
gyakorisgra koncentrlunk. Ha pl. a
naponta elszvott cigarettk szmt 8
intervallumba (1-10, 11-20, 21-30,,
71-80) soroljuk, a balra lthat
hisztogramot kapjuk.

Hisztogram
Az intervallumok szma (bizonyos
hatrok kztt) nknyesen
megvlaszthat, azonban a tl sok
vagy tl kevs intervallum sem j,
mivel az elbbi esetben nem
tmrtjk kellkppen az
informcit, mg az utbbi esetben
pedig ppen fordtva, olyannyira
tmrtjk, ami mr
informcivesztst okozhat.

A srsgfggvny


Mint lttuk, a folytonos vltozk mintabeli eloszlst hisztogrammal


reprezentljuk, de ha a folytonos vltozk populcibeli eloszlst
tekintjk, azt legjobban az n. srsgfggvnnyel lehet lerni.
A srsgfggvny jellemzi:
 X vltoz minden x rtkhez egy nem negatv szmot rendel
(ez a szm nagyobb azon x-ek kzelben, ahol az adatok jobban
srsdnek)
 Az egy-egy szakaszra es terlet a populci ezen szakaszra
es arnyt adja meg
 A srsgfggvny alatti sszterlet 1, azaz 100%
 ms nven eloszlsgrbnek is nevezzk

Plda srsgfggvnyre

-3

-2

-1

t-eloszls (df=3)

You might also like