You are on page 1of 14

1

Statistiek 1
Korte inleiding
2
Waaruit bestaat Statistiek
1. Beschrijvende statistiek = data analyseren

2. Kansrekenen = rekenen met kansen en
bestuderen van kanstheoretische modellen

3. Inductieve/verklarende statistiek: op basis van
verzamelde gegevens uit een deel van de
populatie (= steekproef) een uitspraak doen
over de ganse populatie met behulp van
kansrekenen
3
Deel 1: Beschrijvende Statistiek
Univariate gegevensanalyse: n kenmerk apart
bestuderen

Bivariate gegevensanalyse: twee kenmerken
tezamen bestuderen + samenhang ontdekken

Afspraak
De gegevens zijn op een correcte manier vergaard.
4
1.1 Soorten gegevens/variabelen
Kan er zinvol gerekend worden met de gegevens?
Kwantitatieve gegevens
nominale ordinale
JA NEE
Kunnen de gegevens
zinvol geordend worden?
JA
NEE
Kwalitatieve gegevens
5
1.2 Verwerken van kwantitatieve gegevens
1.2.1 Individuele gegevens
tevredenheid
gsm
% aantal
gezinnen
helemaal niet
tevreden
10%
Redelijk
tevreden
25%
Gewoon
tevreden
40%
Heel
tevreden
15%
Super
tevreden
10%
6
1.2 Verwerken van kwantitatieve gegevens
1.2.1 Individuele gegevens
1
35%
2
23%
3
15%
4
5%
0
22%
verschillende
gegevens
(x
i
)
0
1
2
3
4
totaal
i
i
n
f
n

1

k
i
i
n n

1
1
k
i
i
f

Aantal gsms per gezin


k = het aantal verschillende gegevens
n = het totaal aantal gegevens
0 en 0 1
i i
n n f
relatieve
frequentie
(f
i
)
0.22
0.35
0.23
0.15
0.05
1
absolute
frequentie
(n
i
)
n = 500
7
verschillende
gegevens (x
i
)
relatieve
frequentie (f
i
)
0 0.22
1 0.35
2 0.23
3 0.15
4 0.05
totaal 1
1.2.1 Individuele gegevens: cumulatieve frequentie
verdelingsfunctie
Definitie: F(x) = het relatief aantal gegevens x; met x elk reel getal
De empirische verdelingsfunctie van kwantitatieve
gegevens
cumulatieve
relatieve
frequentie (F
i
)
8
verschillende
gegevens (x
i
)
cumm.
freq. (F
i
)
0 0.22
1 0.57
2 0.80
3 0.95
4 1
Verdelingsfunctie van individuele gegevens: aantal gsms
9
Verdelingsfunctie van individuele gegevens
algemeen (p.9)
De grafiek van de empirische verdelingsfunctie van de geordende
gegevens met relatieve frequenties is een
trapfunctie die nergens dalend is en waarbij:

1 2
, , ,
k
x x x
1 2
, , ,
k
f f f
1
( ) 0 voor elke F x x x
( ) 1 voor elke
k
F x x x
1
1
( ) ( ) voor elke
i
i j i i
j
F x F x f x x x

1
( ) ( )


i i
F x F x
= de grootte van de sprong bij x
i

f
i
0
1
10
1.2.2 Gegroepeerde kwantitatieve gegevens
Klassen K
i
f
i

[0, 5] 0.08
]5, 15] 0.24
]15, 30] 0.33
]30, 50] 0.30
]50, 100] 0.05
Totaal 1

i
i
i
f
h relatieve frequentiedichtheid
b

Oppervlakte rechthoeken = rel. freq. f
i

Oppervlakte histogram = 1
b
i
f
i
/ b
i

11
1.2.2 Gegroepeerde kwantitatieve gegevens
Klassen K
i
f
i
F
i

[0, 5] 0.08
]5, 15] 0.24
]15, 30] 0.33
]30, 50] 0.30
]50, 100] 0.05
Totaal 1
Definitie: F(x) = het relatief aantal gegevens x; met x elk reel getal
12
De grafiek van de empirische verdelingsfunctie van gegroepeerde
gegevens in k aaneensluitende klassen met relatieve
frequenties is een continue functie die nergens dalend is
en waarbij:
Verdelingsfunctie van gegroepeerde gegevens
algemeen (p.14)
1 2
, , ,
k
K K K
1 2
, , ,
k
f f f
1
( ) 0 voor elke het beginpunt van de eerste klasse F x x K
( ) 1 voor elke het eindpunt van de laatste klasse
k
F x x K
1
(eindpunt )
i
i j
j
F K f

(eindpunt ) (beginpunt )
i i i
F K F K f
Binnen een klasse K
i
is de grafiek een lijnstuk dat de verbindingslijn is tussen
de punten (beginpunt Ki,F(beginpunt K
i
)) en (eindpunt K
i
, F(eindpunt K
i
))
en
Eigenschap: het relatief aantal gegevens in ]a,b] = F(b) F(a)
1
0
13
Kwantiele bij gegroepeerde gegevens
Het eerste kwartiel q
1
is die x-waarde waarvoor F(x) = 0.25


De mediaan Me = het tweede kwartiel q
2
= die x-waarde waarvoor F(x) = 0.5


Het derde kwartiel q
3
is die x-waarde waarvoor F(x) = 0.75


Het p
de
percentiel is x-waarde waarvoor F(x) = p / 100


1
1
(0.25) q F

1
(0.5) Me F

1
3
(0.75) q F

1
( /100)
p
P F p

14
Verdelingsfunctie en histogram
rel.freq. dichtheid
0
0,005
0,01
0,015
0,02
0,025
0,03
0 10 20 30 40 50 60 70 80 90 100
x
a

You might also like