Professional Documents
Culture Documents
Hoofdstuk 2: Kansverdelingen en
kansberekening
Hoofdstuk 2: Kansverdelingen en
kansberekening
2
VANDAAG
Kansverdelingen en kansberekening
Hoe waarschijnlijk is het om een “3” te gooien met 1 worp van een
dobbelsteen?
-> P(3) = 1/6 (of 0.1666)
of nog:
Hoofdstuk 2: Kansverdelingen en
kansberekening
4
WAAROM KANSEN?
Waarom kansen nodig in statistiek?
Soorten vragen:
1. Interval-estimatie
2. Hypothesetoetsing
Hoofdstuk 2: Kansverdelingen en
kansberekening
5
WAAROM KANSEN?
1. Interval-estimatie
• Vraag: Wat is het gemiddelde IQ van alle kinderen in het 1e jaar secundair
onderwijs die 1 of meerdere jaren blijven zitten zijn in het basisonderwijs?
• Antwoord op basis van gegevens uit steekproef: “Het gemiddelde IQ van alle
kinderen in het 1e jaar SO die 1 of meerdere jaren blijven zitten zijn in het
BaO ligt tussen X1 en X2 met 95% zekerheid.”
• Betekenis: Indien je steeds deze bewering aanhoudt, dan weet je dat je in
5% van de gevallen fout zal zijn OF de kans op een fout is 0.05 -> zegt iets
over nauwkeurigheid van de schatting van de populatieparameter op basis
van de steekproefgegevens
• Nodig: Steekproefstatistieken (gemiddelde, standaardafwijking, grootte
steekproef) + Kansverdeling
Hoofdstuk 2: Kansverdelingen en
kansberekening
6
WAAROM KANSEN?
2. Hypothesetoetsing
• Hypothese: Het IQ van leerlingen in het 1e jaar SO die 1 of meerdere jaren in het
BaO zijn blijven zitten (populatie 1) is gelijk aan het IQ van leerlingen 1e jaar SO
die niet zijn blijven zitten (populatie 2).
• Antwoord op basis van gegevens uit steekproef: “We verwerpen deze hypothese”
of “We kunnen deze hypothese niet verwerpen”.
• Nodig: Steekproefstatistieken (gemiddelde, standaardafwijking, grootte
steekproef) + Kansverdeling
• Waarom kansverdeling nodig? Stel dat we vinden dat IQ in steekproef 1 = 105 en
IQ in steekproef 2 = 115 .
• Hoe groot is de kans om dit verschil te vinden als er in werkelijkheid geen
verschil is tussen de twee populatiegemiddelden?
-> grote kans: hypothese niet verwerpen
-> kleine kans: hypothese verwerpen
Hoofdstuk 2: Kansverdelingen en
kansberekening
7
KANSEN
Relevante begrippen
Hoofdstuk 2: Kansverdelingen en
kansberekening
8
KANSVERDELING
Kansverdeling = combinatie van uitkomstenruimte met respectievelijke
kansen - overzicht van mogelijke waarden van een variabele en
bijhorende kansen
− bij dobbelsteen:
1,00
uitkomst kans
0,90
1 1/6 0,80
0,70
2 1/6
0,60
3 1/6 0,50
0,40
4 1/6
0,30
5 1/6 0,20
6 1/6 0,10
0,00
1 2 3 4 5 6
Hoofdstuk 2: Kansverdelingen en
kansberekening
9
KANSVERDELING
16
13,89 13,89
14
10
8,33 8,33
8
6 5,56 5,56
4
2,78 2,78
0
2 3 4 5 6 7 8 9 10 11 12
Hoofdstuk 2: Kansverdelingen en
kansberekening
10
KANSVERDELING
verschil:
frequentieverdeling bij geobserveerde waarden
kansverdeling bij theoretische waarden
Hoofdstuk 2: Kansverdelingen en
kansberekening
11
KANSVERDELING
Hoofdstuk 2: Kansverdelingen en
kansberekening
12
KANSVERDELING
Hoofdstuk 2: Kansverdelingen en
kansberekening
13
DE STEEKPROEVENVERDELING
Stel:
• We trekken uit een populatie een oneindig aantal steekproeven.
• Elke steekproef wordt gekenmerkt door een aantal steekproefstatistieken
zoals het gemiddelde. We krijgen dus een oneindig aantal
steekproefgemiddelden waarvan we een verdeling kunnen opstellen.
• Steekproevenverdeling van gemiddelde = alle mogelijke waarden van
steekproefgemiddelden samen met de kansen op die steekproefgemiddelden
• Daarna kunnen we dus de kans bepalen op het vinden van een bepaald
steekproefgemiddelde.
Hoofdstuk 2: Kansverdelingen en
kansberekening
14
populatie
steekproef
steekproeven-
verdeling
Hoofdstuk 2: Kansverdelingen en
kansberekening
15
DE STEEKPROEVENVERDELING
2 2 2 1/9 2 1/9
2 4 3 1/9
3 2/9
2 6 4 1/9
4 3/9
4 2 3 1/9
4 4 4 1/9 5 2/9
4 6 5 1/9 6 1/9
6 2 4 1/9
6 4 5 1/9
6 6 6 1/9
Hoofdstuk 2: Kansverdelingen en
kansberekening
16
DE STEEKPROEVENVERDELING
Verwachte waarde van steekproevenverdeling =
populatiegemiddelde
E( X ) = X =
(2 + 4 + 6)/3 = 4
(1/9 x 2) + (2/9 x 3) + (3/9 x 4) + (2/9 x 5) + (1/9 x 6) = 4
-> gemiddelde van de steekproef is een ‘zuivere schatter’ van het gemiddelde
van de populatie
Schatter: we schatten met behulp van het steekproefgemiddelde het
populatiegemiddelde
Zuiver: er zullen geen systematische afwijkingen zijn wanneer men kijkt naar
het gemiddelde van alle mogelijke steekproeven om de populatiegrootheid
te schatten
Hoofdstuk 2: Kansverdelingen en
kansberekening
17
DE STEEKPROEVENVERDELING
SE X = X = standaardafwijking van populatie
N
indien
steekproefgrootte niet
standaardafwijking van het gemiddelde gekend
10
Bij een steekproef van n = 300 SE X = = 0.58cm
300
10
Bij een steekproef van n = 700 SE X = = 0.38cm
700
Hoofdstuk 2: Kansverdelingen en
kansberekening
19
DE STEEKPROEVENVERDELING
Hoofdstuk 2: Kansverdelingen en
kansberekening
20
DE STEEKPROEVENVERDELING
Hoe groter de steekproef, hoe meer de normale verdeling benaderd wordt:
(vb: gooien van 1 dobbelsteen)
Hoofdstuk 2: Kansverdelingen en
kansberekening
21
DE STEEKPROEVENVERDELING
• Als de populatie waaruit men steekproeven trekt normaal verdeeld is, dan is
de steekproevenverdeling van het gemiddelde ook normaal verdeeld met
een verwachte waarde μ en een standaardafwijking / N .
• Als de populatie waaruit men een steekproeven trekt niet normaal verdeeld
is, maar de steekproeven zijn groot genoeg (N > 30), dan zal de
steekproevenverdeling bij benadering normaal verdeeld zijn met een
verwachte waarde μ en een standaardafwijking / N . (wat als N < 30?
zie later)
• Als σ niet gekend is, mag men σ vervangen door de standaardafwijking van
de steekproef als N > 100.
Hoofdstuk 2: Kansverdelingen en
kansberekening
22
DE STEEKPROEVENVERDELING
Wat is er nu zo cool aan de steekproevenverdeling van het
gemiddelde?
Aangezien:
− we het gemiddelde van deze verdeling kennen (µ)
− we de standaardafwijking van de verdeling kennen (
of indien σ niet gekend is en N>100 :
s ) N
N
− we weten dat ze normaal verdeeld is (als populatie normaal verdeeld
is of als N > 30)
0,4
Probability Density
0,3
0,2
0,1
0
-4 -3 -2 -1 0 1 2 3 4
Hoofdstuk 2: Kansverdelingen en
kansberekening
24
NORMALE VERDELING
0,3
0,25
Probability Density
0,2
0,15
0,1
0,05 6,43%
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Hoofdstuk 2: Kansverdelingen en
kansberekening
25
NORMALE VERDELING
−( X − )
f (X ) =
Formule: 1 2 2
e
2
f (X) = hoogte in curve
π = 3.14
e = 2.72
μ = mu = verwachte waarde, gemiddelde van de normale verdeling
-> bepaalt de plaats van het midden van de verdeling
σ = sigma = standaardafwijking van de verdeling, spreiding van scores
-> bepaalt hoe breed of smal de verdeling is (kleine sigma geeft smalle en hoge
curve; grote sigma geeft brede en lage curve)
Dus:
μ en σ bepalen de normaalverdeling
er zijn vele soorten normaalverdelingen (naargelang μ en σ )
Hoofdstuk 2: Kansverdelingen en
kansberekening
26
NORMALE VERDELING
Verschillende μ ,
gelijke σ
Y
-4 -2 0 2 4 6 8
X
Gelijke μ ,
verschillende σ
Y
-15 -10 -5 0 5 10 15
X
Hoofdstuk 2: Kansverdelingen en
kansberekening
27
NORMALE VERDELING
Hoofdstuk 2: Kansverdelingen en
kansberekening
28
NORMALE VERDELING
Hoofdstuk 2: Kansverdelingen en
kansberekening
29
NORMALE VERDELING
.3413 .3413
.0228 .0228
.1359 .1359
Hoofdstuk 2: Kansverdelingen en
kansberekening
30
NORMALE VERDELING
.3413 .3413
.0228 .0228
.1359 .1359
Standaardnormale verdeling
− Eén bepaald type normale verdeling
− Namelijk met μ = 0 en σ = 1
Hoofdstuk 2: Kansverdelingen en
kansberekening
32
STANDAARDNORMALE VERDELING
Hoofdstuk 2: Kansverdelingen en
kansberekening
33
STANDAARDNORMALE VERDELING
Hoe gaat dat in zijn werk?
x − X
z=
X
De verdeling is dan standaardnormaal en de kansen kunnen
afgelezen worden uit de tabel voor de standaardnormale
verdeling.
Hoofdstuk 2: Kansverdelingen en
kansberekening
34
STANDAARDNORMALE VERDELING
Stap 1:
x − X
z=
X
dus:
112 − 100
Z(IQ112) = = 0.8
15
Hoofdstuk 2: Kansverdelingen en
kansberekening
35
STANDAARDNORMALE VERDELING
Z = 0.80
P(z < 0.80) = 0.7881
P(z ≥ 0.80) = 1 – 0.7881
Pr(0.80) = 0.2119
Hoofdstuk 2: Kansverdelingen en
kansberekening
36
STANDAARDNORMALE VERDELING
Hoofdstuk 2: Kansverdelingen en
kansberekening
37
DE STEEKPROEVENVERDELING
− Wat is gevraagd?
P(X ≥ 102)
− Is de steekproevenverdeling normaal verdeeld?
Ja, want de populatie is normaal verdeeld
Hoofdstuk 2: Kansverdelingen en
kansberekening
38
DE STEEKPROEVENVERDELING
Dus:
Stap1: z-score berekenen
X − X − X − zx =
102 − 100
40 = 0.843
zx = = = N
x 15
N
Hoofdstuk 2: Kansverdelingen en
kansberekening
39
DE STEEKPROEVENVERDELING
Z = 0.84
P(z ≥ 0.84) = 1 - P(z ≤ 0.84)
= 1 - 0.7995 = 0.2005
Hoofdstuk 2: Kansverdelingen en
kansberekening
40
DE STEEKPROEVENVERDELING
Dus:
Hoofdstuk 2: Kansverdelingen en
kansberekening
41
SAMENGEVAT
Kansen zijn van groot belang in onderzoek omdat ze ons in staat stellen
om te beslissen of een observatie heel uitzonderlijk is of eerder heel
gewoon.
Om kansen te berekenen maken we gebruik van kansverdelingen:
theoretische verdelingen van mogelijke waarden en bijhorende
kansen van een variabele.
In de psychologie wordt de normale verdeling vaak gebruikt, aangezien
veel kenmerken van mensen als normaal verdeeld in de populatie
worden beschouwd.
Omdat voor elk kenmerk een normale verdeling met een ander
gemiddelde en standaarddeviatie geldt, is het onmogelijk om voor
elke verdeling de exacte kansen te kennen. Daarom herleiden we die
normale verdeling naar een standaardnormale verdeling door z-
scores te berekenen. Daarna kunnen we de kansen van de z-scores
aflezen uit een tabel.
Een specifieke kansverdeling is de steekproevenverdeling van het
gemiddelde, waarmee we kunnen uitrekenen hoe groot de kans is om
een bepaald gemiddelde te observeren.
Hoofdstuk 2: Kansverdelingen en
kansberekening
42
Herhalingsoefeningen: kansen berekenen
in de normale verdeling.
(zelfstudie – zie statistiek 1)
STANDAARDNORMALE VERDELING
scenario 1
Stap 1: x − X
z=
X
Hoofdstuk 2: Kansverdelingen en
kansberekening
44
STANDAARDNORMALE VERDELING
Z = 0.80
P(z < 0.80) = 0.7881
P(z ≥ 0.80) = 1 – 0.7881
Pr(0.80) = 0.2119
Hoofdstuk 2: Kansverdelingen en
kansberekening
45
STANDAARDNORMALE VERDELING
scenario 2
IQ is normaal verdeeld met μ = 100 en σ = 15.
Wat is kans op een IQ groter of gelijk aan 87?
87 − 100
Stap 1: Z(IQ87) = = −0.867
15
?
-0.867
Hoofdstuk 2: Kansverdelingen en
kansberekening
46
STANDAARDNORMALE VERDELING
Probleem: tabel
bevat enkel
kansen voor
positieve
z-waarden!
Hoofdstuk 2: Kansverdelingen en
kansberekening
47
STANDAARDNORMALE VERDELING
Gelukkig is de standaardnormale verdeling symmetrisch!
P (z ≤ -0.867) P (z ≥ 0.867)
Hoofdstuk 2: Kansverdelingen en
kansberekening
48
STANDAARDNORMALE VERDELING
P ( z ≤ 0.867) = 0.8078
= P (z ≥ -0.867)
Hoofdstuk 2: Kansverdelingen en
kansberekening
49
STANDAARDNORMALE VERDELING
scenario 3
IQ is normaal verdeeld met μ = 100 en σ = 15.
Wat is kans op een IQ kleiner of gelijk aan 114?
114 − 100
Stap 1: Z(IQ114) = = 0.93
15
Hoofdstuk 2: Kansverdelingen en
kansberekening
50
STANDAARDNORMALE VERDELING
scenario 4
IQ is normaal verdeeld met μ = 100 en σ = 15.
Wat is kans op een IQ kleiner of gelijk aan 87?
87 − 100
Stap 1: Z(IQ87) = = −0.867
15
Dus:
P(z ≤ 0.867) = 0.8078 − − −
Hoofdstuk 2: Kansverdelingen en
kansberekening
51
STANDAARDNORMALE VERDELING
Stap 1: 15
113 − 100
Z(IQ113) = = 0.867
15
OF
Hoofdstuk 2: Kansverdelingen en
kansberekening
52
STANDAARDNORMALE VERDELING
Stap 2: P(z ≥ 0.867) OF P(z ≤ -0.867)=
P(z ≥ 0.867) + P(z ≤ -0.867)
Hoofdstuk 2: Kansverdelingen en
kansberekening
53
STANDAARDNORMALE VERDELING
113 − 100
Z(IQ113) = = 0.867
15
?
Hoofdstuk 2: Kansverdelingen en
kansberekening
54
STANDAARDNORMALE VERDELING
Stap 2: P( -0.867 ≤ z ≤ 0.867) =
P(z ≤ 0.867) - P(z ≤ -0.867)
Dus:
P(z ≤ 0.867) - P(z ≤ -0.867) = 0.8078 – 0.1922
= 0.616
Hoofdstuk 2: Kansverdelingen en
kansberekening
55
STANDAARDNORMALE VERDELING
• Bereken de z-scores
• Noteer in P(z ≥ x)-vorm wat je zoekt
• Haal uit de tabel wat rechtstreeks kan afgelezen worden
• Gebruik optelling of aftrekking om kansen af te leiden die niet in de
tabel staan => makkelijker als je even de tekening maakt!
Hoofdstuk 2: Kansverdelingen en
kansberekening
56
STANDAARDNORMALE VERDELING
Verdere toepassing van dezelfde techniek:
Een normaal verdeelde test heeft een gemiddelde van 100 en een
standaardafwijking van 15. Welke score moet men hebben om bij
de 5% best scorende mensen te behoren?
Wat is gevraagd?
0.05
Hoofdstuk 2: Kansverdelingen en
kansberekening
57
STANDAARDNORMALE VERDELING
In de tabel zien we dat de Z-score die een P van 0.95 heeft gelijk is aan
1.65
0.05
15
?
Antwoord: men moet een score van 125 hebben om bij de 5% best
scorende mensen te horen
Hoofdstuk 2: Kansverdelingen en
kansberekening
58
STANDAARDNORMALE VERDELING
Een variabele is normaal verdeeld met een gemiddelde van 70 en een
standaardafwijking van 12. Hoeveel % van de mensen scoort hoger
dan 58?
Wat is gevraagd?
P (x ≥ 58) = ?
Stap 2: P (z ≥ -1) = ?
[scenario 2]
=> 0.8413 of 84%
Hoofdstuk 2: Kansverdelingen en
kansberekening
59