You are on page 1of 12

Sheets HC 3: Discrete verdelingen

Een stochastische variabele (s.v.) X is een


kwantitatieve variabele bij een
toevalsexperiment. Notatie boek: s.v. x

Continue s.v. X: waarden vormen een interval


(volgende week).

Discrete s.v. X heeft aftelbaar veel waarden,


meestal aantallen:
Dus eindig: bijv. x = 0, 1, …, 10
of aftelbaar oneindig: bijv. x = 1, 2, 3,…
Kansen: P(X = x) boek: p(x)

De kansverdeling van X: alle waarden van de


s.v. X en bijbehorende kansen.
In tabel of met formule.
Eisen: 1. P(X = x) ≥ 0 of p(x) ≥ 0
2. ∑P(X = x) = 1 of ∑p(x) = 1

(sommaties over alle waarden van x)


1
Verwachtingswaarde van een s.v.: kengetal voor
het "midden" van kansverdelingen van een s.v.

evenwicht: ∑ waarde × "gewicht"

Definitie verwachtingswaarde µ of E(X):


µ = E(X) = ∑x xP ( X = x) of E(x) = ∑xp(x)

Verschil/verband tussen µ en x :
•De verwachting(swaarde) µ , ook wel
populatiegemiddelde genoemd, is een maat
voor het centrum van een kansverdeling.

• Het steekproefgemiddelde x is een maat voor


het midden van de waarnemingen en geeft
een schatting voor de (onbekende) µ .

• De (experimentele) wet van de grote


aantallen: indien een experiment (heel) vaak
herhaald wordt en x is het gemiddelde van
alle waargenomen waarden van s.v. X,
dan zal x bij dicht bij µ liggen.
2
• Dus in het algemeen geldt: µ ≠ x

Hetzelfde geldt voor:


•σ2 en s2 : populatie- en steekproefvariantie
•p en p̂ : populatie- en steekproeffractie

De variantie var(X) (ook: σ 2 of ) σ2


X

is een maat voor de spreiding van een s.v. X:


var( X ) = E( X − µ)2 = ∑( x − µ)2 P( X = x )
x

De standaardafwijking σ of σ X of sd(X)
wordt afgeleid uit de σ X = var(X)

variantie:

Voor alle kansverdeling geldt de regel van


Tsjebyshev en voor heuvelvormige
kansverdelingen geldt de Empirische regel.

Twee veel gebruikte discrete verdelingen:


1. Binomiale verdeling
Binomiaal experiment: uitkomst is Succes
3
met kans p of Mislukking met kans 1-p = q
X = aantal successen bij n onafhankelijke
binomiale experimenten.

 n  x n− x
P(X = x) =   p (1− p)
 x
E(X) = np (fractie p van n)
var(X) = np(1-p) 1-p = q

Korte notatie: X is B(n, p) (niet in boek)

Toepassen van de binomiale verdeling bij


aselecte steekproeven:
• Bij trekken met terugleggen
• Bij benadering bij trekken zonder
terugleggen (afhankelijk!), indien de
populatie veel groter is dan de steekproef

2. De Poisson-verdeling

4
X = aantal gebeurtenissen per tijdseenheid,
per gebied, e.d. , bijv:
 Aantal klanten die in een uur een winkel
(of een ander systeem) binnenkomen
 aantal vlooien in een liter slootwater
 Aantal ongelukken op een kruispunt in
een week
λ = gemiddeld aantal per eenheid van

tijd en/of gebied

e −λλx
P( X = x ) = , x = 0, 1, 2, ....
x!
E(X) = λ en var( X ) = λ

λ: intensiteit
| x xx x x xx x x |
0 1 tijd
5
| xxx xx xxx x x x x xxx x xxx xx x x x xx|
0 1 tijd

Vb. (kansen bepaald met tabel)


X is Poisson λ = 2.5 → P(X ≤ 5) ≈ 0.96
X is Poisson λ = 8 → P(X ≤ 5) ≈ 0.19

Verband tussen B(n, p)- en Poisson-verdeling:


Als X is B(n, p) met n groot en p klein, dan
is de verdeling van X is te benaderen met de
Poisson-verdeling met λ = np.
(Vuistregel : n > 25 en np < 10)

De simultane verdeling van twee discrete s.v.


X en Y wordt gegeven door de kansen
P(X = x en Y = y)

Onafhankelijkheid van X en Y geldt als:


P(X = x en Y = y) = P(X = x)×P(Y = y),
voor alle waarden van x en y.

6
Eigenschappen E(X) = µ en var(X) = σ2:
• var(X) ≥ 0 en σ ≥ 0
• Voor een lineaire transformatie Y = aX + b
geldt: E(a×X + b) = a×E(X) + b
en var(a×X + b) = a2×var(X)
•Voor de som en het verschil van X en Y
geldt: E(X ± Y) = E(X) ± E(Y)
Als X en Y onafhankelijk zijn, geldt:
var(X ± Y) = var(X) + var(Y)

Vb 1 Kansverdeling in tabelvorm:
x 0 1 2 3 so
m
P(X = x) 0. 0. 0. 0. 1
1 4 2 3
7
P(1< X ≤ 3) = P(X = 2) + P(X = 3)
= 0.2 + 0.3 = 0.5

“gemiddelde van de waarden van X”


0×0.1 + 1×0.4 + 2×0.2 + 3×0.3 = 1.7 = μX
Spreiding: σ2 2
X = ∑( x − µ) P( X = x )
x
σ2 2 2
X = ( 0 − 1.7 ) × 0.1 + ... + ( 3 − 1.7 ) × 0.3
= 1.01

Dus σ X = 1.01 ≈ 1.005


Vb 2: Kansverdeling gegeven door formule

Tien MC-items met 4 antwoorden


De antwoorden worden willekeurig ingevuld
• Noteer een 0 voor een fout en een 1 voor een

goed antwoord. De uitkomsten zijn dan alle


mogelijke rijtjes van 10 nullen of enen.
8
P(1) = p = ¼ en P(0) = 1- p = ¾
• s.v. X = het aantal goede antwoorden

• Omdat de uitkomsten per item onafhankelijk


zijn, geldt bijvoorbeeld:
P( 0001111111 ) = (¼)3 (¾)7
• Kans op 3 goede antwoorden, dus P(X = 3):
10 
 3  rijtjes met 3 enen en 7 nullen, dus
 

10 
P(X = 3) =  3 (¼)3 (¾)7≈ 0.2503
Kansverdeling van X:
10  k 10-k
• P(X = k) =  k  (¼) (¾) , k= 0, 1, …,10
 

Korte notatie: X is B(10, ¼):


“X is binomiaal verdeeld met parameters
n = 10 (# binomiale experimenten) en
p = ¼ (succeskans)”

9
Staafdiagram kansfunctie van X ~ B(10, ¼)

Tabel: cumulatief → P(X ≤ x)


Dus als X ~ B(10, ¼)
P(X = 3) = P(X ≤ 3) – P(X ≤ 2)
= 0.7759 – 0.5256 = 0.2503

10
Vb 3. 2×werpen met een dobbelsteen
S = {(i, j) | i, j = 1, 2, …., 6}
P( (i, j) ) = 1/36
X = aantal enen en Y = aantal zessen

Tabel simultane kansen P(X = x en Y = y):


y 0 1 2
x
0 16
36
8
36
1
36

1 8
36
2
36 0
2 1
36 0 0

P(X= 0) = P(X=0 en Y=0) + P(X=0 en Y=1)


+ P(X=0 en Y=1)
= 16/36 + 8/36 + 1/36
= 25/36
y 0 1 2 P(X = x)
x
0 16/36 8/36 1/36 25/36
1 8/36 2/36 0 10/36
2 1/36 0 0 1/36
P(Y = y) 25/36 10/36 1/36 1
11
Zo vinden we E(X) = E(Y) = 1/3
En var(X) = var(Y) = 10/36
Sommatie rijen en kolommen: marginale
kansverdelingen van resp. X en Y:
Zijn de gebeurtenissen X = 1 en Y = 1
onafhankelijk? Nee, want:
P(X = 1 en Y = 1) ≠ P(X = 1)×P( Y = 1)
2/36 ≠ 10/36 × 10/36
Kansverdeling Z = X+Y
z 0 1 2 som
p(z) 16
36
16
36
4
36 1
zp(z) 0 16
36
8
36 36 =E(X+Y)
24

(z-μZ)2p(z) 16
81
4
81
16
81 9 =var(X+Y)
4

12

You might also like