You are on page 1of 304

Statistiek

om mee te werken
OPGAVENen
UITWERKINGEN'

Achtste druk

TM Wolters-Noordhoff
Statistiek om mee te werken
Opgaven en uitwerkingen

1
Statistiek
om mee te werken
Opgaven en uitwerkingen

Prof. dr. A. Buijs


m.m.v.
Ir. K. de Bont (uitwerkingen)

Achtste druk

Wolters-Noordhoff/Groningen-Houten
Ontwerp binnenwerk: Ebel Kuipers, Sappemeer
Ontwerp omslag: Total Identity, Amsterdam

Eventuele op- en aanmerkingen over deze of andere uitgaven kunt u richten aan:
NoordhoffUitgevers bv, Afdeling Hoger Onderwijs, Antwoordnummer 13,
9700 VB Groningen, e-mail: info@wolters.nl

0 1 2 3 4 5 I 12 11 10 09 08

© 2008 Noordhoff Uitgevers bv Groningen/Houten, The Netherlands.

Behoudens de in of krachtens de Auteurswet van 1912 gestelde uitzonderingen mag niets


uit deze uitgave worden verveelvoudigd, opgeslagen in een geautomatiseerd gegevens-
bestand of openbaar gemaakt, in enige vorm of op enige wijze, hetzij elektronisch,
mechanisch, door fotokopieën, opnamen of enig andere manier, zonder voorafgaande
schriftelijke toestemming van de uitgever. Voor zover het maken van reprografische ver-
veelvoudigingen uit deze uitgave is toegestaan op grond van artikel16h Auteurswet 1912
dient men de daarvoor verschuldigde vergoedingen te voldoen aan Stichting Reprorecht
(postbus 3060, 2130 KB Hoofddorp, www.cedar.nl/reprorecht.nl). Voor het overnemen
van gedeelte(n) uit deze uitgave in bloemlezingen, readers en andere compilatiewerken
(artikel16 Auteurswet 1912) kan men zich wenden tot Stichting PRO (Stichting Publicatie-
en Reproductierechten Organisatie, postbus 3060, 2130 KB Hoofddorp, www.cedar.nl/
pro).

All rights reserved. No part of this publication may be reproduced, stared in a retrieval system,
ar transmitted, in any farm ar by any means, electronic, mechanica/, photocopying, recording,
ar otherwise, without the prior written permission of the publisher.

ISBN 978-90-01-71015-6
NUR 916
Woord vooraf

Opgaven maken is een belangrijke denktraining bij vakgebieden zoals wis-


kunde en statistiek. Het gaat er namelijk niet alleen om dat de student met
behulp van de docent kennisneemt van de hoofdlijnen van een onderwerp,
maar ook de praktische vaardigheid is essentieel om creatief met statistische
methoden een probleem te kunnen aanpakken. Zélf opgaven maken helpt
enorm bij het verwerven van die competentie.

De eerste aanpassing in deze achtste editie van het opgavenboek betreft een
aantal nieuwe opgaven dat in ieder bestaand hoofdstuk is opgenomen, waar-
mee een aantal oude opgaven werd vervangen. Achterin zijn voor alle opga-
ven de antwoorden te vinden. Met het verschijnen van de achtste editie van
het theorieboek Statistiek om mee te werken is besloten de aanpak met een
afzonderlijk opgavenboek en uitwerkingenboek enigszins te wijzigen. Niet
langer zullen de uitwerkingen als een separaat boekwerk verschijnen, maar
de uitwerkingen zullen op een aantal verschillende manieren beschikbaar
worden gesteld aan de gebruikers.
Er zijn drie categorieën:
• Van een aantal van de opgaven is de uitwerking in het laatste deel van dit


boek afgedrukt. Deze opgaven zijn te herkennen aan het gekleurde blokje:

• Een tweede groep uitwerkingen komt beschikbaar via een website waarop
studenten kunnen inloggen.
• Een derde groep uitwerkingen is exclusief beschikbaar voor docenten.

Bij het totstandkomen van deze editie was ir. Koen de Bont uit Eindhoven
mijn steun en toeverlaat. Hij heeft met zijn grote doceerervaring weer de
juiste toon weten te treffen bij het uitwerken van die diverse nieuwe opga-
ven. Koen, heel veel dank hiervoor!

Ik hoop dat de nieuwe opzet bij deze editie tot genoegen is van studenten en
docenten.

Bilthoven, januari 2008

Arie Buijs

Woord vooraf 5
-----------------
Inhoud

1 Inleiding tot de beschrijvende statistiek 9

2 Maatstaven voor ligging en spreiding 24

3 Kansrekening 36

4 Kansvariabelen 48

5 Normale verdeling 60

6 Binomiale verdeling 70

7 De poissonverdeling 80

8 Schatten 88

9 Toetsen 98

10 De chikwadraatverdeling 109

11 Verschiltoetsen 118

12 Variantieanalyse 128

13 Regressie en correlatie 136

14 Indexcijfers 150

7
15 Tijdreeksen 159

16 Gemengde opgaven 112

17 Werken metgegevensbestanden 177

18 Case-studies 186

19 Antwoorden 195

20 Uitwerkingen van geselecteerde opgaven 235

8
1 Inleidingtot de beschrijvende
statistiek

Deel A Multiplechoicevragen

ml Bij een verkeersonderzoek is een van de grootheden die wordt genoteerd het
merk van de passerende auto's. Dit merk is:
a een ratiovariabele
b een kwantitatieve variabele
c een nominale variabele
d geen variabele

Gegevens voor de vragen m2 en m3


Bij een straatenquête werden 250 voorbijgangers gevraagd naar hun mening
over een aantal door de gemeente voorgestelde verkeersmaatregelen.
De resultaten staan in de volgende tabel:

Meeeens Geen mening Oneens Totaal


Man 25 35 50 110
Vrouw 35 55 50 140
Totaal 60 90 100 250

m2 Zie tabel. Bij de mannen is het percentage dat het eens is met de voorgestel-
de maatregelen gelijk aan:
a 41,7%
b 10%
c 25%
d 22,7%

m3 Zie tabel. De groep mensen die het oneens is met de maatregelen bestaat
voor ... uit vrouwen.
a 20%
b 56%
c 50%
d 40%

9
Gegevens voor de vragen m4, m5 en m6:
Bij de reisorganisatie P-Tours heeft men bijgehouden hoeveel geboekte pas-
sagiers kort voor het vertrek van een busreis hun reis afzeggen. Voor 80 bus-
reizen leverde dit de volgende tabel:

1 0-< 5
2 5-< 8 24
3 8-<12 8
4 12-<16 6
5 16-<20 4
6 20en hoger 2
Totaal 80

Bron: administratie P·Tours 2001

m4 De klassenbreedte bij 0 - < 5 bedraagt:


a 5
b 4
c 4,5
d 36

ms De relatieve frequentie van de klasse 16- < 20 bedraagt:


a 0,05
b 4
c 16
d 0,20

m6 Het klassenmidden van de klasse 8- < 12 bedraagt:


a 2
b 10
c 10,5
d 9,5

DeeiB Openvragen

1.1 In een fabriek staat een machine opgesteld die stalen kogeltjes vervaardigt.
Omdat deze kogeltjes aan bepaalde specificaties moeten voldoen, zijn er 60
kogeltjes nagemeten.
Deze kogeltjes bleken de volgende diameter te hebben:

15.42 14,78 15,24 16,05 15,70 16,78 15,58 17,02 15,90 16,12
15,70 16,58 15,62 15,96 15,50 15.42 15.44 15,12 15,96 15,70
16,26 15,78 15,24 16,80 15,06 15,38 14,62 15,20 15,14 15,73
14,72 15,02 15,35 14,75 15,32 16,25 15,36 15,10 15,90 14,98
15,96 14,90 14,84 15,30 15,48 15,02 16,08 15,62 14,83 17,10
16,28 16,10 15,76 15,02 16,60 15,52 15,60 15,26 15,85 15,81

10 Hoofd stuk 1 Inleiding tot de beschrijvende statistiek


a Verwerk de waargenomen uitkomsten tot een frequentieverdeling met klas-
sen van 0,2 mm breed.

Antwoord

Klasse Turven Aantal


14,60-< 14,80
14,80-< .... .
. . . . . -< . ... .
. . . . . -< .... .
. . .. .- ( .... .
. . . . . -<. ... .
. . . . . -< .... .
. . . . . -< .... .
. . . . . -<. ... .
. . . . . -<. ... .
. . . . . -<. ... .
. . . . . -<. ... .
. . . . . -<. ... .
Totaal

b Verwerk de waargenomen gegevens in een histogram.

Antwoord Afbeelding 1.1

10 .

5
4

O~v---+--+--~----------~----------~--------~
14,60 15,00 16,00 17,00
Diameter in mm

De klassengrenzen zijn gegevens als bijvoorbeeld: 14,60- < 14,80.


Dit houdt in dat een waarneming 14,60 wél en een waarneming 14,80 niet in deze
klasse wordt geplaatst. Op grond hiervan is het beter de klassengrenzen iets te ver-
schuiven (namelijk met 0,005 mm), en wel zodanig dat de klasse 14,60- < 14,80
wordt getekend als 14,595- < 14,795.

Deel B Open vragen 11


- a
Een groep van 200 schouwburg-
bezoekers is gevraagd naar het jaar-
inkomen. De inkomens leverden de
volgende frequentieverdeling op (zie
de tabel):
Teken een histogram van de hier
Inkomen (in euro)
0-< 10.000
10.000-< 15.000
15.000-< 20.000
Aantal
12
8
12
20.000-< 25.000 16
gegeven frequentieverdeling.
25.000-< 30.000 20
30.000-< 40.000 36
Antwoord Om het histogram te kunnen tekenen,
40.000-< 50.000 32
moeten eerst de frequentiedichtheden
50.000-< 60.000 24
worden berekend. Allereerst moet er
60.000-<100.000 30
een standaardklassenbreedte worden
100.000-<150.000 10
gekozen. Hiervoor kiezen we een
Totaal 200
breedte van € s.ooo.

Klasse Aantal maal de Frequentie Frequentie·


standaardbreedte dichtheid

0-< 10.000 2 12 12 = 6
2
10.000-< 15.000 8
15.000-< 20.000 12
20.000-< 25.000 16
25.000-< 30.000 20
30.000-< 40.000 36
40.000-< 50.000 32
50.000-< 60.000 24
60.000-<100.000 30
100.000-< 150.000 10

De kolommen kunnen nu worden getekend.

10 100 15,0
Inkomen € 1.000

b Bereken de relatieve frequenties van de aangegeven klassen.

12 Hoofdstuk 1 Inleidingtot de beschrijvende statistiek


Antwoord De relatieve frequenties worden berekend door deling van de absolute frequenties
door het totaal aantal waarnemingen.
We vinden dan:

Inkomen (in euro) Frequentie Relatieve frequentie

0-< 10.000 12 21020 = 0,061

10.000-< 15.000 8 ..............


15.000-< 20.000 12 ···· ··· ·······
20.000-< 25.000 16 ..............
25.000-< 30.000 20 ..............
36 ..............
---- -
30.000-< 40.000
40.000-< 50.000 32 ............ ..
50.000-< 60.000 24 ..............
60.000-<100.000 30 ··············
100.000-<150.000 10 ..............
Totaal 200 ..............

1.3 Geef voor elk van de volgende gevallen aan of de genoemde verzameling als
een steekproef of als een populatie mag worden beschouwd:
a de commissarissen der koningin van de 12 Nederlandse provincies
b de 200 personen die zijn geïnterviewd bij een straatenquête
c de 150 automobilisten die moesten stoppen voor een alcoholcontrole
d de 740 leden van een studentenvereniging
e de 38 klanten die tussen 11.00 en 12.00 uur een postkantoor binnenkomen
f de 12 000 verzekerden bij een verzekeringsmaatschappij
g de 20 nummers die worden gedraaid in een muziekprogramma op de radio

1.4 Geef voor de volgende variabelen aan of deze een nominale, ordinale, inter-
val- of ratioschaal heeft:
a de speelduur van compact disks
b de kleur van tulpen
c de industrietak waarin werknemers een baan hebben
d de jaaromzet (in euro) van bedrijven
e het aantal sterren dat de moeilijkheidsgraad van puzzelboekjes aangeeft
f de hoogte boven de zeespiegel van wintersportdorpen

1.5 De tentamencijfers voor het vak statistiek van 60 eerstejaarsstudenten zijn


weergegeven in de volgende tabel:

Cïfers van 60 eerstejaarsstudenten te X

6 8 4 5 2 2 7 10 9 6 5 6 3 4 6
7 5 6 2 8 5 4 3 6 6 7 5 1 6 8
4 9 6 6 7 6 6 5 6 5 7 6 4 1 3
5 4 7 5 9 5 8 7 4 2 3 1 6 7 6

Deel B Open vragen 13


a Tel de frequenties per cijfer.
b Bereken de relatieve frequenties.
c Teken van de frequentieverdeling een staafdiagram.

1.6 Voor een aantal beursfondsen is op 31 december van een bepaald jaar vast-
gesteld hoe hoog de aandelenkoers is ten opzichte van de in het verstreken
jaar bereikte bedrijfswinst per aandeel (de zogenoemde koers-winst-
verhouding K!W). Verder is berekend met welk percentage de omzet van het
bedrijf is gegroeid in het verstreken jaar.
Dit leverde de volgende cijfers op:

..
Bedrijf KIW
. .. ... ·-· .. . .
Groei(%) Bedrijf KIW Groei(%)
. .. . .

A 18,0 22 K 22,5 23
B 9.5 10 L 14,1 6
c 9.3 3 M 16,2 15
D 10,6 7 N 9.6 2
E 15,6 17 0 9.9 6
F 8,7 5 p 16,0 18
G 11.4 4 Q 17,7 24
H 12,7 14 R 11,8 5
10.4 8 5 13,3 12
13,9 15 T 9,2 2

a Maak een onderscheid tussen snelle groeiers (vanaf 10%) en langzame


groeiers. Verdeel de koers-winstverhoudingen in klassen van 10 eenheden
breed. Stel aan de hand van deze indeling een kruistabel op. Hoe groot is het
percentage bedrijven dat een snelle groeier is en een lage K/W heeft?
Hoeveel % van de bedrijven met een KIW tussen 10% en 20% kan worden
beschouwd als een snelle groeier?
b Teken een spreidingsdiagram voor de relatie tussen K/W en het groeipercentage.

1. 7 Een groep van dertig eerstejaarsstudenten is een aantal vragen voorgelegd.


Dit betrof:
leeftijd;
- woonsituatie (z = zelfstandig, o = bij ouders);
- geslacht (m =man, v =vrouw);
- de maandelijkse bestedingen aan voedsel en drank;
- de score voor het tentamen statistiek.

14 Hoofdstuk 1 Inleiding tot de beschrijvende statistiek


In de volgende tabel staan de resultaten:

Gegevens van 30 eerstejaarsstudenten

Naam Leeftijd Woon- Geslacht Besteding Score


situatie
C. Been 18 V 510
-
72
- -
5. Everwijn 23 0 m 280 62
Y.Anjema 23 V 440 49
J. van den Boom 21 0 m 490 58
T. vanTuyl 20 0 V 330 86
L. Herber 19 0 m 260 67
J. Derickx 22 0 m 420 95
L. Tielens 21 m 570 68
H. Eijgenhuijsen 20 m 530 72
L.deWilde 21 z V 590 63
H. van Woensel 20 0 m 460 52
0. Segers 19 V 480 73
K. de Bont 23 m 550 92
N.Morel 22 V 470 72
H.Moerland 18 0 V 380 45
R. Broersen 19 m 540 68
J. Beuving 22 V 390 46
E. Franken 26 0 m 450 38
A. de Groot 21 0 m 270 83
G. Rietkerk 22 0 m 390 86
L. Verhees 24 0 m 540 47
J. Buhrman 20 m 360 96
D. van Kraay 19 0 m 290 72
M. Eijsbouts 25 V 460 48
J. Wijbenga 20 0 m 310 81
R. de Leeuwe 21 m 570 84
C. Arends 19 0 m 280 51
M. Tijmstra 20 V 410 62
M .Jansen 22 V 510 78
C. zur Lage 21 0 V 330 46

Beantwoord nu de volgende vragen (eventueel nadat het gegevensbestand is


ingebracht in de computer):
a Geef aan op welk type schaal de vijf variabelen worden gemeten.
b Maak een frequentieverdeling van de leeftijden.
c Teken een histogram van de bestedingen. Begin met ondergrens € 250.
d Maak een klassenindeling van de scores voor mannen en vrouwen afzonder-
lijk. Kies voor de klassen 10 eenheden en verwerk de resultaten in een kruis-
tabel. Bereken ook de procentuele frequenties van de scoreklassen voor de
mannen en vrouwen afzonderlijk.
e Maak een kruistabel waarin de waarnemingen worden verdeeld naar ge-
slacht en woonsituatie.
)

f Teken een spreidingsdiagram met 'leeftijd' langs de horizontale as en 'score


langs de verticale as.

Deel B Open vragen 15


1.8 Bij een onderzoek naar de jaarinkomens van personen van 30 jaar oud met
een voltijdse baan is de relatie bekeken tussen inkomen en opleidingsniveau.
De volgende tabel was het resultaat:

• • •• • • •
Opleidingsniveau Minder dan 20 20-<30 30-<40 40-<50 soofmeer
Vmbo of lager 40 32 16 8 4
Mbo 18 22 14 10 6
Vwo 12 16 30 18 14
Hbo 4 8 16 34 18
Wo 0 6 14 26 34

a Bereken voor de tabel de totalen per rij en per kolom.


b Hoeveel procent van de hbo-ers verdient minstens 30.000 euro?
c Hoeveel procent van de hoogste inkomenscategorie heeft hbo of vwo als
opleiding?
d Een advertentiecampagne vindt plaats in een blad dat uitsluitend wordt
gelezen door hbo-ers en vwo-ers. Hoeveel procent van deze doelgroep heeft
een inkomen lager dan 40.000 euro?

- Een sportorganisatie beweert dat het Nederlandse tv-publiek meer sport op


de buis wil zien. Om deze bewering te onderzoeken, werd door een onder-
zoeksbureau een enquête gehouden waarbij onder meer werd gevraagd of
men een toename (T) of een afname (A) van het aantal uren zendtijd wilde
dat aan sport wordt besteed. Als derde antwoordmogelijkheid konden de
respondenten aangeven dat het aantal uren gelijk (G) mocht blijven.
Voor 50 ondervraagden waren de resultaten als volgt:

• • • • •
T A A G T G T T T A A G A T G G A T A A G G A G T
A G T G T A T A T T T A G T T A T T G T T A T T G

a Stel een frequentieverdeling op voor deze gegevens. Bereken voor de ant-


woordcategorieën de relatieve frequenties.
b Geef de frequentieverdeling weer door middel van een cirkeldiagram.

16 Hoofdst uk 1 Inleidingtot de beschrij vende statistiek


1.10 De omzetcijfers van 42 bedrijven uit een bedrijfstak zijn weergegeven in het
volgende histogram (afbeelding 1.3). Zet de gegevens om in een frequentie-
tabel.

Afbeelding 13

Frequentie-
dichtheid
(per € 200.000
omzet) 8
,------

6 -

2 -

0 - I
200400600 1000 2000
I
Omzet x € 1.000

1 .11 De brandduur van een bepaald type gloeilamp is bepaald voor 50 exem-
plaren. De resultaten zijn als volgt:

Brandduur in uren

1248 1150 1215 1380 1495 1325 1418 1060 1176 1204
1020 1292 1350 1553 1236 1310 1464 1280 1017 1360
1527 1140 1238 1347 1134 1264 1198 1618 1372 1278
1642 1394 1090 1407 1082 1262 1514 1430 1255 1424
1368 1646 1103 1385 1258 1485 1380 1270 1525 1100

a Maak een indeling in klassen van 50 eenheden breed, te beginnen met de


klasse 1 000 - < 1 050 en bereken de frequentie per klasse.
b Verwerk de onder vraag a ontstane frequentieverdeling in een histogram.
Bedenk hierbij dat de brandduur (= tijd) een continue variabele is. De in de
tabel gegeven waarden moeten in dit kader worden beschouwd als afrondin-
gen naar het dichtstbijzijnde gehele urenaantaL (Dus 1247 uur en 35 minu-
ten komt als afgeronde waarde 1248 in de tabel.)
c Teken een frequentiepolygoon van de verdeling.

Deel B Open vragen 17


1.12 Bij een bedrijf zijn in een bepaald jaar totaallOO hoogopgeleide werknemers
in dienst getreden, 50 mannen en 50 vrouwen. De maandsalarissen van deze
werknemers zijn weergegeven in de volgende tabel:

Mannen Vrouwen
2.850 4.850 3.910 2.270 4.980 1.850 2.380 2.870 3.290 5.100
3.400 4.780 3.370 3.850 3.260 2.350 3.870 3.360 2.130 1.970
3.750 5.900 3.740 3.490 4.760 2.720 2.410 2.350 2.800 1.890
2.250 4.000 4.130 2.350 5.500 3.270 2.560 3.280 2.650 4.210
3.150 3.670 4.590 4.200 5.100 3.850 3.140 2.100 2.910 3.620
2.960 5.980 2.250 3.240 4.350 2.610 3.650 2.480 1.990 4.410
2.230 2.840 4.480 2.580 2.350 2.370 2.830 3.720 2.180 4.220
3.555 2.170 3.450 5.280 5.420 2.660 4.670 1.950 4.150 3.250
2.430 3.390 2.560 5.650 2.740 4.140 3.560 2.980 3.900 3.170
3.610 2.490 5.750 5.360 2.690 4.850 5.350 3.490 3.360 4.280

Construeer voor deze gegevens een verticaal tweezijdig stamdiagram:


a met klassen van € 1.000 breed;
b met klassen van € 500 breed.

Bij een verkeerscontrole zijn de ban-


den van 200 auto's gecontroleerd.
Gemeten profiel (in mm) Aantal auto's
Hierbij werd het profiel gemeten in
0,00-< 2,00 4
mm.
2,00-< 4,00 34
Een en ander leidde tot de volgende
4,00-< 6,00 82
frequentieverdeling (zie de tabel):
6,00-< 8,00 66
a Geef de waargenomen verdeling
8,00-<10,00 14
weer door middel van een cumula-
Totaal 200
tieve frequentiecurve.
b Probeer met de grafiek te schatten
hoe groot het aantal auto's is met een profiel van minder dan 5,00 mm.
(NB In deze opgave mag men veronderstellen dat de klassengrenzen exact
zijn, dus er hoeven geen correcties met 'halfjes' uitgevoerd te worden.)

1.14 Van een vijftigtal auto's is het benzineverbruik bepaald. De volgende tabel
geeft de resultaten weer van een test waarbij per auto met 10 liter benzine
een bepaalde afstand werd afgelegd:

105 77 67 125 140 138 92 102 158 82


118 86 92 72 96 132 83 107 98 107
96 115 105 78 114 114 65 112 88 158
132 108 135 102 95 128 118 124 140 102
148 110 158 128 126 115 104 135 132 100

a Maak een frequentieverdeling van voorgaande gegevens. Kies een klasse van
10 eenheden breed. Begin met een klasse van 60 - < 70.

18 Hoofdstuk 1 Inleiding tot de beschrijvende statistiek


b Teken een histogram van de ontstane frequentieverdeling.
c Teken de grafiek van de cumulatieve frequentieverdeling.

1.15 Het bedrijfsschap voor het schildersbedrijf heeft onderzocht hoe het is
gesteld met het buitenschilderwerk van de koopwoningen in een grote
gemeente. Voor een steekproef van 250 huizen werd vastgesteld hoe lang het
geleden is dat het buitenschilderwerk was gedaan. Dat leverde de volgende
tabel, waarvan helaas ten gevolge van een computerstoring nogal wat gege-
vens onleesbaar waren:

Aantal jaren sinds de Waargenomen Relatieve Cumulatieve


laatste schilderbeurt aantal frequentie frequentie
0-< 2jaar ?
2-< 4jaar 0,14 80
4-< 6jaar 75 ?
6-< 8jaar 60
8-<10 jaar 235
10-<12jaar
Totaal 250 1,00

a Vul de ontbrekende getallen in.


b Teken een histogram en een frequentiepolygoon van de verdeling.

1.16 Een groep van 1 000 middelbare scho-


lieren wordt een wiskundetest afgeno- Meisjes
Scores Jongens
men. De scores zijn verdeeld volgens de
20-< 30 20 30
volgende tabel:
30-< 40 30 50
a Teken voor beide groepen een histo-
40-< 50 40 80
gram en een frequentiepolygoon. 100 120
50-< 60
b Teken voor de gezamenlijke verdeling
60-< 70 120 90
een histogram.
70-< 80 100 70
c Vergelijk de relatieve frequenties voor
80-< 90 80 50
de jongens, de meisjes en de gezamen- 10
90-<100 10
lijke verdeling.
Totaal 500 500

- Een bank onderzoekt het spaargedrag


van haar cliënten. Van 500 willekeurige
cliënten is vastgesteld hoeveel middelen
door hen aan de bank zijn toever-
trouwd. De resultaten zijn te zien in de
volgende tabel:
Inleg (in euro)
0-< 500
500-< 1.000
1.000-< 2.000
Aantal
-80
65
75
-

2.000-< 5.000 60
a Bereken voor de klassen de relatieve 100
5.000-<10.000
frequenties en de frequentiedichtheden. 120
10.000-< 25.000
b Teken een histogram van de verdeling.
Totaal
-
500
-
c Teken een frequentiepolygoon.
d Teken een cumulatieve frequentiecurve.

Deel B Open vragen 19


1.18 Bij een onderzoek naar leaseauto's is bekeken welk merk door vertegenwoor-
digers doorgaans wordt gekozen.
Een onderzoek onder 2 000 vertegenwoordigers leverde de volgende tabel:

• • ••
Automerk Aantal vertegenwoordigers
Au di 40
Citroën 30
Fiat 60
Ford 350
Nissan 90
Opel 570
Peugeot 140
Toyota 130
Volkswagen 440
Volvo 70
Totaal 2000

Geef de gegevens over de leaseauto's weer door middel van een pareto-
diagram. Welke merken vormen gezamenlijk zo'n 80o/o van alle leaseauto's?

1.19 Een groot ziekenhuis houdt een klantentevredenheidsonderzoek onder pa-


tiënten die minstens twee dagen aaneengesloten in het ziekenhuis hebben
doorgebracht.
De top 10 van klachten is weergegeven in de volgende tabel:

Klacht Aantal respondenten


Andere patiënten gedragen zich storend 12
Artsen verschijnen op onvoorspelbare tijden 6
Bedden worden niet goed verschoond 4
Bezoektijden zijn te beperkt 32
Herrie vanwege een verbouwing 18
Maaltijden zijn onsmakelijk 14
Onvriendelijke verplegers 8
Radio/tv voldoet niet 22
Verplegers reageren niet op alarmsignaal 4
Vroeg gewekt worden 44
Totaal 164

a Maak een paretadiagram van deze gegevens.


b Geef aan door welke klachten de belangrijkste groep van ongeveer 80o/o van
de verdeling wordt gevormd.
c Welke zaken zou de directeur van het ziekenhuis met voorrang moeten aan-
pakken teneinde de tevredenheid te bevorderen?

20 Hoofdstuk 1 Inleidingtot de beschrijvende statistiek


1.20 Voor een bedrijfstak is onderzocht
hoe de verdeling is van de totale
Percentage van Perce'!!ag! ~n
omzet van de bedrijfstak over de be-
de bedrijven de totale omzet
drijven.
10 1
Het resultaat wordt weergegeven in
20 5
de volgende cumulatieve tabel,
30 10
waarbij de bedrijven zijn geordend
40 17
naar omzetgrootte:
50 25
a Geef de informatie uit de tabel weer
60 35
door middel van een Lorenzcurve.
70 46
b Hoe verhoudt zich de gemiddelde
80 58
omzet van de 100% grootste bedrij-
90 70
ven (qua omzet) tot de gemiddelde
100 100
omzet van de 10% kleinste bedrij-
ven?

1.21 Open in Excel het bestand 'MuL T r F o o o'. 1


Maak een grafiek van de omzet (Y,) als functie van de tijd (T). Selecteer de
eerste twee kolommen van het bestand en gebruik de 'Wizard Grafieken'.
Kies bij de eerste stap als grafiektype 'Spreiding' en als subtype de vierde op-
tie: 'Spreiding met gegevenspunten' verbonden via lijnen. In de derde stap
als grafiektitel opgeven 'Tijddiagram Multifood' en bij de assen respectieve-
lijk tijd (kwartaalnummer) en omzet (in mln Euro).

1.22 Open in Excel het bestand 'BAN KERs'.


a Beschrijf van werknemer 19 het opleidingsniveau en het functieniveau.
b Maak een histogram van de variabele dienstjaren. Ga als volgt te werk:
- Voeg een nieuw werkblad in en vermeld hier de klassengrenzen (0, 5, 10
enzovoort). Plaats de tekst dienstjaren erboven.
- Kies in het menu 'Extra ~ Gegevensanalyse' de optie 'Histogram'.
- Vul het dialoogvenster in en vergeet niet om de optie 'Grafiek maken' aan
te vinken.
- Klik op de rand van het grafiekgebied en vergroot dit door te slepen met
de rechteronderhoek Zorg dat de grafiek een bruikbare grootte en vorm
krijgt.
- Klik met de rechtermuisknop op een van de staven en kies in het snel-
menu de optie 'Gegevensreeks Qpmaken'. Op het tabblad 'Opties' kan de
tussenruimte van de kolommen worden ingesteld. Vanwege de vorm van
het histogram moet de breedte tussenruimte op 0 worden ingesteld.
Het histogram is nu klaar!
c Maak een kruistabel waarin het opleidingsniveau en het functieniveau tegen
elkaar zijn afgezet. Ga als volgt te werk:
- Start de 'Wizard Draaitabellen' vanuit het menu 'Data ~ l2_raaitabel-
rapport'.
- Plaats (bij stap 3 van de wizard) de variabelen functie en niveau in res-
pectievelijk het rijvak en het kolomvak. Sleep een van de variabelen in het
vak gegevens en verander Som van .. . in Aantal van ... (door te dubbel-
klikken op het blokje).

Zie hoofdstuk 17 voor een beschrijving van de bestanden.

Deel B Open vragen 21


- Laat de draaitabel op een nieuw werkblad maken (stap 4 van de wizard).
De draaitabel is nu gereed! Beantwoord met behulp van de draaitabel de
volgende vragen:
• Wat is binnen de groep van personen met opleidingsniveau 4 de ver-
deling van de functieniveaus?
• Wat is binnen de groep met functieniveau 4 de verdeling van
opleidingsniveaus?
d Verander in de kruistabel waarin het opleidingsniveau en het functieniveau
tegen elkaar zijn afgezet de samenvattingsfunctie in Gemiddelde van ... en
kies de variabele salaris om weer te geven. Kun je het resultaat verklaren?

1.23 Open in Excel het bestand 'ARCHITECT'.


a Beschrijf nauwkeurig welke informatie gegeven is voor persoon 199.
b Maak via 'Extra ~ .Gegevensanalyse' een histogram van de leeftijdscatego-
rieën.
c Maak via 'Data, draaitabel' een frequentieverdeling van de tevredenheid,
verdeeld naar sekse.

1.24 Open in Excel het bestand 'KoERSEN'.


a Maak via de 'Wizard Grafieken' een spreidingsdiagram, waarbij de variabe-
len dollar en olie worden gekozen. Welke globale conclusie kan men hier
trekken over de relatie tussen deze variabelen?
b Beantwoord dezelfde vragen voor de relatie tussen de variabelen olie en
dowjones.
c Beantwoord dezelfde vragen voor de relatie tussen de varabelen dollar en
dowjones.

1.25 Open in Excel het bestand 'wiNKELs'.


a Beschrijf nauwkeurig de gegevens voor winkel 34.
b Maak een staafdiagram van de verdeling over de verschillende branches.
Hint: maak eerst met behulp van het menu 'Data ~ Draaitabelrapport' een
frequentietabel van de branches.
c Maak een spreidingsdiagram waarin vloeroppervlak en jaarhuur tegen elkaar
worden afgezet.
Hint: vervang eerst de waarde M in de kolom jaarhuur door niets.

1.26 Open in Excel het bestand 'cuRsus'.


a Hoeveel punten behaalde kandidaat 29 bij de twee tentamens en hoeveel
uren heeft deze student besteed?
b Teken een histogram van de behaalde cijfers. Kies als grenzen 40, 50, enzo-
voort. (NB Excel telt altijd frequenties inclusief de bovengrens.)
c Maak met een draaitabel een uitsplitsing van de scores voor evaluatie 1 en 2.
d Bekijk of de verdelingen van evl en ev2 verschillen voor mannen en vrou-
wen.

22 Hoofdstuk 1 Inleidingtot de beschrijvende statistiek


1.27 Open in Excel het bestand 'ToP 100'.
a Maak een histogram van de omzetten in 1990. Maak klassen van 10000 mil-
joen.
b Maak een kruistabel van branchecode en land van de onderneming. Vallen
bepaalde resultaten hierbij op?

1.28 Open in Excel het bestand 'woN 1 NGEN'.


a Maak een spreidingsdiagram met op de horizontale as het bouwjaar en langs
de verticale as de grondoppervlakte. Wat valt op?
b Maak een kruistabel van wijk en garage. In welke wijk hebben relatief de
meeste huizen een garage?
c Bekijk (aansluitend op vraag b) het gemiddeld aantal kamers, uitgesplitst
naar wijk en wel of geen garage. (Dus kies in de draaitabel voor het gemid-
delde.) Beschrijf in alledaagse bewoordingen je conclusie.

Deel B Open vragen 23


...•
.
2 Maatstaven voor ligging
en spreiding

Deel A Multiplechoicevragen

m1 De mediaan van een even aantal waarnemingen is gelijk aan:


a de gemiddelde uitkomst
b de hoogste minus de laagste waarneming gedeeld door twee
c het gemiddelde van de middelste twee waarnemingen na ordening
d het getal dat het meeste blijkt te zijn waargenomen

m2 Het gemiddelde maandinkomen van een groep van 15 net-afgestudeerde


hbo-ers is 1.850 euro per maand. Er blijkt nog een zestiende persoon tot die
groep te behoren. Zijn maandinkomen bedraagt 2.170 euro. Van de totale
groep van zestien personen is het gemiddelde inkomen dus:
a 2.010 euro
b 1.870 euro
c 2.150 euro
d niet te berekenen

m3 Bij een frequentieverdeling van de gewichten van schapen wordt gewerkt


met klassen van 10 kilogram breed. De gewichten worden op gehele kilo-
grammen afgerond. De klasse 20 - < 30 heeft dus als werkelijke bovengrens:
a 10kg
b 29,5kg
c 30kg
d 30,5kg

m4 De variantie is:
a slecht hanteerbaar als maatstaf voor spreiding
b de wortel uit de standaarddeviatie
c een grootheid die wordt opgebouwd uit gekwadrateerde afwijkingen van
waarnemingen ten opzichte van het gemiddelde
d het kwadraat van de gemiddelde afwijking

mS Voor een steekproef van 500 werknemers van een groot concern is in 2001
de verdeling van de jaarinkomens onderzocht. Hierbij bleek dat de stan-
daarddeviatie van die inkomens 7.500 gulden bedroeg. Terwille van een in-
ternationale publicatie dienen de gegevens te worden uitgedrukt in euro's
(1 euro= afgerond f 2,20). De standaarddeviatie gemeten in euro's bedraagt
dus:
a 16.500
b 36.300
c 3.409
d 1.100

24
m6 In een boxplot kan men diverse kenmerken van een frequentieverdeling af-
lezen. Men kan hierin echter niet aflezen:
a de mediaan
b het rekenkundig gemiddelde
c het eerste kwartiel
d de hoogste waarneming

DeeiB Openvragen

2.1 Aan 20 personen die allemaal 40 jaar oud zijn, is gevraagd hoeveel jaar zij
volledig dagonderwijs hebben genoten sinds hun eerste levensjaar.
De resultaten waren als volgt:

10 16 18 16 13 21 18 20 12 15
12 9 14 10 15 12 19 12 13 10

a Bereken voor deze groep van 20 personen het rekenkundig gemiddelde van
het aantal jaren op school.

Antwoord Voor de berekening van het rekenkundig gemiddelde geldt de volgende formule:

x =- - - - -
De 20 uitkomsten leveren gesommeerd: ~x;= ....... .
Voor het rekenkundig gemiddelde vinden we dan: x = ....... .

b Bereken de mediaan.

Antwoord Om de mediaan te kunnen bepalen, zetten we de getallen op volgorde. Dit levert:

9
21

Omdat we hier een even aantal uitkomsten hebben, geldt als mediaan:
.... + ....
xme = - - -
2

c Bepaal de modus.

Antwoord In het geval van afzonderlijkewaarnemingen zoals hier, is de modus gedefinieerd als
de uitkomst met de hoogste frequentie. Inspectie van de uitkomsten levert ons dat
de uitkomst ... . het meeste voorkomt. Dus:

xmo = 0 ••• 0 •••

Deel B Open vragen 25


d Bereken de gemiddelde absolute afwijking ten opzichte van het rekenkundig
gemiddelde.

Antwoord De formule voor gemiddelde absolute afwijking luidt:

GAA=-----

We bepalen term voor term de abso-


lute waarde van het verschil tussen
'
10- ... = .. .
. .. ... .. .. '
12- ... = .. .
waarneming en rekenkundig gemid-
16- ... = .. . 9- .. . = .. .
delde.
18- ... = ... 14- .. . = .. .
16- ... = .. . 10 - ... = .. .
Totaal vinden we voor de som van
13- ... = .. . 15- ... = .. .
21- ... = .. . 12- ... = .. .
de afwijkingen ...... + ...... = ..... .
18- ... = .. . 19- ... = .. .
20- ... = .. . 12 - ... = .. .
Dus GAA=--
12- ... = .. . 13 - ... = .. .
15- ... = .. . 10 - ... = .. .
--+ --+

2.2 Een fabrikant van batterijen heeft


100 batterijen getest op hun levens-
Levensduur Frequentie
duur. De resultaten zijn weergegeven
80,0-< 90,ouur 12
in de volgende tabel:
90,0 -< 100,0 uur 24
a Bereken de gemiddelde levensduur
100,0 -< 110,0 uur 32
van de onderzochte batterijen.
110,0 -< 120,0 uur 26
120,0 -< 130,0 uur 6
Antwoord De formule voor het rekenkundig ge-
Totaal 100
middelde bij een frequentieverdeling
luidt:

x=--
We moeten eerst de klassenmiddens
• • • r

bepalen en deze vervolgens verme-


nigvuldigen met de bijbehorende
Klasse lL !!!.!_ f,mi
80,0 -< 90,0 12 85 1020
frequenties.
90,0 -< 100,0 24
Voor het rekenkundig gemiddelde
100,0 -< 110,0 32
vinden we dus:
110,0 -< 120,0 26
120,0 -< 130,0 6
x=-----
Totaal

b Bereken de standaarddeviatie.

26 Hoofdstuk 2 Maatstaven voor ligging en spreiding


Antwoord De standaarddeviatie is gedefinieerd als de wortel uit de variantie. De formule voor
de variantie luidt in het geval van een frequentieverdeling:

s> = - - - - -

In de volgende tabel is een opstelling gemaakt waarmee de benodigde ter-


men kunnen worden berekend.

Klasse L_ ~ m,-x (m,- X)' /,(m,- X)•


80,0-< 90,0 12 85
90,0 -< 100,0 24
100,0 -< 110,0 32
110,0 -< 120,0 26
120,0 -< 130,0
Totaal
-6 -- - ---

Voor de variantie vinden we dus:

s2=-----

Voor de standaarddeviatie geldt:

s= .. ......

2.3 Een docent heeft gedurende 20 weken geteld hoeveel studenten zijn lessen
hebben bijgewoond. Dit leverde als aantallen:

30 36 32 28 38 25 27 37 34 31
20 33 24 35 22 19 29 35 30 25

a Bereken voor deze gegevens het rekenkundig gemiddelde.


b Bepaal de mediaan.

2.4 Een klein dorp heeft drie stembureaus: Centrum, Buitengebied Noord en
Buitengebied Zuid. Het aantal stemgerechtigden per stembureau is respec-
tievelijk 3 000, 1 000 en 1 000.
Bij bepaalde verkiezingen was het opkomstpercentage: Centrum: 60%,
Noord 40% en Zuid 40 %.
Bepaal het gemiddelde opkomstpercentage voor het hele dorp.

Deel B Openvragen 27
2.5 Een groep van 10 Nederlandse technici werkt voor een Amerikaanse olie-
maatschappij op een booreiland.
De maandsalarissen in US $ van deze technici zijn als volgt:

. .
Werknemer A
~ .•· .... ..... .. . ..
B c D E G
·•
H
- .. . .
Salaris($) 3.500 3.300 3.700 4.000 3.300 3.400 3.000 3.400 3.800 3.600

Gegeven is dat 1 US $ = € 1,10.


a Bereken in dollars het inkomen van deze groep technici.
b Bereken in euro het gemiddelde inkomen en de mediaan.

2.6 Bij een internationale bank met 400


personen in dienst is een overzicht
. . .. . .. ..............
Klasse Aantal
gemaakt van de jaarsalarissen per
(x€1.000)
werknemer.
20-< 30 80
Dat levert de volgende tabel:
30 -< 40 120
a Bepaal van deze verdeling het reken-
40-< 50 100
kundig gemiddelde en de mediaan.
50-< 70 50
b Bereken het eerste en het derde
70 -< 100 30
kwartiel.
100 -< 200 20
Totaal 400

2.7 a Bereken voor de gegevens van opgave 3 de standaarddeviatie.


b Idem voor opgave 5 (standaarddeviatie in euro).
c Bereken voor de frequentieverdeling van opgave 6 de standaarddeviatie.

- a

b
Een groep van 10 studenten behaalde de volgende scores bij een examen:
45, 60, 82, 32, 25, 75, 65, 66, 70 en 80.
Bereken het rekenkundig gemiddelde, de mediaan en de standaarddeviatie
voor deze gegevens.
Er wordt besloten alle studenten 10 punten extra te geven. Wat is het gevolg
van deze maatregel voor de bij vraag a berekende maatstaven?
c In plaats van 10 punten voor iedereen erbij (vraag b) wordt besloten de kan-
didaten allemaal een 10 o/o hogere score te geven dan zij oorspronkelijk
gehaald hebben. Wat is de invloed van deze maatregel op de onder a bere-
kende grootheden?

28 Hoofdstuk 2 Maatstaven voor ligging en spreiding


- In een gemeente is bijgehouden hoe de prijsontwikkeling is van woningen.
Hierbij wordt een onderscheid gemaakt naar het type woning.
De volgende resultaten zijn verzameld over het afgelopen jaar. Prijs-
verandering geeft het verschil aan tussen huidige verkoopprijzen en de prij-
zen van een jaar geleden.

Typewoning Aantal verkocht Aantal aanwezig prijsverandering


Villa 14 280 +5%
Rijtjeshuis 130 1600 +2,4%
Appartement 48 450 +1,6%
Twee onder een kap 26 500 +7,2%
Serviceflat 28 140 -2,5%

a Bereken voor deze gemeente de gemiddelde prijsverandering van de ver-


kochte huizen.
b Bereken op basis van de gegevens de gemiddelde waardeverandering van het
totale woningbestand op basis van weging met het aantal aanwezige huizen.

2.10 Bij een onderzoek naar het aantal


vakantiereizen dat een gezin jaarlijks
Aantal reizen per jaar Aantal gezinnen
maakt, is de volgende frequentie-
a 50
verdeling tot stand gekomen (zie de
1 80
tabel): (Er worden 200 gezinnen
2 60
ondervraagd.)
3 of meer 10
Gemiddeld worden 1,2 reizen per
Totaal 200
gezin gemaakt.
a Welk klassenmidden blijkt te horen
bij de klasse '3 of meer'?
b Bereken de standaarddeviatie van het aantal reizen per gezin.

2.11 Het gemiddelde inkomen (in € 1.000) van de 15 inwoners van een villawijk
bedraagt 110; de standaardafwijking van de inkomens van deze groep is 20.
a Er wordt een villa bijgebouwd. De zestiende bewoner van de wijk verdient
€ 110.000. Bereken het gemiddelde en de standaardafwijking van de inko-
mens van de zestien mensen.
b Een maand later arriveert de zeventiende bewoner. Deze verdient € 144.000.
Bereken het gemiddelde inkomen van de zeventien bewoners.
c Nog een maand later trekt de achttiende bewoner in zijn nieuwe huis. Hij
verdient € 76.000. Bereken de standaardafwijking van de inkomens van de
achttien bewoners.

Deel B Openvragen 29
2.12 Gegeven is de volgende tijdreeks van
de instroom van studenten in het
..... ...... . .. . ... .
Jaar Aantal
wetenschappelijk onderwijs (zie de
2002 26465
tabel).
2003 28300
2004 32225
De vraag is nu: wat is het gemid-
2005 32643
delde groeipercentage van het aantal
2006 34427
studenten per jaar?
2007 34512
Student A beantwoordt deze vraag
2008 35679
als volgt: het groeipercentage van
jaar tot jaar (telkens ten opzichte
van het vorige jaar) is:

De gemiddelde groei per jaar is dus:


. . .. .
.
Jaar Percentage
. .
optellen en delen door 6. 2003 6,93369%
Uitkomst 5,2 %. 2004 13,86926%
Student B redeneert als volgt: in 6 2005 1,29713%
jaar is de groei (35679- 26465): 2006 5.46518%
26 465 X 100 o/o = 34,8 o/o, dus de ge- 2001 0,24690%
middelde groei per jaar is 2008 3,38143%
34,8 o/o : 6 = 5,8 o/o
Wie van beiden heeft gelijk?
Licht uw antwoord toe.

2.13 Een consumentenorganisatie doet een onderzoek naar het benzineverbruik


van auto's. Een auto moest een traject van 100 km driemaal afleggen. Een-
maal in de stad, eenmaal met hoge snelheid op de autosnelweg en eenmaal
op de buitenweg. Het bijbehorende benzineverbruik (km/liter) is weergege-
ven in de volgende tabel:

.. ... .. ....... . . .·-·... . .. .. .. .....


In de stad
·~

1 op 11 (11 km met 11iter)


•·
Op de snelweg 1op14,5
Op de buitenweg 1op16

Wat is het gemiddelde benzineverbruik van de auto bij de test?

2.14 Gegeven zijn 51 getallen, die de uitkomst zijn van een bepaald experiment.
Op basis hiervan wordt het rekenkundig gemiddelde berekend. Dit is 126.
De mediaan is gelijk aan 130 en de standaarddeviatie bedraagt 25. Bij nadere
controle van de gegevens blijkt dat een van de 51 getallen verkeerd is afgele-
zen. In plaats van 148 (een getal dat bij de berekening is gebruikt) moest 199
worden gelezen.
Welke waarde heeft (na vervanging van het getal148 door 199):
a het rekenkundig gemiddelde?
b de mediaan?
c 'de standaarddeviatie?
Hint: gebruik de alternatieve formule voor s2 •

30 Hoofdstuk 2 Maatstaven voor ligging en spreiding


In een garage heeft men geregis- Werktijden wintercontrole
treerd hoe lang het uitvoeren van
Tijd (in minuten) Frequentie
een wintercontrole duurt. Van 30
50 -< 60 3
willekeurige auto's in een bepaalde
60-< 70 8
klasse heeft men de tijden in de
70 -< 80 7
klassenindeling van bijgaande tabel
80 -< 100 10
ondergebracht.
100 -< 130 2
Bepaal van deze frequentieverdeling
achtereenvolgens:
a de mediaan
b de modale klasse
c het rekenkundig gemiddelde
d de standaarddeviatie

2.16 Gedurende een periode van 100 dagen heeft men in een stad geregistreerd
hoeveel verkeersongelukken per dag zijn gemeld bij de politie. Het resultaat
is weergegeven in de volgende tabel:

Aantal ongelukken Frequentie (aantal dagen)


5 -< 10 5
10 -< 15 20
15 -< 20 30
20 -< 30 30
30 -< 50 10
50 -< 100 5
Totaal 100

a Teken een histogram van de verdeling.


b Bereken het gemiddelde aantal ongelukken per dag.
c Wat is de standaarddeviatie van het aantal ongelukken per dag?
d De administratieve afhandeling (zoals het uittypen van een proces-verbaal)
brengt kosten met zich mee voor het politiebureau. Aan vaste kosten heeft
men € 200 per dag. Verder bedragen de administratiekosten € 60 voor elk
ongeluk.
Bereken op grond van deze gegevens de gemiddelde kosten per dag en de
standaarddeviatie van de kosten per dag.

2.17 Een groep van 65 waarnemingen is in de volgende boxplot samengevat:

Afbeelding 2.1

0 100 150 200 250 300

Doe op basis van deze figuur een uitspraak over mediaan, interkwartiel-
range, minimum en maximum van de verdeling.

Deel B Open vragen 31


2.18 Een liefdadigheidsorganisatie heeft 50 collectanten die op een zaterdag mee-
werken aan een actie.
De opgehaalde bedragen per collectant waren (afgerond op euro's):

26 84 72 112 92 1SS 7S 72
63 72 80 66 64 62 87 77 60 70
68 81 67 73 70 72 73 96 76 6S

Verwerk de gegevens tot een gewone boxplot.


Welke waarnemingen worden als uitbijters gekwalificeerd?

- Bij een onderzoek in opdracht van Horeca Nederland werd onderzocht hoe-
veel geld mensen uitgeven aan eten buiten de deur. Twee groepen werden
onderscheiden, namelijk studenten die zelfstandig wonen en afgestudeerden
met minstens twee jaar werkervaring. De resultaten waren als volgt:

Uitgaven voor 30 studenten (euro per maand)


72 S1 146 30 28 88 92 47 S2 68 80 34 28 10S 76 93 ss 40 62 37 88 30 122
46 3S 29 77 40 71 S7
Uitgaven voor 40 afgestudeerden
88 130 2SS S6 0 38 167 188 132 147 78 80 40 170 280 46 174 182 7S 89 103
230 380 S7 ss 90 96 102 78 69 S3 160 19S 24S 60 94 14S 11S 22S 71

a Bereken voor beide groepen het gemiddelde en de mediaan.


b Bereken voor beide groepen de standaarddeviatie.
c Bepaal voor beide groepen een boxplot Zijn er uitbijters?
d Schrijf een korte notitie waarin het verschil wordt toegelicht tussen beide
groepen.

Door Samhoud Consultants wordt bij


bedrijven een tevredenheidsindex bere-
Bedrijf
.. .
Index
...
Omzetgroei
..
kend die aangeeft hoe tevreden het per-
A
--
82 36
soneel is over de eigen werksituatie.
Voor een groep van 12 bedrijven wordt
B ss 3
c 64 10
onderzocht of er een relatie is tussen de
D 73 22
tevredenheidsindex en de gerealiseerde
so 12
omzetgroei over het afgelopen jaar. De
84 44
index wordt genoteerd op een schaal
G 72 28
van 0 tot 100. Het resultaat is weerge-
H 69 16
geven in de bijgaande tabel:
I S4 6
Bereken de correlatiecoëfficiënt tussen
S7 10
medewerkerstevredenheid en omzet-
K 79 32
groei.
7S 36

32 Hoofdstuk 2 Maatstaven voor ligging en spreiding


2.21 Een onderzoeker wil voor de Nederlandse gemeenten het verband weten
tussen het inkomensniveau van de inwoners van die gemeente en de gemid-
delde prijs van koopwoningen.
Voor vijf willekeurige gemeenten werden de volgende gegevens verzameld
(alle bedragen X 1.000 euro):

Gemeente A B C D E
Inkomensniveau 45 50 60 55 40
Prijsgemiddelde 150 190 250 230 130

a Teken een spreidingsdiagram voor deze gegevens.


b Bereken de regressielijn waarbij het prijsniveau wordt verklaard uit het
inkomensniveau. Voorspel hiermee het prijsniveau van woningen voor een
gemeente met gemiddeld inkomensniveau van 52 duizend euro.
c Bereken de correlatiecoëfficiënt.

2.22 Open in Excel het bestand 'MuL TI F o o o'. 1


a Bereken de gemiddelde omzet over de 44 kwartalen.
b Laat zien dat de gemiddelde omzet voor de vier kwartalen afzonderlijk sterk
uiteenloopt.
Hint: voeg een extra kolom toe waarin het kwartaalnummer wordt geplaatst
en maak gebruik van een Draaitabelrapport om de vraag te beantwoorden.
(Ook het werken met Databasefuncties-te vinden onder de help van Excel-
kan hier handig zijn.)

2.23 Open in Excel het bestand 'ARCHITECT'.


a Bereken de gemiddelde prijs van de kaartjes. Beredeneer wat er gebeurt in-
dien we rechtstreeks het gemiddelde zouden berekenen van de code-
nummers van de kaartprijs in vergelijking met het gebruiken van de werke-
lijke kaartprijzen.
Hint: gebruik een Draaitabelrapport om de frequentietabel van de variabele
prijs te maken. Bepaal dan de opbrengst per kaartsoort en op basis daarvan de
gemiddelde prijs.
b De gedachte zou kunnen zijn dat mensen die een goedkoop kaartje hebben
gekocht, eerder vinden dat de prijs van de kaartjes laag is, dan mensen die
een duur kaartje kochten. Onderzoek dit door in een draaitabelrapport het
gemiddelde oordeel per prijscategorie te bekijken.

2.24 Open in Excel het bestand 'wiNKELs'.


a Bereken voor de variabele Vloer (=oppervlakte) de gemiddelde waarde en
de standaarddeviatie.
Hint: je kunt hiervoor een Draaitabelrapport gebruiken zonder variabelen in
rij en kolom te plaatsen.
b In welke winkel wordt de meeste winst per werknemer gemaakt?

1 Zie hoofdstuk 17 voor een beschrijving van de bestanden.

Deel B Openvragen 33
c Welke winkel heeft de laagste huur per m 2 ?
d In welke branche is gemiddeld de hoogste vloeroppervlakte per winkel
waargenomen?

2.25 Open in Excel het bestand 'ToP 1oo'.


Hint: bij sommige bedrijven ontbreken enkele gegevens. Elimineer deze bedrij-
ven uit het databestand indien een vraag betrekking heeft op een variabele
waarvoor geen uitkomst bekend is.
a In welk land vindt men in 1990 de meeste van deze 100 bedrijven?
b Onderzoek met de optie 'Beschrijvende Statistiek' (uit het menu Extra ---7
gegevensanalyse) de omzet in 1990. Wat is het gemiddelde? Wat is de stan-
daarddeviatie? Wat zouden we moeten verstaan onder bereik?
c Vergelijk de resultaten bij vraag b met de overeenkomstige grootheden voor
1989.
d Construeer als nieuwe variabele de winst als percentage van de omzet. Bij
welk bedrijf is dit percentage het grootst? Wat is het gemiddelde winstper-
centage?
e Bereken voor de 100 bedrijven de totale omzet en de totaal behaalde winst
(laat hierbij bedrijf 9 buiten beschouwing). Bereken het gemiddelde winst-
percentage en vergelijk uw antwoord met het resultaat van vraag d.
f Welke industrietak komt het meest voor in de Top 100?
g Bereken een nieuwe variabele die de omzet per werknemer aangeeft. In
welke industrietak is die ratio het hoogst?

2.26 Open in Excel het bestand 'BAN KERs'.


a Bereken voor de vijf functieniveaus het gemiddelde inkomen.
b Voor welk functieniveau is de standaarddeviatie het grootst?
c Bereken een regressielijn waarmee inkomen wordt verklaard door de leeftijd.

2.27 Open in Excel het bestand 'woNINGEN'.


a Bereken de gemiddelde grondoppervlakte voor alle huizen. Bepaal ook de
standaarddeviatie.
b Stel dat grondoppervlakte de enige factor is die de prijs van een huis be-
paalt. Bereken voor alle huizen de prijs van een vierkante meter grond. Wat
is de gemiddelde m 2 -prijs?
c Bereken (aansluitend op vraag b) de gemiddelde grondprijs voor de vier
wijken.
d Bereken de gemiddelde vraagprijs voor woningen met en zonder garage.
e Bewering: huizen met cv hebben gemiddeld een grotere perceeloppervlakte
dan huizen zonder cv. Onderzoek of dit juist is.

2.28 Open in Excel het bestand 'KOERSEN'.


a Bereken voor de voorspelde waarde van de Dow-Jo nesindex het gemiddelde
en de standaarddeviatie.
b Bewering: Personen die een dollarkoers lager dan 1,80 voorspellen, voor-
spellen gemiddeld een hogere olieprijs. Klopt dat?
Hint: hiervoor zou een hulpvariabele kunnen worden ingevoerd die aangeeft of
de dollarkoers boven of beneden 1,80 is.

34 Hoofdstuk 2 Maatstaven voor ligging en spreid ing


2.29 Open in Excel het bestand 'cuRsus:
a Bereken voor zowel de eindcijfers als de eerdere cijfers het gemiddelde en de
standaarddeviatie.
b Bewering: studenten die op Evaluatievraag 1 een hoge score aankruisen,
blijken gemiddeld een hoger cijfer te behalen. Wordt dit ondersteund door
de gegevens?
c Bewering: studenten die op Evaluatievraag 2 een hoge score aankruisen,
blijken ook de neiging te hebben om op evaluatievraag 3 een hoge score te
geven. Klopt dat?
d Bewering: vrouwen scoren gemiddeld hoger dan mannen, maar de stan-
daarddeviatie is lager. Klopt dat?

Deel B Open vragen 35


...•
3 Kansrekening

Deel A Multiplechoicevragen

m1 Bij de finale 100 meter schoolslag op de Olympische Spelen doen acht deel-
nemers mee. Het aantal verschillende volgorden waarop de drie medailles
kunnen worden verdeeld bedraagt:
a 8
b 336
c 8!
d 56

m2 Van een groep van 30 studenten worden drie studenten op basis van presta-
ties geselecteerd voor studie in het buitenland. Het aantal verschillende
groepjes dat kan worden gevormd bedraagt:
a 10
b 30 x 29 x 28
c 30 x 3!
d 5 x 29 x 28

m3 Voor twee elkaar uitsluitende gebeurtenissen A en B geldt:


a dat ze altijd onderling afhankelijk zijn
b dat kans op de doorsnede van A en B gelijk is aan P(A) X P(B)
c dat altijd geldt P(AjB) = P(BjA)
d dat altijd geldt P(A) + P(B) = 0

m4 Als geldt P(A IB) = 0,30 en P(A n B) = 0,20, dan is P(B) gelijk aan:
a 0,06
b 0,50
c 0,667
d 0,60

Gegevens ten behoeve van de vragen m5 en m6


Een groep van 200 personen is gevraagd naar de favoriete sport en tevens is
een indeling man/vrouw gemaakt. De resultaten staan in de volgende tabel:

Mannen 20 40 120
Vrouwen 20 40 20 80
Totaal 80 60 60 200

36
ms De kans dat een willekeurig gelote persoon uit deze groep een man is en te-
vens een tennisliefhebber is, bedraagt (zie tabel) :
a 0,10
b 0,20
c 0,70
d 0,167

m6 Van een willekeurig gelote persoon is bekend dat deze van wielrennen
houdt. De kans dat deze persoon een man is, bedraagt (zie tabel):
a 0,67
b 0,40
c 0,20
d 0,33

DeelS Openvragen

3.1 Een groep van acht studenten bestaat uit drie meisjes en vijf jongens.
De namen van de meisjes zijn: Anna, Bea en Carla; de jongens heten Dirk,
Ed, Frits, Gijs en Henk.
a Als de drie meisjes willekeurig in een volgorde worden geplaatst, hoeveel
verschillende volgorden zijn er dan mogelijk?

Antwoord We hebben te maken met de permutaties van drie elementen.


We vinden dus 3! = ... .. volgorden.
Noem a I die volgorden op: . .. .. .... . . ... . .. . ..... . . . ...... . .. . ... . ................... .

Hoeveel verschillende volgorden zijn er van de vijf jongens te vormen en hoeveel


volgorden zijn er van de acht studenten te geven?

Antwoord Jongens: ... . . volgorden.


Studenten: .... . volgorden.

b Uit de groep van vijf jongens worden twee jongens gekozen. Hoeveel ver-
schillende groepjes van twee jongens zijn er mogelijk als de volgorde waarin
die twee verschijnen niet van belang is?

Antwoord We moeten hier het aantal combinaties uitrekenen.


Het antwoord luidt@ = . .. . . combinaties.
Noem al deze combinaties: . .. .. . .. .... . .. . . ... ... . ........................ . ....... . . .

Bereken het aantal verschillende groepjes van drie studenten uit de totale groep van
acht studenten.

Antwoord Er zijn . . ... groepjes.

Deel B Openvragen 37
Bereken het aantal groepjes van twee meisjes uit de groep van drie meisjes.

Antwoord Er zijn ..... groepjes.

c Wegens goede studieprestaties krijgen twee van de acht studenten respectie-


velijk een prijs van € 100 en van € 50 uitgekeerd.
Hoeveel tweetallen zijn er als prijswinnaar mogelijk?

Antwoord Volgorde is nu wel van belang, want Anna lste prijs, Bea 2de prijs is een ander geval
dan Bea lste prijs, Anna 2de prijs. We berekenen dus het aantal variaties.
n!
Dit levert -(- - ) = ..... variaties.
n- k!

3.2 De beroepsbevolking van een bepaald land bestaat uit ambtenaren (A), zelf-
standigen (B) en de categorie overigen ( C).
De ambtenaren vormen 20% van de beroepsbevolking, de zelfstandigen
vormen 30% van de beroepsbevolking, terwijl 50% van de beroepsbevol-
king tot de categorie 'overigen' behoort.
a We kiezen door loting één lid van de beroepsbevolking.
Hoe groot is de kans dat dit een ambtenaar is?
Rechtstreeks uit de gegevens volgt P(A) = 0,2.
Hoe groot is de kans dat de gelote persoon geen zelfstandige is?
We gebruiken de complementregel:

P(B) = 1 - P(B) = ... .... .

b We loten twee willekeurige leden van de beroepsbevolking.


Hoe groot is de kans dat de beide personen tot de categorie A behoren?
Om dit te kunnen berekenen, hebben we een extra gegeven nodig, namelijk
of twee opeenvolgende lotingen uit deze populatie al dan niet te beschou-
wen zijn als onafhankelijke trekkingen.
Als we eenvoudigheidshalve veronderstellen dat de beroepsbevolking uit on-
eindig veel personen bestaat, dan veranderen de kansen niet als er een of
meer personen bij eerdere lotingen uit verdwijnen.
We vinden dan P(2 ambtenaren)= ... ... X ..... = .... .

c Van de ambtenaren is 10% ziek, van de zelfstandigen 5% en van de overi-


gen is 8% ziek. Vertaald in kansnotatie is dit:

P(ZiA) = 0,10, P(ZiB) = 0,05 en P(ZI C) = 0,08.

Geef in een venndiagram de gebeurtenissen A, B, C en Z aan.


Bereken de kans dat een willekeurig lid van de beroepsbevolking ziek is.

We schrijven P(Z) = P(Z nA)+ P(Z n B) + P(Z n C).


We vinden dus: P(ZiA)P(A) = ....... .
P(ZiB)P(B) = .... ... .
P(ZiC)P(C) = ....... .
--+
P(Z)

38 Hoofdstuk 3 Kansrekening
d Hoe groot is de kans dat een ziek lid van de beroepsbevolking tot de catego-
rie ambtenaren behoort?

Antwoord Gevraagd is dus P(AIZ). We moeten hier de omkeerregel van Bayes toepassen.
In dit concrete gevalluidt deze: ...................................................... .

Om het antwoord te kunnen berekenen, moeten we P(Z), P(ZIA) en P(A) invullen. De


kans P(Z) hebben we reeds bij vraag c berekend.
We vinden dan:
...............
P(AIZ) = - - - -

3.3 Aan de finale van de 110 meter horden doen zes atleten mee.
a Op hoeveel verschillende volgorden kunnen de plaatsen 1 tot en met 6 wor-
den bezet?
b Op hoeveel verschillende manieren kunnen de medailles voor de eerste,
tweede en derde plaats worden verdeeld?
c De nummers 1 en 2 worden opgenomen in de Nederlandse selectie. Hoeveel
verschillende tweetallen zijn er mogelijk?

Op hoeveel manieren kan men een commissie van drie personen kiezen uit
150 kamerleden?
b Stel dat de Tweede Kamer bestaat uit drie partijen, A, B en C, die ieder 50
leden hebben. Op hoeveel manieren kan men een commissie van drie perso-
nen kiezen als alle partijen één commissielid leveren?
c Op hoeveel manieren kan men een commissie van zes personen kiezen als
alle partijen twee vertegenwoordigers kiezen?

3.5 We beschikken over vier letters. In willekeurige volgorde geplaatst, vormen


de letters telkens een woord.
a Hoeveel 'woorden' kan men maken van de letters van het woord KANS?
b Hoeveel 'woorden' kan men maken van het woord KAAS?
c Hoeveel 'woorden' kan men maken van het woord KAAK?

3.6 Een groep van acht mannen en vier vrouwen wordt getraind op een ruimte-
vaartcentrum voor een bemande vlucht naar Mars. Uiteindelijk zullen later
vijf personen (drie mannen en twee vrouwen) worden geselecteerd om de
vlucht mee te maken. Een krant looft een grote prijs uit voor de persoon die
precies voorspelt wie de vijf geselecteerde deelnemers zijn. Op hoeveel ma-
nieren kan hier een verschillend vijftal worden gekozen?

3.7 Een restaurant heeft vijf mensen in dienst voor het serveren van maaltijden,
namelijk de dames Heleen, Jorien en Karen en de heren Hans en Paul.
Men besluit één persoon te loten om aan het eind van de avond het restau-
rant op te ruimen.

Deel B Open vragen 39


a Wat zijn de elementaire gebeurtenissen bij dit experiment?
b Maak een overzicht van alle samengestelde gebeurtenissen.

Vervolgens worden twee werknemers geloot om bij een afscheidsdiner de


bediening te verzorgen.
c Wat zijn de elementaire gebeurtenissen bij deze loting?
d Hoe groot is de kans dat Heleen en Karen worden geloot?
e Hoe groot is de kans dat het gelote tweetal bestaat uit een vrouw en een
man?

3.8 Bij een reclamebureau werkt men met zogenoemde promotieteams, die
worden samengesteld uit een bestand van ingeschreven kandidaten. Dit be-
stand bestaat uit vijf mannen en zeven vrouwen. Er moet een team worden
gevormd dat bestaat uit twee mannen en vier vrouwen.
a Hoeveel combinaties zijn er mogelijk bij de samenstelling van zo'n team?
b Van de kandidaten blijken Jan en Carla broer en zus te zijn. Hoe groot is de
kans dat beiden deel uitmaken van het gekozen team?

- a
Om een zaklantaarn te laten werken, moeten twee batterijen worden
geplaatst. Als een van de batterijen leeg is (of beide) doet de zaklantaarn het
niet.
In een doos zitten 6 batterijen. Hiervan zijn er vier goed en twee leeg.
Er worden twee willekeurig geselecteerde batterijen in de zaklantaarn
gestopt. Hoe groot is de kans dat de zaklantaarn werkt?
b Stel dat de zaklantaarn na de eerste plaatsing van twee batterijen niet werkt.
Deze twee batterijen worden weggegooid (zonder dat we weten of er wel-
licht een goede bij zat). Hierna worden twee volgende batterijen in de zak-
lantaarn geplaatst. Hoe groot is de kans dat de zaklantaarn nu wederom niet
werkt?

3.10 Bij een reisbureau boeken klanten vliegreizen (V), treinreizen (T) en busrei-
zen (B). Deze gaan naar twee soorten bestemmingen, het zijn namelijk win-
tersportvakanties (W) en zonvakanties (Z). In een seizoen werden 2000 rei-
zen geboekt. Deze boekingen zijn weergegeven in de volgende tabel:

. . . . ..... ·-·
V T B
.,..
Totaal
.. ..... . ..·-·...... . ......
w 40 60 500 600
z 760 140 500 1400
Totaal 800 200 1000 2000

Het reisbureau heeft als reclamestunt dat één van de boekingen geloot
wordt. De persoon op naam van wie deze boeking verricht is, krijgt een gra-
tis reis aangeboden.
Bepaal voor deze loting:
a P(Z), P(V) en P(T)
b P(VnT) enP(VnZ)

40 Hoof dstuk 3 Kansrekening


c Bepaal met de antwoorden bij a en b (dus niet met de tabel):
P(V), P(Vu T) en P(VuZ).

..
Geef aan welke kansregels hier zijn gebruikt .

Bij een exameninstituut voor rijexamens zijn drie examinatoren in dienst:


Dirk, Judith en Ilse.
Van alle kandidaten doet 40o/o examen bij Dirk, 40o/o doet examen bij Judith
en 20o/o bij Ilse. Bekend is dat het slagingspercentage voor de drie examina-
toren verschilt. Dat is 40o/o bij Dirk, 60o/o bij Judith en 70o/o bij Ilse.
a Kandidaat Peter van der Meer gaat rijexamen doen bij een van de drie exa-
minatoren. Hoe groot is de kans dat hij slaagt?
b Kandidaat Peter blijkt geslaagd te zijn. Hoe groot is de kans dat hij examen
heeft afgelegd bij Ilse?

Sommige gezakte kandidaten dienen een klacht in over het examen. Op ba-
sis van ervaring weten we dat lOo/o van de gezakten van examinator Dirk een
klacht indient. Bij Judith is dat 6o/o en bij Ilse is dat 3o/o.
c Er komt een klacht binnen over het examen zonder vermelding van de
naam van de exami

..
nator. Hoe groot is de kans dat de klacht over Dirk gaat?

Bij een onderzoek onder abonnees van de 'Breukelen Daily Observer', een
dagblad van internationale allure, is getracht te onderzoeken of het lezen
van de financiële pagina's van deze krant een relatie vertoont met het bezit-
ten van aandelen door de lezers. De volgende tabel geeft aan hoe groot de
kansen op allerlei gecombineerde kenmerken zijn:

Leest de pagina Altijd Soms Nooit


Aandelenbezit 0,16 0,12 0,06
Geen aandelenbezit 0,04 0,24 0,38

a Hoe groot is blijkens voorgaande tabel de kans dat een willekeurig gekozen
abonnee 'altijd' de financiële pagina leest? Hoe groot is de kans dat iemand
'aandelenbezit' heeft? Analyseer of deze twee gebeurtenissen onderling onaf-
hankelijk zijn.
b Hoe groot is de kans dat iemand waarvan gegeven is dat hij tot de groep
'aandelenbezit' behoort, niet tot de lezers behoort die 'altijd' de financiële
pagina lezen?
c Hoe groot is de kans dat iemand waarvan gegeven is dat die niet tot de
groep abonnees behoort die 'altijd' de financiële pagina leest, aandelen blijkt
te bezitten?

3.13 Een reisgezelschap bestaat uit zeven vrouwen en vijf mannen. Men maakt
een uitstapje met een kabelbaan. De gondels bevatten elk vier plaatsen.
Door loting wordt bepaald welke vier personen met de eerste gondel gaan.
a Bereken de kans dat hierin twee mannen en twee vrouwen terechtkomen.
b Bereken de kans dat hierin een ongemengd gezelschap terechtkomt.

Deel B Open vragen 41


Vervolgens wordt door loting bepaald welke vier personen uit de resterende
acht in de volgende gondel mogen plaatsnemen.
c Hoe groot is de kans dat er in de tweede gondel twee mannen en twee vrou-
wen terechtkomen als er in de eerste gondel slechts één man zat?
d Hoe groot is de kans dat alle vrouwen in de eerste twee gondels terecht-
komen?

3.14 Bij een maatschappij zijn zeer veel mensen in dienst. Hiervan zijn 70%
mannen en 30% vrouwen. Naar behaalde diploma's kunnen de mannen
worden onderverdeeld in 10% academici, 20% hbo-ers en 70% met alleen
middelbareschooldiploma. Bij de vrouwen is die verdeling 20 % academici,
20% hbo-ers en 60% middelbare school.
a Hoe groot is de kans dat een willekeurig geloot personeelslid een man is met
alleen een middelbareschooldiploma?
b Hoe groot is de kans dat een willekeurig gekozen werknemer vrouw is of
hbo-er?
c Hoe groot is de kans dat een willekeurig gekozen werknemer academicus is?
d Hoe groot is de kans dat een willekeurig gekozen persoon waarvan gegeven
is dat het een academicus is, een vrouw is?
e Zijn de eigenschappen 'man' en 'academicus' onderling onafhankelijk?
f Zijn de eigenschappen 'vrouw' en 'hbo-er' onderling onafhankelijk?

3.15 Bij een kansexperiment zijn de gebeurtenissen A en B onderling onafhanke-


lijk. Gegeven is P(A) = 0,60 en P(B) = 0,25.
Bereken nu:
a P(AnB)
b P(AuB)
c P(A)
d P(A nB)
e P(BiA)

Stel dat bij het kansexperiment het volgende verhaal hoort. Van de werkne-
mers van een bedrijf heeft 60% een vwo-opleiding (gebeurtenis A). Van de
werknemers is 25% meer dan 5 jaar in dienst (gebeurtenis B). Er wordt wil-
lekeurig één werknemer geloot.
f Wat is in woorden de betekenis van de gebeurtenissen die zijn genoemd bij
de vragen a, b, c, d en e?

3.16 Een student die kleurenblind is kan het verschil niet zien tussen groen, grijs
en lichtbruin. Hij heeft in een la zes groene sokken, acht grijze sokken en
vier lichtbruine sokken. Op een ochtend trekt hij twee willekeurige sokken
aan. Hoe groot is de kans dat deze van dezelfde kleur zijn?

42 Hoofdstuk 3 Kansrekening
3.17 Honderd leerlingen leggen het eindexamen vwo af. Dit examen is onderver-
deeld in een schoolonderzoek (SO) en een centraal schriftelijk examen
(CSE). Voor beide onderdelen kan men een onvoldoende of een voldoende
resultaat behalen. In de volgende tabel staan de resultaten vermeld:

Onvoldoende Voldoende Totaal


Onvoldoende 2S s 30
Voldoende 1S ss 70
Totaal 40 60 100

a Hoe groot is de kans dat een aselect uit deze 100 leerlingen getrokken persoon:
- voor het SO een onvoldoende behaalt, maar voor het CSE een voldoende?
- zowel voor het SO als voor het CSE een onvoldoende behaalt?
voor het CSE een voldoende behaalt, gegeven dat hij voor het SO een on-
voldoende behaalt?
voor het SO en voor het CSE een voldoende behaalt?
b Is het behalen van een voldoende voor het CSE onafhankelijk van het beha-
len van een voldoende voor het SO?
c Hoe groot is de kans dat van vijf willekeurig gekozen leerlingen (zonder
teruglegging) twee of meer leerlingen een onvoldoende behalen voor het
SO?

3.18 Bij het opsporen van aardgas in Nederland wordt gebruikgemaakt van geo-
logische studies waarin een prognose wordt geformuleerd dat in een bepaald
gebied aardgas zal worden aangetroffen, zodat in een later stadium tot ex-
ploitatie van zo'n gasveld kan worden overgegaan. De geologische studies le-
veren echter geen perfecte prognoses, en daarom dienen proefboringen te
worden gedaan om de aanwezigheid van gas vast te stellen.
Voor een bepaalde locatie geeft de geologische studie aan dat de kans op het
aantreffen van gas 60% is (dus 40% kans dat er niets in de grond zit). Van
de proefboringen is bekend dat deze met 80% kans gas zullen aantreffen in-
dien dat inderdaad aanwezig is in de ondergrond. Er is dus 20% kans dat
men met de proefboring geen gas aantreft, terwijl het er wél is. Indien er
geen gas in de grond zit, levert een proefboring uiteraard met 100% kans
een negatief resultaat op.
a Hoe groot is de kans om in het aangegeven terrein bij een proefboring een
negatief boorresultaat te zien?
b Hoe groot is, na het constateren van een negatief boorresultaat, de kans dat
er tóch gas in de grond zit?
c De maatschappij besluit na het negatieve resultaat bij de eerste boring, een
tweede boring te doen. Het resultaat daarvan is onafhankelijk van het eerste
resultaat. Hoe groot is de kans (met inachtneming van het antwoord bij
vraag b) dat er tóch gas in de grond zit indien ook de tweede boring geen
succes op levert?

Deel B Open vragen 43


3.19 De kans dat een typiste een brief foutloos typt, is gelijk aan 0,8. Ze gaat een
aantal brieven typen.
Hoe groot is de kans dat de vierde brief die zij typt al het tweede exemplaar
is waarin een fout verschijnt?
(Voor opeenvolgende brieven zijn de kansen op het maken van een fout on-
derling onafhankelijk).

3.20 Bij een verkiezingsonderzoek is speciale aandacht gegeven aan het kies-
gedrag van Nederlandse echtparen (bestaande uit een man en een vrouw).
Binnen de populatie van echtparen geldt dat de kans dat een willekeurig ge-
kozen man op de VVD stemt gelijk is aan 0,30. De kans dat een vrouw op de
VVD stemt is 0,24. De populatie van echtparen bestaat uiteraard uit even-
veel mannen als vrouwen. Bij nader onderzoek is komen vast te staan dat in-
dien een vrouw op de VVD stemt, in 90% van de gevallen ook haar echtge-
noot op de VVD stemt.
a Hoe groot is de kans dat een willekeurig uit deze populatie gelote persoon
op de VVD stemt?
b Hoe groot is de kans dat van een willekeurig echtpaar beide partners op de
VVD stemmen?
c Hoe groot is de kans dat van een willekeurig echtpaar geen van beide part-
ners op de VVD stemt?
d Hoe groot is de kans dat van een willekeurig echtpaar de vrouw op de VVD
stemt, indien gegeven is dat de man op de VVD stemt?

3.21 Naar een bepaalde functie solliciteren acht kandidaten. Deze groep is sa-
mengesteld uit vijf mannen en drie vrouwen. Veronderstel dat volgens loting
wordt besloten om kandidaten op te roepen voor een onderhoud.
a Als slechts één kandidaat wordt opgeroepen, hoe groot is de kans dat dit een
vrouw is?
b Als precies twee kandidaten worden opgeroepen, hoe groot is dan de kans
dat dit twee mannen zijn? En de kans op één man en één vrouw?
c Stel dat drie kandidaten worden opgeroepen. Hoe groot is de kans dat hier-
bij twee vrouwen zijn?

- Bij een instituut zijn 100 studenten ingeschreven. Hiervan studeren 60 stu-
denten economie en 40 bedrijfskunde.
Men besluit willekeurig drie studenten te kiezen.
Hoe groot is de kans dat hierbij precies twee bedrijfskundestudenten zijn?
Bereken deze kans met behulp van een kansboom. Doe de berekening voor
(a) loting met teruglegging, (b) loting zonder teruglegging.

3.23 In de gezondheidszorg doet zich bij het onderzoek naar tbc het volgende
voor:
- Indien iemand met tbc wordt doorgelicht, ontdekt men de ziekte in 98%
van de gevallen.
- Indien iemand zonder tbc wordt doorgelicht, wordt in 0,2% van de ge-
vallen ten onrechte aangegeven dat deze wél tbc heeft.

44 Hoofdstuk 3 Kansrekening
We weten dat in een bepaalde provincie 0,05% van de inwoners aan tbc
lijdt. We kiezen uit deze provincie volkomen willekeurig een persoon. Als bij
doorlichting blijkt dat het onderzoek aangeeft dat hij tbc heeft, hoe groot is
dan de kans dat dit inderdaad juist is?

3.24 Een vaas bevat N balletjes, onderverdeeld in W witte en Z zwarte balletjes


(dus W+Z=N).
Er worden achtereenvolgens twee balletjes uit de vaas gehaald. Hoe groot is
de kans dat het tweede balletje zwart is?
(Beantwoord deze vraag zowel voor loting mét als loting zónder terugleg-
ging.)

- a
b
In een fabriek wordt de kwaliteit gecontroleerd van de uitgaande producten.
De employé die de controle verrichtte, blijkt 1 % van alle goede producten af
te keuren en verder keurt hij 5% van alle slechte producten goed. De totale
productie bestaat voor 90% uit goede producten.
Bereken de kans dat een willekeurig product goed is en wordt goedgekeurd.
Hoe groot is de kans dat de controleur voor een willekeurig product de ver-
keerde beslissing neemt?
c Hoe groot is het percentage goedgekeurde producten dat de fabriek verlaat?

3.26 Van alle supporters die gebruikmaken van de trein is 40% Ajax-fan, 30%
FC Utrecht-fan en 30% Feijenoord-fan. De kans dat een Ajax-fan zich
schuldig maakt aan vandalisme bedraagt 0,60, voor een FC Utrecht-fan is
dit 0,50 en voor een Feijenoord-fan is dat 0,30. De politie pakt een - niet-
herkenbare - fan op wegens vandalisme. Hoe groot is de kans (op basis van
de verstrekte gegevens) dat dit een Ajax-fan is?

3.27 Bij een onderneming werken drie categorieën werknemers, namelijk acade-
mici (A), hbo-ers (H) en vwo-ers (V).
Van het personeelsbestand bestaat 10% uit A, dus P(A) = 0,10. Verder geldt
P(H) = 0,30 en P(V) = 0,60.
Het aantal personeelsleden is (nagenoeg) oneindig groot.
a Hoe worden willekeurig drie werknemers gekozen? Hoe groot is de kans dat
dit twee vwo-ers en een hbo-er zijn?
b Medewerkers met carrièrepotentieel worden naar een speciale bedrijfs-
kundecursus (B) gestuurd.
Van de academici wordt 50% gestuurd, dus P(B IA) = 0,50.
Verder geldt P(B IH) = 0,30 en P(B IV) = 0,20.
Bereken de kans dat een willekeurig personeelslid naar de bedrijfskunde-
cursus wordt gestuurd.
c Van een personeelslid is gegeven dat hij/zij naar de bedrijfskundecursus ge-
stuurd is. Bereken de kans dat hij/zij tot de vwo-ers behoort.

3.28 Bij een instituut staan drie merken overheadprojectoren opgesteld: merk A,
B en C. Voor merk A geldt dat de kans dat de lamp van een dergelijke pro-
jector gedurende de dag stuk gaat 0,01 is. Voor het merk B is dit 0,02 en

Deel B Open vragen 45


voor merk C is dit 0,03. Van alle in gebruik zijnde projectoren is 50 o/o van
merk A, 30 o/o van merk B en 20 o/o van merk C. Een servicemedewerker
wordt op een willekeurig moment geroepen voor een storingsmelding. Hij
heeft alleen een reservelamp bij zich die geschikt is voor merk C. Hoe groot
is de kans dat hij met deze lamp niet de reparatie kan verrichten?

3.29 Een onderzoeker op het gebied van verkeersproblematiek onderzoekt het


rijgedrag van automobilisten die worden geconfronteerd met een stoplicht
dat van 'groen' op 'oranje' springt. Op een meetpunt dat zich 100 meter
voor een kruispunt bevindt, is vastgesteld dat van alle auto's die het stop-
licht op 'oranje' zien springen, 50 o/o afremt, 30 o/o juist gas geeft en 20 o/o de
snelheid constant houdt.
a Hoe groot is de kans dat van de drie geobserveerde auto's er twee versnellen
en er een afremt?

Nadere observatie bij de stopstreep leert dat van alle auto's die (op 100 me-
ter afstand) afremmen, iedereen blijkt te stoppen bij de stopstreep. Van de
auto's die de snelheid constant hielden blijkt 80 o/o te stoppen bij de stop-
streep, terwijl van de auto's die gas geven op 100 meter slechts 10% nog
stopt bij de stopstreep.
b Hoe groot is de kans dat de volgende (willekeurige) auto aanvankelijk zijn
snelheid constant houdt en vervolgens doorrijdt bij de stopstreep?
c Hoe groot is de kans dat een willekeurige auto doorrijdt op de stopstreep?
d Een agent ziet een willekeurige auto doorrijden op de stopstreep. Hoe groot
is de kans dat dit een auto is die op 100 meter voor de stopstreep tot de ca-
tegorie 'gasgevers' behoorde?

3.30 Een voorlichtingsblad voor beleggers deelt de op de markt beschikbare


fondsen in op basis van verwachtingen over de koersontwikkeling. De ru-
briek 'tips' bevat 10 o/o van alle fondsen, de rubriek 'neutraal' bevat 70 o/o van
alle fondsen en de rubriek 'black list' 20 o/o van alle fondsen. Er zijn totaal
zeer veel (bijna oneindig veel) fondsen.
a Een belegger koopt aandelen van twee willekeurige fondsen. Hoe groot is de
kans dat beide fondsen in de rubriek 'tips' staan? Hoe groot is de kans dat
de twee fondsen niet in dezelfde rubriek staan, maar elk in een verschil-
lende?
b Iemand belegt in zes willekeurige fondsen. Hoe groot is de kans dat hiervan
vier in de rubriek 'neutraal' staan?
c Op grond van ervaring weet men dat de beleggingsresultaten voor de drie
rubrieken iets verschillen. We kennen twee soorten beleggingsresultaten, na-
melijk 'positief' en 'negatief'. Na verloop van een jaar blijkt van de fondsen
uit de rubriek 'tips' 60 o/o als resultaat 'positief' te hebben en 40 o/o heeft 'ne-
gatief: Voor de rubriek 'neutraal' is dit 50 o/o 'positief' en 50 o/o 'negatief'.
Voor de rubriek 'black list' is dit 40 o/o 'positief' en 60 o/o 'negatief'.
1 Iemand heeft aandelen van twee fondsen in bezit. Een uit de rubriek 'tips'
en een uit de rubriek 'black list'. Hoe groot is de kans dat hij bij alle twee
het resultaat 'positief' boekt? Hoe groot is de kans dat hij bij precies een
van de twee fondsen 'positief' scoort?
2 Iemand koopt aandelen van een willekeurig fonds. Hoe groot is de kans
dat hij 'positief' als beleggingsresultaat heeft?

46 Hoofdstuk 3 Kansrekening
3 Iemand koopt aandelen van een willekeurig fonds. Hij blijkt als beleggings-
resultaat 'positief' te boeken. Hoe groot is dan de kans dat dit fonds des-
tijds in de rubriek 'tips' stond?

3.31 De laatste jaren komt in Afrika een zeer ernstige ziekte voor die wordt ver-
oorzaakt door de Stromboli-bacterie. Indien deze ziekte niet snel na het stel-
len van de diagnose wordt behandeld, kan deze levensbedreigend zijn. Be-
kend is dat van alle toeristen die terugkeren van een bestemming in Afrika,
een op de tweeduizend personen drager is van de Stromboli-bacterie. Van-
wege de ernst van de besmetting is door de overheid besloten binnenko-
mende Afrikareizigers te testen. De test lijkt zeer goed te functioneren. Bij
alle reizigers die besmet zijn met de bacterie levert de test in 99 o/o van de ge-
vallen een positief resultaat (dus in 1 o/o van de gevallen wordt de besmetting
ten onrechte niet vastgesteld). Bij reizigers die niet besmet zijn geeft de test
in 98 o/o van de gevallen aan dat er niets aan de hand is. In 2 o/o van de geval-
len echter, geeft de test ten onrechte een positief resultaat, dat wil zeggen dat
de uitspraak wordt gedaan dat de Stramboli-bacterie wél aanwezig is.
a Hoe groot is de kans dat bij een willekeurige reiziger een positief test-
resultaat verschijnt?
b Hoe groot is de kans dat een reiziger waarvan het testresultaat positief is,
daadwerkelijk drager is van de Stromboli-bacterie?

Vanwege de bij vraag b berekende uitkomst worden reizigers met een posi-
tief testresultaat nog niet onmiddellijk behandeld, maar ondergaan zij voor
de tweede maal de test. De kwaliteit daarvan is precies hetzelfde als die van
de eerste test, en het tweede testresultaat is onafhankelijk van het eerste test-
resultaat.
c Bereken de kans dat een willekeurige reiziger die wordt opgeroepen voor de
tweede test opnieuw een positief testresultaat toont.
d Indien gegeven is dat een reiziger voor de tweede maal een positief test-
resultaat heeft, hoe groot is dan de kans dat deze daadwerkelijk besmet is?

3.32 Een vliegtuig heeft vier motoren. Twee aan de linkervleugel en twee aan de
rechtervleugel. Bekend is dat tijdens een vlucht op het traject Amsterdam-
Kaapstad iedere motor een kans heeft van 0,008 om uit te vallen tijdens de
vlucht.
a Hoe groot is de kans dat alle vier de motoren nog werken aan het eind van
de vlucht?
b Hoe groot is de kans dat precies drie van de vier motoren nog werken aan
het eind van de vlucht?
c Het vliegtuig vliegt veilig als alle vier de motoren het doen, als drie motoren
het doen en zelfs als twee motoren het doen, mits in het laatste geval de twee
defecte motoren niet aan dezelfde vleugel zitten. Hoe groot is de kans dat
het vliegtuig veilig de reis voltooit?

Deel B Openvragen 47
....

4 Kansvariabelen

Deel A Multiplechoicevragen

m1 We besluiten driemaal een muntstuk op te gooien en we tellen het aantal


malen dat de uitkomst 'kop' verschijnt. Dit aantal malen 'kop':
a is geen kansvariabele, omdat de uitkomsten 'kop' en 'munt' geen getallen
zijn
b is een continue kansvariabele, omdat dit spelletje eindeloos vaak kan
worden herhaald
c laat altijd een waarde tussen 1 en 3 zien
d is een discrete variabele, aangezien slechts eindig veel uitkomsten hier-
voor mogelijk zijn

m2 Voor de populatie van Nederlandse hbo-studenten is vastgesteld dat het


aantal verschillende statistiekboeken waaruit zij weleens hebben gestudeerd,
kan worden beschreven door een kansvariabele k die in de volgende tabel is
weergegeven:

•••••
Aantal boekenk 0 1 2 3 4
P(/f = k) 0,15 0,40 0,30 0,10 0,05

De kans dat een willekeurige student heeft gestudeerd uit minstens twee
statistiekboeken is daardoor gelijk aan:
a 0,30
b 0,85
c 0,45
d 0,15

m3 Een kansvariabele k kan n verschillende waarden aannemen, namelijk kl' k2 ,


... , kn. Voor de kansfunctie van de variabele k moet dan gelden:
"'Lfk="'LP(k=k;)= ...
a 0
b

c
n
d n

48
m4 Van de kansvariabele k is de verdelingsfunctie als volgt:

Bereken P(k = 14)


a 0,18
b 0,84
c 0,10
d 0,16

ms Het aantal koelkasten dat wekelijks wordt verkocht op de afdeling 'witgoed'


van een supermarkt, kan worden weergegeven door de kansvariabele k
waarvan de kansfunctie is weergegeven in de volgende tabel:

De standaarddeviatie van de variabele k bedraagt dus:


a 1,3 koelkasten
b 1, 1 koelkasten
c 0,93 koelkasten
d 1,21 koelkasten

m6 De opbrengst van de jaarlijkse 'Margrietcollecte' in Utrecht verschilt per


wijk. In de wijk Centrum-Oost mag deze opbrengst worden beschouwd als
een kansvariabele ~ waarvoor geldt E (~) = 2.400 euro en u x= 600 euro.
Voor de wijk Irenepark is dit een kansvariabele 1:. met E(i) = 3.800 en
O"Y = 800. De collecteopbrengsten voor beide wijken zijn te beschouwen als
onderling onafhankelijke kansvariabelen. Voor beide wijken tezamen is de
collecteopbrengst een kansvariabele met als standaarddeviatie:
a 10.000
b 1.400
c 1.000
d 700

Deel A Multiplechoicevragen 49
DeeiB Openvragen

4.1 Een kioskhouder verkoopt elke zaterdag een aantal exemplaren van het
Weekendmagazine.
Het aantal exemplaren dat op een
willekeurige zaterdag wordt ge-
vraagd, kan worden beschouwd als
Aantal gevraagde
.. . .. .. .. ...
~)
... ·~

Weekendmagazines
een kansvariabele k waarvoor de
30 0,10
volgende uitkomsten en bijbeho-
35 0,35
rende kansen gegeven zijn (zie de ta-
40 0,30
bel):
45 0,20
a De kioskhouder koopt elke zaterdag
50 0,05
40 exemplaren van het Weekend-
magazine in. Hoe groot is de kans
dat hij niet aan de vraag kan vol-
doen?

Antwoord De kioskhouder kan niet aan de vraag voldoen als er meer dan 40 exemplaren wor-
den gevraagd.
Dit is het geval (zie tabel) als er 45 of meer kranten worden gevraagd. De gevraagde
kans luidt: P(k = 45) + P(k = 50) = ....... .

b Hoe groot is de verwachtingswaarde van de vraag op een willekeurige zater-


dag?

Antwoord Volgens de definitie van verwachtingswaarde geldt de volgende formule:

f(/5.) = ... .... ... .. . .

Term voor term invullen levert:

30 x 0,10 + ... x ... + ... x ... + ... x ... + ... x ... = ...
c Hoe groot is de variantie van de vraag?

Antwoord De formule voor de variantie luidt:

Var(k) = . ... .... .. ... .

We kunnen deze formule ook schrijven als

We berekenen:

50 Hoofdstuk 4 Kansvariabelen
Dit geeft: 30 2 x 0,1 = 90
X ....
X ....
X ....
X . ...
+
E(J~2)

Samen met het antwoord van vraag b levert dit:

Var(k) = E(k 2 ) - {E(kW = . . ..... .. . - .. ........ = .... .

d De inkoopprijs van de kranten is voor de kioskhouder € 1,40, terwijl de ver-


koopprijs € 2,25 bedraagt. De kranten die niet worden verkocht, moeten
worden weggegooid (en leveren dus een verlies op van € 1,40 per stuk).
Bereken de verwachte winst van de kioskhouder bij een inkoop van 40
exemplaren per zaterdag.

Antwoord We berekenen de opbrengst van de verschillende aantallen die gevraagd kunnen


worden. De (onzekere) opbrengst per zaterdag definiëren we als de kansvariabelem.
Bij een vraag van 30 stuks bedraagt de opbrengst:

30 x 0,85 + (40 - 30) x (-1,40) = . .. . .

Bij een vraag van 35 stuks bedraagt de opbrengst:

. .... x .. .. . + ..... x ..... = .....

Bij een vraag van 40 stuks of meer bedraagt de opbrengst:

..... x ..... + .... . x .. .. . = .....

We brengen de opbrengstbedragen met


de bijbehorende kansen onder in de ta-
bel.
De verwachte opbrengst is te berekenen
met de formule voor verwachtings-
waarde.

f(m) = 2-mP(m = m)
=..... x . .... + .... . x ..... + . ... . x .....

4.2 Aan een machine moet regelmatig onderhoud worden verricht. De tijdsduur
van een willekeurige onderhoudsbeurt kan worden beschouwd als een kans-
variabele ~ waarvoor de kansdichtheid (die op basis van langdurige ervaring
is vastgesteld) kan worden gedefinieerd als:

f(x) = 0 voor x< 0 of x> 2


f(x)=1-!x voor O~x~2

Deel B Open vragen 51


De tijdsduur~ wordt weergegeven in uren.

a Bepaal de kans dat een willekeurige onderhoudsbeurt meer dan 1i uur


duurt.

Antwoord Blijkens de formulering van de kansdichtheid is de tijdsduur van een onder-


houdsbeurt nooit langer dan twee uur.
We moeten dus berekenen: P(l~ < !f. < 2).
Hiervoor geldt:

P(l~ q < 2) = f(l -1x) dx = .....


1t
b Hoe groot is de verwachtingswaarde van de tijdsduur van een onder-
houdsbeurt?

Antwoord We passen de definitie van verwachtingswaarde voor continue kansvariabelen toe.


Deze luidt (in algemene termen):

f(!S_) = .................. ..

Voor de hiertoepasselijke kansdichtheid wordt dit:

f(!S_) = .................... = .. .. .

In minuten luidt de verwachtingswaarde van de tijdsduur dus ... .. minuten.

c Een monteur wil een bepaalde tijdsduur reserveren om de onderhoudsbeurt


te kunnen verrichten. Deze tijdsduur moet zodanig worden gekozen dat met
kans 0,95 de onderhoudsbeurt inderdaad binnen het gereserveerde tijdsbe-
stek kan plaatsvinden. Bepaal de lengte van het te reserveren tijdsinterval.

Antwoord We moeten een dusdanige grens g bepalen dat geldt:

P(O q ~ g) = 0,95

We berekenen:
g

f
0
(1 - 1x) dx: .... .. ... .. .. . ..... .
- . . . . . . . . . . . . . . . . . . ..

De hier gevonden uitdrukking moet gelijk zijn aan 0,95.


We moeten daarom de volgende vierkantsvergelijking oplossen:

.................................... . = 0

We vinden tweeoplossingen voorg, namelijkg = ..... eng = .....


Van dezetwee oplossingen voldoet er slechts één, namelijk
g = ..... uur. De monteur moet ongeveer .. ... minuten reserveren.

52 Hoofdstuk 4 Kansvariabelen
4.3 Gegeven is dat een kansvariabele Is alleen de waarden 10, 20, 30 en 40 kan
aannemen. Verifieer voor de volgende vier getallen of de geformuleerde
waarden van f(k) zodanig zijn dat f als een kansfunctie kan worden be-
schouwd.
a f(lO) = 0,30 /(20) = 0,40 /(30) = 0,10 en /(40) = 0,10
b f(lO) = 0,50 f(20) = 0,30 /(30) = 0,30 en /(40) = 0,10
c f(lO) = 0,05 /(20) = 0,05 /(30) = 0,10 en /(40) = 0,80
d f(lO) = 0 /(20) = 0 /(30) = 1 en /(40) = 0

4.4 Het aantal augurken dat in een halveliterpot zit, blijkt enigszins te variëren.
Uitvoerig onderzoek heeft aangetoond dat dit aantal tussen 15 en 20 ligt,
waarbij de volgende kansen van toepassing zijn:

Aantal augurkenk 15 16 17 18 19 20
P(k = k) 0,10 0,30 0,30 0,15 0,10 0,05

a Teken de kansfunctie.
b Bereken en teken de cumulatieve kansfunctie.
c Hoe groot is de kans om in een willekeurige pot meer dan 16 maar minder
dan 20 augurken aan te treffen?
d Er worden twee willekeurige potten augurken geselecteerd. Hoe groot is de
kans dat beide potten meer dan 18 augurken bevatten?
e Hoe groot is de kans dat twee willekeurige potten augurken in totaal 38
augurken bevatten?

4.5 Bij een onderzoek naar het effect van onderwijshervormingen wordt aan zo-
wel leerlingen als docenten hun mening gevraagd over het 'Studiehuis'. Op
een vragenformulier gaven de betrokkenen hun mening op een schaal van 1
(zeer ontevreden) tot 5 (uiterst tevreden). Het aantal ondervraagden was
dermate groot dat het verantwoord is de resultaten te formuleren door mid-
del van twee kansverdelingen. De resultaten staan in de volgende tabel:

Oordeel over het Studiehuis Leerlingen P(!f = k) Docenten P(!f = k)


l:zeerontevreden 0,35 0,12
2: enigszins ontevreden 0,25 0,28
3: neutraal 0,20 0,38
4: enigszins tevreden 0,15 0,20
5: uiterst tevreden 0,05 0,02

a Hoe groot is de kans dat twee willekeurig gekozen leerlingen allebei zeer on-
tevreden zijn?
b Hoe groot is de kans dat vier willekeurige docenten geen van allen ontevre-
den zijn?
c Bereken voor beide verdelingen de verwachtingswaarde en de standaard-
deviatie.
d Geef een beschouwing over de gevonden resultaten bij vraag c.

Deel B Openvragen 53
Opmerking: het is discutabel of we hier in formele zin mogen spreken van
kansvariabelen. Hier is immers niet sprake van een variabele waarmee men
zomaar berekeningen mag doen, maar van een ordinale variabele waarvan
de uitkomsten bestaan uit codes van 1 tot en met 5. We hebben dit voor-
beeld echter met opzet gekozen omdat het rekenen met dergelijke variabelen,
ondanks deze principiële bezwaren veelvuldig wordt gevolgd in de praktijk.

- a

b
Bij een schoolreisje worden vier bussen gebruikt met elk een eigen chauf-
feur. Van de in totaal 130 leerlingen hebben deze bussen respectievelijk 45,
35, 30 en 20 leerlingen vervoerd.
Op basis van toeval kiest men één van de vier chauffeurs. Men vraagt aan de
chauffeur hoe groot Kis, het aantalleerlingen in zijn bus. Bereken E(K).
Op basis van toeval kiest men één van de 130 leerlingen en vraagt aan hem/
haar hoeveelleerlingen X er in de bus zaten waarmee deze leerling werd ver-
voerd. Bereken E(X).

- Het aantal personen dat in een willekeurig uur opbelt naar de klantenservice
van een groot bedrijf, wordt beschreven door de kansvariabele fs_, waarvan
de gegevens zijn geplaatst in de volgende tabel:

0,20 0,20 0,15 0,10 0,05

a HoegrootisP(fs_~3) enP(fs_~3)?
b Bereken de verwachtingswaarde van fs_.
c Bereken de standaarddeviatie van fs_.

4.8 Een verzekeringsmaatschappij heeft


een analyse gemaakt van de schade- • ~•• • -.. • • • . . ._ • • • • • • • eA •

Schadebedrag k (euro) Kans P(!! =k)


claims die in een gegeven jaar wer-
0 0,85
den ingediend door mensen met een
100 0,05
WA-verzekering. Op basis van deze
200 0,04
gegevens is de volgende kansverde-
400 0,03
ling geformuleerd (zie de tabel).
1.000 0,02
Hierin staat per individuele verze-
3.000 0,01
kerde aangegeven hoe groot in een
gegeven jaar de kansen zijn op uit-
betaling van een bepaald schadebedrag.
a Bereken het verwachte schadebedrag per klant.
b Veronderstel dat de schadeclaims per klant voor opeenvolgende jaren mogen
worden beschouwd als onderling onafhankelijke kansvariabelen. Hoe groot
is de kans de een willekeurige klant in drie opeenvolgende jaren telkens een
bedrag van minstens 1.000 euro claimt? Hoe groot is de kans dat men in
drie opeenvolgende jaren geen enkele keer een schadebedrag claimt (dus
k = 0 in alle jaren)?
c De WA-verzekering kost € 98 per verzekerde per jaar. De maatschappij heeft
25 000 klanten. Hoe is de verwachte winstbijdrage per jaar?

54 Hoofdstuk 4 Kansvariabelen
4.9 Een bezorgdienst voor pizza's brengt per dag pizza's rond na telefonische be-
stelling. Voor een pizza betaalt de consument 6 euro per stuk. Het aantal be-
zorgde pizza's per dag is J; is een kansvariabele met een verwachtingswaarde
van 120 en een standaarddeviatie van 28.
a Bereken voor de dagelijkse omzet (in euro) de verwachtingswaarde en de
standaarddeviatie.
b De ingrediënten van een pizza kosten 80 eurocent. De bezorgkosten zijn ge-
middeld 70 cent per pizza. De vaste kosten per dag voor personeel en locatie
bedragen 280 euro. Beschrijf de dagelijkse kosten als een functie van J;: het
aantal pizza's. Beschrijf de winst per dag (= omzet minus kosten) als een
functie van J;. Bereken de verwachte winst per dag en de standaarddeviatie
daarvan.
c Bepaal op basis van de gegeven vuistregel een interval waarin de verwachte
dagwinst zalliggen met ruwweg 95% kans.

4.10 Bij een groot bouwproject heeft de aannemer een taxatie gegeven voor de
tijdsduur J; om het project te voltooien. Het project duurt minimaal 12 we-
ken, maar het kan een of meer weken uitlopen. De volgende verwachting
werd geformuleerd:

Klaar aan het eind van week x 12 13 14 15 16


Kans op x 0,20 0,35 0,20 0,15 0,10

a Geef de verwachte tijdsduur van het project (neem aan dat het project altijd
aan het eind van een week klaar is).
b Berekende de standaarddeviatie van de projectduur.
c Het project kost 120.000 euro plus voor iedere werkweek 5.000 euro.
Bereken hiermee de verwachtte kosten en de standaarddeviatie ervan.
d Het project is aangenomen voor 220.000 euro. Bij voltooiing ná 14 weken
volgt een boete voor de aannemer van 10.000 per week. Bereken de ver-
wachte winst voor de aannemer.

4.11 Een verzekeringsmaatschappij heeft vastgesteld dat het aantal malen dat een
willekeurige verzekerde per jaar een verwijzing krijgt naar een specialist, kan
worden beschreven door een kansvariabele Is. die is weergegeven in de vol-
gende tabel:

Aantal verwijzingen 0 1 2 3 4
P(k =k) 0,50 0,25 0,15 0,06 0,04

a Bereken voor een willekeurige verzekerde het verwachte aantal verwijzingen


per jaar.
b Bereken de standaarddeviatie van het aantal verwijzingen per jaar.
c Per verwijzing dient de verzekering een vergoeding van 80 euro uit te keren.
Hoe groot zijn de verwachting en de standaarddeviatie van de kosten per
jaar voor een willekeurige verzekerde?

Deel B Open vragen 55


d Bereken voor een groep van 400 verzekerden de verwachting en de stan-
daarddeviatie van het totaal van de gedeclareerde bedragen voor deze 400
personen (veronderstel dat de verwijzing voor deze 400 personen als onder-
ling onafhankelijke kansvariabelen mogen worden beschouwd).
e De landelijke specialistenvereniging overweegt een honorariumverhoging
van 6% per verwijzing. Bereken opnieuw de bij vraag c gevraagde groot-
heden.

4.12 Een doe-het-zelfzaak verhuurt apparaten waarmee oud behang van een
muur kan worden afgestoomd. De vraag per dag naar dergelijke apparaten
kan worden weergegeven door een kansvariabele k die de volgende waarden
aanneemt:

.. . . . . .. .. ... ..
Aantal gevraagde machines k o 1 2 3
· ~ ·. .
P(k = k) 0,20 0,35 0,25 0,20

a Bereken de verwachtingswaarde van het aantal gevraagde machines.


b De bedrijfsleiding vraagt zich af hoeveel machines in voorraad moeten wor-
den gehouden om aan de (onzekere) vraag te kunnen voldoen. Het beschik-
baar hebben van zo'n apparaat kost 4 euro per dag, terwijl de huurprijs 6
euro per dag bedraagt.
Bereken de opbrengst per dag m indien twee apparaten beschikbaar zijn bij
de verschillende waarden van k. Doe dit ook bij drie beschikbare apparaten.
Bereken voor beide gevallen de verwachtingswaarde van m. Welke beslissing
levert de hoogste verwachtingswaarde?

In een bedrijf staat een aantal ma-


chines opgesteld die soms vanwege
Aantal storingenk P(k = k)
een storing moeten worden stil-
0 0,50
gelegd.
1 0,26
Op grond van ervaring is vastgesteld
2 0,12
dat het aantal storingen k per week
3 0,08
door de volgende kanstabel wordt
4 0,04
beschreven.
1,00
a Bereken het verwachte aantal storin- Totaal
gen per week.
b Bereken de variantie van het aantal storingen per week.
c Bereken het verwachte aantal storingen per jaar (=50 weken).
d Bereken de variantie van het aantal storingen per jaar. Hierbij mag u aanne-
men dat de aantallen storingen van week tot week onderling onafhankelijk
zijn.
e Een storing kost het bedrijf aan reparatie en gemiste productie € 500 per ge-
val. Bereken de verwachte storingskasten per jaar.

4.14 Gegeven is een continue kansvariabele ~die alleen waarden kan aannemen
op een bepaald gedeelte van de x-as. Verifieer voor de volgende drie gevallen
of de geformuleerde functie f als kansdichtheid kan dienen.

56 Hoofdstuk 4 Kansvariabelen
a f(x) =0,20 voor 5~x~ 10
=0 elders
b f(x) =~x-2 voor 5 ~x~ 10
=0 elders
c f(x) = 1x-0,75 voor O~x~4
=0 elders

4.15 Bij een loterij wordt een ronddraaiend rad gebruikt om een winnend num-
mer te loten. Op het rad is een indeling gemaakt in centimeters lopend van
0,00 tot 100,00 (wat weer gelijk valt met 0,00, want de cirkel is dan rond).
De uitkomst van één draai met het rad kan men beschouwen als een wille-
keurige trekking uit de uniforme verdeling tussen 0,00 en 100,00.
a Hoe groot is de kans dat een willekeurige draai een uitkomst oplevert tussen
40,00 en 75,00?
b Hoe groot is de kans dat drie draaien achter elkaar alle drie een uitkomst
opleveren tussen 80,00 en 100,00?
c We doen twee draaien met het rad. Hoe groot is de kans dat de eerste draai
een uitkomst kleiner dan 20,00 oplevert en de tweede draai een uitkomst
groter dan 20,00?
d Gegeven is dat de eerste draai 60 oplevert, hoe groot is dan de kans dat de
tweede draai een groter getal oplevert?
e Gegeven is dat de eerste draai A oplevert, hoe groot is de kans dat de tweede
draai meer dan A oplevert?

4.16 Gegeven is de volgende kansdichtheid:


f(x) = 0,2 voor 0 ~x~ 5
=0 elders
a Bereken E( 2f ) en Var(2f) .
b We doen twee trekkingen uit deze verdeling. Hoe groot is de kans dat beide
uitkomsten groter dan 4 zijn?

4.17 Bij een groot bedrijf wordt onderzocht hoe de tijdsduur verdeeld is die no-
dig is voor het verzenden van faxberichten. Na enig onderzoek blijkt deze
tijdsduur 2f een continue kansvariabele te zijn die wordt gekenmerkt door de
volgende kansdichtheid (x in minuten):
f(x) = 0,50- 0,125x voor 0 ~x~ 4
=0 wmx<O~x~4
a Bereken de kans dat het verzenden van een willekeurig faxbericht minder
dan 1,00 minuut duurt.
b Hoe groot is de kans dat voor vier willekeurige faxberichten geldt dat er pre-
cies twee korter dan 1 minuut duren?
c Bereken de verwachtingswaarde van 2f.

Antiekhandelaar Lauwen overweegt op een veiling een fraaie Friese staart-


klok te kopen. Bekend is dat deze klok een bedrag zal moeten opbrengen
tussen € 20.000 en € 30.000.
Een concurrent van Lauwen wil eveneens een (onbekend) bod X doen,
waarvan de hoogte mag worden beschouwd als een trekking uit een recht-

Deel B Openvragen 57
hoekige kansverdeling tussen 20 000 en 30 000. Gelet op het veronderstelde
continue karakter van de kansvariabele, mogen we ervan uitgaan dat beide
partijen nooit exact hetzelfde bod zullen doen.
a Veronderstel dat Lauwen € 23.000 biedt. Hoe groot is de kans dat hij daar-
mee in het bezit komt van de klok?
b Veronderstel Lauwen biedt € 28.000 respectievelijk € 30.000. Hoe groot is
dan de kans op aankoop van de klok?

Er is een klant aan wie Lauwen de klok voor een bedrag van € 31.000 on-
middellijk kan verkopen.
c Hoeveel bedraagt de verwachte winst voor Lauwen bij de biedingen die bij
de vragen a en b worden overwogen?
d Noem het bedrag dat Lauwen gaat bieden B. Bij welke bieding B is de ver-
wachte verkoopwinst zo hoog mogelijk?
e Veronderstel dat de klant niet € 31.000 maar € Y wenst te betalen. Geef aan
hoe het optimale bod B afhangt van de gekozen Y.

4.19 Een klein bedrijf produceert ronde houten borden. Als gevolg van de ver-
schillende dikten van de gebruikte boomstammen kan de diameter van de
borden enigszins variëren. De diameter d van de borden is een kansvariabele
met een rechthoekige verdeling die wordt weergegeven door:
f(d) = 0,2 voor 25 ~ d ~ 30
=0 elders
Bereken de verwachtingswaarde van de oppervlakte van de geproduceerde
borden.

4.20 Bij een makelaar wordt bijgehouden hoe de relatie is tussen het aantal
bezichtigingen en de uiteindelijke tijdsduur tot de verkoop.
Men telt het aantal bezichtigingen dat plaatsvindt in de eerste maand vanaf
de koopaankondiging. Daarnaast kijkt men naar de tijdsduur dat het huis te
koop staat. Bekend is dat na drie maanden alle huizen zijn verkocht. De
gegevens staan in de volgende tabel:

. .. . . ..
Aantal bezichtigingen 0
·• .
1,5 (namelijk 1 of 2)
.
4(3,4of5)
. ..
7(6, 7of8)
in de eerste maand
Tijdsduur tot verloop
0-<1maand 0,00 0,05 0,15 0,10
1-<2 maanden 0,05 0,10 0,15 0,05
2-<3 maanden 0,20 0,10 0,05 0,00

Neem bij de berekeningen voor de tijdsduren het gemiddelde van de tijd-


vakken, dus respectievelijk 0,5 maand, 1,5 maand en 2,5 maanden.
a Bereken de verwachte tijd dat een huis te koop staat en de verwachtings-
waarde van het aantal bezichtigingen in de eerste maand.
b Als gegeven is dat een pand 6, 7 of 8 maal werd bezichtigd, hoe groot is de
kans dat het werd verkocht in de eerste maand?

58 Hoofdstuk 4 Kansva riabelen


c Hoe groot is de kans dat er 0 bezichtigingen zijn in de eerste maand? Hoe
groot is de kans dat het dan in de tweede maand wordt verkocht? Hoe groot
is de kans dat het in de derde maand wordt verkocht?
d Wat is de verwachte tijdsduur tot verkoop voor huizen die nul bezichtigin-
gen hebben in de eerste maand? Wat is die verwachte tijdsduur voor huizen
die 6, 7 of 8 bezichtigingen hadden?

4.21 (Sluit aan bij § 4+.)


Een overheidsinstantie die is belast met het doen van voorspellingen met
betrekking tot de ontwikkeling van de economie heeft voor een zeker jaar
voorspellingen gemaakt voor het niveau van de inflatie en de economische
groei. De inflatie in dat jaar zal 6 %, 8% of 10% bedragen. De economische
groei zal-2 %, 0%, 2% of 4% zijn.
Aangezien de desbetreffende varia-
belen niet onafhankelijk zijn, zijn de
kansen op de verschillende uitkom-
2% 4%
sten tot uitdrukking gebracht in de
6% 0,05 0,20 0,20 0,05
volgende tabel:
8% 0,05 0,15 0,05 0,05
a Hoe groot is de kans op een gelijktij-
10% 0,10 0,05 0,05 0,00
dig optreden van een inflatie van
hoogstens 8% en een economische
groei van hoogstens 2 %?
b Bereken de marginale kansen voor de inflatie en de economische groei en
bereken de verwachtingswaarde van het inflatieniveau en van de economi-
sche groei.

4.22 (Sluit aan bij§ 4+.)


In een druk studentenrestaurant is een onderzoek gedaan naar de wachttijd
t die verstrijkt tussen de binnenkomst van de klanten en het moment
waarop de maaltijd wordt geserveerd.
Voor de gemiddelde wachttijd werd 12 minuten gevonden.
De standaarddeviatie bedroeg 2 minuten.
Verder is er niets bekend over de kansvariabele t.
Geef aan hoe groot op z'n hoogst de kans is dat de wachttijd minder dan 6
minuten of meer dan 18 minuten is.

4.23 (Sluit aan bij § 4+.)


Van een variabele,! is de verwachtingswaarde E (,!) = 80. De variantie is ook
bekend:
Var(,!)= 16. De verdeling van,! is niet bekend.
Geef aan hoe groot de volgende kansen op z'n hoogst kunnen zijn:
P(,! < 72 of ,! > 88)
p(,! < 68 of ,! > 92)
p(,! < 60 of ~ > 100)

Deel B Open vragen 59


..•
.
5 Normale verdeling

Deel A Multiplechoicevragen

m1 Voor een willekeurige normale verdeling geldt dat de volgende drie groot-
heden aan elkaar gelijk moeten zijn:
a gemiddelde, standaarddeviatie en mediaan
b modus, de totale kans en de variantie
c mediaan, gemiddelde en modus
d standaarddeviatie, variantie en spreidingsbreedte

m2 Van een kansvariabele ~ is bekend dat deze de standaardnormale verdeling


volgt. De kans P (~ < -1,20) bedraagt volgens de tabel:
a 0,1151
b 0,8849
c 0,1539
d 0,3849

m3 Voor de populatie van mannelijke economiestudenten is bekend dat het li-


chaamsgewicht kan worden beschreven door middel van een normaal ver-
deelde kansvariabele ~ met fl = 75 kilogram en een standaarddeviatie van 6
kilogram. Hieruit volgt dat het percentage studenten van deze populatie dat
een gewicht van meer dan 85 kilogram heeft ongeveer bedraagt:
a 95,2
b 66
c 34
d 4,8

m4 Het aantal jaarlijkse reiskilometers aan woon-werkverkeer per auto is voor


de werknemers van een groot concern nauwkeurig geregistreerd. Het bleek
hierbij dat dit aantal goed kon worden beschreven door een normale verde-
ling met fl = 8 000 kilometer en 0' = 2 500. Op basis van deze verdeling kan
worden vastgesteld dat de 10 % werknemers die het grootste aantal woon-
werkkilometers maken, per jaar per persoon meer reizen dan ongeveer:
a 8000km
b 10500km
c 11200km
d 12100km

60
ms Van een normaal verdeelde variabele~ is gegeven dat ze een standaarddevia-
tie heeft die gelijk is aan 9. Verder is gegeven dat P(~ < 15,5) = 0,3085. De
waarde van f1 van deze variabele is dan:
a 16
b 17
c 20
d 11

m6 Voor een speerwerper geldt dat het resultaat van een worp ~ kan worden be-
schreven door een normale verdeling met f1 = 61 meter en er= 3 meter. De
speerwerper doet drie pogingen, waarvoor mag worden verondersteld dat de
worpresultaten kunnen worden beschouwd als onderling onafhankelijke kans-
variabelen. De kans dat het gemiddelde resultaat van de drie worpen minder
is dan 59 meter, is ongeveer gelijk aan:
a 0,35
b 0,255
c 0,125
d 0,745

DeeiB Openvragen

5.1 De brandduur van een bepaald type gloeilamp kan worden beschouwd als
een kansvariabele ~ die normaal is verdeeld met een verwachtingswaarde
van 1600 uur en een standaarddeviatie van 100 uur.
a Hoe groot is de kans dat een willekeurige gloeilamp van dit type een brand-
duur heeft van meer dan 1 800 uur?

Antwoord De brandduur van de gloeilamp wordt beschreven door de kansvariabele !f met:

!f - N(J.L = 1600, er = 100)

Gevraagd is: P(!S. > 1800)


Om de tabel van de standaardnormale verdeling te kunnen toepassen, moeten we
de transformatieformule toepassen.
Deze luidt:

Z= - - - -

Invullen levert:

z=--------

Dezez-waarde levert in de tabel P(g > .... . ) = . ....


Dus: P(~ > 1800) = .....

b Bereken de kans dat de levensduur van een willekeurige gloeilamp tussen


1550 en 1 700 uur uitkomt.

Deel B Open vragen 61


Antwoord Gevraagd is: P(1550 < 5. < 1700)
Om de tabel van de standaardnormale verdeling te kunnen toepassen, is het handig
de gevraagde kans te splitsen.
We schrijven:
P(1550 q < 1700) = P(1550 q < 1600) + P( ........ .. . )
Toepassing van de transformatieformule voor de eerste term levert:

z=--------

De tabellevert hierbij:
P(K < 1550) = P(?. < .. ... ) = .... ......
Dit is echter niet de gevraagde kans, maar het 'staartgedeelte'. We moeten de afge-
lezen kans nogvan 0,5 aftrekken. Dit levert:
P(1550 < 5. < 1600) = 0,5 - ........ .. = ..........
Voor de tweede term van de 'gesplitste' kans vinden we:

z=--------

De tabel levert:
P(K > 1700) = P(p .... ...... ) = .... .
We zochten echter: P(1600 < 5. < 1700). Deze kans bedraagt:
P(1600 < 5. < 1700) = .... .... . = .. .....
Samen leveren de gevonden uitdrukkingen:
P(1550<5_<1700) = .... ..... + .. ....... = .... .... .

c Hoe groot is de kans dat een willekeurige lamp van het beschouwde type
een brandduur heeft tussen 1650 en 1 750 uur?

Antwoord Gevraagd is: P(16SO < 5. < 1750)


We schrijven deze kans als het verschil van twee uitdrukkingen:
P(1650 < 5. < 1750) = P(5. > . .. . .. ) - P(5. > . . .. .. )
We bepalen beide kansen met de tabel van de standaardnormale verdeling.
Afgelezen levert dit: P(5. > ...... .. .) = .... .....

De tweede kans P(5. > ..... ) levert: z = - - -- -

Aflezen levert: P(5. > ..... ) = .. ...


Samen leveren de afgelezen kansen :
P(1650 < 5. < 1750) = P(5. > .... .... .. ) - P(K > ........ .. )

d Voor een groep van 25 gloeilampen van het hier beschouwde type wordt de
gemiddelde brandduur bepaald.
Bepaal de kans dat dit gemiddelde uitkomt tussen 1570 en 1630 uur.

Antwoord We definiëren de kansvariabele2i'waarvoor geldt:


f(2i') = .. .. . en Var® = .....
De standaarddeviatie van 2i' bedraagt dus:
(]'~ = .....
Gevraagd is:
P(1570 < 2i' < 1630)
We splitsen deze uitdrukking in:

62 Hoofdstuk 5 Normale verdeling


P(1570 < ~ < 1630) = P(1570 < ~ < 1600) + P(1600 < ~ < 1630)
We bepalen deze kansen met behulp van de tabel.

P(1600 < ~ < 1630) = 0,5 - P(?. >... .. : .~.: ..... )

= 0,5 - P(~ > 1630)

en P(1570 <!f < 1600) = 0,5 - P~ < 1570)

= 0,5 - p(?. < · · · · ·: .~.: · · · · ·) (spiegelen)

= 0,5- P(p .......... )

Samen leveren deze kansen:


P(1570 < ~ < 1630) = ........ .... + ............ = ...... .

5.2 Een bedrijf maakt schroeven en bijpassende moeren.


Voor de diameter van de schroeven geldt dat deze kan worden beschouwd
als een variabele ~ die normaal is verdeeld met verwachtingswaarde
E(~) = 2,00mm en standaarddeviatie O"x = 0,12mm.
Voor de diameter 2: van de moeren geldt een normale verdeling met
E (L:) = 2,20 mm en cr~ = 0,09 mm.

a Men kiest een willekeurige schroef.


Hoe groot is de kans dat deze schroef een diameter heeft die groter is dan
2,20mm?

Antwoord Gevraagd is P(!f > 2,20). Dat is het gearceerde deel in afbeelding 5.1.
We passen de tabel van de standaardnormale verdelingtoe en vinden :

z=-----

DetabellevertP(p .. ... .. ) = P(!f > 2,20) = ...... .

Afbeelding 5.1

I'= 2,00 g =2,20

Deel B Openvragen 63
b Men kiest een willekeurige moer. Hoe groot is de kans dat deze moer een
diameter heeft die kleiner is dan 2,00 mm?

Antwoord Gevraagd is P(l: < 2,00)


We gebruiken de tabel van de standaardnormale verdeling en berekenen daartoe:

z=-----

De tabel levert: P(?. < .... .) = P([' < 2,00) = .....

c Er wordt een willekeurige schroef en een willekeurige moer gepakt. Hoe


groot is de kans dat de schroef in de moer past? We gebruiken hierbij als cri-
terium dat de diameter van de schroef kleiner moet zijn dan de (binnen)-
diameter van de moer.

Antwoord We hebben hier te maken met een 'passingsprobleem'.


We construeren daarom de verschilvariabele ]{ = ~ - !{.
De variabele]{ is normaal verdeeld met:
f(]{) ..... ... ........... .
en Var(]{ = .................... = ..... .
dus uv
Gevraagd is: P(]{ > o)
We berekenen: P(]{ > o) = 1 - P(]{ <o)
Voor de berekening van P(]{ < o) kunnen we rechtstreeks de tabel van de standaard-
normale verdeling toepassen. (Geef zelf in figuur 5.2 de oppervlakte aan die over-
eenstemt met de gevraagde kans.)

Afbeelding 5.2

J.l =...

We vinden: z = ----

De tabel levert: P{]{ < o) = P(?. <. ..... ) = ......


Dus p(]{ > o) = 1 - .... . = .....

64 Hoofdstuk 5 Normale verdeling


5.3 Een variabele g_ heeft een standaardnormale verdeling.
a Bereken P(g_ > 1,68), P(g_ < 1,12) en P( -0,68 < g_ < 1,00).
b Voor welke waarden van a geldt:
P(g_ >a) = 0,5, P(g_ >a) = 0,25 en P(g_ >a) = 0,90?
c Bepaal de kansen bij vraag a ook met de tabel van de cumulatieve normale
verdeling.

5.4 Bepaal voor de standaardnormaal verdeelde variabele g_:


P(g_ < -0,35), P( -0,16 < g_ < +0,16) en P(g_ > -1,15)

5.5 In een fabriek staat een machine met vier identieke onderdelen. Voor alle
onderdelen geldt dat deze een levensduur hebben die normaal verdeeld is
met f1 = 8 000 uur en a= 2 000 uur. De onderneming heeft besloten dat, zo-
dra een van de vier onderdelen uitvalt, steeds alle vier de onderdelen ver-
nieuwd worden. Verder wil men preventief alle onderdelen vervangen indien
nog geen defect is opgetreden na het verloop van een nader te bepalen tijds-
periode van Tuur.
a We bestuderen eerst één onderdeel. Wat is de tijdsduur T 1 waarvoor geldt
dat de kans 95% is dat het onderdeel nog functioneert na T 1?
b Gegeven de waarde van T 1 bij vraag a. Hoe groot is de kans dat alle vier de
onderdelen nog functioneren na T 1 ?
c Bepaal de tijdsduur T waarvoor geldt dat de kans 90% is dat de gehele ma-
chine nog functioneert na verloop van T uur.

- a
b
De gewichten van appels uit een grote partij blijken normaal verdeeld te zijn
met f1 =lOOg en a= 20g.
We willen deze appels in vijf gewichtsklassen verdelen die allemaal evenveel
appels bevatten.
Wat is de klassengrens van de 20% appels met het geringste gewicht?
Bepaal ook de andere klassengrenzen.

5.7 Een garagebedrijf bestudeert de tijdsduur waarin de jaarlijkse servicebeurt


van een auto kan worden uitgevoerd. Deze kan worden beschouwd als een
normaal verdeelde variabele x met f1 = 120 minuten en a= 20 minuten.
a Hoe groot is de kans dat een servicebeurt meer dan 150 minuten vergt?
b Een klant komt zijn auto brengen voor service. De werkzaamheden gaan
onmiddellijk beginnen. De garagehouder zegt tegen de klant: 'Komt u over
X minuten maar terug.' Hoe groot moet X worden gekozen als we eisen dat
de klant minder dan 5% kans wil hebben dat hij nog moet wachten als hij
zich na X minuten weer meldt bij de garage? En hoe zit dat bij 1% kans?

- a
De instelling van een vulmachine is zodanig dat het gewicht 2f dat in een
verpakking terechtkomt, een kansvariabele is met een normale verdeling
waarvoor geldt f1 = 506 gram en a= 5 gram.
Hoe groot is de kans dat een verpakking minder dan 500 gram bevat?

Deel B Open vragen 65


b Stel dat we de waarde van fl kunnen instellen (a blijft 5). Bij welke waarde
van fl geldt dat er slechts een kans van 0,02 is dat een verpakking minder
dan 500 g bevat?

- Een automobilist rijdt dagelijks over een provinciale weg waarvoor een
maximumsnelheid geldt van 80 km per uur. Langs de weg staat een flitspaal
opgesteld waarmee de snelheid van auto's wordt gemeten. Deze flitspaal
functioneert gemiddeld één op de tien dagen. Onze automobilist rijdt op
deze weg met een snelheid ~ die normaal is verdeeld met fl = 78 km en
a= 4 km.
a Hoe groot is de kans dat de automobilist op zekere dag harder rijdt dan 80?
En harder dan 85?
b Er wordt pas een boete van € 50 gegeven indien voor de auto minstens een
snelheid van 85 wordt gemeten. Hoe groot is naar verwachting het boete-
bedrag per jaar (= 250 dagen) van de automobilist (gegeven het feit dat de
flitspaallang niet altijd werkt)?
c Indien de gemeten snelheid 90 km is of hoger, volgt een boete van € 100. Be-
reken opnieuw het jaarlijks te verwachten boetebedrag.

5.10 Voor een verwarmingsbedrijf doet een monteur de jaarlijkse routine-


controles van cv-installaties bij particulieren. Op basis van ervaring weet hij
dat de tijdsduur van een klantenbezoek (inclusief reistijd) als een normaal
verdeelde variabele kan worden beschouwd met fl = 50 minuten en <T = 10
minuten.
a Hoe groot is de kans dat een klantenbezoek meer dan 1 uur vergt?
b Hoe groot is de kans dat 4 geplande klantenbezoeken samen meer dan 4 uur
vergen?
c Bepaal de kans dat vier klantenbezoeken alle vier meer dan een uur vergen.
d Beredeneer waarom zonder berekening al kan worden aangegeven dat de
kans bij vraag c een lagere waarde moet hebben dan bij vraag b.

5.11 De reistijd van een werknemer naar zijn kantoor in Amsterdam is niet hele-
maal constant vanwege de drukte op de wegen. Deze reistijd !. kan worden
beschouwd als een normaal verdeelde kansvariabele met fl = 35 minuten en
<T = 4 minuten.
a Hoe groot is de kans dat op een willekeurige dag meer dan 45 minuten reis-
tijd nodig is?
b Hoe groot is de kans dat in een week (vijf dagen) de reistijd iedere dag meer
dan 40 minuten is (reistijden zijn onderling onafhankelijk en de verdeling is
voor alle dagen hetzelfde).

Het vertrektijdstip van de betrokkene is in principe 7.30 uur 's morgens. In


werkelijkheid varieert het enigszins ten gevolge van huiselijke omstandighe-
den. Bij nader onderzoek blijken de vertrektijdstippen een normale verde-
ling te volgen met gemiddeld vertrektijdstip fl = 7 uur en 32 minuten en
<T = 4 minuten.
c Hoe is de verdeling van de aankomsttijdstippen? Hoe groot is de kans dat
het aankomsttijdstip later is dan 8.15 uur?

66 Hoofdstuk 5 Normale verdeling


- a
De tijd die een vertegenwoordiger nodig heeft voor het bezoeken van een
klant wordt weergegeven door de kansvariabele ~- Op grond van ervaring is
bekend dat ~ normaal verdeeld is met fl = 45 minuten en er= 10 minuten
(in de tijdsduur~ is ook de reistijd opgenomen).
De tijdsduren van bezoeken zijn onderling onafhankelijk.
Hoe groot is de kans dat een willekeurig bezoek meer dan 60 minuten vergt?
b Hoe groot is de kans dat acht bezoeken meer dan 6~ uur vergen?
c De vertegenwoordiger moet op zekere dag tien klanten bezoeken. Hoeveel
tijd T moet hij reserveren om met 95% kans de tien bezoeken binnen de
tijdsduur T te kunnen afhandelen?

5.13 Een vulmachine die pakken rijst vult, staat ingesteld op een gemiddelde van
1010 gram per pak. De inhoud van een willekeurig pak rijst mag worden
beschouwd als een trekking uit een normale verdeling met verwachtings-
waarde 1010 en onbekende standaarddeviatie. Bij nauwkeurig nawegen van
een groot aantal pakken rijst blijkt 20% van de pakken minder dan 1 000
gram te bevatten.
a Bereken de standaarddeviatie van het vulgewicht.
b Bereken de kans dat zestien pakken rijst gemiddeld minder dan 1 000 gram
bevatten.

5.14 Een belegger overweegt zijn geld te investeren in een beleggingsfonds. Twee
fondsen, namelijk A en B komen in aanmerking om te worden gekozen. Het
onzekere jaarrendement ~ voor beleggingsfonds A kan worden beschouwd
als een normaal verdeelde kansvariabele met fl = 10% en er= 6%. Voor het
rendement y van beleggingsfonds B geldt dat dit een normaal verdeelde va-
riabele is met fl = 14% en er= 10%.
a Hoe groot is de kans dat een belegging in fonds A een rendement oplevert
dat hoger is dan 20%?
b Hoe groot is de kans dat B een rendement oplevert dat negatief is?
c Stel dat de rendementen voor de fondsen A en B beschouwd mogen worden
als onderling onafhankelijke variabelen. Hoe groot is de kans dat het rende-
ment van A volgend jaar hoger uitvalt dan voor B?

5.15 De leeftijden van schouwburgbezoekers lopen nogal uiteen. Bij toneelvoor-


stellingen van Othello van Shakespeare blijkt dat de leeftijd een normaal
verdeelde variabele is met fl = 50 jaar en er= 12.
a Hoe groot is de kans dat een willekeurige bezoeker jonger is dan 35 jaar?
b Hoe groot is het percentage bezoekers dat 65 jaar is of ouder?
c Hoe groot is de kans dat een groep van 10 willekeurig gekozen bezoekers ge-
middeld ouder is dan 55 jaar?

Om te stimuleren dat meer jongeren de voorstelling gaan bijwonen, wordt


aan mensen beneden 35 jaar een korting gegeven van 30% op de prijs van
een kaartje. Niet € 20 maar € 14. Gevolg is dat er driemaal zoveel jongeren
naar de voorstelling komen dan op basis van de berekening bij vraag a valt
te verwachten.
d Hoeveel is de gemiddelde prijs van de verkochte kaartjes na deze actie?

Deel B Open vragen 67


5.16 De tijdsduur die een bepaalde chirurgische ingreep vergt, wordt weergege-
ven door de stochastische variabele ;ç, die normaal is verdeeld met fl = 150
minuten en CT= 12 minuten.
Een patiënt moet de desbetreffende ingreep ondergaan.
a Hoe groot is het (symmetrische) 95%-voorspellingsinterval voor de tijds-
duur van de ingreep?
b Geef een grens T, zodanig dat met kans 98 o/o, de tijdsduur van de ingreep
korter is dan T.

5.17 Een fabrikant van horloges weet dat de levensduur van die horloges kan
worden beschreven door een normaal verdeelde variabele ;ç. De horloges
hebben een gemiddelde levensduur van 1200 dagen met een standaard-
deviatie van 120 dagen.
a De fabrikant geeft op de horloges een garantie van drie jaar (= 1 095 dagen).
Hoeveel procent van de horloges zal binnen de garantietermijn aanleiding
geven tot klachten?
b De fabrikant wil de lengte van de garantietermijn (L) zodanig kiezen dat
voor een willekeurig horloge de kans op een klacht binnen deze termijn
minder dan 2 o/o bedraagt.
Hoe groot moet L worden gekozen?

- De lengte van volwassen Nederlandse mannen is te beschouwen als een


kansvariabele ;ç die normaal is verdeeld met fl = 178 cm en CT= 8 cm. Ten
behoeve van de vermelding in het paspoort van de lengte van een persoon
wordt de werkelijke lengte van iemand afgerond op gehele centimeters.
Hoe groot is de kans dat een willekeurige man 186 of meer in zijn paspoort
heeft staan?

5.19 (Sluit aan bij§ 5+.)


Een dorp bestaat uit 300 huishoudens. Het gemiddelde jaarinkomen be-
draagt € 28.000 per huishouden. De standaarddeviatie van de inkomens be-
draagt € 5.000. Bij een onderzoek worden 60 willekeurige huishoudens geko-
zen en deze worden gevraagd naar het jaarinkomen.
Hoe groot is de kans dat het gemiddelde inkomen in de steekproef minder
dan € 27.500 bedraagt? Geef aan hoe groot het verschil is in het antwoord als
wel of geen rekening wordt gehouden met de eindige-populatie-
correctiefactor.

5.20 (Sluit aan bij§ 5+.)


Een populatie bestaat uit N = 100 elementen. Zonder teruglegging worden
uit deze populatie n elementen geloot. Voor deze steekproef wordt het ge-
middelde berekend van een bepaalde variabele. Bereken voor dit steekproef-
gemiddelde de standaarddeviatie, als gegeven is dat de betrokken variabele
wordt gekenmerkt door CT= 20. Doe dit:
a bij een steekproefomvang n = 10;
b bij n = 25;
c bij n = 50.

68 Hoofdstuk 5 Normale verdeling


5.21 (Sluit aan bij § 4+.)
Van een variabele~ is gegevenE(~)= 100 en Var(~)= 4. De verdeling van~
is onbekend.
a Hoe groot is hoogstens de kans dat een willekeurige uitkomst van ~ meer
dan zes eenheden afwijkt van 100?
b We doen 25 trekkingen van de betrokken variabele en we berekenen x. Hoe
groot is de kans dat dit gemiddelde meer dan 1 eenheid verschilt van 100?

5.22 De behandeltijd van patiënten bij een laboratoriumonderzoek in een zieken-


huis wordt weergegeven door de kansvariabele !, die een normale verdeling
volgt met fl = 15 minuten en u= 4 minuten.
In een afsprakenrooster wordt iedere twintig minuten een nieuwe patiënt
gepland.
a Stel dat de behandeling van patiënt A precies volgens plan om 10.00 uur
begint.
Hoe groot is de kans dat patiënt B, die twintig minuten later aan de beurt is,
nog niet kan worden binnengeroepen om 10.20 uur, omdat de behandeling
van A nog niet is voltooid?
b Hoe groot is de kans dat patiënt B, gegeven dat hij nog moet wachten om
10.20 uur, minstens vijf minuten te laat aan de beurt is?

Deel B Open vragen 69


..
.•
6 Binomiale verdeling

Deel A Multiplechoicevragen

m1 Geef aan welke van de volgende beweringen niet waar is voor een binomiale
kansverdeling:
a De succeskans 1T is constant bij iedere poging.
b Het aantal successen in n pogingen is constant.
c De verwachtingswaarde is n1T.
d De variantie is mr(l- 7T).

m2 Een arts weet dat de kans 0,20 is dat een bepaald voorgeschreven medicijn
leidt tot ongewenste bijwerkingen bij een willekeurige patiënt. Hij heeft dit
medicijn bij drie patiënten voorgeschreven. De kans dat nul patiënten deze
ongewenste bijwerkingen ervaren, is:
a 0,512
b 0,60
c 0,008
d 0,384

m3 Bij een actie van de verkeerspolitie worden eigenaren van automobielen


steekproefsgewijze gecontroleerd op hun autopapieren. Bekend is dat 15%
van de automobilisten op pad is zonder geldig rijbewijs. Er worden vijftien
auto's aangehouden. De kans dat in deze steekproef van vijftien het aantal
automobilisten /5_ dat zonder geldig rijbewijs op pad is, meer is dan 1 maar
minder dan 6, is:
a 0,6778
b 0,6646
c 0,3922
d 0,8958

m4 Voor een binomiaal verdeelde variabele 15_ geldt, dat er n = 58 pogingen ge-
daan worden met een succeskans 1T = 0,80. We willen P (/5_ < 50) uitrekenen.
Welke uitspraak is juist?
a Kansen mogen niet worden berekend met behulp van de normale bena-
dering omdat 1T groter dan 0,50 is.
b Bij toepassing van de normale benadering moet 50,5 als grens worden ge-
hanteerd.
c De gevraagde kans kan slechts worden berekend als er een rolverwisseling
plaatsvindt van het aantal 'successen' en 'pechgevallen'.
d Het correcte antwoord kan men in principe verkrijgen door voor k = 0
tot en met k = 49 de afzonderlijke kansen met de binomiale formule te
berekenen en deze kansen bij elkaar te tellen.

70
ms Bij hun eerste poging voor het schriftelijk rijexamen hebben kandidaten een
slagingskans van 0,60, zo leert de ervaring. Hoe groot is de kans dat voor
600 leerlingen van een rijschool geldt dat hiervan meer dan 380 het schrifte-
lijk examen bij de eerste poging halen?
a 0,044
b 1,000
c 0,048
d 0,444

m6 Bij een productieproces wordt de fractie afgekeurde producten f!. bestudeerd.


De kans dat een geproduceerd product defect is, bedraagt 7T, en het totaal
aantal geïnspecteerde eenheden bedraagt n. Hierbij gaan we ervan uit dat de
populatie oneindig groot is. Geef aan welke uitspraak juist is:
a Naarmate n groter is, wordt Var (f!.) groter.
b Naarmaten groter is, wordt E(f!.) groter.
c Naarmate n groter is, wordt een 95 %- voorspellingsinterval smaller.
d Als 7T = 0,50, zal de gevonden steekproeffractie ook gelijk aan 0,50 moe-
ten zijn.

Deel B Openvragen

6.1 Een groothandel in geheugenchips levert partijen 'tweede soort' die gemid-
deld 20% defecte exemplaren bevatten.
a Hoe groot is de kans dat bij vijf willekeurig gekozen geheugenchips precies
één defect exemplaar is?

Antwoord Als we aannemen dat 20% van de geheugenchips defect is, dan kunnen we de trek-
king van een geheugenchip beschouwen als een trekking met succeskans P(goed
exemplaar) = ... .. en P(fout exemplaar) = . ....
We definiëren: /s.: aantal defecte exemplaren.
Hiervoor geldt:

!s. - Bin (n = ... , 1r = ...... )

Voor de kans op één defect exemplaar in de steekproef vinden we met de formule


van de binomiale verdeling:

P(fs. = 1) = . . .... . . ...... = .... . ...... . . .

b Bereken de kans op 0, 2, 3, 4 en 5 defecte exemplaren bij de steekproef van


vijf stuks.

Deel B Open vragen 71


Antwoord P(k = 0) = .............. = ...... .
P(k = 1) = (zie a)
P(k = 2) = .............. = ...... .
P(k = 3) = ...... .... .... = · ·· ·· ··
P(k = 4) = .............. = ·· ···· ·
P(k = 5) = ............ · · = ·······

Totaal

c Een afnemer wil bij de groothandel een partij 'tweede soort' -geheugenchips
bestellen. De afnemer heeft 50 deugdelijke geheugenchips nodig. Rekening
houdend met de mogelijkheid dat een aantal exemplaren defect is, bestelt hij
een partij 'tweede soort' van 60 stuks. Bereken de kans dat de bestelde partij
minstens 50 deugdelijke geheugenchips bevat.

Antwoord Het aantal deugdelijke exemplaren k in een partij van 60 stuks kan worden be-
schouwd als een binomiaal verdeelde kansvariabele.
We stellen :
k:aantal deugdelijke exemplaren
k- Bin (n = ... , 7T = ...... )
(Let op: we tellen nu deugdelijke exemplaren.)
Voor de verwachtingswaarde vanken de variantie van k vinden we:

E(k) = ........ . . . . . . = ... . . . . en


Var(k) = .... . ......... = ...... .

De gevraagde kans luidt: P(k ;;; 50).


Omdat n hier groot genoeg is, passen we de normale benadering toe om de ge-
vraagde kans te berekenen.
Hiervoor kiezen we de variabele ({die normaal is verdeeld met JL = ... . . en er = .. . . .
Om de gevraagde kans te kunnen berekenen, moeten we als grens van het gezochte
gebied kiezeng = . . ... , zie afbeelding 6.1.

J.l= ... g =...

(Denk aan de continuïteitscorrectie.)

72 Hoofdstuk 6 Binomiale verdeling


Om de tabel van de standaardnormale verdeling te kunnen toepassen, berekenen
we:

z = - - - - --

De tabellevert de kans .... . . .


Dus: P(/s.?;; 50) = P(~ > ...... ) = .... .

6.2 Een machine produceert koperen plaatjes waarvan de dikte 2f kan worden
beschouwd als een kansvariabele die normaal is verdeeld met verwachtings-
waarde 8 mm en standaarddeviatie 0,4 mm.
a Een afnemer van koperen plaatjes eist dat de dikte van de geleverde plaatjes
niet meer dan 0,5 mm afwijkt van 8 mm. Hoe groot is de kans dat een wille-
keurig koperen plaatje niet aan deze eis voldoet?

Antwoord We bepalen de gevraagde kans met behulp van de tabel van de standaardnormale
verdeling. We vinden voor de kans P(5. > 8,5) dat

z= - - - - -

De tabellevert voor deze waarde van z: P(~ > 8,5) = .....


Samen met P(~ < 7.5) vinden we: P(~ < 7,5) + P(~ > 8,5) = .....
Zie afbeelding 6.2.

Afbeelding 6.2

7.5 8 8,5

b Hoe groot is de kans dat van tien willekeurig gekozen plaatjes er nul of één
niet aan de eisen voldoet?

Antwoord We definiëren de variabele Is. als:

Is. is het aantal plaatjes dat niet aan de dikte-eis voldoet.

De variabele Is. is binomiaal verdeeld met n = ..... en 7T = .. .. .

Deel B Open vragen 73


Voorde kans P(k = o) vinden we de formule:

P(k = 0) = .. ....... .

Enig rekenwerk levert: P(Js_ = O) = . . . . . . . .. .


Analoog vinden we: P(Js_ = 1) = ..... = .... .
Samen leveren deze uitkomsten:
P(l~ ~ 1) = P(k = O) + P(fs_ = 1) = .. ... + ..... = .....

c Hoe groot is de kans dat van 100 willekeurig gekozen plaatjes er minstens 90
aan de gestelde eisen voldoen?

Antwoord Noem het aa nta I goede plaatjes g.


Hiervoor geldt:
k - Bin (n = .. .. ., 1T = ..... )
We moeten berekenen P(k ~ 90). We doen dit door gebruik te maken van de nor-
male benadering. We berekenen eerst:
E(k) = .......... = .......... en Var(k) = .. ........ = ........ .. ,
dus u! = Jvar(!_) = ... . .

We kiezen als 'best passende' normale verdeling (zie afbeelding 6.3) :


!5. - N (JL = .. .. ., u = .. .. .)
We moeten berekenen P(k ~ 90). Wegens de continuïteitscorre ctie wordt dit
P(!S_> . . . . . .. ... )

f.l= ... g= ...

We vinden :

z=------

De tabelvan destandaard norm a Ie verdeling levert:


P(k ~ 90) = P(!S. > .. .) = ...

74 Hoofdstuk 6 Binomiale verdeling


- a
b
Een multiplechoice-examen bestaat uit tien vragen die elk drie antwoord-
mogelijkheden kennen, waarvan er precies één correct is. Een kandidaat die
volstrekt niet weet wat hij moet antwoorden, kruist naar willekeur bij elk
van de tien vragen een antwoord aan.
Bereken de kans op respectievelijk nul, één of twee antwoorden goed.
Bereken de kans dat hij minstens zes antwoorden goed heeft.
c Bereken de verwachtingswaarde van het aantal goede antwoorden.

- a
Bekend is dat van de volwassen Nederlanders thans 70% over een of meer
creditcards beschikt. We kiezen een steekproef van vijftien personen. Bepaal
met behulp van de tabel van de binomiale verdeling de kans dat de volgende
aantallen mensen in deze steekproef over een of meer creditcards beschik-
ken:
precies 10
b precies 15
c meer dan 9
d minder dan 12

6.5 Bij een aangeboren afwijking blijkt bij 25% van de baby's een bepaalde
complicatie op te treden.
In een jaar worden twintig baby's geboren met de afwijking.
Bepaal met de tabel van de binomiale verdeling de volgende kansen:
a de kans dat twee of minder baby's de complicatie vertonen
b de kans dat meer dan acht baby's de complicatie vertonen
c de kans dat het aantal baby's met de complicatie minstens 4 maar hoogstens
7 is

6.6 Een uitgever van studieboeken weet dat van alle nieuwe uitgaven die op de
markt worden gebracht, 20% zakelijk gezien een succes wordt.
a Hoe groot is de kans dat bij tien nieuwe uitgaven precies één succes voor-
komt? Hoe groot is de kans op drie successen?
b Een uitgever geeft per jaar n nieuwe boeken uit. Hoe groot is de kans dat
hierbij precies één succesvolle uitgave zit bij n = 1, 2, 3, 5, 8 en 10?

- De kans dat een willekeurig gekozen student slaagt bij een bepaald tentamen
is 0,6.
Hoe groot is de kans dat van 150 willekeurig gekozen studenten er meer dan
100 voor het tentamen slagen?

6.8 Van een bloembollensoo rt is bekend dat 5% van de bollen niet opkomt. De
bollen worden verpakt in dozen van tien stuks met de garantie dat ten min-
ste negen van de tien bollen zullen opkomen. De bollen komen onafhanke-
lijk van elkaar al of niet op.
a Bereken de kans dat van een doos alle bollen opkomen.
b Bereken de kans dat een aselect gekozen doos de gegarandeerde eigenschap
niet heeft.

Deel B Open vragen 75


c Een handelaar levert ook plusdozen die 200 bollen bevatten. Hij garandeert
dat ten minste 185 van de 200 bollen opkomen. Bereken de kans dat bij een
willekeurige plusdoos de garantie niet wordt gehaald.

6.9 Een viermotorig vliegtuig kan nog blijven doorvliegen indien tijdens de
vlucht twee van de vier motoren uitvallen. Voor een willekeurige motor is de
kans 0,005 dat deze tijdens een vlucht defect raakt.
a Hoe groot is de kans dat na een vlucht alle vier de motoren nog functione-
ren? En drie van de vier?
b Bereken de kans dat het vliegtuig neerstort.

Van de motoren zijn er twee bevestigd aan de linkervleugel en twee aan de


rechtervleugel. Indien drie of vier motoren uitvallen, stort het vliegtuig neer.
Indien echter twee motoren uitvallen die zich aan dezelfde kant van het
vliegtuig bevinden, dan stort het vliegtuig ook neer.
c Bereken opnieuw de kans dat het vliegtuig neerstort. Geef commentaar op
het verschil met het antwoord op vraag b.

6.10 Een wijnhandelaar blijkt flessen enigszins onnauwkeurig te vullen. Hierdoor


voldoet 10% van de afgeleverde flessen niet aan de inhoudsnorm van het
etiket.
a Een consument koopt twaalf flessen wijn. Hoe groot is de kans dat er precies
twee flessen bij zijn die niet aan de norm voldoen?
b Iemand koopt 144 flessen wijn. Hoe groot is de kans dat er hoogstens tien
flessen niet aan de norm voldoen?
c Iemand koopt n flessen. Hoe groot moet men n kiezen om ervoor te zorgen
dat de kans 95% is dat het percentage flessen dat niet aan de norm voldoet
lager is dan 12 %?

6.11 Een bedrijf van huismerken koopt graag afgekeurde partijen koffiezetappa-
raten op van fabrikanten. Daarna worden deze apparaten van een nieuwe
merknaam voorzien en op de markt gebracht. Het bedrijf koopt de koffie-
zetapparaten bij twee leveranciers. Namelijk 60% bij Elektrolips en 40% bij
Phitronics. Van leverancier Elektrolipsis bekend dat 10% van de apparaten
niet goed is, bij Phitronics is 30% niet in orde. Er is een nieuwe partij bin-
nengekomen. Door slordig optreden van een magazijnbediende is niet meer
te achterhalen of deze van Elektrolips of Phitronics is.
Men neemt een steekproef van 30 van die apparaten. Deze worden uitvoerig
getest.
Vastgesteld wordt dat 2 van die apparaten niet deugen.
Hoe groot is de kans dat Phitronics de leverancier is van deze partij?

6.12 In de binnenstad van Utrecht worden door de parkeerbrigade op een gege-


ven dag 800 parkeerbonnen uitgeschreven elk met een boetebedrag van
40 euro per parkeerbon. Het is een bekend gegeven dat 75% van de ontvan-
gers van zo'n bekeuring het bedrag overmaakt. 25% doet dat niet.
a Bereken voor de dag met 800 parkeerbonnen de verwachtingswaarde en de
standaarddeviatie van het aantal directe betalers. Stel dat voor deze speci-

76 Hoofdstuk 6 Binomialeverdeling
fieke dag op de uiterste betaaldatum 520 bekeurden hun boete hebben vol-
daan, is dat dan uitzonderlijk gegeven de betaalkans van 75%?
b Wat is het verwachte bedrag dat binnenkomt van een dag met 800 bekeur-
den en wat is de standaarddeviatie?
c De gemeente besluit extra invorderingsmaatregelen te nemen voor de niet-
betalers van de boete. Zo'n actie kost 5 euro per niet-betaalde parkeerbon.
De boete is nu verhoogd naar 52 euro. Bekend is dat van deze groep 60%
daarna betaalt. Maak een kosten-batenanalyse van de extra maatregel.

6.13 Het is een bekend feit dat gemiddeld 3% van alle gezinnen geld overmaakt
als er door een charitatieve instelling een beroep op hen wordt gedaan.
Onlangs werd aan 200 000 gezinnen een dergelijke oproep gedaan.
a Geef een 95%-voorspellingsinterval (symmetrisch) voor het aantal reacties.
b Per gezin wordt (zoals gevraagd) € 80 overgemaakt. 'Vertaal' het onder a ge-
geven interval in euro's.

Bij een keukenbedrijf weet men dat van alle klanten die een catalogus aan-
vragen, 15% daadwerkelijk een bestelling zal plaatsen in de maand volgend
op de toezending van de catalogus. Daarna, dus méér dan een maand later,
blijken er nooit bestellingen te worden gedaan.
a In een bepaalde maand worden 120 catalogi verzonden. Bereken de kans dat
meer dan twintig klanten een bestelling gaan plaatsen.
b In een bepaald jaar worden 1 200 catalogi aangevraagd. Hoe groot is het ver-
wachte aantal bestellingen? Bereken een voorspellingsinterval (symmetrisch)
waarvoor geldt dat hierin met 95% kans het aantal waar te nemen bestel-
lingen ligt.
c In een bepaalde periode werden 800 catalogi verzonden. Hoe groot is de
kans dat de fractie bestellers minder is dan 10% voor deze groep aanvragers?

6.15 Een autodealer beweert dat 90% van alle nieuw verkochte Toyota's binnen
drie jaar geen enkele serieuze reparatie nodig heeft. Want zo goed zijn wij
bij Toyota, sprak de dealer trots. In 2008 kwam een nieuw model op de
markt, de Toyota Wyby. Er werden er al snel 2 500 van verkocht in Neder-
land.
a Hoeveel gevallen van serieuze reparaties verwacht u na vaststelling van de
toestand van al die auto's na drie jaar? Wat is de standaarddeviatie?
b Stel dat zo'n reparatie gemiddeld 400 euro kost voor Toyota, hoeveel is dan
het verwachte bedrag aan kosten voor de 2 500 auto's?
c Achteraf blijkt dat 370 van de Toyota Wyby's binnen drie jaar een serieuze
reparatie nodig hadden. Valt dat getal binnen de verwachtingen gegeven de
eerdergenoemde 90%?

6.16 Op basis van jarenlange ervaring is bekend dat studenten aan de Hoge-
school voor Management en Techniek in Eutopia dikwijls hun diploma niet
krijgen, meestal wegens onvoldoende analytische vaardigheden. Het percen-
tage afgewezen studenten is 40% van de ingeschrevenen.
a Bereken voor een groep van zes vrienden die ingeschreven staan bij deze op-
leiding de kans dat zij alle zes hun diploma krijgen.

Deel B Open vragen 77


b Bereken de kans dat drie van de zes hun diploma krijgen en drie niet.
c Bereken voor een jaargang van 150 studenten dat kans dat meer dan 95 stu-
denten hun diploma halen.
d Het bestuur van de opleiding stelt dat men maatregelen heeft genomen om
het niveau van de analytische vaardigheden te verhogen. Stel dat voor een
nieuwe jaargang van 150 studenten achteraf blijkt dat 70 studenten hun di-
ploma krijgen. Wat is uw (statistisch onderbouwde) mening?

6.17 Een frisdrankenfabrikant neemt bij 100 proefpersonen de zogenoemde


'cola-test' af. Hierbij krijgt de kandidaat twee glazen cola te drinken, name-
lijk van merk X en van merk Y. Daarna moet de kandidaat aanwijzen welke
cola hij de lekkerste vindt. Stel dat 45% van de bevolking merk X prefereert.
Hoe groot is de kans dat de fractie liefhebbers van merk X in de steekproef
meer is dan 0,50, als we aannemen dat de proefpersonen willekeurig geko-
zen zijn uit de bevolking?

6.18 (Sluit aan bij § 6+.)


Een fabrikant heeft in een jaar van een bepaald type 400 auto's geprodu-
ceerd. Hiervan zijn 320 voorzien van katalysator model A en 80 van kataly-
sator model B. Achteraf blijkt dat model B een constructiefout heeft. De
fabrikant roept via een advertentie alle 400 auto's op voor een inspectie. Er
worden 240 auto's aangemeld. Hoe groot is de kans dat hierbij minstens 55
auto's zijn met katalysator model B?

6.19 (Sluit aan bij § 6+.)


Een frisdrankenfabrikant voert een actie waarbij onder de kroonkurk van
flessen een letter is aangebracht. Bij 10% van alle flessen is de letter 'P' aan-
wezig.
Een klant opent achtereenvolgens een aantal flessen totdat hij (voor de eer-
ste keer) de letter 'P' vindt.
a Hoe groot is de kans dat hij bij de eerste fles een 'P' vindt?
b Hoe groot is de kans dat hij bij de zesde fles de eerste 'P' vindt?
c Hoe groot is de verwachtingswaarde van het aantal te openen flessen (vóór
de eerste verschijning van een 'P')?

6.20 (Sluit aan bij § 6+.)


Bij een reisbureau vraagt 50% van de klanten naar vliegreizen, 30% naar
busreizen en 20% naar treinreizen. (De klanten vragen niet naar meer dan
één soort reizen.)
Hoe groot is de kans dat van twaalf willekeurige klanten er acht vragen naar
vliegreizen, één naar busreizen en drie naar treinreizen?

6.21 Nederland exporteert aardappelen naar Duitsland. De laatste jaren vinden


de Duitsers de kwaliteit van deze aardappelen (bintjes) onbevredigend. Veel
aardappelen vertonen verkleuringen en er zijn ook relatief veel aardappelen
met rotte plekken.

78 Hoofd stuk 6 Binomiale verdeling


Na uitgebreid onderzoek is het volgende gebleken:
- 10% van alle naar Duitsland geëxporteerde aardappelen is verkleurd.
(90% is dus niet verkleurd.)
- 5% van alle geëxporteerde aardappelen heeft rotte plekken. (95% heeft
dus geen rotte plekken.)
- 2% van alle geëxporteerde aardappelen heeft verkleuring én rotte plek-
ken.

Een exporteur is nogal geschrokken van deze percentages en laat uit zijn
zeer grote partij aardappelen, die voor de export naar Duitsland bestemd is,
een aselecte steekproef van 50 aardappelen nemen en controleren op ver-
kleuring en rotte plekken.
Bereken het volgende in vier decimalen nauwkeurig:
a De kans dat precies vijf van de 50 aardappels verkleurd zijn.
b De kans dat minstens twee aardappelen zowel verkleuring als rotte plekken
hebben.
c Als de controleur slechts één aardappel aselect trekt (in plaats van 50), wat is
dan de kans dat deze aardappel gaaf is (dat wil zeggen zonder verkleuring en
zonder rotte plekken)?
d Een Duitse consument koopt een zak met tien aardappelen waarvan er drie
rotte plekken hebben. Als deze consument vier aardappelen aselect uit de
zak kiest en schilt, wat is dan de kans dat precies één van de vier aardappe-
len rotte plekken heeft?
e Het gewicht van een aselect gekozen aardappel (ras: bintje) is bij benadering
normaal verdeeld met fl = 100 gram en CT= 20 gram. Bereken de kans dat
een aselect gekozen bintje meer dan 95,00 gram weegt.
f Van alle Nederlandse bintjes wordt 10% tot patat verwerkt. Men selecteert
hiervoor de zwaarste bintjes. Boven welke gewichtsgrens komt een bintje in
aanmerking voor het verwerken tot patat?

Deel 8 Open vragen 79


.. '

.
• I

7 De poissonverdeling

Deel A Multiplechoicevragen

m1 Welke van de volgende uitspraken over een kansvariabele Is. met een pois-
sonverdeling is waar?
a Het waargenomen aantal successen kan niet gelijk aan nul zijn.
b De verwachtingswaarde en de standaarddeviatie zijn aan elkaar gelijk.
c Er geldt fl = n · 1T.
d De variabele kan gehele waarden groter of gelijk aan nul aannemen.

m2 Het aantal noodlandingen op een bepaalde luchthaven mag worden be-


schouwd als een kansvariabele met een poissonverdeling waarbij fl = 0,5 per
maand. De kans dat in een willekeurige periode van zes maanden precies
drie noodlandingen plaatsvinden, bedraagt derhalve:
a 1,000
b 0,224
c 0,013
d ongeveer 0,455

m3 Het aantal ongevallen per maand op een kruispunt kan worden beschreven
door een poissonverdeling met fl = 0,5. De standaarddeviatie van het aantal
ongelukken per jaar bedraagt daarom:
a 6
bj6
0,5
'j6
d 0,5 x JU
m4 Het aantal bosbranden per jaar op de Veluwe mag worden beschouwd als
een kansvariabele Is. met een poissonverdeling met fl = 25. Volgens de in het
theorieboek aangegeven berekeningsmetboden kan de kans dat in een wille-
keurig jaar het aantal bosbranden groter is dan 30, worden afgelezen in:
a de cumulatieve poissontabel bij fA-= 5 en k = 6
b de standaardnormale tabel bij z = 0,20
c de standaardnormale tabel bij z = 1,1
d de gewone poissontabel bij fl = 5 en k = 6

80
ms Bij een landelijk bingospelletje is de kans op het winnen van een prijs 0,001.
In een zaal vanwaaruit een directe televisie-uitzending plaatsvindt, bevinden
zich 1 500 mensen. De kans dat zich in die zaal meer dan één prijswinnaar
bevindt, is derhalve gelijk aan:
a 0,592
b ongeveer 0,50
c 0,409
d 0,442

m6 (Sluit aan op paragraaf 7+.)


De tijd (in minuten) die verstrijkt tussen de binnenkomst van twee opeen-
volgende klanten bij een postkantoor, kan worden beschouwd als een kans-
variabele t_ die een negatief exponentiële verdeling heeft met parameter
À = 4. De standaarddeviatie van de variabele t_ is dan gelijk aan:
a 4 minuten
b 0,25 minuten
c 2 minuten
d 0,50 minuten

DeeiB Openvragen

7.1 Bij een zwak radioactief preparaat wordt een geigerteller gehouden. Deze re-
gistreert gemiddeld vier tikken per minuut. Het aantal tikken per minuut
mag worden beschouwd als een kansvariabele met een poissonverdeling.
a Hoe groot is de kans dat in een bepaalde minuut precies één tik geregis-
treerd wordt?

Antwoord De kansvariabele Is_ (het aantal tikken per minuut) wordt beschreven door een pois-
sonverdeling met f.L = 4. In de tabel van de poissonverdeling lezen we bij f.L = 4 af:
P(fs_ = 1lf.L = 4) = .. .... .. . .

b Hoe groot is de kans dat er in een bepaalde minuut meer dan drie tikken ge-
registreerd worden?

Antwoord Te berekenen is P(fs_ > 31 f.L = 4).


Weschrijvenditals:P(/s_> 3lf.L = 4) = 1- P(k ~ 3lf.L = 4).
We lezen bij f.L = 4 in de tabel af:
P(fs_ = 0) = . ..... ... .
P(fs_ = 1) = ......... .
P(fs_ = 2) = . ....... . .
P(fs_ = 3) = . . . ..... . .
-------------- +
P(fs_ ~ 3) = .... .. .... .
Dus: P(fs_ > 31 f.L = 4) = 1 - .... .... .. = .... ..... .

Deel B Open vragen 81


c Hoe groot is de kans dat er in een waarnemingsperiode van twee minuten
minder dan vijf tikken worden geregistreerd?

Antwoord Het aantal tikken in een periode van twee minuten kan worden beschouwd als een
variabele met p.. = 8.
TebepalenisP(k< SIP.= 8).
We lezen af in de tabel:
P(k = o) = ......... .
P(/s. = 1) = ..... .... .
P(k = 2) = ....... .. .
P(/s. = 3) = ......... .
P(/s. = 4) = ......... .
+
P(/s. < 5) = P(/s. ~ 4) = .....

d Hoe groot is de kans dat er in een waarnemingsperiode van 100 minuten


meer dan 450 tikken worden geregistreerd?

Antwoord Voor een periode van 100 minuten geldt p.. = 4 x 100 = 400 als de verwachtings-
waarde van het aantal tikken.
Omdat p..groot is, moet de normale benadering worden gebruikt. Als geschikte vorm
van de verdeling kiezen we:
lf- N (p.. = ..... , CT= ••..• )
We moeten berekenen:

P(/s. > 450).

Wegens de continuïteitscorrectie wordt dit: P(lf > ..... )


We vinden dan:

z= - - - --

De tabel van de normale verdeling levert dan:


P(/s. > 450) = .....

7.2 Bij een fabricageproces wordt een bepaald onderdeel gemaakt. Op grond
van ervaring is bekend dat 3 o/o van de geproduceerde onderdelen defect is
en dus moet worden afgekeurd. Er worden 100 geproduceerde onderdelen
gecontroleerd.
a Hoe groot is de kans dat er geen enkel defect exemplaar in deze steekproef
van 100 stuks wordt aangetroffen?

Antwoord In principe is hier sprake van een vaste steekproefomvang (n = 100) en een vaste
waarde voor 7f, waardoor de binomiale verdeling moet worden toegepast voor de
beschrijving van de kansen op een bepaald aantal defecten. Omdat n hier groot is en
7f klein is, gebruiken we de poissonbenadering. We kiezen als kansvariabele Is.: aantal

defecten.
Voorde poissonparameter p.. kiezen we p.. = . .... .
Bij deze waarde van p.. vinden we in de tabel:
P(k = olp.. = .... .. ) = ..... ... . .

82 Hoofdstuk 7 De poissonverdeling
b Hoe groot is de kans dat er minstens drie defecte exemplaren in de steek-
proef worden aangetroffen?

Antwoord P(k ~ 3) = 1 - P(k ~ 2)


De tabel van de poissonverdeling levert bij p., = ..... dat:
P(k = o) = ........ ..
P(k = 1) = ........ ..
P(k = 2) = ........ ..
+
P(k ~ 2) = ..........
Hieruit volgt:
P(k ~ 3lp., = .... .) = 1 - .... .... .. = .....

- a
Het aantallekke banden dat bij een garage dagelijks ter reparatie wordt aan-
geboden, mag worden beschouwd als een kansvariabele k met een poisson-
verdeling met fl = 4 per dag.
Bepaal met de tabel van de poissonverdeling de kans op het ter reparatie
aanbieden op een willekeurige dag van:
precies één lekke band
b precies zes lekke banden
c meer dan drie lekke banden
d minder dan drie lekke banden
e meer dan vier, maar minder dan tien lekke banden
Bepaal bovengenoemde kansen ook met Excel.

7.4 Voor een eerstehulpafdeling van een ziekenhuis geldt dat het aantal patiën-
ten met brandwonden dat per dag binnenkomt, kan worden beschreven
door een poissonverdeling met fl = 0,35. Bereken met de formule van de
poissonverdeling de kans dat het aantal van dergelijke patiënten per dag:
a precies nul bedraagt
b precies één is
c meer dan één bedraagt
Controleer de verkregen uitkomsten met Excel.

7.5 Een winkel in elektrische apparaten verkoopt gemiddeld vier scheerappara-


ten per week. De vraag naar scheerapparaten beschouwen we als een varia-
bele met een poissonverdeling. Eenmaal per week wordt de voorraad scheer-
apparaten aangevuld. Hoe groot moet, vlak na de wekelijkse aanvulling, de
minimumvoorraad van de winkelier zijn om met kans 0,99 aan de vraag te
kunnen voldoen?

7.6 In een containerhaven kunnen per dag drie schepen afgehandeld worden
met laden en lossen. Bekend is dat het aantal binnenlopende schepen van
variabele is met een poissonverdeling met fl = 2 per dag. Schepen die zich
melden wanneer op een dag reeds drie schepen in behandeling zijn, worden
doorverwezen naar een andere haven.
a Hoe groot is de kans dat op een willekeurige dag een of meer schepen moe-
ten worden doorverwezen?

Deel B Openvragen 83
b Hoe groot is het verwachte aantal schepen dat zich per dag aanmeldt?
c Hoe groot is het verwachte aantal dat per dag kan worden afgehandeld?
d Wat is het verwachte aantal dat per dag wordt doorverwezen naar een an-
dere haven?

- a
In de herfstmaanden krijgen sommige mensen last van depressies. Bij een
psychiatrische kliniek is het aantal nieuwe patiënten per week bijgehouden.
Op basis daarvan is bekend dat dit een variabele is met een poissonverdeling
met ft= 36.
Bereken de kans dat in een willekeurig gekozen herfstweek meer dan 45
nieuwe patiënten komen.
b Vanwege het weekendeffect melden zich op maandag altijd extra veel nieuwe
patiënten. Dat is een variabele met een poissonverdeling met fl = 16. Per pa-
tiënt wordt 30 minuten behandeltijd gereserveerd. Hoeveel tijd moet men
op een willekeurige maandag inplannen om minstens 95o/o van alle nieuwe
patiënten te kunnen behandelen?

7.8 Bij een telefooncentrale komen per uur gemiddeld 180 oproepen voor een
gesprek binnen. In een minuut kunnen hoogstens zes gesprekken worden
verwerkt.
a Bereken de kans dat in een bepaalde minuut overbelasting optreedt.
b Bepaal de kans dat in een uur meer dan 200 oproepen binnenkomen.

7.9 De kans dat bij een loterij een grote geldprijs valt op een lot bedraagt 1 op
de 25000.
a In een stad worden 120000 loten verkocht. Hoe groot is de kans dat in deze
stad meer dan 10 grote geldprijzen vallen?
b In een provincie worden 1 200 000 loten verkocht. Hoe groot is de kans dat
in deze provincie minder dan 40 grote geldprijzen vallen?

7.10 Een wintersportorganisatie organiseert zogenoemde gipsvluchten, dat zijn


speciale chartervluchten waarmee wintersporters die een ernstig ongeval
hebben gehad, kunnen worden gerepatrieerd. Voor de vluchten naar Inns-
bruck heeft men de beschikking over een vliegtuig waarin 30 patiënten kun-
nen worden vervoerd.
Het aantal ernstige ongelukken (van Nederlandse skiërs) in het gebied
rondom Innsbruck kan worden beschouwd als een kansvariabele die pois-
sonverdeeld is met fl = 4 per dag.
a Hoe groot is de kans dat op een willekeurige dag er acht of meer ernstige
ongelukken gebeuren?
Gebruik hierbij - indien beschikbaar - Excel.
b Men besluit dat om de zeven dagen een vlucht moet worden uitgevoerd.
Hoe groot is de kans dat niet alle patiënten meekunnen?
c Hoe groot is de kans bij vraag b indien er om de zes dagen, respectievelijk
om de vijf dagen wordt gevlogen?

84 Hoofdstuk 7 De poissonverdeling
7.11 Bij een veerboot is in een periode van 30 maanden vijftien maal een storing
in de machinekamer opgetreden. Deze storingen verschijnen op willekeurige
momenten volgens een poissonverdeling. De reparatie van zo'n storing kost
€2.500 (mede als gevolg van inkomstenderving).
a Bereken de kans dat in een willekeurige maand 0, 1, 2 en 3 of meer storin-
gen optreden. Bereken de hierbij behorende kosten en bepaal de verwachtings-
waarde van de kosten per maand.
b De rederij overweegt een revisie van de machinekamer te laten uitvoeren.
De kosten hiervan bedragen € 15.000. Na de opknapbeurt zal gemiddeld
slechts tweemaal per jaar een storing voorkomen. Dit 'effect' zal vier jaar du-
ren. Daarna zal de machinekamer weer het oude patroon van storingen ver-
tonen. Geef op basis hiervan een oordeel over de kosten van de revisie.

7.12 Op een werkdag van de dierenambulance komen oproepen binnen volgens


een poissonproces met JA = 0,50 oproepen per uur. Men is 10 uur per dag
bereikbaar.
a Bereken de kans dat op een dag minder dan 4 oproepen binnenkomen.
b Hoe groot is de kans dat er meer dan 3 uur voorbijgaan zonder dat een en-
kele oproep geweest is?
c De chauffeur van de dierenambulance wil met lunchpauze. Hij wil de tijds-
duur van die pauze zodanig kiezen dat de kans hoogstens 0,25 is dat binnen
die periode een oproep binnenkomt. Hoe lang mag hij pauzeren?

7.13 Bij een bepaald soort chirurgische ingreep is de kans op het optreden van
een bepaalde, zeer zeldzame complicatie gelijk aan 0,002. In een ziekenhuis
worden per jaar 400 van dergelijke ingrepen uitgevoerd.
a Hoe groot is de kans dat in een willekeurig jaar meer dan éénmaal een der-
gelijke complicatie wordt geconstateerd?
b Landelijk worden per jaar 18000 van dergelijke ingrepen uitgevoerd. Hoe
groot is de kans dat in een willekeurig jaar minder dan 30 keer de bedoelde
complicatie optreedt?

Een medische behandeling blijkt in 98,5 o/o van de gevallen effectief te zijn.
Bepaal die kans dat van een groep van 200 (willekeurig gekozen) patiënten
er minstens 197 baat hadden bij de behandeling.

Een verhuurbedrijf heeft drie verhuiswagens beschikbaar voor verhuur aan


particulieren. De verhuiswagens worden telkens voor één dag verhuurd. Ver-
huur is mogelijk gedurende 50 weken per jaar; iedere week heeft zes
verhuurdagen. De vraag per dag wordt beschreven door de variabele Is_ die
een poissonverdeling heeft met JA = 3. Dit geldt voor alle dagen van het jaar.
a Hoe groot is de kans dat op een willekeurige dag alle verhuiswagens ver-
huurd zijn?
b Hoe groot is de kans dat op een willekeurige dag minstens een verhuiswa-
gens niet wordt verhuurd?
c Hoe groot is het verwachte aantal verhuiswagens dat per dag wordt ver-
huurd? En per jaar?

Deel B Open vragen 85


d Het bedrijf overweegt een vierde verhuiswagen aan te schaffen. De vaste kos-
ten hiervoor (voor afschrijving, verzekering en dergelijke) bedragen € 10.000
per jaar. Voor één dag verhuur rekent het bedrijf € 120. De variabele kosten
bedragen € 40 per verhuurdag. Bereken de verwachte extra opbrengst als er
vier in plaats van drie verhuiswagens beschikbaar zijn.

1.16 Het aantal schepen Is. dat per dag in een bepaalde haven aankomt, is te be-
schouwen als een variabele met een poissonverdeling waarvoor geldt fl = 24.
Per dag kunnen vier schepen worden afgehandeld in de haven. Als zich meer
dan vier schepen melden, dan worden de overige schepen doorgestuurd
naar een andere haven.
a Hoe groot is de kans dat op zekere dag één of meer schepen worden doorge-
stuurd?
b Wat is het verwachte aantal schepen dat per dag wordt doorgestuurd?
c Hoe groot moet de capaciteit van de haven worden om een kans kleiner dan
0,01 te hebben dat op een willekeurige dag een of meer schepen worden
doorgestuurd?

1.11 Door een grote bank worden wekelijks duizenden effectenorders uitgevoerd.
Gebleken is dat in sommige gevallen een order niet juist wordt uitgevoerd.
De kans hierop is voor een willekeurige order 0,01.
a Hoe groot is de kans dat van 300 willekeurige orders er minder dan vijf niet
juist worden uitgevoerd?
b Hoe groot is de kans dat van 2 500 willekeurige orders er minder dan acht-
tien niet juist worden uitgevoerd?
c Het herstellen van een fout uitgevoerde order kost gemiddeld € 180. Door
een maatregel waarbij orders nauwkeuriger worden gecontroleerd, kan de
kans op foutieve uitvoering worden gereduceerd van 0,01 tot 0,002. De
nauwkeuriger controle kost € 1,50 per order.
Is het op basis van de verwachte kosten verstandig de nauwkeurige controle
in te voeren bij de bank?

7.18 (Sluit aan bij§ 7+.)


Het aantal branden per week in de omgeving van Breukelen kan worden be-
schouwd als een kansvariabele met een poissonverdeling met een gemid-
delde van 0,5 branden per week.
a Bereken de kans dat er in een bepaalde week twee of meer branden uitbreken.
b Bereken de kans dat er in een bepaald jaar minder dan twintig branden uit-
breken.
c Bereken de kansverdeling van t de wachttijd tot de eerstvolgende brand.
d De brandweer van Breukelen besluit een proteststaking te houden tegen een
op handen zijnde salarisverlaging. Men besluit de lengte van de stakings-
periode zodanig te kiezen dat er 50 o/o kans bestaat dat er geen enkele brand
uitbreekt tijdens de staking. Hoeveel dagen en uren zal de staking duren?

86 Hoofdstuk 7 De paissenverdeling
7.19 (Sluit aan bij § 7+.)
Een satelliet heeft vijf zonnepanelen. Ieder zonnepaneel heeft een levens-
duur die kan worden beschreven door een negatief-exponentiële verdeling
met À= 0,5. Dus de gemiddelde levensduur van een paneel is 1/0,50 =
2 jaar. Zodra drie zonnepanelen zijn uitgevallen, houdt de satelliet op te
functioneren.
a Hoe groot is de kans dat een willekeurig zonnepaneel na vier jaar nog func-
tioneert? Bereken dit met Excel.
b Hoe groot is de kans dat de satelliet na vier jaar nog functioneert? We gaan
ervan uit dat de levensduren van de panelen onderling onafhankelijk zijn.

7.20 (Sluit aan bij § 7+.)


De benodigde tijd ~ voor een patiënt bij een huisarts heeft als kansdichtheid:
1 x
f(x) = - e -ïö voor x~ 0, x in minuten
10
a Bereken de kans dat de tijd voor een willekeurige patiënt meer dan twaalf,
maar minder dan zestien minuten duurt.
b Bepaal de verdelingsfunctie.
c Hoe groot is de verwachtingswaarde van~?
En de variantie van ~?
d Bereken de kans dat de consulten van 25 patiënten totaal meer dan vijf uur
tijd vergen.

Deel B Open vragen 87


..••

8 Schatten

Deel A Multiplechoicevragen

m1 Onder de betrouwbaarheid van een intervalschatting wordt verstaan:


a de afstand van het midden van het interval tot de rand ervan
b de z-waarde of t-waarde die is gebruikt om de intervalgrenzen te bereke-
nen
c de kans dat bij een nieuw steekproefonderzoek hetzelfde interval wordt
gevonden
d de kans dat de grenzen van een schattingsinterval een zodanige waarde
hebben, dat de onbekende parameter zich tussen die grenzen bevindt

m2 Bij een grote financiële instelling worden jaarlijks vele honderden net afge-
studeerden aangenomen als trainee. Bedoeling is dat deze trainees na een
zekere tijd (t) een eerste aanbod ontvangen voor een officiële baan bij deze
instelling. Bij een onderzoek onder 36 trainees is gebleken dat men gemid-
deld na zestien maanden het eerste aanbod kreeg. Voor ! is gegeven dat de
standaarddeviatie drie maanden is. Het 95 %-betrouwbaarheidsinterval voor
de gemiddelde tijd tot het eerste aanbod is dan gelijk aan:
a 9,01 < fl < 22,99
b 15,16 < fl < 16,85
c 15,02 < fl < 16,98
d 14,84 < fl < 17,17

m3 Het Nationale Instituut voor de Volksgezondheid wenst een schatting te ma-


ken van de fractie rokers onder volwassen vrouwen. Hiertoe dient de grootte
van de steekproef te worden bepaald. Eis is dat deze schatting een nauwkeu-
righeid heeft van (plus of min) 0,02. Als uitgangspunt geldt dat de gezochte
fractie bij eerdere onderzoekingen zich in de buurt van 0,25 bevond. Er zijn
geen duidelijke aanwijzingen dat de thans geldende populatiefractie in be-
langrijke mate daarvan zou afwijken. Op basis van voorgaande gegevens is
de vereiste steekproefomvang voor een 99%-betrouwbaarheidsinterval (af-
gerond op het dichtstbijzijnde honderdtal!) ongeveer:
a n=3100
b n= 12400
c n = 1800
d n=2400

m4 Bij een schattingsprobleem dient men de t-verdeling te gebruiken als voor


de te onderzoeken kansvariabele geldt dat er een steekproef is genomen van:
a een normale verdeling met onbekende fl en onbekende variantie
b een binomiale verdeling met onbekende succeskans 7T

88
c een normale verdeling met gegeven standaarddeviatie en onbekende
verwachtingswaarde
d een gegeven normale verdeling met minder dan 30 vrijheidsgraden

ms Van een normale verdeling met onbekende fl en u worden zes waarnemin-


gen gedaan. Deze waren: 8, 12, 7, 9, 11 en 13. De puntschatting voor cr is
derhalve:
a 5,6
b 4,67
c 2,37
d 1,87

m6 Men wil een 99 %-betrouwbaarheidsinterval voor fl berekenen voor een nor-


male verdeling met een onbekende cr. Er worden acht waarnemingen ge-
daan. Het interval wordt dan berekend met:
a z= 2,58
b t = 3,499
c t = 2,998
d t = 2,306

DeeiB Openvragen

8.1 Een machine vult zakken met meel. Het gewicht van het meel in een wille-
keurige zak is te beschouwen als een trekking uit een normale verdeling met
onbekende fl en een standaarddeviatie van 100 gram.
Om het schattingsinterval te berekenen voor fl weegt men de inhoud van 25
zakken meel. Het gemiddelde gewicht van het meel per zak bedroeg
20,142kg.
a Bereken een schattingsinterval voor fl (de verwachtingswaarde van het ge-
wicht van het meel) dat een betrouwbaarheid heeft van 95 o/o.

Antwoord Het steekproefgemiddelde x kan worden beschouwd als een trekking van de kans-
variabele~ die het gemiddelde vulgewicht van 25 willekeurige zakken meel weer-
geeft.
Voor een 'losse' zak meel geldt als standaarddeviatie van hetvulgewicht
a= 100gram.
Voor de variabele~geldt dus als standaarddeviatie:

a~ = .. .. .

Als we een schattingsinterval willen maken met een betrouwbaarheid van 95%, dan
levert de tabelvan de standaard norma Ie verdeling:

z = .....

Het schattingsinterval voor IJ.- wordt dan als volgt geformuleerd:

Ingevuld levert dit:

Deel B Open vragen 89


.......... - .......... <fl< ... ....... + ......... .

Dus .... . ..... < fl < .......... is het 95 %-betrouwbaarheidsinterval voor fl·

b Bereken een schattingsinterval voor fl dat een betrouwbaarheid heeft van


99%.

Antwoord De berekeningverloopt hetzelfde als bij vraag a.


Een betrouwbaarheid van 99% levert z = .....
Het interval wordt dan:

.......... - .......... < J.L< • ••• . ••••• + ......... .

Dus .......... < J.L < .......... is het 99%-betrouwbaarheidsinterval voor J.L.

c Hoe groot moet men de steekproefomvang n kiezen om tot een 95 %-betrouw-


baarheidsinterval voor fl te komen dat een breedte heeft van 20 eenheden
(gram)?

Antwoord Als de breedte van het interval20 is, dan geldt:

[x- J.L[< 10 (met een betrouwbaarheid van 95%).

We passen de formule voor de steekproefomvang toe.


Deze luidt:

n E::: •• • • • ••

In deze formule moet worden ingevuld: z = .......... u = .......... en a = ........ ..


Dit levert n ~ .....
Mronding op het eerstvolgende gehele getal levert:
n~ .....

8.2 Van een bepaalde oplossing worden tien even grote monsters genomen.
Van elk monster bepaalt men het aantal mg eiwit, om hiermee het eiwit-
gehalte (fl) van de gehele oplossing te kunnen schatten.
De waargenomen uitkomsten zijn als volgt:

36,5 45,2 40,5 42,0 37,7 39,4 41,6 38,8 39,0 43,3

90 Hoofdstuk 8 Schatten
a Een zuivere schatter voor fl is het steekproefgemiddelde x.
Bereken x.

Antwoord De form uIe voor x Iuidt:

'"\;'X -
- ~I
X=--
n

We vinden dus:
1
x=- (36,5 + ... .. + .... . + ..... + ..... + ..... + ..... + ..... + .... . + ..... )
10

b Alvorens er een schattingsinterval kan worden berekend voor fl, moet er een
schatting van de variantie gemaakt worden.
Bereken deze variantie.

Antwoord De formule voor de variantie luidt:

L (X;- X)
s 2 = ----'---
2

n-1

We berekenen de benodigde som-


matie in het volgende schema (zie
de tabel):
1 36,5
Voor de variantie vinden we 2 45,2
3 40,5
sz=.:_:_:_:_:_:_:= ...... .
9 4 42,0
5 37.7
c Bereken voor fl een betrouwbaar-
6 39.4
heidsinterval dat een betrouwbaar-
7 41,6
heid heeft van 95 %.
8 38,8
9 39,0
Antwoord Omdat we hier te maken hebben met
10 43.3
een geschatte variantie, moeten we
Totaal
gebruikmaken van de t-verdeling bij de
bepalingvan hetschattingsintervaL
Voor de variatie vonden we 5 2 = ... . .. .
De standaarddeviatie bedraagt dus:
s=fo= ...... .
Omdat het schattingsinterval is gebaseerd op het gemiddelde van tien waarnemin-
gen, geldt voor de kansvariabele x een standaarddeviatie:
s
sx = JW= ...... .
Het te berekenen betrouwbaarheidsinterval heeft de gedaante:
s s
X- to975 ' r;::: < fl < X+ t 0 97S• C
. .y10 . .y10

De te gebruiken t-verdeling heeft . ...... vrijheidsgraden.


De tabel van de t-verdeling levert dan:

Deel B Open vragen 91


t0,975 = '' ' '' ..

Voor het betrouwbaarheidsinterval vinden we dan:

.. ..... - . ...... < J.I- < ...... . + ....... , dus .... . .. < J.I- < ...... .

Dit interval heeft een betrouwbaarheid van 95%.

8.3 Een meetapparaat in een laboratorium wordt gebruikt voor het bepalen van
de hoeveelheid van een stof die aanwezig is in een oplossing. Van het appa-
raat is bekend dat dit voor de gemeten hoeveelheid een standaarddeviatie
heeft van 1,2mg per bepaling. Er worden zes monsters genomen.
Deze leverden voor de hoeveelheid stof de volgende resultaten (in mg): 14,7
13,2, 15,8, 16,1, 14,3 en 15,0.
Bereken met deze gegevens een 95 %-betrouwbaarheidsinterval voor f.l= de
gemiddelde hoeveelheid van de stof per monster. Ga ervan uit dat de meet-
resultaten een normale verdeling volgen.

- De montagetijd van een apparaat in een fabriek is te beschouwen als een


kansvariabele ~ die normaal is verdeeld met een verwachtingswaarde van 40
minuten en een standaarddeviatie van vier minuten.
Na het invoeren van een nieuw systeem voor de montage is de chef van de
afdeling benieuwd of de gemiddelde montagetijd hierdoor korter is gewor-
den.
Voor een aantal (n) montages vond hij als gemiddelde montagetijd x= 36
minuten. We gaan ervan uit dat de montagetijden nog steeds normaal zijn
verdeeld met er= 4 minuten.
Bereken een 95 %-betrouwbaarheidsinterval voor f.l in de volgende gevallen:
a als n = 16 waarnemingen zijn gebruikt voor het berekenen van x=36 minu-
ten
b als n = 100 waarnemingen gebruikt zijn
c als n = 4 waarnemingen geruikt zijn

8.5 Van een vulmachine is bekend dat deze een 'natuurlijke' standaarddeviatie
heeft van er= 3 mg. De instelling van de machine voor wat betreft de ge-
middelde afgeleverde hoeveelheid kan echter na verloop van tijd veranderen.
In de fabriek dienen daarom regelmatig inspecties te worden uitgevoerd. Op
basis van de uitkomsten daarvan dient men - indien nodig - de instelling
van de vulmachine aan te passen.
a Bij een inspectie werden de volgende acht vulgewichten gevonden (in mg):
124 127 123 126 127 131 125 en 122.
Bereken op basis van deze gegevens een 95 %-betrouwbaarheidsinterval
voor fl· Is het op grond van dit interval verdedigbaar om te stellen dat de
machine wordt gekenmerkt door een gemiddelde instelling van f.l = 130 mg?
b Men stelt als eis dat het betrouwbaarheidinterval voor f.l niet breder mag zijn
dan 1 mg. Hoe groot is de vereiste steekproefomvang dan?

92 Hoofdstuk 8 Schatte n
8.6 Een bedrijf vervaardigt plastic draagtasjes die winkeliers gratis verstrekken
aan klanten om hun inkopen in te doen. Deze dienen een bepaald gewicht te
kunnen dragen. Bij proeven worden de tasjes steeds zwaarder belast totdat
zij stukgaan. Bekend is dat de breeksterkte van een tasje, uitgedrukt in kilo-
gram belasting, beschreven kan worden door een normale verdeling met
fl = 11,5 en CT= 1,3 kg.
a Hoeveel procent van de tasjes breekt reeds bij een belasting van minder dan
10 kg?
b De fabrikant gaat een nieuw soort plastic gebruiken bij de productie van de
tasjes. Er wordt een steekproef genomen van 25 tasjes. Deze leveren een ge-
middelde breeksterkte op van 12,8 kg. Ga ervan uit dat de standaarddeviatie
nog hetzelfde is. Bepaal een 95%-betrouwbaarheidsinterval voor fl: de ge-
middelde breeksterkte.
c Hoeveel o/o van de tasjes breekt bij een belasting minder dan 10 kg ingeval
de nieuwe waarde van fl nu 12,8 is? En hoeveel o/o is dit als fl gelijk is aan de
linkergrens L respectievelijk de rechtergrens R van het interval dat berekend
is bij vraag b?

- In een aselecte steekproef van 400 kiesgerechtigde Nederlanders blijken 160


personen aanhanger van een bepaalde politieke partij te zijn.
Geef een 99 %-betrouwbaarheidsinterval voor 7T: de fractie aanhangers in de
totale populatie.

8.8 In een fabriek maakt men badkamertegels. Bekend is dat het productiepro-
ces 20% ondeugdelijke tegels oplevert. Na wat wijzigingen in het productie-
proces, werd bijgehouden hoe groot het aantal afgekeurde tegels is in de
nieuwe situatie. Men vond de volgende aantallen:

1 120
2 210
3 1000 80
4 3000 450
5 1500 120
6 1700 170
7 2000 220
8 1400 80
9 1800 200
10 1500 130

a Stel dat alleen de gegevens van dag 1 bekend zouden zijn. Wat is op basis
daarvan een 95%-betrouwbaarheidsinterval voor 7T: de populatiefractie van
afgekeurde tegels?
b Bereken voor iedere dag de fractie afgekeurde tegels. Bereken op basis van
deze dagelijkse steekproeffracties een interval van 7T 0 : de gemiddelde dage-
lijkse fractie afgekeurde tegels.

Deel 8 Open vragen 93


c Bereken de totalen over de tien dagen van productieomvang en aantal afge-
keurde tegels.
Bereken op basis hiervan een interval voor 7T. Wat is de betekenis van deze 7T?

8.9 Bij een onderzoek naar bodemverontreiniging bij benzinestations werden bij
50 benzinestations bodemmonsters genomen. De steekproef van 50 benzi-
nestations werd aselect gekozen uit de populatie van alle benzinestations in
Nederland. In zes gevallen werd een ontoelaatbaar niveau van bodemveront-
reiniging geconstateerd. Geef, met behulp van de 'grote' formule uit het
theorieboek, een 95,4 %-betrouwbaarheidsinterval voor de fractie benzine-
stations met ernstige bodemverontreiniging.

8.10 Bij een snelweg is door een verdekt opgestelde controlepost de snelheid be-
paald voor een grote steekproefvan de passerende auto's. Uit de aantekenin-
gen van de onderzoeker blijkt dat de berekende standaarddeviatie van de
snelheden 8,2 km/uur bedraagt. Verder bleek dat men als 95 %-betrouw-
baarheidsinterval voor de gemiddelde snelheid als resultaat opgeschreven
had dat fl tussen 74,2 en 76,8 zou moeten liggen. Helaas was niet meer te
vinden hoe groot de steekproefomvang is geweest.
a Bereken op basis van de verstrekte gegevens de omvang van de steekproef
(ga er hierbij van uit dat de nog onbekende steekproefomvang groot genoeg
is om toepassing van de normale verdeling te rechtvaardigen).
b Uit het interval blijkt dat f1. op z'n minst 74,2 en op z'n hoogst 76,8 zou
kunnen zijn. Op het betreffende traject geldt een maximumsnelheid van 80
km/uur. Bereken op basis van beide uiterste waarden van fl het percentage
auto's dat te hard rijdt. De snelheden vormen een normale verdeling.
Veronderstel dat de politie alleen bekeuringen geeft indien de snelheid min-
stens 85,0 km/uur is. Hoeveel procent van de automobilisten krijgt dan een
bekeuring? Formuleer dit als een interval.

8.11 Op een traject van de snelweg Utrecht-Amsterdam is bijgehouden hoeveel


aanrijdingen er plaatsvinden. In een periode van 50 weken vonden 832 aan-
rijdingen plaats. Veronderstel dat het aantal aanrijdingen per week beschre-
ven kan worden door een poissonverdeling met onbekende fl (en dat die fl
hetzelfde is voor alle weken van het jaar, dus er is geen seizoenpatroon in het
aantal ongelukken of iets dergelijks).
Bereken een 95 %-betrouwbaarheidsinterval voor fl·

8.12 Een student doet een onderzoek naar het kijkgedrag van Nederlanders naar
de uitzendingen van de samenvattingen voetbal op zondag. Zij wil weten
wat het percentage vrouwen is onder de kijkers, wat de gemiddelde leeftijd is
onder de kijkers en wat het percentage aanhangers van FC Utrecht is onder
de kijkers. In alle drie gevallen wenst men een 95%-betrouwbaarheidsinter-
val. De student wil een steekproef nemen uit de voetbalkijkers. Geef aan hoe
groot de steekproefomvang moet worden gekozen als voldaan moet worden
aan de volgende voorwaarden:
a De fractie vrouwen moet met een marge plus of min 0,025 worden bepaald.
Ga er op voorhand van uit dat ongeveer 30% van de kijkers vrouw is.

94 Hoofdstuk 8 Schatten
b De gemiddelde leeftijd moet plus of min 2 jaar worden bepaald. Ga ervan
uit dat de standaarddeviatie van de leeftijden 12 jaar is.
c De fractie FC Utrecht-supporters moet plus of min 0,02 moet worden
bepaald. Ga ervan uit dat ongeveer 6% van de kijker FC Utrecht-fan is.
d Hoe groot wordt de vereiste steekproefomvang als aan alle drie voorwaarden
tegelijk moet zijn voldaan?

8.13 In Nederland zijn 1742 hoogleraren. Via een steekproef wil men te weten
komen hoeveel procent van deze populatie voorstander is van het wijzigen
van de huidige vut-regeling.
Hoe groot moet deze steekproef zijn om de fractie 'voorstanders van wijzi-
ging' te leren kennen met een nauwkeurigheid van 0,03 (dus circa 3 o/o ), ge-
baseerd op 95 %-betrouwbaarheid?

8.14 Een handelsmaatschappij onderzoekt hoe groot de fractie orders is die bin-
nen de afgesproken levertijd worden uitgevoerd.
Van 200 orders bleken er 180 binnen de levertijd uitgevoerd te zijn.
a Geef een 95 %-betrouwbaarheidsinterval voor de fractie orders die op tijd
zijn uitgevoerd.
b Hoeveel orders moeten worden onderzocht om een interval voor 7T te krij-
gen dat hoogstens 0,02 breed is? (We gaan ervan uit dat 7T ongeveer 0,9 is.)

8.15 Bij een supermarkt wil de manager laten bepalen hoe groot de fractie klan-
ten is die meedoet aan het airmilesspaarsysteem. Hij wil deze fractie weten
met een nauwkeurigheidsmarge van hoogstens 0,05 in de vorm van een
95 %-betrouwbaarheidsinterval.
Bij welke steekproefomvang wordt zeker aan deze voorwaarde voldaan?

8.16 Een ziektekostenverzekeraar heeft een groep medewerkers in dienst die tele-
fonisch problemen van cliënten behandelt. In verband met de werkplanning
wil men een beeld krijgen van de gemiddelde tijdsduur van de telefoonge-
sprekken.
Voor een steekproefvan 16 gesprekken werden de volgende tijdsduren waar-
genomen (in minuten): 2,50 12,70 3,90 6,60 11,20 10,30 8,50 7,30 2,20 5,80
4,80 4,30 5,20 9,70 8,50 en 3,60.
a Voer de gegevens in op een Excelsheet. Bereken voor de steekproef de ge-
middelde tijdsduur en de standaarddeviatie van de tijdsduren.
b Bereken op basis van de uitkomsten bij vraag a een 95%-betrouwbaarheids-
interval voor fl: de gemiddelde tijdsduur van de populatie van telefoonge-
sprekken.
c Gemiddeld komen 32 telefoontjes per uur binnen. De manager wil het aan-
tal medewerkers zodanig plannen dat de beschikbare hoeveelheid werktijd
20% hoger is dan de gemiddeld te verwachte tijdsduur van alle gesprekken
tezamen. Hoeveel medewerkers moeten minimaal beschikbaar zijn bij de
telefoon balie?

Deel B Open vragen 95


De handvatten van koffers moeten van zodanige kwaliteit zijn dat ze niet
breken bij een forse belasting van de koffers. Ter controle van de kwaliteit
van de handvatten werden er proeven genomen waarbij het gewicht dat aan
een handvat hing net zolang werd opgevoerd tot het handvat brak. Er wer-
den negen handvatten getest waarbij de maximale belasting werd vast-
gesteld. De resultaten staan in de volgende tabel:

.._

Handvat
.. . A B
.. .. ... .. ·-·
c 0 E G H
-

Breuk bij een gewicht


(in kg) van 84 87 81 85 90 93 86 88 80

a Geef een schatting van de variantie.


b Geef een betrouwbaarheidsinterval voor flx: de verwachtingswaarde van de
maximumbelasting van een handvat. Kies een 99%-betrouwbaarheids-
interval.

8.18 Bij een postorderbedrijf wil men een schatting maken van de gemiddelde
tijdsduur van telefoongesprekken met klanten. We gaan ervan uit dat de
gespreksduur t een kansvariabele is met een normale verdeling. Voor negen
gesprekken werd als tijdsduur gevonden (in seconden): 218, 225, 230, 240,
214, 202, 204, 195, 180.
Bereken een 95 %-betrouwbaarheidsinterval voor ft: gemiddelde tijdsduur.

8.19 Een technicus van een bedrijf dat oefenapparaten ontwikkelt voor fitness-
trainingen heeft een nieuw ontwerp gemaakt van een bepaalde machine. Be-
doeling is dat dit apparaat spierversterkend werkt voor personen met rug-
klachten. Helaas was maar één prototype van het apparaat beschikbaar om
het te kunnen testen. Hierdoor konden slechts de gegevens van twaalf pa-
tiënten worden verzameld. Deze twaalf patiënten gingen oefenen met dit ap-
paraat en het aantal dagen werd opgetekend dat nodig was om volledig het
gewenste resultaat te behalen. Van de twaalf patiënten werden de volgende
aantallen dagen waargenomen:
15, 18, 41, 27, 23, 16, 29, 30, 32, 22, 25 en 22.
a Schat de standaarddeviatie.
b Bereken een 95%-betrouwbaarheidsinterval voor ft: de gemiddelde herstel-
tijd voor de populatie.
c In een vervolgstudie werden 90 personen getest. Er werd een standaard-
deviatie gevonden van 6,5 dagen en een gemiddelde hersteltijd van 27 da-
gen. Bereken opnieuw een 95 %-betrouwbaarheidsinterval voor fl·
d Men wenst het bij vraag c gevraagde interval zodanig te bepalen dat het re-
sulterende interval voor fl niet breder is dan twee dagen. Hoe groot moet de
steekproefomvang worden gekozen om dat te bereiken, als de standaard-
deviatie van vraag a als vertrekpunt mag worden gekozen?

96 Hoofdstuk 8 Schatten
8.20 Bij een postorderbedrijf onderzoekt men de betalingstermijn van de klan-
ten. Op basis van een steekproef van 150 rekeningen stelde men vast dat de
betaaltermijn per cliënt een gemiddelde kende van 34,2 dagen met een stan-
daarddeviatie van 12,0 dagen.
a Bereken een 95 %-betrouwbaarheidsinterval voor de gemiddelde betalings-
termijn.
b De directie was niet helemaal tevreden over de nauwkeurigheid van het bij
vraag a berekende interval. Men wenst een marge voor fl te hanteren van
één dag (ten opzichte van het gevonden gemiddelde). Men besluit daarom
een aanvullende steekproef te doen. Hoeveel extra waarnemingen moeten
aan de oorspronkelijke steekproef worden toegevoegd?
c Volgens de leveringsvoorwaarden dienen klanten binnen 30 dagen te beta-
len. In een steekproef van 300 klanten bleken 124 betalingen aan deze con-
ditie te voldoen. Geef een 95 %-betrouwbaarheidsinterval voor de fractie be-
talingen die op tijd worden verricht.

(Sluit aan bij paragraaf 8+.)


Een bepaald soort snoer wordt vervaardigd in een chemische fabriek. De
kwaliteit van dit snoer wordt gegeven door de breeksterkte (in kg). Bekend is
dat deze breeksterkte wordt gekenmerkt door CT= 9 kg. Voor een nieuwe
partij snoeren is de gemiddelde breeksterkte bepaald. Deze was 146 kg voor
een steekproef van 10 snoeren.
a Geef een 95%-betrouwbaarheidsinterval voor fl: de gemiddelde breek-
sterkte.
b Geef een 99 %-tolerantie-interval voor de specifieke breeksterkte van het
elfde snoer dat wordt getest.

Deel B Open vragen 97


... '

.
9 Toetsen

Deel A Multiplechoicevragen

m1 Een kritiek gebied Z:


a bestaat uit alle hypothesen die dienen te worden verworpen
b mag geen waarnemingen bevatten
c geeft voor de toetsingsgrootheid aan welke uitkomsten daarvan tot ver-
werping van de nulhypothese zullen leiden
d heeft een kans van 1 - a

m2 Een fout van de eerste soort wordt gemaakt als:


a de nulhypothese wordt verworpen indien deze toch juist is
b reeds bij het nemen van de steekproef fouten worden gemaakt
c een onjuiste toetsingsprocedure wordt gevolgd
d de alternatieve hypothese wordt verworpen

m3 Het verwerpen van een juiste alternatieve hypothese:


a heet een fout van de eerste soort
b heet een fout van de tweede soort
c heet een steekproeffout
d kan alleen als de toetsingsgrootheid een waarde in het kritieke gebied
heeft laten zien

m4 Indien bij een toetsingsprocedure wordt gewerkt met de zogeheten overschrij-


dingskansen p, dan:
a dient de nulhypothese te worden verworpen als p groter is dan a
b dient de nulhypothese te worden verworpen als bij tweezijdige toetsing
dep-waarde kleiner is dan !a
c is 1 - p het onderscheidingsvermogen
d mag p niet groter zijn dan 0,05

m5 Een vulmachine is zodanig ingesteld dat deze verpakkingen vult met een
vulgewicht ~ dat een normale verdeling volgt met fl = 1 510 gram en a= 20
gram. Regelmatig wordt met een steekproef gecontroleerd of de instelling
(fl) van de machine nog correct is. We nemen dan een steekproefvan zestien
verpakkingen en we toetsen tweezijdig met a = 0,05. We veronderstellen dat
a niet is veranderd. De grenzen van het kritieke gebied zijn dan:
a 1500,2 en 1519,8
b 1 4 77 en 1 543
c 1507,55 en 1512,45
d 1461 en 1559

98
m6 Voor een normaal verdeelde variabele met onbekende 14 en a wordt een
toets voor 14 verricht. De volgende gegevens zijn van belang: H 0 : 14 = 60, H 1 :
14 < 60, a= 0,05, s2 = 16, n = 25, het steekproefgemiddelde is 62. Bij deze
toets vinden we dus een berekende t* -waarde of z* -waarde die gelijk is aan:
a 2,50
b 0,625
c 1,568
d 1,316

Deel 8 Open vragen

9.1 De Rekenkamer heeft gesignaleerd dat 50% van alle uitkeringen krachtens
de Bijstandswet op onjuiste gronden wordt verstrekt. Op grond hiervan
werd een aantal nieuwe richtlijnen opgesteld voor de behandeling van
nieuwe bijstandsaanvragen. Een jaar na de invoering van de nieuwe richtlij-
nen werd er een onderzoek gehouden naar de effecten hiervan. Er werd in
100 gevallen waarbij een uitkering was toegekend, nagegaan of de uitkering
overeenkomstig de nieuwe richtlijnen terecht is toegekend. Er bleken 25 ge-
vallen te zijn van een niet op juiste gronden toegewezen uitkering. Toets of
de nieuwe richtlijnen geleid hebben tot een duidelijk terugbrengen van het
aantal onjuiste uitkeringen.
Toets hierbij eenzijdig, kies a= 0,05.

Antwoord Bij het ontwerpen van de toets kiezen we als nulhypothese dat de fractie 7T, dat is de
fractie onjuisttoegekende uitkeringen, gelijk is aan 0,5.
Aangezien er eenzijdig moet worden getoetst, geldt klaarblijkelijk:
H 0 : 7T = 0,5
en H 1 : 7T< 0,5
De toetsingsgrootheid is gedefinieerd als de kansvariabele k_, die het aantal onjuist
toegekende uitkeringen uit de steekproef aangeeft. De steekproefgrootte bedraagt
n = 100.
Onder de veronderstelling dat de nulhypothese juist is, geldt dat de variabele k bino-
miaal verdeeld is met n = ....... en 7T = ...... .
Het kritieke gebied moet worden berekend door toepassing van de normale benade-
ring op de verdelingvan k..
(Aan de vereisten is voldaan, namelijk n > ...... , n 7T > ...... en n (1 - 7T) > ...... )
Voor de verwachtingswaarde van k vinden we:

E(k.) = n 7T = .... .

Voor de variantie van k.geldt:

Var(k.) = n7T(1- 7T) = .... . dus u!!= .....


We kiezen daarom voor de uitvoering van de normale benadering de kansvariabele ~
die normaal is verdeeld met 1-L = .... . en u= .....
Omdat is geëist dat er wordt gewerkt met een kans op een fout van de eerste soort
a = 0,05, vinden we in de tabel van de standaardnormale verdeling de waarde
z = ..... (Let op: er moet eenzijdig worden getoetst; we krijgen dus een eenzijdig
kritiek gebied.)

Deel B Open vragen 99


Als grens van het kritieke gebied vinden we in eerste instantie:

g, = p.. - zu = .......... - .......... = ......... .

In termen van de normale verdeling luidt het kritieke gebied Z dus:

Z = {xlx < ..... }

Toepassing van de continuïteitscorrectie levert:

z= {kik~ ..... }

In de steekproef is gevonden: k = 25.


Deze waarde ligt wel/niet in het kritieke gebied.
De nulhypothese is wel/niet verworpen.
Wat is de conclusie met betrekking tot het effect van de nieuwe richtlijnen voor het
toekennen van een uitkering krachtens de Bijstandswet?

9.2 Een fabrikant die een vermageringsmiddel op de markt brengt, stelt in zijn
brochure dat dit product 150 calorieën bevat per pakje van 200 gram. Na-
vraag bij de fabrikant toonde dat laboratoriumproeven hem een gemiddelde
van 150 calorieën per pakje leverden en een standaarddeviatie van 20,0 calo-
rieën per pakje. Bij een serie controleproeven heeft de Consumentenbond
25 pakjes onderzocht. Deze 25 pakjes bleken gemiddeld een voedingswaarde
te hebben van 170 calorieën.
a Toets of de fabrikant gelijk kan hebben met zijn uitspraken. Kies als nulhy-
pothese H 0 : f4 = 150 en als alternatieve hypothese H 1: 14 > 150. Kies verder
a= 0,01.

Antwoord Als nulhypothese kiezen we: H 0 : p..= 150


Als alternatieve hypothese kiezen we: H 1 : p.. > 150
Op grond van de formulering van de alternatieve hypothese kan worden geconclu-
deerd dat we eenzijdig gaan toetsen.
Als toetsingsgrootheid kiezen we het steekproefgemiddelde x.
Onder aanname van de nulhypothese kan het steekproefgemiddelde als een kans-
variabele ~ worden beschouwd die normaal is verdeeld met p.. = . . . . . en
(J = . . . . ... . . .
De waarde a = 0,01levert in de tabel van de normale verdeling (wegens het eenzij-
digtoetsen)z = ...... .
Als grenswaarde van het kritieke gebied vinden we dan:

gR = ·•••••• + ..... .. =
Het kritieke gebied luidt dus:

Z = {xiX> ..... }
In de steekproef is een gemiddeld aantal calorieën gevonden van x= 170. Deze
waarde ligt wel/niet in het kritieke gebied.
Oefabrikant heeft daarom met zijn garantie gelijk/ongelijk.

100 Hoofdstuk 9 Toetsen


b Bereken op basis van het kritieke gebied van vraag a, de kans op een fout
van de tweede soort indien in werkelijkheid geldt:

Antwoord Gegeven is nu dat J.L in werkelijkheid de waarde 170 heeft. Bij het berekenen van de
kans op een fout van de tweede soort gaan we de kans bepalen dat het steekproef-
gemiddelde niet in het bij vraag a berekende kritieke gebied terechtkomt.
Voor de verdeling van~ geldt nu:

:??_- N(J.L= ....... ,er= ... )

Het bij vraag a gevonden kritieke gebied luidt:

Z = {x!X> ... .. }

De grenswaarde van het kritieke gebied bedroeg: g R = .....


Voor de overschrijdingskans vang 9 , vinden we met:
gR- J.L
z=--= - - - - -
cr

in de tabel van de standaardnormale verdeling dat

P(??_ < g R) = P(??_ < ..... ) = .....

9.3 Een variabele 2f is normaal verdeeld met standaarddeviatie 10. We toetsen


H 0 : fA-= 50 tegen H 1 : fA-> 50.
a Bereken het kritieke gebied indien er één waarneming wordt gedaan bij een
kans op een fout van de eerste soort a= 0,05 en ook bij a= 0,01.
b We doen 100 waarnemingen van de betrokken variabele.
Bereken het kritieke gebied bij a= 0,10 en a= 0,001.

9.4 Een fabrikant van een geneesmiddel garandeert dat het medicijn in min-
stens 90 o/o van de gevallen werkt. In een steekproef van 200 blijken 40 per-
sonen te zijn waarbij het middel niet werkte. Kan de fabrikant gelijk hebben
met zijn garantie? (a= 0,01).

- In een laboratorium wordt de zuiverheid van een bepaalde oplossing be-


paald. Het gehalte aan verontreiniging mag hoogstens 5 o/o bedragen. De ge-
bruikte bepalingsmetbode heeft met betrekking tot het gemeten verontrei-
nigingsgehalte 2f per bepaling een onnauwkeurigheid die kan worden weer-
gegeven door de standaarddeviatie 0,5 o/o. Er worden tien monsters genomen
waarbij de volgende percentages verontreiniging werden gevonden: 5,2 o/o,
6,3 o/o, 4,8 o/o, 5,0 o/o, 4,6 o/o, 5,8 o/o, 5,3 o/o, 6,0 o/o, 4,5 %, 5,3 o/o.
Toets of het experiment overtuigend aantoont dat het gehalte aan verontrei-
niging in de oplossing meer dan 5 o/o is.
Kies a= 0,10, toets eenzijdig.

Deel B Open vragen 101


- Capsules die zijn gevuld met een bepaald medicijn, dienen 5 mg werkzaam
bestanddeel te bevatten.
Het is bekend dat door onnauwkeurigheden met de machine die de capsules
vult de hoeveelheid werkzaam bestanddeel te beschouwen is als een normaal
verdeelde kansvariabele ~ met verwachtingswaarde 5,0 mg en standaard-
deviatie 0,15 mg.
Geëist wordt dat de hoeveelheid werkzaam bestanddeel per capsule tussen
4,6 mg en 5,4 mg ligt.
a Hoeveel% van de capsules heeft een inhoud buiten de gestelde normen in-
dien de vulmachine correct is ingesteld?
b De instelling van de machine kan tijdens het gebruik veranderen. Daarom
wordt er regelmatig een aantal capsules gecontroleerd in het laboratorium.
Een steekproef van 25 capsules levert een gemiddeld gehalte van het werk-
zame bestanddeel van 4,70 mg. Toets of hieruit mag worden geconcludeerd
dat de instelling van de machine is gewijzigd.
Toets hierbij tweezijdig, kies a= 0,01 en ga ervan uit dat de standaarddevia-
tie niet is veranderd.
c Indien de capsules worden gevuld met gemiddeld 4,70 mg werkzaam be-
standdeel (u is nog steeds gelijk aan 0,15 mg), hoeveel procent van de cap-
sules voldoet dan niet meer aan de norm?

9.7 Een elektriciteitsbedrijf laat consumenten maandelijks een vast bedrag beta-
len als een voorheffing voor levering van stroom. Dit gebeurt op basis van
een geschat verbruik. Aan het eind van het jaar wordt het werkelijke ver-
bruik afgelezen en volgt een bijbetaling of een terugbetaling. Een
consumentenorganisatie heeft het vermoeden dat het bedrijf te hoge bedra-
gen als voorheffingen incasseert bij de consumenten. Het bedrijf ontkent dat
en stelt dat consumenten gemiddeld nog 1,2% van het jaarbedrag moeten
nabetalen.
Er wordt een steekproef genomen onder 130 willekeurig gekozen huishou-
dens. Dat leverde op dat men gemiddeld 2,3% teruggave kreeg met een stan-
daarddeviatie van de teruggaves van 4,1% (werk hiermee als een gegeven u).
a Toets met a = 0,05 of de stelling van het bedrijf houdbaar is.
b Toets ook of het populatiegemiddelde 0% kan zijn.

- Op basis van meerjarig onderzoek is komen vast te staan dat van 60o/o van
alle ondernemingen die als starter worden aangemeld bij de Kamer van
Koophandel, de activiteiten binnen drie jaar worden beëindigd. Om de
overlevingskans van nieuwe bedrijven te verhogen, heeft de Kamer van
Koophandel een mentorsysteem ingevoerd. Hiermee kunnen bedrijven (op
basis van vrijwilligheid) gedurende de eerste twee jaar begeleiding krijgen
van een ervaren ondernemer.
Voor een groep van 88 bedrijven die van deze dienstverlening gebruik heeft
gemaakt, is gebleken dat 31 bedrijven binnen drie jaar de activiteiten heeft
beëindigd. Toets met a= 0,01 (eenzijdig) of het mentorsysteem lijkt te wer-
ken.

102 Hoofdstuk 9 Toetsen

J
9.9 Bij een onderzoek naar een weinig voorkomende ziekte in Nederland is bij
een steekproef van 100 000 personen vastgesteld dat in 36 gevallen deze
ziekte werd waargenomen.
a Geef een 95%-voorspellingsinterval voor het aantal gevallen van deze ziekte
onder de zestien miljoen inwoners van Nederland.
b Gegeven is dat dezelfde ziekte in de USA bij 250 op de 1 miljoen inwoners
voorkomt. Toets of de ziekte in Nederland meer voorkomt dan in de USA
(kies a= 0,05).

9.10 In een laboratorium wordt een onderzoek verricht naar het chloorgehalte
van het water in zwembaden. Hiervoor wordt een aantal malen een maatbe-
ker met water uit het zwembad gevuld. Van de inhoud van elke maatbeker
wordt het gehalte aan chloor vastgesteld. Bekend is dat deze bepalings-
methode een onnauwkeurigheid heeft die wordt weergegeven door een stan-
daardafwijking per bepaling van 1,5 mg chloor.
Per monster bedraagt de waargenomen hoeveelheid chloor:

Monster 11 111 IV V VI VIl VIII


Cl (in mg) 46,4 50,1 48,3 49,2 50,4 48,0 47,2 52,4

Toets of het gemiddelde gehalte in de steekproef voldoende aanleiding geeft


om het water af te keuren (kies a= 0,05) indien een chloorgehalte dat over-
eenkomt met 50 mg per monster, het maximaal toelaatbare is.

Een zelfbedieningsrestaurant verkoopt hamburgers van het type Big-Smak.


Het vleesgewicht van deze hamburgers bedraagt volgens het restaurant ge-
middeld minstens 160 g met een standaarddeviatie van 5 gram. Om de be-
wering van het restaurant te onderzoeken, kopen zes studenten een Big-
Smak en bepalen het vleesgewicht. Dat leverde: 140, 148, 162, 146, 152 en
152 gram op.
We gaan ervan uit dat de gewichten van hamburgers mogen worden be-
schouwd als trekkingen uit een normale verdeling met (nog steeds) er= 5
gram.
Toets door berekening van de p-waarde of de bewering van het restaurant
staande kan worden gehouden (kies a= 0,05).

9.12 Een instituut voor economisch onderzoek wil onderzoeken hoeveel procent
van het gezinsbudget wordt besteed aan recreatieve uitgaven. Voor acht wil-
lekeurig gekozen gezinnen uit een bepaalde inkomensgroep (onze popula-
tie) worden de volgende percentages gevonden:

Gezin 1 2 3 4 5 6 7 8
%recreatie 17 12 13 14 10 18 16 20

Deel B Open vragen 103


a Geef een 95 %-betrouwbaarheidsinterval voor ft: het gemiddelde percentage
recreatie-uitgaven voor de onderzochte populatie. Ga ervan uit dat de percen-
tages kunnen worden beschreven door een (onbekende) normale verdeling.
b Vroeger onderzoek leverde voor het percentage recreatieve uitgaven dat fl
minstens 21% is. Toets of deze uitspraak houdbaar is voor de door ons on-
derzochte inkomensgroep.
(Toets eenzijdig, kies a= 0,05.)

9.13 Door een fabrikant worden sigaretten van het merk Ultrasoft op de markt
gebracht. Hiervan wordt op de verpakking vermeld dat het gemiddelde teer-
gehalte per sigaret hoogstens 5,0 milligram per sigaret bedraagt. We gaan er-
van uit dat het te bepalen teergehalte per sigaret kan worden beschreven
door een normale verdeling met onbekende fl en er. In een laboratorium
werden 20 sigaretten getest. Dat leverde de volgende resultaten:

T~ehattevan20s~~n

6,3 7,2 5,3 5,9 6,6 4,3 7,2 5,0 6,7 5,1 ·-
4,9 7.9 5.5 5.4 6,0 4.5 5,8 6,5 5,7 6,4

Voer de gegevens in op een Excelwerkblad en beantwoord de volgende


vragen.
a Schat de standaarddeviatie.
b Bereken een 95%-betrouwbaarheidsinterval voor fl·
c Toets of de bewering van de fabrikant staande kan worden gehouden.

9.14 Bij een servicebedrijf voor cv-installaties kan men een abonnement nemen
om bij storingen snelle hulp te krijgen. Het bedrijf garandeert dat de gemid-
delde wachttijd na een storingsmelding hoogstens 1 uur en 30 minuten is.
Voor 16 storingsmeldingen is de wachttijd onderzocht. Dat leverde (in minu-
ten); 45, 60, 72, 88, 92, 104, 108, 118, 120, 125, 142, 156, 172, 185, 192,206.
Plaats deze gegevens op een Excelwerkblad en beantwoord de volgende
vragen:
a Toets de bewering van het bedrijf.
b Bereken een 95%-betrouwbaarheidsinterval voor de gemiddelde wachttijd.

9.15 Een politieke partij beweert dat van de kandidaten op de kieslijsten voor de
gemeenteraadsverkiezingen ten minste 30% vrouw is. Voor een steekproef
van 35 gemeenten vond men een gemiddeld percentage van 26% en een
standaarddeviatie van 11 %.
a Toets of de bewering van de partij staande kan worden gehouden, gegeven
het steekproefresultaat (toets telkens met a= 0,05).

Een statisticus spreekt twijfel uit over de bij vraag a gevolgde methode. Het
aantal kandidaten per gemeente loopt nogal uiteen en daarom zou het niet
toegestaan zijn om te werken met (gemiddelden van) percentages. Bij een
vervolgonderzoek worden daarom alle kandidaten uit de steekproef van 35
gemeenten bij elkaar gevoegd. Dat leverde totaal 640 kandidaten. Hierbij
waren 176 vrouwen.

104 Hoofdstuk 9 Toetsen


b Toets opnieuw of de bewering van de partij staande kan worden gehouden.
c Veronderstel dat het werkelijke percentage vrouwen 25% zou zijn, wat is
dan het onderscheidingsvermogen van de bij vraag b uitgevoerde toets?

9.16 Blijkens het jaarverslag van het Sociaal en Cultureel Planbureau is 45% van
de Nederlanders voorstander van het opnieuw invoeren van de doodstraf in
Nederland. Een aantal politieke partijen reageert hierop geschrokken, omdat
dit een opvallend verschil in opvatting zou aangeven tussen politici en be-
volking. Men besluit daarom een propagandacampagne te houden tegen de
doodstraf. Na afloop van die campagne worden 200 willekeurige Nederlan-
ders ondervraagd over hun standpunt. Nu blijken 62 van de 200 voorstan-
der te zijn van de doodstraf.
a Toets (eenzijdig) met a = 0,05 of de hypothese dat het aantal voorstanders
nog steeds 45% is, kan worden verworpen.
b Bereken een 95 %-betrouwbaarheidsinterval voor het percentage voorstan-
ders onder de Nederlandse bevolking, gegeven het resultaat in de steekproef.

9.17 De hoeveelheid radioactieve sporen in een kist spinazie is te beschouwen als


een kansvariabele x die normaal is verdeeld met een gemiddelde van 50 RE
(Radioactieve Eenheden). De standaarddeviatie is niet bekend.
Na een explosie in een ver land werd van zeven kisten spinazie nauwkeurig
bepaald hoeveel RE's er aanwezig waren.
De resultaten waren (in RE) 80, 90, 86, 70, 92, 74 en 68.
Toets of de nieuwe uitkomsten duiden op een significante verhoging ten op-
zichte van het oude niveau. Toets eenzijdig, kies a= 0,05.

Een bedrijf voert een administratie van het aantal klachten van afnemers. In
acht weken werden de volgende aantallen klachten per week geregistreerd:

1 2 3 4 5 6 7 8
Aantal klachten 30 45 46 50 52 34 35 28

We gaan ervan uit dat het aantal klachten per week kan worden beschouwd
als een variabele met een normale verdeling.
In het verleden bleek het aantal klachten gemiddeld 51 per week te zijn.
Toets of dit gemiddelde nog houdbaar is in het licht van verzamelde uit-
komsten (kies a= 0,05).

9.19 Een fabrikant van azijn levert flessen die 1 000 ml moeten bevatten. Een
consumentenorganisatie onderzoekt de inhoud met enige regelmaat. Elke
week wordt een steekproef van tien flessen genomen. Van de gemeten in-
houden (xl' ... , x 10 ) wordt het gemiddelde x bepaald. Als dit lager uitkomt
dan 992 ml, wordt de hypothese H 0 : 'fl ~ 1 000' verworpen, waarna de over-
heid wordt ingelicht. We nemen aan dat x 1 tot en met x 10 normaal zijn ver-
deeld.

Deel B Open vragen 105


a Hoe groot is de kans op de fout van de eerste soort als fl = 1000 en O" = 15?
b De fabrikant zorgt er veiligheidshalve voor dat fl = 1 005, maar weet ook dat
O" = 18. Hoe groot is dan de kans op de fout van de eerste soort?

Als de fabrikant heeft ontdekt wat de beslissingsregel van de consumenten-


organisatie is, stelt hij zijn fl in op 998 en O" op 10.
c Wat is nu de kans op de fout van de tweede soort?

Een steekproef van negen flessen geeft aan 1001, 993, 998, 987, 1004, 991,
985, 990, 1 006.
d Wat concludeert de consumentenorganisatie?
e Wat is het 90%-betrouwbaarheidsinterval voor fi-?

9.20 Op een bepaald deel van de ringweg rondom Utrecht zijn altijd veel verkeers-
opstoppingen tijdens het avondspitsuur. In het kader van de filebestrijding
is er een aanbevolen omleidingsroute gevormd om op die manier de ver-
keersdruk op dat traject te verminderen.
Voorafgaand aan de maatregelen werden tijdens de spits per uur gemiddeld
4 200 auto's geteld. Een maand na de invoering van de maatregelen werd op
25 werkdagen geteld hoeveel auto's per uur van het oude traject gebruik-
maakten. Dit leverde een gemiddelde op van 3 812 auto's met een standaard-
deviatie van 245.
Toets met a = 0,05 of de verkeersdrukte op het traject significant is afge-
nomen.

9.21 In de laatste jaren werd in Nederland 28% van de grote investerings-


projecten gefinancierd door buitenlandse beleggers. In het laatste jaar werd
bij een nieuw onderzoek geconstateerd dat voor een steekproef van 250 pro-
jecten er 48 werden gefinancierd door buitenlandse beleggers.
a Toont dit resultaat overtuigend aan dat er een verandering is opgetreden ten
opzichte van de vroegere situatie? Kies a = 0,05.
b Veronderstel dat de werkelijke fractie door buitenlanders gefinancierde pro-
jecten 18% zou bedragen. Hoe groot is het onderscheidingsvermogen van
de bij vraag a ontwikkelde toets?

9.22 Het aantal klachten dat per dag bij een reisorganisatie binnenkomt heeft een
poissonverdeling met fl = 1,8.
a Bereken de kans dat op een willekeurige dag precies drie klachten binnenko-
men.
b Bereken de kans dat in een periode van twintig dagen meer dan 44 klachten
binnenkomen.
c Ontevreden over het hoge aantal klachten besluit de reisorganisatie stren-
gere eisen te stellen aan de te verhuren accommodatie. Na het nemen van de
maatregelen werden 23 klachten ontvangen in twintig dagen. Duidt dit op
een significante verbetering ten opzichte van de oude situatie? (Voer de toets
uit met a = 0,05.)

106 Hoofdstuk 9 Toet sen


d Op grond van ervaringen met soortgelijke projecten had men de stellige ver-
wachting dat het aantal klachten diende te dalen tot gemiddeld hoogstens
één per dag. Bereken, ervan uitgaand dat deze verwachting correct is, het
onderscheidingsvermogen van de in vraag c besproken toetsingsprocedure.

Een autofabriek heeft een nieuw model, de XGT, op de markt gebracht. In


de folder staat dat het benzinegebruik laag is, namelijk gemiddeld hoogstens
7 liter voor 100 kilometer op de buitenweg. Om deze bewering te controle-
ren, werden met zestien XGT's proefritten gemaakt van 100 kilometer. Voor
deze zestien proefritten werd een gemiddeld verbruik van 7,32 liter gevon-
den. Wegens verschillen in rijstijl en rijomstandigheden mag worden aange-
nomen dat het benzineverbruik per 100 kilometer wordt beschreven door
een kansvariabele ~ die normaal is verdeeld met (J = 0,5 liter.
a Toets (volgens de gebruikelijke procedure) of de bewering van de fabrikant
staande kan worden gehouden op basis van de uitkomsten van de proefrit-
ten (kies a= 0,05).
b Bereken het onderscheidingsvermogen van de toets als in werkelijkheid zou
gelden dat het gemiddelde benzineverbruik 7,30 liter per 100 kilometer is.

9.24 Een importeur krijgt een grote partij goederen aangeboden. Twijfelachtig is
of alle exemplaren voldoen aan de eisen die de wet aan dit product stelt. Als
de partij hoogstens 5% ondeugdelijke exemplaren bevat, wil de importeur
de partij graag hebben. Als de partij meer dan 20% ondeugdelijke exempla-
ren bevat, wil hij de partij beslist niet hebben.
a Stel dat de importeur willekeurig 40 exemplaren uit de partij neemt en deze
inspecteert. Als keuringsgrens geldt c = 4. Dus als er vier of minder defecten
worden gevonden, keurt hij de partij goed. Bij meer dan vier defecten keurt
hij de partij af.
Bereken voor een partij met 20% defecten de goedkeurkans.
Bereken voor een partij met 5% defecten de afkeurkans.
b We voeren dezelfde keuring uit als bij vraag a. We keuren de partij goed als
het aantal defecten in de steekproef ~ c is.
Bereken voor c = 2, 3, 4, 5, 6, 7 en 8 de afkeurkansen van partijen met 5%
defecten en de goedkeurkansen van partijen met 20% defecten. Voor welke
waarde vancis de som van de twee berekende kansen minimaal?
c De importeur besluit 100 exemplaren te keuren. De partij wordt goedge-
keurd als het aantal defecten in de steekproef ~ c is. Bereken voor c = 8, 9,
... , 15 de afkeurkansen van partijen met 5% defecten en de goedkeur-
kansen van partijen met 20% defecten. Voor welke keuze van c is de som
van deze kansen minimaal?

9.25 Bij de keuring zoals beschreven in opgave 24 nemen we een steekproef van
100 stuks.
We besluiten een partij goed te keuren als hierbij hoogstens negen defecte
exemplaren worden aangetroffen.
a Bereken de goedkeurkans voor partijen met 10%, 11%, 12%, 13%, 14%,
15%, 16% en 20% defecten.
b Teken een grafiek van de goedkeurkansen.

Deel B Open vragen 107


c Geef aan hoe de vorm van deze grafiek wordt bij een steekproef van
400 stuks waarbij de partij wordt goedgekeurd bij hoogstens 36 defecte
exemplaren in de steekproef.

9.26 Bij de helpdesk van een computerleverancier is bekend dat de Easy Speed
Pentium nogal eens problemen geeft bij de installatie. In het verleden moest
bij 20% van de geleverde machines een monteur eraan te pas komen om de
harddisk te vervangen. De fabrikant van de Easy Speed Pentium beweert dat
er inmiddels een stringenter kwaliteitsbeleid wordt gevolgd waardoor het
percentage klachten aanmerkelijk lager zou moeten uitkomen dan de ge-
noemde 20%. Van het nieuwe type werden er door een bepaalde groothan-
del in een week 60 verkocht.
Hiervan bleken er acht de oude klacht te vertonen.
a Toets of er sprake is van een lager percentage defecten in vergelijking met de
oude situatie. (Kies ex= 0,05.)
b Bereken het onderscheidingsvermogen van de toets, indien inmiddels zou
gelden dat nog maar 10% van de Easy Speed-computers nazorg vereist.
c Stel dat met een twee keer zo grote steekproef (dus 120), twee keer zoveel
klachten (namelijk zestien) worden gevonden. Hoe luiden dan de conclusies
bij vraag a en b?
d Bij welke steekproefomvang zou een gevonden percentage van 15% defecten
een aanduiding zijn van een significante verbetering ten opzichte van de
eerdergenoemde 20%? (Gegeven het feit dat we toetsen met ex= 0,05.)

108 Hoofdstuk 9 Toetsen


..•
..
10 De chikwadraatverdeling

Deel A Multiplechoicevragen

m1 Voor een kansvariabele die een theoretische ebikwadraatkansverdeling met


vijf vrijheidsgraden volgt, geldt dat:
a deze symmetrisch rondom 0 ligt
b deze symmetrisch rondom 5 ligt
c de kansen hiervoor kunnen worden gevonden als het kwadraat wordt ge-
nomen van een normaal verdeelde variabele met fl = 5
d deze kansvariabele waarden kan aannemen die groter zijn dan 15

m2 Bij een ebikwadraattoets voor onafhankelijkheid moet worden gewerkt met


de ebikwadraatverdeling met 6 vrijheidsgraden. Er moet worden getoetst
met a= 0,05. De kritieke tabelwaarde is daarom:
a 1,64
b 14,45
c 12,59
d 9,49

m3 Bij een toets voor onafhankelijkheid


geeft de volgende tabel de waargeno- Vrouw
Man
men frequenties weer:
Links 80 120
De te verwachten of expected fre-
Rechts 170 130
quentie voor de cel waarin 80 waar-
nemingen vermeld zijn, bedraagt:
80
a
250
b 125
c 0,2
d 100

m4 Men wenst te toetsen of het aantal aanvragen bij een helpdesk van een
computermaatschappij gelijk is verdeeld over de vijf werkdagen van de
week. In een bepaalde week worden de volgende aantallen waarnemingen
gedaan tussen maandag en vrijdag: 48, 65, 57, 72 en 58. De expected fre-
quentie voor het aantal aanvragen op een willekeurige maandag is dus:
a 12
b 60
c 48
d 5

109
ms Voor een frequentieverdeling van 300 waarnemingen wordt onderzocht of
deze verdeling qua vorm kan overeenstemmen met een normale verdeling.
Hiertoe worden de gegevens in acht klassen verdeeld. Vervolgens worden de
expected frequenties berekend door de kansen voor iedere klasse te bepalen
met behulp van de tabel van de normale verdeling. Hierbij worden het
steekproefgemiddelde en de steekproefstandaarddeviatie gebruikt als schat-
tingen voor respectievelijk JA en u. Er volgt voor de toetsingsgrootheid de
waarde 15,40. Welke uitspraak is juist?
a De nulhypothese wordt verworpen bij a= 0,01.
b Bij a= 0,05 kan worden geconcludeerd dat er sprake is van homogeni-
teit.
c De rechtergrens van het kritieke gebied is 12,59 bij a = 0,05.
d De linkergrens van het kritieke gebied is 1,24 bij a = 0,025.

m6 Van een kansvariabele is gegeven dat deze een normale verdeling volgt. Een
steekproef van tien waarnemingen levert een schatting van de variantie van
24 op. De nulhypothese die wordt getoetst, luidt: H 0 : u 2 ~ 12. De toetsings-
grootheid heeft dan de waarde:
a 240
b 2
c 18
d 20

DeeiB Openvragen

10.1 Bij een onderzoek naar de rookgewoonten van Nederlanders van 18 jaar en
ouder werden door loting 200 proefpersonen gekozen die vervolgens werden
ingedeeld naar leeftijd en naar rookgewoonte.
De resultaten waren als volgt:

18 -< 30 30 -< 45 45enouder Totaal


Roker 25 35 20
- -80
Niet-roker 55 25 40 120
Totaal 80 60 60 200

We gaan met behulp van de ebikwadraattoets onderzoeken of de indelingen


naar leeftijd en rookgewoonte al dan niet afhankelijk van elkaar zijn.
We toetsen met a= 0,01.
De nulhypothese luidt: H 0 : onafhankelijkheid.

a Bereken de expected-tabel.
80
Antwoord De waargenomen fractie rokers bedraagt - = 0,4.
200
De waargenomen fractie niet-rokers bedraagt . . . . .. .
De waargenomen fractie personen van de leeftijdscategorie 18 - < 30

110 Hoofdstuk 10 De chikwadraatverdeling


80
bedraagt - = 0,4.
200

De overige fracties bedragen : voor 30 - < 45 . . .. .


voor 45 en ouder ... . .
De te verwachten frequentie van de categorie personen die roker is én een leeftijd
heeft van 18 - < 30, berekenen we als 0.4 x 0,4 x 200 = 32. {We gaan immers van
onafhankelijkheid uit.)
Bereken nu de overige frequenties van de expected-tabel.

Leeftijd
18 -< 30 30 -< 45 45enouder Totaal
- -80
Roker 32
Niet-roker 120
Totaal 80 60 60 200

b Bereken de toetsingsgrootheid x 2•

Antwoord De formule luidt: X 2 = ......... .. . . .

Hier is E;de .. . .. .. .. . . ..... . ..... . .... . frequentie

en O;de .. ..... . . . . . . .. . . . . . .. . . . . .. frequentie.

Ingevuld levert de formule :


(25 - 32) 2
x,= + ... ......... ..... .. .
32

c Hoeveel vrijheidsgraden heeft de chikwadraatverdeling die gebruikt moet


worden?

Antwoord We werken hier met een 3 x 2-tabel; het aantal vrijheidsgraden bedraagt dus ... . .
d Hoe luidt het kritieke gebied van de grootheid x?
2

Antwoord We zoeken in de tabel bij a = 0,01 en .. . . . vrijheidsgraden.


We vinden als kritieke grens 9 0 ,99 = .... .
Voor het kritieke gebied geldt dus: Z = . . .. .

e Wat is uw eindconclusie?

10.2 (Sluit aan op § 10+.)


Bij een productieproces worden producten vervaardigd waarvan de lengte
aan bepaalde specificaties moet voldoen. Alle producten met een lengte tus-
sen 119,2 en 120,8 worden goedgekeurd. Als de machine normaal staat afge-
steld, wordt minder dan 1 % van de producten afgekeurd. In dat gevallevert
de machine producten waarvan de lengte normaal is verdeeld met een ge-
middelde 120 en met een standaarddeviatie a= 0,3.

Deel B Open vragen 111


Bij het controleren van een nieuwe partij producten blijkt het percentage af-
keurde producten groter dan normaal.
Om deze reden werd uit de partij een steekproef genomen van 21 stuks. De
gemiddelde lengte van de onderzochte producten bleek 120,0 cm te zijn en
de standaarddeviatie bedroeg s = 0,58.
We gaan toetsen of de variantie die is gevonden in de steekproef duidt op
een significante toeneming van de variantie van de lengten bij het produc-
tieproces. We gaan hierbij eenzijdig toetsen.
De formulering van de hypothesen is dus:
Ho: ......... .
Hl: ......... .

Bij een toets voor de variantie geldt als toetsingsgrootheid:

- - - - = (ingevuld)

Deze volgt, gegeven H 0 , een x2 -verdeling met ... vrijheidsgraden. Als grens
vinden we in de tabel (gegeven a= 0,05), dat gg, = .....
Weergegeven als kritiek gebied levert deze grens:

Z= {xix > ..... }

De waarde voor de toetsingsgrootheid bedraagt ...


Deze zit wel/niet in Z.
De conclusie luidt dan ook: de variantie van de lengten is wel/niet signifi-
cant hoger.

10.3 Bepaal de grenzen van het kritieke gebied voor de volgende chikwadraatver-
delingen.
a Bepaal met de tabel de grens van een rechtseenzijdig gebied voor de vol-
gende verdelingen:
1 a = 0,01 en v = 4 vrijheidsgraden
2 a = 0,05 en v = 6 vrijheidsgraden
3 a = 0,025 en v = 20 vrijheidsgraden

Controleer dat Excel: 'eH I. KWADRAAT. INv' dezelfde uitkomsten levert als
de tabel.
b Bepaal met de tabel de grenzen van een linkseenzijdig gebied voor:
4 a = 0,025 en v = 5 vrijheidsgraden
5 a = O,Ol en v = 50 vrijheidsgraden
6 et= 0,05 en v = 10 vrijheidsgraden

Controleer deze waarden met Excel (NB Maak van een a aan de linkerkant,
een daarmee corresponderende kans voor de rechterkant).
c Bepaal met Excel de grenzen voor de volgende situaties:
7 a = 0,02, v = 7, rechtseenzijdig
8 a = 0,08, v = 4, tweezijdig
9 a= 0,001, v = 22, rechtseenzijdig

112 Hoofdstuk 10 De chikwadraatverdeling


10.4 We bepalen voor een berekende waarde van ebikwadraat (en gegeven v: het
aantal vrijheidsgraden) de overschrijdingskans. Het programma Excel:
'cHJ.KWADRAAT.INv' is hiervoor het geschikte hulpmiddel. Vervolgens
moet worden aangegeven of de uitkomst als significant moet worden aange-
merkt, gegeven de specifieke toetsingssituatie.
a x2 =8,32, j) = 3, rechtseenzijdige toets met a= 0,05
b X2 = 2,12, j) = 12, linkseenzijdige toets met a= 0,10
c X2 = 7,02, j) = 16, tweezijdige toets met a= 0,05
d x2 = 73,49, v = 52, rechtseenzijdige toets met a = 0,02
e X2 = 1,96, v= 9, tweezijdige toets met a= 0,01

- Bij een onderzoek naar het gebruik van internet werden de respondenten
onderverdeeld naar leeftijd en het wel of niet werken met internet. Voor 400
respondenten leverde dit de volgende tabel:

Tot en met44~ar 143 77 220


45 jaar en ouder 97 83 180
Totaal 240 160 400

a De vraag is of deze indelingen onafhankelijk zijn. Bereken op de volgens de


in het boek aangegeven wijze de expected-tabel en voer de ebikwadraattoets
uit met behulp van de tabel (kies a= 0,01).
b Voer dezelfde toets uit met Excel.

10.6 Onlangs is een nieuwe politieke partij opgericht, genaamd Ondernemend


Nederland (ON). De eerste reacties vanuit het publiek waren positief. Men
wil door middel van een onderzoek vaststellen hoe de aanhang is verdeeld
over diverse groeperingen in de maatschappij. Dat leverde de volgende re-
sultaten op:

Stemt zeker op ON Misschien ON Zeker niet ON


.
lagere opleiding 24 20 36 80
Middelbare opleiding 28 32 100 160
Hbo of hoger 4 8 48 60
Totaal 56 60 184 300

a Toets met a = 0,05 of het stemgedrag van de drie groepen kiesgerechtigden


hetzelfde kan zijn.
b Bekend is dat 52% van de kiesgerechtigden een lagere opleiding heeft, 34%
heeft een middelbare opleiding en 14% heeft een hogere opleiding. Van de
lager opgeleide kiesgerechtigden gaat doorgaans 45% stemmen, van de mid-
delbaar opgeleiden is dat 55% en bij de groep hbo of hoger is dat 70%. Ver-
der nemen we aan dat van de groep Misschien ON uiteindelijk 10% op ON
gaat stemmen, dus 90% stemt op een andere partij. Stel dat de uitkomsten

Deel B Open vragen 113


in de tabel een getrouw beeld geven, hoe groot is dan het totaalpercentage
van alle uitgebrachte stemmen dat ON kan verwachten?

10.7 Een tijdschrift met als doelgroep afgestudeerde (loopbaangerichte) jongeren,


heeft onderzocht welke 'lifestyle' zijn lezers voeren. Bij het onderzoek wer-
den 400 willekeurig gelote lezers ondervraagd. Hieronder bleken zich 250
mannen en 150 vrouwen te bevinden. Van de mannen bekenden zich 78 tot
lifestyle A, 46 voerden lifestyle B, 44 kozen voor lifestyle C en 82 konden
worden getypeerd door lifestyle D. Bij de vrouwen waren er 82 voor A, 34
voor B, 16 voor C en 18 voorD. Toets met a= 0,05 of een lifestylekeuze als
onafhankelijk van het geslacht mag worden beschouwd.

10.8 In een grote stad wordt onderzocht hoe vaak bepaalde delicten voorkomen.
Hierbij wordt een verdeling gemaakt over de vier wijken waarin de stad
organisatorisch is opgesplitst. Op basis van de politierapporten heeft men
een overzicht gemaakt van de delicten in de afgelopen maand (voor zover
die ter ore gekomen zijn van de politie). Dat leverde de volgende gegevens:

Openbare geweldpleging 12 28 6 17
Inbraak 8 42 26 30
Verkeersmisdrijven 32 44 25 33
Diefstal van fietsen en motorvoertuigen 24 66 19 52

Toets de hypothese dat de verdeling van de type delicten onafhankelijk is


van de keuze van de wijk. Gebruik hierbij het programma Excel: 'cHr-
.TOETS.'
Kies a = 0,05.

10.9 Bij de belastingdienst gaat men uit van de veronderstelling dat bij een naar
waarheid ingevuld aangiftebiljet de cijfers 1 tot en met 4 en de cijfers 6 tot
en met 9 een even grote kans hebben om voor te komen. Bij een eerlijke
aangifte is naar verwachting 24% van de cijfers nullen en 12% vijven.
Iemand die een gefingeerde aangifte doet, zal door een onbewuste voorkeur
sommige cijfers vaker invullen dan andere. Het is ook mogelijk dat zijn aan-
tal nullen of zijn aantal vijven te hoog of te laag is.
Op het aangiftebiljet van de heer X zijn de cijfers 0 tot en met 9 met de vol-
gende frequentie aangetroffen:

. . ... .
Cijfer o
...
1 2
. .. .
3 4 5 6
.. ... ........ .... ..
7 8 9
Frequentie 23 7 6 16 8 18 8 15 9 14

Onderdeel van de controle is het uitvoeren van een toets waarmee de veron-
derstelling van de juiste kans voor elk cijfer wordt onderzocht. Voer deze
toets uit met a = 0,05.

114 Hoofdstuk 10 De chikwadraatverdeling


10.10 In een ziekenhuis worden dagelijks vijf orthopedische operaties uitgevoerd.
Bekend is dat deze in 20% van de gevallen leiden tot complicaties waardoor
de patiënt enige tijd moet verblijven op de afdeling intensive care.
Voor een periode van 100 dagen leidde dit tot de volgende aantallen verwij-
zingen naar de afdeling intensive care:

Aantal per dag k


.
Aantal dagen met k verwijzingen
. .. .
0 15
1 25
2 36
3 12
4 10
5 2
Totaai 100dagen

Toets met a= 0,05 of de waargenomen verdeling overeenstemt met een bi-


nomiale verdeling met 1T = 0,20.

10.11 Het Bridgeblad is een maandblad dat door de Nederlandse Bridgebond on-
der zijn leden wordt verspreid. Omdat het blad in een oplage van 100000
exemplaren per jaar verschijnt, is dit interessant voor adverteerders. Een van
de belangrijkste factoren in dit verband is de leestijd die een bridger besteedt
aan een aflevering van het blad. Hiervoor werd bij 80 lezers de leestijd be-
paald. De frequentieverdeling staat vermeld in de volgende tabel:

leestijd!!. Waargenomen Kans volgens de


in minuten frequentie normale verdeling
O<X< 50 8 0,1587
50 <X< 70 12 0,1498
70 <X< 90 14 0,1915
90 <x< 110 17 0,1915
110 <X< 130 13 0,1498
130 <x< 160 10
160 <x< 250 6
Totaal 80

a Op twee plaatsen is deze tabel niet ingevuld. Bepaal de ontbrekende kansen.


Ga er hierbij van uit dat de steekproef van 80 waarnemingen een steekproef-
gemiddelde opleverde van 90 minuten en een standaarddeviatie van 40 mi-
nuten.
b Toets of de waargenomen frequentieverdeling kan overeenkomen met een
normale verdeling. (Kies a= 0,05.)

Deel B Open vragen 115


- Soms wil men voor een getrokken steekproefbeoordelen of die als represen-
tatief mag worden beschouwd met betrekking tot een bepaald kenmerk of
een bepaalde variabele. Met de chikwadraattoets voor aanpassing kan wor-
den getoetst of de waargenomen verdeling in dit opzicht voldoende gelijke-
nis vertoont met de populatieopbouw. Bij een opinieonderzoek over de toe-
komst van Europa worden 480 kiesgerechtigde Nederlanders ondervraagd.
Van alle ondervraagden is het opleidingsniveau genoteerd. In de volgende
tabel wordt dit opleidingsniveau vergeleken met de totale Nederlandse be-
volking:

Populatie 28% 24% 12% 100%

Toets met a = 0,05 of de steekproef als representatief mag worden beschouwd.

- Het aantal brandmeldingen dat in


een stad per week is geregistreerd
gedurende een periode van 100 we-
ken blijkt uit de volgende tabel:
Toets of het aantal branden per week
is te beschouwen als een kans-
0
1
2
• .... ... • • ••• ·••. •• •.•
Aantal branden perweek
·~·w·

Frequentie
48
24
16
3 8
variabele die een poissonverdeling
4ofmeer 4
volgt met ft = 1 (kies a = 0,05).
Totaal toaweken

10.14 In een fabriek staat een aantal machines opgesteld die in volcontinudienst
altijd functioneren. Regelrnatig treden er storingen op bij deze machines, die
dan moeten worden verholpen door een monteur. Gedurende een bepaalde
periode heeft men de tijdstippen genoteerd waarop een machine wegens
storing uitviel. Uit deze gegevens kon men telkens de tijdsduur berekenen
tussen twee opeenvolgende storingsmeldingen. De gemiddelde wachttijd op
een volgende melding bedroeg 1 uur en 45 minuten.
De waargenomen tijdsverschillen
tussen 75 opeenvolgende storingen
zijn weergegeven in de volgende Tijdsverschil
. . ·-·. ........ ..".. ..
Frequentie
tabel. 0 uur - < 1 uur 30
Toets of de waargenomen verdeling 1 uur-< 2 uur 22
van wachttijden overeenstemt met 2 uur-< 3 uur 10
een negatief exponentiële verdeling. 3 uur - < 5 uur 8
Kies a= 0,01. 5 uur en hoger 4
Totaal 74

116 Hoofdstuk 10 De chikwadraatverdeling


10.15 (Sluit aan bij § 10+.)
Een gloeilampenfabriek doet onderzoek naar de levensduur van een bepaald
type lamp. We veronderstellen dat de branduren te beschouwen zijn als
trekkingen uit een normale verdeling.
Voor acht lampen die zijn getest, waren de resultaten als volgt:

Lamp 1 2 3 4 5 6 7 8
Branduren 2600 2 560 2 500 2550 2400 2440 2470 2480

Geef een 95 %-betrouwbaarheidsinterval voor de variantie van de desbetref-


fende grootheid.

10.16 (Sluit aan bij § 10+.)


Een product wordt geleverd in 1 kg-verpakkingen. Het nettogewicht van het
product kan enigszins variëren. Van tien willekeurige pakken werd de in-
houd gecontroleerd. Dit gaf de volgende resultaten (in gram): 1 020, 1 024,
I 008, 1 007, 1 000, 996, 1012, 1016, 1 013 en 1 004. De leverancier van de ver-
pakkingen beweert dat de variantie van de gewichten hoogstens 4 bedraagt.
Toets met a = 0,05 of deze bewering houdbaar is. Ga ervan uit dat de netto-
gewichten normaal zijn verdeeld.

10.17 Bij een servicebedrijf voor cv-installaties kan men een abonnement nemen
om bij storingen snelle hulp te krijgen. Het bedrijf garandeert dat de gemid-
delde wachttijd na een storingsmelding hoogstens 1 uur en 30 minuten is en
dat de standaarddeviatie van de wachttijd hoogstens 20 minuten is.
Voor 16 storingsmeldingen is de wachttijd onderzocht. Dat leverde (in mi-
nuten): 45, 60, 72, 88, 92, 104, 108, 118, 120, 125, 142, 156, 172, 185, 192,
206.
Plaats deze gegevens op een Excelwerkblad en beantwoord de volgende
vragen:
a Toets of de standaarddeviatie hoogstens 20 minuten is (kies a= 0,05).
b Bereken een 95%-betrouwbaarheidsinterval voor de standaarddeviatie van
de wachttijd.

10.18 (Sluit aan bij § 10+.)


Een machine maakt batterijen voor kwartshorloges. De diameter van de bat-
terijen is gemiddeld ongeveer 8 mm. De onderlinge verschillen tussen de
diameters mogen niet al te groot zijn, omdat anders het risico ontstaat dat
een batterij niet in een horloge past.
Geëist wordt dat de standaarddeviatie van de diameters kleiner is dan 0,04
mm. Zo nu en dan wordt een steekproef van 26 stuks genomen om de
steekproefstandaarddeviatie sx te bepalen.
a s;,
Veronderstel, we toetsen H 0 :- 0' ~ 0,04. De steekproef leverde = 0,00032.
Wat levert de toets bij a = 0,05? -
b Veronderstel dat 0' = 0,025. Hoe luidt een 98 %-voorspellingsinterval voor s2
bij deze steekproefomvang?

Deel B Open vragen 117


...
..
11 Verschiltoetsen

Deel A Multiplechoicevragen

m1 Voor een tweetal normale verdelingen is gegeven dat hun standaarddeviaties


respectievelijk u 1 = 4 en u 2 = 6 bedragen.
Men wil toetsen H 0 : fi- 1 = flz· Een steekproefvan negen waarnemingen uit de
eerste verdeling leverde een gemiddelde uitkomst op van 48, en een steek-
proef van zestien waarnemingen uit de tweede verdeling leverde een gemid-
delde op van 42. De toetsingsgrootheid bij deze toets levert een z-waarde op
van:
a 6
b 2,99
c 6,63
d 2,67

m2 Het kenmerk van gepaarde waarnemingen is dat:


a twee steekproefgemiddelden met elkaar worden vergeleken
b de toets moet worden uitgevoerd met een t-verdeling met n + m - 2
vrijheidsgraden
c de waarnemingen op een logische manier als paren tot stand komen
d van twee waargenomen series uitkomsten bij iedere X-waarde een
Y-waarde wordt gezocht die daarbij zo dicht mogelijk in de buurt ligt.

m3 Voor twee populaties mag worden verondersteld dat deze allebei een nor-
male verdeling volgen en dezelfde onbekende variantie hebben. Men wil
toetsen of deze populaties hetzelfde gemiddelde hebben. Daartoe neemt
men uit beide populaties een steekproef van tien waarnemingen. Bij de toets
is het aantal vrijheidsgraden van de toetsingsgrootheid gelijk aan:
a 9
b 18
c 19
d -(er is bij deze toetsingsgrootheid geen sprake van vrijheidsgraden)

m4 Bij verschiltoetsen is voor toepassing van de tekentoets een vereiste dat:


a het verschil van twee steekproefgemiddelden negatief is
b bij gepaarde waarnemingen de berekende verschillen tussen de uitkom-
sten van een paar een binomiale verdeling volgen
c beide verdelingen normaal zijn verdeeld
d men voor het verschil van de twee uitkomsten van ieder waarnemings-
paar uitsluitend kijkt of dit positief of negatief is

118
ms Bij een verschiltoets voor fracties worden twee steekproeven genomen. De
eerste steekproef bestond uit 300 waarnemingen en leverde 180 successen
op. De tweede steekproefbestond uit 200 waarnemingen en leverde 140 suc-
cessen op. De toetsingsgrootheid d neemt hier dus een waarde aan van:
a 40
b -0,10
c 0,64
d 0,70

m6 Voor een tweetal normale verdelingen willen we toetsen of ze dezelfde


waarde van de variantie hebben. Voor de eerste variabele werd met een
steekproef van twaalf waarnemingen de waarde 5 2 = 240 gevonden. Bij de
tweede variabele leverde de steekproef van tien waarnemingen de waarde
5 2 = 160. De toetsingsgrootheid krijgt hier dan de waarde:
a 80
b 1,50
c 4
d 1,25

DeeiB Openvragen

11.1 Een instantie die toezicht houdt op de mate van luchtverontreiniging doet
regelmatig metingen op diverse plaatsen in het land. De gemeten verontrei-
niging wordt uitgedrukt in een bepaalde index, die op alle werkdagen wordt
bepaald.
In 2008 werden enkele nieuwe richtlijnen voor de industrie afgekondigd met
als doel het niveau van luchtverontreiniging te verlagen. Om het effect van
deze maatregelen te bestuderen, werd een onderzoek gedaan. Hierbij werden
20 waarden (x) die bepaald zijn in februari 2007 vergeleken met 20 waarden
(y) die zijn gemeten in februari 2008. Voor deze waarden werd berekend:
X = 164,6 en 5x = 17,2 en Y = 143,2 en 5Y = 15,9

Met een verschiltoets gaan we bepalen of er een significante verbetering is


opgetreden. We formuleren:

H 0 : fl x~ fl) er is geen verbetering)


Ho: flx > fly

Hierbij is flx de gemiddelde waarde van de index vóór de maatregelen en fly


de gemiddelde waarde na de maatregelen.
Omdat we werken met geschatte standaarddeviaties, moeten we werken met
de t-toets voor verschillen (bij onafhankelijke steekproeven). Als we veron-
derstellen dat beide steekproeven te beschouwen zijn als trekkingen uit
(normale) verdelingen met dezelfde variantie moeten we gebruikrnaken van
'pooled variance'.
We berekenen die als 5~ = . .... . . .. ..... = . . . . . . . . . . . . . . _ _
De toets wordt uitgevoerd met de verschilvariabele !' = K- X. waarvoor on-
der H 0 geldt:

E(}") = ...... .

Deel B Open vragen 119


Var(~)= .......

dus sv = ...... .
Om een kritieke grens te berekenen met a = 0,05 zoeken we in de t-verde-
ling met ... vrijheidsgraden.
Omdat er éénzijdig wordt getoetst, moet t 0 ,05 worden bepaald. We vinden
(na interpolatie) t 0 ,05 = ...
Dit leidt tot een kritieke grens:

gR= ...

en dus tot het kritieke gebied Z = { ............... } .


Het gevonden verschil bedroeg v = .. .
Deze waarde ligt wel/niet inZ.
De conclusie luidt daarom: .............. .

Opmerkingen
Na de berekening van sv kunnen we ook rechtstreeks een t-waarde bereke-
nen door: -
V
t* =-= .....
sr
Deze waarde vergelijken we met de tabelwaarde t c = .....

11.2 Een bureau voor budgetadvies geeft aan gezinnen bepaalde adviezen over de
besteding van het gezinsinkomen om gezinnen te helpen met het bestrijden
van financiële problemen.
Voor acht gezinnen is vastgesteld hoeveel hun uitgaven (in euro) per maand
bedroegen voordat de advisering plaatsvond en hoeveel die uitgaven per
maand waren ná de uitgebrachte adviezen. De resultaten waren:

2500 1600 3200 2600 1300 3000 2100 1800


2200 1400 2800 2500 1300 2700 2000 1600

Ga ervan uit dat de verschillen (tussen voor en na) mogen worden be-
schouwd als trekkingen uit een normale verdeling.
We gaan toetsen of de advisering effect heeft (kies a = 0,05).

Voordat we het probleem oplossen, moeten we allereerst vaststellen dat het


hier een geval van gepaarde waarnemingen betreft. Dat betekent dat we onze
berekeningen niet uitvoeren met de waargenomen uitgaven, maar dat we de
waargenomen verschillen zullen gebruiken bij het uitvoeren van de toets. We
toetsen tweezijdig.
De nulhypothese en de alternatieve hypothese luiden:
H 0 : ••••••• en H 1 : •••••••
Als toetsingsgrootheid gebruiken we V = ...... .

We berekenen allereerst de waargenomen verschillen.

120 Hoofdstuk 11 Verschiltoet sen


V1 = 300 Vs=·· · ··
V2= .... . V6= .... .
v3 = .. . . . V?= ... . .
V4= . .. . . Vs= .. . . .
_. _ kV;
Dus voor V vmden we V = - - = .....
n
Als tweede stap gaan we de variantie van Y schatten.
We doen dit met de volgende formule:

s~ = ... ..
We hebben daarom de afwijkingen van V; ten opzichte van V nodig.
We berekenen hiervan alle kwadraten, tellen die op en delen de som door ....
Dit levert s2 = .....
Bij de toets gaat het erom dat wordt vastgesteld of het waargenomen gemid-
delde verschil V opvallend van 0 verschilt. De grootheid V heeft een varian-
tie:

s~ = .. . . .

Voor de standaarddeviatie vinden we dus:

sv= .. . . .

Omdat we hier te maken hebben met een normaal verdeelde variabele met
een onbekende variantie, moeten we gebruikmaken van de t-verdeling.
We hadden hier acht waarnemingen, dus ... vrijheidsgraden voor de t-ver-
deling. Bij tweezijdige toetsing met a= O,OS moeten we als grenzen gebrui-
ken t 0 , 025 en t 0 ,975 •
In de tabel vinden we (voor beide) t = .....

Voor de grenzen van het kritieke gebied vinden we


gr= 0 + .............. = .... .
en g 1 =0- .............. = .... .
Dus Z= {xjx < .. ... of x> ..... }

De gevonden waarde V bedraagt .....


Deze ligt wel/niet in het kritieke gebied.
De conclusie is dus: . . .. . .. .

11.3 De variabele ~ is normaal verdeeld met onbekende JA en een variantie


<T~ = 100.
Ook de variabele y_ is normaal verdeeld met onbekende verwachtingswaarde.
Er geldt Var (y_) = 30.
Van de variabele ~ worden tien trekkingen gedaan. Die leveren als gemid-
delde X = SO. Er worden vijf trekkingen gedaan van de variabele y_ die als
gemiddelde opleveren Y = SS.
Toets of beide variabelen dezelfde verwachtingswaarde kunnen hebben (kies
a= O,OS).

Deel B Open vragen 121


11.4 In een fabriek staan twee vulmachines opgesteld die beide als kenmerk heb-
ben dat de natuurlijke standaarddeviatie van het vulgewicht 12 gram be-
draagt. Beide machines worden regelmatig geïnspecteerd omdat er soms
verschuiving lijkt op te treden in het gemiddelde vulgewicht ( fl 1 respectieve-
lijk fl 2 ) waarop deze machines zijn ingesteld.
Op regelmatige tijdstippen neemt men een steekproef van een aantal door
de vulmachines afgeleverde eenheden, zodat een beeld kan worden verkre-
gen van de instelling van deze machines. Dat levert de volgende gegevens
op:

Vulgewichten bij machine A (in gram) Vulgewichten bij machine B(in gram)
1053 1067 1093 1068 1054 1070 1075 1082 1072 1088 1062 1069 1085 1099
1052 1058 1065 1071 1058 1080 1058 1065 1068 1060 1074 1055 1040 1073

Voer deze gegevens in op een Excelwerkblad en toets of de gemiddelde vul-


gewichten voor machines A en B significant verschillen (kies a= 0,05).

- Van werknemers in een bepaalde bedrijfstak wordt het verband tussen jaar-
salaris en het bezit van een vakdiploma onderzocht. Groep 1 is een steek-
proef uit de werknemers met diploma, groep 2 is een steekproef van werk-
nemers zonder diploma. De resultaten waren (jaarinkomens in duizenden
euro's):

Groept 40 45 48 33 42 35 32 47 38 37 43
Groep2 25 28 30 35 38 32 22

Veronderstel dat beide inkomensverdelingen mogen worden beschouwd als


normale verdelingen met dezelfde onbekende variantie.
Toets of fl 1 = fl z (kies a= 0,05).

11.6 Voor twee merken batterijen die volgens de aanduiding op de verpakking


eenzelfde levensduur zouden moeten hebben, is de gebruiksduur bepaald.
Twee steekproeven leverden de volgende resultaten:

. .,.... ...... . . ..
Merk A 32 35 37 36 40 36 33 35 38 33
.
MerkB 42 38 36 41 44 35 39 38 42 37 43 38

Geef een 95 %-betrouwbaarheidsinterval voor fl 1 - fl 2 , het verschil van de


verwachtingswaarden voor de twee verdelingen.

-
122
In een studie naar luchtvervuiling leverde een aselecte steekproef van acht
luchtmonsters in de omgeving van een bepaalde fabriek gemiddeld 2,26 mi-
crogram van een schadelijke stof per m 3 , met een standaardafwijking van

Hoofdstuk 11 Verschiltoetsen
0,56. In een grote stad leverde een steekproef van tien monsters een resultaat
van 1,54 als gemiddelde en 0,42 als standaardafwijking. Ook in dit geval
ging het om de hoeveelheid van dezelfde stof per m 3 • Onderzoek met
a= 0,01 of het gevonden verschil significant is. Hierbij mag men aannemen
dat de steekproeven afkomstig waren uit twee normale verdelingen met de-
zelfde variantie.

11.8 Een verffabrikant vergelijkt twee soorten verf, aan te duiden als A en B, voor
wat de droogtijd betreft. Op acht verschillende typen ondergrond werd met
beide verfsoorten een vlak geschilderd. De droogtijden in uren bedroegen:

6,2 s.s s.o 4,2 S.4 4.7 6,0


Droogtijd t 8 S,2 6,S S,2 S,8 4,7 S,9 5,0 6,S

a Toets of het verschil in droogtijd van de twee verftypen significant van nul
afwijkt, indien voor deze verschillen geen specifieke kansverdeling wordt
verondersteld (kies a= 0,05).
b Ga ervan uit dat de verschillen kunnen worden beschreven door een (onbe-
kende) normale verdeling. Voer, hiermee rekening houdend, nogmaals een
toetsing uit zoals bij vraag a is geformuleerd.

11.9 Een organisatie voor maatschappelijk verantwoord ondernemen onderzoekt


de houding van grote bedrijven voor investeren in duurzame projecten.
Voor 12 grote ondernemingen werd op basis van de jaarverslagen bekeken
hoe hoog de uitgaven voor dit doel waren in 2008 en 2009. Dat leverde de
volgende tabel:

Bedrijf Uitgaven in 2008 Uitgaven in 2009


A 120 134
B 18 26
c 3SO 320
D 62 70
E 8 12
ss 68
G 247 2SS
H 66 78
23 29
192 210
K 125 147
L 30 35

Voer de gegevens in op een Excelwerkblad.


De analyse van deze gegevens leidde tot verhitte discussies, waarbij de vol-
gende drie stellingen over de tafel vlogen:

Deel B Openvragen 123


Stelling 1
De uitgaven voor duurzame projecten zijn niet significant omhooggegaan,
zo blijkt uit de verschiltoets voor gemiddelden.

Stelling 2
Bedrijven geven meer aan duurzame projecten uit, want als je per bedrijf de
procentuele stijging berekent, dan levert de verschiltoets voor gepaarde
waarnemingen een significante toename.

Stelling 3
Omdat de grootte van de bedragen zeer uiteenloopt is het beter om de
tekentoets te gebruiken. Die toont een significante verbetering.

Voer de berekeningen uit die ten grondslag liggen aan de hier genoemde
stellingen en geef argumenten voor de keuze van de meest geschikte me-
thode.

11.10 Bij een hypotheekbank wil men onderzoeken of er een verschil is tussen
klanten die kiezen voor een hypothecaire lening met een variabele rente en
klanten die een vaste rente (minstens vijf jaar vast) prefereren. Een van de
variabelen die hierbij van belang zou kunnen zijn is de leeftijd van de per-
soon die de lening opneemt. Voor twintig recentelijk afgesloten hypotheken
kon men de leeftijd van de klant in de documentatie vinden. Dit leverde de
volgende resultaten op:

eeeAeeeeeeeeeeeee~········~·············
Leeftijden van klanten die kiezen Leeftijden van klanten die kiezen
.•..........
voor een variabele rente voor een vaste rente
33 44 41 38
34 29 52 35
41 56 46 58
45 32 47 56
30 47
31 40

Toets of de gemiddelde leeftijd van klanten die een variabele rente willen
significant afwijkt van klanten die een variabele rente prefereren. Doe dit
door eerst de gegevens uit de tabel in te voeren op een Excel-werkblad en
dan vervolgens de juiste toets toe te passen. Hierbij gaan we ervan uit dat
beide populaties (leeftijden van mensen die vaste rente respectievelijk varia-
bele rente prefereren) dezelfde variantie hebben. Kies Cl' = 0,05.

11.11 Bij een onderzoek naar de uitgaansgewoonten van jongeren maakt men on-
derscheid tussen werkende jongeren en studerende jongeren.
Men heeft deze jongeren gevraagd hoeveel zij per maand besteden in cafés,
discotheken enzovoort. Voor steekproeven uit beide groeperingen werden de
volgende bedragen gevonden (in euro per maand):
a Toets of de varianties van de twee populaties aan elkaar gelijk kunnen zijn.

124 Hoofdstuk 11 Verschiltoetsen


. ~· .. . . . . ...
Uitgaven van twintig werkende jongeren
·• ............ ·-·.. . .........
Uitgaven van zestien studenten
240 460 135 365 480 320 100 120 170 280 245 390 255 140 260
60 275 495 660 285 110 430 330 70 230 60 150 200 155 145
595 410 295 210 45 300
- ----- - --- ---

b Toets (rekening houdend met uw conclusie bij vraag a) of beide populaties


kunnen zijn gekenmerkt door hetzelfde gemiddelde uitgavenniveau. Doe dit
door de waargenomen bedragen in te voeren in een Excelwerkblad (kies
a= 0,05).

Een grootwinkelbedrijf verkoopt in alle filialen een bepaald afwasmiddel. In


een week werd in zes filialen het volgende aantal flessen van dit afwasmiddel
verkocht:

Filiaal A B c D E F
Aantal flessen 320 260 440 400 380 300

In de week nadat voorgaande gegevens werden verzameld, is een intensieve


reclamecampagne gehouden voor het desbetreffende afwasmiddel. Volgend
op deze reclamecampagne worden in tien filialen in één week de volgende
aantallen flessen verkocht:

Filiaal
. . P Q R 5
. ·~·
TU
. V
.. W X
.. Y
Aantal flessen 400 360 410 500 540 380 490 520 420 480

Toets of het gemiddelde aantal verkochte flessen voor en na de behandeling


gelijk is (a= 0,05).
(Ga ervan uit dat de waargenomen aantallen mogen worden beschouwd als
trekkingen uit normale verdelingen).

In zes filialen van een supermarktketen is het aantal verkochte flessen van
een wasmiddel vlak voor en vlak na een reclamecampagne geregistreerd. De
resultaten waren:

• • • • • • ••• • ••••
Filiaal A B c D E F
Aantalvoor 320 260 440 400 380 310
Aantal na 420 380 520 490 490 400

Toets of er een opvallend verschil is in de omzet per filiaal voor en na de


campagne (a= 0,05).
Voer de toets op twee manieren uit en geef aan van welke veronderstellingen
men is uitgegaan bij de toetsen (vergelijk opgave 12).

Deel B Open vragen 125


11.14 Een farmaceutisch bedrijf onderzoekt het effect van een nieuw soort pillen
tegen allergie.
Via de spreekuren bij een aantal artsen werden 200 patiënten geselecteerd
die met bepaalde allergieklachten kwamen. Hiervan kregen 120 personen de
nieuwe medicatie voorgeschreven en een controlegroep van 80 personen
kreeg een placebo (neppil) verstrekt.
Bij controle na drie weken bleek dat van de 120 patiënten die het nieuwe
middel kregen, er nog 28 waren met de aanvankelijke allergieklachten. Bij de
groep van 80 patiënten die de placebo hadden geslokt, bleek dat er nog 38
personen allergieklachten hadden.
Toets of het nieuwe middel significant betere resultaten geeft dan de placebo
(kies a= 0,05).

- Een frisdrankenfabrikant heeft een advertentiecampagne gevoerd om de


merkbekendheid te verhogen. Vóór de campagne bleek dat van 1 000 wille-
keurig gelote consumenten er 200 het merk kenden. Na de campagne bleek
dat van 1 500 willekeurig gelote consumenten er 500 het merk kenden.
Toets of de merkbekendheid gewijzigd is (kies a= 0,05); toets eenzijdig.

11.16 Van 500 willekeurig gekozen Amsterdammers steunen 200 het regeringsbe-
leid in een bepaalde kwestie. Van 300 willekeurig gekozen plattelanders
steunden 180 personen dit regeringsbeleid. Toets of de regeringsaanhang in
Amsterdam en op het platteland significant verschillend is (kies a= 0,01).

11.17 (Sluit aan bij § 11 +.)


Voor een bepaald onderzoek kan worden gebruikgemaakt van een F -toets.
Geef de grenzen van het kritieke gebied aan als de toets rechtseenzijdig is
met a= 0,025 en de volgende F -verdelingen van toepassing zijn (zie ook
Excel):
a F(4,6)
b F(l0,15)
c F(8,8)
d F(20,10)
Dezelfde vraag voor een linkseenzijdige toets met a = 0,025 bij de volgende
verdelingen:
e F(3,5)
f F(5,3)
g F(l5,6)
h F(6,8)
Dezelfde vraag voor een tweezijdige toets met a = 0,05 bij de volgende ver-
delingen:
F(4,5)
j F(5,4)
k F(l0,8)
I F(20,15)

126 Hoofdstuk 11 Verschiltoetsen


11.18 Bij een kwaliteitscontroleprocedure worden geproduceerde platen bouwma-
teriaal periodiek gecontroleerd op dikte. Hiertoe wordt een steekproef geno-
men van acht exemplaren. Deze leverde als uitkomsten (in mm):

88 92 90 91 89 90 89 91

De fabrikant van de machine (machine A) waarmee deze platen worden ver-


vaardigd garandeert dat de standaarddeviatie van de diktes hoogstens O,S
millimeter is.
a Toets met a = O,OS of de bewering van de fabrikant houdbaar is.
b De fabrikant heeft nog een tweede type machine (machine B) waarmee der-
gelijke platen kunnen worden vervaardigd.
Een steekproef van zes platen die met deze tweede machine werden vervaar-
digd, leverde de volgende diktes op:

87 91 93 89 86 94

Toets met a = O,OS of de diktes van de platen voor de twee machines de-
zelfde variantie kunnen hebben.
c Geef voor machine B (uit opgave b) een 9S %-betrouwbaarheidsinterval
voor 14: de gemiddelde dikte van de populatie van platen bouwmateriaal.

11.19 Toets voor de gegevens uit opgave S of de twee steekproeven mogen worden
beschouwd als trekkingen uit twee (normale) verdelingen die worden geken-
merkt door dezelfde variantie (kies a= O,OS).

11.20 Een transportbedrijf verzorgt de dagelijkse bevoorrading van supermarkten.


Tussen het centrale magazijn in stad A en een aantal supermarkten in stad B
moet dagelijks een traject worden afgelegd van 40 kilometer (we noemen dit
traject A). Helaas zijn er dikwijls, en op onvoorspelbare tijdstippen, files op
dit traject. Hierdoor is de reisduur onzeker, en kunnen vanwege het tijds-
verlies de kosten voor het transportbedrijf soms onbeheersbaar zijn. Men
overweegt daarom een alternatieve route (traject B) te kiezen. Deze is een
aantal kilometers groter, maar misschien is er veel minder risico voor files.
Om een dergelijke keuze te onderbouwen is besloten op een aantal willekeu-
rig gekozen dagen de route via traject A dan wel traject B te rijden.
Dit leverde de volgende reistijden (in minuten):
Traject A: 72 8S 104 SS 90 77 68 SO 36 63

Traject B: 78 72 81 74 8S 71 69 84 66 76 6S 79
a Toets of de variantie van de reistijden voor traject A en traject B aan elkaar
gelijk kunnen zijn (kies a= O,OS).
b Toets of de gemiddelde reistijd voor traject A en traject B hetzelfde kan zijn
(kies a= O,OS).

Deel B Open vragen 127


....
12 Va ria ntiea na lyse

Deel A Multiplechoicevragen

m1 Variantieanalyse wordt gebruikt om de nulhypothese te toetsen dat:


a twee of meer populatievarianties aan elkaar gelijk zijn
b minstens één populatievariantie afwijkt van de andere populatievarian-
ties
c twee of meer populatiegemiddelden aan elkaar gelijk zijn
d minstens één populatiegemiddelde afwijkt van de andere populatie-
gemiddelden

Gegevens voor de vragen m2, m3, m4 en mS


Een éénfactor-variantieanalyse wordt uitgevoerd met vier steekproeven met
respectievelijk 9, 10, 12 en 15 waarnemingen. Berekend werd SST= 1250 en
SSE= 840.

m2 De binnenvariantie is dus:
a 29,76
b 18,26
c 20
d 9,76

m3 (Gebruik de gegevens zoals vermeld boven vraag m2.)


De tussenvariantie is dus:
a 9,76
b 136,67
c 11,69
d 416,67

m4 De toets dient te worden uitgevoerd met de volgende F-ratio:


a F= 6,83
b F= 20,83
c F= 1,49
d F=5,125

ms Indien getoetst wordt met a = 0,05, dan is de te gebruiken tabelwaarde bij


benadering:
a 2,83
b 5,70
c 2,59
d 8,60

128
m6 Bij een éénfactor-variantieanalyse worden steekproeven uit vier populaties
gebruikt. Men wil als vervolg op deze analyse ook paarsgewijze vergelijkin-
gen maken tussen de steekproeven. Indien we de methode van Bonferroni
gebruiken met een gezamelijke a = 0,05, dan moet worden gewerkt met
t-waarden die een overschrijdingskans weergeven van:
a a= 0,025
b a= 0,0125
c a= 0,0083
d a= 0,0042

DeeiB Openvragen

Bij een bepaalde universitaire opleiding dienen studenten een toelatingstest


te doen. Voor deze test kan men een score halen op de schaal van 1 tot 100.
De deelnemers aan de test worden onderscheiden naar het schooltype dat
men heeft doorlopen. Vraagstelling is of de behaalde resultaten voor de test
onafhankelijk zijn van het schooltype. Er werd een steekproef genomen van
een aantal kandidaten om met hun testresultaten deze vraag te kunnen be-
studeren.
De resultaten voor de test zijn weer-
gegeven in de tabel.
We willen door middel van varian-
tieanalyse bestuderen of de popula-
ties van studenten afkomstig van de
48
drie schooltypen gemiddeld het-
64 66 58
zelfde scoreniveau hebben bij de
80 54 72
test.
75 70 64
50 68
a Hoe luiden de nulhypothese en de
alternatieve hypothese?
Antwoord:
Ho: .............. .
Ht: .............. .

b Wat zijn de gemiddelde scores voor de drie steekproeven?


Voor steekproef A vinden we : ..... .
Voor steekproef B vinden we ..... .
Voor steekproef C vinden we ..... .
Het totaalgemiddelde is ........... .

c Bereken de binnenvariantie.
We kijken binnen de drie groepen:
Voor groep A vinden we ~(x -x:)l = : ............................ .
Voor groep B vinden we: .................................... ..... .
Voor groep C vinden we: .................................... ..... .

Deel B Open vragen 129


d Bereken de tussenvariantie
We berekenen eerst de totale kwadraatsom.
Dat levert: .................................... . . .
Vervolgens berekenen we SSG.
Dit levert SSG = ...... - ...... = ..... .

Dus tussenvariantie is: - - = ..... .

e Toets de nulhypothese met a = 0,05.

- Een bedrijfseconoom onderzoekt of de methode van financiering van een


onderneming in verband te brengen is met de jaarwinst (gedefinieerd als be-
haald rendement over het eigen vermogen). Sommige ondernemingen zijn
geheel met eigen vermogen gefinancierd, andere zijn ook gefinancierd met
vreemd vermogen (geldleningen). Voor deze laatste categorie onderscheiden
we twee soorten, namelijk ondernemingen die zijn gefinancierd met relatief
weinig vreemd vermogen en met relatief veel vreemd vermogen.
Voor een steekproef van 24 ondernemingen is vastgesteld hoe groot het be-
haalde rendement was op het eigen vermogen in het afgelopen jaar (zie de
volgende tabel).

Financieringsstructuur
Alleen eigen vermogen Weinig vreemd vermogen Veel vreemd vermogen
3,8 8,6 20,6
6,3 12,5 10,9
7,6 5,0 17.4
8,2 9,9 16,1
8,1 16,3 23,0
0,2 17.4 25.4
4,9 4 ,0
7,0 7,9
10,9 18,8

Toets met a = 0,05 of de gemiddelde rendementen voor de drie groepen


duiden op hetzelfde rendementsniveau.

12.3 Een onderwijskundige wil de studieprestaties van studenten onderzoeken.


Hierbij wordt bekeken of de woonsituatie van studenten van invloed kan
zijn op het gemiddelde cijfer voor de tentamens. Er worden drie vormen
van huisvesting onderscheiden, namelijk thuiswonend, op kamers of in een
studentenhuis.

130 Hoofdstuk 12 Variantiea nalyse


Voor een steekproefvan 24 studenten werden de volgende resultaten gevon-
den:

Vorm van huisvesting


Thuis Opkamers In studentenhuis
7,8 8,2 5,8
6,3 6,1 6,6
7,7 5,9 8,0
5,8 7.3 5.5
8,5 6,6 4,6
8,2 6,9 6.4
6,9 7.8 6,2
8,0 7.2 5.4

Toets met a = 0,05 de uitspraak dat de studieresultaten niet afhankelijk zijn


van de huisvesting van studenten.

12.4 Pas op de analyse van de gegevens van opgave 3 de Bonferroni-methode toe,


gegeven de gebruikte a = 0,05.

12.5 Bij een levensbedreigende ziekte Levensduurvan 36 behandelde patiënten


worden soms zware medicamenten (weken)
toegediend die wellicht de reste-
Dehandeling
rende levensduur van patiënten ver- c
A B D
lengen. Bij een bepaalde behande- 25 90
46 72
ling komen vier soorten chemothe- 80 36 65
34
rapie in aanmerking. Na het stellen 61 38
56 71
van de diagnose wordt door de be-
67 43 65 47
handelend specialist aan patiënten 28 23 88
42
volgens een gerandamiseerde opzet, 18 104
40 96
een van de vier middelen voorge-
62 84 40 72
schreven. Achteraf is het aantal we- 68
67 53
ken geregistreerd dat de patiënten 32
52
nog leefden na de start van de thera-
23 54
pie. Zie de tabel.
a Toets met a = 0,05 of de populaties
van levensduren dezelfde waarde voor fl kunnen hebben.
b Een veronderstelling bij variantieanalyse is, dat alle populaties worden ge-
kenmerkt door dezelfde a. Vergelijk de steekproeven A en B en toets of deze
voortgekomen kunnen zijn uit populaties met dezelfde a. (Kies weer a = 0,05.)

- In een groot havengebied zijn vijf locaties ingericht om dagelijks de lucht-


verontreiniging te meten. Op vijf verschillende dagen werden metingen ver-
richt (zie de volgende tabel). De vraag is of er duidelijke verschillen zijn in
de gemeten waarden per waarnemingsstation en tevens of op de vijf meet-
tijdstippen hetzelfde niveau van luchtverontreiniging werd gemeten.

Deel B Openvragen 131


Datum Waarnemingsstation
A B
-
c D E
27februari 34 38 42 37 30
27 maart 26 32 35 33 20
24april 75 73 80 72 67
22mei 40 44 51 45 38
19juni 52 58 60 54 48

Pas op deze gegevens variantieanalyse toe waarbij de invloed van de blokken


en de behandelingen wordt onderzocht. Kies a = 0,05.

12.7 Een onderzoeksbureau wenst na te Gereden kilometers (x 1000) voor drie


gaan of voor drie merken banden de
levensduur overeenkomt. De banden
Automerken Bandensoorten
werden getest met vijf verschillende
11 111
automerken. Nagegaan werd hoeveel
A 70 73 78
kilometer er met de banden kon
B 76 81 86
worden gereden voordat deze wer-
den afgekeurd. De resultaten zijn
c 68 76 80
D 80 82 88
weergegeven in de volgende tabel en
E 72 80 82
geven de gereden afstand in duizen-
den kilometers aan. Toets met
a = 0,05 of de drie bandenmerken eenzelfde levensduur kunnen hebben.

- Een fabriek van golfballen heeft een nieuw procédé ontwikkeld voor de bui-
tenkant van golfballen. Er zijn drie proefversies vervaardigd: type A, B en C.
Bij de fabriek is een machine die als een soort automatische golfclub de bal-
len met dezelfde kracht een klap geeft. Hierna wordt de geslagen afstand (in
meters) gemeten. De machine doet met alle drie de balsoorten 12 slagen. De
resultaten waren als volgt:

Slag Baltype A BaltypeB BaltypeC


1 185 184 180
2 174 175 188
3 164 192 173
4 182 197 178
5 175 186 184
6 170 183 174
7 178 187 170
8 177 196 176
9 196 194 172
10 190 193 166
11 186 188 162
12 183 195 177

Toets met a= 0,05 of de ballen gemiddeld een verschillende afstand afleggen.

132 Hoofdstuk 12 Variantieanalyse


12.9 Bij dezelfde fabriek van golfballen worden de ballen ook getest door echte
spelers. Jan, Ria en Koen slaan met hetzelfde type golfclub. De resultaten
waren als volgt:

pen ballen door drie spelers

Speler Baltype A BaltypeS BaltypeC


- - ---
Jan 195 194 190
184 185 198
174 202 183
192 207 188
Ria 165 176 169
160 173 159
168 177 155
167 186 161
Koen 186 194 172
180 193 166
176 188 162
173 195 177

Toets of er significante verschillen zijn tussen Jan, Ria en Koen en ook of er


significante verschillen zijn tussen de drie typen ballen. Kies a = 0,05.

12.10 Een onderzoeksbureau voor de Kunsten bestudeert de waardering die


schouwburgpubliek heeft voor toneelvoorstellingen.
Bij een voorstelling van Othello is per geënquêteerde een waarderingscijfer
vastgesteld tussen 0 en 10. Tevens werd per deelnemer genoteerd het
opleidingsniveau (1: laag, 2: midden, 3: hoog) en de leeftijd (1: jong, 2: mid-
den, 3: oud). Voor iedere gecombineerde groep werden 5 waarnemingen ge-
daan. De volgende 45 resultaten werden vastgesteld (zie tabel op volgende
pagina):
a Construeer een 3-bij-3-tabel waarin per cel de vijf scores vermeld staan.
Voer hierop een tweefactor-variantieanalyse uit.
b Toets of leeftijd een factor is die samenhangt met de waardering voor de
voorstelling.
c Toets of opleidingsniveau een factor is die samenhangt met de waardering
van de voorstelling.
d Zijn er interactie-effecten?

Deel B Open vragen 133


Persoon Opleiding Leeftijd Cijfer
1 1 3 7
2 2 2 6
3 2 1 7
4 3 3 9
5 2 3 8
6 1 2 5
7 3 1 8
8 1 2 5
9 2 3 6
10 3 1 7
11 3 3 9
12 1 3 7
13 1 3 6
14 3 2 9
15 2 3 9
16 3 3 9
17 3 1 8
18 1 1 7
19 3 2 8
20 2 3 8
21 2 2 7
22 1 1 5
23 3 2 8
24 2 1 7
25 1 2 5
26 1 1 6
27 3 3 9
28 3 3 8
29 3 2 5
30 2 2 8
31 3 1 9
32 2 1 6
33 1 3 6
34 2 3 8
35 3 2 9
36 2 2 7
37 2 2 8
38 3 1 9
39 2 1 7
40 2 1 8
41 1 3 7
42 1 2 6
43 1 1 7
44 1 2 7
45 1 1 5

134 Hoofdstuk 12 Variantieana lyse


- Bij een landbouwkundige studie wil men de omvang van de oogst voor een
aantal tarwesoorten bepalen waarbij tevens wordt bestudeerd of de ge-
bruikte meststoffen van belang zijn. Van iedere combinatie van een gekozen
tarweras en een gebruikte meststof werden vier proefakkertjes gevormd. De
opbrengsten zijn weergegeven in de volgende tabel:

Oo t van viertarwerassen
Meststof Tarweras
A B c D
1 25 27 26 30 31 33 35 37 36 38 39 39 27 29 29 31
2 32 33 35 36 34 37 38 40 40 43 44 45 32 32 33 35
3 19 21 23 25 33 35 36 36 30 31 33 34 20 20 21 23

a Voer een tweefactor-variantieanalyse uit op deze gegevens.


b Toets of de gemiddelde opbrengsten voor populaties gevormd door de vier
tarwerassen aan elkaar gelijk kunnen zijn.
c Toets of de drie merken meststoffen dezelfde productieniveaus opleveren.

(NB Bij toepassing van Excel dienen ook labels voor kolommen en rijen in-
gevoerd te worden.)

Deel B Open vragen 13 5


...•
13 Regressie en correlatie

Deel A Multiplechoicevragen

m1 Bij regressieanalyse wordt de grootheid die aangeeft hoe de variabele Y (ge-


middeld) reageert op veranderingen in de variabele X aangeduid met:
a de constante term
b de storingsterm
c de richtingscoëfficiënt van de regressielijn
d de correlatiecoëfficiënt

m2 Indien bij een regressieanalyse een correlatiecoëfficiënt wordt gevonden ter


grootte van - 0,50, dan:
a moet er een rekenfout zijn gemaakt
b is de variabele Y ongeschikt als verklarende variabele
c zullen bij hogere X-waarden doorgaans lagere Y-waarden worden aange-
troffen
d kan de storingsterm geen positieve variantie hebben

m3 Indien bij lineaire regressie wordt vastgesteld dat ~ = 0, dan:


a hebben de variabele X en Y een tegengestelde relatie
b is het onderscheidingsvermogen 1 - ~ gelijk aan 1
c toont de variabele X geen relatie met de variabele Y
d passen de punten perfect op de lijn

m4 Indien bij een enkelvoudige lineaire regressieanalyse blijkt dat geldt a = 0


voor de berekende regressielijn, dan:
a geldt altijd a = 0 voor het regressiemodel
b is de correlatie tussen X en Y gelijk aan nul
c gaat de berekende regressielijn door de oorsprong
d loopt de berekende lijn horizontaal

ms Een dummyvariabele is:


a een variabele die geen zinvolle verklaring van de Y-variabele levert
b alleen bruikbaar bij regressie indien de afhankelijke variabele alleen ja of
nee kan aanduiden
c een verklarende variabele die alleen de waarde 0 of 1 aanneemt, afhanke-
lijk van het wel of niet aanwezig zijn van een bepaald kenmerk
d een variabele waarvan tijdens het onderzoek nog niet vaststaat welke
waarden ze zal aannemen

m6 Als op basis van een berekende regressielijn een voorspellingsinterval wordt


berekend voor een uitkomst van de afhankelijke variabele Y bij een gekozen

136
waarde X 0 , dan kan voor dit interval het volgende worden gezegd (slechts
één antwoord is juist):
a Als het gebruikte aantal waarnemingen bij de bepaling van de regressie-
lijn naar oneindig gaat, dan kan zo'n interval willekeurig klein worden
gemaakt, gegeven de te gebruiken kans.
b Naarmate X 0 dichter bij het gemiddelde van de in de steekproef aanwe-
zige X-waarden ligt, zal het interval breder zijn in vergelijking met een X 0
die dichter bij de oorsprong ligt.
c Een voorspellingsinterval bij X 0 is smaller dan een vergelijkbaar betrouw-
baarheidsinterval bij X 0 •
d Als de variantie van de storingsterm groter dan nul is, kan een Y-waarde
nooit perfect worden voorspeld bij iedere gegeven X 0 •

DeeiB Openvragen

13.1 Een fabrikant van synthetische vezels onderzoekt of het krimpen van de ve-
zels samenhangt met de temperatuur waarbij ze worden gewassen.
Er wordt achtmaal een proef verricht waarbij de vezels gedurende 30 minu-
ten aan een bepaalde temperatuur worden blootgesteld. De geconstateerde
krimp werd (in procenten van de oorspronkelijke lengte) als volgt vast-
gesteld:

Temp. (•c) 60 70 80 90 100 75 85 100


Krimp(%) 1,2 1,9 2,8 3,8 4,2 2,6 3,2 4,5

Het verband tussen temperatuur en krimp willen we beschrijven door een


regressielijn te berekenen op basis van de waargenomen uitkomsten.

a Welke sommaties moeten we berekenen om de regressiecoëfficiënt te kun-


nen bepalen?

Antwoord De normaalvergelijkingen luiden:

Berekend moeten worden:

LX;........ , .. . .... en ...... .

Deel B Open vragen 13 7


b Bereken de sommaties in een reken- Antwoord
schema.
c Bereken de coëfficiënt a en b van de
lineaire vergelijking. ~ g_ ~ _,_
x•
60 1,2 72 3600
Antwoord Oplossing van het stelsel van twee 70 1,9
normaalvergelijkingen levert 80 2,8
90 3,8
b=----- 100 4,2
75 2,6
en 85 3,2

LY; 100 4,5


LX;
a = - - b -- . Som:
n n
We vonden in het rekenschema:

IX;
I Y;
IX;Y; = . ...... .
Ix; = ....... .

Verder geldt: n = .....


Invullen levert:

a= . .... . .... en b = .. . . .. . .. .

De vergelijkingvan de regressielijn wordt dus:

Y= ............. .

d Voorspel de krimp indien de temperatuur X de waarde 65 oe heeft.

Antwoord De waarde X = ... . . moet worden ingevuld in de gevonden vergelijking.


Dit levert:

Y = . ..... .

13.2 In een productieafdeling is het niveau van de dagproductie sterk afhankelijk


van de vraag.
Als er (toevallig) veel orders binnenkomen, dan moet er onder druk een
hoge productie worden gehaald. Het percentage afgekeurde producten lijkt
samen te hangen met het niveau van de dagproductie.
Voor negen achtereenvolgende dagen werden de dagproductie en het per-
centage afgekeurde producten geregistreerd.

138 Hoofdstuk 13 Regressie en correlatie


Dag nr. Dagprodu'!ie (stuks) Percentage afgekeurde
producten
1 2800 2,0
2 3800 3,2
3 4400 4,2
4 3200 2,4
5 2400 1,4
6 2700 1,7
7 3500 2,8
8 4200 3,6
9 3600 3,0

a Bereken de regressielijn met de dagproductie als verklarende variabele voor


het percentage afgekeurde producten.

Antwoord Mede met het oog op vraag c (de correlatiecoëfficiënt) zullen we de regressielijn be-
palen door het berekenen van sommaties met 'kleine x' en 'kleiney'.
We berekenen daarom eerst X (de gemiddelde dagproductie) en Y (het gemiddelde
percentage afgekeurde producten).
We vinden:
LX; 1
-- = - (2 800 + 0 0 0 + 0 0 0 + 0 0 0 + 0 0 0 + 0. 0 + 0. 0 + 0 0. + 0 0 0) = . 0 0 0. 0 0 0 0 0 0 0 0 0 0 0 0

n 9
en
- 1
y =- (2,0 + 0 0 0 + 0 0 0 + 0 0 0 + 0 0 0 + 0 0 0 +. + 0 0 0 0 0 +. 0 0) = 0 0 • 0 0 0 0 0 0 • 0 0 ••• 0 0 • 0 0 • 0 0

9
We kunnen nu het rekenschema opzetten:

4400 4,2
3200 2,4
2400 1,4
2700 1,7
3500 2,8
4200 3,6
3600 3,0
--- - - -
Som

In termenvan 'kleine x' en 'kleine y' Iu idt de vergelijking voor de richtingscoëfficiënt:

b= = ... .. ... (invullen)

Voor de constante term geldt:

a= ............... = ......... .

Deel B Open vragen 139


De vergelijking van de lijn luidt dus:

y = ... . . ......... .

b Geef een voorspelling van het percentage defecten bij een productieomvang
van 4 000 stuks per dag.

Antwoord De gevonden vergelijking luidt: Y = ...... .


Invullen van X= 4000 levert Y = ...... .

c Bereken de correlatiecoëfficiënt van de variabelen X en Y.

Antwoord De formulevan de correlatiecoëfficiënt Iu idt:

r=-----

In het rekenschema bij vraag a hebben we de benodigde sommaties berekend.


Invullen levert:

r = -- - - -

13.3 Een autofabrikant onderzoekt het benzineverbruik van een nieuw op de


markt te brengen model. Hiertoe wordt op een speciaal circuit een tijd lang
met constante snelheid gereden, waarna het benzineverbruik wordt vast-
gesteld in liters per 100 kilometer.
Vijf van die experimenten leverden de volgende gegevens:

••••
Snelheid 90 100 110 120 130
Verbruik 6,8 7,3 7,9 8,5 9,0

a Bereken een regressielijn waarbij het verbruik wordt verklaard uit de geko-
zen snelheid.
b Voorspel het verbruik bij een snelheid van 115 kilometer per uur en ook bij
een snelheid van 20 kilometer per uur. Geef commentaar op dit laatste re-
sultaat.
c Een automobilist die een exemplaar van dit model heeft aangeschaft, klaagt
erover dat bij hem het benzineverbruik bij 100km per uur 8,6liter bedraagt.
Wat kan de oorzaak zijn?

140 Hoofdstuk 13 Regressie en correlat ie


De Stichting voor Veilig Verkeer
doet onderzoek naar de invloed van Promillage Gewicht (in kg)
alcohol op het bloedalcoholgehalte 1,06 61
(promillage). In een onderzoek on- 0,77 82
der tien mannen heeft men het pro- 0,72 86
millage gemeten, twee uur na het 0,95 70
begin van het drinken van vijf gla- 0,65 96
zen bier. Tevens heeft men van deze 0,83 80
tien personen het lichaamsgewicht 0,99 67
gemeten. De gegevens staan in de 0,73 90
volgende tabel: 0,84 75
Een onderzoeker heeft het idee dat 0,96 73
het gewicht van een persoon invloed
heeft op het bloedalcoholgehalte en
onderzoekt dit met regressie.
a Welke van de variabelen is de te verklaren variabele?
b Stel de vergelijking van de regressielijn op.
c Bereken de correlatiecoëfficiënt.
d Geef het voorspelde promillage (twee uur na het begin van het drinken van
vijf glazen bier) voor een man van 85 kg.
e Uit onderzoek is gebleken: het promillage ligt, twee uur na het begin van het
drinken van zes glazen bier (bij mannen) 20 o/o hoger dan na het drinken
van vijf glazen. Stel de vergelijking van de regressielijn voor dit geval op.

13.5 De weerstand van een blokje van een bepaald metaalsoort hangt af van de
temperatuur. Bij verschillende temperaturen (X) werd de weerstand (Y) ge-
meten. De resultaten zijn weergegeven in de volgende tabel:

Temp.("C) -100 -50 0 50 100 150 200


Weerstand (H) 13,2 17,5 21,3 25,4 28,9 32,8 36,8

a Ga ervan uit dat het verband tussen temperatuur en weerstand lineair is.
Bepaal de regressielijn met de temperatuur als verklarende variabele.
b Welke weerstand kan men verwachten bij 400 oe?
c Bij experimenten als het hier genoemde wordt de temperatuur vaak uitge-
drukt in Kelvin (K). Hoe luidt de vergelijking van de regressielijn als de tem-
peratuur in K wordt uitgedrukt? (Het nulpunt van de Keivin-temperatuur-
schaalligt bij -273 oe. Een stijging met 1 oe is gelijk aan een stijging met 1 K.)

Deel B Open vragen 141


Bij een groep van 30 studenten is onderzocht hoe de resultaten waren voor
het eindtentamen Statistiek. Aan het begin van de cursus werd een tussen-
toets afgenomen. De docent heeft het vermoeden dat op basis van de resul-
taten voor deze tussentoets een redelijke voorspelling kan worden gedaan
voor de score op het eindtentamen. De resultaten staan in de volgende tabel:

1 80 86
2 S8 S7
3 41 S8
4 38 4S
s 67 58
6 92 98
7 25 36
8 67 S8
9 60 63
10 ss 66
11 72 69
12 23 22
13 68 60
14 62 S3
15 82 84
16 84 88
17 S1 64
18 68 60
19 72 67
20 S9 61
21 68 80
22 36 58
23 88 83
24 7S 52
25 S7 54
26 S6 61
27 81 65
28 74 67
29 52 55
30 60 64

a Bereken op basis van deze gegevens de regressielijn. Gebruik Excel hiervoor.


b Welke score voor het eindtentamen wordt voorspeld voor een student die bij
de tussentoets een score behaalde van 40 punten? En 80 punten?

142 Hoofdstuk 13 Regressie en correlatie


13.7 Een studentendecaan heeft onderzoek gedaan naar het verband tussen
studieresultaten ( Y) van studenten en het aantal uur (X) dat zij wekelijks
doorbrengen in uitgaansgelegenheden.
Voor die studieresultaten Y werd gekeken naar het gemiddelde cijfer dat be-
haald is voor de exacte vakken. Voor 50 studenten werden gegevens verza-
meld. Deze leverden de volgende resultaten:

IX =400 IY =275
IX 2 =3400 Iy2=1580
n = 50 IXY = 2 100
a Bereken de regressielijn met X als verklarende variabele.
b Bereken de correlatiecoëfficiënt.
c Geef een schatting van de standaarddeviaties sx en sy-
Bereken met de richtingscoëfficiënt b (zie vraag a) nogmaals r.

De variabelen J: en 2::: worden paarsgewijs waargenomen.


De gezamenlijke kansverdeling van de variabelen J: en 2::: wordt gekarakteri-
seerd door de volgende kansen:
2 1
P(x= 1, y= 10) = - P(x=2, y=12)=-
- - 10 - - 10

1 2
P(x= 1, y= 11) = - P(x=3, y=ll)=-
- - 10 - - 10

1 1
P(x= 2, y= 10) = - P(x=3, y=12)=-
- - 10 - - 10

2
P(x=2, y=ll)=-
- - 10
a Breng de hier gegeven kansen in een vierkant schema over.
b Bereken E(J:) en Var(,~)
en E(L::) en Var(L::).
c Bereken Cov(J:, L:::).
d Bereken de (populatie)correlatiecoëfficiënt.
e We definiëren de kansvariabele ~ als ~ = J: + 2:::·
Bereken de verwachtingswaarde en de variantie van~-

Opmerking: denk aan de marginale kansverdeling: zie paragraaf 4+.

Deel B Open vragen 143


13.9 Een consumentenorganisa tie wil onderzoeken hoe de samenhang is tussen
de ouderdom van automobielen en de jaarlijkse kosten voor onderhoud.
Voor auto's van het merk Inceatti zijn tien exemplaren in het onderzoek be-
trokken geweest. Dit leverde de volgende gegevens:

Autonummer Leeftijd in jaren (X) Onderhoudskosten (Y)


in de laatste 12 maanden
A 1,6 450
B 6,8 930
c 5.1 670
D 7,2 920
E 3.5 640
6,2 900
G 9.4 1440
H 5.5 760
8,0 1260
2,7 530
Totaal 56,0 8500

Verder zijn de volgende sommaties gegeven:


kX; = 56, k Y; = 8 500, kXf = 367,24, k yt = 8102 000 en kX;Y; = 54132.

a Bereken de regressielijn waardoor de onderhoudsuitgaven worden verklaard


uit de leeftijd.
b Bereken op basis van de gegevens van a een 95 %-voorspellingsinterval voor
de onderhoudskosten van een willekeurige auto van tien jaar oud.
c Veronderstel eens dat de hier bedoelde regressielijn exact bekend zou zijn,
bijvoorbeeld omdat een alomvattend onderzoek naar onderhoudskosten heeft
plaatsgevonden waarbij alle 50 000 Inceatti-auto's die in Nederland rondrij-
den, betrokken waren. Dit bleek een regressielijn op te leveren met a = 320
en {3 = 130. Verder geldt voor de storingsterm u . = 65.
Geef hiermee een 99%-voorspellingsint erval voor het bedrag aan jaarlijkse
onderhoudskosten voor een willekeurige Inceatti-auto van tien jaar oud.

13.10 Een belegger is geïnteresseerd in aandelen van de ondernemingen PQR en


RSV. Op grond van bekend veronderstelde subjectieve kansverdelingen zijn
de volgende gegevens beschikbaar.
De koers van PQR over een jaar kan worden beschouwd als een trekking uit
de normale verdeling met fl = 200 en u= 20.
De koers van RSV over een jaar kan worden beschouwd als een trekking uit
de normale verdeling met fl = 100 en u= 15.
Verder hangen de koersen van beide aandelen samen. De correlatie-
coëfficiënt van de koersen bedraagt p = 0,6.
a Bereken de covariantie van de koersen PQR en RSV.
b De belegger heeft in portefeuille één aandeel PQR en één aandeel RSV. Bere-
ken de kans dat de portefeuille over een jaar meer dan € 350 waard is.
c De belegger heeft in portefeuille vijf aandelen PQR en 10 aandelen RSV.
Bereken de kans dat de portefeuille over een jaar minder dan € 1.800 waard is.

144 Hoofdstuk 13 Regressie en correlatie


Voor een groep studenten wordt een tweetal testscores vastgesteld. Een voor
de A-vakken en een voor de B-vakken. De resultaten waren als volgt:

Student A B C 0 E F G H
A-score 40 60 50 45 74 53 45 42
8-score 88 35 45 80 35 60 70 85

Bereken hiervoor de rangcorrelatiecoëfficiënt van Spearman.

13.12 De bond voor 'Sociale Noden in deze Wereld' heeft voor een steekproef van
200 personen onderzocht welk aantal personen wel eens een donatie doet
voor een goed doel. Van de groep van 200 bleken 80 wél lid te zijn van de
bond en 120 niet. De volgende tabel geeft de resultaten:

Wéllid Geen lid Totaal


Wél bijdrage 52 8 60
Geen bijdrage 28 112 140
80 120 200

a Geef met de maatstaf van Yule aan hoe groot de associatie is tussen beide
kenmerken.
b Bereken Ph i als maatstaf voor associatie.

13.13 Een hamburgerrestaurant doet regelmatig aan verspreiding van reclamefol-


ders waarin een bon voor korting is opgenomen.
Deze bonnen hebben een geldigheidsduur van zes weken. De folders worden
in de derde week van iedere maand verspreid. Voor acht maanden zijn de
volgende gegevens verzameld.

Maand 1 2 3 4 5 6 7 8
Aantal folders (x1 ooo) 12 2 5 14 0 6 3 6
Maandomzet (x1000) 90 115 78 87 123 67 84 76

a Het vermoeden bestaat dat de reclamefolders die worden verspreid in


maand teen stimulerend effect hebben op de omzet in maand t + 1.
Onderzoek deze relatie met lineaire regressie.
b Bereken de correlatiecoëfficiënt voor de situatie die is geschetst bij vraag a.
Bereken ook de correlatiecoëfficiënt zonder dat rekening wordt gehouden
met de verschuiving van één maand.

Deel B Open vragen 145


13.14 Bij de deltawerken vaart een rondvaartboot met een capaciteit van 1 000
passagiers. Gebleken is dat deze capaciteit weleens aan de krappe kant is.
Men vraagt zich af of men de noodzaak van het inzetten van een tweede
boot kan voorspellen uit de weersvoorspelling. Hiertoe registreert men de
voorspelde temperatuur (t, 's avonds tevoren in het NOS-journaal) en het
aantal passagiers (P). De resultaten van enkele aselect gekozen dagen in de
zomerperiode zijn:

. .,. . .... . .... .


18 19 16 19 23
... .. . .
21 17
•~ ~·~ ·

p 621 720 554 825 901 788 701

a Bereken de relevante regressielijn.


b Bereken de correlatiecoëfficiënt.

Bij de beantwoording van de twee volgende vragen moet men aannemen dat
het aantal passagiers een normaal verdeelde grootheid is, waarvan de ver-
wachting lineair afhangt van de voorspelde temperatuur en de variantie on-
afhankelijk is van deze temperatuur.
c Bepaal een 95 %-voorspellingsinterval voor het aantal passagiers op een dag
waarop voor de temperatuur 25 oe wordt voorspeld.
d Bepaal een 95 %-betrouwbaarheidsinterval voor het verwachte aantal passa-
giers op dagen waarop voor de temperatuur 25 oe wordt voorspeld.

11111 Er is een onderzoek gehouden naar het verband tussen motorinhoud en


maximumsnelheid van personenauto's.
Er werden tien auto's getest. De resultaten waren als volgt:

Auto nr.
. ..Cilinderinhoud
.•· . .
Max. snelheid (km/uur)
.. .. .. .. .
1,2 140
11 0,8 110
111 0,8 100
IV 2,0 180
V 1.4 150
VI 1,0 100
VIl 1,6 160
VIII 1,8 190
IX 1,3 140
x 1,1 130

a Teken de gegevens in een spreidingsdiagram.


b Bepaal het verband tussen de variabelen met behulp van lineaire regressie.
c Voorspel aan de hand van de gevonden lijn de maximumsnelheid van een
auto met een cilinderinhoud van 1,5liter.
d Geef een schatting van de variantie van de storingsterm.
e Geef een 95 %-voorspellingsinterval voor de maximumsnelheid van een
auto waarvan is gegeven dat deze een cilinderinhoud van 1,45 liter heeft.

146 Hoofdstuk 13 Regressie en correlatie


13.16 (Sluit aan bij opgave 6)
Voor de klas van 30 studenten is ook bijgehouden hoeveel studie-uren zij
hebben besteed aan het voorbereiden van het eindtentamen. De resultaten
zijn weergegeven in de eerste vier kolommen van het volgende databestand:

Student Eindtentamen Tussentoets Uren Dyslexie


1 80 86 23 0
2 58 57 23 1
3 41 58 18 1
4 38 45 15 0
5 67 58 24 0
6 92 98 20 0
7 25 36 12 0
8 67 58 30 1
9 60 63 16 0
10 55 66 14 0
11 72 69 24 1
12 23 22 10 1
13 68 60 20 0
14
15
62
82
53
84
22
21
0
1
- ~ -~ --
16 84 88 18 0
17 51 64 16 1
18 68 60 24 0
19 72 67 23 0
20 59 61 16 0
21 68 80 12 0
22 36 58 12 1
23 88 83 24 1
24 75 52 26 0
25 57 54 20 0
26 56 61 15 0
27 81 65 29 0
28 74 67 24 0
29 52 55 18 1
30 60 64 21 0

a Bereken een regressielijn waarmee de eindscore wordt voorspeld uit het aan-
tal studie-uren.
b Iemand spreekt het vermoeden uit dat de invloed van de studie-uren vooral
tot uiting komt in het verschil tussen de score voor eindtentamen en tussen-
toets. Construeer een kolom verschillen en bestudeer met lineaire regressie
het hier genoemde vermoeden.
c Is er verband tussen de score voor de tussentoets en het aantal studie-uren?
Gebruik het resultaat voor de tussentoets als verklaring voor de studie-uren.

Deel B Openvragen 147


13.17 (Sluit aan bij opgave 16)
Voor de studenten is ook bijgehouden wie geregistreerd staat als lijdend aan
dyslexie. Dat is in de tabel bij opgave 16 aangegeven met dyslexie ja= 1,
nee= 0.
a Verschilt het gemiddelde eindcijfer voor studenten mét dyslexie van het ge-
middelde voor studenten zonder dyslexie?
b Besteden studenten met dyslexie meer tijd aan het bestuderen van het eind-
tentamen?
c Ga meervoudige regressie toepassen op deze gegevens. Probeer de score voor
het eindtentamen te voorspellen op basis van de drie andere variabelen.

13.18 Voor een groep van tien managers is het verband onderzocht tussen inko-
men, aantal jaren onderwijs en het aantal jaren werkervaring.
De resultaten waren als volgt:

• •• •• • ••••
Manager Jaarinkomen Jaren onderwijs Jaren ervaring
(x€1.000)
A 80 12 5
B 110 16 10
c 90 13 3
0 70 12 2
E 80 15 6
120 17 16
G 110 14 15
H 130 18 20
110 18 12
100 12 8

a Onderzoek het verband tussen de variabelen met behulp van meervoudige


regressie.
b Voorspel het jaarinkomen van een manager met achttien jaren onderwijs en
tien jaar werkervaring.

13.19 In een televisieprogramma van automobielliefhebbers wordt een test gepre-


senteerd voor autobanden. Omdat wel eens wordt gesuggereerd dat het
benzineverbruik van de auto omhooggaat zowel wanneer met te zachte ban-
den als wanneer met te harde banden wordt gereden, word achtmaal bij ver-
schillende bandenspanning (maar verder bij gelijkblijvende omstandighe-
den) het aantal verbruikte liters benzine per 100 kilometer bepaald.
De resultaten waren als volgt:

Verbruik (y) 8,8 8,0 7.3 7,0 7,1 7.4 8,1

148 Hoofdstuk 13 Regressie en correlat ie


Het vermoeden bestaat dat een tweedegraadscurve hier mogelijk geschikt is
voor het beschrijven van de relatie tussen de variabelen x en y.
Bepaal de curve met de kleinstekwadratenmethode.

13.20 Open in Excel het bestand 'BANKERs'.


a Bereken de regressielijn waarmee het jaarsalaris wordt verklaard uit het aan-
tal dienstjaren bij de bank.
b Bereken een overeenkomstige regressielijn voor personen met een directie-
functie en voer nogmaals zo'n berekening uit voor baliemedewerkers. Verge-
lijk de richtingscoëfficiënten.

13.21 Open in Excel het bestand 'ToP 100'.


a Bereken de correlatie tussen 'omzet in 1990' en 'winst in 1990'.
Hint: verwijder uit het bestand eerst het bedrijf Samsung, want Excel kan niet
goed omgaan met ontbrekende gegevens.
b Bereken een regressielijn waarbij een relatie wordt gelegd tussen 'omzet in
1990' en 'aantal werknemers in 1990'.
Hint: verwijder het bedrijf Petrobras (zie vraag a).

13.22 Open in Excel het bestand 'wiNKELs'.


a Verklaar de jaaromzet in 1992 uit de vloeroppervlakte.
b Verklaar de jaaromzet in 1992 uit het aantal werknemers.
c Verklaar de jaaromzet in 1992 uit zowel vloeroppervlakte als aantal werkne-
mers.
Hint: bij toepassing van meervoudige regressie in Excel is het een absolute ver-
eiste dat de verklarende variabelen in kolommen naast elkaar in het bestand
staan. Dus een voorbewerking van het gegevensbestand kan vaak noodzakelijk
zijn alvorens men Excel kan toepassen.

13.23 Open in Excel het bestand 'cuRsus'.


a Men wil proberen het eindcijfer van een student te voorspellen uit het vo-
rige cijfer. Bereken voor dit doel een regressielijn. Welk cijfer levert dit voor
een student die als vorig cijfer 70 punten haalde?
b Men wil het eindcijfer voor de student verklaren uit het aantal studie-uren.
Bereken voor dit doel een regressielijn. Welk cijfer krijgt een student met 50
studie-uren?
c Bereken de regressielijn van vraag b voor mannen en vrouwen afzonderlijk.
d Bereken met meervoudige regressie hoe het eindcijfer kan worden verklaard
uit het aantal studie-uren en een dummy variabele die het geslacht aangeeft.
Vergelijk deze resultaten met de uitkomst van vraag c. (Zie de hint bij op-
gave 22.)
Hint: let op dat de variabele man/vrouw omgecodeerd moet worden tot 1/0.

13.24 Open in Excel het bestand 'woNINGEN'.


a Verklaar de vraagprijs van een huis uit het aantal kamers.
b Verklaar de vraagprijs van een huis uit de perceeloppervlakte.
c Onderzoek met meervoudige regressie hoe men de vraagprijs kan verklaren
uit de verschillende beschikbare variabelen. (Zie de hint bij opgave 22.)

Deel B Open vragen 149


I ..••

14 Indexcijfers

Deel A Multiplechoicevragen

m1 Voor een landelijke prijsindex is een reeks berekend op basis van 1990 =
100. In 2000 bereikte deze index de waarde 140. In dat jaar werd overgegaan
op een nieuw wegingsschema met als basis 2000 = 100. In het jaar 2008 be-
reikte de nieuwe index de waarde 125. Een gekoppelde reeks geeft dan in
2008 op basis van 1990 = 100 de waarde:
a 112
b 265
c 165
d 175

De volgende tabel bevat gegevens voor de vragen m2 tot en met mB.


Een onderneming plaatst op jaarmarkten en kermissen kraampjes voor de
verkoop van snacks. Er worden drie producten verkocht, namelijk Frankfur-
ter worstjes, hamburgers en Berliner bollen. In de tabel staan voor 2001,
2002 en 2003 de prijzen en de verkochte hoeveelheden.

2001 2001 2002 2003


Fra nkfu rte rs 3,00 25000 3,30 28000 30000
Hamburgers 6,00 50000 6,50 56000 48000
Berliners 4,80 12000 s.so 10000 s.so 14000

m2 Het samengesteld omgewogen prijsindexcijfer (prijsindexcijfer van Carli)


voor 2002 bedraagt (op basis van 2001 = 100):
a 111,0
b 110,9
c 110
d 112

m3 Het hoeveelheidsindexcijfer van Dutot voor 2002 bedraagt (op basis van
2001 = 100):
a 108,0
b 111,0
c 102,4
d 110,9

150
j
m4 Het waarde-indexcijfer voor 2003 bedraagt (op basis van 2001 = 100):
a 118,2
b 125,7
c 129,9
d 124,6

ms Het prijsindexcijfer van Laspeyres voor 2002 bedraagt (op basis van
2001 = 100):
a 108,2
b 109,3
c 109,5
d 111,1

m6 Het hoeveelhei cisindexcijfer van Paasche voor 2003 bedraagt (op basis van
2001 = 100):
a 121,1
b 105,7
c 102,9
d 102,5

DeeiB Openvragen

14.1 Bij een Chinees restaurant kunnen


de gerechten uitsluitend worden af-
Verkochte hoeveelheid
gehaald. Men kan kiezen uit nasi,
2008 _20_0...:.9_ _
bami en loempia's. In de volgende
Nasi (porties) 50000 60000
tabellen zijn de afgezette hoeveelhe- 32000
Bami (porti.:_s) 30000
den voor de jaren 2008 en 2009 aan- 38000
Loempia's (stuks) 45000
gegeven. Verder is voor de betrokken
jaren de gemiddelde verkoopprijs
vermeld.

(Gemiddelde} verkoopprijs In euro


2008 _2_00...:.9_ __
Nasi (per portie) 4,00 4,20
Bami (per portie) 3,80 4,20
Loempia's (per stuk) 2,50 3,00

a Bereken voor de betrokken producten de enkelvoudige prijs- en hoeveelheicis-


indexcijfers op basis van 2008 = 100.

Antwoord Voor het enkelvoudige prijsindexcijfer geldt:

pl
p~l = - x 100
Po

Deel B Openvragen 151


We vinden dus:
Po9 4,20
P~ 8 •09 (nasi)=- X 100 = 4 OO X 100 = 105, p~ 8 • 09 (bami) = .. ... X 100 = .....
Pos ,
P~ 8 • 09 (loempia's) = .. ... X 100 = .....

Voor het enkelvoudige hoeveelheidsindexcijfer geldt:


q!
Q~ 1 = - X 100
qo
We vinden dus:
60000
Q~8 09 (nasi) = - - X 100 = 120
' 50000
Q~ 8 • 09 (bami) = .......... X 100 = .....

Q~ 8 • 09 (loempia's) = .... ...... X 100 = .... .

b Bereken de omzet van de drie producten in 2008 en 2009, en bereken de to-


tale omzet in beide jaren en het waarde-indexcijfer op basis van 2008 = 100.

Antwoord De omzet is voor elk product te berekenen als 'prijs maal hoeveelheid'. We vinden
dus:

Nasi 4,00 x 50 000 = € 200.000


Bami ...... x ..... = € ........ .. ... .
loempia's ..... x ..... = € .. .... .. .. .. ..
Totale omzet in 2008 € . .... . ....... .

Nasi 4,20 x 60 000 = € 252.000


Bami .... . x .... . = € .... .... .... ..
loempia's ..... x ..... = € ....... . .
Totale omzet in 2009 € . .... . .. ..

Het waarde-indexcijfer luidt:

LPogqog ·····
W 08•09 = ~ x 100 = - - x 100 =
L.Poa qoa .....

c Bereken voor de groep van drie producten met behulp van de indirecte
methode het samengestelde prijsindexcijfer van Laspeyres op basis van
2008 = 100.

152 Hoofdstuk 14 Indexcijfe rs


Antwoord Volgens de indirecte schrijfwijze luidt de formule van Laspeyres:
.... . .... .
P~a.og = - - - -

In deze formule hebben we de enkelvoudige prijsindexcijfers nodig (die zijn al bere-


kend bij vraag a) en de wegingscoëfficiënt voor elk artikel.
Deze wegingscoëfficiënten berusten bij toepassing van de formule van Laspeyres op
de waarde(= omzet = prijs maal hoeveelheid) in de basisperiode.
We vonden bij vraag a:

pe 08 ,09 (nasi) = 105


p•oa.o 9 (bami) = .. .. .
pe 08 ,09 (1oempia's) = .....

Bij vraag b vonden we:

voor nasi p08 q 08 = 4,00 X 50000 = 200000


voor bami = ...... x ...... = ...... .
voor loempia's = ...... x ...... = ...... .

Voor het prijsindexcijfer van Laspeyres vinden we dan:


200000 x 105 + ...... .... x .......... + .......... x ..........
P~a.og = ------------------------
20000 + .......... + ..........

14.2 Een sigarenwinkelier heeft nauwkeurig de hoeveelheden en de prijzen bijge-


houden van de verkochte producten in 2005 en 2010. De resultaten zijn
weergegeven in de volgende tabel:

2005 2010 2005 2010


Sigaretten (pakjes) 4,25 160
- -
144
3.75
Sigaren (doosjes) 8,20 9,80 12 14
Shag (pakjes) 2,50 3,25 40 42

a Bereken het samengestelde prijsindexcijfer van Laspeyres (2005 = 100) vol-


gens de directe methode.

Antwoord De formule lu idt:


. . .. . . . . ..
p~S,lO = X 100

Ingevuld levert dit:


4,25 x 160 + ..... x ..... + ..... x .. ...
p~510 = x 100 = .....
. 3,75 x 160 + ..... x ..... + ..... x .....
b Bereken het samengestelde prijsindexcijfer van Paasche (2005 = 100).

Deel B Openvragen 153


Antwoord De formule van Paasche luidt:

p~S.lO = ~ X 100

Invullen levert:
4,25 x 144 + .. ... x ..... + ..... x .....
P~ 5 10 = X 100 = .. .. .
. 3,75 x 144 + .. .. . x ..... + ..... x .....
c Bereken het samengestelde prijsindexcijfer van Fisher.

Antwoord Voor het prijsindexcijfer van Fisher geldt:

Invullen levert: PK = J.......... X .......... = .... .


5•10

d Bereken het waarde-indexcijfer (2005 = 100).

Antwoord De formulevan hetwaarde-indexcijfer Iu idt:

WOS,10 = --- x 100

Invullen levert:
4,25 x 144 + .... . x ..... + ..... x .....
wos. = 3,75 x 160
10 x 100 = .... .
+ .. .. . x . .. .. + ... .. x .. ...
e Bereken de samengestelde hoeveelheidsindexcijfers van Laspeyres en Paas-
che.

Antwoord Omdat we in de vragen a tot en met d reeds verschillende indexcijfers hebben bere-
kend, kunnen we de hier gevraagde indexcijfers berekenen met behulp van de
zwakke prod ucttest. We kennen het volgende verband:

pL X QP=W X 100 en pP X QL = W X 100

Met behulpvan de hiervóór gevonden getallen kunnen QP en QL worden berekend .

..... x QP = ..... dusQP0 5 , 10 = .. ...

en

..... x QL = ..... dusQLos,lo = .....

14.3 De gemiddelde prijs per jaar van een artikel is voor de jaren 1998-2003 ge-
geven in de volgende tabel:

•• • •• • • •••• •• •• •• • • • • ••• • •••


Jaar 1998 1999 2000 2001 2002 2003
Gemiddelde prijs 4,60 5,00 6,00 7,60 8,00 8,80

154 Hoofdstuk 14 Indexcijfers


a Bereken de enkelvoudige prijsindexcijfers voor de jaren 2002 en 2003 met
1998 als basis.
b Bereken de enkelvoudige prijsindexcijfers voor alle gegeven jaren met (de
gemiddelde prijs uit) de periode 1999-2001 als basis.

14.4 De prijs per kilogram van product A was in 2008 10o/o hoger dan in 2007. In
2006 was de prijs 12 o/o lager dan in 2007 en in 2009 was de prijs 25 o/o hoger
dan in 2007.
Bereken op grond van deze gegevens het (enkelvoudige) prijsindexcijfer
voor product A voor de jaren 2006 tot en met 2009. Kies hierbij 2007 als
basisjaar.
Bereken hiermee een reeks enkelvoudige prijsindexcijfers voor product A
waarbij 2006 = 100 is gesteld.

14.5 Een zelfbedieningsrestaurant ver- Aantal verkochte eenheden (x 1000)


koopt drie soorten gerechten, name-
Hamburgers Kip Frites
lijk hamburgers, kip en frites. De
2000 200 80 160
volgende tabel geeft het aantal ver-
2001 280 100 176
kochte eenheden (stuks of porties)
2002 320 106 160
aan voor de jaren 2000, 2001 en
2002.
a Bereken voor de drie producten afzonderlijk de enkelvoudige hoeveelheicis-
indexcijfers voor 2001 en 2002 (2000 = 100).
b Bereken het ongewogen samengestelde hoeveelheidsindexcijfer voor 2001 en
2002 (2000 = 100).
c Bereken het hoeveelheidsindexcijfer van Dutót voor 2001 en 2002 (2002 =
100).

- Een importeur van personenauto's heeft in 2008 en 2009 de volgende aan-


tallen auto's verkocht:

Model Aantai2008 Aantal2009


Axel 2400 2100
Berlina 450 420
Co met 190 280
DubioMPV 820 1320
Totaal 3860 4120

a Bereken op basis van vóórgaande gegevens de enkelvoudige hoeveelheicis-


indexcijfers voor de vier modellen (op basis van 2008 = 100) en bereken
vervolgens het samengestelde hoeveelheidsindexcijfer.

Deel B Open vragen 15 5


Voor genoemde modellen zijn ook
nog de prijzen gegeven in 2008 en
2009.
Axel
b Bereken met behulp van de gegevens
Berlina 59.500
uit beide tabellen het samengestelde
Cornet 88.500 84.500
hoeveelheidsindexcijfer van Laspey-
DubioMPV 57.500 56.000
res (2008 = 100).
c Bereken ook het samengestelde
hoeveelheidsindexcijfer van Paasche
(2008 = 100)

- De ANWB onderzoekt de uitgaven van automobilisten. Per auto waren de


prijzen van de operationele kosten voor een vijftal categorieën als volgt:

.. ..... ..... . ........ . .... . .. ..,..... .. ..•. .


Uitgavensoort Prijs in jaar 11 Prijs in jaar 14 Aantaleenhedeninjaar11

(in euro's) (in euro's)


WA-verzekering 270 340 1
Wegenbelasting 186 208 1
Benzine 1,35 1,74 2 200 (liter)
Parkeergelden 2,00 3,50 35 (uren)
Onderhoud 240 220 2 (beurten)

a Bereken een prijsindexcijfer voor de operationele kosten.

Het blijkt dat in jaar 14 de auto's voor wat betreft benzineverbruik gemid-
deld 10o/o zuiniger rijden. Bovendien hebben auto's in jaar 14 nog slechts
één onderhoudsbeurt per jaar nodig. Betaald parkeren moet steeds vaker.
Gemiddeld 45 uur in jaar 14.
b Hoe ziet het prijsverloop eruit als dit gebaseerd wordt op de eenheden in
jaar 14?
c Hoe verhouden zich de totale operationele kosten voor de twee jaren?

14.8 Een belegger heeft aandelen van vier bedrijven in portefeuille.


Hij heeft 400 aandelen Akzo, 500 aandelen DSM, 500 aandelen Océ, 1 000
aandelen SNS-Reaal. De koersen van deze aandelen waren op drie tijd-
stippen als volgt:

. .. ... .. .. . .. . .. .. .
Aandeel December jaar 1
~

December jaar 2 December jaar 3


~· .. . ~

Akzo 52,20 59.30 43.70


DSM 35.75 45.90 42,30
Océ 16,40 24,05 29,50
SNS-Reaal 17,80 19,60 24,40
Beursindex 459 540 521

156 Hoofdstuk 14 Indexcijfers


a Bereken een index voor het koersverloop van de gehele portefeuille waarin
de aantallen aandelen het gewicht bepalen.
b Heeft de belegger het in jaar 2 en jaar 3 beter gedaan dan de beursindex of
slechter?

Een groot levensmiddelenconcern


heeft drie typen supermarkten, die
door een verschillend aanbod van
2003 2004
producten worden onderscheiden.
Type I 152 180
De omzet van de drie typen winkels
Typeli 334 350
was als volgt (zie de tabel):
Typelil 50 80

Vanwege het verschillende pakket


dat wordt verhandeld, is de prijsant-
wikkeling voor de drie typen win-
100 108
kels verschillend geweest. De vol- Type 1
100 104
gen de tabel geeft de ontwikkeling Type 11
100 110
van het prijsindexcijfer van Laspey- Type 111
res voor elk van de drie winkel-
typen.
a Bereken voor de drie winkeltypen afzonderlijk het hoeveelheidsindexcijfer
van Paasche (2003 = 100).
b Bereken het samengestelde prijsindexcijfer van Laspeyres (2003 = 100).
c Bereken het samengestelde hoeveelheidsindexcijfer van Paasche (2003 =
100).

14.10 Voor een pakket goederen geldt voor het prijsverloop P~6 • 07 = 104,5.
Verder geldt voor de ontwikkeling van de omzet W 06 ,07 = 118,8.
Bereken (met behulp van de zwakke producttest) het hoeveelheicis-
indexcijfer van Paasche voor 2007 op basis van 2006.

14.11 Voor een bepaald pakket goederen geldt dat de (afgezette) waarde in 2001
€ 12 mln bedroeg en in 2002 bedroeg deze € 13,7 mln. Verder zijn het
prijsindexcijfer van Fisher en het prijsindexcijfer van Laspeyres gegeven op
basis van 2001 = 100. Deze bedroegen: P~1 • 02 = 106,2 en P~ 1 • 02 = 108,1.
Bereken de hoeveelheidsindexcijfers van Fisher, Paasche en Laspeyres.

14.12 Een kleine ondernemer heeft een overzicht gemaakt van zijn netto-
jaarinkomen over een aantal jaren en van de ontwikkeling van de koop-
kracht.
In de volgende tabel is het verloop van beide grootheden weergegeven:

Jaar 2005 2006 2007 2008


Nettojaarinkomen (x 1.000) 74 86 125 160
Prijsindexcijfer 100 103 105,6 108,4

Deel B Openvragen 157


a Bereken de reële ontwikkeling van het inkomen van de ondernemer (in
euro's van 2005).
b In 2005 is door de ondernemer een bedrag van € 100.000 op de bank gezet
tegen een rente van drie jaar vast. Dit leverde een rente van 8 o/o per jaar op.
De rente werd jaarlijks bijgeboekt op de rekening en hierover werd dan in
het volgend jaar ook 8 o/o betaald. In 2008 neemt hij het totale bedrag van
zijn rekening op.
Hoeveel is dit (nominale) eindbedrag?
Hoeveel is dit bedrag in euro van 2005?
Hoeveel heeft hij reëel verdiend met die belegging? Ga ervan uit dat de on-
dernemer een marginaal belastingtarief heeft van 60 o/o en dat hij jaarlijks
over de bijgeboekte rente belasting dient te betalen. Is de waarde van het
beginbedrag in stand gebleven?

14.13 Een groothandel in fruit vergelijkt de omzetten en prijzen voor het afgelo-
pen jaar (jaar t = 20) met de overeenkomstige gegevens 5 jaar daarvoor (jaar
15).

.
Product
. .
Omzet in kg in
.
Omzet in kg in
.
Prijs per kg in Prijs per kg in
.
jaar 15 (x 1.000) jaar 20 (x 1.000) jaar15 jaar20
Appels 160 130 0,88 1,10
Bananen 120 160 0,76 0,72
Citroenen 15 18 2,30 2,40
Druiven 42 64 1,60 1,70

a Bereken voor het assortiment van vier producten een prijsindexcijfer vol-
gens de methode van Laspeyres.
b Bereken voor het assortiment van vier producten een hoeveelheids-
indexcijfer volgens de methode van Paasche.
c Bereken het waarde-indexcijfer.
d In de periode van vijf jaar is het prijsindexcijfer van de gezinsconsumptie
gestegen van 212,63 tot 229,41. Zijn de prijzen voor fruit in die tijd sneller
gestegen dan de gezinsconsumptie of juist langzamer?
e Door de toegenomen welvaart is het gemiddelde gezinsbudget dat uitgege-
ven wordt aan voedsel en dranken opgelopen van 12.700 euro naar 15.150
euro. Hebben de bestedingen aan fruit hiermee gelijke tred gehouden?

158 Hoofdstuk 14 Indexcijfers


...
.
15 Tijd reeksen

Deel A Multiplechoicevragen

m1 De lange-termijnontwikkeling in een tijdreeks wordt doorgaans aangeduid


met de term:
a seizoencomponent
b toevallige component
c trend
d toekomstvoorspelling of 'Forecast'

m2 Als bij de methode van de voortschrijdende gemiddelden wordt gewerkt


met een even aantal perioden, dan is het slechts mogelijk de waargenomen
uitkomsten rechtstreeks met de berekende trendwaarden te vergelijken in-
dien:
a de middelste waarneming wordt weggelaten
b de methode van gecentreerde voortschrijdende gemiddelden wordt ge-
bruikt
c er eerst correcties voor het seizoen plaatsvinden
d de toevallige component wordt verwijderd uit de reeks

m3 Een analyse van de omzetontwikkeling van een bedrijf leverde de volgende


vergelijking op voor de maandomzetten:
Y, = 20.000 + 250t, met t = 0 in januari 1998, tin maanden.
De voorspelde omzet voor de maand juli 1999 is dan:
a 20.375
b 21.500
c 24.500
d 24.250

m4 Een student houdt zich bezig met het berekenen van een reeks waarden van
het voortschrijdende gemiddelde voor de dagelijkse slotkoersen van het aan-
deel Philips. Hij gebruikt hiervoor een vijfperiodengemiddelde. Op de
avond van vrijdag 27 september is dit gemiddelde gelijk aan 63,80. Hiervoor
gebruikte hij de koersen 23, 24, 25, 26 en 27 september. Op maandag 30
september is de koers van Philips gelijk aan 65,30. De hiermee te berekenen
nieuwe waarde van het voortschrijdend gemiddelde:
a is gelijk aan 64,10
b moet op de tijdas worden geplaatst op 28 september
c is met deze gegevens niet te berekenen
d komt tot stand indien door zeven wordt gedeeld

159
ms De vraag naar een product wordt voorspeld met de methode van (enkelvou-
dige) exponentiële effening met a= 0,30. In periode 8 was de (berekende)
geëffende waarde gelijk aan 62. Als nieuwe waarneming verscheen in pe-
riode 9 de waarde 66. De nieuwe geëffende waarde in periode 9 is dus:
a 64,8
b 63,2
c 19,8
d 67,2

m6 Een analyse van kwartaalcijfers van de omzet van een bedrijf heeft de vol-
gende trendlijn opgeleverd: Y, = 450 + 20t, met t = 0 in het eerste kwartaal
van 2008, t in kwartalen.
Tevens werden seizoenindices berekend volgens het multiplicatieve model.
Dat leverde: Sr= 1,30, SII = 0,90, Sm= 0,70, Srv= 1,10.
De voorspelling van de omzet voor het laatste kwartaal van 2008 is dus:
a 561
b 463,6
c 583
d 516

DeeiB Openvragen

15.1 Een fabrikant van consumptiegoe-


deren heeft het aantal eenheden dat
hij gedurende acht achtereenvol-
1 250
gende (even lange) perioden heeft
2 310
vervaardigd, weergegeven m een
3 350
tabel. De resultaten waren (zie de
4 390
tabel):
5 440
a Bereken voor de reeks geprodu-
6 520
ceerde goederen een reeks trend-
7 550
waarden met behulp van voort-
8 590
schrijdend gemiddelden die zijn ge-
baseerd op drie perioden.

Antwoord Voor de berekening van het voortschrijdende gemiddelde berekenen we de zoge-


noemde 'drieperiodensom' en we delen deze som door drie.

• • • • •• • •• •• •
Periode(t) Aantal stuks (Y,) 3-per.som V.G.
1 250
2 310 910 303,3
3 350
4 390
5 440
6 520
7 550
8 590

b Bereken een trendlijn met behulp van de methode der kleinste kwadraten.

160 Hoofdstuk 15 Tijdreeksen


Antwoord We zetten een rekenschema op om de sommaties te berekenen die in de normaal-
vergelijkingen moeten worden ingevuld.
Hierbij kiezen we hetnulpuntvan de tijdastussen periode4en s.

!t__ !!1_ t•
250 -3%
310 -2i
350 -1 ~
_ _.
390 2

440 +"'2
520 +1~
550 +2~
590 +3~
Totaal

De normaalvergelijkingen luiden (algemeen):


k Yt = n x a + b x kt
ktYt = a x kt + b x kt 2

Als het nulpunt van de tijdas wordt gekozen in het midden van het totale tijdsinter-
val, dan geldt kt= o.
De normaalvergelijkingen luiden dan:

.. . .. = ...... . en ..... = ..... . .

Ingevuld levert de eerste normaalvergelijking:

a= ...... .

De tweede normaalvergelijking levert:

b = . ...... .

De vergelijkingvan de trendlijn luidt dus:

Y= .. . .. + ..... Xt (t = oin . . .. ...... . ... )

c Voorspel de omvang van de productie voor periode 9 met behulp van de


trendlijn die gevonden is bij vraag b.

Met behulp van de kleinstekwadratenmethode vonden we als vergelijking


van de trendlijn:

Y= ...... . .

Voor periode 9 moeten we invullen t = ...... .


We vinden dan als voorspelde productieomvang voor periode 9:

Y9= ...... .

Deel B Open vragen 161


15.2 De omzetcijfers van een onder-
neming vertonen een duidelijk
Jaar Kwartaal
seizoenpatroon. Om de seizoen-
componenten te kunnen berekenen,
2008 36
11
42
-11146 IV
30
bepalen we eerst een serie uitkom-
2009 32 46 54 38
sten van het voortschrijdende ge-
2010 36 52 60 44
middelde. Daarna berekenen we de
seizoencomponenten volgens de ad-
ditieve methode.
De omzet (x € mln) per kwartaal was als volgt (zie de tabel):
a Bereken een reeks trendwaarden met de methode van de voortschrijdende
gemiddelden.

Antwoord Omdat we hier een voortschrijdend gemiddelde over vier perioden moeten bereke-
nen (een jaar bestaat uitvier kwartalen), moeten we de berekening opzetten zoals in
de volgende tabel is weergegeven.

Periode Omzet(Y) 4-periodensom S-periodensom V.G.


2008 26
11 42
144
lil 46 294 36,75
150
IV 30
2009 I 32
11 46
111 54
IV 38
2010 36
11 52
lil 60
IV 44

b Bereken de afwijking die de waargenomen omzetbedragen vertonen ten op-


zichte van de trend.

Antwoord We brengen de waargenomen omzetbedragen en de berekende uitkomsten van het


voortschrijdend gemiddelde in een schema over:

Periode Omzet(Y) V.G. Y-V.G.


--
2008 111 46 36,75 9,25
2008 IV 30
2009 I 32
2009 11 46
2009 lil 54
2009 IV 38
2010 36
2010 11 52

162 Hoofdstuk 15 Tijdreeksen


c Bereken met behulp van de onder b berekende resultaten de seizoen-
componenten door toepassing van het additieve model.

Antwoord

Jaar Kwartaal
IJ 111 IV
2008 9,2S
2009
2010
Gemiddeld

De somvan de gemiddelden uit voorgaande tabel bedraagt:

.......... + .......... + .......... + .......... = .... .

De som van deze gemiddelden dient uitte komen op o.


De gecorrigeerde seizoencomponenten zijn dus:

5, = ..... 5 11 = ..... 5 111 = ..... en 5 1v = .....

- In een winkel is het aantal verkochte eenheden bijgehouden van een onlangs
geïntroduceerd merk aftershave. In de volgende tabel zijn de verkochte aan-
tallen weergegeven voor een periode van tien weken:

Week 1 2 3 4 5 6 7 8 9 10
Aantal Y, 40 4S so ss 60 6S 70 7S 80 8S

a Bereken over de periode van tien weken een reeks van voortschrijdende ge-
middelden die is gebaseerd op k = 3 perioden.
b Als vraag a, maar nu gebaseerd op k = 4 perioden.
Opmerking: In beide gevallen blijkt dat de waarnemingen volledig overeen-
komen met de uitkomsten van de voortschrijdende gemiddelden.

15.4 Het verloop van de prijs van een edelmetaal op de Londense beurs gedu-
rende een bepaalde maand is weergegeven in de volgende tabel:

Goudprijs in$ pertray-ounce

Week1 Week2 Week3 Week4


maandag 332 322 313 302
dinsdag 34S 318 31S 298
woensdag 338 319 312 292
donderdag 328 31S 30S 295
vrijdag 330 308 30S 292

Bereken een reeks trendwaarden gebaseerd op een voortschrijdend gemid-


delde van vijf perioden (dagen). Maak gebruik van Excel.

Deel B Open vragen 163


15.5 Het aantal passagiers dat is vervoerd
door een scheepvaartmaatschappij is
Jaar lste halfjaar 2de halfjaar
weergegeven in de volgende tabel:
2003 212 316
Bereken een reeks trendwaarden
2004 240 350
gebaseerd op een voortschrijdend
2005 288 396
gemiddelde van twee perioden.
2006 342 464
2007 406 504
2008 448 550

- De omzet van een bedrijfheeft zich de afgelopen maanden als volgt ontwik-
keld (x € 1 mln):

Jan. Feb. Mrt. Apr. Mei Jun. Jul. Aug.


20 18 30 29 32 28 30 31

a Pas op deze reeks exponentiële effening toe. Kies a= 0,3.


b Geef commentaar op de gebleken aanpassing van de geëffende reeks bij de
oorspronkelijke waarden.
Hoe zit dat bij een keuze van a = 0,1?
c Hoeveel gewicht heeft de uitkomst van januari nog in de geëffende waarde
van mei bij a = 0,1?
d Plaats de uitkomsten van vraag a en b in één grafiek.

- Voor een tankstation zijn in de volgende tabel de benzineprijzen vermeld,


telkens per einde van de maand:

Jan Feb Mrt Apr Mei Jun Jul Aug Sep Okt Nov Dec
Prijs 1,32 1,38 1,36 1,44 1,42 1,43 1.37 1,42 1,46 1,48 1,52 1,53

Bereken op basis van deze gegevens een trendlijn voor de maandelijkse


benzineprijzen op basis van de kleinstekwadratenmethode. Voorspel hier-
mee de bezineprijs voor januari van het nieuwe jaar.

15.8 Maak gebruik van de waargenomen gegevens van het tankstation van
vraag 7.
a Bereken hiervoor een reeks voortschrijdende gemiddelden gebaseerd op 5
perioden.
b Bereken voor de reeks gegevens uit vraag 7 een serie trendwaarden met be-
hulp van exponentiële effening (a= 0,4).
c Voorspel op basis van de resultaten van vraag b de benzineprijs voor januari
van het nieuwe jaar.

164 Hoofdstuk 15 Tijdreeksen


15.9 Een boekhandel verkoopt een week-
blad dat kort tevoren op de markt is
Week Aantal verkochte exemplaren
verschenen. In een aantal opeenvol-
1 50
gende weken is het aantal verkochte
2 58
exemplaren geteld (zie de tabel).
3 59
a Bereken een trendlijn met behulp
4 63
van de methode der kleinste kwa-
5 69
draten (kies t = 0 in de vijfde week).
6 75
b Werk de onder a gevonden vergelij-
7 76
king zodanig om dat geldt: t = 0 in
8 80
week 1.
9 82

15.10 De trendlijn van de omzet van een


handelaar in olieproducten wordt weergegeven door de volgende vergelij-
king: T, = 1.200.000 + 200.000t. T, is het aantal euro's per kwartaal. Hierbij
geldt t = 0 in het eerste kwartaal van 2008, t in jaren.
a Bereken de trendwaarden voor alle kwartalen van 2008 en 2009.
b De tijdreeks vertoont een additief seizoen patroon.
De seizoencomponenten zijn respectievelijk S1 = 100.000, Sn= 20.000,
Sm= - 80.000 en S1v =- 40.000. Bereken voor alle kwartalen van de jaren
2008 en 2009 omzetvoorspellingen waarin de seizoencomponenten zijn ver-
werkt.

Van hotel 'Sammerdriem' in Zand- Kwartaalomzetbedragen en trendcijfers


voort zijn in de volgende tabel de (beide x € 10.000) van hotel Sammerdriem
kwartaalomzetbedragen (in tiendui- in Zandvoort
zenden euro's) gegeven. In het
Omzet Trend
vierde kwartaal van 2005 was de
2004 118
omzet nul, omdat het hotel wegens
237
verbouwing was gesloten. De eige-
425 236
naar heeft in december 2005 een in-
165 236
tensieve promotiecampagne gehou-
2005 117 235
den om de omzet vanaf de herope-
235
ning op 1 januari 2006 blijvend te
422
vergroten. In de tweede kolom van
0
de tabel staan de trendcijfers, bere-
2006 127
kend met behulp van de methode
258
van de voortschrijdende gemiddel-
472 262
den.
186 265
2007 135 270
a Laat zten hoe men aan het trend-
273 274
cijfer van het eerste kwartaal van
497 276
2007 is gekomen.
195 277
b Leg uit waarom sommige trend-
2008 140 280
cijfers in de tabel zijn weggelaten.
282 283
c Welk model voor het seizoen-
511
patroon lijkt hier het beste?
200
d Bepaal het seizoenpatroon.
e De etgenaar wil kwartaalomzet- Bron: Sammerdriem, 2009

prognoses voor 2010. Ga uit van een

Deel B Openvragen 165


jaaromzet van twaalf miljoen euro en veronderstel dat de trendcijfers voor
2010 constant zullen zijn.
f Zojuist zijn de omzetcijfers van de kwartalen van 2009 bekend geworden:
145, 294, 533 en 208. Corrigeer deze cijfers voor het seizoen.

15.12 In de Oost-Europese republiek Boelravië is sinds 2000 een periode van eco-
nomische ontwikkeling aan de gang. Een van de factoren die als een indica-
tor worden gezien van de gezondheid van de economie is de vraag naar
personenauto's. In volgende tabel is per kwartaal voor een viertal jaren het
aantal verkochte nieuwe personenauto's (x 1 000) aangegeven:

Kwartaallil 104
Kwartaal IV 28 36 50 62

a Bereken voor de gegevens uit de tabel een reeks gecentreerde voortschrij-


dende gemiddelden.
b Men denkt dat het aantal verkochte personenauto's door een seizoenpatroon
wordt gekenmerkt. Onderzoek (en beargumenteer) welk model hiervoor
moet worden toegepast.
c Bereken op grond van de gegevens bij vraag a en de keuze bij vraag b de
seizoenpatronen die de tijdreeks kenmerken.
d Corrigeer de gegevens van alle kwartalen van 2002 en 2003 voor het seizoen
(met behulp van de bij de vorige vraag gevonden resultaten).
e Gebruik de eerder in deze opgave berekende resultaten om een onder-
bouwde voorspelling te maken voor de vraag in het eerste kwartaal van
2004.

15.13 Restaurantketen MacDagobert is beroemd vanwege de Dagobert-hambur-


gers, kortweg Dagobmgers genoemd. Om een restaurant op een juiste ma-
nier dagelijks te kunnen bevoorraden, heeft men het verkooppatroon van de
Dagobmgers geanalyseerd. Hiertoe werden de dagelijkse omzetten voor een
viertal weken bijgehouden. Dat leverde het volgende patroon:

Dag Week1 Week2 Week3 Week4


Maandag 130 150 140 120
Dinsdag 140 160 160 150
Woensdag 160 160 180 180
Donderdag 150 170 160 160
Vrijdag 220 210 230 220
Zaterdag 350 320 360 310
Zondag 180 220 210 230

166 Hoofdstuk 15 Tijdreeksen


Bereken op basis van deze gegevens uit oktober een reeks trendwaarden vol-
gens het voortschrijdende gemiddelde.
b Bepaal de zeven (dagelijkse) seizoencomponenten op basis van het additieve
model.
c Bekend is dat in november de dagelijkse verkopen gemiddeld zo'n 20o/o lager
zijn dan in oktober. Wat voorspelt u voor de dagelijkse verkoop voor de eer-
ste week van november op basis van de resultaten die gevonden zijn bij de
vragen a en b?

15.14 Van een zaak in wintersportartikelen is de volgende tabel met kwartaal-


omzetten opgesteld. In het rechterdeel van de tabel zijn de afgeronde voort-
schrijdende gemiddelden gegeven die bij de gevraagde berekeningen moeten
worden gebruikt:

Jaar Kwartaalomzet Kwartaai-V.G.


11 111 IV I 11 111 IV
- -
2000 810 570 392 519 578 589
2001 848 622 445 566 602 614 626 641
2002 893 695 496 624 656 670 684 697
2003 950 740 545 694 709 724

a Laat zien dat bij deze tijdreeks het additieve model past.
b Bereken het seizoenpatroon.
c Met behulp van de kleinstekwadratenmethode heeft men vastgesteld dat de
trend kan worden geëxtrapoleerd met T, = 481 + 13,45t.
Hierin is t de tijd in kwartalen, met t = 1 in 1999- I.
Geef een raming voor de omzet in het derde kwartaal van 2004.
d Bereken de toevallige afwijkingen.
e Geef een voorspellingsinterval waarbinnen de omzet van het derde kwartaal
2004 met 95 o/o kans zal komen te liggen.

15.15 De omzet van een onderneming is weergegeven door de volgende tijdreeks:

Jaar 2002 2003 2004 2005 2006 2007 2008 2009 2010
Omzet (x € mln) 8 10 10 12 15 20 25 36 38

a Bereken de trendlijn volgens de methode der kleinste kwadraten.


b Bereken een kwadratische curve volgens de methode der kleinste kwadraten.
c Vergelijk in een grafiek de oorspronkelijke gegevens met de twee curven.

Deel B Open vragen 167


15.16 De export van een bepaald ontwik-
kelingsland heeft zich als volgt ont-
Jaar Export
wikkeld (zie de tabel): (x $miljoen)
Bij deze gegevens moet een expo- 2003 1,4
nentiële functie worden aangepast 2004 2,8
(zie hoofdstuk 13 van het theorie- 2005 4,8
boek). 2006 8,3
2007 15,8
2008 27,5

a Bereken de logaritmen van de exportbedragen.


b Bepaal met behulp van de normaalvergelijkingen de coëfficiënten van de
exponentiële functie.
c Geef een voorspelling van de export in 2009.
d Teken een grafiek van de exponentiële functie en geef in dezelfde figuur de
waargenomen uitkomsten aan.

15.17 Bij de Verkeersdienst van de Rijkspolitie wordt de totale lengte van de files
dagelijks berekend. Vervolgens worden die aantallen (van vijf dagen) tot
weektotalen omgerekend. Voor zeven weken werden de volgende resultaten
gevonden:

. .. . . .. .
Week 1 2 3
.. .. .. ..... .
4 5 6
~··

7
lengte file (in km) 330 390 420 450 440 480 500

a Het vermoeden bestaat dat er een duidelijk opgaande trend in het wekelijkse
aantal filekilometers zit. Men wil de filelengte voorspellen voor week 8 en
week 9. We gebruiken hiervoor een trendlijn die is berekend volgens de me-
thode van de kleinste kwadraten.
b Op de verschillende vijf dagen van de week is er een duidelijk verschillend
filepatroon dat wordt beschreven door een multiplicatief seizoenpatroon
waarbij wordt gerekend ten opzichte van een trendwaarde die 20 o/o is
van het berekende weekcijfer. Voor maandagen geldt een 'seizoenindex' van
1,50.
Voorspel het aantal kilometers file op de maandagen van week 8, 9 en 10.
c Verder is er een multiplicatieve toevallige component die wordt beschreven
door een standaarddeviatie van 5 o/o van het (via trend en seizoen bere-
kende) voorspelde aantal.
Geef een 95 o/o-voorspellingsinterval voor het aantal kilometers file op
maandag in week 9.

168 Hoofd stuk 15 Tijdree kse n


15.18 De cursussen van instituut Moltex blijken de afgelopen jaren veel cursisten
te trekken.
Voor de cursus Statistische Toepassingen bijvoorbeeld blijkt het aantal cur-
sisten per maand beschreven te kunnen worden door de volgende trendlijn:

Y= 88 + 1,3t met t = 0 in januari 2006, tin maanden

Het cursistenaantal kent een opvallend multiplicatie[ seizoenpatroon. Voor


de maand mei wordt dit beschreven door een seizoenindex van 1,55, terwijl
voor de maand juni een seizoenindex van 0,65 geldt.
a Geef een voorspelling van het te verwachten aantal cursisten in mei 2008 en
in juni 2008.
b Naast een seizoencomponent is er ook nog een toevallige component aan-
wezig. Deze wordt weergegeven als een standaarddeviatie en bedraagt 6%
van het te verwachten aantal cursisten. De aldus ontstane kansverdeling mag
men als een normale verdeling beschouwen. Bereken hiermee een 95 %-
voorspellingsinterval voor het aantal cursisten in de maand mei 2008.
Doe dit ook voor de maand juni 2008.
c Per cursist wordt € 250 cursusgeld betaald. Geef een 95 %-voorspellings-
interval voor de totale omzet in de maanden mei en juni 2008. Ga er hierbij
van uit dat de toevallige afwijkingen in die twee maanden onderling onaf-
hankelijk zijn.

15.19 Open in Excel het bestand 'MULTIFooo'.


a Bereken een trendlijn door (lineaire) regressie toe te passen met de tijd als
verklarende variabele.
b Gedacht wordt dat een exponentiële curve wellicht beter past bij de gege-
vens. Voer de hiervoor benodigde transformatie uit en bereken vervolgens
de gewenste curve.

15.20 Het aantal nieuwe abonnees per maand bij een internetprovider is voor een
periode van veertien maanden weergegeven in de volgende tabel:

Maand Aantal Maand Aantal


1 2245 8 3819
2 2 581 9 4180
3 2712 10 4276
4 3003 11 4522
5 3 217 12 4698
6 3366 13 4934
7 3412 14 5160

Maak een Excelbestand van deze gegevens.


a Bepaal met deze gegevens een trendlijn van het aantal maandelijkse nieuwe
inschrijvingen. Doe dit met het Excelprogramma.
b Geef op basis van de trendlijn voorspellingen voor maand 15 en 16.

Deel B Open vragen 169


15.21 Een voorraadmanager in een magazijn houdt de dagelijkse vraag naar een
bepaald onderdeel bij. Voor achttien achtereenvolgende productiedagen be-
droeg die vraag:

Dag Vraag Dag Vraag Dag Vraag


1 44 7 so 13 ss
2 S3 8 S2 14 S8
3 48 9 4S 1S S4
4 40 10 44 16 63
s 47 11 61 17 64
6 S9 12 S1 18 S7

Maak een Excelbestand van deze gegevens.


a Bereken met behulp van Excel een reeks van voortschrijdende gemiddelden
gebaseerd op k = 4 perioden. Gebruik hierbij het 'zwevende gemiddelde' uit
het menu 'Gegevensanalyse' (zie hiervoor ook enkele opmerkingen in het
theorieboek, subparagraaf 15.4.2)
b Gebruik de uitkomsten van het voortschrijdende gemiddelde steeds als de
voorspelling van de vraag voor de eerstkomende periode.
c Hoe groot is de gemiddelde absolute voorspelfout over de laatste 6 dagen?

15.22 In de aanloop naar de gemeenteraadsverkiezingen houdt een bureau voor


opinieonderzoek wekelijks een enquête door middel van straatinterviews.
Voor de partij Roerig Rotterdam wordt zodoende wekelijks het percentage
aanhangers gepeild. Voor de twaalf weken voorafgaand aan de verkiezingen
waren de resultaten als volgt:

Week 1 2 3 4 5 6 7 8 9 10 11 12
%aanhangers 6,8 7.4 7,6 8,S 8,9 10,3 9.4 8,8 8,0 7,7 8,2 7,9

Maak een Excelbestand van deze gegevens.


a Maak van deze reeks een geëffende reeks met effeningscanstante a = 0,3.
Gebruik hiervoor het 'Exponentiele Demping' uit het menu 'Gegevensana-
lyse'. Zie hiervoor ook enkele opmerkingen in het theorieboek in sub-
paragraaf 15.4.2 (let op: de dempingsfactor is dan 0,7).
b In week 13 worden de officiële verkiezingen gehouden. Welke uitslag voor-
spelt u voor Roerig Rotterdam na het bekend worden van de peiling in week
12?
c Voer nogmaals de effening uit, nu met a = 0,50. Welke methode geeft de
kleinste gemiddelde voorspelfout: a = 0,3 of a= 0,5? (Hierbij geldt dus de
veronderstelling dat de laatst geëffende waarde steeds als voorspelling wordt
gebruikt voor de eerstvolgende periode.)

170 Hoofdstuk 15 Tijdreeksen


15.23 Open in Excel het bestand 'MULTIFooo'.
a Bereken volgens de in het theorieboek aangegeven werkwijze een reeks
voortschrijdende gemiddelden van de omzet.
b Bereken op basis van deze voortschrijdende gemiddelden een trendlijn.
c Analyseer met de bij vraag b gevonden trendlijn de seizoenafwijkingen op
basis van het multiplicatieve model.
d Voorspel op basis van de resultaten bij vraagben c de omzet voor de eerst-
volgende vier kwartalen.

Deel 8 Openvragen 171


...•
.
16 Gemeng de opgaven

16.1 Gegeven is de volgende indeling


van 100 landbouwbedrijven naar
Hectaren Aantal
bedrijfsgrootte:
0-< 1 4
a Teken hiervan een histogram.
1-< 5 20
b Teken een frequentiepolygoon.
5 -< 10 40
c Teken de cumulatieve frequentie-
10 -< 15 15
curve.
15 -< 30 15
d Schat met behulp van de cumula-
30 -< 50 60
tieve frequentieverdeling beneden
Totaal 100
welke waarde x midden 50 o/o van de
waarnemingen valt.

16.2 De weeklonen van een bedrijf met


200 werknemers zijn weergegeven in
de volgende frequentieverdeling (zie Loon in euro per week Aantal
de tabel): 300 -< 3 50 25
350 -< 400 40
a Teken een histogram van voor-
400-< 450 60
gaande verdeling.
450 -< 550 30
b Bereken het rekenkundig gemid-
delde en de standaarddeviatie. 550 -< 750 30

c Wat gebeurt er met het rekenkundig 750 -< 1.000 15

gemiddelde en de standaarddeviatie Totaal 200

indien alle arbeiders een loonsver-


hoging van 2 o/o krijgen?
d Wat gebeurt er met het rekenkundig gemiddelde en de standaarddeviatie in-
dien iedereen een verhoging van € 10 per week krijgt?

16.3 Voor een etentje zijn zes echtparen uitgenodigd.


De genodigden nemen plaats aan een lange tafel met zes plaatsen aan elke
kant.
a Op hoeveel manieren kunnen de gasten aan de tafel worden gerangschikt?
b Als we aannemen dat een man niet naast of tegenover een andere man mag
zitten, hoeveel volgorden zijn dan mogelijk?
c Als we aannemen dat van elk echtpaar man en vrouw naast elkaar zitten,
hoeveel mogelijkheden zijn er dan als mannen en vrouwen om en om zit-
ten? Hoeveel mogelijkheden zijn er als mannen van verschillende echtparen
eventueel naast elkaar mogen komen te zitten?

172
16.4 Een textielfabrikant produceert lakens die op grond van eventuele weef-
fouten in drie kwaliteitscategorieën worden ingedeeld.
Op grond van ervaring zijn de kansen bekend dat een willekeurig laken in
categorie A, B of C valt. Deze kansen zijn:

Categorie A 8 C
Kans op laken in categorie 0,8 0,1 0,1

a Hoe groot is de kans dat drie willekeurige lakens allemaal van kwaliteits-
klasse A zijn?
Hoe groot is de kans dat er twee van categorie A zijn en dat er een van cate-
gorie Bis?
b De verkoopprijzen van de drie soorten lakens A, B en C bedragen per laken
respectievelijk € 20, € 15 en € 10. Per week worden 5 000 lakens geprodu-
ceerd. Hoe groot is de te verwachten omzet?
Hoe groot is de standaarddeviatie van de omzet per week?
c De fabrikant wil zijn fabricageproces --------...
verbeteren. De kosten hiervan be-
dragen € 1 per laken. Bij het verbe- Categorie A 8 c
terde fabricageproces bedragen de Kans 0,9 o,o5 0,05
kansen per kwaliteitsklasse (zie de
tabel):
Is genoemde maatregel verantwoord?

16.5 Het gewicht van pakken hondenvoer is normaal verdeeld met fl = 503 gram
en0"=10.
a Hoe groot is de kans dat een pak minder dan 500 gram voer bevat?
b In een doos gaan twaalf pakken. Hoe groot is de kans dat een doos minder
dan 12 X 500 gram bevat?
c Een doos bevat n pakken. Bepaal n zodanig dat de kans om niet aan de
gewichtseis te voldoen minder dan 1 o/o bedraagt voor de doos.

16.6 Drie skiërs, A, B en C, doen mee aan een wedstrijd skispringen.


A heeft 95 meter gesprongen.
Uit ervaring is bekend dat de lengte van de sprongen van B normaal is ver-
deeld met fl = 100 men fT= 12 m.
De sprongen van C zijn normaal verdeeld met fl = 90 m en fT= 5 m.
B en C moeten nog springen.
a Hoe groot is de kans dat A winnaar wordt?
b Hoe groot is de kans dat A tweede wordt?
c Hoe groot is de kans dat C verder springt dan B?

16.7 Voordat een afnemer een grote partij goederen koopt bij een fabrikant,
neemt hij een keuringsmonster.
De afnemer besluit 60 artikelen te keuren.
Als er meer dan drie ondeugdelijke exemplaren in het keuringsmonster aan-
wezig zijn, zal hij de partij niet aanschaffen.

Hoofdstuk 16 Gemengde opgaven 173


a Bereken de afkeurkansen voor partijen goederen met een aantal defecten
van 1%, van 2!% en van 5 %.
b De afnemer besluit de keuring voortaan in fasen te verrichten. Als er bij de
eerste 30 exemplaren geen foute exemplaren worden aangetroffen, zal hij de
partij goedkeuren. Bereken de kans dat een partij met 5% defecten geen
fout exemplaar laat zien in een steekproef van 30 stuks.
c De afnemer wil een partij met 4% defecte exemplaren nog nét wel hebben,
maar een partij met een hoger percentage defecte exemplaren niet. Hij
neemt een steekproef van 400 stuks. Hoe liggen de afkeurkansen in dit geval
indien er wordt afgekeurd bij een keuringsgrens van 22 (dat wil zeggen, 23
defecten of meer leiden tot afkeuren)? Bekijk hierbij een partij met precies
4% en een partij met precies 5% defecte exemplaren.

16.8 Een enquête onder 1000 gezinnen bestaande uit een echtpaar en twee niet-
verdienende kinderen leverde de volgende resultaten:
- Het gemiddelde besteedbare inkomen van de 1 000 gezinnen bedroeg
€ 28.560, de standaarddeviatie van de inkomens bedroeg € 4.175.
Van de gezinnen hadden er 187 geen auto.
- Bij een steekproefvan 100 gezinnen waren er 30 waarbij zowel de man als
de vrouw een volledige baan had.

a Geef een 99 %-schattingsinterval voor het gemiddelde inkomen van de hier-


voor gekarakteriseerde populatie van gezinnen.
b Geef een 99 %-schattingsinterval van de fractie gezinnen zonder auto in de
populatie.
c Geef, op grond van de steekproef van 100 stuks, een 95 %-betrouwbaarheids-
interval voor de fractie gezinnen waarbij zowel de man als de vrouw werkt.

16.9 Het aantallampen van straatlantaarns dat per etmaal stukgaat in een bepaalde
wijk van Utrecht is een variabele met een paissouverdeling met fJ = 1.
a Bereken de kans dat er in een etmaal meer dan drie lampen uitvallen.
b Eenmaal per week worden de defecte lampen vervangen door nieuwe lam-
pen. Hoe groot moet de voorraad nieuwe lampen minimaal zijn om met
minstens 98% kans alle defecte exemplaren te kunnen vervangen?
c Op zekere dag worden alle lampen vervangen door lampen van een ander
merk. In een periode van 30 dagen blijkt nu dat achttien lampen stuk zijn
gegaan. Toets of het aantal uitgevallen lampen significant verschilt ten op-
zichte van het verwachte aantal uitvallers bij het vorige merk (a = 0,05).

16.10 Een groep van 400 studenten is aan het eind van het eerste studiejaar ge-
vraagd of zij tevreden zijn over hun studiekeuze. Als oordeel zijn drie ant-
woorden mogelijk, namelijk enthousiast, onverschillig en teleurgesteld. Er
worden vier groepen studierichtingen onderscheiden, namelijk (1) exact, (2)
taalkundig, (3) medisch en (4) economisch.

174 Hoofdstuk 16 Gemengde opgaven


De antwoorden zijn weergegeven in de volgende tabel:

Oordeel Studierichting
Exact Taal Medisch Economisch Totaal
Enthousiast 50 30 40 30 150
Onverschillig 5 35 15 105 160
Teleurgesteld 25 15 5 45 90
Totaal 80 80 60 180 400

Toets of de studentenoordelen samenhangen met het type studierichting


(kies a= 0,01).

16.11 Bij een onderzoek naar operatietechnieken werden 400 oogoperaties gedaan.
Bij 200 operaties werd nylondraad als hechtingsmateriaal gebruikt, terwijl
bij de andere 200 operaties zijdedraad werd gebruikt. Bij elke operatie werd
door middel van loting vastgesteld welk type draad gebruikt zou worden. Bij
de nylondraadoperaties kregen 32 patiënten naderhand problemen. Bij de
zijdedraadoperaties ontstonden bij 48 patiënten problemen. Toets of er een
significant verschil is in de fractie operaties met problemen bij de twee
hechtingstechnieken (kies a= 0,05, toets tweezijdig).

16.12 Een bedrijf heeft een vulmachine in gebruik waarmee een product in 1 kg-
pakken wordt verpakt.
Er bereiken het bedrijf nogal wat klachten over onvoldoende gewicht aan
product in de 1 kg-pakken. Daarom wordt besloten een uitgebreid onder-
zoek te doen naar de werking van de vulmachine.
Dit leverde als resultaat dat het vulgewicht als een normaal verdeelde varia-
bele mag worden beschouwd. Het bleek dat de machine op een aanvaard-
baar gemiddelde was afgesteld ( 1 020 gram), maar dat de standaarddeviatie
van de vulgewichten nogal groot was, namelijk 25 gram. Het bedrijf besloot
daarom op zoek te gaan naar een nauwkeuriger vulmachine.
a Het bedrijf krijgt een vulmachine aangeboden waarvan wordt gesteld dat
deze nauwkeuriger werkt. Om dit te controleren, werden tien proefpakken
gevuld. De vulgewichten waren: 1022, 1026, 1030, 1005, 1016, 1018, 1014,
1010, 1035 en 1024.
Toets of de variantie significant lager is dan bij de oude vulmachine (toets
eenzijdig, kies a= 0,05).
b Geef een 95 %-betrouwbaarheidsinterval voor de variantie van de nieuwe
machine.
c Het bedrijf biedt nog een tweede model vulmachine aan waarvan wordt ge-
steld dat deze nauwkeuriger werkt dan het bij vraag a genoemde apparaat.
Hierbij werden acht verpakkingen als proefexemplaar gevuld. De vul-
gewichten waren: 1025, 1018, 1 023, 1020, 1015, 1 022, 1 017 en 1 020.
We willen de variantie voor de machine van vraag a vergelijken met het
tweede model. Toets of deze verschillend zijn (kies a= 0,05).

Hoofdstuk 16 Gemengdeopgaven 175


16.13 Op een aantal proefakkers is het verband onderzocht tussen de opbrengst
van de oogst en de hoeveelheid kunstmest die is gebruikt.
De resultaten waren als volgt (opbrengst in tonnen, kunstmest in kilogram-
men):

Akker 1 2 3 4 5 6 7 8
Opbrengst 38 40 44 47 52 35 46 sa
Kunstmest 8 8 10 12 15 9 12 14

a Bereken de regressielijn volgens de methode der kleinste kwadraten.


b Voorspel de opbrengst van een akker waarbij 13 kg kunstmest is gebruikt.
c Bereken de correlatiecoëfficiënt.
d Bereken de variantie van de storingsterm.
e Voorspel de opbrengst van een akker waarbij 13 kg kunstmest is gebruikt
door middel van een 95 %-betrouwbaarheidsinterval.

16.14 Het totaal aantal vakantiegangers dat het Oostenrijkse stadje Saalbach heeft
bezocht, wordt per halfjaar gepubliceerd.
De gegevens over een periode van tien jaar zijn (aantallen X 1 000):

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
Winterseizoen (6 mnd.) 150 180 220 240 284 272 308 320 268 400
Zomerseizoen (6 mnd.) 50 72 104 118 146 150 210 224 246 260

a Bereken de trend van deze reeks met behulp van de methode der voort-
schrijdende gemiddelden.
b Bereken het seizoenpatroon volgens het additieve model.
c Combineer de seizoencijfers tot jaarcijfers. Bereken hiervoor een lineaire
trendlijn.

176 Hoofdstuk 16 Gemengde opgaven


17 Werken met
gegevensbestanden

Het gebruiken van de computer bij het verwerken en analyseren van gege-
vens is tegenwoordig een belangrijk onderdeel binnen de statistiek. Er zijn
allerlei softwarepakketten waarmee deze werkzaamheden kunnen worden
uitgevoerd.
Wat de toepassing betreft, kunnen we een onderscheid maken tussen het ge-
bruik van de computer voor het verwerken van gegevensbestanden (dat is
waarschijnlijk het belangrijkst) en het gebruik van de computer als 'kans-
rekenmachine' bijvoorbeeld omdat de computer allerlei kansverdelingen
kent of in staat is steekproeven te nemen uit kansverdelingen.
Wie met gegevensbestanden wil werken, krijgt allereerst te maken met de
vraag:
- Werken we met een reeds eerder aangemaakt gegevensbestand, of
- moeten de onderzoeksgegevens nog in de computer gebracht worden in
de vorm van een goed georganiseerd gegevensbestand? In dat geval kan
men de zogenaamde 'data entry' -methoden gebruiken.

We bespreken hier de opbouw van een aantal gegevensbestanden. Sommige


hiervan zijn gefingeerd, terwijl andere bestanden overeenkomen met onder-
zoeksgegevens uit de praktijk. De bestanden zijn:
1 Woningen
2 Koersen
3 Cursus
4 Top 100
5 Architect
6 Bankiers
7 Winkels
8 Multifood

De opbouw van deze bestanden wordt hierna beschreven. Van alle bestan-
den zijn de gegevens verkrijgbaar. Alleen van het eerste bestand, 'Woningen'
beschrijven we ook alle waargenomen gegevens in de tekst.

177
1 Het bestand 'Woningen'

Hierna volgt een collectie gegevens waarop allerlei bewerkingen kunnen


worden toegepast, al dan niet met behulp van de computer.
De gegevens betreffen het totale aanbod van koopwoningen in een ge-
meente, zoals dat op een zekere datum geregistreerd stond bij de gezamen-
lijke makelaars.
Van de 120 aangeboden woningen is een aantal karakteristieken in de vol-
gende tabel opgenomen. Deze zijn als volgt aangegeven:
X 1: wijk, er worden vier wijken onderscheiden (1, 2, 3 en 4)
X 2 : aantal kamers (exclusief keuken, hal, sanitaire ruimten)
X 3 : aantal badkamers met ligbad
X 4 : m 2 grondoppervlak van het aangeboden perceel
X 5 : bouwjaar
X 6 : garage aanwezig? (nee= 0, ja= 1)
X 7 : e.v. aanwezig? (nee= 0, ja= 1)
X8 : vraagprijs

Nr.
~ ~ ~ ~ ~ ~ x.
1 1 3 0 120 1920 0 132.000
2 1 4 0 140 1932 0 0 137.500
3 3 4 0 110 1938 0 1 138.000
4 1 3 1 110 1927 0 0 139.500
5 1 3 0 140 1968 0 1 142.000
6 1 3 0 220 1935 0 0 144.000
7 3 3 1 190 1938 0 0 145.000
8 1 4 0 130 1950 0 0 145.000
9 1 4 0 120 1964 0 1 146.500
10 3 3 0 200 1966 0 1 148.000
11 1 4 0 320 1932 0 0 149.000
12 2 3 1 120 1972 0 1 154.000
13 1 4 1 210 1953 0 1 158.000
14 3 4 0 240 1936 0 0 159.000
15 1 4 0 160 1962 0 0 160.000
16 1 3 0 150 1966 0 1 162.000
17 1 3 0 220 1937 0 0 163.000
18 2 4 0 220 1980 0 1 164.500
19 3 4 1 320 1962 0 1 165.000
20 3 4 0 380 1918 0 0 168.000
21 1 3 0 160 1985 1 1 169.000
22 2 5 1 370 1948 1 0 169.500
23 3 4 0 290 1985 0 1 170.000
24 1 4 0 180 1966 0 1 174.000
25 1 3 1 240 1957 0 1 175.000
26 2 4 0 180 1984 0 1 175.000
27 3 5 0 340 1936 1 0 176.500
28 3 4 1 2 50 1 987 0 1 1 77.000
29 2 4 0 160 1986 0 1 178.000

178 Hoofdstuk 17Hoofdstuk 17 Werken met gegeve nsbestanden


Nr. ~~~ ~ ~ ~ .~ x.
30 2 4 0 180 1981 0 1 178.000
31 3 3 1 260 1957 0 1 182.500
32 1 4 0 290 1932 1 0 184.000
33 3 4 0 380 1972 0 1 185.000
34 1 4 0 190 1972 1 1 186.000
35 2 4 1 170 1978 0 1 187.500
36 2 5 0 190 1982 0 1 187.500
37 1 3 0 420 1920 1 0 189.000
38 1 4 1 220 1988 0 1 189.000
39 2 3 0 280 1976 0 1 195.000
40 2 3 0 850 1934 1 0 197.500
41 2 5 0 460 1952 0 1 198.000
42 1 4 1 240 1982 0 1 212.500
43 1 4 0 250 1983 0 1 215.000
44 2 5 1 190 1984 0 1 219.000
45 2 4 0 240 1982 1 1 219.500
46 3 4 0 420 1956 0 1 225.000
47 1 5 0 700 1926 0 0 228.000
48 2 4 1 260 1985 0 1 229.500
49 3 5 1 460 1972 1 1 230.000
50 2 5 1 230 1987 0 1 232.500
51 1 4 0 980 1920 0 0 235.000
52 2 4 0 180 1976 0 1 239.000
53 4 5 1 330 1975 0 1 247.500
54 3 5 1 360 1974 1 1 247.500
55 1 3 0 670 1985 0 1 252.000
56 2 4 1 250 1988 0 1 259.000
57 2 4 1 280 1988 1 1 262.500
58 1 4 1 220 1977 1 1 265.000
59 3 3 0 350 1965 0 1 265.000
60 4 3 1 1020 1934 0 0 268.000
61 2 5 1 320 1983 1 1 275.000
62 2 4 1 280 1938 0 1 275.000
63 3 5 0 240 1976 1 1 280.000
64 1 5 1 510 1984 0 1 289.000
65 2 4 1 270 1985 1 1 295.000
66 3 4 1 340 1988 1 1 297.500
67 4 6 1 420 1910 0 0 298.000
68 3 5 1 510 1967 1 1 310.000
69 2 5 0 320 1977 0 1 310.000
70 2 6 1 340 1979 0 1 312.500
71 3 5 1 310 1975 1 1 315.000
72 2 5 1 240 1982 0 1 319.000
73 2 6 0 1100 1918 1 0 325.000
74 3 5 1 250 1947 0 1 345.000
75 3 3 1 550 1980 0 1 345.000

Hoofdstuk 17 Werken met gegevensbestanden 179


Nr.
.
x, ~ ~~
. ~ x. ~ x.
~ . .
76 3 6 2 970 1924 1 1 349.000
77 4 6 1 620 1956 1 1 358.000
78 3 5 1 1430 1936 0 0 359.500
79 2 6 1 420 1984 1 1 365.000
80 2 7 2 310 1982 0 1 375.000
81 1 5 1 340 1981 1 1 375.000
82 3 6 1 1600 1930 1 0 389.000
83 4 6 2 530 1936 0 1 390.000
84 2 7 1 360 1985 1 1 395.000
85 3 6 1 720 1937 1 1 420.000
86 3 5 1 290 1982 1 1 425.000
87 4 6 2 420 1978 0 1 447.000
88 4 7 1 840 1936 1 1 465.000
89 4 5 1 1090 1928 0 1 479.000
90 2 6 1 380 1974 0 1 479.000
91 3 6 1 390 1983 1 1 485.000
92 4 7 1 2250 1915 1 0 487.000
93 1 6 1 410 1969 1 1 495.000
94 4 6 2 360 1984 1 1 498.000
95 3 5 2 480 1987 1 1 499.000
96 3 7 1 920 1934 0 1 515.000
97 4 6 2 670 1972 1 1 545.000
98 4 5 2 1540 1920 1 1 549.000
99 3 5 1 810 1962 1 1 565.000
100 4 6 2 1180 1925 1 1 568.000
101 3 6 2 450 1983 0 1 575.000
102 4 7 1 1250 1928 1 1 575.000
103 4 6 1 620 1961 0 1 587.500
104 3 5 1 1510 1938 1 1 595.000
105 4 8 1 1480 1914 1 1 598.000
106 4 7 2 630 1980 1 1 625.000
107 3 5 2 490 1970 1 1 638.000
108 4 8 1 1600 1928 0 1 645.000
109 3 6 2 490 1981 1 1 650.000
110 4 7 1 380 1978 1 1 669.000
111 4 6 1 540 1982 1 1 685.000
112 4 7 1 560 1958 1 1 689.000
113 4 7 2 480 1974 1 1 695.000
114 3 9 1 1800 1936 1 1 745.000
115 3 9 1 1350 1912 1 1 785.000
116 4 8 2 650 1978 1 1 840.000
117 4 7 3 620 1985 1 1 925.000
118 3 8 3 500 1988 1 1 990.000
119 4 12 2 2 250 1910 1 1 995.000
120 4 9 3 1850 1986 1 1 1.200.000

180 Hoofdstuk ! ?Hoofdstuk 17 Werken met gegevensbesta nden


2 Het bestand 'Koersen'

Omstreeks Kerstmis wordt onder beleggingsadviseurs de jaarlijkse


voorspellingscompetitie gehouden. Hierbij is het de bedoeling dat van een
drietal grootheden een prognose wordt gegeven van de waarde die een jaar
later officieel zal worden vastgesteld. Voor n = 60 beleggingsadviseurs is in
het bestand opgenomen de prognose van:
DOLLAR dollarkoers (in euro's)
oLIE de olieprijs (in US $ per barrel)
DOWJONES de stand van de DowJones-index

Als een jaar later de juiste uitkomst bekend is, wordt voor elk van de drie va-
riabelen een prijs uitgeloofd aan de adviseur die de uitkomst het dichtst be-
naderd heeft met zijn voorspelling. Het vermoeden bestaat dat de voorspel-
lingen van de drie variabelen niet geheel onafhankelijk zijn.

3 Het bestand 'Cursus'

In dit bestand zijn gegevens opgenomen die de evaluatie van het verloop
van een cursus beschrijven. Van 50 studenten worden inspanningen, resulta-
ten en meningen vermeld, verdeeld over de volgende variabelen:
STUDENT waarnemingsnummer
CIJFER behaald resultaat op afsluitend tentamen op een schaal van
0-100
UREN aantal uren dat de student heeft gestudeerd naast de colleges
VRGCIJF cijfer van het zogenoemde mid-termtentamen
EVl evaluatie 1: 'De cursus was goed georganiseerd',
helemaal mee oneens - helemaal mee eens
1-2-3-4-5
EV2 evaluatie 2: 'De docent gaf op een inspirerende manier col-
lege',
helemaal mee oneens - helemaal mee eens
1-2-3-4-5
EV3 evaluatie 3: 'De kwaliteit van het studiemateriaal was uitste-
kend',
helemaal mee oneens - helemaal mee eens
1-2-3-4-5
GESLACHT man of vrouw

4 Het bestand 'Top 100'

In het bestand Top 100 worden kenmerken beschreven van de 100 grootste
bedrijven buiten de Verenigde Staten, gemeten naar omzet in 1990. Deze
rangschikking is gebaseerd op een publicatie van het Amerikaanse blad For-
tune. In het bestand treffen we de volgende variabelen aan:
NR90 het rangnummer in 1990
NR89 het rangnummer in 1989
NAAM de naam van het bedrijf
LA Nn het land dat officieel als vestigingsplaats geldt van dit bedrijf

Hoofdstuk 17 Werken metgegevensbestanden 181


INDUSTRIE het type industrie:
1 =chemie
2 =auto's
3 = elektronische apparaten
4 = olie
5 = voedingsmiddelen
6 =machines
7 =ijzer, staal
8 =diversen

OMZET90 de omzet in 1990 (in mln.$)


OMZET89 de omzet in 1989
WINST de winst in 1990
WERKNMR het aantal werknemers per ultimo 1990

5 Het bestand 'Architect'

In het voorjaar vond in Rotterdam de Dag van de Architectuur plaats. Be-


zoekers werden daar door middel van rondritten in staat gesteld het een en
ander te bezichtigen. Arends & Samhoud Dienstenmarketing was met een
aantal enquêteurs ter plekke aanwezig om de bezoekers enkele vragen te stel-
len. Hierna wordt het enquêteformulier letterlijk afgedrukt. De resultaten
zijn te vinden in het bestand 'Architect'. Het bestand bestaat uit de volgende
variabelen met de volgende coderingen:
NUMMER rangnummer
INFO 1 - INFO 9 antwoorden op vraag 1.1 tot en met 1.9
(1 =ja en 2 =nee)
KRANT 1 T/M 3 specifieke antwoord op vraag 1.1
(1 =ja en 0 =nee)
VERZORGD antwoord op vraag 2 (codes 1,2,3)
KAARTPRIJS antwoord op vraag 3 (codes 1,2,3)
PRIJSAANDEEL antwoord op vraag 4 (codes 1,2,3,4,5)
TEVREDEN antwoord op vraag 5 (codes 1,2,3,4,5)
SEXE vraag 6 (codes 1,2)
LEEFTIJD vraag 7 (codes 1,2,3,4,5,6)

Arends & Samhoud


Dienstenmarketing

Goedemorgen/middag meneer/mevrouw! Ik ben ... van Arends & Samhoud


Dienstenmarketing.
Wij zouden u graag een aantal vragen willen stellen over de rondritten op de
Dag van de Architectuur. Zou u hieraan willen meewerken? Het beantwoor-
den van de vragen zal ongeveer drie minuten duren.

182 Hoofdstuk 17Hoofdstuk 17 Werken met gegevensbesta nden


Hoe bent u over deze rondrit geïnformeerd?
NB Enquêteur: meer antwoorden zijn mogelijk; svp alleen de spontane
reacties noteren.
1 0 Uit de krant:
0 Havenloods
0 Het Zuiden
0 Andere, nl. ...
2 0 Affiches in de stad
3 0 Uit de RET Zomerkrant
4 0 Informatiefolder RET
5 0 Via mijn school
6 0 Via het bejaardentehuis
7 0 Via de informatie in de te bezoeken gebouwen
8 0 Van vrienden en/ of bekenden
9 0 Anders, nl. ...
2 Door wie wordt volgens u deze rondrit verzorgd?
NB Enquêteur: keuzemogelijkheden niet opnoemen!
1 ÜRET
2 0 Organisator van de Dag van de Architectuur
3 0 Andere, nl. ...
3 Welk soort kaartje heeft u gekocht?
1 0 kaartje van € 5,-
2 0 kaartje van €7,50
3 0 kaartje van € 12,50
4 Vindt u de prijs van dit kaartje
1 0 te hoog
2 0 hoog
3 0 noch hoog/noch laag
4 0 laag
5 0 te laag
5 In welke mate bent u tevreden over de rondrit?
1 0 zeer tevreden
2 Otevreden
3 0 noch tevreden, noch ontevreden
4 0 ontevreden
5 0 zeer ontevreden
6 Sekse
1 OMan
2 OVrouw
7 Leeftijd
1 0 jonger dan 18 jaar
2 0 18- 25 jaar
3 0 26 - 40 jaar
4 0 40 - 50 jaar
5 0 50 - 65 jaar
6 0 65 jaar en ouder
8 Heeft u nog verdere opmerkingen met betrekking tot dit onderwerp?

Hartelijk dank voor uw medewerking!

Hoofdstuk 17 Werken met gegevensbestanden 183


6 Het bestand 'Bankiers'

Met het oog op een op handen zijnde grondige reorganisatie heeft de


directie van de Amersfoorts-Rosmalense bank besloten het werknemers-
bestand te inventariseren. Van de 80 medewerkers wordt achtereenvolgens
genoteerd:
Nummer waarnemingsnummer
Leeftijd leeftijd van de persoon in kwestie
Niveau opleidingsniveau, onderscheidend:
1 academisch
2 hbo
3 vwo
4 mbo, havo
5 mavo
Functie functie bekleed door persoon in kwestie onderscheidend:
1 directie
2 stafmedewerker
3 administratie
4 baliemedewerker
5 huishoudelijk
Dienstjaren aantal dienstjaren bij de bank
Salaris jaarsalaris (bruto) in duizenden euro's

Uit de gegevens is het een en ander af te leiden over verbanden tussen


opleidingsniveau, functie, leeftijd en salaris.

7 Het bestand 'Winkels'

In een bepaalde plaats is de overheid geïnteresseerd in het welvaren van de


plaatselijke middenstand. Daartoe schakelt zij een onderzoeksbureau in dat
van n = 150 winkels een hoeveelheid gegevens verzamelt die wordt verdeeld
over de volgende variabelen:
Nummer waarnemingsnummer
Branche acht verschillende branches
1 levensmiddelen
2 horeca
3 apotheek/drogist
4 kleding en schoeisel
5 boeken en tijdschriften
6 woninginrichting
7 huishoudelijke artikelen
8 diversen
Omzet '92 jaaromzet in 1992 in guldens (inclusief 18% BTW)
Omzet '91 jaaromzet in 1991 in guldens (inclusief20% BTW)
Winst '92 jaarwinst 1992 (in guldens)
Eigendom de winkelruimte is
1 gehuurd
2 eigendom
Vloer oppervlakte van de winkelruimte in m 2
Huur winkelhuur per jaar (in guldens)
Werknmrs. aantal personen in vaste dienst

184 Hoofdstuk 17Hoofdstuk 17 Werken met gegevensbestanden


8 Het bestand 'Multifood'

Het levensmiddelenconcern Multifood geeft per kwartaal een rapportage


van de bedrijfsomzet. In het bestand zijn deze gegevens opgenomen voor elf
achtereenvolgende jaren. De volgende variabelen zijn gebruikt:
T geeft de tijd aan in de diverse kwartalen;
T = 0 in het eerste kwartaal van 1983
Yt de omzet in kwartaal t
51 = 1 in het eerste kwartaal
= 0 in de drie overige kwartalen
52,53,54 analoog aan 51 voor kwartaal2, 3 en 4

Het bestand kan met name goed worden gebruikt voor het analyseren van
de trendmatige groei van de tijdreeks en het vaststellen van het seizoen-
patroon. Met de gegevens kunnen vervolgens voorspellingen worden bere-
kend vanaf t = 44.

Hoofdstuk 17 Werken metgegevensbestanden 185


...•
.
18 Case-studies

Dit hoofdstuk bestaat uit een vijftal uitgebreide vraagstukken, die we case-
studies hebben genoemd omdat ze telkens betrekking hebben op een heel
scala van problemen binnen één bepaalde organisatie.
Deze case-studies zijn mogelijk nuttig oefenmateriaal bij de voorbereiding
van tentamens, omdat bij de vragen steeds onderwerpen uit diverse hoofd-
stukken van het theorieboek aan bod komen.
Alle zes case-studies zijn gebaseerd op oefen- en tentamenvragen die eerder
werden gebruikt op de Hogeschool 's-Hertogenbosch en de Hogeschool
voor Economie en Management in Utrecht.

1 Bungalowpark 'De Bossche Duinen'*

Het tijdstip van aankomst ~ van huurders bij bungalowpark 'De Bossche
Duinen' is een continue stochast met dichtheidsfunctie:
ix - 2 als 8 ~x~ 10
{
f(x)= - x+3 als 10<x~l2
0
elders

De variabele ~ geeft hierbij het tijdstip op de klok in uren aan. Bijvoorbeeld


x= 9,75 staat voor het tijdstip 9 uur en 45 minuten.
a Bepaal de verdelingsfunctie van de aankomsttijd ~.

Op zekere dag komen voor de 120 aanwezige huisjes 120 nieuwe huurders
aan.
b Hoeveel van deze 120 huurders kan men verwachten tussen 9 en 10 uur?
c De receptie heeft per huurder anderhalve minuut nodig voor inname van
het inschrijfformulier, een eerste registratie en sleutelafgifte. Vanaf welk tijd-
stip verwacht u dat de receptie het tempo van de toestromende gasten niet
meer kan bijhouden? (Aanwijzing: gebruik de grafiek van de dichtheids-
functie.)

De 120 aanwezige huisjes zijn ge-


schikt voor maximaal vijf personen
k 2 3 4 5
per huisje. Het aantal gasten k (in-
P(k) 0,10 0,20 0,50 0,20
clusief de huurder) dat in een va-
kantiehuisje verblijft, heeft kans-
functie (zie tabel):

* J. Derickx, Hogeschool 's-Hertogenbosch

186
d Bereken de verwachtingswaarde van k.
e Bereken de variantie van /s..
f Het bungalowpark heeft een vergunning voor maximaal 500 gasten. Bereken
de kans dat in het bungalowpark te veel gasten verblijven.

Het aantal liters bier ~, dat het parkcafé dagelijks tapt, is normaal verdeeld
met verwachtingswaarde fl = 150 en standaarddeviatie a= 30.
g Hoe groot is de kans dat op een willekeurige dag minstens 100 liter bier ge-
tapt wordt?
h Hoe groot is de kans dat op maandag tot en met donderdag minder bier
wordt getapt dan op vrijdag tot en met zondag?
Het bier wordt bij het café elke maandagmorgen afgeleverd in fusten van 50
liter. De beheerder wil voldoende fusten in voorraad nemen om met 99%
zekerheid aan de vraag van de komende week te kunnen voldoen. Hoeveel
hele fusten dient de beheerder na aflevering op maandagochtend minstens
in voorraad te hebben?

Alle 120 huisjes worden vele maanden van tevoren geboekt door de vakan-
tiegangers. Doordat een aantal huurders annuleert, blijft gemiddeld 8% van
de huisjes onbezet. De huurders die wél komen opdagen, arriveren allemaal
op dezelfde dag en vertrekken twee weken later. Neem aan dat bij elk huisje
(onafhankelijk van de overige) geldt: de kans dat het huisje onbezet blijft, is
0,08.
Bereken met de binomiale formule de kans dat op zeker moment precies
115 van de 120 huisjes bezet zijn.
k Bereken de kans dat in een bepaalde periode minder dan 110 huisjes bezet
zijn.

Huisjes die niet bezet zijn, leveren geen winst op. Daarom overweegt de ei-
genaar van het bungalowpark het volgende:
Hij zal op papier 125 huisjes verhuren en hoopt dat er hiervan uiteindelijk
hoogstens 120 bezet zullen zijn. Komen er toch meer dan 120 huurders, dan
spreken we van 'overboeking'.
Bereken de kans op overboeking.
m De eigenaar besluit op papier n huisjes te verhuren. Hij wil er ook voor zor-
gen dat de kans op 'overboeking' kleiner is dan 0,01. Bereken de maximale
waarde van n.

Met klachten kunnen de tijdelijke bewoners van het vakantiepark terecht bij
de receptie. Het aantal klachten dat daar per dag binnenkomt, heeft een
Poissonverdeling met fl = 1,5.
n Bereken de kans dat op een willekeurige dag precies drie klachten binnenko-
men.
o Bereken de kans dat in een willekeurige week minimaal vijf en maximaal
tien klachten binnenkomen.

Hoofdstuk 18 Case-studies 187


2 Het rekencentrum van de hogeschool*

Een hogeschool bezit twee soorten computersystemen: een groot mainframe


en een aantal netwerken (lokalen), met in elk netwerk vijftien pc's, waarbij
elke pc voorzien is van een aparte printer. Het mainframesysteem is van 'le-
vensbelang' voor deze hogeschool. Het uitvallen van dit systeem betekent
dat binnen deze hogeschool een aantal vitale functies ogenblikkelijk lam
wordt gelegd. Het meest storingsgevoelig is de leeskop van de computer.
Deze leeskop moet regelmatig worden onderhouden. Indien deze leeskop
slecht functioneert, neemt een ingebouwde reservekop het werk automa-
tisch over.
De tijd dat de leeskop na een onderhoudsbeurt storingvrij werkt, is normaal
verdeeld met verwachtingswaarde fl = 1200 uur en u= 200 uur.
De tijd dat de reservekop na een onderhoudsbeurt storingvrij functioneert,
is normaal verdeeld met verwachtingswaarde fl = 800 uur en u= 150 uur.
De genoemde tijden zijn onafhankelijk van elkaar.
a Bereken de kans dat de leeskop na een onderhoudsbeurt minder dan 1 000
uur storingvrij zal werken.
b Men stelt het onderhoud zo lang uit tot beide koppen niet meer werken.
Hoe groot is de kans dat de reservekop langer heeft gewerkt dan de leeskop?
c Bereken de kans dat beide koppen samen minstens 1280 uur (= één leer-
jaar) zullen werken.

Indien bij een onderhoudsbeurt blijkt dat de eerste leeskop nog storingvrij
werkt, is de reservekop niet gebruikt en heeft deze dus geen onder-
houdsbeurt nodig. In alle andere gevallen krijgt de reservekop wél een on-
derhoudsbeurt.
d Men maakt na een onderhoudsbeurt een afspraak voor de volgende onder-
houdsbeurt als de computer een tijd T (in uren) heeft gewerkt. De tijd T
wordt zodanig vastgesteld dat geldt: de kans dat de leeskop na een tijd T nog
werkt, is 25 %.
Bereken de kans dat dan tevens de reservekop een onderhoudsbeurt zal krij-
gen.
e Bereken de kans dat op het afgesproken onderhoudstijdstip beide koppen
niet meer functioneren.

De computerleslokalen met pc's leveren, indien ze worden gebruikt voor on-


derwijs (post-hbo, contract, regulier) een (gemiddelde) winst op van €500
per lokaal per uur. Een niet gebruikt computerlokaallevert per uur een ver-
lies op van € 200.
Het aantal voor onderwijs gevraagde computerlokalen Is_ per uur heeft de
volgende kansverdeling:

k 0 1 2 3 4 5
P(/! = k) 0,05 0,15 0,30 0,25 0,15 0,1

f Bereken de verwachtingswaarde van Is_ en de variantie van Is_.

* J. Derickx. Hogeschool 's-Hertogenbosch.

188 Hoofdstuk 18 Case-stud ies


g Voor het uitprinten op de printers is per leslokaal elk uur van gebruik een
kwart doos printerpapier nodig. De variabele m is het totaal aantal dozen
printerpapier dat in een week ( = 40 uur) nodig is voor de vijf computer-
lokalen. Bereken de verwachtingswaarde en de variantie van m.
h Uiteindelijk besluit men slechts drie computerlokalen in te richten. Bepaal
de verwachte winst per uur bij de inrichting van drie computerlokalen.

Bij het begin van elke dag wordt elke van de 45 pc-printers door de
onderwijsassistent voorzien van een even grote hoeveelheid printerpapier.
De kans dat deze printer in de loop van de dag onbruikbaar wordt omdat
het papier opraakt of omdat het printerlint vervangen moet worden, be-
draagt bij elke printer 15%.
Geef de exacte formule voor de kans dat in de loop van de dag precies vijf
van de 45 printers wegens genoemde oorzaken onbruikbaar worden en be-
reken deze kans.
Bereken de kans dat van de 45 printers in de loop van de dag hoogstens tien
wegens genoemde oorzaken onbruikbaar worden en geef aan om welke re-
den men hierbij gebruik mag maken van een normale benadering.
k Bereken met de tabel de kans dat in de loop van de dag in elk van de drie lo-
kalen minder dan vier printers wegens genoemde oorzaken onbruikbaar
zullen worden.

De leverancier die het mainframe heeft geleverd, verzorgt ook het onder-
houd aan deze computer. Bovendien kan men bij hem een verzekering af-
sluiten die, bij het uitvallen van deze computer door slecht werkende kop-
pen, een standaardbedrag van € 5.000 uitkeert, mits het onderhoud aan het
begin van elk (leer )jaar zal worden verricht. De kans op het uitvallen van de
computer is in dat jaar dan 0,002. Bij deze leverancier hebben 2 300 main-
frame-bezitters een dergelijke verzekering afgesloten.
Bereken de kans dat de leverancier in een (leer)jaar minstens vijf schade-uit-
keringen moet doen.
m Het exploiteren van deze verzekering brengt voor de leverancier jaarlijks een
bedrag van € 5.000 aan kosten met zich mee (die uiteraard door de verzeker-
den moeten worden betaald). Voorts worden bij het herstellen van een ver-
zekerde, uitgevallen computer de herstelkosten à € 500 niet in rekening ge-
bracht (ook dit wordt in de verzekeringspremie verdisconteerd). Hoe hoog
moet de jaarlijkse verzekeringspremie zijn indien de leverancier met hoog-
stens 2% kans verlies wil maken op deze verzekering? Men mag hierbij aan-
nemen dat een computer nooit tweemaal binnen een jaar zal uitvallen.

Het computerlokaal waarin het kleinste aantal lessen is ingeroosterd, kan


door de studenten, op momenten dat er geen les wordt gegeven, als vrije
practicumruimte worden gebruikt. Als een student een computer wil ge-
bruiken en alle computers zijn bezet, kan de wachttijd J; in uren, totdat een
computer voor deze student vrijkomt, worden weergegeven met de dicht-
heidsfunctie:

f(x)=2-2x als O~x~l


elders 0

Hoofdstuk 18 Case-studies 189


n Geef de formule van de verdelingsfunctie van de wachttijd en bereken de
kans dat een student tussen de 20 en 40 minuten moet wachten tot er een
computer vrijkomt.
o Bereken de verwachte wachttijd tot er een computer vrijkomt.
p Welke wachttijd zal een student moeten incalculeren zodat hij na deze
wachttijd met 90 o/o zekerheid een vrije computer zal kunnen gebruiken?
Bereken deze wachttijd in minuten en seconden nauwkeurig.

3 Fun Tours B.V.*

Fun Tours B.V. is een reisorganisatie, gespecialiseerd in pendelbusreizen. Dit


bedrijf wil de nu gebruikte pendelbussen vervangen door een nieuw type.
Elke bus van dit nieuwe type zal eerst 175 000 km worden ingezet op de zo-
genoemde nachtpendels vanaf een collectief vertrekpunt naar het 'verre'
buitenland, en nadien 25 000 km op de aan- en afvoerroutes tussen de
woonplaats van de vakantiegangers en het collectief vertrekpunt.
Daarna is de bus voor de reisorganisatie afgeschreven en zal hij worden ver-
kocht. Uiterst belangrijk hierbij is dat grote schade aan de motor door slij-
tage, bij normaal onderhoud, in de eerste 175 000 km nauwelijks voorkomt.
Het aantal km dat de motor zonder deze grote schade meegaat, zullen we de
levensduur van de motor noemen. Deze levensduur is normaal verdeeld.
De directeur van Fun Tours kan zich uit de statistieklessen van vroeger her-
inneren dat het niet verstandig is een bus aan te schaffen waarvan de motor
een verwachte levensduur van precies 175 000 km heeft. Derhalve besluit hij
te gaan kijken naar een bus van het type XGTI-turbo, waarvan de fabrikant
beweert dat de verwachte levensduur van de motor minstens 250 000 km zal
zijn.
Onlangs is er ook een testresultaat van dit type bus bekend geworden: bij 17
bussen van het type XGTI-turbo vond men respectievelijk de volgende le-
vensduur van de motor (in duizend km):
254 283 227 189 246 294 210 277 252 226 295 224 190 201 277
148 287. Hierbij is L (x i - :X)Z = 29 720.
a Geef een 95 %-betrouwbaarheidsinterval voor de verwachte levensduur.
b Toets met a = 0,05 of de testresultaten reden geven om aan de bewering van
de fabrikant te twijfelen.
c Men wil de verwachte levensduur JA schatten met ~, zodat de fout in de
schatter maximaallOOOO km is. Hoeveel bussen zullen nu nog extra moeten
worden getest, gegeven 95 o/o betrouwbaarheid?
d Neem aan dat de verwachte levensduur van de motor van een bus inderdaad
250 000 km is. Men wenst dat de kans dat een busmotor een kortere levens-
duur heeft dan 175 000 km hoogstens 1 o/o is. Hoe groot mag de standaard-
deviatie in de levensduur dan maximaal zijn?

Ook van de nu nog in gebruik zijnde bussen van het type TGX is destijds
een testresultaat gepubliceerd.
Bij een steekproef van 41 bussen van dit type vond men een gemiddelde le-
vensduur van de motor van x= 224000 km en een steekproefstandaard-
deviatie s = 25 250 km.

* J. Derickx, Hogeschool 's-Hertogenbosch.

190 Hoofdstuk 18 Case-studies


e Toets met a= 0,05 of de nieuwe bussen van het type XGTI-turbo een motor
met een langere levensduur hebben. Men moet er hierbij van uitgaan dat de
standaarddeviaties van de levensduren niet gelijk zijn.

De bussen van het type XGTI-turbo schakelen en sturen aanmerkelijk lich-


ter dan de tot nu toe in gebruik zijnde bussen. Een bekend verschijnsel on-
der buschauffeurs is dat sommigen toch de voorkeur geven aan het wat
zwaarder te bedienen oude model bus. Door middel van een enquête krijgen
100 chauffeurs van Fun Tours de mogelijkheid om hun voorkeur kenbaar te
maken. De resultaten zijn:

Geslacht
Vrouw Man
Voorkeur voor oude model 6 24
Geen voorkeur 8 12
Voorkeur voor XGTI-turbo 26 24

f Toets met a= 0,05 of de kenmerken 'voorkeur' en 'geslacht' bij de 100 bus-


chauffeurs van elkaar afhankelijk zijn. Vermeld tevens waar en om welke re-
den men in de berekening van de nulhypothese gebruik moet maken.

4 Air Brabant*

Een luchtvaartmaatschappij is continu bezig met het onderhoud van haar


vliegtuigen. Bij een onderhoudsbeurt wordt alles onder handen genomen,
onder andere de stoelen.
Een fabriek maakt weefseldoek voor stoeldekken. Ze beweert dat het aantal
fouten in een rol doek van 60 m een poissonverdeling heeft met gemiddeld
1,2 weeffouten in een rol.
a De luchtvaartmaatschappij heeft voor de stoelen uit een bepaald type vlieg-
tuig 100 m doek nodig en bestelt dus een rol van 100 m. Hoe groot is de
kans op hoogstens één weeffout in de rol van 100 m?
b De fabriek van het weefseldoek wil kunnen zeggen dat 95 o/o van de rollen
hoogstens één weeffout bevat. Op welke rollengte moet het weefseldoek dan
worden verkocht?
c In het verleden heeft men ooit de uitspraak van de fabrikant getoetst door
in een steekproef van 120 rollen van 60 m lengte het aantal weeffouten te
beschouwen. De steekproef gaf de volgende resultaten:

Aantal weeffouten o 1 2 3 4ofmeer


Waargenomen frequentie 45 35 25 10 5

Laat aan de hand van een toets zien dat met betrouwbaarheid 95 o/o geldt dat
het aantal weeffouten inderdaad een poissonverdeling heeft met gemiddeld
1,2 weeffouten in een 60 m lange rol.

* R. Lenderink, Hogeschool 's-Hertogenbosch.

Hoofdstuk 18 Case-studies 191


Om veiligheidsredenen dient het profiel van de banden van een vliegtuig
minimaal 3 mm te bedragen. Indien het profiel minder dan 3 mm bedraagt,
wordt de band zonder meer weggedaan.
Bij Air Brabant heeft men onlangs een nieuw type band, de LM-II, getest.
Men kijkt daarbij naar het aantal landingen dat kan worden gemaakt voor
de band vervangen moet worden. Dit aantallandingen is normaal verdeeld.
De testresultaten van de twaalf banden leverden het volgende aantal landin-
gen:

d Geef een 95 %-betrouwbaarheidsinterval voor het verwachte aantallandin-


gen dat met de banden kan worden gemaakt.
e De bandenfabrikant beweert dat de banden ten minste 50 landingen mee-
gaan. Toets met a = 0,05 of er, als gevolg van de testresultaten, reden is om
aan de bewering van de fabrikant te twijfelen.

Bij de onderhoudsbeurt van het vliegtuig worden ook de veiligheidsgordels


onder handen genomen. Bij een bepaalde kracht dienen de riemklemmen te
blokkeren. Men controleert of de riemklemmen nog steeds goed zijn door
uit deze klemmen een steekproef te nemen en te kijken naar de blokkeer-
kracht. Deze blokkeerkracht is normaal verdeeld. Men vergelijkt dit resultaat
met het resultaat van eenzelfde steekproef uit de riemklemmen van een zo-
juist afgeleverd toestel van hetzelfde type. De steekproefresultaten zijn:

...._
...
Oude toestel
. ~

146,8
. . .. . .. . . .. .. .. .....
133,2 145,3 143.5 134.9 157,0
•·

137.4 141,1 131,6 150,0 146,7

... ...... .. ....... . ... .. .. ...... .. .. . .


Nieuwe toestel 141,8 156,1 150,2 153.5 145.3
.

147.4 143,8 149,0 156,7 145,2

f Toets met a = 0,05 of er verschil bestaat tussen de blokkeerkracht van de


riemklemmen van de beide toestellen. Hierbij wordt ervan uitgegaan dat,
vanwege het feit dat de klemmen in beide gevallen uit dezelfde fabriek
komen, de standaarddeviatie van de blokkeerkracht voor beide toestellen
gelijk is.

De luchtvaartmaatschappij heeft enkele nieuwe toestellen nodig voor inter-


continentale vluchten. Twee toestellen worden serieus overwogen: de Airbus
A310 en de Boeing 747-400.
Aan 100 passagiers wordt gevraagd welk toestel hun voorkeur heeft. Van hen
kiest 30 o/o voor de Airbus en 70 o/o voor de Boeing.
g Bereken het 95 %-betrouwbaarheidsinterval voor de werkelijke fractie voor-
standers van de Boeing.
h Hoe groot moet de steekproef onder de passagiers minimaal zijn opdat met
95 %-betrouwbaarheid de maximale fout in de geschatte fractie 3 o/o is?

192 Hoofdstuk 18 Case-studies


Air Brabant weet uit soortgelijke onderzoeken bij andere maatschappijen
dat ten minste 75 o/o van de passagiers de Boeing 747 prefereert. Toets met
a = 0,05 of op grond van de steekproefresultaten kan worden aangenomen
dat ook onder de eigen passagiers ten minste 75 o/o de Boeing 747 verkiest.

Voor het serveren van maaltijden tijdens de vlucht kan Air Brabant kiezen
uit twee leveranciers (1 en 2).
Om deze verpakte maaltijden te testen op houdbaarheid bewaart men gedu-
rende lange tijd en onder gelijke omstandigheden van beide leveranciers een
partij maaltijden. Vervolgens kijkt men welke fractie van elke partij moet
worden afgekeurd wegens een te groot aantal aanwezige bacteriën. Van de
uit 240 maaltijden bestaande partij 1 moesten 96 maaltijden worden afge-
keurd. Bij partij 2, afkomstig van leverancier 2, moesten 144 van de 320
maaltijden worden afgekeurd. De werkelijke (maar onbekende) fracties die
we bij deze test in de populaties hadden moeten afkeuren, zullen we 7T P (le-
verancier 1) en 7T 2 , (leverancier 2) noemen.

j Geef een 95 %-betrouwbaarheidsinterval voor fld = 7T 1 - 7T 2 •


k Men heeft het vermoeden dat bij maaltijden van leverancier 1 het afkeur-
percentage in de populatie lager ligt dan bij maaltijden van leverancier 2.
Dit vermoeden wil men aantonen door middel van een toets. Voer deze
toets uit met a = 5 o/o.

5 Have the guts to go Nuts*

Om de verkoop van Nuts, een candybar van chocolade met een vulling van
hazelnoten of amandelen, te bevorderen, heeft men naast een intensieve
televisiereclame ('Have the guts to go Nuts') een actie opgezet. Tegen inleve-
ring van vijf speciale Nutsactiewikkels kan een muziekcassette worden ver-
kregen. De bedrijfsleiding vraagt zich af hoeveel cassettes voor de actie moe-
ten worden aangeschaft. Teneinde een schatting te kunnen maken van het
percentage Nutsconsumenten dat de actiewikkels zal inleveren, stelt men
een onderzoek in voordat de actie van start gaat. Vijfhonderd aselect geko-
zen Nutsconsumenten worden van de komende actie op de hoogte gebracht.
Aan deze personen wordt gevraagd of ze de actiewikkels van de gekochte
Nutsrepen zouden bewaren om ze tegen een cassette in te wisselen. Van de
ondervraagden gaf 42% hierop een bevestigend antwoord.
a Bepaal een 95 %-betrouwbaarheidsinterval voor de fractie Nutscansurnen-
ten die meedoet aan de actie.
b Als de bedrijfsleiding een 95 %-betrouwbaarheidsinterval voor de bij a be-
doelde fractie wil, dat ten hoogste 0,04 breed is, hoe groot moet de steek-
proef dan zijn?
c Ter wille van de actie worden 100000 Nutsrepen in handige 'five-packs' te
koop aangeboden, zodat de belangstellende consument in één aankoop de
benodigde vijf actiewikkels in bezit krijgt. Bereken- op basis van het resul-
taat bij vraag a - hoeveel cassettes er minstens in voorraad moeten worden
genomen als de bedrijfsleiding de kans op een tekort aan cassettes op hoog-
stens 0,5 o/o wil stellen.

* A. Franzen, HE & M, Utrecht

Hoofdstuk 18 Case-studies 193


De Nutsbedrijfsleiding wil onderzoeken of de promotionele inspanningen
(televisiereclame en de actie ter verkrijging van een muziekcassette) die in
de afgelopen periode zijn gedaan, succes hebben gehad. Uit onderzoek,
voorafgaande aan de promotieactiviteiten, bleek dat 25 o/o van alle Neder-
landse consumenten regelmatig (minstens eens per maand) een Nuts consu-
meert. Er moet door middel van een toets worden onderzocht of dit percen-
tage is gestegen. Kies a = 5 o/o en ga uit van een steekproef van 200 personen.
d Stel een toets op voor voorgaand onderzoek.
e Na het onderzoek bleek: 64 van de 200 aselect gekozen consumenten eet re-
gelmatig een Nuts. Bereken de overschrijdingskans en trek uit deze waarde
een conclusie.
f Bereken het onderscheidingsvermogen van de opgestelde toets bij een
populatiepercentage van 30 o/o.
Geef de betekenis van het berekende getal.
In een steekproef van 120 aselect gekozen Nederlandse consumenten wor-
den de volgende vragen gesteld:
Wat is uw leeftijd?
- Eet u regelmatig (minstens eenmaal per maand) een Nuts?

De resultaten staan in de volgende tabel.

Geen Nutseter 16 33 18 13
Bron: Franz Dean Producties.1993.

g Toets met a = 5 o/o of er statistisch verband bestaat tussen de variabelen leef-


tijd en Nutsgebruik.
h Met een computerprogramma is de overschrijdingskans (de zogenoemde
p-waarde) bij deze toets berekend. Geef op de gok deze kans.

Na uitvoerige analyse blijkt dat het gewicht van een aselect gekozen Nuts bij
benadering normaal is verdeeld met standaardafwijking 0,8 gram. Op de
verpakking van een Nuts staat dat de inhoud 50 gram behoort te zijn.
Als het gemiddelde gewicht in de populatie 51 gram bedraagt, hoeveel pro-
cent van de productie weegt dan minder dan 50 gram?
Als hoogstens 3 o/o van de productie minder dan 50 gram mag wegen, op
welk gemiddeld gewicht (in tienden grammen nauwkeurig) moet de ma-
chine die deNutsrepen produceert, dan worden afgesteld? (Ga ervan uit dat
de standaardafwijking niet is veranderd.)

194 Hoofdstuk 18 Case-studies


Antwoorden

Hoofdstuk 1 Inleiding tot de beschrijvende statistiek


Hoofdstuk 2 Maatstaven voor ligging en spreiding
Hoofdstuk 3 Kansrekening
Hoofdstuk 4 Kansvariabelen
Hoofdstuk 5 Normale verdeling
Hoofdstuk 6 Binomiale verdeling
Hoofdstuk 7 De poissonverdeling
Hoofdstuk 8 Schatten
Hoofdstuk 9 Toetsen
Hoofdstuk 10 De ebikwadraatverdeling
Hoofdstuk 11 Verschiltoetsen
Hoofdstuk 12 Variantieanalyse
Hoofdstuk 13 Regressie en correlatie
Hoofdstuk 14 Indexcijfers
Hoofdstuk 15 Tijdreeksen
Hoofdstuk 16 Gemengde opgaven
Hoofdstuk 17 Werken met gegevensbestanden
Hoofdstuk 18 Case-studies

195
....
1 Inleidingtot de
beschrijvende statistiek

Deel A Antwoorden op de multiplechoicevragen


1 c 4 a
2 d 5 a
3 c 6 d

196
2 Maatstaven voor ligging
en spreiding

Deel A Antwoorden op de multiplechoicevragen

1 c 4 c
2 b 5 c
3 b 6 b

DeeiB Antwoorden op de open vragen

2.1 a 14,25
b 13t
c 12
d 2,975

2.2 a 104 uur


b 11 uur

2.3 a 29,5
b 30

2.4 0,52

2.5 a $3500
b € 3850 en € 2695

2.6 a €48.125 en €40.000


b € 31.666,67 en € 50.000

2.7 a 5,66
b 315,41
c s = €28.312

2.8 a 60, 65,5 en 19,73


b Nieuwe uitkomsten: 70, 75,5 en 19,73
c Nieuwe uitkomsten: 66, 72,05 en 21,71

2.9 a 2,34%
b 3,10%

2.10 a 4
b 0,98

197
2.11 a 110 en 19,32
b 112 en 20,445
c 21,57

2.12 5,105% is de gemiddelde jaarlijkse groei als meetkundig gemiddelde.

2.13 1 op 13,49

2.14 a Nieuw gemiddelde is 127.


b Mediaan blijft 130.
c 5= 26,85

2.15 a 75,71
b 60- < 70
c 78
d 15,73

2.16 b 22,875
c 14,5
d 1572,50 en 870,3

2.17 170, 50, 122 en 280

2.18 xme= 72! Q, =66 Q3 =82


Uitbijters: 26 38 112 126 155 165

2.19 a Voor studenten 62,63 en mediaan 56. Voor afgestudeerden 125,20 en mediaan 99.
b 5= 29,94 en 5 = 77,97
c Zie verder de uitwerking met Q 1 = 37 en Q 3 = 77 voor de studenten en Q, = 70 en
Q 3 = 172 voor de afgestudeerden.

2.20 r= 0,92

2.21 b Y = -130 + 6,4X en 202,8


c r= 0,992

2.22 a 106,96
b 80,82 111 154,85 91,16

2.23 a De gemiddelde code is 1,72. Omdat code 1 staat voor € 5 en code 2 voor € 7,50 zouden
we met enige fantasie (interpoleren) kunnen gokken dat het gemiddelde € 6,80 is.
Bij gebruik van de echte prijzen vinden we € 6,96: logisch want de dure kaartjes leg-
gen nu iets meer gewicht in de schaal.
b Het prijsoordeellijkt veel overeen te komen voor de drie prijsklassen.

2.24 a 194,06 en 166


b 37 500 in winkel132
c 101,25 in winkel 70
d 358,75 in branche 6 (woninginrichting)

198 Hoofdstuk 2 Maatstaven voor ligging en spreiding


2.25 a Japan wint met 28 bedrijven.
b 21375, 15 563. Bereik is wat we spreidingsbreedte (range) noemen.
c 18 352 en 13040 (met weglating van 64: Austrian Industries)
d Bij bedrijf 100 (Smithkline beecham). Gemiddelde is 3,34%.
e 3,33%
f Branchecode 4 (olie)
g Bij branchecode 4 (olie)

2.26 a 155 108,19 81,83 60,18 42,47 totaalgemiddelde 82,44


b 14,92 in groep 3
c 13 + 1,88X

2.27 a 519,5 en 455,20


b 845
c Afgerond 851 937 791 en 813
d 476380 en 246394
e Onjuist. Gemiddelde is 583 (zonder) en 504 (met).

2.28 a 3085 en 431,3


b Mensen met hoge dollarkoers hebben gemiddeld 20,82. Gemiddelde van allemaal is
22,04, dus de bewering klopt.

2.29 a Eindcijfers 64,26 en 15,07; bij vorig cijfer 67,72 en 12,43


b Ja, de groep die zeer tevreden is (code 5) heeft een hoger gemiddeld cijfer dan alle
andere groepen.
c Die relatie is nauwelijks vindbaar (weinig hoge scores op vraag 2).
d Gemiddelden 67,92 (v) en 60,60 (m), standaarddeviaties 15,96 (v) en 13,46 (m).
Bewering als geheel is dus onjuist.

Deel B Antwoorden op de open vragen 199


.• '
.
3 Kansrekening

Deel A Antwoorden op de multiplechoicevragen

1 b 4 c
2 d 5 a
3 c 6 a

DeeiB Antwoorden op de open vragen

3.1 a Bij meisjes zijn er zes volgorden;


bij vijf jongens zijn er 120 volgorden;
bij acht studenten zijn er 40 320 volgorden.
b Bij de jongens zijn er tien groepjes;
bij de studenten zijn er 56 groepjes;
bij de meisjes zijn er drie groepjes.
c Er zijn 56 variaties.

3.2 a P(B) = 0,7


b P(2 ambtenaren)= 0,04
c P(ZnA) = 0,02
P(Z) = 0,075
d P(AIZ) = 0,267

3.3 a 720
b 120
c 15

3.4 a (Ij0 )
b 125000
c 1 838 265 625

3.5 a 24
b 12
c 6

3.6 336

3.7 a {Beleen} {Karen} {Jorien} {Hans} {Paul}


b 26 stuks
c Alle tweetallen, dus tien stuks

200
d 0,10
e 0,60

3.8 a 350
b 0,22857

3.9 a 0,40
b 0,267

3.10 a 0,7 0,4 0,1


b 0 0,38
c 0,6 (complementregel) 0,5 (speciale optelregel)
0,72 (algemene optelregel)

3.11 a 0,54
b 0,259
c 0,68

3.12 a 0,20 0,34 niet onderling onafhankelijk


b 0,529
c 0,225

3.13 a 0,4242
b 0,0808
c 0,5143
d 0,0101

3.14 a 0,49
b 0,44
c 0,13
d 0,462
e Nee
f Ja

3.15 a 0,15
b 0,70
c 0,40
d 0,85
e 0,25

3.16 a 0,32

3.17 a 0,05 0,25 0,167 0,55


b nee
c 0,4739

3.18 a 0,520
b 0,231
c 0,057

3.19 0,0768

Deel B Antwoorden op de open vragen 201


3.20 a 0,270
b 0,216
c 0,676
d 0,720

3.21 a 0,375
b 0,357 en 0,536
c 0,268

3.22 a 0,288
b 0,289

3.23 0,1969
z
3.24 a P(Z) =-
2 N

3.25 a 0,891
b 0,014
c 0,896 (89,6%)

3.26 0,50

3.27 a 0,324
b 0,26
c 0,462

3.28 0,6471

3.29 a 0,135
b 0,04
c 0,31
d 0,871

3.30 a 0,01; 0,46


b 0,324
c 0,24 en 0,52; 0,49; 0,122

3.31 a 0,020485
b 0,024164
c 0,04344
d 0,550711

3.32 a 0,9684
b 0,0312
c 0,09999

202 Hoofdstuk 3 Kansrekening


...• .

.
4 Kansvariabelen

Deel A Antwoorden op de multiplechoicevragen


1 d 4 a
2 c 5 b
3 b 6 c

DeeiB Antwoorden op de open vragen

4.1 a 0,25
b 38,75
c 27,1875
d € 27,81 (afgerond)

4.2 a
16
b ~uur (40 minuten)

c g = 1,553 uur, dat wil zeggen ruim 93 minuten

4.3 a Geval c en d zijn mogelijk.

4.4 b F(lS) = 0,10 F(l6) = 0,40 F(l7) = 0,70 F(l8) = 0,85


F(l9) = 0,95 F(20) = 1
c F(l9)- F(l6) = 0,55
d (0,15)2 = 0,0225
e 0,15 x 0,05 + 0,10 x 0,10 + 0,05 x 0,15 = 0,025

4.5 a 0,1225
b 0,1296
c Leerlingen 2,30 en 1,23;
docenten 2,72 en 0,98

4.6 a 32,5
b 35

4.7 a 0,30 0,85


b 1,80
c 1,435

203
4.8 a 75
b 0,000027
0,614
c 575.000

4.9 a 720 euro en 168 euro


b .J1! = 4,50~- 280. Dus E(.!!!) = 260 euro en a= 126 euro
c 260 ± 2 X 126. Dus de dagwinst zal meestalliggen tussen 8 en 512 euro.

4.10 a 13,6 weken


b 1,24 weken
c 188.000 en 6.200
d 28.500 euro

4.11 a 0,89
b 1,11
c 71,20 en 89
d 28 480 en 1 780
e 75,47 en 94,34

4.12 a 1,45
b Bij 1 apparaat E(m_) =0,80
Bij 2 apparaten m = -8, -2 of +4 E(m_) = -0,50
Bij 3 apparaten m = - 12, - 6 of +6 E(m_) = -3,30

4.13 a 0,90
b 1,29
c 45
d 64,5
e €22.500

4.14 a Alleen geval a voldoet.

4.15 a 0,35
b 0,008
c 0,16
d 0,40
(100 - A)
e
100

25
4.16 a 21· -
2 ' 12

b
25

4.17 a 0,4375
b 0,3634
c 1 minuut 20 seconden

204 Hoofdstuk 4 Kansvariabelen


4.18 a 0,30
b 0,80 en
c 2400,2400 en 1000
d B= 25,5
Y+20
e B=--
2
Als Y > 40 dan B = 30

4.19 595,59

4.20 a 1,55 maanden en 2,83 bezichtigingen


b 0,67
c 0,25, 0,20 en 0,80
d 2,30 maanden en 0,83 maanden

4.21 a 0,70
b E(inflatie) = 7,4% E (groei) = 0,6%

4.22 0,111

4.23 0,25 0,111 0,04

Deel B Antwoorden op de open vragen 205


.....
5 Normale verdeling

Deel A Antwoorden op de multiplechoicevragen


1 c 4 c
2 a 5 c
3 d 6 c

DeeiB Antwoorden op de open vragen

5.1 a P(:lf > 1 800) = 0,0228


b P(l550 < :lf < 1700) = 0,5328
c P(l650 < :lf < 1750) = 0,2417
d P(l570 < ~ < 1630) = 0,8664

5.2 a 0,0475
b 0,0132
c 0,9082

5.3 a 0,0465 0,8686 0,5930


b 0 0,67 (of 0,675) -1,28

5.4 a 0,3632 0,1272 0,8749

5.5 a 4 710 uur


b 0,8145
c 4114uur

5.6 a 83,2
b 95, 105 en 116,8

5.7 a 0,0668
b 152,9 minuten en 166,6 minuten

5.8 a 0,1151
b 510,27

5.9 a 0,3085 en 0,0401


b 50,13 euro
c 51,75 euro

206
5.10 a 0,1587
b 0,0228
c 0,000634

5.11 a 0,0062
b 0,000013
c 0,0787 (na interpoleren)
fl = 8 uur, 7 min. en a= 5,66

5.12 a 0,0668
b 0,1446
c 8 uur en 22 minuten

5.13 a a= 11,9
b Verwaarloosbaar klein

5.14 a 0,0475
b 0,0808
c 0,3658

5.15 a 0,1056
b 10,56%
c 0,0934
d 18,43 euro

5.16 a 126,48 <x< 173,52


b T = 174,66 (met z = 2,055)

5.17 a Met z= 0,875 is de kans 0,1908.


b Met z = -2,055 is de grens 953,40 dagen.

5.18 0,1742 (na interpolatie)

5.19 0,1949 (met) 0,2206 (zonder)

5.20 a 6,03
b 3,48
c 2,01

5.21 a 0,11
b 0,0124

5.22 a 0,1056
b 0,0587

Deel B Antwoorden op de open vragen 207


...•
6 Binomiale verdeling

Deel A Antwoorden op de multiplechoicevragen


1 b 4 d
2 a 5 a
3 b 6 c

DeeiB Antwoorden op de open vragen

6.1 a 0,4096
b 0,3277 0,4096 0,2048 0,0512 0,0064 0,0003
c 0,3156

6.2 a 0,2112
b 0,3430
c 0,0047

6.3 a 0,0173 0,0867 0,1951


b 0,0766
c 3,33

6.4 a 0,2061
b 0,0047
c 0,7216
d 0,7031

6.5 a 0,0913
b 0,0409
c 0,6730

6.6 a 0,2684 0,2013


b 0,20 0,32 0,384 0,4096 0,3355 0,2684

6.7 0,0401

6.8 a 0,5987
b 0,0861
c 0,0375

208
6.9 a 0,9801 0,0197
b 498 x 10-9
c 0,00005

6.10 a 0,2301
b 0,1401
c n = 609 (n = 658 bij toepassing continuïteitscorrectie)

6.11 0,00524

6.12 a Kans 0, dus uitzonderlijk


b 24.000 en 490
c Kosten 1.000, E(opbrengst) = 6.240

6.13 a 5 850 < k < 6 150


b 468 000 < x < 492 000

6.14 a 0,2611
b [156; 204]
c 0

6.15 a 250 en 15
b € 100.000
c 370 ligt 8 maal de standaarddeviatie weg van 250. Dus kans 0.

6.16 a 0,0476
b 0,2765
c 0,2266
d Heeft zeer kleine kans om te komen, dus is ongeloofwaardig.

6.17 0,1335

6.18 0,0485

6.19 a 0,10
b 0,059
c 9

6.20 0,0186

6.21 a 0,1849
b 0,5405
c 0,2642
d 0,87
e 0,50
f 0,5987
g 125,6 gram

Deel B Antwoorden op de open vragen 209


....•
7 De poissonverdeling

Deel A Antwoorden op de multiplechoicevragen


1 d 4 c
2 b 5 d
3 b 6 b

DeeiB Antwoorden op de open vragen

7.1 a 0,0733
b 0,5665
c 0,0996
d 0,0057

7.2 a P(k = O) ifl = 3) = 0,0498


b 0,5768

7.3 a 0,0733
b 0,1042
c 0,5665
d 0,2381
e 0,3631

7.4 a 0,7047
b 0,2466
c 0,0487

7.5 9 stuks

7.6 a 0,3528
b 2
c 1,782
d 0,218

7.7 a 0,0567
b 11,5 uur

7.8 a 0,0335
b 0,0630

210
7.9 a 0,0109
b 0,1099

7.10 a 0,0511
b 0,3185
c 0,0923 0,0094
Met Excel
0,0511, 0,3097, 0,0958, 0,0135

7.11 a 0,6065 0,3033 0,0758 0,0144


€ 1.250
b €60.000 (oud)
€35.000 (nieuw)

7.12 a 0,2650
b 0,2231
c 2,77 uur

7.13 a 0,1912
b 0,1401

7.14 0,6472

7.15 a 0,5768
b 0,4232
c 2,3278 per dag; 698,34 per jaar
d 105,9 extra verhuurdagen, dus niet doen

7.16 a 0,1088
b ruim 0,17
c 7

7.17 a 0,8153
b 0,0668
c Niet invoeren is goedkoper (1,44 tegenover 1,50).

7.18 a 0,0902
b 0,1020
c verdelingsfunctie F(t) = 1- e-o,sr (tin weken)
d ruim 232 uur (9 dagen, 16 uur)

7.19 a 0,1353
b 0,0203

7.20 a 0,0993
b F(x) = 1 - e- .'ö xvoor x;;;;o
c 10 en 100
d 0,1587

Deel B Antwoorden op de open vragen 211


.....
8 Schatten

Deel A Antwoorden op de multiplechoicevragen

1 d 4 a
2 c 5 c
3 a 6 b

DeeiB Antwoorden op de open vragen

8.1 a 20,1028 < fl < 20,1812 (in kg)


b 20,0904 < fl < 20,1936 (in kg)
c n~385

8.2 a x = 40,4
b 52= 7,05
c 38,50 < fl < 42,30

8.3 13,89 < fl < 15,81

8.4 a 34,04 < fl < 37,96


b 35,216 < fl < 36,784
c 32,08 < fl < 39,92

8.5 a 125,63 ± 2,08 levert


123,55 < fl < 127,71
Dus fl = 130 wordt verworpen.
b n ;;3 139

8.6 a 0,1243
b 12,29 < fl < 13,31 kg
c 0,0156 0,0390 0,0054

8.7 0,337 < 7r < 0,463

8.8 a 0,083 < rr < 0,117


b 0,085 < 7r < 0,113. Alle dagen tellen even zwaar mee.
c 0,10 < 7r < 0, 11. Alle tegels tellen even zwaar mee. Bij deze opzet krijgt dag 4 relatief
meer gewicht dan bij vraag b.

8.9 0,055 < 7r < 0,241

212
8.10 a n = 153, met de normale verdeling
b 23,97% en 34,83%
Bekeuringen tussen 9,39% en 15,87%.

8.11 15,5 < fl < 17,8

8.12 a 1291
b 71
c 542
d Dus met n = 1291 wordt aan alle drie vereisten voldaan.

8.13 nË:;; 662

8.14 a 0,8584 < 1T < 0,9416


b 3458

8.15 n;:;;. 385

8.16 a X= 6,694 en s = 3,192


b 4,99 < fl < 8,39
c 257 minuten, dus 5 medewerkers

8.17 a s 2 = 17
b 81,39 < fl < 90,61

8.18 197,63 < fl < 226,37

8.19 a s = 7,3978
b 20,3 < fl < 29,7
c 25,6 fl < 28,4 met t = 1,987 of 25,7 < fl < 28,3 met z = 1,96
d n ;:;;. 211

8.20 a 32,28 < fl < 36,12 met de normale verdeling


b 554- 150 = 404 extra waarnemingen
c 0,413 ± 0,056 levert 0,357 < fl < 0,469

8.21 a 140,42 <fl < 151,58


119,36 < fl < 172,64

Deel B Antwoorden op de open vragen 213


9 Toetsen

Deel A Antwoorden op de multiplechoicevragen


1 c 4 b
2 a 5 a
3 b 6 a

DeelS Antwoorden op de open vragen

9.1 Z= {kjk~41} De campagne heeft gewerkt.

9.2 a Z= {xlx> 159,32}


b P(~ < 159,32) = 0,0038

9.3 a Z= {xjx > 66,45}


Z={xjx>73,3}
b Z= {xjx > 51,28}
Z= {xjx > 53,08}

9.4 De fabrikant heeft ongelijk.

9.5 Z= {xjx > 5,2025}, dus H 0 verwerpen.

9.6 a 0,0076 kans, dus 0,76%


b Z={xjx<4,9226 of x>5,0774}, dusH0 verwerpen.
c 25,14%

9.7 a Zeer significant


b Ook zeer significant

9.8 Z= {pjp :S 0,4788} dusH0 verwerpen.

9.9 a 3879 < k < 7641


b gegeven fi = 25 per 100000 is 36 significant hoger.

9.10 Z= {xjx > 50,88}, dus H 0 niet verwerpen.

9.11 z* = -4,9, dus p < 0,001, dus significant.

9.12 a 12,21 < fi < 17,79


b H 0 wordt verworpen.

214
9.13 a s = 0,909
b 5,95 ± 0,43 levert 5,51 < f1 < 6,37
c Bij een eenzijdige toets met t = 1,73 vinden we als kritieke grens 5,35. Dus Ha wordt
verworpen.

9.14 a Ha verwerpen, 124 zit in Z


b 98,40 < f1 < 149,72 (met t-verdeling!)

9.15 a Bij f1 = 30 vinden we als kritieke grens g= 26,9. Dus Haverwerpen.


b Gevonden p = 0,275. Bij Ha: p = 0,30 vinden we voor de steekproeffractie als grens
0,270. Dus nu Ha niet verwerpen.
c 0,8790

9.16 a Met Z = {kIk~ 77} wordt Ha verworpen.


b 0,246 < 7T < 0,374, dus tussen 24,6% en 37,4%

9.17 Met t[6] = 1,943 en s, = 3,65 zeer significant.

9.18 x= 40 leidt met S:x = 3,30 en ta, 975 (7) = 2,365 tot verwerping van Ha.

9.19 a 0,0455
b 0,0113
c 0,9711
d Geen klacht indienen
e 990,65 < fl < 999,35

9.20 a Ha verwerpen, want Z ={x I x:=; 4116}.

9.21 a Tweezijdige toets levert als kritieke linkergrens 22,4 %. In de steekproef 19,2 %, dus
significante daling.
b Met z = 1,81 vinden we 0,9649.

9.22 a 0,1607
b 0,0778
c ja
d 1 - {3 = 0,8907

9.23 a Z= {xlx > 7,206}, dus Ha verwerpen.


b 0,7734

9.24 a 0,0526 en 0,0838


b 0,3233 0,1429 0,0526 0,0166 0,0045 0,0011
0,0002 (bij 5% defecten)
0,0150 0,0375 0,0838 0,1611 0,2776 0,4207
0,5793 (bij 20% defecten)
De som is het laagst voor c = 4.
c 0,0681 0,0318 0,0137 0,0055 0,0020 0,0007
0,0002 0,0001 (bij 5% defecten)
0,0020 0,0043 0,0087 0,0166 0,0301 0,0516
0,0838 0,1292 (bij 20% defecten)
De som is het laagste bij c = 11 .

Deel B Antwoorden op de open vragen 215


9.25 a 0,4313 0,3156 0,2206 0,1492 0,0968 0,0551
0,0384 0,0057

9.26 a Niet significant


b MetZ={klk~6} vindenwe 1-{3 = 0,5871
c 16 is wel significant 1 - {3 = 0,9147
d n = 174 (afgerond, geen e.c. gebruikt)

216 Hoofdstuk 9 Toetsen


.•
..•
10 De chikwadraatverdeling

Deel A Antwoorden op de multiplechoicevragen


1 d 4 b
2 c 5 a
3 d 6 c

DeeiB Antwoorden op de open vragen

10.1 a Expected-tabel:
32 24 24
48 36 36
b x 2 = 12,07

c Twee vrijheidsgraden
d Z={xlx>9,21}
e H 0 wordt verworpen.

10.2 X 2 = 74,8 groter dan x~.95 [20) = 31,41

10.3 a 13,27 12,59 34,17


b 0,83 29,71 3,94
c 16,62 0,63 en 10,03 48,27

10.4 a 0,0398: significant


b 0,999, dus links 0,001: significant
c 0,973, dus links 0,027: niet significant
d 0,026: niet significant
e 0,992, dus links 0,008: niet significant

10.5 Chikwadraat 5,09: niet-significant

10.6 a 4 vrijheidsgraden 9,49; toetsingsgrootheid 19,56


b 23,29%

10.7 Chikwadraat = 33,27, dus H 0 verwerpen

10.8 Chikwadraat = 22,26 significant met a = 0,05, want p = 0,008

10.9 Chikwadraat = 13,43: niet significant

10.10 g = 7,81. Toetsingsgrootheid 39,26, dus H 0 verwerpen.

217
10.11 a 0,1186 en 0,0401
b Chikwadraat = 2,98: H 0 aanvaarden

10.12 Chikwadraat = 10,57: H 0 verwerpen

10.13 Chikwadraat = 10,2. Dus H 0 wordt verworpen.

10.14 Met de negatief-exponentiële verdeling (A= 4,7 per uur) eerst de 'expected' frequen-
ties uitrekenen. Per klasse vinden we:
32,2 18,2 10,28 9,1 en 4,25.
Daarna x2 toepassen. Geen significant verschil tussen waarnemingen en theoretische
frequenties.

10.15 1 936 < CJ" 2 < 18 343

10.16 De toetsingsgrootheid= 172,5, dus H 0 wordt verworpen.

10.17 a Toetsingsgrootheid 86,98, dus H 0 verwerpen.


b 35,6 <u< 74,5

10.18 a Significant kleiner dan 0,04


b 0,0170 < 5 < 0,0333

218 Hoofdstuk 10 De chikwadraatverdeling


...•
11 Verschiltoetsen

Deel A Antwoorden op de multiplechoicevragen

1 b 4 d
2 c 5 b
3 b 6 b

DeeiB Antwoorden op de open vragen

11.1 s; = 274,3, sv = 5,23, 38 vrijheidsgraden, t = 1,687


gR = 8,84. Gevonden v = 21,4, dus H 0 verwerpen.
Er is significante verlaging.
NB t* = 4,09 > 1,687

11.2 Met sv = 46,29 en t 0 ,025 = 2,365 vinden we:


Z={xlx< -109,47 of x> +109,47}.
Dus v= 200 ligt in Z, dus H 0 wordt verworpen.

11.3 H 0 : fix= flr wordt niet verworpen.

11.4 De gemiddelden verschillen 1065,75- 1070,31 = -4,56, levert z = -1,00, dus niet
significant.

11.5 Z= { vl v < - 5,66 of v > + 5,66}, dus H 0 verwerpen.

11.6 -6,34 < fll- fl2 < - 1,49

11.7 t* = 3,12, dus significant verschil

11.8 a Zevenmaal min en eenmaal plus is niet significant bij tweezijdige teken toets.
b Met t* = -3,48 significant

11.9 a Kritieke grenzen zijn -87,1 of +87,1. Gevonden -7,3, dus niet significant verschil
volgens deze methode.
b Kritieket-waarde 2,2. Gevonden 4,17, dus significant.
c Kritieke aantal plussen 0, 1 en 2 en 10, 11 en 12. Gevonden 11 plussen, dus H 0
verwerpen.

11.10 We vinden t* = 2,13. Dat is significant bij tweezijdige toetsing (tabel t = 2,10).

219
11.11 a Berekende F = 3,70. Tabellevert met a= 0,05 bij tweezijdige toetsing F = 2,77.
Dus de populatievarianties zijn ongelijk.
b Berekende t* = 2,51. Excellevert bij tweezijdige toetsing t = 2,04.
Dus significant.

11.12 Z={vlv-71,9 of v> +71,9}, dusH0 verwerpen.

11.13 a Tekentoets: k = 6 is significant.


b t-toets voor verschillen toepassen: effect is zeer significant.

11.14 Toetsingsgrootheid -0,2417, dus H 0 verwerpen.


Verwerping bij uitkomsten lager dan -0,1116 en hoger dan +0,1116.

11.15 a Z= {x ix> 0,0302} (met p*), dus H 0 wordt verworpen.


d= 0,133

11.16 Z = {x Ix < - 0,094 of x > + 0,094} gevonden d = -0,20,


dus H 0 : 7T 1 = 7T2 wordt verworpen.

11.17 a 6,23
b 3,06
c 4,43
d 3,42
e 0,067
f 0,129
g 0,293
h 0,179
0,107 en 7,39
j 0,135 en 9,36
k 0,260 en 4,30
I 0,389 en 2,76

11.18 a Niet houdbaar (chikwadraatverdeling toepassen)


b Met F = 6,07 significant verschillend
c 86,62 < fls < 93,38

11.19 Verschil niet significant.

11.20 a F = 9,22 in Z. Dus H 0 verwerpen. Verwerpingsgebied van de F-waarden is 0 tot


0,255 of 3,66 en hoger.
b Gemiddelden van de reistijden kunnen gelijk zijn. -5 is geen element van Z, want Z
is lager dan -17,47 en hoger dan +17,47.

220 Hoofdstuk 11 Verschiltoetsen


...
.
12 Va ria ntiea na lyse

Deel A Antwoorden op de multiplechoicevragen


1 c 4 a
2 c 5 a
3 b 6 d

DeeiB Antwoorden op de open vragen

12.1 a Ho: fl1 = fl2 = fl3


H 1 : niet H 0 is juist
b 76, 60 en 70. Totaalgemiddelde bedraagt 68,24.
c 83,57
d 363,57
e Omdat de berekende F = 4,35 hoger is dan F = 3,74 wordt H 0 verworpen.

12.2 De berekende F-waarde is 7,50. Dat is beduidend boven de kritieke F = 3,47. De nul-
hypothese wordt dus verworpen (p = 0,003).

12.3 De berekende F-waarde is 4,39. Dat is boven de kritieke F = 3,47. De nul-


hypothese wordt dus verworpen (p = 0,025).

12.4 De drie gemiddelden zijn 7,4, 7 en 6,0625 met s = 0,926 en t = 2,601 (bij 21
vrijheidsgraden en a=0,016667 via T.INV van Excel) vinden drie intervallen. Bij
het grootste verschil 7,4- 6,0625 = 1,3375 vinden we als interval:
-+0,013 < f1 1 - f1 3 < 2,54, dus nét nog geen significant verschil.

12.5 a De berekende F-waarde is 6,66. Dat is beduidend boven de kritieke F = 2,91. De nul-
hypothese wordt dus verworpen (p = 0,00133).
b Berekende F-waarde is 3,84. De tabelwaarde is 5,52 (bij ~a= 0,025) dus geen signifi-
cant verschil.

12.6 a Voor de dagen geldt: De berekende F-waarde is 444. Dat is beduidend boven de kri-
tieke F = 3,01. De nulhypothese wordt dus verworpen (pis vrijwel nul).
b Voor de waarnemingsstations geldt: De berekende F-waarde is 34,1. Dat is bedui-
dend boven de kritieke F= 3,01. De nulhypothese wordt dus verworpen (pis vrijwel
nul) .

221
12.7 a Voor de banden geldt: De berekende F-waarde is 54,1. Dat is beduidend boven de
kritieke F = 4,46. De nulhypothese wordt dus verworpen (p is vrijwel nul).
b Voor de automerken geldt: De berekende F-waarde is 23,64. Dat is beduidend boven
de kritieke F = 3,84. De nulhypothese wordt dus verworpen (p = 0,0002).

12.8 Grens 3,30, gevonden 10,72, dus H 0 verwerpen.

12.9 Ballen: grens 3,285, gevonden 5,971, dus H 0 verwerpen.


Spelers: grens 3,285, gevonden 13,83, dus H 0 verwerpen.

12.10 a Op de tabel passen we tweefactorvariantieanalyse toe.


b 3,43
c 20,32
d 0, 173, neen geen interactie

12.11 a Er blijkt dat een rij-, kolom- en interactie-effect aanwezig is. Voor de interactie: bere-
kende F = 6,92 en tabelwaarde F = 2,36.
b Voor de drie tarwerassen geldt: de berekende F-waarde is 84,4. Dat is beduidend
boven de kritieke F = 2,87. De nulhypothese wordt dus verworpen (pis vrijwel nul).
c Voor de meststoffen: de berekende F-waarde is 90,0. Dat is beduidend boven de kri-
tieke F = 3,26. De nulhypothese wordt dus verworpen (pis vrijwel nul).

222 Hoofdstuk 12 Variantieanalyse


...-

13 Regressie en correlatie

Deel A Antwoorden op de multiplechoicevragen


1 c 4 c
2 c 5 c
3 c 6 d

DeeiB Antwoorden op de open vragen

13.1 b som: 660 24,2 2108 55850


c Y= -3,55 + 0,0796X
d Y= 1,63%

13.2 a Y= -1,82 + 0,00133X


b Y = 3,5%
c r= 0,994

13.3 a Y= 1,74 + 0,056X


b 8,18 en 2,86 (zeer onaannemelijk dat het lineaire verband nog geldt)
c Het kan een storing zijn of onvergelijkbaar rijgedrag.

13.4 a Promillage
b Y = 1,797 - 0,01214X
c r= - 0,9761
d Y= 0,765
e Y= 2,156-0,1457 X

13.5 a Y=21,24+0,0779X
b 52,4 ohm
c y = - 0,03 + 0,0779 x

13.6 a Y= 3,38 + 0,94X


b Bij X= 40 levert dit afgerond 41. Bij X= 80 levert dit 78.

13.7 a Y= 9,5 - 0,5X


b r = - 0,86
c sx = 2,02sy= 1,17

13.8 b E(;s;) = 2; Var(~ )= 0,6; E(J::) = 10,9; Var( z: ) = 0,49


c Cov (~, z:) = 0,30
d p(~, J::) = 0,55
e E(~) = 12,9 Var( ~ ) = 1,69

223
13.9 a Y= 168,06 + 121,77 X
b 1104 < y < 1667
c 1452,6 < y < 1787,4

13.10 a 180
b 0,0559
c 0,1867

13.11 -0,94

13.12 a 0,926
b <P= 0,624

13.13 a Y= 66,1 + 3,98X


b r = 0,99 en r = -0,45

13.14 a p = -105,44 + 43,97t


b r= 0,877
c 754 < p < 1234
d 816,98 < p < 1170,6

13.15 b y = 44,26 + 73,65 x


c 154,72
d s~ = 96,5
e 127,13 < y < 174,97

13.16 a Y= 17,39 + 2,29X


b Y= -29,02 + 1,44X
c Y (uren) = 13,71 + 0,09 X

13.17 a Gemiddelde is 65 punten zonder en 57 mét dyslexie.


b Gemiddelde is 19,7 uur zonder en 19,6 uur mét dyslexie.
c Y= -16,17 + 0,76 X toets+ 1,64 X uren- 5,29 d

13.18 a Y= 58,81 + 1,00X + 2,73Z


b Y= 104,1

13.19 Y= 15,07- 10,70X + 3,57 X 2

13.20 a 55,5 + 2,36X


b Y= 144,3 + 0,80X
Y= 54,3 + 0,75X

13.21 a r = 0,6975 (NB Eerst moet Samsung, regel 9, uit het bestand worden verwijderd
omdat hier gegevens ontbreken.)
b Y= 9167 + 0,1124X (NB Eerst moeten Samsung, regel 9, en Petrobas, regel 37, uit
het bestand worden verwijderd omdat hier gegevens ontbreken.)

224 Hoofdstuk 13 Regressie en correlatie


13.22 a Y= -431496 + 11893X
b Y= -264551 + 152068X
c Y= -343678 + 3546X 1 + 108814X2 (NB Excel eist dat de verklarende variabelen
naast elkaar staan. Dit kan bijvoorbeeld worden bereikt door - tijdelijk - kolom H,
jaarhuur, uit het bestand te verwijderen.)

13.23 a Met Y= -6,88 + 1,05Xvinden we 67 punten (afgerond).


b Met Y= 38,4 + 0,415Xvinden we 59 punten (afgerond).
c Voor de vrouwen Y= 37,7 + 0,451 X
Voor de mannen Y= 44,1 + 0,286X
d Y= 39,7 + 0,362X 1 + 3,915Xv

13.24 a Y= -219601 + 113898X


b y = 192202 + 303,5 x
c Diverse modellen kunnen worden geprobeerd. Met alle beschikbare variabelen levert
meervoudige regressie R 2 = 0,8419.

Deel B Antwoordenopdeopenvragen 225


.... '

14 Indexcijfers

Deel A Antwoorden op de multiplechoicevragen


1 d 4 d
2 a 5 c
3 a 6 d

DeeiB Antwoorden op de open vragen

14.1 a De enkelvoudige prijsindexcijfers zijn 105, 110,5 en 120; de enkelvoudige


hoeveelheidsindexcijfers zijn 120, 106,7 en 84,4.
b De totale omzet in 2008 bedraagt € 426.500.
De totale omzet in 2009 bedraagt € 500.400.
Het waarde-indexcijfer bedraagt 117,3.
c Het prijsindexcijfer van Laspeyres is 110,43.

14.2 a P~5 • 10 = 116,2


b P~5 • 10 = 116,6
c p~S,IO = 116,4
d WOS,IO = 110,9
e Q~5 • 10 = 95,5 en Q~S,IO = 95,2

14.3 a 173,9 191,3


b 74,2 80,6 96,8 122,6 129,0 141,9

14.4 a De enkelvoudige prijsindexcijfers luiden:


88, 100, 110, 125 en 100, 113,64, 125 en 142,05.

14.5 a 140, 125, 110 en 160, 132,5, 100


b 125 en 130,8
c 126,4 en 133,2

14.6 a 87,50, 93,3, 147,4, 161,0, 122,3


b 118,8
c 117,3

14.7 a 124,2
b 126,4
c 3.976 4.370 W= 109,9

226
14.8 a 120,9 en 99,3
b In beide jaren beter dan de beursindex van respectievelijk 117,6 en 96.5.

14.9 a type I: 109,65 type II: 100,76; Type III: 145,45


b 105,7
c 107,7 (met producttest!)

14.10 113,7

14.11 Q~I,02 = 107,5 Q~l.02 = 105,6 Q~l,OZ = 109,5

14.12 a 74 83,5 118,4 147,6


b 125.971,20 116.209,59
Na belasting is er nog een kleine winst.

14.13 a 110,8
b 110,9
c W= 122,9 (voor fruit)
d Prijsindex 107,9. Zowel Laspeyres als Paasche is voor fruit hoger.
d 119,3, dus fruitbestedingen stegen meer.

Deel B Antwoorden op de open vragen 227


.... -- - --~ - - - -

15 Tijdreeksen

Deel A Antwoorden op de multiplechoicevragen

1 c 4 c
2 b 5 b
3 c 6 a

DeeiB Antwoorden op de open vragen

15.1 a De waarden van de voortschrijdende gemiddelden zijn:


303,3, 350, 393,3, 450, 503,3, 553,3.
b Y, = 425 + 49,3t (t = 0 in periode 4/5)
c Y 9 = 650 en Y 9 = 646,8

15.2 a VG (vanaf 2008 III): 36,75 38 39,5 41,5 43 44,25 45,75 47,25
b en c
Gemiddelde van de seizoenafwijkingen: - 8,625 4,625 10,125 en -7,125
Na correctie: S1 = -8,375 S11 = 4,875 Sm= 10,375 S1v = -6,875

15.3 a 45 (week 2) 50 55 60 65 70 75 80 (week 9)


b 47,5 52,5 (enzovoort) gecentreerd: 50 55 enzovoort

15.4 a Trendwaarden (VG) vanaf woensdag week 1: 334,6 332,6 327,2 323,4
320,8 316,4 314,6 314 312,6 310,6 310 307,8 304,4 300,4
298,4 295,8 (woensdag week 4)

15.5 Trendwaarden (VG) vanaf2003II: 271 286,5 307 330,5 355,5 386
419 445 465,5 487,5

15.6 a 19,4 22,58 24,51 26,75 27,13 27,99 28,89


b Bij a= 0,1 is de vertragingsfactor groter.
c 0,06561 (wegens startwaarde)

15.7 Y = 1,404 + 0,0036 t, met t = 1 in januari, tin maanden en Y13 = 1,451

15.8 a 1,384 (maart) 1,406 1,404 1,416 1,420 1,432 1,450 1,482 (okt)
b Y= 1,320 Y = 1,344 en verder 1,350 1,386 1,400 1,412 1,395 1,405 1,427
1,448 1,477 1,498
c F = Y12 = 1,498

228
15.9 a Y= 68 + 4t (t= 0 in week 5)
b Y= 52 + 4t (t= 0 in week 1)

15.10 a 1200000; 1250000; 1300000; 1350000; 1400000; 1450000;


1500000; 1550000
b 1300000; 1270000; 1220000; 1310000; 1500000; 1470000;
1420000; 1510000

15.11 a Gecentreerd 4 periode VG


b Wegens sluiting geen reëel beeld
c Multiplicatief
d 0,50 1 1,80 en 0,70
e 1,5 3 5,4 en 2,1
f 2,90 2,94 2,96 en 2,97

15.12 a 37,5 40 43,5 46,5 48,75 51,75 55,5 59,25


62,50 66 70,25 en 74
b Multiplicatief lijkt redelijk.
c 0,754 1,113 1,417 en 0,718
e Tendmatige groei ongeveer 4 per kwartaal. Levert trend 86 voor
2004 1 x 0,754 = 64,8.

15.13 a Vanaf do week 1 190,0 192,9 enz.... enz. 192,9 195,7 di week 4
b Vanafmaandag -63,54 -43,44 -24,94 -38,14 +21,76 +144,64
en + 3,66 op zondag.
c Vanaf donderdag 122 172 272 160. Op basis van de laatste trends:
110 125 134 woe

15.14 b S1 = 241,3 Sn= 16,3 Sm= -185,0 S1v = -72,7


c t = 23 levert T = 790,3, dus Y = 790,3 - 185,0 = 605,3
e 5 2 = 77,3, dus 5 = 8,79 en 5p = 10,35 levert: 583,1 < Y < 627,6

15.15 a Y= 19,3 + 3,93t (t = 0 in 2006, tin jaren)


b Y= 15,8 + 3,93t+ 0,526t 2 (t= 0 in 2006)

15.16 b Y= 1,462 (1,802)' (t= 0 in 2003)


c Y 03 = 50,06

15.17 a 531,43 en 556,79


b 159,43, 167,04 en 174,64
c 157,53 < y9 < 191,75

15.18 a 193 en 82 (afgerond)


b 170,2 < Ymei< 215,5 72,1 < Yjuni < 91,3
c €62.475 <omzet< €74.787

15.19 a Y= 50,24 + 2,64t (t= 0 in periode O)


b ln(Y) = 4,0447 + 0,0251 t, dus Y= 57,1 X (1,0254)'

15.20 a Trendlijn Y, = 2068 + 221 X t, met t = 1 in periode 1


b 5379 en 5599

Deel B Antwoorden op de open vragen 229


15.21 a Vanaf periode 4levert dit: 46,25 47 48,5 49 52 51,5 47,75 50,5
50,25 52,75 56,25 54,5 57,5 59,75 en 59,5
b Vanaf periode 13 zijn de voorspellingen:
50,25 52,75 56,25 54,5 57,5 en 59,75
c 5
Zie verder de uitwerking voor een uitgebreidere aanpak.

15.22 a Vanafperiode 2 vinden we als waarden: 6,8 6,98 7,17 7,57 7,97
8,67 8,89 8,86 8,60 8,33 en 8,29
b 8,17%
c Met a= 0,50 vinden we: 6,8 7,1 7,35 7,93 8,41 9,36 9,38
9,09 8,54 8,12 en 8,16
Gemiddelde absolute afwijking is 0,89 (bij a= 0,30) en 0,77 (bij a= 0,50)

15.23 a We vinden een reeks VG-waarden beginnend met 63,025 in periode 2 tot aan 167,7
in periode 41.
b Lijn is 50,21 + 2,59 t met t = 0 in periode 0.
c Volgens het additieve patroon vinden we als seizoencomponenten:
44,47(III) -27,93(IV) -22,84(1) en 5,38. Het multiplicatief model levert als
seizoenindices: 1,433 0,733 0,786 en 1,045
d 141,97 172,33 214,01 144,67 bij additief model
129,18 174,46 242,95 126,17 bij multiplicatiefmodel

230 Hoofdstuk 15 Tijdreeksen


16 Gemengde opgaven

16.1 d XME is ongeveer 8 ha.

16.2 b x= 481,25 s= 149


c x nieuw = 490,88 5 = 152
d xnieuw = 491,25 s= 149

16.3 a 12! = 479 001 600


b 2 x 6! x 6! = 1 036 800
c 2 X 6! = 1 440 en 6! X 2 6 = 46 080

16.4 a 0,512 en 0,192


b E(Jç)=€92.500,- a= J51250=€226,4
c Nieuwe E(k) = € 19,25 per laken. Dit was eerst € 18,50. Dus de kosten van de verbe-
tering zijn te hoog in relatie tot de toename in verwachte opbrengst.

16.5 a 0,3821
b 0,1492
c n~61

16.6 a 0,2837
b 0,6111
c 0,2206

16.7 a 0,0034 0,0656 en 0,3528


b 0,2231
c P(afkeuren 1-rr = 0,04) = 0,0485
P(afkeuren 1-rr = 0,05) = 0,2843

16.8 a 28 219,40 < fl < 28 900,60


b 0,155 < 7r < 0,219
c 0,219 < 7r < 0,396

16.9 a p (Jç ~ 4) = 0,0190


b 13 stuks
c Ha verwerpen Z = {kl k;;; 18 of k ~ 42}

16.10 X2 = 98,77 met Z= {xlx > 16,81} wordt Ha verworpen. Er is wél afhankelijkheid.

16.11 Ha (gelijke probleemkans) wordt verworpen.

231
16.12 a Met 5 2 = 84,67 en X2 [9] = 3,33 wordt H 0 (geen verschil) verworpen.
b 40,06 < u 2 < 282,22 met 95 o/o betrouwbaarheid
c Met 5 2 = 10,86 vinden we F = 84,67/10,86 = 7,8. Dus er is sprake van een verschil-
lende standaarddeviatie.

16.13 a Y= 21,34 + 2,06X


b Y= 48,12 ton
c r= 0,9287
d 5~= 5,63
e 41,75 < Y0 < 54,49

16.14 a VGvanaf2000n:
107,50 120,50 136 154 167 175,5 190 208 212 210 220
244 262 268,50 284 301,50 315 326,50
b Na correctie: Swinter = 64,3 Szomer = -64,2
c Y = 432,2 + 25t met t = 0 in 2004/05, tin halve jaren

232 Hoofdstuk 16 Gemengde opgaven


18 Case-studies

Case 1 Bungalowpark 'De Bossche Duinen'

a F(x)=O voor x< 8


1
=-x 2 -2x+8 8~x< 10
8
1
= - - x 2 + 3x - 17 lO~x< 12
8

=1 voor x~ 12
b 120 x 0,375 = 45
c Om 9 uur en 20 minuten.
d E(k) = 3,8
e Var (Js) = 0,76
f Met E (ksom) = 456 en CJ' = 9,55 vinden we kans 0.
g 0,9525
h 0,0294
Grens 1 234,9 leidt tot 25 fusten.
j 0,0428
k 0,3821
I 0,0351
m n = 123
n 0,1255
0 0,4678

Case 2 Het rekencentrum van de Hogeschool

a 0,1587
b 0,0548
c 0,9980
d 0,75
e Met T = 1 335 volgt kans 0,0039.
f E(Js) = 2,6 en Var (Js) = 1,74
g E(m_) = 26 en Var(m) = 4,35
h E(!l!)=€975,-
0,139379
j 0,9412
k 0,5568
I 0,4868
m €23,70
I
n 3
0 20 minuten
p 2x- x 2 = 0,9levert x= 0,6837, dus ruim 41 minuten

233
Case 3 Fun Tours B.V.

a 217,84 <fA.< 262,16


b Met t[ 16] = 1,74 vinden we gL = 231,8, dus H 0 niet verwerpen.
c Gegevens= 43,1 vinden we n;;; 72 (met z = 1,96), dus 55 extra.
d u hoogstens 32,19
e Met ud = 11,17 en t[16] = 1,74 vinden we grens 19,4.
Verschild= 16 niet significant
f X 2 = 8, dus H 0 verwerpen

Case 4 Air Brabant

a 0,4060
b 18 meter
c X 2 = 3,8483, dus H 0 niet verwerpen.
d 45,96 < fA. < 50,04
e Bij eenzijdige toets H 0 verwerpen.
f Metsd=2,911 en t=2,10levertg=±6,11 ,
dus d = -6,4 is significant verschil.
g 0,61 < 7T < 0,79
h Gegeven 7T ongeveer 0,70 vindenwen;;; 897.
H 0 wordt niet verworpen.
j -0,1325 < fA-d < 0,0325
k Gegeven H 0 : 7T 1 = 7T2 leidt d = - 0,05 niet tot een overtuigend verschil.

Case s Have the guts to go nuts

a 0,377 < 7T < 0,463


b n ;;; 2401
c 9 539 cassettes
e P(k;;;64)=0,0139
f Bij eenzijdig kritiek gebied grens 60,10, dus k;;; 61, dit levert bij 7T = 0,30, dat
1 - {3 = 0,4681.
g X 2 = 13,90 duidt op siginificant verband.
h p < 0,5o/o
10,56 o/o
51,504 gram

234 Hoofdstuk 18 Case-studies


Uitwerkingen van geselecteerde opgaven
(door ir.Koen de Bont)

Hoofdstuk 1 Inleiding tot de beschrijvende statistiek


Hoofdstuk 2 Maatstaven voor ligging en spreiding
Hoofdstuk 3 Kansrekening
Hoofdstuk 4 Kansvariabelen
Hoofdstuk 5 Normale verdeling
Hoofdstuk 6 Binomiale verdeling
Hoofdstuk 7 De poissonverdeling
Hoofdstuk 8 Schatten
Hoofdstuk 9 Toetsen
Hoofdstuk 10 De ebikwadraatverdeling
Hoofdstuk 11 Verschiltoetsen
Hoofdstuk 12 Variantieanalyse
Hoofdstuk 13 Regressie en correlatie
Hoofdstuk 14 Indexcijfers
Hoofdstuk 15 Tijdreeksen

235
Hoofdstuk 1-lnleidingtot de beschrijvende statistiek

Opgave 1.2

a De eenheid van klassenbreedte wordt 5000 euro. De frequentiedichtheden


zijn dan achtereenvolgens: 12/2 = 6; 8/1 = 8; 12/1 = 12; 16/1 = 16;
20/1 = 20; 36/2 = 18;32/2 = 16; 24/2 = 12; 30/8 = 3,75; 10/10 = 1.
Opmerking
Eigenlijk zouden de histogramgrenzen 0,5 cent naar links verschoven moe-
ten worden:
bijvoorbeeld tweede klasse:
• ondergrens 9.999,995
• bovengrens 14.999,995
Maar die (overdreven) secuurbeid laten we hier achterwege.

Histogram van het jaarinkomen van 200 schouwburgbezoekers

20
e 18 1--
:2~
a>o
.r:.o 16 '--
c:o
:RI!)
'
14
.... c:
Cl) ctl
c.> 12 -
'0.2!
ëii~
'
10
.Sa>
.C.'-
o.O
·- c: 8 -
~~
c:ctl
6 -
Cl>-
::l-"'
C"c: 4
~~ 2
L/1,
0 1015202530 40 50 60 100 150 • € 1.000

b De relatieve frequenties zijn achtereenvolgens:


12/200 = 0,06; 8/200 = 0,04; 12/200 = 0,06 enzovoort.

Opgave1.9

Cirkeldiagram van de gewenste ontwikkeling van de aan sport bestede zendtijd

Categorie Frequentie Relatieve


frequentie
A 15
D Afname 30%
30%
G 13 26% 13 Gelijk 26%
T 22 44% ~ Toename 44%
n = 50 100%

236 Hoofdstuk 1 - lnleidingtot de beschrijvende statistiek


Opgave1.13

a Cumulatieve frequentieverdeling van het bandenprofiel van 200 auto's met cu-
mulatieve frequentiepolygoon

Profiel in mm Cumulatieve
frequentie Ql 200
-~ 180
4 gJ 160
0,00 - < 2,00
0,00- < 4,00 38 g 140
120 ~ 120
0,00- < 6,00
0,00- < 8,00 186 ~ 100
-~ 80
0,00- <10,00 200
:; 60
§ 40
() 20

0 2 4 6 8 10 profielinmm

b Naar schatting zullen er circa 75 auto's rondrijden met een profiel van
minder dan 5 mm.

Opgave1.17

Opmerking
Geen verschuiving met een halfje zoals besproken in het theorieboek

Klassen Frequentie Frequentiedichtheid Relatieve


per sooeuro frequentie
0 -< 500 80 80 80/500 = 0,16
500-< 1 .000 65 65 65/500 = 0,13
1 .000 -< 2.000 75 37.5 751500 = 0 ,15
2.000 -< 5.000 60 10 60/500 = 0 ,12
5.000 -< 10.000 100 10 100/500 = 0,20
10.000 -< 25.000 120 4 120/500 = 0,24
"L = 5oo "L = 1

Histogram van spaarbedragen van 500 cliënten met frequentiepolygoon

80
u
·a;
.<::
.E 60
.5:?
U
e::I
.!!! Ql
Eo
QlO
40
::ILO
o-~
QlQ)
.::a. 20

O -'VOO 0 0 0
1/) 0
~ ~
0
§ 0
0
')J 0
~

Hoofdstuk 1 -lnleidingtot de beschrijvende st atistiek 237


Hoofdstuk 2- Maatstaven voor ligging en spreiding

Opgave2.8

a x=~ : rangschikken: 25-32-45-60-65-6 6-70-75-80-82


s = 19,73 (met :
deling door 10- 1): I.------'1----.,
mediaan= 65,51

b • Bij set getallen een vast getal optellen(of aftrekken)


~ ook bij gemiddelde en de mediaan dat getal optellen (of aftrekken)
~ de standaardafwijking blijft onveranderd.
• Een set getallen vermenigvuldigen met (of delen door) een vast getal
~ het gemiddelde, mediaan én de standaardafwijking ook vermenigvul-
digen met (of delen door) dat getal.
10 punten erbij?
~ x =60 + 10 = ~
~ mediaan = 65,5 + 10 = 175,51
~ s = 119,731 (blijft!)

c Met 1,1 vermenigvuldigen(= 10% erbij)


~ x = 1,1 . 60 = ~
~ mediaan= 1,1 · 65,5 = !n,o5!
~ s=1,1·19,73=! 21,70!

Opgave2.9

a
L _t; x i 14 · 5 + 130 · 2,4 + 48 • 1,6 + 26 · 7,2 + 28 · (-2,5)
x =--=------------------
n (14 + 130 + 48 + 26 + 28)
576
= - = 12,34%1
246

L /;xi 280 · 5 + 1600 · 2,4 + 450 · 1,6 + 500 · 7,2 + 140(- 2,5)
b x= - - =- - - - - - - - - - - - - - - - - - -
n 280 + 1600 + 450 + 500 + 140
9210
= - - = 13,10%1
2970

238 Hoofdstuk 2 - Maat st aven voor liggingen spreiding


Opgave2.15

Als eenheid van klassenbreedte wordt 10 minuten gekozen. De frequentie-


2
dichtheden zijn dan achtereenvolgens 3, 8, 7, 5 en - .
3
Histogram van de tijdsduur van winterinspecties (n=JO)

7/30
-a B
ëii
.I::
-c
-5 ~ 6
~-~ _1_1_~_0____+-~~
i§E
~~ 4
o-~

-=a. 2
(i) (I)

0
50 60 70 80 90 100 110 120 130 tijd in minuten

Mediaan

De mediaan wordt weer bepaald via oppervlakken. De eerste en tweede


klasse hebben samen een oppervlak van 11/30. Dat moet aangevuld worden
met 4/30 van het oppervlak van de derde klasse. Deze derde klasse heeft in
haar geheel een oppervlak van 7/30.

4/30)
De aanvulling betreft dus het ( --- 'ste deel van de derde klasse.
7/30
4/30
De mediaan wordt dan 70 + stukje = 70 + --- X klassenbreedte van de
7/30
derde klasse.

Dus mediaan = 70 + ( 4130 X 10) = 175,711


7/30
Modale klasse van 160- < 70 Imet klassenmidden ~(zie histogram).

ss 3 -23 1587 3025


6S 8 520 - 13 169 13S2 4225 33800
75 7 S2S -3 9 63 S625 3937S
90 10 900 +12 144 1440 8100 81000
-
115 2 230 +37 1369 2738 13225 26450
n = 30 2340 0 7180 189700
_J,

lx=781

Hoofdstuk 2 - Maatstaven voor ligging en spreiding 239


Lf(x-x) 2 7180
Klassiek: 52 = = - - = 247,S86 ... ~I 5 = 1S,73 1
n -1 29
Via alternatieve rekenformule:

Lfx~ (L fxm)2 189700 (2340)2


= ---
52 = - - - - - - - = 247,S86... ~ 5 = 1S,73
n- 1 n(n -1) 29 30 · 29
Opmerking
Je moet x en 5" _ 1 ook kunnen bepalen via de statistische functie van je
rekenmachientje.

Opgaven 2.19

Deze opgave wordt zonder klassenindelingen benaderd.

a Studenten: x = L x = I€ 62,631 via rekenmachientje zonder


n klassenindelingen.

Mgestudeerden:
LX
x=-= 1€ 12s,2o 1
n
Vóór het bepalen van de mediaan zijn de waarnemingen op volgorde gezet.
(Met Excel gaat dat snel)

Studenten:
28 28 29 30 30 34 3S
~ 40 40
46 47 S1 S2
êJ ~ 62 68 71 72
76
EJ 80 88 88 92 93 10S 122 146

Mgestudeerden:
0 38 40 46 S3 ss S6 S7 60 [@
~ 7S 78 78 80 88 89 90 94
~
11021 103 liS 130 132 14S 147 160 167 11701
11741 182 188 19S 22S 230 24S 2SS 280 380

ss+ S7
De mediaan voor stud.: - - - = I€ S61 gemiddelde van de middelste
2 twee, na rangschikken.
96 + 102
De mediaan voor afg.: = 1€991
2

In verband met de volgende vraag c zijn ook Q 1 en Q 3 bepaald.

240 Hoofdstuk 2 - Maatst aven voor ligging en spreiding


Voor studenten:

Voor afgestudeerden:
69+ 71
Q =--=f?ol Q3 =
170 + 179
= 172
§]
I 2 U 2

e
b Het betreft steekproeven, dus werk met n - 1.

Studenten: s= =I € 29,941

Afgestudeerden: e
s= =1€77,971

c Gewone boxplot voor studenten. Gewoon, vanwege de gevraagde uitbijters.

Afbeelding 2.1

0 100 150 200 250 300

De 'stelen' zijn aanvankelijk 1,5(79- 37) = ~

De linkersteel zou eindigen bij 37- 60 = -23, maar dat wordt ingekort tot
I+281, de laagste waarneming.
De rechtersteel eindigt bij 77 + 60 = 11371
Er is één uitbijter: 11461

Voor de gewone boxplot voor afgestudeerden geldt voor de box: Q1 = 70,


Med = 99 en Q3 = 172.
De stelen zijn aanvankelijk 1,5( 172 - 70) = 11531
Links zou dat eindigen bij 70 - 153 = -83
Er wordt ingekort tot @], de laagste uitgave.
De rechtersteel eindigt bij 172 + 153 = 13251
En ook hier is slechts één uitbijter: 1380 I

d • Te verwachten was de gemiddeld veellagere uitgave door studenten.


• De spreiding rond het gemiddelde is bij de studenten ook veel kleiner.
• Interessant is dat die spreiding bij de studenten leidt tot een symmetrisch
beeld en bij de afgestudeerden tot een rechtsscheef patroon.

Hoofdstuk 2- Maatstaven voor ligging en spreiding 241


Opgave2.20

We beschouwen de tevredenheidsindex als 'oorzaak' en dus als X.


Omzetgroei is een variabele met ratioschaaL
De index heeft in feite een ordinale schaal.
Dus eigenlijk is het verband alleen uit te drukken in de rangcorrelatie-
coëfficiënt (Spearman). De onderzoeksresultaten moeten dan eerst op rang-
orde worden geplaatst.

Index (rang) Groei (rang)


82 (11) 36 (11) 0 0
8 55 (3) 3 (1) 2 4
c 64 _(5) 10(3.5) 1,5 2,25
D 73 (8) 22 (7) 1 1
E 50 (1) 12 (5) -4 16
F 84(12) 44(12) 0 0
G 72 (7) 28 (8) -1 1
H 69 (6) 16 (6) 0 0
54 (2) 6 (2) 0 0
J 57 (4) 10(3.5) 0,5 0,25
K 79 (10) 32 (9) 1 1
75 (9) 36 (10) -1 1
2:d=O 2: d 2 =26,5

6 • ~ d2 6 . 26,5
r, = 1 - = 1- = 0,907. Een positieve samenhang!
n(n 2 - 1) 12(144- 1)
We sluiten ons aan bij een nogal gangbare praktijk en verheffen a.h.w. de
schaal van Index tot het intervalniveau. De productmomentcorrelatie-
coëfficiënt van Pearson kan dan bepaald worden. (Zie Buijs, 1.1.5).

18901- 12. 67,83. 21,25


J(56706- 12 • 67,8Y)(7465- 12 • 21,25 2)

1604,35
1495,1. 2046,25

1604,35
1749,1

=10,921

Opm. r 2 = 0,84. Het kwadraat is iets beter te interpreteren dan r zelf.


(Zie hoofdstuk 13).

242 Hoofdstuk 2- Maatstaven voor ligging en spreiding


Hoofdstuk 3- Kansrekening

Opgave 3.4

Extra
Wat is bij de vorige opgave de kans op een commissie met 2 A-leden,
5 B-Ieden en 3 C-leden, als de leden aselect worden gekozen?

P('gun,tige' oommi"ie) ~ ~
n,••• ;,
5 5
( : ) ( : ) (
530
)

·-~ c:n
Merk op dat die commissies worden samengesteld zonder teruglegging (dus
niet twee keer dezelfde Pietersen in één commissie).
De achtereenvolgende kansen zijn dus afhankelijk.
Dit soort problemen levert altijd een dergelijke formule op, die van de zoge-
noemde hypergeometrische verdeling.

Opgave3.9

[ID De trekkingen 'zonder teruglegging' leiden tot afhankelijke kansen.

a De productregel is dan als volgt:


4 3
P(hij werkt)= P(GG) = P(G,)P(G 2 1 G,) =-·-=I 0,41
6 5
Opm. Het probleem volgt het hypergeometrisch model:
(4)(2)
P(hij werkt) = ~ = 0,4
m
Dus de kans dat hij niet werkt is daarom 0,6.

Hoofdstuk 3- Kansrekening 243


b Hoe kan het dat de zaklantaarn niet werkt? Ofwel omdat er twee lege batte-
rijen inzitten, ofwel omdat er één goede (G) en één lege (L) inzit. Hiervoor
gelden de volgende kansen:

4 2 2 4 8
P(één goed en één leeg)= P(GI' L2 ) + P(Lp G 2 ) =-X-+- X-=-
6 5 6 5 15
De twee kansen zijn samen 0,60, dus dat klopt met vraag a.
Gegeven is reeds dat de zaklantaarn niet werkt.
We kunnen dan met de regel van Bayes bepalen hoe groot de kans is dat dit
veroorzaakt is doordat beide batterijen leeg waren respectievelijk dat er een
lege en een goede aanwezig waren. We vinden:
1
15
P(Lp L 2 llantaarn werkt niet) = - - = 0,111
0,60
8
15
P( één goed en één leeg Ilantaarn werkt niet) = - - = 0,889
0,60
Nu gaan we de kans berekenen dat de zaklantaarn het de tweede keer weer
niet doet.
Gevall: De weggegooide batterijen waren beide leeg.
Nu zijn er nog alleen vier goede batterijen aanwezig. De zaklantaarn zal met
zekerheid branden. Kans dat ie niet werkt is in dit geval 0.
Geval2: Van de weggegooide batterijen was er een leeg en een goed.
Nu zijn er nog 3 goede en een lege waaruit gekozen wordt.
3 2 1
De kans op twee goede batterijen bedraagt - X - = -.
4 3 2
De lantaarn doet het dan.
De kans op een of nul goede batterijen is daarom 1- 0,5 = 0,5. Dan doet de
lantaarn het niet.
Kortom, in geval 1 is de kans gelijk aan 0 dat de zaklantaarn niet werkt en in
geval 2 is die kans 0,50. Omdat geval1 optreedt met kans 0,111 en geval 2
met kans 0,889 vinden we voor de gevraagde kans:
P(zaklantaarn weigert ook de tweede keer, gegeven weigering de eerste keer)
= 0,111 x 0 + 0,889 x 0,50 = 0,444

244 Hoofdstuk 3 - Kansrekening


Opgave3.11

wel niet totaal


Dirk 0,4. 40 = 16 0,6· 40 = 24 40
Judith 0,6 ·40 = 24 0,4-40 = 16 40
llse 0,7. 20 = 14 0,3. 20 = 6 20
54 46 100

Examinator Klachten
wel niet totaal
Dirk 0,10 . 24 = 2.4 0,90. 24 = 21,6 24
Judith 0,06 . 16 = 0,96 0,94. 16 = 15,04 16
llse 0,03. 6 = 0,18 0,97. 6 = 5,82 6
3,54 42,46 46

a P(Peter slaagt)
= P((Bij Dirk n slagen) u (Bij Judith n slagen) u (Bij Ilse n slagen))

= P(Bij Dirk n slagen) + P(Bij Judith n slagen) + (Bij Ilse n slagen) - 0


(Elkaar uitsluitende gebeurtenissen)
I
= P(Bij Dirk) P(slagen Bij Dirk) + ... + ... (afhankelijke kansen)
= o,4. o,4 + o,4. o,6 + 0,2 . o,7 =1o,541
14
b P(Bij Ilse Igeslaagd) =-=I
54
0,2591

Beperk je tot de kolom 'wel geslaagd'.

2,4 ~
d -=~
3,54
Opm. Met een kansboompje gaat het misschien wel zo aardig:

Hoofdstuk 3- Kansrekening 245


Nog eens met kansboompje

·•.... . ....• •· ......,. . ... .. . .... . .... . . . ·-·· . .......1'.. .. •. •• •


Protest 0,10 I o,o24l
zakt 0,60 I o,24l
Niet 0,90 ~
I 0.4ol slaagt 0,40 [QJ]] Niet 1 [QJ]]
0,4 Protest 0,06 I o,oo96l
Dirk zakt 0,40 [QJ]]
Judith 0,4 I o.4ol Niet 0,94 I o,15o4l
llse slaagt 0,60 I o,24l Niet 1 I o,24l
0,2 Protest 0,03 I o,oo18l
zakt 0,30 ~
I o.2ol Niet 0,97 ~
slaagt 0,70 I o,14l Niet 1 I o,14l
L= 1 L= 1 L=1

a Zie ze kolom: P(slagen) = 0,16 + O,Z4 + 0,14 =I 0,541

0,14 0,14 ~
b Zie ze kolom: P(Ilse Islagen) = = - = O,Z59
0,16 + O,Z4 + 0,14 0,54

O,OZ4
c Zie 3e kolom: P(Dirk Iprotest)= =I 0,6781
O,OZ4 + 0,0096 + 0,0018

Opgave3.12

Het gegeven tableau nog eens, nu uitgebreid met marginale kansen .

...._ .. .. .... . ...•.... . ... ...


•~ ~

Leest de pagina
·~ ·. ·~ ·. ...... ... .•· ...
Marginale
kansen
,t.
Altijd Soms Nooit
Aandelenbezit 0,16 0,12 0,06 0,34
Geen aandelenbezit 0,04 0,24 0,38 0,66
Marginale kansen --t 0,20 0,36 0,44 1

a Willekeurig slaat op het hele tableau.


Kans dat een willekeurig iemand altijd de financiële pagina leest is IO,ZO I·
Kans dat een willekeurig iemand aandelen bezit is I0,341 .
Onafhankelijk als P(leest altijd Iaandelenbezit) = P(leest altijd Iaandelen-
bezit of niet)

246 Hoofdstuk 3- Kansrekening


0,16
als - = 0,20 en dat is niet zo
0,34
<=> 0,47 =F 0,20
Beschouw voor het linkerlid alleen de regel over aandelenbezit en voor het
rechterlid het hele tableau. Dus zijn de gebeurtenissen afhankelijk.

b Maak een nieuwe tabel met de 'soms'- en 'nooit' -lezers samen.

. .. ... . ···"·
Altijd
. .
Soms/Nooit
. ,. . .
Bezit aandelen 0,16 0,18 0,34
Geen bezit 0,04
- ---
0,62 0,66
0,20 0,80 1

Beperk je tot de bezitters van aandelen.


P(leest niet Altijd IBezit aandelen)
0,18
= P(leest Soms/Nooit Bezit aandelen) I =-=I
0,34
0,52941

c Beperk je tot de 'Soms/Nooit' -lezers


0,18
P(Bezit Ileest Soms/Nooit) =-=I 0,2250 I
0,80

Opgave 3.22

Economiestudent= E enBedrijfskundestudent = B.

a Met teruglegging ~ O.O.


P(2 Bedrijfskundestudenten) vraag
= P(EBB u BEB u BBE) toestanden
= P(EBB) + P(BEB) + P(BBE) - 0 somregel
60 40 40 40 60 40 40 40 60
=-·-·-+-·-·-+-·-·- productregel
100 100 100 100 100 100 100 100 100
= o,o96 + o,o96 + o,o96 = 1o,288o 1

Hoofdstuk 3- Kansrekening 247


De kansen zijn ook uit een kansboompje te halen.

I 0,6-E P(EEE) = (0,6)3 = 0,216


0,6 - E I 0,4 - 8 P(EE8) = (0,6)2 (0,4) = 0,144
0,4- 8 I 0,6 - E
0,6- E
P(E8E) = (0,6)2 (0,4) = 0,144
1 o,4- 8 P(E88) = (0,6)(0,4) 2 = 0,096 t-

I 0,6-E P(8EE) = (0,6)2 (0,4) = 0,144


0,4-8 0,6 - E I 0,4 - 8 P(8E8) = (0,6)(0,4) 2 = 0,096 t-

0,4 - 8 I 0,6 - E P(88E) = (0,6)(0,4) 2 = 0,096 t-

1 o,4- 8 P(888) = (0,4) 3 = 0,064


I: =1

b Zonder teruglegging: analoog


60 40 39 40 60 39 40 39 60
... = 1oo · 99 · 98 + 1oo · 99 · 98 + wo · 99 · 98 = I0' 2894 1

Opgave 3.25

Twee grootheden, elk met twee uitkomsten; typisch iets voor 2·2-tabel (hier
met kansen).

.. ... ... Keuring


•·
Goedkeur Afkeur
. .. .
Producten
Goed 0,8910* 0,0090 0,9000
Fout o,ooso• 0,0950. 0,1000
0,8960 .. 0,1040 •• 1,0000

De getallen met • zijn eerst berekend, met •• zijn later berekend. De rest is
eerder ingevuld aan de hand van de tekst.

a P(goed n goedkeur) = 0,8910 aflezen

b P(verkeerde beslissing) vraag


= P((goedkeur n afkeur) u (fout n goedkeur)) toestanden
= P(goed n afkeur)+ P(fout n goedkeur)- 0 somregel
= 0,0090 + 0,0050 = I0,0140 I aflezen

c P(goedkeur) = 0,8960 ~ 189,60% goedkeur I

248 Hoofdstuk 3 - Kansrekening


Hoofdstuk 4- Kansvariabelen

Opgave4.6

1 1
a De kansen zijn P(x = 45) =- , P(x = 35) =- enzovoort
- 4 - 4

1 1 1 1
E(x)
-
= ~x· P(x- =x) = 45 · -4 + 35 ·-4 + 30 • -4 + 20 ·-4 = 132,51

45 35
b De kansen zijn P(y = 45) = - P(y= 35) = - enzovoort
- 130 - 130

45 35 30 20
E(y) = ~y-P(y=y) = 45 · - + 35 ·-+30 · - + 20 ·-=1351
- - 130 130 130 130 u
Opgave4.7

t(k) =P(!s =k) Gokje:


E(!s)"' 1,5
0,30
cr(!s)"' 1,5
0,20
0,10
0 2 3 4 5 k

a = P(k= 3) + P(k= 4) + P(k = 5) = 10,301


P(/s_?:. 3)
P(k~ 3) = P(k= 0) + P(fs_= 1) + P(k = 2) + P(k= 3) = 10,851

b E(/s_) = ~ k • P(k = k)
= (0. 0,20) + (1 . 0,30) + (2. 0,20) + (3. 0,15) + (4. 0,10) + (5. 0,05)
=~ (oké, zie gokje)

c 0" 2(/s_) = ~ (k- E(k))l • P(k = k)


= ( -1,8) 2 • 0,20 + (-0,8)2. 0,30 + (0,2) 2 • 0,20 + (1,2) 2 • 0,15
+ (2,2) 2 • 0,10 + (3,2) 2 • 0,05
= 2,06 ~ O"(k) = 11,4351 (oké, zie gokje)

Nog eens met de rekenformule:

0" 2(/s_) = E(/s_ 2) - [E(k)p = ~ P • P(k = k)- (1,8) 2


= 0 0,20 + 1
2 • 2 • 0,30 + 2 2 • 0,20 + 3 2 • 0,15 + 4 2 • 0,10 + 5 2 • 0,05
- (1,8)2 = 2,06

Hoofdstuk 4- Kansvariabelen 249


Opgave4.13

1 0,26
2 0,12
3 0,08
4 0,04
1,00

Opmerking
Alle kansen tussen 0 en 1, samen gelijk aan 1.
Eerst een prentje.

f(k) Gokje:
E(!s) wat kleiner dan 1
0,50 o(~) ongeveer 1

0,25

0 2 3 4 k

a E(Js.) = ~ k · f(k) = (O · 0,50) + (1 • 0,26) + (2 • 0,12) + (3 • 0,08) + (4 • 0,04)


=J0,90J
Dus naar verwachting 0,9 storingen per week (oké, zie gokje).

b Var(k) = E(k 2 ) - [E(k)] 2 (met rekenformule) = ~ P • f(k)- (0,9) 2


= (02 • 0,50) + {1 2 • 0,26) + (2 2 • 0,12) + (Y • 0,08) + (42 • 0,04)- 0,81
= 2,1-0,81 = J1,29J

a(k) = .jli9 = 1,136 ~ 1,14 (oké, zie gokje)


Nog eens met de oorspronkelijke formule:

Var(k) = ~ (k- E(k))2 • f(k)


= (0- 0,9)2. 0,5 + (1 - 0,9) 2 • 0,26 + (2- 0,9) 2 • 0,12 +
(3- 0,9) 2 • 0,08 + (4- 0,9)2 . 0,04 = 1,29

c/d Vooraf
Als g =
- -
+
~ +y dan : E(g) = E(~) + E(y) en Var(~)= Var(~) Var(y) + 2Cov(~ • y)
- Î -
Cov(~, 2:) = 0 als ~ en 2: O.O.
Zo geldt ook:
als g = ~ + ~ dus g = 2~
Î
maar in bovenstaande zin(!), dus niet als vermenigvuldiging

250 Hoofdstuk 4- Kansvariabelen


dan E(g) = E(~) + E(~) = 2E(~) en Var(~) = Var(~) + Var(~) + 0 = 2Var(~)
Î
als achtereenvolgende~· en O.O. zijn
Zo geldt verder nog:
als g = ~ + ~ + ... ~ = 50~
dan E(g) = 50E(~) en Var(g) = 50Var(~) mits ze alle O.O. zijn
Nu de opgave
E(g_) = 50E(~) = 50 · 0,9 = 45
Dus naar verwachting ~ storingen per jaar.

Var(g) = 50Var(~) = 50 · 1,29 = 164,51 ~ O'(g) = J64j = 8,03


De standaardafwijking als maat voor spreiding rond die 45 is dus circa 8.

e De verwachte storingskasten per jaar zijn dan: 45 · 500 = 122.500 euro I·

Opgave4.18

~.de biedprijs van de concurrent (€)


~- U[20.000; 30.000]

f(x = 0,0001)

a Lauwen krijgt de klok als de concurrent minder dan 23.000 biedt. De kans
daarop is:
P(~ < 23.000) 0,31.=I
b Bij een bod B van 28.000 is die kans: P(~ < 28.000) =I 0,81.
Bij een bod B van 30.000 is hij zeker koopman: kans =[TI.

c Er zijn twee toestanden te bedenken:


• Lauwen kan de klok kopen met winst (31.000- B) als ~ < B; de kans
B- 20.000
daarop is: P(~ < B) = - - - -
10.000
• Lauwen kan de klok niet verwerven met winst 0 als ~ > B; de kans daarop
30.000- B
is: P(~ > B) = - - - -
10.000

Hoofdstuk 4- Kansvariabelen 251


Opmerking
Een derde toestand waarbij ~ = B, heeft theoretisch de kans 0, en hoe in een
dergelijk geval praktisch besloten wordt, laten we hier voor wat het is.
De kansverdeling van de ~inst is dan als volgt samen te vatten:
B- 20.000
31.000- B met kans
10.000
f(w) = {
30.000- B
0 met kans----
10.000

B- 20.000 30.000 - B
E(J-Jt:) = (31.000- B) · +0 ·---
10.000 10.000
Ad a
23.000 - 20.000
Als B = 23.000, dan E(J'!::) = (31.000 - 23.000) · - - - - -
10.000
= 8.000 · 0,3 = 12.400 euro I

Adb
Als B = 28.000, dan E(J'!::) = 3.000 · 0,8 = 12.400 euro I
Als B = 30.000, dan E(J'!::) = 1.000 · 1 = 11.000 euro I

Opmerking
Denk erom: niet alleen de kosten B worden slechts met een zekere kans ge-
realiseerd; diezelfde kans is ook van toepassing op opbrengst 31.000, die ook
niet altijd gerealiseerd wordt.

B - 20.000
d E(J'!::) = (31.000- B) · betreft een tweedegraadsfunctie, dus
10.000
grafisch een (berg)parabool. We nemen de afgeleide:
B - 20.000 1 51.000 - 2B
E'(J'!::) = - 1 · + (31.000 - B) · - - = - ---
10.000 10.000 10.000
De maximale verwachte winst wordt bereikt als
E' (1!::) = 0 <=> 51.000 - 2B = 0 <=> B = 125.500 euro I
De verwachte winst is dan E25_500 = 13.025 euro I·

B- 20.000
e E(J'!::) = (Y-B) · , tweedegraadsfunctie van B
10.000
B - 20.000 1 20.000 + Y - 2B
E1(w) =-1· + (Y - B)· - - = - - - - -
- 10.000 10.000 10.000

252 Hoofdstuk 4 - Kansvariabelen


Er wordt weer geëist:
20.000 + Y- 2B
El(~) = 0 <=> = 0 <=> IB = 1/ 2 Y+ 10.000 euro I
10.000 . .
Als de klant 40.000 of meer biedt, bereikt Lauwen zijn maximale bod:
B = 30.000 (en verwerft met zekerheid de klok). En méér hoeft hij nooit
te bieden, omdat de concurrent nooit een bod hoger dan 30.000 zal uit-
brengen.

Hoofdstuk 4- Kansvariabelen 253


Hoofdstuk 5- Normale verdeling

Opgaves.6

s_, de gewichten van de appels in grammen


s_- N(tt(s_) = 100; a{s:) = 20)

a A, de klasse met het kleinste gewicht,


gaat tot bovengrens G.
P~ < G) = 0,20 ~Ze= -0,842
G H100 I J
c = 100- (0,842 • 20) = J83,16J

b p~ < H) = 0,40 ~ ZH = -0,25.D' ~ H = 100- (0,25.D'. 20) = J94,93J


Vanwege symmetrie:
I= 100 + (0,25.D' · 20) = j105,07j; J = 100 + (0,842 • 20) = jl16,84j

Opgaves.s

~' het vulgewicht in grammen


~- N(fl(~) = 506; oü) = 5)

500-506 6
a Zsoo= 5 =S=-1,2
(l<ijkbij z=+1,2 (tabel1a))
500 506
P(~ < 500) = P(g_ < -1,2) = P(g_ > + 1,2)
=jO,l151j

opp< 500 = 0,02 ~


Z 500 = -2,055
Î
negatief omdat 500 links van fl(~) ligt
500 ~!!lil

Dus x = 500 ligt 2,005 • u links van


tt(~) <=> 500 = tt(~) - (2,055 • 5) <=> tt(~) = J510,275J
Opmerking
Het blijft het beste om te bedenken wat z, de excentriciteit, betekent: x ligt
zo veel keer de standaardafwijking uit het midden. Maar je kunt natuurlijk
x-ft
ook steeds een en ander in de formule voor z invullen: z = - - .
u
500- fl(~)
Dat levert hier: - 2,055 = <::::> fl(X) = 500 + (2,055 • 5) = 510,275.
5 -

254 Hoofdstuk 5- Normale verdeling


Opgaves.g

~'de snelheid in km/u

~ - N{ft(~) = 78; a(~) = 4) ~~ b 4500

a P(~>80) =I 0,3085j
Immers, de excentriciteit van 80, dus het aantal keer de standaardafwijking is:

Z 80 =80-78
4 0,5. Analoog: P(~ > 85) =I 0,040 1j.
b Per dag: P(op een boete) = P(~"2:. 85) = 0,0401, immers:
85-78
Z 85 = 1,75
4
l!_, de boete per dag

b _ {0,0401 als b = 50}


f( ) - 0,9599 als b = 0
E(l!_) = 0,0401 · 50 + 0,9599 • 0 = 2,005 euro
1
De verwachte boete per jaar is:-· 250 • 2,005 = j5o,13j euro.
10
Eigenlijk maar één op de tien dagen.

~~
90-78
c P(x > 90) = 0,013, immers: Z 90 = - - - = 3
- 4

l
4412 4500
De kansverdeling wordt dan:

0,9599 als b = 0
f(l!_) = =
( 0,0401- 0,0013 0,0388 als b = 50
0,0013 als b = 100
E(l!_) = 0,9599 • 0 + 0,0388 • 50 + 0,0013 • 100 = 2,07
1
De verwachte boete per jaar is: - · 250 • 2,07 = 151,75j euro
10

Hoofdstuk 5- Normale verdeling 255


Opgave5.12

~,de bezoekduur in minuten


~- N(Jt = 45; er= 10)

a P(~ > 60) =I 0,06681


immers:
60-45
45 60
z60 = - - - = 1,5 ~ opp >60 = 0,0668
10

b Nieuwe stochastische variabele f! (van acht): f! = ~ + ~ + ... + ~ = 8~ met


E(f!) = SE(~) = 8 • 45 = 360

Var(f!) = 8Var(~) ~ cr(f!) = J8 X erx = 2 J2 X 10 = 28,28


en f! is normaal verdeeld.
Kortom: f!- N(360; 28,28 ... ) in minuten.

P(f! > 6,5 uur)= P(f! > 390 minuten)= I0,14461

~ 360 390
. Immers:
390-360
z 390 = - - - - = 1,06 ~ opp> 390 = 0,1446
28,28

c Analoog: T_rv N(E(1) = 10 • 45 = 450; er(l) = .jlO · 10 = 31,6)

.
P(l) < T = 0,95 ~ Zy = 1,645

~
(volgens tabel 1b)
T= 450 + 1,645 • 31,6 = 502 minuten=
450 T
Is uur en 22 mini

Opgave5.18

~, de lengte van de Nederlandse man in cm


~- N(Jt = 178; er= 8)
Opmerking
In verband met de afronding van 185,5 op
186, ligt de beschouwde (werkelijke) grens
176 165,5
niet op 186 maar op 185,5.

P(~ > 185,5)=10,17421; immers


185,5- 178
Z 185,5 = 8 = 0,9375 ~ opp >Iss.s = 0,1742

256 Hoofdstuk 5- Normale verdeling


Hoofdstuk 6- Binomiale verdeling

Opgave6.3

~- = 7T Lees tekst. Concentreer je op goed.


3

n = 10 ~O.O. ~ Binomiaal Is_, het aantal goede antwoorden in de


steekproef

a P(/s_ =0) =I 0,01731 P(k =1) =I 0,08671 P(/s_ =2) =0,1951 (binomiale tabel)
P(fs_ =0, 1 of 2) =P(ls_::; 2) =0,2991 (cumulatieve binomiale tabel)

b P( minstens 6) = P( 6 of meer goed) =

=1 - P(fs_::; 5) =1 - 0,9234 =I 0,07661 (cumulatieve tabel).


P(ls_:::::: 6)
1
c E(/s_) = =10 · 3" =/31/· Naar verwachting ('gemiddeld' genomen)
n7T

31 antwoord goed.
Opgave6.4

m_, het aantal volwassen Nederlanders met minstens een creditkaart (= met)
m - B(n = 15; 7T = 0,70)
Omdat de (cumulatieve) binomiale tabel slechts kanswaarden aangeeft voor
7T::;0,5, wordt het geschetste probleem (met 1r= 0,70 > 0,50) zó omge-
bouwd dat het geldt voor Is_, het aantal volwassen Nederlanders zonder
creditkaart (=zonder): Is_ rv B(n = 15; 7T = 0,30).

a P(m = 10 met)= P(fs_ = 5 zonder)= 0,20611 I


b P(m = 15 met)= P(fs_ = 5 zonder)= 0,00471 I
c P(m > 9 met)= P(ls_::; 5 zonder)= 0,72161I
d P(m < 12 met)= P(ls_:::::: 4 zonder)= 1- P(ls_::; 3 zonder)= 1- 0,2969 =I 00,70311

Hoofdstuk 6- Binomialeverdeling 257


Opgave6.7

slagen
of ~ 7T= 0,6 7T, de individuele slagingskans
niet

n = 150 ~O.O. )s, het aantal geslaagden in de


steekproef
Is~ B(n = 150; 7T = 0,6)

Normaal benaderen mag, want n = 150 > 20,


n7T = 90 > 5 en n(1 - 7T) = 60 > 5.

90 100.5

Is~ B(n = 150; 7T = 0,6) ~ Is - N(E(!s) = 90; u(/s) = 6)


E(!s) = 150 • 0,6 = 90 ~ E(/s) = 90

u(Js) = J150 · o,6 • 0,4 = J36 = 6 ~ u(!s) = 6


P(!s > 100) =? (continuïteitscorrectie) ~ P(!s > 100,5) = J 0,0401J
Immers:
100,5-90
Z 100,5 = = 1,75
6

Opgave6.14

Bestellingen 7T, de individuele kans dat een


catalogus tot bestellen leidt

~ 7T= 0,15 /s, het aantal bestel-klanten per maand


n

n= 120~0.0. Is~ B(n = 120; 7T = 0,15) met


E(/s) = 120 • 0,15 = 18
u(Js) = J12o · 0,15 · 0,85 = 3,91

a
k~
0 1718192021 120
...
k
=}~
18 20,5
...

Binomiaal: P(/s > 20) Normaal: P(/s > 20,5)


i
cont.corr

258 Hoofdstuk 6- Binomialeverdeling


De binomiale verdeling mag normaal benaderd worden (met continuïteits-
correctie), omdat
n = 120 > 20 en mr= 18 > 5 en
n(1 - 7T) = 102 > 5
P(k > 20,5) 0,26111 =I
20,5- 18
immers z 20 ,5 = = 0,64
3,91

b Analoog k- B(n = 1200; 7r= 0,15)


n > 20 E(k) = 1200 · 0,15 = 180
n7T > 5 O"(k) = Juoo · o,15 · 0,85 = 12,37
k- N(E(k) = 180; O"(k) = 12,37)
R = 180 + 1,96 · 12,37 = 204,25 ~ 204

~
L = 180- 1,96 · 12,37 = 155,75 ~ 156

0,0~,0~
Gevraagd interval I[156, 204]1 .

c Analoog: uiteindelijk k- N(E(k) = 180; O"(k) = 12,37)

L = 10% van 800 is 80 ~ 79,5 (cont.corr.)

~-- L 120
P(k :5 79,5)

immers z 79,5 =
=@].
79,5-120
= -4,0
10,1
Opmerking
In plaats van de binomiale verdeling voor aantallen (k), had ook de bino-
miale verdeling voor fracties (p) beschouwd kunnen worden. Dat gebeurt in
opgave 6,15c. -

Hoofdstuk 6- Binomiale verdeling 259


Hoofdstuk 7- De poissonverdeling

Opgave7.3

k, het aantallekke banden per dag; k- poisson(,u = 4).

a P(k = 1) = I0,07331

b P(k = 6) =I 0,10421

c P(k > 3) = 1- P(k :S, 3) = 1- 0,4335 =I 0,56651

d P(k < 3) = P(k :S, 2) =I 0,23811

e P(4 < k < 10) = P(k :So 9)- P(k :So 4) = 0,9919- 0,6288 =I 0,36311

Hierna nog een keer de uitwerkingen, maar dan met Excel.

a Kies fx ~ statistisch ~ POISSON ~ OK.


Vul in: POISSON(l;4;onwaar). Lees uit: P(k = 1) =I 0,07331

b Idem: POISSON(6;4;onwaar) ~ P(k = 6) =I 0,10421

c P(k > 3) = 1- P(k :So 3) = 1-0,4335 =10,56651


Immers vul in: POISSON(3;4;waar) en trek de uitkomst (0,4335) van 1 af.

d P(k < 3) = P(k :So 2) = j0,2381j


Immers vul in: 2;4;waar

e P (4 < k < 10) = P(k :So 9)- P(k :So 4) = 0,9919 - 0,6288 =I 0,3630 I
Immers vul in en bereken: POISSON(9;4;waar) - POISSON(4;4;waar).

260 Hoofd stu k 7 - De poissonverdeling


Opgave7.7

a k, het aantal patiënten per week


k ~ Poiss (ft = 36)
met E(k) = 36 en IT(k) = }; = 6
Omdat fl > 10 normaal benaderen
~ k ~ N(E(k) = 36 en IT(k) = 6)

P(k > 45) = P(k > 45,5)


Poisson Normaal
= 10,05671
36 45,5
45,5-36
Immers z 45 ,5 = 6 = 1,583

b y_, het aantal patiënten per dag


y_ ~ Poiss (fl = 16)

met E(y_) = fl = 16 en IT(y_) = }; = jl6 = 4


Omdat fl = 16 > 10 mogen we normaal benaderen.
~ y_ ~ N(E(y_) = 16 en IT(y_) = 4)
CX.R = 0,05 ~ ZR = 1,645
~ R = 16 + 1,645 · 4 = 22,58
Om deze (continue) waarde te diskretiseren vallen twee waarden te overwe-
gen. De keuze voor 22,5 leidt tot een kansgebied < 95o/o en dat botst met het
begrip 'minstens'. Dus kies voor een continue waarde van 23,5 die leidt tot
een discrete waarde van 23 (of minder). De kliniek moet dus tijd inruimen
voor maximaal 23 patiënten om aan de gestelde eis te kunnen voldoen.
Dus een openstelling van 23 X 0,5 = 111,5 uur I·
Opgave 7.14

~ 7T= 0,985 k is het aantal effectieven in de steekproef


k ~ B(n = 200; 7T = 0,985) met E(k) = 197
n = 200 ~ O.O. ~ Binomiaal.
Benaderen mag, want n = 200 > 20, n1r= 197 > 5 en n(l- 7T) = 3 < 5.
Dat wordt een poissonverdeling mét de rolverwisseling.
• Eerst dan maar gewoon uitrekenen:
P(k::::: 197) = P(k = 197) + P(k = 198) + P(k = 199) + P(k = 200)
197197 197198 107199 197200
= _ _ e-197 + __ e-197 + __ e-197 + __ e-197
197! 198! 199! 200!

In principe oké, maar te groot voor mijn rekenmachientje.

l Hoofdstuk 7- De poissonverdeling 261


• Dan maar omgooien: concentreer je op de andere categorie:
effectief
of -Hr= 0,015 k, het aantal niet-effectieven in de
niet--- effectief steekproef
k - B(n = 200; 7T = 0,015) met E(k) = 3
n = 200 ~ O.O. ~ Binomiaal ~ Poisson benaderen met fJ = 3
P( 197 of meer effectief) = P( 3 of minder niet-effectief) =
P(k::; 3) =I 0,64721
(De poissontabel is op deze manier wel bruikbaar met fJ = 3 < 10.)

Opgave7.15

Is_, de vraag naar verhuiswagens per dag; k- Poisson(JJ = 3)

a P(alle verhuiswagens verhuurd)= P(k 2:: 3) = 1--- P(fs_ :5 2) =


1 --- o,4232 = 1o,57681

b P(minstens 1 verhuiswagen niet verhuurd) = P(O, 1 of 2 verhuiswagens


verhuurd) = P(k :5 2) =I 0,42321

c E(aantal verhuurde verhuiswagens 13 verhuiswagens in verhuur)

= L (aantal verhuurde verhuiswagens X kans) (als vraag 2::3 is,


= (0 • 0,0498) + (1 • 0,1494) + (2 • 0,2240) + (3 · 0,5768) dan zijn er steeds
= 2,3278 per dag = 1698,34 per jaar I 3 verhuurd)

d Als 4 verhuiswagens in de verhuur


E(verhuurde verhuiswagens 14 verhuiswagens in verhuur)

= L(verhuurde verhuiswagens X kans)


= (0. 0,0498) + (1 . 0,1494) + (2. 0,2240) + (3. 0,2240) + (4. 0,3528)
= 2,6806 per dag = 804,16 per jaar

Dat levert 1105,841 verhuurdagen méér, dus I€ 8.467,20 I per jaar méér, maar
het kost nóg meer, namelijk € 10.000,00. Dus niet doen.

262 Hoofdstuk 7- De peissenverdeling


Hoofdstuk 8- Schatten

Opgave8.4

~, de montagetijd in minuten; ~ - N(ft(~) = 40; u(~) = 4)


Steekproef levert: x= 36
u(~) u(~)
Algemeen: x-z· ;-;z<ft(~) <x+z· Fn
a Met n = 16:
4 4
36- 1,96. r:; <ft(~)< 36 + 1,96. c
~16 ~16

<=> j34,04 < ft(~) < 37,96 minuten I


b Met n = 100:
4 4
36- 1,96. r:;:;: <ft(~) < 36 + 1,96. r:::;
~ 100 ~100

<=> j35,22 <ft(~) < 36,78 minuten I

c Met n = 4:
4 4
36- 1,96. ----;14 <ft(~) < 36 + 1,96 . .j4
I
<=> 032,08 <ft(~) < 39,92 minuten I

Opgave8.7

n X 400 > 200 ~ eenvoudige formule

160 240 160 240


160 400 400 160 400 400
--2,575. ---7T<-+2,575.
400 400 400 400

1o,o37 > 7T < o,4631

Hoofdstuk 8- Schatten 263


Opgave8.15

De nauwkeurigheid = de halve breedte van het betrouwbaarheidsinterval.


Het betreffende betrouwbaarheidsinterval is

p-zx P < 1r<p+zx p,


waarbij z X
~ dus de nauwkeurigheid weergeeft.
\j---;;-
Vóórdat het onderzoek plaatsvindt, moet men rekening houden met een
mogelijke uitkomst van p = 0,5 die tot de grootste onnauwkeurigheid zou
leiden.
Eis:

Dus: In = ; : : 3851 .

Opgave8.17

In deze opgave wordt in onderdeel b het betrouwbaarheidsinterval gevraagd


bij onbekende er(~). Deze onbekende moet dus eerst ge(punt)schat worden,
hetgeen in onderdeel a dan ook eerst wordt gevraagd. Deze puntschatter
wordt aangegeven met een dakje: oü).
Hij wordt bepaald uit de standaardafwijking s van de steekproef met (n- 1)
vrijheidsgraden, genoteerd als sx.
Er moet in zo'n geval niet van de normale verdeling gebruik worden ge-
maakt, maar van een t-verdeling met een zeker aantal vrijheidsgraden v, aan
te geven met t v•
Merk op dat, afhankelijk van de toevallige steekproefopbouw, s en dus û(~)
dan eens wat groter en dan eens wat kleiner uitvalt. Met andere woorden, de
spreidingsmaat zelf bezit spreiding. Daardoor is de t-verdeling wat breder
dan de normale verdeling met de vaste O"(~). Als n ---7 oo dan nadert de
t-verdeling weer tot de normale verdeling (en in de statistiek ligt in dit ver-
band het oneindige dichtbij, namelijk vanaf n = 30).

~(x; - x)1
---- =
~36 r::::
- 8 = .y 17 = 4,123---7 s2 = fl7l
9-1 L....:J

b t-verdeling toepassen: 99% betrouwbaarheid ---7


a = 0,01 ---7 1/ 2 a = 0,01} _
tg- 3,355
met v=9 -1 = 8
x- tg • a(;E) < Jl(g) < x+ tg • a(g)

264 Hoofdstuk 8- Schatten


û(~) û(~)
86 - 3,355 • Jn < {l(~) < 86 + 3,355 . Jn
~123 ~1D
<=> 86 - 3,355 • ~ < {l(~) < 86 + 3,355 • j9
<=> j81,39 < fl(~) < 90,61j

Opgave8.21

a n = 150 en a = 0,05, dus 1/ 2 a = 0,025 ~ t = 1,976


12 12
34,2- 1,976. r:::;: < fl < 34,2 + 1,976. r:::;:
y150 v150
<=> j32,26 < fl < 36,141

Opmerking
Als met z = 1,96 wordt gewerkt, dan volgt 32,28 < fl < 36,12.

b • Bij opgave a was de marge ±1,936. Deze moet nagenoeg gehalveerd wor-
den, en dus zal de steekproefomvang bijna vier keer zo groot moeten
worden. Daarmee wordt n zó groot dat nagenoeg precies zal gelden:
t= 1,96.
• Ga ervan uit dat de s niet noemenswaardig anders zal zijn als de gestelde
12 dagen.
12
• De eis wordt dan: 1,96 Jn
= 1 ~ n = 553.

Dus nog 553 - 150 = 14031 klanten extra ondervragen.

c p-z <1r<p+z P- (1-p)


n
124
met p=-=0,413
300
<=> 1 o,358 < 7T < o,4691

Hoofdstuk 8- Schatten 265


Hoofdstuk 9- Toetsen

Opgave9.5

Verontreinigingseis: Jl-(~) :5 5%. Als dat zo is, oké. Maar ik vrees méér.
Derhalve:
H 0 : Jl(~) = 5%, met J1-(~), het gehalte aan verontreiniging
H 1 : Jl-(~) > 5%, rechtseenzijdige toets met a= 0,10
Toetsingsgrootheid ~' het steekproefgemiddelde

u(~)
Onder H 0 : ~- N ( Jl-(~) = Jl-(~) = 5%; u(~)= Jn = .jlO
0,5
= 0,158%
)

a= 0,10 ---7 ZG = 1,28


G = 5 + 1,28 • 0,158 = 5,20%
5% G A= {x ER I x< 5,20%}
jz={xER I x2::5,20o/o} I
De gevonden x = j5,28o/o jE Z.
Derhalve H 0 verwerpen, H 1 accepteren: het gehalte is waarschijnlijk meer
dan 5%.

Opgave9.6

a ~- N(5, 0,15)
5,4-5
z5,4 = ~ = 2,67 <=> opp>5,4 = 0,0038

~ 4,6 5 5,4
. analoog opp <4,6 = 0,0038

I
Ofwelj 0,76% heeft inhoud buiten de gestelde grenzen.

b H 0 : J1-(~) = 5, met Jl(~), het gehalte aan werkzame stof (in mg)
H 1: J1-(~) =I= 5, tweezijdige toets met a = 0,010 en Vz a = 0,005
Toetsingsgrootheid ~' het steekproefgemiddelde
a(~)
Onder H 0 : ~- N(/1-(~) = J1- (~) = 5; a(~)= r::; = 0,03)
....;25
!a= 0,05 ---7 ZR = 2,575

~--
R = 5 + 2,575 x 0,03 = 5,07725
L = 5 - 2,575 x 0,03 = 4,92275
l 5 R A= {xER 14,923 < x< 5,077}
I Z={xER I x:54,923 v x2::5,077}1

266 Hoofdstuk 9- Toetsen


Het gevonden steekproefgemiddelde = 14,71 EZ, dus H 0 verwerpen en H 1
accepteren.
Met andere woorden: de instelling van de machine is zeer waarschijnlijk ver-
anderd. (Om de laatste zin gaat het uiteindelijk.)

5,4-4,7
c z 5A = = 4,67 Ç::> opp>5,4 = 0

~.
0,15
4,6-4,7
4,6 4,7 5,4 z4,6 = = -0,67 Ç::> opp<4,6 = 0,2514
0,15
Kijk bij z = +0,67
Antwoord: 125,14o/o I·
Opgave9.8

7T,de fractie 'falende' ondernemers


H 0:7T = 0,60 H 1 : 7T < 0,60 (minder 'falers')
Linkseenzijdige toets met a= 0,01
Toetsingsgrootheid p_, de overeenkomstige steekproeffractie.
Onder H 0 weten we vanwege de binomiale verdeling E(p_) = 7T = 0,60
0,60. 0,40
enCT(p) = = - --=0,052
- 88
Omdat n = 88 > 20, n1r= 88 · 0,60 = 52,8 > 5 en
n(1- 1r) = 88 · 0,40 = 35,2>5 mag je normaal benaderen.
Dus p_- N(E(p_) = 0,60, CT(p_) = 0,052)
G = 0,60 - 2,33 · 0,052 = 0,4788

I zH. =( f- , o,4788ll
31
In feite blijkt p = - = 0,3522 EZ
- 88
Dus H 0 verwerpen, H 1 accepteren: de mentorbegeleiding lijkt succes te heb-
ben.
(Zo'n afwijking van p = 0,3222 ten opzichte van zijn verwachtingswaarde
0,60 kan niet meer worden 'verklaard' uit toeval.)

Opgave9.11

Klassieke aanpak
~' het gewicht van een hamburger
H 0 : JIÜ ) = 160
H 1 : Jl(~) < 160, linkseenzijdige toets met a = 0,05
Toetsingsgrootheid ~
0"(~) 5
Onder H 0 : ~- N(JI(~) = Jl(~) = 160; CT(~) = Jn = j6 = 2,04)

Hoofdstuk 9 - Toetse n 267


a= 0,0S ~ ZL = I,64S

~~
L = I60- I,64S x 2,04 = IS6,64
A= {x ER I x> IS6,64}
L 160
IZ= {x ER I x :S IS6,64}1

In feite is Ix = ISO IE Z dus H 0 verwerpen. De negatieve afwijking ten


opzichte van fl = I60 kan niet verklaard worden uit het toeval; het gewicht is
significant te laag.
Aanpak via dep-waarde
Kennelijk ligt x= ISO links té ver in de staart, en wel zodanig dat het bijbe-
horende kansoppervlakje (=dep-waarde) kleiner is dan a= O,OS.
ISO- I60
z~so -4,90

~~
2,04

Dep-waarde :;; opp< 150 =I O,OOOII < O,OS.


150 160

Dus x= ISO is significant te klein. Dus H 0 verwerpen: het gemiddeld ge-


wicht is minder dan I60 gram (behoudens het a-risico).

Opgave9.18

De cijfers lijken op een vermindering te duiden. We zullen onderzoeken of


die vermindering significant is, of nog door het toeval verklaard kan wor-
den.
Het wordt meestal ontoelaatbaar geacht eenzijdig te toetsen op grond van
waarnemingsuitkomsten. Voor veel praktijksituaties is de kwestie een- of
tweezijdig toetsen niet zo interessant omdat het er in essentie om gaat hoe-
veel risico van de eerste soort men in de betreffende staart( en) willopen en
dat hangt natuurlijk weer af van de aard van de consequenties die samen-
gaan met een verkeerd besluit.
~' het aantal klachten.
H 0 : fl(~) =SI
H 1 : fl(~) <SI, linkseenzijdige toets met a= O,OS
Toetsingsgrootheid ~ het gemiddeld aantal klachten in de steekproef
• <T(,~:) is onbekend, dus puntschatten via ö-~) :;; sx

~(x.- x)Z ~(x.- 40) 2


52 = I = I = 87 I4 ~ Q-(x):;; 5 = 9 33
x n-I 7 ' - x '

• Met a= O,OS en v = 7 ~ t' = -I,89S


ö-(~)
Onder H 0 : ~- t({J(~) = fl(;ç.) =SI; ö-(~) = Jn = 9,33
j8 = 3,30)
x~ 40-SI
~~ t:0 =3:3{)=1-3,331< I-I,89S= t'l
40 51

268 Hoofdstuk 9- Toetsen


Dus H 0 verwerpen en H 1 accepteren: het klachtenniveau 1s significant
gedaald.
Opmerking
Bij een tweezijdige toets geldt t' = ± 2,365. Ook dan leidt t* = -3,33 tot
verwerping van H 0 •

Opgave9.23

a H 0 : fl(~) = 7, verwacht verbruik in liter per 100 km


H 1 : fl(~) > 7, rechtseenzijdige toets met a= 0,05
Toetsingsgrootheid ~' het gemiddeld verbruik in een steekproef.
ö-(~) 0,5
Onder H 0 : ~ ~ N(fl(~) = fl(~) = 7; ö-(~) = r = r,-:: = 0,125)
.yn y 16
Opp>G = 0,05 ~ ZG = 1,645
G = 7 + 1,645 x 0,125 = 7,206

-----11...... . . _
A=< f- '7,206) IZ= [7,206, ~> I
A Z
In feite blijkt Ix = 7,321 EZ.
Conclusie: uitgaande van een beweerd verwacht gebruik van hoogstens
7 liter, is de steekproefuitkomst te afwijkend naar boven om nog te kunnen
verklaren uit het toeval; het verwacht verbruik moet meer zijn dan beweerd;
de fabrikant heeft ongelijk.

b Het OV van de toets is:

~ ..
7,206 7,30
P(~ E z Ifl = 7,30) = P(~ > 7,206 Ifl = 7,30) =
10,77401
7,206-7,30
Immers: z 7,206 = = -0,752
0, 125

Hoofdstuk 9- Toetsen 269


Hoofdstuk 10- De chikwadraatverdeling

Opgave10.5

0 E 0 E 0 E
T/m 44 jaar 143 132 (SS%) 77 88 (SS%) 220 220 (SS%)
4S jr en ouder 97 108 (4S%) 83 72 (4S%) 180 180 (4S%)
Totaal 240 240 (100% 160 160 (100%) 400 400 (100%)

H 0 : internetgebruik onafhankelijk van leeftijd


H 1 : niet
(E- 0)2
Toetsingsgrootheid L met als idee dat bij onafhankelijkheid de
E
gekwadrateerde gestandaardiseerde afwijkingen van Observed met Expected
loputer door toeval ontstaan zijn, en dus samen niet al te groot mogen zijn.

G = 6,63 (zie tabel)

~
Jz= [6,63, ~>I
~a~,01 In feite blijkt
G

(E- 0) 2 (132- 143) 2


L E
=
132
+ ... = s,o9!lZ.

Dus H 0 niet verwerpen: internetgebruik is niet afhankelijk van de leeftijd.

Opgave 10.12

Vooraf wat rekenwerk

Aantal Aantal %
134 134.4 28 0,00
144 172,8 36 4,80
129 11S,2 24 1,6S
-
73 S7,6 12 4,12
480 480 100

270 Hoofdstuk 10- De ch ikwadraatverdel ing


H 0: steekproef conform populatie
H 1: niet
Uit de aard van de toets: rechtseenzijdig toetsen met a= 0,05.

(E- 0) 2
Toetsingsgrootheid L ---
E

(E- 0) 2
Onder H 0 : L E
~ x\3>-verdeling
opp>G= 0,05 ~I G = 7,811

~
Z== [7,81, ~)A== [0,7,81)
~:.=0,05
(E- 0) 2
3 G In feite blijkt L E = 110,5 71 EZ.

De afwijkingen zijn significant groot, te groot om nog door het toeval te


kunnen verklaren; er moet iets anders aan de hand zijn, in casu: de
steekproefverdeling is op dit kenmerk niet representatief voor de populatie.

Opgave 10.13

Is_, het aantal branden per week.


H 0 : Is_ ~ Poisson (ft= 1)
H 1: niet

(E- 0) 2
Toetsingsgrootheid L E

.
Klasse
.
·~ ·.

Expected
... ·• ... . . .... ...
Observeel
. . .. . ... . ....~

(E- o)•
~--·-
E
P~=k) Aantal Aantal 3.41
0 0,3679 36,8 48 4,45
1 0,3679 36,8 24 0,31
2 0,1839 18,4 16
3 0,0613
-----
-----
4
5
6
0,0153
0,0031
0,0005
'·'}
1,5
0,3
0,1
= 8,0 12 2
- ----- -

7 0,0001 0 ,0
L 100 100
-10,17
- --

Hoofdstuk 10 - De chikwadraatverdeling 271


Opmerking
Omdat voor elke cel E > 5 moet gelden, zijn enige klassen samengenomen.
a= 0,05 ~ lx~= 7,811
Z= [7,81, ~) A= [0,7,81)

(E- 0) 2
In feite blijkt L E = 110,171 EZ.
G

Dus H 0 verwerpen; geen poissonverdeling


met fl = 1.
Opmerking
Het kan nog wél gaan om een poissonverdeling met een parameter fl die
(perfect) geschat wordt uit het steekproefgemiddelde (al valt dat in deze op-
gave niet te achterhalen).

272 Hoofdstuk 10- De chikwadraatverdeling


Hoofdstuk 11- Verschiltoetsen

Opgave11.5

Ho: fl1 = fl2 ~ fl1- fl2 =0


H 1: fl 1 i= fl 2, tweezijdig met a = 0,05 en 1/ 2a = 0,025
Toetsingsgrootheid y = g 1 - g2
Onder H 0 : E(y) = E(g 1) - E(g 2) = E(~ 1 )- E(~ 2 ) = fl 1 - fl 2 = 0
u(y) is onbekend, immers: u(~ 1 ) en u(~ 2 )zijn onbekend, maar wel gelijk!
Er geldt:
Q-2(~1) Q-2(~2)
Q-2(v) = Q-2(x ) + Q-2(x ) _ 0 = _ _ + __
- -1 -2 11 7

(10. 30,2) + (6. 31)


s~ = 16 30,5 bij df= 16)

30,5 30,5
=-+-= 7,13 ~ ó-(v) = 2,67
11 7
Kortom: y- t(E(y) = 0; ó-(y) = 2,67) (bij df= 16)
Î
1/ 2 a = 0,025}
t= 2,12

~--
df= 16

L 0 R R = 0 + 2,12 • 2,67 = 5,66 en L = -5,66 (analoog)


lz=< ~ ,5,66] u [5,66, ~>I
A= ( -5,66, 5,66)
In feite: v = 40- 30 =~EZ. Dus H 0 verwerpen en H 1 accepteren: de
gemiddelde inkomens ZlJn ongelijk.

Opgave11.7

Fabrieksvervuiling ~ f, stadsvervuiling ~ s.
De verwachtingswaarde ~ fl·
Maak een nieuwe verschilvariabele y = [ - I.
Dan is E(y) = E(D - E(?.) en u 2(y) = u 2(D + u 2(?.) - 0.
Î
o.o.
Ho: fl([) = fl(~)
H 1 : fl([)>fl(;&), rechtseenzijdige toets met a= 0,01

Hoofdstuk 11- Verschiltoetsen 273


Toetsingsgrootheid y = [ - ~

E(y) = E([) - EW = E([) - E(~) = 0

Onder i
HO:y- t o.o.
i
0,236 0,236
= - - + - - = 0,053 ...
8 10

7·0,56 2 +9·0,42 2 )
a( v) = 0,23 ( met s~ = = 0,236
- 16

Opmerking
Omdat er sprake is van gelijke varianties, wordt voor de beide onbekende
u's dezelfde paoled varianties~ ingezet.
Bij a= 0,01 is de t-waarde van de grens van

~~ 0 G
het kritieke gebied: I t' = 2,591 (bij df = 16).
In feite: v = 2,26- 1,54 = 0,72.
-------~,.
A
...____
Z o,72 -o
Deze heeft een t* = = 13,131 > t'.
0,23
Dus H 0 verwerpen en H 1 accepteren; de
fabrieksvervuiling is significant groter.

Opgave 11.12

Vooraf
2100 (320- 350) 2 + ... + (300- 350) 2 23000
A t/m F x = - - = 350 en s2 = = - - = 4600
6 x 6-1 5

4500 (400- 450) 2 + ... + (480- 450) 2 36000


Pt/m Y y=--=450 en s2 = =--=4000
10 y 10- 1 9
Opdracht
Toets of de verkopen gelijk bleven.
Ho: fl(~) = {l(y) {:::} fl(~) - fl(y) = 0
H 1 : fl(~) =/= fl(y), tweezijdige toets met a= 0,05 en 1/ 2 a = 0,025
ToetsingsgroOtheid y = K -J?
Onder
H 0 : E(y) = E(K)- E(r) = E(~)- E(2) = 0; u 2 (y) = u 2 (K) + u 2(y)
u 2(x) u 2(y)
=---+---=?
nx ny

274 Hoofdstuk 11- Verschiltoetsen

J
a(~) en a(y) zijn onbekend, maar zijn ze (on)gelijk? Via een toets met de
F-verdeling-zou dat te verifiëren zijn. Neem aan: gelijk, dan zijn beide te
schatten via de paoled variance:

52
= (6- 1)s; + (10- 1)s~ 5(4600) + 9(4000)
------ = 4214,28
p (6- 1) + (10- 1) 14

A
2 A
2 _ A
2 _ Û 2 (~) û 2 (2:') s~ s~ 4214,28 4214,28
<T (y) = <T (~) + <T (y) = - - + - - = - + - = +--
- nx ny nx ny 6 10
= 1123,81
û(y) = 33,52
Kortom: y ~ t(E(y) = 0; û(y) = 33,52) met df= (6- 1) + (10- 1) = 14
i
a = 0,025}
1/ 2
t= 2,145

~~
df= 14

L 0 R R = 0 + 2,145 · 33,52 = 71,90 en L = -71,90


(analoog)
lz=(~,-71,90]u[71,90, ~)1
A= (-71,90, 71,90)
In feite blijkt y = x - y = 350 - (-450) = 1-100 IE Z. Dus Ha verwerpen; de
verkopen zijn niet meer gelijk te noemen; ze zijn bijna zeker gestegen.

Opgave 11.13

a Via de tekentoets (bekijk alleen óf er verschillen zijn; niet de grootte ervan).


(Er zijn geen veronderstellingen nodig over de parameters.)
ABCDEF

Ha: er is geen verschil; de kans op (-) is dan even groot als de kans op (+),
met andere woorden: 7T(-) = 0,5
H 1 : dat is niet zo
Toetsingsgrootheid k_, het aantal keer (-)
Onder Ha: k ~ B(n = 6; 7T = 0,5)
A= {1, 2, 3, 4, 5} met kans 0,9688 > 0,95

-
- ' - - - - J ' - - - - - ' - - - - - L - - -... ~ z= { 0, 6} met kans 2 x 0,0156
A 5 6 k = 0,0312

(De onbetrouwbaarheid= 0,0312 < 0,05.)


In feite is k = 6 EZ, dus Ha verwerpen: er is verschil en wel beter!

Hoofdstuk 11- Verschiltoetsen 275


b Omdat de cijfers voor en na per filiaal bekend zijn, ligt het voor de hand de
duploverschillen, y, van elk filiaal apart te beschouwen.
Veronderstel dat de verschillen afkomstig zijn uit een normale verdeling met
onbekende fl(Y) en CT(y).
Onder H 0 zal verondersteld worden dat de verschillen gemiddeld gelijk aan
nul zijn (dus dat er geen effect is): fl(Y) = 0. Voorts zal CT(y) geschat worden
uit de standaardafwijking van de steekproef met 5 vrijheidsgraden, hetgeen
gebruik van de t-verdeling noodzakelijk maakt. Kortom:
Ho: fl(Y) = 0
H 1 : fl(Y) > 0, eenzijdige toets met a = 0,05
Toetsingsgrootheid E
(, û{y) sv 14,72 )
Onder H 0 : E - t \E(E) = E(y) = 0 - (E) = Jn
= .j6 = .j6 = 6,0

Immers:
1 1
v =- (100 + 120 + 80 + 90 + 110 + 90) = 98-
6 3

~~~ (( !00-98D' + ... + ( 90-··D}2,•.•,


sv = 14,72
a= 0,05}
t= 2,015
v=5
G = 0 + 2,015 x 6 = 12,11
0 G
Jz=[12,11, --7)j A=(~,12,u)
In feite blijkt: v=j981!3 jEZ (zeer ruim). Dus H0 verwerpen en H 1 accepte-
ren: de campagne is zeer succesvol. (Ook een tweezijdige toets leidt tot deze
conclusie.)

Opgave 11.15

200 1 500 1
Vooraf: p = - - =- Nadien: p = - - =-
V 1000 5 n 1500 3

H 1: 7T" > 1rv <=> 1r"- 1rv > 0, eenzijdig met a= 0,05
Toetsingsgrootheid d. = E_n -E_v
Onder H 0 : E(d.) = E(E_n)- E(E_v) = 7T"- 7Tv = 0

172{4_) = 172{p ) + (T2(p ) = p n{l - p n) + p .{1 - p.)


_n _v 1500 1000

276 Hoofdstuk 11- Verschiltoetsen


In plaats van de verschillende Pn en Pv wordt één p* gebruikt (bedenk daar-
200 + 500
bij dat 71"" = 1rv wordt verondersteld!): p * = = 0,28. Er geldt dan:
2500

0,28 x 0,72 0,28 x 0,72


u(d) = ---- + = 0,01833
1500 1000
Kortom: d- N(E(d) = 0; u(d) = 0,01833)
a= 0,05 --7 ZG = 1,645

~5~ G = 0 + 1,645 x 0,01833 = 0,030


L 0 R IZ= [0,030, >IA= (~, 0,030)
--7

In feite: d = p" - pv = I0, 13# IEZ. Dus H 0verwerpen: de merkbekendheid


lijkt groter.

Hoofdstuk 11- Verschiltoetsen 277


Hoofdstuk 12- Variantieanalyse

Opgave12.1

a Ho: fiA =fis= flc


H 1 : niet alle fi's zijn gelijk

c L(x;-xY= 242(A)
L(x;-xY= 560(B)
L(x;-xY= 368(C)
SSE = 1170
Binnenvariantie MSE = SSE/ 14 = 1170/14 = 183,571
c n1

SST= LL (xij- x) 2 = 1897,059


j i

SSG = 5(76- 68,235) 2 + 6(60- 68,235) 2 + 6(70- 68,235) 2 = 727,059


Opmerking
Er moet gelden: SST = SSG + SSE en dat klopt. Dus had je SSG niet meer
hoeven uitrekenen, maar is toch interessant ter controle.

727,059
d Tussenvariantie MSG = 2 = 1363,531

e Als a = 0,05 dan is de rechtergrenswaarde in de F(2,14)-verdeling gelijk aan


13,741.
De toetsingsgrootheid MSG/MSE ~ F(2,14)-verdeling.
In feite blijkt: MSG/MSE = 14,351EZHo
Dus H verwerpen: het behaalde gemiddelde rendement is voor de drie
0

groepen niet gelijk.


Opmerking
In plaats van de gevonden F = 4,35 te vergelijken met de grenswaarde voor
F = 3,74, kun je ook kansoppervlakken vergelijken:
de overschrijdingskans (PE(2,14) > 4,35) = 0,034 met a= 0,05.

278 Hoofdstuk 12 - Variantieanalyse


Opgave12.2

Deze opgave heeft dezelfde structuur als opgave 12.1. Nu eens via Excel.
Typ eerst de gegevens, op dezelfde wijze als in de opgave wordt gesugge-
reerd.
Kies Extra- Gegevensanalyse- Unifactoriële variantieanalyse- OK.
Vul in: achter Invoerbereik $A$1:$C$9 of $A:$C, Groeperen per kolom,
Alfa is 0,05 en kies een Nieuw werkblad.
Het programma geeft onder andere:
• gemiddelde van de kolommen: 6,33 11,62 16,01
• kwadratensommen: SSG = 422,36 en SSE = 591,54;
opgeteld: SST= 1013,89
• tussenvariantie: MSG = 422,36/2 = 211,18;
binnenvariantie: MSE = 591,54/21 = 28,17
MSG 211,18
• de toetsingsgrootheid i s : - - = - - = 17,50 I
MSE 28,17
• deze toetsingsgrootheid volgt een F(2,21)-verdeling met
P(f(2,21) > 7,50) =I 0,00351 als rechteroverschrijdingskans
• als je deze kans vergelijkt met Ia = 0,051 , blijkt de gevonden waarde van
de toetsingsgrootheid 'royaal' in ZHo te liggen.

Dus H 0 verwerpen: de rendementen liggen niet alle op hetzelfde niveau.

Opmerking
Overigens is de grenswaarde van F(2,21) bij rechtseenzijdig a= 0,05 gelijk
aan 13,471.

Opgave12.6

Gebruik een Excel-spreadsheet om de gegevens vast te leggen, zoals in de


opgave is aangereikt.
Gebruik: Extra- Gegevensanalyse- Multifactoriële variantieanalyse zonder
herhaling. OK.

a Voor de blokken ( = rijen, ofwel de dagen van de week) is de aanpak dezelfde


als hiervoor.
MSB 1495,14
Zie output: toetsingsgrootheid --= = 1444,321 EZ.
MSE 3,365 · ·

De grenswaarde is immers F( 4,16) = 13,011 .


Dus ook hier H 0 verwerpen: de gemiddelde niveaus van luchtverontreini-
I I
ging zijn niet voor alle dagen van de week gelijk.

Hoofdstuk 12- Variantieanalyse 279


b Voor de behandeling(= de kolommen, ofwel de waarnemingsstations) geldt:
Ha: flA = flB = flB = flc = flD
H 1: niet alle fl's zijn gelijk
1
De toetsingsgrootheid is het quotiënt van de tussenvariantie van de behan-
delingen (kolommen) en de binnenvariantie: MSG/MSE.
Onder H 0 : MSG/MSE - F((5 -1), (5 -1) (5 -!))-verdeling.
Met a= 0,05 is de (rechtseenzijdige) grenswaarde F(4,16) =13,011
(zie output).
MSG 114,84
In feite blijkt--=--= 134,131 EZ (zie output).
MSE 3,365
Dus ook hier weer Ha verwerpen: de gemiddelde niveaus van luchtveront-
reiniging zijn niet voor alle Istations Igelijk.
Ter informatie: de steekproefgemiddelden zijn respectievelijk 45,4; 49; 53,6;
48,2; 40,6.
Opmerking
Zonder meerdere waarnemingen per cel kunnen we niet bekijken of er
sprake is van interactie.

Opgave12.8

a • Ho:flA=flB=fl c

H 1 : niet alle fl' s zijn gelijk

• voor A: x= 180L(x;-x)2=860
voor B: x = 189,17L(x; - x)l = 469,67
voor C: x= 175L(X;- x) 2 = 578
lssE = 1907,671
allemaal x= 181,39
SSE 1907,7
• Binnenvariantie MSE = - - = - - = 157,811
36-3 33
De kwadratensom over (alle elementen minus x ):
c nj

SST= LL(xij - x) 2 = 13.146,561


} I

SSG = 12(180 - 181,39) 2 + 12(189,17 - 181,39)2 + 12(175 - 181,39)2


= 11238,891
Opmerking: er moet gelden: SST = SSG + SSE en dat klopt!
1238,89
• DetussenvariantieMS G = 2 =1619,441

280 Hoofdstuk 12 - Varia ntieanalyse


• Als a= 0,05 dan is de rechtergrenswaarde in de F(2,33)-verdeling gelijk
aan 3,29
Dus I:ZH,=3,29, ~)1 AH,=[O, ~3,29)
De toetsingsgrootheid MSG/MSE- F(2,33)-verdeling.
In feite blijkt de MSG/MSE = 619,44/57,81 = 110,721E:ZHo
Dus H 0 verwerpen: de drie balsoorten leggen gemiddeld niet alle dezelfde
afstand af.
Ook met Excel
• Breng de gegeven matrix precies over op een Excel-werkblad.
• Extra- Gegevensanalyse- Unifactoriële variantieanalyse - OK.
• Invoerbereik de gezamenlijke coördinaten van de drie kolommen met
baltypen, inclusief de kolomhoofden.
• Vink aan: Labels in eerste rij.
• Kies a= 0,05.
• Kies voor het uitvoerbereik een nieuw werkblad.
• OK.
Zie bij de output de gemiddelden als hierboven.
Zie ook de kwadratensommen tussen de groepen (SSG), binnen de groepen
(SSE) en totaal (SST).
Zie de tussenvariantie (gemiddelde kwadraten tussen groepen) (MSG) en de
binnenvariantie (gemiddelde kwadraten binnen groepen) (MSE).
Zie de F-waarde (MSG/MSE).
Zie de grens van :Z(3,28).

Hoofdstuk 12- Variantieanalyse 281


Opgave 12.11

• Voer de getallen in op een Excel-werkblad zoals aangegeven.


• Kies Extra, Gegevensanalyse, Multifactoriële variantieanalyse met herha-
ling en OK.
• Vul het dialoogvenster in: het invoerbereik met een stippellijn 'strak' om
de hoekpunten meststof en 23, het aantal rijen per steekproef 4,
Alfa = 0,05, Nieuw werkblad en OK.
• Data en output zien er, na wat tekstwijzigingen en reductie van het aantal
decimalen, als volgt uit.

Oogst Meststof Tarweras


A 8 c 0
1 25 31 36 27
27 33 38 29
26 35 39 29
30 37 39 31

2 32 34 40 32
33 37 43 32
35 38 44 33
36 40 45 35

3 19 33 30 20
21 35 31 20
23 36 33 21
25 36 34 23

Multifadoriële variantieanalyse met herhaling


.. . ... ·-· ·• . ... ..
Bronvan Kwadr. Vrijh. Gemidd. F P-waarde Grens
variatie som grad. kwadr. F-toets
Steekproef 694,04 2 347,02 90,04 9,78E-15 3,26
Kolommen 975.56 3 325,19 84,37 2,38E-16 2,87
Interactie 160,13 6 26,69 6,92 5,99E-o5 2,36
Binnen 138,75 36 3,85
Totaal 1968,48 47

a Bij de variantieanalyse valt op dat de drie mogelijke nulhypothesen alle drie


verworpen worden, blijkens de vergelijking van de gevonden F-waarden (en
hun zeer kleine overschrijdingskansen) met de kritische F-grenzen.
Het gaat om de nulhypothesen aangaande de rassen (steekproef), de mest-
stoffen (kolommen) en interactie tussen beide.
Kort door de bocht: de nulhypothese die stelt dat er geen interactie is, wordt
verworpen omdat de toetsingsgrootheid MSI!MSE = 16,921 EZ Ho bij grens-
waarde G = 12,361 in de F(6,36)-verdeling.

282 Hoofdstuk 12 - Variantieanalyse


b H 0 : er is geen verschil in opbrengsten tussen de tarwerassen, dus:
Ho: flA = flB = flc = flo
H 1 : niet alle fl's zijn gelijk, rechtseenzijdige toets met a= 0,05
De toetsingsgrootheid is MSG/MSE.
Onder H 0 : toetsingsgrootheid MSG/MSE ~ F(4- 1,4 • 3(4 -1)),
dus F(3,36)-verdeling.
I Fc = 2,871 (zie output)
E(3,36)
zH.=[ , ~) AH.=(f-,
Cl =0.05
.... MSG
In feite blijkt - - = 184,3 71 E ZH
MSE •
(zie output).
Dus H 0 verwerpen en H 1 accepteren: de opbrengsten per tarweras zijn
Iongelijk I·
c Analoog: H 0 : er is geen verschil in opbrengst ten gevolge van de meststoffen.
Dus:
Ho: fl1 = flz = fl3
H 1: niet alle fl's zijn gelijk.
Onder H 0 : toetsingsgrootheid MSB/MSE ~ F(2,36)-verdeling met
IF= 3,261.
In feite blijkt MSB/MSE = 190,041EZHo (zie output).
Dus H 0 verwerpen: meststoffen genereren verschillende opbrengst.
Opmerking
Analoog is vast te stellen dat er interactie is tussen de rassen en de invloed
van de meststoffen. De nulhypothese die stelt dat er geen interactie is, wordt
verworpen omdat de toetsingsgrootheid MSI/MSE = 6,92 EZ bij grens-
waarde G = 2,36 in de F(6,36)-verdeling.

Hoofdstuk 12- Variantieanalyse 283


Hoofdstuk 13 - Regressie en correlatie

Opgave13.4

a Te verklaren (gevolg): promillage (Y); verklarend (oorzaak): gewicht (X)

b De vergelijking van de regressielijn: Y = a + bX met


nLXY-LXLY
b= en a=Y-bX
nLX2 -LXLX

~ •~• . •. . . •..... . . . .... . . ....... •. ·~ . .... . •• •.'t. •·-


x y XY x• y•
61 1,06 64,66 3721 1,1236
82 0,77 63,14 6724 0,5929
86 0,72 61,92 7396 0,5184
70 0,95 66,50 4900 0,9025
96 0,65 62,40 9216 0,4225
80 0,83 66,40 6400 0,6889
67 0,99 66,33 4489 0,9801
90 0,73 65,70 8100 0,5329
75 0,84 63,00 5625 0,7056
73 0,96 70,08 5329 0,9216
~ 780 8,50 650,13 61900 7,3890

780 8,50
X= -=78 Y =-=0,85
10 10
(10. 650,13)- (780. 8,5) 6501,30- 6630 -128,7
b = (10. 61900) - (780. 780) = 619000 - 608400 = 10600 = 1-0' 0121415 1
a= 0,85-(0,0121415 X 78) = 11,79701
Dus IY= 1,797- 0,01214XI
De gevraagde regressielijn: IY= 1,797- 0,01214XI.
Een grafiek is een mooi controlemiddel; dus aan de slag!
n LXY - LXLY n LXY- LXLY -128,7 - 128,7
c r2 = = - - - · - -- - - -- --
n LX2 - LX LX n Lyz- LYLY 10600 10 x 7,3890-8,5 x 8,5
= 0,9528...

Ir- 0,9761 (kies bij deze worteltrekmanoeuvre het min-teken: er is een


negatieve samenhang; zie ook de richtingscoëfficiënt b in de regressielijn).

d Y = 1,7970 - 0,01214 · 85 = I0,7651 promille.

284 Hoofdstuk 13 - Regressie en correlatie


e Beschouw de formule van b.
In de teller staat in beide termen een Y-achtige factor. Die teller wordt 20%
groter, dus de oude *1,2. De noemer blijft gelijk.
Beschouw de formule voor a. De term met Y wordt 20% groter, dus de oude
*1,2.
Resultaat: I Y= 2,1564- 0,01457XI.

Opgave13.6

a Met Excel.
• Extra- Gegevensanalyse-Regressie- OK.
• Markeer de kolom van invoerbereik Y (eindtentamen), inclusief het
woord eindexamen.
• Markeer de kolom van invoerbereik X (tussentoets), inclusief het woord
tussen toets.
• Zet een vink bij labels.
• Markeer een lege cel om het resultaat in te kunnen zetten .
• Druk op OK.
• Het resultaat staat op een volgend blad.
• Maak de velden daarvan wat breder zodat de volledige kopteksten zicht-
baar zijn.
• Kijk bij coëfficiënten en destilleer daaruit het gevraagde resultaat:
Eindexamencijfer = 3,38 + 0,94 Tussentoetscijfer.
Opm. Als het cijfer voor de tussentoets één punt hoger is, leidt dat gemid-
deld genomen (ook) bijna tot een één punt hoger eindexamencijfer.

b Tussentoets 40 ~ Eindexamen 40,8 ~ ~


Tussentoets 80 ~ Eindexamen 78,2 ~ ~

Opgave13.8

y
. . ..".. . ......
10
~

11 12
. . . .. ~

-x
1 0,2 0,1 0,3
2 0,1 0,2 0,1 0,4
0,1 0,3
3
0,3
0,2
0,5 0,2 1,0
- - --

b E(X) =IX· f(X) = (1 · 0,3) + (2 · 0,4) + (3 • 0,3) = 0


E(X) = !-Y · f(Y) = (10 · 0,3) + (11 · 0,5) + (12 · 0,2) = 110,91
Var(K ) =!-(X- E(K)) 2 • f(X) = (-1) 2 • 0,3 + (0) 2 • 0,4 + (1) 2 • 0,3
=I 0,61 ~ u(K) = 0,77

Hoofdstuk 13- Regressie en correlatie 285


Var(Y) = I(Y- E(Y))Z · f(Y) = (-0,9) 2 • 0,3 + (0,1) 2 • 0,5 + (1,1) 2 • 0,2
=I 0,491 ~ u(Y) = 0,7

c Cov(X_, Y) = I(X- E(X)) ( Y- E(Y)) • f(X, Y)


= [(1- 2) (10- 10,9). 0,2 + (1- 2) (11- 10,9). 0,1 + 0]
+ [(2- 2) (10- 10,9). 0,1 + (2- 2) (11- 10,9). 0,2
+ (2- 2) (12- 10,9). 0,1]
+ [0 + (3- 2) (11- 10,9). 0,2 + (3- 2) (12- 10,9). 0,1]
= 0,18 - O,ül + 0
0 +0 +0
0 + 0,02 + 0,11
=0,30
Kortom: Cov(K, Y) = I0,30 I

d Deze maat voor samenhang zegt nog niets; pas na standaardiseren, te berei-
ken doordeling door u(K) en u(Y), ontstaat de correlatiecoëfficiënt p(~ X):
Cov(2~, X) 0,30
p(X, X) = = = I0,561, een zwak verband.
- - CT(K) • u(Y) 0,77 · 0,77
Opmerking over p
Om redenen, waarop ik hier niet inga, is een p = 0,56 allerbelabbertst; er is
dan nauwelijks sprake van enig verband, dus van enige verklaring van ver-
schijnsel Y uit verschijnsel X, van enige afhankelijkheid. We moeten immers
eigenlijk kijken naar p 2 = 0,31 als aanduiding van welk deel van de variantie
in de Y-waarden wordt verklaard uit oorzaak X; de rest van die variantie
wordt toegeschreven aan het toeval.

e g= ,! + ~

E(~) = E(,!) + E(~) = 2 + 10,9 = 112,91


Var (g) = Var(,!) +Var(~) + 2Cov(,!, ~) = 0,6 + 0,49 + 2 · 0,3 = 11,69 1
Î Î
eindelijk afhankelijk Ziec

dus eindelijk niet 0 vanwege O.O.

Î
CT(z) = 1,3

286 Hoofdstuk 13- Regressie en correlatie


Opgave 13.11

• ... • • e4 a • • ·• • • • h•·• ~· • • • •·•A• •-~ . .. .. . •-•


Scores Rang
A 8 A 8 d d·
40 88 8 1 7 49
60 34 2 7.5 -5.5 30,25
6 -2 4
50
45
45
80
4
5,5 3 2,5 6,25
-
- -6,5 42,25
74 35 1 7,5
53 60 3 5 -2 4
45 79 5.5 4 1,5 2,25
42 85 7 2 5 25
0 163

6. 163
Spearman: R = 1 -
8(64- 1)
= 1-0,940 I
De Ranges vertonen een tegengestelde samenhang.

Opgave 13.15

X, de cilinderinhoud~ 'oorzaak'; Y, de maximumsnelheid~ 'gevolg'

a Spreidingsdiagram
Opmerking
In principe zou je de verticale as door middel van een scheurlijn bij circa
100 kunnen laten beginnen. Toch kan dat ooit een tikje vervelend zijn voor
het maken van een 'gokje', namelijk in dát geval dat de verticale afsnijding
(het verticale intercept), a dus, ónder de scheurlijn zou uitkomen.
Gokje: Y = 38 + BOX
Î
y 160
r.c.=-=80
2
200

I
100 I (160)

(~ I
=38

2 x

Hoofdstuk 13- Regressie en correlatie 287


b

... . . •· .. ·-·. ... ... .. .. •···. ....L .


x y Weer eens via 'kleine' x en y x L ~
x•
1,2 140 x= 1,3 -0,1 0 0 0,01 0
0,8 110 y- = 140 -0,5 -30 15 0,25 900
0,8 100 x= X-X -0,5 -40 20 0,25 1600
2,0 180 y=Y-Y 0,7 40 28 0,49 1600
1,4 150 0,1 10 1 0,01 100
1,0 100 -0,3 -40 12 0,09 1600
1,6 160 0,3 20 6 0,09 400
1,8 190 0,5 50 25 0,25 2500
1,3 140 0 0 0 0 0
1,1 130 -0,2 -10 2 0,04 100
-
13,0 1400 109 8800

Uy -109 =7365 }
b=-=
b= ~X 2 ~,48 ' IY= 44,26 + 73,65XI
a = Y - bX = 44,26
waarschijnlijk goed gerekend
(zie gokje)

c yc = 44,26 + 73,65 · 1,5 = 1154,74 km/uur Ibij X0 = 1,5 liter.

d De variantie van de storingsterm gaat alleen over .Ql


L(e - e) 2 L(e- 0)2 Le 2
u~ wordt geschat met: û~ = s! = - - - -
n-2 n-2 n-2
Dus met v = n - 2, omdat ~ berekend wordt ten opzichte van de optimaal
bij de punten passende lijn Y=a + bX, vastgelegd door twee gegevens.

1,2 140 7,36 54,17


0 ,8 110 103,18 6,82 46,51
0,8 100 103,18 - 3,18 10,11
2,0 180 191,56 -11,56 133,63
1,4 150 147,37 2,63 6,92
1,0 100 117,91 - 17,91 320,77
1,6 160 162,10 -2,10 4,41
1,8 190 176,83 13,17 173.45
1,3 140 140,01 - 0,01 0,00
1,1 130 125,28 4,72 22,28
0 772,25

288 Hoofdstuk 13 - Regressie en correlatie


Le 2 772,25
û E2 =s2e =--=--=169531
n- 2 >
~û E =s e =983
>
8
i
gevraagd

e û2
F
= s2
F
1 (x -
= SJe { 1 + - + ----:0~
-xy}
=---
2
n .t:.JX

1 (1,45- 1,3)2}
=69,53 { 1 + - + = 107,65~ûF = 10,37
10 1,48
X 0 = 1,45 ~ Y' = 44,26 + 73,65 · 1,45 = 151,05 km/u
We kennen dan:
• het centrum van het voorspellingsinterval151,05 km/u,
• de schatting voor de standaardafwijking van dat interval, namelijk
10,37 km/u,
• en we zullen vanwege die schatting de t-verdeling gebruiken bij
v= 10-2 = 8 en 1a = 0,025 ~ t= 2,306.

Dus:
151,05- 2,306. 10,37 < y < 151,05 + 2,306. 10,37
<=> 1127,17 < y < 174,961

f Als een toegift berekenen we ook nog eens de productmomentcorrelatiecoëf-


ficiënt. In kleine letters geschreven geldt:
Lxy Lxy 109 109
r 2 = - · - = - • - - = 0,9122
LX 2 LY 2 1,48 8800
Omdat de regressie duidt op een positieve samenhang (dus b > 0), moet
ook r positief worden gekozen. Dus:

Extra
Omdat in diverse uitwerkingen Excel zal worden gebruikt, wordt opgave
13.15 nog eens gedeeltelijk uitgewerkt, maar dan met Excel. De Excel-resul-
taten kunnen dan vergeleken worden met de klassieke uitwerkingen, om
zodoende meer vertrouwen te krijgen in Excel.
• Neem de gegevens in twee kolommen over op een Excel-werkblad.
• Ga naar Extra, Gegevens, Regressie, OK.
• Vul het dialoogvenster in: het invoerbereik van Y en van X desgewenst via
de gestippelde omkadering van de respectievelijke kolommen (alleen de
getallen!), het Betrouwbaarheidsniveau is 95% en kies ook voor Storin-
gen. OK.
• Verwijder de regels over variantieanalyse.
• Reduceer het aantal decimalen tot drie en verbreed de kolommen tot alle
tekst volledig zichtbaar is.

Hoofdstuk 13- Regressie en correlatie 289


• Vanwege de overzichtelijkheid en plaatsbepaling is een en ander herschikt
en in een 8-punts letter afgedrukt.
Toelichting
• Meervoudige correlatiecoëfficiënt R ~ zie opgave f met r = 0,9551
• R-kwadraat ~ zie opgave f met r 2 = 0,9122
• Standaardfout ~ zie opgave d met s. = 9,83
• Coëfficiënten Snijpunt ~ zie opgave b met a = 44,26
Variabele X1 ~ zie opgave b met b = 73,65
• Bij Coëfficiënten kan het belangrijkste afgelezen worden: de regressielijn:
I
y =a+ bX ~ Y= 44,26 ... + 73,65 ... xl
• Bij de STORINGEN geeft de eerste kolom voor elke X de bijbehorende
Y-waarde op de regressielijn.
De tweede kolom geeft voor elke X de afwijkingen van 'werkelijke' (dus
gevonden Y-waarde) metdeY-waarde op de regressielijn.
• Door middel van een paar Excel-manoeuvres zijn deze storingen te kwa-

:::~::,0: ·:~::,!e~:· 9,83 (rie d '" het be~ vm de"


extra Excel-toelichting).
Opmerking
Er is ook nog via fx, Statistisch, LIJNSCH. en OK iets van dit alles te ha-
len bij onder andere LIJNSCH(atting). Vul het tableau in met de coördi-
naten van alleen de getallen, tweemaal 'niks' en niet OK, maar
Ctrl+Shift+Enter. (Wel eerst twee naast elkaar liggende cellen reserveren
voor de output: a = 44,26 en b = 73,65 als gezocht wordt naar
Y= a+ bX.)

290 Hoofdstuk 13 - Regressie en correlatie


Hoofdstuk 14 -Indexcijfers

Opgave14.6

q09 2100 ~
a Axel : QE = - • 100 = - - • 100 = 87,5
08,09 2400
q08

q09 420 ~
Berlina QE =-·100=-·100= 93,3
08,09 450
q08

q09 280 ~
Cornet QE =-•100=-•100= 147,4
08,09 190
q08

q09 1320 ~
Dubio MPV: QE08,09 = - · 100 = - - · 100 = 161,0
820
q08

s - LQE(i)- 87,50 + 93,33 + 147,37 + 160,98- [I§


Q0809____ - 122,3
· n 4
ongewogen samengestelde hoeveelheid

b Via de directe schrijfwijze:

L =
Q08,09 ~Po8q09. 100
~
""- Po8q09
(24.000 . 2.100) + (57.500. 420) + (88.500. 280) + (57.500 . 1.320)
--------------------------------------------- ·100
(24.000. 2.400) + (57.500. 450) + (88.500. 190) + (57.500. 820)

175,23. 10 6
= · 100 =ll18,81
147,44. 10 6

c Via de directe schrijfwijze:

QP = ~Po9qo9. 100
08,09 ~
"'-Po9q08
(25.750. 2.100) + (59.500. 420) + (84.500. 280) + (56.000. 1320)
------------------------------------------- ·100
(25.750. 2.400) + (59.500. 450) + (84.500. 190) + (56.000. 820)
176,65 . 10 6
= . 100 = ll17,31
150,55. 10 6

Hoofdstuk 14 -Indexcijfers 291


Opgave14.7

a We kennen de aantallen uit de basisperiode en gaan dus op zoek naar het sa-
mengesteld prijsindexcijfer van Laspeyres. Er wordt nu eens gekozen voor de
directe schrijfwijze.

PL = ~p14iql1i 100
11,14 ""
.L.J p 11i q11i
x
340. 1 + 208. 1 + 1,74. 2200 + 3,5. 35 + 220 . 2
- - - - - - - - - - - - - - - - x 100
270 . 1 + 186 • 1 + 1,35 • 2200 + 2,0 . 35 + 240 . 2
4938,5
= - - x 100=1124,21
3976

b Het gebruik van de hoeveelheidscijfers uit de objectperiode 14 leidt tot een


overeenkomstig samengesteld indexcijfer, maar dan van Paasche.
(De hoeveelheden spreken voor zich.)

PP = ~p14iq14i OO
11,14 "" x1
.L.J p lli q 14i

340. 1 + 208. 1 + 1,74 . 1980 + 3,5. 45 + 220. 1


- - - - - - - - - - - - - - - - x 100
270 . 1 + 186. 1 + 1,35 . 1980 + 2,0. 45 + 240. 1
4370,7
= - - x 100=1126,41
3459

c De totale operationele kosten gaan van ~P 11 ;q 11 ;

naar ~pl4iq 14 ;, dus van 139761 naar 14370,71


7370,7
Uitgedrukt in het waarde-indexcijfer is dat W1114 = - - X 100 = 1109,91
. 3976

Opgave14.9

118,42
a Q~3 •04 (J) = ----wB · 100 = 1109,651

104,79
Q~3 .o4 (II) = ----w:1· 100 = 1100,761
160
Q~3,04 (JIJ)= 110. 100 = 1145,451

292 Hoofdstuk 14 -Indexcijfers


b

Deze directe formule brengt ons niet verder. Maar er geldt ook een indirecte:

De opbouw van deze formule is als volgt:

"" (omzet in 2003 van één type) . ..


=~ · enkelvoudig pnJS
(omzet in 2003 van de drie typen samen) indexcijfer (03,04)

=relatieve omzet in 2003 van één type· enkelvoudig prijsindexcijfer (03,04)


152 334 50
-----·108+ ·104+-------
(152 + 334 + 50) (152 + 334 + 50) (152 + 334 + 50) . 100

= (0,2836. 108) + (0,6231. 104) + (0,0933. 110) = 1105,71

c • P~3 •04 kan meteen (zie b) uit de gegevens worden gehaald ~ 105,69.
• Ook Wg 3,04 haal je uit de gegevens:
totale waarde 2004 610
- - - - - - . 100 = - . 100 = 113,81
totale waarde 2003 536
• Er geldt pL • QP = W 5 • 100 (zwakke productrelatie).

wg3o4 113,81 ~
Dus ook QP
03,04
= -pL- · · 100 = - - · 100 = 107,7
105 69
03,04 )

Hoofdstuk 14 -Indexcijfers 293


Hoofdstuk 15- Tijdreeksen

Opgave15.3

....... •·. . . .... ..


.,
Weken
· ~·

Aantal
-40-
., · - · · ·~·

V.G.(3)
........ ..................... .
V.G.(4)
·~·

Gecentreerd
1
2 45 45
.............. 47,5
3 50 50 50
.............. 52,5
4 ss 55 55
.............. 57,5
5 60 60 60
..............
-
62,5
6 65 65 65
.............. 67,5
7 70 70 70
.............. 72,5
8 75 75 75
.............. 77,5
9 80 80
10 85

Opgave15.6

a Y 1 = 20 = 20,00 Y5 = (0,3 • 32) + (0,7 · 24,51) = 26,75


y2 = (0,3. 18) + (0,7. 20) = 19,40 y6 = (0,3. 28) + (0,7. 26,75) = 27,13
y3 = (0,3. 30) + (0,7. 19,4) = 22,58 y 7 = (0,3 . 30) + (0,7. 27,13) = 27,99
y4 = (0,3. 29) + (0,7. 22,58) = 24,51 Y 8 = (0,3 · 31) + (0,7 · 27,99) = 28,89

b Bij grote a zijn het vooral de meest recente cijfers die meewegen in de geëf-
fende trendreeks. Als a kleiner is zullen de historische cijfers ook mede bepa-
lend zijn, hetgeen leidt tot een gladder (gemiddeld) verloop van de trend,
minder fluctuerend dus dan de oorspronkelijke tijdreeks.

c Y 5 = aY5 + a(1- a)Y4 + a(1- et) 2 Y3 + a(l- a)3 Y2 + a(1- et) 4 Y1


Dus wegingsfactor: 0,1 · (1- 0,1) 4 =0,1 · 0,9 =I 0,06561 .
4

d Nog eens met Excel.


• Maak één kolom met de gegevens en voeg de laatste waarde nog eens toe.
• Kies Extra, Gegevensanalyse, Exponentiële demping, OK.
• Vul het dialoogvenster in:
Invoer: de coördinaten van de datakolom.
Demping: 0,7 (bij a= 0,3).
Uitvoer: de coördinaten van een kolom naast de datakolom. OK.
• De geëffende waarden van reeks 1 worden dan zichtbaar.
• Reduceer het aantal decimalen tot 2.

294 Hoofdstuk 15- Tijdreeksen


• Herhaal de procedure nog eens met dempingsfactor 0,9 en een output-
kolom voor reeks 2 naast die van reeks 1.
Hierna worden outputreeksen in één grafiek weergegeven. Ga daartoe als
volgt te werk:
• Markeer beide outputkolommen (alleen de getallen!).
• Kies Wizard Grafieken en Lijndiagram.
• Kies het prentje met twee elkaar kruisende grafieken mét 'markerings-
symbolen'.
• Druk tweemaal op Volgende, vul de tekst in bij titel en assen.
• Maak je keuze bij stap 4 en Voltooi de bewerking.

....
Data
.·-· .... .. .
a= 0,3 a=0,1
Exponentiële effening

20
-#NB #NB
ê
äl 40 - . - - - - - - - - - ,
--
18
30
20
19,4
-
20
19,8
~ ::1
i ,~ i I I I I
I I t
i I
ct j l= ::~:~1
29 22,58 20,82
0 12345678
32 24,51 21,64
maand
28 26,75 22,67
30 27,13 23,21
31 27,99 23,89
31 28,89 24,60

Opgave15.7

a Kies jan~ t= 1.

Jaar
. . . . ". -.- •·
t y txY t•
. ·• ~· .·-
ja~
feb
-- 1---
2
1,32
1,38
1,32
2,76
- -1 ----
4
mrt 1,36 4,08
-- -
3 9
ap.!:_ __ 1,44 5,76 16
mei
4
5 1,42 7,10 25
--- - -- -----
--·--
juni 6
- 1,43 8,58
-------
36
juli
- 1,37 9,59
7 49
aug 8 1,42 11,36 64
sept 9 1,46 13,14 81
--- -------
okt 10 1,48 14,80 100
-------
nov 11 1,52 16,72 121
----
-
dec 12 1,53 18,36 144
2:
--- -
78
- - -- - - - - -650
17,13 113,57
- -- ------
Zoek lineair Y =a + bt met:
n~tY- ~ Y~t (12 ·113,57)- (17,13 • 78) 26,7
b= = - - - - - - - - - - - - = 0,00355688
n~t2- ~t ~t (12 • 650)- (17,13 · 17,13) 7506,56

Hoofdstuk 15- Tijdreeksen 295


a= Y- bt = 1,4275- (0,00355688 • 6,5) = 1,4043808
IY = I I
1,404 + 0,0036t met jan ~ t = 11 en t in maanden

b De voorspelde benzineprijs per eind januari van het nieuwe jaar ( t = 13) is
Y= 1,4043808 + 0,00355688 · 13
= 1,4506 ~ 11,4511
Opgave 15.11

Ik veronderstel voortschrijdende gemiddelden over vier kwartalen na cen-


treren.

a Zie tabelopbouw: 270 als trendcijfer voor 2008-1.

b Het rekenmechanisme maakt duidelijk dat de vier 4-periodensommen met


een* mede tot stand zijn gekomen door 2005-IV ~ 0 en dat werkt door in
de vijf streepjes halverwege de tabel.
De twee streepjes aan het begin en de twee streepjes aan het eind zijn evi-
dent.

c Kwartaalomzetten van Hotel Sammerdriem (*€ 10.000)

I 2oo4 I 2oos I 2oo6 I 2001 I 2ooa I

Er is een niet hevige trendbreuk: beschouw daarom alleen de tweede groep


cijfers. Het lijkt alsof de afwijkingen ten opzichte van de trend groeien sa-
men met de positieve trend (zie de betreffende kolom met componenten), in
de figuur tot uitdrukking komend in twee wijkende begrenzingslijnen. Dus
neiging tot de keuze voor een multiplicatief model, nog eens bevestigd door
de kolom met indices: prachtig stabiel, voorzover dat over zo'n korte reeks
gesteld kan worden. Ook vóór de trendbreuk traden dezelfde indices op.

296 Hoofdstuk 15- Tijdreeksen


d Seizoenpatroon in indices:
kwartaal I ~ 0,50
kwartaal II ~ 1,00
kwartaal III ~ 1,80
kwartaal IV ~ 0,70

2,=4

minustrend
2005 I 118
11 237
945
111 425 236 189 1,80
944
IV 165 236 - 71 0,70
942
2006 117 235 -118 0,50
939
11 235
774*
111 422
784*
IV 0
807*
2007 127
857*
258
1043
111 472 262 210 1,80
1051
IV 186 265 -79 0,70
1066
2008 135 270 -135 0,50
1091
11 237 274 -1 1,00
1100
111 497 276 221 1,80
1105
IV 195 277 -82 0,70
1114
2009 140 280 - 140 0,50
1128
11 282 283 -1 1,00
1133
lil 511
IV 200

Hoofdstuk 15 - Tijdreeksen 297


e Omzet 12 miljoen, per kwartaal3 miljoen (bij horizontale trend).
Prognose 2011-1 ~ 0,5 · 3 = 1,5 miljoen
2011-11 ~ 1 · 3 = 3,0 miljoen
2011-III ~ 1,8 · 3 = 5,4 miljoen
2011-IV ~ 0,7 · 3 = 2,1 miljoen

~ = 12 miljoen

f De voor het seizoen gecorrigeerde omzetcijfers (via: ~mzet ) :


mdex
1,45
2010-1 ~ - = 2,90 miljoen
0,5
2,94
2010-11 ~ -=2,94miljoen
1
5,33
2010-III ~ - = 2,96 miljoen
1,8
2,08
2010-IV ~ - - = 2,97 miljoen
07

298 Hoofdstuk 15- Tijdreeksen


-- - - --"

- - - - - - - - -
Statistiek om mee te werken geeft een compleet Inclusief
beeld van statistische methoden en hun
toepassingen. Het opgaven- en uitwerkingenboek Website:
volgt de indeling van het leerboek en behandelt www.statistiekommeetewerken.noordhoff.nl
vervolgens: - Excel-bestanden
• Maatstaven voor ligging en spreiding - Met de voucher in dit opgavenboek krijgen de
• Kansrekening studenten toegang tot de uitgebreide en extra
• Kansvariabelen, zoals normale verdeling, binomiale uitwerkingen.
verdeling en paissenverdeling
• Schatten
·Toetsen
• De chi-kwadraatverdeling
• Verschiltoetsen
• Variantieanalyse
• Regressie en correlatie
• Indexcijfers
• Tijdreeksen

Met het leerboek kunnen studenten:


• Snel aan de slag, ook zonder uitgebreide Prof dr. A. Buijs is als hoogleraar Bedrijfseconomie
wiskundige voorkennis verbonden aan de Utrecht School of Economics van
• Zelfstandig analyses uitvoeren de Universiteit Utrecht. Tevens doceert hij Statistiek
• Zelfstandig resultaten beoordelen en Kwantitatieve Methoden aan Universiteit
• Werken met Excel Nyenrode en is hij regelmatig gastdocent aan
• Zelfstandig de stof en de vele praktijkvoorbeelden de Nelson fvfandela fvfetropolitan University in
bestuderen Zuid-Afrika. Zijn interesse gaat vooral uit naar het
gebruik van kwantitatieve methoden in gebieden
Met het opgaven- en uitwerkingenboek kunnen zoals Ondernemingsfinanciering en Beleggingsleer.
studenten
• Uitgebreid oefenen met de opgaven en
uitwerkingen

Met de voucher in dit opgavenboek krijgen de


studenten toegang tot de uitgebreide en extra
uitwerkingen. Deze zijn ook voor docenten
beschikbaar. Voor wie dieper op de stof wil ingaan,
zijn er plusparagrafen met extra materiaal.

ISBN: 978 · 90 · 01 · 71015 · 6

• ~ Wolters-Noordhoff

You might also like