Professional Documents
Culture Documents
om mee te werken
OPGAVENen
UITWERKINGEN'
Achtste druk
TM Wolters-Noordhoff
Statistiek om mee te werken
Opgaven en uitwerkingen
1
Statistiek
om mee te werken
Opgaven en uitwerkingen
Achtste druk
Wolters-Noordhoff/Groningen-Houten
Ontwerp binnenwerk: Ebel Kuipers, Sappemeer
Ontwerp omslag: Total Identity, Amsterdam
Eventuele op- en aanmerkingen over deze of andere uitgaven kunt u richten aan:
NoordhoffUitgevers bv, Afdeling Hoger Onderwijs, Antwoordnummer 13,
9700 VB Groningen, e-mail: info@wolters.nl
0 1 2 3 4 5 I 12 11 10 09 08
All rights reserved. No part of this publication may be reproduced, stared in a retrieval system,
ar transmitted, in any farm ar by any means, electronic, mechanica/, photocopying, recording,
ar otherwise, without the prior written permission of the publisher.
ISBN 978-90-01-71015-6
NUR 916
Woord vooraf
De eerste aanpassing in deze achtste editie van het opgavenboek betreft een
aantal nieuwe opgaven dat in ieder bestaand hoofdstuk is opgenomen, waar-
mee een aantal oude opgaven werd vervangen. Achterin zijn voor alle opga-
ven de antwoorden te vinden. Met het verschijnen van de achtste editie van
het theorieboek Statistiek om mee te werken is besloten de aanpak met een
afzonderlijk opgavenboek en uitwerkingenboek enigszins te wijzigen. Niet
langer zullen de uitwerkingen als een separaat boekwerk verschijnen, maar
de uitwerkingen zullen op een aantal verschillende manieren beschikbaar
worden gesteld aan de gebruikers.
Er zijn drie categorieën:
• Van een aantal van de opgaven is de uitwerking in het laatste deel van dit
-·
boek afgedrukt. Deze opgaven zijn te herkennen aan het gekleurde blokje:
• Een tweede groep uitwerkingen komt beschikbaar via een website waarop
studenten kunnen inloggen.
• Een derde groep uitwerkingen is exclusief beschikbaar voor docenten.
Bij het totstandkomen van deze editie was ir. Koen de Bont uit Eindhoven
mijn steun en toeverlaat. Hij heeft met zijn grote doceerervaring weer de
juiste toon weten te treffen bij het uitwerken van die diverse nieuwe opga-
ven. Koen, heel veel dank hiervoor!
Ik hoop dat de nieuwe opzet bij deze editie tot genoegen is van studenten en
docenten.
Arie Buijs
Woord vooraf 5
-----------------
Inhoud
3 Kansrekening 36
4 Kansvariabelen 48
5 Normale verdeling 60
6 Binomiale verdeling 70
7 De poissonverdeling 80
8 Schatten 88
9 Toetsen 98
10 De chikwadraatverdeling 109
11 Verschiltoetsen 118
12 Variantieanalyse 128
14 Indexcijfers 150
7
15 Tijdreeksen 159
18 Case-studies 186
19 Antwoorden 195
8
1 Inleidingtot de beschrijvende
statistiek
Deel A Multiplechoicevragen
ml Bij een verkeersonderzoek is een van de grootheden die wordt genoteerd het
merk van de passerende auto's. Dit merk is:
a een ratiovariabele
b een kwantitatieve variabele
c een nominale variabele
d geen variabele
m2 Zie tabel. Bij de mannen is het percentage dat het eens is met de voorgestel-
de maatregelen gelijk aan:
a 41,7%
b 10%
c 25%
d 22,7%
m3 Zie tabel. De groep mensen die het oneens is met de maatregelen bestaat
voor ... uit vrouwen.
a 20%
b 56%
c 50%
d 40%
9
Gegevens voor de vragen m4, m5 en m6:
Bij de reisorganisatie P-Tours heeft men bijgehouden hoeveel geboekte pas-
sagiers kort voor het vertrek van een busreis hun reis afzeggen. Voor 80 bus-
reizen leverde dit de volgende tabel:
1 0-< 5
2 5-< 8 24
3 8-<12 8
4 12-<16 6
5 16-<20 4
6 20en hoger 2
Totaal 80
DeeiB Openvragen
1.1 In een fabriek staat een machine opgesteld die stalen kogeltjes vervaardigt.
Omdat deze kogeltjes aan bepaalde specificaties moeten voldoen, zijn er 60
kogeltjes nagemeten.
Deze kogeltjes bleken de volgende diameter te hebben:
15.42 14,78 15,24 16,05 15,70 16,78 15,58 17,02 15,90 16,12
15,70 16,58 15,62 15,96 15,50 15.42 15.44 15,12 15,96 15,70
16,26 15,78 15,24 16,80 15,06 15,38 14,62 15,20 15,14 15,73
14,72 15,02 15,35 14,75 15,32 16,25 15,36 15,10 15,90 14,98
15,96 14,90 14,84 15,30 15,48 15,02 16,08 15,62 14,83 17,10
16,28 16,10 15,76 15,02 16,60 15,52 15,60 15,26 15,85 15,81
Antwoord
10 .
5
4
O~v---+--+--~----------~----------~--------~
14,60 15,00 16,00 17,00
Diameter in mm
0-< 10.000 2 12 12 = 6
2
10.000-< 15.000 8
15.000-< 20.000 12
20.000-< 25.000 16
25.000-< 30.000 20
30.000-< 40.000 36
40.000-< 50.000 32
50.000-< 60.000 24
60.000-<100.000 30
100.000-< 150.000 10
10 100 15,0
Inkomen € 1.000
1.3 Geef voor elk van de volgende gevallen aan of de genoemde verzameling als
een steekproef of als een populatie mag worden beschouwd:
a de commissarissen der koningin van de 12 Nederlandse provincies
b de 200 personen die zijn geïnterviewd bij een straatenquête
c de 150 automobilisten die moesten stoppen voor een alcoholcontrole
d de 740 leden van een studentenvereniging
e de 38 klanten die tussen 11.00 en 12.00 uur een postkantoor binnenkomen
f de 12 000 verzekerden bij een verzekeringsmaatschappij
g de 20 nummers die worden gedraaid in een muziekprogramma op de radio
1.4 Geef voor de volgende variabelen aan of deze een nominale, ordinale, inter-
val- of ratioschaal heeft:
a de speelduur van compact disks
b de kleur van tulpen
c de industrietak waarin werknemers een baan hebben
d de jaaromzet (in euro) van bedrijven
e het aantal sterren dat de moeilijkheidsgraad van puzzelboekjes aangeeft
f de hoogte boven de zeespiegel van wintersportdorpen
6 8 4 5 2 2 7 10 9 6 5 6 3 4 6
7 5 6 2 8 5 4 3 6 6 7 5 1 6 8
4 9 6 6 7 6 6 5 6 5 7 6 4 1 3
5 4 7 5 9 5 8 7 4 2 3 1 6 7 6
1.6 Voor een aantal beursfondsen is op 31 december van een bepaald jaar vast-
gesteld hoe hoog de aandelenkoers is ten opzichte van de in het verstreken
jaar bereikte bedrijfswinst per aandeel (de zogenoemde koers-winst-
verhouding K!W). Verder is berekend met welk percentage de omzet van het
bedrijf is gegroeid in het verstreken jaar.
Dit leverde de volgende cijfers op:
..
Bedrijf KIW
. .. ... ·-· .. . .
Groei(%) Bedrijf KIW Groei(%)
. .. . .
A 18,0 22 K 22,5 23
B 9.5 10 L 14,1 6
c 9.3 3 M 16,2 15
D 10,6 7 N 9.6 2
E 15,6 17 0 9.9 6
F 8,7 5 p 16,0 18
G 11.4 4 Q 17,7 24
H 12,7 14 R 11,8 5
10.4 8 5 13,3 12
13,9 15 T 9,2 2
• • •• • • •
Opleidingsniveau Minder dan 20 20-<30 30-<40 40-<50 soofmeer
Vmbo of lager 40 32 16 8 4
Mbo 18 22 14 10 6
Vwo 12 16 30 18 14
Hbo 4 8 16 34 18
Wo 0 6 14 26 34
• • • • •
T A A G T G T T T A A G A T G G A T A A G G A G T
A G T G T A T A T T T A G T T A T T G T T A T T G
Afbeelding 13
Frequentie-
dichtheid
(per € 200.000
omzet) 8
,------
6 -
2 -
0 - I
200400600 1000 2000
I
Omzet x € 1.000
1 .11 De brandduur van een bepaald type gloeilamp is bepaald voor 50 exem-
plaren. De resultaten zijn als volgt:
Brandduur in uren
1248 1150 1215 1380 1495 1325 1418 1060 1176 1204
1020 1292 1350 1553 1236 1310 1464 1280 1017 1360
1527 1140 1238 1347 1134 1264 1198 1618 1372 1278
1642 1394 1090 1407 1082 1262 1514 1430 1255 1424
1368 1646 1103 1385 1258 1485 1380 1270 1525 1100
Mannen Vrouwen
2.850 4.850 3.910 2.270 4.980 1.850 2.380 2.870 3.290 5.100
3.400 4.780 3.370 3.850 3.260 2.350 3.870 3.360 2.130 1.970
3.750 5.900 3.740 3.490 4.760 2.720 2.410 2.350 2.800 1.890
2.250 4.000 4.130 2.350 5.500 3.270 2.560 3.280 2.650 4.210
3.150 3.670 4.590 4.200 5.100 3.850 3.140 2.100 2.910 3.620
2.960 5.980 2.250 3.240 4.350 2.610 3.650 2.480 1.990 4.410
2.230 2.840 4.480 2.580 2.350 2.370 2.830 3.720 2.180 4.220
3.555 2.170 3.450 5.280 5.420 2.660 4.670 1.950 4.150 3.250
2.430 3.390 2.560 5.650 2.740 4.140 3.560 2.980 3.900 3.170
3.610 2.490 5.750 5.360 2.690 4.850 5.350 3.490 3.360 4.280
1.14 Van een vijftigtal auto's is het benzineverbruik bepaald. De volgende tabel
geeft de resultaten weer van een test waarbij per auto met 10 liter benzine
een bepaalde afstand werd afgelegd:
a Maak een frequentieverdeling van voorgaande gegevens. Kies een klasse van
10 eenheden breed. Begin met een klasse van 60 - < 70.
1.15 Het bedrijfsschap voor het schildersbedrijf heeft onderzocht hoe het is
gesteld met het buitenschilderwerk van de koopwoningen in een grote
gemeente. Voor een steekproef van 250 huizen werd vastgesteld hoe lang het
geleden is dat het buitenschilderwerk was gedaan. Dat leverde de volgende
tabel, waarvan helaas ten gevolge van een computerstoring nogal wat gege-
vens onleesbaar waren:
2.000-< 5.000 60
a Bereken voor de klassen de relatieve 100
5.000-<10.000
frequenties en de frequentiedichtheden. 120
10.000-< 25.000
b Teken een histogram van de verdeling.
Totaal
-
500
-
c Teken een frequentiepolygoon.
d Teken een cumulatieve frequentiecurve.
• • ••
Automerk Aantal vertegenwoordigers
Au di 40
Citroën 30
Fiat 60
Ford 350
Nissan 90
Opel 570
Peugeot 140
Toyota 130
Volkswagen 440
Volvo 70
Totaal 2000
Geef de gegevens over de leaseauto's weer door middel van een pareto-
diagram. Welke merken vormen gezamenlijk zo'n 80o/o van alle leaseauto's?
Deel A Multiplechoicevragen
m4 De variantie is:
a slecht hanteerbaar als maatstaf voor spreiding
b de wortel uit de standaarddeviatie
c een grootheid die wordt opgebouwd uit gekwadrateerde afwijkingen van
waarnemingen ten opzichte van het gemiddelde
d het kwadraat van de gemiddelde afwijking
mS Voor een steekproef van 500 werknemers van een groot concern is in 2001
de verdeling van de jaarinkomens onderzocht. Hierbij bleek dat de stan-
daarddeviatie van die inkomens 7.500 gulden bedroeg. Terwille van een in-
ternationale publicatie dienen de gegevens te worden uitgedrukt in euro's
(1 euro= afgerond f 2,20). De standaarddeviatie gemeten in euro's bedraagt
dus:
a 16.500
b 36.300
c 3.409
d 1.100
24
m6 In een boxplot kan men diverse kenmerken van een frequentieverdeling af-
lezen. Men kan hierin echter niet aflezen:
a de mediaan
b het rekenkundig gemiddelde
c het eerste kwartiel
d de hoogste waarneming
DeeiB Openvragen
2.1 Aan 20 personen die allemaal 40 jaar oud zijn, is gevraagd hoeveel jaar zij
volledig dagonderwijs hebben genoten sinds hun eerste levensjaar.
De resultaten waren als volgt:
10 16 18 16 13 21 18 20 12 15
12 9 14 10 15 12 19 12 13 10
a Bereken voor deze groep van 20 personen het rekenkundig gemiddelde van
het aantal jaren op school.
Antwoord Voor de berekening van het rekenkundig gemiddelde geldt de volgende formule:
x =- - - - -
De 20 uitkomsten leveren gesommeerd: ~x;= ....... .
Voor het rekenkundig gemiddelde vinden we dan: x = ....... .
b Bereken de mediaan.
9
21
Omdat we hier een even aantal uitkomsten hebben, geldt als mediaan:
.... + ....
xme = - - -
2
c Bepaal de modus.
Antwoord In het geval van afzonderlijkewaarnemingen zoals hier, is de modus gedefinieerd als
de uitkomst met de hoogste frequentie. Inspectie van de uitkomsten levert ons dat
de uitkomst ... . het meeste voorkomt. Dus:
GAA=-----
x=--
We moeten eerst de klassenmiddens
• • • r
b Bereken de standaarddeviatie.
s> = - - - - -
s2=-----
s= .. ......
2.3 Een docent heeft gedurende 20 weken geteld hoeveel studenten zijn lessen
hebben bijgewoond. Dit leverde als aantallen:
30 36 32 28 38 25 27 37 34 31
20 33 24 35 22 19 29 35 30 25
2.4 Een klein dorp heeft drie stembureaus: Centrum, Buitengebied Noord en
Buitengebied Zuid. Het aantal stemgerechtigden per stembureau is respec-
tievelijk 3 000, 1 000 en 1 000.
Bij bepaalde verkiezingen was het opkomstpercentage: Centrum: 60%,
Noord 40% en Zuid 40 %.
Bepaal het gemiddelde opkomstpercentage voor het hele dorp.
Deel B Openvragen 27
2.5 Een groep van 10 Nederlandse technici werkt voor een Amerikaanse olie-
maatschappij op een booreiland.
De maandsalarissen in US $ van deze technici zijn als volgt:
. .
Werknemer A
~ .•· .... ..... .. . ..
B c D E G
·•
H
- .. . .
Salaris($) 3.500 3.300 3.700 4.000 3.300 3.400 3.000 3.400 3.800 3.600
- a
b
Een groep van 10 studenten behaalde de volgende scores bij een examen:
45, 60, 82, 32, 25, 75, 65, 66, 70 en 80.
Bereken het rekenkundig gemiddelde, de mediaan en de standaarddeviatie
voor deze gegevens.
Er wordt besloten alle studenten 10 punten extra te geven. Wat is het gevolg
van deze maatregel voor de bij vraag a berekende maatstaven?
c In plaats van 10 punten voor iedereen erbij (vraag b) wordt besloten de kan-
didaten allemaal een 10 o/o hogere score te geven dan zij oorspronkelijk
gehaald hebben. Wat is de invloed van deze maatregel op de onder a bere-
kende grootheden?
2.11 Het gemiddelde inkomen (in € 1.000) van de 15 inwoners van een villawijk
bedraagt 110; de standaardafwijking van de inkomens van deze groep is 20.
a Er wordt een villa bijgebouwd. De zestiende bewoner van de wijk verdient
€ 110.000. Bereken het gemiddelde en de standaardafwijking van de inko-
mens van de zestien mensen.
b Een maand later arriveert de zeventiende bewoner. Deze verdient € 144.000.
Bereken het gemiddelde inkomen van de zeventien bewoners.
c Nog een maand later trekt de achttiende bewoner in zijn nieuwe huis. Hij
verdient € 76.000. Bereken de standaardafwijking van de inkomens van de
achttien bewoners.
Deel B Openvragen 29
2.12 Gegeven is de volgende tijdreeks van
de instroom van studenten in het
..... ...... . .. . ... .
Jaar Aantal
wetenschappelijk onderwijs (zie de
2002 26465
tabel).
2003 28300
2004 32225
De vraag is nu: wat is het gemid-
2005 32643
delde groeipercentage van het aantal
2006 34427
studenten per jaar?
2007 34512
Student A beantwoordt deze vraag
2008 35679
als volgt: het groeipercentage van
jaar tot jaar (telkens ten opzichte
van het vorige jaar) is:
2.14 Gegeven zijn 51 getallen, die de uitkomst zijn van een bepaald experiment.
Op basis hiervan wordt het rekenkundig gemiddelde berekend. Dit is 126.
De mediaan is gelijk aan 130 en de standaarddeviatie bedraagt 25. Bij nadere
controle van de gegevens blijkt dat een van de 51 getallen verkeerd is afgele-
zen. In plaats van 148 (een getal dat bij de berekening is gebruikt) moest 199
worden gelezen.
Welke waarde heeft (na vervanging van het getal148 door 199):
a het rekenkundig gemiddelde?
b de mediaan?
c 'de standaarddeviatie?
Hint: gebruik de alternatieve formule voor s2 •
2.16 Gedurende een periode van 100 dagen heeft men in een stad geregistreerd
hoeveel verkeersongelukken per dag zijn gemeld bij de politie. Het resultaat
is weergegeven in de volgende tabel:
Afbeelding 2.1
Doe op basis van deze figuur een uitspraak over mediaan, interkwartiel-
range, minimum en maximum van de verdeling.
26 84 72 112 92 1SS 7S 72
63 72 80 66 64 62 87 77 60 70
68 81 67 73 70 72 73 96 76 6S
- Bij een onderzoek in opdracht van Horeca Nederland werd onderzocht hoe-
veel geld mensen uitgeven aan eten buiten de deur. Twee groepen werden
onderscheiden, namelijk studenten die zelfstandig wonen en afgestudeerden
met minstens twee jaar werkervaring. De resultaten waren als volgt:
Gemeente A B C D E
Inkomensniveau 45 50 60 55 40
Prijsgemiddelde 150 190 250 230 130
Deel B Openvragen 33
c Welke winkel heeft de laagste huur per m 2 ?
d In welke branche is gemiddeld de hoogste vloeroppervlakte per winkel
waargenomen?
Deel A Multiplechoicevragen
m1 Bij de finale 100 meter schoolslag op de Olympische Spelen doen acht deel-
nemers mee. Het aantal verschillende volgorden waarop de drie medailles
kunnen worden verdeeld bedraagt:
a 8
b 336
c 8!
d 56
m2 Van een groep van 30 studenten worden drie studenten op basis van presta-
ties geselecteerd voor studie in het buitenland. Het aantal verschillende
groepjes dat kan worden gevormd bedraagt:
a 10
b 30 x 29 x 28
c 30 x 3!
d 5 x 29 x 28
m4 Als geldt P(A IB) = 0,30 en P(A n B) = 0,20, dan is P(B) gelijk aan:
a 0,06
b 0,50
c 0,667
d 0,60
Mannen 20 40 120
Vrouwen 20 40 20 80
Totaal 80 60 60 200
36
ms De kans dat een willekeurig gelote persoon uit deze groep een man is en te-
vens een tennisliefhebber is, bedraagt (zie tabel) :
a 0,10
b 0,20
c 0,70
d 0,167
m6 Van een willekeurig gelote persoon is bekend dat deze van wielrennen
houdt. De kans dat deze persoon een man is, bedraagt (zie tabel):
a 0,67
b 0,40
c 0,20
d 0,33
DeelS Openvragen
3.1 Een groep van acht studenten bestaat uit drie meisjes en vijf jongens.
De namen van de meisjes zijn: Anna, Bea en Carla; de jongens heten Dirk,
Ed, Frits, Gijs en Henk.
a Als de drie meisjes willekeurig in een volgorde worden geplaatst, hoeveel
verschillende volgorden zijn er dan mogelijk?
b Uit de groep van vijf jongens worden twee jongens gekozen. Hoeveel ver-
schillende groepjes van twee jongens zijn er mogelijk als de volgorde waarin
die twee verschijnen niet van belang is?
Bereken het aantal verschillende groepjes van drie studenten uit de totale groep van
acht studenten.
Deel B Openvragen 37
Bereken het aantal groepjes van twee meisjes uit de groep van drie meisjes.
Antwoord Volgorde is nu wel van belang, want Anna lste prijs, Bea 2de prijs is een ander geval
dan Bea lste prijs, Anna 2de prijs. We berekenen dus het aantal variaties.
n!
Dit levert -(- - ) = ..... variaties.
n- k!
3.2 De beroepsbevolking van een bepaald land bestaat uit ambtenaren (A), zelf-
standigen (B) en de categorie overigen ( C).
De ambtenaren vormen 20% van de beroepsbevolking, de zelfstandigen
vormen 30% van de beroepsbevolking, terwijl 50% van de beroepsbevol-
king tot de categorie 'overigen' behoort.
a We kiezen door loting één lid van de beroepsbevolking.
Hoe groot is de kans dat dit een ambtenaar is?
Rechtstreeks uit de gegevens volgt P(A) = 0,2.
Hoe groot is de kans dat de gelote persoon geen zelfstandige is?
We gebruiken de complementregel:
38 Hoofdstuk 3 Kansrekening
d Hoe groot is de kans dat een ziek lid van de beroepsbevolking tot de catego-
rie ambtenaren behoort?
Antwoord Gevraagd is dus P(AIZ). We moeten hier de omkeerregel van Bayes toepassen.
In dit concrete gevalluidt deze: ...................................................... .
3.3 Aan de finale van de 110 meter horden doen zes atleten mee.
a Op hoeveel verschillende volgorden kunnen de plaatsen 1 tot en met 6 wor-
den bezet?
b Op hoeveel verschillende manieren kunnen de medailles voor de eerste,
tweede en derde plaats worden verdeeld?
c De nummers 1 en 2 worden opgenomen in de Nederlandse selectie. Hoeveel
verschillende tweetallen zijn er mogelijk?
Op hoeveel manieren kan men een commissie van drie personen kiezen uit
150 kamerleden?
b Stel dat de Tweede Kamer bestaat uit drie partijen, A, B en C, die ieder 50
leden hebben. Op hoeveel manieren kan men een commissie van drie perso-
nen kiezen als alle partijen één commissielid leveren?
c Op hoeveel manieren kan men een commissie van zes personen kiezen als
alle partijen twee vertegenwoordigers kiezen?
3.6 Een groep van acht mannen en vier vrouwen wordt getraind op een ruimte-
vaartcentrum voor een bemande vlucht naar Mars. Uiteindelijk zullen later
vijf personen (drie mannen en twee vrouwen) worden geselecteerd om de
vlucht mee te maken. Een krant looft een grote prijs uit voor de persoon die
precies voorspelt wie de vijf geselecteerde deelnemers zijn. Op hoeveel ma-
nieren kan hier een verschillend vijftal worden gekozen?
3.7 Een restaurant heeft vijf mensen in dienst voor het serveren van maaltijden,
namelijk de dames Heleen, Jorien en Karen en de heren Hans en Paul.
Men besluit één persoon te loten om aan het eind van de avond het restau-
rant op te ruimen.
3.8 Bij een reclamebureau werkt men met zogenoemde promotieteams, die
worden samengesteld uit een bestand van ingeschreven kandidaten. Dit be-
stand bestaat uit vijf mannen en zeven vrouwen. Er moet een team worden
gevormd dat bestaat uit twee mannen en vier vrouwen.
a Hoeveel combinaties zijn er mogelijk bij de samenstelling van zo'n team?
b Van de kandidaten blijken Jan en Carla broer en zus te zijn. Hoe groot is de
kans dat beiden deel uitmaken van het gekozen team?
- a
Om een zaklantaarn te laten werken, moeten twee batterijen worden
geplaatst. Als een van de batterijen leeg is (of beide) doet de zaklantaarn het
niet.
In een doos zitten 6 batterijen. Hiervan zijn er vier goed en twee leeg.
Er worden twee willekeurig geselecteerde batterijen in de zaklantaarn
gestopt. Hoe groot is de kans dat de zaklantaarn werkt?
b Stel dat de zaklantaarn na de eerste plaatsing van twee batterijen niet werkt.
Deze twee batterijen worden weggegooid (zonder dat we weten of er wel-
licht een goede bij zat). Hierna worden twee volgende batterijen in de zak-
lantaarn geplaatst. Hoe groot is de kans dat de zaklantaarn nu wederom niet
werkt?
3.10 Bij een reisbureau boeken klanten vliegreizen (V), treinreizen (T) en busrei-
zen (B). Deze gaan naar twee soorten bestemmingen, het zijn namelijk win-
tersportvakanties (W) en zonvakanties (Z). In een seizoen werden 2000 rei-
zen geboekt. Deze boekingen zijn weergegeven in de volgende tabel:
. . . . ..... ·-·
V T B
.,..
Totaal
.. ..... . ..·-·...... . ......
w 40 60 500 600
z 760 140 500 1400
Totaal 800 200 1000 2000
Het reisbureau heeft als reclamestunt dat één van de boekingen geloot
wordt. De persoon op naam van wie deze boeking verricht is, krijgt een gra-
tis reis aangeboden.
Bepaal voor deze loting:
a P(Z), P(V) en P(T)
b P(VnT) enP(VnZ)
..
Geef aan welke kansregels hier zijn gebruikt .
Sommige gezakte kandidaten dienen een klacht in over het examen. Op ba-
sis van ervaring weten we dat lOo/o van de gezakten van examinator Dirk een
klacht indient. Bij Judith is dat 6o/o en bij Ilse is dat 3o/o.
c Er komt een klacht binnen over het examen zonder vermelding van de
naam van de exami
..
nator. Hoe groot is de kans dat de klacht over Dirk gaat?
Bij een onderzoek onder abonnees van de 'Breukelen Daily Observer', een
dagblad van internationale allure, is getracht te onderzoeken of het lezen
van de financiële pagina's van deze krant een relatie vertoont met het bezit-
ten van aandelen door de lezers. De volgende tabel geeft aan hoe groot de
kansen op allerlei gecombineerde kenmerken zijn:
a Hoe groot is blijkens voorgaande tabel de kans dat een willekeurig gekozen
abonnee 'altijd' de financiële pagina leest? Hoe groot is de kans dat iemand
'aandelenbezit' heeft? Analyseer of deze twee gebeurtenissen onderling onaf-
hankelijk zijn.
b Hoe groot is de kans dat iemand waarvan gegeven is dat hij tot de groep
'aandelenbezit' behoort, niet tot de lezers behoort die 'altijd' de financiële
pagina lezen?
c Hoe groot is de kans dat iemand waarvan gegeven is dat die niet tot de
groep abonnees behoort die 'altijd' de financiële pagina leest, aandelen blijkt
te bezitten?
3.13 Een reisgezelschap bestaat uit zeven vrouwen en vijf mannen. Men maakt
een uitstapje met een kabelbaan. De gondels bevatten elk vier plaatsen.
Door loting wordt bepaald welke vier personen met de eerste gondel gaan.
a Bereken de kans dat hierin twee mannen en twee vrouwen terechtkomen.
b Bereken de kans dat hierin een ongemengd gezelschap terechtkomt.
3.14 Bij een maatschappij zijn zeer veel mensen in dienst. Hiervan zijn 70%
mannen en 30% vrouwen. Naar behaalde diploma's kunnen de mannen
worden onderverdeeld in 10% academici, 20% hbo-ers en 70% met alleen
middelbareschooldiploma. Bij de vrouwen is die verdeling 20 % academici,
20% hbo-ers en 60% middelbare school.
a Hoe groot is de kans dat een willekeurig geloot personeelslid een man is met
alleen een middelbareschooldiploma?
b Hoe groot is de kans dat een willekeurig gekozen werknemer vrouw is of
hbo-er?
c Hoe groot is de kans dat een willekeurig gekozen werknemer academicus is?
d Hoe groot is de kans dat een willekeurig gekozen persoon waarvan gegeven
is dat het een academicus is, een vrouw is?
e Zijn de eigenschappen 'man' en 'academicus' onderling onafhankelijk?
f Zijn de eigenschappen 'vrouw' en 'hbo-er' onderling onafhankelijk?
Stel dat bij het kansexperiment het volgende verhaal hoort. Van de werkne-
mers van een bedrijf heeft 60% een vwo-opleiding (gebeurtenis A). Van de
werknemers is 25% meer dan 5 jaar in dienst (gebeurtenis B). Er wordt wil-
lekeurig één werknemer geloot.
f Wat is in woorden de betekenis van de gebeurtenissen die zijn genoemd bij
de vragen a, b, c, d en e?
3.16 Een student die kleurenblind is kan het verschil niet zien tussen groen, grijs
en lichtbruin. Hij heeft in een la zes groene sokken, acht grijze sokken en
vier lichtbruine sokken. Op een ochtend trekt hij twee willekeurige sokken
aan. Hoe groot is de kans dat deze van dezelfde kleur zijn?
42 Hoofdstuk 3 Kansrekening
3.17 Honderd leerlingen leggen het eindexamen vwo af. Dit examen is onderver-
deeld in een schoolonderzoek (SO) en een centraal schriftelijk examen
(CSE). Voor beide onderdelen kan men een onvoldoende of een voldoende
resultaat behalen. In de volgende tabel staan de resultaten vermeld:
a Hoe groot is de kans dat een aselect uit deze 100 leerlingen getrokken persoon:
- voor het SO een onvoldoende behaalt, maar voor het CSE een voldoende?
- zowel voor het SO als voor het CSE een onvoldoende behaalt?
voor het CSE een voldoende behaalt, gegeven dat hij voor het SO een on-
voldoende behaalt?
voor het SO en voor het CSE een voldoende behaalt?
b Is het behalen van een voldoende voor het CSE onafhankelijk van het beha-
len van een voldoende voor het SO?
c Hoe groot is de kans dat van vijf willekeurig gekozen leerlingen (zonder
teruglegging) twee of meer leerlingen een onvoldoende behalen voor het
SO?
3.18 Bij het opsporen van aardgas in Nederland wordt gebruikgemaakt van geo-
logische studies waarin een prognose wordt geformuleerd dat in een bepaald
gebied aardgas zal worden aangetroffen, zodat in een later stadium tot ex-
ploitatie van zo'n gasveld kan worden overgegaan. De geologische studies le-
veren echter geen perfecte prognoses, en daarom dienen proefboringen te
worden gedaan om de aanwezigheid van gas vast te stellen.
Voor een bepaalde locatie geeft de geologische studie aan dat de kans op het
aantreffen van gas 60% is (dus 40% kans dat er niets in de grond zit). Van
de proefboringen is bekend dat deze met 80% kans gas zullen aantreffen in-
dien dat inderdaad aanwezig is in de ondergrond. Er is dus 20% kans dat
men met de proefboring geen gas aantreft, terwijl het er wél is. Indien er
geen gas in de grond zit, levert een proefboring uiteraard met 100% kans
een negatief resultaat op.
a Hoe groot is de kans om in het aangegeven terrein bij een proefboring een
negatief boorresultaat te zien?
b Hoe groot is, na het constateren van een negatief boorresultaat, de kans dat
er tóch gas in de grond zit?
c De maatschappij besluit na het negatieve resultaat bij de eerste boring, een
tweede boring te doen. Het resultaat daarvan is onafhankelijk van het eerste
resultaat. Hoe groot is de kans (met inachtneming van het antwoord bij
vraag b) dat er tóch gas in de grond zit indien ook de tweede boring geen
succes op levert?
3.20 Bij een verkiezingsonderzoek is speciale aandacht gegeven aan het kies-
gedrag van Nederlandse echtparen (bestaande uit een man en een vrouw).
Binnen de populatie van echtparen geldt dat de kans dat een willekeurig ge-
kozen man op de VVD stemt gelijk is aan 0,30. De kans dat een vrouw op de
VVD stemt is 0,24. De populatie van echtparen bestaat uiteraard uit even-
veel mannen als vrouwen. Bij nader onderzoek is komen vast te staan dat in-
dien een vrouw op de VVD stemt, in 90% van de gevallen ook haar echtge-
noot op de VVD stemt.
a Hoe groot is de kans dat een willekeurig uit deze populatie gelote persoon
op de VVD stemt?
b Hoe groot is de kans dat van een willekeurig echtpaar beide partners op de
VVD stemmen?
c Hoe groot is de kans dat van een willekeurig echtpaar geen van beide part-
ners op de VVD stemt?
d Hoe groot is de kans dat van een willekeurig echtpaar de vrouw op de VVD
stemt, indien gegeven is dat de man op de VVD stemt?
3.21 Naar een bepaalde functie solliciteren acht kandidaten. Deze groep is sa-
mengesteld uit vijf mannen en drie vrouwen. Veronderstel dat volgens loting
wordt besloten om kandidaten op te roepen voor een onderhoud.
a Als slechts één kandidaat wordt opgeroepen, hoe groot is de kans dat dit een
vrouw is?
b Als precies twee kandidaten worden opgeroepen, hoe groot is dan de kans
dat dit twee mannen zijn? En de kans op één man en één vrouw?
c Stel dat drie kandidaten worden opgeroepen. Hoe groot is de kans dat hier-
bij twee vrouwen zijn?
- Bij een instituut zijn 100 studenten ingeschreven. Hiervan studeren 60 stu-
denten economie en 40 bedrijfskunde.
Men besluit willekeurig drie studenten te kiezen.
Hoe groot is de kans dat hierbij precies twee bedrijfskundestudenten zijn?
Bereken deze kans met behulp van een kansboom. Doe de berekening voor
(a) loting met teruglegging, (b) loting zonder teruglegging.
3.23 In de gezondheidszorg doet zich bij het onderzoek naar tbc het volgende
voor:
- Indien iemand met tbc wordt doorgelicht, ontdekt men de ziekte in 98%
van de gevallen.
- Indien iemand zonder tbc wordt doorgelicht, wordt in 0,2% van de ge-
vallen ten onrechte aangegeven dat deze wél tbc heeft.
44 Hoofdstuk 3 Kansrekening
We weten dat in een bepaalde provincie 0,05% van de inwoners aan tbc
lijdt. We kiezen uit deze provincie volkomen willekeurig een persoon. Als bij
doorlichting blijkt dat het onderzoek aangeeft dat hij tbc heeft, hoe groot is
dan de kans dat dit inderdaad juist is?
- a
b
In een fabriek wordt de kwaliteit gecontroleerd van de uitgaande producten.
De employé die de controle verrichtte, blijkt 1 % van alle goede producten af
te keuren en verder keurt hij 5% van alle slechte producten goed. De totale
productie bestaat voor 90% uit goede producten.
Bereken de kans dat een willekeurig product goed is en wordt goedgekeurd.
Hoe groot is de kans dat de controleur voor een willekeurig product de ver-
keerde beslissing neemt?
c Hoe groot is het percentage goedgekeurde producten dat de fabriek verlaat?
3.26 Van alle supporters die gebruikmaken van de trein is 40% Ajax-fan, 30%
FC Utrecht-fan en 30% Feijenoord-fan. De kans dat een Ajax-fan zich
schuldig maakt aan vandalisme bedraagt 0,60, voor een FC Utrecht-fan is
dit 0,50 en voor een Feijenoord-fan is dat 0,30. De politie pakt een - niet-
herkenbare - fan op wegens vandalisme. Hoe groot is de kans (op basis van
de verstrekte gegevens) dat dit een Ajax-fan is?
3.27 Bij een onderneming werken drie categorieën werknemers, namelijk acade-
mici (A), hbo-ers (H) en vwo-ers (V).
Van het personeelsbestand bestaat 10% uit A, dus P(A) = 0,10. Verder geldt
P(H) = 0,30 en P(V) = 0,60.
Het aantal personeelsleden is (nagenoeg) oneindig groot.
a Hoe worden willekeurig drie werknemers gekozen? Hoe groot is de kans dat
dit twee vwo-ers en een hbo-er zijn?
b Medewerkers met carrièrepotentieel worden naar een speciale bedrijfs-
kundecursus (B) gestuurd.
Van de academici wordt 50% gestuurd, dus P(B IA) = 0,50.
Verder geldt P(B IH) = 0,30 en P(B IV) = 0,20.
Bereken de kans dat een willekeurig personeelslid naar de bedrijfskunde-
cursus wordt gestuurd.
c Van een personeelslid is gegeven dat hij/zij naar de bedrijfskundecursus ge-
stuurd is. Bereken de kans dat hij/zij tot de vwo-ers behoort.
3.28 Bij een instituut staan drie merken overheadprojectoren opgesteld: merk A,
B en C. Voor merk A geldt dat de kans dat de lamp van een dergelijke pro-
jector gedurende de dag stuk gaat 0,01 is. Voor het merk B is dit 0,02 en
Nadere observatie bij de stopstreep leert dat van alle auto's die (op 100 me-
ter afstand) afremmen, iedereen blijkt te stoppen bij de stopstreep. Van de
auto's die de snelheid constant hielden blijkt 80 o/o te stoppen bij de stop-
streep, terwijl van de auto's die gas geven op 100 meter slechts 10% nog
stopt bij de stopstreep.
b Hoe groot is de kans dat de volgende (willekeurige) auto aanvankelijk zijn
snelheid constant houdt en vervolgens doorrijdt bij de stopstreep?
c Hoe groot is de kans dat een willekeurige auto doorrijdt op de stopstreep?
d Een agent ziet een willekeurige auto doorrijden op de stopstreep. Hoe groot
is de kans dat dit een auto is die op 100 meter voor de stopstreep tot de ca-
tegorie 'gasgevers' behoorde?
46 Hoofdstuk 3 Kansrekening
3 Iemand koopt aandelen van een willekeurig fonds. Hij blijkt als beleggings-
resultaat 'positief' te boeken. Hoe groot is dan de kans dat dit fonds des-
tijds in de rubriek 'tips' stond?
3.31 De laatste jaren komt in Afrika een zeer ernstige ziekte voor die wordt ver-
oorzaakt door de Stromboli-bacterie. Indien deze ziekte niet snel na het stel-
len van de diagnose wordt behandeld, kan deze levensbedreigend zijn. Be-
kend is dat van alle toeristen die terugkeren van een bestemming in Afrika,
een op de tweeduizend personen drager is van de Stromboli-bacterie. Van-
wege de ernst van de besmetting is door de overheid besloten binnenko-
mende Afrikareizigers te testen. De test lijkt zeer goed te functioneren. Bij
alle reizigers die besmet zijn met de bacterie levert de test in 99 o/o van de ge-
vallen een positief resultaat (dus in 1 o/o van de gevallen wordt de besmetting
ten onrechte niet vastgesteld). Bij reizigers die niet besmet zijn geeft de test
in 98 o/o van de gevallen aan dat er niets aan de hand is. In 2 o/o van de geval-
len echter, geeft de test ten onrechte een positief resultaat, dat wil zeggen dat
de uitspraak wordt gedaan dat de Stramboli-bacterie wél aanwezig is.
a Hoe groot is de kans dat bij een willekeurige reiziger een positief test-
resultaat verschijnt?
b Hoe groot is de kans dat een reiziger waarvan het testresultaat positief is,
daadwerkelijk drager is van de Stromboli-bacterie?
Vanwege de bij vraag b berekende uitkomst worden reizigers met een posi-
tief testresultaat nog niet onmiddellijk behandeld, maar ondergaan zij voor
de tweede maal de test. De kwaliteit daarvan is precies hetzelfde als die van
de eerste test, en het tweede testresultaat is onafhankelijk van het eerste test-
resultaat.
c Bereken de kans dat een willekeurige reiziger die wordt opgeroepen voor de
tweede test opnieuw een positief testresultaat toont.
d Indien gegeven is dat een reiziger voor de tweede maal een positief test-
resultaat heeft, hoe groot is dan de kans dat deze daadwerkelijk besmet is?
3.32 Een vliegtuig heeft vier motoren. Twee aan de linkervleugel en twee aan de
rechtervleugel. Bekend is dat tijdens een vlucht op het traject Amsterdam-
Kaapstad iedere motor een kans heeft van 0,008 om uit te vallen tijdens de
vlucht.
a Hoe groot is de kans dat alle vier de motoren nog werken aan het eind van
de vlucht?
b Hoe groot is de kans dat precies drie van de vier motoren nog werken aan
het eind van de vlucht?
c Het vliegtuig vliegt veilig als alle vier de motoren het doen, als drie motoren
het doen en zelfs als twee motoren het doen, mits in het laatste geval de twee
defecte motoren niet aan dezelfde vleugel zitten. Hoe groot is de kans dat
het vliegtuig veilig de reis voltooit?
Deel B Openvragen 47
....
4 Kansvariabelen
Deel A Multiplechoicevragen
•••••
Aantal boekenk 0 1 2 3 4
P(/f = k) 0,15 0,40 0,30 0,10 0,05
De kans dat een willekeurige student heeft gestudeerd uit minstens twee
statistiekboeken is daardoor gelijk aan:
a 0,30
b 0,85
c 0,45
d 0,15
c
n
d n
48
m4 Van de kansvariabele k is de verdelingsfunctie als volgt:
Deel A Multiplechoicevragen 49
DeeiB Openvragen
4.1 Een kioskhouder verkoopt elke zaterdag een aantal exemplaren van het
Weekendmagazine.
Het aantal exemplaren dat op een
willekeurige zaterdag wordt ge-
vraagd, kan worden beschouwd als
Aantal gevraagde
.. . .. .. .. ...
~)
... ·~
Weekendmagazines
een kansvariabele k waarvoor de
30 0,10
volgende uitkomsten en bijbeho-
35 0,35
rende kansen gegeven zijn (zie de ta-
40 0,30
bel):
45 0,20
a De kioskhouder koopt elke zaterdag
50 0,05
40 exemplaren van het Weekend-
magazine in. Hoe groot is de kans
dat hij niet aan de vraag kan vol-
doen?
Antwoord De kioskhouder kan niet aan de vraag voldoen als er meer dan 40 exemplaren wor-
den gevraagd.
Dit is het geval (zie tabel) als er 45 of meer kranten worden gevraagd. De gevraagde
kans luidt: P(k = 45) + P(k = 50) = ....... .
30 x 0,10 + ... x ... + ... x ... + ... x ... + ... x ... = ...
c Hoe groot is de variantie van de vraag?
We berekenen:
50 Hoofdstuk 4 Kansvariabelen
Dit geeft: 30 2 x 0,1 = 90
X ....
X ....
X ....
X . ...
+
E(J~2)
f(m) = 2-mP(m = m)
=..... x . .... + .... . x ..... + . ... . x .....
4.2 Aan een machine moet regelmatig onderhoud worden verricht. De tijdsduur
van een willekeurige onderhoudsbeurt kan worden beschouwd als een kans-
variabele ~ waarvoor de kansdichtheid (die op basis van langdurige ervaring
is vastgesteld) kan worden gedefinieerd als:
f(!S_) = .................. ..
f(!S_) = .................... = .. .. .
P(O q ~ g) = 0,95
We berekenen:
g
f
0
(1 - 1x) dx: .... .. ... .. .. . ..... .
- . . . . . . . . . . . . . . . . . . ..
.................................... . = 0
52 Hoofdstuk 4 Kansvariabelen
4.3 Gegeven is dat een kansvariabele Is alleen de waarden 10, 20, 30 en 40 kan
aannemen. Verifieer voor de volgende vier getallen of de geformuleerde
waarden van f(k) zodanig zijn dat f als een kansfunctie kan worden be-
schouwd.
a f(lO) = 0,30 /(20) = 0,40 /(30) = 0,10 en /(40) = 0,10
b f(lO) = 0,50 f(20) = 0,30 /(30) = 0,30 en /(40) = 0,10
c f(lO) = 0,05 /(20) = 0,05 /(30) = 0,10 en /(40) = 0,80
d f(lO) = 0 /(20) = 0 /(30) = 1 en /(40) = 0
4.4 Het aantal augurken dat in een halveliterpot zit, blijkt enigszins te variëren.
Uitvoerig onderzoek heeft aangetoond dat dit aantal tussen 15 en 20 ligt,
waarbij de volgende kansen van toepassing zijn:
Aantal augurkenk 15 16 17 18 19 20
P(k = k) 0,10 0,30 0,30 0,15 0,10 0,05
a Teken de kansfunctie.
b Bereken en teken de cumulatieve kansfunctie.
c Hoe groot is de kans om in een willekeurige pot meer dan 16 maar minder
dan 20 augurken aan te treffen?
d Er worden twee willekeurige potten augurken geselecteerd. Hoe groot is de
kans dat beide potten meer dan 18 augurken bevatten?
e Hoe groot is de kans dat twee willekeurige potten augurken in totaal 38
augurken bevatten?
4.5 Bij een onderzoek naar het effect van onderwijshervormingen wordt aan zo-
wel leerlingen als docenten hun mening gevraagd over het 'Studiehuis'. Op
een vragenformulier gaven de betrokkenen hun mening op een schaal van 1
(zeer ontevreden) tot 5 (uiterst tevreden). Het aantal ondervraagden was
dermate groot dat het verantwoord is de resultaten te formuleren door mid-
del van twee kansverdelingen. De resultaten staan in de volgende tabel:
a Hoe groot is de kans dat twee willekeurig gekozen leerlingen allebei zeer on-
tevreden zijn?
b Hoe groot is de kans dat vier willekeurige docenten geen van allen ontevre-
den zijn?
c Bereken voor beide verdelingen de verwachtingswaarde en de standaard-
deviatie.
d Geef een beschouwing over de gevonden resultaten bij vraag c.
Deel B Openvragen 53
Opmerking: het is discutabel of we hier in formele zin mogen spreken van
kansvariabelen. Hier is immers niet sprake van een variabele waarmee men
zomaar berekeningen mag doen, maar van een ordinale variabele waarvan
de uitkomsten bestaan uit codes van 1 tot en met 5. We hebben dit voor-
beeld echter met opzet gekozen omdat het rekenen met dergelijke variabelen,
ondanks deze principiële bezwaren veelvuldig wordt gevolgd in de praktijk.
- a
b
Bij een schoolreisje worden vier bussen gebruikt met elk een eigen chauf-
feur. Van de in totaal 130 leerlingen hebben deze bussen respectievelijk 45,
35, 30 en 20 leerlingen vervoerd.
Op basis van toeval kiest men één van de vier chauffeurs. Men vraagt aan de
chauffeur hoe groot Kis, het aantalleerlingen in zijn bus. Bereken E(K).
Op basis van toeval kiest men één van de 130 leerlingen en vraagt aan hem/
haar hoeveelleerlingen X er in de bus zaten waarmee deze leerling werd ver-
voerd. Bereken E(X).
- Het aantal personen dat in een willekeurig uur opbelt naar de klantenservice
van een groot bedrijf, wordt beschreven door de kansvariabele fs_, waarvan
de gegevens zijn geplaatst in de volgende tabel:
a HoegrootisP(fs_~3) enP(fs_~3)?
b Bereken de verwachtingswaarde van fs_.
c Bereken de standaarddeviatie van fs_.
54 Hoofdstuk 4 Kansvariabelen
4.9 Een bezorgdienst voor pizza's brengt per dag pizza's rond na telefonische be-
stelling. Voor een pizza betaalt de consument 6 euro per stuk. Het aantal be-
zorgde pizza's per dag is J; is een kansvariabele met een verwachtingswaarde
van 120 en een standaarddeviatie van 28.
a Bereken voor de dagelijkse omzet (in euro) de verwachtingswaarde en de
standaarddeviatie.
b De ingrediënten van een pizza kosten 80 eurocent. De bezorgkosten zijn ge-
middeld 70 cent per pizza. De vaste kosten per dag voor personeel en locatie
bedragen 280 euro. Beschrijf de dagelijkse kosten als een functie van J;: het
aantal pizza's. Beschrijf de winst per dag (= omzet minus kosten) als een
functie van J;. Bereken de verwachte winst per dag en de standaarddeviatie
daarvan.
c Bepaal op basis van de gegeven vuistregel een interval waarin de verwachte
dagwinst zalliggen met ruwweg 95% kans.
4.10 Bij een groot bouwproject heeft de aannemer een taxatie gegeven voor de
tijdsduur J; om het project te voltooien. Het project duurt minimaal 12 we-
ken, maar het kan een of meer weken uitlopen. De volgende verwachting
werd geformuleerd:
a Geef de verwachte tijdsduur van het project (neem aan dat het project altijd
aan het eind van een week klaar is).
b Berekende de standaarddeviatie van de projectduur.
c Het project kost 120.000 euro plus voor iedere werkweek 5.000 euro.
Bereken hiermee de verwachtte kosten en de standaarddeviatie ervan.
d Het project is aangenomen voor 220.000 euro. Bij voltooiing ná 14 weken
volgt een boete voor de aannemer van 10.000 per week. Bereken de ver-
wachte winst voor de aannemer.
4.11 Een verzekeringsmaatschappij heeft vastgesteld dat het aantal malen dat een
willekeurige verzekerde per jaar een verwijzing krijgt naar een specialist, kan
worden beschreven door een kansvariabele Is. die is weergegeven in de vol-
gende tabel:
Aantal verwijzingen 0 1 2 3 4
P(k =k) 0,50 0,25 0,15 0,06 0,04
4.12 Een doe-het-zelfzaak verhuurt apparaten waarmee oud behang van een
muur kan worden afgestoomd. De vraag per dag naar dergelijke apparaten
kan worden weergegeven door een kansvariabele k die de volgende waarden
aanneemt:
.. . . . . .. .. ... ..
Aantal gevraagde machines k o 1 2 3
· ~ ·. .
P(k = k) 0,20 0,35 0,25 0,20
4.14 Gegeven is een continue kansvariabele ~die alleen waarden kan aannemen
op een bepaald gedeelte van de x-as. Verifieer voor de volgende drie gevallen
of de geformuleerde functie f als kansdichtheid kan dienen.
56 Hoofdstuk 4 Kansvariabelen
a f(x) =0,20 voor 5~x~ 10
=0 elders
b f(x) =~x-2 voor 5 ~x~ 10
=0 elders
c f(x) = 1x-0,75 voor O~x~4
=0 elders
4.15 Bij een loterij wordt een ronddraaiend rad gebruikt om een winnend num-
mer te loten. Op het rad is een indeling gemaakt in centimeters lopend van
0,00 tot 100,00 (wat weer gelijk valt met 0,00, want de cirkel is dan rond).
De uitkomst van één draai met het rad kan men beschouwen als een wille-
keurige trekking uit de uniforme verdeling tussen 0,00 en 100,00.
a Hoe groot is de kans dat een willekeurige draai een uitkomst oplevert tussen
40,00 en 75,00?
b Hoe groot is de kans dat drie draaien achter elkaar alle drie een uitkomst
opleveren tussen 80,00 en 100,00?
c We doen twee draaien met het rad. Hoe groot is de kans dat de eerste draai
een uitkomst kleiner dan 20,00 oplevert en de tweede draai een uitkomst
groter dan 20,00?
d Gegeven is dat de eerste draai 60 oplevert, hoe groot is dan de kans dat de
tweede draai een groter getal oplevert?
e Gegeven is dat de eerste draai A oplevert, hoe groot is de kans dat de tweede
draai meer dan A oplevert?
4.17 Bij een groot bedrijf wordt onderzocht hoe de tijdsduur verdeeld is die no-
dig is voor het verzenden van faxberichten. Na enig onderzoek blijkt deze
tijdsduur 2f een continue kansvariabele te zijn die wordt gekenmerkt door de
volgende kansdichtheid (x in minuten):
f(x) = 0,50- 0,125x voor 0 ~x~ 4
=0 wmx<O~x~4
a Bereken de kans dat het verzenden van een willekeurig faxbericht minder
dan 1,00 minuut duurt.
b Hoe groot is de kans dat voor vier willekeurige faxberichten geldt dat er pre-
cies twee korter dan 1 minuut duren?
c Bereken de verwachtingswaarde van 2f.
Deel B Openvragen 57
hoekige kansverdeling tussen 20 000 en 30 000. Gelet op het veronderstelde
continue karakter van de kansvariabele, mogen we ervan uitgaan dat beide
partijen nooit exact hetzelfde bod zullen doen.
a Veronderstel dat Lauwen € 23.000 biedt. Hoe groot is de kans dat hij daar-
mee in het bezit komt van de klok?
b Veronderstel Lauwen biedt € 28.000 respectievelijk € 30.000. Hoe groot is
dan de kans op aankoop van de klok?
Er is een klant aan wie Lauwen de klok voor een bedrag van € 31.000 on-
middellijk kan verkopen.
c Hoeveel bedraagt de verwachte winst voor Lauwen bij de biedingen die bij
de vragen a en b worden overwogen?
d Noem het bedrag dat Lauwen gaat bieden B. Bij welke bieding B is de ver-
wachte verkoopwinst zo hoog mogelijk?
e Veronderstel dat de klant niet € 31.000 maar € Y wenst te betalen. Geef aan
hoe het optimale bod B afhangt van de gekozen Y.
4.19 Een klein bedrijf produceert ronde houten borden. Als gevolg van de ver-
schillende dikten van de gebruikte boomstammen kan de diameter van de
borden enigszins variëren. De diameter d van de borden is een kansvariabele
met een rechthoekige verdeling die wordt weergegeven door:
f(d) = 0,2 voor 25 ~ d ~ 30
=0 elders
Bereken de verwachtingswaarde van de oppervlakte van de geproduceerde
borden.
4.20 Bij een makelaar wordt bijgehouden hoe de relatie is tussen het aantal
bezichtigingen en de uiteindelijke tijdsduur tot de verkoop.
Men telt het aantal bezichtigingen dat plaatsvindt in de eerste maand vanaf
de koopaankondiging. Daarnaast kijkt men naar de tijdsduur dat het huis te
koop staat. Bekend is dat na drie maanden alle huizen zijn verkocht. De
gegevens staan in de volgende tabel:
. .. . . ..
Aantal bezichtigingen 0
·• .
1,5 (namelijk 1 of 2)
.
4(3,4of5)
. ..
7(6, 7of8)
in de eerste maand
Tijdsduur tot verloop
0-<1maand 0,00 0,05 0,15 0,10
1-<2 maanden 0,05 0,10 0,15 0,05
2-<3 maanden 0,20 0,10 0,05 0,00
Deel A Multiplechoicevragen
m1 Voor een willekeurige normale verdeling geldt dat de volgende drie groot-
heden aan elkaar gelijk moeten zijn:
a gemiddelde, standaarddeviatie en mediaan
b modus, de totale kans en de variantie
c mediaan, gemiddelde en modus
d standaarddeviatie, variantie en spreidingsbreedte
60
ms Van een normaal verdeelde variabele~ is gegeven dat ze een standaarddevia-
tie heeft die gelijk is aan 9. Verder is gegeven dat P(~ < 15,5) = 0,3085. De
waarde van f1 van deze variabele is dan:
a 16
b 17
c 20
d 11
m6 Voor een speerwerper geldt dat het resultaat van een worp ~ kan worden be-
schreven door een normale verdeling met f1 = 61 meter en er= 3 meter. De
speerwerper doet drie pogingen, waarvoor mag worden verondersteld dat de
worpresultaten kunnen worden beschouwd als onderling onafhankelijke kans-
variabelen. De kans dat het gemiddelde resultaat van de drie worpen minder
is dan 59 meter, is ongeveer gelijk aan:
a 0,35
b 0,255
c 0,125
d 0,745
DeeiB Openvragen
5.1 De brandduur van een bepaald type gloeilamp kan worden beschouwd als
een kansvariabele ~ die normaal is verdeeld met een verwachtingswaarde
van 1600 uur en een standaarddeviatie van 100 uur.
a Hoe groot is de kans dat een willekeurige gloeilamp van dit type een brand-
duur heeft van meer dan 1 800 uur?
Z= - - - -
Invullen levert:
z=--------
z=--------
De tabellevert hierbij:
P(K < 1550) = P(?. < .. ... ) = .... ......
Dit is echter niet de gevraagde kans, maar het 'staartgedeelte'. We moeten de afge-
lezen kans nogvan 0,5 aftrekken. Dit levert:
P(1550 < 5. < 1600) = 0,5 - ........ .. = ..........
Voor de tweede term van de 'gesplitste' kans vinden we:
z=--------
De tabel levert:
P(K > 1700) = P(p .... ...... ) = .... .
We zochten echter: P(1600 < 5. < 1700). Deze kans bedraagt:
P(1600 < 5. < 1700) = .... .... . = .. .....
Samen leveren de gevonden uitdrukkingen:
P(1550<5_<1700) = .... ..... + .. ....... = .... .... .
c Hoe groot is de kans dat een willekeurige lamp van het beschouwde type
een brandduur heeft tussen 1650 en 1 750 uur?
d Voor een groep van 25 gloeilampen van het hier beschouwde type wordt de
gemiddelde brandduur bepaald.
Bepaal de kans dat dit gemiddelde uitkomt tussen 1570 en 1630 uur.
Antwoord Gevraagd is P(!f > 2,20). Dat is het gearceerde deel in afbeelding 5.1.
We passen de tabel van de standaardnormale verdelingtoe en vinden :
z=-----
Afbeelding 5.1
Deel B Openvragen 63
b Men kiest een willekeurige moer. Hoe groot is de kans dat deze moer een
diameter heeft die kleiner is dan 2,00 mm?
z=-----
Afbeelding 5.2
J.l =...
We vinden: z = ----
5.5 In een fabriek staat een machine met vier identieke onderdelen. Voor alle
onderdelen geldt dat deze een levensduur hebben die normaal verdeeld is
met f1 = 8 000 uur en a= 2 000 uur. De onderneming heeft besloten dat, zo-
dra een van de vier onderdelen uitvalt, steeds alle vier de onderdelen ver-
nieuwd worden. Verder wil men preventief alle onderdelen vervangen indien
nog geen defect is opgetreden na het verloop van een nader te bepalen tijds-
periode van Tuur.
a We bestuderen eerst één onderdeel. Wat is de tijdsduur T 1 waarvoor geldt
dat de kans 95% is dat het onderdeel nog functioneert na T 1?
b Gegeven de waarde van T 1 bij vraag a. Hoe groot is de kans dat alle vier de
onderdelen nog functioneren na T 1 ?
c Bepaal de tijdsduur T waarvoor geldt dat de kans 90% is dat de gehele ma-
chine nog functioneert na verloop van T uur.
- a
b
De gewichten van appels uit een grote partij blijken normaal verdeeld te zijn
met f1 =lOOg en a= 20g.
We willen deze appels in vijf gewichtsklassen verdelen die allemaal evenveel
appels bevatten.
Wat is de klassengrens van de 20% appels met het geringste gewicht?
Bepaal ook de andere klassengrenzen.
- a
De instelling van een vulmachine is zodanig dat het gewicht 2f dat in een
verpakking terechtkomt, een kansvariabele is met een normale verdeling
waarvoor geldt f1 = 506 gram en a= 5 gram.
Hoe groot is de kans dat een verpakking minder dan 500 gram bevat?
- Een automobilist rijdt dagelijks over een provinciale weg waarvoor een
maximumsnelheid geldt van 80 km per uur. Langs de weg staat een flitspaal
opgesteld waarmee de snelheid van auto's wordt gemeten. Deze flitspaal
functioneert gemiddeld één op de tien dagen. Onze automobilist rijdt op
deze weg met een snelheid ~ die normaal is verdeeld met fl = 78 km en
a= 4 km.
a Hoe groot is de kans dat de automobilist op zekere dag harder rijdt dan 80?
En harder dan 85?
b Er wordt pas een boete van € 50 gegeven indien voor de auto minstens een
snelheid van 85 wordt gemeten. Hoe groot is naar verwachting het boete-
bedrag per jaar (= 250 dagen) van de automobilist (gegeven het feit dat de
flitspaallang niet altijd werkt)?
c Indien de gemeten snelheid 90 km is of hoger, volgt een boete van € 100. Be-
reken opnieuw het jaarlijks te verwachten boetebedrag.
5.11 De reistijd van een werknemer naar zijn kantoor in Amsterdam is niet hele-
maal constant vanwege de drukte op de wegen. Deze reistijd !. kan worden
beschouwd als een normaal verdeelde kansvariabele met fl = 35 minuten en
<T = 4 minuten.
a Hoe groot is de kans dat op een willekeurige dag meer dan 45 minuten reis-
tijd nodig is?
b Hoe groot is de kans dat in een week (vijf dagen) de reistijd iedere dag meer
dan 40 minuten is (reistijden zijn onderling onafhankelijk en de verdeling is
voor alle dagen hetzelfde).
5.13 Een vulmachine die pakken rijst vult, staat ingesteld op een gemiddelde van
1010 gram per pak. De inhoud van een willekeurig pak rijst mag worden
beschouwd als een trekking uit een normale verdeling met verwachtings-
waarde 1010 en onbekende standaarddeviatie. Bij nauwkeurig nawegen van
een groot aantal pakken rijst blijkt 20% van de pakken minder dan 1 000
gram te bevatten.
a Bereken de standaarddeviatie van het vulgewicht.
b Bereken de kans dat zestien pakken rijst gemiddeld minder dan 1 000 gram
bevatten.
5.14 Een belegger overweegt zijn geld te investeren in een beleggingsfonds. Twee
fondsen, namelijk A en B komen in aanmerking om te worden gekozen. Het
onzekere jaarrendement ~ voor beleggingsfonds A kan worden beschouwd
als een normaal verdeelde kansvariabele met fl = 10% en er= 6%. Voor het
rendement y van beleggingsfonds B geldt dat dit een normaal verdeelde va-
riabele is met fl = 14% en er= 10%.
a Hoe groot is de kans dat een belegging in fonds A een rendement oplevert
dat hoger is dan 20%?
b Hoe groot is de kans dat B een rendement oplevert dat negatief is?
c Stel dat de rendementen voor de fondsen A en B beschouwd mogen worden
als onderling onafhankelijke variabelen. Hoe groot is de kans dat het rende-
ment van A volgend jaar hoger uitvalt dan voor B?
5.17 Een fabrikant van horloges weet dat de levensduur van die horloges kan
worden beschreven door een normaal verdeelde variabele ;ç. De horloges
hebben een gemiddelde levensduur van 1200 dagen met een standaard-
deviatie van 120 dagen.
a De fabrikant geeft op de horloges een garantie van drie jaar (= 1 095 dagen).
Hoeveel procent van de horloges zal binnen de garantietermijn aanleiding
geven tot klachten?
b De fabrikant wil de lengte van de garantietermijn (L) zodanig kiezen dat
voor een willekeurig horloge de kans op een klacht binnen deze termijn
minder dan 2 o/o bedraagt.
Hoe groot moet L worden gekozen?
Deel A Multiplechoicevragen
m1 Geef aan welke van de volgende beweringen niet waar is voor een binomiale
kansverdeling:
a De succeskans 1T is constant bij iedere poging.
b Het aantal successen in n pogingen is constant.
c De verwachtingswaarde is n1T.
d De variantie is mr(l- 7T).
m2 Een arts weet dat de kans 0,20 is dat een bepaald voorgeschreven medicijn
leidt tot ongewenste bijwerkingen bij een willekeurige patiënt. Hij heeft dit
medicijn bij drie patiënten voorgeschreven. De kans dat nul patiënten deze
ongewenste bijwerkingen ervaren, is:
a 0,512
b 0,60
c 0,008
d 0,384
m4 Voor een binomiaal verdeelde variabele 15_ geldt, dat er n = 58 pogingen ge-
daan worden met een succeskans 1T = 0,80. We willen P (/5_ < 50) uitrekenen.
Welke uitspraak is juist?
a Kansen mogen niet worden berekend met behulp van de normale bena-
dering omdat 1T groter dan 0,50 is.
b Bij toepassing van de normale benadering moet 50,5 als grens worden ge-
hanteerd.
c De gevraagde kans kan slechts worden berekend als er een rolverwisseling
plaatsvindt van het aantal 'successen' en 'pechgevallen'.
d Het correcte antwoord kan men in principe verkrijgen door voor k = 0
tot en met k = 49 de afzonderlijke kansen met de binomiale formule te
berekenen en deze kansen bij elkaar te tellen.
70
ms Bij hun eerste poging voor het schriftelijk rijexamen hebben kandidaten een
slagingskans van 0,60, zo leert de ervaring. Hoe groot is de kans dat voor
600 leerlingen van een rijschool geldt dat hiervan meer dan 380 het schrifte-
lijk examen bij de eerste poging halen?
a 0,044
b 1,000
c 0,048
d 0,444
Deel B Openvragen
6.1 Een groothandel in geheugenchips levert partijen 'tweede soort' die gemid-
deld 20% defecte exemplaren bevatten.
a Hoe groot is de kans dat bij vijf willekeurig gekozen geheugenchips precies
één defect exemplaar is?
Antwoord Als we aannemen dat 20% van de geheugenchips defect is, dan kunnen we de trek-
king van een geheugenchip beschouwen als een trekking met succeskans P(goed
exemplaar) = ... .. en P(fout exemplaar) = . ....
We definiëren: /s.: aantal defecte exemplaren.
Hiervoor geldt:
Totaal
c Een afnemer wil bij de groothandel een partij 'tweede soort' -geheugenchips
bestellen. De afnemer heeft 50 deugdelijke geheugenchips nodig. Rekening
houdend met de mogelijkheid dat een aantal exemplaren defect is, bestelt hij
een partij 'tweede soort' van 60 stuks. Bereken de kans dat de bestelde partij
minstens 50 deugdelijke geheugenchips bevat.
Antwoord Het aantal deugdelijke exemplaren k in een partij van 60 stuks kan worden be-
schouwd als een binomiaal verdeelde kansvariabele.
We stellen :
k:aantal deugdelijke exemplaren
k- Bin (n = ... , 7T = ...... )
(Let op: we tellen nu deugdelijke exemplaren.)
Voor de verwachtingswaarde vanken de variantie van k vinden we:
z = - - - - --
6.2 Een machine produceert koperen plaatjes waarvan de dikte 2f kan worden
beschouwd als een kansvariabele die normaal is verdeeld met verwachtings-
waarde 8 mm en standaarddeviatie 0,4 mm.
a Een afnemer van koperen plaatjes eist dat de dikte van de geleverde plaatjes
niet meer dan 0,5 mm afwijkt van 8 mm. Hoe groot is de kans dat een wille-
keurig koperen plaatje niet aan deze eis voldoet?
Antwoord We bepalen de gevraagde kans met behulp van de tabel van de standaardnormale
verdeling. We vinden voor de kans P(5. > 8,5) dat
z= - - - - -
Afbeelding 6.2
7.5 8 8,5
b Hoe groot is de kans dat van tien willekeurig gekozen plaatjes er nul of één
niet aan de eisen voldoet?
P(k = 0) = .. ....... .
c Hoe groot is de kans dat van 100 willekeurig gekozen plaatjes er minstens 90
aan de gestelde eisen voldoen?
We vinden :
z=------
- a
Bekend is dat van de volwassen Nederlanders thans 70% over een of meer
creditcards beschikt. We kiezen een steekproef van vijftien personen. Bepaal
met behulp van de tabel van de binomiale verdeling de kans dat de volgende
aantallen mensen in deze steekproef over een of meer creditcards beschik-
ken:
precies 10
b precies 15
c meer dan 9
d minder dan 12
6.5 Bij een aangeboren afwijking blijkt bij 25% van de baby's een bepaalde
complicatie op te treden.
In een jaar worden twintig baby's geboren met de afwijking.
Bepaal met de tabel van de binomiale verdeling de volgende kansen:
a de kans dat twee of minder baby's de complicatie vertonen
b de kans dat meer dan acht baby's de complicatie vertonen
c de kans dat het aantal baby's met de complicatie minstens 4 maar hoogstens
7 is
6.6 Een uitgever van studieboeken weet dat van alle nieuwe uitgaven die op de
markt worden gebracht, 20% zakelijk gezien een succes wordt.
a Hoe groot is de kans dat bij tien nieuwe uitgaven precies één succes voor-
komt? Hoe groot is de kans op drie successen?
b Een uitgever geeft per jaar n nieuwe boeken uit. Hoe groot is de kans dat
hierbij precies één succesvolle uitgave zit bij n = 1, 2, 3, 5, 8 en 10?
- De kans dat een willekeurig gekozen student slaagt bij een bepaald tentamen
is 0,6.
Hoe groot is de kans dat van 150 willekeurig gekozen studenten er meer dan
100 voor het tentamen slagen?
6.8 Van een bloembollensoo rt is bekend dat 5% van de bollen niet opkomt. De
bollen worden verpakt in dozen van tien stuks met de garantie dat ten min-
ste negen van de tien bollen zullen opkomen. De bollen komen onafhanke-
lijk van elkaar al of niet op.
a Bereken de kans dat van een doos alle bollen opkomen.
b Bereken de kans dat een aselect gekozen doos de gegarandeerde eigenschap
niet heeft.
6.9 Een viermotorig vliegtuig kan nog blijven doorvliegen indien tijdens de
vlucht twee van de vier motoren uitvallen. Voor een willekeurige motor is de
kans 0,005 dat deze tijdens een vlucht defect raakt.
a Hoe groot is de kans dat na een vlucht alle vier de motoren nog functione-
ren? En drie van de vier?
b Bereken de kans dat het vliegtuig neerstort.
6.11 Een bedrijf van huismerken koopt graag afgekeurde partijen koffiezetappa-
raten op van fabrikanten. Daarna worden deze apparaten van een nieuwe
merknaam voorzien en op de markt gebracht. Het bedrijf koopt de koffie-
zetapparaten bij twee leveranciers. Namelijk 60% bij Elektrolips en 40% bij
Phitronics. Van leverancier Elektrolipsis bekend dat 10% van de apparaten
niet goed is, bij Phitronics is 30% niet in orde. Er is een nieuwe partij bin-
nengekomen. Door slordig optreden van een magazijnbediende is niet meer
te achterhalen of deze van Elektrolips of Phitronics is.
Men neemt een steekproef van 30 van die apparaten. Deze worden uitvoerig
getest.
Vastgesteld wordt dat 2 van die apparaten niet deugen.
Hoe groot is de kans dat Phitronics de leverancier is van deze partij?
76 Hoofdstuk 6 Binomialeverdeling
fieke dag op de uiterste betaaldatum 520 bekeurden hun boete hebben vol-
daan, is dat dan uitzonderlijk gegeven de betaalkans van 75%?
b Wat is het verwachte bedrag dat binnenkomt van een dag met 800 bekeur-
den en wat is de standaarddeviatie?
c De gemeente besluit extra invorderingsmaatregelen te nemen voor de niet-
betalers van de boete. Zo'n actie kost 5 euro per niet-betaalde parkeerbon.
De boete is nu verhoogd naar 52 euro. Bekend is dat van deze groep 60%
daarna betaalt. Maak een kosten-batenanalyse van de extra maatregel.
6.13 Het is een bekend feit dat gemiddeld 3% van alle gezinnen geld overmaakt
als er door een charitatieve instelling een beroep op hen wordt gedaan.
Onlangs werd aan 200 000 gezinnen een dergelijke oproep gedaan.
a Geef een 95%-voorspellingsinterval (symmetrisch) voor het aantal reacties.
b Per gezin wordt (zoals gevraagd) € 80 overgemaakt. 'Vertaal' het onder a ge-
geven interval in euro's.
Bij een keukenbedrijf weet men dat van alle klanten die een catalogus aan-
vragen, 15% daadwerkelijk een bestelling zal plaatsen in de maand volgend
op de toezending van de catalogus. Daarna, dus méér dan een maand later,
blijken er nooit bestellingen te worden gedaan.
a In een bepaalde maand worden 120 catalogi verzonden. Bereken de kans dat
meer dan twintig klanten een bestelling gaan plaatsen.
b In een bepaald jaar worden 1 200 catalogi aangevraagd. Hoe groot is het ver-
wachte aantal bestellingen? Bereken een voorspellingsinterval (symmetrisch)
waarvoor geldt dat hierin met 95% kans het aantal waar te nemen bestel-
lingen ligt.
c In een bepaalde periode werden 800 catalogi verzonden. Hoe groot is de
kans dat de fractie bestellers minder is dan 10% voor deze groep aanvragers?
6.15 Een autodealer beweert dat 90% van alle nieuw verkochte Toyota's binnen
drie jaar geen enkele serieuze reparatie nodig heeft. Want zo goed zijn wij
bij Toyota, sprak de dealer trots. In 2008 kwam een nieuw model op de
markt, de Toyota Wyby. Er werden er al snel 2 500 van verkocht in Neder-
land.
a Hoeveel gevallen van serieuze reparaties verwacht u na vaststelling van de
toestand van al die auto's na drie jaar? Wat is de standaarddeviatie?
b Stel dat zo'n reparatie gemiddeld 400 euro kost voor Toyota, hoeveel is dan
het verwachte bedrag aan kosten voor de 2 500 auto's?
c Achteraf blijkt dat 370 van de Toyota Wyby's binnen drie jaar een serieuze
reparatie nodig hadden. Valt dat getal binnen de verwachtingen gegeven de
eerdergenoemde 90%?
6.16 Op basis van jarenlange ervaring is bekend dat studenten aan de Hoge-
school voor Management en Techniek in Eutopia dikwijls hun diploma niet
krijgen, meestal wegens onvoldoende analytische vaardigheden. Het percen-
tage afgewezen studenten is 40% van de ingeschrevenen.
a Bereken voor een groep van zes vrienden die ingeschreven staan bij deze op-
leiding de kans dat zij alle zes hun diploma krijgen.
Een exporteur is nogal geschrokken van deze percentages en laat uit zijn
zeer grote partij aardappelen, die voor de export naar Duitsland bestemd is,
een aselecte steekproef van 50 aardappelen nemen en controleren op ver-
kleuring en rotte plekken.
Bereken het volgende in vier decimalen nauwkeurig:
a De kans dat precies vijf van de 50 aardappels verkleurd zijn.
b De kans dat minstens twee aardappelen zowel verkleuring als rotte plekken
hebben.
c Als de controleur slechts één aardappel aselect trekt (in plaats van 50), wat is
dan de kans dat deze aardappel gaaf is (dat wil zeggen zonder verkleuring en
zonder rotte plekken)?
d Een Duitse consument koopt een zak met tien aardappelen waarvan er drie
rotte plekken hebben. Als deze consument vier aardappelen aselect uit de
zak kiest en schilt, wat is dan de kans dat precies één van de vier aardappe-
len rotte plekken heeft?
e Het gewicht van een aselect gekozen aardappel (ras: bintje) is bij benadering
normaal verdeeld met fl = 100 gram en CT= 20 gram. Bereken de kans dat
een aselect gekozen bintje meer dan 95,00 gram weegt.
f Van alle Nederlandse bintjes wordt 10% tot patat verwerkt. Men selecteert
hiervoor de zwaarste bintjes. Boven welke gewichtsgrens komt een bintje in
aanmerking voor het verwerken tot patat?
.
• I
7 De poissonverdeling
Deel A Multiplechoicevragen
m1 Welke van de volgende uitspraken over een kansvariabele Is. met een pois-
sonverdeling is waar?
a Het waargenomen aantal successen kan niet gelijk aan nul zijn.
b De verwachtingswaarde en de standaarddeviatie zijn aan elkaar gelijk.
c Er geldt fl = n · 1T.
d De variabele kan gehele waarden groter of gelijk aan nul aannemen.
m3 Het aantal ongevallen per maand op een kruispunt kan worden beschreven
door een poissonverdeling met fl = 0,5. De standaarddeviatie van het aantal
ongelukken per jaar bedraagt daarom:
a 6
bj6
0,5
'j6
d 0,5 x JU
m4 Het aantal bosbranden per jaar op de Veluwe mag worden beschouwd als
een kansvariabele Is. met een poissonverdeling met fl = 25. Volgens de in het
theorieboek aangegeven berekeningsmetboden kan de kans dat in een wille-
keurig jaar het aantal bosbranden groter is dan 30, worden afgelezen in:
a de cumulatieve poissontabel bij fA-= 5 en k = 6
b de standaardnormale tabel bij z = 0,20
c de standaardnormale tabel bij z = 1,1
d de gewone poissontabel bij fl = 5 en k = 6
80
ms Bij een landelijk bingospelletje is de kans op het winnen van een prijs 0,001.
In een zaal vanwaaruit een directe televisie-uitzending plaatsvindt, bevinden
zich 1 500 mensen. De kans dat zich in die zaal meer dan één prijswinnaar
bevindt, is derhalve gelijk aan:
a 0,592
b ongeveer 0,50
c 0,409
d 0,442
DeeiB Openvragen
7.1 Bij een zwak radioactief preparaat wordt een geigerteller gehouden. Deze re-
gistreert gemiddeld vier tikken per minuut. Het aantal tikken per minuut
mag worden beschouwd als een kansvariabele met een poissonverdeling.
a Hoe groot is de kans dat in een bepaalde minuut precies één tik geregis-
treerd wordt?
Antwoord De kansvariabele Is_ (het aantal tikken per minuut) wordt beschreven door een pois-
sonverdeling met f.L = 4. In de tabel van de poissonverdeling lezen we bij f.L = 4 af:
P(fs_ = 1lf.L = 4) = .. .... .. . .
b Hoe groot is de kans dat er in een bepaalde minuut meer dan drie tikken ge-
registreerd worden?
Antwoord Het aantal tikken in een periode van twee minuten kan worden beschouwd als een
variabele met p.. = 8.
TebepalenisP(k< SIP.= 8).
We lezen af in de tabel:
P(k = o) = ......... .
P(/s. = 1) = ..... .... .
P(k = 2) = ....... .. .
P(/s. = 3) = ......... .
P(/s. = 4) = ......... .
+
P(/s. < 5) = P(/s. ~ 4) = .....
Antwoord Voor een periode van 100 minuten geldt p.. = 4 x 100 = 400 als de verwachtings-
waarde van het aantal tikken.
Omdat p..groot is, moet de normale benadering worden gebruikt. Als geschikte vorm
van de verdeling kiezen we:
lf- N (p.. = ..... , CT= ••..• )
We moeten berekenen:
z= - - - --
7.2 Bij een fabricageproces wordt een bepaald onderdeel gemaakt. Op grond
van ervaring is bekend dat 3 o/o van de geproduceerde onderdelen defect is
en dus moet worden afgekeurd. Er worden 100 geproduceerde onderdelen
gecontroleerd.
a Hoe groot is de kans dat er geen enkel defect exemplaar in deze steekproef
van 100 stuks wordt aangetroffen?
Antwoord In principe is hier sprake van een vaste steekproefomvang (n = 100) en een vaste
waarde voor 7f, waardoor de binomiale verdeling moet worden toegepast voor de
beschrijving van de kansen op een bepaald aantal defecten. Omdat n hier groot is en
7f klein is, gebruiken we de poissonbenadering. We kiezen als kansvariabele Is.: aantal
defecten.
Voorde poissonparameter p.. kiezen we p.. = . .... .
Bij deze waarde van p.. vinden we in de tabel:
P(k = olp.. = .... .. ) = ..... ... . .
82 Hoofdstuk 7 De poissonverdeling
b Hoe groot is de kans dat er minstens drie defecte exemplaren in de steek-
proef worden aangetroffen?
- a
Het aantallekke banden dat bij een garage dagelijks ter reparatie wordt aan-
geboden, mag worden beschouwd als een kansvariabele k met een poisson-
verdeling met fl = 4 per dag.
Bepaal met de tabel van de poissonverdeling de kans op het ter reparatie
aanbieden op een willekeurige dag van:
precies één lekke band
b precies zes lekke banden
c meer dan drie lekke banden
d minder dan drie lekke banden
e meer dan vier, maar minder dan tien lekke banden
Bepaal bovengenoemde kansen ook met Excel.
7.4 Voor een eerstehulpafdeling van een ziekenhuis geldt dat het aantal patiën-
ten met brandwonden dat per dag binnenkomt, kan worden beschreven
door een poissonverdeling met fl = 0,35. Bereken met de formule van de
poissonverdeling de kans dat het aantal van dergelijke patiënten per dag:
a precies nul bedraagt
b precies één is
c meer dan één bedraagt
Controleer de verkregen uitkomsten met Excel.
7.6 In een containerhaven kunnen per dag drie schepen afgehandeld worden
met laden en lossen. Bekend is dat het aantal binnenlopende schepen van
variabele is met een poissonverdeling met fl = 2 per dag. Schepen die zich
melden wanneer op een dag reeds drie schepen in behandeling zijn, worden
doorverwezen naar een andere haven.
a Hoe groot is de kans dat op een willekeurige dag een of meer schepen moe-
ten worden doorverwezen?
Deel B Openvragen 83
b Hoe groot is het verwachte aantal schepen dat zich per dag aanmeldt?
c Hoe groot is het verwachte aantal dat per dag kan worden afgehandeld?
d Wat is het verwachte aantal dat per dag wordt doorverwezen naar een an-
dere haven?
- a
In de herfstmaanden krijgen sommige mensen last van depressies. Bij een
psychiatrische kliniek is het aantal nieuwe patiënten per week bijgehouden.
Op basis daarvan is bekend dat dit een variabele is met een poissonverdeling
met ft= 36.
Bereken de kans dat in een willekeurig gekozen herfstweek meer dan 45
nieuwe patiënten komen.
b Vanwege het weekendeffect melden zich op maandag altijd extra veel nieuwe
patiënten. Dat is een variabele met een poissonverdeling met fl = 16. Per pa-
tiënt wordt 30 minuten behandeltijd gereserveerd. Hoeveel tijd moet men
op een willekeurige maandag inplannen om minstens 95o/o van alle nieuwe
patiënten te kunnen behandelen?
7.8 Bij een telefooncentrale komen per uur gemiddeld 180 oproepen voor een
gesprek binnen. In een minuut kunnen hoogstens zes gesprekken worden
verwerkt.
a Bereken de kans dat in een bepaalde minuut overbelasting optreedt.
b Bepaal de kans dat in een uur meer dan 200 oproepen binnenkomen.
7.9 De kans dat bij een loterij een grote geldprijs valt op een lot bedraagt 1 op
de 25000.
a In een stad worden 120000 loten verkocht. Hoe groot is de kans dat in deze
stad meer dan 10 grote geldprijzen vallen?
b In een provincie worden 1 200 000 loten verkocht. Hoe groot is de kans dat
in deze provincie minder dan 40 grote geldprijzen vallen?
84 Hoofdstuk 7 De poissonverdeling
7.11 Bij een veerboot is in een periode van 30 maanden vijftien maal een storing
in de machinekamer opgetreden. Deze storingen verschijnen op willekeurige
momenten volgens een poissonverdeling. De reparatie van zo'n storing kost
€2.500 (mede als gevolg van inkomstenderving).
a Bereken de kans dat in een willekeurige maand 0, 1, 2 en 3 of meer storin-
gen optreden. Bereken de hierbij behorende kosten en bepaal de verwachtings-
waarde van de kosten per maand.
b De rederij overweegt een revisie van de machinekamer te laten uitvoeren.
De kosten hiervan bedragen € 15.000. Na de opknapbeurt zal gemiddeld
slechts tweemaal per jaar een storing voorkomen. Dit 'effect' zal vier jaar du-
ren. Daarna zal de machinekamer weer het oude patroon van storingen ver-
tonen. Geef op basis hiervan een oordeel over de kosten van de revisie.
7.13 Bij een bepaald soort chirurgische ingreep is de kans op het optreden van
een bepaalde, zeer zeldzame complicatie gelijk aan 0,002. In een ziekenhuis
worden per jaar 400 van dergelijke ingrepen uitgevoerd.
a Hoe groot is de kans dat in een willekeurig jaar meer dan éénmaal een der-
gelijke complicatie wordt geconstateerd?
b Landelijk worden per jaar 18000 van dergelijke ingrepen uitgevoerd. Hoe
groot is de kans dat in een willekeurig jaar minder dan 30 keer de bedoelde
complicatie optreedt?
Een medische behandeling blijkt in 98,5 o/o van de gevallen effectief te zijn.
Bepaal die kans dat van een groep van 200 (willekeurig gekozen) patiënten
er minstens 197 baat hadden bij de behandeling.
1.16 Het aantal schepen Is. dat per dag in een bepaalde haven aankomt, is te be-
schouwen als een variabele met een poissonverdeling waarvoor geldt fl = 24.
Per dag kunnen vier schepen worden afgehandeld in de haven. Als zich meer
dan vier schepen melden, dan worden de overige schepen doorgestuurd
naar een andere haven.
a Hoe groot is de kans dat op zekere dag één of meer schepen worden doorge-
stuurd?
b Wat is het verwachte aantal schepen dat per dag wordt doorgestuurd?
c Hoe groot moet de capaciteit van de haven worden om een kans kleiner dan
0,01 te hebben dat op een willekeurige dag een of meer schepen worden
doorgestuurd?
1.11 Door een grote bank worden wekelijks duizenden effectenorders uitgevoerd.
Gebleken is dat in sommige gevallen een order niet juist wordt uitgevoerd.
De kans hierop is voor een willekeurige order 0,01.
a Hoe groot is de kans dat van 300 willekeurige orders er minder dan vijf niet
juist worden uitgevoerd?
b Hoe groot is de kans dat van 2 500 willekeurige orders er minder dan acht-
tien niet juist worden uitgevoerd?
c Het herstellen van een fout uitgevoerde order kost gemiddeld € 180. Door
een maatregel waarbij orders nauwkeuriger worden gecontroleerd, kan de
kans op foutieve uitvoering worden gereduceerd van 0,01 tot 0,002. De
nauwkeuriger controle kost € 1,50 per order.
Is het op basis van de verwachte kosten verstandig de nauwkeurige controle
in te voeren bij de bank?
86 Hoofdstuk 7 De paissenverdeling
7.19 (Sluit aan bij § 7+.)
Een satelliet heeft vijf zonnepanelen. Ieder zonnepaneel heeft een levens-
duur die kan worden beschreven door een negatief-exponentiële verdeling
met À= 0,5. Dus de gemiddelde levensduur van een paneel is 1/0,50 =
2 jaar. Zodra drie zonnepanelen zijn uitgevallen, houdt de satelliet op te
functioneren.
a Hoe groot is de kans dat een willekeurig zonnepaneel na vier jaar nog func-
tioneert? Bereken dit met Excel.
b Hoe groot is de kans dat de satelliet na vier jaar nog functioneert? We gaan
ervan uit dat de levensduren van de panelen onderling onafhankelijk zijn.
8 Schatten
Deel A Multiplechoicevragen
m2 Bij een grote financiële instelling worden jaarlijks vele honderden net afge-
studeerden aangenomen als trainee. Bedoeling is dat deze trainees na een
zekere tijd (t) een eerste aanbod ontvangen voor een officiële baan bij deze
instelling. Bij een onderzoek onder 36 trainees is gebleken dat men gemid-
deld na zestien maanden het eerste aanbod kreeg. Voor ! is gegeven dat de
standaarddeviatie drie maanden is. Het 95 %-betrouwbaarheidsinterval voor
de gemiddelde tijd tot het eerste aanbod is dan gelijk aan:
a 9,01 < fl < 22,99
b 15,16 < fl < 16,85
c 15,02 < fl < 16,98
d 14,84 < fl < 17,17
88
c een normale verdeling met gegeven standaarddeviatie en onbekende
verwachtingswaarde
d een gegeven normale verdeling met minder dan 30 vrijheidsgraden
DeeiB Openvragen
8.1 Een machine vult zakken met meel. Het gewicht van het meel in een wille-
keurige zak is te beschouwen als een trekking uit een normale verdeling met
onbekende fl en een standaarddeviatie van 100 gram.
Om het schattingsinterval te berekenen voor fl weegt men de inhoud van 25
zakken meel. Het gemiddelde gewicht van het meel per zak bedroeg
20,142kg.
a Bereken een schattingsinterval voor fl (de verwachtingswaarde van het ge-
wicht van het meel) dat een betrouwbaarheid heeft van 95 o/o.
Antwoord Het steekproefgemiddelde x kan worden beschouwd als een trekking van de kans-
variabele~ die het gemiddelde vulgewicht van 25 willekeurige zakken meel weer-
geeft.
Voor een 'losse' zak meel geldt als standaarddeviatie van hetvulgewicht
a= 100gram.
Voor de variabele~geldt dus als standaarddeviatie:
a~ = .. .. .
Als we een schattingsinterval willen maken met een betrouwbaarheid van 95%, dan
levert de tabelvan de standaard norma Ie verdeling:
z = .....
Dus .... . ..... < fl < .......... is het 95 %-betrouwbaarheidsinterval voor fl·
Dus .......... < J.L < .......... is het 99%-betrouwbaarheidsinterval voor J.L.
n E::: •• • • • ••
8.2 Van een bepaalde oplossing worden tien even grote monsters genomen.
Van elk monster bepaalt men het aantal mg eiwit, om hiermee het eiwit-
gehalte (fl) van de gehele oplossing te kunnen schatten.
De waargenomen uitkomsten zijn als volgt:
36,5 45,2 40,5 42,0 37,7 39,4 41,6 38,8 39,0 43,3
90 Hoofdstuk 8 Schatten
a Een zuivere schatter voor fl is het steekproefgemiddelde x.
Bereken x.
'"\;'X -
- ~I
X=--
n
We vinden dus:
1
x=- (36,5 + ... .. + .... . + ..... + ..... + ..... + ..... + ..... + .... . + ..... )
10
b Alvorens er een schattingsinterval kan worden berekend voor fl, moet er een
schatting van de variantie gemaakt worden.
Bereken deze variantie.
L (X;- X)
s 2 = ----'---
2
n-1
.. ..... - . ...... < J.I- < ...... . + ....... , dus .... . .. < J.I- < ...... .
8.3 Een meetapparaat in een laboratorium wordt gebruikt voor het bepalen van
de hoeveelheid van een stof die aanwezig is in een oplossing. Van het appa-
raat is bekend dat dit voor de gemeten hoeveelheid een standaarddeviatie
heeft van 1,2mg per bepaling. Er worden zes monsters genomen.
Deze leverden voor de hoeveelheid stof de volgende resultaten (in mg): 14,7
13,2, 15,8, 16,1, 14,3 en 15,0.
Bereken met deze gegevens een 95 %-betrouwbaarheidsinterval voor f.l= de
gemiddelde hoeveelheid van de stof per monster. Ga ervan uit dat de meet-
resultaten een normale verdeling volgen.
8.5 Van een vulmachine is bekend dat deze een 'natuurlijke' standaarddeviatie
heeft van er= 3 mg. De instelling van de machine voor wat betreft de ge-
middelde afgeleverde hoeveelheid kan echter na verloop van tijd veranderen.
In de fabriek dienen daarom regelmatig inspecties te worden uitgevoerd. Op
basis van de uitkomsten daarvan dient men - indien nodig - de instelling
van de vulmachine aan te passen.
a Bij een inspectie werden de volgende acht vulgewichten gevonden (in mg):
124 127 123 126 127 131 125 en 122.
Bereken op basis van deze gegevens een 95 %-betrouwbaarheidsinterval
voor fl· Is het op grond van dit interval verdedigbaar om te stellen dat de
machine wordt gekenmerkt door een gemiddelde instelling van f.l = 130 mg?
b Men stelt als eis dat het betrouwbaarheidinterval voor f.l niet breder mag zijn
dan 1 mg. Hoe groot is de vereiste steekproefomvang dan?
92 Hoofdstuk 8 Schatte n
8.6 Een bedrijf vervaardigt plastic draagtasjes die winkeliers gratis verstrekken
aan klanten om hun inkopen in te doen. Deze dienen een bepaald gewicht te
kunnen dragen. Bij proeven worden de tasjes steeds zwaarder belast totdat
zij stukgaan. Bekend is dat de breeksterkte van een tasje, uitgedrukt in kilo-
gram belasting, beschreven kan worden door een normale verdeling met
fl = 11,5 en CT= 1,3 kg.
a Hoeveel procent van de tasjes breekt reeds bij een belasting van minder dan
10 kg?
b De fabrikant gaat een nieuw soort plastic gebruiken bij de productie van de
tasjes. Er wordt een steekproef genomen van 25 tasjes. Deze leveren een ge-
middelde breeksterkte op van 12,8 kg. Ga ervan uit dat de standaarddeviatie
nog hetzelfde is. Bepaal een 95%-betrouwbaarheidsinterval voor fl: de ge-
middelde breeksterkte.
c Hoeveel o/o van de tasjes breekt bij een belasting minder dan 10 kg ingeval
de nieuwe waarde van fl nu 12,8 is? En hoeveel o/o is dit als fl gelijk is aan de
linkergrens L respectievelijk de rechtergrens R van het interval dat berekend
is bij vraag b?
8.8 In een fabriek maakt men badkamertegels. Bekend is dat het productiepro-
ces 20% ondeugdelijke tegels oplevert. Na wat wijzigingen in het productie-
proces, werd bijgehouden hoe groot het aantal afgekeurde tegels is in de
nieuwe situatie. Men vond de volgende aantallen:
1 120
2 210
3 1000 80
4 3000 450
5 1500 120
6 1700 170
7 2000 220
8 1400 80
9 1800 200
10 1500 130
a Stel dat alleen de gegevens van dag 1 bekend zouden zijn. Wat is op basis
daarvan een 95%-betrouwbaarheidsinterval voor 7T: de populatiefractie van
afgekeurde tegels?
b Bereken voor iedere dag de fractie afgekeurde tegels. Bereken op basis van
deze dagelijkse steekproeffracties een interval van 7T 0 : de gemiddelde dage-
lijkse fractie afgekeurde tegels.
8.9 Bij een onderzoek naar bodemverontreiniging bij benzinestations werden bij
50 benzinestations bodemmonsters genomen. De steekproef van 50 benzi-
nestations werd aselect gekozen uit de populatie van alle benzinestations in
Nederland. In zes gevallen werd een ontoelaatbaar niveau van bodemveront-
reiniging geconstateerd. Geef, met behulp van de 'grote' formule uit het
theorieboek, een 95,4 %-betrouwbaarheidsinterval voor de fractie benzine-
stations met ernstige bodemverontreiniging.
8.10 Bij een snelweg is door een verdekt opgestelde controlepost de snelheid be-
paald voor een grote steekproefvan de passerende auto's. Uit de aantekenin-
gen van de onderzoeker blijkt dat de berekende standaarddeviatie van de
snelheden 8,2 km/uur bedraagt. Verder bleek dat men als 95 %-betrouw-
baarheidsinterval voor de gemiddelde snelheid als resultaat opgeschreven
had dat fl tussen 74,2 en 76,8 zou moeten liggen. Helaas was niet meer te
vinden hoe groot de steekproefomvang is geweest.
a Bereken op basis van de verstrekte gegevens de omvang van de steekproef
(ga er hierbij van uit dat de nog onbekende steekproefomvang groot genoeg
is om toepassing van de normale verdeling te rechtvaardigen).
b Uit het interval blijkt dat f1. op z'n minst 74,2 en op z'n hoogst 76,8 zou
kunnen zijn. Op het betreffende traject geldt een maximumsnelheid van 80
km/uur. Bereken op basis van beide uiterste waarden van fl het percentage
auto's dat te hard rijdt. De snelheden vormen een normale verdeling.
Veronderstel dat de politie alleen bekeuringen geeft indien de snelheid min-
stens 85,0 km/uur is. Hoeveel procent van de automobilisten krijgt dan een
bekeuring? Formuleer dit als een interval.
8.12 Een student doet een onderzoek naar het kijkgedrag van Nederlanders naar
de uitzendingen van de samenvattingen voetbal op zondag. Zij wil weten
wat het percentage vrouwen is onder de kijkers, wat de gemiddelde leeftijd is
onder de kijkers en wat het percentage aanhangers van FC Utrecht is onder
de kijkers. In alle drie gevallen wenst men een 95%-betrouwbaarheidsinter-
val. De student wil een steekproef nemen uit de voetbalkijkers. Geef aan hoe
groot de steekproefomvang moet worden gekozen als voldaan moet worden
aan de volgende voorwaarden:
a De fractie vrouwen moet met een marge plus of min 0,025 worden bepaald.
Ga er op voorhand van uit dat ongeveer 30% van de kijkers vrouw is.
94 Hoofdstuk 8 Schatten
b De gemiddelde leeftijd moet plus of min 2 jaar worden bepaald. Ga ervan
uit dat de standaarddeviatie van de leeftijden 12 jaar is.
c De fractie FC Utrecht-supporters moet plus of min 0,02 moet worden
bepaald. Ga ervan uit dat ongeveer 6% van de kijker FC Utrecht-fan is.
d Hoe groot wordt de vereiste steekproefomvang als aan alle drie voorwaarden
tegelijk moet zijn voldaan?
8.13 In Nederland zijn 1742 hoogleraren. Via een steekproef wil men te weten
komen hoeveel procent van deze populatie voorstander is van het wijzigen
van de huidige vut-regeling.
Hoe groot moet deze steekproef zijn om de fractie 'voorstanders van wijzi-
ging' te leren kennen met een nauwkeurigheid van 0,03 (dus circa 3 o/o ), ge-
baseerd op 95 %-betrouwbaarheid?
8.14 Een handelsmaatschappij onderzoekt hoe groot de fractie orders is die bin-
nen de afgesproken levertijd worden uitgevoerd.
Van 200 orders bleken er 180 binnen de levertijd uitgevoerd te zijn.
a Geef een 95 %-betrouwbaarheidsinterval voor de fractie orders die op tijd
zijn uitgevoerd.
b Hoeveel orders moeten worden onderzocht om een interval voor 7T te krij-
gen dat hoogstens 0,02 breed is? (We gaan ervan uit dat 7T ongeveer 0,9 is.)
8.15 Bij een supermarkt wil de manager laten bepalen hoe groot de fractie klan-
ten is die meedoet aan het airmilesspaarsysteem. Hij wil deze fractie weten
met een nauwkeurigheidsmarge van hoogstens 0,05 in de vorm van een
95 %-betrouwbaarheidsinterval.
Bij welke steekproefomvang wordt zeker aan deze voorwaarde voldaan?
8.16 Een ziektekostenverzekeraar heeft een groep medewerkers in dienst die tele-
fonisch problemen van cliënten behandelt. In verband met de werkplanning
wil men een beeld krijgen van de gemiddelde tijdsduur van de telefoonge-
sprekken.
Voor een steekproefvan 16 gesprekken werden de volgende tijdsduren waar-
genomen (in minuten): 2,50 12,70 3,90 6,60 11,20 10,30 8,50 7,30 2,20 5,80
4,80 4,30 5,20 9,70 8,50 en 3,60.
a Voer de gegevens in op een Excelsheet. Bereken voor de steekproef de ge-
middelde tijdsduur en de standaarddeviatie van de tijdsduren.
b Bereken op basis van de uitkomsten bij vraag a een 95%-betrouwbaarheids-
interval voor fl: de gemiddelde tijdsduur van de populatie van telefoonge-
sprekken.
c Gemiddeld komen 32 telefoontjes per uur binnen. De manager wil het aan-
tal medewerkers zodanig plannen dat de beschikbare hoeveelheid werktijd
20% hoger is dan de gemiddeld te verwachte tijdsduur van alle gesprekken
tezamen. Hoeveel medewerkers moeten minimaal beschikbaar zijn bij de
telefoon balie?
.._
Handvat
.. . A B
.. .. ... .. ·-·
c 0 E G H
-
8.18 Bij een postorderbedrijf wil men een schatting maken van de gemiddelde
tijdsduur van telefoongesprekken met klanten. We gaan ervan uit dat de
gespreksduur t een kansvariabele is met een normale verdeling. Voor negen
gesprekken werd als tijdsduur gevonden (in seconden): 218, 225, 230, 240,
214, 202, 204, 195, 180.
Bereken een 95 %-betrouwbaarheidsinterval voor ft: gemiddelde tijdsduur.
8.19 Een technicus van een bedrijf dat oefenapparaten ontwikkelt voor fitness-
trainingen heeft een nieuw ontwerp gemaakt van een bepaalde machine. Be-
doeling is dat dit apparaat spierversterkend werkt voor personen met rug-
klachten. Helaas was maar één prototype van het apparaat beschikbaar om
het te kunnen testen. Hierdoor konden slechts de gegevens van twaalf pa-
tiënten worden verzameld. Deze twaalf patiënten gingen oefenen met dit ap-
paraat en het aantal dagen werd opgetekend dat nodig was om volledig het
gewenste resultaat te behalen. Van de twaalf patiënten werden de volgende
aantallen dagen waargenomen:
15, 18, 41, 27, 23, 16, 29, 30, 32, 22, 25 en 22.
a Schat de standaarddeviatie.
b Bereken een 95%-betrouwbaarheidsinterval voor ft: de gemiddelde herstel-
tijd voor de populatie.
c In een vervolgstudie werden 90 personen getest. Er werd een standaard-
deviatie gevonden van 6,5 dagen en een gemiddelde hersteltijd van 27 da-
gen. Bereken opnieuw een 95 %-betrouwbaarheidsinterval voor fl·
d Men wenst het bij vraag c gevraagde interval zodanig te bepalen dat het re-
sulterende interval voor fl niet breder is dan twee dagen. Hoe groot moet de
steekproefomvang worden gekozen om dat te bereiken, als de standaard-
deviatie van vraag a als vertrekpunt mag worden gekozen?
96 Hoofdstuk 8 Schatten
8.20 Bij een postorderbedrijf onderzoekt men de betalingstermijn van de klan-
ten. Op basis van een steekproef van 150 rekeningen stelde men vast dat de
betaaltermijn per cliënt een gemiddelde kende van 34,2 dagen met een stan-
daarddeviatie van 12,0 dagen.
a Bereken een 95 %-betrouwbaarheidsinterval voor de gemiddelde betalings-
termijn.
b De directie was niet helemaal tevreden over de nauwkeurigheid van het bij
vraag a berekende interval. Men wenst een marge voor fl te hanteren van
één dag (ten opzichte van het gevonden gemiddelde). Men besluit daarom
een aanvullende steekproef te doen. Hoeveel extra waarnemingen moeten
aan de oorspronkelijke steekproef worden toegevoegd?
c Volgens de leveringsvoorwaarden dienen klanten binnen 30 dagen te beta-
len. In een steekproef van 300 klanten bleken 124 betalingen aan deze con-
ditie te voldoen. Geef een 95 %-betrouwbaarheidsinterval voor de fractie be-
talingen die op tijd worden verricht.
.
9 Toetsen
Deel A Multiplechoicevragen
m5 Een vulmachine is zodanig ingesteld dat deze verpakkingen vult met een
vulgewicht ~ dat een normale verdeling volgt met fl = 1 510 gram en a= 20
gram. Regelmatig wordt met een steekproef gecontroleerd of de instelling
(fl) van de machine nog correct is. We nemen dan een steekproefvan zestien
verpakkingen en we toetsen tweezijdig met a = 0,05. We veronderstellen dat
a niet is veranderd. De grenzen van het kritieke gebied zijn dan:
a 1500,2 en 1519,8
b 1 4 77 en 1 543
c 1507,55 en 1512,45
d 1461 en 1559
98
m6 Voor een normaal verdeelde variabele met onbekende 14 en a wordt een
toets voor 14 verricht. De volgende gegevens zijn van belang: H 0 : 14 = 60, H 1 :
14 < 60, a= 0,05, s2 = 16, n = 25, het steekproefgemiddelde is 62. Bij deze
toets vinden we dus een berekende t* -waarde of z* -waarde die gelijk is aan:
a 2,50
b 0,625
c 1,568
d 1,316
9.1 De Rekenkamer heeft gesignaleerd dat 50% van alle uitkeringen krachtens
de Bijstandswet op onjuiste gronden wordt verstrekt. Op grond hiervan
werd een aantal nieuwe richtlijnen opgesteld voor de behandeling van
nieuwe bijstandsaanvragen. Een jaar na de invoering van de nieuwe richtlij-
nen werd er een onderzoek gehouden naar de effecten hiervan. Er werd in
100 gevallen waarbij een uitkering was toegekend, nagegaan of de uitkering
overeenkomstig de nieuwe richtlijnen terecht is toegekend. Er bleken 25 ge-
vallen te zijn van een niet op juiste gronden toegewezen uitkering. Toets of
de nieuwe richtlijnen geleid hebben tot een duidelijk terugbrengen van het
aantal onjuiste uitkeringen.
Toets hierbij eenzijdig, kies a= 0,05.
Antwoord Bij het ontwerpen van de toets kiezen we als nulhypothese dat de fractie 7T, dat is de
fractie onjuisttoegekende uitkeringen, gelijk is aan 0,5.
Aangezien er eenzijdig moet worden getoetst, geldt klaarblijkelijk:
H 0 : 7T = 0,5
en H 1 : 7T< 0,5
De toetsingsgrootheid is gedefinieerd als de kansvariabele k_, die het aantal onjuist
toegekende uitkeringen uit de steekproef aangeeft. De steekproefgrootte bedraagt
n = 100.
Onder de veronderstelling dat de nulhypothese juist is, geldt dat de variabele k bino-
miaal verdeeld is met n = ....... en 7T = ...... .
Het kritieke gebied moet worden berekend door toepassing van de normale benade-
ring op de verdelingvan k..
(Aan de vereisten is voldaan, namelijk n > ...... , n 7T > ...... en n (1 - 7T) > ...... )
Voor de verwachtingswaarde van k vinden we:
E(k.) = n 7T = .... .
z= {kik~ ..... }
9.2 Een fabrikant die een vermageringsmiddel op de markt brengt, stelt in zijn
brochure dat dit product 150 calorieën bevat per pakje van 200 gram. Na-
vraag bij de fabrikant toonde dat laboratoriumproeven hem een gemiddelde
van 150 calorieën per pakje leverden en een standaarddeviatie van 20,0 calo-
rieën per pakje. Bij een serie controleproeven heeft de Consumentenbond
25 pakjes onderzocht. Deze 25 pakjes bleken gemiddeld een voedingswaarde
te hebben van 170 calorieën.
a Toets of de fabrikant gelijk kan hebben met zijn uitspraken. Kies als nulhy-
pothese H 0 : f4 = 150 en als alternatieve hypothese H 1: 14 > 150. Kies verder
a= 0,01.
gR = ·•••••• + ..... .. =
Het kritieke gebied luidt dus:
Z = {xiX> ..... }
In de steekproef is een gemiddeld aantal calorieën gevonden van x= 170. Deze
waarde ligt wel/niet in het kritieke gebied.
Oefabrikant heeft daarom met zijn garantie gelijk/ongelijk.
Antwoord Gegeven is nu dat J.L in werkelijkheid de waarde 170 heeft. Bij het berekenen van de
kans op een fout van de tweede soort gaan we de kans bepalen dat het steekproef-
gemiddelde niet in het bij vraag a berekende kritieke gebied terechtkomt.
Voor de verdeling van~ geldt nu:
Z = {x!X> ... .. }
9.4 Een fabrikant van een geneesmiddel garandeert dat het medicijn in min-
stens 90 o/o van de gevallen werkt. In een steekproef van 200 blijken 40 per-
sonen te zijn waarbij het middel niet werkte. Kan de fabrikant gelijk hebben
met zijn garantie? (a= 0,01).
9.7 Een elektriciteitsbedrijf laat consumenten maandelijks een vast bedrag beta-
len als een voorheffing voor levering van stroom. Dit gebeurt op basis van
een geschat verbruik. Aan het eind van het jaar wordt het werkelijke ver-
bruik afgelezen en volgt een bijbetaling of een terugbetaling. Een
consumentenorganisatie heeft het vermoeden dat het bedrijf te hoge bedra-
gen als voorheffingen incasseert bij de consumenten. Het bedrijf ontkent dat
en stelt dat consumenten gemiddeld nog 1,2% van het jaarbedrag moeten
nabetalen.
Er wordt een steekproef genomen onder 130 willekeurig gekozen huishou-
dens. Dat leverde op dat men gemiddeld 2,3% teruggave kreeg met een stan-
daarddeviatie van de teruggaves van 4,1% (werk hiermee als een gegeven u).
a Toets met a = 0,05 of de stelling van het bedrijf houdbaar is.
b Toets ook of het populatiegemiddelde 0% kan zijn.
- Op basis van meerjarig onderzoek is komen vast te staan dat van 60o/o van
alle ondernemingen die als starter worden aangemeld bij de Kamer van
Koophandel, de activiteiten binnen drie jaar worden beëindigd. Om de
overlevingskans van nieuwe bedrijven te verhogen, heeft de Kamer van
Koophandel een mentorsysteem ingevoerd. Hiermee kunnen bedrijven (op
basis van vrijwilligheid) gedurende de eerste twee jaar begeleiding krijgen
van een ervaren ondernemer.
Voor een groep van 88 bedrijven die van deze dienstverlening gebruik heeft
gemaakt, is gebleken dat 31 bedrijven binnen drie jaar de activiteiten heeft
beëindigd. Toets met a= 0,01 (eenzijdig) of het mentorsysteem lijkt te wer-
ken.
J
9.9 Bij een onderzoek naar een weinig voorkomende ziekte in Nederland is bij
een steekproef van 100 000 personen vastgesteld dat in 36 gevallen deze
ziekte werd waargenomen.
a Geef een 95%-voorspellingsinterval voor het aantal gevallen van deze ziekte
onder de zestien miljoen inwoners van Nederland.
b Gegeven is dat dezelfde ziekte in de USA bij 250 op de 1 miljoen inwoners
voorkomt. Toets of de ziekte in Nederland meer voorkomt dan in de USA
(kies a= 0,05).
9.10 In een laboratorium wordt een onderzoek verricht naar het chloorgehalte
van het water in zwembaden. Hiervoor wordt een aantal malen een maatbe-
ker met water uit het zwembad gevuld. Van de inhoud van elke maatbeker
wordt het gehalte aan chloor vastgesteld. Bekend is dat deze bepalings-
methode een onnauwkeurigheid heeft die wordt weergegeven door een stan-
daardafwijking per bepaling van 1,5 mg chloor.
Per monster bedraagt de waargenomen hoeveelheid chloor:
9.12 Een instituut voor economisch onderzoek wil onderzoeken hoeveel procent
van het gezinsbudget wordt besteed aan recreatieve uitgaven. Voor acht wil-
lekeurig gekozen gezinnen uit een bepaalde inkomensgroep (onze popula-
tie) worden de volgende percentages gevonden:
Gezin 1 2 3 4 5 6 7 8
%recreatie 17 12 13 14 10 18 16 20
9.13 Door een fabrikant worden sigaretten van het merk Ultrasoft op de markt
gebracht. Hiervan wordt op de verpakking vermeld dat het gemiddelde teer-
gehalte per sigaret hoogstens 5,0 milligram per sigaret bedraagt. We gaan er-
van uit dat het te bepalen teergehalte per sigaret kan worden beschreven
door een normale verdeling met onbekende fl en er. In een laboratorium
werden 20 sigaretten getest. Dat leverde de volgende resultaten:
T~ehattevan20s~~n
6,3 7,2 5,3 5,9 6,6 4,3 7,2 5,0 6,7 5,1 ·-
4,9 7.9 5.5 5.4 6,0 4.5 5,8 6,5 5,7 6,4
9.14 Bij een servicebedrijf voor cv-installaties kan men een abonnement nemen
om bij storingen snelle hulp te krijgen. Het bedrijf garandeert dat de gemid-
delde wachttijd na een storingsmelding hoogstens 1 uur en 30 minuten is.
Voor 16 storingsmeldingen is de wachttijd onderzocht. Dat leverde (in minu-
ten); 45, 60, 72, 88, 92, 104, 108, 118, 120, 125, 142, 156, 172, 185, 192,206.
Plaats deze gegevens op een Excelwerkblad en beantwoord de volgende
vragen:
a Toets de bewering van het bedrijf.
b Bereken een 95%-betrouwbaarheidsinterval voor de gemiddelde wachttijd.
9.15 Een politieke partij beweert dat van de kandidaten op de kieslijsten voor de
gemeenteraadsverkiezingen ten minste 30% vrouw is. Voor een steekproef
van 35 gemeenten vond men een gemiddeld percentage van 26% en een
standaarddeviatie van 11 %.
a Toets of de bewering van de partij staande kan worden gehouden, gegeven
het steekproefresultaat (toets telkens met a= 0,05).
Een statisticus spreekt twijfel uit over de bij vraag a gevolgde methode. Het
aantal kandidaten per gemeente loopt nogal uiteen en daarom zou het niet
toegestaan zijn om te werken met (gemiddelden van) percentages. Bij een
vervolgonderzoek worden daarom alle kandidaten uit de steekproef van 35
gemeenten bij elkaar gevoegd. Dat leverde totaal 640 kandidaten. Hierbij
waren 176 vrouwen.
9.16 Blijkens het jaarverslag van het Sociaal en Cultureel Planbureau is 45% van
de Nederlanders voorstander van het opnieuw invoeren van de doodstraf in
Nederland. Een aantal politieke partijen reageert hierop geschrokken, omdat
dit een opvallend verschil in opvatting zou aangeven tussen politici en be-
volking. Men besluit daarom een propagandacampagne te houden tegen de
doodstraf. Na afloop van die campagne worden 200 willekeurige Nederlan-
ders ondervraagd over hun standpunt. Nu blijken 62 van de 200 voorstan-
der te zijn van de doodstraf.
a Toets (eenzijdig) met a = 0,05 of de hypothese dat het aantal voorstanders
nog steeds 45% is, kan worden verworpen.
b Bereken een 95 %-betrouwbaarheidsinterval voor het percentage voorstan-
ders onder de Nederlandse bevolking, gegeven het resultaat in de steekproef.
Een bedrijf voert een administratie van het aantal klachten van afnemers. In
acht weken werden de volgende aantallen klachten per week geregistreerd:
1 2 3 4 5 6 7 8
Aantal klachten 30 45 46 50 52 34 35 28
We gaan ervan uit dat het aantal klachten per week kan worden beschouwd
als een variabele met een normale verdeling.
In het verleden bleek het aantal klachten gemiddeld 51 per week te zijn.
Toets of dit gemiddelde nog houdbaar is in het licht van verzamelde uit-
komsten (kies a= 0,05).
9.19 Een fabrikant van azijn levert flessen die 1 000 ml moeten bevatten. Een
consumentenorganisatie onderzoekt de inhoud met enige regelmaat. Elke
week wordt een steekproef van tien flessen genomen. Van de gemeten in-
houden (xl' ... , x 10 ) wordt het gemiddelde x bepaald. Als dit lager uitkomt
dan 992 ml, wordt de hypothese H 0 : 'fl ~ 1 000' verworpen, waarna de over-
heid wordt ingelicht. We nemen aan dat x 1 tot en met x 10 normaal zijn ver-
deeld.
Een steekproef van negen flessen geeft aan 1001, 993, 998, 987, 1004, 991,
985, 990, 1 006.
d Wat concludeert de consumentenorganisatie?
e Wat is het 90%-betrouwbaarheidsinterval voor fi-?
9.20 Op een bepaald deel van de ringweg rondom Utrecht zijn altijd veel verkeers-
opstoppingen tijdens het avondspitsuur. In het kader van de filebestrijding
is er een aanbevolen omleidingsroute gevormd om op die manier de ver-
keersdruk op dat traject te verminderen.
Voorafgaand aan de maatregelen werden tijdens de spits per uur gemiddeld
4 200 auto's geteld. Een maand na de invoering van de maatregelen werd op
25 werkdagen geteld hoeveel auto's per uur van het oude traject gebruik-
maakten. Dit leverde een gemiddelde op van 3 812 auto's met een standaard-
deviatie van 245.
Toets met a = 0,05 of de verkeersdrukte op het traject significant is afge-
nomen.
9.22 Het aantal klachten dat per dag bij een reisorganisatie binnenkomt heeft een
poissonverdeling met fl = 1,8.
a Bereken de kans dat op een willekeurige dag precies drie klachten binnenko-
men.
b Bereken de kans dat in een periode van twintig dagen meer dan 44 klachten
binnenkomen.
c Ontevreden over het hoge aantal klachten besluit de reisorganisatie stren-
gere eisen te stellen aan de te verhuren accommodatie. Na het nemen van de
maatregelen werden 23 klachten ontvangen in twintig dagen. Duidt dit op
een significante verbetering ten opzichte van de oude situatie? (Voer de toets
uit met a = 0,05.)
9.24 Een importeur krijgt een grote partij goederen aangeboden. Twijfelachtig is
of alle exemplaren voldoen aan de eisen die de wet aan dit product stelt. Als
de partij hoogstens 5% ondeugdelijke exemplaren bevat, wil de importeur
de partij graag hebben. Als de partij meer dan 20% ondeugdelijke exempla-
ren bevat, wil hij de partij beslist niet hebben.
a Stel dat de importeur willekeurig 40 exemplaren uit de partij neemt en deze
inspecteert. Als keuringsgrens geldt c = 4. Dus als er vier of minder defecten
worden gevonden, keurt hij de partij goed. Bij meer dan vier defecten keurt
hij de partij af.
Bereken voor een partij met 20% defecten de goedkeurkans.
Bereken voor een partij met 5% defecten de afkeurkans.
b We voeren dezelfde keuring uit als bij vraag a. We keuren de partij goed als
het aantal defecten in de steekproef ~ c is.
Bereken voor c = 2, 3, 4, 5, 6, 7 en 8 de afkeurkansen van partijen met 5%
defecten en de goedkeurkansen van partijen met 20% defecten. Voor welke
waarde vancis de som van de twee berekende kansen minimaal?
c De importeur besluit 100 exemplaren te keuren. De partij wordt goedge-
keurd als het aantal defecten in de steekproef ~ c is. Bereken voor c = 8, 9,
... , 15 de afkeurkansen van partijen met 5% defecten en de goedkeur-
kansen van partijen met 20% defecten. Voor welke keuze van c is de som
van deze kansen minimaal?
9.25 Bij de keuring zoals beschreven in opgave 24 nemen we een steekproef van
100 stuks.
We besluiten een partij goed te keuren als hierbij hoogstens negen defecte
exemplaren worden aangetroffen.
a Bereken de goedkeurkans voor partijen met 10%, 11%, 12%, 13%, 14%,
15%, 16% en 20% defecten.
b Teken een grafiek van de goedkeurkansen.
9.26 Bij de helpdesk van een computerleverancier is bekend dat de Easy Speed
Pentium nogal eens problemen geeft bij de installatie. In het verleden moest
bij 20% van de geleverde machines een monteur eraan te pas komen om de
harddisk te vervangen. De fabrikant van de Easy Speed Pentium beweert dat
er inmiddels een stringenter kwaliteitsbeleid wordt gevolgd waardoor het
percentage klachten aanmerkelijk lager zou moeten uitkomen dan de ge-
noemde 20%. Van het nieuwe type werden er door een bepaalde groothan-
del in een week 60 verkocht.
Hiervan bleken er acht de oude klacht te vertonen.
a Toets of er sprake is van een lager percentage defecten in vergelijking met de
oude situatie. (Kies ex= 0,05.)
b Bereken het onderscheidingsvermogen van de toets, indien inmiddels zou
gelden dat nog maar 10% van de Easy Speed-computers nazorg vereist.
c Stel dat met een twee keer zo grote steekproef (dus 120), twee keer zoveel
klachten (namelijk zestien) worden gevonden. Hoe luiden dan de conclusies
bij vraag a en b?
d Bij welke steekproefomvang zou een gevonden percentage van 15% defecten
een aanduiding zijn van een significante verbetering ten opzichte van de
eerdergenoemde 20%? (Gegeven het feit dat we toetsen met ex= 0,05.)
Deel A Multiplechoicevragen
m4 Men wenst te toetsen of het aantal aanvragen bij een helpdesk van een
computermaatschappij gelijk is verdeeld over de vijf werkdagen van de
week. In een bepaalde week worden de volgende aantallen waarnemingen
gedaan tussen maandag en vrijdag: 48, 65, 57, 72 en 58. De expected fre-
quentie voor het aantal aanvragen op een willekeurige maandag is dus:
a 12
b 60
c 48
d 5
109
ms Voor een frequentieverdeling van 300 waarnemingen wordt onderzocht of
deze verdeling qua vorm kan overeenstemmen met een normale verdeling.
Hiertoe worden de gegevens in acht klassen verdeeld. Vervolgens worden de
expected frequenties berekend door de kansen voor iedere klasse te bepalen
met behulp van de tabel van de normale verdeling. Hierbij worden het
steekproefgemiddelde en de steekproefstandaarddeviatie gebruikt als schat-
tingen voor respectievelijk JA en u. Er volgt voor de toetsingsgrootheid de
waarde 15,40. Welke uitspraak is juist?
a De nulhypothese wordt verworpen bij a= 0,01.
b Bij a= 0,05 kan worden geconcludeerd dat er sprake is van homogeni-
teit.
c De rechtergrens van het kritieke gebied is 12,59 bij a = 0,05.
d De linkergrens van het kritieke gebied is 1,24 bij a = 0,025.
m6 Van een kansvariabele is gegeven dat deze een normale verdeling volgt. Een
steekproef van tien waarnemingen levert een schatting van de variantie van
24 op. De nulhypothese die wordt getoetst, luidt: H 0 : u 2 ~ 12. De toetsings-
grootheid heeft dan de waarde:
a 240
b 2
c 18
d 20
DeeiB Openvragen
10.1 Bij een onderzoek naar de rookgewoonten van Nederlanders van 18 jaar en
ouder werden door loting 200 proefpersonen gekozen die vervolgens werden
ingedeeld naar leeftijd en naar rookgewoonte.
De resultaten waren als volgt:
a Bereken de expected-tabel.
80
Antwoord De waargenomen fractie rokers bedraagt - = 0,4.
200
De waargenomen fractie niet-rokers bedraagt . . . . .. .
De waargenomen fractie personen van de leeftijdscategorie 18 - < 30
Leeftijd
18 -< 30 30 -< 45 45enouder Totaal
- -80
Roker 32
Niet-roker 120
Totaal 80 60 60 200
b Bereken de toetsingsgrootheid x 2•
Antwoord We werken hier met een 3 x 2-tabel; het aantal vrijheidsgraden bedraagt dus ... . .
d Hoe luidt het kritieke gebied van de grootheid x?
2
e Wat is uw eindconclusie?
- - - - = (ingevuld)
Deze volgt, gegeven H 0 , een x2 -verdeling met ... vrijheidsgraden. Als grens
vinden we in de tabel (gegeven a= 0,05), dat gg, = .....
Weergegeven als kritiek gebied levert deze grens:
10.3 Bepaal de grenzen van het kritieke gebied voor de volgende chikwadraatver-
delingen.
a Bepaal met de tabel de grens van een rechtseenzijdig gebied voor de vol-
gende verdelingen:
1 a = 0,01 en v = 4 vrijheidsgraden
2 a = 0,05 en v = 6 vrijheidsgraden
3 a = 0,025 en v = 20 vrijheidsgraden
Controleer dat Excel: 'eH I. KWADRAAT. INv' dezelfde uitkomsten levert als
de tabel.
b Bepaal met de tabel de grenzen van een linkseenzijdig gebied voor:
4 a = 0,025 en v = 5 vrijheidsgraden
5 a = O,Ol en v = 50 vrijheidsgraden
6 et= 0,05 en v = 10 vrijheidsgraden
Controleer deze waarden met Excel (NB Maak van een a aan de linkerkant,
een daarmee corresponderende kans voor de rechterkant).
c Bepaal met Excel de grenzen voor de volgende situaties:
7 a = 0,02, v = 7, rechtseenzijdig
8 a = 0,08, v = 4, tweezijdig
9 a= 0,001, v = 22, rechtseenzijdig
- Bij een onderzoek naar het gebruik van internet werden de respondenten
onderverdeeld naar leeftijd en het wel of niet werken met internet. Voor 400
respondenten leverde dit de volgende tabel:
10.8 In een grote stad wordt onderzocht hoe vaak bepaalde delicten voorkomen.
Hierbij wordt een verdeling gemaakt over de vier wijken waarin de stad
organisatorisch is opgesplitst. Op basis van de politierapporten heeft men
een overzicht gemaakt van de delicten in de afgelopen maand (voor zover
die ter ore gekomen zijn van de politie). Dat leverde de volgende gegevens:
Openbare geweldpleging 12 28 6 17
Inbraak 8 42 26 30
Verkeersmisdrijven 32 44 25 33
Diefstal van fietsen en motorvoertuigen 24 66 19 52
10.9 Bij de belastingdienst gaat men uit van de veronderstelling dat bij een naar
waarheid ingevuld aangiftebiljet de cijfers 1 tot en met 4 en de cijfers 6 tot
en met 9 een even grote kans hebben om voor te komen. Bij een eerlijke
aangifte is naar verwachting 24% van de cijfers nullen en 12% vijven.
Iemand die een gefingeerde aangifte doet, zal door een onbewuste voorkeur
sommige cijfers vaker invullen dan andere. Het is ook mogelijk dat zijn aan-
tal nullen of zijn aantal vijven te hoog of te laag is.
Op het aangiftebiljet van de heer X zijn de cijfers 0 tot en met 9 met de vol-
gende frequentie aangetroffen:
. . ... .
Cijfer o
...
1 2
. .. .
3 4 5 6
.. ... ........ .... ..
7 8 9
Frequentie 23 7 6 16 8 18 8 15 9 14
Onderdeel van de controle is het uitvoeren van een toets waarmee de veron-
derstelling van de juiste kans voor elk cijfer wordt onderzocht. Voer deze
toets uit met a = 0,05.
10.11 Het Bridgeblad is een maandblad dat door de Nederlandse Bridgebond on-
der zijn leden wordt verspreid. Omdat het blad in een oplage van 100000
exemplaren per jaar verschijnt, is dit interessant voor adverteerders. Een van
de belangrijkste factoren in dit verband is de leestijd die een bridger besteedt
aan een aflevering van het blad. Hiervoor werd bij 80 lezers de leestijd be-
paald. De frequentieverdeling staat vermeld in de volgende tabel:
Frequentie
48
24
16
3 8
variabele die een poissonverdeling
4ofmeer 4
volgt met ft = 1 (kies a = 0,05).
Totaal toaweken
10.14 In een fabriek staat een aantal machines opgesteld die in volcontinudienst
altijd functioneren. Regelrnatig treden er storingen op bij deze machines, die
dan moeten worden verholpen door een monteur. Gedurende een bepaalde
periode heeft men de tijdstippen genoteerd waarop een machine wegens
storing uitviel. Uit deze gegevens kon men telkens de tijdsduur berekenen
tussen twee opeenvolgende storingsmeldingen. De gemiddelde wachttijd op
een volgende melding bedroeg 1 uur en 45 minuten.
De waargenomen tijdsverschillen
tussen 75 opeenvolgende storingen
zijn weergegeven in de volgende Tijdsverschil
. . ·-·. ........ ..".. ..
Frequentie
tabel. 0 uur - < 1 uur 30
Toets of de waargenomen verdeling 1 uur-< 2 uur 22
van wachttijden overeenstemt met 2 uur-< 3 uur 10
een negatief exponentiële verdeling. 3 uur - < 5 uur 8
Kies a= 0,01. 5 uur en hoger 4
Totaal 74
Lamp 1 2 3 4 5 6 7 8
Branduren 2600 2 560 2 500 2550 2400 2440 2470 2480
10.17 Bij een servicebedrijf voor cv-installaties kan men een abonnement nemen
om bij storingen snelle hulp te krijgen. Het bedrijf garandeert dat de gemid-
delde wachttijd na een storingsmelding hoogstens 1 uur en 30 minuten is en
dat de standaarddeviatie van de wachttijd hoogstens 20 minuten is.
Voor 16 storingsmeldingen is de wachttijd onderzocht. Dat leverde (in mi-
nuten): 45, 60, 72, 88, 92, 104, 108, 118, 120, 125, 142, 156, 172, 185, 192,
206.
Plaats deze gegevens op een Excelwerkblad en beantwoord de volgende
vragen:
a Toets of de standaarddeviatie hoogstens 20 minuten is (kies a= 0,05).
b Bereken een 95%-betrouwbaarheidsinterval voor de standaarddeviatie van
de wachttijd.
Deel A Multiplechoicevragen
m3 Voor twee populaties mag worden verondersteld dat deze allebei een nor-
male verdeling volgen en dezelfde onbekende variantie hebben. Men wil
toetsen of deze populaties hetzelfde gemiddelde hebben. Daartoe neemt
men uit beide populaties een steekproef van tien waarnemingen. Bij de toets
is het aantal vrijheidsgraden van de toetsingsgrootheid gelijk aan:
a 9
b 18
c 19
d -(er is bij deze toetsingsgrootheid geen sprake van vrijheidsgraden)
118
ms Bij een verschiltoets voor fracties worden twee steekproeven genomen. De
eerste steekproef bestond uit 300 waarnemingen en leverde 180 successen
op. De tweede steekproefbestond uit 200 waarnemingen en leverde 140 suc-
cessen op. De toetsingsgrootheid d neemt hier dus een waarde aan van:
a 40
b -0,10
c 0,64
d 0,70
DeeiB Openvragen
11.1 Een instantie die toezicht houdt op de mate van luchtverontreiniging doet
regelmatig metingen op diverse plaatsen in het land. De gemeten verontrei-
niging wordt uitgedrukt in een bepaalde index, die op alle werkdagen wordt
bepaald.
In 2008 werden enkele nieuwe richtlijnen voor de industrie afgekondigd met
als doel het niveau van luchtverontreiniging te verlagen. Om het effect van
deze maatregelen te bestuderen, werd een onderzoek gedaan. Hierbij werden
20 waarden (x) die bepaald zijn in februari 2007 vergeleken met 20 waarden
(y) die zijn gemeten in februari 2008. Voor deze waarden werd berekend:
X = 164,6 en 5x = 17,2 en Y = 143,2 en 5Y = 15,9
E(}") = ...... .
dus sv = ...... .
Om een kritieke grens te berekenen met a = 0,05 zoeken we in de t-verde-
ling met ... vrijheidsgraden.
Omdat er éénzijdig wordt getoetst, moet t 0 ,05 worden bepaald. We vinden
(na interpolatie) t 0 ,05 = ...
Dit leidt tot een kritieke grens:
gR= ...
Opmerkingen
Na de berekening van sv kunnen we ook rechtstreeks een t-waarde bereke-
nen door: -
V
t* =-= .....
sr
Deze waarde vergelijken we met de tabelwaarde t c = .....
11.2 Een bureau voor budgetadvies geeft aan gezinnen bepaalde adviezen over de
besteding van het gezinsinkomen om gezinnen te helpen met het bestrijden
van financiële problemen.
Voor acht gezinnen is vastgesteld hoeveel hun uitgaven (in euro) per maand
bedroegen voordat de advisering plaatsvond en hoeveel die uitgaven per
maand waren ná de uitgebrachte adviezen. De resultaten waren:
Ga ervan uit dat de verschillen (tussen voor en na) mogen worden be-
schouwd als trekkingen uit een normale verdeling.
We gaan toetsen of de advisering effect heeft (kies a = 0,05).
s~ = ... ..
We hebben daarom de afwijkingen van V; ten opzichte van V nodig.
We berekenen hiervan alle kwadraten, tellen die op en delen de som door ....
Dit levert s2 = .....
Bij de toets gaat het erom dat wordt vastgesteld of het waargenomen gemid-
delde verschil V opvallend van 0 verschilt. De grootheid V heeft een varian-
tie:
s~ = .. . . .
sv= .. . . .
Omdat we hier te maken hebben met een normaal verdeelde variabele met
een onbekende variantie, moeten we gebruikmaken van de t-verdeling.
We hadden hier acht waarnemingen, dus ... vrijheidsgraden voor de t-ver-
deling. Bij tweezijdige toetsing met a= O,OS moeten we als grenzen gebrui-
ken t 0 , 025 en t 0 ,975 •
In de tabel vinden we (voor beide) t = .....
Vulgewichten bij machine A (in gram) Vulgewichten bij machine B(in gram)
1053 1067 1093 1068 1054 1070 1075 1082 1072 1088 1062 1069 1085 1099
1052 1058 1065 1071 1058 1080 1058 1065 1068 1060 1074 1055 1040 1073
- Van werknemers in een bepaalde bedrijfstak wordt het verband tussen jaar-
salaris en het bezit van een vakdiploma onderzocht. Groep 1 is een steek-
proef uit de werknemers met diploma, groep 2 is een steekproef van werk-
nemers zonder diploma. De resultaten waren (jaarinkomens in duizenden
euro's):
Groept 40 45 48 33 42 35 32 47 38 37 43
Groep2 25 28 30 35 38 32 22
. .,.... ...... . . ..
Merk A 32 35 37 36 40 36 33 35 38 33
.
MerkB 42 38 36 41 44 35 39 38 42 37 43 38
-
122
In een studie naar luchtvervuiling leverde een aselecte steekproef van acht
luchtmonsters in de omgeving van een bepaalde fabriek gemiddeld 2,26 mi-
crogram van een schadelijke stof per m 3 , met een standaardafwijking van
Hoofdstuk 11 Verschiltoetsen
0,56. In een grote stad leverde een steekproef van tien monsters een resultaat
van 1,54 als gemiddelde en 0,42 als standaardafwijking. Ook in dit geval
ging het om de hoeveelheid van dezelfde stof per m 3 • Onderzoek met
a= 0,01 of het gevonden verschil significant is. Hierbij mag men aannemen
dat de steekproeven afkomstig waren uit twee normale verdelingen met de-
zelfde variantie.
11.8 Een verffabrikant vergelijkt twee soorten verf, aan te duiden als A en B, voor
wat de droogtijd betreft. Op acht verschillende typen ondergrond werd met
beide verfsoorten een vlak geschilderd. De droogtijden in uren bedroegen:
a Toets of het verschil in droogtijd van de twee verftypen significant van nul
afwijkt, indien voor deze verschillen geen specifieke kansverdeling wordt
verondersteld (kies a= 0,05).
b Ga ervan uit dat de verschillen kunnen worden beschreven door een (onbe-
kende) normale verdeling. Voer, hiermee rekening houdend, nogmaals een
toetsing uit zoals bij vraag a is geformuleerd.
Stelling 2
Bedrijven geven meer aan duurzame projecten uit, want als je per bedrijf de
procentuele stijging berekent, dan levert de verschiltoets voor gepaarde
waarnemingen een significante toename.
Stelling 3
Omdat de grootte van de bedragen zeer uiteenloopt is het beter om de
tekentoets te gebruiken. Die toont een significante verbetering.
Voer de berekeningen uit die ten grondslag liggen aan de hier genoemde
stellingen en geef argumenten voor de keuze van de meest geschikte me-
thode.
11.10 Bij een hypotheekbank wil men onderzoeken of er een verschil is tussen
klanten die kiezen voor een hypothecaire lening met een variabele rente en
klanten die een vaste rente (minstens vijf jaar vast) prefereren. Een van de
variabelen die hierbij van belang zou kunnen zijn is de leeftijd van de per-
soon die de lening opneemt. Voor twintig recentelijk afgesloten hypotheken
kon men de leeftijd van de klant in de documentatie vinden. Dit leverde de
volgende resultaten op:
eeeAeeeeeeeeeeeee~········~·············
Leeftijden van klanten die kiezen Leeftijden van klanten die kiezen
.•..........
voor een variabele rente voor een vaste rente
33 44 41 38
34 29 52 35
41 56 46 58
45 32 47 56
30 47
31 40
Toets of de gemiddelde leeftijd van klanten die een variabele rente willen
significant afwijkt van klanten die een variabele rente prefereren. Doe dit
door eerst de gegevens uit de tabel in te voeren op een Excel-werkblad en
dan vervolgens de juiste toets toe te passen. Hierbij gaan we ervan uit dat
beide populaties (leeftijden van mensen die vaste rente respectievelijk varia-
bele rente prefereren) dezelfde variantie hebben. Kies Cl' = 0,05.
11.11 Bij een onderzoek naar de uitgaansgewoonten van jongeren maakt men on-
derscheid tussen werkende jongeren en studerende jongeren.
Men heeft deze jongeren gevraagd hoeveel zij per maand besteden in cafés,
discotheken enzovoort. Voor steekproeven uit beide groeperingen werden de
volgende bedragen gevonden (in euro per maand):
a Toets of de varianties van de twee populaties aan elkaar gelijk kunnen zijn.
Filiaal A B c D E F
Aantal flessen 320 260 440 400 380 300
Filiaal
. . P Q R 5
. ·~·
TU
. V
.. W X
.. Y
Aantal flessen 400 360 410 500 540 380 490 520 420 480
In zes filialen van een supermarktketen is het aantal verkochte flessen van
een wasmiddel vlak voor en vlak na een reclamecampagne geregistreerd. De
resultaten waren:
• • • • • • ••• • ••••
Filiaal A B c D E F
Aantalvoor 320 260 440 400 380 310
Aantal na 420 380 520 490 490 400
11.16 Van 500 willekeurig gekozen Amsterdammers steunen 200 het regeringsbe-
leid in een bepaalde kwestie. Van 300 willekeurig gekozen plattelanders
steunden 180 personen dit regeringsbeleid. Toets of de regeringsaanhang in
Amsterdam en op het platteland significant verschillend is (kies a= 0,01).
88 92 90 91 89 90 89 91
87 91 93 89 86 94
Toets met a = O,OS of de diktes van de platen voor de twee machines de-
zelfde variantie kunnen hebben.
c Geef voor machine B (uit opgave b) een 9S %-betrouwbaarheidsinterval
voor 14: de gemiddelde dikte van de populatie van platen bouwmateriaal.
11.19 Toets voor de gegevens uit opgave S of de twee steekproeven mogen worden
beschouwd als trekkingen uit twee (normale) verdelingen die worden geken-
merkt door dezelfde variantie (kies a= O,OS).
Traject B: 78 72 81 74 8S 71 69 84 66 76 6S 79
a Toets of de variantie van de reistijden voor traject A en traject B aan elkaar
gelijk kunnen zijn (kies a= O,OS).
b Toets of de gemiddelde reistijd voor traject A en traject B hetzelfde kan zijn
(kies a= O,OS).
Deel A Multiplechoicevragen
m2 De binnenvariantie is dus:
a 29,76
b 18,26
c 20
d 9,76
128
m6 Bij een éénfactor-variantieanalyse worden steekproeven uit vier populaties
gebruikt. Men wil als vervolg op deze analyse ook paarsgewijze vergelijkin-
gen maken tussen de steekproeven. Indien we de methode van Bonferroni
gebruiken met een gezamelijke a = 0,05, dan moet worden gewerkt met
t-waarden die een overschrijdingskans weergeven van:
a a= 0,025
b a= 0,0125
c a= 0,0083
d a= 0,0042
DeeiB Openvragen
c Bereken de binnenvariantie.
We kijken binnen de drie groepen:
Voor groep A vinden we ~(x -x:)l = : ............................ .
Voor groep B vinden we: .................................... ..... .
Voor groep C vinden we: .................................... ..... .
Financieringsstructuur
Alleen eigen vermogen Weinig vreemd vermogen Veel vreemd vermogen
3,8 8,6 20,6
6,3 12,5 10,9
7,6 5,0 17.4
8,2 9,9 16,1
8,1 16,3 23,0
0,2 17.4 25.4
4,9 4 ,0
7,0 7,9
10,9 18,8
- Een fabriek van golfballen heeft een nieuw procédé ontwikkeld voor de bui-
tenkant van golfballen. Er zijn drie proefversies vervaardigd: type A, B en C.
Bij de fabriek is een machine die als een soort automatische golfclub de bal-
len met dezelfde kracht een klap geeft. Hierna wordt de geslagen afstand (in
meters) gemeten. De machine doet met alle drie de balsoorten 12 slagen. De
resultaten waren als volgt:
Oo t van viertarwerassen
Meststof Tarweras
A B c D
1 25 27 26 30 31 33 35 37 36 38 39 39 27 29 29 31
2 32 33 35 36 34 37 38 40 40 43 44 45 32 32 33 35
3 19 21 23 25 33 35 36 36 30 31 33 34 20 20 21 23
(NB Bij toepassing van Excel dienen ook labels voor kolommen en rijen in-
gevoerd te worden.)
Deel A Multiplechoicevragen
136
waarde X 0 , dan kan voor dit interval het volgende worden gezegd (slechts
één antwoord is juist):
a Als het gebruikte aantal waarnemingen bij de bepaling van de regressie-
lijn naar oneindig gaat, dan kan zo'n interval willekeurig klein worden
gemaakt, gegeven de te gebruiken kans.
b Naarmate X 0 dichter bij het gemiddelde van de in de steekproef aanwe-
zige X-waarden ligt, zal het interval breder zijn in vergelijking met een X 0
die dichter bij de oorsprong ligt.
c Een voorspellingsinterval bij X 0 is smaller dan een vergelijkbaar betrouw-
baarheidsinterval bij X 0 •
d Als de variantie van de storingsterm groter dan nul is, kan een Y-waarde
nooit perfect worden voorspeld bij iedere gegeven X 0 •
DeeiB Openvragen
13.1 Een fabrikant van synthetische vezels onderzoekt of het krimpen van de ve-
zels samenhangt met de temperatuur waarbij ze worden gewassen.
Er wordt achtmaal een proef verricht waarbij de vezels gedurende 30 minu-
ten aan een bepaalde temperatuur worden blootgesteld. De geconstateerde
krimp werd (in procenten van de oorspronkelijke lengte) als volgt vast-
gesteld:
IX;
I Y;
IX;Y; = . ...... .
Ix; = ....... .
a= . .... . .... en b = .. . . .. . .. .
Y= ............. .
Y = . ..... .
Antwoord Mede met het oog op vraag c (de correlatiecoëfficiënt) zullen we de regressielijn be-
palen door het berekenen van sommaties met 'kleine x' en 'kleiney'.
We berekenen daarom eerst X (de gemiddelde dagproductie) en Y (het gemiddelde
percentage afgekeurde producten).
We vinden:
LX; 1
-- = - (2 800 + 0 0 0 + 0 0 0 + 0 0 0 + 0 0 0 + 0. 0 + 0. 0 + 0 0. + 0 0 0) = . 0 0 0. 0 0 0 0 0 0 0 0 0 0 0 0
n 9
en
- 1
y =- (2,0 + 0 0 0 + 0 0 0 + 0 0 0 + 0 0 0 + 0 0 0 +. + 0 0 0 0 0 +. 0 0) = 0 0 • 0 0 0 0 0 0 • 0 0 ••• 0 0 • 0 0 • 0 0
9
We kunnen nu het rekenschema opzetten:
4400 4,2
3200 2,4
2400 1,4
2700 1,7
3500 2,8
4200 3,6
3600 3,0
--- - - -
Som
a= ............... = ......... .
y = ... . . ......... .
b Geef een voorspelling van het percentage defecten bij een productieomvang
van 4 000 stuks per dag.
r=-----
r = -- - - -
••••
Snelheid 90 100 110 120 130
Verbruik 6,8 7,3 7,9 8,5 9,0
a Bereken een regressielijn waarbij het verbruik wordt verklaard uit de geko-
zen snelheid.
b Voorspel het verbruik bij een snelheid van 115 kilometer per uur en ook bij
een snelheid van 20 kilometer per uur. Geef commentaar op dit laatste re-
sultaat.
c Een automobilist die een exemplaar van dit model heeft aangeschaft, klaagt
erover dat bij hem het benzineverbruik bij 100km per uur 8,6liter bedraagt.
Wat kan de oorzaak zijn?
13.5 De weerstand van een blokje van een bepaald metaalsoort hangt af van de
temperatuur. Bij verschillende temperaturen (X) werd de weerstand (Y) ge-
meten. De resultaten zijn weergegeven in de volgende tabel:
a Ga ervan uit dat het verband tussen temperatuur en weerstand lineair is.
Bepaal de regressielijn met de temperatuur als verklarende variabele.
b Welke weerstand kan men verwachten bij 400 oe?
c Bij experimenten als het hier genoemde wordt de temperatuur vaak uitge-
drukt in Kelvin (K). Hoe luidt de vergelijking van de regressielijn als de tem-
peratuur in K wordt uitgedrukt? (Het nulpunt van de Keivin-temperatuur-
schaalligt bij -273 oe. Een stijging met 1 oe is gelijk aan een stijging met 1 K.)
1 80 86
2 S8 S7
3 41 S8
4 38 4S
s 67 58
6 92 98
7 25 36
8 67 S8
9 60 63
10 ss 66
11 72 69
12 23 22
13 68 60
14 62 S3
15 82 84
16 84 88
17 S1 64
18 68 60
19 72 67
20 S9 61
21 68 80
22 36 58
23 88 83
24 7S 52
25 S7 54
26 S6 61
27 81 65
28 74 67
29 52 55
30 60 64
IX =400 IY =275
IX 2 =3400 Iy2=1580
n = 50 IXY = 2 100
a Bereken de regressielijn met X als verklarende variabele.
b Bereken de correlatiecoëfficiënt.
c Geef een schatting van de standaarddeviaties sx en sy-
Bereken met de richtingscoëfficiënt b (zie vraag a) nogmaals r.
1 2
P(x= 1, y= 11) = - P(x=3, y=ll)=-
- - 10 - - 10
1 1
P(x= 2, y= 10) = - P(x=3, y=12)=-
- - 10 - - 10
2
P(x=2, y=ll)=-
- - 10
a Breng de hier gegeven kansen in een vierkant schema over.
b Bereken E(J:) en Var(,~)
en E(L::) en Var(L::).
c Bereken Cov(J:, L:::).
d Bereken de (populatie)correlatiecoëfficiënt.
e We definiëren de kansvariabele ~ als ~ = J: + 2:::·
Bereken de verwachtingswaarde en de variantie van~-
Student A B C 0 E F G H
A-score 40 60 50 45 74 53 45 42
8-score 88 35 45 80 35 60 70 85
13.12 De bond voor 'Sociale Noden in deze Wereld' heeft voor een steekproef van
200 personen onderzocht welk aantal personen wel eens een donatie doet
voor een goed doel. Van de groep van 200 bleken 80 wél lid te zijn van de
bond en 120 niet. De volgende tabel geeft de resultaten:
a Geef met de maatstaf van Yule aan hoe groot de associatie is tussen beide
kenmerken.
b Bereken Ph i als maatstaf voor associatie.
Maand 1 2 3 4 5 6 7 8
Aantal folders (x1 ooo) 12 2 5 14 0 6 3 6
Maandomzet (x1000) 90 115 78 87 123 67 84 76
Bij de beantwoording van de twee volgende vragen moet men aannemen dat
het aantal passagiers een normaal verdeelde grootheid is, waarvan de ver-
wachting lineair afhangt van de voorspelde temperatuur en de variantie on-
afhankelijk is van deze temperatuur.
c Bepaal een 95 %-voorspellingsinterval voor het aantal passagiers op een dag
waarop voor de temperatuur 25 oe wordt voorspeld.
d Bepaal een 95 %-betrouwbaarheidsinterval voor het verwachte aantal passa-
giers op dagen waarop voor de temperatuur 25 oe wordt voorspeld.
Auto nr.
. ..Cilinderinhoud
.•· . .
Max. snelheid (km/uur)
.. .. .. .. .
1,2 140
11 0,8 110
111 0,8 100
IV 2,0 180
V 1.4 150
VI 1,0 100
VIl 1,6 160
VIII 1,8 190
IX 1,3 140
x 1,1 130
a Bereken een regressielijn waarmee de eindscore wordt voorspeld uit het aan-
tal studie-uren.
b Iemand spreekt het vermoeden uit dat de invloed van de studie-uren vooral
tot uiting komt in het verschil tussen de score voor eindtentamen en tussen-
toets. Construeer een kolom verschillen en bestudeer met lineaire regressie
het hier genoemde vermoeden.
c Is er verband tussen de score voor de tussentoets en het aantal studie-uren?
Gebruik het resultaat voor de tussentoets als verklaring voor de studie-uren.
13.18 Voor een groep van tien managers is het verband onderzocht tussen inko-
men, aantal jaren onderwijs en het aantal jaren werkervaring.
De resultaten waren als volgt:
• •• •• • ••••
Manager Jaarinkomen Jaren onderwijs Jaren ervaring
(x€1.000)
A 80 12 5
B 110 16 10
c 90 13 3
0 70 12 2
E 80 15 6
120 17 16
G 110 14 15
H 130 18 20
110 18 12
100 12 8
14 Indexcijfers
Deel A Multiplechoicevragen
m1 Voor een landelijke prijsindex is een reeks berekend op basis van 1990 =
100. In 2000 bereikte deze index de waarde 140. In dat jaar werd overgegaan
op een nieuw wegingsschema met als basis 2000 = 100. In het jaar 2008 be-
reikte de nieuwe index de waarde 125. Een gekoppelde reeks geeft dan in
2008 op basis van 1990 = 100 de waarde:
a 112
b 265
c 165
d 175
m3 Het hoeveelheidsindexcijfer van Dutot voor 2002 bedraagt (op basis van
2001 = 100):
a 108,0
b 111,0
c 102,4
d 110,9
150
j
m4 Het waarde-indexcijfer voor 2003 bedraagt (op basis van 2001 = 100):
a 118,2
b 125,7
c 129,9
d 124,6
ms Het prijsindexcijfer van Laspeyres voor 2002 bedraagt (op basis van
2001 = 100):
a 108,2
b 109,3
c 109,5
d 111,1
m6 Het hoeveelhei cisindexcijfer van Paasche voor 2003 bedraagt (op basis van
2001 = 100):
a 121,1
b 105,7
c 102,9
d 102,5
DeeiB Openvragen
pl
p~l = - x 100
Po
Antwoord De omzet is voor elk product te berekenen als 'prijs maal hoeveelheid'. We vinden
dus:
LPogqog ·····
W 08•09 = ~ x 100 = - - x 100 =
L.Poa qoa .....
c Bereken voor de groep van drie producten met behulp van de indirecte
methode het samengestelde prijsindexcijfer van Laspeyres op basis van
2008 = 100.
p~S.lO = ~ X 100
Invullen levert:
4,25 x 144 + .. ... x ..... + ..... x .....
P~ 5 10 = X 100 = .. .. .
. 3,75 x 144 + .. .. . x ..... + ..... x .....
c Bereken het samengestelde prijsindexcijfer van Fisher.
Invullen levert:
4,25 x 144 + .... . x ..... + ..... x .....
wos. = 3,75 x 160
10 x 100 = .... .
+ .. .. . x . .. .. + ... .. x .. ...
e Bereken de samengestelde hoeveelheidsindexcijfers van Laspeyres en Paas-
che.
Antwoord Omdat we in de vragen a tot en met d reeds verschillende indexcijfers hebben bere-
kend, kunnen we de hier gevraagde indexcijfers berekenen met behulp van de
zwakke prod ucttest. We kennen het volgende verband:
en
14.3 De gemiddelde prijs per jaar van een artikel is voor de jaren 1998-2003 ge-
geven in de volgende tabel:
14.4 De prijs per kilogram van product A was in 2008 10o/o hoger dan in 2007. In
2006 was de prijs 12 o/o lager dan in 2007 en in 2009 was de prijs 25 o/o hoger
dan in 2007.
Bereken op grond van deze gegevens het (enkelvoudige) prijsindexcijfer
voor product A voor de jaren 2006 tot en met 2009. Kies hierbij 2007 als
basisjaar.
Bereken hiermee een reeks enkelvoudige prijsindexcijfers voor product A
waarbij 2006 = 100 is gesteld.
Het blijkt dat in jaar 14 de auto's voor wat betreft benzineverbruik gemid-
deld 10o/o zuiniger rijden. Bovendien hebben auto's in jaar 14 nog slechts
één onderhoudsbeurt per jaar nodig. Betaald parkeren moet steeds vaker.
Gemiddeld 45 uur in jaar 14.
b Hoe ziet het prijsverloop eruit als dit gebaseerd wordt op de eenheden in
jaar 14?
c Hoe verhouden zich de totale operationele kosten voor de twee jaren?
. .. ... .. .. . .. . .. .. .
Aandeel December jaar 1
~
14.10 Voor een pakket goederen geldt voor het prijsverloop P~6 • 07 = 104,5.
Verder geldt voor de ontwikkeling van de omzet W 06 ,07 = 118,8.
Bereken (met behulp van de zwakke producttest) het hoeveelheicis-
indexcijfer van Paasche voor 2007 op basis van 2006.
14.11 Voor een bepaald pakket goederen geldt dat de (afgezette) waarde in 2001
€ 12 mln bedroeg en in 2002 bedroeg deze € 13,7 mln. Verder zijn het
prijsindexcijfer van Fisher en het prijsindexcijfer van Laspeyres gegeven op
basis van 2001 = 100. Deze bedroegen: P~1 • 02 = 106,2 en P~ 1 • 02 = 108,1.
Bereken de hoeveelheidsindexcijfers van Fisher, Paasche en Laspeyres.
14.12 Een kleine ondernemer heeft een overzicht gemaakt van zijn netto-
jaarinkomen over een aantal jaren en van de ontwikkeling van de koop-
kracht.
In de volgende tabel is het verloop van beide grootheden weergegeven:
14.13 Een groothandel in fruit vergelijkt de omzetten en prijzen voor het afgelo-
pen jaar (jaar t = 20) met de overeenkomstige gegevens 5 jaar daarvoor (jaar
15).
.
Product
. .
Omzet in kg in
.
Omzet in kg in
.
Prijs per kg in Prijs per kg in
.
jaar 15 (x 1.000) jaar 20 (x 1.000) jaar15 jaar20
Appels 160 130 0,88 1,10
Bananen 120 160 0,76 0,72
Citroenen 15 18 2,30 2,40
Druiven 42 64 1,60 1,70
a Bereken voor het assortiment van vier producten een prijsindexcijfer vol-
gens de methode van Laspeyres.
b Bereken voor het assortiment van vier producten een hoeveelheids-
indexcijfer volgens de methode van Paasche.
c Bereken het waarde-indexcijfer.
d In de periode van vijf jaar is het prijsindexcijfer van de gezinsconsumptie
gestegen van 212,63 tot 229,41. Zijn de prijzen voor fruit in die tijd sneller
gestegen dan de gezinsconsumptie of juist langzamer?
e Door de toegenomen welvaart is het gemiddelde gezinsbudget dat uitgege-
ven wordt aan voedsel en dranken opgelopen van 12.700 euro naar 15.150
euro. Hebben de bestedingen aan fruit hiermee gelijke tred gehouden?
Deel A Multiplechoicevragen
m4 Een student houdt zich bezig met het berekenen van een reeks waarden van
het voortschrijdende gemiddelde voor de dagelijkse slotkoersen van het aan-
deel Philips. Hij gebruikt hiervoor een vijfperiodengemiddelde. Op de
avond van vrijdag 27 september is dit gemiddelde gelijk aan 63,80. Hiervoor
gebruikte hij de koersen 23, 24, 25, 26 en 27 september. Op maandag 30
september is de koers van Philips gelijk aan 65,30. De hiermee te berekenen
nieuwe waarde van het voortschrijdend gemiddelde:
a is gelijk aan 64,10
b moet op de tijdas worden geplaatst op 28 september
c is met deze gegevens niet te berekenen
d komt tot stand indien door zeven wordt gedeeld
159
ms De vraag naar een product wordt voorspeld met de methode van (enkelvou-
dige) exponentiële effening met a= 0,30. In periode 8 was de (berekende)
geëffende waarde gelijk aan 62. Als nieuwe waarneming verscheen in pe-
riode 9 de waarde 66. De nieuwe geëffende waarde in periode 9 is dus:
a 64,8
b 63,2
c 19,8
d 67,2
m6 Een analyse van kwartaalcijfers van de omzet van een bedrijf heeft de vol-
gende trendlijn opgeleverd: Y, = 450 + 20t, met t = 0 in het eerste kwartaal
van 2008, t in kwartalen.
Tevens werden seizoenindices berekend volgens het multiplicatieve model.
Dat leverde: Sr= 1,30, SII = 0,90, Sm= 0,70, Srv= 1,10.
De voorspelling van de omzet voor het laatste kwartaal van 2008 is dus:
a 561
b 463,6
c 583
d 516
DeeiB Openvragen
• • • • •• • •• •• •
Periode(t) Aantal stuks (Y,) 3-per.som V.G.
1 250
2 310 910 303,3
3 350
4 390
5 440
6 520
7 550
8 590
b Bereken een trendlijn met behulp van de methode der kleinste kwadraten.
!t__ !!1_ t•
250 -3%
310 -2i
350 -1 ~
_ _.
390 2
440 +"'2
520 +1~
550 +2~
590 +3~
Totaal
Als het nulpunt van de tijdas wordt gekozen in het midden van het totale tijdsinter-
val, dan geldt kt= o.
De normaalvergelijkingen luiden dan:
a= ...... .
b = . ...... .
Y= ...... . .
Y9= ...... .
Antwoord Omdat we hier een voortschrijdend gemiddelde over vier perioden moeten bereke-
nen (een jaar bestaat uitvier kwartalen), moeten we de berekening opzetten zoals in
de volgende tabel is weergegeven.
Antwoord
Jaar Kwartaal
IJ 111 IV
2008 9,2S
2009
2010
Gemiddeld
- In een winkel is het aantal verkochte eenheden bijgehouden van een onlangs
geïntroduceerd merk aftershave. In de volgende tabel zijn de verkochte aan-
tallen weergegeven voor een periode van tien weken:
Week 1 2 3 4 5 6 7 8 9 10
Aantal Y, 40 4S so ss 60 6S 70 7S 80 8S
a Bereken over de periode van tien weken een reeks van voortschrijdende ge-
middelden die is gebaseerd op k = 3 perioden.
b Als vraag a, maar nu gebaseerd op k = 4 perioden.
Opmerking: In beide gevallen blijkt dat de waarnemingen volledig overeen-
komen met de uitkomsten van de voortschrijdende gemiddelden.
15.4 Het verloop van de prijs van een edelmetaal op de Londense beurs gedu-
rende een bepaalde maand is weergegeven in de volgende tabel:
- De omzet van een bedrijfheeft zich de afgelopen maanden als volgt ontwik-
keld (x € 1 mln):
Jan Feb Mrt Apr Mei Jun Jul Aug Sep Okt Nov Dec
Prijs 1,32 1,38 1,36 1,44 1,42 1,43 1.37 1,42 1,46 1,48 1,52 1,53
15.8 Maak gebruik van de waargenomen gegevens van het tankstation van
vraag 7.
a Bereken hiervoor een reeks voortschrijdende gemiddelden gebaseerd op 5
perioden.
b Bereken voor de reeks gegevens uit vraag 7 een serie trendwaarden met be-
hulp van exponentiële effening (a= 0,4).
c Voorspel op basis van de resultaten van vraag b de benzineprijs voor januari
van het nieuwe jaar.
15.12 In de Oost-Europese republiek Boelravië is sinds 2000 een periode van eco-
nomische ontwikkeling aan de gang. Een van de factoren die als een indica-
tor worden gezien van de gezondheid van de economie is de vraag naar
personenauto's. In volgende tabel is per kwartaal voor een viertal jaren het
aantal verkochte nieuwe personenauto's (x 1 000) aangegeven:
Kwartaallil 104
Kwartaal IV 28 36 50 62
a Laat zien dat bij deze tijdreeks het additieve model past.
b Bereken het seizoenpatroon.
c Met behulp van de kleinstekwadratenmethode heeft men vastgesteld dat de
trend kan worden geëxtrapoleerd met T, = 481 + 13,45t.
Hierin is t de tijd in kwartalen, met t = 1 in 1999- I.
Geef een raming voor de omzet in het derde kwartaal van 2004.
d Bereken de toevallige afwijkingen.
e Geef een voorspellingsinterval waarbinnen de omzet van het derde kwartaal
2004 met 95 o/o kans zal komen te liggen.
Jaar 2002 2003 2004 2005 2006 2007 2008 2009 2010
Omzet (x € mln) 8 10 10 12 15 20 25 36 38
15.17 Bij de Verkeersdienst van de Rijkspolitie wordt de totale lengte van de files
dagelijks berekend. Vervolgens worden die aantallen (van vijf dagen) tot
weektotalen omgerekend. Voor zeven weken werden de volgende resultaten
gevonden:
. .. . . .. .
Week 1 2 3
.. .. .. ..... .
4 5 6
~··
7
lengte file (in km) 330 390 420 450 440 480 500
a Het vermoeden bestaat dat er een duidelijk opgaande trend in het wekelijkse
aantal filekilometers zit. Men wil de filelengte voorspellen voor week 8 en
week 9. We gebruiken hiervoor een trendlijn die is berekend volgens de me-
thode van de kleinste kwadraten.
b Op de verschillende vijf dagen van de week is er een duidelijk verschillend
filepatroon dat wordt beschreven door een multiplicatief seizoenpatroon
waarbij wordt gerekend ten opzichte van een trendwaarde die 20 o/o is
van het berekende weekcijfer. Voor maandagen geldt een 'seizoenindex' van
1,50.
Voorspel het aantal kilometers file op de maandagen van week 8, 9 en 10.
c Verder is er een multiplicatieve toevallige component die wordt beschreven
door een standaarddeviatie van 5 o/o van het (via trend en seizoen bere-
kende) voorspelde aantal.
Geef een 95 o/o-voorspellingsinterval voor het aantal kilometers file op
maandag in week 9.
15.20 Het aantal nieuwe abonnees per maand bij een internetprovider is voor een
periode van veertien maanden weergegeven in de volgende tabel:
Week 1 2 3 4 5 6 7 8 9 10 11 12
%aanhangers 6,8 7.4 7,6 8,S 8,9 10,3 9.4 8,8 8,0 7,7 8,2 7,9
172
16.4 Een textielfabrikant produceert lakens die op grond van eventuele weef-
fouten in drie kwaliteitscategorieën worden ingedeeld.
Op grond van ervaring zijn de kansen bekend dat een willekeurig laken in
categorie A, B of C valt. Deze kansen zijn:
Categorie A 8 C
Kans op laken in categorie 0,8 0,1 0,1
a Hoe groot is de kans dat drie willekeurige lakens allemaal van kwaliteits-
klasse A zijn?
Hoe groot is de kans dat er twee van categorie A zijn en dat er een van cate-
gorie Bis?
b De verkoopprijzen van de drie soorten lakens A, B en C bedragen per laken
respectievelijk € 20, € 15 en € 10. Per week worden 5 000 lakens geprodu-
ceerd. Hoe groot is de te verwachten omzet?
Hoe groot is de standaarddeviatie van de omzet per week?
c De fabrikant wil zijn fabricageproces --------...
verbeteren. De kosten hiervan be-
dragen € 1 per laken. Bij het verbe- Categorie A 8 c
terde fabricageproces bedragen de Kans 0,9 o,o5 0,05
kansen per kwaliteitsklasse (zie de
tabel):
Is genoemde maatregel verantwoord?
16.5 Het gewicht van pakken hondenvoer is normaal verdeeld met fl = 503 gram
en0"=10.
a Hoe groot is de kans dat een pak minder dan 500 gram voer bevat?
b In een doos gaan twaalf pakken. Hoe groot is de kans dat een doos minder
dan 12 X 500 gram bevat?
c Een doos bevat n pakken. Bepaal n zodanig dat de kans om niet aan de
gewichtseis te voldoen minder dan 1 o/o bedraagt voor de doos.
16.7 Voordat een afnemer een grote partij goederen koopt bij een fabrikant,
neemt hij een keuringsmonster.
De afnemer besluit 60 artikelen te keuren.
Als er meer dan drie ondeugdelijke exemplaren in het keuringsmonster aan-
wezig zijn, zal hij de partij niet aanschaffen.
16.8 Een enquête onder 1000 gezinnen bestaande uit een echtpaar en twee niet-
verdienende kinderen leverde de volgende resultaten:
- Het gemiddelde besteedbare inkomen van de 1 000 gezinnen bedroeg
€ 28.560, de standaarddeviatie van de inkomens bedroeg € 4.175.
Van de gezinnen hadden er 187 geen auto.
- Bij een steekproefvan 100 gezinnen waren er 30 waarbij zowel de man als
de vrouw een volledige baan had.
16.9 Het aantallampen van straatlantaarns dat per etmaal stukgaat in een bepaalde
wijk van Utrecht is een variabele met een paissouverdeling met fJ = 1.
a Bereken de kans dat er in een etmaal meer dan drie lampen uitvallen.
b Eenmaal per week worden de defecte lampen vervangen door nieuwe lam-
pen. Hoe groot moet de voorraad nieuwe lampen minimaal zijn om met
minstens 98% kans alle defecte exemplaren te kunnen vervangen?
c Op zekere dag worden alle lampen vervangen door lampen van een ander
merk. In een periode van 30 dagen blijkt nu dat achttien lampen stuk zijn
gegaan. Toets of het aantal uitgevallen lampen significant verschilt ten op-
zichte van het verwachte aantal uitvallers bij het vorige merk (a = 0,05).
16.10 Een groep van 400 studenten is aan het eind van het eerste studiejaar ge-
vraagd of zij tevreden zijn over hun studiekeuze. Als oordeel zijn drie ant-
woorden mogelijk, namelijk enthousiast, onverschillig en teleurgesteld. Er
worden vier groepen studierichtingen onderscheiden, namelijk (1) exact, (2)
taalkundig, (3) medisch en (4) economisch.
Oordeel Studierichting
Exact Taal Medisch Economisch Totaal
Enthousiast 50 30 40 30 150
Onverschillig 5 35 15 105 160
Teleurgesteld 25 15 5 45 90
Totaal 80 80 60 180 400
16.11 Bij een onderzoek naar operatietechnieken werden 400 oogoperaties gedaan.
Bij 200 operaties werd nylondraad als hechtingsmateriaal gebruikt, terwijl
bij de andere 200 operaties zijdedraad werd gebruikt. Bij elke operatie werd
door middel van loting vastgesteld welk type draad gebruikt zou worden. Bij
de nylondraadoperaties kregen 32 patiënten naderhand problemen. Bij de
zijdedraadoperaties ontstonden bij 48 patiënten problemen. Toets of er een
significant verschil is in de fractie operaties met problemen bij de twee
hechtingstechnieken (kies a= 0,05, toets tweezijdig).
16.12 Een bedrijf heeft een vulmachine in gebruik waarmee een product in 1 kg-
pakken wordt verpakt.
Er bereiken het bedrijf nogal wat klachten over onvoldoende gewicht aan
product in de 1 kg-pakken. Daarom wordt besloten een uitgebreid onder-
zoek te doen naar de werking van de vulmachine.
Dit leverde als resultaat dat het vulgewicht als een normaal verdeelde varia-
bele mag worden beschouwd. Het bleek dat de machine op een aanvaard-
baar gemiddelde was afgesteld ( 1 020 gram), maar dat de standaarddeviatie
van de vulgewichten nogal groot was, namelijk 25 gram. Het bedrijf besloot
daarom op zoek te gaan naar een nauwkeuriger vulmachine.
a Het bedrijf krijgt een vulmachine aangeboden waarvan wordt gesteld dat
deze nauwkeuriger werkt. Om dit te controleren, werden tien proefpakken
gevuld. De vulgewichten waren: 1022, 1026, 1030, 1005, 1016, 1018, 1014,
1010, 1035 en 1024.
Toets of de variantie significant lager is dan bij de oude vulmachine (toets
eenzijdig, kies a= 0,05).
b Geef een 95 %-betrouwbaarheidsinterval voor de variantie van de nieuwe
machine.
c Het bedrijf biedt nog een tweede model vulmachine aan waarvan wordt ge-
steld dat deze nauwkeuriger werkt dan het bij vraag a genoemde apparaat.
Hierbij werden acht verpakkingen als proefexemplaar gevuld. De vul-
gewichten waren: 1025, 1018, 1 023, 1020, 1015, 1 022, 1 017 en 1 020.
We willen de variantie voor de machine van vraag a vergelijken met het
tweede model. Toets of deze verschillend zijn (kies a= 0,05).
Akker 1 2 3 4 5 6 7 8
Opbrengst 38 40 44 47 52 35 46 sa
Kunstmest 8 8 10 12 15 9 12 14
16.14 Het totaal aantal vakantiegangers dat het Oostenrijkse stadje Saalbach heeft
bezocht, wordt per halfjaar gepubliceerd.
De gegevens over een periode van tien jaar zijn (aantallen X 1 000):
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
Winterseizoen (6 mnd.) 150 180 220 240 284 272 308 320 268 400
Zomerseizoen (6 mnd.) 50 72 104 118 146 150 210 224 246 260
a Bereken de trend van deze reeks met behulp van de methode der voort-
schrijdende gemiddelden.
b Bereken het seizoenpatroon volgens het additieve model.
c Combineer de seizoencijfers tot jaarcijfers. Bereken hiervoor een lineaire
trendlijn.
Het gebruiken van de computer bij het verwerken en analyseren van gege-
vens is tegenwoordig een belangrijk onderdeel binnen de statistiek. Er zijn
allerlei softwarepakketten waarmee deze werkzaamheden kunnen worden
uitgevoerd.
Wat de toepassing betreft, kunnen we een onderscheid maken tussen het ge-
bruik van de computer voor het verwerken van gegevensbestanden (dat is
waarschijnlijk het belangrijkst) en het gebruik van de computer als 'kans-
rekenmachine' bijvoorbeeld omdat de computer allerlei kansverdelingen
kent of in staat is steekproeven te nemen uit kansverdelingen.
Wie met gegevensbestanden wil werken, krijgt allereerst te maken met de
vraag:
- Werken we met een reeds eerder aangemaakt gegevensbestand, of
- moeten de onderzoeksgegevens nog in de computer gebracht worden in
de vorm van een goed georganiseerd gegevensbestand? In dat geval kan
men de zogenaamde 'data entry' -methoden gebruiken.
De opbouw van deze bestanden wordt hierna beschreven. Van alle bestan-
den zijn de gegevens verkrijgbaar. Alleen van het eerste bestand, 'Woningen'
beschrijven we ook alle waargenomen gegevens in de tekst.
177
1 Het bestand 'Woningen'
Nr.
~ ~ ~ ~ ~ ~ x.
1 1 3 0 120 1920 0 132.000
2 1 4 0 140 1932 0 0 137.500
3 3 4 0 110 1938 0 1 138.000
4 1 3 1 110 1927 0 0 139.500
5 1 3 0 140 1968 0 1 142.000
6 1 3 0 220 1935 0 0 144.000
7 3 3 1 190 1938 0 0 145.000
8 1 4 0 130 1950 0 0 145.000
9 1 4 0 120 1964 0 1 146.500
10 3 3 0 200 1966 0 1 148.000
11 1 4 0 320 1932 0 0 149.000
12 2 3 1 120 1972 0 1 154.000
13 1 4 1 210 1953 0 1 158.000
14 3 4 0 240 1936 0 0 159.000
15 1 4 0 160 1962 0 0 160.000
16 1 3 0 150 1966 0 1 162.000
17 1 3 0 220 1937 0 0 163.000
18 2 4 0 220 1980 0 1 164.500
19 3 4 1 320 1962 0 1 165.000
20 3 4 0 380 1918 0 0 168.000
21 1 3 0 160 1985 1 1 169.000
22 2 5 1 370 1948 1 0 169.500
23 3 4 0 290 1985 0 1 170.000
24 1 4 0 180 1966 0 1 174.000
25 1 3 1 240 1957 0 1 175.000
26 2 4 0 180 1984 0 1 175.000
27 3 5 0 340 1936 1 0 176.500
28 3 4 1 2 50 1 987 0 1 1 77.000
29 2 4 0 160 1986 0 1 178.000
Als een jaar later de juiste uitkomst bekend is, wordt voor elk van de drie va-
riabelen een prijs uitgeloofd aan de adviseur die de uitkomst het dichtst be-
naderd heeft met zijn voorspelling. Het vermoeden bestaat dat de voorspel-
lingen van de drie variabelen niet geheel onafhankelijk zijn.
In dit bestand zijn gegevens opgenomen die de evaluatie van het verloop
van een cursus beschrijven. Van 50 studenten worden inspanningen, resulta-
ten en meningen vermeld, verdeeld over de volgende variabelen:
STUDENT waarnemingsnummer
CIJFER behaald resultaat op afsluitend tentamen op een schaal van
0-100
UREN aantal uren dat de student heeft gestudeerd naast de colleges
VRGCIJF cijfer van het zogenoemde mid-termtentamen
EVl evaluatie 1: 'De cursus was goed georganiseerd',
helemaal mee oneens - helemaal mee eens
1-2-3-4-5
EV2 evaluatie 2: 'De docent gaf op een inspirerende manier col-
lege',
helemaal mee oneens - helemaal mee eens
1-2-3-4-5
EV3 evaluatie 3: 'De kwaliteit van het studiemateriaal was uitste-
kend',
helemaal mee oneens - helemaal mee eens
1-2-3-4-5
GESLACHT man of vrouw
In het bestand Top 100 worden kenmerken beschreven van de 100 grootste
bedrijven buiten de Verenigde Staten, gemeten naar omzet in 1990. Deze
rangschikking is gebaseerd op een publicatie van het Amerikaanse blad For-
tune. In het bestand treffen we de volgende variabelen aan:
NR90 het rangnummer in 1990
NR89 het rangnummer in 1989
NAAM de naam van het bedrijf
LA Nn het land dat officieel als vestigingsplaats geldt van dit bedrijf
Het bestand kan met name goed worden gebruikt voor het analyseren van
de trendmatige groei van de tijdreeks en het vaststellen van het seizoen-
patroon. Met de gegevens kunnen vervolgens voorspellingen worden bere-
kend vanaf t = 44.
Dit hoofdstuk bestaat uit een vijftal uitgebreide vraagstukken, die we case-
studies hebben genoemd omdat ze telkens betrekking hebben op een heel
scala van problemen binnen één bepaalde organisatie.
Deze case-studies zijn mogelijk nuttig oefenmateriaal bij de voorbereiding
van tentamens, omdat bij de vragen steeds onderwerpen uit diverse hoofd-
stukken van het theorieboek aan bod komen.
Alle zes case-studies zijn gebaseerd op oefen- en tentamenvragen die eerder
werden gebruikt op de Hogeschool 's-Hertogenbosch en de Hogeschool
voor Economie en Management in Utrecht.
Het tijdstip van aankomst ~ van huurders bij bungalowpark 'De Bossche
Duinen' is een continue stochast met dichtheidsfunctie:
ix - 2 als 8 ~x~ 10
{
f(x)= - x+3 als 10<x~l2
0
elders
Op zekere dag komen voor de 120 aanwezige huisjes 120 nieuwe huurders
aan.
b Hoeveel van deze 120 huurders kan men verwachten tussen 9 en 10 uur?
c De receptie heeft per huurder anderhalve minuut nodig voor inname van
het inschrijfformulier, een eerste registratie en sleutelafgifte. Vanaf welk tijd-
stip verwacht u dat de receptie het tempo van de toestromende gasten niet
meer kan bijhouden? (Aanwijzing: gebruik de grafiek van de dichtheids-
functie.)
186
d Bereken de verwachtingswaarde van k.
e Bereken de variantie van /s..
f Het bungalowpark heeft een vergunning voor maximaal 500 gasten. Bereken
de kans dat in het bungalowpark te veel gasten verblijven.
Het aantal liters bier ~, dat het parkcafé dagelijks tapt, is normaal verdeeld
met verwachtingswaarde fl = 150 en standaarddeviatie a= 30.
g Hoe groot is de kans dat op een willekeurige dag minstens 100 liter bier ge-
tapt wordt?
h Hoe groot is de kans dat op maandag tot en met donderdag minder bier
wordt getapt dan op vrijdag tot en met zondag?
Het bier wordt bij het café elke maandagmorgen afgeleverd in fusten van 50
liter. De beheerder wil voldoende fusten in voorraad nemen om met 99%
zekerheid aan de vraag van de komende week te kunnen voldoen. Hoeveel
hele fusten dient de beheerder na aflevering op maandagochtend minstens
in voorraad te hebben?
Alle 120 huisjes worden vele maanden van tevoren geboekt door de vakan-
tiegangers. Doordat een aantal huurders annuleert, blijft gemiddeld 8% van
de huisjes onbezet. De huurders die wél komen opdagen, arriveren allemaal
op dezelfde dag en vertrekken twee weken later. Neem aan dat bij elk huisje
(onafhankelijk van de overige) geldt: de kans dat het huisje onbezet blijft, is
0,08.
Bereken met de binomiale formule de kans dat op zeker moment precies
115 van de 120 huisjes bezet zijn.
k Bereken de kans dat in een bepaalde periode minder dan 110 huisjes bezet
zijn.
Huisjes die niet bezet zijn, leveren geen winst op. Daarom overweegt de ei-
genaar van het bungalowpark het volgende:
Hij zal op papier 125 huisjes verhuren en hoopt dat er hiervan uiteindelijk
hoogstens 120 bezet zullen zijn. Komen er toch meer dan 120 huurders, dan
spreken we van 'overboeking'.
Bereken de kans op overboeking.
m De eigenaar besluit op papier n huisjes te verhuren. Hij wil er ook voor zor-
gen dat de kans op 'overboeking' kleiner is dan 0,01. Bereken de maximale
waarde van n.
Met klachten kunnen de tijdelijke bewoners van het vakantiepark terecht bij
de receptie. Het aantal klachten dat daar per dag binnenkomt, heeft een
Poissonverdeling met fl = 1,5.
n Bereken de kans dat op een willekeurige dag precies drie klachten binnenko-
men.
o Bereken de kans dat in een willekeurige week minimaal vijf en maximaal
tien klachten binnenkomen.
Indien bij een onderhoudsbeurt blijkt dat de eerste leeskop nog storingvrij
werkt, is de reservekop niet gebruikt en heeft deze dus geen onder-
houdsbeurt nodig. In alle andere gevallen krijgt de reservekop wél een on-
derhoudsbeurt.
d Men maakt na een onderhoudsbeurt een afspraak voor de volgende onder-
houdsbeurt als de computer een tijd T (in uren) heeft gewerkt. De tijd T
wordt zodanig vastgesteld dat geldt: de kans dat de leeskop na een tijd T nog
werkt, is 25 %.
Bereken de kans dat dan tevens de reservekop een onderhoudsbeurt zal krij-
gen.
e Bereken de kans dat op het afgesproken onderhoudstijdstip beide koppen
niet meer functioneren.
k 0 1 2 3 4 5
P(/! = k) 0,05 0,15 0,30 0,25 0,15 0,1
Bij het begin van elke dag wordt elke van de 45 pc-printers door de
onderwijsassistent voorzien van een even grote hoeveelheid printerpapier.
De kans dat deze printer in de loop van de dag onbruikbaar wordt omdat
het papier opraakt of omdat het printerlint vervangen moet worden, be-
draagt bij elke printer 15%.
Geef de exacte formule voor de kans dat in de loop van de dag precies vijf
van de 45 printers wegens genoemde oorzaken onbruikbaar worden en be-
reken deze kans.
Bereken de kans dat van de 45 printers in de loop van de dag hoogstens tien
wegens genoemde oorzaken onbruikbaar worden en geef aan om welke re-
den men hierbij gebruik mag maken van een normale benadering.
k Bereken met de tabel de kans dat in de loop van de dag in elk van de drie lo-
kalen minder dan vier printers wegens genoemde oorzaken onbruikbaar
zullen worden.
De leverancier die het mainframe heeft geleverd, verzorgt ook het onder-
houd aan deze computer. Bovendien kan men bij hem een verzekering af-
sluiten die, bij het uitvallen van deze computer door slecht werkende kop-
pen, een standaardbedrag van € 5.000 uitkeert, mits het onderhoud aan het
begin van elk (leer )jaar zal worden verricht. De kans op het uitvallen van de
computer is in dat jaar dan 0,002. Bij deze leverancier hebben 2 300 main-
frame-bezitters een dergelijke verzekering afgesloten.
Bereken de kans dat de leverancier in een (leer)jaar minstens vijf schade-uit-
keringen moet doen.
m Het exploiteren van deze verzekering brengt voor de leverancier jaarlijks een
bedrag van € 5.000 aan kosten met zich mee (die uiteraard door de verzeker-
den moeten worden betaald). Voorts worden bij het herstellen van een ver-
zekerde, uitgevallen computer de herstelkosten à € 500 niet in rekening ge-
bracht (ook dit wordt in de verzekeringspremie verdisconteerd). Hoe hoog
moet de jaarlijkse verzekeringspremie zijn indien de leverancier met hoog-
stens 2% kans verlies wil maken op deze verzekering? Men mag hierbij aan-
nemen dat een computer nooit tweemaal binnen een jaar zal uitvallen.
Ook van de nu nog in gebruik zijnde bussen van het type TGX is destijds
een testresultaat gepubliceerd.
Bij een steekproef van 41 bussen van dit type vond men een gemiddelde le-
vensduur van de motor van x= 224000 km en een steekproefstandaard-
deviatie s = 25 250 km.
Geslacht
Vrouw Man
Voorkeur voor oude model 6 24
Geen voorkeur 8 12
Voorkeur voor XGTI-turbo 26 24
4 Air Brabant*
Laat aan de hand van een toets zien dat met betrouwbaarheid 95 o/o geldt dat
het aantal weeffouten inderdaad een poissonverdeling heeft met gemiddeld
1,2 weeffouten in een 60 m lange rol.
...._
...
Oude toestel
. ~
146,8
. . .. . .. . . .. .. .. .....
133,2 145,3 143.5 134.9 157,0
•·
Voor het serveren van maaltijden tijdens de vlucht kan Air Brabant kiezen
uit twee leveranciers (1 en 2).
Om deze verpakte maaltijden te testen op houdbaarheid bewaart men gedu-
rende lange tijd en onder gelijke omstandigheden van beide leveranciers een
partij maaltijden. Vervolgens kijkt men welke fractie van elke partij moet
worden afgekeurd wegens een te groot aantal aanwezige bacteriën. Van de
uit 240 maaltijden bestaande partij 1 moesten 96 maaltijden worden afge-
keurd. Bij partij 2, afkomstig van leverancier 2, moesten 144 van de 320
maaltijden worden afgekeurd. De werkelijke (maar onbekende) fracties die
we bij deze test in de populaties hadden moeten afkeuren, zullen we 7T P (le-
verancier 1) en 7T 2 , (leverancier 2) noemen.
Om de verkoop van Nuts, een candybar van chocolade met een vulling van
hazelnoten of amandelen, te bevorderen, heeft men naast een intensieve
televisiereclame ('Have the guts to go Nuts') een actie opgezet. Tegen inleve-
ring van vijf speciale Nutsactiewikkels kan een muziekcassette worden ver-
kregen. De bedrijfsleiding vraagt zich af hoeveel cassettes voor de actie moe-
ten worden aangeschaft. Teneinde een schatting te kunnen maken van het
percentage Nutsconsumenten dat de actiewikkels zal inleveren, stelt men
een onderzoek in voordat de actie van start gaat. Vijfhonderd aselect geko-
zen Nutsconsumenten worden van de komende actie op de hoogte gebracht.
Aan deze personen wordt gevraagd of ze de actiewikkels van de gekochte
Nutsrepen zouden bewaren om ze tegen een cassette in te wisselen. Van de
ondervraagden gaf 42% hierop een bevestigend antwoord.
a Bepaal een 95 %-betrouwbaarheidsinterval voor de fractie Nutscansurnen-
ten die meedoet aan de actie.
b Als de bedrijfsleiding een 95 %-betrouwbaarheidsinterval voor de bij a be-
doelde fractie wil, dat ten hoogste 0,04 breed is, hoe groot moet de steek-
proef dan zijn?
c Ter wille van de actie worden 100000 Nutsrepen in handige 'five-packs' te
koop aangeboden, zodat de belangstellende consument in één aankoop de
benodigde vijf actiewikkels in bezit krijgt. Bereken- op basis van het resul-
taat bij vraag a - hoeveel cassettes er minstens in voorraad moeten worden
genomen als de bedrijfsleiding de kans op een tekort aan cassettes op hoog-
stens 0,5 o/o wil stellen.
Geen Nutseter 16 33 18 13
Bron: Franz Dean Producties.1993.
Na uitvoerige analyse blijkt dat het gewicht van een aselect gekozen Nuts bij
benadering normaal is verdeeld met standaardafwijking 0,8 gram. Op de
verpakking van een Nuts staat dat de inhoud 50 gram behoort te zijn.
Als het gemiddelde gewicht in de populatie 51 gram bedraagt, hoeveel pro-
cent van de productie weegt dan minder dan 50 gram?
Als hoogstens 3 o/o van de productie minder dan 50 gram mag wegen, op
welk gemiddeld gewicht (in tienden grammen nauwkeurig) moet de ma-
chine die deNutsrepen produceert, dan worden afgesteld? (Ga ervan uit dat
de standaardafwijking niet is veranderd.)
195
....
1 Inleidingtot de
beschrijvende statistiek
196
2 Maatstaven voor ligging
en spreiding
1 c 4 c
2 b 5 c
3 b 6 b
2.1 a 14,25
b 13t
c 12
d 2,975
2.3 a 29,5
b 30
2.4 0,52
2.5 a $3500
b € 3850 en € 2695
2.7 a 5,66
b 315,41
c s = €28.312
2.9 a 2,34%
b 3,10%
2.10 a 4
b 0,98
197
2.11 a 110 en 19,32
b 112 en 20,445
c 21,57
2.13 1 op 13,49
2.15 a 75,71
b 60- < 70
c 78
d 15,73
2.16 b 22,875
c 14,5
d 1572,50 en 870,3
2.19 a Voor studenten 62,63 en mediaan 56. Voor afgestudeerden 125,20 en mediaan 99.
b 5= 29,94 en 5 = 77,97
c Zie verder de uitwerking met Q 1 = 37 en Q 3 = 77 voor de studenten en Q, = 70 en
Q 3 = 172 voor de afgestudeerden.
2.20 r= 0,92
2.22 a 106,96
b 80,82 111 154,85 91,16
2.23 a De gemiddelde code is 1,72. Omdat code 1 staat voor € 5 en code 2 voor € 7,50 zouden
we met enige fantasie (interpoleren) kunnen gokken dat het gemiddelde € 6,80 is.
Bij gebruik van de echte prijzen vinden we € 6,96: logisch want de dure kaartjes leg-
gen nu iets meer gewicht in de schaal.
b Het prijsoordeellijkt veel overeen te komen voor de drie prijsklassen.
1 b 4 c
2 d 5 a
3 c 6 a
3.3 a 720
b 120
c 15
3.4 a (Ij0 )
b 125000
c 1 838 265 625
3.5 a 24
b 12
c 6
3.6 336
200
d 0,10
e 0,60
3.8 a 350
b 0,22857
3.9 a 0,40
b 0,267
3.11 a 0,54
b 0,259
c 0,68
3.13 a 0,4242
b 0,0808
c 0,5143
d 0,0101
3.14 a 0,49
b 0,44
c 0,13
d 0,462
e Nee
f Ja
3.15 a 0,15
b 0,70
c 0,40
d 0,85
e 0,25
3.16 a 0,32
3.18 a 0,520
b 0,231
c 0,057
3.19 0,0768
3.21 a 0,375
b 0,357 en 0,536
c 0,268
3.22 a 0,288
b 0,289
3.23 0,1969
z
3.24 a P(Z) =-
2 N
3.25 a 0,891
b 0,014
c 0,896 (89,6%)
3.26 0,50
3.27 a 0,324
b 0,26
c 0,462
3.28 0,6471
3.29 a 0,135
b 0,04
c 0,31
d 0,871
3.31 a 0,020485
b 0,024164
c 0,04344
d 0,550711
3.32 a 0,9684
b 0,0312
c 0,09999
.
4 Kansvariabelen
4.1 a 0,25
b 38,75
c 27,1875
d € 27,81 (afgerond)
4.2 a
16
b ~uur (40 minuten)
4.5 a 0,1225
b 0,1296
c Leerlingen 2,30 en 1,23;
docenten 2,72 en 0,98
4.6 a 32,5
b 35
203
4.8 a 75
b 0,000027
0,614
c 575.000
4.11 a 0,89
b 1,11
c 71,20 en 89
d 28 480 en 1 780
e 75,47 en 94,34
4.12 a 1,45
b Bij 1 apparaat E(m_) =0,80
Bij 2 apparaten m = -8, -2 of +4 E(m_) = -0,50
Bij 3 apparaten m = - 12, - 6 of +6 E(m_) = -3,30
4.13 a 0,90
b 1,29
c 45
d 64,5
e €22.500
4.15 a 0,35
b 0,008
c 0,16
d 0,40
(100 - A)
e
100
25
4.16 a 21· -
2 ' 12
b
25
4.17 a 0,4375
b 0,3634
c 1 minuut 20 seconden
4.19 595,59
4.21 a 0,70
b E(inflatie) = 7,4% E (groei) = 0,6%
4.22 0,111
5.2 a 0,0475
b 0,0132
c 0,9082
5.6 a 83,2
b 95, 105 en 116,8
5.7 a 0,0668
b 152,9 minuten en 166,6 minuten
5.8 a 0,1151
b 510,27
206
5.10 a 0,1587
b 0,0228
c 0,000634
5.11 a 0,0062
b 0,000013
c 0,0787 (na interpoleren)
fl = 8 uur, 7 min. en a= 5,66
5.12 a 0,0668
b 0,1446
c 8 uur en 22 minuten
5.13 a a= 11,9
b Verwaarloosbaar klein
5.14 a 0,0475
b 0,0808
c 0,3658
5.15 a 0,1056
b 10,56%
c 0,0934
d 18,43 euro
5.20 a 6,03
b 3,48
c 2,01
5.21 a 0,11
b 0,0124
5.22 a 0,1056
b 0,0587
6.1 a 0,4096
b 0,3277 0,4096 0,2048 0,0512 0,0064 0,0003
c 0,3156
6.2 a 0,2112
b 0,3430
c 0,0047
6.4 a 0,2061
b 0,0047
c 0,7216
d 0,7031
6.5 a 0,0913
b 0,0409
c 0,6730
6.7 0,0401
6.8 a 0,5987
b 0,0861
c 0,0375
208
6.9 a 0,9801 0,0197
b 498 x 10-9
c 0,00005
6.10 a 0,2301
b 0,1401
c n = 609 (n = 658 bij toepassing continuïteitscorrectie)
6.11 0,00524
6.14 a 0,2611
b [156; 204]
c 0
6.15 a 250 en 15
b € 100.000
c 370 ligt 8 maal de standaarddeviatie weg van 250. Dus kans 0.
6.16 a 0,0476
b 0,2765
c 0,2266
d Heeft zeer kleine kans om te komen, dus is ongeloofwaardig.
6.17 0,1335
6.18 0,0485
6.19 a 0,10
b 0,059
c 9
6.20 0,0186
6.21 a 0,1849
b 0,5405
c 0,2642
d 0,87
e 0,50
f 0,5987
g 125,6 gram
7.1 a 0,0733
b 0,5665
c 0,0996
d 0,0057
7.3 a 0,0733
b 0,1042
c 0,5665
d 0,2381
e 0,3631
7.4 a 0,7047
b 0,2466
c 0,0487
7.5 9 stuks
7.6 a 0,3528
b 2
c 1,782
d 0,218
7.7 a 0,0567
b 11,5 uur
7.8 a 0,0335
b 0,0630
210
7.9 a 0,0109
b 0,1099
7.10 a 0,0511
b 0,3185
c 0,0923 0,0094
Met Excel
0,0511, 0,3097, 0,0958, 0,0135
7.12 a 0,2650
b 0,2231
c 2,77 uur
7.13 a 0,1912
b 0,1401
7.14 0,6472
7.15 a 0,5768
b 0,4232
c 2,3278 per dag; 698,34 per jaar
d 105,9 extra verhuurdagen, dus niet doen
7.16 a 0,1088
b ruim 0,17
c 7
7.17 a 0,8153
b 0,0668
c Niet invoeren is goedkoper (1,44 tegenover 1,50).
7.18 a 0,0902
b 0,1020
c verdelingsfunctie F(t) = 1- e-o,sr (tin weken)
d ruim 232 uur (9 dagen, 16 uur)
7.19 a 0,1353
b 0,0203
7.20 a 0,0993
b F(x) = 1 - e- .'ö xvoor x;;;;o
c 10 en 100
d 0,1587
1 d 4 a
2 c 5 c
3 a 6 b
8.2 a x = 40,4
b 52= 7,05
c 38,50 < fl < 42,30
8.6 a 0,1243
b 12,29 < fl < 13,31 kg
c 0,0156 0,0390 0,0054
212
8.10 a n = 153, met de normale verdeling
b 23,97% en 34,83%
Bekeuringen tussen 9,39% en 15,87%.
8.12 a 1291
b 71
c 542
d Dus met n = 1291 wordt aan alle drie vereisten voldaan.
8.17 a s 2 = 17
b 81,39 < fl < 90,61
8.19 a s = 7,3978
b 20,3 < fl < 29,7
c 25,6 fl < 28,4 met t = 1,987 of 25,7 < fl < 28,3 met z = 1,96
d n ;:;;. 211
214
9.13 a s = 0,909
b 5,95 ± 0,43 levert 5,51 < f1 < 6,37
c Bij een eenzijdige toets met t = 1,73 vinden we als kritieke grens 5,35. Dus Ha wordt
verworpen.
9.18 x= 40 leidt met S:x = 3,30 en ta, 975 (7) = 2,365 tot verwerping van Ha.
9.19 a 0,0455
b 0,0113
c 0,9711
d Geen klacht indienen
e 990,65 < fl < 999,35
9.21 a Tweezijdige toets levert als kritieke linkergrens 22,4 %. In de steekproef 19,2 %, dus
significante daling.
b Met z = 1,81 vinden we 0,9649.
9.22 a 0,1607
b 0,0778
c ja
d 1 - {3 = 0,8907
10.1 a Expected-tabel:
32 24 24
48 36 36
b x 2 = 12,07
c Twee vrijheidsgraden
d Z={xlx>9,21}
e H 0 wordt verworpen.
217
10.11 a 0,1186 en 0,0401
b Chikwadraat = 2,98: H 0 aanvaarden
10.14 Met de negatief-exponentiële verdeling (A= 4,7 per uur) eerst de 'expected' frequen-
ties uitrekenen. Per klasse vinden we:
32,2 18,2 10,28 9,1 en 4,25.
Daarna x2 toepassen. Geen significant verschil tussen waarnemingen en theoretische
frequenties.
1 b 4 d
2 c 5 b
3 b 6 b
11.4 De gemiddelden verschillen 1065,75- 1070,31 = -4,56, levert z = -1,00, dus niet
significant.
11.8 a Zevenmaal min en eenmaal plus is niet significant bij tweezijdige teken toets.
b Met t* = -3,48 significant
11.9 a Kritieke grenzen zijn -87,1 of +87,1. Gevonden -7,3, dus niet significant verschil
volgens deze methode.
b Kritieket-waarde 2,2. Gevonden 4,17, dus significant.
c Kritieke aantal plussen 0, 1 en 2 en 10, 11 en 12. Gevonden 11 plussen, dus H 0
verwerpen.
11.10 We vinden t* = 2,13. Dat is significant bij tweezijdige toetsing (tabel t = 2,10).
219
11.11 a Berekende F = 3,70. Tabellevert met a= 0,05 bij tweezijdige toetsing F = 2,77.
Dus de populatievarianties zijn ongelijk.
b Berekende t* = 2,51. Excellevert bij tweezijdige toetsing t = 2,04.
Dus significant.
11.17 a 6,23
b 3,06
c 4,43
d 3,42
e 0,067
f 0,129
g 0,293
h 0,179
0,107 en 7,39
j 0,135 en 9,36
k 0,260 en 4,30
I 0,389 en 2,76
12.2 De berekende F-waarde is 7,50. Dat is beduidend boven de kritieke F = 3,47. De nul-
hypothese wordt dus verworpen (p = 0,003).
12.4 De drie gemiddelden zijn 7,4, 7 en 6,0625 met s = 0,926 en t = 2,601 (bij 21
vrijheidsgraden en a=0,016667 via T.INV van Excel) vinden drie intervallen. Bij
het grootste verschil 7,4- 6,0625 = 1,3375 vinden we als interval:
-+0,013 < f1 1 - f1 3 < 2,54, dus nét nog geen significant verschil.
12.5 a De berekende F-waarde is 6,66. Dat is beduidend boven de kritieke F = 2,91. De nul-
hypothese wordt dus verworpen (p = 0,00133).
b Berekende F-waarde is 3,84. De tabelwaarde is 5,52 (bij ~a= 0,025) dus geen signifi-
cant verschil.
12.6 a Voor de dagen geldt: De berekende F-waarde is 444. Dat is beduidend boven de kri-
tieke F = 3,01. De nulhypothese wordt dus verworpen (pis vrijwel nul).
b Voor de waarnemingsstations geldt: De berekende F-waarde is 34,1. Dat is bedui-
dend boven de kritieke F= 3,01. De nulhypothese wordt dus verworpen (pis vrijwel
nul) .
221
12.7 a Voor de banden geldt: De berekende F-waarde is 54,1. Dat is beduidend boven de
kritieke F = 4,46. De nulhypothese wordt dus verworpen (p is vrijwel nul).
b Voor de automerken geldt: De berekende F-waarde is 23,64. Dat is beduidend boven
de kritieke F = 3,84. De nulhypothese wordt dus verworpen (p = 0,0002).
12.11 a Er blijkt dat een rij-, kolom- en interactie-effect aanwezig is. Voor de interactie: bere-
kende F = 6,92 en tabelwaarde F = 2,36.
b Voor de drie tarwerassen geldt: de berekende F-waarde is 84,4. Dat is beduidend
boven de kritieke F = 2,87. De nulhypothese wordt dus verworpen (pis vrijwel nul).
c Voor de meststoffen: de berekende F-waarde is 90,0. Dat is beduidend boven de kri-
tieke F = 3,26. De nulhypothese wordt dus verworpen (pis vrijwel nul).
13 Regressie en correlatie
13.4 a Promillage
b Y = 1,797 - 0,01214X
c r= - 0,9761
d Y= 0,765
e Y= 2,156-0,1457 X
13.5 a Y=21,24+0,0779X
b 52,4 ohm
c y = - 0,03 + 0,0779 x
223
13.9 a Y= 168,06 + 121,77 X
b 1104 < y < 1667
c 1452,6 < y < 1787,4
13.10 a 180
b 0,0559
c 0,1867
13.11 -0,94
13.12 a 0,926
b <P= 0,624
13.21 a r = 0,6975 (NB Eerst moet Samsung, regel 9, uit het bestand worden verwijderd
omdat hier gegevens ontbreken.)
b Y= 9167 + 0,1124X (NB Eerst moeten Samsung, regel 9, en Petrobas, regel 37, uit
het bestand worden verwijderd omdat hier gegevens ontbreken.)
14 Indexcijfers
14.7 a 124,2
b 126,4
c 3.976 4.370 W= 109,9
226
14.8 a 120,9 en 99,3
b In beide jaren beter dan de beursindex van respectievelijk 117,6 en 96.5.
14.10 113,7
14.13 a 110,8
b 110,9
c W= 122,9 (voor fruit)
d Prijsindex 107,9. Zowel Laspeyres als Paasche is voor fruit hoger.
d 119,3, dus fruitbestedingen stegen meer.
15 Tijdreeksen
1 c 4 c
2 b 5 b
3 c 6 a
15.2 a VG (vanaf 2008 III): 36,75 38 39,5 41,5 43 44,25 45,75 47,25
b en c
Gemiddelde van de seizoenafwijkingen: - 8,625 4,625 10,125 en -7,125
Na correctie: S1 = -8,375 S11 = 4,875 Sm= 10,375 S1v = -6,875
15.4 a Trendwaarden (VG) vanaf woensdag week 1: 334,6 332,6 327,2 323,4
320,8 316,4 314,6 314 312,6 310,6 310 307,8 304,4 300,4
298,4 295,8 (woensdag week 4)
15.5 Trendwaarden (VG) vanaf2003II: 271 286,5 307 330,5 355,5 386
419 445 465,5 487,5
15.8 a 1,384 (maart) 1,406 1,404 1,416 1,420 1,432 1,450 1,482 (okt)
b Y= 1,320 Y = 1,344 en verder 1,350 1,386 1,400 1,412 1,395 1,405 1,427
1,448 1,477 1,498
c F = Y12 = 1,498
228
15.9 a Y= 68 + 4t (t= 0 in week 5)
b Y= 52 + 4t (t= 0 in week 1)
15.13 a Vanaf do week 1 190,0 192,9 enz.... enz. 192,9 195,7 di week 4
b Vanafmaandag -63,54 -43,44 -24,94 -38,14 +21,76 +144,64
en + 3,66 op zondag.
c Vanaf donderdag 122 172 272 160. Op basis van de laatste trends:
110 125 134 woe
15.22 a Vanafperiode 2 vinden we als waarden: 6,8 6,98 7,17 7,57 7,97
8,67 8,89 8,86 8,60 8,33 en 8,29
b 8,17%
c Met a= 0,50 vinden we: 6,8 7,1 7,35 7,93 8,41 9,36 9,38
9,09 8,54 8,12 en 8,16
Gemiddelde absolute afwijking is 0,89 (bij a= 0,30) en 0,77 (bij a= 0,50)
15.23 a We vinden een reeks VG-waarden beginnend met 63,025 in periode 2 tot aan 167,7
in periode 41.
b Lijn is 50,21 + 2,59 t met t = 0 in periode 0.
c Volgens het additieve patroon vinden we als seizoencomponenten:
44,47(III) -27,93(IV) -22,84(1) en 5,38. Het multiplicatief model levert als
seizoenindices: 1,433 0,733 0,786 en 1,045
d 141,97 172,33 214,01 144,67 bij additief model
129,18 174,46 242,95 126,17 bij multiplicatiefmodel
16.5 a 0,3821
b 0,1492
c n~61
16.6 a 0,2837
b 0,6111
c 0,2206
16.10 X2 = 98,77 met Z= {xlx > 16,81} wordt Ha verworpen. Er is wél afhankelijkheid.
231
16.12 a Met 5 2 = 84,67 en X2 [9] = 3,33 wordt H 0 (geen verschil) verworpen.
b 40,06 < u 2 < 282,22 met 95 o/o betrouwbaarheid
c Met 5 2 = 10,86 vinden we F = 84,67/10,86 = 7,8. Dus er is sprake van een verschil-
lende standaarddeviatie.
16.14 a VGvanaf2000n:
107,50 120,50 136 154 167 175,5 190 208 212 210 220
244 262 268,50 284 301,50 315 326,50
b Na correctie: Swinter = 64,3 Szomer = -64,2
c Y = 432,2 + 25t met t = 0 in 2004/05, tin halve jaren
=1 voor x~ 12
b 120 x 0,375 = 45
c Om 9 uur en 20 minuten.
d E(k) = 3,8
e Var (Js) = 0,76
f Met E (ksom) = 456 en CJ' = 9,55 vinden we kans 0.
g 0,9525
h 0,0294
Grens 1 234,9 leidt tot 25 fusten.
j 0,0428
k 0,3821
I 0,0351
m n = 123
n 0,1255
0 0,4678
a 0,1587
b 0,0548
c 0,9980
d 0,75
e Met T = 1 335 volgt kans 0,0039.
f E(Js) = 2,6 en Var (Js) = 1,74
g E(m_) = 26 en Var(m) = 4,35
h E(!l!)=€975,-
0,139379
j 0,9412
k 0,5568
I 0,4868
m €23,70
I
n 3
0 20 minuten
p 2x- x 2 = 0,9levert x= 0,6837, dus ruim 41 minuten
233
Case 3 Fun Tours B.V.
a 0,4060
b 18 meter
c X 2 = 3,8483, dus H 0 niet verwerpen.
d 45,96 < fA. < 50,04
e Bij eenzijdige toets H 0 verwerpen.
f Metsd=2,911 en t=2,10levertg=±6,11 ,
dus d = -6,4 is significant verschil.
g 0,61 < 7T < 0,79
h Gegeven 7T ongeveer 0,70 vindenwen;;; 897.
H 0 wordt niet verworpen.
j -0,1325 < fA-d < 0,0325
k Gegeven H 0 : 7T 1 = 7T2 leidt d = - 0,05 niet tot een overtuigend verschil.
235
Hoofdstuk 1-lnleidingtot de beschrijvende statistiek
Opgave 1.2
20
e 18 1--
:2~
a>o
.r:.o 16 '--
c:o
:RI!)
'
14
.... c:
Cl) ctl
c.> 12 -
'0.2!
ëii~
'
10
.Sa>
.C.'-
o.O
·- c: 8 -
~~
c:ctl
6 -
Cl>-
::l-"'
C"c: 4
~~ 2
L/1,
0 1015202530 40 50 60 100 150 • € 1.000
Opgave1.9
a Cumulatieve frequentieverdeling van het bandenprofiel van 200 auto's met cu-
mulatieve frequentiepolygoon
Profiel in mm Cumulatieve
frequentie Ql 200
-~ 180
4 gJ 160
0,00 - < 2,00
0,00- < 4,00 38 g 140
120 ~ 120
0,00- < 6,00
0,00- < 8,00 186 ~ 100
-~ 80
0,00- <10,00 200
:; 60
§ 40
() 20
0 2 4 6 8 10 profielinmm
b Naar schatting zullen er circa 75 auto's rondrijden met een profiel van
minder dan 5 mm.
Opgave1.17
Opmerking
Geen verschuiving met een halfje zoals besproken in het theorieboek
80
u
·a;
.<::
.E 60
.5:?
U
e::I
.!!! Ql
Eo
QlO
40
::ILO
o-~
QlQ)
.::a. 20
O -'VOO 0 0 0
1/) 0
~ ~
0
§ 0
0
')J 0
~
Opgave2.8
Opgave2.9
a
L _t; x i 14 · 5 + 130 · 2,4 + 48 • 1,6 + 26 · 7,2 + 28 · (-2,5)
x =--=------------------
n (14 + 130 + 48 + 26 + 28)
576
= - = 12,34%1
246
L /;xi 280 · 5 + 1600 · 2,4 + 450 · 1,6 + 500 · 7,2 + 140(- 2,5)
b x= - - =- - - - - - - - - - - - - - - - - - -
n 280 + 1600 + 450 + 500 + 140
9210
= - - = 13,10%1
2970
7/30
-a B
ëii
.I::
-c
-5 ~ 6
~-~ _1_1_~_0____+-~~
i§E
~~ 4
o-~
-=a. 2
(i) (I)
0
50 60 70 80 90 100 110 120 130 tijd in minuten
Mediaan
4/30)
De aanvulling betreft dus het ( --- 'ste deel van de derde klasse.
7/30
4/30
De mediaan wordt dan 70 + stukje = 70 + --- X klassenbreedte van de
7/30
derde klasse.
lx=781
Opgaven 2.19
Mgestudeerden:
LX
x=-= 1€ 12s,2o 1
n
Vóór het bepalen van de mediaan zijn de waarnemingen op volgorde gezet.
(Met Excel gaat dat snel)
Studenten:
28 28 29 30 30 34 3S
~ 40 40
46 47 S1 S2
êJ ~ 62 68 71 72
76
EJ 80 88 88 92 93 10S 122 146
Mgestudeerden:
0 38 40 46 S3 ss S6 S7 60 [@
~ 7S 78 78 80 88 89 90 94
~
11021 103 liS 130 132 14S 147 160 167 11701
11741 182 188 19S 22S 230 24S 2SS 280 380
ss+ S7
De mediaan voor stud.: - - - = I€ S61 gemiddelde van de middelste
2 twee, na rangschikken.
96 + 102
De mediaan voor afg.: = 1€991
2
Voor afgestudeerden:
69+ 71
Q =--=f?ol Q3 =
170 + 179
= 172
§]
I 2 U 2
e
b Het betreft steekproeven, dus werk met n - 1.
Studenten: s= =I € 29,941
Afgestudeerden: e
s= =1€77,971
Afbeelding 2.1
De linkersteel zou eindigen bij 37- 60 = -23, maar dat wordt ingekort tot
I+281, de laagste waarneming.
De rechtersteel eindigt bij 77 + 60 = 11371
Er is één uitbijter: 11461
6 • ~ d2 6 . 26,5
r, = 1 - = 1- = 0,907. Een positieve samenhang!
n(n 2 - 1) 12(144- 1)
We sluiten ons aan bij een nogal gangbare praktijk en verheffen a.h.w. de
schaal van Index tot het intervalniveau. De productmomentcorrelatie-
coëfficiënt van Pearson kan dan bepaald worden. (Zie Buijs, 1.1.5).
1604,35
1495,1. 2046,25
1604,35
1749,1
=10,921
Opgave 3.4
Extra
Wat is bij de vorige opgave de kans op een commissie met 2 A-leden,
5 B-Ieden en 3 C-leden, als de leden aselect worden gekozen?
P('gun,tige' oommi"ie) ~ ~
n,••• ;,
5 5
( : ) ( : ) (
530
)
·-~ c:n
Merk op dat die commissies worden samengesteld zonder teruglegging (dus
niet twee keer dezelfde Pietersen in één commissie).
De achtereenvolgende kansen zijn dus afhankelijk.
Dit soort problemen levert altijd een dergelijke formule op, die van de zoge-
noemde hypergeometrische verdeling.
Opgave3.9
4 2 2 4 8
P(één goed en één leeg)= P(GI' L2 ) + P(Lp G 2 ) =-X-+- X-=-
6 5 6 5 15
De twee kansen zijn samen 0,60, dus dat klopt met vraag a.
Gegeven is reeds dat de zaklantaarn niet werkt.
We kunnen dan met de regel van Bayes bepalen hoe groot de kans is dat dit
veroorzaakt is doordat beide batterijen leeg waren respectievelijk dat er een
lege en een goede aanwezig waren. We vinden:
1
15
P(Lp L 2 llantaarn werkt niet) = - - = 0,111
0,60
8
15
P( één goed en één leeg Ilantaarn werkt niet) = - - = 0,889
0,60
Nu gaan we de kans berekenen dat de zaklantaarn het de tweede keer weer
niet doet.
Gevall: De weggegooide batterijen waren beide leeg.
Nu zijn er nog alleen vier goede batterijen aanwezig. De zaklantaarn zal met
zekerheid branden. Kans dat ie niet werkt is in dit geval 0.
Geval2: Van de weggegooide batterijen was er een leeg en een goed.
Nu zijn er nog 3 goede en een lege waaruit gekozen wordt.
3 2 1
De kans op twee goede batterijen bedraagt - X - = -.
4 3 2
De lantaarn doet het dan.
De kans op een of nul goede batterijen is daarom 1- 0,5 = 0,5. Dan doet de
lantaarn het niet.
Kortom, in geval 1 is de kans gelijk aan 0 dat de zaklantaarn niet werkt en in
geval 2 is die kans 0,50. Omdat geval1 optreedt met kans 0,111 en geval 2
met kans 0,889 vinden we voor de gevraagde kans:
P(zaklantaarn weigert ook de tweede keer, gegeven weigering de eerste keer)
= 0,111 x 0 + 0,889 x 0,50 = 0,444
Examinator Klachten
wel niet totaal
Dirk 0,10 . 24 = 2.4 0,90. 24 = 21,6 24
Judith 0,06 . 16 = 0,96 0,94. 16 = 15,04 16
llse 0,03. 6 = 0,18 0,97. 6 = 5,82 6
3,54 42,46 46
a P(Peter slaagt)
= P((Bij Dirk n slagen) u (Bij Judith n slagen) u (Bij Ilse n slagen))
2,4 ~
d -=~
3,54
Opm. Met een kansboompje gaat het misschien wel zo aardig:
0,14 0,14 ~
b Zie ze kolom: P(Ilse Islagen) = = - = O,Z59
0,16 + O,Z4 + 0,14 0,54
O,OZ4
c Zie 3e kolom: P(Dirk Iprotest)= =I 0,6781
O,OZ4 + 0,0096 + 0,0018
Opgave3.12
Leest de pagina
·~ ·. ·~ ·. ...... ... .•· ...
Marginale
kansen
,t.
Altijd Soms Nooit
Aandelenbezit 0,16 0,12 0,06 0,34
Geen aandelenbezit 0,04 0,24 0,38 0,66
Marginale kansen --t 0,20 0,36 0,44 1
. .. ... . ···"·
Altijd
. .
Soms/Nooit
. ,. . .
Bezit aandelen 0,16 0,18 0,34
Geen bezit 0,04
- ---
0,62 0,66
0,20 0,80 1
Opgave 3.22
Economiestudent= E enBedrijfskundestudent = B.
Opgave 3.25
Twee grootheden, elk met twee uitkomsten; typisch iets voor 2·2-tabel (hier
met kansen).
De getallen met • zijn eerst berekend, met •• zijn later berekend. De rest is
eerder ingevuld aan de hand van de tekst.
Opgave4.6
1 1
a De kansen zijn P(x = 45) =- , P(x = 35) =- enzovoort
- 4 - 4
1 1 1 1
E(x)
-
= ~x· P(x- =x) = 45 · -4 + 35 ·-4 + 30 • -4 + 20 ·-4 = 132,51
45 35
b De kansen zijn P(y = 45) = - P(y= 35) = - enzovoort
- 130 - 130
45 35 30 20
E(y) = ~y-P(y=y) = 45 · - + 35 ·-+30 · - + 20 ·-=1351
- - 130 130 130 130 u
Opgave4.7
b E(/s_) = ~ k • P(k = k)
= (0. 0,20) + (1 . 0,30) + (2. 0,20) + (3. 0,15) + (4. 0,10) + (5. 0,05)
=~ (oké, zie gokje)
1 0,26
2 0,12
3 0,08
4 0,04
1,00
Opmerking
Alle kansen tussen 0 en 1, samen gelijk aan 1.
Eerst een prentje.
f(k) Gokje:
E(!s) wat kleiner dan 1
0,50 o(~) ongeveer 1
0,25
0 2 3 4 k
c/d Vooraf
Als g =
- -
+
~ +y dan : E(g) = E(~) + E(y) en Var(~)= Var(~) Var(y) + 2Cov(~ • y)
- Î -
Cov(~, 2:) = 0 als ~ en 2: O.O.
Zo geldt ook:
als g = ~ + ~ dus g = 2~
Î
maar in bovenstaande zin(!), dus niet als vermenigvuldiging
Opgave4.18
f(x = 0,0001)
a Lauwen krijgt de klok als de concurrent minder dan 23.000 biedt. De kans
daarop is:
P(~ < 23.000) 0,31.=I
b Bij een bod B van 28.000 is die kans: P(~ < 28.000) =I 0,81.
Bij een bod B van 30.000 is hij zeker koopman: kans =[TI.
B- 20.000 30.000 - B
E(J-Jt:) = (31.000- B) · +0 ·---
10.000 10.000
Ad a
23.000 - 20.000
Als B = 23.000, dan E(J'!::) = (31.000 - 23.000) · - - - - -
10.000
= 8.000 · 0,3 = 12.400 euro I
Adb
Als B = 28.000, dan E(J'!::) = 3.000 · 0,8 = 12.400 euro I
Als B = 30.000, dan E(J'!::) = 1.000 · 1 = 11.000 euro I
Opmerking
Denk erom: niet alleen de kosten B worden slechts met een zekere kans ge-
realiseerd; diezelfde kans is ook van toepassing op opbrengst 31.000, die ook
niet altijd gerealiseerd wordt.
B - 20.000
d E(J'!::) = (31.000- B) · betreft een tweedegraadsfunctie, dus
10.000
grafisch een (berg)parabool. We nemen de afgeleide:
B - 20.000 1 51.000 - 2B
E'(J'!::) = - 1 · + (31.000 - B) · - - = - ---
10.000 10.000 10.000
De maximale verwachte winst wordt bereikt als
E' (1!::) = 0 <=> 51.000 - 2B = 0 <=> B = 125.500 euro I
De verwachte winst is dan E25_500 = 13.025 euro I·
B- 20.000
e E(J'!::) = (Y-B) · , tweedegraadsfunctie van B
10.000
B - 20.000 1 20.000 + Y - 2B
E1(w) =-1· + (Y - B)· - - = - - - - -
- 10.000 10.000 10.000
Opgaves.6
Opgaves.s
500-506 6
a Zsoo= 5 =S=-1,2
(l<ijkbij z=+1,2 (tabel1a))
500 506
P(~ < 500) = P(g_ < -1,2) = P(g_ > + 1,2)
=jO,l151j
a P(~>80) =I 0,3085j
Immers, de excentriciteit van 80, dus het aantal keer de standaardafwijking is:
Z 80 =80-78
4 0,5. Analoog: P(~ > 85) =I 0,040 1j.
b Per dag: P(op een boete) = P(~"2:. 85) = 0,0401, immers:
85-78
Z 85 = 1,75
4
l!_, de boete per dag
~~
90-78
c P(x > 90) = 0,013, immers: Z 90 = - - - = 3
- 4
l
4412 4500
De kansverdeling wordt dan:
0,9599 als b = 0
f(l!_) = =
( 0,0401- 0,0013 0,0388 als b = 50
0,0013 als b = 100
E(l!_) = 0,9599 • 0 + 0,0388 • 50 + 0,0013 • 100 = 2,07
1
De verwachte boete per jaar is: - · 250 • 2,07 = 151,75j euro
10
~ 360 390
. Immers:
390-360
z 390 = - - - - = 1,06 ~ opp> 390 = 0,1446
28,28
.
P(l) < T = 0,95 ~ Zy = 1,645
~
(volgens tabel 1b)
T= 450 + 1,645 • 31,6 = 502 minuten=
450 T
Is uur en 22 mini
Opgave5.18
Opgave6.3
a P(/s_ =0) =I 0,01731 P(k =1) =I 0,08671 P(/s_ =2) =0,1951 (binomiale tabel)
P(fs_ =0, 1 of 2) =P(ls_::; 2) =0,2991 (cumulatieve binomiale tabel)
31 antwoord goed.
Opgave6.4
m_, het aantal volwassen Nederlanders met minstens een creditkaart (= met)
m - B(n = 15; 7T = 0,70)
Omdat de (cumulatieve) binomiale tabel slechts kanswaarden aangeeft voor
7T::;0,5, wordt het geschetste probleem (met 1r= 0,70 > 0,50) zó omge-
bouwd dat het geldt voor Is_, het aantal volwassen Nederlanders zonder
creditkaart (=zonder): Is_ rv B(n = 15; 7T = 0,30).
slagen
of ~ 7T= 0,6 7T, de individuele slagingskans
niet
90 100.5
Opgave6.14
a
k~
0 1718192021 120
...
k
=}~
18 20,5
...
~
L = 180- 1,96 · 12,37 = 155,75 ~ 156
0,0~,0~
Gevraagd interval I[156, 204]1 .
~-- L 120
P(k :5 79,5)
immers z 79,5 =
=@].
79,5-120
= -4,0
10,1
Opmerking
In plaats van de binomiale verdeling voor aantallen (k), had ook de bino-
miale verdeling voor fracties (p) beschouwd kunnen worden. Dat gebeurt in
opgave 6,15c. -
Opgave7.3
a P(k = 1) = I0,07331
b P(k = 6) =I 0,10421
e P(4 < k < 10) = P(k :So 9)- P(k :So 4) = 0,9919- 0,6288 =I 0,36311
e P (4 < k < 10) = P(k :So 9)- P(k :So 4) = 0,9919 - 0,6288 =I 0,3630 I
Immers vul in en bereken: POISSON(9;4;waar) - POISSON(4;4;waar).
Opgave7.15
Dat levert 1105,841 verhuurdagen méér, dus I€ 8.467,20 I per jaar méér, maar
het kost nóg meer, namelijk € 10.000,00. Dus niet doen.
Opgave8.4
c Met n = 4:
4 4
36- 1,96. ----;14 <ft(~) < 36 + 1,96 . .j4
I
<=> 032,08 <ft(~) < 39,92 minuten I
Opgave8.7
Dus: In = ; : : 3851 .
Opgave8.17
~(x; - x)1
---- =
~36 r::::
- 8 = .y 17 = 4,123---7 s2 = fl7l
9-1 L....:J
Opgave8.21
Opmerking
Als met z = 1,96 wordt gewerkt, dan volgt 32,28 < fl < 36,12.
b • Bij opgave a was de marge ±1,936. Deze moet nagenoeg gehalveerd wor-
den, en dus zal de steekproefomvang bijna vier keer zo groot moeten
worden. Daarmee wordt n zó groot dat nagenoeg precies zal gelden:
t= 1,96.
• Ga ervan uit dat de s niet noemenswaardig anders zal zijn als de gestelde
12 dagen.
12
• De eis wordt dan: 1,96 Jn
= 1 ~ n = 553.
Opgave9.5
Verontreinigingseis: Jl-(~) :5 5%. Als dat zo is, oké. Maar ik vrees méér.
Derhalve:
H 0 : Jl(~) = 5%, met J1-(~), het gehalte aan verontreiniging
H 1 : Jl-(~) > 5%, rechtseenzijdige toets met a= 0,10
Toetsingsgrootheid ~' het steekproefgemiddelde
u(~)
Onder H 0 : ~- N ( Jl-(~) = Jl-(~) = 5%; u(~)= Jn = .jlO
0,5
= 0,158%
)
Opgave9.6
a ~- N(5, 0,15)
5,4-5
z5,4 = ~ = 2,67 <=> opp>5,4 = 0,0038
~ 4,6 5 5,4
. analoog opp <4,6 = 0,0038
I
Ofwelj 0,76% heeft inhoud buiten de gestelde grenzen.
b H 0 : J1-(~) = 5, met Jl(~), het gehalte aan werkzame stof (in mg)
H 1: J1-(~) =I= 5, tweezijdige toets met a = 0,010 en Vz a = 0,005
Toetsingsgrootheid ~' het steekproefgemiddelde
a(~)
Onder H 0 : ~- N(/1-(~) = J1- (~) = 5; a(~)= r::; = 0,03)
....;25
!a= 0,05 ---7 ZR = 2,575
~--
R = 5 + 2,575 x 0,03 = 5,07725
L = 5 - 2,575 x 0,03 = 4,92275
l 5 R A= {xER 14,923 < x< 5,077}
I Z={xER I x:54,923 v x2::5,077}1
5,4-4,7
c z 5A = = 4,67 Ç::> opp>5,4 = 0
~.
0,15
4,6-4,7
4,6 4,7 5,4 z4,6 = = -0,67 Ç::> opp<4,6 = 0,2514
0,15
Kijk bij z = +0,67
Antwoord: 125,14o/o I·
Opgave9.8
I zH. =( f- , o,4788ll
31
In feite blijkt p = - = 0,3522 EZ
- 88
Dus H 0 verwerpen, H 1 accepteren: de mentorbegeleiding lijkt succes te heb-
ben.
(Zo'n afwijking van p = 0,3222 ten opzichte van zijn verwachtingswaarde
0,60 kan niet meer worden 'verklaard' uit toeval.)
Opgave9.11
Klassieke aanpak
~' het gewicht van een hamburger
H 0 : JIÜ ) = 160
H 1 : Jl(~) < 160, linkseenzijdige toets met a = 0,05
Toetsingsgrootheid ~
0"(~) 5
Onder H 0 : ~- N(JI(~) = Jl(~) = 160; CT(~) = Jn = j6 = 2,04)
~~
L = I60- I,64S x 2,04 = IS6,64
A= {x ER I x> IS6,64}
L 160
IZ= {x ER I x :S IS6,64}1
~~
2,04
Opgave9.18
Opgave9.23
-----11...... . . _
A=< f- '7,206) IZ= [7,206, ~> I
A Z
In feite blijkt Ix = 7,321 EZ.
Conclusie: uitgaande van een beweerd verwacht gebruik van hoogstens
7 liter, is de steekproefuitkomst te afwijkend naar boven om nog te kunnen
verklaren uit het toeval; het verwacht verbruik moet meer zijn dan beweerd;
de fabrikant heeft ongelijk.
~ ..
7,206 7,30
P(~ E z Ifl = 7,30) = P(~ > 7,206 Ifl = 7,30) =
10,77401
7,206-7,30
Immers: z 7,206 = = -0,752
0, 125
Opgave10.5
0 E 0 E 0 E
T/m 44 jaar 143 132 (SS%) 77 88 (SS%) 220 220 (SS%)
4S jr en ouder 97 108 (4S%) 83 72 (4S%) 180 180 (4S%)
Totaal 240 240 (100% 160 160 (100%) 400 400 (100%)
~
Jz= [6,63, ~>I
~a~,01 In feite blijkt
G
Opgave 10.12
Aantal Aantal %
134 134.4 28 0,00
144 172,8 36 4,80
129 11S,2 24 1,6S
-
73 S7,6 12 4,12
480 480 100
(E- 0) 2
Toetsingsgrootheid L ---
E
(E- 0) 2
Onder H 0 : L E
~ x\3>-verdeling
opp>G= 0,05 ~I G = 7,811
~
Z== [7,81, ~)A== [0,7,81)
~:.=0,05
(E- 0) 2
3 G In feite blijkt L E = 110,5 71 EZ.
Opgave 10.13
(E- 0) 2
Toetsingsgrootheid L E
.
Klasse
.
·~ ·.
Expected
... ·• ... . . .... ...
Observeel
. . .. . ... . ....~
(E- o)•
~--·-
E
P~=k) Aantal Aantal 3.41
0 0,3679 36,8 48 4,45
1 0,3679 36,8 24 0,31
2 0,1839 18,4 16
3 0,0613
-----
-----
4
5
6
0,0153
0,0031
0,0005
'·'}
1,5
0,3
0,1
= 8,0 12 2
- ----- -
7 0,0001 0 ,0
L 100 100
-10,17
- --
(E- 0) 2
In feite blijkt L E = 110,171 EZ.
G
Opgave11.5
30,5 30,5
=-+-= 7,13 ~ ó-(v) = 2,67
11 7
Kortom: y- t(E(y) = 0; ó-(y) = 2,67) (bij df= 16)
Î
1/ 2 a = 0,025}
t= 2,12
~--
df= 16
Opgave11.7
Fabrieksvervuiling ~ f, stadsvervuiling ~ s.
De verwachtingswaarde ~ fl·
Maak een nieuwe verschilvariabele y = [ - I.
Dan is E(y) = E(D - E(?.) en u 2(y) = u 2(D + u 2(?.) - 0.
Î
o.o.
Ho: fl([) = fl(~)
H 1 : fl([)>fl(;&), rechtseenzijdige toets met a= 0,01
Onder i
HO:y- t o.o.
i
0,236 0,236
= - - + - - = 0,053 ...
8 10
7·0,56 2 +9·0,42 2 )
a( v) = 0,23 ( met s~ = = 0,236
- 16
Opmerking
Omdat er sprake is van gelijke varianties, wordt voor de beide onbekende
u's dezelfde paoled varianties~ ingezet.
Bij a= 0,01 is de t-waarde van de grens van
~~ 0 G
het kritieke gebied: I t' = 2,591 (bij df = 16).
In feite: v = 2,26- 1,54 = 0,72.
-------~,.
A
...____
Z o,72 -o
Deze heeft een t* = = 13,131 > t'.
0,23
Dus H 0 verwerpen en H 1 accepteren; de
fabrieksvervuiling is significant groter.
Opgave 11.12
Vooraf
2100 (320- 350) 2 + ... + (300- 350) 2 23000
A t/m F x = - - = 350 en s2 = = - - = 4600
6 x 6-1 5
J
a(~) en a(y) zijn onbekend, maar zijn ze (on)gelijk? Via een toets met de
F-verdeling-zou dat te verifiëren zijn. Neem aan: gelijk, dan zijn beide te
schatten via de paoled variance:
52
= (6- 1)s; + (10- 1)s~ 5(4600) + 9(4000)
------ = 4214,28
p (6- 1) + (10- 1) 14
A
2 A
2 _ A
2 _ Û 2 (~) û 2 (2:') s~ s~ 4214,28 4214,28
<T (y) = <T (~) + <T (y) = - - + - - = - + - = +--
- nx ny nx ny 6 10
= 1123,81
û(y) = 33,52
Kortom: y ~ t(E(y) = 0; û(y) = 33,52) met df= (6- 1) + (10- 1) = 14
i
a = 0,025}
1/ 2
t= 2,145
~~
df= 14
Opgave 11.13
Ha: er is geen verschil; de kans op (-) is dan even groot als de kans op (+),
met andere woorden: 7T(-) = 0,5
H 1 : dat is niet zo
Toetsingsgrootheid k_, het aantal keer (-)
Onder Ha: k ~ B(n = 6; 7T = 0,5)
A= {1, 2, 3, 4, 5} met kans 0,9688 > 0,95
-
- ' - - - - J ' - - - - - ' - - - - - L - - -... ~ z= { 0, 6} met kans 2 x 0,0156
A 5 6 k = 0,0312
Immers:
1 1
v =- (100 + 120 + 80 + 90 + 110 + 90) = 98-
6 3
Opgave 11.15
200 1 500 1
Vooraf: p = - - =- Nadien: p = - - =-
V 1000 5 n 1500 3
H 1: 7T" > 1rv <=> 1r"- 1rv > 0, eenzijdig met a= 0,05
Toetsingsgrootheid d. = E_n -E_v
Onder H 0 : E(d.) = E(E_n)- E(E_v) = 7T"- 7Tv = 0
Opgave12.1
c L(x;-xY= 242(A)
L(x;-xY= 560(B)
L(x;-xY= 368(C)
SSE = 1170
Binnenvariantie MSE = SSE/ 14 = 1170/14 = 183,571
c n1
727,059
d Tussenvariantie MSG = 2 = 1363,531
Deze opgave heeft dezelfde structuur als opgave 12.1. Nu eens via Excel.
Typ eerst de gegevens, op dezelfde wijze als in de opgave wordt gesugge-
reerd.
Kies Extra- Gegevensanalyse- Unifactoriële variantieanalyse- OK.
Vul in: achter Invoerbereik $A$1:$C$9 of $A:$C, Groeperen per kolom,
Alfa is 0,05 en kies een Nieuw werkblad.
Het programma geeft onder andere:
• gemiddelde van de kolommen: 6,33 11,62 16,01
• kwadratensommen: SSG = 422,36 en SSE = 591,54;
opgeteld: SST= 1013,89
• tussenvariantie: MSG = 422,36/2 = 211,18;
binnenvariantie: MSE = 591,54/21 = 28,17
MSG 211,18
• de toetsingsgrootheid i s : - - = - - = 17,50 I
MSE 28,17
• deze toetsingsgrootheid volgt een F(2,21)-verdeling met
P(f(2,21) > 7,50) =I 0,00351 als rechteroverschrijdingskans
• als je deze kans vergelijkt met Ia = 0,051 , blijkt de gevonden waarde van
de toetsingsgrootheid 'royaal' in ZHo te liggen.
Opmerking
Overigens is de grenswaarde van F(2,21) bij rechtseenzijdig a= 0,05 gelijk
aan 13,471.
Opgave12.6
Opgave12.8
a • Ho:flA=flB=fl c
• voor A: x= 180L(x;-x)2=860
voor B: x = 189,17L(x; - x)l = 469,67
voor C: x= 175L(X;- x) 2 = 578
lssE = 1907,671
allemaal x= 181,39
SSE 1907,7
• Binnenvariantie MSE = - - = - - = 157,811
36-3 33
De kwadratensom over (alle elementen minus x ):
c nj
2 32 34 40 32
33 37 43 32
35 38 44 33
36 40 45 35
3 19 33 30 20
21 35 31 20
23 36 33 21
25 36 34 23
Opgave13.4
780 8,50
X= -=78 Y =-=0,85
10 10
(10. 650,13)- (780. 8,5) 6501,30- 6630 -128,7
b = (10. 61900) - (780. 780) = 619000 - 608400 = 10600 = 1-0' 0121415 1
a= 0,85-(0,0121415 X 78) = 11,79701
Dus IY= 1,797- 0,01214XI
De gevraagde regressielijn: IY= 1,797- 0,01214XI.
Een grafiek is een mooi controlemiddel; dus aan de slag!
n LXY - LXLY n LXY- LXLY -128,7 - 128,7
c r2 = = - - - · - -- - - -- --
n LX2 - LX LX n Lyz- LYLY 10600 10 x 7,3890-8,5 x 8,5
= 0,9528...
Opgave13.6
a Met Excel.
• Extra- Gegevensanalyse-Regressie- OK.
• Markeer de kolom van invoerbereik Y (eindtentamen), inclusief het
woord eindexamen.
• Markeer de kolom van invoerbereik X (tussentoets), inclusief het woord
tussen toets.
• Zet een vink bij labels.
• Markeer een lege cel om het resultaat in te kunnen zetten .
• Druk op OK.
• Het resultaat staat op een volgend blad.
• Maak de velden daarvan wat breder zodat de volledige kopteksten zicht-
baar zijn.
• Kijk bij coëfficiënten en destilleer daaruit het gevraagde resultaat:
Eindexamencijfer = 3,38 + 0,94 Tussentoetscijfer.
Opm. Als het cijfer voor de tussentoets één punt hoger is, leidt dat gemid-
deld genomen (ook) bijna tot een één punt hoger eindexamencijfer.
Opgave13.8
y
. . ..".. . ......
10
~
11 12
. . . .. ~
-x
1 0,2 0,1 0,3
2 0,1 0,2 0,1 0,4
0,1 0,3
3
0,3
0,2
0,5 0,2 1,0
- - --
d Deze maat voor samenhang zegt nog niets; pas na standaardiseren, te berei-
ken doordeling door u(K) en u(Y), ontstaat de correlatiecoëfficiënt p(~ X):
Cov(2~, X) 0,30
p(X, X) = = = I0,561, een zwak verband.
- - CT(K) • u(Y) 0,77 · 0,77
Opmerking over p
Om redenen, waarop ik hier niet inga, is een p = 0,56 allerbelabbertst; er is
dan nauwelijks sprake van enig verband, dus van enige verklaring van ver-
schijnsel Y uit verschijnsel X, van enige afhankelijkheid. We moeten immers
eigenlijk kijken naar p 2 = 0,31 als aanduiding van welk deel van de variantie
in de Y-waarden wordt verklaard uit oorzaak X; de rest van die variantie
wordt toegeschreven aan het toeval.
e g= ,! + ~
Î
CT(z) = 1,3
6. 163
Spearman: R = 1 -
8(64- 1)
= 1-0,940 I
De Ranges vertonen een tegengestelde samenhang.
Opgave 13.15
a Spreidingsdiagram
Opmerking
In principe zou je de verticale as door middel van een scheurlijn bij circa
100 kunnen laten beginnen. Toch kan dat ooit een tikje vervelend zijn voor
het maken van een 'gokje', namelijk in dát geval dat de verticale afsnijding
(het verticale intercept), a dus, ónder de scheurlijn zou uitkomen.
Gokje: Y = 38 + BOX
Î
y 160
r.c.=-=80
2
200
I
100 I (160)
(~ I
=38
2 x
Uy -109 =7365 }
b=-=
b= ~X 2 ~,48 ' IY= 44,26 + 73,65XI
a = Y - bX = 44,26
waarschijnlijk goed gerekend
(zie gokje)
e û2
F
= s2
F
1 (x -
= SJe { 1 + - + ----:0~
-xy}
=---
2
n .t:.JX
1 (1,45- 1,3)2}
=69,53 { 1 + - + = 107,65~ûF = 10,37
10 1,48
X 0 = 1,45 ~ Y' = 44,26 + 73,65 · 1,45 = 151,05 km/u
We kennen dan:
• het centrum van het voorspellingsinterval151,05 km/u,
• de schatting voor de standaardafwijking van dat interval, namelijk
10,37 km/u,
• en we zullen vanwege die schatting de t-verdeling gebruiken bij
v= 10-2 = 8 en 1a = 0,025 ~ t= 2,306.
Dus:
151,05- 2,306. 10,37 < y < 151,05 + 2,306. 10,37
<=> 1127,17 < y < 174,961
Extra
Omdat in diverse uitwerkingen Excel zal worden gebruikt, wordt opgave
13.15 nog eens gedeeltelijk uitgewerkt, maar dan met Excel. De Excel-resul-
taten kunnen dan vergeleken worden met de klassieke uitwerkingen, om
zodoende meer vertrouwen te krijgen in Excel.
• Neem de gegevens in twee kolommen over op een Excel-werkblad.
• Ga naar Extra, Gegevens, Regressie, OK.
• Vul het dialoogvenster in: het invoerbereik van Y en van X desgewenst via
de gestippelde omkadering van de respectievelijke kolommen (alleen de
getallen!), het Betrouwbaarheidsniveau is 95% en kies ook voor Storin-
gen. OK.
• Verwijder de regels over variantieanalyse.
• Reduceer het aantal decimalen tot drie en verbreed de kolommen tot alle
tekst volledig zichtbaar is.
Opgave14.6
q09 2100 ~
a Axel : QE = - • 100 = - - • 100 = 87,5
08,09 2400
q08
q09 420 ~
Berlina QE =-·100=-·100= 93,3
08,09 450
q08
q09 280 ~
Cornet QE =-•100=-•100= 147,4
08,09 190
q08
q09 1320 ~
Dubio MPV: QE08,09 = - · 100 = - - · 100 = 161,0
820
q08
L =
Q08,09 ~Po8q09. 100
~
""- Po8q09
(24.000 . 2.100) + (57.500. 420) + (88.500. 280) + (57.500 . 1.320)
--------------------------------------------- ·100
(24.000. 2.400) + (57.500. 450) + (88.500. 190) + (57.500. 820)
175,23. 10 6
= · 100 =ll18,81
147,44. 10 6
QP = ~Po9qo9. 100
08,09 ~
"'-Po9q08
(25.750. 2.100) + (59.500. 420) + (84.500. 280) + (56.000. 1320)
------------------------------------------- ·100
(25.750. 2.400) + (59.500. 450) + (84.500. 190) + (56.000. 820)
176,65 . 10 6
= . 100 = ll17,31
150,55. 10 6
a We kennen de aantallen uit de basisperiode en gaan dus op zoek naar het sa-
mengesteld prijsindexcijfer van Laspeyres. Er wordt nu eens gekozen voor de
directe schrijfwijze.
PL = ~p14iql1i 100
11,14 ""
.L.J p 11i q11i
x
340. 1 + 208. 1 + 1,74. 2200 + 3,5. 35 + 220 . 2
- - - - - - - - - - - - - - - - x 100
270 . 1 + 186 • 1 + 1,35 • 2200 + 2,0 . 35 + 240 . 2
4938,5
= - - x 100=1124,21
3976
PP = ~p14iq14i OO
11,14 "" x1
.L.J p lli q 14i
Opgave14.9
118,42
a Q~3 •04 (J) = ----wB · 100 = 1109,651
104,79
Q~3 .o4 (II) = ----w:1· 100 = 1100,761
160
Q~3,04 (JIJ)= 110. 100 = 1145,451
Deze directe formule brengt ons niet verder. Maar er geldt ook een indirecte:
c • P~3 •04 kan meteen (zie b) uit de gegevens worden gehaald ~ 105,69.
• Ook Wg 3,04 haal je uit de gegevens:
totale waarde 2004 610
- - - - - - . 100 = - . 100 = 113,81
totale waarde 2003 536
• Er geldt pL • QP = W 5 • 100 (zwakke productrelatie).
wg3o4 113,81 ~
Dus ook QP
03,04
= -pL- · · 100 = - - · 100 = 107,7
105 69
03,04 )
Opgave15.3
Aantal
-40-
., · - · · ·~·
V.G.(3)
........ ..................... .
V.G.(4)
·~·
Gecentreerd
1
2 45 45
.............. 47,5
3 50 50 50
.............. 52,5
4 ss 55 55
.............. 57,5
5 60 60 60
..............
-
62,5
6 65 65 65
.............. 67,5
7 70 70 70
.............. 72,5
8 75 75 75
.............. 77,5
9 80 80
10 85
Opgave15.6
b Bij grote a zijn het vooral de meest recente cijfers die meewegen in de geëf-
fende trendreeks. Als a kleiner is zullen de historische cijfers ook mede bepa-
lend zijn, hetgeen leidt tot een gladder (gemiddeld) verloop van de trend,
minder fluctuerend dus dan de oorspronkelijke tijdreeks.
....
Data
.·-· .... .. .
a= 0,3 a=0,1
Exponentiële effening
20
-#NB #NB
ê
äl 40 - . - - - - - - - - - ,
--
18
30
20
19,4
-
20
19,8
~ ::1
i ,~ i I I I I
I I t
i I
ct j l= ::~:~1
29 22,58 20,82
0 12345678
32 24,51 21,64
maand
28 26,75 22,67
30 27,13 23,21
31 27,99 23,89
31 28,89 24,60
Opgave15.7
a Kies jan~ t= 1.
Jaar
. . . . ". -.- •·
t y txY t•
. ·• ~· .·-
ja~
feb
-- 1---
2
1,32
1,38
1,32
2,76
- -1 ----
4
mrt 1,36 4,08
-- -
3 9
ap.!:_ __ 1,44 5,76 16
mei
4
5 1,42 7,10 25
--- - -- -----
--·--
juni 6
- 1,43 8,58
-------
36
juli
- 1,37 9,59
7 49
aug 8 1,42 11,36 64
sept 9 1,46 13,14 81
--- -------
okt 10 1,48 14,80 100
-------
nov 11 1,52 16,72 121
----
-
dec 12 1,53 18,36 144
2:
--- -
78
- - -- - - - - -650
17,13 113,57
- -- ------
Zoek lineair Y =a + bt met:
n~tY- ~ Y~t (12 ·113,57)- (17,13 • 78) 26,7
b= = - - - - - - - - - - - - = 0,00355688
n~t2- ~t ~t (12 • 650)- (17,13 · 17,13) 7506,56
b De voorspelde benzineprijs per eind januari van het nieuwe jaar ( t = 13) is
Y= 1,4043808 + 0,00355688 · 13
= 1,4506 ~ 11,4511
Opgave 15.11
2,=4
minustrend
2005 I 118
11 237
945
111 425 236 189 1,80
944
IV 165 236 - 71 0,70
942
2006 117 235 -118 0,50
939
11 235
774*
111 422
784*
IV 0
807*
2007 127
857*
258
1043
111 472 262 210 1,80
1051
IV 186 265 -79 0,70
1066
2008 135 270 -135 0,50
1091
11 237 274 -1 1,00
1100
111 497 276 221 1,80
1105
IV 195 277 -82 0,70
1114
2009 140 280 - 140 0,50
1128
11 282 283 -1 1,00
1133
lil 511
IV 200
~ = 12 miljoen
- - - - - - - - -
Statistiek om mee te werken geeft een compleet Inclusief
beeld van statistische methoden en hun
toepassingen. Het opgaven- en uitwerkingenboek Website:
volgt de indeling van het leerboek en behandelt www.statistiekommeetewerken.noordhoff.nl
vervolgens: - Excel-bestanden
• Maatstaven voor ligging en spreiding - Met de voucher in dit opgavenboek krijgen de
• Kansrekening studenten toegang tot de uitgebreide en extra
• Kansvariabelen, zoals normale verdeling, binomiale uitwerkingen.
verdeling en paissenverdeling
• Schatten
·Toetsen
• De chi-kwadraatverdeling
• Verschiltoetsen
• Variantieanalyse
• Regressie en correlatie
• Indexcijfers
• Tijdreeksen
• ~ Wolters-Noordhoff