You are on page 1of 82

Foutenleer

Omgaan met onderzoeksgegevens in de chemie

dr. J.L. Derissen


drs. P.H. van Roon
dr. P.S. Peijzel
R.J. Baars

Faculteit Bètawetenschappen
Departement Scheikunde
Universiteit Utrecht
2008
Inhoudsopgave

1 Spreiding 5

2 Meetuitkomsten 13

3 Nauwkeurigheid van meetapparatuur 19

4 Notatie van meetresultaten 27

5 Samengestelde grootheden 31

6 Simpele lineaire regressie 37

7 Verdelingsfuncties 45

8 Verwachtingswaarden 53

9 Statistische toetsen 57

10 Literatuur 69

11 Tabellen 71

12 Appendix 77
Hoofdstuk 1

Spreiding

1.1 Meting aan één voorwerp of stof

Als een fysische of chemische eigenschap van een voorwerp of van een (homogeen deel van
een) stof enige keren gemeten wordt, wordt er gewoonlijk niet steeds dezelfde meetuitkomst
verkregen. Dit fenomeen wordt spreiding genoemd.

Voorbeeld 1.1 Een meting van de massa van een messing blokje op een analytische
balans, met één minuut tussen de metingen, leverde de volgende resultaten op (in g):

58, 5773 58, 5771 58, 5771 58, 5770 58, 5772 58, 5769

Een meting van hetzelfde blokje op zes verschillende balansen, vlak na elkaar gemeten,
leverde de volgende resultaten op (in g):

58, 5773 58, 5758 58, 5774 58, 5771 58, 5762 58, 5769

Ervan uitgaande dat de massa van het blokje slechts één bepaalde waarde kan hebben, kan
er gespeculeerd worden over de oorzaken van de spreiding in deze meetuitkomsten. Mogelijke
verklaringen zijn onder andere:

– temperatuurfluctuaties (geeft verschillen in de opwaartse druk van de lucht op het


blokje);
– luchtcirculatie in de balansen;
– verontreiniging van het blokje door bijvoorbeeld aanraken met vette vingers;
– verschillende afstelling van de balansen (bijvoorbeeld van het nulpunt);
– variatie in de elektronica van de balansen (veroorzaakt ruis, stroomverschillen);
– gebruik van een elektronische of mechanische balans.

Merk op dat wanneer er een ruwere meting van deze massa had plaatsgevonden, er wel steeds
dezelfde waarde was gemeten: alle meetwaarden zouden dan bijvoorbeeld 58,58 g geweest
zijn. De volgende stelling wordt geponeerd:

Als er bij herhaaldelijk meten van een continue grootheid dezelfde


uitkomst wordt gevonden, is er waarschijnlijk te grof gemeten!

Met gebruik van deze stelling kan nu opgemerkt worden dat het nooit mogelijk is om de
preciese waarde van een continue grootheid vast te stellen: vanuit de klassieke fysica zijn alle
continue grootheden exact gedefinieerd en heeft de ‘echte’ massa van het blokje dus oneindig

5
6 HOOFDSTUK 1 – SPREIDING

veel decimalen. In het voorbeeld zijn de cijfers 58, 57 als ‘zeker’ te beschouwen, omdat zij bij
alle metingen gelijk zijn. Echter, de daaropvolgende decimalen zijn onzeker: waarschijnlijk is
het 5e cijfer een 7, maar misschien ook wel een 6. Vanaf het 6e cijfer is er niets zekers meer
over de getalwaarde te zeggen.

Opgave 1.1 De temperatuur van kokend water werd door een tiental studenten geme-
ten in het kader van een experiment over kookpuntsverhoging. Ze gebruikten daarvoor
tien thermometers van eenzelfde type. De meetuitkomsten, gesorteerd op toenemende
temperatuur (in ◦C), blijken te variëren:

99, 6 99, 8 100, 0 100, 1 100, 1 100, 2 100, 4 100, 5 100, 6 100, 7

Noem oorzaken voor het feit dat de studenten niet allemaal dezelfde meetuitkomst vonden
en waarom de meetuitkomsten van 100, 0 ◦C afwijken.

Opgave 1.2 In een elektrolyseproef werd de constante van Faraday bepaald (de lading
van een mol elektronen). Hiertoe werd de lading (= stroomsterkte × tijdsduur) die nodig
is om een bepaalde hoeveelheid zilver neer te slaan bepaald. Vijf studenten (A t/m E)
vonden de volgende meetuitkomsten (in C mol−1 ):

A: 99310 100490 98220


B: 96634 97522 97423
C: 92794 97730 95851
D: 96147 96642 96343
E: 98815 98043 88084

Geef een aantal mogelijke oorzaken van de spreiding in deze meetuitkomsten.

1.2 Meting aan een verzameling voorwerpen of stoffen

Als een bepaalde eigenschap van een verzameling voorwerpen of stoffen gemeten wordt, dan
treedt er nog een extra spreiding op in de meetuitkomsten ten gevolge van verschillen in de
individuen.

Voorbeeld 1.2 Er werd een meting gedaan naar de druppelgrootte van een serie buretten
(A t/m E) van hetzelfde type. Voor iedere meting werden 100 druppels geteld en daarvan
werd het volume afgelezen. De grootte van één druppel wordt gesteld op 1/100 keer dit
volume. Een aantal van de meetwaarden (in 10−2 mL) zijn:

A: 4, 30 4, 17 4, 03 4, 18 4, 21 4, 16 4, 15 4, 34 (gem. 4, 19)
B: 4, 31 4, 40 4, 17 4, 24 4, 35 4, 28 4, 37 4, 48 (gem. 4, 33)
C: 4, 21 4, 05 4, 04 4, 17 4, 20 4, 13 4, 17 4, 27 (gem. 4, 16)
D: 4, 11 4, 19 4, 30 4, 12 4, 30 4, 25 4, 22 4, 24 (gem. 4, 22)
E: 4, 08 4, 15 4, 19 4, 18 3, 95 4, 00 4, 02 4, 15 (gem. 4, 09)

Voor de spreiding binnen de meetwaarden van één buret zijn onder andere de volgende ver-
klaringen mogelijk:

– buretstanden moeten tussen twee schaalstreepjes geschat worden;


– misschien zijn er af en toe 99 of 101 druppels geteld;
– snel of langzaam druppelen heeft wellicht invloed;
– er blijft misschien af en toe een halve druppel aan de kraan hangen.
1.3. HET WEERGEVEN VAN SPREIDING 7

Voor de spreiding binnen de gemiddelde meetwaarden van meerdere buretten zijn onder andere
de volgende verklaringen mogelijk:

– iedere buretkraan is net iets anders, hetgeen invloed kan hebben op de druppelgrootte;
– er kunnen vet- of stofdeeltjes in één of meerdere kranen hebben gezeten;
– verschillen in de schaalverdelingen van de buretten.

Concluderend kan gezegd worden dat spreiding in meetuitkomsten niet te vermijden is en dat
er vaak veel oorzaken zijn voor spreiding en dat deze vaak niet allemaal te achterhalen zijn.

1.3 Het weergeven van spreiding

Een eenvoudige manier om een compleet beeld te krijgen van de spreiding in een verzamel-
ing meetuitkomsten is om simpelweg alle meetuitkomsten weer te geven in opklimmende of
afdalende volgorde.

Voorbeeld 1.3 Een weergave van alle meetuitkomsten uit Voorbeeld 1.1 in opklimmende
volgorde (in g):

58, 5758 58, 5762 58, 5769 58, 5769 58, 5770 58, 5771
58, 5771 58, 5771 58, 5772 58, 5773 58, 5773 58, 5774

Een nadeel van deze methode is dat het bij een grote verzameling veel ruimte kost om alle
waarden op te schrijven en dat het totaaloverzicht dan moeilijk te zien is. Eveneens gaat bij
het sorteren de meetvolgorde verloren.

Minder compleet, maar wel illustratief, is het vermelden van de laagste en de hoogste waarde
in een verzameling. Ook is het mogelijk om alleen het verschil tussen die twee waarden, de
zogenaamde spreidingsbreedte (Engels: range) te geven:

w = xmax − xmin (1.1)

In het geval van Voorbeeld 1.3 zou de spreidingsbreedte w = 58, 5774 − 58, 5758 = 0, 0016 g
zijn.

Een overzichtelijkere manier om meetgegevens weer te geven is door een grafische voorstelling
te maken. Er kan bijvoorbeeld een staafdiagram gemaakt worden waarin iedere meetuitkomst
een staafje krijgt met een lengte overeenkomstig de waarde (zie Figuur 1.1). Voor een kleine
verzameling meetuitkomsten is dit goed te doen, maar voor een grote verzameling wordt
vaak een histogram gebruikt. Een histogram is in wezen ook een staafdiagram, maar de
meetwaarden zijn ingedeeld in kleinere groepen (klassen) en iedere klasse krijgt een staafje
overeenkomstig het aantal meetwaarden in de klasse.
Voor het maken van een histogram zijn officiële richtlijnen (zie Hoofdstuk 7).
8 HOOFDSTUK 1 – SPREIDING

100000

80000

60000

40000

20000

x
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Figuur 1.1. Een staafdiagram met de resultaten van de meting van de constante
van Faraday uit Opgave 1.2

Twee statistische kenmerken voor de spreiding, zijn de variantie en de standaarddeviatie.


Om deze te berekenen moet eerst het rekenkundig gemiddelde van een verzameling van n
meetwaarden berekend worden door te sommeren over alle meetwaarden en te delen door het
aantal meetwaarden:
n
1X
x̄ = xi (1.2)
n
i=1

Hierna kan de variantie s2 berekend worden:


n
1 X
s2 = (xi − x̄)2 (1.3)
n−1
i=1

De standaarddeviatie s is de wortel uit de variantie:


v
u n
u 1 X
s= t (xi − x̄)2 (1.4)
n−1
i=1

Het is vooral voor het automatiseren van het berekenen van de variantie handig om de
volgende geheel equivalente uitdrukking te gebruiken:
 !2 
n n
1 X 1 X
s2 =  xi 2 − xi  (1.5)
n−1 n
i=1 i=1

N.B. Het kan lastig zijn om ‘gevoel’ te krijgen voor de betekenis van de standaarddeviatie
als statistische maat voor de spreiding. De volgende vuistregel kan hierbij helpen:

Als het aantal metingen voldoende groot is (n > 20) en als de meetuit-
komsten bij benadering normaal verdeeld zijn, dan ligt ongeveer 2/3
deel van de meetuitkomsten in het gebied x̄ ± s.

Over de normale verdeling meer in §7.3.2.

Opgave 1.3 Bewijs de equivalentie van (1.3) en (1.5)


1.4. DE TERM ‘FOUT’ 9

Voorbeeld 1.4 Voor Buret 1 uit Voorbeeld 1.2 kunnen de genoemde statistische ken-
merken berekend worden. Het is handig om hier een tabel voor op te stellen:

i xi xi − x̄ (xi − x̄)2 xi 2
1 4, 30 0, 11 0, 0116 18, 5
2 4, 17 −0, 02 0, 0005 17, 4
3 4, 03 −0, 16 0, 0264 16, 2
4 4, 18 −0, 01 0, 0002 17, 5
5 4, 21 0, 02 0, 0003 17, 7
6 4, 16 −0, 03 0, 0011 17, 3
7 4, 15 −0, 04 0, 0018 17, 2
8 4, 34 0, 15 0, 0218 18, 8
Som 33, 54 0, 00 0, 0596 71, 3

Om de waarden uit de derde kolom te berekenen moet eerst het gemiddelde berekend
worden (1.2): x̄ = 33, 54/8 = 4, 19.
2
Hierna kan de variantie berekend worden √ met (1.3): s = 0, 0596/(8 − 1) = 0, 0085.
De standaarddeviatie is dan (1.4): s = 0, 0085 = 0, 092.
Wanneer de alternatieve manier (1.5) gebruikt wordt om de variantie te berekenen volgt:
71,3 33,542
s2 = 8−1 − (8−1)·8 = 0, 0085.
Het intypen van de meetuitkomsten op een rekenmachine met statistische mogelijkheden
levert (Casio fx -550): n = 10, Σx = 33, 54, Σx2 = 71, 3, x̄ = 4, 19, σn−1 = 0, 596. Let op
dat er op een rekenmachine ook vaak de mogelijkheid is tot het uitrekenen van σn . Dit
geeft een andere waarde voor de standaardeviatie. Hier wordt later meer over verteld.

Opgave 1.4
a) Bereken het gemiddelde, de variantie en de standaarddeviatie voor de meting van de
massa van het messingblokje uit Voorbeeld 1.1. Neem daarbij de meetuitkomsten
die met de verschillende balansen verkregen zijn.
b) Voer dezelfde berekeningen uit in MS Excel met behulp van de functies AVERAGE,
VAR en STDEV.

1.4 De term ‘fout’

In de chemie wordt in plaats van de term ‘standaarddeviatie’ ook vaak gesproken over de
‘fout’, ‘toevallige fout’ of ‘onnauwkeurigheid’. Omdat deze termen ook in het dagelijkse
taalgebruik voorkomen, geven ze nogal eens aanleiding tot verwarring.

In het kader van de statistische bewerking van meetuitkomsten wordt


de term ‘fout’ uitdrukkelijk niet gebruikt om een ‘blunder’ of ‘persoon-
lijke fout’ aan te geven.

In het Engels is er minder verwarring, omdat er daar aparte woorden voor zijn: ‘error ’ voor
een statistische fout en ‘mistake’ voor een persoonlijke fout.
Als er in het vervolg naar meetresultaten gekeken wordt, moet er altijd van worden uitgegaan
dat de meting op een correcte wijze is uitgevoerd, tenzij anders vermeld is. Alle afwijkin-
gen ten gevolge van geknoei, onervarenheid, onoplettendheid en niet te achterhalen vreemde
uitschieters in de meetuitkomsten moeten in statistische beschouwingen buiten beschouwing
gelaten worden. Het noemen van onjuist of ondoordacht handelen, verkeerd aflezen, reken-
fouten en dergelijke oorzaken hoort in een statistische foutendiscussie beslist niet thuis! In
een laboratoriumjournaal kan dit wel worden vermeld, omdat van dit soort fouten vaak een
groot leereffect uitgaat.
10 HOOFDSTUK 1 – SPREIDING

1.5 Uitschieters

De aanwezigheid van spreiding in meetuitkomsten is een zeer normale zaak. De oorzaak ligt
in oncontroleerbare fluctuaties in de meetapparatuur, de meetomstandigheden, de monsters
of de waarnemer. Dat wil zeggen dat er gewoonlijk een relatief kleine schommeling is rond de
gemiddelde waarde. Het komt echter toch af en toe voor dat een meetuitkomst onverwacht
en onverklaarbaar veel afwijkt van de overige meetuitkomsten. In een dergelijk geval wordt
er gesproken van een uitschieter (Engels: outlier ).
Een uitschieter wordt over het algemeen uit de reeks metingen geschrapt. Eerst wordt echter
zorgvuldig nagegaan of de meetuitkomst te ‘herstellen’ is: is de oorzaak van de afwijking te
achterhalen en de meetuitkomst te corrigeren? Metingen zijn gewoonlijk namelijk kostbaar
in tijd en/of geld.
Er zijn uiteraard grensgevallen waarbij er twijfel is of er sprake is van een uitschieter of niet.
Een objectief rekenkundig criterium is daarvoor nodig in de vorm van een uitschietertoets,
bijvoorbeeld de Q-toets van Dixon. Deze wordt behandeld in de paragraaf over toetsen (§9.8).
Gewoonlijk is echter ‘gezond verstand’ voldoende.

Voorbeeld 1.5 Titratie-uitkomsten voor één monster, onder zoveel mogelijk identieke
omstandigheden verkregen (in mL NaOH-oplossing):

23, 12 23, 15 23, 13 23, 10 23, 13 22, 78 23, 11

Op het eerste gezicht is het al duidelijk dat de op een na laatste meting een uitschieter is
(naar beneden). Deze meetuitkomst wordt dus weggelaten in de berekeningen (maar hij
wordt wel genoteerd in het labjournaal!).

1.6 Standaarddeviatie in het gemiddelde

Volledigheidshalve wordt hier alvast de in §8.2 afgeleide uitdrukking voor de standaarddevia-


tie in het gemiddelde van n metingen vermeld:
s
sg = √ (1.6)
n

Deze waarde wordt in eindresultaten vaak vermeld, vermoedelijk vanwege het flatterende feit

dat ze een factor n kleiner is dan de waarde van s zelf. De factor √sn wordt ook gebruikt
bij het berekenen van een betrouwbaarheidsinterval, zie (9.1).
De numerieke uitkomst voor sg wordt ook gebruikt bij het bepalen van het juiste aantal te
vermelden decimalen van het eindresultaat van een meting. Zie §4.2.

1.7 Minimaliseren van de spreiding

Een serie meetuitkomsten wordt beter genoemd dan een andere serie als de spreiding signi-
ficant kleiner is. De spreiding wordt daarbij gekwantificeerd door middel van de berekende
standaarddeviatie s.
Bij de vergelijking van de spreidingen van twee meetseries kan echter niet zonder meer gecon-
cludeerd worden dat meetserie 1 beter is dan meetserie 2 als s1 < s2 . Het verschil tussen de
twee standaarddeviaties moet ook nog significant zijn. Hiervoor kan de F-toets uitgevoerd
worden. Zie Hoofdstuk 9 over het toetsen van significantie.
1.8. DE VARIATIECOËFFICIËNT 11

1.8 De variatiecoëfficiënt

Als maat voor de spreiding wordt ook wel de variatiecoëfficiënt gebruikt. Dat is de pro-
centuele standaarddeviatie, gerekend als percentage van het gemiddelde:
s
cv = · 100% (1.7)

Voorbeeld 1.6 Van een serie watermonsters werd de pH opgemeten. De verschillende


statistische parameters kunnen bepaald worden aan de hand van de metingen:

i xi xi − x̄ (xi − x̄)2
1 7, 08 −0, 05 0, 0025
2 7, 21 0, 08 0, 0064
3 7, 12 −0, 01 0, 0001
4 7, 09 −0, 04 0, 0016
5 7, 16 0, 03 0, 0009
6 7, 14 0, 01 0, 0001
7 7, 07 −0, 06 0, 0036
8 7, 14 0, 01 0, 0001
9 7, 18 0, 05 0, 0025
10 7, 11 −0, 02 0, 0004
Som 71, 30 0, 00 0, 0182

Gemiddelde m.b.v. (1.2): x̄ = 71, 30/10 p = 7, 13


Standaarddeviatie m.b.v. (1.4): s = 0, 0182/9 = 0, 045%
Variatiecoëfficiënt m.b.v. (1.7): cv = (0, 045/7, 13) · 100% = 0, 63%

Standaarddeviatie in het gemiddelde m.b.v. (1.6): sg = 0, 045/ 10 = 0, 014

Opgave 1.5
a) Bepaal voor de 15 meetuitkomsten uit Opgave 1.2 het gemiddelde, de standaard-
deviatie, de variatiecoëfficiënt en de standaarddeviatie in het gemiddelde. Gebruik
de standaardfuncties AVERAGE, VAR en STDEV van MS Excel en de formules (1.6) en
(1.7).
b) Maak gebruik van de optie ‘Descriptive Statistics’ uit het pakket ‘Data Analysis’ in
MS Excel om dezelfde parameters te bepalen. Bekijk de output kritisch en vergelijk
deze met de zojuist verkregen resultaten.

Merk op dat de variatiecoëfficiënt onbepaald wordt als het gemiddelde nul of heel klein is. In
de fysica en de chemie wordt deze maat dan ook vrijwel niet gebruikt, wel in de econometrie.
12 HOOFDSTUK 1 – SPREIDING
Hoofdstuk 2

Meetuitkomsten

2.1 De ‘ware waarde’

Bij het uitvoeren van een meting is het vaak interessant om een zo juist mogelijke waarde
van de gemeten grootheid te krijgen. Wanneer bijvoorbeeld naar het aantal inwoners van een
gemeente gevraagd wordt, kan dit aantal in principe op een bepaald moment exact worden
vastgesteld (hoewel dit in de praktijk vaak lastig is). Over het algemeen wordt een bepaalde
onnauwkeurigheid in een dergelijke discrete grootheid ook geaccepteerd, maar het is vaak
mogelijk om de meetuitkomst exact weer te geven. In zulke gevallen is er weinig plaats meer
voor statistiek.
Als telling van alle individuen niet mogelijk is, worden steekproeven genomen of schattingen
gedaan. Hierbij wordt het weer nodig om statistiek toe te passen.

In de chemie is het zelden zo dat een gemeten grootheid telbaar is. Gewoonlijk wordt geme-
ten aan continue grootheden, waarvan de uitkomsten dus in principe weergegeven zouden
moeten worden met een zeer groot, misschien wel oneindig, aantal decimalen. Een dergelijke
ideale meetuitkomst met een oneindig aantal decimalen wordt de ware waarde genoemd.
Dit is een volkomen theoretisch begrip: de ware waarde kan nooit gemeten worden. Daarom
moet toevlucht worden gezocht in een ‘zeer nauwkeurige’ waarde: de beste waarde die op een
zeker moment met de meest geavanceerde methode en apparatuur verkregen kan worden.
Zo is bijvoorbeeld de huidige waarde van de constante van Faraday (de lading van een mol elec-
tronen) met een maximale nauwkeurigheid bepaald op 9, 648456 · 104 C mol−1 . In berekenin-
gen van de titer bij een coulometrische titratie kan deze waarde prima gebruikt worden, terwijl
het voor het berekenen van de elementaire lading van een electron nog te onnauwkeurig zou
kunnen zijn.

Naast het begrip ‘ware waarde’ staat het begrip ‘gezochte waarde’: een meetuitkomst die zo
nauwkeurig is dat ze geschikt is om te gebruiken in een gegeven situatie. Het hangt van de
situatie af of een waarde te nauwkeurig of te onnauwkeurig is.

Voorbeeld 2.1 De afstand Utrecht CS - Uithof bedraagt 7 km, wat voor een berekening
van de fietsduur goed genoeg is. De afstand Utrecht CS (uitgang stad) - Uithof (bushalte
Heidelberglaan) bedraagt 6, 85 km, wat in de berekening van de kosten van een raillijn
goed genoeg is. In beide gevallen gaat het om dezelfde afstand, maar de nauwkeurigheid
van de ‘gezochte waarde’ is verschillend.

13
14 HOOFDSTUK 2 – MEETUITKOMSTEN

2.2 Gemiddelden

Het resultaat van een meetprocedure is gewoonlijk een serie meetuitkomsten: x1 , x2 , . . . , xn .


Ervan uitgaande dat ieder van deze meetuitkomsten met dezelfde zorg verkregen is, zijn ze
allemaal even waardevol. Zoals eerder genoemd is, zullen er altijd fluctuaties in de meetuit-
komsten zijn, waardoor iedere meetuitkomst een benadering van de ‘ware waarde’ is.
Het volgende axioma gaat hierover:

Het gemiddelde van een serie meetuitkomsten levert in het algemeen


een betere benadering van de ‘ware waarde‘. De ‘ware waarde’ wordt
beter benaderd naarmate het aantal meetuitkomsten toeneemt.

Het is in een meetserie best mogelijk dat een zekere meetuitkomst ‘toevallig‘ dichter bij de
ware waarde ligt dan het gemiddelde van de meetuitkomsten. Dit kan echter nooit zeker
geweten worden, omdat de ware waarde vooraf (meestal) onbekend is.

Er zijn meerdere methoden om de zogehete centrale tendentie, het ‘midden‘, van een serie
meetuitkomsten te bepalen.

– Het rekenkundig gemiddelde wordt gegeven door de som van de meetuitkomsten,


gedeeld door het aantal meetuitkomsten:
n
1X
x̄ = xi (2.1)
n
i=1

Dit gemiddelde wordt gebruikt in vrijwel alle statistiek zoals die voorkomt in de chemie.
Dit gemiddelde is veelal bekend als ‘hét gemiddelde’.
– Het meetkundig gemiddelde wordt gegeven door de n-de machtswortel uit het pro-
duct van alle n meetuitkomsten:
v
u n
uY
M= t n
xi (2.2)
i=1

– Het harmonisch gemiddelde H wordt gegeven door:


n
1 1X 1
= (2.3)
H n xi
i=1

– De modus is de meestvoorkomende waarde in een serie meetuitkomsten. Soms worden


meetuitkomsten eerst gegeroepeerd in klassen voordat de modale klasse bepaald wordt.
De modus wordt onder andere gehanteerd in de economie (modale werknemer, modaal
inkomen, etc.).
– De mediaan is de middelste waarde in een serie meetuitkomsten wanneer deze op-
klimmend of afdalend zijn gesorteerd. Bij een even aantal metingen is de mediaan de
helft van de som van de middelste twee. De mediaan wordt onder andere gebruikt in
bevolkingsstatistieken (mediane studieduur, mediane levensverwachting, etc.).

Let op! Het rekenkundig gemiddelde is erg gevoelig voor uitschieters. Mediaan en modus
zijn dat niet!
2.3. POPULATIE EN STEEKPROEF 15

Opgave 2.1 Er werd een steekproef uitgevoerd onder 101 studenten naar hun geschatte
jaarinkomens. De resultaten waren als volgt (in A
C/jaar):

3500 (2×) 4000 (4×) 4500 (10×) 5000 (24×) 5500 (20×) 6000 (12×)
6500 (10×) 7000 (8×) 7500 (5×) 8000 (4×) 10000 (2×)

a) Bepaal het rekenkundig gemiddelde, het meetkundig gemiddelde, het harmonisch


gemiddelde, de modus en de mediaan van de inkomens. Gebruik van MS Excel de
functies AVERAGE, GEOMEAN, HARMEAN, MODE en MEDIAN.

2.3 Populatie en steekproef

Over het algemeen kan het aantal metingen bij een meetprocedure zelf gekozen worden. Prak-
tische begrenzingen komen daarbij voort uit de beschikbare middelen en tijd. Bij chemische
analyses speelt de beperkte hoeveelheid van een beschikbaar monster vaak een grote rol.
Eerder werd gezegd dat het gemiddelde van een groter aantal metingen een betere benadering
vormde van de ware waarde. In het limietgeval van oneindig veel metingen zal het gemiddelde
de ware waarde bereiken. Anders gezegd, bij oneindig veel metingen nadert het gemiddelde
tot de zogenoemde meetverwachting µ. Oftewel, als n → ∞ dan x̄ → µ.
Er kunnen nu twee begrippen gedefinieerd worden:

– De populatie wordt gevormd door de verzameling van alle mogelijke meetuitkomsten.


Vaak is deze verzameling oneindig groot, omdat veel soorten metingen in principe einde-
loos kunnen worden herhaald. Het gemiddelde van een populatie is de meetverwachting
µ, ofwel het populatiegemiddelde;
– De steekproef is een deelverzameling van n meetuitkomsten uit de populatie. Een
goede steekproef geeft een zo goed mogelijk beeld van de gehele populatie, maar dit is
lang niet altijd mogelijk. De x̄ is het rekenkundig gemiddelde van de uitkomsten van
de steekproef, het steekproefgemiddelde.

2.4 Systematische afwijkingen

Opgemerkt kan worden dat de meetverwachting gelijk is aan de ware waarde xw , als er ten-
minste geen sprake is van ‘systematische afwijkingen’ (ook wel systematische fouten) genoemd
worden. In feite wordt een systematische afwijking δ gedefinieerd als het verschil tussen
de meetverwachting µ en de ware waarde xw :

δ = µ − xw (2.4)

Systematische afwijkingen zijn afwijkingen van de ware waarde, onafhankelijk van het aantal
metingen dat gedaan wordt. Ze zijn niet onderhevig aan oncontroleerbare fluctuaties, maar
ontstaan op een voorspelbare en/of verklaarbare wijze. Ze kunnen vele oorzaken hebben.
Gewoonlijk worden systematische fouten ontdekt als dezelfde grootheid meerdere malen geme-
ten wordt op verschillende manieren en er een te groot verschil in de gemiddelde meetuitkomst
is. Het zoeken naar de oorzaken kan uiterst moeizaam zijn.
Een aantal veelvoorkomende oorzaken zal nader bekeken worden.
16 HOOFDSTUK 2 – MEETUITKOMSTEN

Apparatuurafwijkingen
Door kleine onnauwkeurigheden in de gebruikte apparatuur kunnen afwijkingen ontstaan.
Voorbeelden:

– Een analoge stopwatch kan een te strakke veer hebben, waardoor deze te snel loopt.
Tijdsmetingen zullen altijd een te grote waarde opleveren;
– Een multimeter kan bij het meten van de stroomsterkte niet nul aangeven als er geen
stroom loopt. Dit is een zogenaamde ‘nulpuntsfout’;
– Met een lineaal kan een lengte van 1, 00 cm opgemeten worden, terwijl de maatstreepjes
in werkelijkheid 1, 02 cm van elkaar af staan. Er is sprake van een ‘schaalfout’;
– Een volpipet van 10 mL levert bij correct gebruik slechts 9, 95 mL vloeistof af. Ook
hier kan sprake zijn van een schaalfout.

Veel van deze apparatuurafwijkingen zijn te controleren met behulp van een zogenaamde
ijkprocedure. Daarbij wordt de meetuitkomst van het betreffende apparaat of instrument
vergeleken met de meetuitkomst van een veel nauwkeuriger apparaat, of met de meetuitkomst
van een nauwkeurigere andere procedure. Daarna kan de eigen meetuitkomst zonodig gecor-
rigeerd worden door bijvoorbeeld het optellen van of het vermenigvuldigen met een con-
stante.

Voorbeeld 2.2 Het volume vloeistof dat uit een volpipet stroomt, wordt geijkt door
zuiver water te nemen en het uitgestroomde water zeer nauwkeurig te wegen met behulp
van een analytische balans. Rekening houdend met de temperatuur en met behulp van
de voor zuiver water zeer nauwkeurig bekende dichtheid ρ, wordt uit de gemeten massa
m het uitgestroomde volume V berekend door V = m/ρ. Dit volume wordt vergeleken
met het op de pipet vermelde volume om de systematische fout te bepalen.

Methode-afwijkingen
Hiertoe worden onder andere verwaarlozingen en andere modelveronderstellingen gerekend.
Enkele voorbeelden:

– Bij het toepassen van de ideale gaswet in een realistische situatie kan de berekende
gasdruk heel goed anders zijn dan op deze wijze uit het volume, de temperatuur en de
hoeveelheid stof berekend is;
– Bij de titratie van een sterk zuur met een sterke base wordt fenolftaleı̈ne als indicator
gebruikt. Echter, de kleuromslag vindt niet bij pH = 7 plaats maar bij ca. 8, 5, dus
steeds iets te laat;
– In een calorimetrieproef wordt de temperatuurafhankelijkheid van de verdampings-
warmte van een vloeistof verwaarloosd. In werkelijkheid varieert die enige procenten
over een meetgebied van 100 ◦C;
– De trillingen van een molecuul waarmee een vibratiespectrum berekend kan worden, zijn
niet precies harmonisch. Daardoor ontstaan er kleine afwijkingen tussen de berekende
en de gemeten frequenties;
– Voor water is de dissociatie-evenwichtsconstante Kw = 1, 00 · 10−14 bij 25 ◦C. Bij 20 ◦C
is de pKw = 14, 15; bij 15 ◦C is deze 14, 35!

Veel van deze afwijkingen zijn te corrigeren door betere (gewoonlijk meer gecompliceerde)
modellen in te voeren voor de beschrijving van de gemeten eigenschappen.
2.5. PERSOONLIJKE FOUTEN 17

Afwijkingen ten gevolge van de waarnemer


Ook door de wijze van handelen van de waarnemer kunnen systematische afwijkingen tussen
meetverwachting en ware waarde veroorzaakt worden. Voorbeelden:

– Een gedeeltelijk kleurenblinde ziet een indicatoromslag steeds te laat;


– Een kleuromslag kan pas gezien worden als de reactie al verder gevorderd is;
– Een traag persoon reageert steeds wat (meer) te laat bij het indrukken van een stop-
watch.

Oplossingen voor het minimaliseren van dit soort afwijkingen zijn bijvoorbeeld te bereiken
door automatisering.

Samengevat kunnen systematische afwijkingen opgespoord en gecorrigeerd worden door:

– Meten met onafhankelijke, nauwkeuriger methoden en apparatuur;


– Nameten van reeds nauwkeurig bekende grootheden;
– Elimineren van de afhankelijkheid van een menselijke waarnemer;
– Uitvoeren van blanco proeven.

Een blanco bepaling is in de analytische chemie een bepaling die wordt verricht precies
zoals en zoveel mogelijk gelijktijdig met de werkelijke bepaling, maar onder weglating van de
te bepalen stof. Een dergelijke bepaling wordt gedaan met toevoeging van alle reagentia in
dezelfde hoeveelheden en in dezelfde volgorde als bij de werkelijke bepaling. Er moet dan
‘nul’ (= blanco) uitkomen. Zonodig kan achteraf gecorrigeerd worden, bijvoorbeeld door het
nulpunt van het aanwijsapparaat bij te stellen.

2.5 Persoonlijke fouten

Meetuitkomsten kunnen ook nadelig beı̈nvloed worden door persoonlijke fouten van de waar-
nemer. Hieronder behoren een hele serie vermijdbare handelingen, zoals:

– Geknoei, verwisseling van monsters, vergissingen, afwijken van procedures, etc.;


– Niet uitvoeren van noodzakelijke controles of ijkprocedures;
– Toepassen van verkeerde modellen of veronderstellingen;
– Rekenfouten (factoren 2 tot 10, verkeerd afronden, verkeerd intikken, teveel afkappen).

Al deze zaken zijn te vermijden door oefening en door zorgvuldig en gedisciplineerd gedrag.
Het consequent en goed bijhouden van een labjournaal draagt hiertoe in belangrijke mate bij.
In foutendiscussies horen beschouwingen over deze persoonlijke fouten slechts op een uiterst
summiere wijze een plaats te krijgen.
Metingen die onder deze factoren geleden hebben, horen overgedaan te worden!
18 HOOFDSTUK 2 – MEETUITKOMSTEN

2.6 Nog een paar termen

In Engelstalige leerboeken komen nog een aantal termen voor:

– ‘Accuracy’, gerelateerd aan ‘correctness’. Het karakteriseert het verschil tussen de


beste meetuitkomst en de ware waarde. Voor de beste meetuitkomst moet eigenlijk
de meetverwachting worden genomen, maar in de praktijk wordt het gemiddelde van
een voldoende groot aantal meetuitkomsten gebruikt. De Nederlandse term is ‘juist-
heid’, dus een term die verband houdt met de systematische afwijking.
– ‘Precision’, gerelateerd aan ‘reproducability’. Die wordt gerepresenteerd door de stan-
daarddeviatie; het is dus een term voor de toevallige fout. De Nederlandse term is
‘precisie’.
Hoofdstuk 3

Nauwkeurigheid van
meetapparatuur

3.1 Algemene opmerkingen

Bij het meten van grootheden wordt vaak gebruik gemaakt van meetapparatuur. Daaronder
worden in dit verband niet alleen apparaten verstaan met min of meer grote kasten eromheen
en knoppen eraan, maar ook allerlei eenvoudige instrumenten als pipetten, stopwatches, ther-
mometers en dergelijke. Apparatuur maakt het mogelijk om waarnemingen te doen die min
of meer onafhankelijk zijn van de zintuiglijke beperkingen van de persoon die de metingen
uitvoert. Er zijn ook tal van grootheden (bijvoorbeeld elektrische) die anders niet gemeten
zouden kunnen worden.
Voorwaarde voor goede metingen, is het correcte gebruik van de apparatuur en kennis van de
beperkingen van het apparaat. Hiervoor bestaan er gebruiksaanwijzingen of procedures die
meestal in handleidingen vermeld staan. Het lezen van deze handleidingen is vaak niet zeer
boeiend, terwijl veel handleidingen slecht geschreven en/of onvolledig of juist te gedetailleerd
zijn.
Helaas moet worden opgemerkt dat tegen de gebruiksprocedures uit laksheid of onwetendheid
veel gezondigd wordt, met nadelige gevolgen voor de kwaliteit van de meetuitkomsten. De
door de fabrikanten vermelde prestaties van een apparaat zijn gewoonlijk slechts
te verkrijgen onder optimale meetomstandigheden!

Voorbeeld 3.1 Als met een volpipet van 10 mL met de daarop vermelde onnauwkeurig-
heid van slechts 0, 02 mL moet worden gepipetteerd, dan moeten de voorschriften omtrent
ontvetten, spoelen, afvegen, uitstroomhoek, uitstroomtijd en temperatuur strikt gevolgd
worden.
Het wegen met een analytische balans op 0, 1 mg vereist trillingsvrije plaatsing in een
tochtvrije omgeving met een constante (binnen 1 ◦C) temperatuur, terwijl het te wegen
voorwerp niet met de handen gehanteerd mag worden.

Bij veel metingen wordt de te bepalen grootheid zeer indirect gemeten. Een goed voorbeeld
daarvan is de pH-meting, waarbij een gecompliceerde elektrochemische cel en een elektronis-
che mV-meter worden gehanteerd (zie verder in §3.2). Een ander voorbeeld is het meten van
het equivalent geleidingsvermogen van een oplossing:

Voorbeeld 3.2 Met behulp van een brugschakeling die in een conductometer is inge-
bouwd en een stroommeter, wordt de weerstand R van de oplossing bepaald die zich in
een meetcel bevindt. De kwaliteit van de meter en de ingebouwde referentieweerstanden
moeten zeer hoog zijn om de weerstand R op 0, 3% te kunnen meten.

19
20 HOOFDSTUK 3 – NAUWKEURIGHEID VAN MEETAPPARATUUR

De meetcel bevat twee platina elektroden op vaste afstand van elkaar. Om de weerstand
van de oplossing tussen de elektroden nauwkeurig te meten, moeten deze vetvrij zijn en
mogen er geen fijne luchtbelletjes aan het oppervlak aanwezig zijn. De temperatuur moet
constant zijn, want R varieert ongeveer 2% per graad.

Bij het gebruik van apparatuur zijn de volgende twee aspecten altijd van belang:

3.1.1 De grootte van de systematische afwijking δ

Hoe vaak er ook gemeten wordt, er blijft een verschil tussen de meetverwachting µ en de
‘ware waarde’ xw . Dat kan liggen aan de meetprincipes of aan beperkingen van onderdelen
van de apparatuur.
In een goede handleiding wordt de grootte van deze afwijking vermeld, meestal met ‘beter
dan’ of ‘kleiner dan’ een bepaalde waarde, omdat deze niet voor ieder apparaat afzonderlijk
door de fabrikant kan worden vastgesteld.
De gehanteerde termen zijn o.a. ‘accuracy’, ‘tolerantie’ en ‘juistheid’. Zie ook §2.6.
De waarde van δ wordt bepaald door ijken, d.w.z. door vergelijken met een veel nauwkeuriger
apparaat of procedure.

Voorbeeld 3.3 De systematische afwijking van de golflengteschaal van een spectrofo-


tometer voor het zichtbare gebied (400 − 700 nm) wordt gecontroleerd door het spectrum
van bijvoorbeeld een erbiumnitraatoplossing op te meten. Daarbij moeten er scherpe
absorptiepieken optreden bij (in nm):

364, 0 379, 4 487, 1 523, 0 652, 5

Naar L. Holleck, L. Hartinger Angewandte Chemie 67 (1955) 648-651.

Bij het gebruik van apparatuur kunnen o.a. de volgende categoriëen van systematische af-
wijkingen aangegeven worden:

– Nulpuntsfouten (niet nul aangeven als er geen signaal is);


– Schaalfouten (bijvoorbeeld temperatuurverschillen van de kwikdraad bij een thermome-
ter), of een metermaat die in werkelijkheid 1, 004 m lang is;
– Niet-lineariteit van een in principe lineaire schaal (bijvoorbeeld een buretbuis die niet
overal even dik is);
– Onstabiliteit (pH-elektroden zijn daar berucht om);
– Drift, het verlopen van de aanwijzing met de tijd (bijvoorbeeld door opwarmen);
– Diversen, zoals strooilicht bij optische apparatuur, dichtheidsverschillen bij het wegen,
etc.

In alle gevallen kan via ijkprocedures op zijn minst inzicht in de grootte van de betreffende
afwijkingen verkregen worden. In goede handleidingen, en ook in speciale leerboeken (bij-
voorbeeld Findlay of Alkemade (zie §10.4, ref. 1 en 2)) wordt hieraan veel aandacht besteed.
3.2. DE NAUWKEURIGHEID VAN ENIGE LABORATORIUMINSTRUMENTEN 21

Voorbeeld 3.4 Voorbeelden van ijkprocedures


– pH-meter inregelen op de elektrodenkarakteristiek, met buffers van bekende pH;
– Extinctie op een spectrofotometer op nul stellen met een blanco oplossing;
– Spectrofotometerlineariteit verifiëren met kaliumchromaatoplossingen van bekende
concentraties;
– Celconstante bepalen bij conductometrie m.b.v. metingen aan KCl-oplossingen van
bekende concentraties;
– Balans controleren met ijkgewichten;
– Maatkolf ijken door waterinhoud te wegen bij bekende temperatuur.

3.1.2 De grootte van de standaarddeviatie s van de meetuitkomsten

In dit verband wordt vaak van de ‘reproducability’, ‘error’, ‘precision’ of de ‘(meet)fout’


gesproken. De grootte wordt bepaald door het uitvoeren van zeer veel metingen en berekening
van s uit de meetuitkomsten.

Voorbeeld 3.5 De standaarddeviatie s van de aanwijzing van een aantal stroommeters


wordt bijvoorbeeld bepaald door ze in serie te schakelen en s te berekenen uit de verkre-
gen meetuitkomsten. Dan wordt de standaarddeviatie voor een stroommeting met een
willekeurig apparaat uit deze verzameling bepaald. De standaarddeviatie voor de stroom-
meting met een bepaald apparaat wordt bepaald door eenzelfde stroom herhaaldelijk met
dat apparaat te meten.
In alle gevallen moet natuurlijk de nulaanwijzing eerst worden gecontroleerd en zonodig
worden bijstellen.

Het geven van de δ en de s in een apparatuurhandleiding komt weinig voor. Dit gebeurt wel
bijvoorbeeld bij de Hitachi 100-60 spectrofotometer, zie §3.2.4.

3.2 De nauwkeurigheid van enige laboratoriuminstrumenten

Hier volgen de specificaties van de nauwkeurigheden van een aantal veel gebruikte laborato-
riuminstrumenten en -apparaten zoals deze in apparaathandleidingen en in normbladen zijn
beschreven.
Veel gebruikte normaalbladen zijn de NEN-bladen (Nederlandse Eenheids Norm, uitgegeven
door het Nederlands Normalisatie Instituut te Delft). Daarnaast bestaan Europese ISO-
normen, Duitse DIN-normen en andere. Enige hiervan worden hier kort samengevat.
22 HOOFDSTUK 3 – NAUWKEURIGHEID VAN MEETAPPARATUUR

3.2.1 Maatglaswerk

Maatglaswerk moet altijd gebruikt worden bij de standaard temperatuur van 20 ◦C. Het
behoort eerst met een ontvettingsmiddel vetvrij te worden gemaakt, en zonodig te worden
gedroogd.

Norm Type glaswerk Maat (mL) Klasse A Klasse B


tolerantie (mL) tolerantie (mL)
NEN 1750 Maatkolf 10 0, 025 0, 050
50 0, 060 0, 120
100 0, 100 0, 200
250 0, 150 0, 300
1000 0, 400 0, 800
NEN 1753 Volpipet 1 0, 007 0, 015
5 0, 015 0, 030
10 0, 020 0, 040
25 0, 030 0, 060
NEN 1754 Meetpipet 1 0, 006 0, 010
2 0, 010 0, 020
5 0, 030 0, 050
10 0, 050 0, 100
NEN 1755 Buret 50 0, 050 0, 100

Met tolerantie wordt meestal een waarde bedoeld die samengesteld is uit een combinatie van
systematische en toevallige fouten. De Fa. Brand hanteert: Tol. ∼
= δ + 2s.
Volgens NEN 1759 is bij maatcylinders hoog model de tolerantie gelijk aan het interval tussen
twee maatstreepjes. Voor bekerglazen met maatstrepen erop bestaan geen NEN-normen.

Opgave 3.1 Bij 20 ◦C werd op 10 manieren een volume water van 10 mL afgemeten
en nagewogen. Het volume van voorwerpen gemaakt van glas kan bij deze temperatuur
berekend worden via volume = 1, 0028 · massa van de inhoud aan water.
De volgende meetuitkomsten werden verkregen (in g):

Nr. Soort Meting 1 Meting 2 Meting 3


1 Bekerglas 50 mL met strepen 10, 90 10, 25 11, 14
2 Maatcylinder 100 mL laag model 9, 60 9, 46 9, 92
3 Maatcylinder 100 mL hoog model 9, 68 9, 56 9, 98
4 Maatcylinder 25 mL 9, 73 9, 76 10, 11
5 Maatcylinder 10 mL laag model 9, 83 10, 03 9, 94
6 Maatcylinder 10 mL hoog model 9, 79 9, 88 9, 89
7 Meetpipet 10 mL klasse A 9, 90 9, 93 10, 00
8 Buret 50 mL klasse A 10, 04 10, 02 10, 02
9 Volpipet 10 mL klasse B 9, 99 9, 98 9, 97
10 Volpipet 10 mL klasse A 10, 01 10, 00 9, 98

a) Ga na in hoeverre de meetuitkomsten overeenkomen met de toleranties uit de boven-


genoemde NEN-bladen.
b) Ga na wat voor elk van de meetwijzen de grootte-orde van de standaarddeviatie van
een meetuitkomst is.
3.2. DE NAUWKEURIGHEID VAN ENIGE LABORATORIUMINSTRUMENTEN 23

3.2.2 Balansen

In het laboratorium worden analytische balansen en laboratorium-bovenwegers voor ruwere


metingen onderscheiden.
Voor de analytische balans A200S van Sartorius gelden onder andere de volgende specificaties:

Weegbereik: 202 g, met aflezing in 0, 1 mg op digitale schaal


Reproduceerbaarheid: < 0, 1 mg
Lineariteitsafwijking: < 0, 2 mg
Meettijd: 3s

De reproduceerbaarheid is de standaarddeviatie van de meetuitkomsten. De lineariteitsaf-


wijking is een afwijking bovenop de systematische afwijking van de echte massa.
Voor de laboratorium-bovenweger 1002 MP9 van Sartorius zijn de specificaties:

Weegbereik: 505 g, met aflezing in 0, 1 g op digitale schaal


Reproduceerbaarheid: < 0, 1 g
Lineariteitsafwijking: < 0, 1 g
Meettijd: 2s

Het is duidelijk dat de analytische balans een meetinstrument is met een verschrikkelijk
hoge nauwkeurigheid: de meetonnauwkeurigheid is slechts van de orde van 1 op 106 , een
nauwkeurigheid die door vrijwel geen ander standaard gebruiksapparaat geëvenaard wordt!

3.2.3 Thermometers

De norm NEN 3128 stelt dat gewone glazen thermometers met kwikvulling op ieder punt
van de schaal niet meer van de ware temperatuur mogen afwijken dan 1 schaaldeel. Dat
geldt ook voor elk temperatuurinterval van niet meer dan 50 ◦C. Het nulpunt moet na 24 uur
verwarmen en 7 uur weer afkoelen, niet meer dan 1 schaaldeel veranderen.
In het algemeen kan dit soort thermometers zonder zeer veel extra werk en voorzorgen ge-
bruikt worden voor temperatuurmetingen op maximaal 0, 1 ◦C nauwkeurig.
Het nulpunt kan gemakkelijk geijkt worden met smeltend ijs; voor het 100 ◦C punt kan kokend
water gebruikt worden, als tenminste rekening wordt gehouden met de heersende luchtdruk
en er uitgekookt water wordt gebruikt.
Er bestaan naast kwikthermometers allerlei andere soorten thermometers, ieder met hun
eigen kwalificaties. Deze kwalificaties zijn te vinden in speciale literatuur (zie §10.4).
Het gebruik van kwikthermometers wordt steeds meer ontraden in verband met de milieu-
problemen die optreden bij breuk. Op de practicumzalen worden sinds 1998 geen
kwikthermometers meer gebruikt.
De nauwkeurigheid van de tegenwoordig veel gebruikte elektronische thermometers kan erg
uiteen lopen, van ca. 1 tot minder dan 0, 0001 graad. Deze thermometers moeten ook zonodig
geijkt worden! Een vuistregel is dat de meetonnauwkeurigheid een paar maal de grootte-orde
van het laatste uitgelezen digit bedraagt.
24 HOOFDSTUK 3 – NAUWKEURIGHEID VAN MEETAPPARATUUR

3.2.4 Spectrofotometers

Als voorbeeld voor de nauwkeurigheid van een spectrofotometer volgen de specificaties van een
goed enkelstraalsinstrument, de Novaspec II van Pharmacia en die van een goed dubbelstraals
scannend routine-apparaat, de Hitachi 100-60.

Novaspec II Pharmacia-LKB
Meetbereik: 325 − 900 nm
Spectrale bandbreedte: 6 nm
Golflengte nauwkeurigheid: 2 nm
Golflengte reproduceerbaarheid: 1 nm
Fotometrische lineariteit: in extinctie: 0, 005 of 0, 5% (grootste)
Fotometrische reproduceerbaarheid: in extinctie: 0, 5%
Drift: minder dan 0, 002 per uur in extinctie,
bij extinctie = 0

Hitachi 100-60
Meetbereik: 190 − 870 nm
Spectrale bandbreedte: 2 nm
Golflengte nauwkeurigheid: 0, 4 nm
Golflengte reproduceerbaarheid: 0, 2 nm
Fotometrische lineariteit: in extinctiegebied 0, 0 − 0, 5: 0, 002
in extinctiegebied 0, 5 − 1, 0: 0, 004
in transmissie: 0, 003 (= 0, 3%)
Fotometrische reproduceerbaarheid: in extinctiegebied 0, 0 − 0, 5: 0, 001
in extinctiegebied 0, 5 − 1, 0: 0, 002
in transmissie: 0, 0015 (= 0, 15%)
Drift: minder dan 0, 0004 per uur in extinctie,
bij extinctie = 0

De nauwkeurigheid is hier de maximale afwijking van de echte golflengte. De reproduceer-


baarheid staat voor de standaarddeviatie. De lineariteit staat voor de grootte van de syste-
matische afwijking.
In dit voorbeeld komt het geweldige prijsverschil (AC2000 tegen A C9000) tussen deze twee
apparaten tot uiting in de meetnauwkeurigheid en de toepassingsmogelijkheden

3.2.5 pH-meting

Voor een pH-meting bestaat de meetopstelling uit een glaselektrode die selectief en gevoelig
is (verandering van ca. 59 mV per pH-eenheid) voor waterstofionen, een referentie-elektrode
waarvan de potentiaal zeer constant is (gewoonlijk een verzadigde calomel-elektrode of een
zilver/zilverchloride elektrode) en een elektronische mV-meter met een zeer hoge inwendige
weerstand. Vaak zijn de referentie-elektrode en de glaselektrode in één omhulsel met twee
contacten tot een combi-elektrode samengevoegd.
Het meetsysteem is de mV-meter samen met de elektrochemische cel:

Ag, AgCl(s) | HCl (0, 1 M) | glasmembraan | meetoplossing k KCl (verz.), Hg2 Cl2 (s) | Hg

Een potentiaalverschil van 0, 1 mV komt overeen met een pH verschil van ca. 0, 0017 pH-
eenheid.
3.3. AFLEESFOUT 25

Van dit systeem is de mV-meter (de ‘pH-meter’) gewoonlijk uitermate betrouwbaar en nauw-
keurig. De onnauwkeurigheid hiervan is te verwaarlozen bij die van de andere delen van het
meetsysteem. Ook de calomel-elektrode is weinig aan storingen onderhevig, mits goed ge-
vuld met een verzadigde KCl-oplossing, en de potentiaal is erg constant, maar wel enigszinds
temperatuurgevoelig.
De zwakke schakel in de meetketen is de glaselektrode. De afgegeven potentiaal is erg gevoelig
voor allerlei storingen: roeren heeft invloed, allerlei zouten hebben invloed, aanraken met de
vingers heeft invloed, de elektrode vervuilt (vooral door eiwitten) en droog staan is funest.
Het gevolg is dat zonder zeer veel extra voorzorgen met gewone glaselektroden de pH gewoon-
lijk een afwijking tot rond 0, 05 eenheid van de ware waarde kan vertonen. (De ‘ware waarde’
kan met een standaard waterstofelektrode moeizaam, maar dicht worden benaderen).
Bij het afregelen van de mV-meter moet de meteraanwijzing met bufferoplossingen van be-
kende pH zo worden ingesteld dat pH = 7, 00 correspondeert met 0, 0 mV en dat de schaaldeel-
grootte correspondeert met de analytische gevoeligheid (in te stellen met twee ijkbuffers, van
pH = 4, 00 en 7, 00 bijvoorbeeld). Daarnaast moet de temperatuur juist worden afgesteld
vanwege de T-factor in RT /F uit de Wet van Nernst.
Voor een routine pH-bepaling kan de standaarddeviatie in het algemeen rond 0, 05 pH-
eenheid gesteld worden. Dat steekt schril af bij de afleesnauwkeurigheid, die bijvoorbeeld
bij de Ankersmit A161 meters 0, 001 pH-eenheid bedraagt! In feite worden dan onnodig
nauwkeurige mV-meters gebruikt.
Let er verder op dat bij hoge pH de zogenaamde alkalimetaal-ionenfout optreedt. Afhankelijk
van het type glas van de elektrode moet de meetuitkomst worden gecorrigeerd.
Bijvoorbeeld: voor oplossingen die 0, 1 M aan Na+ zijn moet bij een pH in de buurt van
12 bij de meetuitkomst voor een glaselektrode van Corning 015 glas 0, 3 pH-eenheid bij de
afgelezen meetuitkomst worden opgeteld. Bij iedere elektrode hoort een correctietabel.
Andere complicaties bij pH-metingen zijn ionsterkte van de oplossing, temperatuurafhanke-
lijkheid van Kw . Zo is pKw bij 20 ◦C niet 14, 00 maar 14, 15.

3.3 Afleesfout

De aanwijzing van een meetinstrument wordt gewoonlijk op een analoge of een digitale schaal
weergegeven. Soms gebeurt dat indirect, bijvoorbeeld door het signaal door te geven aan een
schrijver (‘recorder’) of een computer, die dan voor verdere verwerking zorgt.
Onder de afleesfout verstaan we het kleinste interval dat op een analoge schaal nog kan
worden afgelezen; dat is tussen twee niet te dicht op elkaar staande streepjes ongeveer 0, 2
schaaldeel. Houd bij het aflezen rekening met ‘parallax’, het feit dat de streepjes zich schijn-
baar verplaatsen als de waarnemer er niet recht voor staat.
Voor een digitale schaalverdeling kan de afleesfout gesteld worden op één eenheid van het
laatst gerepresenteerde cijfer (digit), als dat cijfer tenminste niet verandert. Is dat wel zo,
dan moeten uit de veranderingen zelf een waarde voor de afleesfout schatten.
Soms flatteren fabrikanten de meetnauwkeurigheid van een apparaat door het aanbrengen
van te nauwkeurige afleesschalen of het al of niet voorzien van elektronische demping of in-
tegratie.
Gewoonlijk is de afleesfout in meetsystemen kleiner dan de standaarddeviatie van onafhanke-
lijk verkregen meetuitkomsten. Voor een schatting van de totale standaarddeviatie wordt
vaak de grootste van de twee genomen, omdat er geen goede manier bestaat om dit soort
standaarddeviaties ‘op te tellen’.
26 HOOFDSTUK 3 – NAUWKEURIGHEID VAN MEETAPPARATUUR

Voorbeeld 3.6 Een pH van 6, 083 werd afgelezen op een Ankersmit A161 pH-meter. De
afleesfout volgens de fabrikant is 0, 001. De standaarddeviatie van het glaselektrodesys-
teem wordt door de fabrikant geschat op 0, 05 pH-eenheid. In berekeningen wordt een
pH van 6, 08 genomen met standaarddeviatie in de pH van 0, 05.

Voorbeeld 3.7 Op een Novaspec II werd een extinctie van 0, 782 afgelezen. De afleesfout
is 0, 001 (daarop kapt de display af). De standaarddeviatie (reproduceerbaarheid) volgens
de apparaatspecificatie is 0.5% in de extinctie. In berekeningen wordt een standaardde-
viatie s in de extinctie genomen van 0, 004, hetgeen 0, 5% is van 0, 782, en niet de kleinere
afleesfout van 0, 001.

Opgave 3.2 Met vijf combi-elektrodes van één bepaald type en één pH-meter wordt van
een oplossing vijf keer de pH gemeten. De meetuitkomsten zijn:

4, 361 4, 342 4, 324 4, 286 4, 319

Welke waarde moet voor de standaarddeviatie in de pH gebruikt worden?


Hoofdstuk 4

Notatie van meetresultaten

4.1 Eenheden

Zoveel mogelijk worden alle meetuitkomsten genoteerd in SI-eenheden voorzien van de ge-
bruikelijke voorvoegsels voor machten van 10. Het is ook gewenst dat de meetuitkomst en de
standaardeviatie op dezelfde wijze genoteerd worden, met dezelfde macht van 10.

Dus wel: de gemeten spanning = 4, 032 V met s = 0, 007 V,


maar niet: de gemeten spanning = 4, 032 V met s = 7 mV.

In sommige onderzoeksdisciplines wordt traditioneel nog steeds afgeweken van SI-eenheden.


Zo worden in de kernfysica energieën vaak gegeven in eV (electronvolt) in plaats van in joules.
In het laboratorium wordt bij vacuümdestillaties de druk vaak in mm kwik gegeven in plaats
van in pascal, omdat die ook vaak met een kwikmanometer gemeten wordt. Bij infrarood-
spectroscopie worden de absorpties vaak weergegeven bij hun golfgetal in cm−1 en niet bij
hun frequentie in Hz.
Om de wat oudere wetenschappelijke literatuur te kunnen gebruiken moet vaak flexibel wor-
den omgegaan met allerlei eenheden; allerlei oude eenheden moeten soepel in andere kunnen
worden omgerekend. Omrekentabellen zoals die bijvoorbeeld in het ‘Handbook of Chemistry
and Physics’ vermeld staan onder ‘Units, conversion factors’ kunnen daarbij helpen.

4.2 Aantal significante cijfers

Op de middelbare school werd in veel gevallen de regel gehanteerd dat het eindresultaat
van een samengestelde grootheid in een berekening evenveel significante (= betekenisvolle)
cijfers moet bevatten als het minst nauwkeurige gegeven. Bij hoe het aantal significante
cijfers van dit gegeven was verkregen werd niet stil gestaan, maar deze regel faalt ook wel
eens.

Voorbeeld 4.1 Een voorbeeld waarbij de middelbare schoolregel niet opgaat is bij de
pH.
Als de pH = 4, 205 dan volgt [H+ ] = 6, 2373483 · 10−5 mol L−1
Als de pH = 4, 206 dan volgt [H+ ] = 6, 2230028 · 10−5 mol L−1
Een onzekerheid in het vierde significante cijfer van de pH geeft al een onzekerheid in het
derde significante cijfer van de [H+ ], zodat de eenvoudige middelbare schoolregel hier niet
opgaat. Dit komt vaker voor bij het gebruik van logaritmen en e-machten.

27
28 HOOFDSTUK 4 – NOTATIE VAN MEETRESULTATEN

Het is altijd de bedoeling om een meetuitkomst zo correct mogelijk te noteren: de juiste


eenheden, niet teveel maar ook niet te weinig significante cijfers en op een juiste manier
afgerond.

Er moet altijd worden geprobeerd om een meetuitkomst zo te noteren


dat het laatste cijfer, en niet meer en niet minder dan dat, onzeker is.

Die onzekerheid moet corresponderen met de onnauwkeurigheid van het experiment.

Om het aantal significante cijfers van de uiteindelijke meetuitkomst (dat is gewoonlijk de


gemiddelde meetuitkomst x̄) correct te bepalen, moet eerst een goede schatting worden
gemaakt van de standaarddeviatie s, en van de standaarddeviatie in het gemiddelde sg .
Voor die laatste geldt:
s
sg = √ (4.1)
n
Zoals later (§8.2) zal blijken, is de standaarddeviatie s die uit een beperkt aantal metingen
berekend wordt, niet erg nauwkeurig. Vaak is het aantal metingen n maar 5 tot 10 en een
standaarddeviatie in s van 30% is dan heel gewoon. In de praktijk wordt daarom voor een
kleine verzameling metingen de volgende regel gehanteerd:

sg wordt genoteerd met slechts één significant cijfer, tenzij dat een 1
of een 2 zou zijn; in die gevallen worden er twee cijfers genoteerd.
Voor de gemiddelde meetuitkomst x̄ worden evenveel decimalen geno-
teerd als voor sg .

Een voorbeeld om deze regel toe te lichten:

Voorbeeld 4.2
sg berekend sg genoteerd x̄ berekend x̄ genoteerd
0, 1267 0, 13 V 22, 1834 V 22, 18 V
0, 812 0, 8 V 220, 138 V 220, 1 V
6, 2301 6V 21, 7554 V 22 V
2, 441 2, 4 V 22, 3281 V 22, 3 V
0, 0592 0, 06 V 2218, 1 V x̄ te ruw afgekapt!

Opgave 4.1 Noteer de volgende meetuitkomsten met het juiste aantal significante cijfers
(gegevens in kg):

x̄ sg x̄ sg
16, 33227 0, 15003 16, 33227 0, 31283
16, 33227 3, 1283 16, 33227 0, 000005
0, 99283 0, 27432 0, 99283 1, 72583
2412, 13247 0, 27432 2412, 13247 16, 501
2412, 13247 1050

Belangrijk is nog om op te merken dat het afkappen van tussenresultaten in berekeningen


zoveel mogelijk achterwege moet worden gelaten. Bij het gebruik van rekenmachines is het
aan te raden om tussenresultaten in het geheugen op te slaan en later weer te gebruiken. In
ieder geval moeten tussenresultaten minstens één en liefst twee cijfers meer bevatten dan het
eindresultaat, om informatieverlies te voorkomen.
4.3. AFRONDEN 29

4.3 Afronden

Nadat het aantal significante cijfers is bepaald, moet een waarde gewoonlijk nog worden
afgerond. Hier zijn een aantal regels voor.
Er wordt gekeken naar de cijfers die overblijven na het afkappen. Er zijn dan drie gevallen
te onderscheiden:

1. Is het restant < 500 . . ., dan wordt het afgekapte resultaat onveranderd gebruikt.
4, 3128 afgekapt als 4, 3 k 128 wordt 4, 3, want 128 < 500
1, 0006 afgekapt als 1, 00 k 06 wordt 1, 00, want 06 < 50

2. Is het restant > 500 . . ., dan wordt het cijfer waarvóór afgekapt werd met 1 opgehoogd.
4, 3612 afgekapt als 4, 3 k 612 wordt 4, 4, want 612 > 500
1, 0076 afgekapt als 1.00 k 76 wordt 1, 01, want 76 > 50

3. Is het restant = 500 . . ., dan wordt een oneven cijfer vóór de 5 veranderd in het even
getal dat het dichtst bij ligt.
0, 2850 afgekapt als 0, 28 k 50 wordt 0, 28
3, 5000 afgekapt als 3, k 5000 wordt 4
54, 500 afgekapt als 54, k 500 wordt 54

Het is duidelijk dat het afronden steeds in één keer wordt gedaan, dus niet bijvoorbeeld:
28, 7498 wordt 28, 750 wordt 28, 75 wordt 28, 8, maar in één keer 28, 7498 wordt 28, 7.
De macht van 10 van het laatste significante cijfer heet het afrondingsinterval.

Opgave 4.2 Kap eerst af en rond daarna de volgende gemiddelden x̄ af, als gegeven is
dat sg = 0, 3:

28, 652 5, 586 0, 768 12, 553 1, 997 1, 913 121, 55 121, 45 0, 032

Over het afronden kan worden opgemerkt dat de nauwkeurigheid van het resultaat er natuur-
lijk enigszins door afneemt. Er kan worden aangetoond dat het effect op de nauwkeurigheid
echter meestal niet meer dan 1% bedraagt (zie bijvoorbeeld §10.1, ref. 6).

4.4 Notatie

Het zou in het algemeen het beste zijn om alle meetuitkomsten te noteren, maar met veel re-
sultaten wordt dat onoverzichtelijk. In dat geval worden altijd de volgende drie kengetallen
gegeven:

– het aantal metingen: n;

– de gemiddelde meetuitkomst: x̄;

– en de standaarddeviatie: s.

De lezer kan dan zelf de standaarddeviatie in het gemiddelde, of een betrouwbaarheidsinterval


voor de meetverwachting uitrekenen. Alle relevante gegevens om toetsen uit te voeren zijn
dan ook beschikbaar.
30 HOOFDSTUK 4 – NOTATIE VAN MEETRESULTATEN

Voorbeeld 4.3 Voor de massa van een soort metalen kogeltjes werden de volgende
meetresultaten verkregen (in g):

1, 234 1, 236 1, 238 1, 270 1, 235 1, 239 1, 230 1, 235 1, 238 1, 231

De evidente uitschieter 1, 270 wordt uit de serie verwijderd. Er volgt dan:

n = 9 x̄ = 1, 2351 s = 0, 0031 sg = 0, 0010

Zowel sg als x̄ worden met vier decimalen gegeven, want sg = 0, 0010 met twee significante
cijfers. Het is ook mogelijk om sg te noteren met de wetenschappelijke notatie, met
machten van 10. Het wordt dan sg = 0, 10 · 10−2 , waarbij de twee significante cijfers
achter de decimaalpunt staan.

Opgave 4.3 Van een merk azijn werd door middel van titratie het azijnzuurgehalte
bepaald. De meetuitkomsten waren (in massa %):

4, 12 4, 08 4, 03 3, 90 4, 15 4, 08 4, 10 4, 09 4, 01 4, 06 3, 70 3, 99 4, 06

Geef met behulp van deze metingen de drie kengetallen zo correct mogelijk weer.

Met correct noteren wordt dus bedoeld dat de meetuitkomsten worden genoteerd:

– zonder uitschieters;

– correct afgekapt;

– correct afgerond.

Zo mogelijk worden in ieder geval de drie kengetallen gegeven met vermelding van de (SI)
eenheid waarin deze grootheden zijn uitgedrukt.

N.B. Vaak is het prettig als een meetuitkomst toch met één decimaal meer bekend is dan met
bovenstaande procedure bepaald wordt. Met name als ermee verder gerekend moet worden
is dat aan te raden. In feite wordt dan net zo gehandeld als met een tussenresultaat van de
berekeningen.
Hoofdstuk 5

Samengestelde grootheden

5.1 Probleemstelling

Tot nu toe zijn statistische parameters, zoals de standaarddeviatie, berekend op basis van
directe meetuitkomsten. Dat wil zeggen dat er geen mathematische bewerkingen nodig waren
om te komen tot de einduitkomst: er kon direct van een meetinstrument worden afgelezen.
In de chemie en in de fysica is dit soort metingen echter relatief zeldzaam. Vaak wordt er
meer dan één grootheid gemeten en wordt er een mathematische bewerking toegepast om een
samengestelde grootheid te weten te komen.

Voorbeeld 5.1 De warmte W die in een calorimeter wordt ontwikkeld als een stroom
van I Ampère gedurende t seconden door een weerstand van R Ohm gaat is te berekenen
als W = I 2 · R · t Joules.
Als de standaarddeviaties in de meetuitkomsten van I, R en t bekend zijn, moet die in
W berekend kunnen worden.

In dit hoofdstuk wordt nagegaan hoe uit de bekende standaarddeviaties van de meetuit-
komsten van de direct gemeten grootheden (de onafhankelijke variabelen) de standaardde-
viatie van de berekende uitkomst van een samengestelde grootheid (de afhankelijke variabele)
berekend kan worden.
In de praktijk wordt de techniek op twee manieren toegepast: à priori, vóór de meting, en à
posteriori, na de meting.

5.1.1 A priori

Voordat het meten begonnen wordt is het zeer zinvol om af te vragen hoe nauwkeurig alle sub-
grootheden gemeten moeten worden om de gewenste nauwkeurigheid van de samengestelde
eindgrootheid te halen. Bedenk daarbij dat onnodig nauwkeurig meten vaak duur is en/of
veel tijd kost.

Voorbeeld 5.2 Bij de meting van de warmte W met behulp van een calorimeter zijn de
grootte-orden van de te meten grootheden vooraf al ongeveer bekend: I ≈ 0, 2 A; t ≈ 50
s; R ≈ 1000 Ω, zodat W ≈ 2000 J bedraagt. Er is beschikking over een stopwatch voor de
tijdmeting, waarvoor st geschat wordt op 0, 2 s, en over een stroommeter die een geschatte
sI heeft van 0, 003 A. Als de warmte W bekend moet zijn met een standaarddeviatie
van ongeveer 100 J, hoe groot mag dan de standaarddeviatie van de weerstand R zijn?
(die standaarddeviatie moet bijvoorbeeld bekend zijn bij het bestellen van een geschikte
weerstand). Dit probleem zal later opgelost worden.

31
32 HOOFDSTUK 5 – SAMENGESTELDE GROOTHEDEN

5.1.2 A posteriori

In alle gevallen waarin het eindresultaat niet direct gemeten wordt moet het uit de directe
metingen berekend kunnen worden. Daarbij wordt ook nagegaan hoe groot de standaardde-
viatie in het eindresultaat wordt.

Voorbeeld 5.3 Met een spectrofotometer wordt de transmissie T (de verhouding tussen
de doorgelaten intensiteit en de invallende intensiteit van de betreffende straling) gemeten
van een gekleurde oplossing die zich in een cuvet met een bekende breedte ℓ bevindt. Met
behulp van de Wet van Lambert-Beer kan de concentratie c van de oplossing worden
berekend als ook de molaire extinctie-coëfficient ǫ bekend is: E = ǫ · c · ℓ en E = − log T .
Het probleem is hoe de standaarddeviatie in c te berekenen is als de standaarddeviaties in
ǫ, b en T bekend zijn (uit de meetuitkomsten berekend en/of in de apparatuurhandleiding
opgezocht). Ook dit voorbeeld zal later worden opgelost.

In de volgende paragraaf zal een algemene formule worden gepresenteerd die op iedere functie
van een aantal direct gemeten grootheden toe te passen is. Deze formule is in bijzondere
gevallen tot gemakkelijk te onthouden vormen te reduceren.

5.2 Algemene Foutendoorwerkingsformule (Gauss)

We veronderstellen steeds dat tussen een berekende uitkomst u en een serie direct gemeten
grootheden x, y, z, . . . een bekend verband bestaat:

u = f (x, y, z, . . . ) (5.1)

Hierin is f een eenduidige, continue, naar alle variabelen differentieerbare functie. De varia-
belen x, y, z, . . . moeten onafhankelijk zijn. Dit betekent o.a. dat er om de ene variabele te
meten geen waarden van een van de andere variabelen nodig moet zijn.
Er wordt veronderstelt dat de gemiddelde meetuitkomsten x̄, ȳ, z̄ etc. bekend zijn, alsmede
de standaarddeviaties in de gemiddelden sgx , sgy , sgz etc. (berekend m.b.v. formule (4.1)).
Uit de gemeten uitkomsten van x, y, z, . . . wordt de beste uitkomst voor de grootheid u be-
rekend door in de functie u de gemiddelde meetuitkomsten in te vullen:

ubest = f (x̄, ȳ, z̄, . . . ) (5.2)

De standaarddeviatie voor ubest , genoteerd als su , wordt benaderd met behulp van de fouten-
doorwerkingsformule (Engels: law of propagation of errors):
 2  2  2
2 2 ∂u 2 ∂u 2 ∂u
su = sgx + sgy + sgz + ... (5.3)
∂x ∂y ∂z

Hierbij moeten de partiële afgeleiden (∂u/∂x), (∂u/∂y), . . . geëvalueerd worden voor de beste
meetuitkomsten, dus voor x̄, ȳ, . . . .

Let vooral op de kwadraten in de formule! Het betekent dus dat de varianties van de
onafhankelijke grootheden opgeteld kunnen worden, waarbij elke variantie vermenigvuldigd
moet worden met een ‘gewichtsfactor’ gelijk aan het kwadraat van zijn partiële afgeleide.
In §5.5 wordt de equivalente formule (5.7) gegeven, die zeer geschikt is voor numeriek werk.
5.2. ALGEMENE FOUTENDOORWERKINGSFORMULE (GAUSS) 33

Nu kan voorbeeld 5.3 uitwerkt worden:

Voorbeeld 5.4 Als c = − log T /(ǫ · ℓ), en de gemiddelde meetuitkomsten met de stan-
daarddeviaties daarin zijn bijvoorbeeld:

T = 0, 300 met sgT = 0, 010;


ǫ = 4500 mol cm−1 met sgǫ = 10 mol cm−1 ;
ℓ = 1, 000 cm met sgℓ = 0, 010 cm.

Invullen van (5.3) geeft:


 2  2  2
2 2 ∂c 2 ∂c 2 ∂c
sc = sgT + sgǫ + sgℓ
∂T ∂ǫ ∂ℓ
ln T
Bedenkend dat log T = ln 10 ,
dan volgt na differentiëren:
 2  2  2
−1 log T log T
sc 2 = sgT 2
+ sgǫ 2
+ sgℓ 2
ǫ · ℓ · T · ln 10 ǫ2 · ℓ ǫ · ℓ2
Het invullen van de gegevens levert:
c = 1, 1619 · 10−4 mol L−1 en
sc 2 = 0, 012 · −0, 00032172 + 0, 012 · 0, 00011622 + 102 · (2, 582 · 10−8 )2 = 1, 1766 · 10−11
zodat sc = 3, 430 · 10−6 mol L−1
De relatieve standaarddeviatie is dan sc /c = 0, 0295 = 2, 95%.

Dit voorbeeeld laat zien dat de concentratie c met een relatieve standaarddeviatie van slechts
ongeveer 3% gemeten kan worden. Dat is voor apparatuur als de ‘Spectronic 20’ ongeveer
het maximaal haalbare. Voor de ‘Novaspec II’ wordt 1% behaald.

Opgave 5.1 Voor de dissociatieconstante Kz van een zwak zuur geldt:


c
Kz = α2 ·
1−α
Hierin is c de oorspronkelijke zuurconcentratie en α de ionisatiegraad van het zuur.
De gemiddelde meetuitkomsten zijn:
c̄ = 0, 0984 mol L−1 met sgc = 0, 0003 mol L−1 en ᾱ = 0, 0140 met sgα = 0, 0010.
De grootheden α en c werden onafhankelijk gemeten.
a) Bereken de beste waarde voor Kz en van de standaarddeviatie van Kz .
b) Bereken de waarde van pKz (= −10 log Kz ) en van de standaarddeviatie in pKz .
Gebruik daarbij de resultaten van a.

Opgave 5.2 De straal van een bol wordt gemeten met een schuifmaat: r = 2, 035
cm met sr = 0, 025 cm. De dichtheid ρ van het materiaal waarvan de bol is gemaakt
wordt gemeten met een flotatiemethode en bedraagt gemiddeld 2, 450 g cm−3 met als
standaarddeviatie daarin s = 0, 003 g cm−3 . De inhoud van een bol wordt gegeven door
I = 34 r3 .
a) Bereken met behulp van deze meetuitkomsten de beste waarde voor de massa van
de bol en de standaarddeviatie daarvan. Rond correct af.
b) Vergelijk de uitkomst wat nauwkeurigheid betreft met het wegen van de bol op een
analytische balans.

Opgave 5.3 Bereken voor Voorbeeld 5.2 de waarde van de relatieve standaarddevia-
tie van de weerstand, sR /R, die bijvoorbeeld aan het elektronicamagazijn moet worden
opgeven.

Opgave 5.4 Leid de formule voor de standaarddeviatie in het gemiddelde af (sg = s/ n).
34 HOOFDSTUK 5 – SAMENGESTELDE GROOTHEDEN

5.3 Bijzondere gevallen

Hier volgen een aantal bijzondere gevallen van de algemene foutendoorwerkingsformule.


Geval 1. Sommen en/of verschillen
Als de functie u een willekeurige lineaire combinatie is van een aantal direct gemeten on-
afhankelijke variabelen, dus u = ax + by + cz + . . . , dan gaat de algemene formule over in de
gemakkelijk te onthouden vorm:

su 2 = a2 · sgx 2 + b2 · sgy 2 + c2 · sgz 2 + . . . (5.4)

Dit wordt ook wel het ‘kwadratisch optellen van de absolute fouten’ genoemd. De formule is
vooral handig als de coëfficienten a, b, c, . . . gelijk zijn aan ±1.

Opgave 5.5 Leid formule (5.4) af uit de algemene formule (5.3).

Opgave 5.6 Bij een titratie wordt het volume titrant bepaald door de standen van het
vloeistofniveau in de buret aan het begin en aan het eind af te lezen. Gewoonlijk wordt
slechts eenmaal afgelezen en wordt à priori een schatting gemaakt van de standaardde-
viatie van een dergelijke volumebepaling, bijvoorbeeld 0, 02 mL.
Het volume en de standaarddeviatie kan echter ook bepaald worden door een aantal ver-
schillende personen te laten aflezen. Dit experiment werd uitgevoerd en de resultaten
voor vijf verschillende personen zijn: (beginstand / eindstand)

0, 70/25, 82 0, 69/25, 84 0, 74/25, 83 0, 72/25, 80 0, 70/25, 80 mL

Bereken het gemiddelde titrantvolume, en de standaarddeviatie in het gemiddelde volume.

Geval 2. Producten en/of quotiënten met exponenten


Als de functie u de vorm heeft u = k · xa · y b · z c · . . . , dan gaat de algemene foutendoor-
werkingsformule over in de vorm:
2 2 2
su 2 2 sgx 2 sgy 2 sgz
= a · + b · + c · + ... (5.5)
u2 x2 y2 z2
Ook in dit geval is de formule pas echt eenvoudig in de gevallen dat de exponenten a, b, c, . . .
gelijk zijn aan ±1. Dit wordt ook wel het ‘kwadratisch optellen van de relatieve fouten’
genoemd.

Opgave 5.7 Leid formule (5.5) uit de algemene formule (5.3) af.

Voorbeeld 5.5 Van een monster dat als enige base NaOH bevat, wordt m = 120, 2 mg
getitreerd met HCl met een concentratie van 0, 1004 mol L−1 . De standaarddeviatie in de
weging bedraagt 0, 2 mg, en in de concentratie 0, 0002 mol L−1 . Het benodigde volume
V aan HCl-oplossing blijkt 25, 05 mL, met een standaarddeviatie van 0, 03 mL.
Bereken het gehalte G aan NaOH in % in het monster, alsmede de standaarddeviatie
daarin. Alle vermeldde waarden zijn gemiddelden en standaarddeviaties hierin.
Uitwerking:
G = MwNaOH ·VHCl ·[HCl]/mNaOH = 39, 9972 · 25, 05 · 0, 1004 / 120, 2 · 100% = 83, 69%.
2
sG 2 /G2 = sgMw 2 /Mw 2 + sgV 2 /V 2 + sg[HCl] 2 /[HCl] + sgm 2 /m2
sG /G = 0, 0001 /39, 9972 + 0, 03 /25, 05 + 0, 00022/0, 10042 + 0, 22 /120, 22
2 2 2 2 2 2

sG · 100% = 0, 24%. Het gehalte NaOH is 83, 69% met een standaarddeviatie van 0, 24%.
5.4. AFHANKELIJKE GROOTHEDEN 35

Opgave 5.8 Bij de jodometrische bepaling van de Faraday geldt de formule:


I·t
F = (5.6)
m·V
Hierin is F de constante van Faraday in C/mol, I de stroomsterkte in mA, t de tijd tot
de indicatoromslag in s, V het volume natriumthiosulfaat in mL en m de molariteit van
de natriumthiosulfaatoplossing in mol/L.
De gemeten waarden zijn I = 95, 0 mA met sI = 0, 1 mA, t = 510 s met st = 1 s,
V = 5, 00 mL met sV = 0, 02 mL, m = 0, 1000 mol/L met sm = 0, 0005 mol/L.
Alle vermelde waarden zijn gemiddelden en de standaarddeviaties daarin.
a) Bereken de waarde voor de Faraday, en de standaarddeviatie daarvan. Pas zowel
(5.3) als (5.5) toe.
b) Welke grootheid draagt het meest bij tot die standaarddeviatie en komt dus als eerste
eventueel in aanmerking om nauwkeuriger gemeten worden?

5.4 Afhankelijke grootheden

In de afleiding van de algemene foutendoorwerkingsformule, (5.3), wordt gebruik gemaakt


van het feit dat de gemeten grootheden x, y, z, . . . onafhankelijk zijn. Dat wil ondermeer
zeggen dat ze niet uit elkaar te berekenen mogen zijn. Bij het toepassen van deze formule, of
de eenvoudigere vormen (5.4) of (5.5), moet hier zeker rekening mee worden gehouden. Er
worden helaas veel fouten gemaakt doordat wel met afhankelijke grootheden wordt gerekend.

Voorbeeld 5.6 Bij de spectrofotometrische bepaling van de pK van een zuur-base


indicator geldt de volgende relatie tussen de gemeten grootheden:
A − Az
pK = pHA − log
Ab − A
De grootheden A, Az en Ab zijn de extincties bij één golflengte gemeten voor indicator-
oplossingen bij pHA , bij zeer lage pH en bij zeer hoge pH.
Het is beslist verkeerd om nu twee hulpvariabelen x ≡ A − Az en y ≡ Ab − A in te voeren,
deze in de formule te substitueren en daarna de algemene foutendoorwerkingsformule (5.3)
toe te passen met als variabelen x en y. De variabelen x en y zijn namelijk afhankelijk,
want y = Ab + Az − x. Als de formule wordt uitgewerkt met en zonder invoering van x
en y, komen hier heel verschillende resultaten uit. Probeer dat!

Opgave 5.9 Nogmaals wordt het geval van de ijking van een calorimeter bekeken.
Hiervoor geldt W = I 2 · R · t. Uit een meting volgt dat I = 0, 520 A met sI = 0, 020 A,
R = 248, 0 met sR = 0, 5 en t = 866, 8 s met st = 0, 2 s.
a) Bereken de relatieve standaarddeviatie in W door formule (5.3) toe te passen, met
als variabelen I, R en t.
b) Bereken de relatieve standaarddeviatie in W door formule (5.3) toe te passen, maar
nu met als variabelen I, V en t. Waarbij V een nieuw ingevoerde variabele voor de
spanning is. V wordt gegeven met de Wet van Ohm: V = I · R. De warmte wordt
in dat geval geschreven als W = I · V · t.
c) Geef commentaar op de twee uitkomsten.
36 HOOFDSTUK 5 – SAMENGESTELDE GROOTHEDEN

5.5 Het berekenen van (partiële) afgeleiden

Het berekenen van partiële afgeleiden als ∂u/∂x geeft nogal eens problemen, waardoor veel
onnodige fouten worden gemaakt.
Ten eerste is het van groot belang dat het analytisch differentiëren goed beheersd wordt.
Dit houdt in dat de regels van het differentiëren van functies en het werken met de product-,
quotiënt- en kettingregel bekend moeten zijn en dat zij correct toegepast kunnen worden.
Naast analytische differentiëren, kan het soms nuttig zijn om grafisch of numeriek te differ-
entiëren.

Bij het grafisch differentiëren wordt een grafiek van de betreffende functie u(x) getekend
en wordt in het gewenste punt (x, u(x)) de raaklijn getekend. Van deze raaklijn wordt de
richtingscoëfficiënt (= tangens) bepaald.
Deze methode is vooral geschikt voor functies van één variabele die moeilijk differentieerbaar
zijn, bijvoorbeeld omdat er geen expliciete functie voor bekend is.

Bij het numeriek differentiëren, al of niet per computer, wordt het differentiaalquotiënt
∂u/∂x benaderd door een differentiequotiënt ∆u/∆x. Hierbij moet in principe ∆x zo klein
mogelijk worden genomen, omdat in het limietgeval ∆x → 0 het differentiequotiënt tot het
differentiaalquotiënt nadert.
In de praktijk van het rekenen in foutenleer wordt gewoonlijk voor ∆x de waarde van sgx
genomen, voor ∆y de waarde van sgy , enzovoort. Hierbij is het van groot belang dat er vol-
doende nauwkeurig gerekend wordt. De nauwkeurigheid van 10 cijfers op een rekenmachine
of 12 cijfers op een computer is hiervoor zonder speciale voorzorgen vaak te klein!
Voor de afgeleide ∂u/∂x volgt bij uitwerken:

∂u ∆u f (x̄ + sgx , ȳ, z̄, . . . ) − f (x̄, ȳ, z̄, . . . )


≈ =
∂x ∆x sgx

Dit wordt voor alle partiële afgeleiden ∂u/∂x, ∂u/∂y, etc. gedaan. De formule (5.3) vereen-
voudigt in dat geval tot:
su 2 = ∆ux 2 + ∆uy 2 + ∆uz 2
Hierin geldt:
∆ux = f (x̄ + sgx , ȳ, z̄, . . . ) − f (x̄, ȳ, z̄, . . . ) etc.

Opgave 5.10
a) Maak wederom Opgave 5.1, maar differentieer nu numeriek.
b) Zelfde opdracht voor Opgave 5.2.
Controleer zowel de afgeleiden zelf, als de totaaluitkomst m.b.v. (5.7).
Hoofdstuk 6

Simpele lineaire regressie

6.1 Inleiding

Tot nu toe zijn er steeds meetuitkomsten beschouwd voor één grootheid, bijvoorbeeld tem-
peratuur, druk, stroomsterkte etc. Vaak bestaat er echter een mathematische relatie tussen
meerdere meetgrootheden. Deze relatie manifesteert zich bijvoorbeeld in een grafiek waarin
een afhankelijke grootheid Y tegen een onafhankelijke grootheid X wordt uitgezet in de vorm
van een verzameling waarnemingsparen (Xi , Yi ), waarbij voor enkele waarden van Xi een
bijbehorende waarde Yi gemeten wordt.
Met behulp van de zogenaamde simpele lineaire regressierekening is het mogelijk om
voor een systeem met slechts twee variabelen een functie Yi = f (Xi ) te bepalen, die ‘zo goed
mogelijk’ door de puntenverzameling loopt. Dit proces wordt vaak ‘het fitten’ van een curve
genoemd. Bij het fitten zijn de volgende punten van belang:
– Een juiste keuze van het type van de functie (lineair, polynoom, logaritmisch, e-macht,
etc.). Deze keuze is niet een statistisch, maar een fysisch of chemisch probleem: uit de
aard van de grootheden en het theoretisch model dat gehanteerd wordt zal de keuze
van het type functie volgen;
– Een nadere omschrijving van wat precies bedoeld wordt met ‘beste’ aanpassing van de
functie aan de meetparen. Deze problematiek heeft wel betrekking op de statistiek.

In deze paragraaf zal een bijzonder geval van lineaire regressie worden behandelen, namelijk
het zoeken van de beste rechte lijn door een aantal meetpunten. In dit geval wordt gezocht
naar de volgende functie:
Yi = α + βXi (6.1)
Hierin zijn α en β constanten. De waarden van deze constanten worden gezocht met behulp
van de kleinste kwadraten methode. Deze methode geeft niet alleen de parameters voor
de rechte lijn, maar ook de standaarddeviatie in die parameters. Een aantal voorbeelden uit
de praktijk van het scheikunde practicum zal de methode toelichten.

N.B. Op het practicum kan gebruik worden gemaakt van een computerprogramma (POW-
ERFIT) dat de beste polynoom (een rechte lijn is een polynoom van de eerste orde) door een
aantal meetpunten kan berekenen en tekenen.

6.2 Uitgangspunten

Bij de nu te geven behandeling van het eenvoudigste geval van het bepalen van de beste rechte
lijn door een aantal meetpunten worden een vrij groot aantal veronderstellingen gemaakt.

37
38 HOOFDSTUK 6 – SIMPELE LINEAIRE REGRESSIE

Die veronderstellingen zijn nodig om het probleem mathematisch eenvoudig hanteerbaar te


maken. Het mathematische model is als volgt:

– Er zijn tenminste 3 paren meetuitkomsten (Xi , Yi );


– Er wordt van uitgegaan dat er tussen de twee variabelen X en Y het lineaire verband
bestaat van de vorm Yi = α + βXi . Dat verband kan gebaseerd zijn op een fysisch of
chemisch model, of simpelweg op de ligging van de meetpunten in een grafiek;
– De lijn gaat niet per definitie door de oorsprong, dus de parameter β hoeft niet nul te
zijn;
– De standaarddeviatie in de gemeten X-waarden is verwaarloosbaar. Voor alle waarne-
mingen wordt sXi = 0 verondersteld. In de praktijk van het meten is deze standaardde-
viatie natuurlijk nooit nul, maar het is wel vaak zo dat de ene (onafhankelijke) variabele
aanzienlijk nauwkeuriger gemeten of gecontroleerd wordt dan de andere (afhankelijke).
In de chemie is dat vaak het geval voor metingen aan oplossingen, waarvan de concen-
traties nauwkeurig bereid worden, bijvoorbeeld bij een verdunningsreeks;
– De standaarddeviatie in de gemeten Y -waarden is constant, met andere woorden sYi = c.
Hoewel dat in de praktijk lang niet altijd het geval is, wordt deze veronderstelling
vanwege de eenvoud vaak gemaakt. Als de verschillen in de standaarddeviaties te groot
worden, dan moet er een zogehete gewogen procedure worden gevolgd, zie §6.6. De
waarde van de standaarddeviaties in de Y -waarden hoeven niet bekend te zijn om de
methode toe te passen;
– De meetparen (Xi , Yi ) zijn ongecorreleerd, wat wil zeggen dat de meetwaarden geen
relatie tot elkaar hebben. Zogeheten ‘drift’ kan bijvoorbeeld een oorzaak zijn van invloed
van de vorige meetuitkomst op de volgende.

Wanneer de ‘beste lijn’ door een serie meetpunten bepaald is, kan voor ieder punt (Xi , Yi )
een corresponderend punt (Xi , Ŷi ) op de lijn gevonden worden. Hierbij wordt Ŷi gebruikt om
onderscheid te maken met de waarde van Yi die werkelijk gemeten is.
Het verschil tussen de gemeten en de berekende waarde van Y , wordt het residu of differ-
entie di genoemd:
di = Yi − Ŷi (6.2)
Let erop dat de residuen in de grafiek van Y tegen X niet de loodrechte afstanden van de
rechte lijn tot de meetpunten zijn, maar de projecties van de punten op de lijn. Zie Figuur
6.1.

Ŷ = α + βX

(Xi , Yi ) tan ϕ = β
b

di

α
x

Figuur 6.1. Een overzicht van de verschillende parameters bij een lineaire fit procedure.
6.3. KLEINSTE KWADRATEN METHODE 39

6.3 Kleinste kwadraten methode

Om de ‘beste lijn’ te vinden wordt een grootheid R ingevoerd die de som is van de kwadraten
van de residuen van alle meetparen:
n
X n
X n
X
R≡ di 2 = (Yi − Ŷi )2 = (Yi − α − βXi )2 (6.3)
i=1 i=1 i=1

Bij de kleinste kwadraten methode wordt de waarde van R geminimaliseerd. R is minimaal


als de partiële afgeleiden van M naar α en β nul zijn. Uit deze voorwaarden kunnen twee
vergelijkingen opgesteld worden waaruit α en β kunnen worden opgelost. Ook de standaard-
deviaties in α en β kunnen worden berekend door gebruik te maken van de foutendoor-
werkingsformule (5.3).
Met n het aantal meetparen, wordt gevonden dat: (zie voor details §10.1, ref. 1, 3 en 4)
P P 2 P P
Yi Xi − Xi Xi Yi
α = (6.4)
n Xi 2 − ( Xi )2
P P
P P P
n Xi Yi − Xi Yi
β = (6.5)
n Xi 2 − ( Xi )2
P P

sd 2 Xi 2
P
2
sα = (6.6)
n Xi 2 − ( Xi )2
P P

sd 2 n
sβ 2 = (6.7)
n Xi − ( Xi )2
P 2 P
P 2
2 di
Met: sd = (6.8)
n−2
Er kan ook aangetoond worden dat de regressielijn altijd door het ‘zwaartepunt’ (X̄, Ȳ ) van
de meetparen gaat. Hierin zijn X̄ en Ȳ de gemiddelden van de meetvariabelen.
Voorbeeld 6.1 Voor de ijklijn verkregen bij een spectrofotometrische bepaling van
Fe(III) met thiocyanaat werden de volgende meetuitkomsten verkregen:
[Fe+
3 ] in % 0, 100 0, 200 0, 300 0, 400 0, 500 0, 600 0, 700 0, 800 0, 900 1, 000
Extinctie 0, 175 0, 220 0, 265 0, 304 0, 345 0, 383 0, 426 0, 470 0, 514 0, 557

Maak allereerst een grafiek van de gegevens. Voor de berekening van α, sα , β en sβ wordt
een tabel opgezet:
i Xi Yi Xi 2 Xi Yi Yi 2 Ŷi di 2
1 0, 100 0, 175 0, 01 0, 0175 0, 030625 0, 1770 4, 1469 · 10−6
2 0, 200 0, 220 0, 04 0, 0440 0, 048400 0, 2190 0, 9878 · 10−6
3 0, 300 0, 265 0, 09 0, 0795 0, 070225 0, 2610 16, 194 · 10−6
4 0, 400 0, 304 0, 16 0, 1216 0, 092416 0, 3029 1, 1120 · 10−6
5 0, 500 0, 345 0, 25 0, 1725 0, 119025 0, 3449 0, 0072 · 10−6
6 0, 600 0, 383 0, 36 0, 2298 0, 146689 0, 3869 15, 092 · 10−6
7 0, 700 0, 426 0, 49 0, 2982 0, 181476 0, 4289 8, 1487 · 10−6
8 0, 800 0, 470 0, 64 0, 3760 0, 220900 0, 4708 0, 6795 · 10−6
9 0, 900 0, 514 0, 81 0, 4626 0, 264196 0, 5128 1, 4544 · 10−6
10 1, 000 0, 557 1, 00 0, 5570 0, 310249 0, 5548 5, 0010 · 10−6
Som 5, 500 3, 659 3, 85 2, 3587 1, 484201 52, 824 · 10−6

Invullen in de formules voor α, β, sα en sβ levert op:


α = (3, 659 · 3, 85 − 5, 500 · 2, 3587)/(10 · 3, 85 − 5, 5002 ) = 0, 135
β = (10 · 2, 3587 − 5, 500 · 3, 659)/(10 · 3, 85 − 5, 5002) = 0, 420
sd 2 = 52, 824 · 10−6 /8 = 6, 603 · 10−6
sα 2 = (6, 603 · 10−6 · 3, 85)/(10 · 3, 85 − 5, 5002) = 3, 08 · 10−6
sβ 2 = (6, 603 · 10−6 · 10)/(10 · 3, 85 − 5, 5002) = 8, 01 · 10−6
Controleer altijd aan de hand van een grafiek of er geen rekenfouten zijn gemaakt.
40 HOOFDSTUK 6 – SIMPELE LINEAIRE REGRESSIE

6.4 De correlatie-coëfficiënt

Wanneer een serie meetuitkomsten (Xi , Yi ) in een grafiek wordt uitgezet, dan is daar met
de kleinste kwadratenmethode altijd een beste rechte lijn door te construeren, ook al is er
eventueel sprake van een zeer grote spreiding van de meetpunten rond die lijn (een ‘punten-
wolk’). Er is daarom behoefte aan een kwantitatief criterium dat aangeeft in hoeverre het
veronderstelde lineaire verband tussen X en Y goed benaderd wordt.
De grootheid die hiervoor gebruikt wordt is de correlatiecoëfficiënt r, die wordt gegeven
door: P
SXY (Xi − X̄)(Yi − Ȳ )
r=√ = pP (6.9)
SX SY (Xi − X̄)2 (Yi − Ȳ )2
P

Hierin zijn SX , SY en SXY de ‘standaarddeviaties’ van de meetwaarden rond het zwaartepunt


van de ‘puntenwolk’. SXY wordt de covariantie van X en Y genoemd.
X
SX = (Xi − X̄)2 (6.10)
X
SY = (Yi − Ȳ )2 (6.11)
X
SXY = (Xi − X̄)(Yi − Ȳ ) (6.12)

Let op dat deze ‘standaarddeviaties’ geen meet-onnauwkeurigheden voorstellen, maar slechts


hulpmiddelen zijn om de correlatiecoëfficiënt eenvoudig te definiëren. Soms wordt in plaats
van r ook wel r 2 berekend als correlatieparameter.
Enig omwerken van (6.9) levert een hanteerbaar rekenvoorschrift op voor r:
P P P
n Xi Yi − Xi Yi
r = r  P (6.13)
P 2 P 2 2 P 2
n Xi − ( Xi ) n Yi − ( Yi )

Er kan ook bewezen worden dat:


r = α · SX /SY (6.14)
Hierin is α de helling van de regressielijn.

Voorbeeld 6.2 Als de correlatiecoëfficiënt wordt uitgerekend voor Voorbeeld 6.1 met
behulp van (6.12), dan volgt:
10 · 2, 3587 − 5, 500 · 3, 659
r= p = 0, 9998
(10 · 3, 85 − 5, 5002)(10 · 1, 484201 − 3, 6592)

De correlatiecoëfficiënt ligt altijd tussen −1 en +1, waarbij de waarden r = −1 of r = +1


verkregen worden voor lijnen die exact door de meetpunten lopen. Een negatieve helling
leidt tot een negatieve correlatiecoëfficiënt, en een positieve helling tot een positieve corre-
latiecoëfficiënt. Voor het correct berekenen van r moet met zeer grote nauwkeurigheid worden
gerekend, meestal met 12 significante cijfers.
In het algemeen geldt ook dat hoe dichter de absolute waarde van de correlatiecoëfficient de
waarde r = 1 nadert, hoe dichter de meetpunten bij de berekende lijn liggen. De volgende
vuistregel wordt vaak gehanteerd in de chemie:

Bij ijklijnen voor oplossingen in de analytische chemie is gebleken dat


de absolute waarde van de correlatiecoëfficiënt groter dan 0, 999 moet
zijn, om van een behoorlijke kwaliteit te spreken.
6.5. FITTEN VAN POLYNOMEN 41

Opgave 6.1 Bij een AAS-bepaling van Ca 2+ worden voor de ijklijn de volgende waarden
gevonden:

[Ca 2+ ] in mg L−1 : 0, 000 1, 000 2, 000 4, 000 8, 000 12, 000 16, 000 20, 000
Extinctie : 0, 004 0, 040 0, 065 0, 110 0, 221 0, 311 0, 420 0, 534

Bepaal met de kleinste kwadraten methode de beste rechte lijn door de meetpunten. Ga
als volgt te werk:
a) Bereken de parameters van de rechte lijn en hun standaarddeviatie, en bereken ook
de correlatiecoëfficiënt. Stel hiervoor in een spreadsheetprogramma een tabel op als
in Voorbeeld 6.1 en pas formules (6.4) - (6.7) en (6.12) toe.
b) Zet de metingen grafisch uit in een XY-scatter grafiek en voeg een trendlijn toe.
c) Fit een lijn met behulp van het practicumprogramma POWERFIT.
d ) Voer de regressieberekening uit in het spreadsheetprogramma. (Gebruik voor MS
Excel daartoe de optie ‘Regression’ onder ‘Data Analysis’ in het menu ‘Tools’.)
e) Probeer alle uitvoergegevens van beide programma’s te interpreteren.

Het is ook mogelijk om statistische toetsen voor de correlatiecoëfficiënt uit te voeren. De


berekende waarde r is immers slechts een schatting gebaseerd op een steekproef aan meetparen
(Xi , Yi ) uit een grotere populatie. Zie ook §10.3, ref. 5.

6.5 Fitten van polynomen

In sommige situaties geeft het fitten van een rechte lijn niet de beste fit door de meetpunten.
Er kan dan bijvoorbeeld een polynoom worden bepaald die beter bij de meetpunten past:

y = f (x) = a0 + a1 x + a2 x2 + a3 x3 + . . . (6.15)

Met behulp van de kleinste kwadratenmethode worden de waarden van ai en hun standaard-
deviaties berekend. Voor een verdere uitleg over het fitten van polynomen, wordt verwezen
naar §10.1, ref. 5.
Let op! Het is altijd mogelijk om door n meetparen een (n − 1)e -graads polynoom exact te
fitten, met standaarddeviaties van nul voor de parameters! Ook geldt algemeen dat hoe hoger
de graad van de polynoom, hoe beter de curve door de punten gaat. Maar het ophogen van de
graad van de polynoom is niet altijd zinvol, want bij een zekere graad geeft een verhoging geen
statistisch significante verbetering van de fit meer. Met behulp van een F-toets kan worden
nagegaan welke graad polynoom in een bepaald geval de ‘beste’ is. Het practicumprogramma
POWERFIT heeft deze mogelijkheid ook.

6.6 Fitten met gewichten

Als de gemeten X- en/of Y -waarden niet allemaal een vergelijkbare standaarddeviatie hebben,
dan moeten de nauwkeurigere waarden zwaarder tellen in het bepalen van de ‘beste fit’. Dit
wordt gedaan door gewogen regressie toe te passen. Hierbij wordt aan iedere waarneming
een gewicht toegekend, waarna de lijnparameters berekend worden. De gewogen berekening
is aanzienlijk gecompliceerder dan een ongewogen berekening en deze wordt daarom altijd
met een computerprogramma uitgevoerd.
Als de nauwkeurigheden niet teveel verschillen, dan worden de berekeningen meestal onge-
wogen uitgevoerd. Hierdoor worden de berekende standaarddeviaties enigszins onderschat.
42 HOOFDSTUK 6 – SIMPELE LINEAIRE REGRESSIE

In de gevallen dat er toch gewogen wordt, gebeurt dat ook meestal slechts voor de Y -
waarden, omdat de X-waarden zeer vaak verwaarloosbare standaarddeviaties hebben. Het
practicumprogramma POWERFIT kan werken met gewichten voor de Y -waarden.
Voor de expliciete formules voor de kleinste kwadratenfit van een rechte lijn, gewogen voor de
Y -waarden, wordt verwezen naar §10.1, ref. 3. Voor zowel weging in X als Y wordt verwezen
naar §10.1, ref. 5.

6.7 Inverse toepassing van de ijklijn

Vooral in de analytische chemie wordt vaak gebruik gemaakt van ijklijnen of calibratielijnen.
Daarbij worden eerst voor een aantal zelf gekozen en bereide concentraties de meetsignalen
bepaald. De zo verkregen meetuitkomsten worden in grafiek gezet en er wordt een al dan
niet rechte lijn door geconstrueerd.
Vervolgens wordt het meetsignaal M van één of meer monsteroplossingen bepaald en door in-
verse toepassing van de lijn wordt de onbekende concentratie C van deze monsteroplossing
bepaald. Zie Figuur 6.2.

Ŷ = α + βX

M
b

x
C
Figuur 6.2 Een weergave van de inverse toepassing van een ijklijn.

Het geval van een lineaire ijklijn gevormd uit n meetuitkomsten wordt hier verder behandeld.
Als het meetsignaal van het monster de waarde M heeft, dan volgt uit de uitdrukking voor
de ijklijn (Y = α + βX) de waarde van de bijbehorende concentratie C:

C = (M − α)/β (6.16)

De standaarddeviatie in C kan ook berekend worden. Hierbij moet rekening worden gehouden
met de onnauwkeurigheid van het meetsignaal, maar ook dat de lijnparameters α en β
onnauwkeurig zijn. Het doorwerken van de standaarddeviaties in deze drie grootheden is
gecompliceerd, mede doordat α en β afhankelijk zijn. Zie §10.4, ref. 3 voor een afleiding. Het
resultaat wordt: r
sd 1 1
sC = + +E (6.17)
β n N
Hierin is n het aantal paren meetuitkomsten (Xi , Yi ) waaruit de ijklijn is geconstrueerd, N is
het aantal keren dat het monster volledig werd opgewerkt en gemeten (merk op dat als N > 1,
M een gemiddelde meetuitkomst is), β en sd zijn gedefinieerd als in (6.5) respectievelijk (6.8)
6.8. LINEARISEREN 43

en E is een excentriciteitsparameter die groter wordt naarmate het monster verder uit het
zwaartepunt van de ijkpunten ligt. E wordt gegeven door:
E = (C − X̄)2 /SX (6.18)
Volledigheidshalve wordt ook vermeld dat voor het (1 − α) · 100% betrouwbaarheidsinterval
van de meetverwachting µC van de concentratie van het monster geldt:
C − tν,α · sC ≤ µC ≤ C + tν,α · sC (6.19)
Hierin is het aantal vrijheidsgraden ν in de t-factor gelijk aan n + N − 3. Zie verder §9.1.
Let op dat de α in deze functie niet een lijnparameter is, maar een maat voor de gewenste
nauwkeurigheid van het betrouwbaarheidsinterval.
Voorbeeld 6.3 Voorbeeld 6.1 kan gebruikt worden om een inverse toepassing van de
ijklijn te demonstreren.
Er werd een extinctiemeting in triplo uitgevoerd waarvan de gemiddelde meetuitkomst
M = 0, 360 is. De hierbij behorende concentratie C kan berekend worden met (6.16):
C = (0, 360 − 0, 135)/0, 420 = 0, 536. De waarde van E kan bepaald worden met (6.18):
E = (0, 536 − 5, 5/10)2/SXp= 2, 395 · 10 . Nu kan de standaarddeviatie in C berekend
−4

worden met (6.17): sC = 6, 603 · 10 /0, 420 · (1/10 + 1/3 + 2, 395 · 10−4 ) = 0, 004031.
−6

Het betrouwbaarheidsinterval met ν = 10 + 3 − 3 = 10 en t = 2, 228 (zie §11.2), geeft via


(6.19): 0, 527 ≤ C ≤ 0, 545.

Opgave 6.2 Gebruik de ijklijn voor de Ca 2+ -bepaling uit Opgave 6.1.


Voor een monsteroplossing werd eenmaal de extinctie gemeten: Extincie = 0, 150.
a) Bereken de concentratie aan Ca 2+ in mg L−1 , en de standaarddeviatie daarin.
b) Bereken ook het 95%-betrouwbaarheidsinterval voor de meetverwachting van [Ca 2+ ].
Pas daartoe formule (6.19) toe met een t-factor van 2, 447.

6.8 Lineariseren

Het komt geregeld voor dat de variabelen X en Y niet lineair afhankelijk zijn, maar dat wel
door een eenvoudige transformatie een lineair verband verkregen kan worden.
Voorbeeld 6.4 Voor een vloeistof wordt de dampdruk P gemeten als functie van de
absolute temperatuur T . Als P tegen T wordt uitgezet ontstaat een kromme, waardoor
in principe een polynoom gefit zou kunnen worden.
Als echter een grafiek wordt gemaakt van ln P tegen 1/T , dan voorspelt de Wet van
Clausius-Clapeyron dat dit een rechte lijn moet worden met een helling van −Hvap /R.

Opgave 6.3 Voor diethylether staan in het ‘Handbook of Chemistry and Physics’ de
volgende dampdrukken vermeld:
T −74, 3 −48, 1 −27, 7 −11, 5 ◦C
P 1 10 40 100 mm Hg
Bepaal met behulp van lineaire regressie en toepassing van de formule van Clausius-
Clapeyron de waarde van Hvap en de standaarddeviatie daarin.

Bij het lineariseren moet er wel rekening mee worden gehouden dat ook de standaarddeviaties
mee moeten worden gelineariseerd. De standaarddeviaties in de nieuwe variabelen moeten
volgens de methoden van het doorwerken van fouten berekend worden. Dit kan consequenties
hebben voor het gewichtenschema dat in de kleinste kwadratenberekening gebruikt moet
worden. In de praktijk wordt deze omwerking meestal, al of niet terecht, over het hoofd
gezien! De standaarddeviaties worden daardoor meestal onderschat.
44 HOOFDSTUK 6 – SIMPELE LINEAIRE REGRESSIE
Hoofdstuk 7

Verdelingsfuncties

7.1 Histogram

In een histogram worden meetuitkomsten overzichtelijk gepresenteerd in de vorm van een


staafdiagram. Hiertoe worden de meetuitkomsten ingedeeld in klassen. Een klasse omvat
alle meetuitkomsten die een waarde hebben die ligt tussen de vastgestelde klassengrenzen.
De metingen worden verder als gelijkwaardig beschouwd; slechts het aantal metingen in een
klasse is dan nog van belang.
De breedte van een kolom in het diagram is de klassenbreedte, het oppervlak van de kolom
representeert het aantal meetuitkomsten in de klasse.
Een histogram wordt als volgt gemaakt uit een serie meetuitkomsten (naar de officiële NEN
1047 norm):

1. Bepaal het aantal meetuitkomsten n na verwijdering van eventuele uitschieters en sor-


teer deze in opklimmende volgorde;

2. Bepaal a, het afrondingsinterval. Dat is de macht van 10 waarop de meetuitkomsten


zijn afgerond, dus a = 0, 01; 0, 1; 1; 10; 100; . . . etc.;

3. Bepaal de spreidingsbreedte w (1.1);

4. Bereken de klassebreedte h = w/n;

5. Rond h zodanig af dat de breedte van de klasse gemakkelijk te tekenen valt op milime-
terpapier. Dit is bij het gebruik van een computerprocedure niet nodig;

6. De laagste waarde in een klasse is telkens een veelvoud van h;

7. De hoogste waarde in een klasse is telkens een veelvoud van h, verminderd met a;

8. Tel de aantallen meetuitkomsten voor de verschillende klassen. Plaats daartoe elke


meetuitkomst in de juiste klasse;

9. Maak een grafiek, waarin op de horizontale as de klassen staan aangegeven, en op de


verticale as de aantallen meetuitkomsten per klasse (dit kan zowel absoluut als relatief
zijn);

10. Zet voor elke klasse een oppervlak uit in de vorm van een kolom. Bij een absoluut
histogram wordt het oppervlak van iedere kolom gelijk aan het aantal meetuitkomsten
in de betreffende klasse; bij een relatief histogram is het gelijk aan de betreffende fracte
van het totaal.

45
46 HOOFDSTUK 7 – VERDELINGSFUNCTIES

Opgave 7.1 Voor de waarde van de constante van Faraday werden door een groep
van 75 studenten de volgende meetuitkomsten verkregen (in C mol−1 ) en gesorteerd in
opklimmende volgorde:
89000 89000 89400 89550 89800 90270 90700 90870 91000
91200 91320 92000 92000 92200 92300 92300 92400 92500
93050 93100 93130 93200 93500 93600 94000 94000 94150
94300 94600 94660 95200 95300 95890 95900 95990 96190
96200 96210 96270 96400 96600 96800 97000 97100 97100
97100 97270 97310 97400 97500 97600 97800 97900 98000
98100 98200 98250 98300 98490 98600 98700 98820 98900
99000 99190 99300 99680 99700 100000 100000 100000 100000
102000 103000 103000
P
a) Bepaal Phet gemiddelde en de standaarddeviatie. Er is berekend dat x = 7176360
en dat x2 = 6.8754180 · 1011 .
b) Teken een histogram van deze meetuitkomsten. Gebruik daarbij het bovenstaande
voorschrift.
c) Maak een histogram door gebruik te maken van de optie ‘Histogram’ van MS Excel
in het pakket ‘Data Analysis’.

7.2 Van histogram naar verdelingsfunctie

In de vorige paragraaf werd het histogram genoemd als een manier om de spreiding van meet-
uitkomsten visueel weer te geven in de vorm van een staafdiagram.
De breedte van een kolom is representatief voor de meetuitkomsten van een klasse: alle
metingen waarvan de meetuitkomsten tussen de ondergrens en de bovengrens van de betref-
fende klasse liggen, behoren ertoe. In Opgave 7.1 bijvoorbeeld, behoren alle 18 metingen met
een meetuitkomst vanaf 96000 tot en met 97990 C mol−1 tot klasse 5.
Het oppervlak van een kolom representeert het relatieve aantal metingen dat tot die klasse
behoort. In Opgave 7.1 bijvoorbeeld, is het relatieve aantal metingen dat tot klasse 5 behoort
gelijk aan 18/75 = 0, 24. Het oppervlak van kolom 5 is dan ook 24 % van het totale oppervlak
van alle kolommen van het histogram.

Bij een toenemend aantal metingen zal het histogram kolommen krijgen die steeds smaller
worden. Zie Figuur 7.1. Steeds blijft echter gelden dat voor een bepaalde kolom het relatieve
aantal metingen dat in de betreffende klasse valt gelijk is aan het relatieve oppervlak van de
betreffende kolom.

1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Figuur 7.1. Drie histogrammen met van links naar rechts een toenemend aantal metingen (n = 250,
n = 1000, n = 10000). Hoe groter n, hoe meer het histogram op een vloeiende kromme gaat lijken.
7.2. VAN HISTOGRAM NAAR VERDELINGSFUNCTIE 47

Als de middens van de bovenzijden van de kolommen met elkaar worden verbonden, ontstaat
een gebroken lijn die de frequentiepolygoon wordt genoemd.

In het limietgeval van oneindig veel metingen (n → ∞) kan geconstateerd worden dat

– de klassenbreedte wordt infinitesimaal klein;


– de frequentiepolygoon gaat steeds meer op een vloeiende kromme lijken;
– het oppervlak van een kolom is nogsteeds evenredig met het relatieve aantal metingen
in de desbetreffende klasse.

Als de meetvariabele x wordt genoemd, kan het volgende worden gesteld:

– de klassenbreedte wordt ∆x → 0 en de meetvariabele x wordt continu;


– de frequentiepolygoon gaat over in een functie f (x);
– het relatieve aantal metingen met een meetuitkomst tussen xa en xa + ∆x is gelijk aan
het oppervlak van de kolom horend bij xa , dus gelijk aan f (xa ) · ∆x.

Uit het derde punt volgt dat het relatieve aantal metingen met een meetuitkomst tussen bij-
voorbeeld xa en xb kan worden voorgesteld als de som van alle oppervlakken van de kolommen
xa tot xb , ofwel (in het limietgeval ∆x → 0) de integraal van xa tot xb over f (x):
Z xb
f (x) dx (7.1)
xa

Vanzelfsprekend moet de som van alle relatieve aantallen metingen 1 zijn, zodat er voor de
functie f (x) een zogenaamde normaliseringseis bestaat:
Z −∞
f (x) dx = 1 (7.2)

In deze vergelijking wordt uitgegaan van een uitkomstenruimte van −∞ tot ∞. In sommige
gevallen moeten deze grenzen aangepast worden aan het domein van de variabele. Verder
is het vereist dat de functie f (x) altijd positief moeten zijn, omdat anders het verband met
relatieve aantallen metingen niet gelegd kan worden. Vanzelfsprekend moet de functie f (x)
integreerbaar zijn.
De vorm van de functie f (x) zou experimenteel afgeleid kunnen worden uit door bijvoorbeeld
een polynoom te ‘fitten’ aan het experimenteel bepaalde histogram van veel metingen, maar
dat is ongebruikelijk. Er wordt vooral gebruik gemaakt van verschillende modelfuncties
die in de mathematische statistiek gebruikt worden. Deze functies bevatten meestal een of
meerdere variabelen die zodanig gekozen kunnen worden dat de functie de experimentele fre-
quentiepolygoon dicht benadert.

In de volgende paragrafen zullen enkele van deze modelfuncties, of beter kansdichtheids-


functies, nader bekeken worden.
48 HOOFDSTUK 7 – VERDELINGSFUNCTIES

7.3 Enige verdelingsfuncties

7.3.1 De exponentiële verdeling

Voor de exponentiële verdeling heeft de kansdichtheidsfunctie de volgende vorm:

f (x) = λe−λx met λ>0 en x ≥ 0 (7.3)

De parameter λ bepaalt in sterke mate hoe steil de functie afloopt. In Figuur 7.2 is voor
verschillende waarden van λ de functie weergegeven.
y
2
λ=2

λ=1

λ = 0, 5
x
1 2
Figuur 7.2. Een weergave van de kansdichtheidsfunctie van de expo-
nentiële verdeling voor waarden van λ = 0, 5, 1, 0 en 2, 0.

De exponentiële verdeling komt veel voor in tijdsafhankelijke processen (bijvoorbeeld bij


reactiekinetiek).
Er kan bewezen worden dat de verwachtingswaarde voor de exponentiële verdeling gelijk is
aan 1/λ en dat de variantie gelijk is aan 1/λ2 .

Voorbeeld 7.1 Uit onderzoek is gebleken dat de wachttijd bij een bepaald loket een
exponentiële verdeling volgt met λ = 2 min−1 . Bereken de kans dat de wachttijd 1, 5
min. of langer is.
Deze kans is gelijk aan de integraal van (7.3) van 1, 5 tot +∞. Het resultaat is 0, 049787,
wat dus betekent dat er ongeveer 5% kans is op 1, 5 min. of langer wachten.
Met MS Excel zou deze berekening als volgt gaan: 1 - EXPONDIST(1.5;2;TRUE) =
0, 049787.

Opgave 7.2 Een zwakke radioactieve bron zendt per milliseconde gemiddeld 3, 80 pulsen
uit. De kansdichtheidsfunctie voor het tijdsverschil ∆t tussen de ontvangst van de ver-
schillende pulsen in een scintillatieteller blijkt te zijn: f (∆t) = 3, 80 · exp(−3, 80 · ∆t) met
∆t in ms.
a) Schets m.b.v. MS Excel de functie voor ∆t = 0 tot 4 met stappen van 0, 1.
b) Bereken de kans dat er gedurende 1 ms of langer geen pulsen in de teller worden
ontvangen. Gebruik zowel een directe uitwerking van de integraal als MS Excel.
7.3. ENIGE VERDELINGSFUNCTIES 49

7.3.2 De normale of Gauss-verdeling

Bij veel soorten metingen zullen de meetuitkomsten een min of meer klokvormige verdeling
vertonen: meetuitkomsten in de buurt van een centrale waarde komen het meest voor, waar-
den evenveel groter of kleiner dan de centrale waarde komen minder vaak voor en waarden
die erg veel afwijken van de centrale waarde komen erg weinig voor.
Deze verdeling blijkt onder andere op te treden als een groot aantal oncontroleerbare factoren
op volkomen willekeurige wijze de metingen beı̈nvloeden. Daarbij kan gedacht worden aan
temperatuurfluctuaties, trillingen, wrijvingsverschijnselen, stofdeeltjes, luchtbelletjes, etc.
De mathematische vorm van de functie die de normale verdeling beschrijft is als volgt:

(x − µ)2
 
1
f (x) = √ exp − (7.4)
σ 2π 2σ 2

De twee parameters µ en σ definiëren respectievelijk de plaats van de symmetrie-as en de


breedte van de klokvorm. De lijn x = µ is de verticale symmetrie-as en σ is de afstand van
de symmetie-as tot het buigpunt. Zie Figuur 7.3. Voor de normale verdeling wordt f (x) ook
wel genoteerd als N (µ, σ 2 ).

0.5

0.4

0.3

0.2

0.1

0 x
−3 −2 −1 0 1 2 3

Figuur 7.3. Een weergave van de kansdichtheidsfunctie van de normale verdeling


voor µ = 0 en σ = 0, 75.

In het geval dat µ = 0 en σ = 1 wordt er gesproken over een standaard normale verdeling.
Voor de normale verdeling zijn er tabellen die een gedeelte van het oppervlak onder de verdel-
ingsfunctie geven, gewoonlijk als functie van de excentriciteit z die als volgt gedefinieerd
is:
x−µ
z≡ (7.5)
σ
Het oppervlak onder de kansdichtheidsfunctie f (x) op het domein −∞ ≤ x < a wordt gegeven
door de verdelingsfunctie F (a): de integraal van de kansdichtheidsfunctie van −∞ tot a.
Voor de standaard normale verdeling en het gebruik van de excentriciteit geldt dan:
Za
1 1 2
F (a) = √ e− 2 z dz (7.6)

−∞

Om van de getabelleerde waarden gebruik te kunnen maken wanneer het niet gaat om een
standaard normale verdeling is een transformatie naar de standaard normale verdeling nodig:
50 HOOFDSTUK 7 – VERDELINGSFUNCTIES

de onafhankelijke variabele x moet naar z worden getransformeerd via (7.5). Concreet


betekent dit dat x over een afstand µ getransleerd wordt over de x-as en dat er daarna
door σ gedeeld wordt.
Door de transformatie van x naar z gaat de normale verdeling N (µ, σ 2 ) over in de standaard
normale verdeling N (0, 1).
Een aantal veelgebruikte integralen zijn de volgende:
µ+σ
Z
f (x) dx = 0, 682 68,2% van het oppervlak ligt in het gebied µ ± σ
µ−σ
µ+2σ
Z
f (x) dx = 0, 954 95,4% van het oppervlak ligt in het gebied µ ± 2σ
µ−2σ
µ+3σ
Z
f (x) dx = 0, 997 99,7% van het oppervlak ligt in het gebied µ ± 3σ
µ−3σ

Opgave 7.3 Genereer 25000 random getallen uit een normale verdeling met µ = 8 en
σ = 2. Gebruik hiertoe de ‘Randomgenerator’ van MS Excel uit het ‘Data analysis’
pakket onder het menu ‘Tools’.
a) Controleer de getallen op uitschieters door de getallen de sorteren. Verwijder even-
tuele uitschieters.
b) Bereken x̄ en s met AVERAGE en STDEV. Verifieer of het gemiddelde en de standaard-
deviatie overeenkomen met de opgegeven waarden van µ en σ.
c) Tel het aantal getallen dat tussen x̄ − s en x̄ + s ligt en vergelijk dit met de 2/3-
vuistregel uit §1.3 en met de theoretische waarde die hierboven genoemd is.
d ) Maak met de optie ‘Histogram’ uit het ‘Data analysis’ pakket een histogram van de
getallen en ga na of dit op een normale verdeling lijkt.
e) Voer deze procedure ook uit voor bijvoorbeeld 100 random getallen en vergelijk de
uitkomsten.

Opgave 7.4 Uit gegevens van het CBS blijkt dat de lengte van Nederlandse vrouwen
bij goede benadering normaal verdeeld is met µ = 168 cm en σ = 6 cm.
a) Bereken hoeveel % van de vrouwen langer is dan 176 cm.
b) Bereken hoeveel % van de vrouwen kleiner is dan 156 cm.
c) Bereken hoeveel % van de vrouwen een lengte heeft tussen de 158 en de 178 cm.
Gebruik voor de gewenste integralen zowel de tabel voor de normale verdeling als MS
Excel.
7.3. ENIGE VERDELINGSFUNCTIES 51

7.3.3 De Student t-verdeling

Voor relatief kleine aantallen meetuitkomsten, minder dan ongeveer 25, moet een andere
verdelingsfunctie gebruikt worden, de zogenaamde Student of t-verdeling, ontwikkeld door
W.S. Gossett in 1908 die onder het pseudoniem ‘Student’ werkte.

Hij bedacht dat de grootheid (x̄−µ)/(s/ n) een zogenaamde t-verdeling heeft in tegenstelling

tot de grootheid (x̄ − µ)/(σ/ n), die een standaard normale verdeling heeft.
Het blijkt dat de vorm van de functie afhankelijk is van een parameter ν die het aantal
vrijheidsgraden genoemd wordt (ν is hier het aantal metingen minus 1). De t-verdeling is
lager en breder dan een normale verdeling voor dezelfde parameters. Ook wordt de verdeling
lager en breder naarmate ν kleiner is. Zie Figuur 7.4.

0.4 standaard normale verdeling

0.3
t-verdeling, ν = 1
0.2

0.1

0 x
−3 −2 −1 0 1 2 3
Figuur 7.4. Een weergave van de kansdichtheidsfunctie van de t-verdeling (ν = 1)
en de standaard normale verdeling ter vergelijk.

In het limietgeval van n → ∞ gaat de t-verdeling over in de normale verdeling (vergelijk de


tabel in §11.1 met de tabel in §11.2 voor ν = ∞).
De functie die bij de t-verdeling hoort is ingewikkeld (zie §11.1) en zal niet verder besproken
worden. Gewoonlijk wordt alleen gebruik gemaakt van oppervlakken onder een deel van de
curve, namelijk bij het uitvoeren van de t-toets en bij het bepalen van betrouwbaarheids-
intervallen. Zie Hoofdstuk 9.

Opgave 7.5 Bereken het oppervlak onder de t-verdeling met ν = 10 vrijheidsgra-


den van t− = −1, 372 tot t+ = 3, 169. Gebruik zowel de tabel in §11.2 als de functie
TDIST(x;ν;tails) van MS Excel.
Hierbij is x de waarde tot waar de integraal moet worden geëvalueerd (met als begin-
punt −∞), ν het aantal vrijheidsgraden en tails geeft aan of er één of twee ‘staarten’
uitgesloten moeten worden (dit heeft te maken met eenzijdig of tweezijdig toetsen, zie
Hoofdstuk 9).
52 HOOFDSTUK 7 – VERDELINGSFUNCTIES
Hoofdstuk 8

Verwachtingswaarden

8.1 Verwachtingswaarden

Voor de kansdichtheidsfunctie f (x) gelden de volgende eigenschappen, zoals deze al in het


vorige hoofdstuk genoemd zijn:

1. f (x) dx ≥ 0
de kans op een willekeurige meetuitkomst tussen x en x + dx is altijd ≥ 0;
R∞
2. f (x) dx = 1
−∞
het totaal van de kansen op alle meetuitkomsten is één;
Rb
3. P (a ≤ x < b) = f (x) dx
a
de kans op een meetuitkomst tussen a en b is gelijk aan het oppervlak onder f (x) van
a tot b.

Met de kansdichtheidsfunctie is het mogelijk om zogenaamde verwachtingswaarden te


berekenen. Algemeen geldt dat de verwachtingswaarde E van een functie g(x) wordt gegeven
door:
Z∞
E(g(x)) ≡ hg(x)i ≡ g(x) · f (x) dx (8.1)
−∞

In woorden: de verwachtingswaarde van een functie g(x), weergegeven met het symbool E
van ‘expectation’ of met h i voor verwachtingswaarde, is de gemiddelde waarde van g(x),
gemiddeld over de hele uitkomstenruimte van x. Daarbij wordt aan het voorkomen van elke
x een ‘gewicht’ of ‘kans’ toegekend ter grootte van f (x) dx.

Voorbeeld 8.1 Voor discrete functies is het berekenen van verwachtingswaarden bekend,
bijvoorbeeld bij het gooien van een dobbelsteen. Voor een worp van 1, 2, 3, 4, 5 en 6 is
de kans P (wi ) = 1/6. Het berekenen van de verwachtingswaarde geeft:
i=6
1 1 1 1 1 1 X
hwi = 1 · + 2 · + 3 · + 4 · + 5 · + 6 · = wi · P (wi ) = 3, 5
6 6 6 6 6 6 i=1

Als nu bijvoorbeeld de verwachtingswaarde van het kwadraat van een worp berekend
moet worden, dan volgt analoog:
i=6
1 1 1 1 1 1 X 2
hwi = 12 · + 22 · + 32 · + 42 · + 52 · + 62 · = wi · P (wi ) = 15, 1667
6 6 6 6 6 6 i=1

53
54 HOOFDSTUK 8 – VERWACHTINGSWAARDEN

Hieruit volgt de algemene uitdrukking voor een willekeurige verwachtingswaarde met een
discrete kansverdeling: X
hg(x)i = g(xi ) · P (xi )
Hierbij moet de som worden genomen over alle mogelijke uitkomsten.
Analoog voor deze discrete kansverdeling met een sommatie, moet in het geval van een
continue kansverdeling worden geı̈ntegreerd (8.1).

We zullen nu een aantal in de chemie veel gebruikte bijzondere gevallen behandelen.

8.1.1 De verwachtingswaarde van x

De verwachtingswaarde van de meetvariable x zelf wordt ook wel de meetverwachting of


het populatiegemiddelde genoemd:
Z∞
E(x) = hxi = x · f (x) dx (8.2)
−∞

Als f (x) de normale verdeling is, dan volgt:


Z∞
(x − µ)2
 
1
E(x) = hxi = x· √ exp − dx (8.3)
σ 2π 2σ 2
−∞

Uitwerken van deze integraal levert hxi = µ. Dit is ook in te zien zonder rekenwerk, want
de gemiddelde waarde over alle mogelijke meetuitkomsten is bij de symmetrische normale
verdeling met het maximum bij µ natuurlijk gelijk aan µ.
Opgave 8.1 Bereken de meetverwachting van de exponentiële verdeling. Integreer van
0 tot ∞ (zie §7.3.1).

8.1.2 De populatievariantie van x

De variantie van x wordt gedefinieerd als de verwachtingswaarde van het kwadraat van het
verschil tussen x en het populatiegemiddelde van x. Het wordt genoteerd als Var(x), en
geformuleerd als:
Var(x) = h(x − hxi)2 i = hx2 i − hxi2 (8.4)
In het geval van de normale verdeling volgt:
Z∞
(x − µ)2
 
2 1
Var(x) = (x − hxi) · √ exp − dx (8.5)
σ 2π 2σ 2
−∞
R∞
Deze integraal kan uitgewerkt worden door gebruik te maken van hxi = µ en f (x) dx = 1.
−∞
Dit levert op dat Var(x) = σ 2 voor de normale verdeling.
Opgave 8.2
a) Bereken de variantie voor de exponentiële verdeling. Tip: splits het kwadraat en
bereken de drie integraaltermen afzonderlijk.
b) Bereken de variantie en de verwachtingswaarde voor de standaard normale verdeling.
c) Bereken de gemiddelde snelheid en de variantie van de snelheid voor de atomen in
een gas dat aan de Maxwell-vergelijking
R 2 voldoet. √Zoek de
R relevante2 vergelijkingen
2
zelf op. Gegeven is dat
√ x exp(−x ) dx = 0, 25 π en x exp(−x ) dx = 0, 5 en
exp(−x2 ) dx = 0, 5 π, allemaal geintegreerd van 0 tot ∞.
R
8.2. STEEKPROEF EN POPULATIE 55

8.2 Steekproef en populatie

Bij een meetprocedure wordt gewoonlijk een beperkt aantal metingen verricht. In veel geval-
len zijn een oneindig aantal metingen in principe mogelijk, zoals bijvoorbeeld bij het wegen
van een voorwerp, maar tijd en kosten vormen gewoonlijk beperkende voorwaarden voor het
doen van heel veel metingen.
Het is meestal voldoende om een steekproef uit te voeren die een deelverzameling is van n
uitkomsten uit de verzameling van alle mogelijke meetuitkomsten, de populatie.

Voorbeeld 8.2 Van een scheepslading van 5000 ton ijzererts moet het ijzergehalte
zorgvuldig geanalyseerd worden. De hele populatie bestaat in dit geval bijvoorbeeld uit
5 · 1010 mogelijke meetuitkomsten aan monsters van 1 g.
In de praktijk worden er bijvoorbeeld eerst 100 ertsmonsters van 10 kg genomen. Deze
worden ieder afzonderlijk gemalen en van elk van deze 100 gemalen monsters worden 3
analysemonsters van 1 g genomen, zodat de uiteindelijke meting wordt uitgevoerd met
een (toch nog erg grote) steekproef van 300 meetuitkomsten.
Uit kostenoogpunt wordt de analyse tot 10 (willekeurig gekozen) monsters beperkt.

Aan een populatie van meetuitkomsten, die altijd uit de volledige verzameling van alle moge-
lijke meetuitkomsten bestaat, kan gewoonlijk een kansdichtheidfunctie worden toegeschreven.
Uit een histogram kan bijvoorbeeld een functie worden afgeleid (‘gefit’).
Hierbij wordt de meetverwachting hxi benaderd door het experimenteel gevonden steekproef-
gemiddelde x̄, en de populatievariantie Var(x) door de steekproefvariantie s2 .
Wanneer de steekproef overgaat in de hele populatie (als n nadert naar de volledige popu-
latiegrootte), zal de steekproefvariantie overgaan in de populatievariantie, en het steekproef-
gemiddelde in het populatiegemiddelde.
Voor x̄ en s kunnen de verwachtingswaarden ook berekend worden:
hx̄i = hxi (= µ voor de normale verdeling) (8.6)
2
hs i = Var(x) (= σ2 voor de normale verdeling) (8.7)
x̄ en s2 worden schatters genoemd voor µ en σ 2 .
Voor het steekproefgemiddelde en de steekproefvariantie kunnen twee belangrijke eigenschap-
pen worden afgeleid:
Var(x)
Var(x̄) = (= σ 2 /n voor de normale verdeling) (8.8)
n
2σ 4
Var(s2 ) = (alleen voor de normale verdeling) (8.9)
n−1
Wat nauwkeuriger beschouwd blijkt te gelden dat als x normaal verdeeld is met parameters

µ en σ, dan heeft x̄ een normale verdeling met parameters µ en σ/ n. De verdeling van x̄ is
dus veel ‘smaller’ dan die van x.

Opgave 8.3
a) Bewijs (8.6). Tip: schrijf x̄ als een sommatie en bedenk dat hxi i = hxi voor alle xi .
b) Bewijs (8.7). Tip: schrijfPs2 op en werk de kwadraten uit en bedenk dat (xi − x̄)2 =
2
((xi − µ) − (x̄ − µ)) en (xi − µ) = n(x̄ − µ).
c) Bewijs (8.8). Tip: schrijf x̄ als een sommatie en bedenk dat Var(constante · x) =
Var(x) · constante2 en dat Var(xi ) = Var(x) voor alle xi .

Uit (8.9) blijkt dat s2 in veel gevallen een erg grote variantie (en dus onnauwkeurigheid)
heeft, vanwege de factor σ 4 , zodat s gewoonlijk maar in één significant cijfer opgegeven hoeft
te worden (zie §4.2).
56 HOOFDSTUK 8 – VERWACHTINGSWAARDEN

Voorbeeld 8.3 Neem een meetserie waarvoor geldt n = 5 en s = 0, 050. Veronderstel


dat deze metingen een deelverzameling zijn van een populatie met een normale verdeling
met σ = 0, 055. Dan is s2 = 25 · 10−4 en Var(s2 ) = 457, 5 · 10−8 .
Dus de standaarddeviatie in s2 is volgens (8.9) gelijk aan 21, 39 · 10−4. Dit is van dezelfde
grootte-orde als s2 zelf. Dus hoewel s in dit voorbeeld toevallig erg dicht in de buurt van
σ ligt, is deze waarde erg onzeker!

Van (8.8) wordt gebruik gemaakt bij het schatten van de standaarddeviatie in het gemiddelde,
ook als er maar één gemiddelde wordt gemeten. Er geldt namelijk dat Var(x̄) = σ 2 /n, wat
benaderd kan worden met Var(x̄) ≈ s2 /n. Dit is een betere benadering naarmate n groter

wordt. De standaarddeviatie in het gemiddelde wordt dan gegeven door: sg ≈ s/ n, zoals
al werd gegeven door (1.6).
Op grond van dit model kan dus een schatting gemaakt worden van de standaarddeviatie van
het gemiddelde op grond van slechts één serie metingen leidend tot dit gemiddelde.

N.B. In de dagelijkse spreektaal wordt er vaak gesproken over de ‘beste uitkomst’. Er


wordt dan in feite het steekproefgemiddelde bedoeld. Het woord ‘fout’ is dan synoniem voor
de standaarddeviatie. Als er gesproken wordt over de fout in de beste uitkomst, wordt sg
bedoeld. Let op, want deze begrippen worden vaak slordig gebruikt!

Opgave 8.4 Een groep van acht studenten meet de waarde van de constante van Faraday.
De uitkomsten zijn (in C mol−1 :

95750 96620 94780 97290 99510 93260 94280 96200

Bereken de ‘beste uitkomst’ en de ‘fout’ daarin.

Opgave 8.5 Uit 1000 analyses van een gehomogeniseerd ertsmonster blijkt dat het
gehalte ijzer 37, 41% is met een standaarddeviatie van 0, 50%. Beschouw deze uitkomsten
als populatiewaarden.
Er werden zes steekproeven genomen van ieder vijf metingen. De meetuitkomsten zijn
(in %Fe):
1. 37, 9 37, 5 36, 3 37, 9 37, 5
2. 37, 1 38, 6 37, 0 36, 6 37, 2
3. 37, 2 38, 2 37, 3 37, 6 36, 6
4. 36, 8 37, 4 37, 9 37, 3 38, 1
5. 36, 9 37, 5 38, 2 37, 9 38, 1
6. 37, 2 37, 7 37, 0 36, 6 37, 0

a) Bepaal voor elke steekproef het gemiddelde en de variantie.


b) Bepaal de varianties in de steekproefgemiddelden en de steekproefvarianties. Verge-
lijk de uitkomsten met de theoretische waarden, berekend met (8.8) en (8.9).
c) Ga na of voor de gecombineerde steekproef van alle dertig meetuitkomsten het gemid-
delde en de variantie beter lijken op het populatiegemiddelde en de populatievari-
antie, dan voor de aparte steekproeven.

√ √
Let op dat de variabele (x̄−µ)/(s/ n) een tn−1 verdeling heeft. De variabele (x̄−µ)/(σ/ n)
heeft een N (0, 1) verdeling.
Voor de t-verdeling geldt dat hxi = 0 en dat Var(x) = 1 + 2/(ν − 2), waarbij ν > 2 moet zijn.
Hoofdstuk 9

Statistische toetsen

9.1 Betrouwbaarheidsinterval voor een meetverwachting en


voor een (populatie)-variantie

Uit de kansverdeling voor het gemiddelde is gemakkelijk het zogenaamde betrouwbaar-


heidsinterval voor de meetverwachting µ af te leiden. Dat is het interval waarbinnen deze
populatieparameter met een zekere waarschijnlijkheid ligt.

In Hoofdstuk 8 werd gezegd dat de variabele (x̄ − µ)/(s/ n) een tn−1 verdeling heeft. De
waarschijnlijkheid dat deze variabele een uitkomst heeft tussen t− en t+ is gelijk te stellen
aan (1 − α) · 100%. Hierbij kan ofwel de waarde van α gekozen worden, ofwel de waarden van
t− en t+ , die gewoonlijk in absolute waarde aan elkaar gelijk genomen worden.
Meestal wordt voor α een klein getal gekozen (bv. 0, 05 of 0, 01), terwijl de waarden van
t− en t+ dan uit kansverdeling volgen. Het getal α heet de onbetrouwbaarheid en heeft
te maken met de kans die gewenst is voor een bepaalde uitkomst van een meting van een
grootheid.

Voorbeeld 9.1 In een bepaald geval wordt gemeten x̄ = 8, 120, s = 0, 162 en n = 11. Er
wordt gekozen voor een onwaarschijnlijkheid van α = 0, 05 (d.w.z. een waarschijnlijkheid
van 95%). Voor n = 11 is het aantal vrijheidsgraden ν = 10.
Uit de t-tabel (zie §11.2) of met behulp van de MS Excel functie TINV(0.05;10) wordt
voor de absolute waarde van t de waarde 2, 228 gevonden. √
Er kan nu geconcludeerd worden dat de uitkomst van de variabele (x̄ − µ)/(s/ n) met
een waarschijnlijkheid van 95% tussen −2, 228 en +2, 228 ligt.

Let op! Bij bijvoorbeeld het gebruik van de functie TINV in MS Excel, wordt de zoge-
naamde tweezijdige kans (two-tailed) berekend. Dit betekent dat van de (hier symmetrische)
kansverdeling beide uiteinden van de grafiek (de staart) weggelaten worden.
In de figuur van de t-verdeling in 11.2 is de eenzijdige kans α = 0, 025 aangegeven als het
oppervlak van het rechter ‘staartje’ onder de curve. De bijbehorende t+ -waarde is 2, 093 voor
ν = 19.

Algemeen kan gesteld worden dat met P (α) = (1−α)·100% kans, de variabele (x̄−µ)/(s/ n)
tussen t− en t+ ligt. Dit is ook te schrijven als:
√ √
x̄ − tν,α · s/ n ≤ µ ≤ x̄ + tν,α · s/ n (9.1)
Hierin is tν,α de absolute waarde van t− en t+ die geldt voor een kans P (α) en ν vrijheidsgra-
den. Hiermee is een interval gevonden voor de onbekende meetverwachting, dat rechtstreeks
uit de meetuitkomsten n, x̄ en s kan worden afgeleid, afhankelijk van de nauwkeurigheid
waarmee de meetverwachting bekend moet zijn.

57
58 HOOFDSTUK 9 – STATISTISCHE TOETSEN

Voorbeeld 9.2 Er werd een bepaling gedaan van de constante van Faraday waaruit
volgde dat x̄ = 96400, s = 2000 en n = 20. Bereken het 95%-betrouwbaarheidsinterval
voor de meetverwachting µ van de constante van Faraday.
Uit n = 20 volgt dat ν = 19. Kies α = 0, 05 (waarschijnlijkheid
√ van 95%). Het berekenen
met TINV(0.05;19) geeft t = 2, 0930 en t · s/ n = 936, 02. Met 95% betrouwbaarheid
wordt het gevraagde betrouwbaarheidsinterval dus gegeven door 95440 ≤ µ ≤ 97360

Opgave 9.1 Voor het azijnzuurgehalte in azijn wordt door titratie gevonden (in g 100
mL−1 ):
3, 992 4, 012 3, 988 4, 023 4, 020 4, 008 4, 038 4, 025
Bereken het 95%-betrouwbaarheidsinterval voor de meetverwachting µ van het azijnzuur-
gehalte.

Opgave 9.2 Voor de meting van het equivalent geleidingsvermogen van azijnzuur vonden
negen studenten de volgende uitkomsten (in Ω−1 mol−1 cm2 ):
395, 6 397, 0 389, 3 392, 6 398, 7 402, 3 386, 7 393, 0 399, 0
Als deze uitkomsten worden beschouwd als een steekproef uit een populatie met een
normale verdeling, bereken dan het interval waarin het populatiegemiddelde µ met een
waarschijnlijkheid van 99% ligt.

In §6.7 werd het betrouwbaarheidsinterval vermeld voor de meetverwachting van een resultaat
voor een monster dat met behulp van een lineaire ijklijn wordt verkregen (6.19). Deze formule
lijkt qua structuur erg op (9.1):
C − tν,α · sC ≤ µC ≤ C + tν,α · sC (9.2)
Voor de populatievariantie σ 2 wordt het (1 − α) · 100%-betrouwbaarheidsinterval uit de χ2 -
verdeling als volgt berekend:
ν · s2 /χ2 ν,α/2 ≤ σ 2 ≤ ν · s2 /χ2 ν,1−α/2 (9.3)

Merk op dat dit geen symmetrisch interval is, want de χ2 -verdeling is niet symmetrisch. Er
wordt wel steeds links en rechts α/2 voor de waarschijnlijkheid genomen.

Opgave 9.3 Gebruik de meetgegevens uit Opgave 9.2, maar bepaal nu ook het 99%-
betrouwbaarheidsinterval voor de variantie als voor de standaarddeviatie van het azijn-
zuurgehalte. Gebruik de MS Excel functie CHIINV. Let op dat die ‘one tailed’ is.

9.2 Hypothese

Met behulp van statistiek is het mogelijk om uitspraken te doen over bepaalde waarschijn-
lijkheden in populaties. Bijvoorbeeld: “De waarschijnlijkheid dat een bepaalde student voor
een zekere concentratiemeting een uitkomst lager dan 0, 0900 mol L−1 vindt is 25%.”.
Een ander soort statistische uitspraak is het aangeven van een betrouwbaarheidsinterval.
Bijvoorbeeld: “De kans dat, op grond van deze steekproef van vijf metingen, de verwacht-
ingswaarde van de [HCl] van deze oplossing tussen 0, 0800 M en 0, 0900 M ligt is 95%.”

Bovengenoemde soorten waarschijnlijkheidsuitspraken worden zogenaamde statistische hy-


pothesen genoemd en het onderzoek naar de geldigheid van dit soort uitspraken heet het
toetsen van hypothesen. Een dergelijke toets heeft als doel om een bepaalde hypothese
te verwerpen dan wel aan te nemen. Naast de zogeheten nulhypothese H0 wordt altijd een
alternatieve hypothese HA opgesteld die complementair is aan de nulhypothese.
9.2. HYPOTHESE 59

Voorbeeld 9.3 In een onderzoek wordt getoetst of een groep mensen gemiddeld langer
is dan 1, 75 m. De twee hypothesen die opgesteld worden zijn:
H0 : µ > 1, 75 m (nulhypothese) HA : µ ≤ 1, 75 m (alternatieve hypothese)

Ook kan bijvoorbeeld worden getoetst of de gemiddelde uitkomsten van twee meetpopu-
laties van elkaar verschillen. De hypothesen zijn dan:
H0 : µ1 − µ2 = 0 (nulhypothese) HA : µ1 − µ2 6= 0 (alternatieve hypothese)

Wanneer de alternatieve hypothese aangeeft dat de waarde van de toetsingsvariabele boven


of onder een aangegeven waarde ligt, heet dat een eenzijdige toets.
Voorbeeld 9.4 Een voorbeeld van een eenzijdige toets:
H0 : µ = 100 (nulhypothese) HA : µ < 100 (alternatieve hypothese, eenzijdig)

In het geval dat een alternatieve hypothese aangeeft dat de waarde van de toetsingsvariabele
boven en onder een aangegeve waarde ligt, heet dat een tweezijdige toets.
Voorbeeld 9.5 Een voorbeeld van een tweezijdige toets:
H0 : µ = 100 (nulhypothese) HA : µ 6= 100 (alternatieve hypothese, eenzijdig)

Een statistische toets kan in principe nooit volledige zekerheid geven over een hypothese, maar
ze kan slechts aangeven met welke waarschijnlijkheid de nulhypothese waar en de alternatieve
hypothese onwaar is. Meestal wordt deze waarschijnlijkheid, het betrouwbaarheidsniveau
(Engels: confidence level), aangegeven met de waarde (1−α). De waarschijnlijkheid waarmee
H0 uiteindelijk onterecht verworpen kan worden is dan α.
De grootheid α wordt de onbetrouwbaarheid genoemd. Het volgende schema kan hiervoor
worden opgesteld:

H0 is waar HA is waar
H0 wordt geaccepteerd Juiste beslissing Onjuiste beslissing
Kans = 1 − α Kans = β
(fout van de 2e soort)
H0 wordt verworpen Onuiste beslissing Juiste beslissing
Kans = α Kans = 1 − β
(fout van de 1e soort)
Er wordt hier niet verder ingegaan op de waarde van β en de voordelen bij het waar zijn van
de alternatieve hypothese. Zie §10.1, ref. 5, 7.

Bij het toetsen van hypothesen wordt in het algemeen de volgende standaardprocedure
gehanteerd:

1. Formuleer de nulhypothese H0 en accepteer deze als waar;


2. Zoek een geschikte statistische toetsvariabele en zijn verdelingsfunktie;
3. Stel de grootte van de onbetrouwbaarheid α vast;
4. Bepaal het acceptatiegebied voor de toetsvariabele als de nulhypothese geldt;
5. Bepaal de actuele waarde van de toetsvariabele, en vergelijk met 4;
6. Neem de statistische beslissing: accepteer of verwerp H0 definitief.

In de volgende paragrafen zullen een aantal statistische toetsen worden behandelen. Het
eerste voorbeeld zal zeer uitvoerig worden uitgewerkt aan de hand van de net geformuleerde
zes stappen. De daaropvolgende voorbeelden worden beknopt weergegeven.
60 HOOFDSTUK 9 – STATISTISCHE TOETSEN

9.3 De u-toets voor één populatiegemiddelde (σ bekend)

Met deze toets wordt onderzocht of het verschil tussen een onbekend
populatiegemiddelde µ en een referentiewaarde µ0 significant is. Hierbij
moet een steekproefgemiddelde x̄ en de populatievariantie σ 2 bekend
zijn.

Voorbeeld 9.6 Een docent onderzoekt of de gemiddelde uitkomst van de meting van het
getal van Avogadro door de studenten van zijn practicum afwijkt van een geaccepteerde
literatuurwaarde van 6, 023 · 1023 mol−1 .
Uit jarenlange ervaring was gebleken dat de resultaten van dit soort studentmetingen een
normale verdeling vormen met populatievariantie σ 2 = (0, 250 · 1023 )2 .
De docent neemt uit de uitkomsten een steekproef van n = 25 studentmetingen en vindt
dat x̄ = 6, 162 · 1023 .
Wijkt deze waarde significant af van de literatuurwaarde?

De zes punten van het algemene voorschrift worden toegepast:

1. Formuleer de nulhypothese H0 en accepteer deze


De toets draait om de waarde van het populatiegemiddelde, dus H0 : µ = 6, 023 · 1023 . Deze
hypothese wordt voorlopig geaccepteerd en er wordt aangenomen µ = µ0 = 6, 023 · 1023 .

2. Zoek een geschikte statische toetsvariabele en zijn verdelingsfunctie


Een steekproefgemiddelde x̄ is normaal verdeeld met variantie σ 2 /n, en met populatiegemid-

delde µ. De statistische variabele u = (x̄ − µ)/(σ/ n) is standaard-normaal verdeeld (zie
§7.3.2), dus N (0, 1).
Als x̄ ongeveer gelijk is aan 6, 023 · 1023 , dan zal u ongeveer nul zijn en zal de neiging groot
zijn om H0 te accepteren. Is x̄ echter veel groter of kleiner, dan zal u een grote positieve of
negatieve waarde hebben en moet H0 worden verworpen. Het probleem is het bepalen van
het acceptatiegebied van H0 : binnen welke zogeheten kritieke waarden u+ en u− moet
H0 nog net geaccepteerd worden of moet H0 worden verworpen?

3. Bepaal de onbetrouwbaarheid
De kritieke waarden u+ en u− hangen samen met de kans α op een fout van de eerste soort
(het ten onrechte verwerpen van een juiste H0 ). Er geldt (zie ook Figuur 9.1):

Hoe groter de waarde van α, hoe kleiner het acceptatiegebied van H0


en dus hoe eerder deze verworpen wordt.

Als er gekozen wordt voor α < 0, 01, dan is de kans op een fout van de eerste soort klein en is
het acceptatiegebied van H0 dus groot. De kans op de verwerping van H0 wordt hiermee klein,
maar de toets werkt niet discriminerend meer. Dit wordt duidelijk bij onzekere verschijnselen:
een voorspelling zekerder maken betekent dat de uitspraak vager wordt (denk bijvoorbeeld
aan het voorspellen van het weer van overmorgen). Gewoonlijk wordt in de wetenschap
gekozen voor α = 0, 05 of α = 0, 01 (tweezijdig), of α = 0, 025 of α = 0, 005 (éénzijdig).

4. Bepaal het acceptatiegebied voor de toetsvariabele als de nulhypothese geldt


Als de verdelingsfunctie voor de variabele u bekend is en er is een waarde van α gekozen, dan
kan het acceptatiegebied bepaald worden met behulp van de tabel in 11.1.
Met α = 0, 025 (eenzijdig) moet worden gezocht naar F (u) = 1 − α = 0, 9750. Deze waarde
wordt gevonden voor u+ = 1, 96 en via de symmetrie geldt u− = −1, 96.
9.3. DE U-TOETS VOOR ÉÉN POPULATIEGEMIDDELDE 61

Ook kan gebruik gemaakt worden van MS Excel. De functie NORMINV(0.025;0;1) geeft
u− = −1, 95996 en NORMINV(0.975;0;1) geeft u+ = 1, 95996.
Zie Figuur 9.1 voor een grafische weergave van deze berekening.

x
−1.96 0 1.96

Figuur 9.1. Weergave van het 95%-acceptatiegebied (wit) voor de u-toets, twee-
zijdig. Beide grijze vlakken vertegenwoordigen ieder 2, 5% van het totaaloppervlak
onder de curve. Waarden van ua die in deze gebieden vallen leiden tot het verwerpen
van H0 .

Uit de grenswaarden van u kan voor Voorbeeld 9.6 het gebied berekend worden waarbinnen de
meetwaarden van de constante van Avogadro nog acceptabel zijn. Door de bekende waarden

µ = µ0 , n, σ in te vullen in u = (x̄ − µ)/(σ/ n) kan worden afgeleid dat het acceptatiegebied
loopt van x̄− = 5, 925 · 1023 tot x̄+ = 6, 121 · 1023 .

5. Bepaal de actuele waarde van de toetsvariabele


Voor de steekproef kan de actuele waarde ua berekend worden (bedenk hierbij dat µ = µ0
omdat H0 als waar is aangenomen). Deze berekening geeft ua = (6, 162 · 1023 − 6, 023 ·

1023 )/(0, 25 · 1023 / 25) = 2, 78.

6. Neem de statistische beslissing


De zojuist uit de metingen berekende waarde van ua ligt niet binnen het acceptatiegebied van
H0 dat loopt van −1, 96 tot +1, 96: |u+ | > ua . De oorspronkelijke acceptatie van H0 was dus
onjuist en de nulhypothese moet worden verworpen. Dit betekent dus dat het gemiddelde
van de 25 studenten te hoog is ten opzichte van de literatuurwaarde. Let op dat er alsnog
een kleine kans bestaat dat deze verwerping ten onrechte gebeurt!

Opgave 9.4 Lange ervaring heeft geleerd dat bij een zilveranalyse aan een grote par-
tij munten de uitkomst van regelmatig uitgevoerde steekproeven gemiddeld 73, 5% Ag
bedraagt met een standaarddeviatie van 0, 6% Ag. Na een wijziging in de productie-
methode wordt één nieuwe steekproef van 20 analyses genomen waarvan de gemiddelde
uitkomst 73, 2% Ag bedraagt.
Indien aangenomen wordt dat door de wijziging in de productiemethode de populatie-
standaarddeviatie niet is veranderd, mag dan worden aangenomen dat het gehalte aan
zilver van de net geanalyseerde partij afwijkt van de normwaarde 73, 5%? Met andere
woorden, mag worden aangenomen dat de productiemethode significant is gewijzigd?
Toets dit met een onbetrouwbaarheid van 0, 5% en 2, 5%, beide eenzijdig.
62 HOOFDSTUK 9 – STATISTISCHE TOETSEN

9.4 De t-toets voor één populatiegemiddelde (σ onbekend, s


bekend)
Met deze toets wordt onderzocht of het verschil tussen een onbekend
populatiegemiddelde µ en een referentiewaarde µ0 significant is. Hierbij
moet een steekproefgemiddelde x̄ en een steekproefvariantie s2 bekend
zijn (een populatiegemiddelde σ 2 is onbekend).

Het verschil tussen de u-toets uit de vorige paragraaf en de t-toets, is dat σ 2 onbekend is,
maar dat er wel een s2 uit de steekproef bekend is. Dit is de normale situatie bij vrijwel
iedere meting!
Het stappenplan ziet er als volgt uit:

1. H0 : µ = µ0 . Accepteer H0 .

2. Bereken voor een steekproef van n elementen het gemiddelde x̄ en de variantie s2 .



Berken de toetsvariabele t = (x̄ − µ)/(s/ n). Bij deze variabele hoort de Student
t-verdeling met het aantal vrijheidsgraden ν = n − 1.

3. Stel de waarde van α vast. Deze volgt uit de probleemstelling. Vaak zal α = 0, 05 zijn.

4. Het acceptatiegebied voor t volgt uit een t-tabel (zie §11.2). Zoek de waarde van t+ op
voor ν = n−1 en een onbetrouwbaarheid α via F (t) = 1−α (eenzijdig) of F (t) = 1−α/2
(tweezijdig). De waarde van t kan ook met MS Excel bepaald worden met de functie
TINV(α;ν). Let op dat hierbij α altijd tweezijdig moet worden opgegeven.

5. Bereken uit de steekproefuitkomsten de actuele waarde ta onder acceptatie van H0 :



t = (x̄ − µ)/(s/ n)

6. Als |ta | > t+ dan moet H0 worden verworpen.

Voorbeeld 9.7 Voor een populatie van analyseresultaten van de constante van Faraday
geldt µ = 96487 C mol−1 . De variantie is onbekend.
Een groep studenten doet 20 metingen voor de constante op dezelfde meetwijze als voor
de populatie hierboven bedoeld, en verkrijgt een gemiddelde van 95500 C mol−1 en een
standaarddeviatie van 2000 C mol−1 .
Wijkt het gemiddelde van deze groep significant af van het populatiegemiddelde of niet?
Toets dit eenzijdig voor α = 0, 5% en α = 2, 5%.
Uitwerking

1. H0 : µ = µ0 = 96487. Accepteer H0 .
2. De toetsvariabele is t met ν = n − 1 = 19.
3. α1 = 0, 005 (eenzijdig) en α2 = 0, 025 (eenzijdig).
4. Opzoeken voor F (t) = 1 − α geeft t+,1 = 2, 861 en t+,2 = 2, 093. Met behulp van
MS Excel: TINV(0.01;19) = 2, 8609 en TINV(0.05;19) = 2, 0930.

5. ta = (95500 − 96487)/(2000/ 20) = −2, 207.
6. Voor α = 2, 5% geldt |ta | > t+,1 , dus de acceptatie van H0 was niet juist en er is
wel een significante afwijking.
Voor α = 0, 5% geldt |ta | < t+,2 , dus de acceptatie van H0 was juist en er is geen
significante afwijking.

Dit antwoord is in overeenstemming met de constatering dat bij grotere α de nulhypothese


eerder verworpen wordt, omdat het acceptatiegebied dan kleiner is.
9.4. DE T-TOETS VOOR ÉÉN POPULATIEGEMIDDELDE 63

Opgave 9.5 Een door een ijkinstituut gecertificeerd zilver-standaardmonster bevat


99, 5% Ag. Met een nieuwe analysemethode werd het zilvergehalte van dit monster
bepaald. Een steekproef van 20 analyses leverde een gemiddeld gehalte van x̄ = 99, 2%
Ag, met een standaarddeviatie van s = 0, 5%.
Mag op grond van deze meetuitkomsten worden aangenomen dat het gehalte aan zilver,
behaald met de nieuwe analysemethode, significant afwijkt van de normwaarde 99, 5%?
Toets dit voor een onbetrouwbaarheid van 0, 5% (eenzijdig).

Opgave 9.6 Het ‘normale’ gehalte van stof Q in bloed van kinderen is 5, 0 mg L−1 . Van
een bepaalde groep kinderen wordt vermoed dat door een gemeenschappelijke oorzaak
hun gehalte aan Q te laag is en worden 15 bloedmonsters genomen. Bij analyse werden
de volgende meetuitkomsten gevonden voor het gehalte Q (mg L−1 ):

4, 0 4, 1 4, 2 4, 4 4, 4 4, 5 4, 5 4, 7 4, 8 4, 9 4, 9 4, 9 5, 0 5, 2 5, 2

Geven deze analyseresultaten steun aan het vermoeden van het te lage Q-gehalte? Toets
met α = 0, 025 (eenzijdig).

De volgende algemene conclusies kunnen nog uit deze voorbeelden worden afgeleid:

– Ten gevolge van de onbekendheid van σ (waarvoor slechts een schatting bekend is in
de vorm van s) wordt het acceptatiegebied van H0 groter; de H0 mag minder gauw
verworpen worden bij de t-toets dan bij de u-toets. Dit komt tot uiting in het feit dat
de kritieke t-waarden groter zijn dan de corresponderende u-waarden.
– Voor kleinere α wordt het acceptatiegebied van H0 ook groter, want er moet een grotere
‘zekerheid’ 1 − α zijn, voordat H0 moet worden verworpen.
64 HOOFDSTUK 9 – STATISTISCHE TOETSEN

9.5 De t-toets voor twee populatiegemiddelden (σ-waarden


onbekend, s-waarden bekend)

Voor deze toets zijn twee verschillende versies. Voor de eerste versie geldt dat de onbekende
σ-waarden gelijk zijn. Dit heet homoscedastisch. Voor de tweede versie zijn de onbekende
σ-waarden ongelijk. Dit heet heteroscedastisch.

9.5.1 Homoscedastisch

Met deze toets wordt onderzocht of er een significant verschil is tussen


twee populatiegemiddelden µA en µB op grond van twee steekproeven.
Hierbij zijn de populatiestandaarddeviaties σA en σB onbekend maar
gelijk van grootte.

Het stappenplan:

1. H0 : µA = µB . Accepteer H0 .

2. Voor de toetsvariabele geldt:

t = ((x̄A − x̄B ) − (µA − µB )) /S (9.4)


s
(nA − 1)sA 2 + (nB − 1)sB 2
 
1 1
S = + (9.5)
nA + nB − 2 nA nB

De variabele t is verdeeld volgens een t-verdeling met ν = νA + νB = nA + nB − 2


vrijheidsgraden.

3. De onbetrouwbaarheid is tweezijdig, bijvoorbeeld α = 0, 05.

4. De kritieke t-waarden worden opgezocht in §11.2 voor de betreffende ν en α, of worden


berekend met MS Excel via TINV(α;ν).

5. De actuele waarde ta onder aanname van H0 , is ta = (x̄A − x̄B )/S.

6. Als |ta | > t+ , dan wordt H0 verworpen.

Voorbeeld 9.8 Voor een titerstelling van twee titers A en B werd een aantal malen een
titratie uitgevoerd. De gevonden titerconcentraties zijn (mol L−1 ):

A: 0, 131 0, 134 0, 129 0, 126 0, 132 0, 135


0, 138 0, 134 0, 130 0, 129 0, 132 0, 131
B: 0, 126 0, 124 0, 128 0, 129 0, 130 0, 129
0, 132 0, 126 0, 131 0, 129 0, 132 0, 128

Ga na of op grond van deze steekproeven geconcludeerd mag worden dat de titers A en


B verschillen. Neem aan dat de standaarddeviaties van beide populaties (A en B) gelijk
zijn. Test met α = 5% (tweezijdig).
9.5. DE T-TOETS VOOR TWEE POPULATIEGEMIDDELDEN 65

Uitwerking
Neem H0 aan: H0 : µA = µB . Reken de verschillende parameters uit: nA = 12, nB = 12,
x̄A = 0, 13175, x̄B = 0, 12867, sA = 0, 003194455, sB = 0, 002461830.
Invullen geeft: S = 0, 001164 en dan ta = 2, 6455.
Het opzoeken van de kritieke waarden met ν = 12 + 12 − 2 = 22 en α = 0, 05 geeft
t+ = 2, 074 (of met MS Excel TINV(0.05;22)) en dus t− = −2, 074. De actuele ta is
groter dan t+ , dus de nulhypothese moet verworpen worden: de twee titers zijn niet gelijk.

Opgave 9.7 Van twee monsters wordt het loodgehalte bepaald door titratie met EDTA.
De volgende meetwaarden worden verkregen (in massa-% Pb):

Monster A: 60, 34 60, 66 60, 52 60, 40 60, 72 60, 52


Monster B: 60, 28 60, 48 60, 26 60, 42 60, 20 60, 16 60, 30

Ga na of monsters A en B dezelfde meetverwachting voor het loodgehalte kunnen hebben.


Toets dit met α = 0, 02 (tweezijdig).

9.5.2 Heteroscedastisch

Met deze toets wordt onderzocht of er een significant verschil is tussen


twee populatiegemiddelden µA en µB op grond van twee steekproeven.
Hierbij zijn de populatiestandaarddeviaties σA en σB onbekend maar
ongelijk van grootte.

De beslissing om een homo- of heteroscedastische t-toets uit de voeren kan gemaakt worden
door een zogenaamde F-toets toe te passen op de twee varianties (zie §9.7). Indien uit de toets
volgt dat de twee populatievarianties gelijk zijn, moet de homoscedastische versie toegepast
worden, in het andere geval de heteroscedastische.
In het geval van een heteroscedastische toets wordt precies hetzelfde te werk gegaan als bij
een homoscedastische toets, alleen verandert de toetsvariabele en het aantal vrijheidsgraden:

(x̄A − x̄B ) − (µA − µB )


t = √ (9.6)
A+B
(A + B)2
ν = (9.7)
A /(nA − 1) + B 2 /(nB − 1)
2

sA 2
met A = (9.8)
nA
sB 2
en B = (9.9)
nB
Hierbij moet ν worden afgerond naar het dichtstbijzijnde gehele getal.

Opgave 9.8 Van twee analysemonsters wordt het ijzergehalte bepaald. Er wordt gevon-
den (in mol L−1 ):

A: 0, 131 0, 134 0, 129 0, 126 0, 132 0, 135


B: 0, 115 0, 119 0, 124 0, 130 0, 133 0, 135

Ga na of de gehalten van A en B significant verschillen, met een onbetrouwbaarheid van


5% (tweezijdig).
66 HOOFDSTUK 9 – STATISTISCHE TOETSEN

9.6 De χ2 -toets voor één populatievariantie

Met deze toets wordt onderzocht of het verschil tussen een onbekende
populatievariantie σ 2 en een referentiewaarde σ0 2 significant is. Hierbij
is een steekrproefvariantie s2 bekend.

Het stappenplan is als volgt:

1. H0 : σ 2 = σ0 2 . Accepteer H0 .

2. De toetsvariabele is χ2 = ν · s2 /σ 2 met ν = n − 1. Deze variabele heeft een zogenaamde


χ2 -verdeling met ν = n − 1 vrijheidsgraden.

3. Voor de onbetrouwbaarheid wordt gewoonlijk voor beide zijden α/2 genomen, hoewel
de verdeling niet symmetrisch is.

4. Met behulp van de tabel in §11.4 worden de kritieke waarden χ2 + en χ2 − bepaald.


Voor het linker gebied F (χ2 ) = α/2 en voor het rechter gebied F (χ2 ) = 1 − α/2. Met
MS Excel kan CHINV gebruikt worden.

5. Uit de steekproef volgt χ2 a = (n − 1) · s2 /σ 2 0 .

6. Als χ2 a < χ2 − of χ2 a > χ2 + , dan moet H0 worden verworpen.

Voorbeeld 9.9 Voor een zeker populatie moet getoetst worden of de standaarddeviatie
gelijk is aan 0, 50 met een onbetrouwbaarheid van α = 0, 025 (eenzijdig). Het popu-
latiegemiddelde is onbekend. Er wordt een steekproef genomen:

5, 36 5, 78 5, 67 5, 81 5, 52

Toets of de populatiestandaardeviatie gelijk is aan 0, 50.


Uitwerking
Allereerst wordt de steekproefstandaarddeviatie berekend: s = 0, 188. De nulhypothese
wordt aangenomen: H0 : σ 2 = σ0 2 = 0, 502 . De kritieke waarden van χ2 worden bepaald
voor ν = n − 1 = 4 en α = 0, 025: χ2 − = 0, 484 en χ2 + = 11, 14. Met MS Excel:
CHIINV(0.975;4) = 0, 484419 en CHIINV(0.025;4) = 11, 14326. De actuele waarde
wordt berekend onder aanname van de nulhypothese: χ2 a = 4 · 0, 1882 /0, 502 = 0, 5655.
De actuele waarde ligt binnen de kritieke waarden, dus H0 wordt niet alsnog verworpen.
N.B. Ondanks het relatief grote verschil tussen s = 0.188 en σ = 0.50 wordt de nulhy-
pothese toch aangenomen. Dit komt doordat een steekproefstandaarddeviatie zelf ook
weer een relatief zeer grote standaarddeviatie heeft bij een klein aantal waarnemingen
(zie vergelijking (8.9)).

Opgave 9.9 Gegeven is een achttal meetuitkomsten van de pH van een oplossing verkre-
gen met 8 verschillende pH-electroden van één soort:

4, 01 4, 08 4, 12 3, 98 4, 08 3, 92 4, 02 4, 11

Toets de bewering van de fabrikant dat de standaarddeviatie voor een meting met dit
soort elektrode gelijk is aan 0, 05 met een onbetrouwbaarheid van α = 0, 025 (eenzijdig).
9.7. DE F-TOETS VOOR TWEE POPULATIEVARIANTIES 67

9.7 De F-toets voor twee populatievarianties

Met deze toets wordt onderzocht of het verschil tussen twee popu-
latievarianties σA 2 en σB 2 significant is. Hierbij zijn twee steekproef-
varianties sA 2 en sB 2 bekend.
De twee populaties hoeven niet hetzelfde gemiddelde te hebben.

Het stappenplan is als volgt:

1. H0 : σA 2 = σB 2 . Accepteer H0 .

2. De toetsvariabele is F = sA 2 /sB 2 . Deze variabele volgt een F-verdeling met νA = nA −1


en νB = nB − 1 vrijheidsgraden. Let op! F > 1, zonodig worden hiervoor A en B
gewisseld.

3. Er wordt altijd voor een eenzijdige onbetrouwbaarheid α gekozen, gewoonlijk α = 0, 05.

4. De grenswaarde F+ met α = 0, 05 kan worden opgezocht in §11.5. Met MS Excel kan


de grenswaarde berekend worden door FINV(α,νA ,νB ).

5. Uit de steekproef volgt de actuele waarde Fa = sA 2 /sB 2 waarbij moet gelden dat
sA 2 > sB 2 , zodat Fa > 1.

6. Als Fa > F+ wordt H0 verworpen.

Voorbeeld 9.10 Tijdens een onderzoek vraagt een student zich af of twee analyseme-
thoden A en B even nauwkeurig zijn. Met andere woorden, leveren de methoden gelijke
standaarddeviaties op bij gelijke aantallen waarnemingen. Er werden 15 monsters geana-
lyseerd om dit te bepalen.
Met methode A werd gevonden: x̄A = 0, 108 mol L−1 , sA = 0, 50 mol L−1 , nA = 9
Met methode B werd gevonden: x̄B = 0, 120 mol L−1 , sA = 0, 30 mol L−1 , nA = 6
Toets dit met onbetrouwbaarheid α = 0, 05.
Uitwerking
H0 : σA 2 = σB 2 . νA = 8 en νB = 5. De kritieke F-waarde wordt opgezocht in §11.5,
F+ = 4, 82, of wordt berekend met MS Excel, FINV(0.05;8;5) = 4, 818332.
De actuele waarde is Fa = 0, 502/0, 302 = 2, 778. Fa < F+ , dus H0 hoeft niet verworpen
te worden. Er mag dus geconcludeerd worden dat beide analysemethoden even nauw-
keurig zijn. Merk op dat de steekproefgemiddelden niet van belang zijn in de toets.
N.B. Bij deze toets blijkt heel erg hoe noodzakelijk het is om zeer veel waarnemingen
te hebben voordat H0 verworpen mag worden. Ga na dat er hier, onder de conditie
nA = nB , ongeveer 13 waarnemingen voor elke methode nodig zijn om te concluderen dat
er wel een significant verschil is (als σA 2 en σB 2 overigens niet veranderen).

Opgave 9.10 Bij meting van de massa van een bepaald voorwerp wordt voor balans A
gevonden (in g):

10, 0450 10, 0452 10, 0453 10, 0451 10, 0448 10, 0450

Met balans B wordt gevonden (in g):

10, 0443 10, 0446 10, 0451 10, 0450 10, 0445 10, 0453

Kan op grond van deze meetuitkomsten met 95% waarschijnlijkheid worden geconcludeerd
dat balans A nauwkeuriger is dan balans B?
68 HOOFDSTUK 9 – STATISTISCHE TOETSEN

9.8 De toets van Dixon voor uitschieters (Q-toets)

Met deze toets wordt onderzocht of een verdachte extreme waarde,


een uitschieter, significant verschilt met de overige waarden van een
steekproef. Voorwaarde is 3 ≤ n ≤ 25.

Het stappenplan is als volgt:

1. H0 : de verdachte waarde behoort tot de populatie.

2. Zet de n meetuitkomsten op volgorde (toenemend of afnemend), met de verdachte


waarde voorop (verdachte waarde = x1 ).

3. Kies een waarde voor de onbetrouwbaarheid α, bijvoorbeeld α = 0, 05.

4. Als 3 ≤ n ≤ 7, bereken dan Qn = (x2 − x1 )/(xn − x1 ).


Als 8 ≤ n ≤ 10, bereken dan Qn = (x2 − x1 )/(xn−1 − x1 ).
Als 11 ≤ n ≤ 13, bereken dan Qn = (x3 − x1 )/(xn−1 − x1 ).
Als 14 ≤ n ≤ 25, bereken dan Qn = (x3 − x1 )/(xn−2 − x1 ).

5. Zoek in de Q-tabel de kritieke waarde Q op voor de gewenste n en α (zie §11.3). Als


Qn > Q, dan moet H0 verworpen worden en is er sprake van een uitschieter.

Voorbeeld 9.11 Ga na of er een of meer uitschieters zijn in de volgende set meetuit-


komsten:
177 326 161 176
Toets met α = 0, 05.
Uitwerking
De tweede meetuitkomst 326 lijkt verdacht. Sorteer de meetuitkomsten op aflopende
volgorde: 326, 177, 176, 161. Zoek de kritieke waarde voor n = 4 en α = 0, 05 in 11.3:
Q = 0, 756. Bepaal de actuele waarde: Q4 = (177 − 326)/(161 − 326) = 0, 903. Q4 > Q,
dus H0 wordt verworpen en er was sprake van een uitschieter.
De toets kan nogmaals worden uitgevoerd voor de waarde 161. Sorteer oplopend: 161,
176, 177. De kritieke waarde voor n = 3 en α = 0, 05 is Q = 0, 941. De actuele waarde
is Q3 = (176 − 161)/(177 − 161) = 0, 9375. Aangezien Q3 < Q mag H0 niet verworpen
worden en is er nu geen sprake van een uitschieter.

Opgave 9.11 Ga na of er bij de volgende reeks waarnemingen uitschieters zijn, zowel


met onbetrouwbaarheid α = 0, 05 als met onbetrouwbaarheid α = 0, 01

126, 9 132, 0 127, 2 127, 6 128, 3 129, 1

Opmerking: Deze toets wordt ook wel in een wat eenvoudiger vorm gedaan. Zie bijvoorbeeld
§4.5 ‘Q test for bad data’ in §10.2, ref.1. Hierbij wordt voor Q steeds de ‘gap’/‘range’ genomen.
Hoofdstuk 10

Literatuur

10.1 Algemeen

1. B.T. Berendts, H.J.A. Blaauw, B.J.M. Harmsen, J.C. Smit, S.H. Tijs:
“Foutenleer en Statistiek”
Agon Elsevier, Amsterdam-Brussel, 1973.

2. K. Doerffel:
“Statistik in der analytischen Chemie”
VEB Deutscher Verlag für Grundstoffindustrie, Leipzig, 1966.

3. G.L. Squires:
“Fysisch experimenteren”
Aula 480, Het Spectrum N.V., Utrecht-Antwerpen, 1972.

4. D.L. Harnett, J.L. Murphy:


“Introductory Statistical Analysis”
Addison-Wesley, Reading Mass. USA, 1975.

5. J.R. Green, D. Margerison:


“Statistical treatment of Experimental Data”
Elsevier, Amsterdam 1978.

6. P. Booster, E.J. van Kampen, H.F. Pronk:


“Statistische methoden voor het Laboratorium”
Agon-Elsevier, Amsterdam-Brussel, 1972.

7. W. Lederman, E. Lloyd (Ed.):


“Handbook of applicable Mathematics. Volume VI: Statistics, Part A”
John Wiley & Sons, Chichester, 1984.

10.2 Speciaal aanbevolen bij deze cursus

1. D.C. Harris:
“Quantitative Chemical Analysis”
Freeman, New York, 6e Ed. 2003.
Ch. 3: “Experimental Error”
Ch. 4: “Statistics”.
Ch. 5: “Calibration Methods”

69
70 HOOFDSTUK 10 – LITERATUUR

2. J.W.A. Klaassens, J.A. van Leeuwen:


“Praktische Statistiek voor het Laboratorium”
ten Hagen Stam, Den Haag, 1996.

3. J.C. Miller, J.N. Miller:


“Statistics and Chemometrics for Analytical Chemistry”.
Ellis Horwood, Chichester, 4e Ed. 2000.

10.3 Normen en toetsen

1. Nederlands Normalisatie Instituut:


NEN 1750 t/m 1759: “Laboratoriumglaswerk”
Delft, v.a. 1964. Zie de meest recente NNI catalogus.

2. Nederlands Normalisatie Instituut:


NEN 3114: “Terminologie voor het beschrijven van meetnauwkeurigheid”
Delft, 1973.

3. Nederlands Normalisatie Instituut:


NEN 3128: “Staafthermometers”
Delft, 1961.

4. Nederlands Normalisatie Instituut:


NEN 1047: “Receptbladen voor de statistische verwerking van waarnemingen” Delft,
1968 e.v.
NEN 3117: “Statistische termen” Delft, 1968.

5. W.L. Zijp:
“Handleiding voor statistische toetsen”
Tjeenk Willink, Groningen, 1974.

10.4 Overige

1. C. T. J. Alkemade, A.M. Hogenboom, J.A. Smit:


“Inleiding tot fysische Meetmethoden”
2e druk, Oosthoek, Utrecht 1973.

2. B.P. Levitt:
“Findlay’s practical physical chemistry”
9e Ed., Longman, London, 1973.

3. J. Agterdenbos, F.J.M.J. Maessen, J. Balke:


“Confidence regions for the sample content in the case of linear calibration relations”
Analytica Chimica Acta 132, (1981) 127-137.

4. O.G. Brink, R.J. Flink:


“Algemene Instrumentenkennis”
Wolters Noordhoff, Groningen, 1979.
Hoofdstuk 11

Tabellen

11.1 Standaard normale verdeling: cumulatief

Verdelingsfunctie (zie voor grafische weergave §7.3.2):


Z u
1 1 2
F (u) = √ e− 2 z dz (11.1)
2π −∞
Toetsvariabele:
x̄ − µ
u= √ (11.2)
σ/ n
Tabel met waarden van de verdelingsfunctie F (u) op basis van u-waarden:
u 0, 00 0, 01 0, 02 0, 03 0, 04 0, 05 0, 06 0, 07 0, 08 0, 09
0, 0 0, 5000 0, 5040 0, 5080 0, 5120 0, 5160 0, 5199 0, 5239 0, 5279 0, 5319 0, 5359
0, 1 0, 5398 0, 5438 0, 5478 0, 5517 0, 5557 0, 5596 0, 5636 0, 5675 0, 5714 0, 5753
0, 2 0, 5793 0, 5832 0, 5871 0, 5910 0, 5948 0, 5987 0, 6026 0, 6064 0, 6103 0, 6141
0, 3 0, 6179 0, 6217 0, 6255 0, 6293 0, 6331 0, 6368 0, 6406 0, 6443 0, 6480 0, 6517
0, 4 0, 6554 0, 6591 0, 6628 0, 6664 0, 6700 0, 6736 0, 6772 0, 6808 0, 6844 0, 6879
0, 5 0, 6915 0, 6950 0, 6985 0, 7019 0, 7054 0, 7088 0, 7123 0, 7157 0, 7190 0, 7224
0, 6 0, 7257 0, 7291 0, 7324 0, 7357 0, 7389 0, 7422 0, 7454 0, 7486 0, 7517 0, 7549
0, 7 0, 7580 0, 7611 0, 7642 0, 7673 0, 7704 0, 7734 0, 7764 0, 7794 0, 7823 0, 7852
0, 8 0, 7881 0, 7910 0, 7939 0, 7967 0, 7995 0, 8023 0, 8051 0, 8078 0, 8106 0, 8133
0, 9 0, 8159 0, 8186 0, 8212 0, 8238 0, 8264 0, 8289 0, 8315 0, 8340 0, 8365 0, 8389
1, 0 0, 8413 0, 8438 0, 8461 0, 8485 0, 8508 0, 8531 0, 8554 0, 8577 0, 8599 0, 8621
1, 1 0, 8643 0, 8665 0, 8686 0, 8708 0, 8729 0, 8749 0, 8770 0, 8790 0, 8810 0, 8830
1, 2 0, 8849 0, 8869 0, 8888 0, 8907 0, 8925 0, 8944 0, 8962 0, 8980 0, 8997 0, 9015
1, 3 0, 9032 0, 9049 0, 9066 0, 9082 0, 9099 0, 9115 0, 9131 0, 9147 0, 9162 0, 9177
1, 4 0, 9192 0, 9207 0, 9222 0, 9236 0, 9251 0, 9265 0, 9279 0, 9292 0, 9306 0, 9319
1, 5 0, 9332 0, 9345 0, 9357 0, 9370 0, 9382 0, 9394 0, 9406 0, 9418 0, 9429 0, 9441
1, 6 0, 9452 0, 9463 0, 9474 0, 9484 0, 9495 0, 9505 0, 9515 0, 9525 0, 9535 0, 9545
1, 7 0, 9554 0, 9564 0, 9573 0, 9582 0, 9591 0, 9599 0, 9608 0, 9616 0, 9625 0, 9633
1, 8 0, 9641 0, 9649 0, 9656 0, 9664 0, 9671 0, 9678 0, 9686 0, 9693 0, 9699 0, 9706
1, 9 0, 9713 0, 9719 0, 9726 0, 9732 0, 9738 0, 9744 0, 9750 0, 9756 0, 9761 0, 9767
2, 0 0, 9772 0, 9778 0, 9783 0, 9788 0, 9793 0, 9798 0, 9803 0, 9808 0, 9812 0, 9817
2, 1 0, 9821 0, 9826 0, 9830 0, 9834 0, 9838 0, 9842 0, 9846 0, 9850 0, 9854 0, 9857
2, 2 0, 9861 0, 9864 0, 9868 0, 9871 0, 9875 0, 9878 0, 9881 0, 9884 0, 9887 0, 9890
2, 3 0, 9893 0, 9896 0, 9898 0, 9901 0, 9904 0, 9906 0, 9909 0, 9911 0, 9913 0, 9916
2, 4 0, 9918 0, 9920 0, 9922 0, 9925 0, 9927 0, 9929 0, 9931 0, 9932 0, 9934 0, 9936
2, 5 0, 9938 0, 9940 0, 9941 0, 9943 0, 9945 0, 9946 0, 9948 0, 9949 0, 9951 0, 9952
2, 6 0, 9953 0, 9955 0, 9956 0, 9957 0, 9959 0, 9960 0, 9961 0, 9962 0, 9963 0, 9964
2, 7 0, 9965 0, 9966 0, 9967 0, 9968 0, 9969 0, 9970 0, 9971 0, 9972 0, 9973 0, 9974
2, 8 0, 9974 0, 9975 0, 9976 0, 9977 0, 9977 0, 9978 0, 9979 0, 9979 0, 9980 0, 9981
2, 9 0, 9981 0, 9982 0, 9982 0, 9983 0, 9984 0, 9984 0, 9985 0, 9985 0, 9986 0, 9986
3, 0 0, 9987 0, 9987 0, 9987 0, 9988 0, 9988 0, 9989 0, 9989 0, 9989 0, 9990 0, 9990
3, 1 0, 9990 0, 9991 0, 9991 0, 9991 0, 9992 0, 9992 0, 9992 0, 9992 0, 9993 0, 9993
3, 2 0, 9993 0, 9993 0, 9994 0, 9994 0, 9994 0, 9994 0, 9994 0, 9995 0, 9995 0, 9995
3, 3 0, 9995 0, 9995 0, 9995 0, 9996 0, 9996 0, 9996 0, 9996 0, 9996 0, 9996 0, 9997
3, 4 0, 9997 0, 9997 0, 9997 0, 9997 0, 9997 0, 9997 0, 9997 0, 9997 0, 9997 0, 9998
3, 5 0, 9998 0, 9998 0, 9998 0, 9998 0, 9998 0, 9998 0, 9998 0, 9998 0, 9998 0, 9998

Gebruik in MS Excel de functie NORMDIST(u;µ;σ;cumulative). Voor cumulative = FALSE


geeft de functie de kansdichtheidsfunctie f (x), voor TRUE geeft de functie de verdelingsfunctie
F (x).

71
72 HOOFDSTUK 11 – TABELLEN

11.2 Student t-verdeling: kritieke waarden

Verdelingsfunctie (zie voor grafische weergave §7.3.3):


Z t ν−1

2 !
F (t) = (ν+1)/2 dx (11.3)
−∞ ν−2
 √ 
x2
2 ! πν 1 + ν

Toetsvariabelen:
x̄ − µ
t= √ en ν =n−1 (11.4)
s/ n
Tabel met t-waarden op basis van de verdelingsfunctie F (t) en het aantal vrijheidsgraden ν:
F 0, 5 0, 8 0, 9 0, 95 0, 98 0, 99 0, 999 tweezijdig
ν 0, 75 0, 9 0, 95 0, 975 0, 99 0, 995 0, 9995 eenzijdig
1 1, 000 3, 078 6, 314 12, 71 31, 82 63, 66 636, 6
2 0, 816 1, 886 2, 920 4, 303 6, 965 9, 925 31, 60
3 0, 765 1, 638 2, 353 3, 182 4, 541 5, 841 12, 92
4 0, 741 1, 533 2, 132 2, 776 3, 747 4, 604 8, 610
5 0, 727 1, 476 2, 015 2, 571 3, 365 4, 032 6, 869
6 0, 718 1, 440 1, 943 2, 447 3, 143 3, 707 5, 959
7 0, 711 1, 415 1, 895 2, 365 2, 998 3, 499 5, 408
8 0, 706 1, 397 1, 860 2, 306 2, 896 3, 355 5, 041
9 0, 703 1, 383 1, 833 2, 262 2, 821 3, 250 4, 781
10 0, 700 1, 372 1, 812 2, 228 2, 764 3, 169 4, 587
11 0, 697 1, 363 1, 796 2, 201 2, 718 3, 106 4, 437
12 0, 695 1, 356 1, 782 2, 179 2, 681 3, 055 4, 318
13 0, 694 1, 350 1, 771 2, 160 2, 650 3, 012 4, 221
14 0, 692 1, 345 1, 761 2, 145 2, 624 2, 977 4, 140
15 0, 691 1, 341 1, 753 2, 131 2, 602 2, 947 4, 073
16 0, 690 1, 337 1, 746 2, 120 2, 583 2, 921 4, 015
17 0, 689 1, 333 1, 740 2, 110 2, 567 2, 898 3, 965
18 0, 688 1, 330 1, 734 2, 101 2, 552 2, 878 3, 922
19 0, 688 1, 328 1, 729 2, 093 2, 539 2, 861 3, 883
20 0, 687 1, 325 1, 725 2, 086 2, 528 2, 845 3, 850
21 0, 686 1, 323 1, 721 2, 080 2, 518 2, 831 3, 819
22 0, 686 1, 321 1, 717 2, 074 2, 508 2, 819 3, 792
23 0, 685 1, 319 1, 714 2, 069 2, 500 2, 807 3, 768
24 0, 685 1, 318 1, 711 2, 064 2, 492 2, 797 3, 745
25 0, 684 1, 316 1, 708 2, 060 2, 485 2, 787 3, 725
26 0, 684 1, 315 1, 706 2, 056 2, 479 2, 779 3, 707
27 0, 684 1, 314 1, 703 2, 052 2, 473 2, 771 3, 690
28 0, 683 1, 313 1, 701 2, 048 2, 467 2, 763 3, 674
29 0, 683 1, 311 1, 699 2, 045 2, 462 2, 756 3, 659
30 0, 683 1, 310 1, 697 2, 042 2, 457 2, 750 3, 646
40 0, 681 1, 303 1, 684 2, 021 2, 423 2, 704 3, 551
60 0, 679 1, 296 1, 671 2, 000 2, 390 2, 660 3, 460
120 0, 677 1, 289 1, 658 1, 980 2, 358 2, 617 3, 373
∞ 0, 674 1, 282 1, 645 1, 960 2, 326 2, 576 3, 291

Als σA = σB : t = ((x̄A − x̄B ) − (µA − µB )) /S


s
(nA − 1)sA 2 + (nB − 1)sB 2
 
1 1
S = +
nA + nB − 2 nA nB
ν = nA + nB − 2

Als σA 6= σB : t = ((x̄A − x̄B ) − (µA − µB ))/ A + B
(A + B)2
ν =
A /(nA − 1) + B 2 /(nB − 1)
2

A = sA 2 /nA en B = sB 2 /nB

Gebruik in MS Excel de functie TINV(α;ν) voor de t-waarde. Let op dat de α tweezijdig moet
worden opgegeven. Gebruik voor het uitvoeren van een t-toets de functie TTEST(array1;
array2; tails; type). Hierin geeft tails aan of de toets eenzijdig of tweezijdig is en type
geeft aan of het gaat om 1: paired, 2: gelijke sigma’s, 3: ongelijke sigma’s.
11.3. Q-TOETS VAN DIXON: KRITIEKE WAARDEN 73

11.3 Q-toets van Dixon: kritieke waarden

Zet de waarnemingen in opklimmende of neerdalende volgorde zodat de verdachte waarde


voorop staat. Bereken de waarde van Q behorende bij het juiste aantal waarnemingen n.

Tabel met kritieke Q-waarden op basis van de onbetrouwbaarheid α en het aantal vrijheids-
graden ν:
onbetrouwbaarheid α
n 0, 30 0, 20 0, 10 0, 05 0, 02 0, 01 0, 05
3 0, 684 0, 781 0, 886 0, 941 0, 976 0, 988 0, 994
4 0, 471 0, 560 0, 679 0, 765 0, 846 0, 889 0, 926
x2 − x1
Q= 5 0, 373 0, 451 0, 557 0, 642 0, 729 0, 780 0, 821
xn − x1
6 0, 318 0, 386 0, 482 0, 560 0, 644 0, 698 0, 740
7 0, 281 0, 344 0, 434 0, 507 0, 586 0, 637 0, 680
8 0, 318 0, 385 0, 479 0, 554 0, 631 0, 683 0, 725
x2 − x1
Q= 9 0, 288 0, 352 0, 441 0, 512 0, 587 0, 635 0, 677
xn−1 − x1
10 0, 265 0, 325 0, 409 0, 477 0, 551 0, 597 0, 639
11 0, 391 0, 442 0, 517 0, 576 0, 638 0, 679 0, 713
x3 − x1
Q= 12 0, 370 0, 419 0, 490 0, 546 0, 605 0, 642 0, 675
xn−1 − x1
13 0, 351 0, 399 0, 467 0, 521 0, 578 0, 615 0, 649
14 0, 370 0, 421 0, 492 0, 546 0, 602 0, 641 0, 674
15 0, 353 0, 402 0, 472 0, 525 0, 579 0, 616 0, 647
16 0, 338 0, 386 0, 454 0, 507 0, 559 0, 595 0, 624
17 0, 325 0, 373 0, 438 0, 490 0, 542 0, 577 0, 605
18 0, 314 0, 361 0, 424 0, 475 0, 527 0, 561 0, 589
x3 − x1 19 0, 304 0, 350 0, 412 0, 462 0, 514 0, 547 0, 575
Q=
xn−2 − x1 20 0, 295 0, 340 0, 401 0, 450 0, 502 0, 535 0, 562
21 0, 287 0, 331 0, 391 0, 440 0, 491 0, 524 0, 551
22 0, 280 0, 323 0, 392 0, 430 0, 481 0, 514 0, 541
23 0, 274 0, 316 0, 374 0, 421 0, 472 0, 505 0, 532
24 0, 268 0, 310 0, 367 0, 413 0, 464 0, 497 0, 524
25 0, 262 0, 304 0, 360 0, 406 0, 457 0, 489 0, 516
74 HOOFDSTUK 11 – TABELLEN

11.4 Chi-kwadraat verdeling: kritieke waarden

Verdelingsfunctie:
χ2
x(ν−2)/2 · e−x/2
Z
F (χ2 ) = dx (11.5)
0 2ν/2 (ν−2)
2 !
Toetsvariabelen:
s2
χ2 = ν en ν =n−1 (11.6)
σ2
Tabel met χ2 -waarden op basis van de verdelingsfunctie F (χ2 ) en het aantal vrijheidsgraden
ν:
ν/F 0, 010 0, 025 0, 050 0, 100 0, 250 0, 500 0, 750 0, 900 0, 950 0, 975 0, 990
1 0, 000 0, 001 0, 004 0, 016 0, 102 0, 455 1, 323 2, 706 3, 841 5, 024 6, 635
2 0, 020 0, 051 0, 103 0, 211 0, 575 1, 386 2, 773 4, 605 5, 991 7, 378 9, 210
3 0, 115 0, 216 0, 352 0, 584 1, 213 2, 366 4, 108 6, 251 7, 815 9, 348 11, 345
4 0, 297 0, 484 0, 711 1, 064 1, 923 3, 357 5, 385 7, 779 9, 488 11, 143 13, 277
5 0, 554 0, 831 1, 145 1, 610 2, 675 4, 351 6, 626 9, 236 11, 070 12, 833 15, 086
6 0, 872 1, 237 1, 635 2, 204 3, 455 5, 348 7, 841 10, 645 12, 592 14, 449 16, 812
7 1, 239 1, 690 2, 167 2, 833 4, 255 6, 346 9, 037 12, 017 14, 067 16, 013 18, 475
8 1, 646 2, 180 2, 733 3, 490 5, 071 7, 344 10, 219 13, 362 15, 507 17, 535 20, 090
9 2, 088 2, 700 3, 325 4, 168 5, 899 8, 343 11, 389 14, 684 16, 919 19, 023 21, 666
10 2, 558 3, 247 3, 940 4, 865 6, 737 9, 342 12, 549 15, 987 18, 307 20, 483 23, 209
11 3, 053 3, 816 4, 575 5, 578 7, 584 10, 341 13, 701 17, 275 19, 675 21, 920 24, 725
12 3, 571 4, 404 5, 226 6, 304 8, 438 11, 340 14, 845 18, 549 21, 026 23, 337 26, 217
13 4, 107 5, 009 5, 892 7, 042 9, 299 12, 340 15, 984 19, 812 22, 362 24, 736 27, 688
14 4, 660 5, 629 6, 571 7, 790 10, 165 13, 339 17, 117 21, 064 23, 685 26, 119 29, 141
15 5, 229 6, 262 7, 261 8, 547 11, 037 14, 339 18, 245 22, 307 24, 996 27, 488 30, 578
16 5, 812 6, 908 7, 962 9, 312 11, 912 15, 338 19, 369 23, 542 26, 296 28, 845 32, 000
17 6, 408 7, 564 8, 672 10, 085 12, 792 16, 338 20, 489 24, 769 27, 587 30, 191 33, 409
18 7, 015 8, 231 9, 390 10, 865 13, 675 17, 338 21, 605 25, 989 28, 869 31, 526 34, 805
19 7, 633 8, 907 10, 117 11, 651 14, 562 18, 338 22, 718 27, 204 30, 144 32, 852 36, 191
20 8, 260 9, 591 10, 851 12, 443 15, 452 19, 337 23, 828 28, 412 31, 410 34, 170 37, 566
21 8, 897 10, 283 11, 591 13, 240 16, 344 20, 337 24, 935 29, 615 32, 671 35, 479 38, 932
22 9, 542 10, 982 12, 338 14, 041 17, 240 21, 337 26, 039 30, 813 33, 924 36, 781 40, 289
23 10, 196 11, 689 13, 091 14, 848 18, 137 22, 337 27, 141 32, 007 35, 172 38, 076 41, 638
24 10, 856 12, 401 13, 848 15, 659 19, 037 23, 337 28, 241 33, 196 36, 415 39, 364 42, 980
25 11, 524 13, 120 14, 611 16, 473 19, 939 24, 337 29, 339 34, 382 37, 652 40, 646 44, 314
26 12, 198 13, 844 15, 379 17, 292 20, 843 25, 336 30, 435 35, 563 38, 885 41, 923 45, 642
27 12, 879 14, 573 16, 151 18, 114 21, 749 26, 336 31, 528 36, 741 40, 113 43, 195 46, 963
28 13, 565 15, 308 16, 928 18, 939 22, 657 27, 336 32, 620 37, 916 41, 337 44, 461 48, 278
29 14, 256 16, 047 17, 708 19, 768 23, 567 28, 336 33, 711 39, 087 42, 557 45, 722 49, 588
30 14, 953 16, 791 18, 493 20, 599 24, 478 29, 336 34, 800 40, 256 43, 773 46, 979 50, 892

Gebruik in Excel de functie CHIINV(α;ν) om de waarde van χ2 te bepalen.


11.5. F-VERDELING: KRITIEKE WAARDEN 75

11.5 F-verdeling: kritieke waarden voor α = 0, 05

Toetsvariabelen:
sA 2
F = (kies A en B zo dat F > 1) en νA = nA − 1, νB = nB − 1 (11.7)
sB 2
Tabel met kritieke waarden voor de F-verdeling bij een onzekerheid van α = 0, 05. Verticaal
staan het aantal vrijheidsgraden voor sA uitgezet en horizontaal staan het aantal vrijheids-
graden voor sB .
ν 1 2 3 4 5 6 7 8 9 10 12 15 20 30 40 60 120 ∞
1 161 199 216 225 230 234 237 239 241 242 244 246 248 250 251 252 253 254
2 18, 5 19, 0 19, 2 19, 2 19, 3 19, 3 19, 4 19, 4 19, 4 19, 4 19, 4 19, 4 19, 4 19, 5 19, 5 19, 5 19, 5 19, 5
3 10, 1 9, 55 9, 28 9, 12 9, 01 8, 94 8, 89 8, 85 8, 81 8, 79 8, 74 8, 70 8, 66 8, 62 8, 59 8, 57 8, 55 8, 53
4 7, 71 6, 94 6, 59 6, 39 6, 26 6, 16 6, 09 6, 04 6, 00 5, 96 5, 91 5, 86 5, 80 5, 75 5, 72 5, 69 5, 66 5, 63
5 6, 61 5, 79 5, 41 5, 19 5, 05 4, 95 4, 88 4, 82 4, 77 4, 74 4, 68 4, 62 4, 56 4, 50 4, 46 4, 43 4, 40 4, 36
6 5, 99 5, 14 4, 76 4, 53 4, 39 4, 28 4, 21 4, 15 4, 10 4, 06 4, 00 3, 94 3, 87 3, 81 3, 77 3, 74 3, 70 3, 67
7 5, 59 4, 74 4, 35 4, 12 3, 97 3, 87 3, 79 3, 73 3, 68 3, 64 3, 57 3, 51 3, 44 3, 38 3, 34 3, 30 3, 27 3, 23
8 5, 32 4, 46 4, 07 3, 84 3, 69 3, 58 3, 50 3, 44 3, 39 3, 35 3, 28 3, 22 3, 15 3, 08 3, 04 3, 01 2, 97 2, 93
9 5, 12 4, 26 3, 86 3, 63 3, 48 3, 37 3, 29 3, 23 3, 18 3, 14 3, 07 3, 01 2, 94 2, 86 2, 83 2, 79 2, 75 2, 71
10 4, 96 4, 10 3, 71 3, 48 3, 33 3, 22 3, 14 3, 07 3, 02 2, 98 2, 91 2, 85 2, 77 2, 70 2, 66 2, 62 2, 58 2, 54
11 4, 84 3, 98 3, 59 3, 36 3, 20 3, 09 3, 01 2, 95 2, 90 2, 85 2, 79 2, 72 2, 65 2, 57 2, 53 2, 49 2, 45 2, 40
12 4, 75 3, 89 3, 49 3, 26 3, 11 3, 00 2, 91 2, 85 2, 80 2, 75 2, 69 2, 62 2, 54 2, 47 2, 43 2, 38 2, 34 2, 30
13 4, 67 3, 81 3, 41 3, 18 3, 03 2, 92 2, 83 2, 77 2, 71 2, 67 2, 60 2, 53 2, 46 2, 38 2, 34 2, 30 2, 25 2, 21
14 4, 60 3, 74 3, 34 3, 11 2, 96 2, 85 2, 76 2, 70 2, 65 2, 60 2, 53 2, 46 2, 39 2, 31 2, 27 2, 22 2, 18 2, 13
15 4, 54 3, 68 3, 29 3, 06 2, 90 2, 79 2, 71 2, 64 2, 59 2, 54 2, 48 2, 40 2, 33 2, 25 2, 20 2, 16 2, 11 2, 07
16 4, 49 3, 63 3, 24 3, 01 2, 85 2, 74 2, 66 2, 59 2, 54 2, 49 2, 42 2, 35 2, 28 2, 19 2, 15 2, 11 2, 06 2, 01
17 4, 45 3, 59 3, 20 2, 96 2, 81 2, 70 2, 61 2, 55 2, 49 2, 45 2, 38 2, 31 2, 23 2, 15 2, 10 2, 06 2, 01 1, 96
18 4, 41 3, 55 3, 16 2, 93 2, 77 2, 66 2, 58 2, 51 2, 46 2, 41 2, 34 2, 27 2, 19 2, 11 2, 06 2, 02 1, 97 1, 92
19 4, 38 3, 52 3, 13 2, 90 2, 74 2, 63 2, 54 2, 48 2, 42 2, 38 2, 31 2, 23 2, 16 2, 07 2, 03 1, 98 1, 93 1, 88
20 4, 35 3, 49 3, 10 2, 87 2, 71 2, 60 2, 51 2, 45 2, 39 2, 35 2, 28 2, 20 2, 12 2, 04 1, 99 1, 95 1, 90 1, 84
21 4, 32 3, 47 3, 07 2, 84 2, 68 2, 57 2, 49 2, 42 2, 37 2, 32 2, 25 2, 18 2, 10 2, 01 1, 96 1, 92 1, 87 1, 81
22 4, 30 3, 44 3, 05 2, 82 2, 66 2, 55 2, 46 2, 40 2, 34 2, 30 2, 23 2, 15 2, 07 1, 98 1, 94 1, 89 1, 84 1, 78
23 4, 28 3, 42 3, 03 2, 80 2, 64 2, 53 2, 44 2, 37 2, 32 2, 27 2, 20 2, 13 2, 05 1, 96 1, 91 1, 86 1, 81 1, 76
25 4, 24 3, 39 2, 99 2, 76 2, 60 2, 49 2, 40 2, 34 2, 28 2, 24 2, 16 2, 09 2, 01 1, 92 1, 87 1, 82 1, 77 1, 71
30 4, 17 3, 32 2, 92 2, 69 2, 53 2, 42 2, 33 2, 27 2, 21 2, 16 2, 09 2, 01 1, 93 1, 84 1, 79 1, 74 1, 68 1, 62
40 4, 08 3, 23 2, 84 2, 61 2, 45 2, 34 2, 25 2, 18 2, 12 2, 08 2, 00 1, 92 1, 84 1, 74 1, 69 1, 64 1, 58 1, 51
60 4, 00 3, 15 2, 76 2, 53 2, 37 2, 25 2, 17 2, 10 2, 04 1, 99 1, 92 1, 84 1, 75 1, 65 1, 59 1, 53 1, 47 1, 39
120 3, 92 3, 07 2, 68 2, 45 2, 29 2, 18 2, 09 2, 02 1, 96 1, 91 1, 83 1, 75 1, 66 1, 55 1, 50 1, 43 1, 35 1, 25
∞ 3, 84 3, 00 2, 60 2, 37 2, 21 2, 10 2, 01 1, 94 1, 88 1, 83 1, 75 1, 67 1, 57 1, 46 1, 39 1, 32 1, 22 1, 00

Gebruik in MS Excel de functie FINV(α;νA;νB ) om de kritische F-waarde te bepalen.


76 HOOFDSTUK 11 – TABELLEN
Hoofdstuk 12

Appendix

Oefenopgaven
Opgave 12.1 Bereken voor ieder van de volgende meetseries de beste uitkomst, en de
fout daarin. Noteer de uitkomsten zo correct mogelijk.

A: 64, 123 63, 12 65 67, 0 64, 1 63, 24 g L−1


B: 10, 80 10, 80 10, 82 10, 80 10, 81 %
C: 1, 82 1, 79 1, 69 1, 43 1, 65 1, 70 mol L−1

Naslag: §1.3, §1.5, §2.2, §4.2, §4.3, §4.4, §9.8.

Opgave 12.2 Toets de volgende 2 meetreeksen met α = 0, 05 (eenzijdig) op het al dan


niet significant verschillend zijn van hun meetverwachting en hun populatievariantie:

A: 30, 3 30, 1 30, 4 30, 2 30, 9 30, 6 mm


B: 29, 8 32, 4 30, 3 29, 9 31, 6 32, 0 30, 0 mm

Toets ook of de meetverwachting van A significant verschilt van 30, 63 en of de popu-


latievariantie van B significant verschilt van 1.0.
Naslag: §9.4, §9.5, §9.6.

Opgave 12.3 De volgende ‘ijklijn’ werd gemeten:

c 0, 0 2, 0 4, 0 5, 0 6, 0 8, 0 10, 0 ppm Fe
A 0, 00 0, 16 0, 31 0, 45 0, 48 0, 66 0, 81 extinctie

Bepaal m.b.v. de kleinste kwadraten methode (ongewogen) de lijnparameters, hun stan-


daarddeviatie en de correlatiecoëfficiënt.
Er werd ook een monstermeting gedaan: A = 0, 41. Bereken het 95% betrouwbaarheids-
interval voor de meetverwachting van de concentratie Fe in het monster.
Naslag: §6.3, §6.4, §6.7.

Opgave 12.4 In het ‘Handbook’ werd de dampdruk van water als functie van de tem-
peratuur opgezocht:

P (mm Hg): 9, 209 17, 535 31, 824 55, 324 92, 51
t C: 10, 000 20, 000 30, 000 40, 000 50, 000

Bereken uit deze gegevens ∆Hvap m.b.v. de Wet van Clausius-Clapeyron en de standaard-
deviatie hierin. Gegeven is R = 8, 31434 J mol−1 K−1 en de Wet van Clausius-Clapeyron
ln P = −∆Hvap /(RT ) + constante.
Naslag: §6.3, §6.4, §6.7, §5.2.

77
78 HOOFDSTUK 12 – APPENDIX

Opgave 12.5 De brekingsindex n van het glas van een dubbelbolle lens wordt berekend
m.b.v. 1/f = (n − 1) · (1/r1 − 1/r2 ). Voor een bepaalde lens werd gemeten dat r1 = 30
cm met een standaarddeviatie sr1 = 0, 05 cm, r2 = 150 cm met een standaarddeviatie
sr2 = 0, 10 cm en f = 50 cm met een standaarddeviatie sf = 0, 06 cm.
Bereken de brekingsindex n en de standaarddeviatie daarin.
Naslag: §5.2, §5.5.

Opgave 12.6 Bij de extractie van een waterige oplossing van een organische stof X met
ether geldt:
Cn = C0 · wn /(D · e + w)n
Hierin is n het aantal keren dat wordt geëxtraheerd (n = 2), w het volume van de
waterige oplossing (w = 100, 0 mL met sw = 0, 2 mL), e het volume van de toegevoegde
ether (e = 50, 0 mL met se = 0, 2 mL), D de verdelingscoëfficiënt van X(ether/water)
(D = 85, 0 met sD = 0, 5), Cn het gewicht van X na n keer extraheren in de waterige
oplossing (in g) en C0 = 0, 2000 g met sC0 = 0, 0002 g.
Bereken C2 en de standaarddeviatie daarin.
Naslag: §5.2, §5.5.

Opgave 12.7 Gegeven is een normale verdeling van lengten met µ = 2, 54 cm en σ = 0, 12


cm. Hoeveel % van de populatie heeft een lengte tussen 2, 20 en 2, 50 cm?
Naslag: §7.3.2.

Opgave 12.8 Gegeven is een serie meetuitkomsten, waarvoor berekend is dat n = 8,


x̄ = 16, 20 g L−1 en s = 0, 30 g L−1 . Bereken het 95%-betrouwbaarheidsinterval voor µ.
Naslag: §9.1.

Opgave 12.9 Bereken hxi en Var(x) voor een chi-kwadraat-verdeling met ν = 2 vrijheids-
graden en teken de functie. Vergelijking (11.5) geeft de formule voor de verdelingsfunctie.
Naslag: §8.1.

Opgave 12.10 Teken een histogram voor de volgende metingenserie (in kg):
70 77 73 83 71 76 81 68 78 74 80 63 81 66 78 78 74 75 84 76
73 84 74 68 77 82 62 78 90 71 74 67 79 76 85 72 75 77 69 73
71 82 84 65 81 70 78 87 74 80 66 73 78 74 76 76 71 81 79 72
68 73 77 59 75 72 80 75 65 70 74 84 76 79 78 66 74 81 71 77
75 67 80 74 71 77 82 69 76 73 70 76 77 72 79 75 74 63 78 66
73 85 78 68 81 76 84 71 76 74 75 66 74 78 77 67 82 75 79 72
69 73 79 76 83 87 70 85 74
Welke normale verdeling zou deze serie metingen volgen?
Naslag: §7.1, §7.2.

Opgave 12.11 Er wordt op twee manieren een oplossing gemaakt die 12, 5 mg L−1 stof
X bevat.

A: afwegen op analytische balans: 12, 5 mg, oplossen in maatkolf van 500 mL, pipet-
teren met volpipet van 25 mL, oplossen in maatkolf van 50 mL.
B: afwegen op analytische balans: 125, 0 mg, oplossen in maatkolf van 500 mL, pipet-
teren met volpipet van 10 mL, oplossen in maatkolf van 100 mL, pipetteren met
volpipet van 50 mL, oplossen in maatkolf van 100 mL.

Al het glaswerk is van klasse A kwaliteit.


Bereken voor beide manieren de standaardeviatie in de concentratie van X als het glaswerk
niet van tevoren geijkt wordt.
Naslag: §3.2, §3.3, §5.3.
79

Opgave 12.12 Voor zure regen werd een pH gemeten van 4, 55. Volgens de apparatuur-
handleiding is de standaarddeviatie hierin 0, 05.
Bereken de waarden waarbinnen met 95% waarschijnlijkheid de [H+ ] ligt op de volgende
twee manieren:
a) Neem een normale verdeling aan voor de pH en reken om naar [H+ ]
b) Neem een normale verdeling aan voor de [H+ ]
Naslag: §5.2, §9.1

Opgave 12.13 Geef definities of kenmerkende omschrijvingen van de volgende begrippen:


a. populatie m. verwachtingswaarde
b. steekproefvariantie n. gewogen gemiddelde
c. meetverwachting o. nulhypothese
d. systematische afwijking p. significantieniveau
e. standaarddeviatie q. uitschieter
f. histogram r. onbetrouwbaarheid
g. ware waarde s. normale verdeling
h. toevallige fout t. frequentiepolygoon
i. correlatiecoëfficient u. afrondingsinterval
j. kansdichtheidsfunctie v. modus
k. student t-factor w. variatie-coëfficient
l. 95 % betrouwbaarheidsinterval

Opgave 12.14 Een bepaald soort meting voldoet behoorlijk goed aan een zogenaamde
Gamma-verdeling met de parameters α = 2 en β = 1.
Bereken het relatieve aantal metingen (in % van het totaal) dat verwacht wordt bij een
meetuitkomst die ligt tussen µ ± 0, 5σ.
Gegeven voor de Gamma-verdeling is hxi = α en Var(x) = α. Gebruik de MS Excel
functie GAMMADIST.
Naslag: §7.2, §8.1

Opgave 12.15 Het is mogelijk om met MS Excel zelf tabellen te maken zoals in
Hoofdstuk 11. Probeer dit voor bijvoorbeeld de normale verdeling, de t-verdeling, de
chi-kwadraat-verdeling of de F-verdeling en controleer het resultaat met de tabellen in
Hoofdstuk 11.
80 HOOFDSTUK 12 – APPENDIX

Uitwerkingen
Uitwerking 12.1

A: Meting 3 heeft te weinig significante cijfers want de standaarddeviatie in het gemid-


delde dicteert dat een meetwaarde minstens één decimaal cijfer moet hebben:
n = 6, x̄ = 64, 4 (64, 4305), s = 1, 4 (1, 43) en sgx = 0, 6 (0, 58).
Meting 3 wordt weggelaten en de parameters worden opnieuw berekend:
n = 5, x̄ = 64, 3 (64, 3166), s = 1, 6 (1, 57) en sgx = 0, 7 (0, 702).
De beste uitkomst en de fout daarin is: 64, 3 met sgx = 0, 7 g L−1 .
B: n = 5, x̄ = 10, 806 (10, 8060), s = 0, 009 (0, 0089) en sgx = 0, 004 (0, 0040).
De beste uitkomst en de fout daarin is: 10, 806 met sgx = 0, 004 %.
C: Voor de vierde meting moet getest worden of het een uitschieter is: Q6 = (1, 65 −
1, 43)/(1, 82 − 1, 43) = 0, 564 en Q(α = 0, 05; n = 6) = 0, 560. Q6 < Q, dus de
waarde is een uitschieter en wordt verwijderd uit de serie.
n = 5, x̄ = 1, 73 (1, 730), s = 0, 07 (0, 0718) en sgx = 0, 03 (0, 032).
De beste uitkomst en de fout daarin is: 1, 73 met sgx = 0, 03 mol L−1 .

Uitwerking 12.2

A: n = 6, x̄ = 30, 42 (30, 41667), s = 0, 29 (0, 29269) en sgx = 0, 12 (0, 11949) mm.


B: n = 7, x̄ = 30, 9 (30, 85714), s = 1, 1 (1, 10432) en sgx = 0, 4 (0, 41739) mm.

Doe een F-toets: is σA = σB ?


Fa = sB /sA = 14, 236 > F (α = 0, 05; νB = 7 − 1; νA = 6 − 1) = 4, 95, dus σA 6= σB .
Doe een heteroscedastische t-toets: is µA = µB ?
Het invullen van (9.7) geeft ν = 7 en (9.6) geeft ta = 1, 015.
ta < t(α = 0, 025(eenzijdig); ν = 7), dus µA = µB .
Doe een t-toets: is µA =√30, 63?
ta = (30, 63 − µA )/(sA / nA ) = 1, 785 < t(α = 0, 025(eenzijdig); ν = 5) = 2, 571, dus µA
verschilt niet significant van 30, 6.
Doe een χ2 -toets: is σ 2 B = 1, 0?
χ2 a = (nB − 1) · s2 B /1, 0 = 7, 317 < χ2 (α = 0, 025; ν = 6) = 14, 4, dus σ 2 B verschilt niet
significant van 1, 0.

Uitwerking 12.3 Als de grafiek getekend wordt, dan blijkt de meting voor c = 5, 0
een uitschieter. Normaliter zou de meting over gedaan moeten worden, maar in dit geval
wordt deze weggelaten.
Het berekenen van de lijnparameters en de correlatiecoëfficiënt volgens (6.4) - (6.8), (6.10),
(6.11) en (6.14) geeft: α = −0, 005238, sα = 0, 006550, β = 0, 081714, sβ = 0, 001082,
sd = 0, 00905, SX = 3, 741, SY = 0, 306 en r = 0, 99965.
De inverse toepassing van de ijklijn geeft volgens (6.16) - (6.19): C = 5, 0816 en het
95%-betrouwbaarheidsinterval 4, 74946 ≤ µ ≤ 5, 41370 ppm Fe.

Uitwerking 12.4 Maak een plot van ln P tegen 1/T , waarbij T in kelvin genomen
moet worden. Bereken aan de hand van de getransformeerde gegevens de lijnparameter
β, de helling, met (6.5) en de standaarddeviatie hierin met (6.7) en (6.8). Dit geeft
β = −5277, 63 met sβ = 16, 14.
Er geldt ∆Hvap = −R · β = 8, 31434 · 5277, 63 = 43880. Als de standaarddeviatie in
R verwaarloosd wordt (dat mag als er maar genoeg significante cijfers voor R gebruikt
worden), dan geldt s∆Hvap = R · sa = 8, 31434 · 16, 14 = 136, 5.
Dus ∆Hvap = 438, 8 · 102 J mol−1 met s∆Hvap = 1, 4 · 102 J mol−1 .
81

Uitwerking 12.5 De formule kan worden omgewerkt tot n − 1 = r1 · r2 /(f (r2 − r1 )).
Invullen levert n = 1, 7500.
Noem nu a ≡ n − 1 en pas vergelijking (5.3) toe met de variabelen f , r1 en r2 .

∂a/∂f = −(r1 · r2 /(r2 − r1 ))/f 2 = 6 · 10−5


∂a/∂r1 = r2 2 /(f (r2 − r1 )2 ) = 1, 56 · 10−3
∂a/∂r2 = −r1 2 /(f (r2 − r1 )2 ) = 1, 25 · 10−4

De variantie in a kan nu bereken worden: sa 2 = 2, 4592 · 10−6 . Er geldt dan sa = sn =


1, 568 · 10−3 .
Dus n = 1, 7500 met sn = 0, 0016.

Uitwerking 12.6 Het invullen van de formule voor n = 2 geeft C2 = C0 (w/(D·e+w))2 =


0, 0001057 g.
Vergelijking (5.3) wordt gebruikt voor alle vier de variabelen C0 , w, D en e.

∂C2 /∂C0 = w2 /(D · e + w)2 = 5, 2847 · 10−4


∂C2 /∂w = 2C0 · D · e · w/(D · e + w)3 = 2, 0653 · 10−6
∂C2 /∂D = −2C0 · w2 · e/(D · e + w)3 = −2, 4298 · 10−6
∂C2 /∂e = −2C0 · w2 · D/(D · e + w)3 = −4, 1306 · 10−6

Als alles ingevuld wordt levert dit sC2 = 1, 529 · 10−6 .


C2 = 105, 7 · 10−6 g met sC2 = 1, 5 · 10−6 g.

Uitwerking 12.7 Zet de waarden om naar een standaard normale verdeling en zoek de
bijbehorende u-waarden op in §11.1. Het verschil tussen die waarden is het percentage
lengten dat tussen 2, 20 en 2, 50 ligt.
F ((2, 54 − 2, 20)/0, 12) = F (2, 83) = 0, 9977
F ((2, 54 − 2, 50)/0, 12) = F (0, 33) = 0, 6306
Percentage is (0, 9977 − 0, 6306) · 100% = 36, 71%.
Met MS Excel kan de berekening in één keer als volgt: NORMDIST(2.50;2.54;0.12;TRUE)
- NORMDIST(2.20;2.54;0.12;TRUE)= 0, 36714 (= 36, 71%).

Uitwerking 12.8 Gebruik van vergelijking √ (9.1) geeft: √


x̄ − t(α = 0, 05(tweezijdig); ν = 7) · s/ n ≤ µ ≤ x̄ − t(α = 0, 05(tweezijdig); ν = 7) · s/ n.
Invullen met t = 2, 365 geeft:
15, 949 ≤ µ ≤ 16, 450

Uitwerking 12.9 Het invullen van (8.2) waarbij f (x) vergelijking (11.5) is, geeft:
Z ∞ −x/2
e
hχ2 i = x dx = 2 (= ν)
0 2
Het invullen van (8.4) waarbij hxi = 2, geeft:
Z ∞
e−x/2
Var(χ2 ) = (x − 2)2 · dx = 4 (= 2ν)
0 2

Uitwerking 12.10 Het maken van een histogram levert klassen met een breedte van 3
kg (min = 59 kg, max = 90 kg). De frequenties per klassen zijn opeenvolgend: 1, 1, 4,
12, 15, 26, 27, 20, 12, 8, 2, 1.
Het histogram volgt het beste een normale verdeling met µ = x̄ = 75, 1 en σ = s = 5, 7.
Het maken van het histogram met MS Excel levert een histogram met 11 klassen, startend
bij 59, met een klassenbreedte van 2, 82 (wat geen mooie breedte is!) en frequenties: 1,
0, 3, 10, 12, 20, 20, 29, 16, 10, 5, 1.
82 HOOFDSTUK 12 – APPENDIX

Uitwerking 12.11 De relatieve standaarddeviaties van iedere stap kunnen kwadratisch


opgeteld worden. Zie voor de standaarddeviaties §3.2. Standaarddeviaties die daar niet
genoemd worden zijn geschat.

A: c = (25/500) · (25/50) = 12, 5 mg L−1 .


(sc /c)2 = (0, 1/12, 5)2 + (0, 25/500)2 + (0, 03/25)2 + (0, 06/50)2 = 0, 00006713.
sc /c = 0, 82%
B: c = (250/500) · (10/100) · (50/100) = 12, 5 mg L−1 .
(sc /c)2 = (0, 1/250)2 + (0, 25/500)2 + (0, 020/10)2 + (0, 10/100)2 + (0, 05/50)2 +
(0, 10/100)2 = 0, 00000789.
sc /c = 0, 28%.

Methode B is dus nauwkeuriger en dit komt omdat bij A een te kleine hoeveelheid is
afgewogen.

Uitwerking 12.12 pH = 4, 55 met σpH = 0, 05. [H+ ] = 10−4,55 = 2, 818 · 10−5 en


σ[H+ ] = σpH · [H+ ]/ ln 10 = 0, 325 · 10−5 (via pH = − ln [H+ ]/ ln 10)
Betrouwbaarheidsinterval voor [H+ ] uitgaande van een normale verdeling van [H+ ]:
2, 818 · 10−5 − (1, 96 · 0, 325 · 10−5 ) ≤ µ ≤ 2, 818 · 10−5 + (1, 96 · 0, 325 · 10−5 )
2, 181 · 10−5 ≤ µ ≤ 3, 455 · 10−5 mol L−1 .
Betrouwbaarheidsinterval voor [H+ ] uitgaande van een normale verdeling van pH:
10−(4,55−(1,96·0,05)) ≤ µ ≤ 10−(4,55+(1,96·0,05))
2, 249 · 10−5 ≤ µ ≤ 3, 532 · 10−5

Uitwerking 12.13 De begripsdefinities zijn in het dictaat te controleren.


Uitwerking
√ 12.14 Het gevraagde
√ oppervlak heeft als domein α ± 0, 5 · α, dus tussen
2−0, 5 2 = 1, 2929 en 2+0, 5 2 = 2, 7071. Het invullen in MS Excel geeft de oppervlakte
onder de Gamma-functie: GAMMADIST(2.7071; 2; 1; TRUE) - GAMMADIST(1.2929; 2;
1; TRUE) = 0, 382 (= 38, 2%).

Uitwerking 12.15 Als correct gebruik gemaakt wordt van de functies NORMDIST, TINV,
CHIINV en FINV, dan moeten de waarden overeen komen met die in de corresponderende
tabel in Hoofdstuk 11.

You might also like