You are on page 1of 16
2 Destatistische cyclus \Voorkennis Centrummaten en frequentietabellen Bladzijdes5 9 Het onderzock duurde 3 +3 +7+0+3+2~+2=20dagen, B-O+3-147-240-3+3-442-5+2-6 1D gemiddelde = 285 a or e+ eg reign 12 E81 gel _2.2 ms =2 sucsatess 2 De modus, omdat je hier alleen kunt aflezen welke bloedgroep het meest voorkomt. Bb Bij de twee leerlingen met bloedgroep AB hoort 8%. 5 leerlingen in 4H2. € Het verschil tussen bloedgroep A en AB is 30 ~ 10 = 20%, Dus or ten $5 ~ 30 tertngen in 13, Van deze Iecrlingen heeft 46,7% bloedgrocp 0, dat zin 0.467 - 30 14 Ieerlingen. 2.1 De onderzoeksvraag Bladzijdes7 De logische volgorde is 3-5-6-2-4-1, Bladzijde se De onderzocksvraag: 1-3-5 Data verzamelen: 6 Data analyseren: 2 Conclusies trekken: 4-1 De onderzocksvraag: Data verzamelen: Data analyseren: Conclusies trekken: Broo Bladzijde 59 ‘9 “hoevee! mensen’ is niet scherp geformuleend, wie bedoe! je precies? b_ Dit zi cigenlijk twoe onderzocksvragen. © De vraag veronderstelt dat eigenaren van elekirische auto's meer milieubewust zijn ‘dan eigenaren van benzineauto’s en dat hoeft niet 20 te zijn, ladzijde 6 ‘Causaal verband, Een direct gevolg van gamen wordt onderzocht, Geen causaal verband, Een samenhang wordt onderzocht, maar geen direct gevolg. ‘Causaal verband. Een direct gevolg van het verbieden van roken wordt onderzacht. Geen causaal verband, Een samenhang wordt onderzocht, maar geen dircet gevolg. 4@ Nee, want Karlijn is al langere tijd geinteresscerd in het onderwerp en weet er al wat van a. bed + ada GD Enkete voorbeetden van dectvragen: 19 Wat valt onder verkeer? Wat is de CO,-uitstoot van het verkeer? Wat is de totale CO;-uitsto0t? 1b Hoe groot is de uitstoot van fijnstof door auto's in steden? Welke gezondhicidsrsico’s levert lijnstof op? Bij welke hoeveetheid fijnstoftreden gezondhicidstsico’s op? ce i Entete voorbeelden van dectiragen bij opeave 5 Onderdecl a: Hoevect uur gamen scholieren per week? Wat wordt verstaan onder ‘overmatig gamen’? Wat wordt verstaan onder schoolprestatics? Onderdeel b: Hoeveel uur gamen scholieren per week? Hoeveel uur gebruiken scholieren sociale media per week? Onderdeol e: In hoeverre roken scholieren alleen op het schoolplein? Hoe makkelijk vvinden scholieren het om engens anders te roken? In hocverre zijn scholieren gevoelig ‘voor een verbo? Onderdeel d: Wat wordt er verstean onder opleidingsniveaus? Hoevee! uur per week roken scholieren van verschillende opleidingsniveaus? Waar roken scholieren van verschillende opleidingsniveaus? De 18,20,3.4,.40 1b Enkele voorbeelden van deelvragen: 1 Wat verstaan we onder de Nederlandse woningmarkt? Hoe is de prijsontwikkeling vvan de Nederlandse woningmarkt van de afgelopen vijf jaren? Wat zijn de ‘oorzaken van prijsontwikkelingen op woningmarkten? 2 Wanneer is cen woningmarkt stabiel? Wat zijn de effecten van verschillend beleid ‘op woningmarkten? 3 Hoe was de Nederlandse woningmarkt in 2000? Hoe is de huidige Nederlandse ‘woningmarkt? 4. Wat waren de beloftes van de regering voor de Nederlandse woningmarkt? Hoe heeft de Nederlandse woningmarkt zich ontwikkeld tijdens de regeerperiods? sladatja [D @ Dav zijn te woo! mensen, dus dat kos te vo iden gold ‘Omdat de conclusies van het onderzoek dan iets zoggen over de gehele Nederlandse bevolking. ladzijde 63 [B) «de examentcertingen van je school alle weekbladen € de inwoners van Appelscha 4 mensen met hooikoorts [Ba Desteckproet is net select, Mensen zijn nist glijhmatig verde in leet, dus in de steekproef moet daar rekening mee worden gehouden. 1b Ja, dat igt aan het onderzoek. De steekproet kan aselect zijn als de populate ook pensioengerechtigde mannen is. € Ja, dat ligt aan het onderzoek. De steekproef kan groot genoeg zijn als de populatie of het aantal onderzochte kenmerken klein is, De stockproef is nictaselect, omdat niet alle Nederlanders een even grote kans hhebben om op zaterdag in de stad bij het kruispunt langs te komen, D_ Desteekproef is niet aselect, omdat niet alle Nederlanders een even grote kans hhebben in de file tijdens de ochtendspits te stan, € De steckproef iste klein, waardoor niet alle meningen over klimaatverandering ‘gegeven zullen worden, 4 De steckproet is niet aselect, omdat niet alle Nederlanders een even grote kans hhebben om in het bezoekerscentrum van natuurgebied de Posbank te zijn. De steekproet is niet aselect, omdat niet alle Nederlanders een even grote kans hebben ‘om cen smartphone te bezitten. Mogelijk is de steckproet ook niet groot genoeg. {Z)_Datis meer, omdat je op grond van de peiling ongeveer 3 ‘WWD stemmers verwacht 71% Bladzijdes [5 De popuatieproponte p= 122 T0000 1.012 en de steckprocfproportic, . on {5 Her onal pardon in hot ckonhs is 27 = 1500 21 04s Het aantal patignten in de steekproet is 77 = 60, Sel er zn 100 personcelsteden et aantal mannelife pesonetstedcn met kind is dan 100 -0,3-0.6= 18, Het aantalvouvilijke personeelsleden met kind is dan 100 0,7 =O: Das hot antl personeclsteden mot kind is 18-+35~ 53, ine kormoi pono methine suis p= 1S 034 Alternatieve uitwerking ‘Van het kenmerk “mannelijk personeelslid heeft kinderen’ is p = 0,3 * 0,6 = 0418, ‘Van het kenmerk “vrouwelijk personeelstid heeft kinderen’is p = 0,7 + 0,5 = 0,35 ‘Van het kenmerk ‘personeelslid heeft kinderen’ is p = 0,18 +0,35 = 0,53. 08 0.53 ‘Van het kenmerk ‘personeelslid met kinderen is man” is 2.2Data verzamelen Badzide ss [DB de cerste vung is hot onduidelij wat bedoeld wordt mot “ee!” Bij de wieode vraag overlappen de antwoorden. Als jemand bijvoorbeeld 12 wu per ‘week t kit, dan zijn twee antwoorden op de vraag mogeik Badzide 7 [Do 1. suggestiove vrangstlling 2. dubbele oatkenning 3. ‘veo is eon onduideliikbegrip 4. de antwoordmogelikhoden zijn niet compleet on de vraag doet een beroep op herinnering be © ave + Ja, 111 + 108 = 219 miljoen dollar Nee, de rang geeft geen hoevectheid aan en kan niet worden opgeteld © eigenschappen: rang, naam en sport hhoeveetheden: inkomen (S) en leeftiid Bladzijde 1: kwalitatier I kwantitatiet I: kwatitatier IV: kwantitatiet 1b bijvoorbeeld bankrekeningnummer, artikeleode, serienummer, rugnummer, pincode, zaalnummer ‘walitaiet: patigntnummer, opleiding, beroep, bloedroep, sporttrequenti kwantitatief; geboortejaar ita BE) Door de latte keuzemogelifhid ‘4 of meer dagen’ is de varisbele kwalttot sowordsn Jc hunt dan goon gemideldeborckenen, want de antwoordsn in goon hoeveetheden meet. BB « Beide vaiabeten zijn wali. 1 Bij de corse vag geven de antwoorden cen duidalijkevolgorde aan. Vask s meer dan regelmatig egelmatg is meer dan soms en som is meer dan nit Bij de twoede vag hebben de antwoorden geen duidelike volgorde BD sete incon nominate vaisbele fini bxort/samen icon orn varibole ‘ooropleiding is een ordinal variable troooplat oem omnia varlabole snazse70 EB) Enkete voorbeelden van varsbete: ‘ovantate eisafstand in kilometers nominaa: plats van bestemming crdinaal: Beordeling vakante op schaal 1-5 ED) De varabele ‘aantal auto's heeft alleen gehele gtalen als waarden, cen wssenliggende ‘waar is nit mogeijk. Bj de variabele‘sreleld in km/ur ijn alle tssenliggende ‘vnarden mogelik, een auto kan bijvoorbeeld een snelheid hebben van 856 km discreet continu continu disereet continu disereet 2.3 Centrum- en spreidingsmaten Bindsijde 72 4 Het mestniveau is ordinaal, want de antwoordmogelijkheden hebben cen duidelike volgorde, 1b Als de het van de mensen het helemaal eens (5) en de andere helt het helemaal ‘oneens (1) zou zijn met een vreag, dan zijn de meningen duidelifk verdeeld. Toch zou het gemiddolde dan acceptabel (3) zijn. © de modus iaatte73 EZ a Demediaan is het meestgeschikt. Het gemidelde is povoclig voor de uitshister en «de mods is 17, dat goo goon goede indruk van de een. 1b Demodus is het meest geschikt. De andere centrammaten i niet te gebruiken, Het gemiddelde on de median zijn het meest geschkt. De modus is 8, dat gee gen goode indruk van het sata verkochte fesen, De median en de mods zijn bet meest geshikt. Het gemiddele is govoelg voor de uitschieter, die waarschijnlijk een meetfou i ED a ciffersop volgonde: 59 6:3 6.6 68 7.0 7.0 7.2 80 84 mediaan = 5° getal =7.0 Db cies op volgorde: 5,7 5,9 63 66 70 7,1 7.3 24 “# getal + getal” 66470 mediaai = 768 GE) @ detotaefoguenticis 1+5+5-+3-+3+2+ b ij kan zich het beste richten op NE, als die 6,6 een 7,1 wordt, dan heeft Nils geal =§ getal ott Se 56145 33-4 gemiddelde = 10° getal + 11S getal_2-+2 2 2 De leerlingen berekenen de mediaan, daaruit blifkt dat er vee! minder telaatkomers zijn dan de afelingscoérdinator op basis van het gemiddelde denkt. mediaan ladzi}de 74 De variabele is “aantal dagen fastfood gegeten afgelopen week’ ‘Omadat het cen kwantitaticve variabele botreft kun je alle centrummaten berekenen, totale fequentc is2+4+6+5+4+4+3+2=30 DOA 146.245 -344-d44 5+3-642-7 gemidielde = 2~O=4- 1612 ES SAA TA ST S627 15° gota + 16° gotal mediann = 7 SETS ge 358. modus =2 ‘op volgorde: modus, mediaan, gemiddelde Minstons twee keer. Hij moet twee keer het maximum van 60 punten scoren, Minstens drie keer. Hij moet drie keer 55 punten of drie keer 57 punten scoren om de ‘modus te laten veranderen, beide opties zijn goed Minstens twee keer. Hij kan met égn keer spelen de median maximaal verhogen naar 53 door 55 of hoger te scoren, maar het gemiddlelde is dan hoger dan 53. Met twee keer spelen lukt het wel, hij kan bijvoorbeeld twee keer 54 scoren. De mediaan is dan 54 en het gomiddelde ongeveer $3.3. De docent heeft de mediaan berekend, De mediaan is het middelste waarnemingsgetal 25% van de leerlingen heeft cen eijfer hoger dan 8,1 50% van de leerlingen heeft een cijfertussen 3,6 en 8,1 ladzijde 75 spreidingsbreedi interkwarticlafstand = 2304 ~ 1952 = 352 Dat is 50% van de werknemers, dus 0.5 - 250 = 125 wetknemers. Deze werknemers verdicnen tussen 2304 en 3216 euro per maand. ladztjde 76 ‘Onjuist, Het is allebei 25% van de leerlingen. ‘Onjuist. Het is 25% van de leerlingen, dat zijn 0,25 + 2184 = $46 leerlingen. ‘Onjuist, Zowel binnen als buiten de box vall 50% van de leerlingen, MII oars g Dat valt in het laatste dect van de boxplot, dus meer dan 75% van de leerlingen weegt minder dan 63,75 kg. ust, Het gemiddelde van het kleinste en grootste gewich is Dat is 50% van de bedrijven, dus 0,5 » 18056 = 9028 bedrijven. Het gemiddelde is hoger dan de median, omdat er een aantal grote bedrijven zijn tot 1250 kocien. Deze uitsehiters hebben effect op het gemiddelde, maar geen effect op ‘de mediaan, Er zijn evenveet bedrijven met meer dan 117 koeien als bedrijven met minder dan 55 koeien 4 De bewering zou kunnen kloppen, Stel de bedrijven in de bovenste 25% hebben gemiddeld 600 koeien, dan hebben ze ‘samen 0,25 « 18056 - 600 = 2708400 koeien, Stel de bedrijven in de onderste 75% hebben gemiddeld 100 koeien, dan hebben ze ‘samen 0,75 * 18086 - 100 = 1354200 koeien, © 100 ligt midden tussen 83 en 117, dus dat is ongeveer 50-+ > = 62,5% van de bedrijven. Een schatting van het aantal bedrijven is 0,625 - 18056 = 11285. 25 Bladztide77 GB InH4-C is de minste spreiding, De meesteleringen score hier een 6 of een 7, dichthi het gomiddelde In 4H-B is de meeste spreiding, Er zijn 6 leerlingen met een 4, en 6 leerlingen met een 9, ver van het gemiddelde De spreiing in 4H-A zt er tussenin, Bladzide78 LO#2+3H4H6_ Go gomidacide=2*2*3 De verschillen met het gemiddelde berekenen geeft~ De getallen kwadrateren geeft 9, 1,0 1 en 9. De getallen optellen geett 20. Delen door het aantal geet 3 1 Ven 3. 5 De wortel van de ithomst gee o= /4=2. b_Dewaamemingsgcallen in ij B jn 10 hoger dan de waarmemsingsgetalen inj A, dus de getallen hebben dezede spreiding rond het gemiddelde, De standaardafwijking is de gemiddelde afwijking tot het gemiddelde en is dus voor beide rien gelijk. © Alle waarnemingsgetallen zijn gelijk aan het gemiddelde, dus 0 G « De gemiddetde afwijking van de waarnemingsgetllen tot het gemidlde zou dan 53 moeten zijn, Het gemidele ifr 62, dus er uden fers van minder dan 6.2 ~ 53 = 09 en meer dun 62-+5.3= 11,5 moeten zijn. Dati onmogeli 1» Despeiding van de waamemingen wor kleiner, ds de sandnardatwking Wordt cok kleiner. De stndaardawijking is het groots bij aroep B. De spreiding van de lenge is daar het grootst 1b Figuur b hoor bij Quito. De spreiding van het aantal zonuren is daar het kleinst, dus 4e standaardafwiking is daar ook het klcns. 2.4 Representatie van data Biadzide 90 G Fk bedrag korn maar 86n keer voor, dus cen frequenictabel geet geen beter nzicht in de bedragen ladziide 81 Discrete variabele. De prijzen in cen supermarkt worden op centen afgerond. in Klasse (200, 300] © De-totale frequent is 26+ 17 +21 +8413 +2=87 Door klassenmiddens te gebruiken krig je 26 +50:#17- 150-421 25048380 + 13 “450-42 + $50 ‘gomiddelde 7 ® 4 De mediaan is hot 44° gtal, dit ligt in de Klasse (200, 300), De modale klasse is (0, 100} 17 cont, GD « stocroppervakte eo |e 1150, 250) (250, 350) [350, 450) [450, 550) 'b_ De modale klasse is [50, 150). © Het totaal aantal werknemers is 6+8 + 18 + ,.. +284 9+ 19= 266, De gemidelde vloeroppervlakte per werknemer door klassenimiddens te gebruiken is 1002+ 500 69 2 frequentic 266 Deze waarde verschilt van het echte gemiddelde, omdat de echte warden van de vloeroppervlakten verloren zijn gegaan bij het maken van de klassenindeling. De totale vioeropperviakte berekend met klassenmiddens is een benadering van de werkelijke totale vloeroppervlakte, Biadzide 2 GD « inklasse (35,45) b De totale frequent is 18 +3 +40+9+2=72, Door met de laagst mogelijke leefijden binnen de klasen te rekenen kj je et laagst smogelike gemiddellc, dat ig "8257335 +40- 45-59 S57 2°65 4) jar De gomiddold leftjd van de docenten is minstens 41,4 jaar, dus de bewering van de 0,4 is het verschil groot. «ordinal b Je gebruikt de phi-coéfficiént alleen bij twee nominale variabelen met elk twee ‘waarden, Bladzijde os Amhem Nijmegen ‘cum. frea, [cum, pere. cum. freq. | cum. pere.| _Vep ‘eer mee oncens | 5 % 3 25% | 15% ‘mee oneens n 8.8% 4 3.3% | 55% ‘neutral 23 | 184% | 22 | 183% | 01% mee eens ot | 488% | 88 | 73.3% | 24.5% ‘eer mee eens 125 | 100% }| 120 | 100% | 0% (Omdat 20 < max. Vep < 40 is het verschil middetmatig, «ordinal 1b Het grootste verschil in cumulatief percentage is bij één ster, dus max. Vep = 70 ~ 20 = 50%, ‘Omdat max, Vep > 40 is het verschil groot. «De rode eumulatcvefrequentiepolygoon hoot bij het keine doetwitomdat de boogschutters daar meer tijd nodig hadken om het doelwit te raken, Het is moeiliker ‘om eon Klein doelwit te raken, dus daar doct men langer over. 1b Etzijn 200 boogschutters in clke groep. Het grootste verschil in cumulatieve frequentic 20, Dus de max. Vep = 122 x 100% = 60%. is bij 5.5 seconden, dat is 150 ~ 30 oa ‘Omdat max, Vep > 40 is het verschil groot, Bladatja © Deboxen overtappen clr en geen van de meinen ligt uit de box van de ‘andere boxplot. Dus het verschil is gering, 'b_Deboxen overlappen clkaar en er is een mediaan die buiten de box van de andere boxplot ligt. Dus het verschil is middetmatig. © Deboxen overlappen elkaar niet. Dus het verschil is groot. 4. Deboxen overlappen elkaar en er is een mediaan die buiten de box van de andere boxplot ligt Dus het verschil is middetmatig. adetide 98 rmerk: kwalitatiet inhoue: kwantitatiot 1b Aanpat: je hobt de gemiddelden en de standaardatvil effecigroote p= 1012= 1007 Fu0+3) ‘Omdat 0,4 <£ < 08 is het verschil middelmate 0,769 4. Het grootste verschil in cumulatef percentage is bij 80 kg, dus max. Vep =95 ~ 50=45 ‘Omadat max, Vep > 40 is het verschil groot. 1b Porceel 1 Perecel 2 Bij 0% hoort min = 40 kg. Bij 25% hoort O, = 60 ke. Bij 50% hoort mediaan = 63 kg. Bij 50% hoort mediaan Bij 75% hoort Q; = 74 kg, Bij 75% hort Q3 = 85 kg. Bij 100% hort max = 90 kg, Bij 100% hoort max = 90 kg. —— Fe 70 operergstintg De boxen overlappen elkaar en er is een mediaan die buiten de box van de andere oxplot ligt. Dus het verschil is middetmati. a p= 3073-3497 Fuga iag 8 ‘Omdat E> 0,8 is het verschil grat 4 De etfectgrootte is berekend op basis van de oorspronkelike data en die conclusie is ‘daarom het meest betrouwbaar. Bij het maken van de relatieve cumulatieve frequentiepolygonen is een klassenindeling gebruikt, daarbij is informatie verloren gegsan. En bij het maken van de boxplots vanuit de elatieve cumulatieve frequentiopolygonen is nog cen keer informatie verloren gegaan, Die conclusie is daarom het minst betrouwbaat Bladzijde99 0405 Taa2 +428) ‘Omdat 0,4 < £ < 0,8 is het verschil middeImatig, b Bij het herekenen van de effectgrootte wordt gedeeld door de som van de standsardafwijkingen. Als de standaardafwijkingen afnemen, dan deel je door een. kleiner gotal en wordt de effectgrootte grote, © De boxen overlappen elkaar en geen van de medianen ligt buiten de box van de andere boxplot. Dus het versehil is gering, 4 Omadat £ maar net groter is dan 0,4 en de medianen ruim binnen elkaars boxen vallen is de conclusie van vraag ¢ het best te verdedigen, Diagnostische toets ladzijde 102 de onderzocksvraag, data verzamelen, data analyseren, conclusies trekken en causaal verband is als een gebeurtenis het directe gevolg is van een andere gebeurtenis, Bijvoorbeeld een verband tussen de temperatuur en de verkoop van zwemkleding. © De steckprocf moet voldoende groot en aselect zijn, 4. De populatieproportie is het deel van de populatie dat een bepaald kenmerk heeft De steekproefproportic is het deel van de steckproef dat dit kenmerk heeft. Bij cen representatieve steekproet zullen deze proporties ongeveer aan elkaar gelijk zijn, 123, quay = 0085 2 'b_ Her santal loselingen in de steckproet is 555 33, ‘2 Een kwantitatieve variabele is een hoeveetheid en een kwalitatieve variabele niet, Een voorbocld van cen kwantitatiove variabele is lenge in em, Een voorbeeld van cen kwalitatieve variabele is haarkleur. Een voorbeeld van een nominale variabele is favoriet boek, Een voorbeeld van cen ordinale variable is huisnummer, © Bij cen continue variabele zijn alle tussenliggende waarden mogelijk en bij cen diserete variabele nict Een yoorbeeld van een continue variabele is voetlengte, Een voorheold van cen discrete variabele is schoenmaat. a 25%6, ds 0.25365 =91 dagen 1 De settergronzen van de hvaisten jn 108°C; 154°C; 21 89C 6031 9°C Togs A218 319 LONTISAS ASTD ors Dus de gomidelde tempera kan onmogelikmeor dan 20°C zn gewoest speiingsnedte= 349-18" 529°C eninekvartlatstand = 21 8~ 10, a9 T= 48 dus Lars heeft gelik 4. De beste schatting voor de standaardafwijking is 9°C. Het gemiddelde daarvan is mec ladziide 103 Gl a Hc keinst mogelifke totaal aantal Klachten krig je door te rekenen mot het kleinst rmogelijke aantal klachten per klasse. Dat geeft 2-046 +5+55+ 10+ 126-15 +135 2035-25 +6 30= 6225 Kachten, 6225 > 6215 dus je kunt concluderen dat er dt jaar meer klachten waren, 1b Erzijn 365 dagen, dus de mediaan is het 1$3e waamemingsgetal; 246 +55=63 on2 +6 +55 + 126~ 189, dus de median ligt in de klasse (15, 20). € Demodale klass is de klasse [20, 25), want die heeft de grootste frequentic. Gi 0 30%, dus 0.3-240=72 mannen met minder dan 18.5%. 25% ds 0.25 ~ 240 = 60 mann mt minsens 20.5% 1b 2uurstofchalte | retatieve frequemtic | absolute frequentic [17.55 18,3) 2 48 119.5; 20,3) oo (20.5: 21,5) 36 [21,5;22,5) 10% 4 © ee 75 185 195 34-60-57- 66 YOU 126- 100° 17 ‘Omdat -0,2 = phi <0,2 is het verschil gering, phi 0,149 66-54 7854 wager Taas16 Omdat > 038 is het vehi groot El « Baa is de wach het kort. sco cena re 1 Vorschil usson Aon De Vep i maximal bj 120 seconden, ima. Vep = 9076 = 0s = 30 (mda 20% 40% is het verschil groot. © Verschil tussen A en B: + De boxen overlappen elkaar, + Goon van de medianen ligt buiten de box van de andere boxplot. Dus het verschil is gering, Dit is niet dezelfide conclusic als bij vraag b. Verschil tussen B en C: + De boxen averlappen elkaar, + Goon van de medianen ligt buiten de box van de andere boxplot. Dus het verschil is gering, Ditis dezelfle conclusie als bij vraag b. Verschil tussen A en C: + De boxen overlappen elkaar, + Eris cen mediaan die buiten de box van de andere boxplot ligt Dus het verschil is middetmatig. Dit is niet dezelfide conclusic als bij vraag b.

You might also like