You are on page 1of 13

Tentamen Statistiek 1

Donderdag 3 november 2011 18:30-21:30 uur


Invullen! Naam: Studentnummer: Handtekening:

1. Vul op het roze antwoordformulier voor de multiple choice vragen in: a. Je voor en achternaam b. Je studentnummer (zowel door de hokjes aan te strepen, als in gewone cijfers) 2. Op de tafel mogen alleen de uitgereikte papieren, je collegekaart, en een eenvoudige rekenmachine (zie 5) liggen. Het opgavenformulier bevat voldoende lege ruimte om als kladpapier te gebruiken. Gebruik van eigen kladpapier is niet toegestaan. 3. Het tentamen bestaat uit 36 multiple-choice vragen Elke meerkeuzevraag kent slechts n juist of best verdedigbaar alternatief. Als je het antwoord op een vraag niet weet is het in je eigen belang te gissen, aangezien een niet-beantwoorde vraag fout gerekend wordt. Streep de antwoorden aan op het roze multiple-choice antwoordformulier. 4. Achteraan bij dit tentamen ingesloten vind je de bij bepaalde opgaven benodigde delen van Tabel A en Tabel C uit Moore, McCabe & Craig. 5. Bij het tentamen mag gebruik worden gemaakt van een eenvoudige rekenmachine, waarin geen vast data-geheugen zit; grafische rekenmachines mogen daarom niet op het tentamen worden gebruikt. Gebruik van een mobiele telefoon is op het tentamen uiteraard niet toegestaan, dus ook niet als rekenmachine. 6. Lever na afloop alle uitgereikte papieren weer in. Vul ook op dit voorblad je naam en studentnummer in, evenals je handtekening. Je mag wel van het laatste blad het gedeelte met je eigen antwoorden afscheuren en mee naar huis nemen. 7. MAAK PLAATJES VAN JE DATA! De ervaring leert dat hiermee veel fouten voorkomen worden. 8. Veel succes!

1. Klaas doet onderzoek naar de populatieproportie iPad-gebruikers onder studenten in Nederland. Hij neemt een willekeurige steekproef, en rapporteert een 95%-betrouwbaarheidsinterval dat loopt van 0.23 tot 0.35. Wat betekent dit interval? a) Er is 95% kans dat dit interval de steekproefproportie iPad-gebruikers onder studenten in Nederland bevat b) Er is 95% kans dat dit interval de steekproefproportie iPad-gebruikers onder Nederlanders bevat c) Er is 95% kans dat dit interval de populatieproportie iPad-gebruikers onder studenten in Nederland bevat d) Er is 95% kans dat dit interval de populatieproportie iPad-gebruikers onder Nederlanders bevat 2. De correlatie tussen twee variabelen X en Y blijkt negatief te zijn. Wat mag je concluderen? a) Hoger scores op X gaan samen met lagere scores op Y b) Lagere scores op X gaan samen met hogere scores op Y c) Zowel a, als b d) Noch a, noch b 3. Hieronder staan de gegevens van twee variabelen X en Y. Wat is de correlatie tussen X en Y? Proefpersoon 1 2 3 4 5 6 Som a) b) c) d) 0.04 0.53 0.98 1.00 X 5 6 7 7 8 9 42

XX
-2 -1 0 0 1 2 0

( X  X )2
4 1 0 0 1 4 10

Y
2 3 6 6 9 10 36

Y Y
-4 -3 0 0 3 4 0

(Y  Y ) 2
16 9 0 0 9 16 50

( X  X )(Y  Y )
8 3 0 0 3 8 22

4. Hieronder staat een stemplot voor de cijfers op een bepaald tentamen van een klas. Wat is de mediaan voor het tentamen van deze klas ?

a) b) c) d)

5.8 6.0 6.6 8

5. De scores op een test voor de motivatie die een student ervaart om het schakelprogramma succesvol af te ronden blijken normaal verdeeld te zijn met een gemiddelde van 20 en een variantie van 4. Wat is de kans dat een willekeurig schakelstudent een score van 18 of hoger heeft op deze test? a) .025 b) .16 c) .84 d) .975

6. Als je bij een regressie van Y op X in een dataset van ongeveer 100 personen weet dat bij n persoon de waarde van het residu gelijk is aan nul: y  y ! 0 dan weet je dat a) de correlatie tussen X en Y exact 1.0 is b) de correlatie tussen X en Y exact -1.0 is c) de correlatie tussen X en Y exact 1.0 of exact -1.0 is d) Noch a, noch b, noch c

7. De correlatie tussen twee variabelen X en Y is -.60. Zowel X als Y zijn gestandaardiseerd naar Zscores (gemiddeld nul, standaarddeviatie 1). Wat zal voor deze Z-scores de regressievergelijking = a + b*X zijn? a) = 2 - 0.60*X b) = 2 + 0.60*X c) = -0.60*X d) = 0.60*X 8. Als gebeurtenissen A en B onafhankelijk zijn, dan geldt a) P(A | B) = 0.50 b) P(A en B) = P(A) * P(B) c) Zowel a) als b) d) Noch a) noch b) 9. Binnen sociaal wetenschappelijk onderzoek wordt soms gewerkt met verschilscores. De variantie 2 2 2 van de verschilscores W x  y ! W x  W y  2 V xyW xW y valt hoger uit als de correlatie tussen voor- en nameting: a) Negatief is b) Nul is c) Positief is d) Hier is zonder meer gegevens geen uitspraak over te doen

10. Op een basisschool wordt een taaltest afgenomen aan kinderen. De scores op de test zijn scheef verdeeld. Wat kan de onderzoeker doen om er voor te zorgen dat de scores normaal verdeeld worden? a) Een positief lineaire transformatie toepassen b) Alle scores vermenigvuldigen met 3 en er 10 bij optellen c) De scores omzetten naar Z-scores d) Noch a, noch b, noch c

11. Een onderzoeker meet van een aantal proefpersonen variabele X (scores van 1 tot 9) en berekent na afloop scores op Y door de scores op X te kwadrateren (scores op Y van 1 tot 81). Van welke van de volgende uitspraken over X en Y weet je ZEKER dat die waar is? a) De Gowers cofficint is 1.0 b) De correlatie tussen X en Y is 1.0 c) De Spearmans Rho is 1.0 d) De kappa is 1.0 12. Op een persoonlijkheidsvragenlijst blijken de scores symmetrisch verdeeld te zijn. Het gemiddelde op deze test is 12. Dan is de mediaan a) Lager dan 12 b) Gelijk aan 12 c) Hoger dan 12 d) Kan zowel lager dan 12, gelijk aan 12 en hoger dan 12 zijn 13. Gemiddeld genomen studeert een SPO student 24 uur per week. Ga er van uit dat dit normaal verdeeld is met een standaarddeviatie van 5 uur. Hoe groot zal het deel van de SPO studenten ongeveer zijn dat meer dan 20 uur per week studeert? a) 16% b) 21% c) 79% d) 84% 14. Bij een regressieanalyse van een variabele Y op X uitgevoerd in SPSS kreeg iemand de volgende uitvoer. Unstandardized Coefficients B -4.512 1.437 Standardized Coefficients Beta 0.645 t 5.740 4.476 Sig. .000 .000

(Constant) X

Std. Error 0.786 0.321

Welke van onderstaande uitspraken is juist? a) Voor iemand met een score op X van 0 zal de voorspelling op Y gelijk zijn aan 1.437 b) Voor iemand met een score op X van 0 zal de voorspelling op Y gelijk zijn aan -4.512 c) Voor iemand met een score op Y van 0 zal de voorspelling op X gelijk zijn aan 1.437 d) Voor iemand met een score op Y van 0 zal de voorspelling op X gelijk zijn aan -4.512 15. Van een test is bekend dat deze een gemiddelde heeft van 20 en een standaarddeviatie van 3. Een onderzoeker wil graag dat de test op dezelfde meetschaal als IQ scores komt (gemiddelde 100 en standaarddeviatie 15). Met welke van onderstaande transformaties zal hij dit bereiken? a) Y=0.20X b) Y=0.20X+50 c) Y=5X d) Y=5X + 50

16. Welke van de volgende uitspraken over experimenteel onderzoek is juist? I. De onderzoeker geeft sommige proefpersonen een andere behandeling dan andere proefpersonen II. Proefpersonen worden willekeurig ingedeeld in groepen a) Alleen I. is juist b) Alleen II. is juist c) Zowel I. als II. zijn juist d) Noch I. noch II. zijn juist Stelling 1 sowieso juist, stelling 2 in principe ook, maar is nog discutabel als je een blockdesign erbij pakt 17. Gegeven is een five-number summary met de volgende getallen: 10; 15; 18; 25; 41. Welke van de volgende uitspraken is waar gegeven de 1,5*IQR regel? a) De mediaan is 18 en er zijn geen extreme scores gegeven de 1,5*IQR regel b) Het gemiddelde is 18 en er zijn geen extreme scores gegeven de 1,5*IQR regel c) De mediaan is hoger dan 18 en er zijn wel extreme scores gegeven de 1,5*IQR regel d) Het gemiddelde is hoger dan 18 en er zijn wel extreme scores gegeven de 1,5*IQR regel

18. Bij een dataset met uitbijters aan de onderkant van de verdeling van scores heeft de onderzoeker de standaarddeviatie bepaald en deze blijkt 8.4 te zijn. De onderzoeker verwijdert de drie laagste scores uit de dataset omdat die scores dusdanig veel lager zijn dan de scores van de anderen dat de onderzoeker vermoedt dat die drie proefpersonen de betreffende taak niet serieus hebben uitgevoerd) en hij bepaalt opnieuw de standaarddeviatie. Wat kun je over deze nieuwe standaarddeviatie zeggen? a) Deze zal lager dan 8.4 zijn b) Deze zal gelijk aan 8.4 zijn c) Deze zal hoger dan 8.4 zijn d) Informatie over het gemiddelde is nodig om hier een uitspraak over te kunnen doen. 19. Van een bepaalde variabele is de bijbehorende kansverdeling van de mogelijke scores gegeven. X p 1 .05 2 .10 3 .15 4 .20 5 .40 6 .10

Uitgaande van bovenstaande verdeling: wat is het gemiddelde van deze variabele? a) Kleiner dan 3.5 b) Gelijk aan 3.5 c) Hoger dan 3.5 d) Niet te bepalen zonder meer gegevens over de steekproefgrootte

20. Welke van onderstaande uitspraken is NIET juist? a) Een statistic is een schatting voor de parameter b) Een parameter is een beschrijving van scores in de populatie, een statistic is een beschrijving van scores in de steekproef c) Een statistic is zuiver (unbiased) als het gemiddelde van alle mogelijke statistics uit steekproeven van dezelfde grootte n, uit dezelfde populatie gelijk is aan de parameter d) Een statistic is onzuiver (biased) als het gemiddelde van alle mogelijke statistics uit steekproeven van dezelfde grootte n, uit dezelfde populatie afwijkt van nul

21. Wat is een belangrijke regel bij het trekken van een aselecte (willekeurige) steekproef uit de populatie? a) Elk element uit de populatie moet een kans van 0 of 1 hebben in de steekproef terecht te komen b) Elk element uit de populatie moet een gelijke kans hebben in de steekproef terecht te komen c) Elk element uit de steekproef moet een kans van 0 of 1 hebben in de populatie terecht te komen d) Elk element uit de steekproef moet een gelijke kans hebben in de populatie terecht te komen 22. Om te bepalen in hoeverre een variabele normaal verdeeld is kan het beste gekeken worden naar a) een normal quantile plot b) een boxplot c) een staafdiagram d) een scatterplot

23. Van een test voor een bepaalde ziekte, die bij 1% van de mensen voorkomt, is bekend dat deze in 95% van de gevallen een positief resultaat geeft als je patint de ziekte ook daadwerkelijk heeft. Bij patinten die de ziekte niet hebben geeft de test desondanks in 10% van de gevallen een positieve uitslag. Wat is de kans dat iemand die een positieve uitslag krijgt ook daadwerkelijk de ziekte heeft? a) 0.95% b) 9% c) 91% d) 95%

De populatie Nederlandse Psychologiestudenten is vrij scheef verdeeld: slechts 20% is man, en 80% is vrouw. Ga voor vraag 24 en 25 uit van onderzoek waarbij gekeken wordt naar het aantal mannen in een willekeurige steekproef van psychologiestudenten (waarvoor dus geldt: p = 0.20). 24. Wat is de kans op minder dan 3 mannelijke studenten in een willekeurige steekproef van 8? a) .1678+.3355+.2936 b) .1678+.3355+.2936+.1468 c) 1 - (.1678+.3355+.2936) d) 1 (.1678+.3355+.2936+.1468) 25. Wat is de kans op meer dan 30 mannelijke studenten in een willekeurige steekproef van 120 studenten? Gebruik hierbij de normale benadering van de binomiale verdeling. a) P ( z " 1.15) b) P( z " 1.26) c) P ( z " 1.37) d) P ( z " 1.48)

26. Bij een onafhankelijke variabele kan de verdeling van scores het best weergegeven worden met een a) boxplot b) histogram c) staafdiagram d) Daar valt zonder meer informatie geen antwoord op te geven 27. Een meteoroloog meet in de maand december iedere dag om 12.00 de temperatuur in graden Celsius, en noemt deze variabele X. Hij vindt een gemiddelde van 10 graden, en een standaarddeviatie van 5 graden. Om te communiceren met collegas in de Verenigde Staten rekent hij door middel van de volgende formule graden Celsius om in graden Fahrenheit (Y): Y = 1.8X + 32. Wat is de variantie van Y? a) 3.24 b) 9.00 c) 16.2 d) 81.0 28. Een histogram is een van de grafische methoden om de verdeling van een variabele weer te geven. Wat is een nadeel van deze manier van weergave? a) Verandering van de grenzen kan de vorm van het histogram sterk veranderen b) Een histogram kan alleen met SPSS gemaakt worden c) Er is overlap tussen naast elkaar gelegen staafjes in het histogram d) Frequenties op een kwantitatieve variabele kunnen niet worden weergegeven 29. In een universiteitsbreed onderzoek wordt bekeken in hoeverre het gemiddelde tentamencijfer in de propedeuse te voorspellen is uit het gemiddelde eindcijfer op het examen voortgezet onderwijs. a) Dit is een observationeel onderzoek met gemiddeld eindcijfer op het examen voortgezet onderwijs als onafhankelijke variabele b) Dit is een experimenteel onderzoek met gemiddeld eindcijfer op het examen voortgezet onderwijs als onafhankelijke variabele c) Dit is een observationeel onderzoek met gemiddeld eindcijfer op het examen voortgezet onderwijs als afhankelijke variabele d) Dit is een experimenteel onderzoek met gemiddeld eindcijfer op het examen voortgezet onderwijs als afhankelijke variabele

30. Uit een five number summary kan worden afgelezen a) hoe breed het deel van de meetschaal is waar de laagste 50 procent van de scores over verspreid is b) hoe breed het deel van de meetschaal is waar de middelste 50 procent van de scores over verspreid is c) Zowel a, als b d) Wat het gemiddelde van de scores is

31. P(A) = 0.30 P(B) = 0.30. Daarnaast is gegeven dat A en B disjunct zijn. Wat is de kans P(A|B)? a) 0.00 b) 0.09 c) 0.30 d) Niet te bepalen zonder meer gegevens

32. Van twee variabelen X en Y is bekend dat de correlatie gelijk is aan 0.60. Hieronder staan vier conclusies waarvan er eentje onjuist is en drie juist zijn. Wat is de onjuiste conclusie? a) Kendalls Tau zal ook 0.60 zijn b) Er is lineaire samenhang c) De regressievergelijking zal een stijgende lijn opleveren d) Er zal 36 procent verklaarde variantie zijn bij een lineaire regressie van Y op X

33. In welke situatie is er sprake van Simpsons paradox? a) Als het verband tussen twee variabelen X en Y positief is als we de derde variabele Z buiten beschouwing laten terwijl het verband tussen variabelen X en Y even positief is als we dit bekijken bij de verschillende subgroepen op Z b) Als het verband tussen twee variabelen X en Y positief is als we de derde variabele Z buiten beschouwing laten terwijl het verband tussen variabelen X en Y minder positief is als we dit bekijken bij de verschillende subgroepen op Z c) Als het verband tussen twee variabelen X en Y positief is als we de derde variabele Z buiten beschouwing laten terwijl het verband tussen variabelen X en Y niet aanwezig is als we dit bekijken bij de verschillende subgroepen op Z d) Als het verband tussen twee variabelen X en Y positief is als we de derde variabele Z buiten beschouwing laten terwijl het verband tussen variabelen X en Y negatief is als we dit bekijken bij de verschillende subgroepen op Z 34. In onderstaand scatterplot staat een scatterplot met armlengte in cms op de y-as, en lichaamslengte in cms op de x-as. Welke van de volgende uitspraken lijkt/lijken juist bij een regressie van armlengte op lichaamslengte?

a) b) c) d)

Bij regressie ligt het intercept naar schatting ergens tussen de 60 en 65 Bij regressie ligt de helling naar schatting ergens tussen de 0.3 en 0.5 Zowel a, als b zijn juist Noch a, noch b zijn juist

Intercept sowieso niet af te lezen omdat de lichaamslengte (X) niet tot 0 doorloopt helling ongeveer 0,45 maar je zou op 0,51 uit kunnen komen en dan gaan twijfelen dus ik reken twee antwoorden goed 8

35. Welke van de volgende beweringen over een experiment is waar? a) Bij een experiment kun je een uitspraak doen over de causale relaties tussen de variabelen b) Bij een experiment kun je de invloed van derde variabelen niet uitsluiten c) Een experiment is een observational study d) Bij een experiment kan er geen sprake zijn van undercoverage 36. Twee doktoren willen uitzoeken in hoeverre ze het eens zijn wat betreft het stellen van een diagnose van een bepaalde ziekte. Ze geven bij 100 patinten aan of die persoon de ziekte al dan niet heeft (uiteraard zonder te weten wat de ander heeft gezegd). Welke maat kan zinvol gebruikt worden om de mate van overeenstemming uit te drukken? a) Gowers coefficient b) Kappa c) Spearmans rho d) Gemiddelde absolute verschil

10

11

12

------------------------------------------------------------------Hieronder kun je je eigen antwoorden invullen.

1. 2. 3. 4. 5.

6. 7. 8. 9. 10.

11. 12. 13. 14. 15.

16. 17. 18. 19. 20.

21. 22. 23. 24. 25.

26. 27. 28. 29. 30.

31. 32. 33. 34. 35.

36.

13

You might also like