You are on page 1of 3

Hoorcollege 1 Beschrijvende statistiek, kansbegrip, normale verdeling Steekproef en populatie: Waarom een steekproef uit een populatie?

? Populatie is oneindig groot beperkte tijd, geld en mogelijkheden destructieve tests (sommige testen moeten leden v.d. populatie worden opgeofferd) Waarom een aselecte en representatieve steekproef? Aselect: ieder element uit de populatie heeft dezelfde kans om in de steekproef te komen representatief: steekproef heeft dezelfde karakteristieken als de populatie Beschrijvende statistiek: Nominale variabele: Geen ordening, maar sluiten elkaar wel buiten. (jongens/meisjes) grafieken: frequentiediagram, staafdiagram Ordinale variabele: Geen nummering, maar wel een ordening (opleidingsniveau) grafieken: frequentietabel Numerieke variabele: kan d.m.v. Een cijfer worden weergegeven (Leeftijd) grafiek: boxplot Discrete variabele: heeft een beperkt aantal waarden klassen waarde variabele in kan vallen (bloedgroep) Continue variabele: Kan veel waardes aannemen maar is wel door een minimum en maximum begrenst (Leeftijd) Diskreet nominaal ordinaal numeriek Tabel: manier hoe de variabelen kunnen worden ingedeeld. Boxplot: De box wordt gevormd door het eerste (P25) en het derde (P75) kwartiel. In de box wordt het tweede (P50) kwartiel (mediaan) aangegeven. De uitbijters (extreme waarden) liggen tenminste 1,5 maal de box lengte van P25 of P75 verwijderd. De staarten (whiskers) aan de box lopen tot aan de kleinste/grootste waarneming die nog geen uitbijter is. Extreme waarden worden aangegeven met een o; erge extremen worden aangegeven met een *. Continu

Kruistabellen worden gebruikt om 2 nominale waarden tegenover elkaar uit te zetten. In grafiek vorm wordt dit vaak gedaan d.m.v. een staafdiagram of Mozaek blot. Spreidingsdiagrammen worden gebruikt om 2 continue waarden tegenover elkaar te zetten.

Locatiematen: Waar liggen de waarnemingen gemiddeld o Gemiddelde, mediaan, modus, geometrisch gemiddelde. Spreidingsmaten: Hoeveel spreiding zit er in de waarnemingen. o Variantie, standaard afwijking, range, interkwartiel afstand. Scheefheid: Rechts-scheve verdeling (gemiddelde is hoger dan de mediaan) o Staart zit aan de rechterkant van het histogram (boven in boxplot) Links-scheve verdeling ( gemiddelde is kleiner dan de mediaan) o Staart zit aan de linkerkant van het histogram (beneden in boxplot) Kansen: Kansen komen voort uit discrete data. Kans wordt aangegeven met de letter P. Definitie van kans: proportie keren dat een verschijnsel zich voordoet. Dit kan theoretisch (wiskundig) en empirisch (proefondervindelijk) worden benadert. Normale verdeling: Q-Q plot: Kijken of waarden normaal verdeelt zijn. Als de waarden normaal zijn, dan liggen deze op de lijn van de Q-Q plot Rechts-scheve waarden liggen boven de lijn in hoefijzervorm. Links-scheve waarden liggen onder de lijn in hoefijzer vorm. Histogram: Vuistregels: Neem het aantal klassen (nkl) ongeveer gelijk aan de wortel uit het aantal waarnemingen (tem minste 6 en ten hoogste 20) Klassebreedte is ongeveer gelijk aan: (maximum-minimum)/nkl

Kansberekening: Z-transformatie: = populatiegemidddelde (schatten m.b.v. steekproefgemiddelde) 2 = populatievariantie (schatten m.b.v. steekproefvatiantie) Normale verdeling: F(x)= 1/ (2)(-1/2(x-/2)^2) ~ N(0,1) als X ~ N(, 2) Standaard-normale verdeling wordt genoteerd als N(0,1) (Alleen als gemiddelde en mediaan samen vallen) Z transformatie: Z = (x )/ als N (0,1) De uitkomst moet worden opgezocht in tabel. De Z-tabel heeft tweezijdige waarden. Als je maar 1 zijde hoeft te hebben (Bijv Z > 1,6) moet je de waarde gevonden in de tabel delen door 2. Interventie:

Biased: Systematische afwijking Precisie: nauwkeurigheid