You are on page 1of 25

Udformning

Sampling har vi snakket om


Bearbejdning
SPRGESKEMAER
Stil n-dimensionelle sprgsml.

Sprgsml der tilsyneladende sprger om mere end n ting ad gangen vil ikke
give det svar i leder efter.


fx. Stiller man sprgsmlet: Syntes du at det er godt at kommunen lukker
brnehaven og plejehjemmet? skal man ikke regne med at kunne bruge svaret
da det ikke er til at gennemskue hvad det er de enkelte respondenter har svaret:
Om de er kede af at miste brnehaven eller plejehjemmet eller evt. begge dele.
Udformning 1/6
Alle skal kunne svare p sprgsmlene

Brugen af multiple-choice er meget udbredt ved sprgeskemaer. Vr sikre p
at alle har mulighed for at svare p de sprgsml der skal besvares p denne
mde.

fx. Sprgsmlet; stemte du p venstre eller p socialdemokratiet ved sidste
valg? vil ikke give alle mulighed for at svare i overensstemmelse med
sandheden. Enten m alle partier nvnes, eller ogs m der optrde en
mulighed der hedder andet.
Udformning 2/6
Stil entydige sprgsml

Hvis ikke sprgsmlene er entydige er svarene ikke trovrdige og kan derfor
ikke benyttes i analysen.

fx. Voksede du op p landet, p en grd eller i byen? Her er det ikke tydeligt
hvad man skal svare hvis man er vokset op p en grd p landet. Dels vil det
frustrere respondenten og dels vil svaret vre ubrugeligt.
Udformning 3/6
Variation i svarene

Stil sprgsml p en sdan mde at i fr variation i de svar i indsamler. Det er
tit ndvendigt at tvinge respondenten til at tage stilling.

fx. Hvad syntes du om det nuvrende byrd? Er det godt, nogenlunde det
samme eller er det vrre end tidligere? Her vil langt de fleste respondenter
sikkert svare i mellemkategorien. Dette kan undgs ved kun at give mulighed
for at svare enten godt eller skidt.
Udformning 4/6
Andre gode rd
Sprgsmlene br fremfres i en meningsfyldt sammenhng.
Pas p med vrdiladede ord.
Brug ikke termer uden klart at definere dem.
Brug ikke forkortelser og vendinger som ikke er almene.
Undg, eller minimer, sprgeskemaer der forgrener sig.
Giv ikke mere end 5 muligheder ved multiple-choice.

Udformning 5/6
men mske allervigtigst
Tnk p at i bruger respondentens tid og energi:



Sprg kun om ting som i rent faktisk skal bruge til at besvare
jeres undersgelses problemformulering !!!
Udformning 6/6
Dataindsamlings teknink (sampling)
Ved al dataindsamling m man antage at man kun samler data sammen fra en
delmngde af den samlede population. Vi antager i det flgende at
populationens strrelse er N, mens vores samplestrrelse er n.
Ved al dataindsamling vil der knytte sig en mlefejl (med mindre n = N).
Dette er ikke en rigtig fejl, men en mlefejl der knytter sig til det faktum at n
som regel vil vre meget mindre end N (n << N)
Des strre sample des mindre mlefejl.

Jo bedre planlagt indsamlings strategi des mindre mlefejl.
Vi vil nu se nrmere p forskellige mder at samle tilfldigt indsamlede data
sammen p vi vil ikke beskftige os med ikke-tilfldige indsamlinger i det
efterflgende.
Sampling 1/6
Simpel tilfldig indsamling
Hvert element i en population har i princippet samme chance for at blive en del
af den samlede delmngde.
Sampel-strrelsen n uddrages fra den samlede population N og hvert element i
samplet kan gives et nummer fra 1 til N.
Fordelene er at det er let at udfre og at den efterflgende analyse er
forholdsvis simpel.

Efterflgende stratificering af data kan gennemfres som data mining.
Man skal vre opmrksom p at simple tilfldige data indsamlinger i meget
heterogene populationer vil give meget store varianser. Dette kan vre en
fordel, men kan ogs hindre den videre analyse.
Sampling 2/6
Systematisk dataindsamling
Antag at de N elementer i populationen er nummererede fra 1 til N. For at
gennemfre en systematisk indsamling af n elementer samles hver kte element
til stikprven, hvor k = N/n.
fx. Antallet af lejligheder i et boligkompleks: N = 500. Vi nsker et sample p
30 lejligheder, dvs. n = 30 og k = 500/30 17. Vi skal alts indsamle hver 17.
lejlighed i boligkomplekset, begyndende med lejlighed nummer x
hvor x k. Vi kunne begynde med lejlighed nummer 8 og derefter 25, 42, 59,
76 osv.
Her skal man vre opmrksom p at der ikke eksisterer cykliske mnstre eller
strukturer i populationen hvilket vil give en indsamlingsfejl.

fx. kunne indstillingsretten i en bestemt lejlighed i hver opgang vre allokeret
til kommunen der bruger den til bestemte forml.
Sampling 3/6
Klyngeindsamling (Cluster sampling)
Ved klynge indsamling inddeles populationen frst i et antal klynger. Disse
klynger udpeges ved simpel opdeling, fx. et grid-net hen over et kort, en
transekt eller andre metoder der ikke opdeler populationen efter en kendt
karakteristika som vi vil undersge.
I hver klynge udtages derefter en tilfldigt stikprve p en given strrelse.
Summen af hver klynges strrelse giver stikprvens samlede strrelse n.
Lg mrke til at vi her antager at delpopulationen i hver klynge er
karakteristisk for hele populationen. Dette behver ikke at vre tilfldet og
hvis det ikke undersges kan det medfre serise indsamlingsfejl.
Sampling 4/6
Stratificeret dataindsamling
Ved en stratificeret dataindsamling opdeles populationen N frst i et antal
undergrupper (strata) hvor hver strata skal vre ikke-overlappende med
hensyn til den parameter der benyttes til opdelingen af populationen.
Man kan fx. benytte respondenternes kn, boligtype eller andet til at foretage
stratificeringen, dog br man tilstrbe at enhederne i de enkelte strata er s ens
som muligt, mens de enkelte strata br vre s forskellige som muligt..
I hvert strata udtages derefter en tilfldig stikprve.
De enkelte stratas stikprver kan summeres eller analyseres hver for sig.

I den stratificerede dataindsamling er der alts ingen forventning om at
stikprven er karakteristisk for hele populationen, men for den del af
populationen der deler statificerings-karakteristika med det pgldende strata.
Benyttes summen af strata br denne vre karakteristisk for hele populationen.

Sampling 5/6
Opsummering
n
N
Tilfldig
indsamling
N
Systematisk
indsamling
N
Klynge
indsamling
N
Stratificeret
indsamling
Sampling 6/6
Sprgeskemaets opbygning
1. Basis data. Disse er som regel sprgsml s som respondentens kn, alder
osv. Svarene benyttes ofte til at kontrollere de samlede svars
reprsentativitet.

2. Specifikke sprgsml. Dette er de egentlige sprgsml der skal benyttes til
at besvare undersgelsens problemformulering.

3. Afrunding. Her har respondenten ofte mulighed for at komme med
afsluttende bemrkninger eller komentarer som ikke har kunne besvares
under punkt 2.

Bearbejdning 1/12
Udformning af sprgsml
Ved udformningen af de enkelte sprgsml i sprgeskemaet er det vigtigt at huske
p, at mden respondenten har mulighed for at svare vil vre afgrende for hvilke
statistiske tests der efterflgende vil kunne foretages.

I det flgende kigger vi lidt nrmere p dette vha. et simpelt eksempel:
I en undersgelse nskes det belyst hvordan husstandsindkomsten har betydning
for hvor meget husstanden betaler, eller er villig til at betale, i husleje (eller
mnedlig ydelse p ln).
Bearbejdning 2/12
Ville du vre parat til at betale
mere i husleje hvis du havde en
hjere mnedlig indkomst?

JA NEJ
SPRGESKEMA
Det vil vre svrt at tage analysen af
dette sprgsml ret langt.
Denne type svar muligheder hvor
variablen kun kan antage to vrdier
kaldes binominale.

Vi kan rapportere en gennemsnitlig
frekvens for hver af de to svar, men
hvis vi ikke har et sammen-
ligningsgrundlag kan vi ikke ret
meget andet.

fx. 52% 4% svarer at hvis de tjente
flere penge ville de vre villige til at
betale mere i husleje eller boligydelse
Bearbejdning 3/12
Er husstandsindkomsten over
25.000 kr. om mneden?

JA NEJ
Er den mnedlige boligydelse
strre end 8.000 kr.?

JA NEJ
SPRGESKEMA

Fra indkomstsprgsmlet kan vi undersge om
vores svargruppe er sammenlignelig med
kommunens gennemsnit.
Ved at sammenligne svarene i sprgsml 1 og 2
kan vi undersge hvorvidt svarene er fordelt
tilfldigt, eller om der er tale om en intern
afhngighed.

Men det er svrt p denne baggrund at udtale
sig om hvordan denne sammenhng er. Vi kan
blot konstatere om det er tilfldigt eller ej!
Bearbejdning 4/12
Indkomst
Ja Nej
Ja
Nej
B
o
l
i
g
y
d
e
l
s
e

15 11
9 23
Frst tller vi vores svar sammen Herefter beregnes den forventede fordeling.
Indkomst
Ja Nej
Ja
Nej
B
o
l
i
g
y
d
e
l
s
e

11 15
13 19
46 . 5
19
) 29 23 (
13
) 13 9 (
15
) 15 11 (
11
) 11 15 ( ) (

2 2 2 2 2
2
=

i
i i
f
f o
Alts et ganske hjt sinifikansniveau
Bearbejdning 5/12
men er det reprsentativt for kommunen?
Den gennemsnitlige indkomst fra vores undersgelse: 26 ud af 59 svarede ja =
26*100/57 = 46% = 0.46
Spredningen for dette resultat vil vre
06 . 0
1
) 456 . 0 1 ( 456 . 0
1
2 1
=

=
n n
f f
x
o
Med et 95% konfidensinterval finder vi sledes at kommunegennemsnittet br
ligge inden for flgende interval:
] 58 . 0 ; 34 . 0 [ ] 12 . 0 46 . 0 [ ] 06 , 0 * 96 , 1 46 . 0 [ = = e
Bearbejdning 6/12
I dette tilflder oplyser kommunen at blot 13% af beboerne i kommunen tjener
mere end 25.000 kr om mneden.

Dette falder uden for undersgelsens acceptinterval som var:
] 58 . 0 ; 34 . 0 [ e
Vores undersgelse er alts ikke sammenlignelig med resten af kommunen
det var nok ikke nogen god ide kun at samle data i villakvarteret.

men endnu vrre; der er s mske heller ingen grund til at tro p at alt det
andet data vi har samlet sammen er karakteristisk for kommunen.
Bearbejdning 7/12
I hvilket interval er husstandens
mnedlige indkomst?

< 10.000
10.000 15.000
15.000 20.000
20.000 25.000
> 25.000

Er den mnedlige boligydelse
strre end 8.000 kr.?

JA NEJ
SPRGESKEMA
Vi gennemfrer samme undersgelse som
tidligere, men denne gang med flere
svarmuligheder. Her er der tale om nominale
svarmuligheder.

Nu kan fordelingen af indkomster
sammenlignes med kommunale oplysninger.

Vi kunne ogs undersge om der er et
indkomstinterval der er parat til at betale
mere i boligydelse end alle de andre.
Bearbejdning 8/12
Indkomst O
i
f
i
< 10 3 10 4.9
10-15 19 15 1
15-20 7 35 22.4
20-25 25 30 0.8
>25 46 10 130
Vi fr alts et kraftigt signifikant resultat
den observerede fordeling er meget
forskellig fra kommunens fordeling.
Specielt to grupper skiller sig ud:
Mellemindkomstgruppen er alt for svagt
prsenteret
Hjindkomsterne er alt for hyppige.

Disse resultater kan s bearbejdes videre
med hensyn til de forskellige indkomst-
gruppers svar p sprgsmlet om hvorvidt
de vil betale mere i husleje.

Dette er et eksempel p stratificering.
Bearbejdning 9/12
Hvad er husstandens samlede
mnedlige indkomst?

___________________ kr.
Hvad er husstandens samlede
mnedlige boligudgift?

___________________ kr.
SPRGESKEMA
Med denne type data (rationelle) er det muligt
at lave mere dybdegende analyser da man
dels kan svare p om der er en sammenhng
mellem de to parametre, men ogs hvad denne
sammenhng er.

Man vil stadig kunne kontrollere
reprsentativiteten af sine data som tidligere
gennemget.
Bearbejdning 10/12
n
y
n
x
n
y x
y x COV
i i i i

=
) (
) , (
Frst beregnes co-variansen:
Hvorefter vi kan beregne korre-
lations koefficienten som er udtryk
for hvor godt y lader sig beskrive
ved x:
y x
y x COV
r
o o
=
) , (
Ved hjlp af korrelationskoefficien-
ten kan vi herefter beregne bde
hldning og skring for den bedste
linje gennem alle data punkter.
y = f(x) = ax + b
Boligydelse = a * indkomst + b
0
3000
6000
9000
0 10000 20000 30000 40000 50000
Indkomst
b
o
l
i
g
y
d
e
l
s
e

Bearbejdning 11/12
Opsummering
De to mest anvendte datatyper ved sprgeskema indsamling er henholdsvis
nominelle data (og herunder binominelle) og rationelle data.
Hver datatype har sine fordele og til hver datatype knytter der sig et antal
analysemetoder.

Heraf medfrer ogs at datatypen afgr den efterflgende analyse og dermed
ogs typen, eller dybden, af mulige svar som kan flge af analysen.
Bearbejdning 12/12

You might also like