Professional Documents
Culture Documents
Inhoud
In dit onderdeel willen we je een handleiding aanreiken voor het gebruik van SPSS bij
de verwerking van je onderzoeksresultaten. De inhoud van dit onderdeel is als volgt
opgebouwd:
1. SPSS Inleiding
1.1 SPSS opstarten
1.2 SPSS vensters
2. Algemene Werkwijze
2.1 De menustructuur
2.2 De statusbalk in het applicatievenster
2.3 Dialoogvensters
3. Datahantering in SPSS
3.1 Data ingeven en veranderen
3.1.1 Definiëring van de variabelen
3.1.2 En wat met de missing values?
3.1.3 Data veranderen
3.2 Data-file saven
3.3 Bestaande data-files openen in SPSS
4. Het creëren van een SPSS data-bestand
4.1 Het aanmaken van het codeboek
4.2 Het coderen van de vragenlijsten
4.3 Intikken van de datamatrix
4.4 Datacleaning
5. Datamanipulatie
5.1 Het creëren van nieuwe variabelen a.d.h.v. reeds bestaande
5.2 Het hercoderen van varaibelen
6. SPSS-procedures voor univariate statistiek
7. SPSS-procedures voor bivariate statistiek
1 SPSS inleiding
1.1 SPSS opstarten
SPSS for Windows is een zuivere Windows-toepassing. Dit houdt onder meer in dat
je het programma kan opstarten door achtereenvolgens aan te klikken: start, programs,
SPSS for Windows, SPSS 10.0 for Windows. Indien er een icoon van SPSS op je
desktop staat kan je SPSS for Windows ook opstarten door te dubbelklikken op het
icoon.
Wanneer SPSS wordt geopend verschijnt er een dialoogkader met de vraag wat we
willen doen in SPSS.
We hebben 5 keuzemogelijkheden:
• doorloop de handleiding
• typ data in
• laat een bestaande databank lopen
• creëer een nieuw databank aan de hand van de Database Wizard
• open een bestaande file (bvb. Excel-file)
2
1.2 SPSS vensters
3
2 Algemene werkwijze
2.1 De menustructuur
4
2.3 Dialoogvensters
Een dialoogvenster is een venster dat verschijnt wanneer een bepaalde optie uit het
menu is geselecteerd. Het dialoogkader wordt gebruikt om het gevraagde commando
te specifiëren.
Wanneer er bijvoorbeeld wordt gevraagd om een frequentietabel te berekenen van een
variabele uit de datafile dan verschijnt een volgend dialoogvenster.
5
Opmerking 1: wanneer je in het dialoogkader informatie wenst betreffende een
bepaalde variabele dan klik je met je linkermuisknop om de variabele te selecteren in
de 'bronlijst'. Nadien klik je met de rechtermuistoets in deze lijst en kies je voor
'variable information'. Een pop-up venster geeft een overzicht van de variabele (naam,
meetniveau, aantal labels, naam van deze labels).
Opmerking 2: numerieke variabelen worden in de bronlijst aangeduid met een
kardinaalgetal, string variabelen met de letter A.
Wanneer je SPSS je een dialoogkader toont waarvan je niet weet wat alle mogelijke
functies inhouden kan je steeds om hulp vragen. Klik de rechtermuisknop op de
analyse waarvoor je hulp wenst. Een pop-up window verschijnt en toont informatie
over de betreffende analyse.
De gegevens worden in SPSS ingebracht via de Data Editor. Dit venster is een
spreadsheet-achtige methode om een datamatrix in te tikken, te bekijken en te
bewerken. Je komt op dit venster door bij het opstarten van SPSS te kiezen voor de
optie 'type in new data'.
Is SPSS reeds opgestart dan kan je dit data-editor venster ook bekomen door de
volgende selecties te maken: File, New, Data.
• klik in de cel waar je waarden wil intikken: zo wordt de gewenste cel actief (er
komt een dikker rand rond de cel die actief is), enkel in deze actieve cel kan je
gegevens intikken (de variabele naam en het casenummer wordt in de actieve
cel steeds vermeld in de linker-bovenhoek van het data-editor venster.
• tik de waarde of numerieke code in
6
• druk op:
enter: om naar de cel onder aan de actieve cel te gaan
Tab: om naar de cel rechts van de actieve cel te gaan (is het meest
gebruikt omdat het eenvoudigst is om case per case in te vullen)
gebruik de pijltjestoetsen om de respectievelijke richting uit te gaan
Onderaan het venster zie je dat de Data Editor onderverdeelt is in twee mappen: Data
View en Variabele View. Om data in te voeren moet je eerst je variabele definiëren.
Dit kan je doen door te klikken op de map 'Variabele View' of je dubbelklikt op de
variabele naam 'var' aan het hoofd van elke kolom en de 'Variabele View' map wordt
zichtbaar. In de kolom variabele namen klik je in de gewenste rij van de variabele en
geef je de nieuwe variabele naam in.
Je variabele naam moet aan een aantal voorwaarden voldoen:
7
De allerlaatste stap voor het definiëren van je variabele is het opgeven van het
meetniveau.
Als je een vragenlijst afneemt, heb je meestal geen gegevens over alle antwoorden
van alle respondenten. Het komt immers vaak voor dat respondenten het antwoord op
een bepaalde vraag niet willen geven omdat ze de informatie té delicaat vinden. Ze
laten de vraag dan open. Soms is het ook mogelijk dat respondenten een vraag wel
invulden maar dat het antwoord onleesbaar is of totaal naast de kwestie is. Op dat
ogenblik is het onmogelijk een waarde op te geven op de variabele die naar deze
vraag peilde. Je zou de respondent dan uit de steekproef kunnen verwijderen maar dit
zou absurd zijn omdat deze respondent wel valabele antwoorden gaf op de overige
vragen. Een werkbare oplossing voor deze situatie is de respondent een missing value
te geven voor deze onbekende waarde. De missing value is een speciale code die door
SPSS wordt herkend, niet als echte code maar wel als een ontbrekende waarde.
Concreet houdt dit in dat alle respondenten met een missing value als code op een
bepaalde variabele, bij de statistische berekeningen voor die variabele niet worden
betrokken. Het resultaat van het definiëren van missing values is dat SPSS alle cases
met een missing value op een bepaalde variabele uit de analyses weert.
In SPSS roep je het dialoogvenster op door in de map 'Variabele View' de cel bij een
bepaalde variabele aan te klikken in de kolom 'missing'. Dan verschijnt er in deze cel
een rechthoekje waarop je nog eens klikt. Je hebt drie mogelijke opties voor het
definiëren van de missing value:
8
van uitgaande dat iemand 24u werkt zeven dagen lang is 168u. Je zou nu
kunnen opgeven dat iedereen die een score opgeeft van 101 of meer een
missing value label krijgt voor deze variabele)
Het wijzigen van data in SPSS is afhankelijk van waarom je wijzigingen wil
aanbrengen. Wil je de waarde van 1 cel wijzigen of moeten er een hercodering van
variabelen gebeuren?
Kopiëren en plakken
Het is mogelijk om een blok cellen te selecteren en te kopiëren. Net zoals bij Word of
Excel maak je dan gebruik van de methode 'Copy' en 'paste'.
• Seleceer het gebied dat je wil kopiëren, Edit, Copy, nadien selecteer het
gebied waar je de nieuwe waarden wil plaatsen, Edit, Paste
• Seleceer het gebied dat je wil kopiëren, Ctrl + C, nadien selecteer het gebied
waar je de nieuwe waarden wil plaatsen, Ctrl + V
Om je data-file te saven ga je te werk net zoals bij alle andere Windows toepassingen.
Kies achtereenvolgens in de menustructuur: File, Save as. De 'Save as' dialoogkader
9
wordt geopend. In dit venster geef je file een naam en definieer op welke locatie je de
file wil opslaan, je duidt het type van je file aan (in spss is dit .sav) en klikt op OK.
Hou er wel rekening mee dat je data-editor venster actief moet zijn. Indien je reeds
statistische analyses hebt gemaakt en je output-venster is actief dan zal je je output
file opslaan en niet je data-file.
Opmerking: om te vermijden dat uren werk verloren gaan is het ten zeerste
aangeraden om bij het intikken van je datamatrix regelmatig je werk te saven (bvb om
het half uur). Op die manier verlies je maximaal het werk van een half uurtje wanneer
de computer plots blokkeert of uitvalt.
10
• intikken van de datamatrix
• data-cleaning
Aan de hand van een voorbeeld zullen we deze verschillende stappen uitleggen. De
enquête waarop we beroep doen bestaat uit gesloten vragen (geen multiple items
scales). Het toekennen van labels aan open vragen is immers een onderwerp apart
(wens je hierover meer informatie contacteer dan je docent).
In het verdere verloop van deze handleiding maken we gebruik van de onderstaande
vragenlijst. Als je het bestand codering (via de website
http://habe.hogent.be/stat/statistiek/spss.html) download op een diskette dan kan je de
gegevens van 40 respondenten op onze korte vragenlijst geïllustreerd zien in SPSS.
Vragenlijst: kruis het antwoord van uw keuze aan door het bijbehorende bolletje in te
kleuren.
1. Bent u man/vrouw
Vrouw
Man
ongehuwd gescheiden
gehuwd
11
5. Wat is uw netto inkomen (gemiddeld bekeken over de voorbije 6 maanden)?
Coderen is het toekennen van getalsmatige labels aan de antwoorden. Deze codering
is nodig om een latere verwerking via SPSS gemakkelijker te maken.
Per vraag ken je een variabelenaam toe en bepaal je het meetniveau van de variabele.
Nadien ken je labels toe aan alle antwoordcategorieën, ook aan de missing values.
Wanneer een vraag op interval- of rationiveau gemeten wordt, zal het antwoord een
numerieke vorm aannemen.
Bijvoorbeeld: hoe oud ben je? .............
Het antwoord bij deze vraag is een getal. De variabele noem je leeftijd. Je
antwoordcategoriën laat je variëren van 0 jaar tot 98 jaar. Wanneer een respondent
zijn leeftijd niet heeft ingevuld, dan heb je met een missing value te maken. De
codering van missing values zijn meestal 9, 99, 999 of 9999. In dit voorbeeld kiezen
we ervoor om de waarde 99 op te geven als missing value.
Wanneer je een variabele meet op nominaal of ordinaal niveau, worden de
antwoorden meestal ook in een numerieke code weergegeven. Er zijn enkele
belangrijke reden om hiervoor te kiezen:
12
1. Dit vereenvoudigt immers de aanmaak van een datafile: je moet minder
gegevens intikken wat een tijdwinst oplevert en je hebt minder kans op fouten
dan bij het typen van voluit teksten.
2. Sommige statistische analyses in SPSS zijn niet mogelijk indien er geen
gebruik wordt gemaakt van numerieke codes in de datafile!
Voor onze vragenlijst typen we dus numerieke codes voor de vraag: Wat is je
geslacht? man of vrouw
De waarden (values) van de variabele geslacht worden hier mannelijk = 0, vrouwelijk
= 1, missing value = 9
In je datamatrix zal je dus 0, 1 of 9 vinden.
Hou er wel rekening mee dat de statistische analyses op deze variabelen beperkt
moeten worden tot het niet-metrische niveau. In menig onderzoek krijg je resultaten te
horen als het rekenkundig gemiddelde van de variabele geslacht is 1,46. Uiteraard is
dit een zinloze uitspraak daar je variabele geslacht slechts gemeten is op nominaal
niveau.
Naam
Vraag Meetniveau Omschrijving Antwoord Code Label
variabele
man 0 man
geslacht van
1 geslacht nominaal
de respondent vrouw 1 vrouw
geen 9 geen informatie
zoals
leeftijd van de getal ingevuld
-
2 leeftijd interval
respondent
geen 99 geen informatie
optie 1 1 ongehuwd
optie 2 2 samenwonend
burgerlijke optie 3 3 gehuwd
3 burgerl nominaal staat van de
respondent optie 4 4 gescheiden
optie 5 5 weduwe/weduwenaar
geen 9 geen informatie
optie 1 1 lager secundair
optie 2 2 hoger secundair
hoogst optie 3 3 hoger kt
4 opleidin ordinaal behaalde
opleiding optie 4 4 hoger lt
optie 5 5 univ
geen 9 geen informatie
13
optie 1 1 < 19.999
optie 2 2 20.000 - 29.999
optie 3 3 30.000-39.999
optie 4 4 40.000 - 49.999
optie 5 5 50.000 - 59.999
5 inkomen ordinaal nettoinkomen optie 6 6 60.000 - 69.999
optie 7 7 70.000-79.999
optie 8 8 80.000 - 89.999
optie 9 9 90.000 - 99.999
optie 10 10 > 100.000
geen 99 geen informatie
Eens je codeboek is opgesteld, kan je beginnen met het coderen van alle ingevulde
vragenlijsten. Je eerste stap in het coderen van een vragenlijst is het aanbrengen van
een identificatienummer. Elk nummer is een overeenkomstige case uit je datafile.
Dit cijfer breng je bovenaan op de eerste bladzijde van je vragenlijst aan in de
rechterhoek. Voor je eerste vragenlijst is het nummer dan bijvoorbeeld 001. Het
identificeren van je vragenlijsten is belangrijk voor het ontdekken van fouten gemaakt
tijdens het intypen van je data. Stel je typt de gegevens van 300 enquêtes in. Bij het
opvragen van je frequentietabel krijg je voor geslacht een onmogelijke waarde (bvb.
7). Je hebt dus duidelijk een typfout gemaakt. Wat nu? Indien je een
identificatienummer hebt aangebracht kan je deze vragenlijst/case opnieuw opzoeken
en je fout verbeteren. Zonder identificatienummer is deze case niet meer correct. Je
kan nu wel willekeurig kiezen of je 7 een 0, 1 of 9 wordt maar dit is uiteraard een te
vermijden praktijk.
Dit houdt in dat je met een herkenbare (opvallende) kleur per vraag het antwoord van
de respondent in een gecodeerde vorm vermeldt. Dit vergemakkelijkt het intikken
van de datamatrix aanzienlijk omdat men bij het inputten enkel maar de codes om de
vragenlijsten moet overtikken zonder zich nog bezig te houden met de codering
tijdens de input.
Een voorbeeld van een reeds ingevulde en gecodeerde vragenlijst (case 001):
001
1. Bent u man/vrouw
1
Man Vrouw
14
3. Wat is uw burgelijke staat?
ongehuwd gescheiden
ongehuwd maar samenwonend met partner weduwe/weduwenaar
2
gehuwd
Na het coderen van je vragenlijst kan je beginnen aan een intikken van je gegevens.
Afhankelijk van de lengte van je vragenlijst en het aantal cases vraagt wordt de
benodigde tijd hiervoor verlengd. Er zijn twee stappen die je achtereenvolgens moet
doorlopen: 1. definiëren van je variabelen, 2. intikken van je gegevens.
15
identificatienummer. De naam van de variabele wordt dan 'nummer'.
Voor de tweede stap moet je het type van de variabele opgeven. Je kan diverse types
van data opgeven zoals numeriek, munteenheid, comma, datum en tekstwoord
(string). Klik in de kolom type op het grijze blokje in de cel en je bekomt een lijst met
deze verschillende keuzemogelijkheden. Voor ons identificatienummer is het type van
deze variabele 'numeriek'.
Bij 'width' duid je de grootte van je variabele aan. Als je getal een decimaal is, bepaal
je hoeveel decimalen achter de komma.
In 'label' kan je een omschrijving geven van je variabelenaam.
Het invoeren van missing values doe je in een volgende stap. Bij geslacht vul je '9' in
in de optie 'discrete missing values'.
Je kan ook nog de kolomwijdte, de uitlijning en het meetniveau opgeven.
Het voordeel van het definiëren van je waarden is dat het de interpretatie van je
analyses vereenvoudigt. In je output-venster zie je immers de waarde van de
numerieke code staan en dit vergemakkelijkt de interpretatie. Een illustratie zal dit
verduidelijken. Indien we bij het opvragen van een kruistabel voor de variabelen
geslacht en burgerlijke staat de waarden niet definiëren, dan krijgen we in ons output-
venster het volgende resultaat:
16
Een illustratie van het voordeel van het opgeven van de waarden van je codes:
17
4.3.2 Intikken van de gegevens
Zoals reeds in hoofdstuk 3.1 data ingeven en veranderen werd uitgelegd worden de
data in SPSS ingebracht via de Data Editor.
Neem je gecodeerde vragenlijsten in de hand. Begin met het de eerste vragenlijst, geef
het identificatienummer in en vervolgens breng je de andere gegevens in. Indien je de
vragenlijsten door elkaar ingeeft (dus niet beginnend met nummer 1) dan kan je na het
ingeven van je data je cases ordenen: druk achtereenvolgens Data, Sort Cases, breng
variabele identificatienummer over naar de rechterkant, controleer of 'sort cases as
ascending' aangeduid is en klik op OK.
De datfile van de persoon uit ons voorbeeld ziet er dan als volgt uit:
Als je deze gegevens hebt ingetikt, sla je je datafile op. Je kan je file steeds
vergelijken met onze datafile codering (te downloaden via het web).
4.4 Datacleaning
De laatste fase bij het maken van een data-file is de data-cleaning fase. Tijdens deze
fase wordt de datamatrix gecontroleerd op mogelijke typ- en/of codeerfouten.
Om tikfouten op het spoor te komen zijn er twee mogelijke strategieën. Bij de eerste
mogelijkheid neemt men weer alle ingevulde vragenlijsten in de hand en controleert
men de volledig ingetikte datamatrix met de oorspronkelijke gegevens. Het nadeel
van deze werkwijze is dat ze zeer lang duurt en het is maar de vraag of het zinvol is
om zoveel energie te steken in deze methode. Daarom wordt in de praktijk meestal de
andere methode gehanteerd waarbij men probeert de fouten te vinden door
abnormaliteiten in de datamatrix op te sporen. Deze abnormaliteiten kunnen twee
zaken zijn:
• onmogelijke waarden
• onmogelijke combinaties van waarden
18
Door het bekijken van de output kan je nagaan of je missing values correct opgegeven
zijn en of er in de frequentietabel waarden voorkomen die onmogelijk zijn. Wanneer
je codes voor burgerlijke staat lopen van 1 tot 5 met missing value 9 dan is een
waarde zoals 12 uiteraard uit den boze.
Bij grote datasets kan het soms een probleem zijn om deze onmogelijke waarde terug
te vinden in de eigenlijke data-editor. Daarom is het aan te raden om te werken met
identificatienummers bij grote datasets(zie hoofdstuk 4.3 Intikken van de datamatrix :
dit betekent dat je eerste variabele een identificatienummer is. Om tussen de
duizenden respondenten dan die ene respondent terug te vinden met een onmogelijke
waarde op burgerlijke staat, selecteer je alle cases met onmogelijke waarden. Dit doe
je door achtereenvolgens te klikken: Data, Select Cases, optie 'If condition is satisfied'
aanduiden, de conditie te specifiëren, Continue en OK. Nadien vraag je van een
frequentietabel op van deze cases met onmogelijke waarden via hun
identificatienummer.
19
5 Data manipulatie
Soms moet je in de loop van je onderzoek bepaalde statistische analyses maken die
onmogelijk zijn op je ruwe dataset. SPSS maakt het dan mogelijk om je datamatrix te
manipuleren zodat we wel instaat zijn om de gewenste analyses uit te voeren voor ons
onderzoek.
Een nieuwe variabele creëren op basis van reeds bestaande variabelen betekent
meestal dat je nood hebt aan een samengestelde variabele in je onderzoek. Vooral in
de psychologie en sociologie wordt deze methode vaak toegepast. Zo kan je van een
persoon zijn individuele scores te weten komen per vraag in een intelligentietest.
Door middel van het creëren van een samengestelde variabele, tel je de score van alle
variabelen op een bepaalde subtest op en bekom je bijvoorbeeld de intelligentiescore
op taalgebied. Deze samengestelde variabele kan men dan gebruiken om conclusies te
trekken rond het verband tussen intelligentie en andere variabelen (bvb. is er een
verschil in intelligentie naar gelang het inkomen of het geslacht). Ook in
marktonderzoek wordt hiervan gebruik gemaakt. Zo kan men in een vragenlijst
diverse attitudes nagaan van een respondent ten aanzien van een bepaald merk. De
som van alle antwoorden op de vragen die attitude meten, geven dan een globaal
overzicht van hoe deze respondent tegenover dat merk staat. Zal hij geneigd zijn om
het merk wel of niet aan te kopen?
20
Wil je dit zelf eens uitproberen in SPSS? Download dan de fitness data-file via de
website.
Het hercoderen van een variabele wordt meestal gebruikt als men een aantal
categoriën wil beperken om op die manier het verrichten van statistische analyses te
vereenvoudigen.
Om een variabele te hercoderen kies: Transform, Recode, Into different variables
waardoor het 'Recode into different variables' dialoogkader wordt opgeroepen.
In dit venster geef je de naam voor je nieuwe variabele op en breng de oude variabele
van de linkerkolom over naar de rechterkolom. Klik nadien op 'Old en New Values'
en het volgende subdialoogvenster wordt opgeroepen:
21
Het principe van hercodering verloopt als volgt:
Stel dat we in ons voorbeeldje de variabele leeftijd willen hercoderen in drie groepen:
jonge mensen, de actieve bevolking en de gepensioneerden. We gaan ervan uit dat
veel jongeren nog studeren na hun 18 en daarom stellen we de leeftijd van de actieve
bevolking pas beginnend op 26 jaar. De hercodering in het Old naar New kader ziet er
dan als volgt uit:
22
overbrengen naar rechterkolom, Statistics, aanduiden van parameters die je wil
berekenen (vb.mean=rekenkundig gemiddelde), Continue, OK
• Univariate statistische parameters berekenen zonder frequentietabel:
Analyze, Descriptive statisctics, Frequencies, variabele(n) overbrengen naar
rechterkolom, optie 'Display frequencies tables' uitzetten, Statistics, aanduiden
van parameters die je wil berekenen (vb.mean=rekenkundig gemiddelde),
Continue, OK
• Frequentietabel opvragen en frequentieverdeling in grafische vorm
weergeven: Analyze, Descriptive statisctics, Frequencies, variabele(n)
overbrengen naar rechterkolom, Charts, aanduiden van gewenste grafiek,
Continue, OK
• Frequentieverdeling in grafische vorm weergegeven (zonder
frequentieverdeling): 2 mogelijkheden:
Analyze, Descriptive statisctics, Frequencies, variabele(n) overbrengen
naar rechterkolom, optie 'Display frequencies tables' uitzetten, Charts,
aanduiden van gewenste grafiek, Continue, OK
Graphs, gewenste grafiek aanduiden (vb. bar, pie, ...), variabele(n)
overbrengen, OK
Opmerking: Graphs, Gallery : hierin geeft men je uitleg over de
verschillende mogelijke grafieken
• Frequentietabel opvragen en waarden veranderen van oplopend naar
aflopend: Analyze, Descriptive statistics, Frequencies, variabele(n)
overbrengen naar rechterkolom, Format, bij optie Order 'descending values'
aanduiden, Continue, OK (Opmerking: Optie 'Suppres tables with more than n
categories': er wordt dan enkel een frequentietabel getoond als de categoriën
van variabelen kleiner of gelijk zijn aan n.)
• het opvragen van een boxplot voor de verdeling van 1 variabele: Graphs,
Boxplot, optie define summaries of separate variables aanduiden, variabele
kiezen, OK
23
• Kruistabel opvragen en rij, kolom en/of totaalpercentages tonen: Analyze,
Descriptive statistics, Crosstabs, variabelen overbrengen naar
rechterkolommen, gewenste percentage aanduiden, Continue, OK
• Scatterplot opvragen: Graphs, Scatter, optie Simple Define kiezen,
variabelen overbrengen naar rechterkolommen, OK
• Correlatiecoëfficiënt berekenen: Analyze, Correlate, Bivariate, aanduiden
van variabelen, aanduiden welke correlatiecëfficiënt je wil berekenen (vb.
Pearson), OK
• Regressie-analyse uitvoeren: Analyze, Regression, Lineair, aanduiden van
afhankelijke en onafhankelijke variabele, OK
• Regressie-analyse uitvoeren en determinatiecoëfficiënt opvragen: Analyze,
Regression, Lineair, aanduiden van afhankelijke en onafhankelijke variabele,
statistics, aanduiden van 'R square changed', Continue, OK
• Regressie-analyse uitvoeren en ongestandaardiseerde richtingscoëfficiënt
opvragen: Analyze, Regression, Lineair, aanduiden van afhankelijke en
onafhankelijke variabele, statistics, aanduiden van 'Model fit', Continue, OK
(in de output verschijnt dan de parameter B die aangeeft hoe stijl de relatie is,
hoeveel eenheden we verwachten dat de afhankelijke variabele stijgt als de
onafhankelijke variabele met 1 eenheid toeneemt. Uit het teken van B (+ of -)
kunnen we ook de richting van de relatie afleiden.)
• Regressie-analyse uitvoeren en de constante in de regressievergelijking
opvragen: Analyze, Regression, Lineair, aanduiden van afhankelijke en
onafhankelijke variabele, statistics, aanduiden van 'Model fit', Continue, OK
(in de output verschijnt dan de waarde van de constante (=A) in de kolom B
naast '(Constant)'; de constante in de regressievergelijking geeft aan welke
waarde we op de afhankelijke variabele verwachten als de onafhankelijke
variabele gelijk is aan 0.)
• Regressie-analyse uitvoeren en scatterplot met regressielijn opvragen:
Analyze, Regression, Lineair, aanduiden van afhankelijke en onafhankelijke
variabele, Plot, aanduiden van optie 'normal probability plot', Continue, OK
• Boxplot opvragen voor de verdeling van 1 variabele die wordt vergeleken
met de verschillende categorieën van een andere variabele: Graphs,
Boxplot, optie define summaries for group of cases, 2 variabelen aanduiden,
OK
24