You are on page 1of 8

KURSGUIDE OCH STUDIEPLAN

STK120 – Statistik 2: regressionsanalys – HT 2021

Välkommen till Statistik 2. Den här guiden innehåller all information om kursen. Det är
viktigt att du läser den i detalj. Det är mycket information, men du kommer att behöva den.

Uppdaterad version med anledning av campusundervisning


Efter att den första kursguiden publicerades på Canvas, har vi fått tillstånd att genomföra
undervisning på kursen på campus och inte bara på distans. Texten nedan har uppdaterats
med anledning av detta. För att göra det lättare att följa vad som har ändrats från den
tidigare versionen, har alla ändringar (förutom i det här röda stycket och i
schemat/studieplanen längre ner) gjorts med ”spara ändringar”-funktionen i Word. För att
se ändringarna, välj Review – All Markup i menyn. För att bara se den färdiga versionen,
välj Review – No Markup.

Sambandsanalys: En praktisk färdighet


På den här kursen ska du lära dig sambandsanalys: att beskriva och analysera samband
mellan två eller flera variabler, framför allt med hjälp av det som kallas för regressionsanalys.
Målet är att du ska få kompetens att kunna ta en öppen frågeställning och omsätta den till en
lämplig statistisk analys, med lämpliga metodval utifrån frågeställningen och vilken data som
finns tillgänglig, samt kunna tolka och rapportera dess resultat – också när olika tolkningar är
möjliga.
Vi kommer att gå igenom hela den grundläggande verktygslådan för detta. Vi täcker alla de
verktyg som man måste ha i sin verktygslåda för att kunna arbeta självständigt. Och framför
allt övar vi oss praktiskt i att använda dem. Det är en praktiskt inriktad kurs, där du ska ägna
mycket av din tid åt att svara på verkliga frågor med hjälp av verklig data.
Detta praktiska fokus är av två skäl. Dels är det vanlig, klassisk learning-by-doing-pedagogik.
Vi lär oss ofta saker bättre genom att få prova att använda dem än genom att bara läsa eller
höra om dem. Och grundläggande statistikfärdigheter är ett bra exempel på det. Ofta läser
man ett stycke i en lärobok eller lyssnar på en föreläsning och tycker att man har förstått.
Men när man sedan sätter sig ner för att använda det inser man att man faktiskt ännu inte har
förstått, och sedan lär man sig på riktigt genom att använda.
Och dels är det för att statistisk sambandsanalys i praktiken handlar så mycket om
avvägningar och osäkra bedömningar, att den inte går att bara läsa sig till. All statistik är
tillämpad matematik, så i teorin borde man kunna lära sig den bara genom att läsa en bok och
kanske göra lite räkneövningar. I matematiken finns det alltid eller nästan alltid klara rätt och
fel, och bevis för vad som är vad. Men så tydligt är det bara i själva matematiken – inte i de
statistiska tillämpningarna. För i dem ska vi använda matematiken till att svara på frågor om
en kaotisk verklighet, där saker sällan är matematiskt perfekta. Då börjar våra analyser istället
snabbt att handla mer om avvägningar och osäkra bedömningar än om klara rätt och fel.
Och i praktiken är det i princip ingen som lär sig att göra bra avvägningar och bedömningar
bara genom att läsa böcker och göra räkneövningar. Man lär sig genom praktisk erfarenhet.
Ju flera praktiska exempel man ser och gör, desto duktigare blir man. Ju mer kvantitet desto
bättre, och man kan fortsätta att öva sig och bli duktigare i flera år, bara med den
verktygslåda som lärs ut på den här kursen.
Därför är vi också sparsamma med att gå in på själva matematiken på kursen. Det finns
matematiska grunder som vi måste kunna, för att förstå vad de metoder som vi använder
försöker göra och hur deras resultat ska tolkas. Men vi håller den grunden så begränsad vi
kan – och på den nivån är den matematiskt ganska enkel. Vi fördjupar oss inte i den betydligt
svårare matematik som också är inblandad, men som vi kan låta datorn sköta åt oss. Det är
viktigare att vi blir duktiga på att, med datorns hjälp, tillämpa metoderna på data.
För detta behöver vi också kunna hantera något statistikprogram. På den här kursen gör vi
alla praktiska övningar i programmet Stata, som du kan ladda ner från Studentportalen.

Innehåll
Kursens innehåll utgörs av
- Kursbokens Inledning, avsnitt 1.5, 2.6, kapitel 3–6, och avsnitt 7.1.1 (inte hela 7.1).
- 8 datorövningar, som är blandningar av kompletterande undervisning och möjlighet
att öva.
Kärnan utgörs av bokens kapitel 3 och 4, som behandlar det som är mest grundläggande och
som man behöver lägga mest tid och övning på för att förstå och kunna använda. De allra
mest centrala delarna täcks också på 6 föreläsningar. Samtliga dessa delar är från kapitel 3
och 4. Övriga delar av innehållet kan läsas lite mer översiktligt.
Föreläsningarna är bara ett komplement, och ett icke-nödvändigt sådant, till boken. Det står
mycket mer i boken än vad som sägs på föreläsningarna, också i de avsnitt som
föreläsningarna täcker. Föreläsningarna kan därmed inte ersätta att läsa också de delarna av
boken. Det sägs heller ingenting på föreläsningarna som inte står i boken. Så om man tycker
att det fungerar bra att bara läsa, kan man helt strunta i föreläsningarna.
Föreläsningarna är förinspelade och finns som videofiler på Canvas. Men för de som tycker
om att kunna ställa frågor under föreläsningar, ”ges” de också på schemalagda tillfällen, i
form av att de spelas upp i det Zoom-mötesrum där vi befinner oss och vi kan pausa
uppspelningen med jämna mellanrum för frågor och samtal om materialet. Det första
föreläsningstillfället inleds med en introduktion till kursen. (Introduktionen är inte
förinspelad, men där sägs ungefär samma saker som står i den här guiden.)
Föreläsningarna hålls på campus, samt finns som förinspelade versioner som videofiler på
Canvas. Det första föreläsningstillfället inleds med en introduktion till kursen. (Den finns inte
förinspelad, men där sägs ungefär samma saker som står i den här guiden.)
I boken finns en del instuderingsuppgifter som mestadels löses med papper och penna. Dessa
bör du göra. Men de är ganska få, i linje med vad som står ovan om att det är vid praktiskt
arbete med data som man verkligen lär sig. Så när du har läst i boken och gjort
instuderingsuppgifterna, är det dags att gå vidare till de praktiska övningarna. Det finns ett
schemalagt handledningstillfälle till varje övning, och två till den sista.
Kursen kräver mycket arbete! Nästan alla kommer att behöva lägga åtminstone nästan 40
timmar per vecka för att klara den. Mycket få kommer att klara den om de försöker att läsa
någon annan kurs samtidigt, eller arbeta deltid på mer än maximalt 20–25%.
Men det betyder inte att du kommer att behöva hålla ett högt tempo under kursen. Det är
nästan tvärtom. Volymen som du behöver ta dig igenom är inte jättestor. Det är inte
jättemånga sidor i boken, och datorövningarna tar inte mer än några timmar per övning. Du
behöver inte skynda dig. Men du behöver tillåta dig att arbeta grundligt med varje moment i
ett lågt tempo, och gå tillbaka och repetera mycket. Du behöver stanna upp vid och gå till
botten med varje fråga och fundering som dyker upp för dig under arbetets gång. Ofta genom
att gå tillbaka och läsa eller göra något tidigare moment en gång till. Man behöver gå igenom
flera av de här sakerna flera varv för att utveckla förståelsen ordentligt. Det finns tid till att
göra det på kursen, och det är den tiden som du behöver lägga.
Och jag rekommenderar starkt att ni försöker att prata så mycket som möjligt med mig, när ni
undrar över saker. Bakom en fundering om någonting litet som man tycker skaver lite i
kanten, döljer det sig ofta en större fundering som man ännu inte har lyckats sätta fingret på.
Så när ni tar upp de funderingar som ni har, oavsett hur små de är, leder det ofta till att vi
tillsammans kan klara ut också större saker.

Mål och examination


Vid kursens slut ska du ha grundläggande rätt-och-fel-kunskaper om hur de olika metoder
som kursen täcker fungerar. Och du ska ha tillräckliga färdigheter i praktisk tillämpning av
dessa metoder för att självständigt kunna arbeta med regressionsanalys för enklare
frågeställningar, i arbetslivet eller i en c-uppsats.
Kursen examineras genom en skriftlig tenta. Vi har inte de tekniska förutsättningarna för att
kunna examinera ett praktiskt analysarbete i tentasal, och hemexamination medför för stora
risker för fusk. Tentan fokuserar främst på de grundläggande rätt-och-fel-kunskaperna, och
kan bara i begränsad utsträckning utvärdera förmågan till praktiskt arbete.
Det är alltså tyvärr så att en stor del av det som jag allra helst vill att ni ska ta med er från
kursen inte täcks av examinationen. Men att det är så erbjuder inga större genvägar genom
kursen, som till att kunna bortse från mer praktiskt inriktade delar av materialet och ändå
klara tentan. För tentan är konstruerad så att djupförståelse krävs för att klara den. Och den
effektivaste vägen till den djupförståelsen är genom praktisk övning.
Även den som inte har ambitionen att utveckla någon större förmåga till självständigt arbete,
utan är nöjd med att bara klara tentan, behöver därför göra jobbet. Mycket få som inte lägger
åtminstone nästan 40 timmar per vecka klarar den här kursen. Och man behöver göra
datorövningarna. Jag har undervisat på det här materialet ganska länge nu och jag ser att det
är framför allt vid arbete med praktiska övningar som studenter lär sig materialet – också det
teoretiska.
Dessutom brukar de flesta tycka att det är ganska kul, om de går in för att göra kursen
ordentligt och verkligen försöka lära sig. Det är ganska roligt att leta efter samband i data och
därigenom upptäcka saker om världen. Så gå in för det! Lita på att ni kommer att behöva
lägga mycket tid och arbeta igenom allt ordentligt, och så kommer ni nog också att tycka att
det är ganska roligt längs vägen.

Datorövningar
Datorövningarna har i huvudsak två moment: Moment där jag demonstrerar och du följer
med, och moment där du får uppgifter att lösa själv.
För varje huvudmoment som introduceras i boken finns det en demonstration i en
datorövning. Demonstrationen täcker hur saker kodas i Stata och exempel på saker som ofta
kan hända när vi arbetar med momentet och hur vi kan tänka kring dem. Demonstrationerna
syftar mycket till att visa på en viss bredd av vad du kan komma att ställas inför.
Alla demonstrationer är förkodade i Stata och du går igenom dem på egen hand i ditt eget
tempo. Ibland är det kontroll- och förståelsefrågor insprängda i dem, där du kan stämma av
din förståelse.
Moment där du får uppgifter att lösa själv ger dig möjligheten att stämma av vad du har hängt
med på. De är upplagda för att försöka ge dig så mycket chanser som möjligt att upptäcka att
det är någonting som du inte förstår, och som du behöver gå tillbaka och repetera, eller prata
med mig om. Också dessa moment gör du helt på egen hand. Och det finns kommenterade
lösningsförslag som du kan jämföra dina lösningar med.
Det finns ett schemalagt handledningstillfälle till varje datorövning, och två till den sista. Det
första handledningstillfället inleds med att jag gör en mycket kort genomgång av Stata. I
övrigt gör jag Jag gör inga planerade genomgångar vid dessa tillfällen och alla övningar är
konstruerade för att vara helt självförklarande. Handledningstillfällena finns helt och hållet
till för att hantera frågor som du ställer dig och saker som du vill prata om under arbetets
gång.
Fyra av de nio handledningstillfällena ges i datasalar på campus och fem på distans över
Zoom. Varje tillfälle på campus sprids över tre pass under en och samma dag, där varje
student bara får närvara på ett pass. Tre arbetsdagar före varje pass skapas grupper på
Canvas, en för vart och ett av de tre passen. Man anmäler sig till att delta på ett pass genom
att gå med i den grupp som hör till det passet. Dessa grupper kommer att ligga under fliken
”Grupper” under ”Personer” i vänstermenyn. (Dessa grupper tittar jag bara i vid behov, om
det blir flera personer i salen än vad det ska kunna vara.) Var snäll och hjälp andra genom att
avanmäla dig om du ändrar dig och inte tänker komma på ett pass som du har anmält dig till.
De flesta brukar ha stor nytta av att arbeta med datorövningarna i par. Nu blev vi tyvärr
tvungna att genomföra kursen på distans också den här gången, vilket gör att ni inte enkelt
kan skapa par i datasalar. Men om du känner någon på kursen så rekommenderar jag starkt att
ni ses och gör datorövningarna tillsammans. Det brukar ge mycket att ha någon att prata med
löpande när man arbetar med dem. Om du inte känner någon, men gärna vill ha någon att
arbeta med och inte vill slänga ut frågan öppet på diskussionsforumet på Canvas, kan du om
du vill skicka ett mail till mig. Om jag då får mail av två olika som säger att de gärna vill ha
någon att jobba tillsammans med, kan jag föra ihop er.
De flesta brukar ha stor nytta av att arbeta med datorövningarna i par. Det brukar ge mycket
(för nästan alla) att ha någon att prata med löpande när man arbetar med dem. Jag
rekommenderar starkt att man vid det första schemalagda övningstillfället, som är på campus,
bildar par med någon och sedan försöker att göra alla övningar tillsammans med den
personen. (Eller bilda större grupper om ni vill, men var medvetna om att det är mycket
svårare att se till att alla hänger med fullt ut då.) Viss parbildning kommer också att vara
nödvändig för att alla ska få plats vid datorerna i datasalen, så länge fler än ungefär hälften av
alla registrerade studenter kommer på en övning.
En kort bild av de olika datorövningarna:
1. Demonstration av hur Stata fungerar och hur man där utför de första typerna av
analyser som vi går igenom (till och med avsnitt 4.3).
2. Har två delar. I del 1 får du svara på frågor genom att utföra sådana analyser som
gicks igenom i övning 1. I del 2 ges en demonstration som kompletterar
undervisningen från kapitel 3 (och föreläsning 1).
3. Demonstration av hur moment från avsnitten 4.4 och 4.5 hanteras i Stata, samt
komplettering av undervisningen i de avsnitten genom att samma saker belyses ur en
annan vinkel.
4. Uppgifter att lösa själv på allt som har gåtts igenom till och med avsnitt 4.5.
5. Demonstration av hur moment från avsnitten 4.7–4.9 hanteras i Stata, samt
återkoppling till övning 2 del 2 och hur vi med nya verktyg kan hantera samma
frågeställning som där på bättre sätt.
6. Uppgifter att lösa själv på allt som har gåtts igenom till och med avsnitt 4.9.
7. Uppgifter att lösa själv på allt som har gåtts igenom till och med avsnitt 5.1. Samt
möjlighet att öva på rapportskrivning och avstämning mot exempelrapport. (Att skriva
en hel rapport ingår inte i examinationen, men rapportskrivningsmoment kan komma
på tentan.)
8. Större och mer öppen uppgift att lösa själv, där mycket av det som vi har gjort på
kursen strålar samman. Grunden för uppgiften är kapitel 6, men en bra lösning kräver
god förståelse också av mycket av det som har gjorts under resten av kursen. Lägg
gärna särskilt mycket tid på denna övning, som ger ganska stora möjligheter att
utvärdera din förståelse av olika delar så långt.

Frågor och handledning


Du kan arbeta med både föreläsningar och datorövningar helt själv. Allting ligger på Canvas,
och jag levererar inget ytterligare förberett material på de schemalagda tillfällena. De
schemalagda tillfällena finns till helt för att ge er gott om tid och möjligheter att ställa frågor
och diskutera.
Så håll inte inne med dina frågor vid dessa tillfällen. Om ingen ställer några frågor under en
föreläsning gjorde det ingen nytta att vi hade det schemalagda tillfället. Då kunde alla ha tittat
på den förinspelade versionen var och en för sig istället. Och var inte rädd för att ta upp för
mycket tid. Tillfället är ju bara till för de som vill ställa frågor om och diskutera innehållet.
Så det finns nästan ingen anledning alls att oroa sig för att de andra studenterna tycker att
man tar upp för mycket tid (inom rimliga gränser) med frågor och diskussioner och önskar att
föreläsningen bara kunde fortsätta. För den som bara vill att föreläsningen ska fortsätta kan
titta på den förinspelade versionen själv istället för att vara med på passetföreläsningen i sal.
Tänk också på att många studenter ofta tycker att det är skönt när andra studenter ställer
frågor, för då sänks ribban och det blir lättare för dem att våga ställa sina egna. Det gäller
särskilt vid undervisning på distans, när den ribban känns högre för många. Detta hör vi ofta
från studenter.
De schemalagda tillfällena till datorövningarna finns också bara till för att ni ska kunna fråga
och diskutera med mig. Vi kan diskutera vad ni vill från kursinnehållet på dessa tillfällen.
Men de är schemalagda så att de ska passa i planeringen för när datorövningarna bör göras.
Oftast börjar de klockan 9:30. Tanken är då att ni kan börja arbeta med övningen tidigare på
morgonen, så att ni har kommit en bit och har hunnit samla på er frågor när
handledningstillfället börjar. Det första tillfället börjar 8:15, för där kan det tänkas att många
vill höra min lilla introduktion till Stata innan de börjar arbeta med övningen.
Det finns alltså sammanlagt 15 tillfällen som är schemalagda helt och hållet för att ge er gott
om möjligheter att ställa alla typer av frågor och föra upp alla typer av diskussioner ni vill om
kursinnehållet med mig. Men dessa 15 tillfällen är också de enda möjligheterna jag ger till
detta. Jag svarar inte på några frågor om kursinnehållet på mail och jag är heller inte aktiv i
Canvas diskussionsforum. Om det dyker upp en fråga när du sitter själv och arbetar, måste du
spara den till nästa schemalagda tillfälle.
(Om du däremot har frågor som är av mer praktisk eller administrativ karaktär är det förstås
mindre lämpligt att ställa dem inför andra och då går det bra på mail. Och ovan nämns också
att du gärna får maila för att få hjälp att hitta en studiekompis. Men alla frågor om själva
statistiken tar vi på de schemalagda tillfällena.)

Tenta
Kursen examineras genom en skriftlig tenta. Tentan sker i universitets tentasal, även om
kursen nu i övrigt ges på distans.
Man måste föranmäla sig till tentan i Ladok. Deadlines för anmälan till respektive
tentatillfälle kommer att stå på kursens startsida på Canvas.
Tentan skrivs i DISA, som är universitetets system för digitala tentor. Detta innebär att du
behöver antingen ha med dig en egen laptop som du har förberett genom att installera en
särskild programvara på, eller i god tid före tentan boka en lånedator från tentasalen.
Detaljerad information finns på Studentportalen, se länk dit från kursens startsida på Canvas.
En utförlig beskrivning av kursens kunskapskrav och hur tentans konstruktion och
bedömning matchar mot dessa finns i dokumentet Kunskapskrav och tentaupplägg. Du bör
nog vänta till ungefär en vecka in i kursen med att läsa det dokumentet, för att riktigt förstå
vad det beskriver.

Diagnostiskt prov
När du är färdig med kapitel 3 och 4 och har gjort alla övningar på det, kan det vara lämpligt
att göra det diagnostiska provet som ligger på Canvas. Det består av gamla tentafrågor på
motsvarande de två kapitlen, och med lösningsförslag i ett separat dokument. Det kan ge en
bra utvärdering av hur bra du har hängt med i förhållande till vad som kommer att krävas på
tentan.

Schema och studieplan


Nedan följer ett detaljerat förslag till hur du kan lägga upp studierna på kursen, utifrån vad
jag bedömer som en bra tidsfördelning. Schemalagda moment anges i rött. Därtill anges
förslag på vad du bör arbeta med vilken dag, inklusive vilka avsnitt som bör läsas i boken.
Sluttiderna för datorövningarna i schemat är exakta, men föreläsningarna kan hålla på kortare
än vad som står i schemat, om det inte är så mycket frågor. de för föreläsningarna är
ungefärliga. Föreläsningarna får hålla på så lång tid som behövs (inom rimliga gränser)
beroende på hur mycket frågor och kommentarer ni har. Gissningsvis kommer de flesta att
hålla på kortare tid än vad som står i schemat, men det kan också bli längre. Det är ju bara att
lämna för den som inte kan vara med längre.
I planen anges mycket tid till repetition. Räkna med att dina studier kommer att innehålla
mycket repetition. Att läsa texterna i boken (och eventuellt titta på föreläsningarna) tar inte
särskilt mycket tid första gången. Men när du sedan arbetar med datorövningarna kommer du
att upptäcka vilka delar av det du har läst som du inte har förstått fullt ut, och då kommer du
att behöva gå tillbaka och läsa dessa delar igen. Och sedan kanske återvända till övningen en
gång till, och så vidare. Det finns tid till att stanna upp och gå till botten med varje fundering,
och det är viktigt att göra det.
Föreläsning 1, 8:15–11:00: Kursintroduktion samt 3–3.2.
Läs Inledning, 3–3.2.1 (inklusive många instuderingsuppgifter). Hoppa inte över
30 sept inledningen; där ges några av undervisningens grundtankar.
Föreläsning 2, 8:15–11:00: 3.3–4.2.
1 okt Läs 3.2.2–4.1.
Läs 1.5, 2.6, 4.2–4.3. (1.5 läses översiktligt, bara för att vara lite förberedd inför
4 okt övningen nästa dag där Stata introduceras ordentligt.)
Övning 1, Olika tider.
Repetera (räkna med att denna och senare övningar hjälper till med att visa vad du
5 okt behöver repetera).
Övning 2, 9:30–12:00.
6 okt Repetera.
Föreläsning 3, 8:15–10:00: 4.4
7 okt Läs 4.4 (inklusive många instuderingsuppgifter).
Föreläsning 4, 8:15–10:00: 4.5
8 okt Läs 4.5–4.6.
Övning 3, 9:30–12:00.
11 okt Repetera.
Övning 4, Olika tider.
12 okt Repetera.
Föreläsning 5, 8:15–10:00: 4.7–4.8.
13 okt Läs 4.7.
Läs 4.8 samt 7.1–7.1.1 (dvs sidorna 573–578; delarna 7.1.2 och framåt ingår inte i
14 okt kursen) och repetera efter behov.
Föreläsning 6, 8:15–10:00: 4.9.
15 okt Läs 4.9–4.10.
Övning 5, 9:30–12:00.
18 okt Repetera.
Övning 6, Olika tider.
19 okt Repetera.
20 okt Gör diagnostiskt prov.
Läs 5. (Många sidor, men 5.1 kan läsas ganska översiktligt och djupförståelse är
inte nödvändig, och 5.2–5.5 är lätt läsning. Ta pauser mellan de olika delarna och
21 okt sprid läsningen över hela dagen.)
Övning 7, 9:30–12:00.
Gör analysdelen av övningen under handledningen på förmiddagen. Ägna
eftermiddagen åt att skissa på hur du skulle skriva ner resultaten i en rapport, och
22 okt jämför sedan det med rapportförslaget.
25 okt Läs 6 och börja titta på Övning 8.
26 okt Övning 8 handledningstillfälle 1, Olika tider.
27 okt Övning 8 handledningstillfälle 2, 13:15–15:00.
28 okt Repetera.
29 okt Repetera.

Zoom
Alla schemalagda momentDe fem handledningstillfällena på Zoom sker i mitt mötesrum på
Zoom: nummer 276 874 1088. Det fungerar också med den här länken, som också finns på
kursens startsida i Canvas: https://gu-se.zoom.us/j/2768741088
Jag vill be den som pratar i rummet att alltid slå på sin kamera. Detta blir så mycket roligare
för oss alla då. Och ibland blir mina svar långa och då vill jag kunna se den jag pratar med för
att se hur väl den ser ut att hänga med.

Fel i boken
Lösningen på sidan 330 till instuderingsuppgiften på sidan 328 är fel på slutet. Sista
meningen påstår sig räkna ut standardavvikelsen, men räknar egentligen ut variansen. Den
efterfrågade standardavvikelsen är därmed lika med roten ur 1.28, det vill säga ungefär lika
med 1.13.

You might also like