You are on page 1of 15

Kap 8 - Demografi

8.1 Några grundläggande begrepp


Tvärsnittsdata - beskriver befolkningen vid en viss tidpunkt. Källa: folkräkningarna och från
stickprovsundersökningar.
Perioddata - befolkningens förändringar under en viss period. Bygger på löpande registrering +
intervjuer.
Ålderspyramid/befolkningspyramid
Befolkningens storlek vid en tidpunkt: P1 = P0 + (F01 - D01) + (I01 + U01)
- P0 = befolkningens storlek i början av perioden
- P1 = befolkningens storlek i slutet av perioden
- F01 = antalet levande födda under perioden
- D01 = antalet döda under perioden
- I01 = antalet inflyttade under perioden
- U01 = antalet utflyttade under perioden
- (F01 - D01) = den naturliga folkökningen/minskningen
- (I01 - U01) = flyttningsöverskottet/underskottet
Allmänna födelsetalet = antalet födda under ett år/medelfolkmängden under året
Allmänna dödstalet, allmänna inflyttningstalet, allmänna utflyttningstalet: se ovan, alla dessa
kan vara vilseledande
Medelfolkmängden = P0 + P1 / 2

8.2 Dödlighet och livslängd


Kohort: födelsekull, individer som är födda samtidigt (ett-års eller fem-års-kohorter)
Kohortdödlighet: studie av dödsrisker i olika åldrar för samtidigt födda, “samtidigt födda”
Perioddödlighet: studie av dödlighet som skett i olika åldrar och kohorter under en viss period,
“samtidigt döda”
Livslängdstabell: beräkning av hur en tänkt (konstgjord) födelsekull minskar när den utsätts för
aktuella dödsrisker.
● dödsrisk/överlevelsesannolikhet
Medellivslängd: medellivslängden för nyfödda, hur länge nyfödda i genomsnitt har kvar att leva
Återstående medellivslängd för nyfödda, e0:

l0 = födelsekullens storlek
Σli = summan av antalet personer som uppnår åldern 0, 1, 2, 3 år etc. Σli = l0 + l1 + l2 …
Återstående medellivslängd för den del av befolkningen som är i en viss ålder, e n:

(n) Σli = ln + ln+1 + ln+2 …


Sannolika livslängden/medianlivslängden: den ålder då exakt hälften av födelsekullen är i livet
Sannolika återstående livslängden
Typvärdet: sannolikaste livslängden/vanligaste livslängden (den ålder flest dör)
8.3 Fruktsamhet och reproduktion
Antalet årligen födda
Allmänna födelsetalet: kvoten mellan antalet födda under ett år och medelfolkmängden under året
Åldersspecifika fruktsamhetstal: hur många levande barn kvinnor i en viss åldersgrupp har fött
under året dividerat med medelfolkmängden kvinnor i åldersgruppen under året.
Bruttoreproduktionstalet, B
Nettoreproduktionstalet, N
Årliga folkökningen = (1 + r)30 = N r = N1/30 - 1
➔ Exempel 8.
N: 1.12 r = 1.121/30 - 1 = 1.0038 - 1 = 0.0038 (3.8 promille per år)
Kohortfruktsamhet: man räknar ut hur många barn eller döttrar kvinnorna i en viss årgång faktiskt
fött

8.4 Befolkningsstrukturer och befolkningsförändringar


En åldersfördelning kan berätta om framtida generationer, eftersom om en kull är större kommer
antagligen det bli en större kull när de ska få barn.
Teoretiska befolkningsmodeller: m.h.a. dessa kan man bestämma vilken åldersfördelning man får i
en befolkning.
Stabila befolkningar: dödligheten i olika åldrar är konstant under en lång period, ca 100 år, och
ingen in- eller utflyttning sker.
F / F*e0 = 1 / eo

8.5 Befolkningsprognoser och framtiden


Befolkningsprognos: en bedömning av en befolknings framtida storlek och struktur, t.ex. fördelning
efter ålder, kön och civilstånd.
Exponentialfunktionen: Pn = P0 * 1.03n
Ex. P0 = 1 och P1 = 2 → n = 23 Alltså: Folkmängden blir dubbelt så stor efter 23 år om den
årliga ökningen är 3%.
Befolkningsprojektioner: m.h.a. komponentmetoden. Varje åldersgrupp framskriva till den tidpunkt
prognosen avser.
Alternativa prognoser: beräkningar baseras på olika antaganden om den framtida utvecklingen
gällande dödlighet, fruktsamhet och omflyttning.
Den demografiska försörjningskvoten: mått för att bedöma de ekonomiska konsekvenserna av
befolkningsutvecklingen.
personer under 20 år + personer över 67 år = icke-arbetsför ålder
personer 20-66 år arbetsför ålder

Kap 5 - Index
5.1 Att beräkna och begripa indexserier
Statistiska uppgifter som visar utvecklingen under en tidsperiod kan man beskriva med en indexserie.
Utgångspunkten kan vara vad som, ex ett år eller en månad, och kallas för bastidpunkt eller basår.
Man tar därefter kvoten mellan det året man jämför med och basåret. Indextalens storlek beror på vad
man jämför med!
5.2 Hur stor är förändringen per år?
Hur stor har den procentuella ökningen/minskningen i genomsnitt varit per år? Görs enligt
ränta-på-ränta-principen. Beroende på hur vi redovisar, vad vi jämför med kan det se olika ut- därmed
också missvisande.

Ex. År 2000 är indexvärdet 103.4 och ett år senare 103.4*p. 10 år senare är indexvärdet
103.4*p10=109.6. Detta ger ekvationen 103.4*p10=109.6 som också kan skrivas som
p10=109.6/103.4=1.0599… vilket är lika med p=1.05991/10. Lös detta genom att använda yx på
miniräknaren: p=1.006.
Värdet p innebär att folkmängden varje i genomsnitt är ungefär 100.6% av folkmängden
föregående år. Den årliga genomsnittliga ökningen är 0.6%.

5.3 Byte av bastidpunkt


Beroende på vad man vill lyfta för ämne och syfte, kan man välja ett visst basår eller vissa ex. varor
för att påverka läsaren i en riktning. För att inte hamna i dessa fällor ska man fråga sig:
● Vem gör jämförelsen?
● Vilka - eventuellt dolda - syften har jämförelsen?
● Vad är det som jämförs och varför jämförs det?
● Vilken jämförelseperiod har valts och varför?

Ett problem som kan uppstå är att vi tolkar procenttal (indexvärden) som absoluta tal. Så om vi ritar
upp ett diagram på indexvärdena kan det ge en skev bild av verkligheten.

Kontrollfrågor:
● Vilken information vill man förmedla?
● Är redovisningen meningsfull?
● Ger redovisningen en korrekt bild?
● Är redovisningen lätt att begripa?

5.4 Index för grupper av varor


Vi vill ofta beräkna prisutvecklingen för flera varor, inte bara en! Det beror inte bara på hur priserna
varierar utan också vilka varor och hur mycket av olika varor kassen innehåller. Det kommer att se
olika ut beroende på vems kasse vi tittar på - studentens, familjens eller pensionärens?

Hur mycket har prisnivån förändrats från år 1998 till 1999?


Alt 1 - hur mycket totalkostnaden har stigit om man köper en enhet av varje vara: Summera priserna
för 1999 och sätta i relation till samma summa 1998:
Σp99=97.10 Σp98=94.40 Index: 97.10/94.40=102.9%. Genomsnittlig prisnivå har stigit med
2.9%.
Vara 1998 1999 2000

Rågbröd 12.80 13.30 13.40

Ost 60.70 62.40 62.60


Smör 20.90 21.40 21.70

Alt.2 - index beräknas som ett vanligt ovägt medeltal i procenttal: För varje vara beräknar vi ett index
som kvoten (%) mellan pris 1999 och 1998.
Vara Index

Rågbröd 103.9

Ost 102.8

Smör 102.4
Vanligt medelvärde: 103.9+102.8+102.4/3=103.0 → 3%

Viktigt att väga in hur mycket av varje vara som konsumeras!

p=priser q=kvantiteter
Täljaren är totalkostnaden för kassen vid tidpunkt t (jämförelsetidpunkten). Nämnaren anger
totalkostnader för samma kasse vid tidpunkt 0 (bastidpunkten).

5.5 Indexformler
Prisändringar leder normalt till kvantitetsändringar. Därför är det inte rimligt att jämföra två identiska
kassar eftersom det inte stämmer överens med verkligheten. För att lösa detta har vi indexformler, ex.
Laspeyres index och Paasches index.

Laspeyres:

Utgår från konsumtionen vid bastidpunkten. Man beräknar vad denna konsumtion skulle kosta vid
jämförelsetidpunkten och sätter beloppet i relation till den faktiska kostnaden vid bastidpunkten. Tar
ingen hänsyn till prisändringar.

Paasches index:
Utgår från konsumtion vid jämförelsetidpunkten. Man sätter den faktiska kostnaden vid
jämförelsetidpunkten i förhållande till vad denna konsumtion kostat vid bastidpunkten. Dock var
konsumtionen en annan då...

5.6 Kedjeindex
Problemet med ändrad inriktning och omfattning av konsumtionen (TV-apparater, hemtelefoner etc.)
försöker man lösa genom att beräkna kedjeindex. Då justerar man regelbundet uppsättningen av varor
och motsvarande kvantiteter. Bygger på ränta-på-ränta-principen.

Fastbasindex - Motsatser till kedjeindex, som innebär att man har samma varusammansättning och
samma kvantiteter (q0) för att i jämförelsetidpunkter i indexserien.

Beräkning av kedjeindex
Första tidpunkten tilldelar man värdet 100. För var och en av de följande tidpunkterna beräknar man
en indexlänk, som anger tidpunktens prisnivå i förhållande till den tidigare tidpunktens prisnivå. Hela
tiden multiplicerar man länkarna med indexkedjan.
Laspeyres formel:

5.7 Konsumentprisindex, KPI


Basåret är 1980 vilket har indexvärdet (årsmedelvärdet) 100. KPI är ett genomsnittsmått på
prisutvecklingen för hela den privata konsumtionen av varor och tjänster i Sverige. Man mäter
priserna som konsumenterna faktiskt betalar, vilket innebär att indexen påverkas av ändringar i
indirekta skatter och subventioner. Höjd moms leder till att KPI stiger. Direkta skatter och sociala
förmåner påverkar inte indexberäkningen.

Många avtal innehåller så kallade indexregleringar, eftersom köpkraften kan ändras beroende på vad
priserna är.

Fastbasteknik innebär att vi har en hypotetisk shoppingvagn med exakt samma varor och tjänster
varje. Varje gång shoppar vi samma saker, för att vi sedan ska kunna jämföra dessa. Detta funkar
under ett år, men inte under flera år på raden. Då måste vi använda oss av kedjeindex.

I KPI använder man sig av årslänkar. Varje sådan länk mäter hur mycket prisnivån har förändrats
sedan föregående år och som vikter använder man konsumtionen under båda berörda år. I årslänken
vägs också de prisförändringar som av olika skäl inte har kunnat införas i beräkningarna under året.

Huvudgrupper, undergrupper & representantvaror används istället för att skriva upp alla tänkbara
varor och tjänster som finns. Varje representantvara får ett vägningstal som visar hur stor värdemässig
andel varan representerar av vår totala privata konsumtion.

Tillförlitlighet med KPI:


- täckningsfel som beror på att vissa varugrupper inte undersöks
- osäkerhet som beror på de urval som görs, både av representantvaror och försäljningstillfällen
- osäkerhet pga. kvalitetsförändringar
- osäkerhet angående vägningstal

5.8 Omräkning med KPI


KPI är ett mått på den allmänna prisnivåns förändringar och därmed också ett mått på hur köpkraften
för en krona ändras. KPI används för att värdesäkra belopp i framtiden som hela tiden utbetalas
regelbundet. KPI används också för att räkna om (deflatera) löpande priser till fasta priser. Detta är
viktigt när vi exempelvis ska jämföra löneändringar över år, då vi är intresserade av reallönerna för att
kunna jämföra.

Nettoprisindex, NPI, beskriver utvecklingen av konsumentpriserna exklusive nettot av indirekta


skatter och subventioner.

Harmoniserat index för konsumentpriser, HIKP, har utvecklats som jämförbart mått på inflationen
inom EU.

5.9 Att kedja indexserier med olika basår


Vi har haft olika basår över tiden, nu är det 1980 men innan det var basåret 1949. Därför kan det vara
av värde att kedja ihop dessa.

Tumregel: Indexvärdena efter år 1980 enligt den gamla serien för man genom att multiplicera
värdena enligt den nya serien med 5.71.

Levnadskostnadsindex, LKI - prisnivåns förändringar före år 1949.

Kap 4 - Spridning
Två material kan ha samma genomsnitt men olika spridning kring detta, vilket gör att
genomsnittsmåtten måste kompletteras med information om detta. Det främsta måttet är
standardavvikelsen.

4.1 Minsta och största värde - variationsområde


Det enklaste sättet att beskriva spridningen är att ange variationsområdet (det minsta och största
värdet). Variationsvidd/variationsbredd (range)= skillnad mellan det största och minsta värdet.
4.2 Fraktiler
Delar ett statistiskt material i bestämda proportioner och förutsätter att minst ordinalskala (ordna efter
storlek).
1. Medianen - delar materialet i två lika stora delar.
2. Percentiler - delar materialet i hundra lika stora delar. P01 P02, P03 P04 … P99. Under P09 ligger
9% av fördelningen och över P09 ligger 91% av fördelningen.
3. Deciler - delar materialet i 10 lika stora delar. P10 P20
4. Kvartiler - delar materialet i fyra lika stora delar. P25=q1 ,P50=q2=md. Den första kvartilen,
qq, kallas den undre och den tredje, q3, kallas den övre. Båda dessa delar materialet ytterligare
en gång efter att medianen (md, q2) har gjort det.

19 19 20 20 22 23 24 24 24 26 26 28 38 42 45 53

min q1 q1 md q3 q3 max
q1=(20+22)/2=21 q3=(28+38)/2=33
← kvartilavstånd →
← kvartilavvikelse → ← kvartilavvikelse →
Beräkning av kvartilavstånd kräver minst intervallskala.
Klassindelat material - fraktiler bestäms genom interpolering.

4.3 Lådagram
4.4 Standardavvikelsen
Förutsätter minst intervallskala, eftersom beräkningarna innebär att både summor och differenser
bildas.

Beräkning alt. 1

x (x-x) (x-x)2

1 -3 9

2 -2 4

3 -1 1

3 -1 1

6 2 4

9 5 25

Σx=24 Σ(x-x)=0 Σ(x-x)2=44

1. Medelvärdet beräknas: x = 24/6 = 4


2. Kolumn 2 visar varje observations avvikelse från medelvärdet 4. Summan är alltid noll!
3. Kolumn 3 visar kvadratsumman.
4. Kvadratsumman divideras med n-1: 44/(6-1)=8.8
5. Standardavvikelsen beräknas nu genom att ta roten ur 8.8 = 2.97.

4.4.1 Praktiska beräkningar


Alt. 2

Antalet observationer = n = 6 Σx=24 → Σx2=12+22+32+32+62+92=140


Sätt in värdena i formeln och få samma resultat som i alt. 1: 2.97.
Σx2 ≠ (Σx)2 då Σx2=140 (summan av de kvadrerade observationerna) och (Σx)2=242=576
(kvadraten på de summerade observationerna).

Alt. 3

x f f*x f*x2
frånvarodagar antal arbetstagare

0 11 0 0

1 6 6 6

2 10 20 40

3 8 24 72

4 2 8 32

5 1 5 25

Σf = 38 Σf * x = 63 Σf * x2 =175

Beräkna standardavvikelsen enligt formeln!

4.4.2 Normalfördelningsregeln
En av de viktigaste och mest kända sannolikhetsmodellerna. Normalfördelningen ser ut olika
sätt beroende på de numeriska värdena på medelvärdet och standardavvikelsen. Kurvan är
alltid symmetrisk kring medelvärdet.

NF-regeln:
● ca 68% av observationerna ligger mellan gränserna x - s och x + s
● ca 95% av observationerna ligger mellan gränserna x - 2*s och x + 2*s
Man beräknar andelen observationer i de båda intervallen (65% och 95%) och jämför
resultatet med normalfördelningsregeln.

4.4.3 Snabbskattning av standardavvikelsen


För inte alltför stora symmetriskt fördelade material kan man räkna med att differensen
mellan det minsta och största värdet (variationsvidden) är ca 4 standardavvikelser. En
snabbskattning av standardavvikelsen kan man få genom att dela variationsvidden med 4.
4.4.4 Standardavvikelsens släktingar
Varians = standardavvikelsen2 = s2
Variationskoefficienten, VK = kvoten mellan standardavvikelsen och medelvärdet. Anges i
procent. Det är ett mått på variabelns relativa spridning och beräknas endast och variabeln
antar positiva värden.
Genomsnittliga avvikelsen - Medelvärdet av observationernas absoluta (positiva) avvikelser
från medianen.

4.4.5 Linjära transformationer


Att räkna om (transformera) olika värden. Exempelvis liter till till cups, inches till cm osv.
y=a+b*x
Ex. Fem x-värden: 7 8 12 9 10
x = 7+8+12+9+10/5 = 9.2
Transformera (minska) värdena med 6. Transformationen: y = x - 6
Y-värden: 1 2 6 3 4
x = 3.2 Medelvärdet för y är exakt 6 enheter mindre än medelvärdet för x: y=x-6

Standardavvikelse vid transformation


Beräkna för x och sen för y. Båda för 1.92 och är alltså oförändrad! Det är ju fortfarande lika
stor spridning.

Multiplikation och division medför en skalförändring.

Kap 3 - Genomsnitt
Genomsnitt och spridning kring genomsnittet är av intresse. Det finns olika genomsnittsmått
(lägesmått, centralmått). Typvärdet, medianen och det aritmetiska medelvärdet.

3.1 Typvärdet (mode)


Det vanligaste värdet, värdet med högst frekvens,f. Fördelningens maximum.
Bimodal fördelning: två typvärden.
Krav: nominalskala.

Beräknas när:
- det vanligaste värdet är av speciellt intresse.
- man utan närmare beräkningar vill ange ett genomsnittsmått.
- fler än hälften av observationerna antar samma värde.
- observationernas datanivå inte tillåter beräkning av andra genomsnittsmått.
3.2 Medianen, md
Medianen är mittobservationens variabelvärde (kräver att materialet är indelat i storleksordning,
ordinalskala).Vid jämnt antal är medianen medelvärdet av de två mittobservationerna. Man utgår från
de ackumulerade/ kumulerade frekvenserna vid beräkning.
Medianens ordningsnummer = n+1 / 2

Tumregler:
- Medianen är lätt att förstå och därför ofta ett bra beskrivande mått.
- Kräver endast ordinalskala.
- Bra när materialet innehåller extremvärden som kan bli missvisande med andra
genomsnittsmått. Medianen är därmed robust.

Medianen för klasser


1. Beräkna total frekvens (n) och kumulerad frekvens
2. Hitta rätt areaenhet för medianen genom att ta n/2
3. Ta reda på i vilken klass medianen finns m.h.a den kumulerade frekvensen
Formel: undre klassgräns + [(medianens areaenhet + antalet enheter innan klassen)/antalet enheter i
klassen] * klassbredden

3.3 Det aritmetiska medelvärdet


Summan av de observerade värdena dividerat med antalet observationer. Krävs minst intervallskala.

Medelvärdet =
Antalet observationer = n

f*x/f = medelvärdet

3.4 Vilket genomsnitt?


Vid extremvärden → median.
Trimmade/stympade medelvärden: stryka ett eller flera extremvärden.
Totalmedelvärde = vägt medelvärde = sammanslagning av flera statistiska material.

3.5 Betingade medelvärden och regression fallacy


Betingat medelvärde: villkorliga, “alla elever som har alla rätt på prov 1, vad får de på prov 2?” →
medelvärdet av det.
Regression fallacy: felaktiga slutsatser. En naturlig förändring som uppfattas som resultatet av en viss
handling. Kontrollgrupper används för att hindra detta.

3.6 Standardvägning
Snedvridande faktorer: missvisande, ex. att längre personer pluggar data (män).
Direkt standardisering: vägda jämförelser
Indirekt standardisering: jämför ett faktiskt värde med ett förväntat värde. Kvoten mellan dessa
värden kallas för kapacitetindex.

Kap 2 - Tabeller och diagram


2.1 Kategorivariabler/kvalitativa variabler
Klassificering av individerna som ingår i undersökningen och klassificera/kategorisera i tabell.
Variabel - variabelvärden - klass - frekvens.

2.2 Kvantitativa variabler


Sorteras i storleksordning, ex. i frekvenstabell.

Beteckningar
Variabelvärden = x
Frekvens = f
Totala antalet observationer = n = Σf

Klasser
Klassindelning: ex. 160-170 cm blir 159.5-169.5.
Klassbredd: skillnad mellan övre och undre gräns
Klassmitt: mitten av klassen, ex. 164.5
Klassgräns: sluten eller öppen

Histogram presenterar varje klass i en stapel, vars area motsvarar antalet individer i klassen och en
bredd som motsvarar klassbredden.

Stambladsdiagram
Kap 1 - Vad är statistik?
1.2 Statistiska undersökningar - mål och medel
Flaggtablå

Mål
- beskrivande/deskriptiv
- analytiska undersökningar
Metod
- experimentella
- icke-experimentella undersökningar

Demografisk undersökning - beskrivning av befolkningen som studeras


1.3 Hur ska populationen definieras?
Population, urvalsram och täckningsfel

1.4 Vilka uppgifter ska vi samla in - varför och hur?


Validitet, operationalisering - Göra det abstrakta konkret och mätbart. Validitet ställer frågan om vi
mäter det vi avser att mäta.

Reliabilitet - Tillförlighet. Det man mäter påverkas av mätinstrumentet, utföraren, omgivningen och
objektet som undersöks.

1.5 Variabler och skalor


Variabel
1. Kvalitativ variabel, ex. kön och civiltillstånd
2. Kvantitativ variabel - nominalskala. Ex. ålder (år), kroppslängd (cm), vikt (kg), antal barn.
a. Diskret variabel
i. antalet barn (exakt)
b. Kontinuerlig variabel
i. ålder, kroppslängd, vikt (avrundas)

Nominalskala - klass, grupptillhörighet


Ordinalskala - rangordna, ex. längd. Ingen info om skillnaden mellan.
Intervallskala - anger skillnader mellan mätvärden. Saknar en absolut nollpunkt, kvoten kan ej
räknas.
Kvotskala - kvot mellan mätvärdena och göra en tolkning. Absolut nollpunkt
.
1.6 Vilka individer ska ingå i undersökningen?
Undersökning
1. Totalundersökning
2. Urvalsundersökning
a. Sannolikhetsurval
i. slumpmässigt urval (OSU), systematiskt urval, stratifierat urval,
flerstegsurval
b. Andra urval

1.7 Fel i undersökningar - de statistiska uppgifternas kvalitet

Systematiska fel (över- eller underskattningar) → skevhet/bias


Slumpmässiga fel (över- och underskattningar) → precision

You might also like