Professional Documents
Culture Documents
l0 = födelsekullens storlek
Σli = summan av antalet personer som uppnår åldern 0, 1, 2, 3 år etc. Σli = l0 + l1 + l2 …
Återstående medellivslängd för den del av befolkningen som är i en viss ålder, e n:
Kap 5 - Index
5.1 Att beräkna och begripa indexserier
Statistiska uppgifter som visar utvecklingen under en tidsperiod kan man beskriva med en indexserie.
Utgångspunkten kan vara vad som, ex ett år eller en månad, och kallas för bastidpunkt eller basår.
Man tar därefter kvoten mellan det året man jämför med och basåret. Indextalens storlek beror på vad
man jämför med!
5.2 Hur stor är förändringen per år?
Hur stor har den procentuella ökningen/minskningen i genomsnitt varit per år? Görs enligt
ränta-på-ränta-principen. Beroende på hur vi redovisar, vad vi jämför med kan det se olika ut- därmed
också missvisande.
Ex. År 2000 är indexvärdet 103.4 och ett år senare 103.4*p. 10 år senare är indexvärdet
103.4*p10=109.6. Detta ger ekvationen 103.4*p10=109.6 som också kan skrivas som
p10=109.6/103.4=1.0599… vilket är lika med p=1.05991/10. Lös detta genom att använda yx på
miniräknaren: p=1.006.
Värdet p innebär att folkmängden varje i genomsnitt är ungefär 100.6% av folkmängden
föregående år. Den årliga genomsnittliga ökningen är 0.6%.
Ett problem som kan uppstå är att vi tolkar procenttal (indexvärden) som absoluta tal. Så om vi ritar
upp ett diagram på indexvärdena kan det ge en skev bild av verkligheten.
Kontrollfrågor:
● Vilken information vill man förmedla?
● Är redovisningen meningsfull?
● Ger redovisningen en korrekt bild?
● Är redovisningen lätt att begripa?
Alt.2 - index beräknas som ett vanligt ovägt medeltal i procenttal: För varje vara beräknar vi ett index
som kvoten (%) mellan pris 1999 och 1998.
Vara Index
Rågbröd 103.9
Ost 102.8
Smör 102.4
Vanligt medelvärde: 103.9+102.8+102.4/3=103.0 → 3%
p=priser q=kvantiteter
Täljaren är totalkostnaden för kassen vid tidpunkt t (jämförelsetidpunkten). Nämnaren anger
totalkostnader för samma kasse vid tidpunkt 0 (bastidpunkten).
5.5 Indexformler
Prisändringar leder normalt till kvantitetsändringar. Därför är det inte rimligt att jämföra två identiska
kassar eftersom det inte stämmer överens med verkligheten. För att lösa detta har vi indexformler, ex.
Laspeyres index och Paasches index.
Laspeyres:
Utgår från konsumtionen vid bastidpunkten. Man beräknar vad denna konsumtion skulle kosta vid
jämförelsetidpunkten och sätter beloppet i relation till den faktiska kostnaden vid bastidpunkten. Tar
ingen hänsyn till prisändringar.
Paasches index:
Utgår från konsumtion vid jämförelsetidpunkten. Man sätter den faktiska kostnaden vid
jämförelsetidpunkten i förhållande till vad denna konsumtion kostat vid bastidpunkten. Dock var
konsumtionen en annan då...
5.6 Kedjeindex
Problemet med ändrad inriktning och omfattning av konsumtionen (TV-apparater, hemtelefoner etc.)
försöker man lösa genom att beräkna kedjeindex. Då justerar man regelbundet uppsättningen av varor
och motsvarande kvantiteter. Bygger på ränta-på-ränta-principen.
Fastbasindex - Motsatser till kedjeindex, som innebär att man har samma varusammansättning och
samma kvantiteter (q0) för att i jämförelsetidpunkter i indexserien.
Beräkning av kedjeindex
Första tidpunkten tilldelar man värdet 100. För var och en av de följande tidpunkterna beräknar man
en indexlänk, som anger tidpunktens prisnivå i förhållande till den tidigare tidpunktens prisnivå. Hela
tiden multiplicerar man länkarna med indexkedjan.
Laspeyres formel:
Många avtal innehåller så kallade indexregleringar, eftersom köpkraften kan ändras beroende på vad
priserna är.
Fastbasteknik innebär att vi har en hypotetisk shoppingvagn med exakt samma varor och tjänster
varje. Varje gång shoppar vi samma saker, för att vi sedan ska kunna jämföra dessa. Detta funkar
under ett år, men inte under flera år på raden. Då måste vi använda oss av kedjeindex.
I KPI använder man sig av årslänkar. Varje sådan länk mäter hur mycket prisnivån har förändrats
sedan föregående år och som vikter använder man konsumtionen under båda berörda år. I årslänken
vägs också de prisförändringar som av olika skäl inte har kunnat införas i beräkningarna under året.
Huvudgrupper, undergrupper & representantvaror används istället för att skriva upp alla tänkbara
varor och tjänster som finns. Varje representantvara får ett vägningstal som visar hur stor värdemässig
andel varan representerar av vår totala privata konsumtion.
Harmoniserat index för konsumentpriser, HIKP, har utvecklats som jämförbart mått på inflationen
inom EU.
Tumregel: Indexvärdena efter år 1980 enligt den gamla serien för man genom att multiplicera
värdena enligt den nya serien med 5.71.
Kap 4 - Spridning
Två material kan ha samma genomsnitt men olika spridning kring detta, vilket gör att
genomsnittsmåtten måste kompletteras med information om detta. Det främsta måttet är
standardavvikelsen.
19 19 20 20 22 23 24 24 24 26 26 28 38 42 45 53
min q1 q1 md q3 q3 max
q1=(20+22)/2=21 q3=(28+38)/2=33
← kvartilavstånd →
← kvartilavvikelse → ← kvartilavvikelse →
Beräkning av kvartilavstånd kräver minst intervallskala.
Klassindelat material - fraktiler bestäms genom interpolering.
4.3 Lådagram
4.4 Standardavvikelsen
Förutsätter minst intervallskala, eftersom beräkningarna innebär att både summor och differenser
bildas.
Beräkning alt. 1
x (x-x) (x-x)2
1 -3 9
2 -2 4
3 -1 1
3 -1 1
6 2 4
9 5 25
Alt. 3
x f f*x f*x2
frånvarodagar antal arbetstagare
0 11 0 0
1 6 6 6
2 10 20 40
3 8 24 72
4 2 8 32
5 1 5 25
Σf = 38 Σf * x = 63 Σf * x2 =175
4.4.2 Normalfördelningsregeln
En av de viktigaste och mest kända sannolikhetsmodellerna. Normalfördelningen ser ut olika
sätt beroende på de numeriska värdena på medelvärdet och standardavvikelsen. Kurvan är
alltid symmetrisk kring medelvärdet.
NF-regeln:
● ca 68% av observationerna ligger mellan gränserna x - s och x + s
● ca 95% av observationerna ligger mellan gränserna x - 2*s och x + 2*s
Man beräknar andelen observationer i de båda intervallen (65% och 95%) och jämför
resultatet med normalfördelningsregeln.
Kap 3 - Genomsnitt
Genomsnitt och spridning kring genomsnittet är av intresse. Det finns olika genomsnittsmått
(lägesmått, centralmått). Typvärdet, medianen och det aritmetiska medelvärdet.
Beräknas när:
- det vanligaste värdet är av speciellt intresse.
- man utan närmare beräkningar vill ange ett genomsnittsmått.
- fler än hälften av observationerna antar samma värde.
- observationernas datanivå inte tillåter beräkning av andra genomsnittsmått.
3.2 Medianen, md
Medianen är mittobservationens variabelvärde (kräver att materialet är indelat i storleksordning,
ordinalskala).Vid jämnt antal är medianen medelvärdet av de två mittobservationerna. Man utgår från
de ackumulerade/ kumulerade frekvenserna vid beräkning.
Medianens ordningsnummer = n+1 / 2
Tumregler:
- Medianen är lätt att förstå och därför ofta ett bra beskrivande mått.
- Kräver endast ordinalskala.
- Bra när materialet innehåller extremvärden som kan bli missvisande med andra
genomsnittsmått. Medianen är därmed robust.
Medelvärdet =
Antalet observationer = n
f*x/f = medelvärdet
3.6 Standardvägning
Snedvridande faktorer: missvisande, ex. att längre personer pluggar data (män).
Direkt standardisering: vägda jämförelser
Indirekt standardisering: jämför ett faktiskt värde med ett förväntat värde. Kvoten mellan dessa
värden kallas för kapacitetindex.
Beteckningar
Variabelvärden = x
Frekvens = f
Totala antalet observationer = n = Σf
Klasser
Klassindelning: ex. 160-170 cm blir 159.5-169.5.
Klassbredd: skillnad mellan övre och undre gräns
Klassmitt: mitten av klassen, ex. 164.5
Klassgräns: sluten eller öppen
Histogram presenterar varje klass i en stapel, vars area motsvarar antalet individer i klassen och en
bredd som motsvarar klassbredden.
Stambladsdiagram
Kap 1 - Vad är statistik?
1.2 Statistiska undersökningar - mål och medel
Flaggtablå
Mål
- beskrivande/deskriptiv
- analytiska undersökningar
Metod
- experimentella
- icke-experimentella undersökningar
Reliabilitet - Tillförlighet. Det man mäter påverkas av mätinstrumentet, utföraren, omgivningen och
objektet som undersöks.