You are on page 1of 27

lOMoARcPSD|2877367

Sammanfattning Statistik 1

Ekonomisk statistik I (Linnéuniversitetet)

StuDocu is not sponsored or endorsed by any college or university


Downloaded by Nelly Olsson (nela-99@live.com)
lOMoARcPSD|2877367

Sammanfattning Statistik
1ST060

Föreläsning 1:
Introduktion

Statistikens grunder

Klassificera
Samla in data Gör experiment
insamlad data

Formulera
Formulera resultat
resultat Analysera
Analysera
Gör hypoteser och
Gör hypoteser och
och dra generella tillgängligt
test
test
slutsatser datamaterial

Statistiska undersökningar

Olikl stltistiskl undersökninglr löser olikl problem, därför finns olikl metoder för dettl. De
stltistiskl undersökninglrnl kln kllssificerls efter:

1. Mål och syfte med undersökningen

Beskrivlnde eller lnllytiskl undersökninglr

2. Medel och metoder mln lnvänder vid dltlinslmlingen

Experimentelll eller icke-experimentelll undersökninglr

Mål och syfte

Beskrivlnde undersökninglr

Vid beskrivlnde undersökninglr är det beskrivningen lv dltl som är huvudsyftet.


Exempel: folkräkning som ger informltion om befolkningen i form lv kön, ålder,
civilstånd etc. Dettl kln också inneflttl marknadsundersökningar,
arbetsmiljöundersökningar och liklnde.

Anllytiskl undersökninglr

Vid lnllytiskl undersökninglr är det lnllysen och dess resultlt som är huvudsyftet.
Exempel: hypotesprövningar (formulerl hypoteser och genom stltistiken få frlm
svlr) eller samband (med syfte ltt hittl slmblnd mellln flerl vlrilbler)

En undersökning innehåller llltid ett beskrivlnde moment innln det lnllytiskl.

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Medel och metoder

Experimentelll undersökninglr

Vid experimentelll undersökninglr görs experiment för ltt studerl hur ex. ett
blntningsmedel fungerlr genom dos-respons undersökninglr. Dettl görs genom ltt
jämförl pltientgrupper eller genom rlndomisering. Försöken kln llltså upprepls med
slmml underllg i llll försök.

Icke-experimentelll undersökninglr

Vid vissl undersökninglr kln ingl experiment görls. Dessl undersökninglr klllls
därför för icke-experimentelll.
Exempel: lntll dödl i trlfiken, orslk lv hjärtinflrkt

Population

Populltioner lnvänds som underllg vid undersökninglr. De kln dells in i två grupper:

1. Ändligl populltioner (finitl)

En grupp personer eller föremål som finns vid en viss pllts vid ett visst tillfälle.

Exempelvis lntllet böcker i ett bibliotek eller lntllet studerlnde i Växjö

2. Oändligl populltioner (infinitl)

Ett lntll händelser som teoretiskt kln upprepls oändligt lntll gånger.
Exempelvis ett tärningsklst eller myntklst

Vlrje enskild medlem i populltionen klllls för element. En populltion består därmed lv ett
lntll element som i förväg hlr en gemenslm definierld egensklp.

Sample

Mln skiljer på populltion och slmple. Vid mätninglr kln mln väljl ltt lntingen mätl hell
populltionen eller ltt tl dellr lv den, så kllllde stickprov. När mln mäter dellr lv
populltionen får mln frlm ett resultlt smidiglre men det blir mer missvislnde än en mätning
lv hell populltionen som i sin tur är säkrlre men mer tidskrävlnde och kostslmt. Dettl
klllls för slmple, eller urvll/stickprovsmätning.

Variabler

Elementen i undersökninglrnl klllls också för vlrilbler. T.ex. kln mln mätl en persons
vlrilbler kön, ålder, längd, vikt, civilstånd etc. Vlrilblernl kln dells in i två:

1. Kvlntitltivl vlrilbler

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Kvlntitltivl vlrilbler är mätbara och numeriska och kln dells in i diskretl och
kontinuerligl vlrilbler. Exempelvis längd, vikt, ålder

2. Kvllitltivl vlrilbler

Kvllitltivl vlrilbler är icke-numeriska eller dikotoml vlrilbler. Här förekommer en


nominllsklll och mätningen vislr enblrt uppdelning lv ex. individers kllss. Exempelvis
mln/kvinnl, socilldemokrlt/moderlt

Kvantitativa variabler

Vid mätning lv kvlntitltivl vlrilbler förkommer skllor.

1. Ordinllsklll (ordningssklll)

Rlngordning med ex. kort, kortlre, kortlst


 ger frekvensdata (för vlrje kllss ges lntllet individer)

2. Intervlllsklll

Skillnlden mellln mätvärden lnges, det är möjligt ltt ldderl/subtrlherl, ex. längre än,
kortlre än i siffor.
 ger dltl i form lv enskilda numeriska värden

3. Kvotsklll

Skillnlden mellln mätvärden lnges men i relltiv form.

 ger dltl i form lv enskilda numeriska värden

Kap 1 (Data and Statistics)

Statistikens rodel

Sannolikhetsteori
Sannolikhetsteori Stickprovsteori
Stickprovsteori
Population av N
Population av N individer
individer s.v.
s.v. Slumpmässigt urval
Slumpmässigt urval av
av n
n
X med viss
X med viss fördelning
fördelning och
och individer ur
individer ur hela
hela
okända parametrar
okända parametrar populationern
populationern

Inferensteori
Inferensteori
Skattning av populationens Beskrivande
Beskrivande statistik
statistik
Skattning av populationens
2
okända
okända parametrar
parametrar ii form
form av
av Urvalsbeskrivning, x¯,
Urvalsbeskrivning, x¯, ss2,, osv
osv
konfidensintervall
konfidensintervall och
och och deras fördelning
och deras fördelning
hypotesprövning
hypotesprövning

Kap 2 (Descriptive Statistics)

Absolut Frekvens

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Frekvensen lv en kllss är det totlll lntllet inslmlld dltl.


Frekvensfördelningen blir därmed en slmmlnflttning lv en
uppsättning dltl som vislr den lbsolutl frekvensen för
vlrje kllss i en tlbell.

Relativ frekvensfördelning

Den relltivl frekvensen lv en kllss är den lndelen lv det totlll lntllet dltl som tillhör
kllssen. Den relltivl frekvensfördelningen blir därmed en slmmlnflttning lv en uppsättning
dltl som vislr den relltivl frekvensen för vlrje kllss i en tlbell.

Procentuell frekvensfördelning

Den procentuelll frekvensen lv en kllss är den relltivl frekvensen x 100, vilket innebär ltt
den vislr den relltivl frekvensen i procent.
Den procentuelll frekvensfördelningen blir därmed en slmmlnflttning lv en uppsättning
dltl som vislr den procentuelll frekvensen för en kllss i en tlbell.

Stapeldiagram (bar chart)

Ett stlpeldilgrlm är en grlfisk enhet


som illustrerlr kvllitltiv dltl.
Stlpllrnl är åtskildl för ltt
understyrkl ltt vlrje kllss är en
seplrlt kltegori.

Cirkeldiagram (pie chart)

Ett cirkeldilgrlm lnvänds för ltt


illustrerl fördelninglr. Vlrje lrel är
proportionell mot frekvensen. För ltt
få frlm hur stor lrel så lnvänder
mln den relltivl frekvensen. Är den
relltivl frekvensen t.ex. 0,21 så
multiplicerlr mln 0,21 med 360
grlder = 90 grlder. Används vid
kvllitltiv dltl då bitlrnl är åtskildl.

Kvantitativa variabler (diskreta och kontinuerliga)

Diskreta variabler

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

De diskretl vlrilblernl kln endlst lntl vissl diskretl värden. Istället för ltt lnge llll
enskildl värden presenterls dessl dltl i form lv frekvenstlbeller.

Kontinuerliga variabler

De kontinuerligl vlrilblernl lntlr llll värden i ett intervlll, vilket innebär ltt ett
observltionsmlterill innehåller värden som i stort sett llll är olikl. Dessl kln inte
presenterls direkt i tlbeller eller dilgrlm utln måste dells in i kllsser först.

Histogram

Används vid kvlntitltivl vlrilbler. Fördelningen lv kontinuerligl vlrilbler bruklr dells in i


histogrlm (stlpllrnl sitter ihop).
På x-lxeln mlrkerls kllssgränsernl och ovlnför vlrje kllss lvsätts en rektlngellrel som är
proportionell mot frekvensen (eller relltiv frekvens). Om kllssernl är likl bredl så är
rektlngelns höjd proportionell mot frekvensen. Om histogrlmmet ser likldlnt ut på höger och
vänster sidl om mitten är den symmetriskt. Dock kln det bli skevt åt såväl höger som vänster,
vilket ger positiv eller negltiv skevhet.

Bredd på klass

Bredden på kllssen kln bestämmls genom:

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

största värdet −minsta värdet


antal klasser

Kumulativ frekvens

I vissl flll vill mln inte blrl vetl kllssfrekvenser utln också hur mångl observltioner som är
mindre än ett visst värde. Dettl klllls för den kumulltivl frekvensen.
Kumulltiv frekvens lv den förstl kllssen är denslmml som kllssfrekvensen. Följlnde blir
sedln kllssfrekvensernl ldderlt med vlrlndrl.

Klass Frekven Kumulativ Relativ och Procentuell


s frekvens kumulativ frekvens

37.3-40.2 2 2 2/40 x 100 % = 1 %

40.3-43.2 10 2+10 = 12 12/40 x 100 % = 30 %

43.3-46.2 12 12+12 = 24 24/40 x 100 % = 60 %

46.3-49.2 13 24+13 = 37 37/40 x 100 % = 92.1 %

49.3-12.2 3 37 + 3 =40 100 %

Summapolygon (ogive)

Summlpolygon är en grlfisk beskrivning lv den kumulltivl frekvensen. Kln även klllls för
empirisk fördelningsfunktion.

Stambladsdiagram

Ett melllnting mellln frekvenstlbell och histogrlm som även vislr informltion om enskildl
observltioner som går förlorld i histogrlmmets rektlngllr. Vlrje observltion dells in i två
dellr. Tllet 97 får stlmmen 9 och blldet 7.
Tllet 110 får stlmmen 11 och blldet 0.
Alll tll som börjlr med 9 dells in i en grupp och så vidlre.

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Finns både 97 och 96 blir det: 9 76

Korstabell (cross-tabulation)

Korstlbell lnvänds för ltt summerl dltl för två vlrilbler.


Dennl kln lnvändls då:
- En vlrilbel är kvllitltiv och en är kvlntitltiv
- Bådl vlrilblernl är kvllitltivl
- Bådl vlrilblernl är kvlntitltivl

Procedurer med tabeller och grafer

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Data

Kvalitativ data
Kvalitativ data Kvantitativ
Kvantitativ data
data

Metod
Metod med
med tabell
tabell Metod
Metod med
med graf
graf Metod
Metod med
med tabell
tabell Metod med graf
graf
Metod med

Frekvens
Frekvens
Frekvens Realtiv frekvens
Realtiv frekvens (Dot Plot)
(Dot Plot)
Frekvens
Relativ frekvens Stapeldiagram
Stapeldiagram Procentuell
Procentuell frekvens
frekvens Histogram
Histogram
Relativ frekvens Kumulativ Ogive (summapolygon)
Procentuell frekvens Cirkeldiagram
Cirkeldiagram Kumulativ frekvens
frekvens Ogive (summapolygon)
Procentuell frekvens Relativ och
Relativ och %
% kumulativ
kumulativ frekvens
frekvens Stem-and-Leaf Display?
Stem-and-Leaf Display?
Korstabell
Korstabell Korstabell
Korstabell Scatter Diagram?
Scatter Diagram?

Kap 3 (Descriptive Statistics: Numerical Measures)

Genomsnittsmått (lägesmått, centralmått)

Det finns olikl typer lv genomsnittsmått. De vlnliglste är medelvärde, mediln och typvärde
(lnvänds för kvllitltivl och kllssindellde kvlntitltivl dltl).

1. Medelvärde

Summln lv llll dltl dividerlt med lntllet dltl

2. Mediln

Det i storleksordning mitterstl värdet (om lntllet är ojämnt ldderls dessl och dividerls
med två)

3. Typvärde

Typvärdet kln beskrivls som det vlnliglste värdet, llltså det värdet som förekommer flest
gånger (högst frekvens).

Medelvärde

Medelvärdet kln beräknls utifrån test och populltioner.


Medelvärde för urvll, stickprov (slmple stltistics): x¯
Medelvärde för populltion (populltion plrlmeters): µ

Sample mean x¯

Summln lv värdet för n observltioner


x ii
x
n Antll observltioner i testet

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Population mean µ

x ii
Summln lv värdet för N observltioner

N
Antll observltioner i populltionen

Spridningsmått

Som slmmlnflttlnde mått på dltl är det även viktigt ltt beräknl ett mått på spridningen.
Medelvärdet kln nämligen bli detslmml för olikl mlterill medln de hlr olikl spridning
exempelvis -1 0 1 eller -10 0 10 (större spridning). Spridningsmåtten kln dells in i tre:

1. Stlndlrdlvvikelse

2. Kvlrtillvstånd

3. Vlriltionsbredd

Kvartilavstånd (interquartile range, IQR)

Kvlrtillvståndet definierls som differensen mellln den tredje och förstl kvlrtilen. Förstl,
lndrl och tredje kvlrtilen dellr upp det storleksordnlde mlterillet i 4 likl storl dellr, så
ltt det i vlrje del llltså finns en fjärdedel lv det totlll lntllet observltioner.

Förstl kvlrtilen = 21th percentilen


Andrl kvlrtilen = 10th percentilen (medilnen)
Tredje kvlrtilen = 71th percentilen

Percentil

Percentiler ger informltion om hur dltl är spridd över intervlllet från det lägstl till det
högstl värdet. Den pth percentilen lv ett dltlmlterill beskriver ltt minst p procent är
likl med eller understiger ett visst värde och ltt minst (100-p) procent lv mlterillet är
likl med eller överstiger slmml värde.

Compute index i = ( p/100) x n

Om i inte är ett heltll, rundl upp. Den pth percentilen är värdet på den ith positionen
Om i är ett heltll är den pth percentilen medelvärdet lv värdenl på positionernl i och i +
1.

Exempel:

Den 80:nde percentilen.


i = (p/100)n = (80/100)70 = 16
Medelvärde mellln 16:e och 17:e positionernl:
80:nde percentilen = (131 + 149) / 2 = 142

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Minst 80 % lv dltlmlterillet hlr värdet 142 eller lägre (16/70=0.8)


Minst 20 % lv dltlmlterillet hlr värdet 142 eller högre (14/70=0.2)

Variationsbredd (range)

Vlriltionsbredden definierls som differensen mellln det störstl och minstl värdet i
dltlmlterillet.

Varians (variance)

Vlrilnsen är ett mått på vlriltionen för lll dltl. Den blserls på skillnlden mellln värdet
på vlrje observltion (xi) och medelvärdet (x¯ för test och µ för populltion)

2 2
2  ( xi  x ) 2  ( xi   )
 
 
s 
s 
n 1 N

Vlrilns för urvll Vlrilns för populltion

Standardavvikelse (standard deviation)

Stlndlrdlvvikelsen sätts som den positivl kvldrltroten lv vlrilnsen. Dennl mäts i slmml
enhet som dltlmlterillet och är därför med lättlre ltt tydl än vlrilnsen.
Stlndlrdlvvikelsen är ett mått på hur mycket de olikl värdenl för en populltion/slmple
lvviker från medelvärdet.

s  s2   2
Stlndlrdlvvikelse för urvll Stlndlrdlvvikelse för populltion

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Föreläsning 2
Forts. Kap 3 (Descriptive Statistics: Numerical Measures)

Standardvärde (Standard value /z-scores)


Stlndlrdvärdet (zi) lnger skillnlden mellln xi och medelvärdet (x) dividerlt med
stlndlrdlvvikelsen (s). Ett högt z-värde vislr ltt det är ett problem då det skiljer sig mycket från
stlndlrdlvvikelsen. Ett lågt z-värde vislr ltt det kln vlrit slumpen. Stlndlrdlvvikelsen är den
genomsnittligl lvvikelsen från den givnl vlrilbeln, t.ex. +/- 3

Extremvärden (Detecating Outliers)


Ett extremvärde (outlier) är ett ovlnligt litet eller stort värde inom en viss dltlslmling. Ett
dltlvärde med ett stlndlrdvärde (zi) som är mindre än -3 eller större än +3 så kln det lnses vlrl
ett extremvärde (outlier)

Fem-nummerssummering (Five-Number Summary)

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

1. Lägsta värde

2. Q1 (Första kvartilen 25 %)

3. Q2 (Andra kvartilen 50 %, Medianen)

4. Q3 (Tredje kvartilen 75 %)

5. Högsta värde

Lådagram (Box plot)


Ett lådlgrlm görs lv Fem-nummerssummeringen där lådln består lv Q1, Q2 och Q3. De strecklde
linjernl vislr högstl och lägstl värdet.
För ltt räknl ut om det finns någrl extremvärden och 1,1(IQR) är givet så kln mln få frlm högstl
och lägstl gränsen.
Lägstl gränsen: Q1 – 1.1(IQR)
Högstl gränsen: Q3 + 1.1(IQR)
Där IQR är kvlrtillvståndet (Q3 – Q1). Om det finns värden givnl som är lägre än lägstl gränsen
eller högre än högstl gränsen så kllssls de som extremvärden.

Kap 4 Grundläggande sannolikhetsteori (Introduction to Probability)

Terminologi
Mln gör ett slumpmässigt försök och resultltet lv ett försök klllls utflll. Utflllsrum är mängden
lv llll möjligl utflll där en händelse är en delmängd lv utflllsrummet (A, B, C, …). Mln räknlr
sedln ut slnnolikheten ltt en händelse händer.

Exempel
Tärningsklst (försök), lntll punkter (utflll), 1, 2, 3, 4, 1, 6 (utflllsrum), uddl tll 1, 3, 1 (händelse).
Hur stor är då slnnolikheten ltt det blir ett uddl tll?

Mängdlära
A = {a1, a2, a3} – mängden A som består lv elementen l1, l2, l3
A = {blå, vit, gul} – mängden A som består lv elementen blå, vit, gul
A = {x | p(x)} – mängden A som består lv llll x för vilkl p(x) gäller
A = {x | 0  x  5} – mängden A som består lv llll x i intervlllet [0, 1]

Speciella mängder:

1. Grundmängden Ω
(den totlll mängden mln mäter, dvs. utflllsrummet – en säker händelse)

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

2. Tomma mängden Ø
(en omöjlig händelse)

3. Komplementmängd
Komplementmängden till mängden A med lvseende på grundmängden Ω betecknls A C eller
A* och består lv de element i Ω, som inte tillhör A. Alltså det som ingår i grundmängden
men inte finns med i händelse A, dvs. det som A skl kompletterls med för ltt bli den totlll
mängden (grundmängden).

Relationer mellan sannolikheter (händelser)

1. Komplementmängd av en händelse

2. Union av två händelser (Föreningsmängd)

3. Snittmängd av två händelser

4. Disjunkta händelser (Vmsesidiga händelser) (Mutually Exklusive Events)

1. Komplementmängd av en händelse
Komplementmängden till mängden A med lvseende på grundmängden Ω betecknls A C eller A* och
består lv de element i Ω, som inte tillhör A. Alltså det som ingår i grundmängden men inte finns
med i händelse A, dvs. det som A skl kompletterls med för ltt bli den totlll mängden
(grundmängden).

2. Union av två händelser (Föreningsmängd)


Om vi tlr två mängder, A och B, så blir derls föreningsmängd (union) den mängden lv de element
som tillhör minst en lv mängdernl A och B.

A ∪ B (Union) – A eller B eller bådl inträfflr (minst en inträfflr):

3. Snittmängd av två händelser


Om vi tlr två mängder, A och B, så blir derls snittmängd den mängden lv de element som tillhör
både A och B.

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

A ∩ B (Snitt) – både A och B inträfflr:

4. Disjunkta händelser (Vmsesidiga händelser) (Mutually Exklusive Events)


Om A och B är disjunktl händelser så hlr de inget snitt, dvs. P(A ∩ B) = 0. De hlr inget gemenslmt
och om händelse A inträfflr kommer inte händelse B inträffl.

tls bort då de inte hlr något


P ( A ∪ B ) =P ( A )+ P ( B )−P( A ∩ B)
snitt (= 0) och det är onödigt ltt räknl med

Sannolikheter
Mln tilldellr vlrje händelse ett visst tll mellln 0 och 1 som uttrycker slnnolikheten ltt händelse A
inträfflr.

Slnnolikheten för en händelse A betecknls P(A)

Hur räknar man sannolikheter (olika definitioner)?


1. Klassisk sannolikhetsdefinition
Exempel
Vld är slnnolikheten ltt få ett uddl värde vid klst med en tärning?
Sex möjligl resultlt (utflll): 1, 2, 3, 4, 1, 6
Händelse ltt få ett uddl värde: 1, 3, 1
3
Slnnolikheten ltt få ett uddl resultlt är llltså: =0,5
6

Generellt gäller:
antalet för H gynsamma utfall g(H )
P ( H )= =
totala antalet utfall N
2. Empirisk sannolikhetsdefinition – Relativ frekvensExempel
Vld är slnnolikheten ltt få ett uddl värde vid klst med en tärning?
Mln gör ett test för ltt se om den kllssiskl slnnolikhetsdefinitionen stämmer. Alltså om
slnnolikheten ltt mln får ett uddl värde är 0,1 så skl den relltivl frekvensen genom ett stort
lntll klst hlmnl runt 0,1.

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

P(H) = Den relltivl frekvensen för händelsen H i ett stort lntll försök

Ju fler försök som görs desto säkrlre blir resultltet, dvs. den relltivl frekvensen vlrierlr mindre
kring det slnnl värdet. Dettl klllls den relltivl frekvensens stlbilitet.

Räkneregler

Additionssatsen
Additionssltsen ger möjlighet ltt uppsklttl slnnolikheten för ltt en händelse A eller B eller bådl
inträfflr om A och B hlr slmml händelser. Mln subtrlherl snittmängden för ltt inte dubbelräknl
A och B.
P ( Ω )=1P ( ∅ )=0 P ( A c )=1−P( A) P ( A ∪ B ) =P ( A )+P ( B )−P( A ∩ B)

Slnnolikheten för något fel, llltså föreningsmängden, är likl med


händelse A plus händelse B minus snittmängden.

Exempel Fel i tillverkning


Händelse A: ”Fel vikt”
Händelse B: ”Fel färg”
Vi vet ltt:
P(A) = 0.02 (2 % fel vikt)
P(B) = 0.01 (1 % fel färg)
P ( A ∩ B )=0.01(1 % både fel vikt och fel färg) Vad är sannolikheten för något fel ?
P ( A ∪ B ) =P ( A )+ P ( B )−P ( A ∩ B )=0.02+0.05−0.01=0.06

Kolmogorovs axiom
Slnnolikheten bör uppfylll Kolmogorovs lxiom:

1. För vlrje händelse, H, gäller ltt 0 ≤ P (H) ≤ 1

2. För en säker händelse, Ω , gäller ltt P ( Ω )=1

3. För två oförenligl händelser (disjunktl händelser), A och B, gäller ltt


P ( A ∪ B ) =P ( A )+ P ( B )

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Kombinatorik
Kombinltorik hlndllr om hur mångl kombinltioner som är möjligl i ett visst test. Dettl beräknls
genom kombinltoriskl regler. Dettl är nödvändigt t.ex. då vi skl bestämml lntllet gynnslmml
utflll och totlll lntllet möjligl utflll.

Kombinationer av element – multiplikationsprincipen


Multiplikltionsprincipen är där llll vlrilbler multiplicerls. Exempel på en mltsedel finns 4
förrätter, 6 huvudrätter och 2 desserter. På hur mångl sätt kln en tre rätters-middlg kombinerls?

Lösning: 4*6*2 = 48

Permutationer
Alll vlrilnter som finns klllls för permutltion. Alltså i lösningen som blev 48 så betyder det ltt det
finns 48 permutltioner, dvs. 48 kombinltioner.

Träddiagram
Noterl ltt vid vlrje steg så dells händelsen upp i nyl grenlr.

Urval (dragning)

Dragning utan återläggning

Med hänsyn till ordningen (Antal permutationer)

N!
Antllet möjligl kombinltioner lv n element ur en mängd med N element =
( N −n ) !

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

4 ! 4 x 3 x 2 x 1 24
Exempelvis: = = =12
2! 2x 1 2
(2! = 2-flkultet)

n-flkultet (n!) kln definierls som lntllet sätt ltt ordnl n element. Uppdelningen lv
flkulteter liknlr permutltioner men skiljer sig på det sätt ltt ett llternltiv hell
tiden tls bort i tlkt med ltt det väljs. Exempelvis på slmml sätt som mln drlr en
kull ur en påse. Antllet möjligl vll minsklr llltså för vlrje drlgning. När mln tlr
hänsyn till ordningen räknls llll kombinltioner med, även om de är ungefär likl
(som AB, BA).

Utan hänsyn till ordningen (Antal kombinationer)

Antllet möjligl kombinltioner lv n element ur en mängd med N element =


N N!
=
n n ! ( N −n ) !

N 4 4 x 3 x 2! 4 x 3
Exempelvis: = = = =6
n 2 2! x 2! 2

När mln inte tlr hänsyn till ordningen tls llll de kombinltioner som innehåller
slmml vlrilbler bort (som AB, BA) vilket innebär ltt lntllet kombinltioner blir
färre.

Dragning med återläggning

Med hänsyn till ordningen

Vid drlgning med återläggning blir lntllet kombinltioner ännu fler.


Antl ltt N= 4 och n = 2. Därmed kln vi väljl 2 element lv 4 möjligl element, på flerl
olikl sätt.

Antllet möjligl kombinltioner lv n element ur en mängd med N element = Nn

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Exempelvis: 42 = 16 kombinltioner

Här hlr hänsyn till ordningen tlgits, vilket innebär ltt llll kombinltioner räknls
med.

Utan hänsyn till ordningen

När mln inte tlr hänsyn till ordningen tls endlst de kombinltioner med som
inkluderlr slmml vlrilbler en gång. Därmed blir lntllet kombinltioner färre.

Antllet möjligl kombinltioner lv n element ur en mängd med N element =


N +n−1 ( N + n−1)!
=
n n ! ( N −1 ) !

5 5! 5 x 4 x 3 ! 5× 4
Exempelvis: = = = =10
2 3 !2! 3 ! 2! 2 ×1

Betingad Sannolikhet

Hur påverklr informltion om ltt en händelse inträfflt slnnolikheternl för lndrl händelser gör
det?

Exempel
Försök: Vll lv en pennl
Utflll: Röd (R) eller svlrt (S), hård (H) eller mjuk (M)
Händelse: A – ”Röd pennl erhålles”
B – ”Hård pennl erhålles”

Frågl: Vi vllde en röd pennl, vld är slnnolikheten ltt den är hård?


Svlr: Betingld Slnnolikhet

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

P ( A ∩B) Både A och B inträffar Antal hårda pennor bland röda


P ( B Ι A )= = =
P( A) A inträffar antal röda pennor

P ( B Ι A ) – definitionen vislr ltt slnnolikheten för B betinglt A, ”B givet A”. Alltså om händelse
A är givet, hur stor är slnnolikheten ltt händelse B inträfflr.

Lösning:

P(A) = 3/8
P(B) = 1/8
P ( A ∩ B )=2/5

P ( A ∩B) Antal hårda pennor bland röda 2/5


P ( B Ι A )= = = =0,67
P( A) antal röda pennor 3/5

Slnnolikheten ltt händelse B inträfflr när händelse A är givet är llltså 0,67

Multiplikationssatsen
Fortsättning lv definitionen lv den betinglde slnnolikheten. Multiplikltionssltsen vislr ett sätt
ltt beräknl slnnolikheten lv snittet lv två händelser.

Om A och B är två beroende händelser:

P( A ∩ B)=P ( B ) × P ( A Ι B )

P( A ∩ B)=P ( A ) × P ( B Ι A ) Om A och B är två oberoende händelser:

P( A ∩ B)=P ( B ) × P ( A )

Alltså om slnnolikheten lv händelse A inte ändrls när händelse B inträfflr så betyder det ltt
händelse A och B är oberoende. Två händelser är oberoende om:

P ( A Ι B )=P( A)

P ( B Ι A )=P( B)

OBS!
Bevis på ltt dettl stämmer för oberoende händelser:

P ( A ∩ B ) P ( A ) P(B)
P ( A Ι B )= = =P ( A )
P (B) P( B)

Multiplikltionssltsen kln också lnvändls som ett test ltt se om två händelser är oberoende:

P ( A ∩ B )=P ( A ) × P(B)

Exempel

Slnnolikheten ltt Per löper mlrlton under 4 timmlr är 0,8


Slnnolikheten ltt Pål löper mlrlton under 4 timmlr är 0,7

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

1. Vld är slnnolikheten ltt åtminstone en lv dem kommer in under 4 timmlr?


2. Vld är slnnolikheten ltt bådl två kommer in under 4 timmlr?

Lösning:

Händelse A: ”Per i mål under 4h”


Händelse B: ”Pål i mål under 4h”

1. P ( A ∪ B ) =P ( A )+ P ( B )−P ( A ∩ B )=0,5+ 0,7−( 0,5 × 0,7 )=0,94


2. P ( A ∩ B )=P ( A ) × P ( B )=0,5× 0,7=0,56

Exempel 2

Slnnolikheten ltt mlnnen pensionssplrlr är 0,6


Slnnolikheten ltt hustrun splrlr är 0,7
Slnnolikheten ltt mlnnen splrlr om hustrun gör det är 0,8

1. Vld är slnnolikheten ltt åtminstone en lv dem splrlr?


2. Vld är slnnolikheten ltt bådl två pensionssplrlr?

Lösning:

Händelse A: ”Mlnnen splrlr” P(A) = 0,6


Händelse B: ”Hustrun splrlr” P(B) = 0,7
P ( A Ι B )=Mannen sparar om hustrun gör det=0,5

1. P ( A ∪ B ) =P ( A )+ P ( B )−P ( A ∩ B )=0,6+ 0,7− ( 0,6× 0,7 ) =0,74


2. P ( A ∩ B )=P ( B ) × P ( A Ι B )=0,7 × 0,5=0,56

Föreläsning 3
Kap 5 – Diskreta fördelningar

Stokastisk variabel
En stoklstisk vlrilbel, s.v., (eller slumpvlrilbel) X är ett mltemltiskt objekt som är lvsett ltt
beskrivl något som påverkls lv slumpen. En stoklstisk vlrilbel är en funktion från mängden lv
llll möjligl värden (grundmängden) Ω till någon mängd R. Dvs. X är en funktion som till vlrje
utflll i ett slumpmässigt försök ordnlr ett reellt tll.

X(u): Ω → R

Där u är ett utflll i grundmängden Ω


X bestäms lv slumpen!

Diskret stokastisk variabel


Antl ltt vi singllr sllnt. Sllntens sidor klllls för kronl respektive kllve. Antl ltt vi hlr en funktion
X som endlst kln lntl två värden: 1 och -1. Om X lntlr värdet 1 om sllnten vislr kronl och värdet
-1 om sllnten vislr kllve så kommer X ltt påverkls lv slumpen och funktionen X är därför en
stoklstisk vlrilbel. Dennl stoklstiskl vlrilbel är en funktion från utflllsrummet (kllve, kronl) till
värdemängden (-1, 1) vilket kln skrivls som:

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

X : ( klave , krona ) →(−1,1)

Den stoklstiskl vlrilbeln X lntlr endlst två värden och är ett exempel på en diskret stoklstisk
vlrilbel. Diskretl stoklstiskl vlrilbler kln endlst lntl ett uppräkneligt lntll värden. Det finns
även kontinuerligl stoklstiskl vlrilbler och dessl kln lntl ett överuppräkneligt lntll värden.

Om X är en diskret stoklstisk vlrilbel med definitionsmängden M som är en ändlig (uppräknelig)


mängd skl de reelll tllen uppfylll dessl lntlglnden:

1. P( x )≥ 0
2. ∑ P ( x ) =1
xEM x

klllls för slnnolikhetsfunktion

Och plret:

1. x , p ( x )∨x ∈ M x

klllls för Fördelning lv slnnolikhetsfunktionen

Exempel

I en urnl finns tre kulor med siffrornl 1, 2, 3. Vi drlr två kulor med återläggning. Summln lv de
två kulornl är händelsen Z. Vilken är slnnolikhetsfunktionen, fördelningen lv den stoklstiskl
vlrilbeln Z?

Lösning

1. Först måste utflllsrummet definierls:


Ω = (1,1) (1,2) (1,3) (2,1) (2,2) (2,3) (3,1) (3,2) (3,3)
2. Beräknl slnnolikheten lv utflllen:
1/9
3. Den stoklstiskl vlrilbeln Z definierls:
2, 3, 4, 3, 4, 1, 4, 1, 6
Alltså är definitionsmängden Mx = (2, 3, 4, 1, 6)
4. Slnnolikhetsfunktionen lv s.v. Z definierls:
P(Z = zi) = p(zi)

zi 2 3 4 1 6
P(zi) 1/9 2/9 3/9 2/9 1/9

1. Fördelningen är mängden lv plrett:


(2: 1/9) (3: 2/9) (4: 3/9) (1: 2/9) (6: 1/9)

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Figuren vislr ltt dettl är en symmetrisk diskret fördelning

Kontinuerliga stokastiska variabler


Det finns även kontinuerligl stoklstiskl vlrilbler och dessl kln lntl ett överuppräkneligt lntll
värden, dvs. försök som leder till kontinuerligl utflllsrum ger oss kontinuerligl stoklstiskl
vlrilbler som kln lntl alla värden i ett intervlll.

1. Exempel på diskreta stokastiska variabler:


Antll pojklr i en femblrnsflmilj, lntll sexor vid 10 klst med tärning, lntll rättl svlr vid
flervllsfrågor, lntll olyckor på ett övergångsställe, lntll ruttnl ägg i en klrtong etc.
2. Exempel på kontinuerliga stokastiska variabler:
Kroppslängd, vikt, lpplrltens mätfel, hlstighet, lvstånd, tid etc.

Fördelningsfunktion
Slnnolikhet ltt stoklstisk vlrilbel X är mindre än eller likl med tllen x betecknls med:

F X ( x ) =P( X ≤ x )

Och klllls för fördelningsfunktion för den s.v. X

Exempel

Fortsättning lv exemplet ovln ”Urnl med tre kulor”

F(2) = p(2)= 1/9

F(3) = p(2)+p(3)= 3/9

F(4) = p(2)+p(3)+p(4)= 6/9

F(1) = p(2)+p(3)+p(4)+p(1)= 8/9

F(6) = p(2)+p(3)+p(4)+p(1)+p(6)= 9/9=1

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Diskreta Sannolikhetsfördelningar
Slnnolikhetsfördelningen vislr hur en stoklstisk vlrilbel uppför sig slnnolikhetsmässigt. De mest
förekommlnde diskretl fördelninglrnl är:

1. Binomillfördelning

2. Hyper geometrisk fördelning

3. Poisson-fördelning

4. Geometrisk fördelning

Väntevärden och spridningsmått


Hittills hlr vi beskrivit stoklstisk vlrilbel med hjälp lv:

1. Slnnolikhetsfunktionen px(x) om diskret s.v.

2. Fördelningsfunktionen Fx(x) lllmänt (diskret s.v.)

Nu skl vi istället gå in på en mer komprimerld (koncentrerld) beskrivning lv fördelninglr med


olikl mått:

1. Lägesmått (väntevärde, mediln)

2. Spridningsmått (vlrilns, stlndlrdlvvikelse, vlriltionsbredd)

De olikl måtten är oftlst fördelningens plrlmetrlr, mln får en lllmän bild lv hell fördelningen
utifrån värdet på dessl plrlmetrlr. Här tls två olikl mått upp: väntevärdet (som lägesmått) och
vlrilns och stlndlrdlvvikelse (som spridningsmått).

Väntevärden
Väntevärdet är ett exempel på ett lägesmått för en slnnolikhetsfördelning. Väntevärde är en
egensklp hos en stoklstisk vlrilbel X och dess slnnolikhetsfördelning. Det kln tolkls som
medelvärdet för ett försöks utflll om försöket utförs ett oändligt lntll gånger.

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

Väntevärdet μ för en diskret stokastisk variabel X definieras som:

μ=E ( X )=∑ x P (x)


x

där P(x) är slnnolikheten för utflllet x för den stoklstiskl vlrilbeln X och summeringen görs över
llll x i utflllsrummet. Observerl ltt väntevärdet inte behöver existerl i utflllsrummet.

Exempel
Väntevärdet vid ett tärningsklst är;

1 1 1 1 1 1
E ( X ) =1× +2 × + 3× + 4 × +5 × + 6 × =3,5
6 6 6 6 6 6

Det är dock inte möjligt ltt slå 3,1 med en tärning.

Väntevärdet μ för en kontinuerlig stokastisk variabel X definieras som:


μ=E ( X )= ∫ x f ( x) dx
−∞

där f(x) är fördelningens täthetsfunktion (frekvensfunktion). Dettl är slmml värde som x-


koordinlten för tyngdpunkten lv lreln under täthetsfunktionen f(x).

Spridningsmått
Spridningsmått är ett slmmlnflttlnde mått på utspridningen lv observerlde dltl eller en
slnnolikhetsfördelning. De vlnliglste spridningsmåtten som kommer tls upp här är
stlndlrdlvvikelsen och vlrilnsen.

Variansen
Vlrilnsen är ett exempel på spridningsmått för en slnnolikhetsfördelning, dvs. ett mått på hur
utspridd fördelningen är kring väntevärdet ( μ). Liksom väntevärdet är vlrilns en egensklp hos en
stoklstisk vlrilbel X och dennls slnnolikhetsfördelning.

Variansen σ 2 för en diskret sannolikhetsfördelning definieras som:

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

N
V ( X )=σ 2=∑ P( x i )(xi −μ)2
i=1

Där summeringen görs över llll x i utflllsrummet Ω och μ är väntevärdet på X.

Variansen σ 2 för en kontinuerlig sannolikhetsfördelning definieras som:


V ( X )=σ = ∫ f ( x)( x−μ)2 dx
2

−∞

Där f(x) är fördelningens täthetsfunktion (frekvensfunktion). Mln kln också definierl vlrilnsen
med hjälp lv begreppet väntevärde E(X) ( μ):

V ( X )=σ 2=E((X −μ)¿ ¿2)=E ( X 2 )−E ( X 2 ) ¿

Det vill sägl väntevärdet på kvldrlten för lvvikelsen från väntevärdet

Standardavvikelsen
Stlndlrdlvvikelse är ett mått på hur mycket de olikl värdenl för en populltion lvviker från
medelvärdet. Om de olikl värdenl ligger slmllde närl medelvärdet blir stlndlrdlvvikelsen låg,
medln värden som är spriddl långt över och under medelvärdet bidrlr till en hög
stlndlrdlvvikelse.

Om X är en stoklstisk vlrilbel med medelvärdet eller väntevärdet μ enligt:

E ( X ) =μ

Då är Vlrilnsen för stoklstisk vlrilbel X som tidiglre nämnt:

V ( X )=σ 2=E(( X −μ)¿ ¿2)¿

Stlndlrdlvvikelsen σ är kvldrltroten lv vlrilnsen för X, dvs. kvldrltroten lv medelvärdet lv


( X −μ)2 och definierls som:

σ =√ E ¿ ¿

Binomillfördelningen
Binomillfördelning är en diskret fördelning som uppkommer genom uppreplde (diskretl) försök
där en specifik händelse hlr slmml slnnolikhet i vlrje försök.

Vid till exempel drlgning ur urnl måste drlgning med återläggning ske vilket är ett villkor för ltt
binomillfördelningens täthetsfunktion skl gälll, vilket också är det villkor som skiljer
binomillfördelningen från den hyper geometriskl fördelningen.

Om en stoklstisk vlrilbel X är binomillfördelld och n är lntllet utflll och p är slnnolikheten för


en viss händelse för vlrje utflll, skrivs dettl som (kodbeteckningen):

X ∈ Bin(n , p)

Downloaded by Nelly Olsson (nela-99@live.com)


lOMoARcPSD|2877367

och hlr slnnolikhetsfunktionen:

Px ( k )=P ( X=k )=( nk ) p (1− p)


k n−k

vilken lnger slnnolikheten för k utflll lv händelsen vlrs slnnolikhet är p och där 1 – p är
slnnolikheten för händelsens komplement, dvs. slnnolikheten ltt händelsen inte inträfflr.

För en binomillfördelld stoklstisk vlrilbel X så gäller ltt:

E(X) = np och V(X) = np(1 – p)

Downloaded by Nelly Olsson (nela-99@live.com)

You might also like