You are on page 1of 52

1.

1 Kombinatorika (permutacije, variacije, kombinacije s ponavljanjem in brez)


a) Pravilo vsote:
e imamo na voljo m monosti iz prve skupine in n monosti iz druge skupine, izbrati pa elimo
tono eno monost iz prve ali iz druge skupine, potem imamo na izbiro skupno m+n monosti.
b) Pravilo produkta:
Pravilu produkta pravimo tudi osnovni izrek kombinatorike: e imamo na voljo m monosti iz prve
skupine in n monosti iz druge skupine, izbrati pa elimo eno monost iz prve in hkrati eno iz druge
skupine, potem imamo na izbiro skupno m*n monosti.
c) Permutacije:
Permutacije so razporeditve danih n elementov na n prostih mest.
e so vsi elementi med seboj razlini, so to permutacije brez ponavljanja. tevilo permutacij brez
ponavljanja izraunamo po formuli:
Pn = n! ~ n * (n - 1) . . . 3 *2 * 1
V formuli nastopa raunska operacija fakulteta n! (ali tudi faktoriela), ki pravi, da zmnoimo vsa
tevila od 1 do n.
Opomba: Zaradi raunskih razlogov definiramo fakulteto tudi za tevilo 0 in sicer 0! = 1
d) Permutacije s ponavljanjem:
Permutacije s ponavljanjem so permutacije elementov, ki niso vsi med sabo razlini. Pri tem lahko
nastopa celo ve skupin med sabo enakih elementov. Recimo, da je v prvi taki skupini k1 enakih
elementov, v drugi k2 enakih elementov, ..., v m-ti pa km enakih elementov. Potem tevilo permutacij
s ponavljanjem izraunamo po formuli:

e) Variacije:
Variacije brez ponavljanja so razporeditve n razlinih elementov na r prostih mest. Pri tem je r < n,
zato ostane nekaj elementov nerazporejenih. tevilo variacij brez ponavljanja raunamo po formuli:

f) Variacije s ponavljanjem:
Variacije s ponavljanjem so razporeditve, pri katerih poskuamo na r prostih mest razporediti
elemente n razlinih vrst. Pri tem se lahko element doloene vrste v razporeditvi pojavi poljubno
mnogokrat. tevilo variacij s ponavljanjem izraunamo po formuli:

g) Kombinacije:
e pri variacijah zanemarimo vrstni red in opazujemo samo, kateri elementi so izbrani, dobimo
kombinacije. Gre za izbire r (razlinih) elementov izmed n razlinih elementov, ki so na voljo.
tevilo kombinacij brez ponavljanja izraunamo s pomojo binomskega simbola:

h) Kombinacije s ponavljanjem:
Kombinacije s ponavljanjem dobimo, e pri variacijah s ponavljanjem zanemarimo vrstni red. To so
torej izbire, kjer izbiramo r elementov izmed n, vendar pa lahko isti element izberemo tudi vekrat
(poljubno mnogokrat). tevilo kombinacij s ponavljanjem izraunamo po formuli:

1.2 Popoln sistem dogodkov, definicija verjetnosti in raunanje z dogodki


popoln sistem dogodkov
Mnoico dogodkov S={A1,A2,An} imenujemo popoln sistem dogodkov, e se v vsaki ponovitvi
poskusa zgodi natanko eden od dogodkov iz mnoice S.To pomeni, da so vsi mogoi Ai
N(noben izmed njih ni nemogo) in paroma nezdruljivi Ai Aj = N i j in je njihova vsota
gotov dogodek A1 U A2 UU An = G.
Primer: Popoln sistem dogodkov pri metu kocke sestavljajo npr. elementarni dogodki ali pa
tudi dva dogodka: dogodek, da vrem sodo t. pik in dogodek, da vrem liho t. pik.
osnovni pojmi
Verjetnostni raun obravnava zakonitosti, ki se pokaejo v velikih mnoicah enakih ali vsaj
zelo podobnih pojavov.
POSKUS je realizacija neke mnoice skupaj nastopajoih dejstev.(Vsako dejanje, ki ga
opravimo v doloenih pogojih).
IZID - Rezultat poskusa, mnoica vseh izidov je PROSTOR IZIDOV.
DOGODEK - je pojav, ki ne spada v mnoico skupaj nastopajoih dejstev in se lahko v
posameznem poskusu zgodi ali pa ne.
GOTOV DOGODEK- G: Dogodek se zgodi ob vsaki ponovitvi poskusa.(univerzalna mnoica)
NEMOGO DOGODEK - N: Se nikoli ne zgodi!(prazna mnoica)
SLUAJEN DOGODEK - vasih se zgodi, vasih ne.
PODDOGODEK: Dogodek A je poddogodek(nain) dogodka B, e se zagotovo zgodi vsaki, ko
se zgodi dogodek A.
NEZDRULJIVA DOGODKA A in B sta nezdruljiva, e se ne moreta zgoditi hkrati
Primer: dogodka A ={vremo sodo t. pik} in B ={vremo liho t. pik} sta nezdruljiva
Poljuben dogodek in njegov nasprotni dogodek sta vedno nezdruljiva. Njun produkt
je nemogo dogodek, njuna vsota pa gotov dogodek.

SESTAVLJEN DOGODEK je vsota nezdruljivih in mogoih dogodkov. Dogodek, ki ni


sestavljen je ELEMENTAREN. Primer: pri metu kocke je 6 el. dog(1 pika, 2 piki,). Dogodek, da
pade sodo t. pik pa je sestavljen dogodek. Elementarni dogodek vsebuje natanko en
elementarni izid, sestavljen dogodek pa lahko vsebuje ve elementarnih izidov.

raunanje z dogodki
A c B - podmnoica, dogodek A je nain dogodka B(vsaki ko se zgodi A, se zgodi tudi B).
A c B in B c A -> A=B
A B presek, produkt dogodkov A in B (e se zgodita oba dogodka hkrati)
A U B unija, vsota dogodkov A in B (e se zgodi vsaj eden od dogodkov A in B).
Ac komplement, nasprotni dogodek (negacija dogodka A)
PRAVILA:

AUN=A
AUG=G

AUB=BUA

A U (B U C) = (A U B) U C

A U (B C) = (A U B) (A U C)
(A U B)c = Ac Bc
(Ac)c = A
Nc = G

A N = N;
A G = A

definicija verjetnosti
Verjetnost dogodka A v danem poskusu je stevilo P(A), pri katerem se navadno
ustali relativna frekvenca dogodka A v velikem stevilu ponovitev tega poskusa.
oz. Verjetnost dogodka A v danem poskusu je stevilo P(A), pri katerem se ustali pogostost/relativna
frekvenca dogodka A v velikem tevilu ponovitev
oz. Pri velikem tevilu ponovitev dogodka A se pogostost/relativna frekvenca ustali.
Primer: Igralcem je ze dolgo casa znano, da se meti kovanca, kart ali kock scasoma ustalijo v tocno
dolocene vzorce.
klasicna definicija verjetnosti: Ce je pri slucajnem pojavu moznih s izidov, ki so vsi enako verjetni,
potem je verjetnost vsakega od izidov enaka 1/s. Za poljubni dogodek A je njegova
verjetnost enaka
P(A) = stevilo izidov v A / stevilo izidov v S ALI
P(A)= stevilo izidov v A / s
Vzemimo da so dogodki iz popolnega sistema dogodkov
{E1, E2,,Es} enako verjetni: P(E1) = P(E2)== P(Es) = p Tedaj je verj. 1 od dogodkov P(Ei) = 1/s
za i = 1,,s
e je nek dogodek A sest. iz r dogodkov iz tega popolnega sistema dogodkov, potem je njegova
verjetnost P(A) = r/s

STATISTINA DEF. VERJETNOSTI: verjetnost dogodka A v danem poskusu je tevilo P(A), pri katerem
se navadno ustali relativna frekvenca dogodka A v velikem tevilu ponovitev tega poskusa.
Lastnosti verjetnosti:
P(A)>0 (relativna frekvenca je vedno nenegativna)
P(G) = 1
P(N)=0
P(A U B) = P(A) + P(B) (za A in B nezdruljiva dogodka),
P(A U B) = P(A) + P(B) P(A B) (za A in B zdruljiva dogodka)
P(A presek B) = P(A) * P(B)
P(Ac) = 1 P(A)

1.3 Pogojna verjetnost


Pogojna verjetnost je verjetnost, da se zgodi dogodek A, pod pogojem, da se je zgodil neki
drugi dogodek B. Takno verjetnost oznaimo s P(A|B).
Pogojno verjetnost lahko doloimo za nezvezne (diskretne) in zvezne sluajne spremenljivke.
Verjetnost dogodka B, e vemo, da se je zgodil dogodek A: PB(A) = P(A |B) .
Velja 0 P(A|B) 1.

Oz:

Izpeljave:
Torej velja:

Torej A in B sta NEODVISNA ntk velja P(A|B)=P(A) oz. P(AB)=P(A)P(B). Dogodka A in B sta
neodvisna, e ne vplivata eden na drugega.
Primer:
A ... iz prve posode vzamemo 3 rdee kroglice
B ... iz druge posode vzamemo 5 zelenih kroglic

1.4 Dvofazni poskusi, formula za popolno verjetnost in Bayesov obrazec


Dvofazni poskus se dogaja v dveh fazah. Pravimo jim tudi relejni poskusi.
(1) zgodi se natanno en od dogodkov H1,H2,H3, ,Hn (2) opazujemo nek izbrani dogodek A.
Dogodkom Hi pravimo hipoteze. Ti dogodki morajo sestavljati popoln sistem paroma
nezdruljivih dogodkov. Nemogoih hipotez ne uporabimo.
ali z drugimi besedami
Dogodki H1, H2,,Hn tvorijo popoln sistem dogodkov, e so paroma nezdruljivi HiHj =
N in je njihova vsota gotov dogodek H1 U H2 UU Hn = G. Denimo, da na poskus poteka v dveh
fazah in da v prvi fazi nastopi natanko en dogodek iz popolnega sistema dogodkov, od njega pa
je odvisen nek dogodek v drugi fazi. Denimo, da se je v drugi fazi zgodil dogodek A. Poznamo
Hi, zanima pa nas P(A), e poznamo verjetnost P(Hi) in pogojno verjetnost P(A|Hi)
Formula za popolno verjetnost: P(A) = ni=1 P(A|Hi)P(Hi)
Poznamo Hi, zanima pa nas P(Hi|A) torej verj., da se je A zgodil s tono doloenim dogodkom iz
prve faze. Bayesov obrazec se uporablja za raunanje dvofaznega poskusa v obratni smeri.

, kjer je P(A) = ni=1 P(A|Hi)P(Hi) ; formula za popolno verjetnost.

1.5 Bernullijevo zaporedje neodvisnih poskusov in Laplaceov obrazec


O zaporedju neodvisnih poskusov X1, X2 ... Xn govorimo tedaj, ko so verjetnosti izidov v enem
poskusu neodvisne od tega, kaj se zgodi v drugih poskusih.
Zaporedje neodvisnih poskusov se imenuje Bernoullijevo zaporedje, e se more zgoditi v
vsakem poskusu iz zaporedja neodvisnih poskusov le dogodek A z verjetnostjo P(A) = p ali
dogodek A z verjetnostjo P(Apreno) = 1 - P(A) = 1 - p = q.
V Bernoullijevem zaporedju nas zanima kolikna je verjetnost, da se v n zaporednih poskusih
zgodi dogodek A natanko k-krat. Dogodek A se lahko v n poskusih zgodi na toliko nainov, kolikor
lahko izberemo k nainov iz n nainov. Teh je n nad k".

Laplaceov obrazec smemo uporabiti, kadar je n velik, p pa blizu 1/2. V primeru velikih n pa
uporabimo De Moivrov obrazec, ki je tudi poseben primer Laplaceovega obrazca.
Laplaceov tokovni obrazec je aproksimacija normalne porazdelitve, pri dovolj velikih n-jih za
binomsko porazdelitev. Pri dovolj velikih n-jih se oblika/krivulja binomske porazdelitve
pribliuje normalni/gaussovi krivulji.(Povzeto po wikipedia - Laplace -& De moivre theorem)
E(X) = np
sigma^2 = npq ali np(1-p)
Zato je X porazdeljen N(np,sqrt(npq))

1.6 Sluajne spremenljivke


S spremenljivko oznaimo izid nekega dogodka. Kadar je izid takega dogodka odvisen le od
sluaja (drugi dejavniki ne vplivajo), potem spremenljivki pravimo sluajna spremenljivka.
Da je sluajna spremenljivka znana, je potrebno vedeti 1.) kakna je njena zaloga vrednosti
in 2.) verjetnost vsake izmed moznih vrednosti ali intervala vrednosti. Predpis, ki doloca te
verjetnosti, imenujemo porazdelitveni zakon. Porazdelitveni zakon sluajne spremenljivke X je
poznan, e je mogoe za vsako realno tevilo x doloiti verjetnost F(x) = P(X<x). Kjer je F(X)
porazdelitvena funkcija.
Sluajne spremenljivke oznaujemo z velikimi tiskanimi rkami, njihove vrednosti pa z malimi
tiskanimi (na primer: X = xi pomeni: dogodek, pri katerem spremenljivka X zavzame vrednost
xi).

1.7 Diskretna sluajna spremenljivka (enakomerna in binomska porazdelitev)


Diskretna sluajna spremenljivka je spremenljivka, pri katerih je zaloga vrednosti neka tevna mnoica.

Zaloga vrednosti je konna mnoica. {x1,..,xm}. Dogodki X = xk za k = 1,2,,n tvorijo popoln


sistem dogodkov. Verjetnost posameznega dogodka P(X = xi) = pi Vsota verjetnosti vseh
dogodkov je enaka 1. p1+p2++pm = 1 .
Verjetnostna shema prikazuje spremenljivko s tabelo tako, da so zgoraj zapisane vrednosti xi,
pod njimi pa pripadajoe verjetnosti: X: (x1p1 x2 p2 xm pm ). Porazdelitvena funkcija je v tem
primeru F(xk) = P(X< xk) = k-11=1pi
Verjetnostna tabela/shema prikazuje diskretno slucajno spremenljivko s tabelo tako, da so v prvi
vrstici zapisane vse vrednosti xi, pod njimi pa so pripisane pripadajoce verjetnosti:

Enakomerna in binomska porazdelitev:

ali

Enakom. disk. porazdelitev diskretna slu. spr. se porazdeljuje enakomerno, e so vse njene
vred.i enako verjetne.
Primer: t. pik pri metu potene igralne kocke. Vsaka pika ima verjetnost 1/6.
Binomska porazdelitev zaloga vrednosti {0,1,2,,n} in verjetnosti, ki jih izraunamo po
Bernoullijem obrazcu
P(X=k) = (nk)pk(1-p)n-k za k=0,1,2,,n
Binomska porazdelitev je natanko doloena z dvema podatkoma: n in p. Slu. spr. X se
porazdeljuje binomsko s parametroma n in p: X: b(n,p)
indikatorska sluajna spremenljivka

To je sluajna spremenljivka X, ki ima samo vrednosti 0 in 1.

1.8 Zvezna sluajna spremenljivka (porazdelitvena funkcija, gostota verjetnosti)


Je spremenljivka, ki lahko zavzame vsako realno tevilo znotraj doloenega intervala a X b.

Verjetnost, da slu. spr. zavzame vrednost manjo od neke vrednosti x, je: F(x) = P(X<x) = xa p(x)dx,
kjer p(x) imenujemo verjetnostna gostota. To verjetnost si lahko predstavimo tudi grafino v
koordinatnem sistemu, kjer na x-os nanaamo vrednosti sluajne spremenljivke, na y-os pa
verjetnostno gostoto p(x). Verjetnost je tedaj predstavljena kot ploina pod krivuljo, ki jo doloa p(x).
Velja: xa p(x)dx=1.
Funkcija gostote verjetnosti (oznaka pdf iz probability density function) je v teoriji verjetnosti funkcija, ki daje relativno verjetnost, da bo
zvezna sluajna spremenljivka imela tono doloeno vrednost iz mnoice monih vrednosti.

Spremenljivka je zvezno porazdeljena e obstaja taka integrabilan funkcija p, imenovana GOSTOTA


VERJETNOSTI, da za vsak x E R velja:

(narobe mali x in veliki X, ravno obratno)


Enakomerna zvezna sluajna spremenljivka je enakomerno porazdeljena na konnem intervalu [a,b], e je
njena gostota:

Grafino si jo lahko predstavljamo kot pravokotnik nad intervalom [a, b] viine 1/(b-a).

Porazdelitvena funkcija F(x) = P(X < x) nam pove kakna je verj., da je slu. spr. X manja od neke
vred x e R.

Porazdelitvena funkcija:

Lastnosti:
- f(x) je definirana za vse R(realna t) in velja: 0 <= F(x)<= 1, x R
- F(x) je nepadajoa: x1<x2 => F(x1) < F(x2)
- F(-oo)=0, F(oo)=1 ; oo = neskonno
- F(x) je v vsaki toki zvezna od leve: F(x-) = F(x)
- F(x) ima lahko v nekaterih tokah skok; vseh skokov je najve tevno mnogo
- P(x1 <= X < x2) = F(x2) - F(x1)
- P(x1 < X < x2) = F(x2) - F(x1+)
- P(X >= x) = 1 - F(x)
- P(X = x) = F(x+) - F(x)
Gostota verjetnosti:

1.9 Normalna porazdelitev (funkcija napake in standardizirana normalna


porazdelitev), tudi verazsena gostota porazdelitve
Gaussova porazdelitev (imenovana tudi normalna porazdelitev) je verjetnostna porazdelitev
vrednosti statistinih enot v statistini populaciji, ki je v grafini predstavitvi oblikovana v obliki
zvona(unimodalna oblika - ima en sam vrh) oziroma normalne krivulje. Vanjo sodi druina
porazdelitev, ki imajo razline parametre (na primer aritmetino sredino in standardni odklon), a
oblikujejo enake grafe porazdelitve.

Graf Gaussove porazdelitve ima obliko enogrbe kamele. Zaloga vrednosti normalno
porazdeljene sluajne spremenljivke so vsa realna tevila, gostota verjetnosti pa je:

Kadar je spremenljivka priblino normalno porazdeljena, jo statistini karakteristiki povpreje in


standardni odklon zelo dobro opisujeta.

FUNKCIJA NAPAKE in LAPLACEOV INTERVALSKI OBRAZEC

Funkcijo napake uporabljamo za izraun verjetnosti sluajne spremenljivke v normalni


porazdelitvi, da pade v interval (-oo,x]!!

Standardna normalna porazdelitev je porazdelitev vrednosti s povprejem (aritmetino sredino)


0 in standardnim odklonom 1.

Iz Laplaceovega obrazca izhaja: B(n,p) = N(np,sqrt(npq))

reprodukcijska lastnost normalne porazdelitve

1.10 EXTRAS - PRVO POGLAVJE


poissonova v primerjavi z binomsko

Razlika med diskretno in zvezno slu. spremenljivko


Diskretna sluajna spremenljivka: sluajna spremenljivka, pri kateri je zaloga vrednosti neka
tevna (diskretna) mnoica.
Zvezna sluajna spremenljivka: sluajna spremenljivka, ki lahko zavzame vsako realno tevilo
znotraj doloenega intervala.

1.11 Porazdelitve
a) Enakomerna porazdelitev:
Konna diskretna sluajna spremenljivka je enakomerno porazdeljena, e so vse njene vrednosti
enako verjetne.
Primeri:
- Vsi izidi na kocki so enako verjetni. Ker imamo 6 izidov, je verjetnost vsakega izida enaka 1/6.
- Na kovancu je enako verjetno ali bo padel grb ali cifra. Ker sta 2 izida, je verjetnost vsakega
1/2.
b) Binomska porazdelitev:
Binomska porazdelitev je diskretna porazdelitev n uspenih izidov zaporednih poskusov, kjer
sta mona le dva izida: DA ali NE. Takno vrsto neodvisnih poskusov imenujemo Bernoullijevi
poskusi, sam postopek pa Bernoullijev postopek.
Pri binomski porazdelitvi nas zanima verjetnost, da se v zaporedju n-tih poskusov zgodi
dogodek DA k-krat. Tabela binomske porazdelitve je simetrina glede na sredino, le e je p=0,5.

c) Poissonova porazdelitev:
Poissonova porazdelitev je diskretna porazdelitev. Izraa verjetnost tevila dogodkov, ki
se zgodijo v danem asovnem intervalu, e vemo, da se dogodki pojavijo s poznano
povpreno frekvenco in neodvisno od asa, ko se je zgodil zadnji dogodek.
V praksi Poissonovo porazdelitev uporabimo, e vemo da se dogodek v povpreju zgodi 3krat na minuto in nas zanima kolikokrat se bo zgodil v 1 uri.
Primeri: tevilo dostopov do spletnega strenika v 1 uri, tevilo telefonskih klicev na bazni
postaji
vsako minuto, tevilo prometnih nesre na slovenskih cestah v 1 tednu
Verjetnost Poissonove porazdelitve raunamo po obrazcu:

d) Zveza med Binomsko in Poissonovo porazdelitvijo:


V binomski porazdelitvi obravnavamo tevilo uspehov v n ponovitvah poskusa, v
poissonovi pa nas zanima verjetnost, da se pojavi m dogodkov v nekem asovnem obdobju.
Poissonovo porazdelitev uporabljamo tudi za izraun verjetnosti pojavljanja dogodkov na
doloeni razdalji, povrini ali prostornini (ne samo v asovnem intervalu).
B(n,p) = P(np)
Primer:
Binomska: tevilo uspeno opravljenih izpitov v tudijskem letu (recimo, da jih opravimo
10)
Poissonova: verjetnost, da bo tudent letos opravil vse (recimo, da jih ima 10) izpite
e) Pascalova porazdelitev:
Pascalova porazdelitev (imenovana tudi negativna binomska porazdelitev) opisuje
porazdelitev tevila poskusov potrebnih, da se dogodek A zgodi m-krat. Primer: meemo
kovanec, dokler 3-krat ne pade cifra.
f) Geometrijska porazdelitev:
tevilo ponovitev poskusov dokler se ne zgodi A, P(A) = p.

g) Hipergeometrijska porazdelitev:
Hipergeometrijska porazdelitev opisuje verjetnost dogodka, da je med n izbranimi
kroglicami natanko k belih, e je v posodi M belih in N-M rnih kroglic. Pri tem kroglice
izbiramo n-krat in brez vraanja.

i.) Laplaceov intervalski obrazec:


Laplaceov intervalski obrazec uporabimo takrat, kadar nas zanima verjetnost Pn(k1, k2), da
se v Bernoullijevem zaporedju neodvisnih poskusov v n zaporednih poskusih zgodi
dogodek A vsaj k1-krat in manj kot k2-krat.

j) Eksponentna porazdelitev:
Gostota eksponentne porazdelitve, ki ji pravimo tudi porazdelitev Poissonovega toka, je
enaka:
p(x) = lambda * e^(-lambda*x)
; x>=0
porazd. funkcija pa je: F(x) = integral(0,x)(p(x)dt) = 1- e^(-lambda*x)

o) Bernoullijev zakon velikih tevil (1713):


Naj bo k frekvenca dogodka A v n neodvisnih ponovitvah danega poskusa, v katerem ima
dogodek A verjetnost p. Tedaj za vsak > 0 velja:

2.1 Matematino upanje (priakovana vrednost) sluajne spremenljivke


(kdaj obstaja)
Matematino upanje EX (ali tudi priakovana vrednost) je posploitev povprene
vrednosti sluajne spremenljivke X.
Diskretna sluajna spremenljivka X z verjetnostno funkcijo pk ima/OBSTAJA matematino
upanje:

Zvezna sluajna spremenljivka X z gostoto p(x) ima/OBSTAJA matematino upanje:

ALI:

Lastnosti:
e sta sluajni spremenljivki, ki imata matematino upanje neodvisni, obstaja tudi matematino
upanje njunega produkta in velja EXY = EX * EY.
Spremenljivki, za kateri velja EXY EX * EY imenujemo korelirani.

E(aX + bY ) = aEX + bEY


Definiraj vzorno povpreje X in napii, kaj se dogaja z vzornim povprejem EX in s standardno napako DX
z naraanjem velikosti vzorca.

2.2 Disperzija (razprenost/varianca) sluajne spremenljivke in odklon


Disperzija (razprenost ali tudi varianca) DX sluajne spremenljivke, ki ima
matematino upanje, je doloena z izrazom: DX = E(X - EX)2 D(X) = E(X^2) - (E(x))^2
Disperzija je vedno nenegativna, DX 0, je pa lahko tudi neskonna. Velja: DX = EX2 - (EX)2.
Za disp velja: D(X+b) = D(X) in D(aX) = a2D(X), kjer sta a, b konstanti.

Standardni odklon (ali tudi standardna deviacija) sluajne spremenljivke je statistini


kazalec, najvekrat uporabljen za merjenje statistine razprenosti enot. Z njim je mo
izmeriti, kako razprene so vrednosti, vsebovane v populaciji.

e ima podatkovna mnoica porazdelitev priblino zvonaste oblike(normalna porazdelitev)


priblino 68,3% vseh meritev lei na razdalji 1x standardnega odklona od njihovega
povpreja. 95,4% vseh meritev lei na intervalu [mi - 2*sigma, mi + 2* sigma] in 99.7%
meritev lei na razdalji 3x standardnega odklona od njihovega povpreja.

2.3 Standardizacija sluajne spremenljivke


Iz zapiskov:

Normalizacija

Iz fatal-error zapiskov:

2.4 Povezanost dveh tevilskih sluajnih spremenljivk

2.5 Kovarianca, Pearsonov koeficient korelacije

koreliranost:

Zveza med disperzijo in kovarianco: D(X + Y ) = DX + DY + 2Cov(X, Y) e pa sta


spremenljivki nekorelirani, je enostavno: D(X + Y) = DX + DY
Torej sta normalno porazdeljeni sluajni spremenljivki X in Y neodvisni natanko takrat, ko
sta nekorelirani.

ALI.

Torej korelacija ali korelacijski koeficient predstavlja mo linearne povezanosti dveh


spremenljivk. Definiramo ga kot razmerje med kovarianco in standardnim odklonom
spremenljivk X in Y.

2.6 Funkcije sluajnih spremenljivk (npr. X2) in sluajni vektorji (npr. opis
dvorazsene diskretne porazdelitve s tabelo in stopniasto ploskvijo, robna
porazdelitvena funkcija, verjetnostna funkcija, neodvisnost, pogojne
porazdelitve)
Funkcije sluajnih spremenljivk:

e je X sluajna spremenljivka in f poljubna realna funkcija


definiramo kompozitum
= f(X(t)).

, lahko

oz. novo preslikavo Y, doloeno s predpisom Y(t)

SLUAJNI VEKTORJI

opis dvorazsene diskretne porazdelitve s tabelo:

neodvisnost sluajnih spremenljivk:

robna porazdelitvena funkcija:

pogojne porazdelitve:

verjetnostna funkcija:

2.7 Sredine (aritmetina, geometrijska, harmonina, kvadratna)


Aritmetina sredina ali povpreje je vsota vseh vrednosti deljena s t. enot v populaciji.
Primerna je za tevilske, priblino normalno porazdeljene spremenljivke. = Ni=1xi / N
e spremenljivka dosee k razlinih vrednosti s pripadajoimi frekvencami fi, aritm.
sredino izraunamo kot = ri=1fixi / N in ji pravimo tehtana oz. uravnoteena
aritmetina sredina, frekvencam pa utei.
Geometrijska sredina je enaka N-temu korenu iz produkta N vrednosti t. spremenljivke pri
pogoju xi > 0. G = Nx1x2xN

Harmonina sredina - predstavlja eno od srednjih vrednosti. Primerna je v primerih,


ko je potrebno najti srednje vrednosti stopenj.
oz.
je enaka reciproni(vzajemni) vrednosti aritmetine sredine, izraunane iz recipronih
vrednosti spremenljivk. H = N / (1/x1+1/x2++1/xN) Velja HG
Kvadratna sredina - kvadratni koren aritmetine sredine kvadratov podatkov v vzorcu.

2.8 Momenti, centralni limitni izrek (ni dovolj napisati, da gre za CLI, pa pa
je potrebno razumeti kaj je centralni limitni zakon)

Kadar spremenljivka nima momentov, uporabljamo kvantile.

Centralni limitni izrek (central limit theorem) pravi, da vsako zaporedje enako
porazdeljenih neodvisnih sluajnih spremenljivk z istim matematinim upanjem in disperzijo tei
k normalni porazdelitvi.

2.9 Statistika (osnovni pojmi kot npr. mediana, kvantil, kvartil in kvartilni
razmik, vrste spremenljivk, tipi analiz)
Enota = posamezni prouevani element (primer: tudent na neki fakulteti)
Populacija = mnoica vseh prouevanih elementov; pomembna je natanna opredelitev
populacije, asovno ali prostorsko (primer: vsi tudenti na tono doloeni fakulteti v
doloenem letu)
Vzorec = podmnoica iz populacije, na osnovi katere sklepamo o lastnostih cele populacije
Spremenljivka = lastnost enot; podatek ki ga prouujemo (primer: spol, uspeh pri
nekem predmetu)
Mediana - predstavlja srednjo vrednost, e so podatki urejeni po velikosti. Pri lihem
tevilu elementov je to element, ki se nahaja tono na sredini. e pa v vzorcu nastopa sodo
mnogo elementov, potem vzamemo povpreje srednjih dveh.
Modus - predstavlja tisto vrednost v vzorcu, ki se najvekrat ponovi. Torej, element, ki ima
najvijo frekvenco. Modus obstaja natanko takrat, kadar obstaja le en element, ki ima
najvijo frekvenco.
Kvartil - katera koli od treh vrednosti kvantilov, ki delijo urejeno mnoico sluajnih
spremenljivk na tiri enake dele. V mnoici nastopajo 3 kvartili, ki jih oznaimo z Q:
Prvi kvartil (25% manjih vrednosti in 75% vejih), Drugi kvartil (tono na sredini;
mediana), Tretji kvartil (75% manjih vrednosti in 25% vejih).

Decil - katerakoli od devetih vrednosti kvantilov, ki delijo urejeno mnoico sluajnih


spremenljivk na deset enakih delov. V mnoici nastopa 9 decilov, ki jih oznaimo z D.
Centil - katerakoli od 99 vrednosti kvantilov, ki delijo urejeno mnoico sluajnih
spremenljivk na 100 enakih delov. V mnoici nastopa 99 decilov, ki jih oznaimo z C.
Centilov

Razpon je razlika med najvecjo in najmanjso meritvijo v mnozici podatkov.


Kvantil - Po tevilu delov, na katere delimo po neki vrednosti urejeno populacijo,
poznamo razline kvantile, ki jih oznaujemo kot p-kvantile oziroma kvantile razreda p.
Pri tem velja
. Kvantili so tako mejne vrednosti med posameznimi

podmnoicami sluajne spremenljivke. Kadar populacijo razdelimo na primer na 10


delov, imamo 10 podmnoic vrednosti sluajne spremenljivke in 9 vrednosti kvantilov,
ki jih loijo med seboj.

Vrste sluajnih spremenljivk:


Glede na vrsto vrednosti oziroma tip izraanja vrednosti delimo na:
1. tevilske( ali numerine spremenljivke - Vrednosti lahko izrazimo s tevili(starost))
2. opisne( ali atributivne - vrednosti lahko opiemo z imeni razredov(poklic, uspeh, spol).
Za podatke reemo da so kvalitativni, kadar jih delimo v kategorije in zanje ni
kvantitativnih interpretacij.)
e so kategorije BREZ odgovarjojeega vrstnega reda/UREJENOSTI ->imenski

Kakor hitro imajo kategorije neko UREJENOST, reemo da so podatki


ordinalni(urejenostni).
Glede na vrsto merske lestvice:
1. imenske (ali nominalne) spremenljivke vrednost je lahko samo enaka ali razlina
(primer: spol)
2. urejenostne (ali ordinalne) spremenljivke { vrednosti lahko uredimo od najmanjse do
najvecje, a ni mogoce dolociti za koliko je ena vrednost vecja od druge (npr. uspeh:
odlicen, pravdober, dober, zadosten, nezadosten); smiselno je racunati se kvantile
(mediana,kvartile, decile,...), ne pa aritmeticne sredine;
3. razmicne (ali intervalne) spremenljivke { lahko primerjamo razlike med vrednostima
dvojic enot (npr. temperatura, cas po koledarju, merjenje inteligencnega kvocienta,...);
smiselno je racunati se aritmeticno sredino, standarni odklon,...
4. razmernostne spremenljivke { lahko primerjamo razmerja med vrednostima dvojic
enot (npr. starost, vrednost povzrocene skode, stevilo prometnih nesrec); smiselno
je racunati se geometicno sredino, harmonicno sredino,...
5. absolutne spremenljivke { stetja (npr. stevilo prebivalcev).

2.10 Opisna statistika (koraki statistine analize ter urejanje in


prikazovanje podatkov, standardizacija)
KORAKI STATISTINE ANALIZE
Iz interneta:
1. Opredelitev problema (vsebina, namen statistinega opazovanja)
2. Opredelitev problema opazovanja (opredelitev populacije, vzorca in spremenljivk)
3. Nart zbiranja in urejanja podatkov (opredelitev virov in tehnik zbiranja podatkov in njihovega
prikaza)
4. Statistino opazovanje, zbiranje in urejanje podatkov (zbiranje in urejanje podatkov)

5. Analitina obdelava urejenih podatkov (ugotavljanje znailnosti zbranih podatkov v skladu z


opredelitvijo problema)
6. Razlaga rezultatov (razlaga in ocena rezultatov)

Iz skripte:
1. Pridobivanje podatkov (vzorenje)
2. Obdelava podatkov

3. Statistino sklepanje (Sklepanje je proces, pri katerem pridemo do zakljuckov na


podlagi danih dokazov.)
Grafina predstavitev kvantitativnih podatkov

frekvenna porazdelitev
Frekvenna porazdelitev spremenljivke je tabela, ki jo doloajo vrednosti ali skupine
vrednosti in njihove frekvence. e je spremenljivka ordinalnega znaaja, vrednosti
uredimo po velikosti. To porazdelitev uporabimo, ko je tevilo vseh monih vrednosti
prouevane spremenljivke preveliko za pregledno prikazovanje podatkov. Zato sorodne
vrednosti razvrstimo v skupine-razrede.
prikaz frekvenne porazdelitve
Histogram - drug poleg drugega riemo stolpce - pravokotnike, katerih viina je
sorazmerna frekvenci v razredu. irina vseh pravokotnikov je enaka.
Poligon - v koordinatnem sistemu zaznamujemo toke (xi, fi), kjer je xi sredina tega
razreda in fi njegova frekvenca.

Ogiva - grafina predstavitev komulativne frekvenne porazdelitve s poligonom, kjer v


koordinatni sistem nanaamo toke.

Standardizacija:

Pomen standardizacije:
Standardizacija spremenljivk je postopek, s katerim vrednosti spremenljivke
transformiramo, in sicer tako, da od vsake vrednosti spremenljivke odtejemo aritmetino
sredino x in delimo z njenim standardnim odklonom x. Dobimo standardizirano vrednost.
Tako iz velikega tevila razlinih spremenljivk naredimo eno novo spremenljivko - e
imamo na primer razline merske enote, spremenljivke najprej standardiziramo in jih
tako spravimo na skupni imenovalec oziroma na isto mersko raven (vrednost).
Standardizirana spremenljivka Z ima vedno aritmetino sredino z = 0 in standardni
odklon z = 1. Standardizacijo uporabljamo, kadar elimo, da ima vsaka od spremenljivk enak
vpliv oziroma enako teo na novo, skupno oceno.

3.1 Mere razprenosti (povpreni absolutni odklon, varianca, standardni


odklon) in mere asimetrije ter sploenosti, momenti (centralni, zaetni)
Povpreni absolutni odklon predstavlja povpreje absolutnih odklonov vseh
spremenljivk v populaciji.

spremenljivke,

kjer je POx povpreni absolutni odklon, xi posamezne


aritmetine sredina populacije in N tevilo vseh enot v populaciji

Varianca (tudi verjetnost distribucije; oznaka 2, sigma-kvadrat) je


v statistiki in verjetnostni teoriji mera statistine razprenosti doloene spremenljivke. Tako prikazuje, kako
so dejanske vrednosti razporejene okoli linije priakovanih vrednosti. Manj abstraktna
mera je kvadratni koren variance, imenovan standardni odklon.
Varianco definira formula:
Standardni odklon definira formula:

Standardni odklon (ali tudi standardna deviacija) sluajne spremenljivke je statistini kazalec,
najvekrat uporabljen za merjenje statistine razprenosti enot. Z njim je mo izmeriti, kako
razprene so vrednosti, vsebovane v populaciji.

Ponovitev momentov:

Mere asimetrije in sploenosti izraunane z momenti:

3.2 Porazdelitve vzornih statistik (aritmetinih sredin, deleev, razlike


aritm. sredin in razlike deleev) ter sklepanje iz vzorca na populacijo
(vzorne statistike, cenilke: nepristranske in dosledne)
Analitina statistika je veja statistike, ki se ukvarja z uporabo vzornih podatkov, da bi z
njimi naredili zakljuek o populaciji.

Enostavni sluajni vzorec:

Porazdelitev vzornih povpreij:

Vzorno povpreje in normalna porazdelitev( Vsota in vzorno povpreje)

iz foruma(fri-info.net):
Vzorne stat. pa so formule (morajo biti simetrine, da vrstni red nabiranja vzorcev ne vpliva nanje) s katerimi izraunamo lastnost
vzorca in iz nje sklepamo na lastnost populacije.

vzorni delei:

razlika vzornih povpreij:

razlika vzornih deleov:

Vzorno povpreje:

vzorne aritmetine sredine:

Sklepanje iz vzorca na populaciji:


Vzorne stat. pa so formule (morajo biti simetrine, da vrstni red nabiranja vzorcev ne vpliva nanje)
s katerimi izraunamo lastnost vzorca in iz nje sklepamo na lastnost populacije. Da bo sklepanje
uspeno moramo poznati njihove porazdelitve in o tem govorijo centralni limitni izreki, ki jih
uporabljamo pri intervalih zaupanja (in seveda nato e pri preverjanju domnev).

Vzorna aritmetina sredina X_precno je ocena populacijske aritmetine sredine . Vzorno


aritmetino sredino imenujemo tudi cenilka populacijske aritmetine sredine. Vrednost
cenilke se od ocenjevanja parametra bolj ali manj odklanja. Reemo, da je cenilka
parametra dobra, e ima nekaj dobrih lastnosti:
Nepristranska cenilka - povpreje vseh vzornih ocen (matematino upanje cenilk) je enako
ocenjevanemu parametru. Velja: E(X) = .
Dosledna cenilka - z veanjem vzorca se vzorna ocena blia parametru.
Tokovna cenilka - pove, kako izraunati numerino oceno parametra populacije na osnovi
merjenj vzorca.

CENILKE:

3.3 Intervali zaupanja (za povpreje, odklon, dele, tudi njihove razlike oz.
kvocijenti, majhen in velik vzorec)
definicija:

pomen stopnje tveganja:

postopek intervalskega ocenjevanja parametrov:


1.)S sluajnim vzorcem ocenjujemo parameter y(gama). Poskuamo najti statistiko g,
ki je nepristranska(to je E(g) = gama) in se na vseh monih vzorcih vsaj priblino
normalno porazdeljuje s standardno napako SE(g) in
2.)Poskuamo najti t.i. interval, v katerem se bo z dano gotovostjo (1-alfa ; verjetnost
gotovosti) nahajal ocenjevani parameter, kjer sta a in b spodnja in zgornja meja
zaupanja, alfa pa stopnja tveganja.
3.) Izberemo ustrezni test

4.) Za vsak enostavni sluajni vzorec lahko izraunamo ob izbrani stopnji tveganja alfa
interval zaupanja za parameter gama, kjer sta meji sluajni spremenljivki.
pojasni razliko med tokovno in intervalno oceno?
Tokovna cenilka je formula(pravilo), ki nam pove kako izraunati numerino oceno
parametra populacije na osnovi vzorca in rezultatu ne moremo zaupati v smislu
verjetnosti.
Pri intervalni oceni pa znamo oceniti verjetnost, da je parameter gama na izraunanem
intervalu( P(a<gama<b)=1-alfa)
kaj nam pove koeficient zaupanja(1-alfa) - TEORETINA INTERPRETACIJA
Z verjetnostnjo tveganja alfa se parameter gama nahaja v tem intervalu zaupanja. e
zaporedoma izbiramo vzorce velikosti n in za vsakega izraunamo interval zaupanja za
parameter gama, tedaj priakujemo, da bo (1-alfa)*100% intervalov vsebovalo pravo
vrednost parametra.
opii ocenjevanje parametrov z majhnimi vzorci(im ve monosti)
Odloamo se na podlagi vpraanj:
1.) Ali se spremenljivka poradeljuje normalno(da/ne)
2.) Ali poznamo standardni odklon sigma(da/ne)
3.) Kakna je velikost vzorca
Pri ocenjevanju parametra mi/E(x) se pri znanem odklonu sigma odloimo za ztest(tabela standardne normalne porazdelitve). Pri velikih vzorcih z-test, pri majhnih
vzorcih(n<30) t-test(studentova statistika) z n-1 prostnostnimi stopnjami.
Pri razliki povpreij mi1 -mi2 z znanima odklonoma sigma1 in sigma2 z-test, velik
vzorec z-test, majhen vzorec, neznani sigmi, t-test, kjer je po formuli potreben izraun
prostostnih stopenj.
Pri majhnih vzorcih je potrebno privzeti da so populacije porazdeljene priblino
normalno!!!
Pri ocenjevanju parametra Pi/dele je podobno kot zgoraj. Majhen vzorec, neznan
odklon = z test, velik vzorec = t test. Privzamemo da se populacija porazdeljuje priblino
normalno!
Velik vzorec za ocenjevanje parametra varianca o^2: Privzamemo da se porazdeljuje
priblino normalno, hi-kvadrat test z n-1 prostostnimi stopnjami, asimetrina
porazdelitev, za razliko od normalne porazdelitve, ki je zvonaste oblike(simetrina).

3.4 Preverjanje domnev (tj. testiranje hipotez: alternativa, stopnja


zaupanja/tveganja, napake, stopnja znailnosti testa, P-vrednost, kritino
obmoje, formalen postopek)

Iz primera izpita(reeno od prof. Juriia)


1. Postavimo domnevo o parametrih: h0 in ha
2. Za parameter poiemo kar se da dobro cenilko(npr. nepristransko) in njeno
porazdelitev ali porazdelitev ustrezne statistike(odvisno od tevilka podatkov/velikosti
vzorca).
3. Doloimo odloitveno pravilo: Izberemo stopnjo znailnosti(alfa) in na osnovi nje ter
porazdelitve statistike doloimo kritino obmoje
4. Zberemo/manipuliramo podatke ter na vzornih podatkih(nakljuni, neodvisni)
izraunamo eksperimentalno vrednost testne statistike(TS).
5. Primerjamo in naredimo zakljuek: e kritino obmocje eksperimentalno vrednost:
a. vsebuje: nielno domnevo zavrnemo in sprejmemo osnovno
b. ne vsebuje, pravimo da vzorni podatki kaejo na statistino neznailne razlike med
domnevno vrednostjo parametra in vzorno oceno.
Zavrnitveni kriterij:
alfa je obiajno 10% ali 5%, doloimo enostranski ali dvostranski test -> doloimo
kritino obmoje
a. (-oo, Z_alfa) ali (Z_alfa,oo)
b. (-oo,-Z_alfa/2) U (Z_alfa/2,oo)

e ne zavrnemo nielne domneve v primeru, ko je ta napana, je napaka 2. vrste.


Verjetnost da naredimo napako 2. vrste oznaimo s simbolom BETA.

Stopnja znailnosti:
Stopnja znailnosti(signifikantnosti) je najveji alfa, ki ga je vodja eksperimenta
pripravljen sprejeti(tj. zgornja meja za napako 1. vrste).

stopnja tveganja = alfa; - Verjetnsot da bomo naredili napako prve vrste.


stopnja zaupanja = 1-alfa

cdke

3.5 Ocenjevanje parametrov z majhnimi vzorci (tudi na nove vpeljane


porazdelitve kot so Studentova, Fisherjeva in hi-kvadrat)

Pri tej porazdelitvi je uporabljena Beta funkcija, ki jo lahko vpeljemo z Gama funkcijo.
Hi-kvadrat porazdelitev
Poseben primer porazdelitve Gama.

3.6 Regresija (regresijska premica z metodo najmanjih kvadratov)

Kaj sta prva in druga regresijska funkcija in kje se seeta?


Seeta se v toki, doloeni z aritmenima sredinama spremenljivk X in Y.

Kaj ve o prvi in drugi regresijski premici(npr. kje se seeta) ter o metodi najmanjih
kvadratov. Kaj je pomen Pearsonovega koef. in pojasni njegov pomen za regresijo?
Z pomojo Pearsonovega koeficienta ugotavljamo linearno povezanost dveh tevilskih
spremenljivk. Ko ugotovimo, da med spremenljivkama obstaja mona linearna
odvisnost, lahko le-to poiemo z metodo najmanjih kvadratov. Regresijsko funkcijo(Y
= a+bX+E) parcialno odvajamo po a in b ter dobimo dve enabi iz katerih doloimo a in
b. Na tak nain pridemo do regresijskih premic, ki se seeta v toki E(X) in E(Y).

3.7 asovne vrste in doloanje trenda