You are on page 1of 15

VELV

Odgovori na pitanja iz
Statistike
Novak Mario
Odgovori na pitanja iz STATISTIKE
1. STATISTIKA je znanstvena disciplina koja se bavi prikupljanjem,grupiranjem i analizom podataka i
informacfija te interpretacijom dobivenih rezultata provedenog istraživanjem,
Statisticke metode temelje se na teoriji vjerojatnosti.
Primjenjuje se u ekonomiji,prometu,poljoprivredi,zdrastvu,unutrašnjoj i vanjskoj trgovini,turizmu,itd.
2. KOMBINATORIKA-je grana matematike koja uglavnom proučava konačne skupove i strukture.
Ako imamo k praznih mjesta i pri tome se prvo mjesto može popuniti sa n1 različitih elemenata drugo mjesto sa
n2 različitih elemenata,...,k-to mjesto sa nk različitih elemenata tada se svih k mjesta može popuniti na
n1,n2,...,nk različitih načina.

3. PERMUTACIJE-jedan od osnovnih pojmova kombinatorike je pojam premutacije.Ako imamo n


različitih elemenata A1,A2,...,An njih je moguće poredati u jedan niz na više različitih načina.Svaki takav
niz,odnosno poredak naziva se permutacija.
PERMUTACIJE BEZ PONAVLJANJA- da bi se izračinao broj permutacija bez ponavljanja može se
zamisliti da su sva mjesta u nizu prazna.Svako moguće popunjavanje tih mjesta daje po jednu
permutaciju,prvo mjesto je moguće popuniti na n načina jer na to mjesto može doći svaki od n
elemenata.Kad je prvo mjesto popunjeno ide na drugo mjesto n-1,a kad je prvo i drugo ide na treće mjesto
n-2.Prema osnovnoj lemi kombinatorike može se zaključiti da će broj mogućih popunjavanja svih n mjesta
biti jednak n*(n-1)(n-2) ... za ovakav produkt prirodnih brojev uvodimo oznaku n faktorjela , broj
permutacija od n različitih elemenata bit će P
( n)
= n

4. PERMUTACIJE S PONAVLJANJEM- ako postoji n različitih elemenata,a izmeĎu njih je r1 jednakih


r2 jednakih,..,rk jednakih uz uvjet da je r1+r2+...+rk=n tada svaki poredak n elemenata u nizu predstavlja
po jednu permutaciju s ponavljanjem ,kada su svi elementi različiti broj permutacija bit će n faktorjela .Ako
imamo r1 meĎusobno jednakih elemenata tada će broj permutacija biti
n n
r  za slučaj r1 i r2 jednakih elemenata broj permutacija je r1 r2 daljnjim razmatranjem
1
( n) n
P r1r.2r.k =
dolazimo do konačne relacije za broj permutacija s ponavljanjem u obliku r1 r2 ....rk

5. VARIJACIJE-kod varijacije se od n elemenata uzima njih r pri čemu je r veće ili jednako n.Svako
uvoĎenje uzetih elemenata iz zadanog skupa predstavlja varijaciju.Kada je r=n,varijacije prelaze u
permutacije.
VARIJACIJE BEZ PONAVLJANJA-ako raspolažemo polaznim skupom od n različitih elemenata
A1,A2,......,An tada svaki slog odgovara elementu toga skupa koji predstavlja varijaciju n-tog reda i r-tog
razreda.Da bismo odredili broj varijacija,pretpostavimo r praznih mjesta u nizu.Prvo mjesto moguće je
popuniti na n različitih načina drugo mjesto na n-1 treće mjesto na n-2 itd. Stoga zaključujemo da se r
mjesta može popuniti n*(n-1)(n-2)...[n-(r-1)].Broj mogućih popunjavanja r mjesta odgovara broju varijacija
n-tog reda i r-tog razreda tj. = n  n  1  n  2 ... n  r  1
( n)
Vr
Množenjem i djeljenjem dobivenog izraza sa bit će
( n  r )
( n) n
Vr =
( n  r )

6. VARIJACIJE S PONAVLJANJEM- ako je zadano n različitih elemenata,iz kojeg se uzimaju slogovi od


po r elemenata,te ako se u jednom slogu isti elementi mogu pojavljivati dva ili više puta,dobivaju se varijacije
n-tog reda i r-tog razreda s ponavljanjem.Popunjavanje prva dva mjesta moguće je ostvariti na nn=n2 različitih
( n) r
načina Vr =n

7. KOMBINACIJE- pri rješavanju raznih problema prebrojavanja često puta poredak elemenata u slogu
nije važan.Svaki podskup nekog skupa od n različitih elemenata kod kojega redosljed nje bitan naziva se
kombinacija.
KOMBINACIJE BEZ PONAVLJANJA-ako od n različitih elemenata tvorimo slogove od po r elementa
i pri tome nam nije važan poredak elemenata unutar sloga,tada dobivamo kombnacije n-toga reda i r-toga
razreda.Broj kombinacija odreĎujemo preko broja varijacija.Budući da svaka skupina obuhvaća r faktorjela
varijacija a sa stajališta kombinacija varijacije jedne skupine meĎusobno su identične kombinacije,tada će
broj kombinacija biti jednak broju skupina varijacija tj.
( n) n
Kr =
r ( n  r )
8. KOMBINACIJE S PONAVALJANJEM- Kombinacije s ponavljanjem razlikuju se od kombinacija bez
ponavljanja po tome što se kod njih mogu pojavljivati isti elementi,broj kombinacija s ponavljanjem r-tog razreda
od n elemenata ,bit će ( n)  n  r  1 
r  n  1 
Kr =

9. SLUČAJAN DOGAĐAJ I SLUČAJAN POKUS-SLUČAJAN DOGAĐAJ- je takav dogaĎaj koji se u


odreĎenim uvijetima može,ali i ne mora dogoditi,kod proučavanja vjerojatnosti svaki proces promatranja
nekog dogaĎaja naziva se pokusom a rezultat promatranja je ishod pokusa.SLUČAJAN POKUS : bacanje
novčića,kocke; pokus se naziva slučajnim ako se njegov ishod ne može predvidjeti.
10. POJAM VJEROJATNOSTI- svaki ishod pokusa nazivamo elementarnim dogaĎajem a skup svih
elementarnih dogaĎaja nazivamo potpunim skupom dogaĎaja ili prostorom elementarnih dogaĎaja. Ako je
m(A) broj elementarnih dogaĎaja koji realiziraju neki dogaĎaj A tada je vjerojatnost dogaĎaja A omjer
broja m(A) i broja n jednako mogučih dogaĎaja koji tvore potpun skup.
m( A)
P( A) =
n
Često se vjerojatnos definira kao omjer broja ponovljenih i broja svih mogučih ishoda pokusa.

11. PROTIVNA VJEROJATNOST- ako je P(A) vjerojatnos dogaĎaja A postavlja se pitanja


kolika je vjerojatnost da dogaĎaj A ne nastupi. Nenastupanje dogaĎaja A takoĎer je jedan dogaĎaj
koji označavamo A(čita se " non A" ) vjerojatnost dogaĎaja A je : m( A)
P( A) = =p
n
Vjerojatnost protivnog dogaĎaja A je :
m( A) n  m( A) n  m( A)
P( A) = = = = q = P( A) = 1  P( A) = Q( A)
n n n

Zbroj vjerojatnosti i protivne vjerojatnost jednakog dogaĎaja jednak je 1.


P(A)  Q( A) = 1 p q=1

12. ZBRAJANJE VJEROJATNOSTI-da bismo odredili vjerojatnost jednog složenog dogaĎaja koji je
sastavljen od više elementarnih dogaĎaja prvo čemo definirati pojam ISKLJUČIVOST dogaĎaja.
Elemenentarne dogaĎaje možemo predočiti točkama u ravnini.Ako se dogaĎaj A i B meĎusobno isključuju
tada odgovarajući skupovi A i B nemaju zajedničkih točaka. Za skupove koje nemaju zajednički element
kažemo da su DISJUNKTIVNI.Za dva dogaĎaja A1 i A2 kažemo da se meĎusobno isključuju ako
istovremeno ne mogu nastupiti oba,tj. ili može nastupiti dogaĎaj A1 ili A2.Vjerojatnost da se desi ili
dogaĎaj A1 ili A2 jednaka zbroju vjerojatnosti tih dogaĎaja
 
P A1  A2 = P A1  P A2    
Istaknimo da znak "+" kada stoji meĎu dogaĎajima znači "ILI" (desna strana) ,dok znak "+" meĎu
brojevima znači "ZBRAJANJE" ( lijeva strana) na isti način možemo reći da se više dogaĎaja meĎusobno
isključuju , ako se uvijek može pojaviti jedan od njih a ne dva ili više.

13. MNOŽENJE VJEROJATNOSTI- pretpostavimo da se dogaĎaj A1 i A2 meĎusobno ne isključuju što


znači da se istovremeno mogu pojaviti oba. Takvi dogaĎaji pripadaju skupovima koji se prisjecaju koji
imaju zajedničkih točaka u presjeku A1  A2 . Istovremeno pojavljivanje oba dogaĎaja je opet
jedan dogaĎaj koji čemo označiti A1  A2 pri čemu taj znak znači "i".DogaĎaji koji se meĎusobno
ne isključuju i mogu se istovremeno zbiti nazivamo nezavisnim dogaĎajima.Za dva nezavisna
dogaĎaja A1 i A2 vrijedi relacija

P A  A = P A P A
1 2   1  2
prema tome vjerojatnost istovremenog pojavljivanja i dogaĎaja A1 i A2 jednaka je produktu vjerojatnosti
pojedinih dogaĎaja A1 i A2 ovo je poznati multiplicioni teorem za dva nezavisna dogaĎaja a primjenjuje se
u slučajevima kada se istovremeno može zbiti dogaĎaj A1 i A2 .
14. VJEROJATNOS SLOŽENIH DOGAĐAJA - meĎutim ako se dogaĎaji ne isključuju tako da može
nastupiti ili dogaĎaj A1 ili A2 ili istovremeno oba dogaĎaja tj. i A1 i A2 tada će vjerojatnost takva dogaĎaja
biti P  A1  A2 = P  A1  P  A2  P  A1 P  A2

Pri čemu znak "U" opet ima značenje "ili",ali u ovom slučaju da se može pojaviti ili jedan ili drugi ili oba
dogaĎaja.
Vjerojatnost da će se dogoditi ili dogaĎaj A1 ili A2 ili oba dogaĎaja istovremeno jednaka je zbroju
vjerojatnosti tih dogaĎaja umanjena za produkt njihovih vjerojatnosti.
15. UVJETNA VJEROJATNOST-često puta vjerojatnost nekog dogaĎaja ovisi o tome što znamo o tjeku
pokusa koji se izvodi. Zamislimo neki pokus u kojem se zbivaju dogaĎaji A i B čije su vjerojatnosti P(A) i
P(B).Postavlja se pitanje kolika je vjerojatnost dogaĎaja A,ako znamo da se dogodio dogaĎaj B. Ovu
vjerojatnost označavamo P(A/B) i čitamo P od A ako je B ( vjerojatnost dogaĎaja A,ako se dogodio
dogaĎaj B). B 
P  Ak P  
 Ak   Ak 
P =
B   B 
  P Ai P Ai 
i

Ova formula predstavlja poznati Bayesov teorem.Bayesova formula daje vjerojatnost neke hipoteze ako
znamo da se neki dogaĎaj već dogodio. Ona omogučuje mjenjanje vjerojatnosti nekog ishoda pod
utjecajem novih imformacija. Bayes je bio engleski svećenik koji se bavio problemima vjerojatnosti.

16. PRIKAZIVANJE STATISTIČKIH PODATAKA-jedan od osnovnh pojmova statistike je statistički


skup.Pod statističkim skupom podrazumijevamo skup elemenata koji posjeduju neko zajedničko obilježje
čija se mjerna vrijednost mijenja od elementa do elementa toga skupa.
1 obilježja-1 dimenzionalan skup
2 obilježja-2 dimenzionalan skup
-prema svojstvu obilježja statičke skupove dijelimo na kontinuirane i diskontinuirane.Kod kontinuiranih
skupova dotičbo obilježje koje ćemo označiti sa x,može poprimiti bilo koju vrijednost iz nekog intervala
(a,b).Npr. Imamo podatke da se neka staza može istračati u razmaku od 12 do 18 sekundi budući da ne
postoje valjani razlozi da vrijeme istrčavanja staze ne bi moglo biti bilo koje vrijeme izmeĎu 12 i 18
sekundi tada je vrijeme istrčavanja jedno kontinuirano obilježje.Skup je diskontinuiran ako obilježje x
poprima diskuntinuiran niz vrijednosti,primjerice x1,x2,...npr. ispit iz nekog predmeta i ocijene su samo od
1 do 5 i u ovom primjeru su te ocjene dijunktivnog karaktera jer mogu biti samo od 1 do 5.

17. UREĐIVANJE I GRUPIRANJE PODATAKA-prikupljene podatke treba urediti da pojava koju


želimo istražiti bude što uočljivija.MeĎu najvažnijim metodama ureĎivanja podataka spada metoda
grupiranja.GRUPIRANJE-podataka ostvaruje se tako da se podaci razvrstavaju u razrede.Jedan od načina
grupiranja jest stavljanje istih vrijednosti u jedan razred,što u stvari znači prebrojavanje koliko se puta
pojedina vrijednost javlja u podacima.MeĎutim na ovaj način često se dobije veliki broj razreda pa je
prikladnije u jedan razred stavljati više uzastopnih vrijednosti obilježja x.
18. SREDNJE VRIJEDNOSTI-MJERE CENTRALNE TENDENCIJE-razlikujemo potpune i položajne
srednje vrijednosti. U potpune srednje vrijednosti spadaju: aritmetička sredina,harmonijska sredina,
geometrijska sredina. Značajke potpunih srednjih vrijednosti je ta što se u njihovom izračunavanju uzimaju
sve vrijednosti varijable. Položajne srednje vrijednosti odreĎene su položajem podatka u nizu a tu spadaju
:mod i medijan.
19. ARITMETIČKA SREDINA-je jedna od najvažnijih najčešće korištenih mjera centralne tendencije.U
praksi se često naziva i prosjekom.
SVOJSTVA ARITMETIČKE SREDINE:
1. numerički niz x1,x2,...,xn ima samo jednu aritmetičku sredinu.
2.aritmetička sredina uvijek se nalazi izmeĎu najmanje i najveće vrijednosti niza.
3.aritmetička sredina ima svojstva da je suma svih odstupanja jednaka nuli
4.Zbroj kvadrata odstupanja svih vrijednosti obilježja od aritmetičke sredine je minimalan,tj.
manji od zbroja koje ddruge proizvodnje odabrane vrijednosti
5.Aritmetička sredina nije reprezantativna kada su u nemiričkom nizu ekstremno male i

ekstremno velike vrijednosti nekog obilježja


20. GEOMETRIJSKA SREDINA-računa se samo za numeričke nizove sastavljene od pozitivnih
brojeva.Za negrupiran niz x1,x2,...,xn geometrijska sredina se odreĎuje po formuli :
n
xG = x1 x2 ...xn

Za grupiran niz će biti


n
f1 f2 fk
xG = x1 x2 ...xk

pri čemu xG ima smisla ako su xi>0,za i=1,2,...,k.


Geometrijska sredina obično se koristi kao mjera prosječne brzine promjene nekih pjava u vremenu.
21. MOD- je vrijednost obilježja koja se najčešće javlja u statističkom nizu,odnosno to je vrijednost obilježja
s najvećom frekvencijom
M o = xj ako je fj = max fi 1 i k
Za odreĎivanja moda koristimo formulu
fj  fj  1
Mo = L  ij
fj  fj  1  fj  fj  1
gdje je L donja granica modalnog razreda s najvećom ( korigiranom ) frekvencijom f j dok su fj-1 i fj+1
(korigirane) frekvencije ispred i iza modalnog razreda.Veličina modalnog razreda je ij.Mod je odreĎen
svojim položajem u nizu i na njega ne utječu ni izrazito male ni izrazito velike vrijednosti obilježja,kao što je
slučaj kod aritmetičke sredine.Nedostatak moda je u tome što je osjetljiv na način grupiranja razreda.

22. MEDIJAN- je položajna srednja vrijednost koja po veličini ureĎeni numerički niz dijeli na dva
jednakobrojna dijela.Prema tome odreĎivanje medijana sastoji se u pronalaženju vrijednosti obilježja na
središnjoj poziciji u ureĎenom nizu.Ako je niz x1,x2,...,xn ureĎen po veličini tada je medijan
 n  1
Me = xj n  nep aran j = 
 2 

xj  xj  1
Me = j = n 
n  paran
2  
 2
U slučaju razdiobe frekvencija po razredima tada se za odreĎivanje medijana koristi formula
N n 

  fi 
i
Me = L  
fMED  2
 i1 

gdje je L donja granica medijalnog razreda fMED frekvencija medijalnog razreda,"i" veličina razreda.
Medijalni razred odgovara prvoj kumulativnoj frekvenciji koja uključuje N/2.Sumacija se provodi do
medijalnog razreda  n 

  f1 

i  1 
24. MJERE RASPRŠENJA ( DISPERZIJE ) -pri mjerenju mnogih pjava računa se grupiranje rezultata
oko neke srednje vrijednosti .Kada su vrijednosti nekog niza mjerenja gusto grupirane oko neke srednje
vrijednosti tada ta srednja vrijednost dobro reprezentira rezultate,naprotiv ako grupiranost ima mallu
gustoću tada srednja vrijednost slabo reprezentira rezultate.
Skupovi podataka mogu imati jednake srednje vrijednosti,ali se razlikuju po stupnju raspršenosti
vrijednosti obilježja.Prema tome nije dovoljno poznavati samo srednju vrijednost prikupljupljenih
podataka nego treba poznavati i pokazatelje njihove raspršenosti ( DISPERZIJE).
MeĎu najpoznatije mjere raspršenosti spadaju : raspon varijance, interkvartil i koeficijent kvartilne
devijacije,varijanca te iz nje izvedena standardna devijacija i koeficijent varijance.
25. RASPON VARIJACIJE-je najjednostavnija mjera i predstavlja razliku izmeĎu najveće i
najmanje vrijednosti obilježja u numeričkom nizu dakle
R x = xmax  xmin

Ako je Rx=0 tada nema raspršenja,jer su sve vrijednosti obilježja jednake.

26. INTERKVARTIL I KOEFICIJENT KVARTILNE DEVIJACIJE-budući da je raspon varijacije


grupa mjera raspršenosti,računanje raspona preobliku se tako da uzmemo u obzir samo dio podataka.
Raspon varijacije numeričkog obilježja središnjih pedeset posto članova niza zovemo INTERKVARTIL.

Kvartil su vrijednosti statičkog obilježja koje statistički niz dijele na četri jednaka dijela.Mogu se podijeliti
na:donji kvartil i gornji kvartil. Ia = Q3  Q1

DONJI KVARTIL(Q1)-dijeli ureĎeni niz na dva dijela i to na način da je prva četvrtina,odnosno 25%
članova niza, ima vrijednost obilježja manju od donjeg kvartila.Preostale tri četvrtine odnosno 75% imaju
vrijednosti veće od donjeg kvartila.
GORNJI KVARTIL(Q3)-dijeli ureĎen niz na dva dijela i to na način da prve tri četvrtine ,odnosno 75%
članova niza ima vrijednost obilježja manju od gornjeg kvartila.Preostala posljednja četvrtina,odnosno 25%
imaju vrijednost obilježja veću od gornjeg kvartila.
Ako broj članova niza dijeljiv s brojem četiri bez ostatka,tada je donji kvartil jednak vrijednosti varijable:
n
Q1 = xr 1 r=
gdje je n/4 cijeli dio razlomka. 4
Kada je broj članova niza dijeljiv s brojem četiri bez ostatka,tada je donji kvartil dat izrazom:
xr  x n
r 1 r=
Q1 = 4
2
Ako ureĎeni numeričkog niza ima n članova i ako razlomak 3n/4 nije cijeli broj ,tada je gornji kvartil
jednak vrijednosti varijable:
3n
Q3 = xr r=1
4
gdje je 3n/4 cijeli dio razlomka.
Kada je razlomak 3n/4 cijeli broj tada je gornji kvartil dat izrazom
xr  x 3n
r 1 r=
Q3 = 4
2
U slučaju distribucije frekvencija s razredima vrijednosti kvartila računaju se slično kao kod medijana.
Donji kvartil dat je izrazom

 fi
N

dok je gornji kvartil 4
i
Q1 = L1  i
fkvar

3N
4

 fi
i
Q3 = L1  i
fkv ar
Pri čemu je N zbroj frekvencija L1 donja granica kvartilnog razreda,fkvar frekvencija kvartilnog razreda "i"
je veličina kvartilnog razreda. a Σfi ozačava zbroj frekvencija do kvartilnog razreda.
Donji kvartilni razred je onaj razred čija komulativna frekvencija prvi put obuhvaća vrijednost N/4 odnosno
3N/4 za gornji kvartilni razred.
Uz interkvartil,koji je apsolutna mjera disperzije,može se definirati i koeficijent devijacije,kao relativna
mjera disperzije tj. Q3  Q1
V =
Q 0 V 1 Q
Q3  Q1

Disperzija će biti manja što je koeficijent kvartilne devijacije bliži nuli.Visoke vrijednosti koeficijenta
kvartilne devijacije pokazuju relazivno jaku raspršenost obilježja u nizu.
27. VARIJANCA I STANDARDNA DEVIJACIJA-varijanca je najvažnija mjera raspršenja vrijednosti
kvantitativne varijable.Do varijance dolazimo kvadriranjem pojedinačkih razlika vrijednosti obilježja od
aritmetičke sredine.Kvadriranje se provodi kako bi se izbjegle negativne vrijednosti.Prema tome varijanca
je aritmetička sredina kvadrata odstupanja vrjednosti numeričke varijable od njezine aritmetičke sredine.Za
negrupiran niz data je izrazom
1
 xi  xsr 
2 2
 =
N
dok je za grupiran niz :
2 1
 = fi xi  xsr 
2
pri čemu je xi razredna sredina. N
STANDARDNA DEVIJACIJA-je apsolutna mjera raspršenja i predstavlja prosječno odstupanje
vrijednosti numeričke varijable od aritmetičke sredine.Iskazuje se u istoj dimenziji kao i obilježje.
 2  2
 =   fi xi   x 
i

28. MOMENTI-su parametri koji se računaju kao presjeci zbroja odstupanja numeričke varijable od
odabrane vrijednosti dignut na neku potenciju.
Razlikujemo centralne i pomoćne momente.Slično kao što se definira varijanca,može se definirati centralni
moment r-tog reda (r=0,1,2...) za grupiran niz bit će

1
fi  xi  xsr 
r
Mr =
kada je r=0 dobivamo Mo=1 N

dok je r=1 dobivamo M1=0.


Ova dva momenta su konstantne veličine i oni ne daju nikakvu informaciju o svojstvima same
distribucije.Za r=2 centralni moment jednak je varijanci i pokazuje rasprostiranje numeričke varijable oko
aritmetičke sredije tj. M2=σ2 . Momenti M3 i M4 služe za definiranje koeficijenta asimetrije α3 i
koeficijenta spljoštenosti α4.Pored centralnog momenta definiramo i pomoćne momente koje
izračunavamo oko nule ili neke druge vrijednosti ( parametar koji ima ulogu provizorne sredine ).

29. KOEFICIJENT ASIMETRIJE I KOEFICIJENT SPLJOŠTENOSTI-asimetriju nekog niza


najčešće mijerimo pomoću koeficijenta asimetrije (mogući su i drugi pokazatelji,kao što su Piersonova
mjera asimetrije ili Bowleyeva mjera simetrije). Koeficijent asimetrije je neimenovani broj definiran
izrazom
M3
3 =
3

Za simetrične distribucije koeficijent asimetrije jednak je nuli (α3=0), što je rijedak slučaj u praksi.Većina
razdioba koje se u praksi javljaju imaju svojstvo da im je asimetrija veća što je koeficijent asimetrije veći.
Koeficijent asimetrije obično se kreće u intervalu od -2 do +2 kod izrazito asimetričnog rasporeda
koeficijent α3 izlazi izvan navedenog intervala.
KOEFICIJENT SPLJOŠTENOSTI- mjeri zaobljenost krivulje numeričkog niza, definira se izrazom
M4
4 =
4

Koeficijent α4 je karakteristika distribucije frekvencija i pokazuje kakva je zaobljenost vrha razdiobe
promatranog skupa u odnosu na normalnu razdiobu za koju je α4=3.Ako je α4,onda je pripadna razdioba
siljastija od normalne razdiobe,dok je α4<3 pripadna razdioba spljoštenija od normalne razdiobe.

30. SLUČAJNE VARIJABLE-DISKONTRINUIRANA SLUČAJNA VARIJABLA-Diskuntinuirana ili


diskrena slučajna jest takva x1,x2,... tako da svaka od njih ima odreĎenu vrijednost p(x1),p(x2)...
Suma svih vjerojatnosti jednaka je jedinici tj Σp(xi)=1. Skup svih vrijednosti slučajne varijable i pripadajućih
vjerojatnosti čini razdiobu ili distribuciju slučajne varijable {x i,p(xi)}, i=1,2,...
Dakle svakoj vrijednosti varijable xi pripada vjerojatnosti p(xi).Zakon po kome se to ostvaruje naziva se
zakon razdiobe ili funkcija vjerojatnosti.Funkcija distribucije slučajne varijable x, zadana je formulom
 
F xo =   
p xi

 xi xo
i pokazuje vjerojatnost da slučajna varijabla x poprimi bilo koju vrijednost manju ili jednaku xo.

31. OČEKIVANJE DISKONTINUIRANE SLUČAJNE VARIJABLE-pod očekivanjem E(x) slučajne


varijable podrazumijevamo sumu produkata vrijednosti varijable i pripadnih vjerojatnosti tj.
E(x)=Σxi*p(xi)
uz uvijet da red na desnoj strani konvergira apsolutno.
Ako ovaj uvijet nije zadovoljen tada kažemo da varijabla x nema konačnog očekivanja.
Aritmetička sredina u teoriji empiričkih distribucija izraženoj preko relativnih frekvencija
xsr=Σfri*xi
odgovara očekivanje E(x) u teoriji slučajnih varijabli.Ako je zadana slučajna varijabla x ,tada možemo
izgraditi novu varijablu ax+b koja je takoĎer slučajna varijabla, pri čemu su a i b realne konstante.
Očekivanje nove varijable E(ax+b) možemo odrediti preko E(x) na sljedeći način:
E(ax+b)=a*E(x)+b
za slučaj b=0 imamo
E(ax)=a*E(x)
32. VARIJANCA DISKONTINUIRANE SLUČAJNE VARIJABLE-momente drugoga reda naziva se
varijanca slučajne varijable x  2  2
M2 = V( x) = E( x  )  =
  xi   p xi =  
r

i
dok je  = V( x) standarna devijacija slučajne varijable x.
Kvadriranjem binoma (x-μ)2 i kratkim sreĎivanjem imamo
V(x)=Σxi2*p(xi)-μ2
Dobili smo relaciju koja je analogna relaciji za varijancu u empiričkim distribucijama.
33. MOMENTI DISKONTINUIRANE SLUČAJNE VARIJABLE-kao što smo memente koristili u
empiričkim distribucijama iz istih razloga koristi ćemo ih i u teoriji slučajnih varijabli.Centralnim
momentom r-tog reda diskontinuirane slučajne varijable x predstavlja očekivanje varijable (x-μ)r tj.

Mr = E ) r   xi   p xi


r
( x  =
i gdje je μ=E(x).

Pomoćni moment r-tog reda bit će očekivanje slučajne varijable xr odnosno:


mr = E x  = xi p xi
r r

Centralni moment možemo odrediti preko pomoćnih momenata,koristeći relaciju:


n
 k r  k
Mr =
  1  k  mr k m1 
k0

U specijalnim slučaju za r=2 dobivamo M2=m2-m12 što odgovara relaciji V(x)=E(x2)-μ2.


Koeficijenti asimetrije i koeficijent spljoštenosti u teoriji slučajnih varijabli,definirat ćemo na isti način
kao i kod empiričkih distribucija tj. M3 M4
3 = 3 =
3 4

Značenje i uloga ovih koeficijenata ista je kao i kod empiričkih distribucija.

34. BINOMNA RAZDIOBA-pretpostavimo neki slučajni pokus kojhi se u idealnim uvijetima ponavlja n
puta.Ako se u tom pokusu dogaĎaj A pojavljuje s konstantnom vrijednošću p,tada će vjerojatnost da dogaĎaj
A ne nastupi biti q=1-p.Primjer ovakvog pokusa imamo kod bacanja novčića.Sad se postavlja pitanje kolika
je vjerojatnost da se u n pokusa dogaĎaj A pojavi x puta.
Vjerojatnost da dogaĎaj A nastupi x puta u n pokusa,jednaka je vjerojatnosti da se u nizu na x mjesta pojav
dogaĎaj A ,a na preostali n-x mjesta dogaĎaj A povlaka (non A).Prema zakonu o množenju vjerojatnosti
nezavisnih dogaĎaja ta vjerojatnost je pxqn-x.
Budući da imamo (x povrh n ) kombinacija koje imaju istu vjerojatnost dobit ćemo
 n  x nx
P( x) =   p q
x
Dobili smo formulu koja odreĎuje vjerojatnost da u seriji od n pokusa dogaĎaj A nastupi x puta.
Skup svih parova{x,P(x)} x=1,2,...,n čini BINOMNU RAZDIOBU.
Binomna razdioba odreĎena je parametrima n i p, pa se može kratko označiti B{n,p}.
Prikladnija formula za odreĎivanje binomnih koeficijenata za veće vrijednosti od x i n je rekurzivna formula:
 p x  1
nx 1 p
P( x) =
x q

35. KARAKTERISTIČNE VELIČINE BINOMNE RAZDIOBE- slučajnoj varijabli x binomne razdiobe


pripada Očekivanje E(x)=np
i varijanca slučajne varijable x σ2=npq
36. POISSONOVA RAZDIOBA-do Poissonove razdiobe možemo doći ako krenemo od binomne razdiobe
i pretpostavimo da se radi o rjetkim dogaĎajima,tako da je vjerojatnost p vrlo mala.IzvoĎenjem vrlo velikog
broja pokusa možemo uzeti da će produkt np biti konstantan.Pokazat ćemo da je Poissonova razdioba
granični slučaj binomne razdiobe kada n teži u beskonačno i p teži u nulu,jer u tom slučaju može biti
np=const. pa smo prema tome zakonu vjerojatnosti Poissonove razdiobe dobili :
x
m m
P ( x) = e
x
Ovdje isto imamo rekurzivnu formulu koja glasi :
p( x) =
m

p x  1
x
Očekivanje kod Poissonove razdiobe bit će E(x)=m , a Varijanca σ 2=m , dok su koeficijent asimetrje
i spljoštenosti
1 1
3 = 4 = 3 
m m
37. ČEBIŠELJEV TEOREM-Vjerojatnost da slučajna varijabla x poprimi vrijednost izvan intervala
(μ-ε,μ+ε),za proizvoljno ε>0 manja je ili jednaka σ 2/ε2
2

P( x    ) 
2

38. BERNOULLIJEV ZAKON VELIKIH BROJEVA-Neka je izvedeno n nezavisnih pkusa i neka se u
svakome od njih dogaĎah A pojavljuje se s vjerojatnošću p. Ako slučajna varijabla x poprima vrijednosti
jednake broju nastupanja dogaĎaja A u n pokusa ,tada vrijedi

lim P  p  
x
  =0
 n 
x
Za velik broj pokusa i za proizvoljni ε>0, vjerojatnost da razlika p bude veća od ε, je
n
isčezavajuće mala.
Bernoullijev teorem možemo jednostavnije intepretirati riječima:što se više pokusa izvodi,skoro je sigurno
da će relativna frekvencija f = x biti bliža stvarnoj vjerojatnosti p dogaĎaja A.
rn n
Slučajna varijabla ima binomnu razdiobu pa će očekivanje i varijanca biti
E
  = E( x) =
x 1 np
=p
  n
n n

= V
2 x 1 npq pq
   = V( x) = =
 n 2 2 n
n n

Primjenom teorema Čebiševa imamo:


v
 x 

P
x  x
 E 

  
 n
 n  n  2

odnosno:

P
x
 p   
 pq
 n  2
n

Ako sada potražimo limes kada n teži u beskonačno desna strana teži nuli pa će težiti i lijeva odnosno:

lim P  p  
x
  =0
 n 

39. KONTINUIRANE SLUČAJNE VARIJABLE-kod diskretnih slučajnih varijabli područje vrijednosti


bio je diskontinuiran niz točaka na brojnom pravcu.
Područje vrijednosti kontinuirane varijable bit će čitav interval,ponekad u granicama (-besk.do+besk.)
Za slučajnu varijablu x kažemo da je kontinuirana (neprekinuta) ako postoji funkcija f(x) sa sljedećim
svojstvima
f ( x)  0 x R
besk



f ( x) dx = 1
 besk

Ako je područje vrijednosti varijable x interval (a,b) onda uzimamo da je f(x)=0 za sve vrijednosti izvan
tog intervala,pa relacija 2 poprima oblik
b

 f ( x) dx = 1

a
Iz prvog svojstva funkcije f(x) proizlazi da vjerojatnost ne može biti negativan broj,dok se drugim uvjetom
zahtjeva da vjerojatnost sigurnong dogaĎaja bude jednaka jedinici.
Funkcija f(x) odreĎuje vjerojatnost koja pripada svakom intervalu (x1,x2) dok je f(x)dx element
vjerojatnosti i predstavlja vjerojatnost da slučajna varijabla primi vrijednost iz intervala (x,x+dx)
Funkcija distribucije slučajne varijable bit će x

F ( x) =  f ( x) dx
 besk

pri čemu f(x)nazivamo funkcijom gustoće vjerojatnosti.


Funkcija f(x) ima značenje vjerojatnosti da slučajna varijabla poprimi bilo koju vrijednost koja je manja ili
jednaka x i može se predstaviti površinom ispod krivulje do točke x (grafička interpretecaija.)
Ako je poznata funkcija distribucije F(x) onda se jednostavnim postupkom deriviranja dobiva funkcija
gustoće vjerojatnosti f(x) odnosno dF( x)
f ( x) =
dx
Za svaki interval (x1,x2) možemo izraziti vjerojatnost P(x1<x<x2) preko funkcije F(x) pa je
x
 2

P x1  x  x2 = 


x
f ( x) dx = F x2  F x1    
1

40. NORMALNA RAZDIOBA-je najvažnija kontinuirana razdioba koju koristimo u atematičkoj


statistici.Poznata je još pod imenom kao GAUSSOVA RAZDIOBA,prema njemačkom matematičaru
K.F.Gaussu (1777.-1855.). Normalna razdioba ima veliku važnost i primjenu u razim područjima,jer se
velik broj drugih razdioba može aproksimitirati ovom razdiobom.
Za kontinuiranu slučajnu varijablu x kažemo da ima normalnu ili Gaussovu razdiobu ako je područje
njenih vrijednosti (-besk. do +besk.) s funkcijom vjerojatnosti
2
1 x 

1 2   
f ( x) = e
 2
Graf funkcije f(x) naziva se normalna ili Gaussova krivulja.
Gaussova krivulja je osno simetrična u odnosu na pravac x=μ na kojem se nalazi i tjeme krivulje s
maksimalnom vrijednošću 1
F( ) =
 2
Gaussova krivulja ima točke infleksije za vrijednosti apscise x=μ+-σ.
ProvoĎenjem računa pokazuje se da normalna razdioba ima očekivanje E(x)=μ i varijancu V(x)=σ 2,pa se
za ovu razdiobu koristi kraća oznaka N(μ,σ2).Za svaku razdiobu dobiva se da je koeficijent asimetrije α3=0
i koeficijent spljoštenosti α4=3
Zamjenom x
u=

dobivamo 1 2
u
1 2 1
f ( x) = e = ( u)
 2 2

gdje je 1 2
u
1 2
( u) = e
2

Funkcija vjerojatnosti jedinične ili standardne normalne razdiobe za koju je μ=0 i σ=1 tj. N(0,1) čije su
vrijednosti tabelirane.Vjerojatnost P(x1<x<x2) da varijabla x normalne razdiobe N(μ,σ2) poprimi neku
vrijednost iz intervala (x1,x2) bit će: x
 2 1
  x 

1  2   

P x1  x  x2 =   e dx
 2 x
1
uvoĎenjem već korištene zamjene x 
u=

dobivamo u
 2 1
 u
2
1 
 
2
P x1  x  x2 =  e du
2 u
1
pri čemu je
x1   x2  
u1 = u2 =
 
ako uzmemo da je x1=μ,tada je u1=0 pa će biti
u
 2 1
 u
2
1 
 
P u2 = P    x  x2 = 

e
2
du
2 0
Vjerojatnost P(u2) za različite vrijednosti u2 nalaze se u tablicama i pomoću njih moguće je odrediti
svaku drugu vjerojatnost pri normalnoj razdiobi.
41. GAMA RAZDIOBA-prije razmatranja gama razdiobe potrebo je nešto reći o gama funkciji koja je
sastavni dio ove razdiobe.Pod gama funkcijom Γ(n) podrazumijevamo funkciju definiranu izrazom
 besk
 n 1  x
( n) =  x e dx gdje je n pozitivan broj.

0

Za gama funkciju vrijedi rekurzivna relacija


Γ(n)=(n-1)*Γ(n-1), n>1
Ako uzmemo da je n cijeli pozitivan broj tada uzastopnim primjenama navedene formule dobivamo da je
Γ(n)=(n-1)!
Varijabla x ima gama razdiobu kada je područje njenih vrijednosti interval (0,+besk.) a funkcija
vjerojatnosti zadana je izrazom k 2  x
2 2
f ( x) = Ck x e
pri čemu je 1
Ck =
k

2  
2 k
 2
Parametar k je prirodni broj koji jednoznačno odreĎuje gama razdiobu i naziva se stupnjem slobode
razdiobe.Očekivanje i varijanca varijable x pri gama razdiobi su
E(x)=k V(x)=2*k
Koeficijent asimetrije je veći od nule (α3>0),što znači da je razdioba pozitivno asimetrična.MeĎutim
,pokazuje se da α3 teži nuli kada k teži u beskonačno.
Ako varijabla x ima normalnu razdiobu N(μ,σ2) tada varijabla
2
V=
 x   
  
zadovoljava gama razdiobu sa stupnjem slobode k=1.
Iz formule 1
v
12 2
e
1 2
g( v) = v
1
2
2
vidimo da je g(v),za k =1,funkcija vjerojatnosti gama razdiobe.
Za nezavisne normalne varijable x1,x2,...,xn koje imaju jednaka očekivanja i jednake varijance
tj.
E(xn)=μ
V(xn)=σ2
može se pokazati da varijabla n  x   2
2
 =  
i
  
i 1

ima gama razdiobu sa stupnjem slobode k=n.


Za nezavisne varijable x1,x2,...,xn koje imaju
E(x1)=E(x2)=...=E(xn)
V(x1)=V(x2)=...=V(xn)=σ2
može se takoĎer pokazati da varijabla
n  x  x 2
2
 =  
i sr
  
i 1

n
ima gama razdiobu sa stupnjem slobode k=n-1 pri čemu je
 xi

i 1
xsr =
n

42. TEORIJA UZORKA-ODABIR UZORKA-vidjeli smo da se pomoću uzorka mogu dobiti procjene
pojedinih parametara osnovnog skupa.
Sada se postavlja pitanje koliko su te procjene pouzdane ?
Odnosno sa kojom sigurnušću možemo rezultate dobivene na uzorku proširiti na čitav osnovni skup.
Da bi se to utvrdilo razvijeni su postupci koji se u praksi nazivaju testovi.
IzvoĎenjem testiranja proizvoda tako da se iz osnovnog skupa izabere slučajni uzorak iz kojeg se računa
karakteristika koju želimo testirati.
Pretpostavimo li da je neki parametar osnovnog skupa najčešći aritmetička sredina jednaka odreĎenoj
hipotetičkoj vrijednosti.Slučajni uzorak dobiva se metodom slučajnog odabira elemenata iz osnovnog
skupa,pri čemu se slučajnost osigurava korištenjem objektivnih metoda odabira elemenata osnovnog skupa
treba imati jednaku vjerojatnost izbora u uzorku.To se postiže slučajnim izborom ,a jedna od metoda je
korištenje tablice slučajnih brojeva.Ako su elementi podjednako rasporeĎeni u osnovnom skupu tada se izbor
uzorka može postići uzimanjem svakog k-tog elementa (npr. svaki peti,deseti,stoti i sl. )

43. ARITMETIČKA SREDINA I VARIJANCA UZORAKA- Ako naš osnovni skup ima N elemenata
tj. x1,x2,...,xn tada je aritmetička sredina skupa
x  x  ....  x 1 2 n
xsr =
N

Ako iz osnovnog skupa izaberemo uzorke od n elemenata tada će ukupni broj uzorka biti
N  N
 =
 
n n ( N  n)

jer je to broj mogućih kombinacija bez ponavljanja elemenata skupa.


Aritmetička sredina k-tog uzorka bit će : x x  ....  x
k  1 k  2 k  n
xk =
n

Prema tome za svaki od mogućih uzoraka možemo odrediti njegovu aritmetičku sredinu. Izračunate
aritmetičke sredine činit će jednu novu raspodjelu koju nazivamo raspodjelom aritmetičkih sredina uzoraka.
Varijanca k-tog uzorka : n
k =    xk  i  xk
2 1 2 n
sk = k 
n n1
i1
Procijena standardne devijacije osnovnog skupa(sk),koja se još naziva i standardna greška bit će
44. PROCIJENE-NEPRISTRANA PROCIJENA-ako slučajna varijabla t(x1,x2,...xn) ima svojstvo da se
njene vrijednosti gomilaju oko neke stvarne vrijednosti parametra Θ u tom slučaju možemo imati
nepristranu procjenu.Za varijablu t(x1,x2,...xn) kaže se da nepristrano procjenjuje parametar Θ ako je
očekivanje E(t) upravo jednako parametru Θ tj. E(t) = Θ.
Tako npr. aritmetička sredina slučajnog uzorka nepristrano procijenjuje očekivanje μ varijable x osnovnog
skupa.
45. INTERVALNE PROCIJENE-intervalna procijena parametra Θ svodi se na odreĎivanje intervala
(a1,a2) za koji se s odreĎenom vjerojatnošću γ može tvrditi da sadrži parametar Θ tj.
P(a1<Θ<a2)=γ
Vjerojatnost γ nazivamo pouzdanost procijene,dok je dužina intervala (a 1,a2) preciznost procijene.

46. TESTIRANJE HIPOTEZE svodi se na procjenu da li je razlika izmeĎu hipotetičke vrijednosti i rezultata
uzorka zančajna ili slučajna.Ta se procjena može vršiti uz vjerojatnost od 95% ili 99% odnosno na razini 5% ili
1% signifikantnosti testa.

47. χ2-TEST -Hi-kvadrat test se redovito koristi kada želimo utvrditi da li neke opažane frekvencije
odstupaju od frekvencija dobivenih na osnovi postavljene hipoteze.Razmotrit ćemo skup empiričkih
podataka varijable x,koji su grupirani u n razreda,tako da svakom razredu možemo pridružiti dvije
frekvencije,empiričku fi i teoretsku fti.Budući da se empiričke i teorijske frekvencije u potpunosti ne
podudaraju postavlja se pitanje da li se varijabla x na koju se odnose podaci,pokorava nekoj teorijskoj
razdiobi.
Odgovor na ovo pitanje dobivamo pomoću teorema K.Persona, po kojem se izračunava hi-kvadrat, a on
glasi :
2
n  fi  fti  2
 =  fti
i1

gdje je fi emprička frekvencija,dok je fti teorijska frekvencija.


Hi-kvadrat je veličina koja se približno distribuira po zakonu gama razdiobe s odreĎenim stupnjem
slobode.
Broj stupnjeva slobode dat je izrazom k=n-r-1 pri čemu je n broj razreda,a r broj parametara koji odreĎuju
prilagoĎenu razdiobu.
Ako su teoretske frekvencije manje od pet (fti<5) za početne ili psljednje razreda,onda treba izvršiti
spajanja razreda,pa je u tom slučaju n broj pregrupiranih razreda.

n 2 m 2
Prema tome broj stupnjeva slobode k ovisi o broju razreda n i o razdiobi koju smo prilagodili pa je kod
normalne razdiobe k=n-3
binomne razdiobe k=n-2
Poissonove razdiobe k=n-2
Za broj stupnjeva slobode od k=1 do k=30 izraĎene su tablice iz kojih mogu očitati pripadajuće vrijednosti.
Ako su empirički podaci svrstani u tablicu,tada se broj stupnjeva slobode računa prema formuli
k=(n-1)(m-1)
gdje je n broj redaka,a n broj stupaca tablice.
Što su razlike izmeĎu empiričkih i teorijskih frekvencija manje to će i hi-kvadrat biti manji,pa će istinitost
postavljene hipoteze biti veća.
Ako je hi-kvadrat jednak nuli tada imamo potpuno slaganje izmeĎu empiričkih i teorijskih frekvencija ,što
je rijedak slučaj u praksi.
Po dogovoru uzeto da je hi-kvadrat prevelik ako pada izvan područja kojem pripada vjerojatnost 0.95 pa
se kaže da je hi-kvadrat signifikantan.
Testirano hipoteza se prihvaća ako je P(χ2)>0.05 a odbacuje ako je P(χ2)<0.05.Prema tome područje
prihvačanja hipoteze je P(χ2)>0.05 ili χ2<χo2.Navedeni postupak provodi se na isti način i kod testiranja
hipoteze od 1% signifikantnosti.
48. STUDENTOVA T-RAZDIOBA I T-TEST-do ovog testa došao je W.S.Goset u radu koji je pod
pseudinimom Student objavljeno 1908.godine.Kao što se hi-kvadratni test bazira na gama razdiobi tako se i
ovaj test bazira na t-razdiobi,koja se još naziva i Studentova t-razdioba.
Slučajna varijabla t u ovoj razdiobi ima područje vrijednosti intervala (-besk.,+besk.) i funkciju
vjerojatnosti
k 1
2
 2
f ( t) = C( k)  1 
t 
gdje je  k

 k  1
 
C( k) =
 2 
2  
k
 2
Razdioba je jednoznačno odreĎena parametrom k koji se naziva stupanj slobode.To je prirodni broj
odreĎen izrazom k=n-1 pri čemu je n broj elemenata skupa n kojem je varijabla t distribuirana po zakonu
t-razdiobe.Pored toga t-razdioba ima sljedeće karakteristike
k
E( t) = 0 V( t) = k 2 3 = 0 4 = 3
k 2

Formula za t distribuciju je xsr  o


t= n n
1
  xi  xsr 
s 2 2
s = 
n 1
iz te formule je s procjena koju računamo po formuli i1

You might also like