You are on page 1of 28

Glava 4: U V O D U O P T U I MATEMATIKU STATISTIKU

4.1. Poeci, razvoj, znaaj i definicija statistike

Pri izuavanju Teorije vjerovatnoe upoznali smo se sa nekim pojmovima koje


prouava ili na kojima se zasniva statistika. Oslanjajui se na ve izneeni razvijeni aparat
teorije vjerovatnoe (TVJ), koja, inae, predstavlja matematiku strukturu na kojoj su
zasnovane statistike metode, u ovom poglavlju date su osnove statistike u mjeri koja je
neophodna za primjenu statistike u tehnikim naukama, posebno u saobraaju,
komunikacijama i informatici, ali i koja je neophodna za logiki tok daljeg dubljeg izuavanja
i odgovarajuih primjena.
Rije statistika potie od latinske rijei status to znai stanje, drava, ... . Kao nauka
pojavljuje se u XVII vijeku, mada neki korijeni statistikih metoda potiu jo iz vremena
najstarijih civilizacija. Smatra se da je rije statistika prvi upotrijebio naunik Gotfrid
Ahenval (Gottfried Achenwall, 1719-1772), unosei ovaj naziv u svoje radove i u naziv
jednog predmeta (pod nazivom Notitia politica vulgo statistica) na njemakom univerzitetu
u Getingenu. Dok je u Njemakoj i ostalim razvijenim zemljama kontinentalne Evrope razvoj
statistike djelatnosti bio pod snanim uticajem osnivaa univerzitetske kole-dravopisa,
dotle se u Engleskoj razvio drugi pravac, tzv. Politika aritmetika koja svoje teorijske osnove
ima u racionalnoj filozofiji Leonarda da Vinija, Dekarta i dr. Osniva ove kole bio je Don
Graunt (John Graunt, 1602-1674), dok je osniva pravca univerzitetska statistika bio prof.
Hermann Conring (1606-1671) / profesor istraivaa Gotfrida /.
U XIX vijeku statistika se znatno razvila po sadrini i metodama, naroito koritenjem
rauna vjerovatnoe. Prve takve radove nalazimo kod Laplasa (Pierre Simon de Laplace) i
(Jean Baptiste Joseph) Fouriera poetkom XIX vijeka, kada su u Parizu i departmanima
Sene vrili procjenu broja ukupnog stanovnitva na bazi uzorka sa izraunavanjem
najvjerovatnije greke.
Meutim, najznaajnije ime u razvoju statistike XIX vijeka je belgijski fiziar i
astronom (Lambert Adolphe Jacob) Ketle (Quetelet, 1796-1874), na iju je inicijativu odran
i kongres statistiara u Briselu (Brussels, Belgique-Belgium) 1853. godine, a zatim jo est
kongresa u zemljama srednje Evrope. Kao to je XX vijek postao vijek tehnike i hemije, a isto
tako je to i vijek statistike koja proima sav na ivot, jer se danas statistike metode koriste u
raznim istraivanjima (u fizici, tehnici, socioloko-politikim istraivanjima, ekonomiji itd.).
Od kraja XIX vijeka na ovamo statistika se naglo razvija i kao nauka i kao djelatnost-praksa.
Poetkom ovog vijeka javljaju se razliite metrije (biometrija, ekonometrija,
sociometrija, ...), a sredinom ovog vijeka javljaju se i neke bliske discipline kao to su:
kibernetika, teorija informacija, teorija veza i sl. Javlja se kao posebna disciplina i
matematika statistika, koja je oznaila upotpunjavanje i dalje razvijanje teorije i
metodologije kvantitativnog istraivanja masovnih pojava. U mnogim knjigama nalaze se
razni pokuaji definiranja statistike. Tako npr., Silvio Elazar (u knjizi: Matematika statistika)
daje ovu definiciju: Matematika statistika je nauka koja se bavi prouavanjem zakona
sluajnih dogaaja na osnovu teorije vjerovatnoe, matematikom obradom podataka
mjerenja masovnih pojava., dok neki drugi autori daju i ovu definiciju: Nauka koja
prouava pojave koje obuhvataju vrlo veliki broj elemenata koji imaju neko zajedniko
svojstvo (obiljeje) naziva se matematika statistika. Matematika statistika javlja se u
XVIII vijeku, prvenstveno u radovima D. Bernoullija i fiziara Maxwella.
No, savremena uenja u XX vijeku mogla bi se izrei po pitanju definiranja statistike
kao naune discipline u smislu da se usvoji ova (opisna) definicija: Statistika je nauka o
varijacijama obiljeja, zakonitostima razvoja i odnosa masovnih pojava i njihovih elemenata u
2

vremenu i prostoru. (U vezi sa gore navedenim definicijama i u vezi sa osnovnim pojmovima


opte i ekonomske statistike moe se nai u knjizi: Dr. Milo Blai, Opta statistika,
Sarvremena administracija, Beograd, 1982.)
Statistike metode istraivanja primjenjuju se na gotovo sva podruja ljudske
djelatnosti, gdje god se javlja veliki broj posmatranja, eksperimentisanja i mjerenja (kao npr.,
pri izuavanju problema dohotka-profita, nataliteta, mortaliteta, te raznih mjerenja u fizici,
hemiji, tehnici, ...).
U statistici se prvo prikupe podaci o pojavama koje se istrauju pomou opaanja,
anketa, popisa i dr., pa se ti podaci obrauju i izvode odreeni zakljuci i prognoze.

4.2. Predmet i zadaci matematike statistike. Osnovni skup i obiljeje

U okviru matematike statistike kao matematike discipline razvijaju se i primjenjuju


metode izuavanja (dobivanja, opisivanja i obrade) statistikih podataka s ciljem
ustanovljavanja zakonitosti koje vae u odreenim sluajnim masovnim pojavama i
procesima masovnog karaktera. Pri tome se razlikuju sljedea dva osnovna problema:
1) Razvoj metoda prikupljanja i grupisanja statistikih podataka koji se istrauju
(dobijenih ili pomou zapaanja odnosno na osnovu posmatranja ili kao rezultat
specijalno izvedenih pokusa kao to su ankete, popisi, mjerenja i sl.).
2) Razrada i razvoj metoda analize statistikih podataka u zavisnosti od cilja istraivanja.

U okviru problema pod 2) mogu se identifikovati dvije grupe metoda:


a) Metode za ocjenu funkcije distribucije i parametara distribucije (raspodjele,
razdiobe). Npr., na osnovu odreenih statistikih podataka moe se ocijeniti da oni pripadaju
normalnoj (ili binomnoj) raspodjeli, a zatim se mogu odrediti i parametri (oekivanje) i
(standardna devijacija) te distribucije.
b) Metode za provjeru (testiranje) tzv. statistikih hipoteza o obliku (vrsti) zakona
distribucije ili ako je oblik zakona distribucije poznat, o parametrima zakona distribucije.
Npr., moe se provjeriti da je pretpostavka o normalnoj distribuciji ispravna ili pogrena.
Osnovni predmet razmatranja u statistici su skupovi elemenata koji imaju izvjesne
zajednike karakteristike. Pri tome se, intuitivno, pojam osnovnog skupa najee uvodi na
jedan od sljedeih (priblino) ekvivalentnih naina:
(i) Osnovni skup (populacija, generalni skup, statistiki skup, statistika masa) je skup
(cjelina) svih istorodnih elemenata (objekata) koji podlijeu (statistikom) ispitivanju.
(ii) Skup elemenata sa nekom zajednikom osobinom ija mjera vrijednosti varira od
elementa do elementa zove se statistiki (ili osnovni skup i sl.).
(iii) Statistiki skup predstavlja cjelinu sastavljenu od istorodnih meusobno uporedivih
elemenata sa zajednikim varijabilnim obiljejem to je u stvari tekua varijabla (npr. xi )
sluajne promjenljive (npr. X ).
(iv) Skupovi elemenata koje prouava statistika zovu se osnovni skupovi (ili populacije
i sl.).
U definicijama (i), (ii) i (iv) definira se jo i pojam obiljeja, tj. kae se jo da se
zajedniko svojstvo elemenata odreenog osnovnog skupa zove obiljeje tog skupa. Obiljeje
moe biti numerikog ali i atributivnog karaktera. No, obiljeja atributivnog karaktera mogu
se svesti na obiljeja numerikog karaktera.
Iz prethodnih definicija slijedi da osnovni skup mora biti homogen, tj., sastavljen od
istovrsnih i meusobno uporedivih elemenata u odnosu na tekuu varijablu ( xi ) sluajne
veliine ( X ) zajednikog obiljeja, te mora biti i varijabilan, tj. elementi osnovnog skupa
3

moraju biti istovrsni ali ne i istovjetni u odnosu na zajedniko svojstvo (obiljeje) koje
karakterie skup istovrsnih objekata. Ako je na osnovnom skupu definirano samo jedno
obiljeje, skup je jednodimenzionalan. Ako su definirana dva obiljeja, skup je
dvodimenzionalan. Zavisno od toga da li je obiljeje skupa kontinualno (neprekidno),
diskretno ili mjeovitog tipa, razlikuju se kontinualni, diskretni i mjeovitog tipa statistiki
skup.
Definicija 4.2.1. Obimom osnovnog skupa nazivamo broj njegovih elemenata
(objekata) u sluaju da je skup konaan, odnosno obim je kardinalni broj (mo skupa) u
sluaju beskonanog skupa.
Posmatrajmo osnovni skup (obima N ) kod kojeg se vrijednost x1 posmatra ili uzima
u razmatranje n1 ( = f1 ) puta, vrijednost x2 , n2 ( = f 2 ) puta, ... , vrijednost xk , nk ( = f k ) puta,
pri emu je
k

n = N
i =1
i (1) .
Posmatrane vrijednosti xi (i = 1, k ) nazivaju se varijantama (varijansama), a niz
varijansi napisan u rastuem poretku zove se varijacioni red osnovnog skupa. Brojevi
ni ( = fi ) zovu se uestanostima (frekvencijama) odnosno apsolutnim frekvencijama, a
njihov odnos prema obimu osnovnog skupa N se zove relativna frekvencija (relativna
uestanost) i oznaava se esto sa i ( ili pi ) , tj.

i =
ni
N
(
, i = 1, k .) ( 2) .

Definicija 4.2.2. Skup (ureenih) parova {( x , f ) , ( x , f ) ,


1 1 2 2 , ( xn , f n ) , }
vrijednosti xi i njihovih frekvencija fi obiljeja X , ureen po rastuim vrijednostima
x1 , , xn obiljeja X , zove se distribucija ili raspodjela (statistika raspodjela)
frekvencija obiljeja X osnovnog skupa.

Dakle, statistika raspodjela frekvencija (odnosno relativnih frekvencija) je


pridruivanje (preslikavanje) izmeu vrijednosti obiljeja (varijansi) i njihovih frekvencija
(odnosno relativnih frekvencija). Takoe se uvodi i pojam statistike raspodjele osnovnog
skupa kao zajedniki naziv za statistiku raspodjelu relativnih frekvencija i statistiku
raspodjelu apsolutnih frekvencija, tj. statistika raspodjela osnovnog skupa je pridruivanje
izmeu vrijednosti obiljeja (varijansi) i njihovih frekvencija ili relativnih frekvencija.
Najee se statistika raspodjela prikazuje tabelarno a ponekad i grafiki. Tabela je obino u
obliku:

x x1 x2 ... xk
f f1 f2 ... fk

Pri tome su vrijednosti x1 , , xk uzete u rastuem poretku a osnovni skup je konaan.


Meutim, grafiki se statistika raspodjela prikazuje analogno kao i zakon raspodjele
vjerovatnoe u Teoriji vjerovatnoe pomou poligona, histograma i dr. Naime izlomljena
linija koja povezuje ureene parove ( xi , f i ) (odnosno (xi , i ) zove se poligon frekvencija
4

(odnosno, poligon relativnih frekvencija). Obino se pod histogramom frekvencija


(relativnih frekvencija) podrazumijeva unija pravougaonika ije osnovice na osi apscisa x
imaju mjerni broj duine 1, a takoe su sredita osnovica vrijednosti xi posmatranog obiljeja
X , a mjerni brojevi visina su jednaki vrijednosti pojedinih frekvencija (relativnih
frekvencija). Pri tome se najee dijagram frekvencija produi do ose apcisa Ox , tako da
povrina omeena tim dijagramom i osom Ox bude jednaka povrini posmatranog histograma.

Primjer 4.2.1.a). U jednom razredu od 30 uenika uspjeh iz matematike prikazan je


sljedeom tabelom:

Tabela 1

Ocjena iz matematike x Frekvencija f Relativna frekvencija f / 30


x1 = 1 f1 = 3 1 = 0,1
x2 = 2 f2 = 6 2 = 0, 2
x3 = 3 f3 = 10 3 0,3
x4 = 4 f4 = 8 4 0,3
x5 = 5 f5 = 3 5 = 0,1

ta je ovdje osnovni skup? Nacrtati odgovarajui poligon i histogram frekvencija.

Rjeenje. Skup uenika u razredu je osnovni skup iji je obim N = 30, a njihov uspjeh
izraen ocjenom je obiljeje koje se posmatra. U prvoj koloni unijete su vrijednosti koje
poprima obiljeje X . U drugoj koloni unijeti su brojevi f i (i = 1, 2, ... , 5) uenika koji su
postigli ocjenu xi ( f i - su apsolutne frekvencije), u treu kolonu upisuju se relativne
frekvencije elemenata osnovnog skupa.

10

0 1 2 3 4 5

Sl. 4.2.1.
5

Primjer 4.2.1.b). Na jednoj stonoj farmi je statistiki posmatrana mlijenost stotinu


krava, tj. broj X hl mlijeka koje svaka krava daje godinje. Podaci su prvo sreeni, pa su
onda napisani u Tabeli 2. Nacrtati odgovarajui dijagram frekvencija i histogram frekvencija,
te izvesti odgovarajue prirodne zakljuke.

Tabela 2

Klase Broj Relativna


Sredina
obiljeja krava frekvencija
Klase
x f f / 100
29 - 31 30 2 0,02
31 - 33 32 10 0,1
33 - 35 34 18 0,18
35 - 37 36 30 0,3
37 - 39 38 22 0,22
39 - 41 40 13 0,13
41 - 43 42 3 0,3
Ukupno 100 1

Rjeenje. U ovom primjeru je osnovni skup krdo od 100 krava ( N = 100 ) , a obiljeje
koje se posmatra je mlijenost tih krava. Poto je broj elemenata populacije veliki (broj krava
100), a ima i puno vrijednosti obiljeja X, ne bi bilo pregledno kada bi se dala raspodjela za
svaku vrijednost obiljeja posebno. Zato je segment [29, 43] , duine 29 43 = 14 izmeu
najvee i najmanje vrijednosti podijeljen na sedam intervala duine 2 (14 : 7 = 2 )
(napomenimo da se esto u praksi broj klasa uzima tako da on bude priblino jednak n ;
gdje je n broj elemenata osnovnog skupa (konanog), ali se uz to esto uzima da je tim
brojem klasa djeljiva razlika izmeu najvee i najmanje vrijednosti obiljeja X).

Aritmetika sredina donje i gornje granice jedne klase zove se sredina te klase. U
statistikoj obradi podataka klasu moe reprezentovati njena sredina. Na sljedeoj slici je
prikazan dijagram raspodjele tih sredina, tj. dijagram raspodjele klasa kao i histogram
frekvencija.
f (36,30)
30

f
18

10 (32,10)

0 29 31 33 35 37 39 41 43 x
x

Sl. 4.2.2. Sl 4.2.3.


6

Jo o pojmu statistikog skupa i statistike raspodjele

U statistici se posmatraju problemi sa vrlo mnogo podataka, tj. (vrijednosti obiljeja),


pa se javlja veliki broj intervala tih vrijednosti. Duine tih intervala su male pa se poligon
raspodjele frekvencija pribliava tzv. krivoj (krivulji) frekvencija kao na sl. 4.2.3.

Vie formalno moemo ovako uvesti pojam osnovnog skupa i obiljeja. Osnovni
predmet razmatranja u statistici je skup, recimo (neprazan skup) elemenata, recimo ,
koji se zove osnovni skup ili populacija. Kod svakog elementa posmatra se neka
numerika karakteristika, recimo X ( ) , koja se zove obiljeje (svojstvo, osobina) X. Dakle,
obiljeje X je funkcija (preslikavanje) sa (ili iz ) u skup R (ili u R ili u C ili u jo optiji
skup). Za ovu funkciju pretpostavlja se da je F - izmjeriva, tj. da je
X 1 ([ a, b ]) ( = { : a X < b} ) F (tj. da je ovaj skup dogaaj) za svaki interval
[ a, b ) R, gdje je F - algebra ( - polje) podskupova skupa . Takoer smo mogli
zahtijevati da je X 1 ( ( , x ) ) F ( xR ) jer je {( , x ) : x R } =
= {[ x, + ) : x R } = {[ x, + ) : x R } = BR, gdje je BR - algebra Borelovih
skupova na R (tj. najmanja - algebra podskupova iz R koja sadri familiju svih otvorenih
skupva na R). Svaki otvoren skup na R je prebrojiva unija otvorenih intervala
B = ( a, b ) ( a, b R , a < b ) , tj. BR = {( a, b ) : a, b R , a < b} ( - algebra generisana
otvorenim intervalima).

Nad funkcijom F se definira odreena mjera P za koju emo pretpostaviti da je


normirana, tj. da je P ( ) = 1 , tj. da je P vjerovatnoa (normalizovana mjera).
Prema tome u terminima teorije vjerovatnoe osnovni skup (populacija) je skup svih
ishoda jednog pokusa nad kojim je definisano - algebra F dogaaja (podskupova od ) i
vjerovatnoa P. Obiljeje X kao finitna (konanih vjerovatnoa) F - izmjeriva funkcija je
sluajna veliina.

Distribucija vjerovatnoa obiljeja X je funkcija P { X B} definirana za B BR.


Poznato nam je da je ova distribucija vjerovatnoa jednoznano odreena funkcijom
( )
distribucije vjerovatnoa obiljej X : FX ( x ) = P { : X ( x )} , ( x R ) .
esto se rije raspodjela (distribucija) upotrebljava i za funkciju distribucije Fx bez
opasnosti od zabune. Sa aspekta statistike obiljeje X je potpuno odreeno ako je odreena
njegova raspodjela nad skupom u prethodnom smislu, tj. ako je odreena njegova funkcija
raspodjele Fx .

Primjer 4.2.2. Dato je n kuglica u kutiji koje ine jednu populaciju. Neka kuglica
moe biti bijele ili crvene boje. Obiljeje X neka je boja kuglice: X ( )=1 , ako je kuglica
bijela, a X ( )=0 ako je kuglica crvena. Inverzna slika X 1 ([ a, b ) ) je X 1 {1} ( = X 1 (1) )
- podskup skupa bijelih kuglica, odnosno X 1 ( 0 ) - podskup skupa crvenih kuglica.
Normalizovana mjera (vjerovatnoa) P moe se definirati, npr., relacijom
7

broj bijelih kuglica broj crvenih kuglica


P ({ x =1} ) = , P ({ x = 0} ) = . Neka je P ({ x =1} ) = p .
n n
Onda je P ({ x =1} ) = 1 p = q . U ovom primjeru obiljeje X je sluajna veliina diskretnog
0, x 0

tipa za koju je funkcija distribucije F zadana izrazom F ( x ) = q, 0 < x 1
1, x > 1.

Primjer 4.2.3. Populaciju ini skup svih mjerenja neke veliine izraene brojem m.
Kao obiljeje X = X ( ) moemo uzeti upravo rezultat mjerenja . Vjerovatnoa P neka je
b (x m)
2

1
definirana relacijom P {a X b} = e 2 dx , gdje su m R i R + . Tada
2

2 a
imamo da je obiljeje X sluajna veliina s Gaussovom distribucijom (normalnom)
( x m )2
1
N ( m, ) , zadanu funkcijom gustoe: f ( x ) =

2
e 2 2
.
2

4.3. Sluajni uzorak

Pod statistikim pokusom ili statistikim eksperimentom podrazumijeva se registriranje


vrijednosti obiljeja X kod elemenata iz nekog podskupa osnovnog skupa . Osnovni
predmet statistikih zakljuivanja jeste da se na osnovu statistikih pokusa neto zakljui o
distribuciji Fx ( x ) obiljeja X .
Pretpostavimo da treba ispitati neko svojstvo (obiljeje) koje karakterie skup
istorodnih objekata, tj. neki osnovni skup . Da bi to uradili moe se sprovesti potpuno
ispitivanje posmatranog skupa . No, oigledno je da ako je konaan i statistikim
pokusom registrujemo obiljeje X svakog elementa , onda je distribucija Fx ptpuno
odreena. Meutim, redovna je situacija takva da statistiki pokus sproveden nad pravim
podskupom od koji se naziva uzorak. Razlozi za to mogu biti slijedei:

1) principijelna nemogunost da se obiljeje X registruje kod svakog elementa ,


odnosno da pri velikom broju objekata (elemenata) ostvariti potpuno ispitivanje nije
mogue;
2) trokovi ili praktina besmislenost takvog postupka tj. isptivanje vezano za unitavanje
objekata ili je vezano za velike materijalne trokove, (npr., ako je osnovni skup mjesena
proizvodnja jedne fabrike sijalaica, a obiljeje X recimo vijek trajanja sijalice,
registriranje obiljeja na cijeloj populaciji dovodi do unitavanja cijele mjesene
proizvodnje).

Primijetimo da je u primjeru 4.2.1.b) utvrena klasa obiljeja (mlijenosti) za svaku


pojedinu kravu populacije. Najee populacija ima veoma mnogo elemenata (a esto
beskonano), pa je u praksi teko ili ak nemogue za svaki od njih ustanoviti odgovarajuu
klasu, odnosno ispitati posmatrano obiljeje svih elemenata te populacije. Ovakvim
sluajevima, i openito u sluajevima navedenim pod 1) ili 2), za ispitivanje obiljeja X koje
nas interesuje, primjenjuje se metod izbora. Sutina ovog metoda sastoji se u tome to se
ispitivanju podvrgnu ne svi objekti (elementi), ve jedan njihov dio sluajno izabranih iz
8

posmatranog osnovnog skupa. Rezultati koji se dobiju pri ispitivanju tog dijela prenose se na
sve elemente posmatranog skupa elemenata.

Definicija 4.3.1. Izabranim skupom ili uzorkom naziva se skup objekata sluajno
izabranih iz osnovnog skupa. Ponekad se pod pojmom statistiki skup ili statistika masa
podrazumjeva bilo osnovni skup bilo uzorak.

Dakle, iz osnovnog skupa izdvojimo, putem sluajnog odabiranja, jedan pravi podskup
na kojem vrimo ispitivanja i donosimo zakljuke, koji se zove sluajni uzorak osnovnog
skupa. Prouavanjem sluajnog uzorka donosimo zakljuke o samom osnovnom skupu, tj.
zakljuke koji e pod izvjesnim uslovima vaiti za itav osnovni skup. Da bi ti zakljuci bili
to pouzdaniji, potrebno je da uzorak to bolje predstavlja populaciju, tj. da bude
reprezentativan, to je sluaj ako on ima dovoljan broj elemenata i ako su oni odabrani
sluajno, a svi elementi osnovnog skupa treba da imaju jednaku vjerovatnou da uu u
uzorak. U praksi postoji niz metoda za formiranje sluajnih reprezentativnih uzoraka (na bazi
tablice sluajnih brojeva i dr.).
Analogno, kao to smo i kod osnovnog skupa imali, definiraju se i za uzorak analogni
pojmovi kao to su obim, varijansa, statistika raspodjela uzorka (relativnih ili apsolutnih
frekvencija), poligon, histogram (varijacioni red, varijacioni interval itd.).

Definicija 4.3.2. Obimom (ili veliinom, duinom) uzorka naziva se broj njegovih
elemenata (objekata), jasno ukoliko je ozorak konaan. Ako sa N oznaimo obim osnovnog
skupa, a sa n obim uzorka, tada je po pravilu n << N .

Reprezentativnost uzorka zavisi od obima uzorka ali je obim ne obezbjeuje. Naime,


reprezentativnost zavisi od kriterija uzimanja uzorka. Prestrogo reeno, uzorak je
reprezentativan ako kriterij po kojem ga uzimamo ne zavisi od obiljeja koje posmatramo, tj.
to svaki element osnovnog skupa ima jednaku ansu da ue u uzorak. Uzorak je sa
ponavljanjem ako se vraa ispitani objekat u osnovni skup, bez ponavljanja ako se ispitani
objekat ne vraa u osnovni skup. Ako osnovni skup sadri beskonano mnogo elemenata,
onda su efikasnosti uzorka bez vraanja i uzorka s vraanjem meusobno ekvivalentne. Ako
je osnovni skup konaan, onda je efikasniji uzorak bez vraanja. U praksi se najee koristi
uzorak bez vraanja.
Posmatrajmo neki uzorak izabran iz osnovnog skupa pri emu se vrijednost x1
posmatra ili uzima u razmatranje n1, vrijednost x2, n2 puta, vrijednost xk, nk puta, gdje je
k

n = n , ( n obim uzorka). Sluajni uzorak obima n sa vrijednostima


i =1
i x1 , , xn obino se

krae pie u obliku n: x1 , , xn . Posmatrane vrijednosti xi zovu se varijanse (realizacije,


registrirane vrijednosti, opservacije ili varijante). Niz varijansi x i , , xn napisan u
rastuem poretku zove se varijacioni red, a R = Xmax - Xmin zove se varijacioni razmak
(varijacioni interval). Brojevi ni ( = fi ) zovu se frekvencije (uestalosti) varijanti uzorka, a
n
kolinici i , i = 1, , k relativne frekvencije varijanti uzorka.
n

Definicija 4.3.3. Statistika raspodjela uzorka je pridruivanje (funkcija) izmeu


skupa varijanti i skupa njihovih frekvencija ili relativnih frekvencija.

Statistika raspodjela moe biti zadana preko tabele u kojoj su varijante odgovarajue
frekvencije.
9

Primjer 4.3.1. Zadana je raspodjela frekvencija uzorka obima n = 60:

xi 4 10 16 20 24 30
ni 15 18 6 4 5 12

ni ni
Odavde lako se dobije i raspodjela relativnih frekvencija primjenom formule i = = ,
n 60
pa imamo

xi 4 10 16 20 24 30 6

ni 1 3 1 1 1 1 , (
i =1
i = 1 ).
n 4 10 10 15 12 5

Statistika raspodjela uzorka moe biti zadana i preko niza nekih intervala i
odgovarajuih frekvencija. Ako je statistika raspodjela uzorka zadata preko varijanti xi i
odgovarajuih frekvencija i (ili ni onda se na osu apcisa nanosi xi , a na osu ordinata ni (ili
i ). Dobijemo take, recimo M 1 ( x1 , n1 ) , M 2 ( x2 , n2 ) , , koje strogo uzevi predstavljaju
grafik statistike raspodjele u Dekartovom koordinatnom sistemu. Dobijene take
povezujemo odrescima pravih. Tako dobijena linija (izlomljena) zove se poligon frekvencija
(apsolutnih ili relativnih) uzorka. Ako je statistika raspodjela uzorka zadana preko
intervala i odgovarajuih frekvencija, onda se konstruie histogram frekvencija.

Naime, interval kome pripadaju sve posmatrane vrijednosti neprekidnog obiljeja X


dijeli se na nekoliko podintervala jednake duine h. Na svaki i - ti podinterval unosimo broj
ni (suma frekvencija varijanti koje pripadaju i tom podintervalu.

Na osu apscisa nanosimo podintervale duine h, a na istim podintervalima


n
konstruiemo pravougaonike visine h. Kolinik i zove se gustoa frekvencije. Stepenasta
h
figura koja se sastoji iz pomenutih pravougaonika zove se histogram frekvencije uzorka.
Povrina S histograma jednaka je sumi svih frekvencija obima uzorka. Naime, ako je Si
n k k
povrina i tog pravougaonika, onda je Si = i h = ni , pa je S = Si = ni = n .
h i =1 i =1

Na isti nain konstruie se i histogram relativnih frekvencija uzorka, tj. stepenasta


figura predstavljena pravougaonicima ija je osnovica duine (podintervala) h, a visina
i i
x= . Odnos x = zove se gustoa relativnih frekvencija uzorka. Povrina S histograma
h h
k
i
relativnih frekvencija uzorka jednaka je 1. Zaista, kako je S = Si , Si = h = i , to je
i =1 h
k k k
ni 1 k
S = i = i = = ni = 1 .
i =1 i =1 i =1 n n i =1
10

Vratimo se ponovo pojmu uzorka. Iz navedenog se vidi da je osnovni problem da


uzorak bude reprezentativan, tj. da informacija o distribuciji Fx koju on daje za obiljeje X,
bude u izvjesnom smislu tana. Jasno je da se, openito govorei, reprezentativnost uzorka
postie ako je nain uzimanja elemenata u uzorak nezavisan od obiljeja koje se posmatra.
Meutim, esto je teko provjeriti tu nezavisnost kao to pokazuje sljedei interesantan
primjer.
Primjer 4.3.2. Dati su podaci jedne ankete socijalnog osiguranja u Poljskoj. Osnovni
skup ine svi zaposleni osiguranici iji je broj N = 2 757131, a obiljeje X je vrsta posla i ono
uzima slijedee etiri razliite vrijednosti:

1) Radnici, izuzev zaposlenih u ugljenokopima i elianama, N1 = 1778 446, n1 = 152 812;


2) Radnici u ugljenokopima i elianama, N 2 = 250 397, n2 = 22 493;
3) Drutvene i javne slube, N 3 = 564147, n3 = 44 040;
4) Uslune djelatnosti, N 4 = 164141, n4 = 14 088;

Svega: N = 2 757131, n = 230 433 .

Ni
Raspodjela vjerovatnoa za obiljeje X je pi = , (i = 1, 2, 3, 4) . Uzorak obima n = 230 433
N
zaposlenih ine svi oni ija prezimena poinju sa P . Raspodjela obiljeja X u tom uzorku
n
je i , (i = 1, 2, 3, 4) . Pokazuje se pomou tzv. Pearsonovog metoda, tj. pomou tzv.
n
- testa, da postoje vrlo znaajne razlike izmeu obiljeja X u osnovnom skupu i u uzorku,
2

tako da se uzorak ne moe smatrati reprezentativnim. Napomenimo da je u ovom primjeru


bilo teko predvidjeti zavisnost izmeu zaposlenja i poetnog slova prezimena.

O metodi sluajnog uzorka

Do sada smo izlagali o uzorku i metodi uzorka intuitivno, a sada emo to initi vie sa
formalnog aspekta.
Razmatranja u teoriji vjerovatnoe navode nas kako treba uzeti uzorak da bi on bio
reprezentativan. Naime, kao to je obrazloeno u prethodnom dijelu teksta, elemente
osnovnog skupa treba birati u uzorak sluajno, jer onda oekujemo da se neutraliu sve
mogue zavisnosti izmeu posmatranog obiljeja i uzorka. Tako izabran uzorak zove se
sluajni uzorak. Nadalje emo se uglavnom baviti uzorkom konstantnog obima n. Kako
elemente osnovnog skupa biramo u uzorak sluajno to imamo n sluajnih ishoda 1 , , n
naeg statistikog pokusa. Obiljeje X naeg statistikog pokusa posmatrano kod svakog od
tih n ishoda daje n - dimenzionalnu sluajnu veliinu ( X 1 , , X n ) , gdje je X k = X (k ) za
k = 1, , n . Kako emo se uglavnom baviti samo jednim obiljejem, npr. X , to imamo n
dimenzionalnu sluajnu veliinu ( X 1 , , X n ) koju emo takoe zvati sluajni uzorak. Otuda
vidimo da se sa formalnog aspekta moe rei da je jednodimenzionalni sluajni uzorak
obima n ustvari n dimenzionalna sluajna veliina ( X 1 , , X n ) . Ako pak posmatramo dva
obiljeja, recimo X i Y , tj. ako se radi o dvodimenzionalnom statistikom skupu, onda
11

njemu odgovara sluajni uzorak oblika ( ( X , Y ) , ... , ( X


1 1 n , Yn ) ) . Openito se moe posmatrati
k - dimenzionalan statistiki skup, gdje je k prirodan broj.

Kada je statistiki pokus jednom sproveden u uzorak je uzeto nekih n elemenata i


n dimenzionalna sluajna veliina ( X 1 , , X n ) postaje n torka brojeva ( x1 , , xn ) koja
predstavlja tzv. realizovani uzorak. Jednom realizovani uzorak je dakle jedna realizovana
vrijednost n - dimenzionalne sluajne veliine.

Definicija 4.3.4. Sluajni uzorak ( X 1 , , X n ) zove se prost ako su sluajne


promjenljive ( X 1 , , X n ) nezavisne i jednako distribuirane, tj. svaka od njih ima funkciju
distribucije F ( x ) kao i obiljeje X. Pri tome je zajednika funkcija distribucije za
n

( )
( X 1 , , X n ) zadana izrazom Q ( ( x1 , , xn ) ) : = FX1 , , X n ( ( x1 , , xn ) ) = F ( xi ) .
i =1

Popularno govorei, prosti sluajni uzorak znai da se statistiki pokus sastoji od n


nezavisnih registriranja vrijednosti obiljeja X . Prije sprovoenja takvog pokusa vrijednosti
koje emo dobiti su sluajne veliine ( X 1 , , X n ) , a kada je pokus sproveden imamo brojeve
( x1 , , xn ) (ili neke optije elemente), tj. realizovan je prosti sluajni uzorak. Kako emo se
dalje baviti uglavnom prostim sluajnim uzorkom govoriemo kratko uzorak. Ako se radi o
sloenom (stratifikovanom) uzorku posebno emo naglasiti.

Primjer 4.3.3. U Primjeru 4.2.2. prost sluajni uzorak obima n moe se realizovati
tzv. sluajnim uzorkom sa vraanjem (sa N jednakovjerovatnih ishoda): sluajno biramo
kuglicu da bi realizovali obiljeje X, kuglicu vraamo nazad u kutiju, sluajno biramo kuglicu,
itd.
Pri tome su oigledno ( X 1 , , X n ) nezavisne sluajne veliine sa istom funkcijom
raspodjele. No drugaija je situacija kod sluajnog uzorka bez vraanja. Naime, tada biramo
kuglicu da bismo registrirali obiljeje X , a zatim kuglicu ne vraamo u kutiju ve biramo
sluajno slijedeu kuglicu itd. Sluajne veliine X 1' , ... , X n' ( n N ) ovako definirane nisu
nezavisne, jer se pokazuje da je npr. vjerovatnoa dogaaja da je X 2' = 1 uz uslov da se desio
dogaaj X 1' = 1, razliita od vjerovatnoe dogaaja da je X 2' = 1 uz uslov da se desio
dogaaj X 1' = 0 . Zapravo, u tom sluaju imamo:

P ({ X = 1} { X = 1}) = N p 1 P { X = 1} { X
' '

(
P { X = 1} { X = 1} = =
'
2
'
1

) 2

P ({ X = 1} )
'
1

N 1
( '
2
'
1 )
= 0} =
N q
N 1

1

Nije teko pokazati (primjenom formule potpune vjerovatnoe) da u ovom primjeru


svaka sluajna veliina X ' k ( k = 1, , n ) ima istu distribuciju kao obiljeje X.
12

4.4. Empirijska funkcija raspodjele (distribucije). Fundamentalna teorema


statistike

4.4.1. Empirijska funkcija raspodjele

U cilju davanja odgovora na pitanje reprezentativnosti uzorka, tj. u kom sluaju


uzorak ( X 1 , , X n ) daje potpunu informaciju o raspodjeli F ( x ) obiljeja X na cijelom
osnovnom skupu ; definira se prvo tzv. empirijska funkcija distribucije.

Definicija 4.4.1. Neka je ( X 1 , , X n ) sluajni uzorak obima n iz funkcije distribucije


F, tj. neka su ( X 1 , , X n ) nezavisne jednako distribuirane sluajne veliine sa zajednikom
funkcijom distribucije F. Funkcija F ( ili F ili F ili S ili F ) definirana na R izrazom
n st n emp

broj X i ova koji su manji od x


Fn ( x ) : = , ( x R) ,
n
1 n n
f
tj. Fn ( x ) = { X i < x} ili Fn ( x ) = i zove se empirijska funkcija distribucije
n i =1 x < Xi n

(raspodjele) uzorka ili kumulativna ili statistika funkcija raspodjele. )

Dakle, za svaki fiksirani x R , Fn ( x ) predstavlja relativnu frekvenciju dogaaja


{ X < x} u n ponovljenih nezavisnih pokusa, odnosno Fn ( x ) je sluajna veliina.
Iz same definicije slijedi da empirijska funkcija distribucije ima sljedea osnovna svojstva:

1) njene vrijednosti pripadaju segmentu [ 0,1] ;


2) neopadajua je;
3) ako je x1 najmanja i x k najvea vrijednost obiljeja X, onda je za x x1 vrijednost
F ( x ) = 0 , a za x > x je F ( x ) = 1 .
n k n

Definicija 4.4.2. Integralna funkcija raspodjele, recimo F ( x ) , osnovnog skupa za


razliku od empirijske funkcije F ( x ) zove se teorijska funkcija raspodjele i ona se zadaje,
n

kao to znamo, sa ( )
F ( x ) : = P { : X ( ) x } , gdje je X sluajna veliina, tj.
posmatrano obiljeje.
0 1
Kako za svaki i vrijedi { X i < x} = (to slijedi iz definicije
1 F ( x ) F ( x )
karakteristine funkcije skupa i teorijske funkcije raspodjele) i kako su sluajne veliine
nezavisne, to je n Fn ( x ) B ( n, F ( x ) ) , ( x R ) , tj. n Fn ( x ) je binomna sluajna veliina
sa parametrima n, F ( x ) , odnosno, imamo:
_________________
)
U literaturi se, umjesto znaka <, u izrazu koji definira empirijsku funkciju distribucije
(analogno kao i u definiciji funkcije distribucije FX sluajne veliine X) uzima i znak .
13

k n
P Fn ( x ) = = F ( x ) 1 F ( x )
n k
k


nk
(
, k = 0, n . )
Sada se dokae, koristei tzv. Borelov jaki zakon velikih brojeva, da za svaki x R vrijedi
Fn ( x )
g . s.
F ( x ) , /konvergira gotovo sigurno ka/, tj. piemo
( g. s.) lim F ( x ) = F ( x ) , ()
n
n

( ( g . s.) - vrijedi svuda svojstvo osim na skupu mjere 0, odnosno, osim za dogaaje ija je
vjerovatnoa 0). To znai da funkciju raspodjele F ( x ) moemo u svakoj fiksiranoj taki
x R skoro sigurno odrediti pomou uzorka ( X 1 , , X n ) kada obim uzorka neogranieno
raste.
Tzv. Centralna teorema statistike (fundamentalna teorema statistike), ili Glivenko
Cantellijeva teorema, tvrdi da je konvergencija ( ) ak uniformna po x (gotovo svuda,
odnosno, gotovo sigurno). Ona glasi:

( X i )i = 1 , Fn , Fn
n
Teorema 4.4.1. (Glivenko Cantelli). Neka je kao u prethodnoj
definiciji, tj. neka je ( X1, , X n ) prost sluajan uzorak sa obiljejem X ija je funkcija
distribucije F (teoretska) i Fn empirijska funkcija distribucije uzorka. Tada vrijedi:


P lim sup Fn ( x ) F ( x ) = 0 = 1 .

n x R

Napomena 4.4.1. Za realizovani uzorak n : x1 , , xn realizovana empirijska funkcija


raspodjele je neka odreena funkcija s ( x ) ili f ( x ) ( x R ) definirana izrazom
n n

k
sn ( x ) =
n
( )
za xk x < xk + 1 , k = 1, n , sn ( x ) = 0 za x < x1 ,

gdje su x1 xn vrijednosti ( x1 , , xn ) poredane po veliini. Prema centralnoj teoremi


statistike sve realizacije sn ( x ) , ( x R) , izuzev moda onih koje pripadaju dogaaju


vjerovatnoe 0, uniformno po x konvergiraju ka funckiji (teorijskoj) raspodjele F ( x )
obiljeja X kad obim uzorka n .


Interesantno je posmatrati u statistici sluajne veliine Dn definirane izrazom
Dn = sup sn ( x ) F ( x ) . Pokazuje se (tzv. teorema Kolmogorov - Smirnova iji je dokaz
x+

dosta sloen) da za funkciju raspodjele sluajne promjenljive Dn n vai kad ( n )


formula

0, x 0,
FDn ( x ) ( = Gn ( x ) ) = P { }
n Dn < x +
( 1)
k 2 k 2 x2
e , x > 0,

k =
14

pod uslovom da je F ( x ) neprekidna funkcija distribucije.

Primjer 4.4.1. Nai empirijsku funkciju raspodjele prema datoj statistikoj raspodjeli:

xi 6 8 12 15
(fi =) ni 2 3 10 5

Rjeenje. Kako su ve sve varijante uzorka napisane po veliini, to datu tabelu ve


moemo smatrati tablinim prikazom statistike raspodjele apsolutnih frekvencija. (Da bi
odredili analitiki izraz empirijske funkcije distribucije moe se prvo dati tabelarni prikaz
statistike raspodjele relativnih frekvencija.) Imamo:

Fn ( x ) = 0 za x 6 , (n = n i = 20 ) , za 6 < x 8 je Fn ( x ) = 0,1 ,
za 8 < x 12 je Fn ( x ) = 0, 25 , za 12 < x 15 je Fn ( x ) = 0, 75 ,
za x > 15 je F ( x ) = 1 , tj.
n y

0, x 6,
0,1, 6 < x 8,

Fn ( x ) = 0, 25, 8 < x 12,
0, 75, 12 < x 15,

1, x > 15.

0 x

Sl. 4.4.1.

4.4.2. O karakteristinim funkcijama distribucije i tipovima konvergencije u teoriji


vjerovatnoe

Jedan vrlo moan matematiki aparat u teoriji vjerovatnoe, pa i u statistici,


predstavlja metoda karakteristinih funkcija distribucije i u vezi s tim je izgraena itava
teorija karakteristinih funkcija. Te se funkcije mogu korisno upotrijebiti u dokazima
graninih teorema u teoriji vjerovatnoe i u njenim primjenama u statistici. Ovdje emo dati
samo njenu definiciju i navesti njena osnovna svojstva.

Definicija 4.4.3. Funkcija zove se karakteristina funkcija sluajne veliine X


(ili karakteristina funkcija funkcije distribucije F, gdje je F funkcija distribucije sluajne
veliine X na nekom prostoru vjerovatnoe ( , F , P ) ), ako je funkcija zadana izrazom
+

(t ) : = E ( e itX
) ( i imaginarna jedinica), tj. ako je ( t ) = e itX
dF ( x ) , (t R ) .

15

Napomenimo da je eitX primjer kompleksne sluajne veliine Z ( = X + iY ) : C


pri emu je kao to znamo ta sluajna veliina odreena parom ( X , Y ) nezavisnih sluajnih
veliina X , Y , koji preslikava skup u C (gdje je C skup kompleksnih brojeva).

Pokazuje se da karakteristina funkcija ima ova osnovna svojstva:

1) ( t ) 1 , ( t ) (t R ) ;
2) je neprekidna ( t ) ( t R ) ;
3) ( 0 ) = 1 ;
4) ( t ) = ( t ) , ( t ) ( t R ) ;
5) ( j ) ( 0 ) = i j E ( X j
) , ( j n ) , ( ) < + , za neki n N ( izvod funkcije
ako je E X
n

reda j u taki 0);
( )
6) iz ( t ) : = E eitX se dobije funkcija gustoe f:
+ n
1 1
f ( x) = e
itx
( t ) dt , ( e = lim 1 + , e 2, 718 ).
2
n
n

t2
Primjer 4.4.2. Lako se vidi da je funkcija : t e 2
karakteristina funkcija
normalne sluajne varijable.

Definicija 4.4.4. Kaemo da niz { X n }n = 1 sluajnih veliina konvergira gotovo


sigurno (konvergira jako) prema sluajnoj veliini Y ako je

({
P Y ( ) = lim Yn ( )
n
}) = 1
(tj. konvergira svuda osim eventualno na skupu vjerovatnoe 0). To se oznaava sa
Yn g .s.
y ( n + ) ili (g. s.) lim Yn ( x ) = Y ( x ) .
n

Definicija 4.4.5. Kaemo da niz {Yn } sluajnih veliina konvergira po vjerovatnoi


(konvergira slabo) ka sluajnoj veliini Y ako za svaki > 0 vrijedi relacija
({
lim P : Yn ( ) Y ( )
n
}) = 0 ,
to se simboliki oznaava sa Yn
P
Y , ( n ) ili ( P ) lim Yn ( x ) = y ( x ) .
n

Osim ova dva tipa konvergencije u teoriji vjerovatnoe, pa i u statistici, posebno su


znaajna i sljedea dva tipa.

Definicija 4.4.6. Kaemo da niz {Yn } sluajnih veliina konvergira po distribuciji


ka Y ako je lim FYn ( x ) = FY ( x ) , za svaki x C ( FY ) , gdje je C(FY) skup svih taaka
n
16

neprekidnosti funkcije distribucije FY sluajne veliine Y , a FYn je funkcija distribucije


sluajne veliine Yn. To se simboliki esto pie u obliku FYn
D
FY (n ) .
Definicija 4.4.7. Neka je 1 p + i neka postoji konani apsolutni p-ti moment
( ) . Kaemo da niz {Y } konvergira u srednjem reda p
E Yn
p
n prema Y ako je

lim E ( Y Y ) = 0 , to esto oznaavamo sa Y Y , ( n ) .


p mp
n n
n

0 6 8 12 15 x

Sl. 4.4.2.

Posebno vaan sluaj konvergencije u srednjem je za p = 2 , u kom sluaju se


najee pie Yn
s. k .
Y , ( n ) i kae da dati niz konvergira u srednjem, odnosno
da je to srednjekvadratna konvergencija.

Pokazuje se da su konvergencija gotovo sigurno i konvergencija u srednjem


neuporedive (tj. jedna drugu ne implicira), dok obje impliciraju konvergenciju u vjerovatnoi,
a ova implicira konvergenciju u distribuciji (a obrnuto ne vrijedi; tj. pokazuje se da vrijedi
odnos konvergencija sluajnih veliina dat emom na sl. 4.4.2.

4.4.3. O zakonima velikih brojeva, graninim teoremama i teoremama centralnog


limesa u teoriji vjerovatnoe

Zakon velikih brojeva je jedan od osnovnih i najznaajnijih zakona u statistici..


Karakter i sadraj statistike kao nauke i prakse zasniva se na zakonu velikih brojeva. Osnovni
smisao i znaenje zakona velikih brojeva u statistici moe se najjednostavnije izraziti u
sljedeem: to je vei broj dogaaja, posmatranja ili elemenata to je vea vjerovatnoa da e
nai sudovi i zakljuci biti realni, istiniti, odnosno to je manja greka u tanosti naih
zakljuivanja. Pri tome treba voditi rauna da je primjena zakona velikih brojeva opta
(generalna) u statistici, tj. ne treba shvatiti da to zavisi od metoda da li posmatranje i
prebiranje vrimo putem potpunog obuhvatanja svih jedinica nekog osnovnog skupa ili samo
putem djeliminog (selektivnog) posmatranja, odnosno, putem uzorka, tj. u svakom sluaju
teimo da nae sudove i zakljuke temeljimo na zakonu velikih brojeva, samo to kod
primjene metode uzorka to procjenjujemo sa manjim stepenom pouzdanosti nego kad to
vrimo potpunim obuhvatanjem svih elemenata osnovnog skupa.
U sutini, zakon velikih brojeva zasniva se na zakonima vjerovatnoe pa se i njihov
dokaz izvodi tim putem.
17

U klasinom obliku problematika zakona velikih brojeva sastoji se u ispitivanju


X + X2 1 n
potrebnog i dovoljnog uslova da niz aritmetikih sredina X 1 , 1 , ..., X i , ...
2 n i =1
nezavisnih sluajnih veliina X 1 , , X n konvergira u odreenom smislu ka nekom broju.
Ako se ne istakne suprotno, u daljem izlaganju smatramo da su sve sluajne veliine, koje se
istovremeno posmatraju, definirane na istom prostoru vjerovatnoe ( , F , P ) .
Sada emo preciznije formulisati zakon velikih brojeva: Neka je {X n} niz
nezavisnih sluajnih veliina (definiranih na fiksnom prostoru vjerovatnoe ( , F , P ) ).
n n
1 1
Posmatra se konvergencija niza
n i =1
Xi E ( Xi )
n i =1
( n = 1, 2, ) ka 0 (ili, optije, niza
Sn Sn an n
ili niza ka konsanti, gdje je S n = X i , an R , ( n = 1, 2, ) ).
n n i =1

Ako je u pitanju konvergencija u vjerovatnoi odgovarajua teorema zove se slabi


zakon velikih brojeva, a kod skoro sigurne konvergencije zove se strogi (jaki) zakon
velikih brojeva.

Neki osnovni zakoni velikih brojeva

1 n
Pokazuje se da niz X i (Xi nezavisne) konvergira gotovo sigurno ka konstanti ili
n i =1
da divergira gotovo sigurno. Takoe se dokazuje da vrijede sljedei zakoni velikih brojeva (a i
neki drugi, kao to su ebievljev zakon, Hinijev zakon /slabi zakoni/, te jaki zakon
Kolmogorova i dr.).

Teorema 4.4.1. (Bernulijev slabi zakon velikih brojeva). U Bernulijevoj emi (tj.
ako je S n B ( n, p ) , tj. ako je Sn binomna sluajna veliina) za svaki > 0 vrijedi da je
S 1 n
P n p 0 , ( n ) , tj. X i
P
p , (n ) .
n n i =1

(Ovaj zakon govori o konvergenciji po vjerovatnoi niza relativnih frekvencija u


Bernulijevoj emi u svakom pojedinom pokusu. Ovaj zakon pretpostavlja klasian rezultat
teorije vjerovatnoe i jedan je od prvih vanijih teorema teorije vjerovatnoe a objavljen je
1715. godine.)

Dokaz. Prema poznatoj nejednakosti ebieva: Ako je X sluajna veliina sa


konanim oekivanjem i varijansom na nekom prostoru vjerovatnoe ( , F , P ) , onda za
Var ( X )
({
svaki > 0 vrijedi da je P X ( ) E ( X ) }) 2
, (a esto se koristi i

E( X ) , r >0, E
({
Markovljeva nejednakost P : X ( ) }) r ( X ) < + ), imamo:
r
18

Sn 1
Var n n p q
S ( ) = n2 p q
P : n p = 0, n ,
n
2 2
n 2

S 1
jer iz (Var ( S ) = n p q )
n i Var ( a X ) = a 2 Var ( X ) slijedi da je Var n
n
= 2 n p q.
n

Prema tome, Bernulijev slabi zakon velikih brojeva je dokazan.



Napomenimo jo da Bernulijev zakon velikih brojeva daje jedno tumaenje grupisanja
Sn
relativnih frekvencija oko vjerovatnoe p. Ali to grupisanje je opisano sljedeom jaom
n
teoremom koju je dokazao Borel 1909. godine i zove se Borelov jaki zakon velikih brojeva.

Teorema 4.4.2. U Bernulijevoj emi (tj. za binomnu sluajnu veliinu S n B ( n, p ) )


S ( )
vrijedi jaki zakon velikih brojeva dat sa P : n p, n = 1 , tj.
n

1 n
X i
n i =1
g . s.
p, (n ) .


Dokaz. Dokazuje se primjenom ebievljeve nejednakosti i Borel-Cantellijeve leme
I.

Napomenimo da se u primjenama koristi i pooptena ebievljeva nejednakost data


sljedeom teoremom.

Teorema 4.4.3. (Kolmogorovljeva nejednakost). Ako su X 1 , , X m nezavisne


sluajne veliine i ako je Var ( X j ) < + za svaki j = 1, , m , onda za svaki > 0 vrijedi

({ }) 1 Var ( X
n n
P : max Yn = 1, , m ( ) 2 k ) , gdje je Yn = ( X k E ( X k ) ) .
k =1 k =1

Navedimo i ovaj (moni) jaki zakon velikih brojeva:

Teorema 4.4.4. (Teorema Kolmogorova).

I. Neka je ( Xn ) niz nezavisnih sluajnih veliina takav da je FX i = FX1 , ( i ) , tj. sve


1
X i su jednako distribuirane. Ako postoji E ( X 1 ) , onda je
n
X i
g . s.
E ( Xi ) ,

(n ) .
19

1
II. Obrnuto: Ako je P lim X i postoji = 1 , onda E ( X 1 ) postoji i prema I. je
n n

1 n 1 n

n i =1
X i
g . s.
E ( X 1 ) , ( n ) , ili krae: Niz X i , gdje su X i nezavisne
ni =1
i jednako distribuirane sluajne veliine, konvergira gotovo sigurno ako i samo ako
1 n
E ( X 1 ) postoji i u tom sluaju je lim X i = E ( X 1 ) .
n n
i =1

Dokaz. Izlazi iz okvira ovog kursa.

Granine teoreme (teorem centralnog limesa) u teoriji vjerovatnoe

U primjenama najee je potrebno izraunati vjerovatnou da neka sluajna veliina


poprimi vrijednost iz nekog intervala kao npr. vjerovatnou da se broj uspjeha u Bernulijevoj
emi (tj. ako je X B ( n, p ) (binomna sluajna veliina) ) nalazi izmeu realnih brojeva,
recimo, a i b. Ta vjerovatnoa je
n k n k
p (k ) = P (a X b) =
a k b
P( X = k) =
p q
a k bk
.

Brojeve p ( k ) , a posebno P ( a X b ) vrlo teko je izraunati za velike n. U tom


smislu koriste se neke teoreme (granine) da se dobiju pribline vrijednosti ovih brojeva.
Navedimo stoga slijedee vane (klasine teoreme) granine teoreme u teoriji
vjerovatnoe:

Teorema 4.4.5. (Poissonova teorema). Neka je X n B ( n, p ) (n N) i


lim pn = 0 , lim n pn = , > 0 fiksan broj. Tada slijedi da za svaki k = 0,1, 2, vrijedi
n n

n k
lim P ( X n = k ) = lim pnk qn n k = e ,
n k k!
n

nk
tj. imamo P ( X n = k ) e n , ( n = n pn ; k = 0,1, , n ) , a koristi se ako je n 20 , a
k!
n pn < 10 .

Osim ove teoreme imamo dvije Laplaceove teoreme.

Teorema 4.4.6. (Lokalna Moivre Laplaceova teorema). Neka je 0 < p <1 i


k n p
X n B ( n, p ) i neka je X k = , ( k = 0, n , n N ). Tada vrijedi
n pq
2 n p q P ( X n = k )
lim
n xk2
=1 ( )

e 2

i to uniformno na svakom ogranienom segmentu [ a, b ] , gdje je a xk b za sve k i n .


20


Dokaz. Uputa: Primjenjuje se Stirlingova formula r ! = 2 r r r e r e t r ,
1
0 < t r < . Napomenimo da se iz ( ) dobije praktina priblina formula
12 r
k n
1 1
P( Xn = k) e 2 n p
= f ( xk ) .
2 n p q n pq

Teorema 4.4.7. (Integralna Moivre Laplaceova teorema). Neka je 0 < p < 1 i


X n B ( n, p ) ( n N ) . Tada za proizvoljne a, b R il a, b R , a < b , vrijedi
X n p 1
b

x2
Xn n p D
lim P a n

b =
e 2
dx , tj. N ( 0,1) ( n ) .
n
n pq 2 a n pq


Dokaz. Moe se dokazati da je ova konvergencija u teoremi 4.4.7. uniformna u
odnosu na a, b , pri emu je a < b + .

Teorem 4.4.7. je specijalan sluaj opte centralne granine teoreme. Poznati


matematiar G. Polya je uveo naziv centralan da bi naglasio da je taj problem bio u centru
istraivanja u teoriji vjerovatnoe u XVIII vijeku. Ali, etrdesetih godina ovog vijeka
dobijeno je potpuno rjeenje proirene verzije centralnog graninog teorema i taj dio teorije je
jedan od najljepih dijelova teorije vjerovatnoe. Navedimo jednu od verzija opte teoreme
centralnog limesa:


Teorema 4.4.8. (Lvyjeva teorema centralnog limesa). Neka je X n niz
nezavisnih sluajnih veliina jednake distribucije, tj. FX n = FX ( n ) , sa oekivanjem
= E ( X 1 ) i Var ( X n ) = 2
(0 < 2
< ) . Tada za sve a R vrijedi
n
Xi n + 2

1
a = e
i =1
lim P 2
dx ,
n n 2


Sn n n
ili krae N ( 0,1) , gdje je S n = X i .
n i =1


Dokaz. Relativno lako se izvodi dokaz koristei metod karakteristinih funkcija i
razvoja karakteristinih funkcija prema Taylorovoj formuli (MacLaurinovoj formuli), tj.
( it )
k
n
koristei razvoj: ( t ) = E(X ) k
+ o ( t n ) , ako E ( X n
) postoji.
k =0 k!


4.4.4. Fundamentalna teorema statistike

U okviru ove take dokaimo ranije navedenu fundamentalnu (centralnu) teoremu


statistike.
21

Teorema 4.4.9. (Fundamentalna teorema statistike). Ako je F ( X ) funkcija


distribucije sluajne promjenljive X (teoretska funkcija distribucije) i S n ( X ) empirijska
funkcija distribucije koja odgovara prostom uzorku ( X 1 , , X n ) , onda vrijedi:

P sup S n ( X ) F ( X ) 0 , n = 1 .
< x < +

Dokaz. Izvest emo dokaz za sluaj da se polazi od definicije funkcije distribucije F


( )
po kojoj je F ( x ) = P { : X ( ) < x} , tj. da je F neprekidna sa lijeve strane
(analogno se izvodi i za sluaj da se F definirana izrazom F ( x ) = P ( X x ) , tj. da je F
neprekidna sa desne strane) (vidi npr. [N. Sarapa]). Neka je x jk (j = 1, , k )
( k = 1, , n ) najmanja vrijednost od x za koju je
j
F ( x) F ( x + 0) . ( )
k

{ }
Stavimo da je A'jk = S n ( x jk ) F ( x jk ) , n . Tada je prema Borelovom zakonu velikih
brojeva P ( A'jk ) = 1 . Slino se dobije da je P ( A''jk ) = 1 za

{
A''jk = Sn ( x jk + 0 ) F ( x jk + 0 ) , n . }
Dakle, imamo P ( Ajk ) = 1 gdje je Ajk ( = A'jk A''jk ) = A'jk A''jk . Takoe imamo:
k

Ak = A = sup Sn ( x jk 0 ) F ( x jk 0 ) 0, ( n ) .
jk
j =1 1 j k
Prema tzv. lemi o pokrivanju (Booleova nejednakost) imamo da je
k k
P ( Akc ) = P Akc P ( Akc ) = 0 , tj. P ( Ak ) = 1 . Prema osobini neprekidnosti vjerovatnoe
j =1 j =1
m
za A = Ak imamo da je P ( A ) = lim P Ak = lim = 1 . Otuda za svaki x ( x jk , x j +1, k )
m m
k =1 k =1
imamo
F ( x jk + 0 ) F ( x ) F ( x j +1, k ) i S n ( x jk + 0 ) Sn ( x ) Sn ( x j +1, k ) .
1
Kako je, prema ( ) , 0 F ( x j +1, k ) F ( x jk + 0 ) , to imamo:
k
1
S n ( x ) F ( x ) S n ( x j +1, k ) S n ( x jk + 0 ) S n ( x j +1, k ) F ( x j +1, k ) +
, a s druge strane,
k
1
S n ( x ) F ( x ) S n ( x jk + 0 ) F ( x j +1, k ) S n ( x jk + 0 ) F ( x jk + 0 ) , ( g . s.) .
k

Dakle, dobili smo da za svaki x R i svaki k vrijedi


1
Sn ( x ) F ( x ) sup Sn ( x jk 0 ) F ( x jk 0 ) + , ( g . s.) . ()
1 j k k
Kako dogaaj
22


sup Sn ( x jk 0 ) F ( x jk 0 ) 0, n
1 j k
implicira dogaaj

sup Sn ( x ) F ( x ) 0, n ( = A1 )
< x < +
za koji vrijedi, prema ( ) , da je P ( A1 ) P ( A ) = 1, to je centralna teorema dokazana.


4.5. Statistika. Dopustiva familija raspodjela

Ako funkcija F ima gustou f, tj. ako je X neprekidna ili diskretna sluajna veliina s
gustoom f, onda se obino kae da je uzorak ( X 1 , , X n ) uzet iz gustoe f ili iz distribucije
F.
Definicija 4.5.1. Neka je ( X 1 , , X n ) uzorak obiljeja X iz funkcije distribucije F i
g : R n R Borelova funkcija (tj. ako je g 1 ( B ) B , svaki B B n gdje je B n - algebra
n

na R n generisana familijom svih otvorenih podskupova na R n , tj. B n je - algebra


Borelovih skupova na R n (za svaki n = 1, 2, ). Sluajna veliina Y = g ( X 1 , , X n ) , u kojoj
ne figuriu nepoznati parametri, tj. ne zavisi eksplicitno od nepoznatih parametara, zove se
statistika (u uem smislu rijei, za razliku od pojma statistike, u irem smislu, kao naune
discipline).

No, raspodjela statistike moe da zavisi od nepoznatih parametara. Ako je u pitanju


realizovani uzorak ( X 1 , , X n ) , onda je pripadna statistika jedan broj Y = g ( X 1 , , X n ) , tj.
realizovana vrijednost sluajne veliine Y = g ( X 1 , , X n ) .

U primjenama se najee posmatraju sljedee statistike:

1 n
1) Suma uzorka: X = X n = X i koja se jo zove aritmetika sredina uzorka,
n i =1
srednja vrijednost uzorka (oekivanje uzorka).
1 n
2) S = S n = ( X i X n )2 varijansa (disperzija) uzorka.
2 2

n i =1

Takoe se koristi i tzv. ispravljena disperzija


1 n
( X i X n )2 ( n = 2, 3, ) .
'2
Sn :=
n 1 i = 1
Lako se vidi da vrijedi sljedea teorema.

Teorema 4.5.1. Neka je ( X 1 , , X n ) sluajan uzorak iz funkcije distribucije F i


neka je oekivanje od F i 2
varijansa od F. Tada je
23

2
E ( X ) = , Var ( X ) = , E ( S n' 2 ) = 2 .
n
1 n 1 n
Dokaz. Naime, E ( X ) = E X i = E ( X i ) = . Slino se dokazuju i ostale
ni =1 ni =1
dvije relacije.

1 n
Primjer 4.5.1. Ako je E ( X ) = m poznati parametar, onda je S n2 = ( X k m) 2
n k =1
jedna statistika, a ako je m nepoznati parametar, onda S n2 nije statistika.

Kao to smo rekli, osnovni problem u statistici je da se pomou uzorka ( X1, , X n )


neto zakljui o raspodjeli F ( x ) obiljeja X. Najee je situacija takva da o raspodjeli F ( x )
imamo neke prethodne informacije ili pretpostavke koje ne podvrgavamo provjeravanju. Npr.
esto iz optih razmatranja zakljuimo da vai aproksimativno centralna granina teorema te
uzimamo da (priblino) obiljeje X ima normalnu raspodjelu. Ako su nam matematiko
oekivanje m i varijansa 2 obiljeje X nepoznati, onda moemo rei da X ima raspodjelu
koja pripada familiji raspodjela { }
N ( m, 2 ) , < m < + , 2 > 0 , ili recimo, imamo
dovoljno razloga da pretpostavimo da X ima uniformnu raspodjelu na segmentu [ 0,b] , pri
emu je b nepoznat. Tada je familija raspodjela kojoj pripada raspodjela za X data sa
{ ( 0, b ) , b > 0} . Uopte, redovno pretpostavljamo da obiljeje X ima distribuciju
(raspodjelu) koja pripada familiji distribucija {F ( x, ) , } . Ova familija se naziva
dopustiva familija distribucija, gdje parametar prolazi kroz skup dopustivih vrijednosti
. ta emo usvojiti kao dopustivu familiju raspodjela u konkretnoj situaciji zavisi od nekih
naih ranijih informacija i od problema koji nas interesuje. Izbor te familije je u optem
sluaju subjektivan. Meutim, noviji pravac u statistici, tzv. Bajesovski prilaz, jo je
ortodoksniji u tom smislu, jer on pretpostavlja da parametar koji odreuje raspodjelu
F ( x, ) obiljeja X pripada skupu pretpostavljajui jednu sluajnu veliinu sa nekom
apriornom raspodjelom vjerovatnoe G ( ) iji izbor zavisi od prethodnih informacija
obiljeja X, tj. subjektivan je.

4.6. Ocjene parametara po uzorku

Neka sluajna veliina X ima distribuciju F ( x, ) , gdje je nepoznat parametar.


Pretpostavimo da treba ocijeniti parametar , odnosno da treba odrediti priblino njegovu
vrijednost u zavisnosti od nekog uzorka n : x1 , , xn . Oznaimo tu ocjenu sa .
Oigledno zavisi od uzorka n : x1 , , xn , tj. = ( X 1 , , X n ) . Kako u i-toj seriji iz
n-ogleda uzima neku vrijednost i to se javlja kao sluajna veliina : R , te
se moe govoriti o distribuciji (raspodjeli) te veliine, a i o njenim numerikim
karakteristikama. Da bi ocjena nepoznatog parametra imala praktinu (upotrebljivu)
vrijednost, na nju se postavljaju odreeni zahtjevi. Otuda imamo sljedee definicje o
ocjenama parametara:
24

Definicija 4.6.1. Ocjena = ( X 1 , , X n ) nepoznatog parametra zove se centrirana


(nepristrasna, nepomjerljiva), ako je
E = . ( ) ( )
Ako svojstvo ( ) ( )
nije ispunjeno, onda je ocjena pristrasna i tada je E = + ili

( )
E = , gdje je pristrasnost.

Eliminacijom pristrasnosti (odnosno ' = ) ili ' = dobije se nepristrasna

ocjena.
Definicija 4.6.2. Ocjena n parametra zove se asimptotski centrirana ako
( )
E n , n .

Definicija 4.6.3. Ocjena parametra zove se stabilna (postojana, konzistentna,


mona) ako za proizvoljan > 0 vrijedi da je

n
{ }
lim P = 1 , tj.
P
, n .
.
Definicija 4.6.4. Nepristrasna i stabilna ocjena zove se najefektivnijom
(najefikasnijom) ako ona ima najmanju varijasu (disperziju) od svih nepristrasnih i stabilnih
ocjena parametra iz familije , tj.
Var = inf Var .

Napomenimo, da se esto efektivnost definira u klasi nepristrasnih ocjena (procjena).

4.7. Grupisanje statistikih podataka. Numerike (statistike) karakteristike


obiljeja

4.7.1. Grupisanje statistikih podataka

O grupisanju statistikih podataka govorili smo ranije kada smo definirali pojmove
statistike raspodjele uzorka, te govorili o pojmovima grafikog metoda u statistici, (a i u
teoriji vjerovatnoe). Neka je iz nekog statistikog skupa formiran uzorak od n elemenata
n : x1 , , xn . Obino se taj uzorak prikazuje u obliku statistikog niza zadanom tabelom

i 1 2 ... n
xi x1 x2 ... xn

Da bi se izraunale numerike karakteristike kao to su: sredine uzorka (aritmetika,


geometrijska, harmonijska, kvadratna i dr.), medijana, modus, statistiki momenti, kvartili,
karakteristike poloaja, asimetrije ekscesa i dr. (na osnovu centralnog graninog teorema
prirodno je oekivati da e ove uzorake karakteristike biti dobre ocjene za odgovarajue
25

karakteristike osnovnog skupa) i ocjene raspodjele sluajne veliine X obino se vri


grupisanje ovih podataka. Pri tome se u sluaju diskretne sluajne veliine vrijednosti xi
m
poredaju po veliini i raunaju frekvencije mi ili i (n obim) pojavljivanja sluajne veliine
n
X. Kao rezultat dobije se tablica:

xi x1 xn xi x1 xn
mi m1 mn mi m1 mn
n n n

tj. dobije se kao prikaz statistike raspodjele uzorka.

Ako se radi o neprekidnoj sluajnoj veliini, podaci se grupiu tako da se interval


posmatrane vrijednosti podijeli na k podintervala (podsegmenata) jednake duine:
[ x0 , x1 ] , , xk 1 , xk i izrauna relativna frekvencija sluajnog dogaaja koji se sastoji u
tome da sluajna veliina uzme vrijednosti u posmatranom intervalu. Tako se dobije tabela

interval [ x0 , x1 ] xk 1 , xk
mi m1 mk
n n n
k
mi
pri emu je
i =1 n
= 1.

Broj podintervala se bira na osnovu iskustvenih formula, tako npr. moe se uzeti da je k
log n
najvei prirodni broj za koji je k 1 + . Poreenjem poligona i kumulativa (empirijskih
log 2
funkcija distribucije za diskretne i intervalne nizove) i histograma frekvencija za intervalne
nizove sa graficima funkcija frekvencija (funkcije vjerovatnoe) i funkcija distribucije
teoretskih raspodjela, moe se donijeti ocjena (pretpostavka) o raspodjeli posmatrane sluajne
veliine.

4.7.2. Osnovna sredina, sredina uzorka i ocjena oekivane sredine

Svakodnevno ujemo da se govori o prosjeku plata radnika jedne fabrike, ili o srednjoj
ocjeni uspjeha uenika jednog razreda i sl. Slobodno govorei, prosjek je srednji broj ili
sredina oko koje se grupiu vrijednosti obiljeja, pa esto daje dobru obavijest o tom
obiljeju.

Pretpostavimo da treba izuiti obiljeje X za diskretni osnovni skup.

Definicija 4.7.1. Osnovnom sredinom naziva se aritmetika sredina obiljeja X


osnovnog skupa.
26

Oznaimo osnovnu sredinu sa X O . Ako su sve vrijednosti x1 , , xn obiljeja X


osnovnog skupa obima N razliite, onda prema datoj definiciji imamo
1 N
X O = X i (1) .
N i =1
Ako se obiljeje (osobina) X razmatra kao sluajna veliine ije su mogue vrijednosti
1
x1 , , xn sa istom vjerovatnoom p = , onda je matematiko oekivanje takve sluajne
N
1 1 1 1 n
veliine dato sa E ( X ) = x1 + x2 + + xn = xi , tj. slijedi da je oekivanje
N N N N i =1
obiljeja X dato izrazom
E ( x) = XO . ( 2)

Ako vrijednosti x1 , , xk imaju respektivno frekvencuiju N1 , , N k , pri emu je


k

N
i =1
i = N , onda je
k
1
XO =
N
N X
i =1
i i . ( 3)
Nije teko zakljuiti da jednakost ( 2) vai i za ovaj sluaj. Meutim, za neprekidnu
raspodjelu obiljeja X uzima se po definiciji da je
XO = E ( X ) . ( 4)
Pretpostavimo da za izuavanje osnovnog skupa u odnosu na obiljeje X iz njega
izdvojimo uzorak obima n. Tada se definiraju slijedei pojmovi (u skladu sa ranijim
definicijama):

Definicija 4.7.2. Sredina uzorka X n naziva se aritmetika sredina vrijednosti obiljeja


uzorka.

Ako su sve vrijednosti x1 , , xn razliite, onda je


1 n
Xn = xi . ( 5)
ni =1
Ako pak vrijednosti x1 , , xk imaju, respektivno, frekvencije n1 , , nk , pri emu je
n1 + + nk = n , onda je
1 k
Xn = ni xi .
n i =1
( 6)
Kako je svaki uzorak obima n izvuen iz osnovnog skupa kome odgovara broj X n
odreen sa ( 5) ili ( 6 ) , to se sredina uzorka moe smatrati kao sluajna veliina X n . Sredina
uzorka uzima se kao kvalitetna ocjena osnovne sredine, jer se pokazuje da je ova ocjena
nepomjerljiva i mona. Zapravo, pokazuje se da je (kao to smo vidjeli) E ( X n ) = X O i da je

( )
lim P X n X O < = 1 za svaki > 0 . Otuda slijedi da pri neogranienom poveanju obima
n

uzorka sredina uzorka tei po vjerovatnoi ka osnovnoj sredini. Posljednja jednakost znai da
27

sredina uzorka predstavlja monu ocjenu osnovne sredine. Slijedi takoe, da su sredine
uzorka, naene po vie uzoraka sa dovoljno velikim obimom iz nekog osnovnog skupa,
jednake meusobno, to izraava svojstvo stabilnosti sredine uzorka.

4.7.2. Osnovna disperzija, disperzija uzorka i empirijska disperzija

Kao karakteristike rasijanja vrijednosti obiljeja X osnovnog skupa oko svoje srednje
vrijednosti (ili u okolini svoje srednje vrijednosti) slue sljedei pojmovi: osnovna varijansa
(disperzija) te osnovno kvadratno odstupanje (standardna devijacija), to se definira na
sljedei nain:

Definicija 4.7.3. Osnovnom srednjom disperzijom DO naziva se aritmetika


sredina kvadrata odstupanja vrijednosti obiljeja X osnovnog skupa od njegove srednje
vrijednosti X O . Ako su sve vrijednosti x1 , , xN obiljeja X osnovnog skupa obima N
razliite, onda je prema datoj definiciji
1 N
DO = ( xi X O ) 2 , ( )
N i =1
a ako vrijednosti x1 , , xk imaju respektivno frekvencije n1 , , nk , n1 + + nk = n , onda je
k
1
DO =
N
n (x X
i =1
i i O )2 . ( )

Definicija 4.7.4. Osnovnim srednjim kvadratnim odstupanjem O naziva se kvadratni


korijen osnovne disperzije DO , tj. O = DO (aritmetiki korijen).

Kao karakteristike rasijanja vrijednosti osobine uzorka u okolini X n uvode se pojmovi


disperzija uzorka i srednje kvadratno odstupanje uzorka.

Definicija 4.7.5. Disperzijom uzorka Dn naziva se aritmetika sredina kvadrata


odstupanja. Ako su vrijednosti x1 , , xn obiljeja X uzorka obima n sve razliite, onda je
1 n
Dn = ( xi X n )2 , a ako vrijednosti x1 , , xk imaju respektivno frekvencije n1 , , nk , za
ni =1
1 k
koje je n1 + n2 + + nk = n , onda je Dn =
ni =1
ni ( xi X n ) 2 .

Definicija 4.7.6. Srednje kvadratno odstupanje n uzorka definira se izrazom


n = Dn (aritmetiki korijen).

Za izraunavanje disperzije uzorka moe se koristiti formula: Dn = X 2 ( X n ) , gdje


2

1 k 1 k
je X n =
n i =1
ni xi , X n
2
=
n i =1
ni xi 2 .
28

DO = X O2 ( X O ) , odnosno da vai
2
Slino se dokazuje da vai da je:
n 1
E ( Dn ) = DO . Kako je oekivanje E ( Dn ) DO , to se disperzija uzorka Dn javlja
n
pomjerljivom (nije centrirana) ocjenom osnovne disperzije Dn . Da bi dobili nepomjerljivu
ocjenu (centriranu) osnovne disperzije DO , uvodi se pojam empirijske (ispravljene)
disperzije S 2 sljedeom definicijom:

n
Definicija 4.7.7. Empirijska disperzija S 2 definira se izrazom S 2 = Dn .
n 1

Otuda imamo da je
n 1 k 1 k
S2 = ni ( xi X n )2 = ni ( xi X n ) 2 .
n 1 n i = 1 n 1 i =1

n 1 n n n 1
Kako je E ( S 2 ) = E Dn = E ( Dn ) = DO = DO ,
n n 1 n 1 n

to je empirijska disperzija nepomjerljiva (nepristrasna) ocjena osnovne disperzije. Za ocjenu


srednjeg kvadratnog odstupanja osnovnog skupa koristi se ispravljeno srednje kvadratno
odstupanje ili empirijska standardna devijacija koja se definira izrazom

n 1 n
S = S2 =
n 1
Dn = ( xi X )2 ,
n 1 i = 1

tj. S je nepristrasna ocjena standardne devijacije O osnovnog skupa.

n 1
Na kraju dokaimo da je E ( Dn ) = DO . Zaista, imamo:
n

( )
E ( Dn ) = E S n
2 1 k
n i =1
1 n
= E ( xk X n ) 2 = E ( X k2 ) E
n k =1
(( X ) ) ,
n
2

a kako je

1 n 1 n
2

E (( X ) )
n
2

n k = 1 n k =1
1
= E Xk = 2 E Xk 2 + Xi X j = E ( X 2 ) +
n
n 1
n
( E ( X )) ,
2

i j

to imamo:
E Sn ( ) = n n1 E ( X ) n n1 ( E ( X )) = n n1
2 2 2 2
, .t.d.

You might also like