You are on page 1of 125

UVOD U STATISTIKU

 Dejan Brcanov
 Ekonomski fakultet u Subotici,
Univerzitet u Novom Sadu
 brcanovd@ef.uns.ac.rs
Zašto statistika?
 Statistika pruža znanja i koncepte za
 izdvajanjei razumevanje relevatnih podataka i
informacija,
 ispravno zaključivanje,

 uočavanje zakonitosti,

 uočavanje sličnosti/razlika u podacima,

 predviđanje,

 modeliranje pojava.
Gde se primenjuje?
Istorijski razvoj statistike
 status ili stato – državno uređenje, G. Ahneval XVIII
vek.
 4000 g. p.n.e – Kina,
 3000 g. p.n.e – Egipat,
 550 g. p.n.e. – Rimska republika (Rimski
cenzus, Servio Tulio),
 XVIII i XIX vek – Popisi stanovništva,
poljoprivrednih gazdinstava,
industrije.
Istorijski razvoj statistike
 XVII vek – razvoj statistike kao naučne discipline u
Nemačkoj i Engleskoj.
 XVIII vek – P. Laplace, A. Quetelet, C. Gaus, W.S.
Gosset, M.G. Kendal, R.A. Fisher, F. Yates, N.A.
Kolmogorov.
 Savremena statistika
 procene, rizici, tendencije, odnosi, modeli.
 ”Statistički način mišljenja će postati neophodan za
svakodnevni život, kao čitanje i pisanje” G.H.Wells
Osnovni pojmovi
Definicija statistike
 Grupa metoda koji se koriste za prikupljanje, analizu,
prezentaciju i interpretaciju podataka potrebnih za
odlučivanje.
 Skup naučnih metoda kvantitativnog i kvalitativnog
istraživanja varijacija masovnih pojava.
 Induktivni metod koji nastoji da otkrije opšte
karakteristike varijabiliteta posmatranog skupa.
 Deskriptivna i inferencijalna statistika
Predmet statističkog istraživanja
 Masovne pojave
 Varijabilitet
Osnovni pojmovi
 Osnovni skup (statistička masa, populacija)
skup istovrsnih elemenata
sa obeležjima koja variraju
od elementa do elementa i
po kojima se razlikuju.
Osnovni pojmovi
 Osnovni skup (statistička masa, populacija)
 Koliko obeležja (karakteristika) se analizira?
→ Jednodimenzionalan, višedimenzionalan

 Da li postoji kriterijum za podelu osnovnog skupa?


→ Homogen, diferenciran
 Da li je poznat broj jedinica u osnovnom skupu?
→ Konačan, beskonačan

 Prostorno, vremensko i sadržinsko određenje


osnovnog skupa
Osnovni pojmovi

 Statističke jedinice
 Osnovni elementi statističke mase koje imaju bar jedno
zajedničko obeležje koje se posmatra.

Obeležja
statističkih
jedinica

 Zajednička karakteristika statističkih jedinica koja se


posmatra.
Osnovni pojmovi

Atributivna
(kvalitativna,
Obeležja opisna)
statističkih Prekidna
(diskretna,
jedinica diskontinuirana)
Numerička
Neprekidna
(kontinuirana)
Merne skale
 Nominalna
 Ordinalna
 Intervalna
 Skala odnosa
Merne skale

Operacija
Merna
skala Apsolutni Relativni
Kategorizacija Rangiranje
odnos odnos
Nominalna + – – –

Ordinalna + + – –

Intervalna + + + –

Skala odnosa + + + +
Opisna statistika
Opisna statistika
 Grupisanje i sređivanje statističkih podataka
 Prikazivanje statističkih podataka
 Tabelarno i grafički
 Izračunavanje osnovnih karakteristika statističkih
serija
 Srednjevrednosti
 Mere varijacije

 Mere oblika rasporeda


Grupisanje i sređivanje statističkih
podataka
 Cilj: Formiranje statističke serije
 uređeni skup varijacija obeležja posmatrane statističke
mase.
Tabelarno prikazivanje statističkih
podataka
 Statistička tabela - uokvirena površina u koju se
unosi statistička serija.
 Prema sadržaju razlikujemo proste, složene i
kombinovane tabele.
 Svako polje statističke tabele mora biti popunjeno!
 Univerzalni znakovi:
– nema pojave,
… ne raspolaže se podatkom,
prosečna vrednost,
(O ) nepotpun, nedovoljno proveren podatak,
* ispravljen podatak,
↑← obuhvaćeno podatkom u pravcu strelice.
Grafičko prikazivanje statističkih
podataka
 Tačkasti
 Dijagram rasturanja
 Površinski
 Kružni dijagram, Bar dijagram, Histogram
 Linijski
 Poligon frekvencija, Polarni dijagram
 Prostorni
 Stereogram

 Kartogrami
Srednje vrednosti
 Kako reprezentovati celokupnu statističku masu?
 Kakav je odnos srednjih vrednosti prema
minimalnoj i maksimalnoj vrednosti obeležja?
 Da li srednja vrednost mora biti vrednost obeležja?
 Da li se može izraziti decimalnim brojem bez obzira na
tip podataka?
Srednje vrednosti

Izračunate Po položaju

• Aritmetička • Modus
sredina • Medijana
• Geometrijska • Kvartili
sredina • Decili
• Percentili
Aritmetička sredina
Prosečna vrednost obeležja

Podaci predstavljaju Osnovni skup Uzorak

N n

Formula
x i x i
 i 1
x i 1

N n
Primer 1
 12 polaznika kursa izabranih na slučajan način
anketirano je o broju sati nedeljno koje provedu za
računarom:
20, 14, 21, 20, 10, 20, 15, 25, 50, 35, 40, 30.

 Odrediti prosečno vreme provedeno pred


računarom.
Geometrijska sredina
Relativni ili proporcionalni pokazatelji,
geometrijska progresija

n
Formula Gn x
i 1
i
Primer 2
 Kamatna stopa prve godine iznosi 3%, druge 20%,
a treće 40%.
Koliko iznosi prosečna kamatna stopa tokom 3
godine?
Modus
Najčešća vrednost obeležja

Bimodalne i multimodalne serije podataka

Kada modus ne može da se odredi?


Medijana
Centralna poziciona vrednost

Kakva je serija podataka? Neparan broj podataka Paran broj podataka

x n  x n 1
Formula Me  x n1 Me  2 2

2
2
Mere varijacije
 Pokazatelji apsolutnih i relativnih odstupanja
vrednosti obeležja od aritmetičke sredine
Interval varijacije

Varijansa

Standardna devijacija

Koeficijent varijacije

Normalizovano odstupanje
Primer
 12 polaznika kursa izabranih na slučajan način
anketirano je o broju sati nedeljno koje provedu za
računarom:
20, 14, 21, 20, 10, 20, 15, 25, 50, 35, 40, 30.

 Odrediti mere varijacije


Interval varijacije

Formula I  xmax  xmin


Varijansa

Podaci predstavljaju Osnovni skup Uzorak

Formula
 (x  )
i
2 n

 (x  x) 2

  i 1
2 i

N  u2  i 1

n 1
Varijansa
Standardna devijacija

Podaci predstavljaju Osnovni skup Uzorak

Formula   2  u   u2
Koeficijent varijacije

Podaci predstavljaju Osnovni skup Uzorak

 u
Formula V 100 Vu  100
 x
Normalizovano odstupanje

Podaci predstavljaju Osnovni skup Uzorak

X  X x
Formula U Z  U u  Zu 
 u
Mere oblika rasporeda
 Koeficijent x  Me  Mo
3 Negativna
asimetrije asimetrija
( 3  0)

x  Me  Mo
|  3 | 0,25  mala asimetrija Simetričan
0,25 |  3 | 0,50  srednja asimetrija raspored
|  3 | 0,50  jaka asimetrija ( 3  0)

Mo  Me  x
Pozitivna
asimetrija
( 3  0)
Mere oblika rasporeda
 Koeficijent spljoštenosti  4

Više spljošten Normalno spljošten Više izdužen


(4  3) ( 4  3) ( 4  3)

Napomena: α4 se često poredi sa vrednošću 0.


Raspodela verovatnoće za slučajne
promenljive
Teorija verovatnoće
Eksperimenti

Ishodi eksperimenata
{Pismo, Grb} {1,2,3,4,5,6}
Skup elementarnih događaja = skup svih ishoda nekog eksperimenta
Primer
Kockica se baca jednom. Ako A označava događaj da
kockica pokazuje paran broj a B događaj da kockica
pokazuje broj manji od 4, odrediti presek i uniju
događaja A i B.

A  B  {1,2,3,4,6} A  B  {2}
Pojam verovatnoće
 Laplasova (klasična) definicija verovatnoće
 Statistička definicija verovatnoće
 Aksiomatska definicija verovatnoće
 Geometrijska verovatnoća
Laplasova (klasična) definicija
verovatnoće

  {1 , 2 ,..., n } Konačan skup elementarnih događaja

pi  P(i ) 
1 svaki elementarni događaj ima istu
n verovatnoću realizacije

A
k
A  {i1 , i2 ,..., ik } P( A) 
n
Statistička definicija verovatnoće

n ponavljanja eksperimenta

m uspešnih realizacija

m
P ( A) 
n
Osnovne osobine

1. 0  P( A)  1
2. P()  1
3. Verovatnoća unije događaja A i B
P( A  B)  P( A)  P( B)  P( A  B)
Permutacije i kombinacije
Permutacije i kombinacije

n n!
KOMBINACIJE Cnk    
 k  k!(n  k )!
n!
PERMUTACIJE Pnk 
(n  k )!
Permutacije i kombinacije

KOMBINACIJE 10 načina

PERMUTACIJE 60 načina
Binomna verovatnoća
 Bernulijeva shema:
n ponavljanja eksperimenta,
posmatra se događaj A,
p - verovatnoća realizacije
Binomna verovatnoća
 Bernulijeva shema:
2 ponavljanja eksperimenta,
posmatra se događaj A - kocka pokazuje broj 6
p - verovatnoća realizacije
 2
0 AA  (1  p) 2
 
 0
1 AA  p(1  p)  2
 
1 AA  p(1  p) 1
 2
2 AA  p2  
 2
Binomna verovatnoća
 Verovatnoća da se prilikom n ponavljanja
eksperimenta, k uspešno realizuje

n k
p(n; k )    p (1  p) nk
k 
Puasonova verovatnoća
 Granični slučaj binomne verovatnoće kada
n  i p  0
 U praksi n ≥ 20 i p ≤ 0,05.

mk m
p(n; k )  e , m  np
k!
Slučajne promenljive
 Slučajna promenljiva X je preslikavanje koje
svakom elementarnom događaju    pridružuje
realan broj X : R
Prekidna ili neprekidna slučajna
promenljiva?
 Bacanje novčića, elementarnom događaju
pridružuje se broj prikazanih grbova.
 Novčić se baca 3 puta, elementarnom događaju
pridružuje se broj prikazanih grbova.
 Kockica se baca 2 puta, elementarnom događaju
pridružuje se zbir prikazanih brojeva.
 Tačna težina studenta izabranog na slučajan način.
 Tačno vreme provedeno na pauzi.
 Tačan broj sekundi potrebnih da se popuni anketa.
Prekidne slučajne promenljive

RX  {x1, x2 ,...} Skup mogućih vrednosti slučajne promenljive

P( X  xk )  pk Verovatnoća sa kojom slučajna promenljiva X


“uzima” vrednost xk
Zakon raspodele slučajne promenljive X:

 x1 x2 ... 
X   
 p1 p2 ... 
Osobine:
P( X  RX )  1
0  pk  1
Novčić se baca 3 puta, elementarnom događaju
pridružuje se broj prikazanih grbova.

Zakon raspodele slučajne promenljive:


 0 1 2 3
X   1 3 3 1 
8 8 8 8
Matematičko očekivanje prekidne
slučajne promenljive
n
E ( X )   xi pi
i 1

Vrednost koja se u proseku može očekivati


nakon velikog broja eksperimenata
Varijansa prekidne slučajne
promenljive
  Var( X )  E[( X  E( X )) ]  E ( X )  ( E ( X ))
2
X
2 2 2

Očekivano kvadratno odstupanje oko


prosečne vrednosti (E(X)) slučajne promenljive
Bernulijeva slučajna promenljiva

Eksperiment

Neuspešan Uspešan

 0 1 
X   
1  p p 

Osobine:
E( X )  p
Var ( X )  p(1  p)
Binomna slučajna promenljiva
Elementarni događaj iz  0 1 k n 
X  n 0 n 
Bernulijeve šeme
0 
 pq n
1
p1q n 1
...

n
k
p k q nk
...

n
n
p nq0 

Broj realizacija
eksperimenta

Osobine:
E ( X )  np
Var ( X )  np(1  p)
Binomna slučajna promenljiva
Elementarni događaj iz  0 1 k n 
X  n 0 n 
Bernulijeve šeme
0 
 pq n
1
p1q n 1
...

n
k
p k q nk
...

n
n
p nq0 

Broj realizacija
eksperimenta

Osobine:
E ( X )  np
Var ( X )  np(1  p)
Binomna slučajna promenljiva
Elementarni događaj iz  0 1 k n 
X  n 0 n 
Bernulijeve šeme
0 
 pq n
1
p1q n 1
...

n
k
p k q nk
...

n
n
p nq0 

Broj realizacija
eksperimenta

Osobine:
E ( X )  np
Var ( X )  np(1  p)
Puasonova slučajna promenljiva

Granični slučaj binomne slučajne promenljive


za veliki broj eksperimenata i malu verovatnoću
realizacije eksperimenta:

mk k
P( X  k )  e
k!

Osobine:
E( X )  m
Var ( X )  m
Neprekidne slučajne promenljive

Funkcija gustine fX:

1. f ( x)  0, x  D Nenegativna na oblasti definisanja

2. f ( x )dx  1 Ukupna površina ispod funkcije


D
gustine iznosi 1
b
3.P(a  X  b)   f ( x)dx Verovatnoća da X “uzme” neku
a vrednost u intervalu [a,b]
Matematičko očekivanje neprekidne
slučajne promenljive

E ( X )   t  f X (t )dt

Varijansa neprekidne slučajne
promenljive
  Var( X )  E[( X  E( X )) ]  E ( X )  ( E ( X ))
2
X
2 2 2
Normalan raspored
X : Ν ( ,  2 ),   R,  2  0
1  12  xm 
2

f X ( x)  e , xR
2 2

Osobine:
1. Funkcija gustine ima oblik simetričnog zvona,
2. Raspored je simetričan u odnosu na x = µ,
3. α3 = 0, α4 = 3,
4. E ( X )   Var( X )   2

5. Nosi naziv po Nemačkom matematičaru Gausu,


6. Veliki broj pojava ima približno normalan raspored
Normalan raspored
5. Nosi naziv po Nemačkom matematičaru Gausu
Normalan raspored
X : Ν ( ,  2 ),   R,  2  0
1  12  xm 
2

f X ( x)  e , xR
2 2
Normalan raspored
X : Ν ( ,  2 ),   R,  2  0
1  12  xm 
2

f X ( x)  e , xR
2 2
Normalan raspored
X : Ν ( ,  2 ),   R,  2  0
1  12  xm 
2

f X ( x)  e , xR
2 2
Standardizovan normalan raspored
Z : N (0,1) Osobine:
1  x22 E (Z )  0 Var ( Z )  1
f X ( x)  e , xR
2
Standardizovan normalan raspored
Z : N (0,1)

1  x22
f X ( x)  e , xR
2
Standardizovan normalan raspored

Normalizacija:

X 
Z

Normalan raspored
X : Ν ( ,  2 ),   R,  2  0
hi-kvadrat raspored
Zi : N (0,1), i  1,..., r nezavisne slučajne promenljive
 r2  Z12  Z 22  ...  Z r2
Osobine:
E (  r2 )  r Var(  r2 )  2r
hi-kvadrat raspored
Zi : N (0,1), i  1,..., r nezavisne slučajne promenljive
 r2  Z12  Z 22  ...  Z r2
Osobine:
E (  r2 )  r Var(  r2 )  2r
Studentov t – raspored

Bolje reprezentuje male uzorke

Osobine:
1. Funkcija gustine je simetrična,
2. Raspored je simetričan u odnosu na t = 0,
3. α3 = 0,
r
4. E (t )  0 Var (t ) 
r 2
r r
Studentov t – raspored
Studentov t – raspored
Studentov t – raspored
Centralna granična teorema
Neka su X1, X2,..., Xn, slučajne promenljive, sa istom
očekivanom vrednošću µ i varijansom σ 2.
n n
Označimo sa X   X i i X  1n   X i . Kada n  
i 1 i 1
distribucija slučajne promenljive
X  n X 
Z 
n 2 2
n
teži ka slučajnoj promenljivoj sa standardizovanim
normalnim rasporedom.

“Raspored prosečnih vrednosti prati normalnu distribuciju”


Intervali poverenja
Metod uzorka
 Delimično posmatranje statističke mase sprovodi
se kada:
 Osnovni skup neograničen (beskonačan)
 Prikupljanje podataka populacije zahteva previše
resursa (novčanih ulaganja, vremena)
 Prikupljanje podataka o populaciji podložno greškama

 Prikupljanje informacija podrazumava uništenje


jedinice posmatranja
Metod uzorka

Populacija Uzorak

Uzorak Reprezentativan uzorak ima


strukturu sličnu osnovnom skupu
Uzorak

Način Nameran Prost slučajan


(neprobabilistički) (probabilistički)
izbora  kutija,
jedinica  bubanj,
 korak odabiranja,
iz  tablica slučajnih brojeva,
osnovnog  računar.
Sa ponavljanjem Bez ponavljanja
skupa
u
Zavisni uzorci Nezavisni uzorci
uzorak
Kako na osnovu informacija iz uzorka doći do
informacija o celokupnoj populaciji?
Statistika Parametar
uzorka populacije
x 

 u2 2
Kako proceniti parametre osnovnog
skupa?
Koliko iznosi parametar? Da li je parametar <, =, >
od referentne vrednosti?

Prosečan vek trajanja sijalice. Prosečan vek trajanja sijalice


iznosi 1000 h.

Prosečan broj škartova na Prosečan broj škartova na


proizvodnoj traci. proizvodnoj traci je manji od
100.
Kako proceniti parametre osnovnog
skupa?
Koliko iznosi parametar? Da li je parametar <, =, >
od referentne vrednosti?

Varijabilitet prinosa Varijabilitet prinosa


poljoprivredne kulture sa poljoprivredne kulture sa
zasejanih parcela. zasejanih parcela je manji od
1 ha.

Varijabilitet prognoziranih Varijabilitet prognoziranih


prihoda od akcija. prihoda od akcija ne prelazi
1000 n.j.
Kako proceniti parametre osnovnog
skupa?
Koliko iznosi parametar? Da li je parametar <, =, >?

Ocenjivanje Testiranje hipoteze o


parametra parametru
Statističke ocene parametara osnovnog
skupa na osnovu uzorka

Tačkaste:
Za parametar  { ,  2 }
odrediti vrednost  '

Intervalne:
Za parametar  { ,  2 }
i nivo pouzdanost i (1   )
odrediti A, B, tako da : P( A    B)  1  
Ocena aritmetičke sredine osnovnog
skupa

Koliko iznosi očekivan prosečan broj realizovanih


kredita?
Koliko iznosi prosečna novčana vrednost računara?
Koliko iznosi prosečno vreme pripreme ispita?
Primer

Na slučajan način izabrano je 100 sijalica i


zabeležen je njihov radni vek:

Vreme rada u h (xi) 995 1000 1002 1005 1010


Broj sijalica (fi) 10 30 30 20 10

Koliko iznosi prosečan radni vek svih


proizvedenih sijalica?
Ocena aritmetičke sredine osnovnog
skupa

X 
ima standardizovan normalan raspored (CGT)
2
n

X 
1  P ( u    u )
2  2

n
 
 P ( u   X    u )
2
n 2
n
 
 P( X  u     X  u )
2
n 2
n

P(u  U  u )  1  
2 2
Za vrednosti konkretnog uzorka x1, x2,..., xn, oko
tačkaste ocene x formira se interval
 
( x  u , x  u )
2
n 2
n
koji sa verovatnoćom (1-α) sadrži aritmetičku sredinu μ.

Drugim rečima: formiranje velikog broja uzoraka i


 
intervala ( x  u
 ,x u ) 
2
n 2
n
100·(1-α)% intervala sadržaće aritmetičku sredinu
osnovnog skupa µ.
Primer
Prosečno nedeljno vreme provedeno na društvenim
mrežama studenata Ekonomskog fakulteta iznosi 9,58
sati sa standardnom devijacijom 7,73 sati. Na osnovu
uzorka sa ponavljanjem od 12 studenata formirati
90% interval poverenja za prosečno provedeno
vreme na društvenim mrežama svih studenata.
Uzorak 1: 7, 2, 25, 10, 0, 2, 12, 15, 9, 15, 10, 15.
.
.
.

Uzorak 5: 2, 14, 10, 0, 15, 0, 4, 0.5, 2, 7,10, 1.


.
.
.

Uzorak 10: 15, 12, 14, 10, 7, 7, 20, 30, 7, 0, 16, 0.


Šta utiče na preciznost formirane
ocene?
1. Za dat nivo pouzdanosti (1-α) i veličinu uzorka n,
povećanjem standardne devijacije σ interval se
povećava ili smanjuje?

2. Za dat nivo pouzdanosti (1-α) i standardnu devijaciju σ,


povećanjem veličine uzorka n, interval se
povećava ili smanjuje?

3. Za datu veličinu uzorka n i standardnu devijaciju σ,


povećanjem nivoa pouzdanosti (1-α) interval se
povećava ili smanjuje?
Primer sa sijalicama

Problem 1:
Nije (uvek) izvodljivo formirati uzorak
sa ponavljanjem.
Problem 2:
Varijansa rasporeda σ2 nije (uvek) poznata.
Problem 1

Uzorak sa ponavljanjem Uzorak bez ponavljanja

Matematičko očekivanje
rasporeda aritmetičkih μ μ
sredina uzoraka
Varijansa rasporeda
aritmetičkih sredina
2 2 N n
uzoraka n n N 1
Standardna devijacija   N n
rasporeda aritmetičkih
sredina uzoraka n n N 1

U praktičnim primenema uzorak sa ponavljanjem i


uzorak bez ponavljanja takav da je n ≤ 0,05·N
se tretiraju na isti način.
Problem 2

X 
Slučajna promenljiva t
sX

ima Studentov raspored sa n - 1 stepeni slobode


Ocena standardne greške
rasporeda aritmetičkih sredina uzoraka

Kakvi su podaci? Formula

Uzorak sa ponavljanjem u
ili uzorak bez sX 
n
ponavljanja i n/N ≤ 5%

Uzorak bez ponavljanja i u N n


sX 
n/N > 5% n N 1
Izbor teorijskog rasporeda

1. Da li je poznata varijansa osnovnog skupa ?


2. Da li je skup podataka ima normalan raspored?
3. Broj jedinica posmatranja?
Da li je poznata varijansa σ2?

Da Ne
Da li je skup podataka Da li je skup podataka
normalan? normalan?
Da Ne Da Ne

Proizvoljan Da li je Da li je *
broj podataka n ≥ 30? n ≥ 30?
Da Ne Da Ne

z z * t ili z t
•Praktični rezultati pokazuju da je za simetričan unimodalan raspored podataka
prihvatljiva upotreba Studentovog t-rasporeda.
Teorijski Ocena aritmetičke sredine
Total osnovnog skupa
raspored osnovnog skupa

Normalan
x  u s X    x  u s X N ( x  u s X )  N  N ( x  u s X )
raspored 2 2 2 2

Studentov
x  t( ,r ) s X    x  t( ,r ) s X N ( x  t( ,r ) s X )  N  N ( x  t( ,r ) s X )
raspored

U praktičnim primenama za n ≥ 30 Studentov raspored aproksimira se normalnim.


Uzorci sa n < 30 nazivaju se “mali uzorci”.
Primer sa sijalicama

Na slučajan način izabrano je 100 sijalica i


zabeležen je njihov radni vek:

Vreme rada u h (xi) 995 1000 1002 1005 1010


Broj sijalica (fi) 10 30 30 20 10

Uz nivo pouzdanosti 95% odrediti interval


poverenja za prosečan radni vek svih
proizvedenih sijalica.
Ocena varijanse osnovnog skupa
 Na osnovu hi-kvadrat rasporeda uz pretpostavku o
normalnoj distribuciji podataka:
 ( n  1) s 2 ( n  1) s 2 
 , 
  2
1  
2
 2 2 
Primer sa sijalicama

Na slučajan način izabrano je 100 sijalica i


zabeležen je njihov radni vek:

Vreme rada u h (xi) 995 1000 1002 1005 1010


Broj sijalica (fi) 10 30 30 20 10

Uz nivo pouzdanosti 95% odrediti interval


poverenja za varijansu radnog veka svih
proizvedenih sijalica.
Elementi verifikacije statističkih
hipoteza
Testiranje statističkih hipoteza o
parametrima osnovnog skupa

1.Formulacija statističkih hipoteza,


2.Izbor statistike testa i rasporeda verovatnoća,
3.Izbor nivoa značajnosti testa,
4.Formulisanje pravila odlučivanja,
5.Izvlačenje uzorka i izračunavanje statistike testa,
6.Donošenje odluke o statističkoj hipotezi.
Testiranje statističkih hipoteza o
parametrima osnovnog skupa
 { ,  2 }
Statistička hipoteza
Prosta Složena
H:ϴ = ϴ0 H:ϴ > ϴ0

Nulta hipoteza Alternativna hipoteza


H0:ϴ = ϴ0 H1:ϴ < ϴ0 (Jednostrana)
H1:ϴ ≠ ϴ0 (Dvostrana)

Statistička hipoteza ili istraživačka hipoteza?


Formulisati nultu i alternativnu hipotezu:

Prosečan vek trajanja sijalice iznosi 1000 h.

H0:µ = 1000
H1:µ ≠ 1000

Prosečan broj škartova na proizvodnoj traci je manji od


100.
H0:µ ≥ 1000
H1:µ < 1000
Odluka nakon testiranja o H0
Stvarna situacija
Prihvaćena Odbačena
Greška I vrste
Ispravna odluka
Istinita H0 (α)
(1-α)
[nivo značajnosti]
Ispravna odluka
Greška II vrste
Neistinita H0 (1-β)
(β)
[moć testa]
Testiranje aritmetičke sredine za
poznatu varijansu
X 
ima standardizovan normalan raspored (CGT)
 2

Određivanje kritične oblasti:

H0:µ ≥ 1000 H0:µ = 1000 H0:µ ≤ 1000


H1:µ < 1000 H1:µ ≠ 1000 H1:µ > 1000
Primer
 U bankomatu treba ostaviti dovoljnu količinu novca
tokom vikenda. Međutim, banka ne želi da ostavi
prevelike zalihe novca i smatra da je prosečan iznos
po transakciji normalno raspoređen sa sredinom 300
n.j. i standardnom devijacijom 100 n.j.
 Da li se uz nivo pouzdanosti 95% može smatrati da je
procena banke o prosečnom iznosu ispravna, ako je
na osnovu 36 slučajno izabranih transakcija prosečan
iznos 340 n.j.?

[H0:µ ≤ 300; H1:µ > 300]


[u0=2,4 > 1,645 → H0 se odbacuje]
p - vrednost
 Najmanji nivo značajnosti pri kojem se nulta
hipoteza može odbaciti na osnovu uzorka.
Ilustracija za H0:µ ≤ µ0 H1:µ > µ0

(p < α → H0 se odbacuje) (p ≥ α → H0 se prihvata)


p - vrednost

Za prethodni primer: p  P( X  340)


 
 
340  300
 P U  
 100 
 
 36 
 P(U  2,4)
 0,0082
Testiranje aritmetičke sredine osnovnog
skupa za nepoznatu varijansu

Prosečan broj realizovanih kredita iznosi najmanje 50?


Prosečna novčana vrednost računara iznosi 50000 n.j.?
Prosečno vreme pripreme ispita je manje od 20 sati?
Testiranje aritmetičke sredine osnovnog
skupa za nepoznatu varijansu

Veličina uzorka Statistika testa

Normalan X  0
u0 
raspored sX

Studentov X  0
t0 
t-raspored sX

U praktičnim primenama za n ≥ 30 Studentov raspored aproksimira se normalnim.


Uzorci sa n < 30 nazivaju se “mali uzorci”.
Primer sa sijalicama

Na slučajan način izabrano je 100 sijalica i zabeležen je


njihov radni vek:
Vreme rada u h (xi) 995 1000 1002 1005 1010
Broj sijalica (fi) 10 30 30 20 10
a) Da li se uz nivo pouzdanosti 95% može smatrati da
prosečan radni vek svih sijalica iznosi 1000h?
b) Da li se uz nivo pouzdanosti 95% može smatrati da je
prosečan radni vek svih sijalica veći od 1000h?
Određivanje površine ispod normalnog rasporeda u
MS EXCEL-u za zadatu kritičnu vrednost z0
Određivanje kritične vrednosti normalnog rasporeda
u MS EXCEL-u za zadatu verovatnoću P
 Aktiviranje modula za statističku analizu u MS
Excel-u
 Office button
 Excel options

 Add-ins → Go

 Uključiti Analysis ToolPack

 Modul je dostupan u meniju Data → Data Analysis

You might also like