Professional Documents
Culture Documents
MARIJANA RAJKOVIĆ
Travnik, 2021.
SVEUČILIŠTE/UNIVERZITET „VITEZ“ VITEZ
SEMINARSKI RAD
IZJAVA: Ja, Marijana Rajković, student Sveučilišta/Univerziteta “Vitez“ Vitez, Indeks broj:
odgovorno i uz moralnu i akademsku odgovornost izjavljujem da sam ovaj rad izradila
potpuno samostalno uz korištenje citirane literature i pomoć mentora.
Predmet: Statistika
Indeks broj:
1. UVOD.........................................................................................................................1
2. STATISTIČKO ZAKLJUČIVANJE..........................................................................3
9. ZAKLJUČAK...........................................................................................................19
10. LITERATURA........................................................................................................20
1. UVOD
Svrha i cilj ovog istraživanja jeste na što lakši način objasniti postupak testiranja
statističke hipoteze, načine testiranja i pogreške koje se mogu javiti.
5
Prvi, uvodni dio, se odnosi na problem, predmet i objekat istraživanja, svrhu i ciljeve
istraživanja, radnu hipotezu, naučne metode korištene tokom istraživanja i strukturu rada radi
lakšeg praćenja materije.
Treći dio rada govori o testiranju statističke hipoteze uopćeno te o koracima od kojih
se sastoji postupak testiranja.
U četvrtom, petom, šestom i sedmom dijelu rada su, kroz primjere, obrađeni načini
testiranja statističke hipoteze, koji obuhvataju testiranje hipoteze za vjerovatnoću binomne
distribucije n i aritmetičke sredine (kada je varijansa poznata i nepoznata i razlike između
aritmetičkih sredina), testiranje o proporciji osnovnog skupa na bazi uzorka i razlike
proporcija, te pojam i oblike χ2 testa.
Osmi dio rada se bavi pogreškama koje se mogu dogoditi prilikom testiranja statističke
hipoteze.
I naposlijetku, završni dio rada, odnosno zaključak, koji se sastoji od kratkog pregleda
cijelog seminarskog rada.
6
2. STATISTIČKO ZAKLJUČIVANJE
7
3. TESTIRANJE STATISTIČKIH HIPOTEZA
8
Jednostavno rečeno, statistika testa kvantificira uzorak podataka. U statistici se izraz
"statistika" odnosi na bilo kakvo mapiranje (ili funkciju) između uzorka podataka i numeričke
vrijednosti. Popularni primjeri su srednja vrijednost ili varijansa. Formalno, statistika testa se
može zapisati kao
tn = T( D(n))
gdje je D(n) = x1, ..., xn uzorak podataka veličine uzorka n. Ovdje se mapiranje označava sa
T, a vrijednost koja se dobija tn. Tipično, statistika testa može pretpostaviti realne vrijednosti,
tj. tn R, ali su moguća ograničenja.
Statistika testa prisvaja središnju ulogu u testiranju hipoteze jer odlukom koja
statistika testa se upotrebljava, određuje se test hipoteze u velikoj mjeri, iz razloga što će se
statistika testa uključiti u hipoteze koje se formuliraju u drugom koraku. Zbog toga treba
pažljivo odabrati željenu statistiku testa koja je važna za provedeno istraživanje. Bitno je
naglasiti da se u ovom koraku samo bira statistika testa, ali ne i ocjenjuje i koristi.
Statistička hipoteza može biti prosta i složena. Hipoteze H0 i H1 mogu biti postavljene
na tri načina:
9
H0 (t ≥ t0) protiv H1 (t > t0);
H0 (t ≤ t0) protiv H1 (t > t0).
Prva kombinacija hipoteza predstavlja dvosmjerni test, dok je kod preostale dvije u
pitanju jednosmjerni test.
Npr. ako na skupini od 1000 bolesnika primijenimo novi lijek za regulisanje visokog
krvnog tlaka, zanima nas da li je nakon primjene lijeka došlo do statistički značajnog
smanjenja krvnog tlaka. Da bismo utvrdili je li smanjenje krvnog tlaka statistički značajno uz
nivo rizika od 5%, pomoću t-tablica (ili tablica z-vrijednosti kad su uzorci veliki)
provjeravamo je li dobivena t-vrijednost veća od granične uz p < 0,05 (ali samo s jedne strane
t-distribucije), ako je t > 1,64 (kod velikih uzoraka), dolazi do statistički značajnog smanjenja
visokog krvnog tlaka nakon primjene novog lijeka. Ako se odlučimo za rizik od 1%, dobivenu
t-vrijednost upoređujemo sa graničnom uz p < 0,01 t > 2,30 (kod velikih uzoraka) dolazi
do statistički značajnog smanjenja visokog krvnog tlaka, što je prikazano na slici ispod.
1
https://towardsdatascience.com/one-tailed-or-two-tailed-test-that-is-the-question-1283387f631c
(29.01.2021.)
10
U općenitoj raspravi o glavnoj ideji testa hipoteze, spomenuto je da je veza između
statistike testa i njegove distribucije uzorka presudna za bilo koje testiranje hipoteze.
Npr. pretpostavimo da imamo slučajni uzorak X(n) = X1, ..., Xn veličine n, gdje je
svaka tačka podataka Xi uzorkovana iz gama distribucije sa = 4 i = 2, odnosno,
U slučaju kada je prihvaćena nulta hipoteza (H0), a ustvari je tačna hipoteza H1,
napravljena je greška druge vrste. Vjerovatnoća da se desi greška druge vrste naziva se moć
testa i označava se sa β.
Prihvatanje nulte hipoteze znači da ne postoji statistički značajna razlika između dvije
skupine u ispitivanoj pojavi. Odbacivanje nulte hipoteze znači da postoji statistički značajna
razlika između dvije skupine u ispitivanoj pojavi.
Ovaj korak je veza sa realnim svijetom, kako ga predstavljaju podaci, jer sve dosad je
bilo teoretski. Za D(n) = X(n) = X1, ..., Xn, procjenjuje se numerička vrijednost statistike
testa odabrane u prvom koraku
tn = T(D(n))
12
4. TESTIRANJE HIPOTEZE ZA VJEROVATNOĆU BINOMNE
DISTRIBUCIJE n
1. Dvostrani test:
α α
P(T < tkr1) =
2
, P(T > tkr2) =
2
2. Jednostrani test:
nulta hipoteza je H0 (p = p0), alternativna hipoteza je H1 (p < p0); kritična tačka tkr
se određuje iz uslova P(T < tkr) = . Nulta hipoteza se prihvata ako je vrijednost
statistike testa sljedeća:
13
Rješenje: Prvo postavljamo hipoteze:
nulta hipoteza H0(p=0,5) i alternativna hipoteza H1(p ≠ 0,5); H1(p < 0,5) i H1(p > 0,5). Za
zadani nivo značajnosti α = 0,05 provjeravamo dvostrani test. Kvantili standardne normalne
distribucije F* su tkr1 = z0,025 i tkr2 = z0,975.
Područje prihvatanja nulte hipoteze H0(p=0,5) za nivo značajnosti α = 0,05 je (tkr1, tkr2) = (-
1,96, 1,96). Vrijednost statistike testa T (X1, X2, ..., Xn) je onda
Kako je t (tkr1, tkr2) unutar područja prihvatljivosti nulte hipoteze H0(p=0,5), prihvatamo je,
što znači da je novčić ispravan.
14
5. TESTIRANJE HIPOTEZE O VRIJEDNOSTI ARITMETIČKE
SREDINE OSNOVNOG SKUPA
Statistika testa
se koristi kada se testira hipoteza H0( x = x 0), protiv alternativne hipoteze H1¿ x 0), uz
vjerovatnoću 1- i pretpostavku da skup ima normalan raspored ili da raspored osnovnog
skupa nije poznat, a veličina uzorka je n 30 i varijansa osnovnog skupa je poznata. Ova
statistika testa ima normalan raspored N (0,1) pod uslovom da je nulta hipoteza tačna i radi se
o dvosmjernom testu.
U trećem slučaju, kada se testira hipoteza H0( x x 0) protiv alternativne hipoteze H1( x >
x 0), uz iste pretpostavke i istu statistiku testa, statistika testa ima normalan raspored ukoliko je
nulta hipoteza tačna i u pitanju je jednosmjerni test. Za dati nivo značajnosti dobija se
kritična vrijednost Z1- , a kritična oblast je K = (Z1- + ), što je predstavljeno na slici ispod.
15
Slika 2. Testiranje hipoteze o vrijednosti aritmetičke sredine osnovnog skupa kada je
varijansa poznata2
Kad se testira hipoteza H0( x = x 0) protiv alternativne hipoteze H1( x x 0) za dati nivo
značajnosti i pretpostavku da je raspored osnovnog skupa simetričan, veličina uzorka nije
manja od 8 (n<8), a varijansa osnovnog skupa nije poznata, koristi se sljedeća statistika testa
na bazi uzorka:
Ova statistika testa ima Studentov t raspored sa n-1 stepeni slobode i standardnom
devijacijom uzorka (Sn), ukoliko je nulta hipoteza tačna. U pitanju je dvosmjerni test.
Preostala dva pravila se formiraju na sličan način, oslanjajući se na pravila data kad je
varijansa poznata, sa izuzetkom što se u ovom načinu testiranja koristi statistika testa
zasnovana na Studentovom t rasporedu vjerovatnoće.
Testiranje hipoteze o razlici aritmetičkih sredina dva osnovna skupa je u praksi česta
potreba. I u ovom slučaju se poštuju prethodno navedena pravila.
2
Marjanović M., Mihailović I., Spasić K., Statistika u ekonomiji i poslovanju sa zbirkom rešenih
zadataka, Visoka poslovna škola strukovnih studija Leskovac, 2016.
16
Značajnost neke razlike između dvije aritmetičke sredine se može provjeriti uz pomoć
„granica pouzdanosti“, koja se najčešće koristi za testiranje razlike između aritmetičke sredine
uzorka i neke unaprijed poznate populacijske vrijednosti. Također se može provjeriti i tzv. t-
testom.
Ova statistika ima normalan raspored N(0,1) pod uslovom da je hipoteza H0 tačna.
Radi se o dvosmjernom testu. Nulta hipoteza se odbacuje ako dobijena vrijednost testiranjem
pripada kritičnoj oblasti. Ovo testiranje se vrši na osnovu dva uzorka izvučena iz dva različita
skupa. Kada se javi velika razlika zaključujemo da ti uzorci potiču iz dva skupa sa različitim
aritmetičkim sredinama i odbacujemo nultu hipotezu.
U slučaju kada vršimo testiranje razlika aritmetičkih sredina dva uzorka, a varijanse
osnovnih skupova nisu poznate, koristit će se varijanse uzoraka, ako pretpostavimo da su
osnovni skupovi normalno, a uzorci proizvoljne veličine.
Ova statistika testa ima Studentov t raspored sa n1+n2-2 stepeni slobode, pod uslovom
da je H0 tačna. I ovdje je također u pitanju dvosmjerni test.
17
6. TESTIRANJE HIPOTEZE O PROPORCIJI OSNOVNOG SKUPA NA
BAZI UZORKA
p− po
Z=
√ po ( 1− po )
n
Pod uslovom da je nulta hipoteza tačna, ova statistika testa ima normalan raspored
N(0,1) i radi se o dvosmjernom testu. Za dati nivo značajnosti dobija se kritična vrijednost
Z1-/2, a kritična oblast je K = (-; - Z1-/2)U(Z1-/2;+ ). Kod ovog testa se nulta hipoteza
prihvata ako je vrijednost dobijena testiranjem donje i gornje kritične granice.
Drugi primjer ovog načina testiranja je testiranje hipoteze H0(pp0) protiv alternativne
hipoteze H1(p<p0) uz vjerovatnoću 1- i uslovima navedenim u prethodnom primjeru koristi
se ista statistika testa, koja također ima normalan raspored ukoliko je hipoteza H0 tačna.
Međutim, u ovom slučaju se radi o jednosmjernom testu i kritičnoj oblasti K = (-; - Z1-).
Kada se testira hipoteza H0(p1=p2) protiv alternativne hipoteze H1 (p1p2) za dati nivo
značajnosti i uslov ni*pi5, ni(1-pi) 5 za i=1,2 i n30, gdje su slučajni uzorci međusobno
nezavisni koristi se sljedeća statistika testa:
18
7. POJAM I OBLICI X2 TESTA
Karl Pirson je 1890. godine prvi uveo statistiku χ 2 oblika u statističku analizu.
Statistika testa za χ2 test je sljedeća:
19
gdje su fi empirijske frekvence, fi' očekivane frekvence, r broj modaliteta posmatrane slučajne
veličine i s broj nepoznatih ocijenjenih parametara na bazi uzorka.
3
Marjanović M., Mihailović I., Spasić K., Statistika u ekonomiji i poslovanju sa zbirkom rešenih
zadataka, Visoka poslovna škola strukovnih studija Leskovac, 2016.
20
8. POGREŠKE PRI TESTIRANJU STATISTIČKIH HIPOTEZA
Pogreška prve vrste se dešava kada vidimo učinak kojeg zapravo nema. Vjerovatnoća
da će se napraviti pogreška prve vrste se naziva alfa (). Alfa () je ono što smo u prethodnim
poglavljima nazivali nivoom značajnosti. Njena vrijednost se određuje prije testiranja
statističke hipoteze i najčešće je postavljena na 0,05 ili 0,01. Pogreška prvog reda se uvijek
može kontrolisati prilikom statističkog zaključivanja jer se zadaje unaprijed. Hipoteze se
formulišu na način da pogreška koja je bitnija bude pogreška prvog reda .
H0 osumnjičeni je nevin
H1 osumnjičeni je kriv
Pogreška prvog reda u ovom slučaju je vjerovatnoća odbacivanja nulte hipoteze kad je
ona istinita, tj. vjerovatnoća da nevin čovjek bude proglašen krivim. Kad bi se hipoteze
obrnule, odnosno da je H0 osumnjičeni je kriv, tada bismo pogrešku zadali unaprijed i
kontrolisali to da kriv čovjek bude oslobođen.
Pogreška druge vrste se događa kada ne vidimo razliku, a ona je zapravo prisutna.
Vjerovatnoća da će se napraviti pogreška druge vrste se naziva beta ( ). Vrijednost ove
pogreške zavisi od prave vrijednosti parametra o kojem se raspravlja, pogreške , standardne
devijacije populacije i veličine uzorka. se povezuje sa snagom testa u otkrivanju učinka
navedene veličine. Kod pogreške druge vrste radi se o vjerovatnoći prihvatanja H0 u slučaju
kada je H1 istinita. Pogreška druge vrste pada kada postoji veća razlika između
pretpostavljene i prave vrijednosti parametra koji se testira, a raste kada pogreška prvog reda
pada.
21
Vodeći se prethodnim primjerom, pokazat ćemo kako dolazi do pogreške drugog reda.
Postavljamo hipoteze:
H0 osumnjičeni je nevin
H1 osumnjičeni je kriv
4
Emmert-Streib F., Dehmer M., Understanding Statistical Hypothesis Testing: The Logic of Statistical
Inference, Machine learning & knowledge extraction 2019, 1, Licensee MDPI, Switzerland, 2019.
22
9. ZAKLJUČAK
Ogroman broj podataka raspoloživih danas iziskuje postojanje raznih metoda analiza,
kako bi se njima uspješno rukovodilo. Upravo testiranje statističke hipoteze predstavlja jednu
od najčešće korištenih metoda.
23
10. LITERATURA
Knjige:
Benšić M., Šuvak N., Primijenjena statistika, Sveučilište J.J. Strossmayera, Odjel za
matematiku, Osijek 2013.
Marjanović M., Mihailović I., Spasić K., Statistika u ekonomiji i poslovanju sa
zbirkom rešenih zadataka, Visoka poslovna škola strukovnih studija, Leskovac, 2016.
Članci:
Tekstovi sa interneta:
https://towardsdatascience.com/one-tailed-or-two-tailed-test-that-is-the-question-
1283387f631c (29.01.2021.)
http://www.unizd.hr/Portals/12/Nastavnici/Irena%20Buric/Uvod%20u
%20deskriptivnu%20i%20inferencijalnu%20statistiku.pdf (01.02.2021.)
http://www.zemris.fer.hr/predmeti/statmod/Uvod%20u%20statisticko
%20zakljucivanje (01.02.2021.)
https://pistatistics.com/kurs/statistika-varijable-podaci/lekcije/verovatnoca-i-
statisticko-zakljucivanje/ (01.02.2021.)
24