You are on page 1of 24

SVEUČILIŠTE/UNIVERZITET „VITEZ“ VITEZ

FAKULTET POSLOVNE EKONOMIJE VITEZ

STUDIJ I CIKLUSA; GODINA STUDIJA: I; CIKLUS: I

SMJER: PODUZETNIČKI MENADŽMENT

MARIJANA RAJKOVIĆ

TESTIRANJE STATISTIČKIH HIPOTEZA I NAČINI


TESTIRANJA
SEMINARSKI RAD

Travnik, 2021.
SVEUČILIŠTE/UNIVERZITET „VITEZ“ VITEZ

FAKULTET POSLOVNE EKONOMIJE VITEZ

STUDIJ I CIKLUSA; GODINA STUDIJA: II; CIKLUS: I

SMJER: PODUZETNIČKI MENADŽMENT

TESTIRANJE STATISTIČKIH HIPOTEZA I NAČINI


TESTIRANJA

SEMINARSKI RAD

IZJAVA: Ja, Marijana Rajković, student Sveučilišta/Univerziteta “Vitez“ Vitez, Indeks broj:
odgovorno i uz moralnu i akademsku odgovornost izjavljujem da sam ovaj rad izradila
potpuno samostalno uz korištenje citirane literature i pomoć mentora.

Predmet: Statistika

Profesor: prof. dr. Ibrahim Obhođaš

Asistent: mr. Ajdina Karić

Student: Marijana Rajković

Indeks broj:

Travnik, februar 2021.


SADRŽAJ

1. UVOD.........................................................................................................................1

1.1. Problem, predmet i objekat istraživanja...............................................................1

1.2. Svrha i ciljevi istraživanja....................................................................................1

1.3. Radna hipoteza.....................................................................................................1

1.4. Naučne metode.....................................................................................................1

1.5. Struktura rada.......................................................................................................2

2. STATISTIČKO ZAKLJUČIVANJE..........................................................................3

3. TESTIRANJE STATISTIČKIH HIPOTEZA.............................................................4

3.1. Izbor odgovarajuće statistike testa.......................................................................5

3.2. Definisanje nulte hipoteze H0 i alternativne hipoteze H1......................................5

3.2.1. Razlika između jednosmjernog i dvosmjernog testiranja hipoteza...............6

3.3. Distribucija uzorka...............................................................................................7

3.4. Izbor rizika greške α , odnosno vjerovatnoće β ....................................................7

3.5. Definisanje kriterija za prihvatanje/odbacivanje nulte hipoteze..........................7

3.6. Izračunavanje vrijednosti statistike testa..............................................................8

3.7. Donošenje odluke o prihvatanju ili odbacivanju postavljene hipoteze................8

4. TESTIRANJE HIPOTEZE ZA VJEROVATNOĆU BINOMNE DISTRIBUCIJE n


 .............................................................................................................................................9

5. TESTIRANJE HIPOTEZE O VRIJEDNOSTI ARITMETIČKE SREDINE


OSNOVNOG SKUPA..............................................................................................................11

5.1. Testiranje hipoteze o vrijednosti aritmetičke sredine osnovnog skupa kada je


varijansa poznata...................................................................................................................11

5.2. Testiranje hipoteze o vrijednosti aritmetičke sredine osnovnog skupa kada je


varijansa nepoznata...............................................................................................................12

5.3. Testiranje hipoteze o razlici aritmetičkih sredina dva osnovna skupa...............13


6. TESTIRANJE HIPOTEZE O PROPORCIJI OSNOVNOG SKUPA NA BAZI
UZORKA..................................................................................................................................14

6.1 Testiranje hipoteze o razlici proporcija dva osnovna skupa...............................14

7. POJAM I OBLICI X2 TESTA..................................................................................15

7.1. χ2 test oblika rasporeda......................................................................................15

7.2. χ2 test nezavisnosti obilježja..............................................................................16

8. POGREŠKE PRI TESTIRANJU STATISTIČKIH HIPOTEZA.............................17

9. ZAKLJUČAK...........................................................................................................19

10. LITERATURA........................................................................................................20
1. UVOD

1.1. Problem, predmet i objekat istraživanja

Dostupnost velikog broja podataka je bitna karakteristika modernog svijeta u kojem


živimo. Stoga su, kako bismo se lakše suočili sa izazovima koje oni stavljaju pred nas,
potrebne napredne metode analize. Jednom od rasprostranjenijih, ali i prvih metoda analize u
statističkom zaključivanju smatra se testiranje statističke hipoteze. Ova vrsta statističkog
testiranja je među najneshvaćenijim kvantitativnim analizama metode u nauci o podacima,
upravo iz razloga što se čini jednostavnom, a ima kompleksne međuzavisnosti između
sastavnih dijelova procesa. Također se smatra složenom zbog načina objašnjavanja koji se
uglavnom veže za matematiku.

Za istraživače, razumijevanje općih koncepata postupka ovog testiranja je veoma


značajno jer testiranje hipoteze ima značajnu ulogu u donošenju naučnih odluka. Testiranje
statističke hipoteze se osim u ekonomiji, uveliko koristi i u medicini, biologiji, psihologiji itd.
U današnje vrijeme, vrijeme tehnologije, specijalizovani statistički programi u znatnoj mjeri
olakšavaju testiranje statističke hipoteze.

1.2. Svrha i ciljevi istraživanja

Svrha i cilj ovog istraživanja jeste na što lakši način objasniti postupak testiranja
statističke hipoteze, načine testiranja i pogreške koje se mogu javiti.

1.3. Radna hipoteza

Na temelju predmeta i cilja istraživanja, moguće je postaviti glavnu (radnu) hipotezu


seminarskog rada koja glasi:

„Testiranje statističke hipoteze je bitno sredstvo za donošenje binarnih odluka.“

1.4. Naučne metode

U seminarskom radu su korištene sljedeće metode: metoda indukcije, metoda


dedukcije, metoda analize, metoda sinteze, metoda dokazivanja, metoda klasifikacije, metoda
deskripcije i metoda kompilacije.

1.5. Struktura rada

Rezultati istraživanja su postavljeni u devet međusobno povezanih dijelova.

5
Prvi, uvodni dio, se odnosi na problem, predmet i objekat istraživanja, svrhu i ciljeve
istraživanja, radnu hipotezu, naučne metode korištene tokom istraživanja i strukturu rada radi
lakšeg praćenja materije.

S obzirom na to da tema koja se obrađuje, testiranje statističke hipoteze, spada u


statističko zaključivanje, u drugom dijelu rada je ukratko objašnjeno šta predstavlja statističko
zaključivanje, na čemu se zasniva i šta obuhvata pored testiranja statističke hipoteze.

Treći dio rada govori o testiranju statističke hipoteze uopćeno te o koracima od kojih
se sastoji postupak testiranja.

U četvrtom, petom, šestom i sedmom dijelu rada su, kroz primjere, obrađeni načini
testiranja statističke hipoteze, koji obuhvataju testiranje hipoteze za vjerovatnoću binomne
distribucije n i aritmetičke sredine (kada je varijansa poznata i nepoznata i razlike između
aritmetičkih sredina), testiranje o proporciji osnovnog skupa na bazi uzorka i razlike
proporcija, te pojam i oblike χ2 testa.

Osmi dio rada se bavi pogreškama koje se mogu dogoditi prilikom testiranja statističke
hipoteze.

I naposlijetku, završni dio rada, odnosno zaključak, koji se sastoji od kratkog pregleda
cijelog seminarskog rada.

6
2. STATISTIČKO ZAKLJUČIVANJE

Statističko zaključivanje spada u jednu od dvije cjeline statistike. Ono podrazumijeva


izvođenje zaključka o skupu na osnovu uzorka podataka.

Statističko zaključivanje se zasniva na primjeni induktivne i deduktivne metode za


spoznaju relevantne istine koja je sadržana u pretpostavkama koje se odnose na realan svijet.
Naučnom obradom statističkih podataka i donošenjem zaključaka koji se zasnivaju na takvim
podacima može se doći i do informacija koje se ne slažu s datim pretpostavkama. Statističkim
zaključivanjem, a na osnovu izmjerenih rezultata analize uzorka, donose se zaključci o
parametrima osnovnog skupa. Zaključivanje značajnosti statističkih analiza se određuje na
dva nivoa vjerovatnoće: alfa α nivoa, na p < 0,05 i p < 0,01.

U postupku statističkog zaključivanja koriste se parametarske i neparametarske


metode. Također, veoma je važno mjeriti pouzdanost statističkog zaključivanja, jer je u
protivnom ono nepotpuno. Posebno je bitno obratiti pažnju kod određivanja vrijednosti
faktora pouzdanosti. Ukoliko se koristi veliki uzorak (n ≥ 30), kritična vrijednost se određuje
na bazi Normalnog rasporeda i koristi se Z test. Kada je uzorak manji od 30, smatra se da je u
pitanju mali uzorak i onda se kritične vrijednosti testa određuju na bazi Studentovog t
rasporeda i koristi se T test.

Statističko zaključivanje obuhvata:

 ocjene nepoznatih parametara osnovnog skupa (interval povjerenja i tačkaste


ocjene),
 testiranje statističkih hipoteza o parametrima i raspodjelama statističkog skupa.

Ocjenjivanje parametara osnovnog skupa vrši se na osnovu poznatih parametara


uzorka uz odgovarajući rizik greške. Testiranje hipoteze podrazumijeva ispitivanje da li je
unaprijed definisana pretpostavka o vrijednosti parametara osnovnog skupa istinita ili ne. Na
osnovu rezultata testiranja, a sa pouzdanošću manjom od 100% prihvata se nulta ili
alternativna hipotezu. Nakon toga se utvrđuje da li smo prihvatili našu pretpostavku ili ne. O
testiranju statističkih hipoteza će se detaljno govoriti u narednim poglavljima u radu.

7
3. TESTIRANJE STATISTIČKIH HIPOTEZA

Testiranje statističkih hipoteza je široko rasprostranjena metoda statističkog


zaključivanja. Računari i specijalizirani statistički programi, sa svojim opširnim uputama i
objašnjenjima, prilično olakšavaju izvođenje statističkih testova. Statistički programi mogu
izračunati tačnu p vrijednost.

Testiranje statističkih hipoteza je postupak koji uključuje formulisanje statističke


hipoteze i upotrebu podataka iz uzorka, kako bi se moglo odlučiti o ispravnosti formulirane
statističke hipoteze.

Naučna metoda testiranje statističkih hipoteza se primjenjuje za provjeru ispravnosti


unaprijed postavljene pretpostavke o vrijednosti parametara osnovnog skupa. Pored
statističkih hipoteza o parametrima osnovnog skupa, mogu se testirati i hipoteze o rasporedu
osnovnog skupa. Statistički testovi koji se koriste prilikom testiranja mogu biti parametarski i
neparametarski.

Statistička hipoteza je bilo koja pretpostavka o distribuciji neke slučajne varijable


(slučajnog vektora). Neparametarska hipoteza je pretpostavka o funkciji distribucije neke
slučajne varijable, a parametarska hipoteza je pretpostavka o parametrima poznate distribucije
neke slučajne varijable. Statističke hipoteze se označavaju sa H0, H1, .., Hn.

Postupak testiranja hipoteza uvijek počinje postupkom prevođenja problema u


statističku hipotezu. Testirati hipotezu znači donijeti odluku o tome da li će se H odbaciti ili
prihvatiti. Iako detalji testiranja mogu varirati od testa do testa, za svako testiranje statističkih
hipoteza postoji postupak koji se sastoji od sljedećih koraka:

1. izbor odgovarajuće statistike testa;


2. definisanje nulte hipoteze H0 i alternativne hipoteze H1;
3. pronalazak distribucije uzorka;
4. izbor rizika greške α , odnosno vjerovatnoće β ;
5. definisanje kriterija za prihvatanje/odbacivanje nulte hipoteze;
6. izračunavanje vrijednosti statistike testa;
7. donošenje odluke o prihvatanju ili odbacivanju postavljene hipoteze.

3.1. Izbor odgovarajuće statistike testa

8
Jednostavno rečeno, statistika testa kvantificira uzorak podataka. U statistici se izraz
"statistika" odnosi na bilo kakvo mapiranje (ili funkciju) između uzorka podataka i numeričke
vrijednosti. Popularni primjeri su srednja vrijednost ili varijansa. Formalno, statistika testa se
može zapisati kao

tn = T( D(n))

gdje je D(n) = x1, ..., xn uzorak podataka veličine uzorka n. Ovdje se mapiranje označava sa
T, a vrijednost koja se dobija tn. Tipično, statistika testa može pretpostaviti realne vrijednosti,
tj. tn  R, ali su moguća ograničenja.

Statistika testa prisvaja središnju ulogu u testiranju hipoteze jer odlukom koja
statistika testa se upotrebljava, određuje se test hipoteze u velikoj mjeri, iz razloga što će se
statistika testa uključiti u hipoteze koje se formuliraju u drugom koraku. Zbog toga treba
pažljivo odabrati željenu statistiku testa koja je važna za provedeno istraživanje. Bitno je
naglasiti da se u ovom koraku samo bira statistika testa, ali ne i ocjenjuje i koristi.

3.2. Definisanje nulte hipoteze H0 i alternativne hipoteze H1

U ovom koraku se definišu dvije hipoteze koje se nazivaju nulta hipoteza H0 i


alternativna hipoteza H1. Obje hipoteze daju tvrdnje o populacijskoj vrijednosti statistike testa
i međusobno se isključuju. Za statistiku testa t = T(D), odabranu u prvom koraku, populacija
vrijednosti t je . Na osnovu ovoga, mogu se formulirati sljedeće hipoteze:

 nulta hipoteza: H0: θ = θ0


 alternativna hipoteza: H1: θ > θ0

Nulta hipoteza (H0) predstavlja očekivanu vrijednost određenog parametra osnovnog


skupa. Ona sadrži tvrdnju o vrijednosti nepoznatog parametra osnovnog skupa koje se nastoji
negirati. U alternativnoj hipotezi (H1) se unose one vrijednosti određenog parametra osnovnog
skupa koje nisu obuhvaćene u nultoj hipotezi.

Zbog načina na koji su formulirane nulta i alternativna hipoteza, vrijednost parametra


populacije  može biti istinit samo za jednu tvrdnju, ali ne i za obje. Npr. ako je θ = θ0 tačno,
alternativna hipoteza H1 je netačna, ili ako je θ > θ0 tačno, nulta hipoteza H0 je netačna.

Statistička hipoteza može biti prosta i složena. Hipoteze H0 i H1 mogu biti postavljene
na tri načina:

 H0 (t = t0) protiv H1 (t ≠ t0);

9
 H0 (t ≥ t0) protiv H1 (t > t0);
 H0 (t ≤ t0) protiv H1 (t > t0).

Prva kombinacija hipoteza predstavlja dvosmjerni test, dok je kod preostale dvije u
pitanju jednosmjerni test.

3.2.1. Razlika između jednosmjernog i dvosmjernog testiranja hipoteza

Kod jednosmjernog testa, granične vrijednosti su niže od graničnih vrijednosti


dvosmjernog testa. Međutim, ukupna razina rizika, tj. statističke značajnosti ostaje ista. Kod
testiranja značajnosti razlika u pravilu se upotrebljava dvosmjerni test, a u iznimnim i
opravdanim slučajevima jednosmjerni test. Način testiranja se određuje u fazi planiranja
istraživanja, odnosno prije nego što su poznati rezultati mjerenja. Kritična vrijednost u
jednosmjernom testu je manja od kritične vrijednosti dvosmjernog testa.

Npr. ako na skupini od 1000 bolesnika primijenimo novi lijek za regulisanje visokog
krvnog tlaka, zanima nas da li je nakon primjene lijeka došlo do statistički značajnog
smanjenja krvnog tlaka. Da bismo utvrdili je li smanjenje krvnog tlaka statistički značajno uz
nivo rizika od 5%, pomoću t-tablica (ili tablica z-vrijednosti kad su uzorci veliki)
provjeravamo je li dobivena t-vrijednost veća od granične uz p < 0,05 (ali samo s jedne strane
t-distribucije), ako je t > 1,64 (kod velikih uzoraka), dolazi do statistički značajnog smanjenja
visokog krvnog tlaka nakon primjene novog lijeka. Ako se odlučimo za rizik od 1%, dobivenu
t-vrijednost upoređujemo sa graničnom uz p < 0,01  t > 2,30 (kod velikih uzoraka) dolazi
do statistički značajnog smanjenja visokog krvnog tlaka, što je prikazano na slici ispod.

Slika 1. Razlika između jednosmjernog i dvosmjernog testiranja hipoteza.1

3.3. Distribucija uzorka

1
https://towardsdatascience.com/one-tailed-or-two-tailed-test-that-is-the-question-1283387f631c
(29.01.2021.)

10
U općenitoj raspravi o glavnoj ideji testa hipoteze, spomenuto je da je veza između
statistike testa i njegove distribucije uzorka presudna za bilo koje testiranje hipoteze.

Distribucija ili raspodjela uzorka je prvenstveno raspodjela vjerovatnoće, tj.


distribucija uzorka je distribucija statistike testa T, koja je slučajna varijabla neke
pretpostavke. Budući da postoje samo dvije različite hipoteze, H0 i H1, postoje i samo dvije
različite distribucije uzorka. Statistika testa je funkcija veličine uzorka n, pa je iz tog razloga i
distribucija uzorka funkcija n. To znači da, ukoliko promijenimo veličinu uzorka n,
mijenjamo i distribuciju uzorka.

Npr. pretpostavimo da imamo slučajni uzorak X(n) = X1, ..., Xn veličine n, gdje je
svaka tačka podataka Xi uzorkovana iz gama distribucije sa  = 4 i  = 2, odnosno,

Xi gama ( = 4,  = 2 ). Nadalje, upotrebljavamo srednju vrijednost kao


statistiku testa, tj.

Za n = 1, dobije se poseban slučaj da je distribucija uzoraka jednaka osnovnoj


distribuciji populacije, odnosno Ppop, što je u ovom slučaju gama distribucija sa parametrima 
= 4 i  = 2. Za sve ostale n > 1, postoji transformacija u distribuciji uzoraka.

3.4. Izbor rizika greške α , odnosno vjerovatnoće β

U procesu statističkog testiranja, prilikom donošenja odluka na bazi rezultata statistike


testa, mogu se javiti greška prve vrste i greška druge vrste. U slučaju kad se odbaci nulta
hipoteza (H0), a ona je u stvari tačna, onda je načinjena greška prve vrste. Vjerovatnoća
greške prvog tipa (α) naziva se nivo (prag) značajnosti.

U slučaju kada je prihvaćena nulta hipoteza (H0), a ustvari je tačna hipoteza H1,
napravljena je greška druge vrste. Vjerovatnoća da se desi greška druge vrste naziva se moć
testa i označava se sa β.

O ovim pogreškama će biti više riječi u narednim poglavljima.

3.5. Definisanje kriterija za prihvatanje/odbacivanje nulte hipoteze

Prilikom postavljanja nulte i alternativne hipoteze neophodno je posebice obratiti


pažnju da našu pretpostavku koju želimo da potvrdimo prikažemo u okviru alternativne
hipoteze. To je neophodno jer za odbacivanje nulte hipoteze treba imati veoma jake razloge u
11
odnosu na razloge za njeno prihvatanje. U slučaju kada odbacimo nultu hipotezu, alternativna
hipoteza je tačna. Međutim, tvrdnju da je hipoteza tačna ne treba prihvatiti sa velikom
sigurnošću. To znači da nemamo dovoljno jake dokaze da osporimo tu tvrdnju i dok je tako
tvrdnja će biti tačna. Dakle, alternativna hipoteza biva automatski prihvaćena ako na osnovu
rezultata statistike testa odbacimo nultu hipotezu.

Prihvatanje nulte hipoteze znači da ne postoji statistički značajna razlika između dvije
skupine u ispitivanoj pojavi. Odbacivanje nulte hipoteze znači da postoji statistički značajna
razlika između dvije skupine u ispitivanoj pojavi.

Postavljanje hipoteza dešava se na logičkoj razini, tj. vezano je za problem poznavanja


područja problema. Prihvatanje hipoteze, odnosno vjerovanje u određenu hipotezu je stvar
statističke odluke.

3.6. Izračunavanje vrijednosti statistike testa

Ovaj korak je veza sa realnim svijetom, kako ga predstavljaju podaci, jer sve dosad je
bilo teoretski. Za D(n) = X(n) = X1, ..., Xn, procjenjuje se numerička vrijednost statistike
testa odabrane u prvom koraku

tn = T(D(n))

Ovdje tn predstavlja određenu numeričku vrijednost dobivenu iz posmatranih podataka


D(n). Zbog činjenice da skup podataka zavisi od broja uzoraka n, i ova numerička vrijednost
će zavisiti od n.

3.7. Donošenje odluke o prihvatanju ili odbacivanju postavljene hipoteze

U posljednjem koraku, donosi se odluka o nultoj hipotezi. Za donošenje ove odluke,


postoje dva alternativna načina; prvi je donošenje odluke na temelju p-vrijednosti, a drugi na
temelju vrijednosti statistike testa tn.

1. Odluka donesena na osnovu p-vrijednosti:

Ako je p < , H0 se odbacuje

2. Odluka donesena na osnovu praga c:

Ako je tn > c, H0 se odbacuje

U slučajevima kada se nulta hipoteza ne može odbiti, ona se prihvata.

12
4. TESTIRANJE HIPOTEZE ZA VJEROVATNOĆU BINOMNE
DISTRIBUCIJE n  

Teorem 1. Ako je broj ponavljanja u Bernulijevoj šemi veliki, za parametarsku


hipotezu H0 (p = p0) statistika testa

ima standardnu normalnu distribuciju T  N (0,1). Nivo značajnosti  je zadan.

1. Dvostrani test:
α α
P(T < tkr1) =
2
, P(T > tkr2) =
2

nulta hipoteza je H0 (p = p0) i alternativna hipoteza je H1 (p  p0); tkr1 i tkr2 su


kritične tačke.

Ako je vrijednost statistike testa

nulta hipoteza se prihvata.

2. Jednostrani test:
nulta hipoteza je H0 (p = p0), alternativna hipoteza je H1 (p < p0); kritična tačka tkr
se određuje iz uslova P(T < tkr) = . Nulta hipoteza se prihvata ako je vrijednost
statistike testa sljedeća:

Dat je sljedeći primjer ovog teorema.

Primjer 1. Napravljen je slučajni pokus bacanje novčića. Pokus je ponovljen n = 4040


puta i dobijeno je 2048 grbova. Znamo da je uspjeh u pokusu binomna slučajna varijabla s
parametrom p vjerovatnoća da padne grb. Testiramo nultu hipotezu H0(p=0,5) tj. testiramo
hipotezu da je novčić ispravan. Alternativna hipoteza je H1(p≠0,5). Neka je nivo
značajnosti α = 0,05.

13
Rješenje: Prvo postavljamo hipoteze:

nulta hipoteza H0(p=0,5) i alternativna hipoteza H1(p ≠ 0,5); H1(p < 0,5) i H1(p > 0,5). Za
zadani nivo značajnosti α = 0,05 provjeravamo dvostrani test. Kvantili standardne normalne
distribucije F* su tkr1 = z0,025 i tkr2 = z0,975.

- tkr1 = z1-0,025 = z0,975 = 1,96  tkr1 = - 1,96; tkr2 = z0,975 = 1,96

Područje prihvatanja nulte hipoteze H0(p=0,5) za nivo značajnosti α = 0,05 je (tkr1, tkr2) = (-
1,96, 1,96). Vrijednost statistike testa T (X1, X2, ..., Xn) je onda

Kako je t  (tkr1, tkr2) unutar područja prihvatljivosti nulte hipoteze H0(p=0,5), prihvatamo je,
što znači da je novčić ispravan.

14
5. TESTIRANJE HIPOTEZE O VRIJEDNOSTI ARITMETIČKE
SREDINE OSNOVNOG SKUPA

Kad je u pitanju testiranje hipoteze o vrijednosti aritmetičke sredine osnovnog skupa


bilo da je varijansa poznata ili ne, postoje tri pravila.

5.1. Testiranje hipoteze o vrijednosti aritmetičke sredine osnovnog skupa kada je


varijansa poznata

Statistika testa

se koristi kada se testira hipoteza H0( x = x 0), protiv alternativne hipoteze H1¿ x 0), uz
vjerovatnoću 1- i pretpostavku da skup ima normalan raspored ili da raspored osnovnog
skupa nije poznat, a veličina uzorka je n  30 i varijansa osnovnog skupa je poznata. Ova
statistika testa ima normalan raspored N (0,1) pod uslovom da je nulta hipoteza tačna i radi se
o dvosmjernom testu.

Kada se testira hipoteza H0( x  x 0) protiv alternativne hipoteze H1( x < x 0) uz


vjerovatnoću 1- i pretpostavku da skup ima normalan raspored ili da raspored osnovnog
skupa nije poznat, a veličina uzorka je n  30 i varijansa osnovnog skupa je poznata, koristi se
statistika testa kao u prethodnom primjeru. Ova statistika testa također ima normalan raspored
N (0,1) pod uslovom da je nulta hipoteza tačna, s tim da se ovdje radi o jednosmjernom testu.

U trećem slučaju, kada se testira hipoteza H0( x  x 0) protiv alternativne hipoteze H1( x >
x 0), uz iste pretpostavke i istu statistiku testa, statistika testa ima normalan raspored ukoliko je
nulta hipoteza tačna i u pitanju je jednosmjerni test. Za dati nivo značajnosti  dobija se
kritična vrijednost Z1- , a kritična oblast je K = (Z1- + ), što je predstavljeno na slici ispod.

15
Slika 2. Testiranje hipoteze o vrijednosti aritmetičke sredine osnovnog skupa kada je
varijansa poznata2

5.2. Testiranje hipoteze o vrijednosti aritmetičke sredine osnovnog skupa kada je


varijansa nepoznata

Statistička hipoteza o vrijednosti aritmetičke sredine osnovnog skupa se može testirati


i u slučajevima kada varijansa nije poznata, a uzorak veći od 30. Prethodno navedena pravila
se poštuju i u ovom slučaju, s razlikom što varijansa nije poznata, a uzorak je manji.

Kad se testira hipoteza H0( x = x 0) protiv alternativne hipoteze H1( x  x 0) za dati nivo
značajnosti  i pretpostavku da je raspored osnovnog skupa simetričan, veličina uzorka nije
manja od 8 (n<8), a varijansa osnovnog skupa nije poznata, koristi se sljedeća statistika testa
na bazi uzorka:

Ova statistika testa ima Studentov t raspored sa n-1 stepeni slobode i standardnom
devijacijom uzorka (Sn), ukoliko je nulta hipoteza tačna. U pitanju je dvosmjerni test.

Preostala dva pravila se formiraju na sličan način, oslanjajući se na pravila data kad je
varijansa poznata, sa izuzetkom što se u ovom načinu testiranja koristi statistika testa
zasnovana na Studentovom t rasporedu vjerovatnoće.

5.3. Testiranje hipoteze o razlici aritmetičkih sredina dva osnovna skupa

Testiranje hipoteze o razlici aritmetičkih sredina dva osnovna skupa je u praksi česta
potreba. I u ovom slučaju se poštuju prethodno navedena pravila.
2
Marjanović M., Mihailović I., Spasić K., Statistika u ekonomiji i poslovanju sa zbirkom rešenih
zadataka, Visoka poslovna škola strukovnih studija Leskovac, 2016.

16
Značajnost neke razlike između dvije aritmetičke sredine se može provjeriti uz pomoć
„granica pouzdanosti“, koja se najčešće koristi za testiranje razlike između aritmetičke sredine
uzorka i neke unaprijed poznate populacijske vrijednosti. Također se može provjeriti i tzv. t-
testom.

Kada se testira nulta hipoteza H0 ( x 1= x 2) protiv alternativne hipoteze H1 ( x 1 x 2) za


dati nivo značajnosti  i kad su poznate varijanse skupa koristi se sljedeća statistika testa:

Ova statistika ima normalan raspored N(0,1) pod uslovom da je hipoteza H0 tačna.
Radi se o dvosmjernom testu. Nulta hipoteza se odbacuje ako dobijena vrijednost testiranjem
pripada kritičnoj oblasti. Ovo testiranje se vrši na osnovu dva uzorka izvučena iz dva različita
skupa. Kada se javi velika razlika zaključujemo da ti uzorci potiču iz dva skupa sa različitim
aritmetičkim sredinama i odbacujemo nultu hipotezu.

U slučaju kada vršimo testiranje razlika aritmetičkih sredina dva uzorka, a varijanse
osnovnih skupova nisu poznate, koristit će se varijanse uzoraka, ako pretpostavimo da su
osnovni skupovi normalno, a uzorci proizvoljne veličine.

U ovom slučaju se koristi sljedeća statistika testa:

Ova statistika testa ima Studentov t raspored sa n1+n2-2 stepeni slobode, pod uslovom
da je H0 tačna. I ovdje je također u pitanju dvosmjerni test.

17
6. TESTIRANJE HIPOTEZE O PROPORCIJI OSNOVNOG SKUPA NA
BAZI UZORKA

Testirajući hipotezu H0=(p=p0) protiv alternativne hipoteze H1=(pp0) za dati nivo


značajnosti  i uslov n*p05, n(1-p0) 5 i n30 koristi se sljedeća statistika testa:

p− po
Z=
√ po ( 1− po )
n

Pod uslovom da je nulta hipoteza tačna, ova statistika testa ima normalan raspored
N(0,1) i radi se o dvosmjernom testu. Za dati nivo značajnosti  dobija se kritična vrijednost
Z1-/2, a kritična oblast je K = (-; - Z1-/2)U(Z1-/2;+ ). Kod ovog testa se nulta hipoteza
prihvata ako je vrijednost dobijena testiranjem donje i gornje kritične granice.

Drugi primjer ovog načina testiranja je testiranje hipoteze H0(pp0) protiv alternativne
hipoteze H1(p<p0) uz vjerovatnoću 1- i uslovima navedenim u prethodnom primjeru koristi
se ista statistika testa, koja također ima normalan raspored ukoliko je hipoteza H0 tačna.
Međutim, u ovom slučaju se radi o jednosmjernom testu i kritičnoj oblasti K = (-; - Z1-).

Za testiranje nulte hipoteze H0(pp0) protiv alternativne hipoteze H1(p>p0, uz


vjerovatnoću 1- i ispunjene prethodne uslove, koristi se već data statistika testa, koja ima
normalan raspored (ako je H0 tačna). Također se radi o jednosmjernom testu. Kritična oblast u
ovom slučaju je K = (Z1- ;+).

6.1 Testiranje hipoteze o razlici proporcija dva osnovna skupa

Kada se testira hipoteza H0(p1=p2) protiv alternativne hipoteze H1 (p1p2) za dati nivo
značajnosti  i uslov ni*pi5, ni(1-pi) 5 za i=1,2 i n30, gdje su slučajni uzorci međusobno
nezavisni koristi se sljedeća statistika testa:

Za  se dobija kritična vrijednost Z1-/2 i kritična oblast K = (-; - Z1-/2)U(Z1-/2;+ ).

Preostala dva pravila se rade po istom principu.

18
7. POJAM I OBLICI X2 TESTA

χ2 test je neparametarski test saglasnosti zasnovan na primjeni χ2 rasporeda, o kojem će


biti govora kasnije. Vrijednost ovog testa je uvijek pozitivna i radi se o jednosmjernim
testovima. Najmanja vrijednost koja se može dobiti primjenom ovog testa je nula. Razlikuju
se dvije vrste χ2 testa:

 χ2 test oblika rasporeda,


 χ2 test nezavisnoti obilježja.

χ2 test je veoma jednostavan za primjenu. Za njega je karakteristično svojstvo


aditivnosti. Budući da je aritmetička sredina rasporeda jednaka broju stepena slobode, a
varijansa dvostrukom broju stepena slobode, sa porastom broja tog stepena, χ2 raspored teži
normalnom rasporedu.

Za pravilnu primjenu χ2 testa, neophodni su sljedeći uslovi:

 testiranje primjenom χ2 testa se može vršiti samo za apsolutne frekvencije,


 ukupna vrijednost teorijskih frekvencija i ukupna vrijednost originalnih
frekvencija moraju biti jednake,
 pri testiranju neke pojave pitanjima poput „da“ i „ne“, broju frekvencija „da“
se moraju pridružiti i frekvencije „ne“,
 male frekvencije (manje od 5) treba izbjegavati, ali u slučajevima kada se one
jave, potrebno ih je sabrati ili pridružiti drugima.

χ2 test se može sprovesti u većini statističkih programskih paketa, kao npr. u


programskom paketu Statistica, gdje se formira baza podataka koja sadrži eksperimentalno
dobivene i teorijske frekvencije koje su izračunate na bazi teorijske distribucije i veličine
uzorka.

χ2 se može koristiti za teorijske, diskretne i neprekidne teorijske distribucije. Korištenje


χ2 testa se smatra prikladnim ako su sve teorijske frekvencije veće od 5.

7.1. χ2 test oblika rasporeda

Karl Pirson je 1890. godine prvi uveo statistiku χ 2 oblika u statističku analizu.
Statistika testa za χ2 test je sljedeća:

19
gdje su fi empirijske frekvence, fi' očekivane frekvence, r broj modaliteta posmatrane slučajne
veličine i s broj nepoznatih ocijenjenih parametara na bazi uzorka.

Primjenom χ2 testa sa rizikom greške  testira se nulta hipoteza (H0) u kojoj se


pretpostavlja da obilježje ima određenu distribuciju, protiv alternativne hipoteze (H1) u kojoj
se pretpostavlja da obilježje nema očekivanu distribuciju. Broj stepeni slobode je r-s-1. Test je
jednosmjeran i pozitivan. Za dati nivo značajnosti  se dobija kritična vrijednost χ2r-s-1 i
kritična oblast je K = (χ2r-s-1; ; +).

Slika 3. χ2 test oblika rasporeda3

7.2. χ2 test nezavisnosti obilježja

χ2 test se također može primjenjivati i za testiranje nezavisnosti između dva obilježja.


Statistika testa koja se koristi za ovu vrstu χ2 testa je:

Pretpostavka je da su u nultoj hipotezi obilježja jednog skupa x i y nezavisna, a u


alternativnoj zavisna. Međutim, ta dva obilježja ne moraju biti kvantitativna. X (x1, x2, ..., xr) i
Y (y1, y2, ..., yr) su realizovane vrijednosti modaliteta. Dati nivo značajnosti je , kritična
vrijednost χ2(r-1)(s-1); i kritična oblast K = (χ2(r-1)(s-1); ; +).

3
Marjanović M., Mihailović I., Spasić K., Statistika u ekonomiji i poslovanju sa zbirkom rešenih
zadataka, Visoka poslovna škola strukovnih studija Leskovac, 2016.

20
8. POGREŠKE PRI TESTIRANJU STATISTIČKIH HIPOTEZA

Prilikom donošenja odluke o istinitosti hipoteze, moguće je donijeti krivu odluku,


odnosno pogrešku. Postoje dvije vrste takvih pogrešaka:

 pogreška prve vrste (nulta hipoteza odbačena iako je istinita),


 pogreška druge vrste (nulta hipoteza prihvaćena iako je neistinita).

Pogreška prve vrste se dešava kada vidimo učinak kojeg zapravo nema. Vjerovatnoća
da će se napraviti pogreška prve vrste se naziva alfa (). Alfa () je ono što smo u prethodnim
poglavljima nazivali nivoom značajnosti. Njena vrijednost se određuje prije testiranja
statističke hipoteze i najčešće je postavljena na 0,05 ili 0,01. Pogreška prvog reda se uvijek
može kontrolisati prilikom statističkog zaključivanja jer se zadaje unaprijed. Hipoteze se
formulišu na način da pogreška koja je bitnija bude pogreška prvog reda .

Jedan primjer ovakve pogreške je kada recimo u pravosudnom postupku osudimo


nevinog čovjeka ili oslobodimo krivca. Možemo se odlučiti da je bitnije kontrolisati
vjerovatnoću pogreške da osudimo nevinog čovjeka. Tako formuliramo hipoteze:

 H0 osumnjičeni je nevin
 H1 osumnjičeni je kriv

Pogreška prvog reda u ovom slučaju je vjerovatnoća odbacivanja nulte hipoteze kad je
ona istinita, tj. vjerovatnoća da nevin čovjek bude proglašen krivim. Kad bi se hipoteze
obrnule, odnosno da je H0 osumnjičeni je kriv, tada bismo pogrešku zadali unaprijed i
kontrolisali to da kriv čovjek bude oslobođen.

 = P (pogreška prve vrste)= P (odbacujemo H0 | H0 istinita) ⇒ nivo značajnosti

Pogreška druge vrste se događa kada ne vidimo razliku, a ona je zapravo prisutna.
Vjerovatnoća da će se napraviti pogreška druge vrste se naziva beta ( ). Vrijednost ove
pogreške zavisi od prave vrijednosti parametra o kojem se raspravlja, pogreške , standardne
devijacije populacije i veličine uzorka.  se povezuje sa snagom testa u otkrivanju učinka
navedene veličine. Kod pogreške druge vrste radi se o vjerovatnoći prihvatanja H0 u slučaju
kada je H1 istinita. Pogreška druge vrste  pada kada postoji veća razlika između
pretpostavljene i prave vrijednosti parametra koji se testira, a raste kada pogreška prvog reda
 pada.

21
Vodeći se prethodnim primjerom, pokazat ćemo kako dolazi do pogreške drugog reda.
Postavljamo hipoteze:

 H0 osumnjičeni je nevin
 H1 osumnjičeni je kriv

U ovom slučaju osumnjičeni je kriv, ali proglašen nevinim.

β = P ( pogreška druge vrste)= P (prihvatamo H0 | H0 neistinita)

1-β=P (odbacujemo H0 | H0 neistinita) ⇒ snaga testa

Slika 4. Pogreške prve i druge vrste pri testiranju statističkih hipoteza4

4
Emmert-Streib F., Dehmer M., Understanding Statistical Hypothesis Testing: The Logic of Statistical
Inference, Machine learning & knowledge extraction 2019, 1, Licensee MDPI, Switzerland, 2019.

22
9. ZAKLJUČAK

Ogroman broj podataka raspoloživih danas iziskuje postojanje raznih metoda analiza,
kako bi se njima uspješno rukovodilo. Upravo testiranje statističke hipoteze predstavlja jednu
od najčešće korištenih metoda.

Testiranje statističke hipoteze kao jedna od dvije komponente statističkog


zaključivanja, koje se u statistici koristi za spoznaju istine koja je sadržana u pretpostavkama,
služi za ispitivanje te istine pomoću dvije hipoteze, nulte i alternativne. Uprkos njenoj
učinkovitosti, sedam koraka u postupku testiranja, počevši od odabira odgovarajuće statistike
testa pa sve do donošenja prave odluke o istinitosti postavljene hipoteze, pokazuju da metoda
testiranja statističke hipoteze nije najjednostavnija opcija.

Načini testiranja statističke hipoteze se uglavnom provode pomoću matematičkih


formula i jednačina, a dvije moguće vrste pogrešaka do kojih dolazi prilikom testiranja,
pogreška prve i druge vrste, su u većini slučajeva neizbježne. Shodno tome, nulta i
alternativna hipoteza se i formulišu na način da bitnija pogreška bude pogreška prve vrste, iz
razloga što je nju moguće predvidjeti i kontrolisati.

Hipoteza rada je glasila:

„Testiranje statističke hipoteze je bitno sredstvo za donošenje binarnih odluka.“

Na kraju ovog rada, hipoteza se prihvata jer je utvrđeno da testiranje statističke


hipoteze omogućava pretvaranje podataka u odluke, prvenstveno binarne prirode, i stoga je
zbog velike potrebe za naučnim odlukama, budućnost bez testiranja statističke hipoteze teško
zamisliti.

23
10. LITERATURA

Knjige:

 Benšić M., Šuvak N., Primijenjena statistika, Sveučilište J.J. Strossmayera, Odjel za
matematiku, Osijek 2013.
 Marjanović M., Mihailović I., Spasić K., Statistika u ekonomiji i poslovanju sa
zbirkom rešenih zadataka, Visoka poslovna škola strukovnih studija, Leskovac, 2016.

Članci:

 Emmert-Streib F., Dehmer M., Understanding Statistical Hypothesis Testing: The


Logic of Statistical Inference, Machine learning & knowledge extraction 2019, 1,
Licensee MDPI, Switzerland, 2019.
 Ilakovac V., Testiranje statističkih hipoteza i neke zamke, Biochemia Medica 2009;
19(1): 10-6, Medicinska naklada, Zagreb, 2009.

Tekstovi sa interneta:

 https://towardsdatascience.com/one-tailed-or-two-tailed-test-that-is-the-question-
1283387f631c (29.01.2021.)
 http://www.unizd.hr/Portals/12/Nastavnici/Irena%20Buric/Uvod%20u
%20deskriptivnu%20i%20inferencijalnu%20statistiku.pdf (01.02.2021.)
 http://www.zemris.fer.hr/predmeti/statmod/Uvod%20u%20statisticko
%20zakljucivanje (01.02.2021.)
 https://pistatistics.com/kurs/statistika-varijable-podaci/lekcije/verovatnoca-i-
statisticko-zakljucivanje/ (01.02.2021.)

24

You might also like