You are on page 1of 25

TESTIRANJE HIPOTEZA

TESTIRANJE HIPOTEZA
Testiranje hipoteza je oblast statističke analize koja
omogućava donošenje zaključaka o celoj populaciji na
osnovu podataka iz uzorka.
Statistički test je postupak prihvatanja ili odbacivanja
statističkih hipoteza na osnovu realizovanog uzorka.
U postupku testiranja hipoteze zaključak o parametru
osnovnog skupa donosimo na osnovu vrednosti
odgovarajuće statistike uzorka.
Primer (Prem S. Mann, Uvod u statistiku)
Kompanija bezalkoholnih pića tvrdi da njihove limenke soka u
proseku sadrže 2,5 dl soka.
Ako želimo da utvrdimo da li je to tvrđenje tačno, treba da izaberemo
uzorak i izmerimo količinu soka u limenkama iz uzorka.
Recimo da je uzorak činilo 100 limenki soka i da je prosečna količina
soka u njima 2,45 dl. Da li na osnovu ovog rezultata možemo da
tvrdimo da kompanija obmanjuje potrošače?
POSTUPAK TESTIRANJA HIPOTEZE
ZASNOVAN NA KRITIČNOJ
VREDNOSTI
I. Formulisanje hipoteza (nulte i alternativne ).
II. Određivanje tipa testa i izbor raspodele koja će se koristiti.
III. Određivanje kritične vrednosti i kritične oblasti.
IV. Izračunavanje vrednost statistike testa.
V. Donošenje odluke.
HIPOTEZE -
NULTA I ALTERNATIVNA HIPOTEZA
Nulta hipoteza () je tvrđenje o nekom parametru osnovnog
skupa koje se smatra istinitim sve dok se ne dokaže suprotno.
Alternativna hipoteza () je alternativno tvrđenje nultoj hipotezi o
parametru osnovnog skupa koje će biti istinito ako je nulta
hipoteza neistinita za dati uzorak.
Primer (Prem S. Mann, Uvod u statistiku)
Kompanija bezalkoholnih pića tvrdi da njihove limenke soka u
proseku sadrže 2,5 dl soka.
Recimo da je uzorak činilo 100 limenki soka i da je prosečna količina
soka u njima 2,45 dl. Da li na osnovu ovog rezultata možemo da
tvrdimo da kompanija obmanjuje potrošače?
: μ = 2,5 dl
: μ 2,5 dl
GREŠKE
Prilikom testiranja hipoteza moguće su dve vrste grešaka:
Greška prve vrste nastaje kada se odbaci nulta hipoteza iako je
tačna.
Verovatnoća nastanka ove greške jednaka je nivou značajnosti α .
Greška druge vrste ako se konstatuje da uzorak ne protivreči
nultoj hipotezi iako je nulta hipoteza pogrešna.
Grešku druge vrste obeležavamo sa β .
GREŠKE
Senzitivnost testa je vrednost 1 – α koja izražava verovatnoću ne
odbacivanja nulte hipoteze kada je ona stvarno tačna.
Moć (jačina) testa je vrednost 1 – β koja predstavlja verovatnoću
da ne prihvatimo nultu hipotezu kada ona stvarno nije tačna.
Smanjivanjem vrednosti α povećava se β i obrnuto.
Sa povećanjem broja β moć testa opada.
Testovi značajnosti ne kontrolišu greške druge vrste.
GREŠKE
Nulta hipoteza je Nulta hipoteza nije
tačna tačna
Ispravna odluka
Ne odbacujemo Greška II vrste
1–α
nultu hipotezu β
= senzitivnost testa
Greška I vrste Ispravna odluka
Odbacujemo nultu
α 1–β
hipotezu
= nivo značajnosti = moć testa
KRITIČNA OBLAST

Kritična oblast nulte hipoteze je oblast odbacivanja nulte


hipoteze.
Kritična oblast se određuje na osnovu unapred zadatog nivoa
značajnosti α.
Za nivo (prag ) značajnosti α najčešće se biraju vrednosti:
0.05, 0.01, 0.025 i 0.1.
Vrednost α, po pravilu ne prelazi 0.1 (10%).
SMEROVI (OBLICI) TESTA

Statistički testovi mogu biti:


dvostrani,
levostrani (donji jednostrani) i
desnostrani (gornji jednostrani).
Oblik testa se određuje prema relacijskom znaku
alternativne hipoteze.
DVOSTRANI TEST

U alternativnoj hipotezi relacijski


znak je .
Relacijski znak u nultoj hipotezi je
=.
Oblast odbacivanja je na oba kraja
krive raspodele.
Ukupna površina ispod krive
raspodele u oblasti odbacivanja je α.
Ima dve kritične vrednosti.
LEVOSTRANI TEST

U alternativnoj hipotezi relacijski


znak je <.
U nultoj hipotezi znak je = ili ≥.
Oblast odbacivanja je na levom
kraju krive raspodele.
Površina ispod krive raspodele u
oblasti odbacivanja je α.
Ima jedna kritična vrednost.
DESNOSTRANI TEST
U alternativnoj hipotezi relacijski
znak je >.
U nultoj hipotezi znak je = ili ≤.
Oblast odbacivanja na desnom
kraju krive raspodele.
Površina ispod krive raspodele u
oblasti odbacivanje je α.
Postoji jedna kritična vrednost.
SMEROVI (OBLICI) TESTA

Levostrani test Dvostrani test Desnostrani test

Relacijski znak u
nultoj hipotezi = ili = = ili
Relacijski znak u
alternativnoj < >
hipotezi
Kritična oblast
(oblast odbacivanja) Levi kraj krive Oba kraja krive Desni kraj krive
nulte hipoteze raspodele raspodele raspodele
TESTIRANJE
HIPOTEZE O
ARITMETIČKOJ
SREDINI
PRISTUP ZASNOVAN NA KRITIČNOJ
VREDNOSTI
PRISTUP ZASNOVAN NA KRITIČNOJ VREDNOSTI

Vrednost nivoa značajnosti α je unapred određena.


Vrednost α predstavlja ukupnu površinu ispod krive raspodele u
oblasti odbacivanja.
Kod jednostranog testa postoji samo jedna kritična vrednost koju
određujemo na osnovu vrednosti α, pri tome α predstavlja površinu
na jednom kraju ispod krive raspodele.
Ako je test dvostrani, postoje dve kritične vrednosti i njih
određujemo na osnovu vrednosti α, koja predstavlja površine na oba
kraja krive raspodele.
ODREĐIVANJE KRITIČNE VREDNOSTI
U slučaju primene normalne raspodele:
nalazimo kritičnu(e) vrednost(i) c iz tablice za normalnu
raspodelu za dati nivo značajnosti α,
U slučaju primene t raspodele:
nalazimo kritičnu(e) vrednost(i) c iz tablice t raspodele za
dati broj stepeni slobode i određeni nivo značajnosti.
ODLUČIVANJE
Odluku donosimo na sledeći način:
ako vrednost realizovane statistike pripada kritičnoj oblasti, nulta
hipoteza se NE PRIHVATA (odbacuje se) na nivou značajnosti α,
a ako vrednost realizovane statistike ne pripada kritičnoj oblasti
konstatuje se da uzorak ne protivreči nultoj hipotezi na nivou
značajnosti α.
Ako se hipoteza ne prihvata, smatramo da je alternativna hipoteza
istinita.
TESTIRANJE HIPOTEZE O ARITMETIČKOJ SREDINI –
IZBOR RASPODELE testiranje hipoteze
o

 nije poznato
 poznato

n<30
n<30 osnovni skup iz koga se
osnovni skup iz koga se
n<30 uzima uzorak ima n≥30
n≥30 uzima uzorak ima osnovni skup nema normalnu raspodelu
normalnu raspodelu normalnu raspodelu ili
je raspodela nepoznata

koristimo
normalnu koriste se koristimo t
raspodelu neparametarske raspodelu
metode
TESTIRANJE HIPOTEZE O ARITMETIČKOJ SREDINI -
IZRAČUNAVANJE STATISTIKE TESTA ZA NORMALNU
RASPODELU

Izračunavanje vrednosti z za x (kada koristimo normalnu raspodelu)


x 
z , pri čemu je  X  .
X n
Izračunatu vrednost z, na osnovu x iz izabranog uzorka, nazivamo i realizovana vrednost statistike z testa.
TESTIRANJE HIPOTEZE O ARITMETIČKOJ SREDINI -
IZRAČUNAVANJE STATISTIKE TESTA ZA t RASPODELU

Izračunavanje vrednosti statistike t testa za aritmetičku sredinu uzorka x


x s
t , pri čemu je sX  .
sX n
Izračunatu vrednost t, na osnovu x primenom ove jednačine, takođe nazivamo realizovana vrednost
statistike t testa.
Primer 1

Telefonska kompanija pruža usluge međunarodnih razgovora u jednoj


oblasti. Na osnovu raspoloživih informacija utvrđeno je da je prosečna
dužina međunarodnih razgovora, koji su preko ove kompanije obavljeni
u 2004. godini, bila 12.44 minuta. Uprava kompanije je želela da proveri
da li se prosečna dužina aktuelnih telefonskih razgovora razlikuje od
12.44 minuta. U uzorku od 150 takvih razgovora, prosečna dužina je
iznosila 13.71 minut. Standardna devijacija svih razgovora je 2.65
minuta. Da li na nivou značajnosti od 2% možete da zaključite da se
prosečna dužina aktuelnih međunarodnih razgovora razlikuje od 12.44
minuta?
Primer 2

Gradonačelnik jednog velikog grada tvrdi da prosečna neto vrednosti


imovine porodica koje žive u tom gradu iznosi najmanje 300000 €. U
izabranom slučajnom uzorku od 25 porodica iz tog grada, prosečna neto
vrednost imovine iznosi 288000 €. Pretpostavimo da neto vrednosti svih
porodica u ovom gradu ima normalnu raspodelu, sa standardnom
devijacijom 80000 €. Možete li da zaključite, na nivou značajnosti od
2.5%, da je gradonačelnikova tvrdnja neistinita?
Primer 3

Rukovodstvo banke je uvek brinulo o kvalitetu pruženih usluga. Sa starim


kompjuterskim sistemom bankarski službenik je mogao da usluži u proseku 22
klijenta na sat. Rukovodstvo je uočilo da je uz ovakvu brzinu pružanja usluga,
vreme čekanja klijenata predugo. Nedavno je rukovodstvo banke instaliralo
novi kompjuterski sistem u banci očekujući da će to povećati brzinu pružanja
usluga. Da bi utvrdili da li je novi sistem efikasniji nego stari, uprava je izabrala
slučajan uzorak od 70 sati rada sa klijentima i ustanovila da je tokom ovog
vremena prosečan broj klijenata kojima su bankarski službenici pružili usluge
bio 27 klijenata na sat, sa standardnom devijacijom od 2.5. Testirajte na nivou
značajnosti od 1% da li je novi kompjuterski sistem efikasniji od starog?

You might also like