You are on page 1of 13

SVEUČILIŠTE/UNIVERZITET „VITEZ“ VITEZ

FAKULTET INFORMACIONIH TEHNOLOGIJA

STUDIJ I CIKLUSA; GODINA STUDIJA: I CIKLUS : I GODINA


SMIJER: SOFTVERSKI INŽINJERING

TESTIRANJE STATISTIČKIH HIPOTEZA I NAČINI


TESTIRANJA

SEMINARSKI

Travnik, Januar.2023. godine

1
SVEUČILIŠTE/UNIVERZITET „VITEZ“ VITEZ
FAKULTET INFORMACIONIH TEHNOLOGIJA
STUDIJ I CIKLUSA; GODINA STUDIJA: I CIKLUS: I GODINA
SMIJER: SOFTVERSKI INŽINJERING

TESTIRANJE STATISTIČKIH HIPOTEZA I NAČINI


TESTIRANJA

SEMINARSKI RAD

IZJAVA: Ja Džan Pirić student Sveučilišta/Univerziteta „Vitez“ Vitez,


Indeks broj: 284-22/RISI odgovorno i uz moralnu i akademsku odgovornost
izjavljujem da sam ovaj rad izradio potpuno samostalno uz korištenje citirane
literature i pomoć profesora odnosno asistenata.

Potpis studenta: _________________

STUDENT: Džan Pirić


PREDMET: Statistika
PROFESOR: Prof.dr. Ibrahim Obhođaš
ASISTENT: Mr. Ajdina Karić

2
SADRŽAJ
1. UVOD.....................................................................................................................................
1.1. PROBLEM, PREDMET I OBJEKTI ISTRAŽIVANJA...............................................
1.2. RADNA HIPOTEZA I POMOĆNE HIPOTEZE...........................................................
1.3. SVRHA I CILJEVI ISTRAŽIVANJA.............................................................................
1.4. ZNANSTVENE METODE (KOJE SE KORISTE PRI IZRADI RADA)....................
1.5. STRUKTURA RADA........................................................................................................
2. TESTIRANJE STATISTIČKIH HIPOTEZA...................................................................
3. NAČIN TESTIRANJA.........................................................................................................
3.1. Način testiranja statističkih hipoteza................................................................................
3.2. Nulta i alternativna hipoteza............................................................................................
3.3. Greške pri testiranju i nivo značajnosti testa....................................................................
3.4. Izbor testa i izračunavanje statistike testa........................................................................
3.5. Logika statističkog testiranja hipoteze............................................................................
4. ZAKLJUČAK.....................................................................................................................
5. LITERATURA....................................................................................................................

3
1. UVOD

Statistička hipoteza je takva hipoteza koja je provjerljiva na temelju promatranih


podataka koji su modelirani kao ostvarene vrijednosti uzete iz skupa nasumičnih
varijabli. Skup podataka modelira se kao ostvarene vrijednosti skupine nasumičnih
varijabli koje imaju zajedničku distribuciju vjerojatnosti u nekom skupu mogućih
zajedničkih distribucija. Hipoteza koja se testira je upravo taj skup moguće
distribucije vjerojatnosti. Testiranje statističkih hipoteza je metoda statističke
inferencije. Za moguću distribuciju podataka predlaže se alternativna hipoteza,
Usporedba dvaju modela smatra se statistički značajnom ako je prema pragu
vjerojatnosti (razina značajnosti) pojava podataka malo vjerojatna ako je nulta
hipoteza istinita. Testiranje hipoteze određuje koji ishod može dovesti do
odbacivanja nulte hipoteze prema predodređenoj razini značajnosti, koristeći
prethodno izabrane mjere devijacije (rezultat statističkog testa, prikladnost modela).
Prethodno izabrana razina značajnosti maksimalna je dopuštena "lažno pozitivna"
stopa - poželjno je kontrolirati rizik pogrešnog odbacivanja istinite nulte hipoteze.

1.1. PROBLEM, PREDMET I OBJEKTI ISTRAŽIVANJA

U uvodnoj riječi rada prije svega je potrebno definisati pojam koji je povezan sa
samim nazivom seminarskog rada,a to je testiranje statističkih hipoteza i način
testiranja.
Statistički metod kojim se empirijska evidencija uzorka koristi radi procjenjivanja nj
ene prihvatljivosti naziva se testiranjem hipoteze, a procedura statističkim testom

1.2. RADNA HIPOTEZA I POMOĆNE HIPOTEZE

Statistička hipoteza je precizno formulisano tvrđenje ili pretpostavka o nekoj važnoj


karakteristici jednog ili više skupova.Testiranje statističkih hipoteza je
metoda statističke inferencije. Proces razlikovanja između nulte hipoteze i

4
alternativne hipoteze potpomognut je uzimanjem u obzir dva tipa koncepcijskih
pogrešaka.

1.3. SVRHA I CILJEVI ISTRAŽIVANJA

Osnovni cilj seminarskog rada je da se objasni testiranje statistiučkih hipoteza,


koliko su značajani i također o načinu testiranja,to jest da se ukratko kaže o primjeni
i koristi statističke hipoteze.

1.4. ZNANSTVENE METODE (KOJE SE KORISTE PRI IZRADI


RADA)

U ovom seminarskom radu koristit ćemo sljedeće znanstvene metode:


- Metoda analize i sinteze,
- Metoda klasifikacije

1.5. STRUKTURA RADA

Struktura seminarskog rada je usklađena sa Uputstvom za pisanje seminarskog rada


na prvom ciklusu studija kao i temi seminarskog rada. On sadrži četri poglavlja
Prvo poglavlje, Uvod, sadrži pet podpoglavlja:
- Problem, predmet i objekt istraživanja,
- Radna hipoteza i pomoćne hipoteze,
- Svrha i ciljevi istraţivanja,
- Znanstvene metode,(koje se koriste pri izradi rada)
- Struktura rada.
Drugo poglavlje sadrži o testiranju statističkih hipoteza
Treće poglavlje sadržit o načinu testiranja
Četvrto poglavlje sadrži zaključak koji ukratko govori najbitnije stvari o testiranju
statističke hipoteze i način testiranja.

5
2. TESTIRANJE STATISTIČKIH HIPOTEZA

Kao što smo napomenuli ukoliko postoje određene informacije o vrednostima


parametra osnovnog skupa tada se provodi postupak testiranja statističkih hipoteza.
Cilj testiranja je da se ispita prihvatljivost tvrdnji ili pretpostavki koje se tiču
osobina jednog ili više osnovnih skupova. Kao i kod ocenjivanja parametara do
tačnih vrednosti se može doći samo sveobuhvatnim posmatranjem jedinica skupa.
Takođe, da bismo bili potpuno sigurni u tačnost navedenih pretpostavki i tvrđenja
morali bismo izvršiti popis. Kako to obično ne činimo, prilikom testiranja hipoteza
koristimo uzorak i na osnovu njega donosimo odluku da li su postavljene
pretpostavke prihvatljive ili nisu.
Statistička hipoteza je precizno formulisano tvrđenje ili pretpostavka o nekoj važnoj
karakteristici jednog ili više skupova. Pošto odluku o prihvatanju ili odbacivanju
statističke hipoteze donosimo na osnovu informacija iz uzorka, prilikom testiranja
hipoteza uvek je prisutan rizik da ćemo u odluci pogrešiti. Moguće je napraviti dve
vrste grešaka, ali treba naglasiti da verovatnoće javljanja ovih grešaka možemo
kontrolisati. Statističke testove možemo klasifikovati na dva načina.
Prema broju uzoraka koje analiziramo testove delimo na:
• testove zasnovane na jednom uzorku,
• testove zasnovane na dva uzorka i
• testove zasnovane na tri i više uzoraka.
S obzirom na vrstu i jačinu pretpostavki na kojima se zasnivaju, testove delimo na
parametarske- klasične testove i neparametarske testove. Parametarski (klasični)
testovi formulisani su početkom XX veka. Njihova teorijska podloga se zasniva na
verovanju da u prirodi i društvu preovladava samo jedan raspored, normalan
raspored. Ukoliko je ovaj preduslov ispunjen, tada su parametarski testovi optimalan
izbor. Tek posle drugog svetskog rata počeo je ubrzan razvoj druge vrste testova, koji
nemaju preduslov normalnosti. U ovu grupu testova spadaju resampling testovi.U
statističkoj teoriji formulisan je veliki broj testova za različite namene, jer ne postoji
jedan, „savršen“ test, koji bi bio optimalan u svakoj mogućoj situaciji. Situacija se
potpuno promenila poslednjih godina, sa opštom dostupnošću računara i statističkih
softvera. Zbog toga se naglasak stavlja, ne na puku primenu nekog testa, već na
ispitivanje preduslova na kojima se test zasniva i interpretaciji rezultata.

6
3. NAČIN TESTIRANJA

3.1. Način testiranja statističkih hipoteza


Odmah napomenimo da se u statistici nikada ne zaključuje da je nulta hipoteza
stvarno istinita,već samo da nemamo dovoljno dokaza da je odbacimo.
Prilikom testiranja neke tvrdnje ili pretpostavke postavljaéemo dve suprostavljene
hipoteze, nultu i alternativnu. Da bi se odbacila nulta hipoteza uzimaćemo uzorak i
traziti empirijske dokaze. Ako pronademo dovoljno dokaza odbacicemo nultu
hipotezu i usvojiti alternativnu.Ako, pak, ne pronađemo, kažemo samo jedno: nismo
našli dokaze da odbacimo nultu hipotezu. Potpuno je pogrešno tvrditi da je nulta
hipoteza tačna.Ovo važi uvijek: statističkim testiranjem je nemoguée dokazati da je
nulta hipoteza istinita.
Postupak statističkog testiranja hipoteza

1. Na osnovu postavljenog problema formulise se nulta i alternativna


hipoteza i bira tzv. nivo znacajnosti,α

2. Uzima se slučajan uzorak, bira odgovarajuci test i izračunava Izv.


statistika testa

3. Provjerava se da li su ispunjene pretpostavke na kojima se izabrani test


zasniva. Ako nisu, prekida se proces testiranja i bira neki drugi test.

4. Odreduje se p-vrijednost (kod Newman-Pearsonovog pristupa odreduju se


tzv. kritične vrijednosti iz tablica odgovarajuéeg rasporeda)

5. Formulise se pravilo odlucivanja i donosi odluka o odbacivanju ili


neodbacivanju nulte hipoteze.

6. Formuliše se zaključak u kontekstu postavljenog problema

7
3.2. Nulta i alternativna hipoteza

Nulta hipoteza ( H o ) je postavka (iskaz) o vrijednosti nepoznatog parametra skupa.

Testiranje hipoteza je tako koncipirano da se procjeni jačina dokaza protiv nulte


hipoteze. Da bi se H odbacila potrebno je pronaći dovoljno ubjedljive dokaze u
uzorku. Konkretna nulta hipoteza varira od problema do problema, ali tipično se ona
postavlja u vidu status quo, tj. da "nema razlike", "nema uticaja", ili da "nema
promjene".
Nulta hipoteza može biti prosta i složena.
Nulta hipoteza je prosta ako se njom tvrdi da je parametar jednak tačno jednoj,
unapred
poznatoj numeričkoj vrijednosti, tzv. hipotetičnoj vrijednosti.

Nultu hipotezu, na primjer, možemo simbolički napisat H o : μ = 100 gr i


čitamo:“nulta hipoteza glasi da je aritmetička sredina skupa jednaka 100 grana“.

Ako nulta hipoteza obuhvata veći broj mogućih vrijednosti, na primjer, H 0: μ 100

gr, ona je složena, Bez obzira kako je postavljena, nulta hipoteza ona uvijek mora da
sadrži znak jednakosti.

Svakoj nultoj hipotezi suprostavljamo alternativnu hipotezu i označavamo je sa H 1


ili H a

Altemativna hipoteza je tyrđenje o parametru skupa koje će biti prihvaćeno samo


kada se nađu dovoljno ubjedijivi dokazi u uzorku. Najćešće se postavlja u vidu da
"ima razlike ", da "postoji uticaj" ili da je "došlo do promjenc”.
Alternativna hipoteza najčešće sadrži sve vrijednosti koje parametar moze imati a
koje
nisu obuhvaćene nultom hipotezom. Zbog toga je po pravilu data u obliku složene
hipoteze.
H 1 se u naućnim istraživanjima često naziva i istraživačkom hipotezom jer njom

istraživač izražava mišljenje koje postupkom testiranja nastoji da potvrdi. Usljed toga
u praksi često najprije postavljamo alternativnu hipotezu, a tek zatim nultu.
Alternativnu hipotezu kojom moguća odstupanja parametra u odnosu na hipotetičku
vrijednost detektujemo u oba smjera nazivamo dvosmjernom ili dvostranom
hipotezom.
Test koji se primjenjuje u ovakvoj situaciji i nazivamo dvosmjernim ili dvostranim
testom.

8
Hipoteze mogu biti postavljene kao jednosmjerne ili jednostrane ,a testove kojima
ispitujemo prihvatljivost H0 nazivamo jednosmjernimili jednostranim
testovima.Primjetimo da alternativna hipoteza ukazuje na smijer odstupanja koji je
kritičan.

3.3. Greške pri testiranju i nivo značajnosti testa

Slika br.1 Ishodi testiranja hipoteze i njihove vjerovatnoće

Na osnovu gornje tabele vidimo da ćemo isprayno postupiti u sljedeća dva slučaja:

1. Ako je H 0 istinita, a informacija iz uzorka saglasna sa njom, nultu hipotezu

nećemo odbaciti i zaključak testiranja će biti ispravan.

2. Ispravno ćemo postupiti i ako odbacimo H 0 koja je neistinita.

Rizik greške nije isto što i greška. Rizik greške je yjerovatnoča da ćemo napraviti
grešku. U zbiru, rizik greške prve vrste i rizik greške druge vrste nisu jednaki 1.
Postupak testiranja sprovodit ćemo tako što ćemo unaprjed fiksirati rizik greške i
vrste, tj. nivo značajnosti α . Većina istraživača u svijetu koristi uglavnom samo dva
nivoa značajnosti: 0,05 i 0,01. Ako odaberemo najčešće korišteni nivo značajnosti
& =0,05, onda svjesno unaprijed prihvatamo da ćemo u proseku u 5% slučajeva
napravit grešku, odnosno odbaciti istinitu H 0

Fisher je smatrao da ako pri testiranju već moramo da se suočimo sa mogučnosću


javijanja greške, onda je negdje potrebno da se povuče demarkaciona linija, a on je
lično preferirao 5%.

9
3.4. Izbor testa i izračunavanje statistike testa

Umijesto da vodi računa o smanjivanju β , istraživač se najčešće rukovodi


komplementarnomvjerovatnoćom, 1- β . Ova vjerovatnoća naziva se jačinom testa.
Zaključujemo da je optimalan onaj test koji za fiksni nivo značajnosti α ima najveću
jačinu, Međutim, jačina testa zavisi od identičnih faktora kao i rizik greške β i njen
nivo je skoro nemoguće izračunati u konkretnom uzorku. Parametarski testovi
predstavljaju optimalni izbor istraživača pri rješavanju postavljenog problema, uz
uslov da je raspored skupa (tj. skupova) normalan.

Istraživački problem
Z test (ako je poznata
standardna devijacija skupa)

Testiranje aritmetičke sredine


jednog skupa
t test (ako je nepoznata
standardna devijacija skupa

Testiranje poporcije jednog Z test (ako su ispunjeni uslovi


n π 0 >¿ 5 i n ( 1−π 0 )> 5)

Z test (ako su poznate


standardne devijacije skupa
Testiranje jednakosti aritmetičkih
sredina dva skupa
t test ( ako su jednake
V

10
standaedne devijacije skupa)

Testiranje jednakosti proporcija Z test (ako su ispunjeni

uslovi dva skupa n1 p1 >5i n1 ( 1− p1 ) >5

n2 p2 >5 in2 ( 1− p2 ) >5

Statistika testa je kriterijum na osnovu kojeg vršimo testiranje i na osnovu kojeg u


konceptu testiranja na osnovu kritičnih vrijednosti donosimo odluku o odbacivanju
ili
neodbacivanju nulte hipoteze. U našem "integralnom” konceptu testiranja statistika
testa je samo međukorak ka izračunavanju p-vrijednosti.

3.5. Logika statističkog testiranja hipoteze

Na taj način dolazimo do relativnog pokazatelja koji je nezavisan od mjernih


jedinica.
Statistika testa će uzimati različite vrijednosti od uzorka do uzorka i te vrijednosti je
nemoguće predvidjeti. Ona je slučajna promjenljiva i kao takva ima svoj raspored
vjerovatnoća. Ako nam je taj raspored poznat tada možemo izračunavati različite
vjerovatnoće realizacije različitih statistika testa, kao i one dobijene u konkretnom
uzorku. Mala vrijednost statistike testa nam ne daje osnove da odbacimo nultu
hipotezu. Nasuprot tome, njene velike vrijednosti nam sugerišu da nulta hipoteza nije
tačna,što je veća vrijednost statistike testa uvjrljiviji su i dokazi da je nulta hipoteza
pogrešna.
To se upravo postiže preko p-vrijednosti, koja konvertuje vrijednost bilo koje
statistike testa na skalu od 0 do 1, Razumijevanje p-vrijednosti studentima pruža life-
long (dozivotno) sredstvo da shvate kompjuterski izlaz svakog statističkog testa i da
po krajnje jednostavnom pravilu donesu odluku 0 tačnosti nulte hipoteze.

11
p-yrijednost je yjerovatnoća, izračunata pod pretpostavkom da je nulta hipoteza
tačna, da statistika testa uzme vrijednost koja je toliko ekstremna ili još ekstremnija
od one upravo realizovane. Sto je manja p-vrijednost jači su dokazi protiv nulte
hipoteze.
Ako je p-vrijednost manja od nivoa značajnosti a nulta hipoteza se odbacuje.

U suprotnom, ćemo reći da nemamo dovoljno argumenata da odbacimo H 0.

Zbog čestih grešaka u praksi u tumačenju p-vriiednosti, potrebno je voditi računa o


slijedećem:
a) p-vrijednost nije vjerovatnoća da je nulta hipoteza tačna.
b) p-vrijednost nista ne govori o veličini razlike između hipotetične vrijednosti i
dobijenog
rezultata na osnovu uzorka.

Jedan broj statističara smatra da bi postupak testiranja trebalo da se završi sa


izračunavanjem p-vrijednosti. Po njima, umjesto da se donosi odluka o odbacivanju
ili
neodbacivanju nulte hipoteze poređenjem p-vrijednosti sa nivoom značajnosti, treba
jednostavno iskazati dobijenu p-vrijednost i prepustiti svakome da je lično protumači
po svom nahodenju.

Slika br.2 Interpretacija jačine argumenata protiv nulte hipoteze

12
4. ZAKLJUČAK

Testiranje hipoteza je statistička procedura u kojoj se podaci uzorka koriste da bi se


donijela odluka da li neku tvrdnju (ili postavku) o nekoj karakteristici skupa treba
odbaciti ili ne odbaciti. U ovom poglavlju izučavali smo dva parametarska testa (Z i
t) i njihovu primenu u slučaju jednog i dva uzorka. Logika testiranja hipoteza se
zasniva na pronalaženju dovoljno dokaza u uzorku kako bi se nulta hipoteza
odbacila. Parametarski testovi se zasnivaju na pretpostavci da izučavana pojava,
odnosno osnovni skup, ima normalan raspored. Studentov t-test se nikada ne koristi
pri testiranju proporcije skupa. p-vrijednost je vjerovatnoća da statistika test uzme
vrijednost koja je jednaka ili još više ekstremna od realizovane, pod uslovom da je
nulta hipoteza istinita. Pravilo odlučivanja na osnovu p-vrijednosti glasi: nulta
hipoteza se odbacuje ako je p-vrijednost manja od odabranog nivoa značajnosti,α .

5. LITERATURA

Tekstovi s interneta:
1) https://www.bpa.edu.rs/FileDownload?filename=ed3603b4-ef52-
4ab9-bf6c-b897d6b2c7e6.pdf&originalName=Stat-8-pred-vezbe-
SD.pdf
2) https://www.scribd.com/document/396370527/08-Testiranje-
hipoteza-uvodni-dio-doc#
3) https://www.ucg.ac.me/skladiste/blog_23736/objava_71684/fajlovi/
07_Testovi.pdf

13

You might also like