You are on page 1of 55

STATISTIKA

smajilovic@gmail.com

.m

at e

11. oktobar 2010.

at ik

Mirnes Smajilovi c

a. c

om

.b a

Mirnes Smajilovi c

Statistika

O skripti
Ova skripta djelimino (a moda i potpuno) prati predavanja iz Statistike na Prirodnoc z matematikom fakultetu Univerziteta u Tuzli, odsjek Matematika. c Zadravam pravo da ova skripta ima tamparskih greaka, kao i matematikih greaka iz z s s c s razloga jer je ovo radna i nepregledana verzija iste. U cilju da poboljamo ovu skriptu iz s Statistike, na sve nenamjerne propuste moete ukazati putem e-maila smajilovic@gmail.com. z

Dozvoljeno je tampanje. s Pravo na objavljivanje skripte ima samo portal Matematika.com.ba. Svako drugo objavljivanje zahtjeva dozvolu autora.

.m

at e

at ik

a. c
http://matematika.com.ba 1 Radna verzija

om

.b a

Sadraj z
1 Uvod u matematiku statistiku c 1.1 Pojam i predmet matematike statistike . . . . . . . . . . . . . . . . . c 1.2 Osnovne etape statistikih ispitivanja . . . . . . . . . . . . . . . . . . . c 1.3 Prikazivanje statistikih podataka. Raspodjela obiljeja . . . . . . . . c z 1.4 Srednje vrijednosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Disperzija i druge mjere odstupanja . . . . . . . . . . . . . . . . . . . 1.6 Momenti. Mjere asimetrije i spljotenosti . . . . . . . . . . . . . . . . s 1.7 Neke vanije raspodjele u mat. statistici: gama i beta raspodjela . . . z 1.8 Neke vanije raspodjele u mat. statistici: 2 - raspodjela . . . . . . . . z 1.9 Neke vanije raspodjele u mat. statistici: Studentova ili tn raspodjela . z 1.10 Neke vanije raspodjele u mat. statistici: F raspodjela . . . . . . . . . z 3 3 5 6 9 12 13 14 16 18 21 22 22 24 26 28 29 31 33 35 36 37 37 39 41 43 45 49

3 Testiranje parametarskih hipoteza 3.1 Pojam parametarske hipoteze, Kritina oblast. Vrste greaka . . . . . . . . c s 3.2 Testiranje hipoteze o matematikom oekivanju kada je poznata disperzija . c c 3.3 Testiranje hipoteze o matematikom oekivanju kada nije poznata disperzija c c 3.4 Testiranje hipoteze o jednakosti matematikog oekivanja . . . . . . . . . . c c 3.5 Testiranje hipoteze o disperziji . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Testiranje hipoteze o vjerovatnoi . . . . . . . . . . . . . . . . . . . . . . . . c

2 Ocjenjivanje parametara raspodjele 2.1 Nepristranost, stabilnost i ekasnost ocjene . . . . . . . . . . . . . . . . . . . . 2.2 Takaste ocjene parametra. Metoda momenata . . . . . . . . . . . . . . . . . . c 2.3 Metoda maksimalne vjerodostojnosti . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Intervalne ocjene parametara . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Interval povjerenja za mat. oekivanje kada je poznata disperzija . . . . c 2.4.2 Interval povjerenja za mat. oekivanje kada nije poznata disperzija . . . c 2.4.3 Interval povjerenja za disperziju kada je poznato mat. oekivanje . . . . c 2.4.4 Interval povjerenja za disperziju kada nije poznato mat. oekivanje . . . c 2.4.5 Interval povjerenja za nepoznatu vjerovatnou p kod binomne raspodjele c

.m

at e

at ik

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

a. c

om

.b a

. . . . . .

. . . . . .

4 Testiranje neparametarskih hipoteza 51 4.1 Pojam neparametarske hipoteze . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 4.2 2 -test za verikaciju hipoteze o raspodjeli obiljeja . . . . . . . . . . . . . . . 52 z 2 -test za verikaciju hipoteze o nezavisnosti dvaju obiljeja . . . . . . . . . . . 53 4.3 z

Glava 1

Uvod u matematiku statistiku c

Rije statistika dolazi od latinske rijei status=stanje i prvobitno je predstavljala skup izvjesnih c c podataka numerikih karakteristika koji se odnose na stanje posmatrane pojave, posebno na c stanje u dravi. z U staroj Kini i starom Egiptu popisivani su vojni i poreski obaveznici i njihova imovina. Organizovano statistiko popisivanje u starom Rimu je predstavljalo tzv. cenzus koji se c sastojao u prebrojavanju stanovnitva i popisu njihove imovine, obino svake pete godine. s c Krajem 18. i poetkom 19. st. u nekim zemljama organizuju se posebne statistike slube c c z sa ciljem sakupljanja i sredivanja raznovrsnih podataka o stanju u drutvu i privredi. s Isticanjem zahtjeva za matematikom obradom tih podataka i otkrivanjem zakonitosti posc matranih pojava dovodi do potrebe razvoja matematike statsitike kao posebne matematike c c discipline. Na razvoj matematike statistike naroito podsticajno su djelovali rezultati teorije vjerovatnoe. c c c U dananje vrijeme, na razvoj matematike statistike snano djeluje savremena raunarska s c z c tehnika. Primjena raunara omoguava brzu obradu velikog broja prikupljenih podataka. c c Predmet prouavanja matematike statistike su masovne pojave. Dakle, izuavaju se c c c masovne pojave, a ne pojedinani sluajevi. Pojedinani sluajevi mogu pokazivati manja ili c c c c vea odstupanja od prosjenog ili tipinog. c c c c Medutim, sve pojave posmatrane u velikom broju sluajeva pokazuju izvjesnu pravilnost u ponaanju, izvjesnu tendenciju u ispoljavanju slinosti. Te pravilnosti su interesantne za s c statisiku. Opte zakonitosti se ispoljavaju u masi. s Najmanja odstupanja od prosjenog ili tipinog pokazuju pojave koje se javljaju pod utic c cajem malog broja faktora. Nazovimo takve pojave elementarnim. Odnosi izmedu elementarnih pojava i uzronih faktora su od strogo determinisanih do skoro determinisanih. c Primjer 1.1.1 Povien krvni pritisak najee je uzrok infarkta i zbog toga je veoma znaajno s c sc c kontrolisati ga. Poznato je da krvni pritisak zavisi od godina ivota. z Pretpostavimo da elimo saznati vrijednost krvnog pritiska kod zdravih ljudi. Potpunu inz formaciju nikada ne moemo saznati s obzirom na: broj stanovnika, potrebno vrijeme mjerenja, z mogue promjene u toku mjerenja, nejasan kriterijum kod zdravih ljudi itd. c Zbog toga, ispitivanje se izvodi na jednom podskupu ljudi. Izbor tog podskupa, tzv. uzorka, iz skupa svih ljudi, npr. cijele drave ili populacije (generalni skup) treba da zadoz volji izvjesne uslove. Nestrogo govorei, a tano, zakljuak koji izvedemo na osnovu uzorka c c c treba s velikom pouzdanou da vai za itavu populaciju. Kae se: uzorak treba da bude sc z c z

.m

at e

at ik
3

a. c

om

.b a

1.1

Pojam i predmet matematike statistike c

Mirnes Smajilovi c

Statistika

reprezentativan, tj. da ispitivana predstava o odredenoj pojavi bude saglasna sa cijelom populacijom. Ispitivanje pojave na cijeloj populaciji, po pravilu nije mogue. Ako bi broj elemenata u c uzorku bio mali, kae se: obim uzorka mali. Tada ne bismo bili sigurni da dobijeni rezultati nisu z posljedica puke sluajnosti ili nemamo razloga da vjerujemo da se opta zakonitost ispoljila c s na tako malom broju sluajeva. c Dakle, obim uzorka treba da bude dovoljno velik. Obim uzorka treba da bude takav da se u razumnom vremenskom periodu mogu izvriti navedena ispitivanja. s Praksa je pokazala, da obim uzorka nije dovoljan za reprezentativnost. U prethodnom primjeru, ako bi uzeli veliki broj mukaraca, to ne bi bilo dovoljno da zakljuak prenesemo na s c cijelu populaciju. Primjer 1.1.2 Zeli se provjeriti ekasnost novog lijeka L za lijeenje od bolesti B. Radi toga, c lijek se daje jednoj grupi pacijenata, inae dobrovoljaca, i registruje se efekat primjene tog c lijeka. Ako je lijeenje bilo uspjeno u 99% sluajeva, da li treba dozvoliti upotrebu tog lijeka? c s c Na osnovu ovog podatka, ne bi se trebala dozvoliti upotreba lijeka. Moemo rei da matematika statistika prouava populacije ili generalne skupove, iji z c c c c elementi pored svoje raznolikosti, posjeduju i izvjesne slinosti. Zajednika osobina ili karakc c teristika, obiljeje populacije varira od jednog do drugog elementa populacije, ali se u masi, z tj. cijeloj populaciji iskazuje kao pravilnost ili zakonitost. U primjeru 1.1.1 obiljeje je krvni pritisak. z

Kod jedne populacije moemo istovremeno posmatrati i vie obiljeja, i onda se postavlja z s z pitanje njihove meduzavisnosti.

.m

plave oe c zelene oi c crne oi c

1 2 3

at e

Obiljeja emo oznaavati sa X, Y, Z . . . sa ili bez indexa. Obiljeja mogu biti nuz c c z merikog ili atributivnog (opisnog) karaktera. Obiljeje atributivnog karaktera ponekad je c z potrebno zapisati u obliku obiljeja numerikog karaktera. Npr., z c

at ik

a. c

om

.b a

http://matematika.com.ba

Radna verzija

Mirnes Smajilovi c

Statistika

1.2

Osnovne etape statistikih ispitivanja c

Prouavanje pojava i procesa na osnovu uzorka predstavlja statistiki eksperiment, planirano c c posmatranje odredenih obiljeja date populacije koja su znaajna za prouavanu pojavu ili z c c proces. 1. Izbor tih obiljeja predstavlja prvu etapu ili poetnu fazu prouavanja. Taj izbor je z c c iskustvenog karaktera i, razumije se, zbog izvjesne subjektivnosti mogue su poetne ili c c inicijalne greke. One mogu uticati na donoenje pogrenog zakljuka i kad je rasudivanje s s s c ispravno. 2. Druga etapa je statistiko posmatranje ili snimanje, i sastoji se u registrovanju obiljeja c z X. Kratko reeno, druga etapa je uzimanje ili izvlaenje uzorka. c c Dugo vremena se mislilo da obim uzorka treba biti unaprijed ksiran. Npr. obim uzorka je n, a poznato je da je obim populacije N . U posljednje vrijeme obim uzorka se ne ksira unaprijed. Postupa se npr. ovako: prvo se proui n1 elemenata populacije i onda se procjenjuje da li na osnovu ovog ispitivanja moemo c z donijeti konaan zakljuak ili ispitivanje treba produiti. Ako treba produiti, onda treba c c z z uzeti n2 elemenata i nastaviti na isti nain. c Ova shema ispitivanja se primjenjuje najee u tekuoj kontroli kvaliteta proizvoda. c sc c Osnovni zahtjevi u prikupljanju podataka su: istinitost, tanost, urednost i potpunost. c U zavisnoti od prirode pojave, postoje dva osnovna statistika pristupa: c

2. registrovanje vrijednosti posmatranog obiljeja po redoslijedu pojavljivanja. z Jedna od metoda je tzv. popisna metoda (npr. popis stanovnitva, i pri tom popisu s mogu se snimati razna obiljeja). Jedan od naina je tzv. izvjetajna metoda (provodi se z c s putem obrazaca). Primjer 1.2.1 Neka treba utvrditi koliko je prosjeni deparac studenta PMF u Tuzli. Neka c z iz izvjesnih razloga nije mogue svakom studentu postaviti to pitanje. Onda se bira odredeni c broj tih studenata. Kako emo izvriti biranje tih studenata? c s Neka su studenti numerisani brojevima od 1 do 500. Neka je obim uzorka n = 50. Biranje moemo izvriti koritenjem tablica sluajnih brojeva. z s s c 3. Trea etapa je sistemsko sredivanje dobijenih vrijednosti uzorka. c 4. Cetvrta etapa je obrada podataka (rezultata). 5. Peta etapa je tumaenje dobijenih rezultata. c

.m

at e

1. registrovanje vrijednosti posmatranog obiljeja svih elemenata uzorka u tano odredenom z c trenutku,

at ik

a. c

om

.b a

http://matematika.com.ba

Radna verzija

Mirnes Smajilovi c

Statistika

1.3

Prikazivanje statistikih podataka. Raspodjela obiljeja c z

c Primjer 1.3.1 Zelei da saznamo neto o potronji benzina na 100 predenih km automobila s s izvjesnog tipa, na sluajan nain je odabrano 10 vlasnika takvih automobila. Na pitanje o c c prosjenoj potronji, dobili smo odgovore: c s 7.5, 8.1, 7.9, 7.5, 8.2, 7.4, 8.0, 7.4, 7.5, 7.9. Zbog malog obima uzorka ne moramo potpuno biti sigurni u predstavu o prosjenoj potronji. c s Odgovori u rastuem poretku: c 7.4, 7.4, 7.5, 7.5, 7.5, 7.9, 7.9, 8.0, 8.1, 8.2. Neka je X potronja benzina (prosjena na 100 km). s c

xi
ni n

7.4
2 10

at ik
7.5
3 10

gdje je n obim uzorka. Ovaj nain prikazivanja podataka je jedna statistika tabela. c c Posmatrajmo sljedeu tabelu: c 7.9
2 10

a. c
8.0
1 10

xi su konkretne vrijednosti obiljeja X, a ni su apsolutne frekvencije. z Jasno je da mora biti n = n1 + n2 + + nk

at e

Vrijednosti ni = pi su relativne frekvencije. n Jasno je da mora da vai z

Veliinu c

.m

p1 + p2 + + pk =

nazivamo varijacioni raspon (razmak, interval). Varijacioni raspon se, kada to nije dato, podijeli na klase. Duina klase (podintervala) se bira tako da bi se prostije i jasnije uoio z c karakter promjena obiljeja X. Broj klasa se bira shodno sljedeem uputstvu empirijskog z c karaktera.

Obim uzorka - n 40-60 60-100 100-200 200-500 vie od 500 s

n1 n2 nk n + + + = = 1. n n n n

R = max xi min xi

Broj klasa - k 6-8 7-10 9-12 12-17 21

Broj klasa k se odreduje i na sljedei nain: k = [log2 n] + 1. c c Vea preglednost dobijenih sredenih podataka se postie pomou poligona i histograma c z c apsolutnih, odnosno relativnih frekvencija. Poligon apsolutnih frekvencija je izlomljena linija koja spaja take (x1 , n1 ), (x2 , n2 ), . . . , (xk , nk ), c gdje su xi varijante (realizacije) uzorka, a ni odgovarajue apsolutne frekvencije. c Poligon relativnih frekvencija je izlomljena linija koja spaja take (x1 , p1 ), (x2 , p2 ), . . . , (xk , pk ), c gdje su xi varijante (realizacije) uzorka, a pi odgovarajue relativne frekvencije. c http://matematika.com.ba 6 Radna verzija

om
8.1
1 10

8.2
1 10

.b a

xi ni

7.4 2

7.5 3

7.9 2

8.0 1

8.1 1

8.2 1

Mirnes Smajilovi c

Statistika

Primjer 1.3.2 Dat je sljedei uzorak: c xi ni Konstruisati: a) poligon apsolutnih frekvencija, b) poligon relativnih frekvencija. Obim uzorka je n = 2 + 3 + 5 + 4 + 4 + 2 = 20. ni 5 4 3 2 1 0 0 1 1 2 2 3 3 5 4 4 5 4 6 2

at ik
2

a. c m
3 4 5 6 7 xi Slika 1.1: Poligon apsolutnih frekvencija

xi
ni n 2 20

0.25 0.20 0.15 0.10 0.05 0 0 1 2 3 4 5 6 7 Slika 1.2: Poligon relativnih frekvencija Primjer 1.3.3 Dat je sljedei uzorak sl. p. X: c Ii ni (1,5) 10 (5,9) 20 (9,13) 50 (13,17) 12 (17,21) 8

1 = 0.1

.m

Tablica relativnih frekvencija je:


3 20

at e

2 = 0.15

5 20

3 = 0.25

4 20

4 = 0.2

om
4 20

pi

gdje je Ii interval u kome se xi (varijanta, realizacija) pojavljuje ni puta. Konstruisati: http://matematika.com.ba 7 Radna verzija

.b a
5 = 0.2
2 20

6 = 0.1

xi

Mirnes Smajilovi c

Statistika

a) histogram apsolutnih frekvencija, b) histogram relativnih frekvencija. Rjeenje s Obim uzorka je n = 10 + 20 + 50 + 12 + 8 = 100. Duine h intervala Ii su jednake, h = 4. z a) Histogram apsolutnih frekvencija konstruiemo tako to nad intervalima Ii kons s struiemo pravougaonike osnovice h i visina koje su jednake ni . s h Tablica za histogram apsolutnih frekvencija je: Ii
ni h ni h

(1,5) 2.5

(5,9) 5

(9,13) 12.5

(13,17) 3

(17,21) 2

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

b) Histogram relativnih frekvencija konstruiemo tako to nad intervalima Ii kons s struiemo pravougaonike osnovice h i visina koje su jednake pi . s h Tablica relativnih frekvencija je:

.m

13 12 11 10 9 8 7 6 5 4 3 2 1 0

at e

at ik

a. c

om
xi Slika 1.3: Histogram apsolutnih frekvencija Ii pi (1,5) 0.1 (5,9) 0.2 (9,13) 0.5 (13,17) 0.12 (17,21) 0.08 Ii
pi h

Tablica za histogram relativnih frekvencija je: (1,5) 0.025 (5,9) 0.05 (9,13) 0.125 (13,17) 0.03 (17,21) 0.02

Statistiki podaci se mogu prikazivati i na druge naine, a to zavisi od prirode i namjene c c podataka. Razne geometrijske gure se mogu koristiti za prikaz podataka, npr. krunica z (kruni prikaz). z

.b a
8 Radna verzija

http://matematika.com.ba

Mirnes Smajilovi c
pi h

Statistika

0.125 0.100 0.075 0.050 0.025 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 xi Slika 1.4: Histogram relativnih frekvencija

1.4

Srednje vrijednosti

X: pri emu je c
i

p(xi ) = 1.

Obiljeja neprekidnog tipa zadaju se funkcijom gustine ili funkcijom raspodjele. z Najee nemamo potpunu informaciju, a nije rijedak sluaj kada nam potpuna informacija c sc c nije potrebna, nego nam je potrebna neka odredena karakteristika numerikog tipa. Jedna od c najvanijih numerikih karakteristika obiljeja je srednja vrijednost. Srednja vrijednost na z c z neki nain reprezentuje itav skup i omoguava izvjesno poredenje populacija. c c c Najee upotrebljavana srednja vrijednost je aritmetika sredina. Srednja vrijednost c sc c se oznaava sa xn : c k 1 1 xn = (x1 + x2 + + xn ) = n i xi . n n

.m

at e

at ik
2, 3, 4, 5, 7, 8, 9.

Neka su podaci uzorka posmatranog obiljeja uredeni po veliini: z c x1 x2 x3 xn . Medijana uzorka je ona vrijednost obiljeja koja se nalazi u sredini: z Me = xk+1 , 1 2 (xk + xk+1 ), n = 2k + 1 . n = 2k

Primjer 1.4.1 Nai medijanu uzorka: 5, 4, 8, 3, 7, 2, 9. c Rjeenje s Uredimo podatke po veliini: c Kako imamo neparan broj podataka, n = 7, medijana je M e = 5. c Primjer 1.4.2 Nai medijanu uzorka: 18.3, 20.6, 19.3, 22.4, 20.2, 18.8, 19.7, 20.0. http://matematika.com.ba 9 Radna verzija

Medijana

a. c
i=1

x1 x2 ... p(x1 ) p(x2 ) . . .

om

Potpunu informaciju o posmatranom obiljeju izvjesne populacije daje njena raspodjela. Raspodz jela obiljeja diskretnog tipa daje se sljedeom shemom: z c

.b a

Mirnes Smajilovi c

Statistika

Rjeenje s Uredimo podatke po veliniini: c 18.3, 18.8, 19.3, 19.7, 20.0, 20.2, 20.6, 22.4. Kako imamo paran broj podataka, n = 8, medijana je 1 1 M e = (x4 + x5 ) = (19.7 + 20.0) = 19.85. 2 2 Neka su podaci uzorka x1 , x2 , . . . , xk zadati u rastuem poretku, sa odgovarajuim frekvenc c cijama n1 , n2 , . . . , nk , pri emu je n1 + n2 + + nk = n. c Ako formiramo sljedee sume: c n1 , n1 + n2 , n1 + n2 + n3 , . . . sve dok se ne dode do sume frekvencija koje zadovoljavaju ovaj uslov: n n1 + n2 + + ni n1 + n2 + + ni + ni+1 2 onda medijana M e zadovoljava uslov: d d xi+1 M e xi+1 + , 2 2 gdje je d = xi+1 xi . Tada je

at e

Kod grupisanih podataka, x1 , x2 , . . . , xk predstavljaju sredine klasa, to znai da je s c d xi+1 = L1 2 lijeva granica klase kojoj pripada medijana. Sada moemo pisati: z

Ako se koristi desna granica L2 , onda imamo:

.m

M e = L1 + d

at ik

M e = xi+1

d 2

+d

a. c
(1000,1200) 20

n (n1 +n2 ++ni ) 2 ni+1

n (n1 +n2 ++ni ) 2 ni+1

Ii ni

Primjer 1.4.3 Nai medijanu sljedeeg uzoka: c c (400,600) 3 (600,800) 5 (800,1000) 10 (1200,1400) 8 (1400,1600) 4

Rjeenje s Obim uzorka je: n = 3 + 5 + 10 + 20 + 8 + 4 = 50. Formirajmo sume: n1 + n2 = 3 + 5 = 8 n1 + n2 + n3 = 3 + 5 + 10 = 18 n1 + n2 + n3 + n4 = 3 + 5 + 10 + 20 = 38 Dakle, kako je i = 3, zakljuujemo da se medijana nalazi u 4 intervalu (1000, 1200), odakle je c L1 = 1000 i L2 = 1200. Duina klase je d = 1200 1000 = 200. z Medijana je: M e = L1 + d
n 2

M e = L2 d

n (n1 +n2 ++ni ) 2 ni+1

(n1 + n2 + + ni ) 25 18 = 1000 + 200 = 1070. ni+1 20

om
. . .

.b a
Radna verzija

http://matematika.com.ba

10

Mirnes Smajilovi c

Statistika

Moda
Moda uzorka je ona vrijednost u uzorku kojoj odgovara najvea frekvencija. c Ako uzorak ima jednu modu, onda se kae da je unimodalan, u suprotnom multimodalan. z Primjer 1.4.4 Nai modu uzorka: 2, 2, 3, 5, 5, 5, 6, 6, 8, 9. c Rjeenje s xi ni 2 2 3 1 5 3 6 2 8 1 9 1

Vidimo da je najvea frekvencija 3, pa je M o = 5. Ovaj uzorak je unimodalan. c

Rjeenje s xi ni 2 1 3 2

at ik
4 2 5 1 (30,40) 10

.m

Ako su podaci uzorka grupisani u klase, onda se polazei od klase sa najveom frekvencijom c c (modalna klasa), moda odreduje na sljedei nain: c c

at e

Ovaj uzorak ima dvije mode M o = 3 i M o = 4. Ovaj uzorak je multimodalan.

m
(20,30) 5

gdje je L1 - lijeva granica klase kojoj pripada M o, d - duina klase, z d1 - razlika frekvencija modalne i predmodalne klase, d2 - razlika frekvencija modalne i postmodalne klase. Primjer 1.4.7 Nai modu uzorka: c Ii ni (10,20) 3 (40,50) 24 (50,60) 8

Rjeenje s Modalna klasa je (40, 50) pa je L1 = 40, d = 10, d1 = 24 10 = 14, d2 = 24 8 = 16, pa je M o = 40 + 10 14 14 14 = 40 + 10 = 40 + = 44.66. 14 + 16 30 3

M o = L1 + d

a. c
6 1
d1 d1 +d2 .

Primjer 1.4.6 Nai modu uzorka: 2, 3, 3, 4, 4, 5, 6. c

om
Radna verzija

Rjeenje s Ovaj uzorak nema modu.

http://matematika.com.ba

11

.b a

Primjer 1.4.5 Nai modu uzorka: 2, 3, 4, 5, 6. c

Mirnes Smajilovi c

Statistika

1.5

Disperzija i druge mjere odstupanja


2 1
1 8 1 8

Primjer 1.5.1 Date su rapodjele obiljeja X i Y na sljedei nain: z c c X: 0


1 2

1
1 8

2
1 8

Y :

5
2 5

0
1 5

5
2 5

c c c c Ako izraunamo matematika oekivanja, dobit emo E(X) = 0 i E(Y ) = 0. Dakle, dva razliita obiljeja mogu imati ista matematika oekivanja. Tako su srednje vrijednosti obiljeja c z c c z X i Y jednake, ali se moe zapaziti da su vrijednosti obiljeja X vie grupisane oko centra z z s raspodjele, a vrijednosti obiljeja Y su rasturenije od centra raspodjele. Zato se uvode tzv. z pokazetelji rasturenosti ili disperzija. Za uzorak obiljeja X obima n, denisat emo disperziju uzorka na sljedei nain: z c c c

i=1

Koje je pakovanje vjerodostojnije, tj. gdje je manje odstupanje od nominalne vrijednosti? Rjeenje s Aritmetike sredine su x100 = 50, y100 = 100. Ako bi poredili aritmetike sredine, ne bi dobili c c odgovor. Disperzije su D(X) = 3.96, D(Y ) = 7.68. Ako uporedimo disperzije, imamo D(X) < D(Y ) zakljuujemo da je prvo pakovanje, sa obiljejem X, vjerodostojnije. c z Zakljuivanje na osnovu disperzije, ako su veliine raznorodne, ne bi bilo mogue. c c c Disperzija kao mjera ima smisla, ali kada su veliine istorodne. Stoga se uvodi relativna mjera, c koecijent varijacije: KV = D(X) xn

xi ni

45 3

.m

Primjer 1.5.3 Primjeeno je da postoje odstupanja od nominalnih vrijednosti pakovanja tableta c u aice od 50 i 100 komada. Kontrolor je uzeo 100 aica pakovanja po 50 tableta - obiljeje s s z X i 100 aica pakovanja po 100 tableta - obiljeje Y , i dobio rezultate: s z 48 18 49 24 50 30 53 25 yi ni 96 17 98 12 99 16 100 28 104 27

at e

s2 = 5

1 (3.20 3.15)2 + (3.15 3.15)2 + (3.25 3.15)2 + (3.10 3.15)2 + (3.05 3.15)2 = 0.005. 5

at ik

Rjeenje s Obim uzorka je n = 5. Aritmetika sredina je x5 = 1 (3.20 + 3.15 + 3.25 + 3.10 + 3.05) = 3.15. c 5 Disperzija je

a. c

Primjer 1.5.2 Izraunati disperziju uzorka obiljeja X, koje ima vrijednosti: 3.20, 3.15, 3.25, 3.10, 3.05. c z

om

odnosno, ovo je srednja vrijednost kvadrata odstupanja vrijednosti uzorka od sredine uzorka.

.b a

1 2 D(X) = Sn = n

(Xi Xn )2 .

http://matematika.com.ba

12

Radna verzija

Mirnes Smajilovi c

Statistika

1.6

Momenti. Mjere asimetrije i spljotenosti s

2 Srednja vrijednost Xn i disperzija Sn kao centar raspodjele i mjera rasturanja su vane karakz teristike raspodjele obiljeja. Potrebno je uvesti jo neke karakteristike raspodjele obiljeja. z s z Prvo emo denisati momente vieg reda. c s Obini moment m-tog reda je c xm = n 1 n
n

xm = i
i=1

1 n

n i xm i
i=1

odnosno kao n-dimenzionalna sluajna promjenljiva (statistika) c

i=1

Centralni moment m-tog reda je m 1 = n


n i=1

odnosno kao n-dimenzionalna sluajna promjenljiva (statistika) c

m
1 n KA =

at e

m =

Da bismo mogli mjeriti asimetrinost, odnosno odstupanje raspodjele uzorka od simetrine c c raspodjele, uvodimo koecijent asimetrije:

.m

2 Vidimo da je za m = 2, 2 = Sn .

at ik
n i=1

(xi xn )

(Xi Xn )m .

3 2
3/2

Klasikacija asimetrinosti: c 1. 0 |KA | < 0.1, praktino nema aismetrije (zanemarljiva), c 2. 0.1 |KA | < 0.25, mala asimetrinost, c 3. 0.25 |KA | < 0.5, srednja asimetrinost, c 4. 0.5 |KA |, vrlo izraena asimetrinost. z c Koecijent spljotenosti (ekscesa): s KE = 4 3. 2 2

Ako je KE > 0 onda je spljotenost krive manja, a ako je KE < 0 onda je spljotenost krive s s vea. c http://matematika.com.ba 13 Radna verzija

a. c
1 = n
k i=1

2 3 3 2

om
ni (xi xn )m .

1 Vidimo da je za m = 1, Xn = Xn .

.b a

1 m Xn = n

Xim .

Mirnes Smajilovi c

Statistika

0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 4 3 2 1 0

KE > 0

KE = 0, N (0, 1) KE < 0 1 2 3 4 5

U mat. analizi prouavaju se gama i beta funkcije. Ove funkcije imaju znaajnu ulogu u c c primjenama matematike, pogotovo u mat. statistici. Denicija 1.7.1 Gama funkcija (Eulerova funkcija II vrste) je funkcija denisana sljedeim c integralom: (p) =

m
0

at ik
tp1 et dt,

1. (p + 1) = p(p); ako je p N, onda je (p + 1) = p!

2.

1 2

.m

Navedimo neke osobine gama funkcije:

at e

a. c

om
p > 0.
0

1.7

Neke vanije raspodjele u mat. z raspodjela

statistici: gama i beta

.b a

2 1 2

Slika 1.5: Koecijent ekscesa

1 et dt = smjena: t = u2 , dt = 2udu = 2 t sin p (n + 1) n

eu du =

3. (p)(1 p) = 4. n < 0,

Denicija 1.7.2 Beta funkcija (Eulerova funkcija I vrste) je funkcija denisana sljedeim c integralom:
1

w
(n) = B(p, q) =
0

tp1 (1 t)q1 dt,

p > 0, q > 0.

Gama i beta funkcije su povezane sljedeom relacijom: c B(p, q) = (p)(q) . (p + q) Radna verzija

http://matematika.com.ba

14

Mirnes Smajilovi c

Statistika

Denicija 1.7.3 Za sl. p. X kaemo da ima gama raspodjelu ako je z 0, f (x; p, ) = (x)p1 ex , (p) p , x0 x > 0, p > 0, > 0

Osnovni parametri gama raspodjele su: E(X) =


xf (x)dx =

2 (X) = E[X E(X)]2 = E(X 2 ) [E(X)]2 =

p . 2

E(X) = =

Osnovni parametri beta raposdjele su: E(X) =

p , p+q
1

at ik
2 (X) = (p
1 p1 .

z Denicija 1.7.4 Za sl. p. X kaemo da ima beta raspodjelu ako je 0, x0x1 f (x; p, q) = 1 xp1 (1 x)q1 , 0 < x < 1, p > 0, q > 0 B(p, q)

a. c
pq + q)2 (p x
p1 p+q2 .

om

+ q + 1)

E(X) =

1 xp1 (1 x)q1 dx = B(p, q) 0 0 (p + 1)(q) 1 1 1 (p + 1 + q) xp (1 x)q1 dx = B(p + 1, q) = = (p)(q) B(p, q) 0 B(p, q) (p + q) p(p)(p + q) p = . (p)(p + q)(p + q) p+q xf (x)dx = xf (x)dx =

Zadaci za vjebu z 1. Pokazati da je moda gama raspodjele M o = 2. Pokazati da je moda beta raspodjele M o = 3. Izraunati medijanu gama raspodjele. c 4. Izraunati medijanu beta raspodjele. c

.m

at e

.b a
.

(x)p1 ex dx = |smjena: x = t, dx = dt| = (p) 0 0 1 1 p(p) p t p1 t dt t e = tp et dt = (p + 1) = = . (p) (p) 0 (p) (p) 0 xf (x)dx = xf (x)dx = x

http://matematika.com.ba

15

Radna verzija

Mirnes Smajilovi c

Statistika

1.8

Neke vanije raspodjele u mat. statistici: 2 - raspodjela z

Jedan od najvanijih zadataka u mat. statistici je ispitivanje saglasnosti statistike raspodjele z c sa pretpostavljenom teorijskom raspodjelom. Izbor teorijske raspodjele, dakle raspodjele za koju pretpostavljamo da je odgovarajue obiljeje raspodijeljeno upravo po toj raspodjeli, je c z isto iskustvenog karaktera, a to znai da su mogue greke zbog subjektivnosti onoga koji to c c c s bira. Te poetne greke sigurno utiu na vjerodostojnost izvedenih zakljuaka. c s c c Denicija 1.8.1 Raspodjela denisana funkcijom gustine 0, x0 , x>0

naziva se 2 - raspodjela sa n stepeni slobode. Oznaavat emo je sa 2 ili 2 (n). c c n Broj n moe biti bilo koji pozitivan broj, ali je najznaajnije kada je n prirodan broj. z c Skicirat emo grak gustine za neke vrijednosti broja n. c

0.5 0.4 0.3 0.2 0.1 0 n=2

.m

at e

n=6 n = 10 n = 15

Za vei broj stepeni slobode, 2 raspodjela se pribliava normalnoj raspodjeli. c z


0

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Slika 1.6: Grak funkcije gustine 2 raspodjele

at ik

a. c
E(2 ) = n xf (x)dx = x = y, 2

om
x

.b a
1
n 2 0

1 f (x) = n/2 2

n 2

n 1 2

x 2

1 2n/2

n 2

x 2 1 e 2 dx =

x 2 x n e 2 dx 22

= |s : = 2
n 2

dx = 2dy| 2
n 2

y 2 ey dy =

2 n n n +1 = n 2 2 =n 2 2

http://matematika.com.ba

16

Radna verzija

Mirnes Smajilovi c

Statistika

E[(2 )2 ] n

x f (x)dx =
0

1 x n/2 2
2

= |s : = = 4
n 2

x = y, 2

n 2

n 1 2

x 2

dx =

2
n 2 0

x 2 +1 x e 2 dx n 2 2 +1

dx = 2dy| 4
n 2

y 2 +1 ey dy =

n 4 n n +2 = +1 +1 2 2 2 n 2

4
n 2

n+2 n n = n(n + 2) 2 2 2

Za primjenu 2 -raspodjele, znaajne su sljedee teoreme: c c

.m

at e

at ik

Teorema 1.8.2 Neka sluajna promjenljiva X ima 2 -raspodjelu sa n stepeni slobode. Tada c X n ima normalnu raspodjelu N (0, 1). sluajna promjenljiva c 2n

a. c

Teorema 1.8.1 Neka nezavisne sluajne promjenljive X1 , X2 , . . . , Xn imaju normalnu raspodc 2 2 2 jelu N (0, 1). Tada sluajna promjenljiva X = X1 + X2 + + Xn ima 2 -raspodjelu sa n c stepeni slobode.

om

.b a
Radna verzija

2 -raspodjela se ponaa kao normalna raspodjela N (n, 2n), za n 30 . s

2 (2 ) = E[(2 )2 ] [E(2 )]2 = n(n + 2) n = n2 2n n2 = 2n. n n n

http://matematika.com.ba

17

Mirnes Smajilovi c

Statistika

1.9

Neke vanije raspodjele u mat. statistici: Studentova ili tn z raspodjela

Neka nezavisne sluajne promjeljive X1 , X2 , . . . , Xn imaju normalnu raspodjelu N (m, 2 ). c Kao to je poznato, sl. p. s Z= ima normalnu raspodjelu N (0, 1). E(Xn ) = E (Xn ) = 2
2

Xn m
n

1 Xn = n

Xi
i=1

1 n 1 n

Xi
i=1 n

1 E n

Xi
i=1 n

(nezav. sl. p.)

1 n

E(Xi ) =
i=1

1 n m = m. n 1 2 n 2 = . n2 n

Xi
i=1

1 = 2 2 n

Xi
i=1

(nezav. sl. p.)

1 n

Ako nije poznata disperzija 2 onda se koristi sljedea ocjena za disperziju: c 2 Sn = 1 n1

i=1

Denicija 1.9.1 Raspodjela denisana funkcijom gustine n+ 1 2 f (x) = n n 2

at ik
1 2

naziva se Studentova ili tn raspodjela. Ako je n N onda imamo Studentovu raspodjelu sa n stepeni slobode. Navedimo neke osobine Studentove raspodjele.

f (x) > 0,

1. Za funkciju gustine f (x) vai: z x R,

f (x) = f (x) (grak simetrian u odnosu na y osu). c


x

2. Apscisna osa je horizontalna asimptota, tj. x2 3. Kako je 1 + 1 to izraz n M o = 0. x2 1+ n


n+1 2

.m

at e

x2 1+ n

a. c
(Xi Xn )2 .
n+1 2

om
,

x R,

lim f (x) = 0.

dostie maksimum za x = 0, dakle, moda je z

4. Zbog simetrinosti u odnosu na ordinatnu osu, imamo E(X) = 0, M e = 0 i svi momenti c neparnog reda su jednaki nuli. 5. Disperzija: 2 = n , n2 n > 2. 3n2 , (n 2)(n 4) 18 n > 4.

6. Centralni moment etvrtog reda: 4 = c

.b a
2 (Xi ) =
i=1

n>0

http://matematika.com.ba

Radna verzija

Mirnes Smajilovi c 3 (2 )3/2 2 3 3 2

Statistika

7. Koecijent asimetrije: KA = 8. Koecijent ekscesa: KE = Oigledno je lim KE = 0. c


n

= 0, n > 4.

n > 2.

6 4 3= , n4 2 2

0.4 0.3

N (0, 1)

0.1

Slika 1.7: Grak funkcije gustine tn raspodjele

.m

at e

Dokaz Teorema se moe dokazati koritenjem karakteristinih funkcija, ali emo izvesti direktni dokaz. z s c c

Teorema 1.9.1 Studentova ili tn raspodjela tei normalnoj raspodjeli N (0, 1) kada n . z

at ik

n+ 1 2 lim f (x) = lim n n n n 2

1 2

a. c

om
2
n+1 2

.b a
n=2 3 4 5 x2 1+ n
n 2

0.2

n = 10

1 lim n 2
x2 1 e 2 2

n 2 n 2

1 2

lim

x2 1+ n
=e
x2 2

n 2

lim

x2 1+ n
=1

1 2

=1

Kako je funkcija gustoe normalne raspodjele c


(x)2 1 f (x) = e 22 , 2

> 0, R

dokaz teorema je zavren. s Teorema 1.9.2 Neka nezavisne sluajne promjenljive Z i Y imaju redom raspodjele N (0, 1) c 2 . Tada sl. p. i n Z T = , n = 1, 2, . . .
Y n

ima tn raspodjelu. http://matematika.com.ba 19 Radna verzija

Mirnes Smajilovi c

Statistika

Teorema 1.9.3 Neka su X1 , X2 , . . . , Xn nezavisne sluajne promjenljive sa normalnom raspodc 2 ). Tada sl. p. jelom N (m, Xn m n1 Sn ima tn1 raspodjelu. Teorema 1.9.4 Neka su X1 , X2 , . . . , Xm i Y1 , Y2 , . . . , Yn nezavisne sluajne promjenljive i pri c 2 ), a Y (j = 1, n) imaju N (m , 2 ) raspodjelu. Tada sl. p. tome Xi (i = 1, m) imaju N (m1 , j 2 Xm Yn (m1 m2 ) 2 2 mS m + n S n mn (m + n 2) m+n

ima Studentovu raspodjelu s m + n 2 stepeni slobode.

.m

at e

at ik

a. c
http://matematika.com.ba 20 Radna verzija

om

.b a

Mirnes Smajilovi c

Statistika

1.10

Neke vanije raspodjele u mat. statistici: F raspodjela z



m 2 m+n 2

Denicija 1.10.1 Raspodjela denisana funkcijom gustine fm,n (x) =


n 2

x 2 1 (1 + x)

m+n 2

0<x<

naziva se Fisherova ili F raspodjela sa m i n stepeni slobode.

Osnovni parametri F raspodjele


Matematiko oekivanje c c E(X) = =

xfm,n (x) =
0 m+n 2 n 2 0


m 2

m+n 2


m 2

=I

E(X) = Dakle,

m 2

n 2

at e

m+n 2

n 2

1 m +1 n 1 m 2 2 2 = m+n m n 1 2 2 2 E(X) = m , n2 n > 2.

1 1t 1 I = |s : =tx= dx = 2 , x = 0 t = 1, x = t = 0| 1+x t t m m m+n 0 1 1 m n 1 t 2 m+n 1 (1 t) 2 t 2 = t 2 2 dt = dt = (1 t) 2 t 2 2 dt m t t t 2 t2 1 0 0 1 n n 1 m +1 m n m (Beta f-ja) 2 2 = B = t 2 2 (1 t) 2 dt 1, + 1 = 2 2 m+n 0 2

at ik

a. c

om
n > 4.

m 2

1 1+x

m+n 2

.b a
m 2 n 2

n 2

x 2 1 (1 + x)

m+n 2

m . n2

Vrijednost E(X 2 ) = te dobijamo

.m w
=

2 0 x fm,n (x)

raunamo na slian nain kao E(X) i sa istom smjenom, c c c m(m + 2) . (n 2)(n 4)

E(X 2 ) =

Disperzija 2 (X) = E[[X E(X)]2 ] = E(X 2 ) [E(X)]2 = m(m + 2) m2 (n 2)(n 4) (n 2)2 m(m + 2)(n 2) m2 (n 4) 2m(m + n 2) = . 2 (n 4) (n 2) (n 2)2 (n 4) 2 (X) = Moda Mo = m2 n . n+2 m 21 Radna verzija 2m(m + n 2) , (n 2)2 (n 4)

Dakle,

http://matematika.com.ba

Glava 2

Ocjenjivanje parametara raspodjele

Nai emprijsku funkciju raspodjele i nacrtati njen gak. c Rjeenje s Tablica apsolutnih frekvencija: X = xk nk Empirijska funkcija raspodjele: 0, 3 = 0.12, 25 7 = 0.28, Fn (x) = 25 17 = 0.68, 25 23 = 0.92, 25 1, 22 x<2 2x<3 3x<4 4x<5 5x<6 x6 2 3 3 4 4 10 5 6 6 2

Primjer 2.1.1 Iz populacije izvuen je uzorak obima n = 25 i dobijene su vrijednosti c obiljeja X: z 2, 3, 3, 4, 4, 5, 6, 2, 3, 4, 4, 4, 4, 5, 5, 4, 4, 2, 5, 6, 5, 5, 4, 3, 4.

.m

Denicija 2.1.2 Za dati nezavisni uzorak obima n empirijska funkcija raspodjele denie s se na sljedei nain: c c k (x R) Fn (x) = n gdje je k broj elemenata iz uzorka koji nisu vei od x. c

at e

Potpunu informaciju o sluajnoj pojavi daje njena funkcija raspodjele ili funkcija gustine c u neprekidnom sluaju, a u diskretnom zakon raspodjele. c

at ik

Denicija 2.1.1 Skup od n nazavisnih sluajnih promjenljivih sa istom raspodjelom nazivamo c nezavisnim ili prostim uzorkom obima n iz te populacije.

a. c

Jedan od najvanijih zadataka mat. statistike je nalaenje numerikih karakteristika populacije z z c na osnovu uzorka, odnosno ocjenjivanje parametara raspodjele populacije na osnovu uzorka.

om

.b a

2.1

Osnovna pitanja ocjenjivanja parametara raspodjele populacije na osnovu uzorka: nepristranost, stabilnost i ekasnost ocjene

Mirnes Smajilovi c Fn (x) 1

Statistika

x 2 1 0 1 2 3 4 5 6 Slika 2.1: Grak empirijske funkcije raspodjele

Denicija 2.1.5 Statistika = (X1 , X2 , . . . , Xn ) je stabilna ocjena parametra ako je ,


P

Denicija 2.1.4 (Nepristrana statistika) Statistika = (X1 , X2 , . . . , Xn ) je nepristrana ili centrirana za ocjenu parametra ako je E() = .

.m

Ako treba odrediti srednju vrijednost obiljeja X neke populacije, onda je prirodno uzeti z n = 1 (X1 + X2 + + Xn ). Njena realizacija na nekom konkretnom veliinu (statistiku): X c n 1 nizu od n elemenata je xn = n (x1 + x2 + + xn ).

at e

Denicija 2.1.3 (Statistika) Svaka sluajna promjenljiva koja je funkcija samo od elemec nata uzorka = (X1 , X2 , . . . , Xn ) naziva se statistika.

Denicija 2.1.6 Ako su 1 = 1 (X1 , X2 , . . . , Xn ) i 2 = 2 (X1 , X2 , . . . , Xn ) dvije nepristrane ili centrirane ocjene parametra , i ako je 2 (1 ) < 2 (2 ), onda je 1 ekasnija ocjena od ocjene 2 .

at ik

n xR

lim sup |Fn (x) F(x)| = 0.

a. c
n .

Teorema 2.1.1 (Glivenko-Cantelli) Neka je Fn (x) empirijska funkcija raspodjele dobijena na osnovu nezavisnog uzorka obima n iz populacije sa funkcijom raspodjele F(x). Tada s vjerovatnoom 1 vai jednakost: c z

om

.b a
Radna verzija

http://matematika.com.ba

23

Mirnes Smajilovi c

Statistika

2.2

Takaste ocjene parametra. Metoda momenata c

Neka je raspodjela obiljeja X populacije data funkcijom raspodjele F(x; 1 , 2 , . . . , k ) ili z funkcijom gustine f (x; 1 , 2 , . . . , k ) ili zakonom raspodjele p(x; 1 , 2 , . . . , k ) u diskretnom sluaju sa vrijednostima x {x1 , x2 , . . . , xn , . . . }, gdje su 1 , 2 , . . . , k nepoznati parametri. c Nai ocjene parametara 1 , 2 , . . . , k na osnovu uzorka obima n : X1 , X2 , . . . , Xn znai nai c c c takve statistike, funkcije uzoraka 1 = 1 (X1 , X2 , . . . , Xn ) 2 = 2 (X1 , X2 , . . . , Xn ) . . . k = k (X1 , X2 , . . . , Xn )

1 = 1 (x1 , x2 , . . . , xn ) 2 = 2 (x1 , x2 , . . . , xn ) . . .

koje predstavljaju ocjene nepoznatih parametara 1 , 2 , . . . , k . Metodom momenata, statistike 1 , 2 , . . . , k se dobijaju rjeavanjem sistema jednaina s c

gdje su i (i = 1, k) momenti (bilo koji, npr. matematiko oekivanje, disperzija itd.), a ai c c (i = 1, k) odgovarajui uzoraki momenti (dakle, opet, npr. sredina uzorka, disperzija uzorka c c itd.). Dobijene ocjene su tzv. takaste ocjene. c c c Sutina metode momenata je uporedivanje teorijskih momenata sa odgovarajuim uzorakim s momentima. Radi ispitivanja ekasnosti ocjena parametara, koristi se sljedea nejednakost. Na osnovu c te nejednakosti utvrduje se koja je ocjena najekasnija, odnosno koja ima najmanju disperziju. Donja granica disperzije svih nepristranih ocjena dobija se iz sljedeih nejednakosti: c

.m

2 (x; 1 , 2 , . . . , k ) = a2 (x1 , x2 , . . . , xn ) . . .

k (x; 1 , 2 , . . . , k ) = ak (x1 , x2 , . . . , xn )

at e

1 (x; 1 , 2 , . . . , k ) = a1 (x1 , x2 , . . . , xn )

at ik

k = k (x1 , x2 , . . . , xn )

2 () = E[( )2 ] 2 () = E[( )2 ]

a. c
1

om

.b a
pi ()

na osnovu kojih za odredene vrijednosti uzorka n : x1 , x2 , . . . , xn dobijamo numerike vrijedc nosti

d ln pi () 2 n ] i=1 [ d

(2.1) (2.2)

1 n
ln f (x,) 2 ] [

f (x, ) dx

Nejednakost je poznata kao Rao-Kramerova nejednakost.

http://matematika.com.ba

24

Radna verzija

Mirnes Smajilovi c

Statistika

Primjeri Primjer 2.2.1 Na osnovu uzorka obima n obiljeja X raspodijeljenog po Puasonovom zakonu, z tj. e , x = 0, 1, . . . , 0 < < , p(x; ) = P (X = x) = x x! nai metodom momenata ocjenu nepoznatog parametra . Ako su u uzorku n = 100 regc istrovane vrijednosti xi ni nai ocjenu parametra . c 0 36 1 38 2 18 3 6 4 2

E(X) =

x=0

x p(x; ) =
x=0

x=0

om
x=1

x x

e = e x!

x = e (x 1)!

.b a
n

Rjeenje s Matematiko oekivanje je c c

x=1

x1 (x 1)!

x!

Na osnovu uzorka je (aritmetika sredina) c x100 =

.m

1 z Da li je statistika Xn = n n Xi nepristrana za ocjenu parametra , tj. da li vai i=1 n ) = ? Sluajne promjenljive X1 , X2 , . . . Xn su medusobno nezavisne i jednako raspodiE(X c jeljene, pa dobijamo:

at e

1 (0 36 + 1 38 + 2 18 + 3 6 + 4 2) = 1 100

m
1 n
n

at ik
n

=e

E(Xn )

a. c
Xi = 1 n 1 E n
n

= e

= e e = .

= =

E 1 n

Xi
i=1

i=1

(nezav. sl. p.)

E(Xi ) =
i=1

=
i=1

1 n = . n

Dakle, moemo uzeti = 1, pa je z p(x; 1) = P (X = x) = 1x e1 e1 = , x! x! x = 0, 1, . . . .

http://matematika.com.ba

25

Radna verzija

Mirnes Smajilovi c

Statistika

2.3

Metoda maksimalne vjerodostojnosti

Ideja metode maksimalne vjerodostojnosti je da se za ocjenu parametra uzme ona vrijednost za koju je vjerovatnoa realizacije dobijenog uzorka najvea. c c Neka je raspodjela obiljeja X populacije data funkcijom raspodjele F(x; 1 , 2 , . . . , k ) ili z funkcijom gustine f (x; 1 , 2 , . . . , k ) ili zakonom raspodjele p(x; 1 , 2 , . . . , k ) u diskretnom sluaju sa vrijednostima x {x1 , x2 , . . . , xn , . . . }, gdje su 1 , 2 , . . . , k nepoznati parametri. c Nai ocjene parametara 1 , 2 , . . . , k metodom maksimalne vjerodostojnosti zahtijeva uvodenje c pojma funkcije vjerodostojnosti :
n

L(x; ) = L(x1 , x2 , . . . , xn ; 1 , 2 , . . . , k ) =
i=1

f (xi ; 1 , 2 , . . . , k )

(2.3)

Uslov maksimuma funkcije L(x; ) je L = 0, i

.m

predstavlja traene ocjene parametara, na osnovu kojih za odredene vrijednosti uzorka n : z x1 , x2 , . . . , xn dobijamo numerike vrijednosti c 1 = 1 (x1 , x2 , . . . , xn ) 2 = 2 (x1 , x2 , . . . , xn ) . . . k = k (x1 , x2 , . . . , xn ) koje predstavljaju takaste ocjene nepoznatih parametara 1 , 2 , . . . , k . c

at e

(2.4) odnosno (2.5) predstavlja sistem k jednaina sa k nepoznatih. c jednaina vjerodostojnosti (2.4) odnosno (2.5), c 1 = 1 (X1 , X2 , . . . , Xn ) 2 = 2 (X1 , X2 , . . . , Xn ) . . . k = k (X1 , X2 , . . . , Xn )

ili, to je isto i ponekad pogodnije (budui da se maksimumi tih dviju funkcija postiu u istoj s c z vrijednosti za ) ln L = 0, i = 1, k (2.5) i

at ik

a. c

i = 1, k

om

.b a

gdje su x1 , x2 , . . . , xn vrijednosti sluajnog uzorka obima n. Ocjene nepoznatih parametara c (2.3) su funkcije uzorka (statistike) koje maksimiziraju funkciju vjerodostojnosti; to su takve funkcije da pojava tog uzorka bude najvjerovatnija.

(2.4)

Rjeavanje sistema s

http://matematika.com.ba

26

Radna verzija

Mirnes Smajilovi c

Statistika

Primjeri Primjer 2.3.1 Dat je uzorak n : x1 , x2 , . . . , xn iz populacije koja ima funkciju gustine f (x, ) = ex , x0

Metodom maksimalne vjerodostojnosti nai ocjenu nepoznatog parametra . c Rjeenje s Funkcija vjerodostojnosti je
n n n

L(x; ) = L(x1 , x2 , . . . , xn ; ) =
i=1

f (xi ; ) =
i=1

xi

n i=1

exi

ln L(x; ) = n ln +
i=1

Izvod funkcije vjerodostojnosti je d ln L n = d Jednaina vjerodostojnosti je c n


n n

m
i=1

at ik
i=1

at e

xi = 0 =

.m

odakle dobijamo traenu ocjenu (statistiku) z

= (X1 , X2 , . . . , Xn ) =

a. c
xi 1 1 n
n i=1 xi

1 n

om
1 = Xn n i=1 Xi 1 Radna verzija

(xi )

http://matematika.com.ba

27

.b a

Logaritam funkcije vjerodostojnosti je

Mirnes Smajilovi c

Statistika

2.4

Intervalne ocjene parametara

Neka je raspodjela obiljeja X populacije data funkcijom raspodjele F(x; ) ili funkciz jom gustine f (x; ) ili zakonom raspodjele p(x; ) u diskretnom sluaju sa vrijednostima c x {x1 , x2 , . . . , xn , . . . }, gdje je nepoznati parametar. Intervalno ocjenjivanje nepoznatog parametra na osnovu uzorka obima n : X1 , X2 , . . . , Xn sastoji se u nalaenju dviju statistika z (X1 , X2 , . . . , Xn ) i (X1 , X2 , . . . , Xn ) takvih da je za dato , 0 < < 1 P {(X1 , X2 , . . . , Xn ) < < (X1 , X2 , . . . , Xn } = 1 . Interval I = (, ) (2.7) je interval povjerenja ili interval pouzdanosti parametra s nivoom povjerenja ili pouzdanosti = 1 . Interval (, ) je sluajan interval, jer su mu krajnje take sluajne. Zahtjev da duina c c c z intervala bude to je mogue manja je oprean zahtjevu da nivo povjerenja bude to je s c c s mogue vei. Preciznija i pouzdanija ocjena se dobija poveanjem obima uzorka. Vjerovatnou c c c c pouzdanosti moemo shvatiti na sljedei nain: u velikoj seriji uzoraka obima n, 100% z c c izraunatih numerikih intervala e prekriti nepoznati parametar , koji je nesluajan, a u c c c c preostalih 100(1 )% sluajeva nee. c c Sam postupak nalaenja intervala pouzdanosti se moe opisati na sljedei nain. Neka je z z c c poznata statistika U = U (X1 , X2 , . . . , Xn ; ) (2.8) i neka su odredena dva broja u i u takva da je P {u < U = U (X1 , X2 , . . . , Xn ; ) < u} = 1 = Primjenom odgovarajuih ekvivalentnih transformacija nejednakost c (2.6)

at e

at ik

a. c

om

.b a

(2.9)

.m

transformiemo tako da dobijemo s

u < U = U (X1 , X2 , . . . , Xn ; ) < u

(2.10)

U (X1 , X2 , . . . , Xn ; u) < < U (X1 , X2 , . . . , Xn ; u)

(2.11)

Stavljajui = U i = U dobijamo traeni interval. c z

http://matematika.com.ba

28

Radna verzija

Mirnes Smajilovi c

Statistika

2.4.1

Interval povjerenja za matematiko oekivanje normalne raspodjele c c kada je poznata disperzija

Neka je X N (m, 2 ) i neka je poznata disperzija 2 . Kao to smo ranije vidjeli, uzoraka s c n je nepristran procjenitelj matematikog oekivanja i Xn N (m, 2 ). aritmetika sredina X c c c n Neka je zadan , 0 < < 1 i = 1 . Sluajna promjenljiva c Z= Xn m
n

ima normalnu raspodjelu N (0, 1). Interval povjerenja emo odrediti iz uslova c P Odavde dobijamo, Xn m
n

kao i odakle je

at e

P {z < Z < z } = 1+ . 2

Interval povjerenja je

.m

F(z ) F(z ) = F(z ) 1 + F(z ) = 2F(z ) 1 = F(z ) =

Krajevi ovog intervala su sluajne promjenljive koje se mijenjaju od uzorka do uzorka. c Duina intervala je konstantna i zavisi od obima uzorka n, ali centar tog intervala je sl. p. z Xn . Ako uzorak nije uzet iz normalne raspodjele, to za dovoljno veliko n dobijena ocjena vai. z

Im =

Xn z , Xn + z n n

at ik

< z z < Xn m < z n n z Xn < m < z Xn Xn z < m < Xn + z n n n n

a. c

< z z <

Xn m
n

om
.

.b a
Radna verzija

Xn m
n

< z

http://matematika.com.ba

29

Mirnes Smajilovi c

Statistika

Primjeri Primjer 2.4.1 Iz populacije s raspodjelom N (m, 100) izvuen je uzorak obima n = 100 i c izraunata sredina uzorka x100 = 20. Nai 95% interval pouzdanosti za nepoznato mat. c c oekivanje populacije m. c Rjeenje s Iz injenice c F(z ) = dobijamo da je z = 1.96 Interval povjerenja je Im = xn z , xn + z n n = 10 10 , 20 + 1.96 20 1.96 100 100

1+ = 0.975 2

.m

at e

at ik

a. c
http://matematika.com.ba 30 Radna verzija

om

.b a

= (18.04, 21.96).

Mirnes Smajilovi c

Statistika

2.4.2

Interval povjerenja za matematiko oekivanje normalne raspodjele c c kada nije poznata disperzija

Iskoristit emo injenicu da statistika c c tn1 = ima tn1 raspodjelu, pri emu je c 1 Xn = n
n

Xn m n1 Sn

Xi ,
i=1

1 2 Sn = n

n i=1

(Xi Xn )2 .

Interval povjerenje odredujemo iz uslova P Odavde dobijamo, =

Krajevi ovog intervala su sluajni kao i duina intervala. c z

.m

Im =

Sn Sn Xn tn1; , Xn + tn1; n1 n1

at e

Interval povjerenja je

Xn m Sn Sn < Xn m < tn1; n 1 < tn1; tn1; n S n1 n1 n n S S tn1; Xn < m < tn1; Xn n1 n1 Sn Sn Xn tn1; < m < Xn + tn1; n1 n1

at ik

a. c

om

.b a
. Radna verzija

Xn m n 1 < tn1; Sn

http://matematika.com.ba

31

Mirnes Smajilovi c

Statistika

Primjeri Primjer 2.4.2 Iz populacije s raspodjelom N (m, 2 ) izvuen je uzorak obima n = 10 i izraunata c c sredina x10 = 5.5 i disperzija s2 = 36 tog uzorka. Nai intervalnu ocjenu parametra m s 10 c nivoom povjerenja = 0.90. Rjeenje s Iz uslova P dobijamo: P {|tn | < tn1; } = P {tn1; < tn < tn1; } =

Xn m n 1 < tn1; Sn

Stepen slobode je 10 1 = 9, pa za = 0.90 dobijamo da je t9; = 1 + 0.90 = 0.95 2

Im =

.m

at e

6 6 5.5 1.833 , 5.5 + 1.833 9 9

at ik

odakle je t9; = 1.833, pa je interval povjerenja jednak

a. c
= (1.834, 9.166). Radna verzija

http://matematika.com.ba

32

om

.b a

F(tn1; ) F(tn1; ) = F(tn1; ) 1 + F(tn1; ) = 1+ F(tn1; ) = 2

Mirnes Smajilovi c

Statistika

2.4.3

Interval povjerenja za disperziju normalne raspodjele kada je poznato matematiko oekivanje c c

Iskoristit emo injenicu da statistika: c c 2 n Sn , 2 1 2 gdje je Sn = n


n i=1

(Xi m)2

ima 2 -raspodjelu sa (n 1) stepeni slobode. Iz uslova P dobijamo P pa je interval povjerenja jednak I 2 =


2 2

2 n Sn >u 2

= .

0 < 2 <

2 n Sn u

at e

m
1 2

at ik
u

S S Iz P n2n > u = slijedi 1 P n2n u = pa je F(u) = 1 za n 1 stepeni slobode. Dobijeni interval se zove jednostrani interval povjerenja. Lijeva granica tog intervala je ksirana, a desna je sluajna. c

a. c
2

0,

2 n Sn u

.m

Slika 2.2: Grak funkcije gustine 2 raspodjele Na slici su oznaene vrijednosti u i u koje imaju sljedee znaenje. Povrina ispod krive c c c s na intervalu [0, u] iznosi 1 , na intervalu [u, u] iznosi i na intervalu [u, ] iznosi 1 . 2 2 Zelimo nai dvostrani interval povjerenja. Rjeenje ovog problema nije jednoznano. Radi c s c odredenosti nS 2 P u < 2n < u = uzmimo da je P (2 < u) = n1 1 = 2 2 i P (2 > u) = n1 1 = , 2 2 Radna verzija

http://matematika.com.ba

33

om
. =
1 2

.b a

Mirnes Smajilovi c

Statistika

tada je P

2 2 n Sn n Sn < 2 < u u

pa je 100% dvostrani interval povjerenja jednak I 2 = 2 2 n Sn n Sn , u u .

2 c c Granice intervala su sluajne, jer imamo sluajnu promjenljivu Sn koja zavisi od uzorka do uzorka. Primjeri

Rjeenje s Odredimo prvo jednostrani interval povjerenja. Iz uslova P 2 > u = 0.95 24

F(u) = 1 0.95 = 0.05 = u = 13.8

at e

I 2 =

m
0,

pa je jednostrani interval povjerenja

.m

Odredimo dvostrani interval povjerenja. Iz uslova

dobijamo

P (2 < u) = 24

1 0.95 = 0.025 2

at ik
25 0.64 13.8

slijedi da je

a. c
= (0, 0.16). 1 0.95 = 0.025 2 = (0.406, 1.290). Radna verzija

i P (2 > u) = 24

F(u) = 0.025 = u = 12.4 1 F(u) = 0.025 F(u) = 0.975 = u = 39.4

pa je dvostrani interval I 2 = 25 0.64 25 0.64 , 39.4 12.4

http://matematika.com.ba

34

om

.b a

Primjer 2.4.3 Iz normalno raspodjeljene populacije izvuen je uzorak obima n = 25 i izraunata c c disperzija uzorka s2 = 0.64. Nai jednostranu i dvostranu intervalnu ocjenu disperzije 2 s n c pouzdanou 95%. sc

Mirnes Smajilovi c

Statistika

2.4.4

Interval povjerenja za disperziju normalne raspodjele kada nije poznato matematiko oekivanje c c
n i=1 n

Kada nije poznato matematiko oekivanje, onda statistika c c 1 2 Sn = n (Xi Xn )2 , 1 gdje je Xn = n Xi ,


i=1

nije nepristrana ocjena za disperziju 2 . 1 2 E(Sn ) = E n = E = E = E = E = E = Dakle, 1 n 1 n 1 n 1 n 1 n 1 n


n i=1 n i=1 n i=1 n i=1 n i=1 n i=1 n i=1

1 (Xi Xn )2 = E n

n i=1

(Xi m + m Xn )2
n i=1

1 [(Xi m) (Xn m)]2 = E n (Xi m)2 1 n


n i=1

[(Xi m)2 2(Xi m)(Xn m) + (Xn m)2 ]

2(Xi m)(Xn m) +
n i=1 n

1 (Xi m)2 2(Xn m) n 1 (Xi m)2 2(Xn m) n

(Xi m) +

a. c
i=1

at ik

Xi n m

om
n

(Xi m)2 2(Xn m)2 + (Xn m)2 = E

.b a
1 n
n i=1

(Xn m)2

1 n (Xn m)2 n + (Xn m)2 1 n


n i=1

(Xi m)2 (Xn m)2 2 n1 2 = n n

at e
I 2 =

E[(Xi m)2 ] E[(Xn m)2 ] =

1 n

i=1

2 2 (Xn ) = 2

n1 2 = 2 n 2 pa statistika Sn nije nepristrana ocjena disperzije 2 . Medutim, pristranost emo eliminisati c ako uzmemo n 2 2 n = n Sn = 1 (Xi Xn )2 . S n1 n1 2 E(Sn ) =

.m

i=1

Zaista, imamo 2 E(Sn ) = E Statistika n 2 n n n1 2 2 S = E(Sn ) = = 2 . n1 n n1 n1 n

2 (n 1)Sn 2 ima 2 -raspodjelu sa (n 1) stepeni slobode. Slino kao kada je poznato matematiko c c oekivanje, dobijamo jednostrani interval povjerenja c 2 (n 1)Sn I2 = 0, , u dok je dvostrani interval povjerenja jednak 2 2 (n 1)Sn (n 1)Sn , u u .

http://matematika.com.ba

35

Radna verzija

Mirnes Smajilovi c

Statistika

2.4.5

Interval povjerenja za nepoznatu vjerovatnou p kod binomne raspodc jele

c Neka se dogadaj A realizuje m puta u n nezavisnih opita, pri emu je P (A) = p nepoznat parametar. Neka je Sn sl. p. koja uzima vrijednosti jednake broju realizacija dogadaja A. Tada je n m P (Sn = m) p (1 p)nm , m = 0, n. m Prema Moavr-Laplasovoj teoremi, sl. p. Sn koja ima binomnu raspodjelu, za dovoljno veliko n ima normalnu raspodjelu N (np, np(1 p)), a sl. p. Sn np ima standardnu normalnu
np(1p)

raspodjelu N (0, 1). Polazei od c

Sn np

dobijamo interval povjerenja. Kako vrijedi Sn np < z np(1 p) dobijamo da je (Sn np)2 2 < z np(1 p) Sn np np(1 p)
2

2 < z

2 2 2 2 2 2 Sn 2npSn + n2 p2 npz + np2 z (n2 + nz )p2 (2nSn + nz )p + Sn < 0

Rjeenje s Polazei od c

Primjer 2.4.4 Nai 95% interval povjerenja za p, ako je u uzorku obima n = 100 registrovano c 20 pojavljivanja obiljeja X. z

Primjeri

.m

Granice intervala povjerenja Ip su sluajne, kao i duina intervala. U 100% sluajeva, paramc z c etar p pripada intervalu Ip .

at e

Rjeenje ove kvadratne nejednaine je interval Ip = (1 , p2 ) gdje su p1 i p2 (1 < p2 ) rjeenja s c p p s kvadratne jednaine c 2 2 2 (n2 + nz )p2 (2nSn + nz )p + Sn = 0.

P dobijamo da je

Sn np < z np(1 p) F(z ) =

at ik

2 2 (Sn np)2 < np(1 p)z (Sn np)2 np(1 p)z < 0

1+ . 2 Za = 0.95 je z = 1.96, pa je odgovarajua kvadratna jednaina c c (1002 + 100 1.962 )p2 (2 100 20 + 100 1.962 )p + 202 = 0 ili, poslije sredivanja, Rjeenja ove kvadratne jednaine su p1 = 0.1334 i p2 = 0.2888, pa je s c Ip = (0.1334, 0.2888). 10384.2p2 4384.16p + 400 = 0.

a. c
=

om

.b a

np(1 p)

< z

(Sn np)2 2 < z np(1 p)

http://matematika.com.ba

36

Radna verzija

Glava 3

Testiranje parametarskih hipoteza

Kod donoenja zakljuaka o istinitosti hipoteze mogue su sljedee greke: s c c c s

2. test ne odbacuje hipotezu H0 (odbacuje H1 ) kada je H0 netana. Tada inimo greku c c s drugog tipa ili greku druge vrste i oznaavat emo je sa . s c c Vjerovatnou zovemo nivo ili prag znaajnosti, a 1 zovemo koecijent pouzdanosti c c ili povjerenja. Testiranje se zasniva na funkciji uzorka ili statistici oblika = f (X1 , X2 , . . . , Xn ; ). Za dati uzorak = (x1 , x2 , . . . , xn ) i nivo znaajnosti odredujemo kritinu oblast W iz uslova c c PH0 { W } = . (3.1)

Ako realizovana vrijednost uzorka pripada kritinoj oblasti W , onda hipotezu H0 odbacuc jemo s rizikom da smo je odbacili kao tanu i kaemo da uzorak protivrjei hipotezi H0 . Ako c z c realizovana vrijednost ne pripada kritinoj oblasti W , nemamo razloga da odbacimo hipotezu c H0 , kae se da uzorak ne protivrjei hipotezi H0 i inimo greku z c c s PH1 { W } = . / 37

1. test odbacuje hipotezu H0 (ne odbacuje H1 ) kada je H0 tana. Tada inimo greku c c s prvog tipa ili greku prve vrste i oznaavat emo je sa , s c c

.m

Posmatraemo hipoteze koje se odnose na parametre raspodjele obiljeja X i zvaemo c z c ih parametarske hipoteze, a odgovarajue testove parametarski testovi. Parametarska c hipoteza je prosta ako se odnosi na jednu odredenu vrijdnost 0 testiranog parametra i oznaavat emo je sa H0 ( = 0 ) i zvati je nultom hipotezom. Ako hipoteza nije prosta, c c ona je sloena. Hipotezu koju suprostavljamo nultoj hipozeti H0 zvaemo suprotna ili alz c ternativna hipoteza i oznaavati je sa H1 . Alternativna hipoteza je ili prosta ili sloena. c z Prosta ima oblik H1 ( = 1 ), a sloena jedan od oblika: H1 ( = 0 ), H1 ( < 0 ), H1 ( > 0 ). z

at e

at ik

a. c

Svako tvrdenje koje se odnosi na raspodjelu sl. p. X (obiljeje X populacije ) zove se z statistika hipoteza ili, kratko, hipoteza. Hipoteza je ili tana ili netana. Verikacija c c c istinitosti hipoteze je, po pravilu, nemogua ispitivanjem svih elemenata populacije. Kriteric jum verikacije istinitosti hipoteze na osnovu uzorka zove se statistiki test ili, kratko, test. c Kriterijumi verikacije istinitosti na osnovu uzorka daju mogunost da se donese zakljuak o c c istinitosti hipoteze s vjerovatnoama koje su bliske jedinici da je doneeni zakljuak taan. c s c c

om

.b a

3.1

Pojam parametarske hipoteze, Kritina oblast. Vrste greaka c s

Mirnes Smajilovi c

Statistika

Denicija 3.1.1 Funkcija M () = M (W, ) testa = 0 ija je vrijednost u taki = 1 c c jednaka vjerovatnoi da e testiranjem biti odbaena hipoteza H0 ( = 0 ) kada je = 1 , zove c c c se funkcija moi testa. Dakle c M () = M (W, ) = P { W | tana vrijednost parametra je } c i vai z M (W, 0 ) = i M (W, 1 ) = 1 .

Denicija 3.1.2 Funkcija L() = L(W, ) testa = 0 ija je vrijednost u taki = 1 c c jednaka vjerovatnoi da e testiranjem biti prihvaena hipoteza H0 ( = 0 ) kada je = 1 , c c c zove se funkcija operativne karakteristike ili OC funkcija testa. Dakle L() = L(W, ) = P { W | tana vrijednost parametra je } / c i vai z L(W, 0 ) = 1 i sljedea relacija c i L(W, 1 ) =

1 = 1 PH1 { W } = PH1 { W } = max . /

at e

ili, to je ekvivalentno, da bude mo kriterijuma maksimalna, tj. da bude s c (3.3)

.m

Takvu kritinu oblast zovemo najboljom kritinom oblau, a test (kriterijum) nac c sc jmoniji. c

at ik

U optem sluaju, za dato (3.1) kritina oblast W nije jednoznano odredena. Treba s c c c izabrati takvu kritinu oblast W da bude vjerovatnoa greke druge vrste minimalna, tj. da c c s bude = PH1 { W } = min . / (3.2)

a. c

L() = 1 M ().

om
Radna verzija

http://matematika.com.ba

38

.b a

Mirnes Smajilovi c

Statistika

3.2

Testiranje hipoteze o matematikom oekivanju kada je c c poznata disperzija

Neka treba testirati hipotezu H0 (m = m0 ) protiv hipoteze H1 (m = m0 ), na osnovu uzorka obima n : X1 , X2 , . . . , Xn obiljeja X koje ima normalnu raspodjelu N (m, 2 ), gdje je 2 z poznato, s pragom znaajnosti . Nepristrani procjenitelj oekivanja je aritmetika sredina c c c n = 1 (X1 + X2 + + Xn ) koja ima normalnu raspodjelu N m, 2 , pa je sl. p. uzorka X n n Z= Xn m
n

N (0, 1).

Ovu sl. p. emo koristiti kao statistiki test. c c

Kritinu oblast odredujemo iz uslova c

at e

m
n

Slika 3.1: Oblast odbacivanja nulte hipoteze je osjenano podruje. Povrina ispod krive na c c s intervalu [, z1/2 ] iznosi /2, na intervalu [z1/2 , z1/2 ] iznosi 1 i na intervalu [z1/2 , ] iznosi /2.

Neka je na osnovu uzorka dobijena vrijednost xn . |n m0 | x Ako xn pripada kritinoj oblasti, tj. ako je c z1/2 , onda hipotezu H0 (m = m0 )
n

odbacujemo sa rizikom da smo je odbacili kao tanu. Kritina oblast za realizovanu vrijedc c nost je W = [, z1/2 ] [z1/2 , ]. Ako xn ne pripada kritinoj oblasti, tj. ako je c odbacimo hipotezu H0 (m = m0 ). Napomena: Iz
|n m0 | x
n

Pravilo testiranja je:

gdje je z1/2 takvo da je F(z1/2 ) = 1 /2.

.m

PH0

|Xn m|

at ik

/2 z1/2

z1/2

pa dobijamo oblast kritinosti za xn : c W =

z1/2 dobijamo xn z1/2 n + m0 ili xn m0 z1/2 n

, m0 z1/2 m0 + z1/2 , n n

odnosno dobijamo interval kada nemamo razloga odbaciti hipotezu H0 (m = m0 ), tj. kada xn m0 z1/2 n , m0 + z1/2 n . http://matematika.com.ba 39 Radna verzija

a. c
|n m0 | x
n

om
/2 z1/2 = < z1/2 , onda nemamo razloga da

.b a

Mirnes Smajilovi c

Statistika

Primjer 3.2.1 Izvuen je uzorak obima n = 81 iz N (m, 16) i izraunata je srednja vrijednost c c tog uzorka x81 = 11. Na nivou znaajnosti = 0.05 i = 0.01 testirati hipotezu H0 (m = 10) c protiv alternativne hipoteze H1 (m = 10). Rjeenje s Iskoristit emo injenicu da c c Z=

Xn m
n

ima N (0, 1) raspodjelu. Registrovana vrijednost je xn m


n

11 10
4 9

= 2.25.

odakle je pa odbacujemo hipotezu H0 sa rizikom = 0.05.

W = [, 1.96] [1.96, ]

Za = 0.01, kritinu oblast odredujemo iz uslova c

m
n

PH0 odakle je

|Xn m|

at ik
z0.995 = 0.01

pa zbog 2.25 W nemamo razloga da odbacimo hipotezu H0 . /

.m

at e

W = [, 2.576] [2.576, ]

a. c

om
2.25 Radna verzija

PH0

|Xn m|
n

z0.975

= 0.05

http://matematika.com.ba

40

.b a

Za = 0.05, kritinu oblast odredujemo iz uslova c

Mirnes Smajilovi c

Statistika

3.3

Testiranje hipoteze o matematikom oekivanju kada nije c c poznata disperzija

Neka treba testirati hipotezu H0 (m = m0 ) protiv hipoteze H1 (m = m0 ), na osnovu uzorka obima n : X1 , X2 , . . . , Xn obiljeja X koje ima normalnu raspodjelu N (m, 2 ), gdje je 2 z nepoznato, s pragom znaajnosti . Iskoristit emo injenicu da sl. p. c c c tn1 = ima tn1 raspodjelu, pri emu je c 1 Xn = n
n

Xn m n1 Sn
n i=1

Xi ,
i=1

1 2 Sn = n

(Xi Xn )2 .

Ovu sl. p. emo koristiti kao statistiki test. c c

Kritinu oblast odredujemo iz uslova c PH0 |Xn m| n 1 tn1;1/2 Sn

.m

at e

Slika 3.2: Oblast odbacivanja nulte hipoteze je osjenano podruje. Povrina ispod krive na c c s intervalu [, tn1;1/2 ] iznosi /2, na intervalu [tn1;1/2 , tn1;1/2 ] iznosi 1 i na intervalu [tn1;1/2 , ] iznosi /2.

/2 tn1;1/2

at ik

a. c
/2 tn1;1/2 =
|n m0 | x n sn

Pravilo testiranja je: Neka je na osnovu uzorka dobijena vrijednost xn .


x m Ako xn pripada kritinoj oblasti, tj. ako je |nsn 0 | n 1 tn1;1/2 , onda hipotezu c H0 (m = m0 ) odbacujemo sa rizikom da smo je odbacili kao tanu. Kritina oblast za realic c zovanu vrijednost je W = [, tn1;1/2 ] [tn1;1/2 , ].

Ako xn ne pripada kritinoj oblasti, tj. ako je c razloga da odbacimo hipotezu H0 (m = m0 ). Kritina oblast za xn je: c W = , m0

gdje je tn1;1/2 takvo da je F(tn1;1/2 ) = 1 /2.

sn sn tn1;1/2 m0 + tn1;1/2 , . n1 n1 41 Radna verzija

http://matematika.com.ba

om
1 < tn1;1/2 , onda nemamo

.b a

Mirnes Smajilovi c

Statistika

Primjeri Primjer 3.3.1 Ranerija nafte eli da proizvede benzin sa oktanskim brojem 98. Za vrijeme z probne proizvodnje, na sluajan nain uzeto je 10 uzoraka benzina i utvrdeno je da uzorci c c imaju oktanske brojeve 99.0, 97.2, 98.5, 96.9, 98.2, 97.9, 98.4, 97.8, 99.1, 98.3. Ako pretpostavimo da se oktanski brojevi pokoravaju normalnom zakonu raspodjele, da li se na 5% nivou znaajnosti moe tvrditi da je ranerija postigla cilj, tj. da se razlike izmedu c z dobijenih rezultata i projektovanog oktanskog broja 98 mogu smatrati zanemarljivim. Rjeenje s Hipoteze su H0 (m = 98) i H1 (m = 98). Iz uzorka dobijamo x10 = 981.3 = 98.13, 10 s2 = 10 4.481 = 0.4481 = s10 = 0.6694 10

Ako je hipoteza H0 (m = 98) tana, onda statistika c tn1 =

Iz uslova

Kako vrijedi 0.5826 W , nemamo razloga da odbacimo hipotezu H0 , odnosno ranerija je / postigla cilj.

.m

|n m| x |98.13 98| 0.13 n1= 9= 3 = 0.5826. sn 0.6694 0.6694

at e

dobijamo kritinu oblast W = (, 2.262] [2.262, ). Realizovana vrijednost je jednaka c

PH0 {|t9 | t9;0.975 } = 0.05

at ik

ima tn1 raspodjelu, to je u naem sluaju t9 . s s c

a. c
Radna verzija

Xn m n1 Sn

http://matematika.com.ba

42

om

.b a

Mirnes Smajilovi c

Statistika

3.4

Testiranje hipoteze o jednakosti matematikog oekivanja c c

Posmatrajmo dva nezavisna uzorka n1 : X1 , X2 , . . . , Xn i n2 : Y1 , Y2 , . . . , Yn jednog istog obiljeja X iz normalne raspodjele N (m, 2 ). z Treba testirati hipotezu H0 (m1 = m2 ) protiv hipoteze H1 (m1 = m2 ) sa pragom znaajnosti c . Iskoristit emo injenicu da sl. p., tj. statistika c c tn1 +n2 2 = Xn1 Xn2 n1 n2 (n1 + n2 2) n1 + n2

2 2 n 1 Sn1 + n 2 Sn2

/2 tn1 +n2 2;1/2

at ik

Slika 3.3: Oblast odbacivanja nulte hipoteze je osjenano podruje. c c Kritinu oblast odredujemo iz uslova c |X X | n n n1 n2 1 2 PH0 (n1 + n2 2) tn1 +n2 2;1/2 = n S2 + n S2 n1 + n2 2 n2 1 n1

Pravilo testiranja je: Neka je na osnovu uzorka dobijeno xn1 , xn2 , s2 , s2 . 1 2 Ako xn1 xn2 pripada kritinoj oblasti, tj. ako je c |n1 xn2 | x 2 + n s2 n 1 s n1 2 n2 n1 n2 (n1 + n2 2) tn1 +n2 2;1/2 n1 + n2

onda hipotezu H0 odbacujemo sa rizikom da smo je odbacili kao tanu. Kritina oblast za c c realizovanu vrijednost je: W = [, tn1 +n2 2;1/2 ] [tn1 +n2 2;1/2 , ]. Ako xn1 xn2 ne pripada kritinoj oblasti, onda nemamo razloga da odbacimo hipotezu H0 , c odnosno ako je: tn +n 2;1/2 n1 s2 1 + n2 s2 2 n n . |n1 xn2 | < 1 2 x n1 n2 (n1 + n2 2) n1 +n2 http://matematika.com.ba 43 Radna verzija

gdje je tn1 +n2 2;1/2 takvo da je F(tn1 +n2 2;1/2 ) = 1 /2.

.m

at e

a. c
/2 tn1 +n2 2;1/2

om

.b a

ima Studentovu raspodjelu s n1 + n2 2 stepeni slobode. Ovu sl. p. emo koristiti kao c statistiki test. c

Mirnes Smajilovi c

Statistika

Primjeri Primjer 3.4.1 Na osnovu jednog uzorka obima n1 = 9 izraunata je srednja vrijednost xn1 = c 15 i disperzija s2 1 = 0.78 tog uzorka, a na osnovu drugog uzorka obima n2 = 16 izraunata n c je srednja vrijednost xn2 = 14 i disperzija s2 2 = 1 tog uzorka. Na nivou znaajnosti = 0.05 n c testirati hipotezu H0 (m1 = m2 ) protiv alternativne hipoteze: a) H1 (m1 = m2 ), b) H1 (m1 > m2 ), c) H1 (m1 < m2 ). Rjeenje s Ako je hipoteza H0 (m1 = m2 ) tana, onda statistika c tn1 +n2 2 = Xn1 Xn2 n1 n2 (n1 + n2 2) n1 + n2

a) Iz uslova

b) Iz uslova

.m

c) Iz uslova

dobijamo kritinu oblast W = [1.714, ) c = 0.05.

at e

dobijamo kritinu oblast W = (, 2.069] [2.069, ). Budui da 2.40 W odbacuc c jemo hipotezu H0 sa rizikom = 0.05. PH0 {t23 t23;0.95 } = 0.05 2.40, pa odbacujemo hipotezu H0 sa rizikom

dobijamo kritinu oblast W = (, 1.714], pa zbog 2.40 W nemamo razloga da c / odbacimo hipotezu H0 .

PH0 {|t23 | t23;0.975 } = 0.05

PH0 {t23 t23;0.95 } = 0.05

at ik

15 14 9 0.78 + 16 1

9 16 (9 + 16 2) = 2.40. 9 + 15

a. c

ima Studentovu raspodjelu s n1 + n2 2 stepeni slobode, to u naem sluaju daje t23 . Na s s c osnovu podataka iz uzorka dobijamo

om

2 2 n 1 Sn1 + n 2 Sn2

.b a
Radna verzija

http://matematika.com.ba

44

Mirnes Smajilovi c

Statistika

3.5

Testiranje hipoteze o disperziji

Disperzija je mjera rasturenosti i zbog toga je bitan pokazatelj stabilnosti raznih sluajnih c pojava i procesa, tanosti mjernih instrumenata, itd. Najea situacija je da se na osnovu c c sc sluajnog uzorka obima n : X1 , X2 , . . . , Xn obiljeja X provjeri da li je dolo do nekih bitnih c z s promjena. Iskoristit emo injenicu da sl. p., tj. statistika c c 2 n Sn 2 ima 2 - raspodjelu s n 1 stepeni slobode. Ovu sl. p. emo koristiti kao statistiki test. c c
2 2 Testiranje hipoteze H0 ( 2 = 0 ) protiv hipoteze H1 ( 2 > 0 )

at e

Kritinu oblast odredujemo iz uslova c PH0 odakle je W = 2 n1;1 , . Pravilo testiranja je:
s Ako registrovana vrijednost nn pripada kritinoj oblasti W , onda hipotezu H0 odbacuc 2 0 jemo sa rizikom da smo je odbacili kao tanu. c
2

Slika 3.4: Grak funkcije gustine 2 raspodjele. Oblast odbacivanja nulte hipoteze je osjenano c podruje. c

.m

2 n Sn 2 n1;1 2

at ik
2 n1;1 =

Ako

n2 sn 2 0

c ne pripada kritinoj oblasti W , onda nemamo razloga da odbacimo hipotezu H0 .

a. c
http://matematika.com.ba 45 Radna verzija

om

2 2 Neka treba testirati hipotezu H0 ( 2 = 0 ) protiv hipoteze H1 ( 2 > 0 ), sa nivoom povjerenja .

.b a

Mirnes Smajilovi c

Statistika

Primjeri Primjer 3.5.1 Odredeni tehnoloki proces se smatra stabilnim, ako disperzija nekog odredenog s kvantitativnog svojstva nije vea od 2, inae je procesnestabilan. Ako je iz uzorka obima c c n = 25 dobijena disperzija s2 = 1.8, testirati hipotezu o stabilnosti ovog tehnolokog procesa n s 2 = 3, izraunati vjerovatnou greke drugog na nivou znaajnosti = 0.05. Ako je stvarno c c c s tipa. Rjeenje s Hipoteze su H0 2 = 2 i H1 2 > 2 . Kritinu oblast odredujemo iz uslova c PH0 2 n Sn 2 24;0.95 2 =

pa nemamo razloga da odbacimo hipotezu H0 . Iz uslova 2 25Sn = 36.4 2

dobijamo kritinu vrijednost c

Vjerovatnoa greke drugog tipa, ako je tana hipoteza H1 2 = 3 je jednaka: c s c 2 = PH1 Sn < 2.912 = PH1 Iz tablica 2 -raspodjele dobijamo 0.500 < PH1 2 < 24.3 < 0.750 24 i interpolacijom dobijamo traenu vjerovatnou. z c Interpolacija: Iz tablica 2 -raspodjele dobijamo take A(x1 , y1 ) = (23.3, 0.500) i B = c (x2 , y2 ) = (28.2, 0.75). Treba odrediti taku M (24.3, y) koja lei na pravoj AB. c z 0.750 0.500 y2 y1 (24.3 23.3) = 0.051 y = 0.551. (x x1 ) y 0.500 = x2 x1 28.2 23.3 2 n Sn 25 2.912 < 2 3

2. Ako je s2 2.912, onda hipotezu H0 odbacujemo. n

.m

1. Ako je 0 s2 < 2.912 onda nemamo razloga da odbacimo hipotezu H0 , n

at e

pa je pravilo testiranja:

2 36.4 2 Sn = = 2.912 25

at ik

a. c
= PH1 2 < 24.3 24 Radna verzija

y y1 =

Dakle, = 0.551.

http://matematika.com.ba

46

om

25 1.8 n2 sn = 22.5 W / 2 = 2 0

.b a

odakle je W = [36.4, ). Registrovana vrijednost je

Mirnes Smajilovi c
2 2 Testiranje hipoteze H0 ( 2 = 0 ) protiv hipoteze H1 ( 2 < 0 )

Statistika

2 2 Neka treba testirati hipotezu H0 ( 2 = 0 ) protiv hipoteze H1 ( 2 < 0 ), sa nivoom povjerenja .

odakle je Pravilo testiranja je:

Ako

ne pripada kritinoj oblasti W , onda nemamo razloga da odbacimo hipotezu H0 . c

n2 sn 2 0

.m

s Ako registrovana vrijednost nn pripada kritinoj oblasti W , onda hipotezu H0 odbacuc 2 0 jemo sa rizikom da smo je odbacili kao tanu. c

at e

W = 0, 2 n1; .

at ik

PH0

2 n Sn 2 n1; 2

a. c
= Radna verzija

Kritinu oblast odredujemo iz uslova c

http://matematika.com.ba

47

om

Slika 3.5: Grak funkcije gustine 2 raspodjele. Oblast odbacivanja nulte hipoteze je osjenano c podruje. c

.b a

2 n1;

Mirnes Smajilovi c
2 2 Testiranje hipoteze H0 ( 2 = 0 ) protiv hipoteze H1 ( 2 = 0 )

Statistika

2 2 Neka treba testirati hipotezu H0 ( 2 = 0 ) protiv hipoteze H1 ( 2 = 0 ), sa nivoom povjerenja .

1
2 n1;
2

odakle je

Pravilo testiranja je:

.m

c Radi odredenosti, uzmimo da je 1 = , odakle je 2 = = , pa dobijamo kritinu 2 2 2 oblast: W = 0, 2 2 n1; n1;1 , .

at e

2 W = 0, 2 n1;1 n1;12 , .

at ik
2

PH0

2 n Sn 2 n1;1 2

+ PH0

2 n Sn 2 n1;12 2

a. c
2

Kritinu oblast odredujemo iz uslova c

Ako

n2 sn 2 0

ne pripada kritinoj oblasti W , onda nemamo razloga da odbacimo hipotezu H0 . c

s Ako registrovana vrijednost nn pripada kritinoj oblasti W , onda hipotezu H0 odbacuc 2 0 jemo sa rizikom da smo je odbacili kao tanu. c

om

Slika 3.6: Grak funkcije gustine 2 raspodjele. Oblast odbacivanja nulte hipoteze je osjenano c podruje. c

.b a

2 n1;1

= 1 + 2 =

http://matematika.com.ba

48

Radna verzija

Mirnes Smajilovi c

Statistika

3.6

Testiranje hipoteze o vjerovatnoi: c H0 (p = p0 ) protiv H1(p = p0)

Neka treba testirati hipotezu H0 (p = p0 ) protiv H1 (p = p0 ) sa nivoom znaajnosti . Neka c je H0 hipoteza da je vjerovatnoa realizacije nekog dogadaja ili pojave p = p0 , a vjerovatnoa c c nerealizacije q = 1 p. Postupak je sljedei. Uzima se uzorak obima n (n 30), i ustanovi se c koliko puta se realizuje posmatrani dogadaj ili pojava. Neka je to Sn puta. Kako vrijednost Sn varira od uzorka do uzorka, to Sn moemo posmatrati kao sluajnu promjenljivu koja ima z c binomnu raspodjelu B(n, p). Poznato je da sl. p. Sn ima asimptotski raspodjelu N (np, npq). Kritinu oblast odredujemo iz uslova c PH0 |Sn np| z1 2 npq =

c odakle je, zbog simetrinosti normalne raspodjele u odnosu na ordinatnu osu, W = , z1 z1 , . 2 2

Iz jednakosti

Pravilo testiranja sada moemo izrei na sljedei nain: z c c c 1. Ako je Sn np0 z1 2 jemo. np0 q0 ili Sn np0 + z1 np0 q0 , onda hipotezu H0 odbacu2

2. Ako je Sn (np0 z1 np0 q0 , np0 +z1 np0 q0 ), onda nemamo razloga da odbacimo 2 2 hipotezu H0 .

dobijamo

.m

np0 z1 np0 q0 Sn np0 + z1 np0 q0 . 2 2

at e

np0 c 2. Ako registrovana vrijednost |Snnp0 q0 | ne pripada kritinoj oblasti W , onda nemamo razloga da odbacimo hipotezu H0 (uzorak ne protivrjei hipotezi H0 ). c

|Sn np0 | z1 2 np0 q0

at ik

np0 c 1. Ako registrovana vrijednost |Snnp0q0 | pripada kritinoj oblasti W , onda hipotezu H0 odbacujemo sa rizikom da smo je odbacili kao tanu (uzorak protivrjei hipotezi H0 ). c c

a. c

Pravilo testiranja je:

om
Radna verzija

http://matematika.com.ba

49

.b a

Mirnes Smajilovi c

Statistika

Primjeri
Primjer 3.6.1 U 180 bacanja kocke 35 puta je pala estica. Testirati na 5% nivou znaajnosti s c c c s hipotezu H0 p = 1 protiv alternativne hipoteze H1 p = 1 . Izraunati vjerovatnou greke 6 6 1 drugog tipa, ako je tano H1 p = 4 . c Rjeenje s Kritinu oblast odredujemo iz uslova c PH0 |Sn np| z0.975 npq =

odakle je W = (, 1.96] [1.96, ). Registrovana vrijednost je 180


1 6

5 6

2. Ako je Sn (20.2, 39.8), onda nemamo razloga da odbacimo hipotezu H0 .


1 Vjerovatnoa greke drugog tipa, ako je tana hipoteza H1 p = 4 je jednaka: c s c 20.2 180 1 1 1 Sn 180 4 39.8 180 4 4 = PH1 {20.2 < Sn < 39.8} = PH1 < < 180 1 3 3 1 180 1 4 180 4 3 4 4 4 4

Primjer 3.6.2 90% proizvoda jedne fabrike je ispravno. Novim tehnolokim procesom se eli s z dobiti vei procenat ispravnih proizvoda. Ako je u uzorku obima n = 100 na novi nain c c proizvedenih artikala registrovano 95 ispravnih, da li novi nain proizvodnje obezbjeduje vei c c procenat ispravnih proizvoda? Testiranje izvriti na 5% nivou znaajnosti. s c Rjeenje s Hipoteze su H0 (p = 0.9) i H1 (p > 0.9). Kritinu oblast odredujemo iz uslova c PH0 Sn np z0.95 npq =

odakle je W = [1.645, ). Registrovana vrijednost je Sn np 95 100 0.9 = = 1.67 W npq 100 0.9 0.1 i hipotezu H0 (p = 0.9) odbacujemo sa rizikom i prihvatamo alternativnu hipotezu, tj. novi nain proizvodnje poveava procenat ispravnih proizvoda. c c http://matematika.com.ba 50 Radna verzija

= 1 F(0.90) 1 + F(4.27) = F(4.27) F(0.90) = 1 0.8159 = 0.1841.

= PH1 {4.27 < Sn < 0.90} = F(90) F(4.27)

.m

at e

at ik

1. Ako je Sn 20.2 ili Sn 39.8, onda hipotezu H0 odbacujemo.

a. c

Pravilo testiranja je:

om

pa nemamo razloga da odbacimo hipotezu H0 .

.b a

|35 180 1 | 6

=1W /

Glava 4

Testiranje neparametarskih hipoteza

Mjera odstupanja funkcije Sn od F(x), pod pretpostavkom da je hipoteza tana, je neki c broj c takav da je: PH0 {|Sn (x) F(x)| > c} = . Iz ovog uslova se odreduje kritina oblast W za dati nivo znaajnosti . c c Najee se koriste sljedei testovi: c sc c 1. 2 -test ili Pirsonov test, 2. -test ili test Kolmogorova.

Jedan od naina je grako predstavljanje i jedne i druge funkcije. Na osnovu tih c c graka, moe se zakljuiti da li empirijska funkcija dobro aproksimira teorijsku funkciju ili ne. z c

Neka je Sn (x) empirijska funkcija raspodjele (kumulativna funkcija frekvencija) obiljeja z X dobijena na osnovu uzorka obima n i F(x) pretpostavljena, teorijska funkcija raspodjele istog obiljea X. Zadatak je da provjerimo saglasnost izmedu ovih funkcija, a ona se moe z z provjeriti na razne naine. c

.m

at e

Ako se hipoteza odnosi na samu raspodjelu, a ne na parametre raspodjele, zvat emo c je neparametarska hipoteza, a test neparametarski test. Neparametarskim testom se ispituje saglasnost hipotetike, teorijske raspodjele u cijeloj populaciji i empirijske raspodjele c frekvencija u uzorku koji je izvuen iz te populacije. c

at ik
51

a. c

Svako tvrdenje koje se odnosi na raspodjelu sl. p. X (obiljeje X populacije ) zove se z statistika hipoteza ili, kratko, hipoteza. Hipoteza je ili tana ili netana. Verikacija c c c istinitosti hipoteze je, po pravilu, nemogua ispitivanjem svih elemenata populacije. Kriteric jum verikacije istinitosti hipoteze na osnovu uzorka zove se statistiki test ili, kratko, test. c Kriterijumi verikacije istinitosti na osnovu uzorka daju mogunost da se donese zakljuak o c c istinitosti hipoteze s vjerovatnoama koje su bliske jedinici da je doneeni zakljuak taan. c s c c

om

.b a

4.1

Pojam neparametarske hipoteze

Mirnes Smajilovi c

Statistika

4.2

2 -test za verikaciju hipoteze o raspodjeli obiljeja z

Neka treba verikovati istinitost hipoteze H0 da je uzorak n : x1 , x2 , . . . , xn izvuen iz popc ulacije ije obiljeje X ima funkciju raspodjele F(x; 1 , 2 , . . . , s ) (ili zakon raspodjele u c z diskretnom sluaju). Ocijenivi nepoznate parametre 1 , 2 , . . . , s na osnovu uzorka, teorijska c s funkcija raspodjele F postaje potpuno odredena. Za verikaciju hipoteze H0 o saglasnosti empirijske funkcije raspodjele sa pretpostavljenom, hipotetikom funkcijom raspodjele F(x; 1 , 2 , . . . , s ), Pirson je 1900 god. uveo 2 -test c koji se zasniva na 2 -raspodjeli. Podijelimo mogue vrijednosti sl. p. X (obiljeja X) u r disjunktnih intervala S1 , S2 , . . . , Sr . c z Neka je k = PH0 {X Sk } , k = 1, r tada statistika 2 r1s =
k=1 r

2 PH0 2 r1s r1s;1 =

c odredujemo kritinu oblast testa

Primjer 4.2.1 U 1000 bacanja novia grb je pao u 532 sluaja, a pismo u 468 sluajeva. cc c c Testirati homogenost ovog novia na 5% i 1% nivou znaajnosti. cc c Rjeenje s Raunski proces je dat sljedeom tabelom: c c Vrijednosti obiljeja z GRB PISMO nk 530 468 1000 k 0.5 0.5 1 nk 500 500 150 nk nk 32 -32 (nk nk )2 1024 1024
(nk nk )2 nk

Podjela na intervale (klase) S1 , S2 , . . . , Sr treba da bude takva da je (k)(nk 5).

Ako registrovana vrijednost 2 r1s pripada W onda odbacujemo hipotezu H0 sa rizikom , a ako registrovana vrijednost 2 r1s ne pripada W onda nemamo razloga da odbacimo hipotezu H0 .

.m

at e

m
W = 2 r1s;1 , .

at ik

Za dati nivo znaajnosti iz uslova c

a. c

gdje je n obim uzorka, r broj intervala Sk , k teorijske vjerovatnoe, nk teorijske frekvencije c i nk uzorake frekvencije intervala Sk , ima 2 -raspodjelu sa (r 1 s) stepeni slobode. c

om

(nk nk )2 nk

.b a

2.048 2.048 4.096

Broj stepeni slobode je r 1 s = 2 1 0 = 1, a realizovana vrijednost (izraunata tabelom) c je 4.096. Za = 5% = 0.05, kritinu oblast odredujemo iz uslova c PH0 2 2 1 1;0.95 = 0.05 http://matematika.com.ba 52 Radna verzija

Mirnes Smajilovi c

Statistika

odakle je W = [3.84, ), pa kako vrijedi 4.096 W , hipotezu H0 odbacujemo sa rizikom = 0.05 da smo je odbacili kao tanu. c Za = 1% = 0.01, kritinu oblast odredujemo iz uslova c PH0 2 2 1 1;0.99 = 0.05 odakle je W = [6.63, ), pa kako vrijedi 4.096 W , nemamo razloga da odbacimo hipotezu / H0 .

4.3

2 -test za verikaciju hipoteze o nezavisnosti dvaju obiljeja z

a. c

H HH Y y1 X HH H

y2 n12 n22 . . . nr2 n2

... ... ... ... ... ...

ys n1s n2s . . . nrs ns n1 n2 . . . nr n

om
ni = nj = n =

2 -test se moe primjeniti za testiranje hipoteze H0 - da su dva obiljeja X i Y jedne popz z ulacije nezavisna protiv alternativne hipoteze H1 - da su ta dva obiljeja zavisna na nivou z znaajnosti . Obiljeja X i Y ne moraju biti kvantitativnog karaktera. Neka su x1 , x2 , . . . , xr c z registrovane vrijednosti obiljeja X, a y1 , y2 , . . . , ys registrovane vrijednosti obiljeja Y , to se z z s obino predstavlja u obliku tzv. tabele kontingencije: c

at ik

x1 x2 . . . xr

n11 n21 . . . nr1 n1

.b a
s

nij nij

j=1 r i=1 r

nij =
i=1 j=1 i=1

ni
j=1

nj

Uvedemo li oznake

tada je

Za dovoljno veliko n i pod pretpostavkom da je hipoteza H0 tana, statistika c


r s

.m

pij = P ({X = xi } {Y = yj }) ,

at e

pi = P {X = xi },

pj = P {Y = yj }

H0 : pij = pi pj za sve parove (i, j),

H1 : pij = pi pj bar za jedan par (i, j).


n n 2

2 (r1)(s1)

=n
i=1 j=1

nij in j ni nj

ima 2 -raspodjelu sa (r 1)(s 1) stepeni slobode. Za dati nivo znaajnosti iz uslova c


2 PH0 2 (r1)(s1) (r1)(s1);1 =

odredujemo kritinu oblast testa c W = 2 (r1)(s1);1 , . Ako registrovana vrijednost 2 (r1)(s1) pripada W onda odbacujemo hipotezu H0 sa rizikom , a ako registrovana vrijednost 2 (r1)(s1) ne pripada W onda nemamo razloga da odbacimo hipotezu H0 . http://matematika.com.ba 53 Radna verzija

Mirnes Smajilovi c

Statistika

Primjer 4.3.1 Kandidati za predsjednika jedne pokrajine su jedna ena i jedan mukarac. U z s sluajnom uzorku obima n = 1000 zabiljeeni su rezultati dati sljedeom tabelom kontingencije: c z c
XXX XXXKandidat ena z XX XXX Birai c

mukarac s 270 250 520 490 510 1000

ene z mukarci s

220 260 480

Da li za = 0.10 i = 0.05 opredjeljenje biraa zavisi od pola kandidata. c Rjeenje s Hipoteze su:

Ako je H0 tana, onda statistika c


2 2

2 (21)(21) ima 2 -raspodjelu. 1 Registrovana vrijednost je:


2

=n

i=1 j=1

= 100

Za = 0.10 kritina oblast je W = 2 c 1;0.90 , = [2.71, ), pa kako vrijedi 3.704 W zakljuujemo da treba odbaciti hipotezu H0 , a za = 0.05 kritina oblast je W = 2 c c 1;0.95 , = [3.84, ), pa kako vrijedi 3.704 W nemamo razloga da odbacimo hipotezu H0 . /

.m

= 0.982 + 0.944 + 0.907 + 0.871 = 3.704.

at e

220 480490 1000 480 490

at ik
2 2

a. c

nij in j ni nj

om
n n 2

.b a
250 520510 1000 + 520 510
2

H0 : opredjeljenje biraa ne zavisi od pola kandidata, c H1 : opredjeljenje biraa zavisi od pola kandidata. c

260 480510 1000 + 480 510

270 520490 1000 + 520 490

http://matematika.com.ba

54

Radna verzija

You might also like