You are on page 1of 5

1

Testiranje hipoteza
2
3 4
1- jaina testa
5
Unakrsno tabeliranje
Koristi se za:
1. Testiranje statististieke nezavisnosti
2. Testiranje prilagoenosti
Test i raspored koji se koristi za testiranje nezavisnosti i prilagoenosti je hi-kvadrat
Hi-kvadrat raspored je u potpunosti odreen sa brojem tepeni slobode =(redovi-
1)(kolone-1) za testiranje nezavisnosti a =(k-1) za testiranje prilagoenosti gde je
k broj meusobno odvojenih kategorija. Odnosno sa =
2
=2.
Hi-kvadrat statistika
O
i
-posmatrane empirijske frekvencije
E
i
oekivane frekvencije E
i
=p
l
p
a
n
6
Hi-kvadrat
Opte pravilo je da rezultati hi-kvadrat testa su validni samo ako je
vrednost oekivane frekvencije u svakom polju tabele kontingencije
najmanje 5.
Ako je izraunata vrednost hi-kvadrata jednaka nuli, trebalo bi paljivo
da postavimo pitanje da li ne postoji apsolutno nikakva razlika izmeu
opserviranih i oekivanih frekvencija. Ako bi trebalo da postoji razlika
treba ispitati nain prikupljanja podataka i merenja da bi proverili da li
razlike nisu bile prikrivene ili da li se nisu izgubile tokom prikupljanja
podataka.
7
Hi-kvadrat
Ovaj test nam pokazuje da li ima povezanosti ili je nema
ali nam ne pokazuje jainu povezanosti. Jaina
povezanosti se moe meriti sledeim koeficijentima:
8
Hi-kvadrat
Koeficijent kontingencije varira izmeu 0 i 1.
0-ne postoji povezanost
1- se nikad ne postie ve maksimalna vrednost
koeficijenta zavisi od veliine tabele
Kako bi se reio problem hi-kvadrata kao mere
povezanosti (zavisi od veliine uzorka) moemo da
koristimo fi-kvadrat i Krejmerovo V (za tabele vee od
2x2)
Vano je uoiti da ovi koeficijenti nemaju gornju granicu.
9
HI-kvadrat
Ogranienja hi-kvadrat koeficijenta kada se koristi kao
mera povezanosti:
Proporcionalna je veliini uzorka pa je teko tumaenje
u apsolutnom smislu (bez efekta veliine uzorka);
Nema gornju granicu pa se teko razvija oseaj za njenu
vrednost;
Ne daje indikaciju kako su dve varijable povezane.
10
Hi-kvadrat
U firmi P&G prikupili su uzorak od 400 ljudi da bi
utvrdili ponaanje kupaca vezano za kupovinu cerealija
tokom konkretnog odlaska u prodavnicu. Rezultati
istraivanja pokazuju:
Da li su preferencije i brendovi povezani?
Kupac A B C D
Kupuje brend 45 50 45 60
Ne kupuje brend 55 50 55 40
Brend
11
Ho: Preferencije i brendovi nisu povezani.
Ha Preferencije i brendovi su povezani.
Kupac A B C D Total
Kupuje brend 45(50) 50(50) 45(50) 60(50) 200
Ne kupuje brend 55(50) 50(50) 55(50) 40(50) 200
Total 100 100 100 100 400
Oekivane vrednosti date su u zagradama = total u redu x total u koloni
sveukupni total
EII = 200 x 100
400
EII = 50
X
2
izraunato= (O - E)
2
= (45 - 50)
2
+ (50 - 50)
2
+ ... + (40 - 50)
2
E 50 50 50
= 0.5 + 0 + ... + 2 = 6
X
2
test statistika sa (4-1)(2-1) = (3)(1) = 3 stepeni slobode i = 0.05 = 7.815
Poto je izraunata statistika manja od tabline prihvatamo nultu hipotezu da preferencije i brendovi nisu povezani.
12
Tabela koja se nalazi uz ovo pitanje, na nezavisnim sluajnim uzorcima
deaka i devojica, pokazuje broj onih koji se igraju vie ili manje od
2,5 asova dnevno. Na nivou znaajnosti od 10% testirajte nultu
hipotezu o tome da ne postoji veza izmeu pola deteta i vremena koje
provodi u igranju.
A B
Deaci 18 10
Devojice 17 13
Broj sati
13
Izraunata vrednost je 0,349
Tablina vrednost je 6,635 za 1% a 2.71 za 10%
Poto je izraunata vrednost manja od tabline
nemamo dovoljno dokaza da odbacimo nultu
hipotezu da ne postoji povezanost izmeu pola
deteta i vremena koje provodi u igranju.
14
15 16
Chi-Square Tests
22,723
a
3 ,000
23,678 3 ,000
13,718 1 ,000
400
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases
Value df
Asymp. Sig.
(2-sided)
0 cells (,0%) have expected count less than 5. The
minimum expected count is 35,67.
a.
Naredna tabela predstavlja izlaz statistikog paketa SPSS. Konkretno,
predstavljen je rezultat analize uz pomo hi-kvadrat testa. Nulta hipoteza
glasi Promenljive pol i cena su nezavisne promenljive (primer:
istraivanje stavova gostiju odreenog restorana). Ovakve i sline tabele
koje su izlazi statistikog paketa SPSS e se koristiti na
ispitu/kolokvijumu.
17
Naredna tabela je formirana na osnovu istog primera kao i prethodna. Prikazane su
realizovane frekvencije i oekivane frekvencije u prva dva reda. Naredna tri reda
predstavljaju procentualno uee razliitih kategorija promenljivih u razliitim
totalima. Dajte interpretaciju navedenih vrednosti u tabeli.
X26 -- Cena * X32 -- Pol Crosstabulation
98 31 129
76,1 52,9 129,0
76,0% 24,0% 100,0%
41,5% 18,9% 32,3%
24,5% 7,8% 32,3%
47 47 94
55,5 38,5 94,0
50,0% 50,0% 100,0%
19,9% 28,7% 23,5%
11,8% 11,8% 23,5%
46 44 90
53,1 36,9 90,0
51,1% 48,9% 100,0%
19,5% 26,8% 22,5%
11,5% 11,0% 22,5%
45 42 87
51,3 35,7 87,0
51,7% 48,3% 100,0%
19,1% 25,6% 21,8%
11,3% 10,5% 21,8%
236 164 400
236,0 164,0 400,0
59,0% 41,0% 100,0%
100,0% 100,0% 100,0%
59,0% 41,0% 100,0%
Count
Expected Count
% within X26 -- Cena
% within X32 -- Pol
% of Total
Count
Expected Count
% within X26 -- Cena
% within X32 -- Pol
% of Total
Count
Expected Count
% within X26 -- Cena
% within X32 -- Pol
% of Total
Count
Expected Count
% within X26 -- Cena
% within X32 -- Pol
% of Total
Count
Expected Count
% within X26 -- Cena
% within X32 -- Pol
% of Total
Most Important
2
3
Least Important
X26 --
Cena
Total
muki enski
X32 -- Pol
Total
18
Primeri za vebanje
Miljenje ispitanika o kvalitetu amerikih kola je
ispitivano u 2005. Godini. Dobijeni su sledei
rezultati:
41% ispitanika je reklo da,
48% je reklo ne,
a 11% je reklo ne znam.
elimo da ispitamo da li su ovi procenti jo uvek tani.
Pretpostavimo da smo uzeli sluajan uzorak od 1.000
odraslih osoba i da smo utvrdili da njih 536 misli da je
bolji kvalitet amerikih automobila od japanskih, 362
je reklo da su loija, a 102 ostalo je uzdrano.
19
Banka je imala bankomat ATM instaliran sa unutranje
strane banke i on je bio dostupan korisnicima samo od 7 sati pre
podne do 6 po podne, od ponedeljka do petka. Menader banke
eli da ispita da li je procenat transakcija korienjem ATM isti
tokom svih pet dana (od ponedeljka do petka) u nedelji. On je
sluajno izabrao jednu nedelju i prebrojao broj transakcija
ostvarenih korienjem ATM, za svaki od pet dana tokom te
nedelje. Dobijene informacije
prikazane su u tabeli koja sledi, gde broj korisnika predstavlja broj
transakcija na ATM, po posmatranim danima. Zbog lakeg rada,
oznaiemo ove transakcije kao ispitanici ili korisnici.
Dan Ponedeljak Utorak Sreda etvrtak Petak
Broj korisnika 253 197 204 279 267
Na nivou znaajnosti od 1%, da li moemo da odbacimo nultu
hipotezu da je proporcija ispitanika koji koriste ATM ista tokom svih
pet dana u nedelji? Pretpostavimo da je ova nedelja tipina za sve
nedelje u kojima se posmatra korienje ovog ATM.
20
umarska sluba je poredila sluajeve umskih poara u dva regiona, A i B.
Sledea tabela prikazuje razloge izbijanja poara u 76 sluajno izabranih
registrovanih poara, koji su se desili u ova dva regiona.
Namerno paljenje poara Sluajno paljenje poara Rasveta Nepoznato
Region A 6 9 6 10
Region B 7 14 15 9
Testirajte na nivou znaajnosti od 5%, da li postoji povezanost izmeu razloga
izbijanja poara i regioni u kojima su izbili poari.

You might also like