Professional Documents
Culture Documents
S obzirom na broj elemenata statistički skupovi mogu biti konačni ili beskonačni.
Osnovni skup ili populacija predstavlja skup iz kojega se može izvući podskup ili
uzorak.
a.) POJMOVNO
Pojmovno definirati statistički skup znači odrediti točno koja obilježja moraju imati
elementi da bi bili uvršteni u statistički skup.
b.) PROSTORNO
c.) VREMENSKI
Primjeri za nominalna obilježja su: spol, bračno stanje, sreća, vrsta poduzeća,
religioznost, vrsta glazbe, pušenje, uživanje droge
Kvantitativno (numeričko) obilježje izraženo je brojem koji kao svoj početak ima
nulu te ako odnos bilo koja dva broja ne ovisi o jedinici mjere, te ako je taj odnos
sačuvan kad se brojevi pomnože bilo kojim pozitivnim brojem.
Primjeri diskontinuiranog obilježja su: broj djece, broj kvarova na stroju, broj
studenata u grupi, broj radnika i sl.
Primjeri kontinuiranog obilježja su: visina, težina, starost, tlak, količina padalina,
plaća i sl.
b.) KARTOGRAMI
c.) INDEKSI
Relativni brojevi strukture pokazuju odnos dijela prema cjelini. Mogu se još
izražavati u postocima i promilima.
DIO DIO
P = CJELINA ᵒ 100 ili P = CJELINA ᵒ 1000
Kod grafičkog prikazivanja baza stupca je uvijek ista jer je zbroj svih relativnih
frekvencija uvijek isti. Ukoliko se relativni brojevi strukture prikazuju strukturnim
krugovima ili polukrugovima, tada je površina kruga ili polukruga također ista.
Relativni brojevi koordinacije pokazuju odnos dviju pojava ili odgovarajućih
frekvencija u različitim statističkim nizovima koji mogu biti potpuno nezavisni
jedan od drugoga. Te pojave ili frekvencije mogu imati istu ili različitu jedinicu
mjere.
Ai
Ri = Bi
Indeksi se prikazuju grafički preko stupaca koji imaju istu bazu, budući da se svi
članovi niza uspoređuju uvijek s obzirom na istu veličinu.
To je centralna vrijednost oko koje se gomilaju podaci numeričkog niza zbog čega
se još zove i mjerom centralne tendencije.
1. ARITMETIČKA SREDINA
2. GEOMETRIJSKA SREDINA
3. HARMONIJSKA SREDINA
4. MEDIJAN
5. MOD
N
∑ xi
i =1
X= ; i=1,2,3, .. . , N
N
N N
∑ ( xi− x ) 2
≤∑ ( x i− a )2
i =1 i=1
√∏
N
N
G= Xi
i=1
√∏
k
i=1 f
G= Xi i
i=1
Medijan je ona srednja vrijednost koja statistički niz dijeli na dva jednaka dijela.
Kod negrupiranog niza medijan je vrijednost obilježja koja pripada članu
statističkog niza koji se nalazi u sredini niza. Ukoliko je broj članova niza paran,
onda se uzima aritmetička sredina vrijednosti obilježja dvaju članova koji se nalaze
u sredini statističkog niza.
Medijalni razred je onaj razred u nizu u kojem je sadržana polovina zbroja svih
članova u nizu tj. pripada mu prva frekvencija u kumulativnome nizu koja je veća
od polovine suma svih frekvencija.
Mod je ona vrijednost obilježja koja se najčešće pojavljuje. Mod ima smisla
računati samo kod tzv. „unimodalnih“ distribucija. Kod bimodalne distribucije
(koja ima 2 vrha) postoji glavni mod i lokalni mod. U takvoj situaciji mod je manje
reprezentativan kao srednja vrijednost, naročito ako je uz vrijednost moda vezan
mali broj opservacija.
Kod kontinuiranog numeričkog niza mod se također može odrediti, ali zbog prirode
samog niza njegova interpretacija nije jasna i logična.
4.) INTERKVARTIL
R = X max . - X min .
Npr. ako je maksimalna težina 110 kg, a minimalna težina 50 kg, onda je raspon
varijacije obilježja 60 kg.
U gornjoj formuli Q3 predstavlja gornji kvartil koji distribuciju dijeli u omjeru 3:1,
tj. 75% jedinica u statističkome skupu ima vrijednost jednaku ili manju od gornjega
kvartila, dok 25% jedinica u statističkome skupu ima vrijednost obilježja jednaku
ili veću od gornjega kvartila.
Npr. ako je donji kvartil vijeka trajanja proizvoda 1100 sati, a gornji kvartil 1300
sati, to znači da je raspon varijacije trajanja srednjih 50% jedinica u skupu (po
položaju u nizu) jednaka 200 sati.
Ako je npr. deveti decil jednak 1150 sati onda to znači da 90% jedinica u
statističkome skupu (proizvoda) traje 1150 sati ili manje, a 10% 1150 sati ili više.
A6. Relativne mjere disperzije.
Relativne mjere disperzije su:
σ
V = ⋅(100)
x
Q3 −Q1
V q=
Q3 +Q1
Koeficijent asimetrije
Postoji više različitih mjera asimetrije. Ukoliko želimo asimetričnost izraziti preko
varijanca oko aritmetičke sredine upotrijebit ćemo moment oko aritmetičke sredine.
Budući da je vrijednost prvoga momenta oko aritmetičke sredine uvijek jednaka 0,
to onda moramo upotrijebiti moment višeg reda.
Drugi moment oko aritmetičke sredine uvijek je pozitivan kao i svi ostali parni
momenti. Prvi neparni moment koji se može upotrijebiti je treći. Vrijednost trećega
momenta oko aritmetičke sredine dijelimo s vrijednošću standardne devijacije koja
je prethodno dignuta na treću potenciju da bi se mogao dobiti koeficijent, odnosno
neimenovani broj.
μ3
∑ f i⋅( X i −X )3
α 3= μ3 = i=1 k
σ3 ∑ fi
i =1
N
∑ ( X i −X )3
μ3 = i=1
N
Pearson je uveo još jednu mjeru asimetrije koja se zasniva na razlici srednjih
vrijednosti u distribuciji. Kod desnostrane asimetrije vrijednost moda je manja od
vrijednosti aritmetičke sredine, dok je kod ljevostrane asimetrije vrijednost moda
veća od aritmetičke sredine.
X−M o
S k = ( X −M o ) je približno jednaka
Kod umjereno asimetričnih distribucija
σ
3⋅( X−M ) , pa se onda za Pearsonove mjere asimetrije može upotrijebiti i sljedeći
izraz:
3⋅( X−M )
Sk =
σ
Ova mjera asimetrije kreće se uglavnom između -3 i +3.
Q3 +Q1 −2⋅M
S k q=
Q3 −Q1
Kod desnostrane asimetrije:
( Q3 − M ) ( Q3 + Q1 )
¿ ( M −Q 1 ) ¿ ¿ 2⋅M ¿
Mjera zaobljenosti
k
m4 ∑ f i⋅( xi −x )4
α 4= 4 μ4 = i =1
s k
∑ fi
i =1
Koeficijent zaobljenosti poprima vrijednost 3 za normalnu distribuciju. Ukoliko je
vrh šiljastiji nego kod normalne distribucije, koeficijent zaobljenosti ima vrijednost
veću od 3. Kod tupog oblika distribucije koeficijent zaobljenosti je između 1.8 i 3.
Slučajan događaj je takav događaj koji se može, ali se ne mora realizirati, odnosno
realizira se uz određenu vjerojatnost. Realizacija slučajnog događaja rezultat je
mnogih čimbenika.
m( A )
P( A )=
n
S obzirom na činjenicu da broj povoljnih događaja ne može premašiti broj svih
mogućih ishoda, zaključujemo da je vjerojatnost mjera slučaja koja se kreće
između 0 i 1.
0≤P≤1
n−m( A )
p( Ā )=
n
Stoga je:
P( A )+P( Ā )=1
Vjerojatnost „ a priori“
Kod vjerojatnosti „a priori“ unaprijed je poznat broj povoljnih i broj svih mogućih
ishoda. Primjer je bacanje novčića gdje je vjerojatnost da padne „glava“ jednaka ½
s obzirom da ima dva moguća ishoda koja su jednako vjerojatna (ovo je idealna
situacija kad se radi o tzv. „fer“ novčiću koji ne može pasti na brid).
1
P(G) = 2
Vjerojatnost „a posteriori“
Primjer:
P( A i B )=P( A )¿P( B )
Primjer:
1 1 1
P(Z =2 i C=4 )= ⋅ =
6 6 36
Koliko iznosi vjerojatnost da će od šestero djece u nekoj obitelji svi biti muškoga
spola?
6
P( X=6)=0 .515 =0. 01866
B2. Uvjetna vjerojatnost
Ukoliko je realizacija događaja A uvjetovana prethodnom realizacijom događaja B,
radi se o uvjetnoj ili kondicionalnoj vjerojatnosti događaja A.
P( AB)
P( A / B)= , P(B )>0
P (B )
odnosno:
P( AB)
P(B / A )= , P( A )>0
P( A )
P( A / B)=P ( A )
n
P(B )=∑ P ( A i )¿ P(B / A i )
i=1
n
P( Ak )¿ P(B / A k )
P( A k /B )= n ∑ P( A i )=1
i=1
∑ P( Ai )¿ P( B/ Ai )
i=1
Primjer:
P( A 1 )⋅P ( B / A 1 ) 0 . 97⋅0 . 99
P( A 1 /B )= =
P ( A 1 )⋅P ( B / A 1 )+ P( A 2 )⋅P (B/ A 2 ) 0 . 97⋅0 . 99+0 . 03⋅0 . 04
P( A 1 /B )=0 . 99875
Dakle, ako uzmemo proizvod iz pakovanja za koji kontrola tvrdi da je ispravan
vjerojatnost da je to doista tako iznosi 0.99875, dakle, veoma je visoka. Ukoliko bi
takva vjerojatnost bila manja negoli što mislimo da je dozvoljeno prema kontroli
kvalitete, onda moramo poboljšati sam način kontrole.
Diskontinuirana slučajna varijabla X može poprimiti vrijednosti x1, x2, x3, ... , xk,
dok diskontinuirana slučajna varijabla Y može istovremeno poprimiti vrijednosti y1,
y2, y3, ... , ym .
P( X= X i , Y =Y j )= p( X i , Y j )
Budući da se radi o distribuciji vjerojatnosti, moraju biti zadovoljeni sljedeći uvjeti:
K J
∑ ∑ p ( X i , Y j )=1 P( x i y j )≥0
i=1 j=1
Izraz koji vrijedi pod uvjetom da red na desnoj strani konvergira apsolutno ( to
drugim riječima znači da očekivanje i ne mora imati konačnu vrijednost, ali se
takovim distribucijama vjerojatnosti koje nemaju konačna očekivanja nećemo
baviti).
Aritmetička sredina u empirijskim distribucijama ima istu interpretaciju kao i
očekivanje kod teorijskih distribucija.
2
V ( X )=E( X −μ )
2 2
V ( X )=E( X )−( E( x ))
∞ ∞
V ( X )=∑ x 2i ¿ p( x i )−( ∑ xi ¿ p(x i ))2
i=1 i=1
3.)JEDNOLIKA DISTRIBUCIJA
Binomna distribucija
Ako je vjerojatnost da nastupi neki slučajni događaj poznata i uvijek ista tijekom
izvođenja pokusa može se izračunati vjerojatnost da se slučajna varijabla X
realizira x puta u n pokušaja. U tom slučaju kažemo da se diskontinuirana varijabla
X ravna prema tzv. Binomnoj distribuciji koja ima vjerojatnost:
n
( ) ¿ p ∗¿ q
P ( X = x )= x x n− x
x= 0,1,2,3,. .. , n
¿
n - br. pokusa
E( x )=n⋅p
Varijanca, koeficijent asimetrije i koeficijent zaobljenosti binomne distribucije
dobivaju se po formulama:
2 q−p 1−6⋅p⋅q
σ =n⋅p ¿ q α 3=
√ n⋅p⋅q
α 4 =3+
n⋅p⋅q
Poissonova distribucija
x −np
(np ) ⋅e
P( X= x )= x=0,1,2,3, .. .
x!
x −μ
μ ¿e
p( X =x )= x=0,1,2,3,. ..
x!
Hipergeometrijska distribucija
Osnovni skup se sastoji iz dva dijela: skup elemenata koji imaju neko obilježje A i
skup elemenata koji to obilježje nemaju . u uzorku se bira određeni broj elemenata
osnovnoga skupa. Slučajna varijabla je broj jedinica u uzorku koje imaju određeno
obilježje A. Ukoliko se jedinice osnovnoga skupa , koje su jednom uzete u uzorku
ne vraćaju ponovno u osnovni skup radi se o tzv. hipergeometrijskoj distribuciji.
M N −M
p( X =x )=
( ) ¿(
x n−x )
, x=0,1,2,. .. , n
N
(n )
N−n
E( X )=n ¿ M
N
V ( X )=n ¿
M
N
¿ N−N M ¿
N −1
Jednolika distribucija
1
P( X= xi )= , ∀ xi ∈R x
n
Najbolji primjer je bacanje kocke gdje su vjerojatnosti da kocka padne na isti broj
1,2,3,4,5,6 iste i iznose 1/6.
1.) f(x) ≥ 0 , ∀ x
x
dF (x )
F( x)= ∫ f (x )dx =f ( x)
−∞ dx
F(x) predstavlja vjerojatnost da slučajna varijabla X ne premaši neku unaprijed
zadanu vrijednost x. U empirijskoj statistici ta funkcija predstavlja kumulativni niz
„manje od“.
+∞
E( x)= ∫ x⋅f ( x)dx=μ , ako integral konvergira
−∞
Varijanca kontinuirane slučajne varijable X jednaka je:
+∞ +∞
2 2 2
V ( x)= ∫ ( x−μ) ⋅f ( x)dx= ∫ x ⋅f ( x)dx−μ
−∞ −∞
4.) F-DISTRIBUCIJA
Normalna distribucija
1 x −μ 2
1 − ( )
f (x )= e 2 σ x∈¿−∞ ,+∞>¿
σ √2 π ¿
2
Parametri normalne distribucije su njeno očekivanje μ i varijanca σ .
1
x−μ 1 − 2⋅z
2
Z= f (z )= e
σ dobivamo √2 π
0 z
x 2 −μ x1 −μ
P( x 1 < X ≤x2 )=P ( )−P( )
σ σ
Studentova distribucija
√
2
χ
slobode v
n
1 2
1 −2 t
lim f ( t )= ⋅e
k →∞ √2 π
Hi-kvadrat distribucija
i=1
( )σ
y =2
=3
=4
=5
=6
=1
0 1 x
r 2
( f i−f ti )
Varijabla χ 2 =∑ pripada hi-kvadrat distribuciji s brojem stupnjeva
i =1 f ti
slobode koji je jednak: v= r - broj nepoznatih parametara u pretpostavljenoj
distribuciji -1
F-distribucija
F-distribucija je određena s dva parametra v1 i v2 koji predstavljaju stupnjeve
slobode. Ako su χ 21 i χ 22 nezavisne x2 razdiobe sa stupnjevima slobode v1 i v2
tada varijabla :
x
k1
F= Pripada F-distribuciji sa stupnjevima slobode v1 i v2
y
k2
¿ ¿
E( X )=∑ Pi X i
^
E( Θ)=Θ
onda kažemo da je procjena nepristrana, a ako vrijedi:
^
E( Θ)≠Θ onda kažemo da je procjena pristrana
−^ ¿ )= σ
√n
Se ( X , odnosno
¿
−^ ¿ )= σ ⋅ N −n
√n √ N −1
Se ( X za konačne skupove , u praksi ako je f ¿ 0.05
¿
n'
n=
n'
1+
N
Koeficijent „z“ dobije se iz tablice površina ispod normalne krivulje kada veličina
uzorka premaši 30 jedinica. Nivo pouzdanosti procjene je jednaka 1- α . Ukoliko
je n ≤ 30 jedinica, upotrebljava se „t“ iz Studentove distribucije umjesto
koeficijenta „z“.
¿ ¿
2
X =59. 4375 m σ =31 . 98 m 2
Pr { 59.4375−2.33⋅2.2672<X <59.4375+2.33⋅2.2672 }=0.98
Pr { 54.1688< X <64.7062 }=0.98
Gornji rezultati čitaju se ovako: uz vjerojatnost od 98% procjenjujemo sa se
prosječna površina svih stanova kreće između 54.17 i 64.71 m2 .
{ }
¿ N ¿
Pr N⋅X − z⋅N⋅Se ( x )< ∑ x i < N⋅X + z⋅N⋅Se( x ) =1−α
i =1
Se ( ∑ xi ) = N ⃘ Se ( X )
∑ x i=N ⃘⃘
i=1
n
s 2 =σ⋅
^ s2 predstavlja nepristranu procjenu varijance osnovnoga skupa
n−1
{
n⋅s 2 2 n⋅s 2
Pr 2 < σ < 2
χα /2 χ 1−α /2 }
=1−α
1 2
x2 α = −z α + √ 2⃘⃘ v−1
1−
2
2 (2 )
Intervalna procjena standardne devijacije dobiva se tako da se izračuna pozitivni
korijen iz donje i gornje granice intervalne procjene varijance osnovnoga skupa.
n' = [ z⃘ ⃘⃘ √ P ⃘⃘ Q
graška ] P ⃘ Q – varijanca osnovnoga skupa
n' =
[ z⃘ ⃘⃘
√P
0
rel . graška ]
Ukoliko je frakcija izbora veća od 0.05 , onda se pristupa korekciji kao i pri
procjeni aritmetičke sredine osnovnoga skupa.
¿ ¿
{
Pr p −z⋅Se( p)<P< p +z⋅Se( p) =1−α }
Procjena proporcije na osnovu uzorka je nepristrana.
√
¿ ¿
p⋅q
Se ( p)=
n
ako je n ¿ 30, odnosno:
√
¿ ¿
p⋅q ≤
Se ( p)=
n−1 ako je n 30 jedinica
√ N −n
N −1
H 0 :........ X =X 0
H 1 :........ X≠ X 0
Interval prihvaćanja hipoteze H0 (nulte hipoteze) glasi:
X 0 ±z⋅Se( x )
H 0 : . .. .. . .. . X≥ X 0
X0
¿
¿
H 1 : . .. .. .. . . X ¿
¿
DG=X 0 −z⋅Se( x )
Izuzetno, ukoliko smo sigurni iz određenih razloga da aritmetička sredina
osnovnoga skupa ne može poprimiti vrijednost veću od X 0 , tada se nulta
hipoteza u jednosmjernome testiranju također može postaviti kao i kod
dvosmjernog testiranja:
H 0 :........ X=X 0
X 0
¿
H 1 : .. . .. .. . . X ¿
¿
Ako aritmetička sredina uzorka ima vrijednost manju od donje granice prihvaćanja
nulte hipoteze, prihvaća se alternativna hipoteza da je aritmetička sredina manja od
neke pretpostavljene vrijednosti.
I ovdje se testiranje može izvršiti z-testom ili t-testom, kao i kod dvosmjernog
testiranja. Zaključak se izvodi na ovaj način:
H 0 :........ X ≤X 0
H 1 :.........X > X 0
Hipotezom H0 tvrdi se da vrijednost aritmetičke sredine osnovnoga skupa ne
premašuje pretpostavljenu vrijednost X 0 . Alternativnom hipotezom tvrdi se da je
aritmetička sredina osnovnoga skupa veća od pretpostavljene vrijednosti.
GG=X 0 + z⋅Se ( x )
Ukoliko aritmetička sredina uzorka premaši gornju granicu prihvaćanja nulte
hipoteze prihvaća se alternativna hipoteza, tj. hipoteza da je aritmetička sredina
osnovnoga skupa veća od neke pretpostavljene vrijednosti.
Testiranje pomoću „z“ testa:
Ovdje se također primjenjuje vrijednost „t“ umjesto „z“ ukoliko veličina uzorka ne
premaši 30 jedinica.
Kao i kod testiranja na donju granicu, može se izuzetno nulta hipoteza postaviti da
je aritmetička sredina jednaka nekoj pretpostavljenoj vrijednosti nasuprot hipotezi
da je aritmetička sredina veća od neke pretpostavljene vrijednosti ,ali samo ako
smo sigurni da vrijednost aritmetičke sredine ne može biti manja od pretpostavljene
vrijednosti.
Snaga testa = 1- β
U praktičnim primjenama ograničava se na 80%.
Dakle, snaga testa je veća što je greška tipa II manja. Prema tomu, može se
zaključiti
Odluka u svezi Stvarno stanje nul- da
nul-hipoteze hipoteze
Istinita lažna
Odbacujemo Greška Ispravan
nul-hipotezu tipa I () zaključak
Prihvaćamo Ispravan Greška tipa
nul-hipotezu zaključak II ()
jednosmjerni testovi imaju veću snagu od dvosmjernih testova, pa ih je pod
određenim uvjetima bolje primjenjivati.
H 0 :......... X 1− X 2 =0
H 1 :.........X 1− X 2≠0
0 ± z ⃘ Se ( x 1−x 2 )
Se( x 1−x 2 ) = σ
√ 1 1
+
n 1 n2
Se ( x́ 1−x́ 2 ) =
√( n1 σ^ 21 +n2 σ^ 22
n1 +n 2−2 )( )
n1 +n 2
n1 n2
Se ( x 1−x 2 )=
s21 s22
+
n1 n2 √
Treba naći apsolutnu vrijednost razlike aritmetičkih sredina uzorka. Ukoliko ta
razlika premaši interval prihvaćanja nulte hipoteze, tada prihvaćamo alternativnu
hipotezu kao istinitu, tj. zaključujemo da se aritmetičke sredine dvaju osnovnih
skupova značajno razlikuju.
Vrijednost „t“ se upotrebljava umjesto „z“ ukoliko zbroj veličina dvaju uzorka ne
prelazi 32. Naime stupnjevi slobode se određuju kod ovog testiranja na sljedeći
način:
df = n1 + n2 – 2
Snaga testa je veća što je greška tipa II manja. Prema tomu, može se zaključiti da
jednosmjerni testovi imaju veću snagu od dvosmjernih testova, pa ih je pod
određenim uvjetima bolje primjenjivati.
H 0 :......... X 1≥ X 2
H 1 :.........X 1 <X 2
Jednosmjerni test može se postaviti kao test na donju kao test na gornju granicu.
Npr. ako kod dvosmjernog testa dobijemo signifikantnost od 8%, to znači da nema
signifikantne razlike u aritmetičkim sredinama dviju nezavisnih populacija, a ako
test postavimo jednosmjerno signifikantnost iznosi 4% što nje statistički
signifikantnost.
H 0 :...........P=P0 H 0 :...........P≤P0
H 1 :...........P≠P0 H 1 :...........P>P0
P0 ±z⋅Se ( p)
Standardna greška računa se ovako:
Se ( p ) =
√ P0 Q 0
n
ako je n ¿ 30 jedinica, odnosno:
Se ( p ) =
√ P0 Q 0
n−1
ako je n ≤ 30 jedinica
Ako je uzorak mali inda se umjesto „z“ upotrebljava vrijednost „t“ iz Studentove
distribucije s n – 1 stupnjeva slobode.
Testiranje se može izvesti i „z“ testom na isti način kao mi kod testiranja hipoteze o
nepoznatoj vrijednosti aritmetičke sredine osnovnoga skupa.
H 0 :.......... P1=P2
H 1 :.......... P1≠P 2
Interval prihvaćanja nulte hipoteze glasi:
0±z⋅Se ( p 1− p 2 )
Umjesto „z“ upotrijebit ćemo „t“ iz Studentove distribucije ako je broj stupnjeva
slobode jednak 30 ili manje. Broj stupnjeva slobode u ovom testiranju se određuje
na sljedeći način:
df = n1 + n2 – 2
√ 1 1 m1 +m 2
¿ ¿ ¿
Se( p1 −p 2 )= p⋅(1− p )⋅( + ) p=
n1 n2 n1 +n2
¿
p = prosječna proporcija (relativna frekvencija) za oba uzorka zajedno
¿ ¿
p⋅(1−p ) = procjena zajedničke varijance na osnovu uzorka
Sada treba usporediti apsolutnu vrijednost razlike proporcije između dvaju uzoraka
|^p1− ^p2| s granicama intervala prihvaćanja.
Ukoliko se razlika proporcija uzorka nalazi u granicama intervala prihvaćanja nulte
hipoteze prihvaćamo nultu hipotezu kao istinitu. Ukoliko se ta razlika nalazi izvan
granica intervala prihvaćanja prihvaćamo alternativnu hipotezu, tj. zaključujemo da
se proporcije dvaju osnovnih skupova razlikuju, naravno uz rizik da smo pogrešno
odbacili nultu hipotezu koji je jednak razini signifikantnosti testa α .
df = n – 1
k
∑ mi
¯^p= i=1 260
k
= =0 .25
1040
∑ ni
i=1
kvalitete ei
A 200 40 50 2.000
B 180 34 45 2.689
C 300 110 75 16.333
D 200 50 50 0.000
E 160 26 40 4.900
� 1040 260 260 25.922
¿2
df = 5-1 = 4 χ =25. 922 χ 20 .01 ( 4 )=13 .28
k 2
( f i −f ti )
χ =∑
¿2
i=1 f ti
fi – originalne frekvencije (iz distribucije uzorka)
f ti – teorijske frekvencije koje se izračunavaju pod pretpostavkom da distribucija
ima oblik neke teorijske distribucije.
- za jednoliku distribuciju df = k – 1
- za binomnu distribuciju df = k – 2
- za Poissonovu distribuciju df = k – 2
- za normalnu distribuciju df = k – 3
H 0 : . .. .. . .. Pij= P i⋅¿⋅P ∀ ∀
¿ j i j
¿ H 1 : .. . .. .. .∃ P ij ≠ Pi⋅¿⋅P
¿ j
¿
Test-veličina je sljedeća:
r c 2
(mij−e ij )
χ =∑ ∑
¿2
mij – originalne e ij (empirijske)
frekvencije
i=1 j=1
mi.⋅m . j
e ij=
n
mi . - marginalna frekvencija i-tog retka
m. j – marginalna frekvencija j-tog stupca
n – veličina uzorka
C= 2
√
χ2
χ +n
Najmanja vrijednost koeficijenta kontingence iznosi nula.
Ovdje također vrijedi pravilo da očekivane frekvencije ne smiju biti po volji male.
Uobičajeno je kod tabela kontingence, ako postoje više od dvije ćelije da ne smije
biti više od 20% očekivanih frekvencija koje su manje od 5.