You are on page 1of 24

PARAMETRK OLMAYAN

YNTEMLER

Tek rneklem Kolmogorov-Smirnov testi
ki rneklem Kolmogorov-Smirnov testi
Yard. Do. Dr. Cengiz BAL


Ocak 2011
KOLMOGOROV-SMIRNOV (KS) TEST
Bir frekans dalmnn, belirli ya da herhangi bir dalma
uygunluk gsterip gstermediini test etmek iin kullanlan bir
nonparametrik testtir.
Kikare Uygunluk testinin bir alternatifidir.
Bilindii gibi, _
2
uygunluk testinde, gzlerdeki teorik
frekanslarn 5den byk olmas beklenir. Ya da en iyimser
yaklamla toplam snf saysnn %20sine (k*0.20) kadar,
5den kk frekans bulunmas koulu getirilmektedir.
_2 uygunluk testinde, eer 5den kk frekans ieren snf
says ok ise, birletirmelere gidilmesi gerekmektedir. Bu
durumda birletirme bilgi kaybna yol amaktadr.
Bu sakncay ortadan kaldrmak, zellikle az sayda
birimlerin X frekans dalmlarnda bilgi kaybn nlemek iin,
kikare uygunluk testinin uygulanamad ya da uygulanmak
istenmedii durumlarda KS testi kullanlr.
KOLMOGOROV-SMIRNOV (KS) TEST
KS testi,
KS tek rneklem ve
KS iki rneklem testi olarak uygulanr.

Tek rneklem KS testi, n
1
hacimli bir rnein ylml
frekans dalmnn (S
n1
(X)), teorik belirli bir ya da herhangi
bir teorik ylml olaslk dalmna (F
0
(X)) uygunluunu
test etmek iin kullanlr.
ki rnek KS testi ise, n
1
ve n
2
hacimli iki rnekten elde
edilen ylml frekans dalmlarnn (S
n1
(X) ve S
n2
(X))
ayn teorik ylml olaslk dalmdan alnm iki rneklem
dalm olup olmadklarn test eder.
KS Tek rneklem Testi
KS tek rneklem testi, n hacimli rnein ylml frekans dalm
ile, belirli ya da herhangi bir F
0
(X) ylml olaslk dalmnn
uygunluunu test eder. Bunun iin rnein frekans dalm ve ylml
gresel frekans dalm elde edilir.
F
0
(X) k snfl, belirli ya da herhangi bir ylml dalmdr.

Tek rnek KS Testi uygulamak iin;
1. Hipotez kurulur.
H
0
: Uygunluk vardr.
H
1
: Uygunluk yoktur.
2. Veriler frekans dalm durumuna getirilir. Bu frekans dalmnn
ylml olaslk dalm oluturulur (S
n1
(X)).
3. H
0
varsaym altnda rnein alnd varsaylan herhangi bir teorik
dalmn F
0
(X) ylml olaslk dalm belirlenir.
4. Teorik ve Gzlenen ylml olaslk dalmlarnn, her snf
olaslklar arasndaki mutlak farklar belirlenir. Bu farklardan en byk
farklln, rasgelelik koullarndan ayrlp ayrlmad test edilir.
5- D
max
=maksimum | F
0
(X) - S
n
(X) |

6- D
max
deerlerinin nemlilii, o=0.05, 0.01 ve 0.001
iin hesaplanan D
(o)
kritik deerleri ile
karlatrlarak belirlenir. Bu kritik deerler;
eklinde hesaplanr.


D
max
= 0.05 iin D
(0.05)
= 1.36 /

D
max
= 0.01 iin D
(0.01)
= 1.63 /

D
max
= 0.001 iin D
(0.001)
= 1.95 /
n
n
n
7- Karar verilir.

D
max
< D
(o)
P > o H
0
Kabul
D
max
>

D
(o)
P o

H
0
Red edilir.

rnek- Kzama yakalanm 24 bireyin hastanede kalma gnleri
frekans dalm aadaki tabloda verilmitir. Kzamkl bireylerin
hastanede kalma gnlerine gre dalmlar tekdze (uniform)
dalma uymakta mdr? Test ediniz.

Tablo- 24 Kzamkl hastann hastanede kalma gn saylar
Gn Hasta Says
2 1
3 3
4 4
5 2
6 5
7 3
8 2
9 2
10 1
11 1
Tablo- 24 Kzamkl hastann hastanede kalma gn saylar
Gn f F S
n
(X)
2 1 1 1/24=0.042
3 3 4 4/24=0.167
4 4 8 8/24=0.333
5 2 10 10/24=0.417
6 5 15 15/24=0.625
7 3 18 18/24=0.750
8 2 20 20/24=0.833
9 2 22 22/24=0.917
10 1 23 23/24=0.958
11 1 24 24/24=1.000
S
24
(X): ylml frekans dalmnn (F) n birim saysna
blnmesi ile elde edilmi ylml olaslk frekans dalmdr.
( )
min max
min i
i
X X
X X
X F

=
0
F
0
(X), H
0
varsaymna gre 24 birimlik frekans dalmnn tek dze
dalmdan alnm rasgele bir rnek olabileceini gznne alarak bulunmu
teorik deerlerdir.

H
0
a gre k snfl tekdze ylml olaslk dalm aadaki forml aracl
ile hesaplanr.
Buna gre F
0
(X) deerleri srasyla

F
0
(X
1
) =(2-2) / (11-2)=0
F
0
(X
2
) =(3-2) / (11-2)=0.111
F
0
(X
3
) =(4-2) / (11-2)=0.222
F
0
(X
4
) =(5-2) / (11-2)=0.333
F
0
(X
5
) =(6-2) / (11-2)=0.444
F
0
(X
6
) =(7-2) / (11-2)=0.556
F
0
(X
7
) =(8-2) / (11-2)=0.667
F
0
(X
8
) =(9-2) / (11-2)=0.778
F
0
(X
9
) =(10-2) / (11-2)=0.889
F
0
(X
10
)=(11-2) / (11-2)=1.000
Tablo- 24 Kzamkl hastann hastanede kalma gn saylar
Gn f F S
n
(X) F
0
(X) D
2 1 1 1/24=0.042 0 0.042
3 3 4 4/24=0.167 0.111 0.056
4 4 8 8/24=0.333 0.222 0.111
5 2 10 10/24=0.417 0.333 0.084
6 5 15 15/24=0.625 0.444 0.181
7 3 18 18/24=0.750 0.556 0.194
8 2 20 20/24=0.833 0.667 0.166
9 2 22 22/24=0.917 0.778 0.139
10 1 23 23/24=0.958 0.889 0.069
11 1 24 24/24=1.000 1.000 0.000
S
24
(X), ylml frekans dalmnn n birim saysna blnmesi ile elde
edilmi ylml olaslk frekans dalmdr.
F
0
(X), H
0
varsaymna gre 24 birimlik frekans dalmnn tek dze
dalmdan alnm rasgele bir rnek olabileceini gznne alarak bulunmu
teorik deerlerdir.
Farklarn en by D
max
=0.194tr. Bu farkn uygunluu
bozacak byklkte olup olmad D
(o)
kritik deerlerine gre
deerlendirilir.

Kritik deerler rnek hacmine gre;
eklinde hesaplanr.
277 . 0 24 / 36 . 1 D
) 05 . 0 (
= =
333 . 0 24 / 63 . 1 D
) 01 . 0 (
= =
398 . 0 24 / 95 . 1 D
) 001 . 0 (
= =
D
max
<D
(0.05)
olduundan olaslk P>0.05
ns.
olarak belirlenir.
D
max
=0.194 P>0.05, Kzamkl hastalarn hastanede kalma
gnleri Uniform dalm gsterir. Gnlere gre hastanede kalma
saylar homojendir. Sonucu elde edilir
SPSSde KS Tek rneklem Testi
SPSS Veri sayfasna Tablo verileri gun ve f
(frekans) olarak girilir. Frekans stunu
arlklandrlr ya da tablo tek gzlemlere
evrilerek tek bir stuna gzlem deerleri olarak
girilebilir.
Analyze>Nonparametric Tests>1-sample KS
seenei tklanr. Test variable list alanna gun
stunu tanr. Test Distribution alanndan istenilen
dalm (Uniform, Normal, Poisson, Exponential )
seilir.
OK tklanr.
Frekans tablosunun SPSS veri sayfasna girilii
D
max
=0.194; P=0.32; P>0.05,

Kzamkl hastalarn hastanede kalma gnleri Uniform dalm
gstermektedir. Gnlere gre hastanede kalma saylar homojendir.

Sonucu elde edilir.
KS ki rneklem Testi
ki rneklem KS Testi ile, n
1
ve n
2
hacimli iki rnein
ylml olaslk dalmlar S
n1
(X) ve S
n2
(X)in benzerlii test edilir.
Bu rneklem dalmlarnn, Benzer ylml fonksiyonlar F
n1
(X)
ve F
n2
(X) olan iki toplumdan alnan rasgele rneklem dalmlar
olup olmadklar test edilir. Dier yandan KS iki rneklem testi ile,
iki rnein, F
0
(x) dalmna sahip toplumun rasgele iki rnei
olup olmad da test edilir.

ki rnek KS testi uygulamak iin aadaki aamalar izlenir.
1.Hipotezler kurulur. H
0
: F
n1
(X) = F
n2
(X) H
1
: F
n1
(X) =
F
n2
(X)
2.Veriler benzer snf balang deerleri ve aralklar ierecek
ekilde frekans dalmna dntrlr.
3.Her frekans dalmnn belirli ya da herhangi bir olaslk
fonksiyonuna gre S
n1
(X) ve S
n2
(X) ylml olaslk dalmlar
belirlenir.
4.Snflara gre olaslklar arasndaki mutlak farklar bulunur. D
farklar arasnda en byk fark belirlenir (D
max
).
5- D
max
n gzlenme olasl ve nemlilii belirlenir.
N=n
1
=n
2
alnarak n
1
<40 ve n
2
<40 olduunda hazr
tablolardan yararlanlr. K>6 ve n
1
+n
2
>20 olduu
durumlarda ise D(o) kritik deerleri aadaki gibi
hesaplanr.
D(o) = 0.05 iin D
(0.05)
= 1.36 *

D(o) = 0.01 iin D
(0.01)
= 1.63 *

D(o) = 0.001 iin D
(0.001)
= 1.95 *
) * /( ) (
2 1 2 1
n n n n +
6- Test kalb hazrlanr ve karar verilir.
D
max
< D
(o)
P > o

nemli fark yoktur.
D
max
>

D
(o)
P o

nemli fark vardr.

) * /( ) (
2 1 2 1
n n n n +
) * /( ) (
2 1 2 1
n n n n +
rnek- Psikiyatri polikliniinde yatan ve rasgele seilen 15 bayan
ve 15 erkek hasta alnm, bu hastalara 12 soru ieren bir test
uygulanmtr. Test sonunda sorularda yaplan hatalar gelitirilen
kompozit bir lekle belirlenmitir. Veriler Tablodaki gibidir.

Tablo- Bayan (f
1
) ve Erkek (f
2
) hastalarn test hata puanlar dalmlar
Tekdze dalm gsterdii varsaylan Erkek ve Bayan hastalarn
hata puanlar dalmlar arasnda fark var mdr?
ZM:

Tablo- Bayan ve Erkek hastalarn test hata puanlar dalmlar
Hata
puan
f
1


F
1


f
2


F
2


S
n1
(X)

S
n2
(X)

D
max
=|S
n1
(X)- S
n2
(X)|

10-14

0

0

1

1

0/15

1/15

0.067

15-19

0

0

2

3

0/15

3/15

0.20

20-24

2

2

2

5

2/15

5/15

0.20

25-29

2

4

4

9

4/15

9/15

0.33

30-34

3

7

5

14

7/15

14/15

0.467*

35-39

2

9

1

15

9/15

15/15

0.4

40-44

4

130

15

13/15

15/15

0.13

45-49

2

15

0

15

15/15

15/15 0.0

Farklarn en by D
max
=0.467 olarak belirlenir.
Bu farkn, uygunluu bozacak byklkte olup
olmad D
(o)
kritik deerlerine gre deerlendirilir.
Kritik deerler rnek hacimlerine gre aadaki gibi
hesaplanr.
D
max
<D
(0.05)
olduundan D
max
=0.467

P>0.05
ns
.
Bayan ve erkek hastalarn testte yaptklar hata
puanlarnn dalm farkszdr.

497 . 0 ) 15 15 /( ) 15 15 ( 36 . 1 D
) 05 . 0 (
= - + - =
595 . 0 ) 15 15 /( ) 15 15 ( 63 . 1 D
) 01 . 0 (
= - + - =
712 . 0 ) 15 15 /( ) 15 15 ( 95 . 1 D
) 001 . 0 (
= - + - =
SPSSde KS ki rneklem
Testi
SPSS Veri sayfasna gzlemler rneklere gre alt alta ardk
olarak girilir. Her gzlemin hangi gruba ait olduu grup
kodlar olarak baka bir deikene yazlr.
Analyze>Nonparametric Tests>2-Independent samples
seenei tklanr. Test variable list alanna Hata_puan stunu
grouping variable alanna grup deikeni tanr. Grup kodlar
belirlenir.
Test Type alannda Kolmogorov-Smirnov Z iaretlenir. OK
tklanr. Sonular kt penceresinde izlenir.
SPSSde KS ki rneklem
Testine ait iki farkl veri girii
Hata Puan (X1) Grup(X2)
20 1
20 1
25 1
25 1
30 1
30 1
30 1
35 1
35 1
40 1
40 1
40 1
40 1
45 1
45 1
10 2
15 2
15 2
20 2
20 2
25 2
25 2
25 2
25 2
30 2
30 2
30 2
30 2
30 2
35 2
Hata Puan Grup Frekans
10 1 0
15 1 0
20 1 2
25 1 2
30 1 3
35 1 2
40 1 4
45 1 2
10 2 1
15 2 2
20 2 2
25 2 4
30 2 5
35 2 1
40 2 0
45 2 0
NPar Tests


Two-Sample Kolmogorov-Smirnov Test


Frequencies
15
15
30
grup
1.00
2.00
Total
hata_puani
N
Test Statistics
a
.467
.000
-.467
1.278
.076
Absol ute
Posi ti ve
Negati ve
Most Extreme
Di fferences
Kol mogorov-Smi rnov Z
Asymp. Si g. (2-tail ed)
hata_puani
Groupi ng Vari abl e: grup
a.
Dmax=0.467; P=0.076; P>0.05
ns
.

Bayan ve erkek hastalarn testte yaptklar hata puanlarnn
dalm birbirinden farkszdr.