You are on page 1of 18

KISA TEORİK BİLGİLER 185

Örnek: Standart 1 kg’lık dolumlar yapan bir paketleme makinesinin bo-


zuk çalıştığı iddia edilmektedir. İddiayı test için, makine ile birbiri peşi sıra 11
paket hazırlanmış ve bu paketler doğruluğu tescil edilmiş bir terazide yeniden
tartıldığında aşağıdaki ölçüm değerleri elde edilmiştir.
1.03 1.07 1.04 1.05 1.01 0.99 1.05 1.07 0.97 0.97 1.08
Bu verilere göre %5 önem seviyesinde paketleme makinesinin doğru tar-
tım yapmadığını söyleyebilir misiniz?
Ölçüm değerlerinden 1 değeri çıkarıldığında bulunacak farkların işaretleri
aşağıdaki gibi olacaktır.
+ + + + + − + + − − +
Eğer makine doğru tartım yapıyorsa ölçüm değerlerinin 1 kg etrafında te-
sadüfi dağılım göstermesi beklenir. Bu durumda kurulabilecek hipotez çifti aşa-
ğıdaki gibi olur.
H0: Eksik ve fazla tartımlar tesadüfidir.
H1: Eksik ve fazla tartımlar tesadüfi değildir.
Seride 5 dizi olduğu için r = 5’tir. Artı işaretli değer sayısı, n1 = 8, eksi
işaretli değer sayısı, n2 = 3’tür. n1 ve n2 değerlerine göre Tablo 13, alt kritik de-
ğerin 2 olduğunu göstermektedir. Test istatistiği kritik değerden büyük olduğu
için %5 önem seviyesinde sıfır hipotezi kabul edilir. Eksik ve fazla tartı yapma
tesadüfi bir prosesin sonucudur ve “Makine doğru çalışıyor.” diyebiliriz.

D) EŞLENİK VERİLERE UYGULANAN İŞARET TESTİ


İşaret testi, özellikle verilerin sıralama ölçeği ile ölçülmüş olması halinde
faydalıdır. Bu şekilde her bir ölçüm çifti arasında, hangi değerin diğerinden bü-
yük olduğunu belirleyebiliriz. Veriler daha güçlü bir ölçekle ölçülmüş ise, daha
güçlü bir testle test edilebilir.
Tek örnek işaret testi ile iki bağımlı örnek durumunda uygulanan işaret
testindeki mantık birbirine benzediğinden, bağımlı iki örnek durumunda uygula-
nacak test prosedürü daha öncekinin tekrarı gibi olacaktır.
Bu prosedürle test edilecek veriler, tesadüfi olarak seçilen (X1, Y1),
(X2, Y2), ......., (Xn, Yn) gibi n adet ölçüm çiftinden oluşmaktadır. Her bir ölçüm
çifti aynı denekler üzerinde yapılmış ölçümlerdir veya en azından bir ya da daha
fazla değişken itibariyle eşlenmiş olan denekler üzerinde yapılmış ölçümlerdir.
Üzerinde durulan değişken, ölçüm çiftleri arasındaki farklılığı ifade eden
Xi − Yi = Di’dir. Hakkında karar verilecek MD parametresi, ölçüm çiftleri arasın-
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 186

daki farklılıkların meydana getirdiği anakütlenin medyanıdır. n adet ölçüm çifti


birbirinden bağımsızdır. Her bir ölçüm çiftindeki veriler en az sıralama ölçeği ile
ölçülmüş olmalıdır. Bu şekilde, ölçüm çiftlerindeki veriler birbirine eşit olmadığı
sürece hangi verinin daha büyük olduğu bilinebilir. Üzerinde durulan değişken
sürekli bir değişkendir.

Hipotezler
a. (İki yönlü) b. (Sağ kuyruk) c. (Sol kuyruk)
H0: MD = 0 H0: MD ≤ 0 H0: MD ≥ 0
H1: MD ≠ 0 H1: MD > 0 H1: MD < 0

Test İstatistiği
Her bir (Xi, Yi) çifti için, Xi’den Yi’nin çıkarılmasıyla elde edilen farkın
işareti kaydedilir. Xi − Yi > 0 ise artı işareti ve Xi − Yi < 0 ise eksi işareti verilir.
Eğer bağlı değerler müşahede edilirse, yani, herhangi bir çiftte Xi = Yi olursa, bu
gibi çiftler analizden çıkarılır ve buna göre n değeri düşürülür.
a. H0 hipotezi doğru ise, fark değerlerinin yer aldığı örnekte artı işaret ka-
dar eksi işaretin de bulunmasını bekleriz. Çok az sayıda artı veya eksi işaretin
bulunması durumunda H0 hipotezini reddederiz. Böylece bu testteki test istatisti-
ği, artı veya eksi işaretlerden daha az sayıda olanıdır.
b. Çok az sayıda eksi işaretin bulunması durumunda H0 hipotezini redde-
deceğimizden, bu testteki test istatistiği, eksi işaretlerin sayısıdır.
c. Çok az sayıda artı işaretin bulunması durumunda H0 hipotezini redde-
deceğimizden, bu testteki test istatistiği, artı işaretlerin sayısıdır.

Karar
Üç hipotez çifti için geçerli karar modeli aşağıdaki gibidir:
a. P(X ≤ x | n, 0.50) ≤ α/2 ise, α önem seviyesinde a şıkkında tarif edilen
H0 hipotezini reddederiz.
b. P(X ≤ x | n, 0.50) ≤ α ise, α önem seviyesinde b şıkkında tarif edilen H0
hipotezini reddederiz.
c. P(X ≤ x | n, 0.50) ≤ α ise, α önem seviyesinde c şıkkında tarif edilen H0
hipotezini reddederiz.
Örnek: Bir eğitimci üniversite öğrencilerinin başarı düzeyinin lisedeki
başarı düzeylerinin üzerine çıkamadığını iddia etmektedir. İddiayı test için üni-
KISA TEORİK BİLGİLER 187

versiteden yeni mezun olmuş 10 kişi tesadüfi olarak seçildiğinde lise ve üniver-
siteyi bitirme puanları aşağıdaki gibi tespit edilmiştir.

Öğrenci 1 2 3 4 5 6 7 8 9 10
Lise (X) 65.5 55.4 50.3 75.2 80.2 55.3 64.3 74.7 76.4 60.8
Üniversite (Y) 60.1 55.2 60.1 70.2 60.7 60.4 74.4 62.2 75.1 60.0

Bu verilere göre üniversitedeki başarı düzeyinin lisedeki başarı düzeyin-


den farklı olduğunu %1 önem seviyesinde söyleyebilir misiniz?
Problemin son kısmı, test hipotezlerinin,
H0 : MD = 0
H1 : MD ≠ 0
şeklinde olacağını ifade etmektedir. Fark serisindeki işaretler aşağıdaki gibidir.
+ + − + + − − + + +
Az sayıda − işareti olması, test istatistiğinin 3 olduğunu gösterir. Tablo 11,
3 veya daha az sayıda X değeri müşahede etme ihtimalinin,
P(X ≤ 3 | 10, 0.50) = 0.001 + 0.0098 + 0.0439 + 0.1172 = 0.1719
olduğunu göstermektedir. P > 0.01 olduğu için %1 önem seviyesinde H0 hipote-
zini kabul ederek lise ve üniversitedeki başarı düzeyleri arasındaki farkın anlam-
lı olmadığına karar veririz.

E) WILCOXON EŞLENİK-ÇİFT İŞARETLİ-SIRALAR TESTİ


Eşlenik müşahedeleri analiz etmede işaret testinin ihtiyaç duyduğu tek
bilgi, X’lerin Y’lerden büyük mü, küçük mü, yoksa eşit mi olduğudur. Ölçüm
ıskalası ham verilerin daha fazla bilgi vermesini sağlamayacak kadar zayıf ise bu
tip verilerle analiz yaparken işaret testi en iyi test olabilir. Bununla birlikte veri-
ler daha fazla bilgi sağlıyorsa, söz konusu ilave bilgileri işaret testi kullanmaya-
cağı için, Wilcoxon eşlenik-çift işaretli-sıralar testini uygulamak daha güve-nilir
sonuçlar sağlar. Sağlanan bilgilerin bir kısmını kullanmayan testler istatis-tiki
gücünün bir kısmını kaybeder. Sürekli olarak daha fazla bilgi kullanabilen bir
teste ihtiyaç duyarız.
İki bağımlı örnek durumunda, kullanılan ölçüm ıskalası yalnız müşahede
çiftlerindeki farkı değil aynı zamanda bu farkların gösterdiği temayülü de ortaya
koyuyorsa, bu testi daha büyük güvenle uygulayabiliriz. Diğer bir ifadeyle, far-
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 188

kın yönü ile beraber Xi ve Yi müşahede çiftleri arasındaki farkın büyüklüğünü de


hesaplayabildiğimizde, Wilcoxon eşlenik-çift işaretli-sıralar testi işaret testine
göre daha elverişli bir testtir. Farkların temayülünü ortaya koyarken bu farkları
sıraya koyabiliriz. Wilcoxon testinin ilave olarak analize dahil ettiği bilgi, sıraya
konulmuş farklardır.
Analiz edilecek veriler n adet, Xi − Yi = Di farkından oluşur. Her bir öl-
çüm çifti aynı denekler üzerinde veya en azından bir ya da daha fazla değişken
itibariyle eşlenmiş olan denekler üzerinde yapılmış ölçümlerdir. Analizin geçerli
olması için (Xi − Yi) örnek çiftleri, 0 etrafında tesadüfi dağılım göstermelidir.
Üzerinde durulan değişken sürekli bir tesadüfi değişken olmalıdır. Farklar ana-
kütlesinin dağılımı bu farklara ait medyan MD etrafında simetrik olmalıdır. Fark-
lar birbirinden bağımsız olmalıdır. Farklar en az aralık ölçeği ile ölçülmüş olma-
lıdır.

Hipotezler
a. (İki yönlü) b. (Sağ kuyruk) c. (Sol kuyruk)
H0: MD = 0 H0: MD ≤ 0 H0: MD ≥ 0
H1: MD ≠ 0 H1: MD > 0 H1: MD < 0

Test İstatistiği
Test istatistiğinin sayısal değerini elde etmek için izlenecek prosedür aşa-
ğıdaki gibidir:
1. İşaretli farklar elde edilir.
Di = Xi − Yi
2. Mutlak farklar küçükten büyüğe doğru sıralanır.
|Di| = |Xi − Yi|
3. Herbir sıra değerine farkın işareti verilir.
4. T+ ve T− değerleri hesaplanır. pozitif işaretli sıra toplamı T+ ile ve
negatif işaretli sıra toplamıdır T− ile gösterilir.
Alternatif hipoteze bağlı olarak, T+ ve T− değerlerinden birisi test istatisti-
ğidir.
Verilen bir çift için Xi = Yi olduğunda, bağlı değer vuku bulur. Bu bağlı
değerleri yok etmede, Di = Xi − Yi = 0 olan bütün müşahedeler analizden çıkarı-
lır ve n örnek hacmi buna göre azaltılır. İki veya daha fazla |Di| değerinin birbi-
KISA TEORİK BİLGİLER 189

rine eşit olması halinde yine bağlı değer ortaya çıkar. Birbirine eşit |Di| değerle-
rine ortak sıra değeri verilir.
Karar
H0 hipotezi doğru ise; yani, farklar anakütlesinin medyanı sıfır ise, büyük
sıralar arasında negatif işaret kadar veya buna yakın pozitif işaret görmeyi bekle-
riz. Benzer şekilde, küçük sıralar arasında, yaklaşık olarak birbirine eşit sayıda
pozitif ve negatif işaret bulmayı ümit ederiz. Bu sebeple, H0 hipotezi doğru iken,
pozitif işaretli sıralar toplamının, yaklaşık olarak, negatif işaretli sıralar toplamı-
na eşit olmasını bekleriz. Bu beklentiden önemli düzeyde bir uzaklaşma görül-
düğünde sıfır hipotezinin doğruluğu hakkında şüpheye düşeriz. Mümkün üç hi-
potez çifti için geçerli karar modelleri aşağıdaki gibidir.
a. Önemli düzeyde küçük T+ değeri veya önemli düzeyde küçük T− değeri,
sıfır hipotezinin reddedilmesine sebep olacaktır. Bu durumda test istatistiği, T+
ve T− değerlerinden küçük olanıdır. Çift yönlü testte ifade kolaylığı açısından
test istatistiği, T ile gösterilir. Hesaplanan T değeri, önceden seçilen α/2 değeri
ve n’e göre Tablo 12’de gösterilen değerden küçük veya bu değere eşitse, α
önem seviyesinde H0 hipotezini reddederiz.
b. Önemli düzeyde küçük T− değerleri, sıfır hipotezinin reddedilmesine
sebep olacaktır. Hesaplanan T− değeri, n ve önceden seçilen α değerine göre
Tablo 12’de gösterilen değerden küçük veya bu değere eşitse α önem seviye-
sinde H0 hipotezini reddederiz.
c. Önemli düzeyde küçük T+ değerleri, sıfır hipotezinin reddedilmesine
sebep olacaktır. Hesaplanan T+ değeri, n ve önceden seçilen α değerine göre
Tablo 12’de gösterilen değerinden küçük veya bu değere eşitse α önem seviye-
sinde H0 hipotezini reddederiz.
Örnek: Kalite konusunda bir eğitim semineri verilmeden önce ve sonra
bir fabrikada çalışan 16 işçi üzerinde anket çalışması yapılmış ve işçilerin aldık-
ları puanlar aşağıdaki gibi kaydedilmiştir. Yüksek puan alanlar kalite konusunda
daha duyarlı olanlardır.

İşçi 1 2 3 4 5 6 7 8
Seminer Öncesi (X) 15 25 41 42 14 74 52 60
Seminer Sonrası (Y) 30 40 35 45 20 50 60 65
İşçi 9 10 11 12 13 14 15 16
Seminer Öncesi (X) 53 67 42 38 48 62 22 43
Seminer Sonrası (Y) 60 75 40 43 52 70 30 44
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 190

%5 önem seviyesinde, seminerin, kalite konusunda duyarlılığı artırdığını


söyleyebilir misiniz?
Problemin son kısmı seminer sonrası puanların daha yüksek olmasını do-
layısıyla fark değerlerinin daha çok negatif olması beklentisini doğurur. Bu yüz-
den kurulacak hipotez çifti,
H0: MD ≥ 0
H1: MD < 0
şeklinde olacaktır.
Farklar serisi aşağıdaki gibi tespit edilir.

İşçi 1 2 3 4 5 6 7 8
Di = (Xi – Yi) -15 -15 6 -3 -6 24 -8 -5
İşçi 9 10 11 12 13 14 15 16
Di = (Xi – Yi) -7 -8 2 -5 -4 -8 -8 -1

Farklar serisindeki rakamların mutlak değerleri alınıp sıraya konulduktan


sonra, sıra değerine farkın işareti verilerek aşağıdaki seri elde edilir.

İşçi 1 2 3 4 5 6 7 8
|Di| değerinin
işaretli sırası -14.5 -14.5 7.5 -3 -7.5 16 -11.5 -5.5

İşçi 9 10 11 12 13 14 15 16
|Di| değerinin
işaretli sırası -9 -11.5 2 -5.5 -4 -11.5 -11.5 -1

Artı işaretli sıra değerleri toplamının önemli ölçüde az olması H0 hipote-


zinin reddedilmesine sebep olacaktır. Test istatistiği, artı işaretli sıra değerlerinin
toplamıdır. T+ = 7.5 + 16 + 2 = 25.5 olur.
Sol kuyruk testi durumunda Tablo 12, α = 0.05 ve n = 16 için kritik böl-
genin ≤ 36 olduğunu göstermektedir. Test istatistiği 36’dan küçük olduğu için
%5 önem seviyesinde H0 hipotezi reddedilir ve seminer sonrası kalite duyarlılı-
ğının arttığına karar verilir.
KISA TEORİK BİLGİLER 191

F) MANN-WHITNEY U TESTİ
Mann-Whitney testi, iki anakütle yer ölçülerinin eşitliğini test etmede kul-
lanılan prosedürlerden biridir.
Karşılaştırılacak örneklerin birincisi, MX medyanlı anakütleden alınmış
X1, X2, X3, ..., Xn müşahedelerinden ve ikincisi, MY medyanlı anakütleden çe-
kilmiş Y1, Y2, Y3, ..., Yn adet müşahededen oluşur. İki örnek birbirinden bağım-
sız olmalıdır. Üzerinde durulan değişken sürekli bir değişken olmalıdır. Veriler
en az aralık ölçeği ile ölçülmüş olmalıdır.

Hipotezler
Aşağıdaki sıfır hipotezlerinden herbiri alternatifi olan hipoteze karşı test
edilebilir.
a) H0: MX = MY, H1: MX ≠ MY
b) H0: MX ≥ MY, H1: MX < MY
c) H0: MX ≤ MY, H1: MX > MY

Test İstatistiği
Test istatistiğini hesaplamak için iki örneği birleştirerek bütün örnek mü-
şahedelerini küçükten büyüğe doğru sıraya koyarız. Bağlı müşahedelere verile-
cek sıra numarası onların işgal ettikleri sıra değerlerinin ortalamasıdır. Daha son-
ra birinci anakütleden çekilen müşahedelerin (yani, X’lerin) sıra değerlerini top-
larız. Örnek hacimleri birbirine eşit iken birinci anakütlenin yer parametresi
ikinci anakütlenin yer parametresinden küçük olduğunda, birinci anakütleden
çekilen müşahedelerin sıra toplamının ikinci anakütleden çekilen müşahedelerin
sıra toplamından küçük olması beklenir. Benzer şekilde, birinci anakütlenin yer
parametresi ikinci anakütlenin yer parametresinden büyük olduğunda, az önceki
sonucun tersi beklenir. Sıfır hipotezinin doğruluğu faraziyesi altında, birinci ana-
kütleden çekilen müşahedelere verilen sıra değerleri toplamının önemli ölçüde
büyük veya küçük olması halinde, test istatistiği, sıfır hipotezini reddetmemize
sebep olur.
Test istatistiği,
n 1 ( n 1 + 1)
T =S−
2
formülü ile hesaplanır. S değeri, birinci anakütleden çekilen müşahedelere veri-
len sıra değerlerinin toplamıdır.
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 192

Karar
Karar modelinin seçimi sıfır hipotezlerinin yapısına bağlıdır. Belirli bir α
önem seviyesinde mümkün üç karar modeli vardır.
a) a şıkkındaki H0 hipotezini test ederken, önemli ölçüde büyük veya kü-
çük bir T değeri ile karşılaştığımızda H0 hipotezini reddederiz. Böylece, hesap-
lanan T değeri wα/2’den küçük veya w1-α/2’den büyük olduğunda H0 hipotezini
reddederiz. wα/2 değeri, Tablo 15’den bulunacak kritik değerdir. w1-α/2 değeri ise,
w 1−α / 2 = n 1 n 2 − w α / 2
formülü ile hesaplanır.
b) b şıkkındaki H0 hipotezini test ederken, önemli ölçüde küçük bir T de-
ğeri ile karşılaştığımızda H0 hipotezini reddederiz. Yani, hesaplanan T değeri, n1,
n2 ve α değerlerine göre Tablo 15’den bulunacak wα değerinden küçük ise H0
hipotezini reddederiz.
c) c şıkkındaki H0 hipotezini test ederken, T değeri, w1-α değerinden bü-
yük olduğunda H0 hipotezini reddederiz. Burada,
w 1−α = n 1 n 2 − w α
olur.
20’den büyük örneklerde Tablo 15’i kullanamayız. Bu durumda büyük
örnek yaklaşımını kullanarak test istatistiğini,
T − n 1n 2 / 2
Zh =
n 1 n 2 (n 1 + n 2 + 1) / 12

formülü ile hesaplarız. Bu değeri kritik Z değerleriyle karşılaştırarak karara ula-


şırız.
Örnek: İki şeker fabrikasında üretilen şeker safiyet yüzdeleri yönünden
mukayese edilecektir. Birinci fabrikadan tesadüfi gün ve saatlerde 10 ölçüm ya-
pılırken ikincisinde 12 ölçüm yapılmıştır. Ölçüm sonuçları aşağıdaki tabloda
gösterilmiştir. Tablodaki verilere göre safiyetleri yönünden fabrikalarda üretilen
şekerler arasında herhangi bir fark var mıdır? %5 önem seviyesinde test ediniz.
KISA TEORİK BİLGİLER 193

A Fabrikası B Fabrikası
Ölçüm % Safiyet Ölçüm % Safiyet
1 93 1 90
2 97 2 92
3 94 3 94
4 94 4 97
5 93 5 96
6 98 6 94
7 94 7 92
8 98 8 93
9 95 9 95
10 96 10 97
11 92
12 90

Kurulacak hipotezler,
H0: MA = MB,
H1: MA ≠ MB
şeklindedir.
A Fabrikası B Fabrikası
Safiyet Sırası Safiyet Sırası
93 7.0 90 1.5
97 19.0 92 4.0
94 11.0 94 11.0
94 11.0 97 19.0
93 7.0 96 16.5
98 21.5 94 11.0
94 11.0 92 4.0
98 21.5 93 7.0
95 14.5 95 14.5
96 16.5 97 19.0
140.0 92 4.0
90 1.5

Birinci örneğin sıra değerleri toplamı, S = 140 olduğu için, test istatistiği,
n 1 (n 1 + 1) 10(10 + 1)
T =S− = 140 − = 85
2 2
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 194

olarak hesaplanır.
Çift kuyruk testi yaptığımız için α/2 = 0.05/2 = 0.025 önem seviyesi, n1 =
10 ve n2 = 12 örnek hacimleri için Tablo 15’den bulunacak wα/2 değeri 30’dur.
w1-α/2 değeri ise,
w 1− α / 2 = n 1 n 2 − w α / 2 = 10(12) − 30 = 90
olur. Test istatistiği, wα/2 ve w1-α/2 arasına düştüğü için %5 önem seviyesinde H0
hipotezi kabul edilir. Safiyetleri yönünden iki fabrikada üretilen şekerler birbiri-
ne benzemektedir.

G) SPEARMAN SIRA KORELASYON KATSAYISI ve TESTİ


İki değişken arasındaki ilişkinin derecesini bilmek ve bunun anlamlılığını
test etmede Spearman sıra korelasyon katsayısını kullanabiliriz.
Analiz edilecek veriler, tesadüfi olarak seçilen, n adet sayısal veya sayısal
olmayan müşahede çiftinden müteşekkil olmalıdır. Her bir müşahede çifti aynı
eşya veya canlılardan alınan iki müşahedeyi temsil etmelidir.
Spearman korelasyon katsayısının hesaplanmasına başlamadan önce şu
işlemler yapılır:
1. Veriler iki değişkenli bir anakütleden çekilmişse, n müşahede çifti
(X1,Y1), (X2,Y2), ....., (Xn,Yn) şeklinde gösterilir.
2. Her bir X değeri diğer bütün X değerlerine göre küçükten büyüğe
doğru sıraya dizilir. i inci X değerinin sırası S(Xi) ile gösterilir. En küçük X de-
ğerinin sırası, S(X1) = 1’dir.
3. Her bir Y değeri diğer bütün Y değerlerine göre küçükten büyüğe
doğru sıraya dizilir. i inci Y değerinin sırası S(Yi) ile gösterilir. En küçük Y de-
ğerinin sırası, S(Y1) = 1’dir.
4. X veya Y değerleri arasında bağlı değerler görüldüğünde, bu bağlı
değerlerin hepsine bağlı değerlerin işgal ettiği sıra değerlerinin ortalaması, sıra
değeri olarak verilir.
5. Sayısal olmayan veriler sıraya konabilir nitelikte olmalıdır.

Hipotezler
a. (İki-yönlü)
H0 : X ve Y değerleri birbirinden bağımsızdır.
H1 : X ve Y doğrusal veya ters yönlü olarak ilişkilidir.
KISA TEORİK BİLGİLER 195

b. (Tek-yönlü)
H0 : X ve Y değerleri birbirinden bağımsızdır.
H1 : X ve Y doğrusal olarak birbiriyle ilişkilidir.
c. (Tek-yönlü)
H0 : X ve Y değerleri birbirinden bağımsızdır.
H1 : X ve Y ters yönlü olarak birbiriyle ilişkilidir.

Test İstatistiği
Test istatistiği,

rS = 1 −
6 ∑d 2
i

n( n 2 − 1)
şeklindedir. Burada
n

∑ d i2 = ∑ [S(X) − S(Y)]
i =1
2

şeklindedir. Test istatistiği aynı zamanda ilişki ölçüsüdür. Bu bakımdan, söz ko-
nusu test istatistiği asıl müşahede değerlerinden çok, bunların sıra değerleri ara-
sındaki ilişkinin ölçüsüdür.
Her bir müşahede çifti için X’in sıra değeri Y’nin sıra değerine eşit oldu-
ğunda (tam doğrusal ilişki) bütün di farkları sıfıra eşit olurken rS değeri de +1’e
eşit olur. Her bir (Xi,Yi) müşahede çiftindeki bir değişkenin sırası diğer değişke-
nin sırasıyla tersine eşlendiğinde (tam ters ilişki), rS, −1’e eşit olur. rS değeri,
1’den büyük ve −1’den küçük olmaz.

Karar
Tablo 16, 6’dan 40’a kadar örnek hacimleri için kritik rS değerlerini ver-
mektedir. Yukarıda tarif edilen üç hipotez çifti için hazırlanacak karar modelleri
aşağıda gösterilmiştir.
a) (İki-yönlü): Hesaplanan pozitif rS değeri, n örnek hacmi ve α(2) değer-
lerine göre Tablo 16’dan bulunacak değerden büyük ise veya hesaplanan negatif
rS değeri tablodan bulunacak değerden küçük ise, α önem seviyesinde H0 hipote-
zi reddedilir.
b) (Tek-yönlü): Hesaplanan rS değeri, n örnek hacmi ve α(1) değerlerine
göre Tablo 16’dan bulunacak değerden büyük ise, α önem seviyesinde H0 hipo-
tezi reddedilir.
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 196

c) (Tek-yönlü): Hesaplanan rS değeri, n örnek hacmi ve α(1) değerlerine


göre Tablo 16’dan bulunacak değerden küçük ise, α önem seviyesinde H0 hipo-
tezi reddedilir.
Tablo 16’da 40’tan büyük örnekler için kritik değer verilmemiştir. Bu du-
rumda büyük örnek yaklaşımı yardımıyla test istatistiğini,
Z h = rS n − 1
formülü ile standart Z değerine dönüştürülür. Bu değer, verilen bir önem seviye-
sine göre bulunacak kritik Z değeri ile mukayese edilerek karar verilir.
Örnek: Birinci futbol liginde mücadele eden 10 takımın geçen ve bu se-
zonun onuncu haftasındaki puan durumları aşağıdaki gibidir.

Takımlar Geçen Sezon (Xi) Bu Sezon (Yi)


A 15 16
B 18 19
C 20 22
D 13 10
E 10 12
F 14 15
G 12 13
H 18 15
I 13 15
J 11 10

Bu verilere göre takımların her iki sezondaki puan durumları arasında


doğru yönlü bir ilişki var mıdır? %1 önem seviyesinde test ediniz.
Test hipotezleri aşağıdaki gibi olur.
H0 : Geçen ve bu sezonki puanlar birbirinden bağımsızdır.
H1 : Geçen ve bu sezonki puanlar arasında doğrusal ilişki vardır.
Her iki serideki rakamlar kendi aralarında sıraya konularak gerçek değer-
ler sıra değerleriyle değiştirilir. Eşlenik sıra değerleri arasındaki farklar tespit
edilerek bu farkların karesi alınır.
KISA TEORİK BİLGİLER 197

Takımlar S(Xi) S(Yi) di = S(Xi) − S(Yi) d i2


A 7.0 8.0 -1.0 1.00
B 8.5 9.0 -0.5 0.25
C 10.0 10.0 0 0
D 4.5 1.5 3.0 9.00
E 1.0 3.0 -2.0 4.00
F 6.0 6.0 0 0
G 3.0 4.0 -1.0 1.00
H 8.5 6.0 2.5 6.25
I 4.5 6.0 -1.5 2.25
J 2.0 1.5 0.5 0.25
Σd i2 = 24.00

Tablodaki verilerden test istatistiği,

rS = 1 −
6 ∑d 2
i
=1−
6(24)
≅ 0.85
2
n (n − 1) 10(10 2 − 1)
şeklinde hesaplanır.
Hesaplanan test istatistiği, n = 10 ve α(1) = 0.01 önem seviyesine göre
Tablo 16’dan bulunan 0.745 değerinden büyük olduğu için %1 önem seviyesin-
de H0 hipotezi reddedilir. Takımların geçen ve bu sezon aldıkları puanlar arasın-
da doğru yönlü bir ilişki vardır.

H) KRUSKAL-WALLIS TEK YÖNLÜ VARYANS ANALİZİ


İkiden fazla örneğin aynı veya birbirine benzer anakütlelerden çekilmiş
olduğunu iddia eden sıfır hipotezinin testinde en çok kullanılan parametrik ol-
mayan prosedür, sıra değerlerine uygulanan Kruskal-Wallis tek yönlü varyans
analizidir. Analiz edilecek iki örnek varsa, Kruskal-Wallis testi, Mann-Whitney
testine denktir.
Elimizde, analiz edilecek n1, n2, ...., nk hacimli k adet örnek olmalıdır.
Müşahedeler hem örnek içinde ve hem de örnekler itibariyle birbirinden bağım-
sız olmalıdır. Üzerinde durulan değişken sürekli bir değişken olmalıdır. Veriler
en az aralık ölçeği ile ölçülmüş olmalıdır. Herhangi bir yer ölçüsü hariç, diğer
özellikleri itibariyle anakütleler birbirinin aynı olmalıdır.

Hipotezler
H0: k adet anakütle dağılım fonksiyonu birbirinin aynıdır.
H1: k adet anakütlenin hepsi aynı medyana sahip değildir.
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 198

Test İstatistiği
Her bir müşahede değerinin yerine k örnekteki tüm müşahedelerle ilişkili
olan sıra değerini koyarız. k örnekteki toplam müşahede sayısını,
k
n= ∑n
i =1
i

ile gösterirsek, bu müşahedelerin en küçüğünün sıra değeri 1, bir sonrakinin sıra


değeri 2 olur. Bu şekilde en büyük müşahedeye, n sıra değeri verilinceye kadar
sıra değeri verme işine devam edilir. Bağlı değerler durumunda, bağlı müşahede-
lere ait sıra değerlerinin ortalaması bu değerlerin ortak sıra değeri olarak kabul
edilir. Sıra değerlerine uygulanan Kruskal-Wallis tek yönlü varyans analizinde
kullanılacak veriler aşağıdaki gibidir.

Örnekler
1 2 ... k
X 1,1 X 2,1 ... X k,1
X 1,2 X 2,2 ... X k,2
. . . .
. . . .
. . . .
. . . .

X 1,n1 X 2,n 2 ... X k,n k

Sıfır hipotezi doğru ise, gruplardaki sıraların dağılımının tesadüfi bir seyir
takip etmesini bekleriz. Yani, çok küçük sıra değerleri veya çok büyük sıra de-
ğerleri bir örnekte toplanmayacaktır. Bundan dolayı, sıfır hipotezi doğru ise, ör-
nekler eşit olduğunda (veya eşit olmayan örnek için gerekli düzeltme yapıldıktan
sonra), k adet örneğe ait sıra toplamlarının birbirine eşit olmasını bekleriz. Sez-
gilerimize dayanarak bulacağımız bir test istatistiğine bağlı olarak sıra toplamla-
rının birbirinden anlamlı düzeyde farklı olduğunu ve temsil edilen anakütlelerin
birbirine benzer olmadıklarını söyleyebiliriz. Yukarıdaki ifadenin tersine bazen
sıra toplamları birbirine çok yakın olabilir. Bu gibi durumlarda da anakütlelerin
birbirine eşit olduğunu ifade eden hipotezi reddedemeyiz. Kruskal-Wallis testi-
nin test istatistiği,
12 k
ri2
H= Σ
n (n + 1) i =1 n i
− 3(n + 1)

şeklindedir. Formüldeki ri değeri, i inci örnekteki müşahedelerin sıra değerleri


toplamıdır. Herbir örnek en az 5 müşahededen oluşuyorsa, H0 hipotezinin doğru-
luğu faraziyesi altında Kruskal-Wallis test istatistiği, k – 1 serbestlik dereceli
ki-kare dağılımına yaklaşır.
KISA TEORİK BİLGİLER 199

Karar
H değeri, α ve k − 1 değerine göre Tablo 4’ten bulunacak değerden bü-
yükse H0 hipotezi reddedilir.
Örnek: Dört farklı marka sigaradaki nikotin miktarları karşılaştırılmak is-
teniyor. Bu maksatla her marka sigaradan 5’er adet alınarak analiz edilmiş ve
aşağıdaki sonuçlar (mg) elde edilmiştir.

A Marka B Marka C marka D Marka


1.6 1.5 2.1 2.4
2.1 1.4 2.6 2.7
1.8 1.5 3.1 1.8
2.2 1.8 2.5 2.1
1.5 2.1 2.4 1.5

Bu sonuçlara göre dört marka sigaradaki nikotin miktarlarının birbirine


eşit olduğunu %1 önem seviyesinde söyleyebilir misiniz?
Test hipotezleri,
H0: Dört marka sigarada bulunan nikotin miktarları birbirine eşittir.
H1: Nikotin miktarları birbirine eşit değildir.
şeklinde düzenlenir.
Nikotin ölçüm değerleri küçükten büyüğe doğru sıralanıp işgal ettikleri sı-
ra numarası ile numaralanır. Birbirine eşit değerler işgal ettikleri sıra numarala-
rının ortalaması ile numaralanır. Buna göre dört marka sigaradaki nikotin mik-
tarlarının sıra değerleri aşağıdaki gibi olur.

A Marka B Marka C marka D Marka


6.0 3.5 11.5 15.5
11.5 1.0 18.0 19.0
8.0 3.5 20.0 8.0
14.0 8.0 17.0 11.5
3.5 11.5 15.5 3.5
r1 = 43.0 r2 = 27.5 r3 = 82.0 r4 = 57.5

Test istatistiği,
12 ⎛ 43 2 + (27.5) 2 + 82 2 + (57.5) 2 ⎞
H= ⎜ ⎟ − 3(20 + 1) ≅ 9.2
20( 20 + 1) ⎜⎝ 5 ⎟

şeklinde hesaplanır.
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 200

α = 0.01 önem seviyesi ve k – 1 = 4 – 1 = 3 serbestlik derecesine göre


Tablo 4’ten bulunacak kritik ki-kare değeri 11.345’tir. Test istatistiği, kritik de-
ğerden küçük olduğu için %1 önem seviyesinde H0 hipotezi reddedilemez. Dört
marka sigara, ihtiva ettikleri nikotin yönünden birbirine eşittir.

I) COCHRAN TESTİ
Tesadüfi tam blok planının kullanıldığı bazı araştırmalarda, belirli bir mu-
ameleden sağlanan tepkiyi yalnız iki değerden biri ile ifade edebiliriz. Mümkün
iki sonuçtan “başarıyı” 1 ve “başarısızlığı” 0 ile gösterebiliriz. Mesela, dört ağrı
kesici ilacın tesirini karşılaştırmak için bu ilaçların her biri birkaç hastaya veril-
miş ise plandaki hastalar bloklardır. İlaç verildikten sonra hasta rahatlama hisse-
derse durumu 1 ile gösteririz. Hasta ağrıdan kurtulmazsa durumu 0 ile gösteririz.
Cochran, bu gibi bağımlı oranlar durumunda muamele tesirlerinin eşitliği-
ni iddia eden sıfır hipotezini test edecek bir prosedür geliştirmiştir. Cochran Q
testi olarak bilinen bu test aşağıdaki safhalardan müteşekkildir.
Veriler r bloktan elde edilir. c adet muamele, verilen bir bloktaki denekle-
re birbirinden bağımsız olarak uygulanır. Başarı durumunda sağlanan ölçüm 1 ve
başarısızlık durumunda elde edilen ölçüm 0’dır. Sonuçlar, Xij değerlerinin, 0 ve-
ya 1’lerle ifade edildiği, aşağıdakine benzer bir kontenjans tablosunda gösterile-
bilir. Bloklar, mümkün bütün bloklar anakütlesinden tesadüfi olarak seçilir.

Muameleler
Bloklar 1 2 3 .... c Blok toplamları
1 X11 X12 X13 .... X1c R1
2 X21 X22 X23 .... X2c R2
3 X31 X32 X33 .... X3c R3
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
r Xr1 Xr2 Xr3 .... Xrc Rr
Muamele toplamları C1 C2 C3 .... Cc N = genel toplam

Hipotezler
H0 : Muameleler eşit tesirlidir.
H1 : Muamelelerin tümü eşit tesire sahip değildir.

Test İstatistiği
Verilen bir bloktaki toplam başarı sayısı (1’ler) sabittir. Sıfır hipotezi doğ-
ru iken, her bir muamelenin eşit sayıda başarı ihtiva etmesi beklenir. Test, de-
KISA TEORİK BİLGİLER 201

neme toplamlarıyla denemeler arasındaki farkın anlamlı olup olmadığını ortaya


koyar.
Test istatistiği,
c
c(c − 1) ∑ C − (c − 1)N
j=1
2
j
2

Q= r
cN − ∑R
i =1
2
i

şeklindedir.

Karar
r değerleri büyüdükçe Q değerlerine ait limit dağılım, c − 1 serbestlik de-
receli ki-kare dağılımına yaklaşır. Veriler yukarıdakine benzer bir tablodaki gibi
gösterildiğinde, yalnız 0 veya 1 değerlerini ihtiva eden bütün blokları sileriz.
Muamele sayısına göre geri kalan bloklardaki veri sayısı 24 veya daha fazla ve
blok sayısı en az 4 ise, hesaplanan Q değerini, c − 1 serbestlik dereceli tablo
ki-kare değeri ile mukayese ederiz.
Örnek: Bir fabrikadaki işçilere, kalite konusunda üç farklı seminer veril-
miştir. Tesadüfi olarak seçilen 13 işçinin faydalı gördükleri semineri işaretleme-
leri isteniyor. Elde edilen sonuçlar aşağıdaki gibidir.

İşçiler Faydalı Seminerler İşçiler Faydalı Seminerler


1 A, B, C 8 C
2 B, C 9 B, C
3 C 10 C
4 B, C 11 C
5 B 12 B, C
6 A, C 13 A, B, C
7 A, B, C

Kalite seminerlerinin, fayda yönünden birbirinden farklı olup olmadığını


%5 önem seviyesinde test ediniz.
H0: Seminerler fayda yönünden birbirine eşittir.
H1: Seminerlerin fayda yönünden birbirine eşit değildir.
Test istatistiğinin bulunmasını sağlayacak R i2 ve C 2j değerlerinin hesap-
lanışı aşağıdaki tabloda gösterilmiştir. Bu tabloda faydalı görülen seminerlere 1
değeri verilmiştir.
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 202

Seminerler
İşçiler A B C Ri R2
1 1 1 1 3 9
2 1 1 2 4
3 1 1 1
4 1 1 2 4
5 1 1 1
6 1 1 2 4
7 1 1 1 3 9
8 1 1 1
9 1 1 2 4
10 1 1 1
11 1 1 1
12 1 1 2 4
13 1 1 1 3 9
C1 = 4 C2 = 8 C 3 = 12 ΣR i = 24 ΣR i2 = 52
C 12 = 16 C 22 = 64 C 23 = 144 ΣC 2j = 224

N = ΣRi = ΣCj = 24 olduğu için yukarıdaki tabloda bulunan değerleri de


kullanarak test istatistiğini,
c

∑ C − (c − 1)N
c(c − 1)
j=1
2
j
2

3(3 − 1)(224) − (3 − 1)24 2


Q= = = 9 .6
r
3(24) − 52
cN − ∑R
i =1
2
i

şeklinde hesaplarız.
c – 1 = 3 – 1 = 2 serbestlik derecesi ve α = 0.05 önem seviyesine göre ki-
kare tablosundan bulunacak kritik değer 5.991’dir. Test istatistiği, kritik değer-
den büyük olduğu için %5 önem seviyesinde H0 hipotezi reddedilerek fayda yö-
nünden seminerlerin farklı olduğuna karar verilir.

II- ÇÖZÜLMÜŞ PROBLEMLER


A) TEK ÖRNEK İŞARET TESTİ
1) Bir ampul fabrikasının müdürü, fabrikasında üretilen ampullerin med-
yan dayanma süresinin 1300 saat olduğunu iddia etmektedir. İddiayı test için
mamul hattından tesadüfi olarak 12 ampul alınıyor ve dayanma süreleri aşağıda-
ki gibi bulunuyor.

You might also like