You are on page 1of 12

İSTATİSTİĞE GİRİŞ – II ve

İSTATİSTİK – II DERSLERİ

7. ÜNİTE
PARAMETRİK OLMAYAN
İSTATİSTİK TEKNİKLER

Prof. Dr. Erkan OKTAY

ERZURUM, 2020
7. BÖLÜM
PARAMETRİK OLMAYAN
İSTATİSTİK TEKNİKLER

I- KISA TEORİK BİLGİLER


Bir istatistiki prosedürün uygulanabilmesi için, bu prosedürün bazı varsa-
yımları sağlaması gerekir. Mesela, varyans analizi prosedüründe, analiz edilecek
örneklerin, normal dağılıma sahip eşit varyanslı anakütlelerden çekilmiş oldukla-
rı farz edilir. Analizi yapılacak anakütlelerin parametrik analiz tekniklerinde be-
lirtilen varsayımları karşılayamamaları durumunda, katı varsayımlara dayanma-
yan analiz metotlarına ihtiyaç duyarız. Parametrik olmayan istatistik teknikler,
çok genel varsayımlar altında bile iyi sonuç verebilmektedir.
Parametrik olmayan prosedürlerden bazıları anakütle parametrelerini konu
almaz ve bazıları da belirli bir dağılıma sahip değildirler.

Parametrik Olmayan İstatistik Tekniklerin Avantajları


1- Çok az sayıda faraziyeye dayandıklarından, doğru uygulanma şansları
yüksektir.
2- Basit bir hesap makinesi yardımıyla kolayca ve kısa zamanda uygula-
nabilirler.
3- Matematik ve istatistik konularında çok az bilgiye sahip araştırmacılar
bu metotları kolayca anlayıp uygulayabilirler.
4- Zayıf bir ölçekle ölçülmüş verilere uygulanabilirler.

Parametrik Olmayan İstatistik Tekniklerin Dezavantajları


1- Hesaplanması daha kolay olduğu için, eldeki verilere parametrik tek-
nikleri uygulamak mümkün olduğu halde parametrik olmayan teknikler tercih
edilebilir. Halbuki parametrik teknikler bu gibi durumlarda daha elverişli sonuç-
lar sağlarken, parametrik olmayan istatistik teknikler bilgi israfına sebep olur.
2- Sadece basit bazı hesaplamaları gerekli kıldığı için parametrik olmayan
istatistik teknikler uygulanması en çok arzu edilen tekniklerdir. Bununla birlikte,
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 176

örneklerin geniş hacimde olması ve bilgisayar bulunmaması durumunda hesapla-


maların elle yapılması uzun ve yorucu olacaktır.

Parametrik Olmayan İstatistik Teknikler Ne Zaman Kullanılır?


Parametrik olmayan istatistik tekniklerin kullanılmasını elverişli kılan hal-
lerden bazıları aşağıdaki gibidir.
1- Test edilecek hipotez anakütle parametreleri hakkında değilse paramet-
rik olmayan hipotez testleri kullanılabilir.
2- Mevcut veriler parametrik bir prosedür için gerekli olandan daha zayıf
bir ölçekle ölçülmüş ise yine parametrik olmayan istatistik teknikler kullanıla-
bilir. Mesela, eldeki veriler, parametrik metotları elverişsiz kılacak türden sırala-
ma veya numaralama verilerinden oluşuyorsa parametrik olmayan tekniklerin
kullanılması daha güvenilir sonuçlar sağlar.
3- Parametrik bir prosedürün kullanılması için gerekli olan yaklaşımlar
sağlanamıyorsa parametrik teknikler büyük ölçüde güvenilirliklerini yitirirler.
Bir araştırma projesi düzenlenirken parametrik bazı prosedürlerin kullanılması
gerekebilir. Bununla birlikte, verilerin muayene edilmesi sonucu yapılacak testin
dayandığı bir veya daha fazla yaklaşımın ihlal edildiği gözlenebilir. İşte bu gibi
durumlarda, çoğu kez, parametrik olmayan metotları kullanmaktan başka çare
kalmaz.
4- Sonuçlar acele gerekli ise, kullanılacak bir bilgisayar yoksa ve hesapla-
malar elle yapılacaksa, parametrik olmayan teknikleri kullanmak genel fikir
verme açısından kaçınılmaz olur.
Bazı durumlarda örneğin çekileceği anakütlenin aşırı derecede çarpık veya
basık olması yüzünden, merkezi limit teoreminin sağladığı avantajlardan yarar-
lanamayız. Bu durumda da uygun bir parametrik olmayan teknik kullanılabilir.

A) TEK ÖRNEK İŞARET TESTİ


İşaret testi parametrik olmayan prosedürler içerisinde belki de en eski ola-
nıdır. Analiz yapılırken serideki verileri artı ve eksi işaretleriyle gösterdiğimiz-
den bu prosedür işaret testi olarak adlandırılır. Test istatistiği, ya artıların veya
eksilerin sayısıdır.
Analizi yapılacak örnek, bilinmeyen bir M medyanlı anakütleden tesadüfi
olarak seçilmiş olmalıdır. Örnekteki veriler bağımsız ölçümleri ihtiva etmelidir.
Veriler en az sıralama ölçeği ile ölçülmüş olmalıdır. Analiz edilecek değişken
sürekli bir değişken olmalıdır.
KISA TEORİK BİLGİLER 177

Hipotezler:
a. (Çift yönlü test): H0 : M = M0, H1 : M ≠ M0
b. (Tek yönlü test): H0 : M ≤ M0, H1 : M > M0
c. (Tek yönlü test): H0 : M ≥ M0, H1 : M < M0

Test İstatistiği
Örnekteki her bir ölçümden farazi medyan değeri M0’ı çıkardıktan sonra
bulunacak farkın işaretini kaydediniz.
Eğer sıfır hipotezi doğru ise; yani, anakütle medyanı gerçekten M0’a eşitse
anakütleden çekilen tesadüfi örnekte n adet Xi − M0 farklılığı hesap edilirken ar-
tı ve eksi işaretlerin birbirine eşit olması beklenir. Eğer istatistiki bakımdan
önemli düzeyde az artı veya eksi işareti müşahede edersek a şıkkındaki sıfır hi-
potezini reddederiz. Eğer istatistiki bakımdan çok az sayıda eksi işareti müşahe-
de edersek b şıkkındaki sıfır hipotezini reddederiz. Bununla birlikte, önemli dü-
zeyde az artı işareti müşahede edersek c şıkkındaki sıfır hipotezini reddederiz.
Böylece a şıkkındaki hipotezler için test istatistiği, artı veya eksi işaretlerinden
az sayıda olanıdır. b şıkkındaki hipotezler için test istatistiği eksilerin sayısı, c
şıkkındaki hipotezler için artıların sayısıdır.
Daha önce de belirtildiği gibi testin geçerli olması için üzerinde durulan
değişkenin sürekli değişken olması gerekir. Bu yüzden Xİ − M0 farkları hesapla-
nırken sıfır farkın bulunmaması beklenir. Bununla birlikte, uygulamada sıfır
farklılık gözlenebilir. Bu durumda sıfır farklılığa sebep olan müşahedeler analiz-
den çıkarılır ve örnek hacmi n buna göre azaltılır.

Karar
Eksi veya artı işaretlerden az olanının gözlenmesi ihtimali α/2’ye eşit ve-
ya küçük ise α önem seviyesinde a şıkkındaki sıfır hipotezini reddederiz.
Eksi işaretinin gözlenmesi ihtimali α’ya eşit veya küçük ise α önem sevi-
yesinde b şıkkındaki sıfır hipotezini reddederiz.
Artı işaretinin gözlenmesi ihtimali α’ya eşit veya küçük ise α önem sevi-
yesinde c şıkkındaki sıfır hipotezini reddederiz.
Gerçekte müşahede edilene eşit veya ondan daha büyük bir değeri bulma
ihtimalini belirlemek için, artı ve eksi işaretlerin oluşturduğu bir anakütleden çe-
kilen n adet müşahedeyi ihtiva eden örnekteki artı ve eksi işaretlerin sayısını göz
önüne almamız gerekir. Diğer bir ifadeyle, elimizde bulunan n hacimli örneğin
kendisinden çekilmiş olduğu ikili (artı ve eksi işaretler) sonuçlardan müteşekkil
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 178

gözlemleri ihtiva eden bir anakütleyi göz önüne alalım. Sıfır hipotezi doğru iken,
farz edilen hipoteze göre üzerinde durulan işareti veren farklılıkların tesadüfi
dağılımı p = 0.5 parametresiyle binom dağılımıdır. Sıfır hipotezi doğru ise ana-
kütleden çekilen bir tesadüfi örneğin artı işaretine sahip olması ihtimali eksi işa-
retine sahip olması ihtimaline eşittir. Yani Xİ − M0 farklılığının artı işareti ver-
mesi ihtimali ile eksi işareti vermesi ihtimali 0.5’e eşittir.
Tablo 11, p = 0.50 olduğunda verilen n değerlerine göre x olaylarının ger-
çekleşme ihtimallerini vermektedir. Bu tabloyu kullanarak gerçekte müşahede
edilene eşit veya ondan daha büyük bir test istatistiği elde etme ihtimalini hesap-
layabiliriz. Eğer X değerinin eldeki hipotezlere göre üzerinde durulan işaretin
sayısını gösteren bir tesadüfi değişken olduğunu ve x değerinin de test istatisti-
ğinin gözlenen değerini gösterdiğini kabul edersek, aradığımız şey
P(X ≤ x | n, 0.50)
ihtimalidir. Bu ihtimal, içerisindeki artı ve eksi işaretlerin birbirine eşit olduğu
bir anakütleden çekilen n hacimlik bir tesadüfi örnekte X değerinin x değerine
eşit veya küçük olması ihtimalidir.
x değeri, Tablo 11 yardımıyla bulunan X kritik değerinden büyük oldu-
ğunda veya bu değere eşit olduğunda sıfır hipotezini reddederiz.
n > 20 olduğunda Tablo 11’i kullanamayız. 20’den büyük örnekler için
binomun normale yaklaşımını kullanarak, test istatistiğini,
x − n (0.5)
Zh =
n (0.5)(1 − 0.5)

formülü yardımıyla hesaplarız. Hesaplanan Z değerini, α hata payına göre Tablo


2’den bulunacak kritik Z değerleri ile mukayese ederek sıfır hipotezi hakkında
karar veririz. Test istatistiği x’in süreklilik düzeltmesine tabi tutulacağını unut-
mamamız gereklidir.
Örnek 1-) Bir pil fabrikasının yöneticisi ürettikleri pillerin medyan ömrü-
nün 1.50 saat olduğunu iddia etmektedir. İddiayı test için üretim hattından tesa-
düfi olarak seçilen 10 pilin ömrü aşağıdaki gibi bulunmuştur.
1.45 1.55 1.48 1.43 1.52 1.51 1.44 1.48 1.44 1.57
Buna göre pillerin medyan ömrünün 1.50 saate eşit olmadığını %5 önem
seviyesinde söyleyebilir misiniz?
Yapılacak test çift yönlü bir testtir. Kurulacak hipotezler aşağıdaki gibidir.
H0 : M = 1.50
H1 : M ≠ 1.50
KISA TEORİK BİLGİLER 179

Serideki rakamlardan iddia edilen medyan çıkarıldığında bulunacak fark-


ların işaretleri aşağıdaki gibidir.
− + − − + + − − − +
Sıfır hipotezinin doğru olabilmesi için + ve − işaretli değerlerin birbirine
eşit olması gereklidir. Seride artı işaretli değerlerin sayısı daha az olduğu için
test istatistiği, x = 4’tür.
Sıfır hipotezi doğru iken 4 veya daha az + işareti müşahede etme ihtimali
α/2 = 0.05/2 = 0.025’e eşit veya küçük olursa sıfır hipotezini reddederiz.
Tablo 11, n = 10 olduğunda X ≤ 4 ihtimalinin,
P(X ≤ 4 | 10, 0.50) = 0.0010 + 0.0098 + 0.0439 + 0.1172 + 0.2051 = 0.377
olduğunu göstermektedir. Bu durumda sıfır hipotezini kabul ederek pillerin
medyan dayanma süresinin 1.50 saate eşit olduğuna karar veririz.
Örnek 2-) Büyük örnek yaklaşımına göre yukarıdaki problemi tekrar çö-
zelim.
P(X ≤ 4 | 10, 0.50) değerini binomun normale yaklaşımıyla da hesaplaya-
biliriz. P(X ≤ 4) değeri hesaplanacağı için standart Z değerine dönüştürülecek x
değeri 4.5’tir. 4.5’in standart Z değeri,
x − n (0.5) 4.5 − 10(0.5)
Z= = ≅ −0.32
n (0.5)(1 − 0.5) 10(0.5)(0.5)

olurken, P(X ≤ 4) = P(Z ≤ −0.32) = 0.5 − 0.1255 = 0.3745 olur. Bulunan P değe-
ri 0.025’den büyük olduğu için binomun normale yaklaşımı durumunda da sıfır
hipotezi kabul edilerek pillerin medyan dayanma süresinin 1.50’ye eşit olduğuna
karar verilir.

B) TEK ÖRNEK WILCOXON İŞARETLİ SIRALAR TESTİ


Wilcoxon prosedüründe önce müşahede edilen tüm ölçümlerden farazi
medyan çıkarılarak elde edilen fark değerleri küçükten büyüğe doğru sıralanır.
Daha sonra, farklar serisinde bulunan değerlerin işaretleri sıra serisindeki rakam-
lara verilir. Bu seride bulunan pozitif ve negatif işaretli sıra numaraları kendi
aralarında toplanır. Daha fazla bilgi kullanmasından dolayı Wilcoxon testi işaret
testinden daha güçlüdür. Wilcoxon testi, örneklemenin yapıldığı anakütlenin si-
metrik olduğunu kabul eder. Örneklemenin yapıldığı anakütle bu faraziyeyi sağ-
ladığında anakütle medyanı hakkında varılacak hükümler anakütle ortalamasına
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 180

da uygulanabilir. Anakütlenin simetrik olmaması halinde Wilcoxon testini kul-


lanmaktan vazgeçerek işaret testini kullanırız.
Wilcoxon testinin geçerli olabilmesi için, analiz edilecek örnek, bilinme-
yen bir M medyanlı anakütleden tesadüfi olarak seçilen n adet müşahedeyi ihtiva
etmelidir. Üzerinde durulan değişken sürekli değişken olmalıdır. Analizi yapıla-
cak değişken en az aralık ölçeği ile ölçülmüş olmalıdır. Müşahedeler birbirinden
bağımsız olmalıdır.

Hipotezler
a. (Çift yönlü test): H0: M = M0 , H1: M ≠ M0
b. (Tek yönlü test): H0: M ≥ M0 , H1: M < M0
c. (Tek yönlü test): H0: M ≤ M0 , H1: M > M0

Test İstatistiği
Test istatistiğini bulmada aşağıdaki prosedürü takip ederiz:
1. Her bir müşahede değerinden farazi medyanı çıkarırız. Yani, her bir
müşahede için,
Di = Xi − M0
farkını hesaplarız. Herhangi bir Xi müşahede değeri farazi medyan değeri M0’a
eşit ise söz konusu müşahede değerini test prosedüründen çıkararak örnek hac-
mini buna göre azaltırız.
2. İşaretlerine bakmaksızın farkları küçükten büyüğe doğru sıraya koyarız.
Diğer bir ifadeyle, fark değerlerini temsil eden ⏐Di⏐ değerlerini sıraya koyarız.
İki veya daha fazla ⏐Di⏐ değeri birbirine eşitse, bu değerlerin sıra ortalamaları
bulunur.
3. Herbir sıra değerine ilgili farkın işaretini koyarız.
4. T+ olarak adlandırılacak artı değerli sıraların toplamını ve T− olarak ad-
landırılacak eksi işaretli sıraların toplamını buluruz. Gerçekte bu değerlerden sa-
dece birini hesap etmek yeterlidir. Bilinen değer yardımıyla diğer değeri hesap-
lamada, T+ = [n(n+1)/2] − T− ilişkisinden yararlanabiliriz.
Sıfır hipotezinin doğru olması yani, gerçek anakütle medyanı M’nin farazi
medyan M0’a eşit olması halinde Wilcoxon testine ait faraziyeler karşılanıyorsa,
pozitif bir Di = Xi − M0 farklılığı görme ihtimali negatif farklılık görme ihtima-
line eşittir. Böylece tekrarlı örneklemede sıfır hipotezi doğru ve gerekli farazi-
yeler karşılanırsa, beklenen T+ değeri, beklenen T− değerine eşit çıkar. Verilen
KISA TEORİK BİLGİLER 181

bir örnekte T+ değerinin T− değerine eşit olması beklenmez. Bununla birlikte sı-
fır hipotezi doğru ise, bu iki değer arasında çok önemli bir farklılığın olması
beklenmez. Bu yüzden önemli ölçüde küçük bir T+ veya T− değeri, sıfır hipote-
zinin reddedilmesine sebep olacaktır.
Her bir hipotez çifti için hesaplanacak test istatistiği aşağıdaki gibidir:
a) Önemli ölçüde küçük T+ veya T− değeri, sıfır hipotezinin reddedilme-
sine sebep olacağı için a şıkkında belirtilen hipotezler için geçerli test istatistiği
T+ ve T− değerlerinin küçük olanıdır. Kolaylık sağlaması açısından bu iki değe-
rin küçük olanını T ile göstereceğiz.
b) Negatif işaretli sıralarda yeterince büyük bir toplam elde edildiğinde,
sıfır hipotezine göre, bu toplamın pozitif sıralardan hesaplanacak toplamdan çok
fazla olacağını ümit ettiğimiz için H0: M ≥ M0 hipotezini reddederiz. Aynen bu-
nun gibi yeterince küçük bir T+ değeri b şıkkında belirtilen sıfır hipotezinin red-
dedilmesine sebep olacaktır.
c) Benzer sebeplerden dolayı c şıkkında belirtilen sıfır hipotezi için geçerli
olan test istatistiğinin T− olduğunu görürüz.

Karar
Tablo 12, Wilcoxon işaretli sıralar testinde kullanılacak kritik değerleri
göstermektedir. Bu tabloda farklı ihtimal seviyesi veren mümkün bütün sıra top-
lamları (T) için 0.0001’den 0.5000’ye kadar ihtimal seviyeleri verilmiştir. Söz
konusu tabloda, n = 5’den n = 30’a kadar olan bütün örnek hacimleri için sıra
toplamları (T) listelenmiştir.
İkinci safhada bahsedilen herbir hipotez çifti için geçerli olan karar modeli
aşağıdaki gibidir:
a. Hesaplanan T değeri, n örnek hacmi ve önceden seçilen α/2 önem sevi-
yesine göre Tablo 12’den bulunacak tablo T değerine eşit veya bu değerden kü-
çük olursa α önem seviyesinde H0 hipotezini reddederiz.
b. T+ değeri, n örnek hacmi ve önceden seçilen α önem seviyesine göre
Tablo 12’den bulanacak değere eşit veya bu değerden küçükse α önem seviye-
sinde H0 hipotezini reddederiz.
c. T− değeri, n örnek hacmi ve önceden seçilen α önem seviyesine göre
Tablo 12’den bulanacak değere eşit veya bu değerden küçükse α önem seviye-
sinde H0 hipotezini reddederiz.
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 182

Örnek hacmi 30’dan büyük olduğunda, hesaplanan test istatistiğinin an-


lamlılığını test etmek için Wilcoxon işaretli sıralar tablosunu kullanamayız. Bü-
yük örnekler için,
T − n ( n + 1) / 4
ZT =
n ( n + 1)(2n + 1) / 24

test istatistiği, standart normal dağılıma yaklaşır. Tek yönlü testlerde, bu formül-
deki T değerinin yerine, duruma göre, T− veya T+ değerlerinden birisini yazabili-
riz.
Örnek: Atatürk Üniversitesinde okuyan öğrencilerin günde ortalama 60
dk ders çalıştığı iddia edilmektedir. İddiayı test için tesadüfi olarak seçilen 8 öğ-
rencinin günlük ders çalışma süreleri aşağıdaki gibidir.
55 80 45 68 70 110 30 50
Buna göre, %5 önem seviyesinde ortalama ders çalışma süresinin 60 da-
kikadan az olduğu söylenebilir mi?
H0 : M ≥ 60 dk
H1 : M < 60 dk
Serideki rakamlardan, iddia edilen medyan değeri çıkarıldığında aşağıdaki
seri elde edilir.
-5 20 -15 8 10 50 -30 -10
İşaretlerine bakmaksızın fark serisinde rakamlar küçükten büyüğe doğru
sıralandığında aldıkları sıra değerleri aşağıdaki gibi olur.
1 6 5 2 3.5 8 7 3.5
Bu sıra değerlerine farkların işareti verildiğinde aşağıdaki seri elde edilir.
-1 6 -5 2 3.5 8 -7 -3.5
Test istatistiği, artı işaretli sıra değerlerinin toplamıdır. Daha açık bir ifa-
deyle, test istatistiği, T+ = 6 + 2 + 3.5 + 8 = 19.5’tir.
n = 8 ve α = 0.05 önem seviyesine göre Tablo 12’den bulunan kritik değer
6’dır. Test istatistiği tablo değerinden büyük olduğu için %5 önem seviyesinde
sıfır hipotezi reddedilemez ve medyan çalışma süresinin 60 dakikadan az olma-
dığına karar verilir.
KISA TEORİK BİLGİLER 183

C) DİZİ SAYILARI TESTİ


Birçok durumda seride bulunan birimlerin tesadüfi olarak seçilip seçilme-
diğini bilmek isteriz. İstatistiki analizlerde kullanılan örnekleri ele alalım. İstatis-
tiki karar modellerinde kullanılan prosedürlerin dayandığı temel faraziye, alına-
cak kararların tesadüfi örneklere bağlı olmasıdır. Elimizdeki örneğin tesadüfili-
ğinden şüphelenirsek, bu örneği analize tabi tutmadan önce onun tesadüfi bir ör-
nek olup olmadığını anlamak isteriz. Tesadüfilik yaklaşımına uygunluğun olup
olmadığını anlamak istediğimiz daha birçok durum vardır. Şimdi bunlardan ikisi
üzerinde duralım.
1- Bazı kalite kontrol prosedürlerinde, kontrol grafikleri üretim prosesinin
çıktıları arasında standartlara uymayanların oranını belirleyip kontrol altına al-
mada kullanılır. Üretilen mamullerden belirli aralıklarla örnekler alınır ve bu ör-
nekler itibariyle standartlara uymayan mamul oranı belirlenir. Araştırmacı, belir-
li bir örnekteki standartlara uymayan mamul oranını, tüm prosesteki standartlara
uymayan mamul oranı ile mukayese eder. Yine söz konusu araştırmacı, aldığı
örneğin tesadüfi bir örnek olup olmadığını da bilmek ister. Tesadüfiliğin olma-
ması üretim prosesinin kontrolde olmadığını gösterir.
2- Regresyon analizinde, müşahede edilen bağımlı değer ile bu değere
karşı gelen tahmini değer arasındaki fark, residual (artık) olarak adlandırılır. Ar-
tık değerler hem pozitif ve hem de negatif olabilir. Örnek verilerin tesadüfiliğini
anlamak için pozitif ve negatif artık değerlerin sayısını test ederiz. Tesadüfiliğin
olmaması, regresyon analizinin önemli faraziyelerinden birisinin ihlal edildiği
anlamına gelebilir.
Tesadüfiliği araştırmaya ilişkin prosedürler, üzerinde durulan verilerdeki
dizi sayısına ve bu dizilerin dağılımına dayanır. Dizi, birbirini takip eden benzer
olay, birim veya sembollerdir. Bir diziden sonra başka olay, birim veya sembol-
lerden oluşan bir başka dizi gelir. Bir dizideki olay, birim veya sembollerin sayı-
sı o dizinin genişliğini ortaya koyar. Bir seride çok fazla sayıda veya çok az sa-
yıda dizi varsa, serinin tesadüfiliğinden şüphelenilir.
Mesela, 10 kişilik bir öğrenci grubu sıra ile sözlü imtihana alınacaktır.
Eğer öğrenciler cinsiyetlerine göre;
E K E K E K E K E K
şeklinde imtihana alınırsa, bu örneğin tesadüfiliğinden şüphelenebiliriz. Bu du-
rumda çok sayıda dizinin (10 dizi) olması yüzünden örneğe birim seçerken sis-
tematik bir prosedürün takip edildiğini söyleyebiliriz. Eğer imtihana çağrılacak
öğrencilerin sırası;
E E E E E K K K K K
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 184

şeklinde olsa, bu durumda da sadece iki dizinin olması yüzünden seçimin tesa-
düfiliğinden bahsedilemez.
Tek örnek dizi sayıları testi, olay, eşya veya sembollerden müteşekkil bir
serinin, tesadüfi bir seçimin sonuçları olup olmadığını anlamada işimize yarar.
Bu analizde kullanılacak veriler, vuku bulma sıralarına göre kaydedilmiş,
başlıca iki kategori tipi içerisinde toplanabilecek bir seri müşahededen oluşmalı-
dır. Eğer toplam müşahede sayısına n dersek, n1, birinci tip müşahede sayısını ve
n2, diğer tip müşahede sayısını gösterir.

Hipotezler
H0: İki müşahede tipinin vuku bulması durumu tesadüfi bir prosesin
sonucudur.
H1: Vuku bulma durumu tesadüfi değildir.

Test İstatistiği
Serideki dizi sayısı, test istatistiğini vermektedir. Test istatistiği r ile gös-
terilir.

Karar
Sıfır hipotezi yön belirtmediği için çift yönlü hipotez testi yapılır. Test is-
tatistiği için alt ve üst kritik değerini belirlememiz gerekir. r değeri, alt kritik de-
ğere eşit veya küçükse sıfır hipotezi reddedilir. Test istatistiği, üst kritik değere
eşit veya büyük olduğunda da sıfır hipotezi reddedilir.
En fazla 20’ye kadar olan n1 ve n2 değerleri itibariyle Tablo 13, alt kritik
değeri ve Tablo 14, üst kritik değeri verir. Her iki tablo da 0.05 önem seviyesine
göre hazırlanmıştır.
n1 ve n2 değerlerinden birisi 20’yi geçtiğinde hipotezlerimizi test etmede
Tablo 13 ve Tablo 14’ü kullanamayız. Bununla birlikte, büyük örnekler için;
r − {[ (2 n 1 n 2 ) / ( n 1 + n 2 )] + 1}
z=
2 n 1 n 2 (2 n 1 n 2 − n 1 − n 2 )
( n 1 + n 2 ) 2 ( n 1 + n 2 − 1)

değeri, H0 hipotezi doğru iken standart normal dağılıma yaklaşır. Belli bir önem
seviyesi için tablodan bulunacak kritik Z değeri, yukarıdaki formül yardımıyla
hesaplanacak z değeri ile karşılaştırılır.
KISA TEORİK BİLGİLER 185

Örnek: Standart 1 kg’lık dolumlar yapan bir paketleme makinesinin bo-


zuk çalıştığı iddia edilmektedir. İddiayı test için, makine ile birbiri peşi sıra 11
paket hazırlanmış ve bu paketler doğruluğu tescil edilmiş bir terazide yeniden
tartıldığında aşağıdaki ölçüm değerleri elde edilmiştir.
1.03 1.07 1.04 1.05 1.01 0.99 1.05 1.07 0.97 0.97 1.08
Bu verilere göre %5 önem seviyesinde paketleme makinesinin doğru tar-
tım yapmadığını söyleyebilir misiniz?
Ölçüm değerlerinden 1 değeri çıkarıldığında bulunacak farkların işaretleri
aşağıdaki gibi olacaktır.
+ + + + + − + + − − +
Eğer makine doğru tartım yapıyorsa ölçüm değerlerinin 1 kg etrafında te-
sadüfi dağılım göstermesi beklenir. Bu durumda kurulabilecek hipotez çifti aşa-
ğıdaki gibi olur.
H0: Eksik ve fazla tartımlar tesadüfidir.
H1: Eksik ve fazla tartımlar tesadüfi değildir.
Seride 5 dizi olduğu için r = 5’tir. Artı işaretli değer sayısı, n1 = 8, eksi
işaretli değer sayısı, n2 = 3’tür. n1 ve n2 değerlerine göre Tablo 13, alt kritik de-
ğerin 2 olduğunu göstermektedir. Test istatistiği kritik değerden büyük olduğu
için %5 önem seviyesinde sıfır hipotezi kabul edilir. Eksik ve fazla tartı yapma
tesadüfi bir prosesin sonucudur ve “Makine doğru çalışıyor.” diyebiliriz.

D) EŞLENİK VERİLERE UYGULANAN İŞARET TESTİ


İşaret testi, özellikle verilerin sıralama ölçeği ile ölçülmüş olması halinde
faydalıdır. Bu şekilde her bir ölçüm çifti arasında, hangi değerin diğerinden bü-
yük olduğunu belirleyebiliriz. Veriler daha güçlü bir ölçekle ölçülmüş ise, daha
güçlü bir testle test edilebilir.
Tek örnek işaret testi ile iki bağımlı örnek durumunda uygulanan işaret
testindeki mantık birbirine benzediğinden, bağımlı iki örnek durumunda uygula-
nacak test prosedürü daha öncekinin tekrarı gibi olacaktır.
Bu prosedürle test edilecek veriler, tesadüfi olarak seçilen (X1, Y1),
(X2, Y2), ......., (Xn, Yn) gibi n adet ölçüm çiftinden oluşmaktadır. Her bir ölçüm
çifti aynı denekler üzerinde yapılmış ölçümlerdir veya en azından bir ya da daha
fazla değişken itibariyle eşlenmiş olan denekler üzerinde yapılmış ölçümlerdir.
Üzerinde durulan değişken, ölçüm çiftleri arasındaki farklılığı ifade eden
Xi − Yi = Di’dir. Hakkında karar verilecek MD parametresi, ölçüm çiftleri arasın-

You might also like