You are on page 1of 121

PARAMETRİK OLMAYAN

TESTLER
GİRİŞ
• Araştırmacılar tarafından toplanan verilerin
başkaları tarafından anlaşılabilmesi ve aynı
yollarla elde edilmiş başka verilerle
karşılaştırılabilmesi gerekliliği, verilerin belli
kurallara göre, tek tek ve dağılımlar halinde
özetlenerek sunulması zorunluluğunu getirmiştir.
Bu amaçla, çeşitli teknikler geliştirilmiştir. Her
araştırma modeli için, uygun bir istatistiksel
model seçilmeli; her istatistik sonucun, kendi
içinde ne ifade ettiği iyi bilinmelidir. (Altunışık
vd., 2012).
GİRİŞ
• Uygun istatistik yöntemin seçilmesi için
değişkenlerin ölçüm özelliklerini iyi
belirlemek gerekir. Kategorik değişkenlere,
sayısal değişkenlerde uygulanabilecek
istatistik yöntemleri uygulamak gibi
hatalara düşülmemelidir.
İstatistiksel Önemlilik
• Bununla birlikte örneklemden eldeki
verilerden elde edilecek sonuçların önemli
olup olmadığını belirlemek amacıyla
önemlilik testleri kullanılabilir. Burada ifade
edilen önemlilik (significancy) elde edilen
sonuçların tesadüfe bağlı olmadığını, yani
istatistiksel açıdan anlamlı olduğunu ifade
eder.
İstatistiksel Önemlilik
• İstatistiksel önemlilik testleri çeşitli durumlarda
ve farklı amaçlarla uygulanır. Bu testlerin başlıca
kullanım alanları şunlardır:
1.Evrenden seçilen tek örneklemden elde edilen
veriler yardımıyla, evren parametresinin belli bir
değere eşit olup olmadığının test edilmesinde,
2.Evrenden seçilen iki ya da daha fazla grup
arasındaki farkın önemli olup olmadığının test
edilmesinde,
İstatistiksel Önemlilik
3.Aynı grupta farklı koşullar altında elde
edilen veriler arasındaki farkın önemli olup
olmadığının test edilmesinde,
4.Bir örnek gruptan elde edilen dağılışın belli
bir teorik dağılışa uygun olup olmadığının
test edilmesinde kullanılır. Yukarda
belirtilen amaçlarla kullanılan çok sayıda
önemlilik testi vardır (Köseoğlu ve Yamak,
2004).
İstatistiksel Önemlilik
• Önemlilik testlerinin seçiminde göz önünde
bulundurulması gereken çeşitli faktörler vardır. Bu
faktörler (Kaptan, 1991);
1. Ölçümle ve sayımla belirtilen veriler farklı dağılış
özellikleri gösterirler. Ölçümle belirtilen veriler sürekli,
sayımla belirtilen veriler ise kesikli dağılış özelliğine
sahiptir. Bu nedenle, genel olarak ölçümle ve sayımla
belirtilen verilerde farklı testler kullanılır.
2. Test edilecek veriler; bir, iki veya ikiden fazla gruba
ayrılmış olabilir. Grup sayısının ikiden fazla olması,
çoklu karşılaştırma olarak kabul edilir. Grup sayısı
uygulanacak testin seçimini etkiler. Örneğin bazı
testler sadece iki grubu karşılaştırabilirken, bazıları
ikiden fazla grubun karşılaştırılmasına izin verir.
İstatistiksel Önemlilik
3. Örneklem büyüklüğü (veri sayısı) da önemli faktörler
arasındadır. Gruplardaki veri sayısı hem
uygulanacak testin seçimini hem de elde edilen test
sonucunun güvenirliğini etkiler. Bazı testlerin
uygulanabilmesi için gruplarda belli sayıda veri
bulunması gerekir.
4. Grupların bağımsızlığı da seçilecek testi belirlemede
etkilidir. Grupların ayrı ayrı bireylerden oluşması ve
bir deneğin seçiminin diğeri ile bağlantılı olmaması
durumunda gruplar bağımsızdır. Aynı bireyler
üzerinde gözlemlerin tekrarlanması ya da bireylerin
tek tek birbirinin eşi olarak seçildiği durumlarda ise
gruplar bağımlıdır. Grupların bağımlı veya bağımsız
olması durumunda uygulanacak istatistiksel testler
birbirinden farklıdır.
Hipotez Testi
• Önemlilik testinde, testin sonunda
varılacak kararla ilgili hipotezler belirlenir.
Bu nedenle, önemlilik testlerine hipotez
testleri de denir. Her testte birbirinin zıddı
hükümler içeren iki hipotez kurulur.
Hipotez Testi
• Temel hipotez H0 hipotezi olup, farksızlık
hipotezi veya sıfır hipotezi adı verilir. Bu hipotez,
örneklemden elde edilen sonuçların tesadüfe
bağlı olduğunu ve istatistiksel açıdan önemli
olmadığını ifade eder
• İkinci hipotez ise H1 hipotezi olup, alternatif
hipotez adını alır. Bu hipotez örneklemden elde
edilen sonuçların tesadüfe bağlı olmadığını, yani
istatistiksel açıdan önemli olduğunu ifade eder.
Hipotez Testi
• Test sonucunda H0 hipotezi kabul veya ret
edilir. Ancak, her iki durumda da kararın
doğru olması kesin değildir. Bu nedenle,
karar verilirken düşülebilecek hataya bir
üst sınır koymak yani anlamlılık düzeyini
(p) belirlemek gerekir (Kaptan, 1991).
Parametrik-Nonparametrik
Ayrımı
• Kurulan hipotezlerin test edilmesi ve önemliliğin
belirlenebilmesi için birçok istatistiksel test
geliştirilmiştir. Bu testler genel olarak parametrik
ve parametrik olmayan testler olarak ikiye ayrılır.
İstatistiksel analiz yapılmadan önce, verilerin
kategorik (nominal, ordinal) ya da sürekli
(aralıklı, oransal) olup olmadığına bakılmalıdır.
Kategorik verilerde parametrik olmayan
istatistikler kullanılırken, sürekli verilerde ise
parametrik istatistikler kullanılır (Büyüköztürk,
2010).
Parametrik-Nonparametrik
Ayrımı
Parametrik testlerin uygulanışında bazı varsayımlar
öngörülür. Bu varsayımlar;
• Evrenin normal dağılıma uyması,
• Varyansların homojen olması,
• Deneklerin evreden rasgele seçilmiş olması,
• Deneklerin birbirinden bağımsız olması,
• Örneklem büyüklüğünün yeterli olması
• Verilerin sürekli olması
• Grup varyanslarının eşit olması
• Verilerin en az eşit aralık ölçeğinde olması şeklinde
sıralanabilir (Büyüköztürk vd., 2011).
Parametrik-Nonparametrik
Ayrımı
• En kuvvetli ya da en güçlü testler,
kapsamlı varsayımları olan testlerdir.
Parametrik testler kullanılışlarını belirleyen
güçlü pek çok varsayıma sahiptirler. Bu
varsayımlar geçerli olduğu takdirde, bu
testler de parametrik olmayan testlere
göre daha güçlü olmaktadır.
Parametrik-Nonparametrik
Ayrımı
• Parametrik olmayan testlerin uygulanmasında
ise varsayımlar öngörülmez. Bu testler için
yalnız gözlemlerin bağımsızlığı ve rastgele
seçilmeleri gibi varsayımlar öngörülmesine
karşın, bunlar parametrik testlerdeki
varsayımlardan daha az ve daha zayıftır.
Parametrik olmayan testin uygulandığı
değerlerin kuvvetli bir ölçme tekniği ile
ölçülendirilmesi gerekmez. Bu testler, sıralayıcı
ölçekteki ve sınıflayıcı ölçekteki değerlere
uygulanabilir (Baykul ve Güzeller, 2013).
Parametrik-Nonparametrik
Ayrımı
• Parametrik olmayan bir test, örneğin alındığı
toplumun parametreleri hakkında koşulları
belirlemeyen bir testtir. Parametrik olmayan test,
ölçü yerine sıralama, sayma, işaretleme gibi
işlemlerin kullanıldığı testtir. Paramerik testlerde
normal dağılım gösteren veriler analiz edilir,
nonparametrik testlerde ise nominal, ordinal ya
da normal dışı dağılım gösteren sayısal veriler
değerlendirilir. Bir testin uygulanabilmesi için
gerekli koşulların ne olduğu veya koşulların
sağlanıp sağlanamadığı bilinmiyorsa verilerin
analizinde nonparametrik testler kullanılmalıdır.
(Field, 2009).
Parametrik-Nonparametrik
Ayrımı
• Parametrik olmayan testlerin kullanılabileceği
durumlar şunlardır:
• Parametrik test varsayımının yerine
getirilemediği durumlarda,
• Testte kullanılacak değerler yerine bu değerlerin
sıra numaralarının verildiği durumlarda,
• Testte kullanılacak örneklerin küçük hacimli
olduğu durumlarda kullanılır (Büyüköztürk vd.,
2011).
Parametrik-Nonparametrik Ayrımı
Parametrik testler Parametrik olmayan testler
Örneklem büyüklüğü ile ilgili Evren-örneklem ile ilgili koşullar
koşullar sağlanmalıdır aranmaz

Nicel veriler için daha Niteliksel veriler için uygun


uygundur
Parametrik olmayan Hassasiyeti parametrik testlerden
testlerden daha hassastır. daha düşüktür

Elle hesaplanması daha Analizler daha kolay yapılıp


zordur anlaşılır
Normal dağılımı gerektirir Normal dağılımı gerektirmez
Uç değerlerden etkilenir Sıralanmış seriler kullanılır
dolayısıyla uç değerlerden
etkilenmez.
Parametrik Olmayan Testlerin
Kullanılabileceği Durumlar
Nonparametrik testler genellikle anlaşılması
ve uygulanması kolay olan testlerdir. Bu
testler aşağıdaki durumlarda kullanılır.
• Eldeki veriler sıralı ölçeklenmişse (ordinal),
• Veriler sınıflama ölçeğinde ise (nominal),
• Araştırmada örneklem hacmi küçükse,
• Dağılım normal değilse,
• Parametrik testlerin varsayımlarının
sağlanamadığı durumlarda kullanılır.
Parametrik Olmayan Testlerin
Kullanılabileceği Durumlar
• Nonparametrik testler parametrik testlere göre
daha zayıftırlar. Parametrik testlerle normal
dağılım gösteren sayısal verilerin analizi
yapılabilir.
• Eğer koşulların sağlanıp sağlanmadığı
bilinmiyorsa, verilerin analizinde nonparametrik
test kullanılması daha güvenli olur. Ancak
parametrik test için gerekli koşulların
sağlanmasına karşın nonparametrik test
uygulanması halinde, parametrik testlerin kendine
özgü avantajlarından yararlanılmamış olur. Bunun
için öncelik parametrik testlere verilmeli ve
varsayımların sağlandığı kontrol edilmelidir
(Sümbüloğlu ve Sümbüloğlu, 2003).
Parametrik Olmayan Testlerin
Avantajları
Parametrik olmayan testlerin avantajları şu şekilde
sıralanabilir (Kalaycı, 2006);
• Parametrik olmayan testler, varsayımlara
dayanmadığından uygulanmasında hata yapma
olasılığı düşüktür.
• Analizlerin elle hesaplanması küçük
örneklemlerle çalışıldığında kısmen kolaydır.
• Anlaşılması parametrik testlere oranla daha
basittir.
• Sıralayıcı yada dereceli ölçeğe göre
ölçülendirilmiş veriler gibi zayıf ölçekle
oluşturulmuş verilere uygulanabilir
Parametrik Olmayan Testlerin
Avantajları
• Sınıflandırma şeklinde ölçülendirilen verilere
uygulanır. Bu tür verilere parametrik testler
uygulanamaz.
• Nitel verilere uygulanabilir.
• Parametrik olmayan testler, orijinal serilerden
ziyade, ranklarla (sıralanmış serilerle) yapılır;
dolayısıyla aşırı değerlerden etkilenmez.
• Dağılımın şekli hakkındaki varsayımların
(normallik, homojenlik) şüpheli olduğu
durumlarda uygulanabilir
Parametrik Olmayan Testlerin
Dezavantajları
Parametrik olmayan testlerin dezavantajları şu
şekilde sıralanabilir (Kalaycı, 2006);
• Eldeki verilerden alınacak sonuçlarda parametrik
testlere göre bilgi kaybına sebep olur.
• Örneklem büyükse elle hesaplamalar zaman
alıcı olmaktadır.
• Bu tür testlerin uygulanmasıyla elde edilen
sonuçlar, parametrik testlerin uygulanmasıyla
elde edilen sonuçlardan daha az güvenilirdir.
Parametrik Olmayan Test
Çeşitleri
Parametrik olmayan testler evren dağılımı
hakkında hiçbir varsayım yapmayan testlerdir.
Bu araştırmada birçok parametrik olmayan test
belirlenmiş olup araştırmacılar tarafından en sık
kullanılan testler incelenmiştir. Bu testler
aşağıda sıralanmıştır:
• Binom Testi
• İşaret Testi
• McNemar Testi
• Wilcoxon İşaretli Sıra Toplamı Testi
• Tek Örneklem Kay Kare Testi (Ki-kare Uyum
İyiliği Testi)
• Ki-kare Bağımsızlık Testi (İki Değişken İçin Kay-
Kare Testi)
Parametrik Olmayan Test
Çeşitleri
• Diziler (Runs) Testi
• Wald Wolfovitz Sıra Testi
• Mann-Whitney U Testi
• Kruskal-Wallis Testi
• Mood Medyan Testi
• Friedman Testi
• Kendal W Testi
• Cochran’s Q Testi
• Tek Örneklem Kolmogorov-Smirnov Testi
• Çift Örneklem Kolmogorov-Smirnov Testi
• Spearman’ın Rank Order Korelasyonu
(Parametrik Olmayan Korelasyon Testi)
Parametrik Testlerin Parametrik
Olmayan Testlerdeki Karşılığı
Parametrik Test Parametrik Olmayan Test
• Evren ortalaması önemlilik testi İşaret testi
(Unpaired t test)
• İki ortalama arasındaki farkın Mann – Whitney
U önemlilik testi
(Paired t test)
• İki eş arasındaki farkın Wilcoxon T testi
önemlilik testi
• İki yüzde arasındaki farkın Ki-kare testi
önemlilik testi
• Varyans analizi (tek yönlü) Kruskal – Wallis
Aşağıda sıklıkla kullanılan parametrik ve parametrik olmayan testler ile ilgili kavram haritasına yer verilmiştir.

(Işık, 1995)
Binom Testi
• Binom modeli, istenilen sonucun olma olasılığı p iken, n
bağımsız denemede tam adet istenilen sonucun olması
olasılığını veren modeldir. Binom testi ise sınıflama
ölçeğiyle veri toplanmış bağımlı değişken için kullanılır.
Bağımlı değişken hakkındaki veriler iki düzeylidir
“binomial”, örneğin cinsiyet için Erkek-Kadın biçiminde.
• Mevcut verilerin öngörülen bir sayıdan/yüzdeden farklı
olup olmadığını test etmek için kullanılır. Veriler
sınıflama ölçeği düzeyinde toplanmış ve değişken 2
düzeyli ise verilerin dağılımının öngörülen bir yüzdeden
farklı olup olmadığını belirlemek için binom test
kullanılır (Sümbüloğlu ve Sümbüloğlu, 2003).
Binom Testi

• Örnek Uygulama:
• “Performans Değerlendirme.spss” veri dosyasını
kullanarak katılımcıların cinsiyete göre dağılımının
%50’den (yani 0,5) farklı olup olmadığını test etmek için
binom test kullanılır.
Binom Testi

• Katılımcıların cinsiyete göre dağılımı 65 erkek (%47) 72


kadın (%53) şeklindedir. Ancak aradaki fark istatistiksel
açıdan anlamlı değildir (p = 0,608). Yani şansa bağlı
olarak bu şekilde bir oranın çıkması muhtemeldir. Sıfır
hipotezi kabul edilir. Katılımcıların cinsiyete göre
dağılımında istatistiksel açıdan anlamlı bir fark yoktur.
Başka bir deyişle, cinsiyete göre dağılım hipotezde
öngörülen %50’den farklı değildir.
Binomial Test

Observed Asymp. Sig.


Category N Prop. Test Prop. (2-tailed)
cinsiyet Group 1 erkek 65 ,47 ,50 ,608 a
Group 2 kadin 72 ,53
Total 137 1,00
a. Based on Z Approximation.
İşaret Testi
• Bir örneklemde nicel veriler elde edilmiş,
fakat veriler parametrik varsayımları yerine
getirmiyorsa, evren ortancasının belli bir
değere eşit olup olmadığını test etmek
amacıyla işaret testi kullanılabilir. Bu test
bağımlı gruplar arası farklılıkları ölçmeye
yönelik olan “Evren Ortalaması Önemlilik
Testinin (t-testi)” non-parametrik
eşdeğeridir.
İşaret Testi
• Bu analiz ile, iki değişkenin dağılımları aynıdır
hipotezi test edilmektedir. İşaret testi adını,
değerleri sayısal olarak kullanma yerine (+) ve (-)
işaretleri kullanılmasından alır. Sayısal ölçüler
kullanmanın mümkün olmadığı, buna karşın,
a) Birimlerden elde edilen gözlem sonuçlarının bir
kritere göre iyi ve kötü (+ ve -) şeklinde
belirtilebildiği durumlarda,
b) Eşleştirilmiş örneklerde gözlem çiftlerinin kendi
aralarında üstünlüklerinin ölçülebildiği (xy ya da
x y) durumlarda
c) Bir toplumdan seçilen n birimli örneklerin,
ortanca değeri Mo gibi bir toplumdan gelip
gelmediklerinin test edilmeleri durumunda bu test
kullanılır (Sümbüloğlu ve Sümbüloğlu, 2003).
İşaret Testi
• Bu testte gözlem sonuçları (+) ve (-) işaretlere
dönüştürüldüğü gibi, olumlu-olumsuz, iyi-kötü
gibi iki kategori şeklinde de belirtilebilir. Bu
durumda az sayıda görülen işaretin olasılığı
yerine az sayıda görülen kategorinin olasılığı
hesaplanır. Bu kategorileri A ve B şeklinde
belirtirsek sıfır hipotezi olarak,
Ho : A kategorisi elde etme olasılığı, B kategorisi
elde etme olasılığına eşittir.
H1 :A kategorisi elde etme olasılığı, B kategorisi
elde etme olasılığına eşit değildir.
İşaret Testi
Örnek Uygulama:
• Fen bilimleri eğitimi alan bireyler ile sosyal
bilimler eğitimi alan bireyler arasında farklılık
bulunduğu düşünülmektedir. Bu savı denetlemek
için biri fen eğitimi diğeri sosyal eğitimi alan 12
çift ikiz denek olarak seçilmiş ve sosyal sorunları
değerlendirme puanları belirlenmiştir. Puanların
eğitime göre anlamlı bir biçimde farklılaşıp
farklılaşmadığı incelenecektir.
İşaret Testi
Ho : fen eğitimi alanların puanları sosyal
eğitimi alanların puanlarına eşittir eşittir.
H1 :fen eğitimi alanların puanları sosyal
eğitimi alanların puanlarından farklıdır.
İşaret Testi
• Analiz sonuçlarına göre p değeri ,05 düzeyinde
anlamlı çıkmamıştır (p=,388). Buna göre fen
eğitimi alanlar ile sosyal eğitimi alanların sosyal
sorunlara duyarlılığı arasında anlamlı bir fark
bulunmamaktadır. Bireyler eğitim alanlarına
bakılmaksızın toplumsal sorunlara aynı
duyarlılığı göstermektedir.
Test Statistics b

sosyalbilim -
fenbilim
Exact Sig. (2-tailed) ,388 a
a. Binomial distribution used.
b. Sign Test
McNemar Testi
• Mc Nemar testi ikili biçimde sınıflandırılan ve
birimlerin bir konudaki ilk görüşlerinin farklı
zaman ya da uygulamadan sonra değişme
gösterip göstermediği, eğilim ve görüşlerde test
öncesi ve sonrası değişmelerin önemliliği test
edilir.
• Sınıflamalı ya da sıralı ölçekli eşleştirilmiş ikili
verilerin analizinde kullanılır. Bu test ile önceki
ve sonraki durum arasında arada geçen sürede
(uygulanan deneysel yöntemler süreci) değişim
(farklılaşma) olup olmadığı belirlenir.
McNemar Testi
• McNemar testi önce olumlu oldukları halde
sonra olumsuz olan çiftler ile önce olumsuz
oldukları halde sonra olumlu olan çiftlerin
sayısını dikkate alarak analiz yapar (Özdamar,
1999).
2x2 tablosunda;
A=Önce olumlu iken sonra olumsuz olan birey
sayısı
B= Önce olumsuz iken sonra olumlu olan birey
sayısı olmak üzere
McNemar test istatistiği=(A-B)X(A-B)/(A+B)
formülüyle hesaplanır.
Eğer önceki ile sonraki uygulamada değişiklik
gösteren birim sayısı (A+B) 30’dan küçük ise;
=(A-B-1)X(A-B-1)/(A+B)
McNemar Testi
Örnek Uygulama:  

• 30 bireyin önteste Sontest puanları

vermiş oldukları
olumlu ve olumsuz Ontest puanları

cevap dağılımlarının Olumlu 1


Olumlu 1 Olumsuz 2 toplam

belli bir eğitim 13 8 21

aldıktan sonraki Olumsuz 2

değişimi 6 3 9

incelenecektir. Toplam
19 11 30
McNemar Testi
SPSS Menüsünden
• Data -> Weight Cases
seçilir ve frekans
değişkeni ağırlık
olarak tanımlanır.
• Analyze ->
Nonparametric tests->
2-Related Samples
seçilir.
• Test (pairs) list
alanına öntest ve
sontest aynı anda
seçilip ikili olarak
taşınır.
• Test type
seçeneğinden
“McNemar” seçilir.
• OK seçeneğine
basılır.
• Öntest ve sontest sonuçları arasında ,05
düzeyinde anlamlı bir fark ortaya
çıkmamıştır (p=,791). Öntest sonuçları ile
sontest sonuçları arasında önemli
düzeyde değişme olmamıştır.
Test Statistics b

ontest &
sontest
N 30
Exact Sig. (2-tailed) ,791 a
a. Binomial distribution used.
b. McNemar Test
Wilcoxon İşaretli Sıra Toplamı
Testi
• Bu testte, bağımlı iki ana kütle aritmetik
ortalamasının belirli bir önem derecesinde
birbirinden önemli derecede farklı olup olmadığı
test edilir (Özdamar, 1999).
• Bu testin ana ilkesi, değerlere sıra dönüşümü
uygulanmasıdır. Bu testte bağımlı iki grubun
ortalamaları değil, ortancaları arasındaki farkın
önemli olup olmadığı test edilir. Genel olarak,
normal dağılım göstermeyen değerler için
Wilcoxon testi, t testine göre daha güçlüdür, yani
önce ve sonra değerleri arasında fark varsa,
daha doğru olarak saptar (Field, 2009).
Wilcoxon İşaretli Sıra Toplamı Testi
• Bu testte, bir gruptan iki ayrı işlem sonucu elde
edilen puanların her bir çifti için bir (dt) fark
bulunur. Bu farklar, işaretleri göz önüne
alınmaksızın en küçükten başlayarak sıraya
konur. Sıfır olan farklar analizden çıkarılır. Aynı
puana sahip dt'ler varsa, bunlara almaları
gereken sıraların ortalaması sıra olarak verilir.
Sıralamadan sonra fark işaretleri (-) ve (+) olarak
konulur.
• Eğer gruptan elde edilen iki işlem puanları
eşitse, yani Ho doğru ise, pozitif di'ler ve negatif
di'ler toplamı hemen hemen birbirine eşit
olacaktır. Fakat pozitif di'lerin toplamı negatif
di'lerin toplamından çok fazla farklıysa iki işlemin
birbirlerinden farklı oldukları sonucuna varılır. Ho
reddedilir. Ya da, pozitif (ya da negatif) dt'lerin
toplamı çok küçükse Ho reddedilir.
Wilcoxon İşaretli Sıra Toplamı
Testi
• Eşleştirilmiş deneylerde sıra toplamı ile ilgili
olasılıklar, olasılık yasaları kullanılarak
hesaplanabilir. (-) ve (+) farklarına ait sıra
toplamlarının (T) küçük olanının, Ho hipotezinin
doğrultusunda çift sayısına (n) göre belirli bir
değere eşit ve ondan küçük (ya da büyük) olma
olasılıkları tablolar halinde hazırlanmıştır.
Bununla ilgili olarak çift sayısı n ve anlamlılık
düzeyi 'ne göre T'nin bir ve iki yanlı kritik
değerleri bulunabilir. n, farkı sıfır oluşan çiftlerin
sayısıdır. Örnekteki eşlerin sayısına (n) göre test
iki şekilde yapılır (Özdamar, 1999).
Wilcoxon İşaretli Sıra Toplamı
Testi
• Küçük örnekler için (25’ten küçük) hazırlanmış
tabloda T'nin kritik değerleri verilmiştir. T, aynı
işareti (pozitif yada negatif) taşıyan sıra
toplamlarından küçük olanın değeridir. Tabloya
göre verilen bir n değeri ve düzeyine göre,
örnekten hesaplanan T değeri tablodaki kritik
değere eşit yada ondan küçükse Ho hipotezi
anlamlılık düzeyinde reddedilir.
Wilcoxon İşaretli Sıra Toplamı
Testi
• Eğer örnekte, farkı sıfır olan (di=xi-yi=0) çiftler
varsa bunlar çıkarıldıktan sonra diğer çiftlerin
sayısı n olarak alınır. Farklar sıraya konulduktan
sonra birbirlerine eşit olan farkların sıra
numarası, bu farkların içinde bulundukları sıra
sayılarının ortalamasıdır. Örneğin, eğer üç tane
fark birbirine eşitse ve bunlar 3., 4. ve 5.
sıralarda bulunuyorsa bunların sıra sayıları,
(3+4+5)/3=4 olacaktır. Bunlardan sonra gelen
farkın sıra sayısı da 6 olacak, 3. ve 5. sıra
sayıları sıralamada yer almayacaktır
(Sümbüloğlu ve Sümbüloğlu, 2003).
Wilcoxon İşaretli Sıra Toplamı
Testi
• Büyük ( 25’ten büyük ) örnekler için T, normal
dağılıma yakın bir dağılım verir. Buna göre
gözlenen T değerinin birim normal dağılımdaki
değeri Z formülü ile bulunur. Elde edilen Z değeri
bir ve iki yanlı Z tablolarındaki kritik değerlerle
karşılaştırılarak hipotez kontrol edilir.
Wilcoxon İşaretli Sıra Toplamı Testi
Örnek Uygulama
• Rasgele seçilen 8 bireyin X girişimi ile ilgili öntest ve
sontest X puanları arasındaki fark önemli midir?
• SPSS Menüsünden
• Analyze -> Nonparametric tests-> 2-Related Sample
seçilir.
• Test (pairs) list alanına öntestW ve sontestW aynı anda
seçilip ikili olarak taşınır.
• Test type seçeneğinden “Wilcoxon” seçilir.
• OK seçeneğine basılır.
Wilcoxon İşaretli Sıra Toplamı
Testi
• Analiz sonucunda z=-,423 ve P=,67
çıkmıştır. ,05 anlamlılık düzeyinde p değeri
anlamlı değildir. Rasgele seçilen 8 bireyin X
öntest ve sontest puanları arasında manidar fark
bulunmamaktadır.
Ranks Test Statistics b

N Mean Rank Sum of Ranks


sontestW - ontestW Negative Ranks 3a 3,83 11,50
sontestW -
Positive Ranks 4b 4,13 16,50 ontestW
Ties 1c Z -,423 a
Total 8 Asymp. Sig. (2-tailed) ,672
a. sontestW < ontestW
a. Based on negative ranks.
b. sontestW > ontestW
c. sontestW = ontestW
b. Wilcoxon Signed Ranks Test
Ki-kare Testi
• Ki-kare çok yaygın kullanılan bir analiz biçimidir.
Birçok istatistiksel analizin temelini oluşturur. Bu
yaygın kullanımın en önemli nedenleri, çok basit
bir analiz türü olması, varsayımlarının azlığı ve
çok güçsüz ölçeklerde ölçülmüş verilere
uygulanabilmesidir.
• Bağımsız iki grup oranının karşılaştırılmasında
en sık kullanılan testtir. Ki-kare testinde bir
nominal değişkenin diğer bir nominal değişkenle
ilişkili olup olmadığı araştırılır. Değişkenlerden
birinin ya da ikisinin ordinal olduğu durumlarda
da ki-kare testi uygulanabilir.
Ki-kare Testi
• Ki-Kare Testinin Kullanıldığı Yerler
1-Örnekleme ya da tam sayım ile elde edilen bir
veri kümesinin belirli bir teorik dağılıma uygun
olup olmadığının araştırılmasında kullanılır.
2-İki olay arasında bağımsızlığın olup olmadığının
araştırılmasında kullanılır.
3-İki veya daha fazla örneğin aynı kitleden gelip
gelmediğinin araştırılmasında kullanılır (Field,
2009)
Ki-kare Testi
• Ki-Kare testinde amaçlanan;
1-Örnek değerlerinin dağılımının
belirli bir teorik dağılıma uyma derecesinin
saptanması (uygunluk testi) ve
2-İki veya daha fazla nitelik esas
alınarak sınıflandırılan veriler değerlenerek
bu nitelikler arasındaki ilginin derecesinin
belirlenmesidir (bağımsızlık testi).
Ki-kare Testi
• Ki-Kare Testinin Kullanılmasında Dikkat Edilecek
Noktalar
1-Testlerde kullanılacak değerler mutlak sayılar
olup, oranlar olmaz.
2-Her bir gözlem diğerinden bağımsız olmalıdır.
3-Ki-kare testinde beklenen frekansların sayısal
büyüklüğü önemlidir. Beklenen frekansların en
çok yüzde yirmisinin 5’ten küçük olmasına izin
verilir. Bu sorunu çözmenin en basit yolu
kategorileri birleştirmektir.
4-Gözlem sayısı 50 den az ve 1 serbestlik dereceli
örneklerde yates düzeltmesi yapmak gerekir.
5-Beklenen frekansların hiçbiri sıfır değerini almaz
(Büyüköztürk vd., 2011).
Ki-kare Testi
Ki-kare testinin varsayımları
• Ki-kare testinin en önemli varsayımı, oranların
karşılaştırıldığı grupların bağımsız olmasıdır. Ki-
kare testinin uygulanabilmesi için beklenen
sayıların çok küçük olmaması gerekir.
Gözlerdeki beklenen sayılardan herhangi birinin
2’den küçük ya da gözlerin yarısından
çoğundaki beklenen sayıların 5’ten küçük olması
durumunda ki-kare testinin yapılması doğru
değildir (Işık, 1995).
Ki-kare Testi
• Gözlenen sayılar 5’ten küçük olsa bile, beklenen
sayılar yeterince büyükse ki-kare testi
yapılabilir.2x2’den daha büyük ki-kare
tablolarda, 5’ten küçük frekanslar nisbeten daha
az sorun oluşturduğundan, hiçbir beklenen
frekans 1’den küçük olmamalı ve beklenen
frekansların %20’den fazlası 5’ten küçük
olmamalıdır. Bu mümkün değilse, beklenen
frekansları büyütmek için, satır ya da sütun
kategorileri bazen birleştirilebilir. Böylece,
denekler daha az sayıda kategori içinde
gruplandırılarak hücre sayısı azaltılabilir.
Gözlenen frekanslar ile ilgili herhangi bir
varsayım yapılmaz (Büyüköztürk, 2010).
Ki-kare Testi
2x2’lik tablolar için ki-kare düzeltmesi
• 2x2’lik çapraz tablolarda ki-kare testi ile elde
edilen ki-kare değerinde güvenilirliği arttırmak
için devamlılık düzeltmesi ya da Yates
düzeltmesi denen bir hesaplama ile değişiklik
yapılması önerilmektedir. Bu durumda düzeltme
yapılmadan hesaplanan değerden daha küçük
bir ki-kare değeri elde edilir. Ki-kare değeri
küçülünce, p değeri büyür ve iki değişken
arasında ilişki bulmak zorlaşır. 2x2’lik çapraz
tablolarda beklenen değerin birinin 2’den küçük
olması durumunda Fisher testi yapılması bir
zorunluluktur.
Ki-kare Testi
• 2x2’lik ki-kare tablosunda, beklenen
frekanslardan biri 5’ten küçük olduğu taktirde
uygulanabilecek çözümler ve uygulamadaki
tercih sıraları şu şekildedir:
1.Beklenen frekansları büyütmek için, daha büyük
veri seti kullanılabilir.
2. 2x2’lik düzende “Devamlılık düzeltmeli ki-kare
istatistiği” ya da çoğunlukla aynı anlamda
kullanılan “Yates düzeltmeli ki-kare istatistiği”
kullanılabilir.
3. 2x2’lik düzende Fisher kesin ki-kare testi
uygulanabilir (Büyüköztürk vd., 2011).
Ki-kare Testi
Fisher kesin (tam) ki-kare testi
• Beklenen sayılar küçükse, ki-kare testi yerine
Fisher kesin ki-kare testi uygulanabilir. Fisher
testinde t, F, c2 gibi bir test istatistiği yoktur.
Doğrudan p değerini verir. Elle hesaplanması
oldukça zordur. Ki-kare testi ile 2x2’den büyük
çapraz tablolar için de değişkenler arası ilişki
analizi yapılabilirken, Fisher testi yalnız 2x2’lik
çapraz tablolarda kullanılabilir (Leech vd., 2005).
Tek Örneklem Kay Kare Testi (Ki-
kare Uyum İyiliği Testi)
• Ki-kare uyum iyiliği testi 1903’te Karl Pearson
tarafından önerilmiştir. Ronald Fisher testi
geliştirmiş ve 1924’te ki-kare kritik değerleri
yayınlanmıştır. Gözlenen frekansların teorik
beklenen frekanslara uyup uymadığının
araştırılmasında kullanılır. Bir değişkenin
düzeylerine giren birey ya da nesnelerin anlamlı
bir farklılık gösterip göstermediğini test eden tek
örneklem için uygulanır. Test gerçekte,
değişkenin her bir kategorisinde gözlenen
sayıların, kategoriler için beklenen sayılardan
farkının anlamlılığını inceler.
• Gözlenen ve beklenen değerler arasındaki fark
azaldıkça, yani birimlerin kategorilere olan
dağılımının uyum düzeyi arttıkça, hesaplanan
kaykare istatistiğinin anlamlı çıkma olasılığı
düşecektir. Bu testin kullanılabilmesi için,
beklenen değeri beşten küçük olan kategori
sayısının, toplam kategori sayısının %20’sini
aşmaması ve tüm kategorilerde bu değerin
birden büyük olması gerekir (Büyüköztürk,
2010).
Tek Örneklem Kay Kare Testi (Ki-
kare Uyum İyiliği Testi)
Örnek Uygulama:
Araştırma Sorusu: Çocukların tercih ettikleri oyun
türleri arasında anlamlı farklılık var mıdır?”
SPSS İşlem adımları;
• Analyze/ Nonparametric Tests/ Chi Square
komutu seçilir.
• “oyun” değişkenini “test variable list” kutusuna
atılır.
• OK tıklanır
Tek Örneklem Kay Kare Testi (Ki-
kare Uyum İyiliği Testi)
Tek Örneklem Kay Kare Testi (Ki-
kare Uyum İyiliği Testi)
• Çocukların 11’i fiziksel, 7’si küp, 2’si dramatik
türden oyun oynamıştır. Çocukların tercih ettikleri
oyun türleri arasında
2
gözlenen fark anlamlı
bulunmuştur (  =6,10, sd=2, p=,05)

oyun Test Statistics

Observed N Expected N Residual oyun


Chi-Square a 6,100
Fiziksel 11 6,7 4,3
df 2
Kup 7 6,7 ,3 Asymp. Sig. ,047
Dramatik 2 6,7 -4,7 a. 0 cells (,0%) have expected frequencies less than
Total 20 5. The minimum expected cell frequency is 6,7.
Ki-kare bağımsızlık testi (İki Değişken
İçin Kay-Kare Testi)
• Öncelikle 2x2’lik ki-kare
bağımsızlık testi uygulaması
gerçekleştirilecektir. koruma

Örnek Uygulama:
Total
• X hastalığına karşı 1,00 2,00

korunmada A aşısı asi 1,00

geliştirilmiştir. Rasgele 368


246 122
seçilen 780 bireyden
bazılarına A aşısı bazılarına
yalancı aşı (plesabo) 2,00

verilmiştir. 1 yılın sonunda X 125 287 412

hastalığına yakalanıp
yakalanmama durumlarında Total
371 409 780
yapılan aşıya göre anlamlı
farklılık oluşup oluşmadığı
incelenmiştir.
• SPSS Menüsünden
• Data -> Weight Cases seçilir ve frekansX
değişkeni ağırlık olarak tanımlanır.
• Analyze -> Descriptive Statistics->
Crosstabs seçilir.
• Rows kısmına aşı ve columns kısmına
koruma değişkeni taşınır.
• Statistics kısmından “Chi-square” seçilir.
• OK seçeneğine basılır.
• En küçük beklenen değer 25’ten büyük olduğu için
yorumlamak için pearson ki-kare değeri dikkate alınır.
Aynı zamanda likelihood ratio da dikkate alınabilir 2

(Özdamar, 1999). Çıktıya göre = 103,877, sd=1,


p=0,000 geliştirilen A aşısı X hastalığına karşı
koruyuculuğu plesaboya göre anlamlı farklılık
göstermektedir. Tablo incelendiğinde ise A aşısının
plesaboya göre önemli düzeyde yüksek koruyuculuk
oranına sahip olduğu anlaşılmaktadır.
Chi-Square Tests

Asymp. Sig. Exact Sig. Exact Sig.


Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square 103,877 b 1 ,000
Continuity Correctiona 102,418 1 ,000
Likelihood Ratio 106,211 1 ,000
Fisher's Exact Test ,000 ,000
Linear-by-Linear
103,744 1 ,000
Association
N of Valid Cases 780
a. Computed only for a 2x2 table
b. 0 cells (,0%) have expected count less than 5. The minimum expected count is
175,04.
• Burada yates düzeltmesi sonucu
( =102,418, sd=1, p=0,00) da anlamlı
çıkmıştır. Ancak düzeltmeye ihtiyaç yoktur.
Benzer biçimde beklenen frekanslardan
hiç biri 5’in altında çıkmadığı için fisher
testi sonucu da dikkate alınmaz (p=0,00)
ancak bu testin sonucu da anlamlı
çıkmıştır.
Şimdi de RxC’lik ki-kare bağımsızlık testi
uygulaması gerçekleştirilecektir.
• 2x2’den büyük çapraz tablolar için ki-kare
testi 2X2’den büyük çapraz tablolarda da
iki nominal değişkenin arasında ilişki olup
olmadığı ki-kare testi ile incelenebilir. 
• Beklenen sayılar küçükse, 2X2’ den büyük
çapraz tablolarda ki-kare testi kullanılabilmesi
için de, gözlerin hepsindeki beklenen sayıların 2
ya da daha büyük ve yarısı ya da daha
fazlasındaki beklenen sayıların 5 ya da daha
büyük olması gerektiğinden ve Fisher testi yalnız
2x2’lik çapraz tablolarda kullanıldığı için, bu
koşulun sağlanamadığı durumlarda sıra ve
sütunu oluşturan grupların birleştirilmesi yoluna
gidilmelidir. 2x2’lik çapraz tablo oluşana kadar
kategori birleştirmeye devam edildiği halde
beklenen değerler küçük kalıyorsa, Fisher
testine geçilmelidir (Özdamar, 1999).
Örnek Uygulama: kadinED

• Türkiye’de eşlerin Total

birbirlerini
1,00 2,00 3,00
erkekE 1,00

seçmelerinde eğitim D
26 9 2
37

durumlarına göre
anlamlı bir farklılık 2,00
94
42 30 22
oluşup oluşmadığı
incelenmiştir 3,00
6 32 45 83

Total
74 71 69 214
SPSS’te RxC (3X3) ki-kare bağımsızlı testini
uygulamak için
SPSS Menüsünden
• Data -> Weight Cases seçilir ve frekansED
değişkeni ağırlık olarak tanımlanır.
• Analyze -> Descriptive Statistics-> Crosstabs
seçilir.
• Rows kısmına ErkekED ve columns kısmına
KadınED değişkeni taşınır.
• Statistics kısmından “Chi-square” seçilir.
• OK seçeneğine basılır.
• En küçük beklenen değer=11,93 ve hiçbir gözde
beklenen değer 5’ten küçük olmadığından yorumlamak
için pearson ki-kare değeri dikkate alınır. Aynı zamanda
likelihood ratio da dikkate alınabilir (Özdamar, 1999).
Çıktıya göre  = 58,974, sd=4, p=0,000 eşlerin eğitim
2

durumlarının birbirine önemli oranda bağımlı olduğu ve


evli erkekler ile kadınların eğitim durumlarının birbiriyle
uyumlu olduğu ortaya çıkmıştır.
Chi-Square Tests

Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 58,974 a 4 ,000
Likelihood Ratio 66,847 4 ,000
Linear-by-Linear
55,582 1 ,000
Association
N of Valid Cases 214
a. 0 cells (,0%) have expected count less than 5. The
minimum expected count is 11,93.
Diziler (Runs) Testi

• Dizilim farklı elemanlar tarafından takip edilen veya


kendinden önce farklı elemanlar bulunan ya da
kendinden önce veya sonra hiçbir eleman bulunmayan
benzer elemanların oluşturduğu bir sıradır (Dowdy vd.,
2004).
Durum 1: S|E|S|E|S|E|S|E|S|E|S|E|S|E|S|E|S|E|S|E : R =
20 Açıkça Rastsal Değil
Durum 2: SSSSSSSSSS|EEEEEEEEEE : R = 2 Açıkça
Rastsal Değil
Durum 3: S|EE|SS|EEE|S|E|SS|E|S|EE|SSS|E : R = 12
Belki Rastsal
Diziler (Runs) Testi

• Bir veri setinde; değerlerin gözlenme sırasına


göre ard arda gelişlerinde ortalamadan küçük ya
da büyük olma durumlarına göre oluşturdukları
kümelere dizi (run) adı verilir. Gözlenen küme
sayısı (run) r ile beklenen ortalama dizi sayısı
arasındaki fark test edilir.
• Diziler testi iki yönlü bir testtir. Verilen ortalama
değerlerine göre dizinin sağa ya da sola eğilim
gösterip göstermediğini test etmeye yarar.
Diziler (Runs) Testi
Örnek Uygulama
• 10 öğrenci sıra ile sözlü sınavına alınmış ve sorulan 20
sorudan doğru cevapladıkları soru sayıları belirlenmiştir.
Öğrencilerin sınava giriş sırası soruların doğru
cevaplanma sayısını etkilemekte midir? Her öğrencinin
ortalama kadar soruya doğru cevap vermesi ve sınava
giriş sırası ilişkili midir?
Diziler (Runs) Testi
• Hem median (medyan) hem de mean (ortalama)
için yapılan analiz sonuçları incelendiğin de sig
değerleri (p=1,00 ve p=,361) ,05 düzeyinde
anlamlı çıkmamıştır. Buna göre verilerin ard arda
gelişlerinin rasgele olduğu, öğrencilerin sınava
alınış sıralarının notlarının rasgeleliğini
etkilemediği anlaşılmaktadır.

Runs Test Runs Test 2


dogrucevap dogrucevap
Test Value a 6,50 Test Value a 7,8000
Cases < Test Value 5
Cases < Test Value 6
Cases >= Test Value 5
Cases >= Test Value 4
Total Cases 10
Total Cases 10
Number of Runs 6
Z Number of Runs 4
,000
Asymp. Sig. (2-tailed) 1,000 Z -,913
a. Median Asymp. Sig. (2-tailed) ,361
a. Mean
Mann-Whitney U Testi
• Dağılımı normal olmayan, bağımsız iki grup
ortalaması için olan t testinin nonparametrik
karşılığı olan Mann-Whitney U testidir. Bu testte
yapılan, değerlere sıra dönüşümü uygulanması
ve ortalamalar yerine ortancaların
karşılaştırılmasıdır. Normal dağılıma uygun
olmayan verilere t testi uygulanırsa, gerçekte
fark olduğu halde, test sonucunda fark
bulunmayabilir. T testi varsayımlarının
sağlanamadığı durumlarda Mann-Whitney U
testi, t testinden daha güçlüdür (Büyüköztürk vd.,
2011)
Mann-Whitney U Testi
• U testi, gözlemlerden elde edilen bilgilerin en
azından sıralı ölçme ile ölçülendirilebildiği iki
bağımsız örneğin, ait oldukları sıra toplamlarının
dağılımlarının aynı olup olmadığını test eder
(Özdamar, 1999).
• A ve B gibi iki ayrı toplumdan örnek alındığını
düşünelim. Kurulacak hipotez;
Ho : A ve B toplumları aynı dağılıma sahiptir.
H1 : A ve B toplumları farklı dağılımlara sahiptir
şeklinde olur.
Mann-Whitney U Testi
• Örnek Uygulama
• A örnek seti ve B örnek setine ait değerler
belirtilmiştir. Buna göre A v e B aynı meydanlı
toplumun rasgele örnekleri midir?
Mann-Whitney U Testi
• Analiz sonuçları incelendiğinde U=16,00,
z=-,245 ve p=,806 olarak hesaplanmıştır. ,05
anlamlılık düzeyinde gruplar arası fark anlamlı
değildir. Buna göre iki örnek aynı parametrik
değere sahip toplumun rasgele örnekleridir
denilebilir.
Test Statistics b

ab
Ranks Mann-Whitney U 16,000
Wilcoxon W 44,000
grup N Mean Rank Sum of Ranks Z -,245
ab 1,00 5 6,80 34,00 Asymp. Sig. (2-tailed) ,806
2,00 7 6,29 44,00 Exact Sig. [2*(1-tailed a
,876
Total 12 Sig.)]
a. Not corrected for ties.
b. Grouping Variable: grup
Kruskal-Wallis Nonparametrik
Testi
• Kruskal Wallis tekniği, ilişkisiz iki ya da daha çok
örneklem ortalamasının birbirlerinden anlamlı
farklılık gösterip test eder. Analizde k tane
örneklemin bir bağımlı değişkene ait puanları
karşılaştırılır. Bu test bağımlı değişkenin en az
sıralama ölçeğinde, gözlemlerin birbirinden
bağımsız olmasını gerektirir. Analiz, normallik
varsayımının karşılanmasını gerektirmediği için
tek yönlü varyans analizine (ANOVA) alternatif
bir tekniktir (Büyüköztürk, 2010).
Kruskal-Wallis Nonparametrik
Testi
Test İstatistiği;
• Eşitlikte;
• Ri: i. Grup için rankların toplamını,
• ni: i. Gruptaki gözlem sayısını,
• N: toplam gözlem sayısını ifade
etmektedir.
Kruskal-Wallis Nonparametrik
Testi
• Eğer bir grup içindeki paylaşılan rankların
sayısı (ties), gruptaki gözlem sayısının
%25’ini geçiyorsa, aşağıdaki düzeltme
faktörü kullanılır:

• Eşitlikte;
t: bir gruptaki paylaşılan rank sayısını,
N: toplam gözlem sayısını ifade etmektedir.
Kruskal-Wallis Nonparametrik
Testi
Kruskal-wallis istatistiği için kurulacak hipotez
testleri şu şekildedir;
H0: K sayıdaki populasyonlar eşittir.
H1: En az bir populasyon diğerlerinden farklıdır.
Hangi hipotezin kabul edileceğine karar vermek
için aşağıdaki kriterler kullanılır;
• Eğer k=3 ve ni 5’ten küçükse karar vermek için
2

kruskal-wallis tablo değeri esas alınır.
• Eğer k 3’ten büyük ve ni 5’ten büyükse karar
vermek için tablo değeri esas alınır (sd=k-1).
• Yukarıdaki her iki durumda da eğer tc tablo
değerinden büyükse H0 reddedilir.
Kruskal-Wallis Nonparametrik Testi
Örnek Uygulama
• Üç farklı dedektif kurgu yazarının aynı tarz baskı
biçimine sahip kitaplarından rasgele seçilen sayfalarda
elde edilen sayfa başına cümle sayıları performans sav.
Dosyasında verilmiştir. Buna göre yazarlar arasında
ortalama cümle uzunluğuna göre bir farklılık olup
olmadığını belirlenmek istenmektedir.
Kruskal-Wallis Nonparametrik Testi
• Eğer anlamlılık düzeyi ,05’ten düşükse gruplar arasında sürekli
değişkenlerin istatistiksel olarak anlamlı bir biçimde farklı
olduğu söylenebilir. Üç yazarın ortalama sırası (rank)
tablosunda incelendiğinde 2. yazarın en fazla cümle
uzunluğuna ve 1. yazar en kısa cümle uzunluğuna sahip
yazarlardır. Anlamlılık düzeyi (sig=,01, sd=2 ki-
kare=9,14)incelendiğinde ,05 düzeyinde farkın anlamlı olduğu
ortaya çımıştır. Bundan dolayı, farklı dedektif romanları yazan
yazarlar arasında ortalama cümle uzunluğu bakımından
farklılık olduğu söylenebilir.
Test Statistics a,b
Ranks
yazar N Mean Rank cümle
cümle 1,00
5
3,40 Chi-Square 9,146
df 2
2,00 12,08
6 Asymp. Sig. ,010
3,00 11,64 a. Kruskal Wallis Test
7
b. Grouping Variable: yazar
Total 18
Mood Medyan nonparametrik
Testi
• Bağımsız iki grupta medyan testinde olduğu gibi, üç ya
da daha fazla grupta medyanları karşılaştırmak için k-
grup medyan testi uygulanır. Medyan testi, üç grubun
aynı medyana sahip evrenlerden geldiği şeklindeki
hipotezin test edilmesinde kullanılır. Bu testin
uygulanabilmesi için, verilerin en az ordinal bir ölçekle
ölçülmesi gerekir (Kalaycı, 2006)
• Mood medyan testi, K bağımsız gruptaki ordinal ölçekle
elde edilmiş verilerin aynı medyana sahip
populasyondan alınmış örnekler olup olmadığını test
etmeyi amaçlar. Gözlerdeki beklenen değerler 1’den
küçük ya da gözlerdeki 5’ten küçük beklenen değerlerin
oranı ,20 ise bu verilere medyan testi uygulanamaz
(Özdamar, 1999).
Mood Medyan nonparametrik
Testi
• Mood medyan testi tek yönlü varyans analizinin
bir parametrik olmayan alternatifidir. Kruskal-
wallis ile aynı işleve sahiptir. Fakat kruskal-
wallis’e göre daha düşük güce sahiptir. Eğer
veriler aralıklı ölçekle elde edilmiş ve süreklilik
varsayımı geçerli ise mood medyan testi yerine
kruskal-wallis testini tercih etmek gerekir
(Özdamar, 2004).
• Mood testi K örneğin aynı dağılım şekline sahip
dağılımlardan alınmış rasgele örnekler olduğunu
varsayar.
Mood Medyan nonparametrik
Testi
Örnek Uygulama
• Bir ortaokulda rasgele seçilen 30 öğrencinin annelerinin
eğitim durumları ve okulu ziyaret sayıları performans.sav
dosyasına girilmiştir. Annelerin okula ziyaretleri ve
görüşme istekleri eğitim durumları ile ilgili midir? Eğitim
düzeyi yüksek olan annelerin okulu daha fazla ziyaret
ederek çocuklarının eğitim ve öğretimi ile daha fazla ilgili
olup olmadığı incelenmek istenmektedir.
Mood Medyan nonparametrik
Testi
• Analiz sonuçlarına göre 4 farklı grup meydanları
birbirine eşittir. Grup meydanları ,05 anlamlılık
düzeyinde anlamlı çıkmamıştır, yani medyanlar
gruplar arasında önemli farklılık
göstermemektedir (ki-kare=7,64, sd=3, p=,054).
Buna göre okul ziyaret sayılarında annelerin
eğitimlerinin önemli bir etkisi yoktur denilebilir.
Test Statistics b

ziyaret
N 30
Frequencies
Median 3,5000
egitimdurumu Chi-Square 7,643 a
ilkokul orta lise üniversite df 3
ziyaret > Median 3 3 3 6 Asymp. Sig. ,054
<= Median 6 5 4 0 a. 8 cells (100,0%) have expected frequencies less
than 5. The minimum expected cell frequency is 3,0.
b. Grouping Variable: egitimdurumu
Friedman Nonparametrik Testi
• İki veya daha fazla sayıdaki eşleştirilmiş
örnek kitleyi karşılaştırılmada
kullanılmaktadır. Eşleştirimiş gruplar t-
testine benzemektedir. Testin tek
varsayımı ise her bir denek için k sayıdaki
değişkenin 12den k’ya kadar sıralanmış
olmasıdır (Sümbüloğlu ve Sümbüloğlu,
2003).
Friedman Nonparametrik Testi
• Tekrarlı ölçümler varyans analizinin
nonparametrik karşılığıdır. Eğer Friedman testi
ile ortancaların eşit olmadığı saptanırsa (yani
p<0.05 bulunursa) post hoc çoklu karşılaştırma
yöntemi olarak, yanılma düzeyini aşağı çekerek,
Bonferroni düzeltmeli Wilcoxon işaretli sıra testi
ya da işaret testi uygulanır. Evren simetrik ise
Bonferroni düzeltmeli Wilcoxon işaretli sıra testi,
simetrik değilse Bonferroni düzeltmeli işaret testi
tercih edilmelidir. İstatistiksel önemlilik sınırı,
yapılacak ikişerli karşılaştırma sayısına bağlı
olarak karşılaştırılmalıdır (Sümbüloğlu ve
Sümbüloğlu, 2003).
Friedman Nonparametrik Testi
• Friedman testi aynı zamanda her hücrede bir
veri kullanılan iki-yollu ANOVA olarak da ifade
edilir çünkü bölüntüleri bir faktör ve işleyiş
düzeylerini diğer bir faktör olarak görmek
mümkündür. Bu test sıralamalara dayanır.
Test hipotezi:
H0: k sayıda popülasyonun dağılımı benzerdir
H1: Bütün k dağılımları benzer değildir
Friedman test istatistiği ki-kare dağılımı için
serbestlik dereceleri (k -1) olmak üzere;
Friedman Nonparametrik Testi
• Örnek Uygulama
• Eğitime yeni başlamış 10 öğrenciye, 12 isimden
oluşan bir liste yüksek sesle okunmuştur. 12
isimden dört tanesi sporcu kişiliklere ait isimler
(A grubu), dört tanesi ulusal ve uluslar arası
politikacı isimleri (Bgrubu) ve dört tanesi ise
yerel düzeyde ünlü kişilerin isimleridir (C grubu).
Okuma periyodunun sonunda öğrencilere
mümkün olduğu kadar hatırlayabildikleri isimleri
tekrarlamaları istenmiştir. Cevaplar performans
değerlendirme.sav dosyasına girilmiştir. Üç grup
için hatırlanma oranları arasında farklılık olup
olmadığı test edilmek istenmektedir.
Friedman Nonparametrik Testi
• SPSS Menüsünden
• Analyze -> Nonparametric tests-> K Related
Samples seçilir.
• Test Variables kısmına grupa,b,c değişkenleri
taşınır.
• Test type kısmından Friedman testi seçilir.
• OK seçeneğine basılır.
Friedman Nonparametrik Testi
• Elde edilen sonuçlar üç farklı kişi grubunun
isimleri hatırlanması arasında ,05 anlamlılık
düzeyinde anlamlı farklılık olmadığını
göstermektedir (sig=,09, sd=2, ki-kare=4,73).
Bununla birlikte ranks tablosu incelendiğinde en
çok hatırlanan isim grubunun sporculara ait isim
grubu, en az hatırlananın ise politikacı isimleri
olduğu anlaşılmaktadır. Uygulama sonucunda
gruplar arasında anlamlı fark oluşmadığı için
çoklu karşılaştırma testi yapılmamıştır.
Test Statistics a
Ranks
N 10
Mean Rank Chi-Square 4,727
sporcu 2,30 df 2
politikaci 1,60 Asymp. Sig. ,094
ünlüler 2,10 a. Friedman Test
Kendal W Testi
• Kendall W testi, k-bağımlı örneğin aynı
populasyondan alınmış rasgele örnekler olduğu
varsayımını test eden bir parametrik olmayan
testtir. W testi, n birimlik (b) bir grubun t
değişken ya da işlem için puanları arasında
uyumluluk (concordance) olup olmadığını test
eder. W testi, n değerlendirici ya da gözlemcinin
t farklı fenomeni değerlendirmelerinde
uyumluluğu da test etmek için kullanılır. W
testinden, değerlendiricilerin (observer) kendi
içlerinde uyumluluğunu (inter-raters reliability) ve
test içi uyumluluğun (inter-test reliability)
güvenirliğini değerlendirmede de yararlanılır
(Özdamar, 1999).
Kendal W Testi
Örnek Uygulama
• Bir besin maddesine herhangi bir lezzet katkısı olmayan
(plesabo etkisi) farklı renklerdeki A,B,C gıda boyaları
eklenerek üç farklı preparat hazırlanmıştır. Rasgele
seçilen 8 bireye öğle yemeklerinde preparatlar verilmiştir.
Yüz üzerinden beğenilerini puanlayan bireylere ait
cevaplar performans değerlendirme.sav dosyasına
girilmiştir. Bireylerin farklı renkteki preparatlara verdikleri
beğeni puanları uyumluluk göstermekte midir?
Kendal W Testi
• Elde edilen sonuçlar aynı grubun besin değerleri
aynı olan 3 farklı renkteki preparata verdikleri
beğeni puanları arasında ,05 anlamlılık
düzeyinde anlamlı farklılık olduğunu
göstermektedir (sig=,002, sd=2, ki-kare=13,00).
Analiz sonucuna göre bireylerin besin değeri
değişmemesine rağmen renk katkılı
maddelerden etkilenerek uyumsuz
değerlendirmelerde bulundukları görülmüştür.
Inter-rater uyumluluğu yoktur.
Test Statistics
N 8 Ranks
Kendall's W a ,813
Chi-Square 13,000 Mean Rank
df 2 boyaA 1,00
Asymp. Sig. ,002 boyaB 2,25
a. Kendall's Coefficient of Concordance boyaC 2,75
Cochran’s Q Testi
• Cochran Q testi k bağımlı ikili değerler alan
(dichotomous) değişkenlerin aynı populasyondan
geldikleri varsayımını test etmeye yarar. McNemar
testinin iki ya da daha fazla bağımlı setin frekanslarının
birbirlerinden önemli farklılık gösterip göstermediğini test
etmek için genişletilmiş halidir. R sıra birim ve C sütunda
(bağımlı grup, işlem) yer alan verilerin, var-yok 0-1, evet-
hayır gibi cevapların işlemlere göre farklılığını test etmek
için Q testinden yararlanılır. Q Testi uygulamak için her
birimin skorları 0,1 biçiminde ikili (dichotomous) olmalıdır
(Özdamar, 1999).
Cochran’s Q Testi
Örnek Uygulama
• Zorunlu bir kursa devam eden rasgele seçilmiş 18 ev
hanımından kursun başlangıcında ortasında ve sonunda
kursun yararlılığı ile ilgili görüşleri alınmıştır. Beğenilerini
0 (olumlu) 1 (olumsuz) şeklinde puanlayan bireylere ait
cevaplar performans değerlendirme.sav dosyasına
girilmiştir. Buna göre ev hanımlarının kursa karşı
görüşlerinde önemli farklılık var mıdır?
Cochran’s Q Testi
• Çıktı sonuçlarına göre ev hanımlarının
kurs sonunda fikirleri olumlu hale
dönmüştür yorumu yapılabilir (sig=,000,
sd=2, ki-kare=16,67). Kurs ilerledikçe ev
hanımlarının kurs hakkındaki olumsuz
tutumları olumlu hale dönmüştür.

Test Statistics Frequencies


N 18
Value
Cochran's Q 16,667 a
0 1
df 2 kb 5 13
Asymp. Sig. ,000 ko 5 13
a. 0 is treated as a success. ks 15 3
Kolmogorov - Smirnov Testi
• Uygunluk testleri arasında yaygın kullanım
bulmuş olan testlerden biri de Kolmogorov
– Simirnov Testi’dir. Bu testte ki-kare
testinde olduğu gibi örnek verilerin
dağılımı ile teorik dağılım arasında
uyuşum derecesi kullanılır.
• Gözlerdeki küçük frekanslardan
etkilenmediğinden n x 2 tablolarında ki kare
testinin yerine kullanılır. Ki kare testinde
beklenen değer 5'in altında olduğunda
kategorileri birleştirme yoluna gidilmektedir. Bu
da bilgi kaybına neden olmaktadır. Gözlerdeki
frekans değerlerinin çok küçük olmasından
dolayı kategorilerin birleştirilmesi yoluna
gidildiğinde, ki kare testi Kolmogorov-Smirnov
testinden daha az kuvvetlidir. Ki kare testinin hiç
uygulanamadığı küçük örneklerde Kolmogorov
Smirnov testi uygulanabilir. n x 2 tablosunda n
sayısının büyük olması yani, grubun daha fazla
sınıflara ayrılması testin gücünü arttırır (Kalaycı,
1999).
• Bu test yalnızca iki grubun birbiriyle
karşılaştırılması ve gözlenen bir frekans
dağılımının kuramsal bir dağılımla
karşılaştırılmasında kullanılır. Örneklerin
durumuna göre, tek örneklem Kolmogorov
- Smirnov testi ve çift örneklem
Kolmogorov - Smirnov testi olmak üzere iki
ayrı test vardır (Özdamar, 1999).
Tek Örneklem Kolmogorov - Smirnov Testi
• Bu bir iyi uyuşum testidir. Gözlenen bir frekans
dağılımının kuramsal bir dağılıma uyup
uymadığını test eder. Yani, örneklemde
gözlenen puanların kuramsal dağılımı belli olan
bir toplumdan gelmiş olabileceğini düşünmenin
akla yatkın olup olmadığını ortaya koyar.
• Bu yöntem, kuramsal eklemeli frekans dağılımını
örnekten elde edilen eklemeli frekans dağılımı ile
karşılaştırır. Kurulacak hipotezler şu şekildedir:
H0: kuramsal ve örnekten elde edilen gözlenen
eklemeli frekansların oranları birbirine eşittir.
H1: kuramsal ve örnekten elde edilen gözlenen
eklemeli frekansların oranları birbirine eşit
değildir.
Tek Örneklem Kolmogorov - Smirnov
Testi
Örnek Uygulama
• Tifoya yakalanmış 10 bireyin hastanede
kalma günleri frekans dağılımı perfomans
sav. dosyasında verilmiştir. Bireylerin
tifoya yakalanma günlerine göre
dağılımlarında önemli farklılık olup
olmadığı incelenmek istenmektedir.
Bireylerin frekans dağılımları kuramsal
normal dağılıma uymakta mıdır?
Tek Örneklem
Kolmogorov - Smirnov
Testi

• SPSS Menüsünden
• Analyze ->
Nonparametric tests-> 1
Sample K-S seçilir.
• Test Variables kısmına
HKG değişkeni taşınır.
• Test distrubition
kısmından Normal
seçilir.
• OK seçeneğine basılır.
Tek Örneklem Kolmogorov - Smirnov Testi
Hipotez:  
Ho: Örnekten gözlenen frekans dağılımı, kuramsal (normal)
frekans dağılımına uyar.
H1: İki frekans dağılımı birbirinden farklıdır.
Veriler incelendiğinde gözlenen frekans dağılımı, kuramsal
frekans dağılımından farklı çıkmıştır (N=10, Kolmogorv-Smirnov
Z=,516, Sig=,95). Test sonucu anlamlılık düzeyi ,05 değerinden
büyük olduğundan H1 hipotezi kabul edilir. Sonuç olarak,
örnekten elde edilen frekans dağılımı kuramsal (normal)
dağılıma uymamaktadır denilebilir.
One-Sample Kolmogorov-Smirnov Test

HKG
N 10
Normal Parameters a,b Mean 8,3000
Std. Deviation 1,88856
Most Extreme Absolute ,163
Differences Positive ,163
Negative -,146
Kolmogorov-Smirnov Z ,516
Asymp. Sig. (2-tailed) ,953
a. Test distribution is Normal.
b. Calculated from data.
Çift Örneklem Kolmogorov
Smirnov Testi
• Çift örneklem testi, bağımsız iki örneğin aynı
toplumdan (ya da dağılımları aynı olan
toplumlardan) gelip gelmediğini inceleyen bir
testtir. İki yanlı test, örneklerin alındığı
dağılımlardaki her çeşit farklılığa (çarpıklık,
basıklık, eğrilik) duyarlıdır. Örneklerden birinin
alındığı toplumdaki değerlerin, diğer örneğin
alındığı toplumdaki değerlere kıyasla olasılık
açısından daha büyük olup olmadığına karar
vermede bir yanlı test kullanılır (Özdamar,
1999).
Çift Örneklem Kolmogorov
Smirnov Testi
• Çift örneklem testi de tek örneklem testi gibi
birikimli iki dağılım arasındaki uyuşumu inceler.
Eğer iki örnek gerçekten aynı toplumdan
alınmışsa, bunlar toplum dağılımından sadece
rastgele sapmalar göstereceğinden, her iki
örneklemin eklemeli dağılımlarının birbirlerine
oldukça benzer olmaları beklenir. İki örneğin
eklemeli frekans dağılımları herhangi bir noktada
çok fazla ayrıysa, bu iki örneğin ayrı
toplumlardan geldiğine işaret eder.
Çift Örneklem Kolmogorov
Smirnov Testi
Örnek Uygulama
• Bir sınıftan rasgele 10 kız ve 10 erkek alınmış,
bu öğrencilere 10 soru içeren biyoistatistik testi
uygulanmıştır. Test sonucunda sorularda yapılan
hatalar geliştirilen bir ölçekle belirlenmiştir. Ölçek
verileri performans.sav dosyasına girilmiştir.
Buna göre kız ve erkek öğrencilerin hata
puanlarına göre dağılımlarında fark olup
olmadığı incelenmek istenmektedir.
Çift Örneklem Kolmogorov Smirnov Testi

• SPSS Menüsünden
• Analyze -> Nonparametric tests-> 2 Independent Samples
seçilir.
• Test Variable list kısmına hata değişkeni taşınır.
• Grouping Variable kısmına grupek değişkeni taşınır.
• Define groups kısmında gruplar 1,2 olarak tanımlanır.
• Test type kısmından kolmogorov-smirnov Z işaretlenir.
• OK seçeneğine basılır.
Çift Örneklem Kolmogorov
Smirnov Testi
• Erkek ve kız öğrencilerin hata puanları
dağılımları türdeş değildir ( kolmogorov-smirnov
Z=1,57, sig=,015). Kızların hata puanları
dağılımı, erkeklerin hata puanları dağılımından
önemli düzeyde pozitif uçta yer almaktadır.
Kızların hata puanları erkeklerin hata
puanlarından daha yüksektir.

Test Statistics a
Frequencies
hata
Most Extreme Absolute ,700 grupek N
Differences Positive ,000 hata 1,00 10
Negative -,700 2,00 10
Kolmogorov-Smirnov Z 1,565 Total 20
Asymp. Sig. (2-tailed) ,015
a. Grouping Variable: grupek
Spearman’ın Rank Order Korelasyonu
(Parametrik Olmayan Korelasyon Testi)
• Değişkenlerden birinin ya da her ikisinin de
aralıklı/oranlı olmadığı (ama sıralı olduğunun
varsayıldığı) ve normal dağılmadığı durumlarda
Spearman korelasyon katsayısı kullanılır.
Değişkenlerin aldığı değerler sıraya çevrildikten
sonra ilişkilendirilir. Spearman korelasyonu (rho)
iki sürekli değişken arasındaki ilişkinin
derecesinin hesaplanmasında kullanılır. Bu test
Pearson korelasyon katsayısının parametrik
olmayan alternatifidir (Kalaycı, 2006).
Spearman’ın Rank Order Korelasyonu
(Parametrik Olmayan Korelasyon Testi)
• Korelasyon katsayısı (rho) anlamlılık düzeyi,
örneklem büyüklüğünden etkilenebilmektedir.
Küçük bir örnekte ,05 alfa değerinden küçük
istatistiksel anlamlılığı olmayan çok kuvvetli
olmayan korelasyon değeri elde edilebilir.
Bununla birlikte büyük örneklerde çük düşük
korelasyon değerleri anlamlı olabilir. Bu noktada
bir çok araştırmacı anlamlılık düzeyinin
belirlenmesi ama üzerinde durulmasının gerekli
olmadığını belirtmektedirler (Kalaycı, 2006).
Spearman’ın Rank Order Korelasyonu
(Parametrik Olmayan Korelasyon Testi)
Örnek Uygulama
• Hilyen ve sağlık hizmetleri standartlarının gelişmeye
başladığı 19 ve 20. yy boyunca ortalama yaşam
süresinde genel bir artış gözlenmektedir. Ortalama
yaşam süresindeki artış ülkeden ülkeye toplumdan
topluma hatta aileler arasında farklılık göstermektedir.
Örnekte büyük bir aileye ait ölüm olayının yaşandığı
yıllar ve ölen kişinin yaşının değerleri performans
değerlendirme.sav dosyasında verilmiştir. Ailenin
ortalama yaşam süresinde artış olup olmadığı
incelenmek istenmektedir.
• Ölüm görülen yılları x ve yaşı y olarak tanımlayarak x ve
y sıralanır. Pozitif rho katsayısı ortalama yaşam
süresinde artışı gösterecektir. Buna göre ölüm görülen
yıllar ve ölenlerin yaşları arasındaki ilişki test edilecektir.
Spearman’ın Rank Order Korelasyonu
(Parametrik Olmayan Korelasyon Testi)
SPSS Menüsünden
• Analyze -> correlate-> bivariate seçilir.
• Variables kısmına Yıl ve yaş taşınır.
• Spearman ve two-tailed test seçilir.
• OK tıklanır.
Spearman’ın Rank Order Korelasyonu
(Parametrik Olmayan Korelasyon Testi)

• Buna göre analiz sonuçları incelendiğinde


rho=,51 ve katsayısının işareti pozitiftir.
Ancak sig=,08 çıkmıştır ve bu değer ,05
düzeyinde anlamlı değildir. Buna göre iki
değişken arasında bir ilişkiden söz
edilemez yorumu yapılabilir.
Correlations

YIL YAS
Spearman's rho YIL Correlation Coefficient 1,000 ,507
Sig. (2-tailed) . ,077
N 13 13
YAS Correlation Coefficient ,507 1,000
Sig. (2-tailed) ,077 .
N 13 13

You might also like