You are on page 1of 16

IV.

8 İkiden Fazla Bağımsız Grup Karşılaştırması ile İlgili Parametrik veya


Parametrik Olmayan Test Teknikleri ve SPSS Programı ile Kullanımı (Tek
Faktör Varyans Analizi, OneWay ANOVA)
𝑋: Bağımlı değişken olsun. Bağımlı değişkeni etkileyen tek bağımsız değişken (faktör,
gruplama değişkeni) olduğunu kabul edelim. Bağımlı değişken nicel, sürekli ve eşit aralıklı
veya oranlama düzeyinde ölçülmüş iken, faktör ise genellikle nitel (bazen nicel de olabilir)
türden ve ölçme düzeyi sınıflama ya da sıralama düzeyinde ölçülmüş olsun. Bu takdirde söz
konusu faktörün (bağımsız değişkenin) bağımlı değişken üzerinde etkisinin önemli olup
olmadığını belirlemek için uygulanan istatistiksel analize Tek Faktör Varyans Analizi denir.
Faktörün alabileceği değerlere faktör düzeyi adı verilir ve her bir faktör düzeyi birbirinden
bağımsız olan farklı bir grubu gösterir. Bu sebeple faktör düzeylerine bağımsız gruplar da
denir. Bu sebeple faktörün bağımlı değişken üzerindeki etkisinin önemli olup olmadığını
araştırmak, bağımsız grupların ortalamalar bakımından farklılık gösterip göstermediğini
araştırmakla eş anlamlıdır. Bu araştırmayı yapmak için geliştirilmiş olan parametrik ve
parametrik olmayan teknikler vardır. Bu tekniklerden ikisi;

i) Friedman’ın 𝐹-Testi ( parametrik teknik)

ii) Kruskal-Wallis 𝐻-testi (parametrik olmayan teknik)

olarak bilinir.

IV.8.1 Tek Faktör Varyans Analizi, Friedman’ın F-Testi ve Çoklu


Karşılaştırmalar
İkiden fazla bağımsız grubun ortalamaları yönünden karşılaştırılması olarak bilinen tek faktör
varyans analizinde, kabul edelim ki faktörün düzey sayısı (bağımsız grupların sayısı) 𝑘 tane
(𝑘 > 2) olsun. Değişkenlerle ilgili olarak yukarıda belirtilen özelliklere ilaveten, tek faktör
varyans analizi ile bu grupların ortalamaları yönünden karşılaştırmada bir parametrik teknik
olan F-testinin kullanılabilmesi için sağlanması gereken varsayımlar:

i) Bağımsız grupların bağımlı değişkene göre dağılımları normal olmalı

ii) Gruplar homojen varyanslı (yani grupların ortak varyansa sahip) olması gereklidir.

Buna göre:

Grup:1 için 𝑋1 ~𝑁(𝜇1 , 𝜎12 )

Grup:2 için 𝑋2 ~𝑁(𝜇2 , 𝜎22 )

Grup:𝑘 için 𝑋𝑘 ~𝑁(𝜇𝑘 , 𝜎𝑘2 )


şeklinde gösterilir.

Grupların bağımlı değişkene göre dağılımlarının normal dağılım ile uyumlu olup olmadığı her
bir grup için ayrı ayrı normallik testi olan Shapiro-Wilk testi ile kontrol edilebilir. Bu
durumda test edilecek hipotezler:

𝐻0 : 𝑗.nci grup, 𝑁(𝜇𝑗 , 𝜎𝑗2 ) dağılımı ile uyumludur (𝑗 = 1, 2, … , 𝑘)

𝐻1 : 𝑗.nci grup, 𝑁(𝜇𝑗 , 𝜎𝑗2 ) dağılımı ile uyumlu değildir (4.27)

şeklinde oluşturulur. Eğer 𝑝 < 𝛼 ise 𝐻0 ret edilir ve 𝑝 ≥ 𝛼 ise 𝐻0 ret edilemez.

Grupların homojen varyanslı olup olmadığı ise Levene testi ile kontrol edilebilir. Bu durumda
test edilecek hipotezler:

𝐻0 : 𝜎12 = 𝜎22 = ⋯ = 𝜎𝑘2 = 𝜎 2

𝐻0 : En az bir 𝜎𝑗2 diğerlerinden farklıdır (4.28)

şeklinde oluşturulur. Eğer 𝑝 < 𝛼 ise𝐻0 ret edilir ve 𝑝 ≥ 𝛼 ise 𝐻0 ret edilemez.

Tek faktör varyans analizinde F-testi ile 𝑘 tane bağımsız grubun ortalamalar yönünden
farklılık gösterip göstermediği ortalamalar üzerinde bir hipotez testi ile kontrol edilir. Bu
durumda test edilecek hipotezler:

𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 = 𝜇

𝐻1 ∶ En az bir 𝜇𝑗 diğerlerinden farklı (4.29)

şeklinde kurulur. Bu hipotezleri test etmek için her bir gruptan 𝑛𝑗 (𝑗 = 1,2, ⋯ , 𝑘) birimlik
örnekler çekilir ya da her bir faktör düzeyinde 𝑛𝑗 (𝑗 = 1,2, ⋯ , 𝑘) tane deneme (deney) yapılır.
Bu durumda elde edilen sonuçlara göre örneklem veri düzeni Tablo 4.33’de verildiği gibi
olacaktır. Burada 𝑋𝑗𝑖 : Faktörün 𝑗.nci düzeyinde 𝑖.nci birime ait bağımlı değişken değeridir.

Tablo 4.33 Tek Faktör Varyans Analizi Veri Düzeni Tablosu

GRUPLAR(FAKTÖR)
𝑖 1 2 …… j … k
1 𝑋11 𝑋21 𝑋𝑗1 𝑋𝑘1
2 𝑋12 𝑋22 ……… 𝑋𝑗2 𝑋𝑘2
⋮ ⋮ ⋮ ⋮ ……… ⋮
𝑛𝑗 𝑋1𝑛1 𝑋2𝑛2 𝑋𝑗𝑛𝑗 𝑋𝑘𝑛𝑘

𝑇𝑗 . 𝑇1 . 𝑇2 . …… 𝑇𝑗 . ….. 𝑇𝑘 .
𝑛𝑗 𝑛1 𝑛2 …….. 𝑛𝑗 …… 𝑛𝑘
𝑋𝑗 . 𝑋1 . 𝑋2 . …….. 𝑋𝑗 . …….. 𝑋𝑘 .

𝐻0 hipotezini test etmek için gerekli olan işlemler ve test istatistiği ANOVA Tablosu adı
verilen Tablo 4.34’de özet olarak verilmiştir.

Tablo 4.34 Tek Faktör Varyans Analizi ANOVA Tablosu

Varyans Serbestlik Kareler Kareler Test İstatistiği


Kaynağı derecesi Toplamı Ortalaması
(KT) (KO)
Gruplar Arası
(𝐺𝐴) 𝐺𝐴𝐾𝑇
𝑘−1 𝐺𝐴𝐾𝑇 𝐺𝐴𝐾𝑂= 𝑘−1 𝐺𝐴𝐾𝑂
𝐹= ~ 𝐹𝑘−1;𝑁−𝑘
Hata (𝐻) 𝑁−𝑘 𝐻𝐾𝑇 𝐻𝐾𝑇 𝐻𝐾𝑂
𝐻𝐾𝑂=𝑁−𝑘

Genel (𝐺) 𝑁−1 𝐺𝐾𝑇

Burada hesaplamalarda

𝑁 = ∑𝑘𝑗=1 𝑛𝑗 : Örneklemdeki tüm birim sayısı

𝐺𝐾𝑇: Genel Kareler toplamı

𝑗 𝑛 𝑗2 𝑛 𝑇. 2.
𝐺𝐾𝑇 = ∑𝑘𝑗=1 ∑𝑖=1 (𝑋𝑗𝑖 − 𝑋. . ) = ∑𝑘𝑗=1 ∑𝑖=1 𝑋𝑗𝑖2 − (4.30)
𝑁

𝐺𝐴𝐾𝑇 : Gruplar Arası Kareler Toplamı

2 𝑇𝑗2 . 𝑇. 2.
𝐺𝐴𝐾𝑇 = ∑𝑘𝑗=1 𝑛𝑗 (𝑋𝑗 . − 𝑋. . ) = ∑𝑘𝑗=1 − (4.31)
𝑛𝑗 𝑁
𝐻𝐾𝑇 : Hata Kareler Toplamı

𝑗 𝑛 𝑗 2 𝑛 𝑇2
𝐻𝐾𝑇 = ∑𝑘𝑗=1 ∑𝑖=1(𝑋𝑗𝑖 − 𝑋𝑗 . ) = ∑𝑘𝑗=1 ∑𝑖=1 𝑋𝑗𝑖2 − ∑𝑘𝑗=1 𝑛𝑗 . = 𝐺𝐾𝑇 − 𝐺𝐴𝐾𝑇 (4.32)
𝑗

𝑋𝑗 . : Faktörün 𝑗.nci düzeyine ait örnek ortalaması

1𝑗 𝑛 𝑇𝑗 .
𝑋𝑗 . = 𝑛 ∑𝑖=1 𝑋𝑗𝑖 = ,(𝑗 = 1,2, ⋯ , 𝑘) (4.33)
𝑗 𝑛𝑗

𝑇𝑗 . = Faktörün 𝑗.nci düzeyine ait gözlemlerin toplamı

𝑗𝑛
𝑇𝑗 . = ∑𝑖=1 𝑋𝑗𝑖 ,(𝑗 = 1,2, ⋯ , 𝑘) (4.34)

𝑗 𝑛
∑𝑘𝑗=1 ∑𝑖=1 𝑋𝑗𝑖 : Tüm örneklemdeki gözlem değerlerinin toplamı
𝑛
𝑗
𝑇. . = ∑𝑘𝑗=1 ∑𝑖=1 𝑋𝑗𝑖 = ∑𝑘𝑗=1 𝑇𝑗 . (4.35)

𝑋. . : Tüm örneklem için örnek ortalaması (Genel örnek ortalaması)


1 𝑗 𝑛 𝑇. .
𝑋. . = 𝑁 ∑𝑘𝑗=1 ∑𝑖=1 𝑋𝑗𝑖 = (4.36)
𝑁

bağıntıları kullanılır. Örneklemden 𝐻0 hipotezi altında test istatistiğinin aldığı değer


𝐺𝐴𝐾𝑂
𝐹ℎ = olsun. 𝑃𝑟(𝐹 ≥ 𝐹ℎ ) = 𝑝 diyelim.
𝐻𝐾𝑂

Karar: 𝛼 önem seviyesi olmak üzere, eğer 𝑝 ≥ 𝛼 oluyorsa 𝐻0 kabul edilir. Bu karara göre
tüm grupların ortalamaları birbirine eşit olup, %(1- 𝛼) güvenle faktör düzeylerinin bağımlı
değişken üzerine etkileri aynıdır.

Eğer 𝑝 < 𝛼 oluyorsa 𝐻0 ret edilir. Bu karara göre gruplardan en az birisinin ortalaması
diğerlerinden farklı olup, %(1- 𝛼) güvenle faktör düzeylerinden en az birisi bağımlı değişken
üzerine diğerlerine göre farklı etki yapmaktadır.

𝐻0 ret edildiği zaman hangi grupların farklılık gösterdiği bulunmak istenebilir. Bu amaçla
çoklu karşılaştırma (Post Hoc) adı verilen istatistiksel tekniklerden yararlanılır.

Çoklu Karşılaştırma Teknikleri (Post Hoc)


Varyans analizinde 𝐻0 ret edildiğinde, bu kararın ortaya çıkmasında hangi grup/grupların
etkili rol oynadığını, yani ortalamalar bakımından farklılık gösteren grupları ya da bağımlı
değişkene farklı etki yapan faktör düzeylerini belirlemek amacıyla kullanılan tekniklere çoklu
karşılaştırma teknikleri adı verilir. Bu amaçla kullanılan çok sayıda çoklu karşılaştırma
tekniği mevcuttur. Bu teknikler kullanım tercihlerine göre şu şekilde sınıflandırılır:

i) Grupların eşit varyanslı olması durumuna göre: LSD (Fisher’in en küçük önemli fark)
testi, S-N-K (Student- Newman-Keuls) testi, Tukey (Tukey HSD, Tukeya) testi, Dunnett testi
, Benferroni testi v.s.

ii) Grupların eşit varyanslı olmama durumuna göre: Tamhane (Tamhane’s T2) testi,
Dunnet’s T3 testi v.s

IV.8.2 SPSS ile Tek Faktör Varyans Analizi (F-Testi) ve Çoklu


Karşılaştırma Teknikleri

SPSS Paket programı ile Tek faktör varyans analizi, yani 𝑘 tane bağımsız grubun ortalamalar
yönünden karşılaştırılması ve gerekli olduğu durumda çoklu karşılaştırma analizleri
yapılabilir. Bunun için uygulanacak algoritma aşağıda verildi.

Adım:1 Varible View’de bağımlı değişken ve faktör (grup) değişkeni ile özellikleri
tanımlanır. Faktör değişkeni için faktör düzeyleri Values bölümünde grup numaraları ile
kodlanır.
Adım:2 Data View’de bağımlı değişkene ait veriler bağımlı değişken kolonuna, grup
numaraları ise faktör (grup) değişkeni kolonuna girilir.

Adım:3 Analyze menüsünden Compare means ve One Way Anova seçenekleri seçilir.
Açılan ekranda değişkenler listesinde yer alan bağımlı değişken seçilerek Dependent List
işlem kutusuna, Faktör (grup) seçilerek Factor işlem kutusuna aktarılır.

Adım:4 Options seçeneği ile açılan ekranda Descriptive ve Homogeneity of Variance test
(betimleyici istatistikler ve varyansların homojenlik testi) seçenekleri seçilir. Continue
tıklanır önceki ekrana dönülür.

Adım:5 Çoklu karşılaştırma teknikleri seçimi içim Post Hoc seçeneği ile açılan ekranda
Varyansların homojen olup olmama durumuna göre uygun teknik seçilir. Continue tıklanır.

Adım:6 OK tıklanır ve sonuç tabloları Output (çıktı) sayfasında görüntülenir. Elde edilen
tablolar değerlendirilerek analiz sonuçları yorumlanır.
Örnek 4.14 Total Protein (TP) değerlerinin hastalık türlerine göre farklılık gösterip
göstermediğini belirlemek amacıyla, sağlıklı kişilerden (kontrol grubu=K hasta) ve H hasta, L
hasta, T hasta gruplarından rastgele olarak 5’er birimlik örnekler alınmıştır. Her bir örnek
biriminin total protein değerleri aşağıda verilmiştir. Buna göre:

a) Bu problemin çözümünde hangi istatistiksel analiz kullanılmalıdır, neden?

b) Her bir hasta grubu için total protein değerlerine ait dağılımların 𝑁(𝜇𝑗 , 𝜎𝑗2 ) , (𝑗 = 1,2,3,4)
ile uyumlu olup olmadığını kontrol ediniz?

c) Hastalık grupları için total protein değerlerine ait dağılımların homojen varyanslı olup
olmadığını kontrol ediniz?

d) Total protein değerleri bakımından hastalık gruplarına ait ortalamalar arasında fark olup
olmadığına ilişkin test edilecek olan hipotezleri oluşturunuz?

e) SPSS programı ile (d) şıkkındaki hipotezlerin testi için gerekli olan istatistiksel analizi
yapınız?

f) Hastalık türlerine göre grup ortalamaları arasında fark olup olmadığına dair uygulanacak
olan test için test istatistiği nedir ve 𝐻0 hipotezi altında hangi değeri alır?

g) %5 önem seviyesinde hastalık türlerinin TP değerleri üzerinde etkili olduğu söylenebilir


mi?

h) Eğer hastalık türlerine göre TP değerleri bakımından grup ortalamaları arasında fark varsa,
farklılık gösteren grupları belirleyiniz?

i) Eğer hastalık türlerine göre TP değerleri bakımından grup ortalamaları arasında fark varsa,
kontrol grubu (K) ile diğer hasta gruplarından hangileri arasında fark vardır?
HASTALIK TÜRÜ
K -Hasta H -Hasta L-Hasta T-Hasta
6,4 8,6 13,7 21,8
6,5 9,7 13,8 17,9
6,7 10,1 14,9 21,6
5,9 9,6 16,3 20,5
6,0 9,4 15,4 19,7
Çözüm
a) Bağımlı değişken (𝑋):Total Protein değerleri…. Nicel, sürekli ve ölçme düzeyi oranlama
Faktör: Hastalık türü…… Nitel ve ölçme düzeyi sınıflama
𝐾 − ℎ𝑎𝑠𝑡𝑎(1. 𝑔𝑟𝑢𝑝)
𝐻 − ℎ𝑎𝑠𝑡𝑎(2. 𝑔𝑟𝑢𝑝)
Faktör düzeyleri{ olup, bunlar bağımsız gruplardır. Bağımsız grup
𝐿 − ℎ𝑎𝑠𝑡𝑎(3. 𝑔𝑟𝑢𝑝)
𝑇 − ℎ𝑎𝑠𝑡𝑎(4. 𝑔𝑟𝑢𝑝)
sayısı (faktör düzey sayısı) 𝑘 = 4 dür. Bu değişkenlere ve özelliklerine göre, bu problemin
analizinde Tek faktör Varyans analizi kullanılır. Uygulanacak tekniği (parametrik veya
parametrik olmayan) belirlemek için normallik ve homojen varyanslılık varsayımlarının
kontrol edilmesi gerekir.
b) Her bir hasta grubu için total protein değerlerine ait dağılımların normal dağılım ile
uyumlu olup olmadığını Shapiro-Wilk testi ile kontrol edebiliriz. Test edilecek hipotezler:

𝐻0 : 𝑗.nci hasta grubu için total protein değerlerine ait dağılım, 𝑁(𝜇𝑗 , 𝜎𝑗2 ) dağılımı ile
uyumludur (𝑗 = 1, 2, 3,4)
𝐻1 : 𝑗.nci hasta grubu için total protein değerlerine ait dağılım, 𝑁(𝜇𝑗 , 𝜎𝑗2 ) dağılımı ile uyumlu
değildir (𝑗 = 1, 2, 3,4)
Test işlemi sonucu Tablo 4.35 ile verilmiştir.

Tablo 4.35 Hastalık gruplarında Total Protein Değerleri Dağılımı İçin Normallik Testi
Bağımlı Hastagrup Shapiro-Wilk
Değişken (faktör) Statistic df Sig.(𝑝)
Khasta ,925 5 ,564
Hhasta ,931 5 ,605
totalprotein
Lhasta ,926 5 ,568
Thasta ,921 5 ,539
Tablo 4.35’ e göre hastalık türlerine ait bütün gruplar için 𝛼 = 0,05 iken 𝑝 > 𝛼 olduğundan
𝐻0 hipotezi kabul edilir. Böylece bütün hastalık türlerinde total protein değerlerine ait
dağılımlar %95 güvenle 𝑁(𝜇𝑗 , 𝜎𝑗2 ), (𝑗 = 1, 2, 3,4) dağılımı ile uyumludur.
c) Hastalık grupları için total protein değerlerine ait dağılımların homojen varyanslı olup
olmadığını Levene testi ile kontrol edebiliriz. Bunun için test edilecek hipotezler:
𝐻0 : 𝜎12 = 𝜎22 = 𝜎32 = 𝜎42
𝐻1 : En az bir 𝜎𝑗2 diğerlerinden faklı
şeklinde kurulur. Test işleminin sonuç tablosu Tablo 4.36 ile verildi.
Tablo 4.36 Hastalık Grupları İçin Varyansların Homojenlik Testi
Levene Statistic df1 df2 Sig.
3,167 3 16 ,053
Tablo 4.36’ya göre 𝑝 = 0,053 olup 𝛼=0,05 için 𝑝 > 𝛼 olduğundan 𝐻0 kabul edilir. Buna
göre, Hastalık türlerine göre TP değerlerine ait dağılımlar homojen varyanslıdır.
d) Total protein değerleri bakımından hastalık gruplarına ait ortalamalar arasında fark olup
olmadığına ilişkin test edilecek hipotezler;
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇
𝐻1 : En az bir 𝜇𝑗 diğerlerinden farklı
şeklinde kurulur.
e) SPSS programı ile (d) şıkkındaki hipotezlerin testi için gerekli olan istatistiksel analizi
ikiden fazla bağımsız grubun ortalamalar yönünden karşılaştırılması olarak bilinen tek faktör
varyans analizidir. Bu analiz ile ilgili test işlemi sonuçları için, betimleyici istatistikler Tablo
4.37’de ve ANOVA tablosu ise Tablo 4.38’de verildi.

Tablo 4.37 Hastalık Gruplarına Göre Betimleyici İstatistikler


N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean
Lower Bound Upper Bound
K hasta 5 6,3000 ,33912 ,15166 5,8789 6,7211
H hasta 5 9,4800 ,55408 ,24779 8,7920 10,1680
L hasta 5 14,8200 1,09864 ,49132 13,4559 16,1841
T hasta 5 20,3000 1,58902 ,71063 18,3270 22,2730
Total 20 12,7250 5,54654 1,24024 10,1291 15,3209

Tablo 4.38 Anova Tablosu


Sum of Squares df Mean Square F Sig.
Between Groups 567,902 3 189,301 182,283 ,000
Within Groups 16,616 16 1,039
Total 584,518 19
f) Hastalık türlerine göre grup ortalamaları arasında fark olup olmadığına dair uygulanacak
olan test için test istatistiği 𝐹 istatistiği olup, test istatistiğinin alabileceği değer;
𝐹ℎ = 182,283 dir.
g) Anova tablosundan 𝑝=0.000 olup 𝛼=0,05 için 𝑝 < 𝛼 olduğundan 𝐻0 ret edilir. Bu
durumda hastalık türlerinin total protein değerleri üzerinde etkisi hastalık türüne göre farklılık
göstermektedir.
h) Hastalık türlerine göre TP değerleri bakımından grup ortalamaları arasında fark olduğuna
göre, farklılık gösteren grupları çoklu karşılaştırma teknikleri ile belirleriz. Gruplar homojen
varyanslı olduğundan Tukey HSD testi kullanılabilir. Test sonuçları Tablo 4.39’da verilmiştir.

Tablo 4.39 Çoklu Karşılaştırmalar (Tukey HSD Testi)


(I) grup (J) grup Mean Difference Std. Error Sig. 95% Confidence Interval
(I-J) Lower Bound Upper Bound
H hasta -3,18* ,64452 ,001 -5,0240 -1,3360
*
K hasta L hasta -8,52 ,64452 ,000 -10,3640 -6,6760
T hasta -14,00* ,64452 ,000 -15,8440 -12,1560
*
K hasta 3,18 ,64452 ,001 1,3360 5,0240
H hasta L hasta -5,34* ,64452 ,000 -7,1840 -3,4960
*
T hasta -10,82 ,64452 ,000 -12,6640 -8,9760
Tukey HSD
K hasta 8,52* ,64452 ,000 6,6760 10,3640
*
L hasta H hasta 5,34 ,64452 ,000 3,4960 7,1840
T hasta -5,48* ,64452 ,000 -7,3240 -3,6360
*
K hasta 14,00 ,64452 ,000 12,1560 15,8440
T hasta H hasta 10,82* ,64452 ,000 8,9760 12,6640
*
L hasta 5,48 ,64452 ,000 3,6360 7,3240
*. The mean difference is significant at the 0.05 level.

Bu tabloya göre:
1. Total protein değerleri bakımından K-hasta grubu ile H-hasta grubu farklılık
göstermektedir. Çünkü; 𝑃(−5,024 ≤ 𝜇1 − 𝜇2 ≤ −1,336) = 0,95 olup, güven aralığı sıfırı
kapsamamaktadır. Üstelik güven sınırları negatif olduğundan H-hasta grubunun protein
değerleri daha yüksektir.
2. Total protein değerleri bakımından K-hasta grubu ile L-hasta grubu farklılık
göstermektedir. Çünkü; 𝑃(−10,364 ≤ 𝜇1 − 𝜇3 ≤ −6,676) = 0,95 olup, güven aralığı sıfırı
kapsamamaktadır. Üstelik güven sınırları negatif olduğundan L-hasta grubunun protein
değerleri daha yüksektir.
3. Total protein değerleri bakımından K-hasta grubu ile T-hasta grubu farklılık
göstermektedir. Çünkü; 𝑃 (−15,844 ≤ 𝜇1 − 𝜇4 ≤ −12,156) = 0,95 olup, güven aralığı
sıfırı kapsamamaktadır. Üstelik güven sınırları negatif olduğundan T-hasta grubunun protein
değerleri daha yüksektir.
4. Total protein değerleri bakımından H-hasta grubu ile L-hasta grubu farklılık
göstermektedir. Çünkü; 𝑃(−7,184 ≤ 𝜇2 − 𝜇3 ≤ −3,496) = 0,95 olup, güven aralığı sıfırı
kapsamamaktadır. Üstelik güven sınırları negatif olduğundan L-hasta grubunun protein
değerleri daha yüksektir.
5. Total protein değerleri bakımından H-hasta grubu ile T-hasta grubu farklılık
göstermektedir. Çünkü; 𝑃(−12,664 ≤ 𝜇2 − 𝜇4 ≤ −8,976) = 0,95 olup, güven aralığı sıfırı
kapsamamaktadır. Üstelik güven sınırları negatif olduğundan T-hasta grubunun protein
değerleri daha yüksektir.
6. Total protein değerleri bakımından L-hasta grubu ile T-hasta grubu farklılık
göstermektedir. Çünkü; 𝑃(−7,324 ≤ 𝜇3 − 𝜇4 ≤ −3,636) = 0,95 olup, güven aralığı sıfırı
kapsamamaktadır. Üstelik güven sınırları negatif olduğundan T-hasta grubunun protein
değerleri daha yüksektir.
i) Hastalık türlerine göre TP değerleri bakımından grup ortalamaları arasında fark olduğuna
göre, kontrol grubu (K- hasta) ile diğer gruplar arasında farklılık gösteren grupları çoklu
karşılaştırma teknikleri ile belirleriz. Gruplar homojen varyanslı olduğundan kontrol grubu
(K-hasta) ile deneme grupları (H-hasta, L_hasta ve T-hasta) arasında fark olup olmadığını
Dunnett Testi ile test ederiz. Test sonuçları aşağıdaki tabloda verilmiştir.

Tablo 4.40 Çoklu Karşılaştırmalar (Dunnett Testi)


(I) grup (J) grup Mean Difference Std. Error Sig. 95% Confidence Interval
(I-J) Lower Bound Upper Bound
H hasta K hasta 3,18* ,64452 ,000 1,5092 4,8508
Dunnett t (2-
*
L hasta K hasta 8,52 ,64452 ,000 6,8492 10,1908
sided)b
T hasta K hasta 14,00* ,64452 ,000 12,3292 15,6708
*. The mean difference is significant at the 0.05 level.
b. Dunnett t-tests treat one group as a control, and compare all other groups against it.

Bu tabloya göre:
1. Total protein değerleri bakımından H-hasta grubu ile K-hasta grubu farklılık
göstermektedir. Çünkü; 𝑃(1,5092 ≤ 𝜇2 − 𝜇1 ≤ 4,8508) = 0,95 olup, güven aralığı sıfırı
kapsamamaktadır. Üstelik güven sınırları pozitif olduğundan H-hasta grubunun protein
değerleri daha yüksektir.
2. Total protein değerleri bakımından L-hasta grubu ile K-hasta grubu farklılık
göstermektedir. Çünkü; 𝑃(6,8492 ≤ 𝜇3 − 𝜇1 ≤ 10,1908) = 0,95 olup, güven aralığı sıfırı
kapsamamaktadır. Üstelik güven sınırları pozitif olduğundan L-hasta grubunun protein
değerleri daha yüksektir.
3. Total protein değerleri bakımından T-hasta grubu ile K-hasta grubu farklılık
göstermektedir. Çünkü; 𝑃(12,292 ≤ 𝜇4 − 𝜇1 ≤ 15,6708) = 0,95 olup, güven aralığı sıfırı
kapsamamaktadır. Üstelik güven sınırları pozitif olduğundan T-hasta grubunun protein
değerleri daha yüksektir.

IV.8.3 Tek Faktör Varyans Analizi, Kruskal Wallis H-Testi ve SPSS


Uygulaması
İkiden fazla bağımsız grubun ortalamaları bakımından karşılaştırmasında, eğer bağımlı
değişken için grupların dağılımı normal dağılım ile uyumlu değilse parametrik teknik (F-testi)
kullanılamaz. Bu durumda parametrik tekniğin alternatifi olan ve bir parametrik olmayan
teknik olarak bilinen Kruskal Wallis H-testi kullanılmalıdır. Yani H-testinde gruplar için
normallik varsayımının sağlanması şartı aranmaz. Gruplar normal dağılım varsayımını sağlasa
da sağlamasa da H testi uygulanabilir. Ancak normallik varsayımının sağlanması durumunda
parametrik tekniğin tercih edilmesi gerektiği unutulmamalıdır.

Kruskal Wallis H tetinde test edilecek hipotezler, Friedman F-testindeki hipotezler ile aynı
olup (4.29) ifadesinde verilmiştir. Bu hipotezleri test etmek için gerekli olan örneklem veri
düzeni de Tablo 4.33’de verildiği gibidir. H-testinde her biri 𝑛𝑗 (𝑗 = 1,2, … , 𝑘)birimlik
örneklerden 𝑘 tane örneklem birleştirilir ve birleştirilmiş örneklemde örnek birimlerine sıra
sayıları verilerek sıra sayıları veri düzeni oluşturulur. Sıra sayıları veri düzeni Tablo 4.41 ile
verildi. Burada
𝑅𝑗𝑖 : 𝑗. grupta 𝑖. nci birime verilen sıra sayısı (𝑗 = 1,2, … , 𝑘; 𝑖 = 1,2, … , 𝑛𝑗 )
𝑛𝑗
𝑅𝑗 . : 𝑗. nci gruba ait sırasayılarının toplamı (𝑅𝑗 . = ∑𝑖=1 𝑅𝑗𝑖 )

𝑅𝑗 .
𝑅𝑗 . : 𝑗.nci gruba ait sıra sayılarının ortalaması (𝑅𝑗 . = )
𝑛𝑗

𝑛𝑗 : 𝑗.nci gruba ait örnek birimi sayısı


N: Birleştirilmiş örnek birim sayısı (𝑁 = ∑𝑘𝑗=1 𝑛𝑗 )
𝑅. . ∶ Birleştirilmiş örnekte tüm birimlere verilen sıra sayılarının toplamı (𝑅. . = ∑𝑘𝑗=1 𝑅𝑗 . )
Tablo 4.41 Tek Faktör Varyans Analizi Sıra Sayıları Veri Düzeni Tablosu

GRUPLAR(FAKTÖR)
𝑖 1 2 …… k
1 𝑅11 𝑅21 𝑅𝑘1
2 𝑅12 𝑅22 𝑅𝑘2
⋮ ⋮ ⋮ ……… ⋮
𝑛𝑗 𝑅1𝑛1 𝑅2𝑛2 𝑅𝑘𝑛𝑘

𝑅𝑗 . 𝑅1 . 𝑅2 . …… 𝑅𝑘 . 𝑅. .
𝑛𝑗 𝑛1 𝑛2 …….. 𝑛𝑘 N
𝑅𝑗 . 𝑅1 . 𝑅2 . …….. 𝑅𝑘 . 𝑅. .

𝑅. .
𝑅. . ∶ Birleştirilmiş örnekte tüm birimlere verilen sıra sayılarınınortalaması (𝑅. . = )
𝑁

dir. Kruskal Wallis H-testi için test istatistiği:

12 2
𝐻= ∑𝑘𝑗=1 𝑛𝑗 (𝑅𝑗 . − 𝑅. . ) (4.37)
𝑁(𝑁+1)
veya
12 𝑅𝑗 . 2
𝐻= ∑𝑘𝑗=1 − 3(𝑁 + 1) (4.38)
𝑁(𝑁+1) 𝑛𝑗

şeklinde tanımlıdır. Test istatistiğinin örnekten hesaplanan değeri 𝐻ℎ ile gösterilsin.


Karar 𝛼 önem seviyesi ve 𝑝 = 𝑃𝑟(𝐻 ≥ 𝐻ℎ ) ile hesaplanan olasılık değeri olsun. Eğer 𝑝 < 𝛼
ise 𝐻0 hipotezi ret edilir ve gruplar arasında farklılık olduğuna karar verilir. Eğer 𝑝 ≥ 𝛼 ise
𝐻0 hipotezi ret edilemez ve gruplar arasında farklılık olmadığına karar verilir.
Kruskal-Wallis H-Testi İçin SPSS Algoritması

Adım:1 Varible View’de bağımlı değişken ve faktör (grup) değişkeni ile özellikleri
tanımlanır. Faktör değişkeni için faktör düzeyleri Values bölümünde grup numaraları ile
kodlanır.

Adım:2 Data View’de bağımlı değişkene ait veriler bağımlı değişken kolonuna, grup
numaraları ise faktör (grup) değişkeni kolonuna girilir.

Adım:3 Analyze > Nonparametric Test > Legacy Dialogs > K Independent Samples…
seçenekleri seçilir. Açılan ekranda değişkenler listesinden bağımlı değişken seçilerek Test
Variable List işlem kutusuna ve faktör (gruplama değişkeni) seçilerek Grouping Variable
işlem kutusuna aktarılır. Define Range pencerisi tıklanarak, açılan pencerede tanımlanan
gruplar için en küçük grup kodu ile en büyük grup kodu ilgili alanlara girilir. Continue
tıklanarak önceki ekrana dönülür.

Adım:4 Dönülen ekranda Test Type bölümünden Kruskal-Wallis H seçeneği işaretlenir.


Aynı ekranda Exact… penceresi açılarak, Tam olasılık 𝒑 değerinin hesaplanabilmesi için
Exact seçeneği, tam olasılık 𝒑 değerinin hesaplanamadığı durumlarda, yaklaşık olasılık
değerini veren Asymptotic only seçeneği işaretlenir ve Continue tıklanarak önceki ekrana
dönülür.
Adım:5 OK tuşu tıklanarak işlem bitirilir. Analiz sonucu bir tablo halinde Output (çıktı)
sayfasında sunulur. Bu tablo değerlendirilerek karar verilir. Eğer 𝑝 < 𝛼 ise 𝐻0 hipotezi ret
edilir ve gruplar arasında farklılık olduğuna karar verilir. Eğer 𝑝 ≥ 𝛼 ise 𝐻0 hipotezi ret
edilemez ve gruplar arasında farklılık olmadığına karar verilir.

Örnek 4.15 Örnek 4.14’deki veriyi kullanarak, hastalık gruplarına göre toral protein
değerlerine ait dağılımların ortalamalar bakımından farklılık gösterip göstermediği ile ilgili
hipotezleri oluşturup, bu hipotezlerin testini Kruskal-Wallis H-testini kullanarak SPSS ile
yapınız ve sonuçları değerlendiriniz?

Çözüm Total protein değerleri bakımından hastalık gruplarına ait ortalamalar arasında fark
olup olmadığına ilişkin test edilecek hipotezler;
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇
𝐻1 : En az bir 𝜇𝑗 diğerlerinden farklı
şeklinde kurulur. Kruskal Wallis H testinin SPSS sonuç tablosu;
Tablo 4.42 Hastalık Gruplarına Göre TP Değerleri İçin Kruskal Wallis H-Testi

Ranks Test Statisticsa,b

hastagrup N Mean totalprotein


Rank Chi-Square 17,857
Khasta 5 3,00 df 3
Hhasta 5 8,00 Asymp. Sig. ,000
Exact Sig. ,000
totalprotein Lhasta 5 13,00
Point
Thasta 5 18,00 ,000
Probability
Total 20

𝑝 = 0.000 ve 𝛼 = 0,01 iken 𝑝 < 𝛼 olup 𝐻0 ret edilir ve böylece hasta gruplarına TP
ortalamaları arasında fark vardır.

SORULAR
1. Algılama güçlüğünün performans üzerindeki etkilerinin araştırıldığı bir çalışmada, her
birinde 5 birimin yer aldığı üç örneklem grubu seçilmiştir. Bu gruplara sırayla kolay, orta ve
zor matematik problemleri sorulmuş ve bireylerin doğru olarak çözdükleri problem sayısı
aşağıdaki gibi çözülmüştür. Gruplara göre çözülen problem sayısının dağılımının
𝑁(𝜇𝑗 , 𝜎𝑗2 ), ( 𝑗 = 1,2,3) olduğu varsayımı altında:
a) Bu problemin analizinde hangi istatistiksel analiz kullanılmalıdır, neden?

b) Bu analiz gereğince test edilmesi gereken hipotezleri oluşturunuz?

c) SPSS programı ile verilerin analizini hem Friedman F- testi ile hem de Kruskal Wallis H-
testi yapınız?
d) Soru türlerine göre çözülen soru sayısına ait dağılımların homojen varyanslı olup
olmadığına %5 önem seviyesinde karar veriniz?

e) Soru türlerine göre grup ortalamaları arasında fark olup olmadığına dair uygulanacak olan
test için test istatistiği nedir ve 𝐻0 hipotezi altında hangi değeri alır?

f) %5 önem seviyesinde soru türlerinin çözülen soru sayısı üzerinde etkili olduğu söylenebilir
mi?

g) Eğer soru türlerine göre çözülen soru sayısı bakımından grup ortalamaları arasında fark
varsa, farklılık gösteren grupları belirleyiniz?

SORU TÜRÜ
Kolay Orta Zor
9 4 1
12 6 3
4 8 4
8 2 5
7 10 2

2. Yaşın yaratıcılık üzerindeki etkisinin incelendiği bir çalışmadan aşağıdaki veriler elde
edilmiştir. Bu veri düzenine göre dört farklı yaş grubu ele alınmış ve her bir yaş grubundan
rastgele olarak beşer birey seçilerek bireylerin yaratıcılık puanları ölçülmüştür. Yaratıcılık
puanı bakımından her bir yaş grubunun 𝑁(𝜇𝑗 , 𝜎𝑗2 ), ( 𝑗 = 1,2,3,4) olduğu varsayılmıştır.
Buna göre:
a) Bu problemin analizinde hangi istatistiksel analiz kullanılmalıdır, neden?

b) Bu analiz gereğince test edilmesi gereken hipotezleri oluşturunuz?

c) SPSS programı ile verilerin analizini hem Friedman F- testi ile hem de Kruskal Wallis H-
testi yapınız?

d) Yaş gruplarına göre yaratıcılık puanına ait dağılımların homojen varyanslı olup olmadığına
%5 önem seviyesinde karar veriniz?

e) Yaş gruplarına göre grup ortalamaları arasında fark olup olmadığına dair uygulanacak olan
test için test istatistiği nedir ve 𝐻0 hipotezi altında hangi değeri alır?

f) %5 önem seviyesinde yaş gruplarının çözülen yaratıcılık puanı üzerinde etkili olduğu
söylenebilir mi?

g) Eğer yaş gruplarına göre çözülen yaratıcılık puanı bakımından grup ortalamaları arasında
fark varsa, farklılık gösteren grupları belirleyiniz?
YAŞ GRUPLARI
YAŞ 4 YAŞ 7 YAŞ 10 YAŞ 13
3 9 9 7
5 11 12 7
7 14 9 6
4 10 8 4
3 10 9 5

3. Her bir grupta 21 kişinin yer aldığı beş gruplu bir çalışma düzenlenmiştir. Birimler
üzerinde herhangi bir X değişkeni (bağımlı değişken) için yapılan ölçümleri sonucu elde
edilen verilere ANOVA uygulanarak aşağıdaki Anova tablosu düzenlenmiştir. Bu tablodaki
eksik bilgileri tamamlayınız ve grup ortalamaları arasında fark olup olmadığına %5 önem
seviyesinde karar veriniz?
Kaynak sd KT KO F
Gruplar Arası (GA) 360
Hata (H) 4500
Genel /G)
4. Bir tek faktör varyans analizi probleminin çözümü sonucunda aşağıdaki Anova tablosu
düzenlenmiştir. Bu tablodaki eksik bilgileri tamamlayınız ve grup ortalamaları arasında fark
olup olmadığına %5 önem seviyesinde karar veriniz?
Kaynak sd KT KO F
Gruplar Arası (GA) 3 100
Hata (H) 960
Genel /G) 99
Çözüm 1
a) Bağımlı değişken (𝑋): Çözülen Soru Sayısı…. Nicel, kesikli ve ölçme düzeyi eşit aralıklı
Faktör: Soru türü…… Nitel ve ölçme düzeyi sınıflama
𝐾𝑜𝑙𝑎𝑦 (1. 𝑔𝑟𝑢𝑝) … . 𝑋1 ~𝑁(𝜇1 , 𝜎12 )
Faktör düzeyleri { 𝑂𝑟𝑡𝑎 (2. 𝑔𝑟𝑢𝑝) … . 𝑋2 ~𝑁(𝜇2 , 𝜎22 ) olup, bunlar bağımsız gruplardır.
𝑍𝑜𝑟 (3. 𝑔𝑟𝑢𝑝) … . 𝑋3 ~𝑁(𝜇3 , 𝜎32 )
Bağımsız grup sayısı (faktör düzey satısı) 𝑘 = 3 dür. Bu değişkenlere ve özelliklerine göre,
bu problemin analizinde Tek faktör Varyans analizi kullanılır.
b) Test edilecek hipotezler
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
𝐻1 : En az bir 𝜇𝑗 diğerlerinden farklı
şeklinde kurulur.

c) SPSS programı ile verilerin analiz


N Mean Std. Std. Error 95% Confidence Interval for Mean
Deviation Lower Bound Upper Bound
kolay 5 8,0000 2,91548 1,30384 4,3800 11,6200
orta 5 6,0000 3,16228 1,41421 2,0735 9,9265
zor 5 3,0000 1,58114 ,70711 1,0368 4,9632
Total 15 5,6667 3,24404 ,83761 3,8702 7,4632
ANOVA
PUAN
Sum of Squares df Mean Square F Sig.
Between Groups 63,333 2 31,667 4,524 ,034
Within Groups 84,000 12 7,000
Total 147,333 14

d) Soru türlerine göre cevaplanan soru sayısına ait dağılımların homojen varyanslı olup
olmadığı ile ilgili hipotezler
𝐻0 : 𝜎12 = 𝜎22 = 𝜎32
𝐻1 : En az bir 𝜎𝑗2 diğerlerinden faklı
şeklinde kurulur. Test işleminin sonuç tablosu aşağıdaki gibidir. Bu tabloya göre 𝑝 = 0,472
olup 𝛼=0,05 için 𝑝 > 𝛼 olduğundan 𝐻0 kabul edilir. Buna göre, soru türlerine göre
cevaplanan soru sayısına ait dağılımlar homojen varyanslıdır.

Test of Homogeneity of Variances


PUAN
Levene Statistic df1 df2 Sig.
,800 2 12 ,472

e) Soru türlerine göre grup ortalamaları arasında fark olup olmadığına dair uygulanacak olan
test için test istatistiği 𝐹 istatistiği olup, test istatistiğinin alabileceği değer; 𝐹ℎ = 4,524 dür.
f) Anova tablosundan 𝑝=0.034 olup 𝛼=0,05 için 𝑝 < 𝛼 olduğundan 𝐻0 ret edilir. Bu
durumda soru türünün çözülecek soru sayısı üzerinde etkisi soru türüne göre farklılık
göstermektedir.
g) Soru türlerine göre çözülecek soru sayısı bakımından grup ortalamaları arasında fark
olduğuna göre, farklılık gösteren grupları çoklu karşılaştırma teknikleri ile belirleriz. Gruplar
homojen varyanslı olduğundan Tukey HSD testi kullanılabilir. Test sonuçları aşağıdaki
tabloda verilmiştir.
Multiple Comparisons
Dependent Variable: PUAN
(I) GRUP (J) GRUP Mean Difference Std. Error Sig. 95% Confidence Interval
(I-J) Lower Bound Upper Bound
orta 2,00000 1,67332 ,478 -2,4642 6,4642
kolay
zor 5,00000* 1,67332 ,028 ,5358 9,4642
kolay -2,00000 1,67332 ,478 -6,4642 2,4642
Tukey HSD orta
zor 3,00000 1,67332 ,213 -1,4642 7,4642
*
kolay -5,00000 1,67332 ,028 -9,4642 -,5358
zor
orta -3,00000 1,67332 ,213 -7,4642 1,4642
*. The mean difference is significant at the 0.05 level.

Bu tabloya göre:
1. Çözülen soru sayısı bakımından Kolay soru grubu ile Orta soru grubu farklılık
göstermemektedir. Çünkü; 𝑃(−2,46 ≤ 𝜇1 − 𝜇2 ≤ 6,46) = 0,95 olup, güven aralığı sıfırı
kapsamaktadır.
2. Çözülen soru sayısı bakımından Kolay grubu ile Zor grubu farklılık göstermektedir.
Çünkü; 𝑃(0,54 ≤ 𝜇1 − 𝜇3 ≤ 9,46) = 0,95 olup, güven aralığı sıfırı kapsamamaktadır.
Üstelik güven sınırları pozitif olduğundan kolay grubunda çözülen soru sayı daha fazladır..
3. Çözülen soru sayısı bakımından Orta grubu ile Zor grubu farklılık göstermemektedir.
Çünkü; 𝑃 (−1,46 ≤ 𝜇2 − 𝜇3 ≤ 7,46) = 0,95 olup, güven aralığı sıfırı kapsamaktadır.

You might also like