Professional Documents
Culture Documents
Varyans Analizi
Öğrenme hedefleri
Bu bölümde öğreneceklerimiz:
Deney tasarımının temel yapısı
Çok sayıda grubun ortalamaları arasındaki farkın testi için tek-
yönlü varyans analizinin nasıl kullanılacağı
Çift-yönlü varyans analizinin nasıl kullanılacağı ve etkileşimlerin
etkisinin yorumlanması
Tek-yönlü varyans analizinde ve çift-yönlü varyans analizinde
çoklu karşılaştırmaların nasıl yapılacağı
2
Neden varyans analizi?
5
Varyans analizindeki dağılımlar
6
Bölüme kısa bir bakış
Varyans Analizi (ANOVA)
Tek-Yönlü Çift-Yönlü
ANOVA ANOVA
F-testi
Etkileşimin
Etkileri
Tukey-Kramer
Çoklu
Karşılaştırmalar Tukey Çoklu
Karşılaştırmalar
Varyansın
Homojenliği
İçin
Levene Testi
7
Genel ANOVA ayarları
düşünülür
Bağımlı değişken üzerindeki etkiler gözlemlenir
Gruplar aynı mı?
8
Bütünüyle rassal tasarım
9
Tek-Yönlü varyans analizi
Üç veya daha fazla grubun ortalamaları arasındaki
farkı değerlendirir
Örnekler: 1’inci, 2’inci ve 3’üncü vardiyalardaki kaza sayısı
Beş farklı markanın lastiklerinin beklenen ömrü
Varsayımlar
Anakütleler normal dağılır
10
Tek-Yönlü ANOVA’nın hipotezleri
H0 : μ1 μ2 μ3 μc
Bütün anakütlelerin ortalamaları eşittir
Yani faktör etkisi yoktur (gruplar arasında
ortalamalarda varyasyon bulunmamaktadır)
H1: Anakütle ortalamalarından en az
biri diğerlerinden farklıdır
En az bir anakütle ortalaması farklıdır
Yani faktör etkisi vardır
Bu bütün anakütle ortalamaları birbirinden farklıdır
anlamına gelmez (bazıları aynı olabilir)
11
Yek-Yönlü ANOVA
H0 : μ1 μ2 μ3 μc
H1: Bütün j’ler eşit değil
Sıfır Hipotezi Doğru
Bütün Ortalamalar Aynı
(Faktör Etkisi Yok)
μ1 μ 2 μ 3
12
Tek-Yönlü ANOVA
H0 : μ1 μ2 μ3 μc
H1: Bütün j’ler eşit değil
Sıfır Hipotezi Yanlış
En Az Bir Ortalama Diğerlerinden Farklı
(Faktör Etkisi Var)
veya
μ1 μ2 μ3 μ1 μ2 μ3
13
Varyasyon bölümleme
14
Varyasyon bölümleme
15
Toplam varyasyon
Toplam Varyasyon
(SST)
16
Kareler toplamı
SST = SSA + SSW
c nj
SST ( Xij X) 2
j1 i1
Burada:
SST = Kareler toplamı
c = grup veya seviye sayısı
nj = grup j’deki gözlem sayısı
Xij = grup j’nin i’inci gözlemi
X = büyük ortalama (bütün veri değerlerinin
ortalaması) 17
Toplam varyasyon
2 2 2
SST ( X 11 X ) ( X 12 X ) ( X cn X )
c
X
R esponse, X
GGrup
roup11 GGrup
roup22 G roup33
Grup
18
Gruplar arası varyasyon
SST = SSA + SSW
c
SSA n j ( X j X)2
j1
Burada:
SSA = gruplar arası kareler toplamı
c = grup sayısı
nj = grup j’deki örnek boyutu
Xj = grup j’nin örnek ortalaması
X = büyük ortalama (bütün veri değerlerinin
ortalaması) 19
Gruplar arası varyasyon
c
SSA n j ( X j X)2
j1
SSA
Gruplar Arası Farklılıklardan
MSA
Dolayı Varyasyon
c 1
Gruplar Arası Ortalama
Kareler (Mean Square
Among) = SSA/serbestlik
i j derecesi
20
Gruplar arası varyasyon
SSA n 1 (X1 X) n 2 (X 2 X) n c (X c X)
2 2 2
X
R esponse, X
X3
X2 X
X1
GGrup
roup11 G roup2 2
Grup GGrup
roup33
21
Gruplar içi varyasyon
SST = SSA + SSW
c nj
SSW ( Xij X j ) 2
j1 i1
Burada:
SSW = gruplar içi kareler toplamı
c = grup sayısı
nj = grup j’nin örnek boyutu
Xj = grup j’nin örnek ortalaması
Xij = grup j’deki i’inci gözlem
22
Gruplar içi varyasyon
c nj
SSW ( Xij X j )2
j1 i1
SSW
Her bir grup içindeki varyasyonun
MSW
toplanması ve daha sonra tüm
gruplar üzerine eklenmesi nc
Gruplar İçi Ortalama
Kareler (Mean Square
Within) = SSW/serbestlik
derecesi
n = bütün grupların örnek
μj sayısı toplamı
23
Gruplar içi varyasyon
X
R esponse, X
X3
X2
X1
GGrup
roup11 G roup2 2
Grup GGrup
roup33
24
Ortalama karelerin elde
edilmesi
Ortalama Kareler, hesaplanan kareler toplamlarının ilgili
serbestlik derecesine bölünmesiyle elde edilir
c = grup sayısı
n = bütün grupların örnek sayısı toplamı
df = serbestlik derecesi
26
Tek-Yönlü ANOVA
F testi
H0: μ1= μ2 = … = μc
H1: En az iki anakütlenin ortalaması birbirinden farklıdır
Test istatistiği MSA
FSTAT
MSW
MSA gruplar arası ortalama kareler
MSW gruplar içi ortalama kareler
Serbestlik derecesi
df1 = c – 1 (c = grup sayısı)
df2 = n – c (n = bütün anakütlelerin örnek sayısı toplamı)
27
Tek-Yönlü ANOVA
F istatistiğinin yorumlanması
F istatistiği gruplar arası ve gruplar içi
varyans tahminleri oranıdır
Oran daima pozitif olmalıdır
df1 = c -1 küçük olacaktır
df2 = n - c büyük olacaktır
Karar Kuralı:
F
STAT > Fα ise H0 Reddedilir,
Değilse H0 Kabul Edilir 0 H0 Kabul H0 Red
Fα
28
Tek-Yönlü ANOVA
Örnek
29
Tek-Yönlü ANOVA örnek:
Dağılım grafiği
Süre (Sn)
270
M1 M2 M3
254 234 200 260 •
•
263
241
218
235
222
197
250 • X1
240 •
237 227 206 • ••
230
251 216 204
220
•
X2 • X
••
210
x1 249.2 x 2 226.0 x 3 205.8
•• X3
200 ••
x 227.0 190
1 2 3
Makine 30
Tek-Yönlü ANOVA örnek:
Hesaplamalar
M1 M2 M3 X1 = 249.2 n1 = 5
254 234 200
X2 = 226.0 n2 = 5
263 218 222
241 235 197 X3 = 205.8 n3 = 5
237 227 206 n = 15
251 216 204 X = 227.0
c=3
SSA = 5 (249.2 – 227)2 + 5 (226 – 227)2 + 5 (205.8 – 227)2 = 4716.4
SSW = (254 – 249.2)2 + (263 – 249.2)2 +…+ (204 – 205.8)2 = 1119.6
SUMMARY
Groups Count Sum Average Variance
M1 5 1246 249.2 108.2
M2 5 1130 226 77.5
M3 5 1029 205.8 94.2
ANOVA
Source of
SS df MS F P-value F crit
Variation
Between
4716.4 2 2358.2 25.275 0.0000 3.89
Groups
Within
1119.6 12 93.3
Groups
Total 5836.0 14
33
Tukey-Kramer prosedürü
μ1= μ2 μ3 x
34
Tukey-Kramer kritik aralığı
MSW 1 1
Critical Aralık Q α
Kritik Range
2 n j n j'
burada:
Qα = Üst kuyruk kritik değeri (Studentized
Range Distribution with c and n - c degrees
of freedom) (E.7 table)
MSW = grup içi ortalama kare
nj ve nj’ = sırasıyla grup j ve grup j’ örnek sayıları
35
Tukey-Kramer prosedürü: Örnek
1. Mutlak ortalama farklarını
M1 M2 M3 hesapla:
254 234 200
263 218 222 x1 x 2 249.2 226.0 23.2
241 235 197 x1 x 3 249.2 205.8 43.4
237 227 206
251 216 204 x 2 x 3 226.0 205.8 20.2
4. Karşılaştır:
5. Bütün mutlak ortalama farklar kritik x1 x 2 23.2
aralıktan daha büyük. Bu yüzden, %5
önem düzeyinde ortalamaların her bir x1 x 3 43.4
çifti arasında istatistiksel olarak
anlamlı bir farklılık vardır. Sonuç olarak, x 2 x 3 20.2
95% güven düzeyinde M1’in ortalama işlem
süresi M2 ve M3’ten büyük ve M2’nin
ortalama işlem süresi M3’ten büyüktür
denilebilir.
37
ANOVA varsayımlar
Rassallık ve Bağımsızlık
c adet gruptan rassal örnekler seçilir (veya seviyeler
rastgele atanır)
Normallik
Her grubun örnek değerleri normal anakütlelerden
alınmıştır
Varyans Homojenliği
Örneklerin varyansı birbirine eşittir
Levene Testi ile test yapılabilir
38
ANOVA varsayımları
Levene testi
39
Levene varyans homojenliği testi
Örnek
M1 M2 M3 M1 M2 M3
237 216 197 14 11 7
241 218 200 10 9 4
251 227 204 Medyan 0 0 0
254 234 206 3 7 2
263 235 222 12 8 18
40
Levene varyans homojenliği testi
Örnek
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
p-değeri 0.05’ten
M1 5 39 7.8 36.2 büyük
M2 5 35 7 17.5 olduğundan
M3 5 31 6.2 50.2 varyansların farklı
olduğuna ilişkin
P- yeterli kanıt
Source of Variation SS df MS F value F crit
bulunmamaktadır
Between Groups 6.4 2 3.2 0.092 0.912 3.885
Total 422 14
41
Tek-Yönlü ANOVA
Örnek
Bir atölyede aynı parçayı üreten 3 tezgah vardır. Her tezgah farklı bir
operatör tarafından çalıştırılmaktadır. Altı saatlik bir üretim devresinde
her bir saatte üretilen kusurlu birim sayıları belirlenmiş ve aşağıda
verilmiştir. Bir saat içinde üretilen kusurlu parçaların normal dağıldığı
varsayılmaktadır. %95 güven düzeyinde (=%5 hata seviyesinde)
tezgahların kusurlu üretim ortalamalarının aynı olup olmadığına karar
veriniz.
42
Tek-Yönlü ANOVA
Örnek
43
Tek-Yönlü ANOVA
Örnek
44
Faktöriyel dizayn:
Çift-Yönlü ANOVA
Aşağıdakilerin etkisinin araştırılmasında
kullanılır
Bağımlı değişken üzerinde iki faktör etkisi
örn., meşrubat şişeleme sürecinde yüzde
karbonatlaşma ve hat hızı etkisi
Bu iki faktörün farklı seviyelerinin arasında
etkileşim olup olmadığı
örn, Belirli bir karbonatlaşma seviyesi ile belirli bir hat
hızı ayarının arasında etkileşimin olup olmadığı?
45
Çift-Yönlü ANOVA
Varsayımlar
46
Çift-Yönlü ANOVA
varyasyon kaynağı
İki faktörün etkisi araştırılmaktadır: A and B
r = A faktörünün seviye sayısı
c = B faktörünün seviye sayısı
n’ = her bir hücrenin tekerrür sayısı (ij hücresi)
n = bütün seviyelerdeki toplam gözlem sayısı
n = (r)(c)(n’)
Xijk = A faktörü i’nci seviye ve B faktörü j’inci
seviye için k’nıncı gözlemin değeri
47
Çift-Yönlü ANOVA
varyasyon kaynağı
SST = SSA + SSB + SSAB + SSE Serbestlik
derecesi:
SSA r–1
Faktör A Varyasyonu
r c n
Toplam Varyasyon SST ( Xijk X) 2
i1 j1 k 1
r
Faktör A Varyasyonu SSA cn ( Xi.. X)
2
i1
c
Faktör B Varyasyonu SSB rn ( X. j. X)2
j1
49
Çift-Yönlü ANOVA eşitlikleri
i1 j1 k 1
50
Çift-Yönlü ANOVA eşitlikleri
r c n
burada: X
i 1 j 1 k 1
ijk
X Buyuk Ortalama
c n
rc n
X
j 1 k 1
ijk
X ijk
X . j. i 1 k 1
Faktor B' nin j' nci seviye ortalamasi (j 1, 2, ..., c)
rn
n X ijk
r = faktör A’nın seviye sayısı
X ij . Hucre ij' nin ortalamasi c = faktör B’nin seviye sayısı
k 1 n n’ = her hücrede tekrar (deneme)
sayısı
51
Ortalama kare hesaplamaları
SSA
MSA Faktör A ortalama kare (Mean square factor A)
r 1
SSB
MSB Faktor B ortalama kare (Mean square factor B)
c 1
MSAB Ortalama kare etkilesimi
SSAB
(Mean square interaction)
(r 1)(c 1)
SSE
MSE Ortalama kare hatasi (Mean square error)
rc (n'1)
52
Çift-Yönlü ANOVA:
F testi istatistikleri
Faktör A Etkisi İçin F Testi
H0: μ1..= μ2.. = μ3..= • • = µr..
MSA
H1: Bütün μi.. eşit değil FSTAT FSTAT > Fα ise
MSE H0 Reddedilir
55
Örnekler:
Etkileşimler
Etkileşim Var: bazı doğru
Etkileşim Yok: doğru parçaları paralel değil
parçaları paralel
Faktör B Seviye 1
Ortalama Karşılık
Ortalama Karşılık
Faktör B Seviye 1
Faktör B Seviye 3
Faktör B Seviye 2
Faktör B Seviye 2
Faktör B Seviye 3
56
Çift-Yönlü ANOVA
Örnek
ACT Scores for Different Types and Lengths of Courses
LENGTH OF COURSE
Traditional 26 18 34 28
Traditional 27 24 24 21
Traditional 25 19 35 23
Traditional 21 20 31 29
Traditional 21 18 28 26
Online 27 21 24 21
Online 29 32 16 19
Online 30 20 22 19
Online 24 28 20 24
Online 30 29 23 25 57
Şekilden güçlü bir etkileşim
olduğu anlaşılmaktadır
Uzaktan öğretim
yoğunlaştırılmış derslerde
en yüksek puanı verirken,
geleneksel öğretim
düzenli eğitimde en
yüksek puanı
vermektedir.
58
Excel İle ders verileri analizi
Kurs uzunluğu (düzenli,
yoğunlaştırılmış) ile tipi
(geleneksel, uzaktan) arasında
etkileşim vardır çünkü
p-değeri 0.0000’dır.
59
Dört grup verileri arasındaki etkileşim
60
Excel ile analiz
62