Professional Documents
Culture Documents
Korelasyon Teorisi
Korelasyon Teorisi
İSTATİSTİK – II DERSLERİ
4. ÜNİTE
KORELASYON TEORİSİ
ERZURUM, 2020
4. BÖLÜM
KORELASYON TEORİSİ
Σ(Ŷ − Y ) 2
r=±
Σ( Y − Y ) 2
şeklindedir. Korelasyon katsayısının işareti, regresyon doğru veya eğrisine ait
eğim katsayısının işaretidir. Kök içerisindeki kesrin paydası genel kareler topla-
mıdır. Kesrin payı ise sebebi bilinen değişim olarak adlandırılır. Yani, genel ka-
reler toplamı içerisinde regresyonla belirlenebilen kısmı ifade eder. Buna göre,
kök içerisindeki kısım, toplam değişimin yüzde kaçının, regresyonla belirlenebi-
leceğini gösterir. Bu nispete, determinasyon katsayısı adı verilir. Bu nispetin,
meselâ %90 çıkması halinde toplam değişimin %90’ı regresyonla, yani bağımsız
değişken veya değişkenler tarafından belirlenmiştir. %10’u ise, ya tesadüfen
meydana gelmiş veya dikkate alınmayan başka değişkenlerce belirlenmiştir. De-
terminasyon katsayısı, r2 ile gösterilir. Korelasyon katsayısının karesi determi-
nasyon katsayısını verir. Yukarıdaki eşitlikte her iki tarafın karesi alındığında
determinasyon katsayısı,
DÖRDÜNCÜ BÖLÜM: KORELASYON TEORİSİ 104
Σ(Ŷ − Y ) 2
r2 =
Σ( Y − Y ) 2
olarak ifade edilir.
Regresyondan kaynaklanan değişim, toplam değişimden hata sonucu elde
edilen değişimin çıkarılması ile bulunur. Buna göre yukarıdaki formül,
Σ(Y − Y ) 2 − Σ(Y − Ŷ) 2 Σ(Y − Ŷ) 2
r2 = = 1 −
Σ( Y − Y ) 2 Σ( Y − Y ) 2
şeklinde yeniden yazılabilir.
Noktalar diyagramındaki noktalar regresyon doğru veya eğrisinin üzerin-
de veya etrafında yoğunlaştıkça korelasyon ve determinasyon katsayısı mutlak
değerce yüksek çıkar. Diyagramdaki noktalar regresyon doğru veya eğrisinden
uzakta yer aldıkça korelasyon ve determinasyon katsayısı da mutlak değerce kü-
çülür.
Y Y Y
X X X
1− r2
sr =
n−2
formülüyle bulunur.
Test istatistiği, mutlak olarak kritik değerden büyük çıktığında, X ile Y
değişkenleri arasında önemli bir ilişki olduğunu söyleyebiliriz. Bununla birlikte,
bu değişkenler arasında mantıki bir ilginin bulunması şarttır. Bazen hiç alakası
olmayan değişkenler arasında da yüksek bir korelasyon çıkabilmektedir. Bu tip
korelasyonlara sahte korelasyon denir.
Örnek büyüklüğü yükseldikçe, daha düşük yüzdelerin bile testte önemli
çıkması mümkün olabilmektedir. Meselâ, bir problemde 0.70’lik bir korelasyon,
test sonunda önemsiz çıkarken; diğer bir problemde, 0.45’lik korelasyonun
önemli çıktığını görebiliriz. Örneğin büyük olması halinde düşük korelasyonlar
önemli çıkabilmektedir.
Örnek: Bir süpermarket yöneticisi tesadüfi olarak seçilen bir saatlik süre-
lerde kasaya gelen müşteri sayısını ve ödedikleri toplam para miktarını aşağıdaki
gibi kaydetmiştir.
Müşteri Sayısı 25 20 50 35 40
Ödenen Para (10000-TL) 12.5 10.4 25.3 20.2 24.1
Müşteri sayısını bağımsız (X), kasalara ödenen para miktarını bağımlı de-
ğişken (Y) olarak kabul ederek, lineer korelasyon katsayısını,
nΣXY − (ΣX)(ΣY )
r=
[nΣX − (ΣX ) 2 ][nΣY 2 − (ΣY ) 2 ]
2
5(3456.5) − 170(92.5)
r= ≅ 0.9669
[5(6350) − 170 2 ][5(1893.35) − (92.5) 2 ]
olarak hesaplanır.
Korelasyon katsayısının önemli olup olmadığını %5 önem seviyesinde test
ederken, test hipotezleri,
H0: ρ = 0
H1: ρ ≠ 0
şeklinde kurulur.
Tablo 3, v = n – 2 = 5 – 2 = 3 serbestlik derecesi ve α/2 = 0.05/2 = 0.025
önem seviyesine göre kritik değerlerin ±3.182 olduğunu göstermektedir.
Test istatistiği,
r 0.9669
th = = ≅ 6.5635
2
1− r 1 − (0.9669) 2
n−2 5−2
şeklinde hesaplanır.
Test istatistiği, kritik t değerinden büyük olduğu için %5 önem seviye-
sinde H0 hipotezi reddedilerek hesaplanan lineer korelasyon katsayısının önemli
olduğuna karar verilir.
(ΣX 2 )(ΣY)
Σx 2 y = ΣX 2 Y −
n
formülleri ile hesaplanır.
Örnek: Bir üretim prosesinde üretilen mamul miktarı (yıl başına 1000
adet) ve marjinal maliyet tutarları (mamul başına 100000-TL) aşağıdaki gibidir.
Mamul Sayısı 7 9 12 14 17
Marjinal Maliyet 6 7 10 15 25
X1 X2 Y X1 Y X2Y X1 X 2 X 12 X 22 Y2
5 18 40 200 720 90 25 324 1600
8 10 37 296 370 80 64 100 1369
7 12 43 301 516 84 49 144 1849
9 9 35 315 315 81 81 81 1225
11 5 30 330 150 55 121 25 900
40 54 185 1442 2071 390 340 674 6943
Tablodaki hesaplamalardan yararlanarak iki bağımsız değişkenli regres-
yon modelindeki katsayılar, a = 124.385, b1 = −7.392 ve b2 = −2.615 bulunur.
( ΣY ) 2 185 2
Σy 2 = ΣY 2 − = 6943 − = 98
n 5
(ΣX 1 )(ΣY) 40(185)
Σx 1 y = ΣX 1 Y − = 1442 − = −38
n 5
(ΣX 2 )(ΣY) 54(185)
Σx 2 y = ΣX 2 Y − = 2071 − = 73
n 5
olarak belirlenir. Bu değerler kullanılarak iki bağımsız değişkenli regresyon mo-
deline ait determinasyon katsayısı,
b1Σx 1 y + b 2 Σx 2 y − 7.392(−38) + (−2.615)(73)
r2 = 2
= ≅ 0.9184
Σy 98
bulunur. Eğitim süresi ve iş tecrübesi, aylık geliri %91.84 oranında açıklayabil-
mektedir.