Professional Documents
Culture Documents
İSTATİSTİK – II DERSLERİ
3. ÜNİTE
REGRESYON TEORİSİ
ERZURUM, 2020
3. BÖLÜM
REGRESYON TEORİSİ
Dağılma Diyagramları
Değişkenler arasındaki ilişkiyi tespit etmekte ilk adım, söz konusu değiş-
kenler için bir dağılma diyagramı teşkil etmektir. Bu diyagramdaki noktaların
durumuna göre, regresyon denkleminin şekline karar verilir. Aşağıdaki dağılma
diyagramlarından birinci ve üçüncüsünde noktalar belirli bir doğrultuda serpil-
miştir. Bu sebeple birinci ve üçüncü dağılma diyagramlarını belirleyen verilere
regresyon modeli uydurulabilir. Daha sonra belirlenen modele ait katsayılar he-
saplanır ve nihayet önem kontrolü yapılarak, model seçiminin isabetli olup ol-
madığı test edilir. Eğer önem kontrolü sonunda, regresyon denkleminin dağılımı
iyi temsil etmediği ortaya çıkarsa, bir başka model üzerinde çalışılır.
Y Y Y
X X X
Y A
Y − Ŷ Y = a + bX
Y−Y
B
Ŷ − Y
Y
C
0 X
nır. Fark kare toplamının serbestlik derecesine bölünmesiyle elde edilecek değe-
rin karekökü alındığında standart hata hesaplanır.
Σ(Yi − Ŷi ) 2
S YX =
n −1− m
m, regresyon modelindeki parametre sayısıdır. Parametreler regresyon
modelinin yönünü ve şeklini belirlerler.
Standart hatası daha küçük olan regresyon modeli, değişkenler arasındaki
ilişkiyi daha iyi temsil eder.
ΣY = na + bΣX
ΣXY = aΣX + bΣX 2
Müşahede edilen X ve Y değerleri üzerinden gerekli hesaplamalar yapıla-
rak normal denklem sisteminde yerine yazıldığında birinci dereceden iki bilin-
meyenli bir denklem sistemi elde edilir. Bu denklem sistemi çözülerek lineer
regresyon modelindeki a ve b sabitleri bulunur.
bΣxy
Fh = 2
Σy − bΣxy
n−2
Test istatistiği, kritik F değerinden büyük olursa, H0 hipotezi reddedilerek,
lineer regresyon modelinin anlamlı olduğuna karar verilir.
Örnek: Bir süpermarket yöneticisi tesadüfi olarak seçilen bir saatlik süre-
lerde kasaya gelen müşteri sayısını ve ödedikleri toplam para miktarını aşağıdaki
gibi kaydetmiştir.
Müşteri Sayısı 25 20 50 35 40
Ödenen Para (10000-TL) 12.5 10.4 25.3 20.2 24.1
Müşteri sayısını bağımsız (X), kasalara ödenen para miktarını bağımlı de-
ğişken (Y) olarak kabul ederiz. Y = a + bX şeklindeki lineer regresyon denkle-
mindeki a ve b sabitlerini elde edebilmek için
ΣY = na + bΣX
ΣXY = aΣX + bΣX 2
normal denklem sisteminde bilinenlerin yerine yazılması gerekir. X ve Y değiş-
kenlerinden hareketle aşağıdaki hesaplamalar yapılır.
Ölçüm X Y XY X2 Y2
1 25 12.5 312.5 625 156.25
2 20 10.4 208.0 400 108.16
3 50 25.3 1265.0 2500 640.09
4 35 20.2 707.0 1225 408.04
5 40 24.1 964.0 1600 580.81
Toplam 170 92.5 3456.5 6350 1893.35
Tabloda yapılan hesaplamalara göre normal denklem sistemi,
92.5 = 5a + 170b
3456.5 = 170a + 6350b
şeklinde yazılır. Bu denklem sistemi çözüldüğünde, a = −0.064 ve b = 0.546
bulunur.
Bağımsız değişken X, bağımlı değişken Y ekseninde gösterilmek üzere,
(X,Y) değişken çiftlerinin belirlediği noktalar diyagramı ve bu noktalardan mi-
nimum sapma ile geçen Y = −0.064 + 0.546X regresyon doğrusu aşağıdaki gibi-
dir.
ÜÇÜNCÜ BÖLÜM: REGRESYON TEORİSİ 78
28
24
Ödenen Tutar (10000-TL)
20
16
Y = −0.064 + 0.546X
12
8
15 20 25 30 35 40 45 50 55
Müşteri Sayısı
n−2 5−2
olarak elde edilir.
Test istatistiği, kritik değerden büyük olduğu için %5 önem seviyesinde
H0 hipotezini reddederek lineer regresyon modelinin anlamlı olduğuna ve tahmin
maksadıyla kullanılabileceğine karar veririz.
KISA TEORİK BİLGİLER 79
Σ(Y − a − bX − cX 2 ) 2
ifadesi elde edilir. Bu ifadenin a, b ve c’ye göre ayrı ayrı kısmi türevleri alına-
rak sıfıra eşitlenirse aşağıdaki normal denklemler elde edilir.
ΣY = na + bΣX + cΣX 2
ΣXY = aΣX + bΣX 2 + cΣX 3
ΣX 2 Y = aΣX 2 + bΣX 3 + cΣX 4
Müşahede edilen X ve Y değerleri üzerinden gerekli hesaplamalar yapıla-
rak normal denklem sisteminde yerine yazılırsa birinci dereceden üç bilinme-
yenli bir denklem sistemi elde edilir. Bu denklem sistemi çözüldüğünde lineer
regresyon modelindeki, a, b ve c sabitleri elde edilir.
Mamul Sayısı 7 9 12 14 17
Marjinal Maliyet 6 7 10 15 25
ΣY = na + bΣX + cΣX 2
ΣXY = aΣX + bΣX 2 + cΣX 3
ΣX 2 Y = aΣX 2 + bΣX 3 + cΣX 4
normal denklem sisteminde bilinenlerin yerine yazılması gerekir. X ve Y değiş-
kenlerinden hareketle aşağıdaki hesaplamalar yapılır.
X Y XY X2 X3 X4 X 2Y Y2
7 6 42 49 343 2401 294 36
9 7 63 81 729 6561 567 49
12 10 120 144 1728 20736 1440 100
14 15 210 196 2744 38416 2940 225
17 25 425 289 4913 83521 7225 625
59 63 860 759 10457 151635 12466 1035
28
24
20
Y = 18.044 – 3.164X + 0.21X2
Marjinal Maliyet
16
12
4
7 8 9 10 11 12 13 14 15 16 17
Mamul Sayısı
ÜÇÜNCÜ BÖLÜM: REGRESYON TEORİSİ 82
Σ(Y − a − b1X1 − b 2 X 2 ) 2
ifadesi elde edilir. Bu ifadenin a, b1 ve b2’ye göre ayrı ayrı kısmi türevleri alına-
rak sıfıra eşitlediğimizde aşağıdaki normal denklemleri elde ederiz.
ΣY = na + b1ΣX 1 + b 2 ΣX 2
ΣX 1 Y = aΣX 1 + b1ΣX 12 + b 2 ΣX 1 X 2
ΣX 2 Y = aΣX 2 + b1ΣX 1 X 2 + b 2 ΣX 22
Müşahede edilen X1, X2 ve Y değerleri ile gerekli hesaplamalar yapılarak
normal denklem sisteminde yerine yazıldığında birinci dereceden üç bilinme-
yenli bir denklem sistemi elde edilir. Bu denklem sistemi çözülerek iki bağımsız
değişkenli regresyon modelindeki a, b1 ve b2 sabitleri elde edilir.
X1 X2 Y X1 Y X2Y X1 X 2 X 12 X 22 Y2
5 18 40 200 720 90 25 324 1600
8 10 37 296 370 80 64 100 1369
7 12 43 301 516 84 49 144 1849
9 9 35 315 315 81 81 81 1225
11 5 30 330 150 55 121 25 900
40 54 185 1442 2071 390 340 674 6943
( ΣY ) 2 185 2
Σy 2 = ΣY 2 − = 6943 − = 98
n 5
(ΣX 1 )(ΣY ) 40(185)
Σx 1 y = ΣX 1 Y − = 1442 − = −38
n 5
(ΣX 2 )(ΣY ) 54(185)
Σx 2 y = ΣX 2 Y − = 2071 − = 73
n 5
bulunur. Regresyon sabitleri ve yukarıdaki hesaplamalar kullanılarak test istatis-
tiği,
b1Σx1 y + b 2 Σx 2 y (−7.392)(−38) + (−2.615)(73)
Fh = 2 2 = 2 = 11.25
Σy − (b1Σx1 y + b 2 Σx 2 y) 98 − [(−7.392)(−38) + (−2.615)(73)]
n −3 5−3
olarak hesaplanır.
Test istatistiği, kritik F değerinden küçük olduğu için H0 hipotezi kabul
edilerek çoklu regresyon modelinin önemsiz olduğuna ve tahmin maksadıyla
kullanılamayacağına karar verilir.
Yaşlar 1 3 4 6 8 9 11 14
Tedavi Sayısı 1 2 4 4 5 7 8 9