You are on page 1of 15

İSTATİSTİĞE GİRİŞ – II ve

İSTATİSTİK – II DERSLERİ

3. ÜNİTE
REGRESYON TEORİSİ

Prof. Dr. Erkan OKTAY

ERZURUM, 2020
3. BÖLÜM
REGRESYON TEORİSİ

I- KISA TEORİK BİLGİLER


Uygulamada genellikle çeşitli değişkenler arasında bir ilginin bulunduğu
görülür. Bu ilginin fonksiyonel olarak ifade edilmesi regresyon teorisinin konu-
sudur. Regresyonda, bir veya daha çok bağımsız değişkenle bir bağlı değişken
açıklanmaya çalışılır.

Dağılma Diyagramları
Değişkenler arasındaki ilişkiyi tespit etmekte ilk adım, söz konusu değiş-
kenler için bir dağılma diyagramı teşkil etmektir. Bu diyagramdaki noktaların
durumuna göre, regresyon denkleminin şekline karar verilir. Aşağıdaki dağılma
diyagramlarından birinci ve üçüncüsünde noktalar belirli bir doğrultuda serpil-
miştir. Bu sebeple birinci ve üçüncü dağılma diyagramlarını belirleyen verilere
regresyon modeli uydurulabilir. Daha sonra belirlenen modele ait katsayılar he-
saplanır ve nihayet önem kontrolü yapılarak, model seçiminin isabetli olup ol-
madığı test edilir. Eğer önem kontrolü sonunda, regresyon denkleminin dağılımı
iyi temsil etmediği ortaya çıkarsa, bir başka model üzerinde çalışılır.

Y Y Y

X X X

Uygulamada eldeki verilere, en fazla lineer regresyon modeli uydurul-


maktadır. Bu ünitede lineer regresyon modelinin yanı sıra, parabolik ve çok de-
ğişkenli regresyon modelleri de tanıtılacaktır.
ÜÇÜNCÜ BÖLÜM: REGRESYON TEORİSİ 74

En Küçük Kareler Metodu


En küçük kareler metodunda, gerçekleşen Y değerleri ile regresyon fonk-
siyonundan elde edilen tahmini Y değerleri arasındaki fark ei olmak üzere,
Σe i2 = Σ( Yi − Ŷi ) 2
kareler toplamını minimum kılan regresyon modelinin tespit edilmesi öngörülür.

Y A

Y − Ŷ Y = a + bX
Y−Y
B
Ŷ − Y
Y
C

0 X

Müşahede edilen X ve Y değer çiftinin dağılma diyagramında A noktasını


belirlediği farz edilsin. (X,Y) değişken çiftlerine uygulanan Y = a + bX şeklinde-
ki lineer regresyon modelinde X değişkeni yerine yazıldığında B noktası belirle-
nir. Çizilen her doğru için Y değerleri ile tahmini Y değerleri arasında değişik
farklar çıkacaktır. Bu şekilde A ve B noktaları arasındaki farkı minimum kılan
regresyon modeli bu noktaları en iyi temsil eden modeldir.

Tahminin Standart Hatası


Standart hata, gerçek değerlerle tahmini değerler arasındaki farkın ölçüsü-
dür. Temelde standart sapmaya benzer. Standart sapma, verilerin ortalama etra-
fındaki dağılışları hakkında bilgi sağlar. Standart sapması küçük olan dağılımın
değişkenliğinin daha az olduğu söylenir. Tahminin standart hatası hesaplanırken,
Yi değerlerinden Ŷi değerleri çıkarılır. Bulunan farkların karesi alınarak topla-
KISA TEORİK BİLGİLER 75

nır. Fark kare toplamının serbestlik derecesine bölünmesiyle elde edilecek değe-
rin karekökü alındığında standart hata hesaplanır.

Σ(Yi − Ŷi ) 2
S YX =
n −1− m
m, regresyon modelindeki parametre sayısıdır. Parametreler regresyon
modelinin yönünü ve şeklini belirlerler.
Standart hatası daha küçük olan regresyon modeli, değişkenler arasındaki
ilişkiyi daha iyi temsil eder.

Regresyon Modelinin Önem Kontrolü


Regresyon modelinin anlamlı olup olmadığı varyans analizi ile test edilir.
Sıfır hipotezinde regresyon katsayısının (veya katsayılarının) sıfıra eşit olduğu
belirtilirken; alternatif hipotezde, regresyon katsayısının (veya katsayılarının)
sıfırdan farklı olduğu, yani anlamlı olduğu belirtilir. Varyans analizinde genel
kareler toplamı, regresyon kareler toplamı ve hata kareler toplamı olmak üzere
iki kısma ayrılarak analiz edilir.
Σ(Yi − Y ) 2 = Σ(Ŷi − Y ) 2 + Σ(Yi − Ŷi ) 2
Eşitliğin sağ kısmındaki birinci ifade regresyon kareler toplamıdır. Bu
toplam, regresyon modelinin yönü ve şeklini belirleyen değişken sayısı, v1 = m
serbestlik derecesine bölünerek regresyon kareler ortalaması bulunur. Eşitliğin
sağ kısmındaki ikinci ifade olan hata kareler toplamı ise, v2 = n – 1 – m serbest-
lik derecesine bölünerek hata kareler ortalaması elde edilir. Regresyon kareler
ortalaması, hata kareler ortalamasına bölünerek Fh değeri hesaplanır. Daha sonra
verilen önem seviyesi, v1 ve v2 serbestlik derecelerine göre Tablo 5’ten kritik F
değeri okunur. Test istatistiği, kritik değerden büyük olduğunda regresyon mo-
delinin anlamlı olduğuna ve tahmin maksadıyla kullanılabileceğine karar verilir.

A) LİNEER REGRESYON MODELİ


Lineer Regresyon Katsayılarının Hesaplanması
Lineer regresyon modeli, Ŷ = a + bX şeklindedir. Σ(Y − Ŷ) 2 toplamın-
da, Ŷ yerine, a + bX yazılmasıyla elde edilecek Σ(Y − a − bX) 2 ifadesinin hem
a’ya hem de b’ye göre ayrı ayrı kısmi türevleri alınarak sıfıra eşitlendiğinde aşa-
ğıdaki normal denklemler elde edilir.
ÜÇÜNCÜ BÖLÜM: REGRESYON TEORİSİ 76

ΣY = na + bΣX
ΣXY = aΣX + bΣX 2
Müşahede edilen X ve Y değerleri üzerinden gerekli hesaplamalar yapıla-
rak normal denklem sisteminde yerine yazıldığında birinci dereceden iki bilin-
meyenli bir denklem sistemi elde edilir. Bu denklem sistemi çözülerek lineer
regresyon modelindeki a ve b sabitleri bulunur.

Lineer Regresyon Modelinin Testi


Lineer regresyon modelinin şekil ve doğrultusunu belirleyen değer b’dir. b
değeri, sınırlı sayıda veri üzerinden hesaplanan bir istatistiktir. Bu istatistiğin
anakütle parametresi olarak karşılığı β’dır. Buna göre test hipotezleri,
H0: β = 0
H1: β ≠ 0
şeklinde olur. Sıfır hipotezine göre lineer regresyon parametresi anlamsızdır.
Sıfır hopotezi reddedildiğinde lineer regresyon modelinin anlamlı olduğuna ve
tahmin maksadıyla kullanılabileceğine karar verilir.
Lineer regresyon modelinde bir parametre olduğu için, v1 = m = 1’dir.
İkinci serbestlik derecesi, v2 = n – 1 – m’dir. Lineer regresyon modeli için ikinci
serbestlik derecesi, v2 = n – 2’dir. Tablo 5, verilen bir α önem seviyesi, v1 ve v2
serbestlik derecelerine göre kritik F değeri tespit etmeyi sağlar.
Lineer regresyon modelinin anlamlılığını test etmek için gerekli olan test
istatistiğini aşağıdaki varyans analizi tablosu yardımıyla elde ederiz.

Değişim Serbestlik Kareler Kareler Ortalama-


Kaynakları Derecesi Toplamı sı
Regresyon v1 = 1 bΣxy bΣxy/1
Hata v2 = n – 2 Σy2 − bΣxy (Σy2 − bΣxy)/(n – 2)

Söz konusu tabloda,


( ΣY ) 2
Σy 2 = Σ( Y − Y ) = ΣY 2 −
n
(ΣX)(ΣY)
Σxy = Σ(X − X )(Y − Y ) = ΣXY −
n
olarak hesaplanır. Test istatistiği, varyans analizi tablosundaki regresyon kareler
ortalaması, hata kareler ortalamasına bölünerek hesaplanır.
KISA TEORİK BİLGİLER 77

bΣxy
Fh = 2
Σy − bΣxy
n−2
Test istatistiği, kritik F değerinden büyük olursa, H0 hipotezi reddedilerek,
lineer regresyon modelinin anlamlı olduğuna karar verilir.
Örnek: Bir süpermarket yöneticisi tesadüfi olarak seçilen bir saatlik süre-
lerde kasaya gelen müşteri sayısını ve ödedikleri toplam para miktarını aşağıdaki
gibi kaydetmiştir.

Müşteri Sayısı 25 20 50 35 40
Ödenen Para (10000-TL) 12.5 10.4 25.3 20.2 24.1

Müşteri sayısını bağımsız (X), kasalara ödenen para miktarını bağımlı de-
ğişken (Y) olarak kabul ederiz. Y = a + bX şeklindeki lineer regresyon denkle-
mindeki a ve b sabitlerini elde edebilmek için
ΣY = na + bΣX
ΣXY = aΣX + bΣX 2
normal denklem sisteminde bilinenlerin yerine yazılması gerekir. X ve Y değiş-
kenlerinden hareketle aşağıdaki hesaplamalar yapılır.
Ölçüm X Y XY X2 Y2
1 25 12.5 312.5 625 156.25
2 20 10.4 208.0 400 108.16
3 50 25.3 1265.0 2500 640.09
4 35 20.2 707.0 1225 408.04
5 40 24.1 964.0 1600 580.81
Toplam 170 92.5 3456.5 6350 1893.35
Tabloda yapılan hesaplamalara göre normal denklem sistemi,
92.5 = 5a + 170b
3456.5 = 170a + 6350b
şeklinde yazılır. Bu denklem sistemi çözüldüğünde, a = −0.064 ve b = 0.546
bulunur.
Bağımsız değişken X, bağımlı değişken Y ekseninde gösterilmek üzere,
(X,Y) değişken çiftlerinin belirlediği noktalar diyagramı ve bu noktalardan mi-
nimum sapma ile geçen Y = −0.064 + 0.546X regresyon doğrusu aşağıdaki gibi-
dir.
ÜÇÜNCÜ BÖLÜM: REGRESYON TEORİSİ 78

28

24
Ödenen Tutar (10000-TL)

20

16

Y = −0.064 + 0.546X
12

8
15 20 25 30 35 40 45 50 55
Müşteri Sayısı

Şimdi hesaplanan bu lineer regresyon modelinin anlamlı olup olmadığını


%5 önem seviyesinde test edelim. Kurulacak hipotezler,
H0: β = 0
H1: β ≠ 0
şeklindedir.
Tablo 5, α = 0.05 önem seviyesi, v1 = 1 ve v2 = n – 2 = 5 – 2 = 3 serbestlik
derecesinde kritik F değerinin 10.13 olduğunu göstermektedir.
Σy2 ve Σxy değerleri,
( ΣY ) 2 (92.5) 2
Σy 2 = ΣY 2 − = 1893.35 − = 182.1
n 5
(ΣX)(ΣY) 170(92.5)
Σxy = ΣXY − = 3456.5 − = 311.5
n 5
olarak hesaplanır ve test istatistiği,
bΣxy (0.546)(311.5)
Fh = = ≅ 42.45
Σy − bΣxy 182.1 − (0.546)(311.5)
2

n−2 5−2
olarak elde edilir.
Test istatistiği, kritik değerden büyük olduğu için %5 önem seviyesinde
H0 hipotezini reddederek lineer regresyon modelinin anlamlı olduğuna ve tahmin
maksadıyla kullanılabileceğine karar veririz.
KISA TEORİK BİLGİLER 79

B) PARABOLİK REGRESYON MODELİ


Parabolik Regresyon Katsayılarının Hesaplanması
Parabolik regresyon modeli, Ŷ = a + bX + cX 2 şeklindedir. Σ(Y − Ŷ ) 2
toplamında, Ŷ yerine, a + bX + cX 2 yazılırsa,

Σ(Y − a − bX − cX 2 ) 2
ifadesi elde edilir. Bu ifadenin a, b ve c’ye göre ayrı ayrı kısmi türevleri alına-
rak sıfıra eşitlenirse aşağıdaki normal denklemler elde edilir.
ΣY = na + bΣX + cΣX 2
ΣXY = aΣX + bΣX 2 + cΣX 3
ΣX 2 Y = aΣX 2 + bΣX 3 + cΣX 4
Müşahede edilen X ve Y değerleri üzerinden gerekli hesaplamalar yapıla-
rak normal denklem sisteminde yerine yazılırsa birinci dereceden üç bilinme-
yenli bir denklem sistemi elde edilir. Bu denklem sistemi çözüldüğünde lineer
regresyon modelindeki, a, b ve c sabitleri elde edilir.

Parabolik Regresyon Modelinin Testi


Parabolik regresyon modelinin şekil ve doğrultusunu belirleyen katsayılar
b ve c’dir. Modeldeki b ve c değerleri, sınırlı sayıda veri üzerinden hesaplanan
istatistiklerdir. Bu terimlerin anakütle parametresi olarak karşılığı β ve χ’dır.
Buna göre test hipotezleri,
H0: β = χ = 0
H1: β ≠ χ ≠ 0
şeklinde olur. Sıfır hipotezine göre parabolik regresyon parametreleri anlamsız-
dır. Sıfır hipotezi reddedildiği takdirde parabolik regresyon modelinin anlamlı
olduğuna ve tahmin maksadıyla kullanılabileceğine karar verilir.
Parabolik regresyon modelinde iki parametre olduğu için, v1 = m = 2’dir.
Parabolik regresyon modeli için ikinci serbestlik derecesi, v2 = n – 1 – m =
n – 3’dür. Tablo 5, α önem seviyesi, v1 ve v2 serbestlik derecelerine göre kritik F
değeri tespit etmeyi sağlar.
Parabolik regresyon modelinin anlamlılığını test etmek için gerekli olan
test istatistiğini aşağıdaki varyans analizi tablosu yardımıyla elde ederiz.
ÜÇÜNCÜ BÖLÜM: REGRESYON TEORİSİ 80

Değişim Serbestlik Kareler Kareler


Kaynakları Derecesi Toplamı Ortalaması

Regresyon v1 = 2 bΣxy + cΣx2y bΣxy + cΣx 2 y


2
2 2
Hata v2 = n – 3 Σy2 − (bΣxy + cΣx2y) Σy − (bΣxy + cΣx y)
n −3

Söz konusu tabloda,


( ΣY ) 2
Σy 2 = Σ( Y − Y ) = ΣY 2 −
n
(ΣX)(ΣY)
Σxy = Σ(X − X )(Y − Y ) = ΣXY −
n
(ΣX 2 )(ΣY )
Σx 2 y = Σ( X − X ) 2 (Y − Y ) = ΣX 2 Y −
n
şeklinde hesaplanır. Varyans analizi tablosunda regresyon kareler ortalaması, ha-
ta kareler ortalamasına bölündüğünde, test istatistiği aşağıdaki gibi hesaplanır.
bΣxy + cΣx 2 y
Fh = 2
Σy 2 − (bΣxy + cΣx 2 y)
n −3
Test istatistiği, kritik F değerinden büyük olursa, H0 hipotezi reddedilerek
parabolik regresyon modelinin anlamlı olduğuna karar verilir.
Örnek: Bir üretim prosesinde üretilen mamul miktarı (yıl başına 1000
adet) ve marjinal maliyet tutarları (mamul başına 100000-TL) aşağıdaki gibidir.

Mamul Sayısı 7 9 12 14 17
Marjinal Maliyet 6 7 10 15 25

Verilere uygun parabolik regresyon modelini kurarak %1 önem seviyesin-


de test edelim.
Mamul sayısını bağımsız (X), marjinal maliyeti bağımlı değişken (Y) ola-
rak kabul ederiz. Y = a + bX + cX2 şeklindeki parabolik regresyon denklemin-
deki, a, b ve c sabitlerini elde edebilmek için,
KISA TEORİK BİLGİLER 81

ΣY = na + bΣX + cΣX 2
ΣXY = aΣX + bΣX 2 + cΣX 3
ΣX 2 Y = aΣX 2 + bΣX 3 + cΣX 4
normal denklem sisteminde bilinenlerin yerine yazılması gerekir. X ve Y değiş-
kenlerinden hareketle aşağıdaki hesaplamalar yapılır.

X Y XY X2 X3 X4 X 2Y Y2
7 6 42 49 343 2401 294 36
9 7 63 81 729 6561 567 49
12 10 120 144 1728 20736 1440 100
14 15 210 196 2744 38416 2940 225
17 25 425 289 4913 83521 7225 625
59 63 860 759 10457 151635 12466 1035

Buna göre normal denklem sistemi,


63 = 5a + 59b + 759c
860 = 59a + 759b + 10457c
12466 = 759a + 10457b + 151635c
şeklinde yazılır. Bu denklem sistemi çözüldüğünde, a = 18.044, b = -3.164 ve
c = 0.21 bulunur.
Bağımsız değişkeni X ekseninde, bağımlı değişkeni Y ekseninde gösterir-
sek, (X,Y) değişken çiftlerinin belirlediği noktalar diyagramı aşağıdaki gibidir.

28

24

20
Y = 18.044 – 3.164X + 0.21X2
Marjinal Maliyet

16

12

4
7 8 9 10 11 12 13 14 15 16 17
Mamul Sayısı
ÜÇÜNCÜ BÖLÜM: REGRESYON TEORİSİ 82

Müşahede edilen X değerleri parabolik regresyon modelinde yerine yazıl-


dığında tahmini Y değerleri elde edilir. X değişkenine karşı tahmini Y değerle-
rinin belirlediği noktalar Y = 18.044 – 3.164X + 0.21X2 parabolik regresyon
eğrisi üzerindedir. Müşahede edilen noktalardan minimum sapma ile geçen
Y = 18.044 – 3.164X + 0.21X2 parabolik regresyon eğrisi yukarıdaki gibidir.
Şimdi parabolik regresyon modelinin anlamlı olup olmadığını %1 önem
seviyesinde test edelim. Kurulacak hipotezler,
H0: β = χ = 0
H1: β ≠ χ ≠ 0
şeklindedir.
α = 0.01 önem seviyesi, v1 = 2 ve v2 = n – 3 = 5 – 3 = 2 serbestlik derece-
sinde Tablo 5’ten bulunacak kritik F değeri 99’dur.
Σy2, Σxy ve Σx2y değerleri,
( ΣY ) 2 63 2
Σy 2 = ΣY 2 − = 1035 − = 241.2
n 5
(ΣX)(ΣY) 59(63)
Σxy = ΣXY − = 860 − = 116.6
n 5
(ΣX 2 )(ΣY) 759(63)
Σx 2 y = ΣX 2 Y − = 12466 − = 2902.6
n 5
olarak hesaplanır. Test istatistiği,
bΣxy + cΣx 2 y (−3.164)(116.6) + (0.21)(2902.6)
Fh = 2 2 = 2 = 422.16
Σy − (bΣxy + cΣx y) 2
241.2 − [(−3.164)(116 .6) + (0.21)(2902.6)]
n −3 5−3
olarak elde edilir.
Test istatistiği, kritik değerden büyük olduğu için %1 önem seviyesinde
H0 hipotezini reddederek parabolik regresyon modelinin anlamlı olduğuna ve
tahmin maksadıyla kullanılabileceğine karar veririz.

C) ÇOK DEĞİŞKENLİ REGRESYON MODELİ


Çok Değişkenli Regresyon Katsayılarının Hesaplanması
İki veya daha fazla bağımsız değişkenin bir bağımlı değişkeni belirlemesi
durumunda çok değişkenli regresyon modeli kurulabilir. Nispeten kısa ve anlaşı-
lır olması bakımından burada iki bağımsız değişkenli regresyon modeli izah
edilecektir.
KISA TEORİK BİLGİLER 83

İki bağımsız değişkenli regresyon modeli, Ŷ = a + b1 X 1 + b 2 X 2 şeklin-


dedir. Σ(Y − Ŷ ) 2 toplamında, Ŷ yerine, a + b1 X 1 + b 2 X 2 yazılırsa,

Σ(Y − a − b1X1 − b 2 X 2 ) 2

ifadesi elde edilir. Bu ifadenin a, b1 ve b2’ye göre ayrı ayrı kısmi türevleri alına-
rak sıfıra eşitlediğimizde aşağıdaki normal denklemleri elde ederiz.
ΣY = na + b1ΣX 1 + b 2 ΣX 2
ΣX 1 Y = aΣX 1 + b1ΣX 12 + b 2 ΣX 1 X 2
ΣX 2 Y = aΣX 2 + b1ΣX 1 X 2 + b 2 ΣX 22
Müşahede edilen X1, X2 ve Y değerleri ile gerekli hesaplamalar yapılarak
normal denklem sisteminde yerine yazıldığında birinci dereceden üç bilinme-
yenli bir denklem sistemi elde edilir. Bu denklem sistemi çözülerek iki bağımsız
değişkenli regresyon modelindeki a, b1 ve b2 sabitleri elde edilir.

Çok Değişkenli Regresyon Modelinin Testi


İki bağımsız değişkenli regresyon modelinin şekil ve doğrultusunu belir-
leyen katsayılar b1 ve b2’dir. Modeldeki b1 ve b2 değerleri, sınırlı sayıda veri
üzerinden hesaplanan istatistiklerdir. Bu terimlerin anakütle parametresi olarak
karşılığı β1 ve β2’dir. Buna göre test hipotezleri,
H0: β1 = β2 = 0
H1: β1 ≠ β2 ≠ 0
şeklinde olur. Sıfır hipotezine göre regresyon modelindeki β1 ve β2 parametreleri
anlamsızdır. Sıfır hipotezi reddedildiği takdirde regresyon modelinin anlamlı
olduğu ve tahmin maksadıyla kullanılabileceği söylenir.
İki bağımsız değişkenli regresyon modelinde iki parametre olduğu için, v1
= m = 2’dir. Söz konusu regresyon modeli için ikinci serbestlik derecesi, v2 =
n – 1 – m = n – 3’dür. Tablo 5, verilen bir α önem seviyesi, v1 ve v2 serbestlik
derecelerine göre kritik F değerini verir.
İki bağımsız değişkenli regresyon modelinin anlamlılığını test etmek için
gerekli olan test istatistiğini aşağıdaki varyans analizi tablosu yardımıyla elde
ederiz.
ÜÇÜNCÜ BÖLÜM: REGRESYON TEORİSİ 84

Değişim Serbestlik Kareler Kareler


Kaynakları Derecesi Toplamı Ortalaması
b1Σx1y + b2Σx 2 y
Regresyon v1 = 2 b1Σx1y + b2Σx2y
2
2
Hata v2 = n – 3 Σy2 − (b1Σx1y + b2Σx2y) Σy − (b1Σx1y + b2Σx2y)
n −3

Söz konusu tabloda,


( ΣY ) 2
Σy 2 = Σ( Y − Y ) = ΣY 2 −
n
(ΣX 1 )(ΣY)
Σx 1 y = Σ(X 1 − X1 )(Y − Y ) = ΣX 1 Y −
n
(ΣX 2 )(ΣY )
Σx 2 y = Σ( X 2 − X 2 )(Y − Y ) = ΣX 2 Y −
n
olarak hesaplanır. Varyans analizi tablosunda regresyon kareler ortalaması, hata
kareler ortalamasına bölündüğünde, test istatistiği aşağıdaki gibi hesaplanır.
b 1 Σx 1 y + b 2 Σx 2 y
Fh = 2
2
Σy − (b1Σx 1 y + b 2 Σx 2 y)
n −3
Test istatistiği, kritik F değerinden büyük olursa, H0 hipotezi reddedilerek
iki bağımsız değişkenli regresyon modelinin anlamlı olduğuna karar verilir.
Örnek: Tesadüfi olarak seçilen beş işçiye kaç yıl okula devam ettikleri
(yıl), kaç yıllık iş tecrübesine sahip oldukları (yıl) ve ellerine geçen aylık gelir
(milyon TL) sorulmuş ve aşağıdaki cevaplar alınmıştır.

Eğitim Süresi İş Tecrübesi Aylık Gelir


5 18 40
8 10 37
7 12 43
9 9 35
11 5 30

Eğitim süresi, birinci bağımsız değişken (X1); iş tecrübesi, ikinci bağımsız


değişken (X2) ve aylık gelir, bağımlı değişken (Y) olmak üzere, iki bağımsız
değişkenli regresyon modelini kuralım.
KISA TEORİK BİLGİLER 85

Ŷ = a + b1 X 1 + b 2 X 2 şeklindeki çoklu regresyon modelinde, a, b1 ve b2


sabitlerinin hesaplanabilmesi için,
ΣY = na + b1ΣX 1 + b 2 ΣX 2
ΣX 1 Y = aΣX 1 + b1ΣX 12 + b 2 ΣX 1 X 2
ΣX 2 Y = aΣX 2 + b1ΣX 1 X 2 + b 2 ΣX 22
normal denklem sisteminin çözülmesi gereklidir. Bu denklem sistemindeki de-
ğerler aşağıdaki gibidir.

X1 X2 Y X1 Y X2Y X1 X 2 X 12 X 22 Y2
5 18 40 200 720 90 25 324 1600
8 10 37 296 370 80 64 100 1369
7 12 43 301 516 84 49 144 1849
9 9 35 315 315 81 81 81 1225
11 5 30 330 150 55 121 25 900
40 54 185 1442 2071 390 340 674 6943

Tablodaki hesaplamalardan yararlanarak birinci dereceden üç bilinme-


yenli denklem sistemini,
185 = 5a + 40b1 + 54b2
1442 = 40a + 340b1 + 390b2
2071 = 54a + 390b1 + 674b2
şeklinde yazarız. Bu denklem sistemi çözüldüğünde, a = 124.385, b1 = −7.392 ve
b2 = −2.615 bulunur.
Şimdi, Y = 124.385 – 7.392X1 – 2.615X2 regresyon modelini %5 önem
seviyesinde test edelim.
Test hipotezleri,
H0: β1 = β2 = 0
H1: β1 ≠ β2 ≠ 0
şeklinde olur.
α = 0.05 önem seviyesi, v1 = 2 ve v2 = n – 3 = 5 – 3 = 2 serbestlik derece-
sinde Tablo 5’ten bulunacak kritik F değeri 19’dur.
Σy2, Σx1y ve Σx2y değerleri,
ÜÇÜNCÜ BÖLÜM: REGRESYON TEORİSİ 86

( ΣY ) 2 185 2
Σy 2 = ΣY 2 − = 6943 − = 98
n 5
(ΣX 1 )(ΣY ) 40(185)
Σx 1 y = ΣX 1 Y − = 1442 − = −38
n 5
(ΣX 2 )(ΣY ) 54(185)
Σx 2 y = ΣX 2 Y − = 2071 − = 73
n 5
bulunur. Regresyon sabitleri ve yukarıdaki hesaplamalar kullanılarak test istatis-
tiği,
b1Σx1 y + b 2 Σx 2 y (−7.392)(−38) + (−2.615)(73)
Fh = 2 2 = 2 = 11.25
Σy − (b1Σx1 y + b 2 Σx 2 y) 98 − [(−7.392)(−38) + (−2.615)(73)]
n −3 5−3
olarak hesaplanır.
Test istatistiği, kritik F değerinden küçük olduğu için H0 hipotezi kabul
edilerek çoklu regresyon modelinin önemsiz olduğuna ve tahmin maksadıyla
kullanılamayacağına karar verilir.

II- ÇÖZÜLMÜŞ PROBLEMLER


A) LİNEER REGRESYON MODELİ ve TESTİ
1) Bir yetiştirme yurdundaki 8 çocuğun yaşı ve psikiyatrik tedavi görme
sayıları aşağıdaki gibidir.

Yaşlar 1 3 4 6 8 9 11 14
Tedavi Sayısı 1 2 4 4 5 7 8 9

Yaşları, bağımsız değişken (X); tedavi görme sayılarını, bağımlı değişken


(Y) kabul ederek en küçük kareler lineer regresyon modelini kurunuz. Modeli
%1 önem seviyesinde test ediniz.
Çözüm: Y = a + bX şeklindeki lineer regresyon denklemindeki a ve b sa-
bitlerini elde edebilmek için,
ΣY = na + bΣX
ΣXY = aΣX + bΣX 2
normal denklem sisteminde bilinenlerin yerine yazılması gerekir.

You might also like