You are on page 1of 60

Tek Faktörlü Deneyler

• Basit karşılaştırma deneylerine başka


bir bakış açısı ile bakıldığında aslında
tek faktörlü deney oldukları anlaşılır
– Tek değişken/faktör/parametre vardır
– Tek değişkenin değişik seviyelerine göre sonuç
değişken ölçülür
– Sonuç değişken değerleri üzerine ANOVA veya
regresyon uygulanır
ANOVA: Analysis of
Variance
Değişimin Analizi
• ANOVA
– Çoklu hipotezlerin eşitliğini test eder
– Gelecekteki çalışmalara yönelik faktor
belirlemeye yardımcı olur.
• İki tür ANOVA yöntemi mevcuttur
– Tek faktorlu
– Çok faktorlu
ANOVA: Analysis of
Variance
Değişimin Analizi
Deneyler Gözlemler Toplamlar Ortalamalar

1 y11 y ... y1n y1.


12 y1.
2 y12 y ... y2n y2.
22 y.
3 . .
. . . ... . .
. . . ... . .
. . .
a ya1 ya2 ... y ya.
an ya.
y.. ya.
Tek faktörlü ANOVA
• Üç tür değişimden bahsedilir
Source of Sum of Degrees of Mean Square F0
Variation Square Freedom

Between a
SS treatment = n∑ ( y i. − y..) 2 SS treatment MS treatment
Treatments a-1 MSTreatments = F0 =
a −1 MS E
i =1

Error SS te
(within SS e = SS T − SS treatment N-a MS E =
treatments) N −a

a n
Total SS Total = ∑∑ ( y ij − y..) 2 N-1
i =1 j =1

Sıfır hipotezi red kriteri;F0>Fα,a-1,n-a


Analogous Hypothesis Test
F Dağılımı
H 0 : µ1 = µ 2 = ... = µ c
MSTR
Fistatistik =
MSE

Alan = α

F- ekseni Fα
Red et Ho
Fcritical
Örnek 1
Değişik yüzdelerde pamuk içeren sentetik fiberin çekme dayanımları
verilmiştir. Çekme dayanımları üzerine pamuk yüzdelerinin etkisi olup
olmadığını inceleyiniz?
Pamuk Çekme Dayanımları (lb/in2)
Yüzdesi

15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
Örnek 1
5 5
y..
SS Total = ∑∑ ( y ij2 − )
i =1 j =1 N
(376) 2
SS Total = (7) + (7) + (15) + .......(15) + (11) −
2 2 2 2 2
= 636,96
25

[ ]
2
SS Treatments = (49 ) + ...... + (54) 2 −
1 (376 )
= 475,76
2

n 25
SS E = SS T − SS Treatments
SS E = 636,96 − 475,76 = 161,20

475,6
MS Treatments =
4 118,94
F0 =
161,20 8,06
MS E =
20
Örnek 1

Source of Sum of Degrees of Mean Square F0


Variation Square Freedom

Between 475,6 5-1 118,94 14,76


Treatments

Error 161,20 25-5 8,06

(within treatments)

Total 636,96 25-1

Sıfır hipotezi red kriteri;F0>Fα,a-1,n-a


Örnek 1:Hipotez testi
H 0 : µ1 = µ 2 = ... = µ c

F0,05,4,20= 2,87 F0,01,4,20= 4,43 F0= 14,76

Alan = α

F- ekseni F0,05 F0,01

F0> F0,05,4,20 F0> F0,01,4,20

KARAR ? ? ?
Örnek 1
One-way ANOVA: Çekme Dayanýmlarý (lb/in2) versus
Pamuk Yüzdesi

Analysis of Variance
for Çekme Da
Source DF SS MS F P
Pamuk yüzde 4 475,76 118,94 14,76 0,000
Error 20 161,20 8,06
Total 24 636,96
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ------+---------+---------+---------+
15 5 9,800 3,347 (-----*----)
20 5 15,400 3,130 (----*----)
25 5 17,600 2,074 (----*----)
30 5 21,600 2,608 (----*----)
35 5 10,800 2,864 (-----*----)
------+---------+---------+---------+
Pooled StDev = 2,839 10,0 15,0 20,0 25,0
Örnek 1
Normal Probability Plot of the Residuals
(response is Çekme Da)

1
Normal Score

-1

-2

-4 -3 -2 -1 0 1 2 3 4 5 6
Residual
Örnek 1
Residuals Versus the Order of the Data
(response is Çekme Da)

4
3

2
Residual

-1

-2

-3

-4
5 10 15 20 25
Observation Order
Örnek 1
Dotplots of Çekme Da by Pamuk Yü
(group means are indicated by lines)

26
Çekme Dayanýmlarý (lb/in2)

16

amuk Yüzdesi
15

20

25

30

35
Regresyon Analizi
• Regresyon analizi deneysel
verilerden tahmini hataları kontrol
eden prosedürleri kullanarak
matematiksel fonksiyon geliştirme
yaklaşımıdır.
Regresyon
• Lineer Regresyon (Tek bağımsız değişken)

• Lineer olmayan regresyon

• Çoklu regresyon (çok sayıda bağımsız


değişken)

• Polynominal regresyon
Regresyon

• Xi Bağımsız değişkenin i’ inci gözlenen


değeri
• Yi Y’nin gerçek değeri

X=Xi olduğunda Y nin tahmin edilen değeri

Yˆ (Xi )
Regresyon
• Extrüzyonda, dolma uzunluğunun işe
verimi önemli. Şimdi bu iki değişken
arasındaki ilişkiyi inceleyelim.

• Bu model iki değişken arasındaki


ilişkiyi ortya koyar.
Veriler
Dolm a Uzunluğu İş ver im i

16 3
34 7
40 8
93 12
125 14
50 9
48 9
18 4
70 11
110 13
85 12
45 8
40 7
33 6
20 3
Regresyon
140

120

100
Dolma Uzunluğu

80

60

40

20

0
0 2 4 6 8 10 12 14 16
İş verimliliği
Regresyon
• En küçük kareler yöntemi
n

• Prensip: Minimize et ∑ [ Y
ˆ (X ) - Y ]2
i i
i=1

• Varsay ˆ (X )
Y i = a+bXi (lineer ilişki)
n

• Minimize et ∑ [Yi-(a+bXi)]2
i=1
Lineer regresyon
• “a” yı minimize et

n n (1)
∑Y
i =1
i = na + b∑ X i
i =1

• “b” yi minimize et

(2)
n n n

∑X Y
i =1
i i = a∑ Xi + b∑ X
i =1 i =1
i
2
Lineer regresyon
• (1) ve (2) çözüldüğünde:

n ∑ XY − ∑ X ∑ Y
b=
n ∑ X 2 − (∑ X ) 2

1
a = (∑ Y − b ∑ X )
n
Lineer regresyon çizgisi
• Regresyon Çizgisi

Yˆ(Xi ) = a +bXi
• Bu lineer regresyon çizgisi olup Y
lineer olarak X’e bağlıdır.
SUMMARY OUTPUT
X Variable 1 Residual Plot
Regression Statistics
Multiple R 0.953661 20

Residuals
R Square 0.90947
Adjusted R 0.902506 0
Standard E 10.60753 0 5 10 15
Observatio 15 -20
X Variable 1
ANOVA
df SS MS F ignificance F
Regression 1 14694.98 14694.98 130.599 3.75E-08
Residual 13 1462.757 112.5198
Total 14 16157.73
X Variable 1 Line Fit Plot
Coefficientstandard Erro t Stat P-value Lower 95% Upper 95%Lower 95.0%
Upper 95.0%
Intercept -22.1505 7.296244 -3.03588 0.009556 -37.9131 -6.38796 -37.9131 -6.38796 200
X Variable 9.200461 0.805081 11.42799 3.75E-08 7.461189 10.93973 7.461189 10.93973 100

Y
Y
0
Predicted Y
0 5 10 15

RESIDUAL OUTPUT X Variable 1

ObservationPredicted Y Residuals
1 5.450845 10.54916
2 42.25269 -8.25269
3 51.45315 -11.4531
4 88.25499 4.745008
5 106.6559 18.34409
6 60.65361 -10.6536
7 60.65361 -12.6536
8 14.65131 3.348694
9 79.05453 -9.05453
10 97.45545 12.54455
11 88.25499 -3.25499
12 51.45315 -6.45315
13 42.25269 -2.25269
14 33.05223 -0.05223
15 5.450845 14.54916
Standart Hata-Tek değişken
• Standard Hata ( SY • X )

• Gerçek verilerle tahmin edilen veriler


arasındaki hatayı tahmin eder.

SY • X =
∑ [Y − ˆ
Y ( X )]2

n−2

• SY • X = 7.29
Regresyon çizgisi
• Çıktılara bağlı olarak regresyon eğrisi
veya çizgisi:

Y ( X ) = −22.1505 + 9.22 X
ˆ
Korelasyon Katsayısı
• Korelasyon Katsayısı ( r )
• X ve Y arasındaki lineer ilişkinin derecesini
tahmin eder.
• -1 ve 1arasında değişir
• “r” nin 1 değerine yakın olması ilişkinin
derecesinin oldukça güçlü olduğunu
gösterir.
Korelasyon Katsayısı
• Matematiksel tanım

r =
∑ XY − n X Y
( n − 1) s X s Y

sX =
∑ (X − X )2
sY =
∑ (Y − Y )2
n −1 n −1

• Çıktılardan örneğimiz için


r = 0.948
Lineer olmayan regresyon
• Lineer olmayan bir ilişki olduğunu
düşünelim.
• Bu durumda uyum nasıl olur?
Lineer olmayan regresyon
140

120

100
Dolum uzunluğu

80

60

40

20

0
0 2 4 6 8 10 12 14 16
İş verimliliği
Nonlinear regression
• Varsayalım ki:

Y = ab
ˆ x

• İki taraftada logaritma alınırsa:

lnYˆ( X ) = ln a + X lnb
• Bu durumda lnY ve X ilişki lineer hale
gelir.
Lineer olmayan regresyon
• Bu durumda,

n ∑ X ln Y − ∑ X ∑ ln Y
ln b =
n∑ X 2
− (∑ X )
2

ln a =
∑ ln Y − X ln b
n
Lineer olmayan regresyon
olma uzunluğu İş verimi
Y X lnY
16 3 2.773
34 7 3.526
40 8 3.689
93 12 4.533
125 14 4.828
50 9 3.912
48 9 3.871
18 4 2.89
70 11 4.248
110 13 4.7
85 12 4.443
45 8 3.807
40 7 3.689
33 6 3.497
20 3 2.996
SUMMARY OUTPUT

Regression Statistics X Variable 1 Line Fit Plot


Multiple R 0.991808
R Square 0.983683 10
Adjusted R 0.982428 5

Y
Standard E 0.084922 Y
0
Observatio 15 Predicted Y
0 5 10 15

ANOVA X Variable 1
df SS MS F ignificance F
Regression 1 5.652105 5.652105 783.7339 5.27E-13
Residual 13 0.093753 0.007212
Total 14 5.745858

Coefficientstandard Erro t Stat P-value Lower 95% Upper 95%Lower 95.0%


Upper 95.0%
Intercept 2.311113 0.058412 39.56539 6.17E-15 2.18492 2.437305 2.18492 2.437305
X Variable 0.180439 0.006445 27.99525 5.27E-13 0.166515 0.194363 0.166515 0.194363

RESIDUAL OUTPUT

ObservationPredicted YResidualsndard Residuals


1 2.85243 -0.07943 -0.97063
2 3.574185 -0.04819 -0.58883
3 3.754624 -0.06562 -0.80193
4 4.47638 0.05662 0.691895
5 4.837258 -0.00926 -0.11313
6 3.935063 -0.02306 -0.28183
7 3.935063 -0.06406 -0.78285
8 3.032869 -0.14287 -1.74586
9 4.295941 -0.04794 -0.58584
10 4.656819 0.043181 0.527671
11 4.47638 -0.03338 -0.40791
12 3.754624 0.052376 0.64003
13 3.574185 0.114815 1.403034
14 3.393747 0.103253 1.261758
15 2.85243 0.14357 1.75443
Lineer olmayan regresyon
• Çıktıya göre regresyon eşitliği:

ln Yˆ ( X ) = 2.31 + 0.18 X

• Bunun anlamı
2.31+.18 X
Y(X ) = e
ˆ
Lineer olmayan regresyon
• Bu durumda, r=.9899 ve
Standart hata = 0.05

• Bu durum gösteriyor ki verilen veri


grubu için lineer olmayan regresyon
daha iyi bir uyum gösterebilir.
Çoklu regresyon

Y değişkeni birden çok


değişkene bağlı olduğunda
ne olur?
Çoklu regresyon
• Benzin tüketiminin (Y) iki değişkene bağlı
olduğunu düşünelim:
Benzinin oktan oranı, (X1)

Ortalama hız (X2)

• Regresyon eşitliğini (Y) deneysel olarak


verilen X1 ve X2 değerlerine göre
hesaplayalım.
Veri
Deney Benzinle alınan yol Oktanı Ortalama hız
Sayısı (mpg)
Y X1 X2

1 24.8 88 52
2 30.6 93 60
3 31.1 91 58
4 28.2 90 52
5 31.6 90 55
6 29.9 89 46
7 31.5 92 58
8 27.2 87 46
9 33.3 94 55
10 32.6 95 62
11 30.6 88 47
12 28.1 89 58
13 25.2 90 63
14 35 93 54
15 29.2 91 53
16 31.9 92 52
17 27.7 89 52
18 31.7 94 53
19 34.2 93 54
20 30.1 91 58
Çoklu regresyon
• Yˆ = a + b1X1+b2X2

• En küçük kareler yöntemi


kullanıldığında:

∑(Y − Y ) = ∑[Y − (a + b1 X1 + b2 X 2 )
ˆ 2
(1 )
Çoklu regresyon
• a, b1, b2
∑Y = na+b ∑X
1 1 + b2 ∑X2

∑ 1 ∑ 1 1 ∑ 1 +b2 ∑X1 X2
X Y = a X + b X 2

∑ 2 ∑ 2 1 ∑ 1 2 2∑ 2
X Y = a X + b X X + b X 2
Y
Çoklu regresyon
X1 X2 X1Y X2Y X1X2

24.8 88 52 2182.4 1289.6 4576


30.6 93 60 2845.8 1836 5580
31.1 91 58 2830.1 1803.8 5278
28.2 90 52 2538 1466.4 4680
31.6 90 55 2844 1738 4950
29.9 89 46 2661.1 1375.4 4094
31.5 92 58 2898 1827 5336
27.2 87 46 2366.4 1251.2 4002
33.3 94 55 3130.2 1831.5 5170
32.6 95 62 3097 2021.2 5890
30.6 88 47 2692.8 1438.2 4136
28.1 89 58 2500.9 1629.8 5162
25.2 90 63 2268 1587.6 5670
35 93 54 3255 1890 5022
29.2 91 53 2657.2 1547.6 4823
31.9 92 52 2934.8 1658.8 4784
27.7 89 52 2465.3 1440.4 4628
31.7 94 53 2979.8 1680.1 4982
34.2 93 54 3180.6 1846.8 5022
30.1 91 58 2739.1 1745.8 5278

604.5 1819 1088 55066.5 32905.2 99063


Çoklu regresyon
• Üç eşitlikte hesaba katılarak a, b1 ve
b2 değerleri bulunabilir.

• Çoklu lineer regresyon eşitliği:

Y = a+b1 X1 +b2 X2
ˆ
Çoklu regresyon
• Bu örnekte,

a = -63.535
b1 = 1.1789
b2= -.24743

• Buna göre:

Yˆ = − 63 .535 + 1 .1789 X 1 − .24743 X 2


Çoklu regresyon
• Standart hata: Tekil değişkenle
yapılan lineer regresyona benzer
olarak, çoklu değişkenlerde standart
hata:

SY o XY = ∑ (Y −Yˆ ) 2
n −3
Çoklu regresyon
Gerçek değer Tahmin edilen değer Kalan değer Değişim
Y

24.8 27.34 -2.54 6.4516


30.6 31.26 -0.66 0.4356
31.1 29.39 1.71 2.9241
28.2 29.7 -1.5 2.25
31.6 28.96 2.64 6.9696
29.9 30 -0.1 0.01
31.5 30.57 0.93 0.8649
27.2 27.65 -0.45 0.2025
33.3 33.67 -0.37 0.1369
32.6 33.12 -0.52 0.2704
30.6 28.58 2.02 4.0804
28.1 27.04 1.06 1.1236
25.2 26.98 -1.78 3.1684
35 32.74 2.26 5.1076
29.2 30.63 -1.43 2.0449
31.9 32.06 -0.16 0.0256
27.7 28.52 -0.82 0.6724
31.7 34.17 -2.47 6.1009
34.2 32.74 1.46 2.1316
30.1 29.39 0.71 0.5041

604.5 604.51 45.4751


Çoklu regresyon
• Örnekte:

45.4751
SY o XY = = 1.64
20 − 3
• Bu regresyon düzlemi üstünde hangi
noktaların dağıldığını gösterir.
Çoklu regresyon
• Avantajlar
• rYX1=.74, rYX2=.081 and rX1X2=.53
• Y ve X2 arasında çok zayıf bir ilişki
varken, X1 ve X2 arasında iyi bir ilişki
vardır.
• Bu X2 nin Y üzerindeki etkisinin X1 ile
arasındaki etkileşimden dolayı
kamufule edildiğini gösterir.
Mileage vs. Octane rating Mileage vs. Speed

40 40

35 35

30 30

25 25

Mileage
Mileage

20
20

15
15

10
10

5
5

0
0 0 10 20 30 40 50 60 70
86 87 88 89 90 91 92 93 94 95 96
Speed
rYX = 0.74 Octane Rating rYX = 0.081
2
1

Octane Rating vs. Speed


96

95

94

93
Octane Rating

92

91

90

89 rX X2
= 0.53
1
88

87

86
0 10 20 30 40 50 60 70

Speed
Çoklu regresyon
• Avantajlar

• Y üzerinde X2 nin etkisini korelasyon


az olduğu için gözardı etmenin
sakıncalı olduğunu gösterir.
Polinominal regresyon
Stress vs. Strain

120

100

80
Stress

Series1
60
Series2

40

20

0
0 0.002 0.004 0.006 0.008 0.01 0.012 0.014 0.016 0.018
Strain
Polinominal regresyon
• Gerilim-deformasyon eğrisinden
regresyon eşitliği ortaya koymaya
çalıştığımızı düşünelim. Lineer
olmayan dönüşüm yapmak zor
olacaktır.
• Bu durumda ne yaparız?
Polynomial regression
• Varsayalım

Y = a + b1 X + b 2 X
2

• Başka deyişle, daha iyi uyum için X


in yüksek dereceli olanlarından
yararlan
Polinominal regresyon
• Gerilim-deformasyon eğrisi verileri

Test Deformasyon Gerilim


(Y) (X)
1 0.001 91
2 0.002 97
3 0.003 108
4 0.005 111
5 0.006 114
6 0.006 110
7 0.009 112
8 0.011 105
9 0.016 98
10 0.017 91
Polinominal regresyon
Gerilim Deformasyon Deformasyon ^2

91 0.001 0.000001
97 0.002 0.000004
108 0.003 0.000009
111 0.005 0.000025
114 0.006 0.000036
110 0.006 0.000036
112 0.009 0.000081
105 0.011 0.000121
98 0.016 0.000256
91 0.017 0.000289
SUMMARY OUTPUT

Regression Statistics
X Variable 1 Residual Plot
Multiple R 0.922711
R Square 0.851396 10

Residuals
Adjusted R 0.808938
0
Standard E 3.822007
Observatio 10 0 0.005 0.01 0.015 0.02
-10
X Variable 1
ANOVA
df SS MS F ignificance F
Regression 2 585.8459 292.9229 20.05259 0.001265
Residual 7 102.2541 14.60773
Total 9 688.1

Coefficientstandard Erro t Stat P-value Lower 95%Upper 95%Lower 95.0%


Upper 95.0%
Intercept 89.58253 3.439173 26.0477 3.14E-08 81.45019 97.71488 81.45019 97.71488
X Variable 5377.952 956.4434 5.622865 0.000797 3116.324 7639.58 3116.324 7639.58
X Variable -311829 50657.11 -6.15569 0.000465 -431614 -192045 -431614 -192045

X Variable 2 Residual Plot


RESIDUAL OUTPUT
10

Residuals
ObservationPredicted YResidualsndard Residuals 0
1 94.64866 -3.64866 -1.08246 0 0.0001 0.0002 0.0003 0.0004
2 99.09112 -2.09112 -0.62038 -10
3 102.9099 5.090075 1.510097 X Variable 2
4 108.6766 2.323443 0.689307
5 110.6244 3.375615 1.00146
6 110.6244 -0.62439 -0.18524
7 112.7259 -0.72591 -0.21536
8 111.0086 -6.00864 -1.78261
9 95.80142 2.198581 0.652264
10 90.889 0.111002 0.032932
Polinominal regresyon
• Regresyon Eşitliği

Y = 89 .6 + 5378 X − 311829 X
ˆ 2

• Korelasyon katsayısı ( r ) = .922


Örnek 1
Regression Analysis: Çekme Dayanýmlarý (lb/in2) versus
Pamuk Yüzdesi

The regression equation is


Çekme Dayanımı (lb/in2) = 10,9 + 0,164 Pamuk Yüzdesi

Predictor Coef SE Coef T P


Constant 10,940 3,764 2,91 0,008
Pamuk Yü 0,1640 0,1449 1,13 0,269

S = 5,122 R-Sq = 5,3% R-Sq(adj) = 1,2%

Analysis of Variance

Source DF SS MS F P
Regression 1 33,62 33,62 1,28 0,269
Residual Error 23 603,34 26,23
Total 24 636,96
Örnek 1
Regression Analysis: Çekme Dayanýmlarý (lb/in2) versus Pamuk
Yüzdesi

The regression equation is


Çekme Dayanımları (lb/in2) = 10,9 + 0,164 Pamuk Yüzdesi

Predictor Coef SE Coef T P


Constant 10,940 3,764 2,91 0,008
Pamuk Yü 0,1640 0,1449 1,13 0,269

S = 5,122 R-Sq = 5,3% R-Sq(adj) = 1,2%

Analysis of Variance

Source DF SS MS F P
Regression 1 33,62 33,62 1,28 0,269
Residual Error 23 603,34 26,23
Total 24 636,96
Örnek 1
The regression equation is
Çekme Dayanımı(lb/in2) = 62,6 - 9,01 Pamuk Yüzdesi - 0,00760
Kare3 + 0,481 Kare2

Predictor Coef SE Coef T P


Constant 62,61 39,76 1,57 0,130
Pamuk Yü -9,011 5,197 -1,73 0,098
Kare3 -0,007600 0,002874 -2,64 0,015
Kare2 0,4814 0,2160 2,23 0,037

S = 3,048 R-Sq = 69,4% R-Sq(adj) = 65,0%

Analysis of Variance

Source DF SS MS F P
Regression 3 441,81 147,27 15,85 0,000
Residual Error 21 195,15 9,29
Total 24 636,96

You might also like