Professional Documents
Culture Documents
Ilovepdf Merged
Ilovepdf Merged
1) İki değişken arasındaki korelasyon katsayısı (r) değeri nedir ? Bu katsayı hangi sonucu
gösterir?
Örnek Erozyonla Arazi
No Toprak Eğimi Yi 2 X i2 X i .Yi
Kaybı X
Y
1 72 13 5184 169 936
2 81 26 6561 676 2106
3 45 5 2025 25 225
4 67 11 4489 121 737
5 86 27 7396 729 2322
6 99 34 9801 1156 3366
7 84 25 7056 625 2100
8 55 4 3025 16 220
9 62 8 3844 64 496
Toplam 651 153 49381 3581 12508
Ortalama 72.3 17.0
( Yi ) 2 ( )
Erozyonla Toprak Kaybının KT= y Yi 2
i
2
= 49381 - = 2292
n
( X i ) 2 ( )
Arazi Eğimi KT= x X
2
i i
2
3581 - = 980
n
( X i )( Yi ) ( ) ( )
İki değişkenin ÇT= xi yi X i .Yi = 12508 - = 1441
n
r
x y i i
= = +0.961
x . y
2
i
2
i
√
∑
𝑏 =
∑
= = +1.470 cm3
Arazilerin eğim derecesi 1 birim değiştiğinde erozyonla toprak kaybı ortalama 1.470 cm3
değişmektedir.
►Topraktaki azot miktarı (kg/da) ile soya fasulyesi köklerinde Rhizobium japonicum
bakterileri tarafından oluşturulan nodül (nodozite) sayıları arasındaki ilişki araştırılmaktadır.
Bu amaçla, 9 farklı toprakta yetiştirilen soya fasulyesi köklerinde Rhizobium japonicum
bakterileri tarafından oluşturulan nodül (nodozite) sayıları bu toprakların azot miktarları (kg/da)
aşağıdaki tabloda verilmiştir.
Değişken Örnekler
1 2 3 4 5 6 7 8 9
4) Soya fasulyesi köklerinde nodül sayısı ile topraktaki azot miktarı arasındaki korelasyon
katsayısı (r) değeri nedir ve bu katsayı hangi sonucu ifade eder?
( X i ) 2 ( )
Azot Miktarı KT= x X 2
i i
2
3581 - = 980
n
( X i )( Yi ) ( ) ( )
İki değişkenin ÇT= xi yi X i .Yi = 12508 - = 1441
n
r
x y i i
= = +0.961
x . y
2
i
2
i
√
( . )
S = = 0.065 SD = n – 2 = 9 - 2 = 7
6) Soya fasulyesi köklerindeki nodül sayısının (Y) topraktaki azot miktarı (X) üzerine olan
regresyon katsayısını bulunuz ve bu katsayının ne anlam ifade ettiğini açıklayınız.
∑ .
𝑏 =
∑
= = - 7.39 adet
.
Topraklarda azot miktarındaki bir birim değişmeye karşılık soya köklerindeki nodül sayısının
zıt yönde ortalama olarak 7.39 adet değiştiğini ortaya koymaktadır.
7) Soya fasulyesi köklerindeki nodül sayısının (Y) topraktaki azot miktarı (X) üzerine olan
Regresyon doğru denklemi aşağıdakilerden hangisinde doğru olarak verilmiştir.
^
Yi a b. X i
∑ .
𝑏=𝑏 =
∑
= = - 7.39 adet
.
Ŷ= 120.54 – 7.39X
►Domates salçalarında askorbik asit miktarı ile likopen miktarı arasındaki ilişki
araştırılmaktadır. Bu amaçla yapılan çalışmada, bir salça fabrikasından alınan 10 salça
örneğinde askorbik asit miktarı (mg/100g) ve likopen miktarı (ppm) saptanmıştır. Elde edilen
değerler aşağıdaki tabloda verilmiştir.
8) İki değişken arasındaki korelasyon katsayısı (r) değeri nedir ? Bu katsayı hangi
sonucu gösterir ?
( Yi )2 ( )
Askorbik asit KT= y Yi
2
i
2
= 14343 - = 3780.5
n
( X i ) 2 ( )
Likopen KT= xi2 X i2 1496 - = 414.4
n
( X i )( Yi ) ( ) ( )
İki değişkenin ÇT= xi yi X i .Yi = 4619 - = 1239
n
Sonuç olarak domateste askorbik asit ile likopen arasındaki korelasyon katsayısı,
r
x y i i
= = + 0.989
x . y
2
i
2
i
√ . .
Bu korelasyon katsayısı domateste askorbik asit ve likopen miktarı arasında pozitif yönde
yüksek bir doğrusal ilişki olduğunu göstermektedir. Buna göre domateste askorbik asit artıkça
likopen miktarının da arttığı söylenebilir.
10) Askorbik asit miktarının (Y) Likopen miktarı (X) üzerine olan regresyon katsayısı
ve bu katsayının ne anlam ifade ettiği aşağıdaki seçeneklerden hangisinde doğru
olarak verilmiştir?
∑
𝑏 =
∑
= = 2.99 mg/100g
.
Domateste likopen miktarında 1 ppm’lik değişmeye karşılık askorbik asit miktarının ortalama
olarak 2.99 mg/100g değiştiğini ortaya koymaktadır.
10) Bu çalışmada Askorbik Asit miktarının (Y) Likopen miktarı (X) üzerine olan
regresyon doğru denklemini oluşturunuz.
^
Yi a b. X i b
x y i i
= = 2.99
x 2
i
.
Ŷ = 1.41 + 2.99 X
► Oniki adet inek sütünde kalsiyum (Ca) miktarı (mg/g) ile laktik asit miktarı (g/100g)
aşağıda olduğu gibi bulunmuştur.
11) İki değişken arasındaki korelasyon katsayısı (r) değeri nedir ? Bu katsayı hangi
sonucu gösterir?
Örnek Kalsiyum Laktik
No miktarı asit X i2 Yi 2 X i .Yi
(mg/g) (g/100g)
Y X
1 5.0 7.9 62.41 25.0 39.5
2 1.0 3.7 13.69 1.0 3.7
3 3.0 6.8 46.24 9.0 20.4
4 5.5 10.5 110.25 30.25 57.75
5 2.0 2.5 6.25 4.0 5.0
6 4.5 9.2 84.64 20.25 41.4
7 6.0 8.0 64.00 36.0 48.0
8 0.5 2.0 4.0 0.25 1.0
9 4.5 5.0 25.0 20.25 22.5
10 1.0 2.0 4.0 1.0 2.0
11 5.0 9.7 94.09 25.0 48.5
12 4.0 5.5 30.25 16.0 22.0
Toplam 42.0 72.8 544.82 188.0 311.75
Ortalama 3.5 6.06
( Yi )2 ( . )
Kalsiyum miktarı KT= y Yi
2
i
2
= 188.0 - = 41.0
n
( X i ) 2 ( . )
Laktik asit KT= xi2 X i2 544.82 - = 103.17
n
( X i )( Yi ) ( . ) ( . )
İki değişkenin ÇT= xi yi X i .Yi = 311.75 - = 56.95
n
Sonuç olarak inek sütlerinde laktik asit miktarı ile kalsiyum miktarı arasındaki korelasyon
katsayısı,
r
x y i i
=
.
= + 876
x . y
2
i
2
i
√ . .
Bu korelasyon katsayısı inek sütlerinde laktik asit miktarı ile kalsiyum miktarı arasında pozitif
yönde yüksek bir doğrusal ilişki olduğunu göstermektedir. Buna göre inek sütlerinde laktik asit
miktarı artıkça kalsiyum miktarının da arttığı söylenebilir.
( . )
S = = = 0.153 SD = n – 2 = 12 – 2 = 10
13) Kalsiyum miktarının (Y) Laktik asit miktarı (X) üzerine olan regresyon katsayısını
hesaplayınız ve bu katsayının ne anlam ifade ettiğini açıklayınız.
∑ .
𝑏 =
∑
= = 0.552 mg/g
.
İnek sütlerinde laktik asit miktarında 1 birimlik değişmeye karşılık kalsiyum miktarının
ortalama olarak 0.552 mg/g değiştiğini ortaya koymaktadır.
14) Laktik asit miktarının (Y) Kalsiyum miktarı (X) üzerine regresyon doğrusunu
oluşturunuz.
^
Yi a b. X i b
x y
i i
=
.
= 0.552 mg/g
x 2
i
.
Ŷ = 0.15 + 0.552 X
Şekil 1. İnek sütünde kalsiyum miktarının laktik asit üzerine olan regresyon doğrusu
İSTATİSTİK
BÖLÜM 4
DOĞRUSAL KORRELASYON VE REGRESYON
Gövde No 1 2 3 4 5 6 7 8
Gövde ağırlığı (gr) 250 280 340 450 240 350 900 875
Şeker oranı (%) 18 17 14 13 19 15 13 12
Rakamlardan da çok açık bir şekilde görüldüğü gibi gövde ağırlığı arttıkça,
şeker oranı azalmaktadır. İşte bu ilişki korrelasyondur. Bu tip ilişkilerin derecelerine
ise "Korrelasyon Katsayısı" denir. Bu katsayı örneklerde r ile gösterilir. Yani r, iki
değişken arasındaki doğrusal ilişkinin derecesini ve yönünü belirten katsayıdır.
Deneme üniteleri üzerinde gözlenen iki değişken X ve Y
değişkenleri olsun. Böyle iki herhangi değişken arasında
doğrusal ilişkinin olup olmadığını saptamada en basit yol
bunların değerlerini aynı koordinat sisteminde
göstermektir. Örneğin; X değişkeni x ekseninde ve Y
değişkeni ise y ekseninde gösterilerek kesişme noktaları
belirlenebilir. Kesişme noktalarının koordinat düzleminde
gösterdikleri dağılım durumuna göre farklı doğrusal
korrelasyon formları ortaya çıkar.
l- X ve Y aynı yönde değişiyor ve noktalar bir doğru üzerinde
yerleşiyorsa ilişki tamdır. Yani r = + l dir (Şekil 4A).
Örnek Y X
No Değişkeni Değişkeni Yi 2 X i2 X i .Yi
( X i )( Yi )
xi yi ( X i X )(Yi Y ) X i .Yi
n
Yukarıda tanımlanan üç istatistik kullanılarak korelasyon katsayısı aşağıdaki Pearson
eşitliğinden bulunur.
r
x y i i
x . y
2
i
2
i
ÖRNEK 4.1.
Dokuz farklı toprak örneğinde tuz konsantrasyonu(%) ve elektriksel geçirgenlik miktarı
(mmhos) değerleri aşağıda verilmiştir(Tablo 4.2).
r
x y i i
=
284
0.97
x . y
2
i
2
i
576 x144
Traktör No.
Değişkenler
1 2 3 4 5 6 7 8 9 10
Bakım 230 540 110 220 75 280 140 320 30 420
Harcamaları
Traktörün 8 14 3 7 2 9 4 10 1 12
Yaşı
( X i ) 2
(𝟕𝟎)𝟐
Traktör Yaşı KT= i i
x 2
X 2
664 - = 174
n 𝟏𝟎
( X i )( Yi ) 𝟕𝟎 𝒙 (𝟐𝟑𝟔𝟎)
İki değişkenin ÇT= xi yi X i .Yi = 22760 - = 6240
n 𝟏𝟎
Sonuç olarak traktör yaşı ile bakım masrafları arasındaki korelasyon katsayısı,
r
x y i i
=
𝟔𝟐𝟒𝟎
= + 0.985
x . y
2
i
2
i
𝟏𝟕𝟒 𝒙 𝟐𝟑𝟎𝟔𝟒𝟎
( X i ) 2 (𝟕𝟐.𝟖)𝟐
Laktik asit KT= xi2 X i2 544.82 - = 103.17
n 𝟏𝟐
r
x y i i
=
𝟓𝟔.𝟗𝟓
= + 0.876
x . y
2
i
2
i
𝟏𝟎𝟑.𝟏𝟕𝒙 𝟒𝟏.𝟎
Şekil 4.7. İnek sütünde kalsiyum miktarının laktik asit üzerine olan regresyon doğrusu
ÖRNEK 4.5
8 adet öğrencinin harçlığı ile aile geliri aşağıda olduğu gibi bulunmuştur.
Tablo 4.3. Sekiz aile-öğrenci çiftinde aile geliri ve harçlık miktarı (TL)
İki değişken arasındaki korelasyon katsayısını hesaplayarak sonucunu tartışalım.
Korelasyon katsayısı,
r
x y i i
=
12650
= + 0.95
x . y
2
i
2
i
1350 x132400
Tıpkı bir önceki örneğe benzer şekilde bir doğrusal ilişki durumu ortaya çıkmıştır. Aile geliri arttıkça öğrenci
harçlığı da artmakta veya aile geliri azaldıkça harçlık miktarı da almaktadır. Ayrıca doğrusal ilişki tam olmasa
bile tama yakındır.
4.2.DOĞRUSAL REGRESYON
4.2.l.Regresyon Katsayısı
X ve Y gibi herhangi iki değişken arasında bir ilişki varsa matematikte
y=f(x) şeklinde gösterilir. Burada X'e bağımsız değişken, Y'e ise bağımlı
değişken denir. Böylece X'in verilen bazı değerlerinde Y'nin alacağı
değerlerde hesaplanabilir. Örneğin toprağa verilen gübre, verim
açısından bakıldığında bağımsız değişkendir. Ancak gübre verimi
etkiliyor ve değiştirmeye meyil gösteriyorsa verim bir bağımlı
değişkendir. Geriye dönüş anlamına sahip regresyon; Y değişkeninin X
değişkenine matematiksel bağımlılığını gösterir.
İstatistikte bağımlı değişkenler Y ve bağımsız değişkenler ise X ile
gösterilir.
Y ve X arasında önemli bir ilişki var ve korrelasyon katsayısı
yeterince önemli ise, bağımsız değişkenin bir ölçü birimi değiştiğinde
bağımlı değişkenin ne kadar değiştiği karşılaşılan önemli bir sorudur.
Bu regresyon katsayısıdır. Yani; X değişkeninin l ölçü birimi
değişmesi durumunda , Y değişkeninin kendi birimi cinsinden
ortalama değişme miktarıdır. İşte bu regrasyon katsayısıdır. Esasen
tanımlanan bu değere Y'nin X'e göre regresyon katsayısı denir ve byx
şeklinde gösterilir. Ancak bunun terside olabilir. X'in Y'e göre regresyon
katsayısı da vardır ve bu bxy şeklinde gösterilebilir.
Biraz sonrada kanıtlanacağı gibi,
byx=
Ç𝐚𝐫𝐩ı𝐦𝐥𝐚𝐫 𝐓𝐨𝐩𝐥𝐚𝐦ı
byx
xyi i
x
𝐁𝐚ğı𝐦𝐬ı𝐳 𝐃𝐞ğ𝐢ş𝐤𝐞𝐧 𝐊𝐓 2
i
σ 𝒙𝒊 𝒚𝒊
bxy= 𝟐 (Burada Y'i bağımsız değişkenmiş gibi düşünmek gerekir)
σ 𝒚𝒊
Yukarıdaki toprak analizi örneğinde (ÖRNEK 4.1); tuz konsantrasyonunun (Y),
elektriki geçirgenlik (X) üzerine olan regresyon katsayısı;
byx
x y 𝟔𝟐𝟒𝟎
i i
= = 35.86 TL
x 𝟏𝟕𝟒
2
i
Bu sonuç, traktörlerin bir yaş yaşlanması ile bakım masraflarında ortalama 35.86 TL
artış olacağını ortaya koymaktadır.
ÖRNEK 4.3’de verilen Kalsiyum miktarının (Y) Laktik asit miktarı (X) üzerine olan
regresyon katsayısını hesaplayınız ve bu katsayının ne anlam ifade ettiğini açıklayınız.
σ 𝒙𝒚 𝟓𝟔.𝟗𝟓
𝒃𝒚𝒙 =
σ 𝒙𝟐
= = 0.552 mg/g
𝟏𝟎𝟑.𝟏𝟕
İnek sütlerinde laktik asit miktarında 1 birimlik değişmeye karşılık kalsiyum miktarının
ortalama olarak 0.552 mg/g değiştiğini ortaya koymaktadır.
4.2.2.Regresyon Doğrusu
b
xyi i
x 2
i
𝐘 = 0.0833+0.49X
Bulunan doğru denklemine, daha öncede değinildiği gibi "Önceden Tahminleme
Denklemi" de denir. Örneğin; elektriki geçirgenlik X=20 mmhos olduğunda tuz
konsantrasyonu;
𝐘 = 0.0833+0.49x20 = % 9.92 olur. Tahminlenen bu değere X=20 ye ait
regresyon değeri denir ve bütün istatistiklerde olduğu gibi bunun da bir standart
hatası vardır.
Şekil 4.3. Dokuz adet toprak örneğinde tuz konsantrasyonu ve elektriksel
geçirgenlik dağılım grafiği
ÖRNEK 4.2.(Devam). Örnek 4.2’de verilen traktörlerin yaşı ve bakım harcamaları
arasındaki ilişki ile ilgili soruda bakım harcamalarının (Y) traktör yaşı (X) üzerine olan
regresyon doğru denklemini oluşturunıuz.
Bakım harcamaları ortalaması : 𝐘ഥ = 236 TL
Traktör yaşı ortalaması : 𝐗ഥ = 𝟕
byx
x y 𝟔𝟐𝟒𝟎
i i
= = 35.86 TL
x 𝟏𝟕𝟒
2
i
Ŷ = 0.15 + 0.552 X
Şekil 4.7. İnek sütünde kalsiyum miktarının laktik asit üzerine olan regresyon doğrusu
Örnek 4.8
Daha önce çeşitli istatistikleri hesaplanmış olan harçlık-aile geliri örneğinde öğrenci harçlıklarının aile geliri
üzerine olan regresyon doğru denklemini tanımlayalım. Bunun için a ve b katsayılarının hesaplanması
gerekir.
Tablo 3.4 den de görüldüğü gibi,
x y 12650
i i
x 132400
2
i
olduğu bulunmuştu.
byx
x y i i
=
12650
0.096 YTL
x 2
i 132400
( X i ) 2 (153)2
Arazi Eğimi KT= xi X i 3581 - = 980
2 2
n 9
r
x y i i
=
1441
= +0.961
x . y
2
i
2
i
980 𝑥 2292
σ 𝑥𝑦 1441
𝑏𝑦𝑥 = σ 𝑥2
= = +1.470 cm3
980
σ 𝑥𝑦 1441
𝑏 = 𝑏𝑦𝑥 =
σ 𝑥2
= = +1.470
980
Ŷ= 47.34 + 1.470X
BÖLÜM 5
UYGULAMA SORULARI VE ÇÖZÜMLERİ
ÖRNEK 5.1.Varyans bilinmeyen populasyondan çekilmiş 25 varyantlık bir örneğin ortalaması
22.5 cm ve varyans 2.56 dır. Örnek ortalamasının standart hatası nedir?
.
S = = = 0.32 cm dir.
ÖRNEK 5.2.
Tarla koşullarında yetiştirilmiş patates bitkilerinde bitki başına yaprak alanı ortalaması 800
cm 2 ve standart sapması 90 cm 2 olan normal bir dağılış göstermektedir. Aşağıdaki iki soruyu
yanıtlayalım.
a. Bitkilerin yer aldığı populasyonda bunların yüzde kaçı 750-850 cm 2 arsında yaprak
alanına sahiptir.
Şekildeki alanın toplam alana oranını veya integralini z-tablosundan yaralanarak hesaplayalım.
750 ve 850 cm 2 lik yaprak alanlarının standart değerleri,
750 800 850 800
z1 -0.56 ve z1 +0.56
90 90
EKTABLO I de z dağılışının ortalaması olan sıfır ile 0.56 arasındaki olasılık 0.2123 dır. O
halde,
P(750 xi 850) =0.2123+0.2123=0.4246 (%42.5)
olur. Tarladaki bitkilerin %42.5 unda yaprak alanının 750-850 cm 2 olması beklenir. Yada
herhangi rast gele alınan bir yaprağın alanının bu iki değer arsına düşme olasılığı %42.5 dır.
b. Bitkilerin yer aldığı tarladan dört bitkilik örnekler alındığında ( n 4 ) bu örneklerin
yüzde kaçında ortalama yaprak alanının yine 750-850 cm 2 olması beklenir.
Örnekleme dağılışının ortalaması ve standart sapması,
90
X =800 cm 2 ve X = 45 cm 2
n 4
İstenen olasılık bu kez dört yapraklık örneklerin ortalamalarının örnekleme dağılışındaki
aşağıda verilen şekilde gösterilen olasılıktır.
Örnekleme dağılışındaki ortalama 750 ve 850 cm 2 lik yaprak alanlarının standart değerleri ise
bu kez,
750 800 850 800
z1 -1.11 ve z1 +1.11
45 45
Bunların EKTABLO I de verilen olasılıkları ise 0.3665 dır. Sonuç olarak,
P(750 X i 850) =0.3665+0.3665=0.733 (% 73.3)
dır. Her birisi 4 adet bitki olan sınırsız sayıda örnekler alınıp ortalamaları hesaplanırsa bunların
%73.3 ünün 750-850 cm 2 arasına düşmesi beklenir.
ÖRNEK 5.3.
Yeni doğmuş ivesi kuzularından rast gele alınmış 28 adet kuzunun doğum ağırlıkları (Kg)
aşağıda olduğu gibi bulunmuştur.
Doğum ağırlığı
4.3 5.2 6.2 6.7 5.3 4.9 4.7 5.5 5.3 4.0 4.9 5.2 4.9 5.3
5.4 5.5 3.6 5.8 5.6 5.0 5.2 5.8 6.1 4.9 4.5 4.8 5.4 4.7
Söz konusu örneğin ortalamasını, varyansını, standart hatasını ve serbestlik derecesini
hesaplayalım. Eğer gerekli işlemler yapılırsa,
X 5.2 ve S 2 0.428 ve S 0.654
olduğu görülür. O halde ortalamanın standart hatası,
S 0.654
SX = 0.124 ve serbestlik derecesi ise 28-1=27
n 28
dır.
ÖRNEK 5.4.
Ampul üreten A fabrikasında ampullerin ortalama dayanma süresi 1400 saat ve standart
sapması ise 200 saattir (varyansı 40.000). B fabrikasında ise ortalama süre 1200 saat ve standart
sapması 100 saat olmaktadır (varyansı 10.000). Her iki firmanın ürettiği ampullerden 125 er
adetlik örnekler aldığımızı varsayalım. A fabrikasında üretilen ampullerin B fabrikasında
üretilenlere göre ,
a. En az 160 saat daha fazla dayanması ve
b. 250 saatten daha fazla dayanması olasılıkları nedir.
Farklılığın örnekleme dağılışının ortalaması,
( X 1X2 )
1 2 = 1400-1200=200 saat
ve farklılığın standart hatası ise veya örnekleme dağılışının standart sapması ise,
40000 10000
(X X ) =20 saat
1 2
125 125
A fabrikasında üretilen ampullerin 160 ve daha fazla saat dayanması olasılığı aşağıdaki dağılış
eğrisinden de görüldüğü gibi taralı alan veya 160 h ile arasındaki integraldir. Bunu
EKTABLO I den bulalım. 160 saate ait olan standart değer,
160 200
z 2.00
20
EKTABLO I de ortalama 0 olan z değeri ile 2.00 arasındaki olasılık 0.4772 dır. O halde,
P( X A X B ) 160 =0.5000+0.4772=0.9772 (%97.7)
dır. A fabrikasında üretilen ampullerin B fabrikasında üretilenlere göre 160 saatten daha fazla
dayanması şansı %97.7 dır.
A fabrikasında üretilen ampullerin 250 saatten daha fazla dayanması ise bu kez aşağıdaki
şekilde gösterilen alandır.
dır.
ÖRNEK 5.5.
Bir ülkede liseyi bitirenlerin oranı 0.25 dır. Populasyondan alınan 100 kişilik örneklerde liseyi
bitirme oranlarının ortalamasını ve standart sapmasını bulalım.
=p=0.25
^
p
0.25* 0.75
^ 0.04
p 100
Öte yandan n * p 100 * 0.25 25 5 olduğundan dağılış tipi normaldir.
Buna göre liseyi bitirenlerin oranlarının 0.30 dan daha fazla olma şansını hesaplayalım.
Söz konusu olasılık EKTABLO I den yaralanılarak hesaplanabilir. 0.30 oranının standart
değeri,
^
p ^ ^
p p p 0.30 0.25
z =1.25
^ ^ 0.04
p p
EKTABLO I de 1.25 ile sıfır ortalama arasındaki olasılık 0.3955 dır. Buna göre aranan yanıt,
^
P ( p 0.30) =0.5000-0.3955=0.1045
dır. O halde 100 varyantlık örneklerde liseyi bitirme oranının 0.30 ve daha yüksek olması
şansının %10.5 olduğunu ileri sürmek mümkündür.
ÖRNEK 5.6. Domates salçalarında bir yıllık raf ömrü sonunda bozulma oranının 0.10 olması
yönetmelik gereğidir. Bir salça fabrikasının ürettiği salçalardan rastgele seçilen 550 salça
kutuluk örneklerde örnekleme dağılışının ortalamasını ve standart sapmasını hesaplayalım.
Söz konusu örnekleme dağılışının ortalaması;
p*q . .
= p = 0.10 ve standart sapması; ^
^
p p n
= = 0.0128
ÖRNEK 5.7. Bir elma çeşitinde 200 elmadan 80'inde ve ikinci bir çeşitte ise 180 elmanın
120'sinde elma içi kurdu görülmüştür. Elma iç kurdu oranlarını ve farklılığının standart hatasını
bulunuz.
^ ^
p1 = = 0.40 ve p2 = = 0.67
^ ^ ^ ^
p1 * q1 p2 * q2 . . . .
S ^ ^ = + = 0.49
( p1 p2 ) n1 n2
(0.40-0.67) ± 0.049
ÖRNEK 5.8.
Aynı populasyondan alınan 200 kişilik bir örnekte 12 kişinin ve 150 kişilik bir örnekte ise 5
kişinin solak olduğu görülmüştür. Her iki örnekte solakların oranını, farkını ve bu farklılığın
standart hatasını hesaplayalım.
^ 12 ^ 5
p1 = 0.06 ve p2 = 0.03
200 150
Bu iki örnekteki oranların farkı,
^ ^
p1 _ p2 =0.06-0.03=0.03
ÖRNEK 5.9.
On iki adet traktörün yaşı ve bakım masrafları arasındaki korelasyon katsayısı r 0.875 dır.
Populasyonun korelasyon katsayısının sıfır olduğunu ( 0 ) kabul ederek standart hatasını ve
serbestlik derecesini bulalım.
(1 (0.8752 )
Sr =0.153 ve SD=10
(12 2)
ÖRNEK 5.10.
Aynı dersi alan bayan öğrencilerde sözlü ve yazılı sınarlar arasındaki korelasyon katsayısı 0.60
ve erkek öğrencilerde ise 0.50 dır. Eğer 40 adet bayan ve 35 adet erkek olan şans örnekleri
alınırsa bayanlara ait korelasyonun erkeklere ait korelasyondan daha düşük olma şansı nedir.
r1 0.60 için z1 0.69 ( EKTABLO II den)
Olduğundan farklılık,
z1 z2 0.69 0.55 = 0.14
1 1
S( z1 z2 ) =0.24
40 3 35 3
dır. Bayanlarda korelasyonun erkeklerden daha düşük olması için farkın sıfırın altında olması
gerekir. O nedenle söz konusu olasılık aşağıdaki şekilde verilen taralı alan yada sıfır ile eksi
sonsuz arasındaki olaıslık veya sıfır olan farkın eklemeli olasılığıdır. Bunu EKTABLO I den
yararlanarak bulalım. Sıfır farkının standart değeri,
0 0.14
z 0.58
0.24
İlgili tabloda 0.58 ile sıfır z değeri arasındaki olasılık 0.2190 dır. O halde aranan yanıt 0.5000-
0.2190=0.281 (%28.1) dır. Yani bayan öğrencilerdeki korelasyon katsayısının erkeklere göre
daha düşük olma şansı %28 dır.
PROBLEM 5.11.
Ergin yaşa gelmiş erkeklerde boy 175 cm ve standart sapma 6.4 cm dır( varyansı 41). Ergin
kadınlarda ise ortalama boy 165 cm ve standart sapması 6.4 cm dır (varyansı 41). Birinci
populasyon erkeklerin boyu ve ikinci populasyon ise kadınların boyu olsun. Her iki
populasyondan da 50 şer kişi seçilmiş olsun.
a. İki cinsiyet populasyonundan alınan örneklerin X 1 X 2 ortalama farklılığının örnekleme
dağılışının ortalaması,
( X 1X2 )
1 2 =175-165=10 cm
12 22 41 41
(X X ) = =1.28 cm
1 2
n1 n2 50 50
c. Erkeklerin boylarının kadınların boylarından 12 cm daha uzun olması şansı nedir?. Yani,
P( X 1 X 2 ) 12
EKTABLO I de 0 z değeri ile 1.56 değeri arsındaki olasılık 0.4406 dır. Buna göre,
P( X 1 X 2 ) 12 =0.5000-0.4406=0.0594 (%5.9)
ÖRNEK 5.12.
Serbestlik derecesi v n 1 9 1 8 olan bir khi-kare dağılışı için çeşitli olasılık tanımlamaları
yapalım
Sekiz serbestlik dereceli bu khi-kare değişkeninin dağılış eğrisi aşağıda verilmiştir.
Ortalaması v 8 ve varyansı 16 dır. Dağılış 0 ile artı sonsuz arasındaki bütün khi-kare
değerlerini kapsar. Öte yandan z ve t dağılışları simetrik olduğu halde khi-kare dağılışı sağa
veya pozitif yana eğikdir. Dağılış eğrisi sekiz serbestlik dereceli khi-kare değerleri ile ilgili
bütün olasılıkların tanımlanmasında kullanılabilir.
ÖRNEK 5.13.
Sekiz serbestlik dereceli khi-kare dağılışında khi-kare değerlerinin yüzde kaçı 20.09 dan daha
büyüktür. Herhangi bir khi-kare değerinin 20.09 dan daha büyük olması şansı nedir.
Khi-kare dağılış grafiğinden de görüldüğü gibi 20.09 dan daha düşük khi-karelerin oranı %99
dır.
Ortalaması ve varyansı bilinen normal populasyondan alınan 8 serbestlik dereceli örneklerin
khi-kare değerleri hesaplanırsa bunların %1 i 20.09 dan daha yüksek ve %99 u ise daha düşük
khi-kare değerleri gösterirler. Sekiz serbestlik dereceli herhangi bir şans örneğinin 20.09 dan
daha yüksek bir değer alması şansı da %1 dır. Burada örnek olarak alınan 20.09 khi-kare değeri
serbestlik derecesi 8 olan örneklerde khi-kare dağılışını %99:%1 olacak şekilde ikiye ayıran
değerdir ve o nedenle kritik bir değer olarak düşünülür.
Bu kez yine aynı örnekte 15.51 den daha yüksek khi-kare değerlerinin oranını bulalım.
Şekilden de görüldüğü gibi sekiz serbestlik dereceli khi-kare dağılışında 2 15.51 değeri
dağılışı %95:%5 olmak üzere iki kısma ayırmaktadır. O nedenle bu da başka bir kritik değerdir.
Herhangi bir khi-kare değerinin 15.51 den daha yüksek olması şansı %5 dır.
Çoğu khi-kare testlerinde uygun serbestlik derecelerindeki khi-kare değerlerinin yukarıdaki
örneklerde olduğu gibi verilen bir khi-kare değerinden daha yüksek olma olasılıkları
kullanılmaktadır. İntegral alma sorununu ortadan kaldırmak için çeşitli serbestlik derecelerinde
çeşitli daha fazla olasılıkları sınırlandıran khi-kare değerleri EKTABLO IV de verilmiştir.
Tabloda ilk sütunda serbestlik dereceleri, ilk sırada ise 0.995 den yani yaklaşık 1 den
başlayarak 0.005 e kadar daha fazla olasılıklar ve tablonun orta kısmında ise bu olasılıkları
sınırlandıran khi-kare değerleri yer alır.
Örneğin sekiz serbestlik dereceli sıra aşağı da olduğu gibi görülür.
Görüldüğü gibi 15.51 den daha yüksek khi-kare elde etme olasılığı %5 ve daha düşük bir khi-
kare elde etme olasılığı ise %95 dır. 20.09 dan daha yüksek khi-kare elde etme olasılığı %1 ve
21.96 dan daha yüksek khi-kare değeri elde etme olasılığın ise %0.005 dır.
ÖRNEK 5.14.
On bir serbestlik dereceli bir örneğin khi-kare değeri 2 = 23.32 olarak bulunmuştur. Söz
konusu örneğin 11 serbestlik dereceli veya içinde 12 adet varyant bulunan bir populasyondan
çekilme olasılığı nedir? EKTABLO IV den de görüldüğü gibi % 2.5 ve % 1.0 arasında olup
takriben %l.75'dir. Eğer % 5 düzeyi kritik düzey olarak alınırsa, bu örneğin böyle bir
populasyona temsil etmediği veya böyle bir populasyondan çekilmediği sonucu ortaya çıkar.
► Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü sonundaki
bozulma oranları araştırılmaktadır. Bu amaçla yapılan bir çalışmada Pastorizasyon tekniği ile
işlenmiş olan 740 süt şişesinden 326’sının ve UHT tekniği ile işlenmiş olan 850 süt şişesinden
281’inin 6 ay sonunda bozulduğu belirlenmiştir. Bu deneme ile ilgili aşağıdaki soruları
yanıtlayınız.
5.15.Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü
sonundaki bozulma oranları nedir ?
n1 = 850 X1 = 281 P = X1/ n1 = 281/850 = 0.33
n2 = 740 X2 = 326 P = X2/ n2 = 326/740 = 0.44
5.16.Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü
sonunda bozulma oranları arasındaki farklılığın standart hatasını (S(p1 -p2) )
hesaplayınız.
^ ^ ^ ^
p1 * q1 p2 * q2 . . . .
S ^ ^ = + = 0.0243
( p1 p2 ) n1 n2
► Bursa’da üretilen Deveci armutlarında zirai ilaç kalıntı miktarını analiz etmek için
kullanılan ve doğruluğu kanıtlanmış olan “Klasik Metot” yanında daha kısa sürede sonuç veren
fakat doğruluğu kanıtlanmamış olan “Hızlı Metot” geliştirilmiştir. Yapılan bir araştırmada bu
iki metot karşılaştırılmıştır. Bu amaçla, zirai ilaç uygulanmış olan Deveci armutunun bulunduğu
bir bahçeden rastgele seçilen 12 ağacın meyvelerine Klasik Metot, yine aynı bahçeden rastgele
seçilen 10 ağacın meyvelerine Hızlı Metot uygulanarak zirai ilaç kalıntı miktarları
belirlenmiştir. Her iki metoda ait zirai ilaç kalıntı miktarları (ppm) aşağıdaki tabloda verilmiştir.
1 2 3 4 5 6 7 8 9 10 11 12
Klasik 62 74 56 61 75 53 59 66 61 55 64 70
Hızlı 49 56 62 48 67 64 58 54 50 65 - -
5.17.Her iki analiz metodunun (sırasıyla Klasik; S12 ve Hızlı ; S22 metot) varyanslarını
hesaplayınız.
(∑ ) ( )
∑ 𝒙𝟐𝟏 = ∑ x - = (622+742+…..+702) - = 562.0
∑ 𝐱𝟐𝟏 .
Varyansı; S = = = 51.1
(∑ ) ( )
∑ 𝒙𝟐𝟐 = ∑ x - = (492+562+…..+652) - = 442.1
∑ 𝐱𝟐𝟐 .
Varyansı; S = = = 49.1
5.18. Bu örneğe ait müşterek (toplanmış) varyansı ve serbestlik derecesini bulunuz.
∑ ∑ . .
S = = = 50.2 SD = n1 + n2 − 2 = 12 + 10 – 2 = 20
► Bursa bölgesinde iki farklı bünyeye sahip olan (Tın ve Kil) tarlalardan alınan toprak
örnekleri aynı metotla analiz edilerek fosfor kapsamları (P2O5 kg/da) belirlenmiş ve elde edilen
veriler aşağıda olduğu gibi bulunmuştur. Fosfor analizi kil bünyeli toprakta 11, tın bünyeli
toprakta 10 örnekte yapılmıştır.
(∑ ) ( )
∑ 𝒙𝟐𝟏 = ∑ x - = (672+402+…..+402) - = 2996.6
(∑ ) ( )
∑ 𝒙𝟐𝟐 = ∑ x - = (632+362+…..+502) - = 954.0
5.20. Kil ve tın bünyeli toprakların fosfor kapsamlarına ilişkin varyanslarını ( sırasıyla
S12 ve S22) ve serbestlik derecelerini bulunuz.
∑ 𝐱𝟐𝟏 .
Kil bünyeli toprağın varyansı; S = = = 299.6 SD = n1 – 1 = 11-1 = 10
∑ 𝐱𝟐𝟐 .
Tın bünyeli toprağın varyansı; S = = = 106.0 SD = n2 – 1 = 10-1 = 9
► Türk Gıda Kodeksine göre birinci sınıf meyve sularında brix oranının (kuru madde oranı)
0.45 olması gerekmektedir. Meyve sularında brix oranına ait standart sapmanın (σ) 0.80 olduğu
bilinmektedir. Bir meyve suyu fabrikasından rastgele alınan 100 adet 1 litrelik meyve suyu
kutularında ortalama brix oranı 0.37 olarak bulunmuştur.
5.21. Bu meyve suyu fabrikasından alınan meyve suyu örneklerinin brix oranına ilişkin
örnekleme dağılışının varyansını ve standart sapmasını hesaplayınız.
Örnekleme dağılışının varyansı;
( . )
= = = 0.0064
Örnekleme dağılışının standart sapması;
σ .
σ =
√n
= = 0.08 % değerindedir.
√
5.22.Söz konusu meyve suyu fabrikasının Türk Gıda Kodeksine uygun üretimde bulunup
bulunmadığına ilişkin hipoteznin testi için hesaplanması gereken test istatistiğinin
değerini hesaplayınız.
Xi X . .
zi
X
= = - 1.0 dır.
.
► Bir soya fasulyesi çeşidinde iki farklı tohumluk rutubet oranının (% 8 ve % 11) çimlenme
gücü üzerine etkisi araştırılmaktadır. Yapılan deneme sonunda oda sıcaklığında % 8 rutubet
oranında 1 yıl depolanan 750 tohumdan 675 tanesinin ve oda sıcaklığında % 11 rutubet oranında
1 yıl depolanan aynı çeşide ait 900 tohumdan 765 tanesinin çimlendiği belirlenmiştir. Bu
deneme ile ilgili aşağıdaki soruları yanıtlayınız.
5.23. Oda sıcaklığında iki farklı tohumluk rutubet oranında (% 8 ve % 11) 1 yıl süreyle
depolanan soya tohumlarında çimlenme oranlarını bulunuz.
5.24.İki farklı tohumluk rutubet oranlarına (% 8 ve % 11) ait çimlenen tohum sayıları
arasındaki farklılığın standart hatasını ( S(p -p ) ) hesaplayınız.
^ ^ ^ ^
p1 * q1 p2 * q2 . . . .
S ^ ^ = + = 0.016 %
( p1 p2 ) n1 n2
5.25. İki farklı rutubet oranında çimlenen tohum oranlarının farklı olup olmadığına dair
hipotez testi için hesaplanması gereken test istatistiğinin değerini bulunuz.
(µ µ ) ( . . )
z=
.
= + 3.25
( )
Sulama Parsel No :
Yöntemi 1 2 3 4 5 6 7 8 9 10 11
Damla 76 98 123 107 88 96 127 103 93 119 -
Karık 47 54 71 49 65 57 52 58 63 70 62
5.26.Damla ve karık usulü sulama yöntemlerinin ayrı ayrı örnekleme varyanslarını ( S12
ve S 22 ) ve müşterek varyansı hesaplayınız.
(∑ ) ( )
∑ 𝒙𝟐𝟏 = ∑ x - = (762+982+…..+1192) - = 2376
∑ 𝐱𝟐𝟏
Varyansı; S = = = 264.0
(∑ ) ( )
∑ 𝒙𝟐𝟐 = ∑ x - = (472+542+…..+622) - = 648.9
∑ 𝐱𝟐𝟐 .
Varyansı; S = = = 64.9
∑ ∑ .
S = = = 159.2 SD = n1 + n2 − 2 = 10 + 11 – 2 = 19
S 2 (n1 n2 ) . ( )
S ( X1 X 2 ) = = 5.51 kg/parsel
n1n2
-1
►Elmada kara leke hastalığına karşı kullanılan b r fungus t n 285 mg.g etk l madde çermes
yönetmel k gereğ d r. Aynı t p fungus t üreten b r fabr kadan rastgele alınan 27 kutuluk b r
-1 2
örnekte ortalama etk l madde m ktarı 279 mg.g ve varyansı (S ) se 38.9 olarak bulunmuştur.
5.29.Denemede örnek ortalamasının örnekleme dağılışının standart hatasını ve test
stat st ğ n hesaplayınız.
Bu fabr kadan alınan 27 kutuluk örnekler n oluşturduğu örnekleme dağılışının ortalaması;
= µ = 285 mg.g-1
.
Örnek ortalamasının standart hatası; S = = = 1.20 mg.g-1
SD = n -1 = 27 – 1= 26
Örneğin standart değeri veya test istatistiği;
t= = = - 5.0
.
5.30. Fabr ka yönetmel ğe uygun üret m yapmakta mıdır ? Test ederek sonucu
yorumlayınız.
26 SD’l t- dağılışı
0.99 0.05
0.05
- 2.779 +2.779
Sonuç; - 5.0 t değeri 26 SD’li t- dağılışında % 1 olasılık düzeyinin kritik t-değeri olan -2.779
dan daha küçük olduğu için 27 kutuluk örneğin etkili madde miktarı 285 mg.g-1 olan bir
popülasyona girmesinin, böyle bir popülasyondan çekilmiş şans örneklerinden biri olma
olasılığının % 1 den daha düşük olduğu kabul edilir. Yani, - 5.0 < - 2.779 olduğundan bu
fabrikada elmada kara leke hastalığına karşı üretilen fungusitlerin etkili madde miktarının 285
mg.g-1 olduğu kabul edilemez. Buna göre fabrika yönetmeliğe uygun üretimde
bulunmamaktadır.
►10 adet ayç çeğ çeş d n n yağında ole k as t le l nole k as t oranı arasındak l şk ye a t
korelasyon katsayısı r = - 0.926 bulunmuştur.
5.32. Buna göre ayç çeğ yağında ole k as t le l nole k as t oranı arasında negat f yönde
tam doğrusal l şk olduğu söyleneb l r m ? Test ederek sonucu yorumlayınız.
8 SD’l t- dağılışı
0.99
0.05 0.05
- 3.355 + 3.355
- 6.96
BÖLÜM 5:ÖRNEKLEME DAĞILIŞLARI ve TEST DAĞILIŞLARI
5.l.ÖRNEKLEME DAĞILIŞLARI
Çeşitli tip populasyonlardan çekilen şans örneklerinden hesaplanan X, S, r ve b gibi çeşitli
istatistikler de örnekten örneğe değişiklik gösterirler ve o nedenle yine bir dağılış izlerler. Bu
istatistiklerin izledikleri dağılışa örnekleme dağılışı denir. Bu dağılışlar da teoriktir ve her
biri dağılış ortalaması, varyans ve dağılış tipi ile tanımlanabilirler. Örnekleme dağılışlarının
belirtilen bu parametreleri ve tipi birinci derecede örneğin alındığı esas populasyonun
parametrelerine ve tipine bağlıdır. Burada daha önce tanımlanan bazı istatistiklerin örnekleme
dağılışları açıklanacaktır.
_
5.l.l.Örnek Ortalamalarının (X) Örnekleme Dağılımı
Ortalaması µ ve varyansı 𝜎 olan bir populasyondan herbirinde aynı sayıda varyant bulunan
(n adet) örnekler çekilmiş olsun. Bulunan örnek ortalamaları X1, X2, X3 ... Xk şeklinde
gösterilirse bunlarda örnekten örneğe farklılık göstererek kendine özgü bir dağılış gösterir. Bu
Ortalaması ; ̅ =µ
Varyansı ; ̅ = ve
olmaktadır. Daha öncede belirtildiği gibi örnekleme dağılışı parametreleri asıl dağılışın
şeklinde tanımlanır. Buna örnek ortalamasının "standart hatası" denir ve ortalama ile birlikte x
± S şeklinde gösterilir. S , 𝜎 ̅ 'ın sapmasız bir tahmini olmayıp (n-1) serbestlik derecesine
sahiptir.
Standart sapma ve standart hata aslında eş anlamlıdır. Populasyon ortalamasını x ile
tahminlerken, x'daki hata miktarı hakkında bilgi verirler. Örneklerden elde edilen standart
sapmaların standart hata şeklinde tanımlanması özellikle bu açıdan uygundur.
Örnek ortalamaların gösterdiği örnekleme dağılışının tipi de belirlenmelidir. Yine merkezi
limit teoreminden de anlaşılacağı gibi örneklerin geldiği populasyon ne olursa olsun (normal,
binomiyal poisson v.b.) büyük n değerlerinde dağılış tipi "Normal" dir. O nedenle örnek
ortalamaları ile ilgili bütün olasılık hesaplamalarında standart normal dağılış kullanılabilir.
µ
Zira ; Z = değerleri de ortalaması sıfır, varyansı 1 olan normal dağılış gösterir.
ÖRNEK 5.1 : Fasulyede tane ağırlıkları ortalaması 500 mg ve standart sapması 120 mg olan
normal bir dağılış göstermektedir. Bu populasyondan çekilen 4 er fasulyelik örneklerin
ortalamasının gösterdiği dağılışın ortalaması, varyansı ve standart sapması nedir;
2 14400
X =500 mg ; X2 = 3600 ve X = 3 6 0 0 = 60 mg
n 4 n
ÖRNEK 5.2: 2000 hastaya ait boy uzunluklarının ortalaması 1.70 m ve varyans 4.0 dır. 100
hastalık örneklerin örnekleme dağılışının ortalaması ve varyansı nedir?
𝜎̅ = = = 0.04 ve
Standart Sapması;
𝜎̅= = √0.04 = 0.2 m.
ÖRNEK 5.3 :Varyans bilinmeyen populasyondan çekilmiş 25 varyantlık bir örneğin ortalaması
22.5 cm ve varyans 2.56 dır. Örnek ortalamasının standart hatası nedir?
.
S = = = 0.32 cm dir.
ÖRNEK 5.4
Bir önceki örnekte 4 varyantlık veya danelik fasulyelerin ortalamalarının
X =500 mg ve X
60 mg
olan normal bir dağılış izlediği belirtilmişti. Buna göre rastgele alınan dört fasulyelik bir
örneğin ortalamasının 600 mg dan daha yüksek olması olasılığı nedir veya her birinde 4 adet
fasulye örneklerinin ortalamalarının yüzde kaçı 600 mg dan daha yüksek ortalamaya sahiptir.
Aşağıdaki şekilden de görüldüğü gibi aranan olasılık örnekleme dağılışında 600 mg ile +
arsındaki integral veya olasılıktır.
ÖRNEK 5.5.
Tarla koşullarında yetiştirilmiş patates bitkilerinde bitki başına yaprak alanı ortalaması 800
cm 2 ve standart sapması 90 cm 2 olan normal bir dağılış göstermektedir. Aşağıdaki iki soruyu
yanıtlayalım.
a. Bitkilerin yer aldığı populasyonda bunların yüzde kaçı 750-850 cm 2 arsında yaprak
alanına sahiptir.
Şekildeki alanın toplam alana oranını veya integralini z-tablosundan yaralanarak hesaplayalım.
750 ve 850 cm 2 lik yaprak alanlarının standart değerleri,
750 800 850 800
z1 -0.56 ve z1 +0.56
90 90
EKTABLO I de z dağılışının ortalaması olan sıfır ile 0.56 arasındaki olasılık 0.2123 dır. O
halde,
P (750 xi 850) =0.2123+0.2123=0.4246 (%42.5)
olur. Tarladaki bitkilerin %42.5 unda yaprak alanının 750-850 cm 2 olması beklenir. Yada
herhangi rast gele alınan bir yaprağın alanının bu iki değer arsına düşme olasılığı %42.5 dır.
b. Bitkilerin yer aldığı tarladan dört bitkilik örnekler alındığında ( n 4 ) bu örneklerin
yüzde kaçında ortalama yaprak alanının yine 750-850 cm 2 olması beklenir.
Örnekleme dağılışının ortalaması ve standart sapması,
X =800 cm 2 ve X = 90 45 cm 2
n 4
İstenen olasılık bu kez dört yapraklık örneklerin ortalamalarının örnekleme dağılışındaki
aşağıda verilen şekilde gösterilen olasılıktır.
Örnekleme dağılışındaki ortalama 750 ve 850 cm 2 lik yaprak alanlarının standart değerleri ise
bu kez,
750 800 850 800
z1 -1.11 ve z1 +1.11
45 45
Bunların EKTABLO I de verilen olasılıkları ise 0.3665 dır. Sonuç olarak,
P (75 0 X i 85 0 ) =0.3665+0.3665=0.733 (% 73.3)
dır. Her birisi 4 adet bitki olan sınırsız sayıda örnekler alınıp ortalamaları hesaplanırsa bunların
%73.3 ünün 750-850 cm 2 arasına düşmesi beklenir.
ÖRNEK 5.6.
Yeni doğmuş ivesi kuzularından rast gele alınmış 28 adet kuzunun doğum ağırlıkları (Kg)
aşağıda olduğu gibi bulunmuştur.
Doğum ağırlığı
4.3 5.2 6.2 6.7 5.3 4.9 4.7 5.5 5.3 4.0 4.9 5.2 4.9 5.3
5.4 5.5 3.6 5.8 5.6 5.0 5.2 5.8 6.1 4.9 4.5 4.8 5.4 4.7
dır.
5.1. 2.Örnek Ortalamaları Arasındaki Farklılıklarının Örnekleme Dağılışları
Ortalaması ve varyansı 2 olan bir normal dağılışı populasyondan iki grup örnekler almış
olalım. Birinci grup örneklerde örnek büyüklüğünü n 1 ve ortalamaları ise,
X 11 , X 12 ,... X 1i ,.. X 1 k
olur. Çünkü her iki örnek aynı populasyondan çekilmiştir ve her iki grubun ortalamalarının
beklenen değerleri aynıdır.
Eğer her iki gruptaki örnekler farklı iki populasyondan çekilmiş ise ve bunların ortalamaları
da 1 ve 2 ise bu kez iki gruptaki ortalamaların farklılıklarının gösterdiği örnekleme
dağılışının ortalaması,
( X X ) = E ( X 1 X 2 ) 1 2
1 2
şeklinde tanımlanabilir.
Şimdi farklılıkların gösterdiği örnekleme dağılışının varyansını tanımlamaya çalışalım.
Farklılıkların varyansı (2X1 X 2 ) ile gösterilir. Eğer birinci ve ikinci grup örnekler bağımsız veya
aralarında bir ilişki yoksa farklılıkların varyansı ayrı ayrı varyansların toplamına eşit olur.
(2X X ) = X2 + X2 =
2
2 2 ( n1 n 2 )
1 2 1 2
n1 n2 n1 n 2
1 2
n
Söz konusu varyansın kare kökü örnekleme dağılışının standart sapması veya iki ortalama değer
arasındaki farklılığın standart hatasıdır.
2 ( n1 n2 )
(X 1X2 )
n1n2
2 2
(X X ) 1 2
n
şeklinde yazılabilir.
Birinci ve ikinci grup örneklerin varyansları 12 ve 22 olan farklı iki populasyondan alındığını
varsayarsak bu farklılıkların örnekleme dağılışlarının varyansı,
(2X X ) = X2 + X2 = 1 22
2
1 2 1 2
n1 n2
ve örnek ortalamalarının farkının standart sapması yani farklı populasyonlardan alınmış iki
örnek ortalamasının farklılığının standart hatası ise,
12 22
(X X )
1 2
n1 n2
olur.
ÖRNEK 5.7.
Buğday bitkilerinde ortalama boy 120 cm ve varyansı ise 16 dır. Bu populasyondan rast gele
alınan 20 bitkinin ortalama boyu 124 cm ve 18 bitkinin ortalama boyu ise 130 cm olarak
bulunmuştur. Ortalamalar arası farklılığın gösterdiği dağılışın ortalamasını, varyansını ve
standart hatasını bulalım. Aynı populasyondan çekildiği için,
( X X ) 0
1 2
ve varyansı ise ,
S 2
x 2
1 x 2
2
n1 n 2 2
eşitliğinden bulunur. Burada eşitliğin payında olan değerler birinci ve ikinci örneklerin
ayrılışlarının kareleri toplamı ve payda da yer alan değer ise müşterek serbestlik derecesidir.
Eğer 2 yerine müşterek varyans alınırsa iki ortalama farklılığının standart hatası ,
( ( X 1 X 2 ) ), aşağıdaki eşitlikle tahminlenebilir.
S 2 ( n1 n 2 )
S (X1 X 2 )
n1 n 2
2S 2
S ( X1 X 2 )
n
şeklinde de gösterilebilir. Örnekten bulunan bu standart hatanın serbestlik derecesi ,
n1 n 2 2 veya örnek büyüklüğünün aynı olduğu durumda 2 ( n 1 ) dır.
ÖRNEK 5.8
A ve B yemleri verilen 11'er hayvanda günlük ağırlık artışları gram olarak şöyle bulunmuştur.
S 2
x x 2
1
2
2
= 8472 7748 =811
n1 n2 2 2(11 1)
Azotlu boy değerleri birinci ve azotsuz boy değerleri ise ikinci örnek olsun.
Ortalama boy değerleri,
X 1 1440 /12 120 cm ve X 2 707 / 7 101 cm
Ayrılışların kareleri toplamları,
x 2
1 5032 ve x 2
2 2552
Müşterek varyans,
5032 2552
S2 =446
12 7 2
ve ortalamalar arsı farklılığın standart hatası,
446(12 7) =10.0 cm
S ( X1 X 2 )
12 * 7
ve daha önce bulunan değere oldukça yakındır. Fakat bu standart hatanın serbestlik derecesi
tanımsızdır.
Ortalamalar arasındaki farklılıkların örnekleme dağılışları normal olduğunda çeşitli
olasılıkların hesaplanmasında normal dağılış özelliklerinden ve standart normal dağılış
özelliklerinden yararlanılabilir.
ÖRNEK 5.10
Ampul üreten A fabrikasında ampullerin ortalama dayanma süresi 1400 saat ve standart
sapması ise 200 saattir (varyansı 40.000). B fabrikasında ise ortalama süre 1200 saat ve standart
sapması 100 saat olmaktadır (varyansı 10.000). Her iki firmanın ürettiği ampullerden 125 er
adetlik örnekler aldığımızı varsayalım. A fabrikasında üretilen ampullerin B fabrikasında
üretilenlere göre ,
a. En az 160 saat daha fazla dayanması ve
b. 250 saatten daha fazla dayanması olasılıkları nedir.
Farklılığın örnekleme dağılışının ortalaması,
( X X ) 1 2 = 1400-1200=200 saat
1 2
ve farklılığın standart hatası ise veya örnekleme dağılışının standart sapması ise,
40000 10000 =20 saat
(X 1X2 )
125 125
A fabrikasında üretilen ampullerin 160 ve daha fazla saat dayanması olasılığı aşağıdaki dağılış
eğrisinden de görüldüğü gibi taralı alan veya 160 h ile arasındaki integraldir. Bunu
EKTABLO I den bulalım. 160 saate ait olan standart değer,
160 200
z 2.00
20
EKTABLO I de ortalama 0 olan z değeri ile 2.00 arasındaki olasılık 0.4772 dır. O halde,
P(X A X B ) 160 =0.5000+0.4772=0.9772 (%97.7)
dır. A fabrikasında üretilen ampullerin B fabrikasında üretilenlere göre 160 saatten daha fazla
dayanması şansı %97.7 dır.
A fabrikasında üretilen ampullerin 250 saatten daha fazla dayanması ise bu kez aşağıdaki
şekilde gösterilen alandır.
ÖRNEK 5.11
Bir ülkede çalışma yaşına gelmiş nüfus miktarı 66.510.000 ve işsizlerin sayısı 3.677.500 ise o
ülkede işsizlik oranı,
3677500
p 0.055
66510000
dır. Buna ülkenin veya daha doğrusu populasyonun işsizlik oranı denir ve %5.5 dır. Ülke
bazında bir sayım yapma olanağı yoksa bu oranın tahminlenmesi gerekir. Nitekim 32.500 kişi
sorgulanmış ve bunlardan 1950 adedinin işsiz olduğu görülmüştür. Örnek büyüklüğü 32.500 ve
istenen sonuca sahip kişilerin sayısı ise 1.950 dır. Buna göre örnekten işsizlik oranı,
^ 1950
p 0.06
32500
Hesaplanan bu oran populasyonda istenen sonucun görülmesi olasılığının bir tahminidir ve %
6.0 dır.
Aynı büyüklükte örnekler alınıp bunlarda işsizlik oranı hesaplanmış olsaydı bunların örnekten
örneğe değiştiği veya bir varyasyon gösterdiği izlenir. Buna örnekten hesaplanan oranların
örnekleme dağılışı denir. Burada sorun işte bu örnekleme dağılışının ortalamasının, varyansının
ve dağılış tipinin ne olacağını ortaya koymaktır.
Eğer bir örnek büyüklüğü n ve bu örnekte istenen sonucu gösteren birey sayısı x ise istenen
sonucun örnekteki oranı,
^ x
p
n
ile hesaplanabilir. Eğer bir binomiyal deneme yapılmış ise örneğin oranı daha önce de
açıklandığı gibi,
^ X
p
n
eşitliği ile de hesaplanabilir. Hangi eşitlik kullanılırsa kullanılsın oran örnekten örneğe değişir
ve tanımlanması gereken bir örnekleme dağılışı gösterir.
İstenen sonucun görülme oranının p olduğu bir populasyondan alınan aynı büyülükteki
örneklerde çeşitli örneklerin oranlarını,
^ ^ ^ ^
p1 , p2 ,... pi ,... pk
ile gösterelim. Tıpkı örnek ortalamalarında olduğu gibi sınırsız sayıda oran hesaplamak
mümkündür. İşte bu oranların oluşturduğu populasyona örnek oranlarının populasyonu ve
gösterdiği dağılışa ise örnek oranlarının örnekleme dağılışı denir. Söz konusu populasyonda
ortalama oranı ve varyansı sırası ile
^ ve 2 ^
p p
ile gösterelim ve bunların alacağı değerleri tartışalım.
Bunlar yukarıda da belirtildiği gibi bir örnekten diğerine değiştiği için örnekleme dağılışı
gösterir ve buna örnek oranlarının örnekleme dağılışı denir.
Örnekleme dağılışının ortalaması istenen sonucun populasyonda görülmesi olasılığına eşittir.
=p
^
p
Varyansı ise aşağıda olduğu gibi p olasılığı yanında populasyon büyüklüğü ( N) ve örnek
büyüklüğü ( n ) ile ilişkilidir.
p (1 p ) N n
2= *
N 1
^
p n
^
Bu varyansın kare köküne örnekleme dağılışının standart sapması veya bir oranın ( p )
standart hatası denir.
p (1 p ) N n
^ *
p n N 1
şeklinde daha basit bir eşitlikle tanımlanabilir. Genel olarak populasyonun sınırsız olduğu
varsayılarak bu son eşitlik standart hata olarak kullanılır.
Binomial değişkende istenmeyen sonucun görülmesi olasılığı q 1 p olduğundan standart
sapma eşitliği,
p*q
^
p n olarak tanımlanmıştır.
ÖRNEK 5.12
Tütün bitkilerinde bir virus hastalığına yakalanma olasılığı p 0.25 dır. Bitkilerin oluşturduğu
populasyondan rast gele alınmış 50 bitkilik örneklerde örnek oranlarının örnekleme dağılışının
ortalamasını ve standart sapmasını hesaplayalım. Ortalaması,
= p = 0.25
^
p
ve standart sapması,
0.25 * 0.75
^ 0.06
p 50
ÖRNEK 5.13
Bir ülkede liseyi bitirenlerin oranı 0.25 dır. Populasyondan alınan 100 kişilik örneklerde liseyi
bitirme oranlarının ortalamasını ve standart sapmasını bulalım.
=p=0.25
^
p
0.25 * 0.75
^ 0.04
p 100
Söz konusu olasılık EKTABLO I den yaralanılarak hesaplanabilir. 0.30 oranının standart
değeri,
^
p ^ ^
p p p 0.30 0.25
z =1.25
^ ^ 0.04
p p
EKTABLO I de 1.25 ile sıfır ortalama arasındaki olasılık 0.3944 dır. Buna göre aranan yanıt,
^
P( p 0.30) =0.5000-0.3944=0.1056
dır. O halde 100 varyantlık örneklerde liseyi bitirme oranının 0.30 ve daha yüksek olması
şansının %10.6 olduğunu ileri sürmek mümkündür.
Eğer populasyonun oranı veya istenen sonucun görülmesi olasılığı ( p) bilinmiyorsa
örnekleme dağılışının standart hatası örnekten tahminlenir.
^ ^
p* q
S^
p n
ÖRNEK 5.14
Bir elma çeşidinde 200 elmadan 80 tanesinde elma iç kurdu larvası görülmüştür. Elma iç kurdu
görülen elma oranını ve standart hatasını hesaplayalım. Kurtlu elma oranı,
^ x 80
p = 0.40
n 200
ve standart hatası ise,
0.40 * 0.60 =0.03
S^
p 200
olarak bulunur. Öte yandan 200*0.40=80 > 5 olduğundan 200 elmalık örneklerde kurtlu meyve
oranları normal dağılış gösterir.
ÖRNEK 5.15. Pamukta pembe kurt zararlısına karşı uygulanan bir insektisitin 750 pamuk
bitkisinden 705’inde tamamen pembe kurtları öldürdüğü belirlenmiştir. Bu insektisitin pembe
kurt öldürme oranını ve standart hatasını bulalım. Pembe kurt öldürme oranı ;
^ x
p = = 0.94
n
^ ^
p* q . .
Standart hatası ; S ^
p n
= = 0.0087
ÖRNEK 5.16. Domates salçalarında bir yıllık raf ömrü sonunda bozulma oranının 0.10 olması
yönetmelik gereğidir. Bir salça fabrikasının ürettiği salçalardan rastgele seçilen 550 salça
kutuluk örneklerde örnekleme dağılışının ortalamasını ve standart sapmasını hesaplayalım.
Söz konusu örnekleme dağılışının ortalaması;
. .
= p = 0.10 ve standart sapması;
^ ^
p*q
= = 0.0128
p p n
^
p2 = x 2
n2
olsun.
Aynı binomiyal populasyondan çekilen nı büyüklüklü birinci grup örneklerde istenen olayın
oranları p11, pl2......p1i.......p1k ve yine aynı populasyondan alınan n2 büyüklüklü ikinci grup
örneklerde p21, p22......p2i.......p2k oranları hesaplanmış olsun. Bunlar rasgele ikişerli olarak
eşleştirilip farklılıkları alınırsa, bu farklılıklarda bir örnekleme dağılışı izler. Söz konusu
örnekleme dağılışının ortalaması ve varyansı,
^ ^ ve 2
( p1 p2 ) ^ ^
( p1 p2 )
olarak tanımlanır.
Oranların farklıklarının örnekleme dağılışının ortalaması,
^ ^
^ ^
= E ( p1 p2 ) p p 0
( p1 p 2 )
Çünkü her iki örnek grubu da aynı binomial populasyondan alınmıştır. Örnekleme dağılışının
varyansı ise,
2 ^ ^
= p*q p*q
( p1 p2 ) n1 n2
olarak tanımlamak mümkündür. Bu standart sapma aynı zamanda iki örneğin oranın farkının
standart hatasıdır.
ÖRNEK 5.17.
Bir iki sonuçlu populasyonda istenilen sonucun görülmesi olasılığı 0.84 olduğuna göre bu
populasyondan alınan 120 ve 100 varyantlık örneklerin oranlarının farkının gösterdiği
örnekleme dağılışının ortalamasını, varyansını ve standart hatasını hesaplayalım.
^ ^
= 0.84 0.84 0
( p1 p 2 )
ve varyansı ise,
p1 * q1 p2 * q2
2 ^ ^ =
( p1 p2 ) n1 n2
olur. Burada p1 ve p 2 olasılıkları yukarıda da belirtildiği gibi birinci ve ikinci binomial
populasyonlarda istenen sonucun görülmesi olasılığıdır. Eğer her ikisi de bilinmiyorsa iki
populasyonladan alınan birer örnekle standart hata aşağıdaki eşitlikle tahminlenebilir.
^ ^ ^ ^
p1* q1 p2 * q2
S ^ ^
( p1 p2 ) n1 n2
ÖRNEK 5.18.
A pamuk çeşidinde solgunluk hastalığına yakalanma şansı 0.62 ve B çeşidinde ise 0.76 dır.
İlk çeşitten 120 bitkilik ve ikinci çeşitten ise 60 bitkilik örnek alınıyorsa bunların oranlarının
farkının örnekleme dağılışının ortalaması, varyansı ve standart hatası ne olur?
^ ^
= 0.62 0.76 0.14
( p1 p 2 )
^ ^ 0.005 = 0.07
( p1 p 2 )
ÖRNEK 5.19.
İki farklı ilde A partisine verilen oy oranlarının farklı olup olmadığı araştırılmaktadır. Birinci
ilde rast gele alınan 120 kişiden 45 inin ve ikinci ilde ise yine rastgele alınan 80 kişiden 28 inin
A partisine oy verdiği belirlenmiştir. Her iki ilde A partisine verilen oyların oranını, farkını ve
standart hatasını hesaplayalım.
^ 45 ^ 28
p1 = 0.38 ve p2 = 0.35
120 80
Farklılık,
^ ^
p1 _ p2 =0.38-0.35=0.03
ÖRNEK 5.20. Bir elma çeşitinde 200 elmadan 80'inde ve ikinci bir çeşitte ise 180 elmanın
120'sinde elma içi kurdu görülmüştür. Elma iç kurdu oranlarını ve farklılığının standart hatasını
bulunuz.
^ ^
p1 = = 0.40 ve p2 = = 0.67
^ ^ ^ ^
p1* q1 p2 * q2 . . . .
S ^ ^ = + = 0.49
( p1 p2 ) n1 n2
(0.40-0.67) ± 0.049
ÖRNEK 5.21.
Aynı populasyondan alınan 200 kişilik bir örnekte 12 kişinin ve 150 kişilik bir örnekte ise 5
kişinin solak olduğu görülmüştür. Her iki örnekte solakların oranını, farkını ve bu farklılığın
standart hatasını hesaplayalım.
^ 12 ^ 5
p1 = 0.06 ve p2 = 0.03
200 150
Bu iki örnekteki oranların farkı,
^ ^
p1 _ p2 =0.06-0.03=0.03
gösterir. Bunun ortalaması r = ve varyans ise r2 = (l- 2)/n dir. Varyansdaki (l- 2)
miktarı, X ve Y değişkenlerinin regresyondan kaynaklanmayan varyansın oransal miktarıdır.
r
Varyansı ve bunun kare kökü olan standart sapması yani korelasyon katsayısının standart hatası
ise aşağıda olduğu gibi tanımlanır.
(1 2 ) (1 2 )
2
r ve r
n n
Eşitliklerin payında bulunan 1 2 değeri doğrusal ilişkiden kaynaklanmayan veya çok genel
olarak hatadan kaynaklanan varyans miktarını temsil eder.
Pratikte çoğu zaman populasyonun korelasyon katsayısını bilmek veya tanımlamak
olanaksızdır. Bunun için rast gele seçilen n adet veri çiftine sahip olan bir örnekte korelasyon
(1 r 2 )
Sr
( n 2)
Eşitliğin paydasında yer alan ( n 2) değerine söz konusu standart hatanın serbestlik derecesi
denir ve daha önce de açıklandığı gibi SD ( n 2) şeklinde yazılır.
ÖRNEK 5.22.
Bir buğday tarlasından rastgele seçilmiş 50 adet bitkinin boyları ve sahip oldukları kardeş
sayıları belirlendikten sonra ikisi arasındaki korelasyon katsayısının r 0.34 olduğu
belirlenmiştir. Bunun standart hatasını ve serbestlik derecesini hesaplayalım.
(1 (0.342 )
Sr =0.14
(50 2)
ve SD=50-2=48 dır.
ÖRNEK 5.23.
On iki adet traktörün yaşı ve bakım masrafları arasındaki korelasyon katsayısı r 0.875 dır.
Populasyonun korelasyon katsayısının sıfır olduğunu ( 0 ) kabul ederek standart hatasını
ve serbestlik derecesini bulalım.
(1 (0.8752 )
Sr =0.153 ve SD=10
(12 2)
Korelasyon katsayısı olan populasyondan veri çifti sayısı n 1 ve n 2 olan iki grup örnek
(2z z
1 2)
olan normal bir örnekleme dağılış gösterir. Bu değerler aşağıda olduğu gibi
tanımlanır.
( z z ) = E( z1 z2 ) E( z1) E( z2 ) z z 0
1 2
(2z z ) = z2 + z2 =
1
1
1 2 1 2
(n1 3) (n2 3)
Standart sapma veya iki z değeri farkının standart hatası ise,
1 1
( z z )
1 2
n1 3 n2 3
Çoğu zaman söz konusu farklılığın standart hatası örneklerden tahminlenir. Bunun için farklı
iki pupulasyonda örnekler alınarak korelasyon katsayıları, bunların z değerleri ve bu değerlerin
farklılıkları hesaplandıktan sonra standart hata aşağıdaki eşştilikten tahminlenir.
1 1
S( z1z2 )
n1 3 n2 3
Söz konusu standart hatanın serbestlik derecesi ise n1 3 n2 3 dır. Sonuç olarak farklılığı
ve standart hatasını,
(z1 z2 ) S(z1z2 )
şeklinde birlikte gösterebiliriz.
ÖRNEK: 5.24.
12 bitkide bitki boyu ile başak uzunluğu arasında r 0.88 ve yine aynı populasyondan alınmış
başka bir 18 bitkilik örnekte ise aynı iki değişken için r 0.96 olarak bulunmuştur. Z değerleri
arası farklılığı ve standart sapmasını bulalım.
r1 0 .8 8 için z 1 1 .3 7 5 8 ( EKTABLO II den)
dır. Söz konusu farklılık ve standart hatası örneklerin alındıkları iki populasyonun korelasyon
katsayılarını ( 1 ve 2 ) karşılaştırmada ve bunlarla ilgili çeşitli hipotez testlerinde kullanılır.
ÖRNEK 5.25.
Aynı dersi alan kız öğrencilerde sözlü ve yazılı sınavlar arasındaki korelasyon katsayısı 0.60 ve
erkek öğrencilerde ise 0.50 dır. Eğer 40 adet kız ve 35 adet erkek olan şans örnekleri alınırsa
kızlara ait korelasyonun erkeklere ait korelasyondan daha düşük olma şansı nedir.
r1 0.60 için z1 0.69 ( EKTABLO II den)
r2 0.50 için z2 0.55 (EKTABLOII den)
Olduğundan farklılık,
1 1
S( z1z2 ) =0.24
40 3 35 3
dır. Kızlarda korelasyonun erkeklerden daha düşük olması için farkın sıfırın altında olması
gerekir. O nedenle söz konusu olasılık aşağıdaki şekilde verilen taralı alan yada sıfır ile eksi
sonsuz arasındaki olasılık veya sıfır olan farkın eklemeli olasılığıdır. Bunu EKTABLO I den
yararlanarak bulalım. Sıfır farkının standart değeri,
0 0.14
z 0.58
0.24
İlgili tabloda 0.58 ile sıfır z değeri arasındaki olasılık 0.2190 dır. O halde aranan yanıt 0.5000-
0.2190=0.281 (%28.1) dır. Yani kız öğrencilerdeki korelasyon katsayısının erkeklere göre daha
düşük olma şansı %28 dır.
2
2
yx
b
x i2
ve standart sapması veya bir regresyon katsayısının standart hatası ise,
yx
b
x i
2
dır. Eğer her iki değişken de normal ise örnekleme dağılışının tipi de normal olur.
Burada payda yer alan varyans populasyonda regresyondan ayrılışların veya hataların kareleri
ortalaması ve diğer terim ise bağımsız değişkenin ayrılışlarının kareleri toplamıdır. Şüphesiz
populasyonlarda hata kareleri ortalaması ve bağımsız değişkene ait kareleri toplamı
bilinmediğinden regresyon katsayılarının varyans ve standart hataları aşağıdaki eşitliklerle
örneklerden tahminlenirler.
S yx2 S yx
S
2
ve S b
x x
b 2 2
i i
Standart hatanın serbestlik derecesi (n 2) dır. Daha önce üçüncü bölümde de açıklandığı gibi
eşitliklerin payında yer alan varyans örnekteki ayrılışların yani hataların kareleri ortalaması ve
bir bakıma populasyonun ayrılışlarının kareleri ortalamasının tahminidir.
( xi yi ) 2
y 2
S 2
yx =
i
x 2
i
( n 2)
ÖRNEK 5.25.
Dokuz adet toprak örneğinin tuz oranı ( Y ) ile elektriksel geçirgenliği ( X ) arasında önemli bir
doğrusal ilişki olduğu belirlenmiş ve
x y 284 , x
i i
2
i 576 ; y 2
i 144 , b 0.49
olarak bulunmuştu. Söz konusu katsayının standart hatasını hesaplayarak serbestlik derecesini
belirleyelim. Hata veya regresyondan ayrılışların kareleri ortalaması,
(284)2
144
2
S yx = 576 0.57 ve S 0.57 0.75
(9 2)
yx
ve serbestlik derecesi yedidir. Sonuç olarak regresyon katsayısı standart hatası ile birlikte
yazılabilir.
0.49 0.03
Bir sonraki bölümde de görüleceği gibi örneklerden elde edilen regresyon katsayısı ve standart
hatası kullanılarak populasyona ait regresyon katsayısının ( ) büyüklüğü tahminlenebilir ve
bu parametre ile ilgili çeşitli hipotezler ileri sürülerek test edilebilir.
Aynı veya farklı populasyondan alınmış iki örneğin regresyon katsayılarının farkını ve bu farka
ait standart hata kullanılarak bu kez iki farklı populasyonun regresyon katsayıları ile farklılığa
ait tahminlemeler yapılabilir ve çeşitli hipotezler test edilebilir. Bunun için de regresyon
katsayıları arasındaki farklılığın örnekleme dağılışını tanımlamak gerekir. İki farklı örneğe ait
regresyon katsayılarının farkının gösterdiği dağılışın ortalaması ve varyansı aşağıda olduğu
gibidir.
(2b b ) b2 b2
1 2 1 2
5.2.TEST DAĞILIMLARI
X
zi i
standart değerlerinin, ortalaması sıfır ve varyansı 1 olan normal dağılış gösterdiğini ve buna
Standart Normal Dağılış denildiğini bir önceki bölümde görmüştük. Söz konusu bu dağılımla
herhangi bir varyantın belirtilen bir populasyona girme veya girmeme olasılığı
saptanabiliyordu. Standart normal dağılışın bu özelliğinden, örnekleme dağılışı tanımlanabilen
ve normal olan istatistikler için de yararlanabiliriz. Örneğin örnek ortalamaları, ortalaması ve
standart sapması,
X ve X
n
olan normal bir örnekleme dağılışı izlemekteydi. O halde çok sayıdaki örnek ortalamalarının
aşağıdaki ,
Xi X
zi
X
değerleri yada oranları da aynı şekilde bir standart normal dağılış gösterir. Ancak buradaki z i
değeri örnek ortalamasının ( X i ) standart değeridir. Söz konusu eşitlikle ve standart normal
dağılışın olasılık özelliklerinden yararlanarak bir örnek ortalamasının söz konusu örnekleme
dağılımına girip giremeyeceğini ve bunun sonucu olarak çekildiği populasyonu temsil edip
etmediğini ortaya koyabiliriz.
Benzer şekilde büyük n değerlerinde binomial dağılışta oranların da ortalaması ve standart
sapması aşağıda verilen bir normal örnekleme dağılışına sahip olduğunu görmüştük;
p
^ ve ^
pq
p p n
O halde çok sayıda P değerlerinin;
^
pi ^
p
zi
^
p
oranı ile bulunan zi değerleri de ortalaması sıfır ve standart sapması 1 olan normal dağılış izler.
Yine bu z değerini kullanarak istenilen olayın veya sonucun görülme oranının örnekleme
dağılışına girip girmediğini veya girme olasılığını ortaya koyabiliriz. Standart normal dağılışın
bu amaçla test dağılışı olarak kullanılmasını bazı örneklerle görelim.
ÖRNEK 5.26.
Bir fabrika ürettiği ampullerin ortalama ömrünün l500 saat ve standart sapmasının l5 saat
olduğunu ileri sürmektedir. Bu fabrikanın ürettiği ve şansa bağlı olarak seçilen 36 ampulde
ortalama ömür l492 saat olarak bulunmuştur. Fabrikanın iddiası doğru mudur?
Sorunun yanıtlanabilmesi için, 36 ampullük örneğin; =l500 saat ve =l5 saat olan
populasyondan çekilen şans örneklerinden biri olma olasılığını hesaplamak ve ardından bu
olasılığı tartışmak gerekir. Bu fabrikada üretilen n36 ampullük sonsuz sayıda alınan
örneklerin oluşturduğu örnekleme dağılışının
15
Standart Sapması: X = 2.5 saat
n 36
Örneğimizin ortalaması olan 1492 saat değerinin ,standart değeri ise
X i X 1492 1500
zi = = - 3.2
X 2.5
EK TABLO 1' den de görüldüğü gibi, ortalama ile veya z =0 ile -3.20 arasındaki olasılık 0.4993
dür. Bunun solundaki alan ise 0.50-0.4993= 0.0007 veya % 0.07 dır. O halde ortalamanın
solunda n =36'lık örneğimiz kadar veya daha fazla sapma gösteren örneklerin oransal miktarı
% 0.07 dır. Bu aynı zamanda çekilen n =36'lık örneğin bu populasyona girme olasılığıdır.
Şüphesiz düşük bir olasılıktır. O nedenle bu örneğin = 1500 saat ve =15 saat olan
populasyonu temsil etmesi söz konusu olamaz. Fabrikanın iddiası doğru değildir. Öte yandan
standart normal dağılışta daha öncede belirtildiği gibi -1.96 ve +1.96 değerleri %95 olasılığı
sınırlandıran değerlerdir. Örnekten elde edilen -3.2 standart değeri bu sınırlandırıcı değerlerle
karşılaştırıldığında örneğimizin söz konusu ampul populasyonuna girme olasılığının %5 in
altında olduğu söylenebilir. Bu da düşük bir olasılıktır. O nedenle yine fabrikanın iddiasının
doğru olduğunu söyleyemeyiz.
ÖRNEK 5.27.
Bir fabrika ürettiği ilacın ülser hastalığını tedavi etme oranının 0.62 olduğunu ileri sürmektedir.
100 hastalık bir örnekte iyileşme oranı 0.52 bulunmuştur. Fabrikanın iddiası doğru mudur?
Bu sorunun yanıtlanması için bu ilacın uygulandığı n = 100 hastalık örneğin, tedavi etme oranı
0.62 olan populasyona girme olasılığının hesaplanması gerekir. Bu ilacın uygulandığı n = 100
hastalık sonsuz sayıda alınan örneklerin oluşturduğu örnekleme dağılışının ortalaması ve
standart sapması ( yani oranın standart hatası);
0.62*0.38
p 0.62
^ ve ^ =0.049
p p 100
İlaç alan hastaların yer aldığı populasyondan alınan örneğin iyileşme oranı,
^
pi 0.52
ve standart değeri ise,
^
pi ^ 0.52 0.62
p
zi = = - 2.05
^ 0.049
p
dır. Yine EKTABLO I'deki değerlerden de anlaşılacağı gibi örneğin bu populasyona girme
olasılığı % 2.02 dır. Bu da düşük bir olasılıktır. İlaçların iyileştirme oranı 0.62 den daha
düşüktür.
0.4798 (%47.98)
- 2.05 + 2.05
EK TABLO 1 den görüldüğü g b Z= 0 le -2.05 arasındak olasılık, P (- 2.05 < z < 0) = 0.4798
d r. Bunun solunda kalan alanın olasılığı, P (z < - 2.05) = 0.50 – 0.4798 = 0.0202 (% 2.02) d r.
Bu % 2.02’l k olasılık aynı zamanda n=100 hastalık örneğ n ve daha fazla sapma gösteren
örnekler n söz konusu populasyona yan , ortalama tedav etme oranı 0.62 olan populasyona
g rme olasılığıdır. Kuşkusuz bu olasılık da düşük b r olasılıktır. Aynı zamanda bu olasılık % 5
den de düşüktür. Bu nedenle, n=100 hastalık örneğ n ortalama y leşt rme oranı 0.62 olan b r
populasyonu tems l etmes mümkün değ ld r. Fabr kanın dd ası doğru değ ld r.
ÖRNEK 5.28.
İki firmanın ürettiği meyve sularında kuru madde oranının aynı olup olmadığı araştırılmaktadır.
Birinci firmada kuru madde miktarının standart sapması 2.5 gr/l ve ikinci firmada ise 3.2 g/l
olduğu bilinmektedir. Birinci firmadan rast gele alınan 136 şişelik örnekte kuru madde miktarı
17.2 g/l ve ikinci firmadan alınan 125 şişelik örnekte ise 18.6 g/l bulunmuştur. Her iki firmanın
ürettiği sularda kuru madde miktarı aynı mıdır?
Sorunun çözümü için iki örnek ortalaması arasındaki farklılığın örnekleme dağılışının ve
standart normal dağılışın özellikleri kullanılır. Birinci ve ikinci firmaların ortalama kuru madde
miktarlarını,
X 1 17.2 g/l ve X 1 18.6 g/l
Farklılığı ise,
X 1 X 2 1 7 .2 1 8 .6 1.4 g/l
Birinci firmadan alınan 136 şişelik ve ikinci firmadan alınan 125 şişelik örneklerin
farklılıklarının gösterdiği örnekleme dağılışının ortalaması ve standart sapması aşağıda olduğu
gibi tanımlanır.
( X X ) 1 2 0 ( her iki firmada da kuru madde miktarı aynıdır)
1 2
12 2.52 3.22
22
(X X ) = =0.36 g/l
1 2
n1 n2 136 125
sıfır olan bir populasyona girme olasılığının %1 in çok altında olduğunu görebiliriz. Firmaların
ürettiği meyve sularında kuru madde miktarları farklıdır. İkinci firmanın ürettiği meyve
sularında kuru madde miktarı daha yüksektir
PROBLEM 5.29.
Ergin yaşa gelmiş erkeklerde boy 175 cm ve standart sapma 6.4 cm dır( varyansı 41). Ergin
kadınlarda ise ortalama boy 165 cm ve standart sapması 6.4 cm dır (varyansı 41). Birinci
populasyon erkeklerin boyu ve ikinci populasyon ise kadınların boyu olsun. Her iki
populasyondan da 50 şer kişi seçilmiş olsun.
a. İki cinsiyet populasyonundan alınan örneklerin X1 X 2 ortalama farklılığının örnekleme
dağılışının ortalaması,
( X X ) 1 2 =175-165=10 cm
1 2
12 22
(X X ) = 4 1 4 1 =1.28 cm
1 2
n1 n2 50 50
c. Erkeklerin boylarının kadınların boylarından 12 cm daha uzun olması şansı nedir?. Yani,
P ( X 1 X 2 ) 12
EKTABLO I de 0 z değeri ile 1.56 değeri arsındaki olasılık 0.4406 dır. Buna göre,
P ( X 1 X 2 ) 12 =0.5000-0.4406=0.0594 (%5.9)
0.4406 (%44.06)
- 1.56 + 1.56
olduğu ileri sürülmüştü. Bu oranda yer alan paydadaki değer örnekleme dağılışının standart
sapması veya örnek ortalamasının standart hatası olup yine yukarıda da belirtildiği gibi örneğin
çekildiği populasyonun standart sapması kullanılarak,
X
n
eşitliği ile bulunmuştu. Eğer örnek küçük veya varyant sayısı 30 dan düşük ise ve üstelik
populasyonun varyansı veya standart sapması bilinmiyorsa bu kez örnekten tahminlenmesi
gerekir. Daha önce de belirtildiği gibi örneğin varyansı (S 2 ) populasyon varyansının bir tahmini
olduğundan örnekleme dağılışının standart sapması ( X ) aşağıdaki eşitlikle örnekten
tahminlenir.
S
SX
n
Söz konusu standart hatanın serbestlik derecesi yine daha önce de belirtildiği gibi n1
dır.Populasyon varyasnının bilinmediği ve standart sapmanın örneklerden tahminlendiği
durumlarda,
Xi X
SX
oranı standart normal dağılış göstermez ve o nedenle standart değeri de z i değildir. Bu özel
durumda yukarıdaki oranın t-dağılışı veya Student’in t-dağılışını izlediği söylenir ve söz
konusu oran da,
Xi X
t
SX
şeklinde tanımlanır.
Varyansı bilinmeyen bir populasyondan çekilen ve varyant sayısı (n) olan sınırsız sayıda
örnekler alıp ortalamaları hesaplanıp yukarıdaki eşitlikten t değerleri hesaplanırsa yine sınırsız
sayıda t değerleri hesaplamak mümkün olur. Hesaplanan bu t değerleri eksi ve artı sonsuz
arasında olabilir. Örneğin örnek ortalaması örnekleme dağılışının ortalamasından büyükse t
değeri artı işaretli aksi durumda ise eksi işaretli olur. Öte yandan t değerlerinin ortalaması tıpkı
z değerleri gibi sıfırdır. Ancak z değerlerinin veya standart normal dağılışın varyansı 1 olduğu
v
halde t değerlerinin varyansı dır. Yani,
v2
t 0 ( v 1)
v
t2 (v 2)
v2
Bu eşitliklerde kullanılan v değeri o istatistiğin veya t değerinin serbestlik derecesidir. Örneğin
örnek ortalamasına ait SX standart hatasına ait serbestlik derecesi v n 1 dır. Yirmi varyantlık
bir örnekleme yapılmış ise serbestlik derecesi,
v n 1 20 1 19
olur.
Yukarıda belirtilen şekilde hesaplanan , ortalaması sıfır ve varyansı,
v
t2
v2
olan t değerleri veya oranların olasılık yoğunluk fonksiyonu aşağıda verilmiştir.
v 1
( )
2 t 2 ( v 1)
f (t ) (1 ) 2
v v
( )* v
2
dır. Söz konusu yoğunluk fonksiyonu t değerlerinin olasılıklarının tanımlanmasında kullanılan
bir yoğunluk fonksiyonudur. Zira eksi ve artı sonsuz arasındaki integrali bire eşittir. Küçük
örneklere ait t değerlerinin olasılıklarını tanımlamaya yarayan bu yoğunluk fonksiyonu ilk kez
W.S.Gosset (1908) tarafından önerilmiştir. Çalıştığı firma bu bilim adamının çalışmasını kendi
adı ile yayınlamasını istemediğinden W.S.Gosset araştırmasını Student takma adı ile
yayınlamıştır. Daha sonra çok sayıda bilim adamı ve özellikle Fisher bu fonksiyonun pratikte
kullanılması yönünde önemli katkılarda bulunmuştur. Ama t oranlarının dağılışı Student’in t
-dağılışı veya çok yaygın olarak t -dağılışı olarak isimlendirilmiştir.
Dağılış sıfır etrafında simetriktir. v arttıkça dağılış dikleşmektedir. Daha öncede belirtildiği
gibi v veya n arttıkça t dağılışı z dağılışına yaklaşır. n>30 olduğu durumda bunların yaklaşık
olarak eşit olduğu kabul edilebilir. Ancak bütün normal dağılımları karakterize eden tek bir z
dağılışı olduğu halde örnek büyüklüğüne veya her serbestlik derecesine ait ayrı bir t-dağılışı
vardır. Çok sayıda serbestlik derecelerine ait t-dağılışlarının çeşitli t-değerlerinin olasılıkları
EK TABLO 3'de verilmiştir. Tablodan da görüldüğü gibi ilk sütunda yukarıdan aşağı doğru
serbestlik dereceleri ( v ) verilmiştir. İlk sırada ise 0.20,0.10,0.05,0.01 gibi olasılıklar yer
almıştır. Söz konusu olasılıklar yukarıdaki şekilden de görüldüğü gibi dağılış eğrisinin iki
kuyruğunda yer alan iki olasılığın toplamını göstermektedir. Tablonun ortasında yer alan
değerler ise bu olasılıkların sınırlarını belirleyen t değerleridir. Örneğin t-dağılışı tablosu veya
kısaca t tablosu adı verilen bu tabloda 8 serbestlik dereceli sıraya bakalım.
Tablodan da görüldüğü gibi 0.05 sütunu ile 8 sırasının kesim noktasında bulunan değer 2.306
dır.
Serbestlik derecesi 8 olan t değerlerinin %95 i -2.306 ile 2.306 arasında %5 ise bunun
dışındadır. Ama %2.5 kadarı 2.306 dan daha büyük ve %2.5 kadarı ise -2.306 dan daha
düşüktür. %5 olasılığı yukarıdaki şekilde de gösterilen dağılışın eğrisinin iki kuyruk kısmında
yer alan olasılıkların toplamını göstermektedir.
Bu kez 8 serbestlik dereceli t değerlerinin %99 unun hangi iki t değeri arasında olduğunu
görelim. Sekiz serbestlik dereceli sırada 0.01 olasılıkla kesim noktasında görülen t değeri
t 3.355 dır. Yani aşağıdaki şekilden de görüleceği gibi bu serbestlik derecelerindeki t
değerlerinin %99 u -3.355 ve +3.355 arasında %1 i ise bunun dışında bulunur.
ÖRNEK 5.30.
Serbestlik derecesi 5 olan t değerlerinin %5 i hangi iki t değerinin dışında yer alır. Ya da
serbestlik derecesi 5 olan örneklerde t değerlerinin %95 i hangi iki t değeri arasında yer alır.
Bunu yanıtlamak için EKTABLO III de serbestlik derecesi 5 olan sıra ile yukarıdaki 0.05
olasılığı kesiştirilir. Tablodan da görüldüğü gibi bu kesim noktasındaki değer 2.571 dır. O halde
t değerlerinin %95 i -2.571 ve +2.571 arasında %5 i ise bunun dışında yer alır.
Student’in t dağılış eğrisi standart normalin dağılış eğrisine bakarak biraz daha yatıktır. Ancak
serbestlik derecesi ( v ) daha doğrusu örnek büyüklüğü (n) arttıkça dağılış dikleşir ve ortalaması
sıfır ve varyansı 1 olan standart normal dağılış eğrisine yaklaşır (Şekil 7.4).Pratikte genel olarak
büyük örneklerde ( n 30) her iki eğrinin de çakıştığı kabul edilerek çeşitli olasılık
tanımlamalarında standart normal dağılış kullanılabilir.
Şekil 5.4 : t-dağılışında serbestlik derecesi (v) arttıkça standart normal dağılışa yaklaşma
dır. EKTABLO III de 24 serbestlik dereceli sırada işaretine bakmaksızın 2.5 değerinin yerini
bularak yukarı dik çıkalım.
24 SD’ t - dağılışı
% 1.75
+ 2.5
- 2.5 + 2.5
Görüldüğü gibi örneğe ait t 2.5 değeri %2 ile %1 arasında bir olasılığı göstermektedir.
Yaklaşık %1.75 dır. Bu olasılık ortalaması 465 g olan ekmeklerin ortalaması 475 g olan
populasyona girme olasılığı veya onu temsil etme olasılığıdır. Bu 25 ekmeklik örneğimiz ve
yine aynı sayıda ekmek içeren örneklerin %1.75 i 2.5 ve daha yüksek t değerlerine sahiptir.
Görüldüğü gibi bu olasılık çok düşüktür ve alınan örneğin populasyonu temsil etmediği ve
fırının kurallara uymadığı yani daha düşük ağırlıkta ekmek ürettiği kabul edilir.
ÖRNEK 5.32.
Daha önce 7.11 nolu örnekte azot uygulanan 12 bitkide ortalama boyun X 1 1 20 cm,
uygulanmayan 7 bitkide ise X 2 10 1 cm ve iki ortalama değer arsındaki farklılığın standart
hatasının,
S( X1 X2 ) =10.0 cm
olduğu belirtilmişti. Söz konusu farklılığın serbestlik derecesi n1 n 2 1 12 7 2 17 dır.
Her iki örneğin alındığı populasyonların bitki boyu değerleri eşit kabul edilebilir mi?
İki grup örneklerin ortalamaları arasındaki farklılığın örnekleme dağılışının ortalaması,
( X X ) 1 2 0 (Boyları aynıdır)
1 2
Örnekleme dağılışın standart sapması ise tahminlenmiştir ve ayrıca her iki örnek de küçüktür.
O halde soruyu yanıtlamak için t dağılışından yararlanmak gerekir. Brirnci ve ikinci örnek
ortalamaları arasındaki farklılığın standart değeri yani t değeri aşağıda olduğu gibi bulunur.
( X 1 X 2 ) ( X1 X 2 ) (120 101) 0
t =+1.89
S ( X1 X 2 ) 10.0
Söz konusu t değerinin de serbestlik derecesi 17 dır. EK TABLO III den de görüldüğü gibi l7
serbestlik dereceli iki örnek ortalaması arası farklılığın, 1 2 0 olan örnekleme dağılışına
girme olasılığı % 7-8 civarında veya oldukça yüksektir. O nedenle iki örnek yada azot
uygulaması arasındaki 19 cm lik tesadüflükten kaynakladığını ileri sürebiliriz. O nedenle söz
konusu ortalaması sıfır olan örnekleme dağılışına girdiği söylenebilir. Yani azot uygulaması
ve uygulanmaması eşit bitki boyu değeri vermektedir.
2
x 2
i
(n 1) Si2
2 2
Öte yandan eşitliğin payında yer alan n1 değeri örneğin varyansının serbestlik derecesi
olduğundan,
v n 1
olarak alırsak khi-kare şans değişkeninin varyantlarını,
2
x 2
i
(n 1)Si2
=
vS i2
şeklinde de yazmak mümkündür.
2 2 2
Khi-kare şans değişkeninin ortalaması onun serbestlik derecesi ( v ) ve varyansı ise serbestlik
derecesinin iki katıdır ( 2v ) dır.
E( 2 ) 2 v ve 2 2 2v
Sonuç olarak khi-kare şans değişkeni 0 ile + arasında değer alan, ortalaması v ve varyansı
2v olan sürekli bir şans değişkenidir. Tek bir parametresi vardır, buda onun serbestlik
derecesidir. Bu bakımdan t dağılışına benzemektedir.
Bir khi-kare olasılığını tanımlamak için şüphesiz v 0ve 0 2 olmalıdır.
ÖRNEK 5.33.
Ortalaması v 8 ve varyansı 16 dır. Dağılış 0 ile artı sonsuz arasındaki bütün khi-kare
değerlerini kapsar. Öte yandan z ve t dağılışları simetrik olduğu halde khi-kare dağılışı sağa
veya pozitif yana eğikdir. Dağılış eğrisi sekiz serbestlik dereceli khi-kare değerleri ile ilgili
bütün olasılıkların tanımlanmasında kullanılabilir.
ÖRNEK 5.34
Sekiz serbestlik dereceli khi-kare dağılışında khi-kare değerlerinin yüzde kaçı 20.09 dan daha
büyüktür. Herhangi bir khi-kare değerinin 20.09 dan daha büyük olması şansı nedir.
Khi-kare dağılış grafiğinden de görüldüğü gibi 20.09 dan daha düşük khi-karelerin oranı %99
dır.
Ortalaması ve varyansı bilinen normal populasyondan alınan 8 serbestlik dereceli örneklerin
khi-kare değerleri hesaplanırsa bunların %1 i 20.09 dan daha yüksek ve %99 u ise daha düşük
khi-kare değerleri gösterirler. Sekiz serbestlik dereceli herhangi bir şans örneğinin 20.09 dan
daha yüksek bir değer alması şansı da %1 dır. Burada örnek olarak alınan 20.09 khi-kare değeri
serbestlik derecesi 8 olan örneklerde khi-kare dağılışını %99:%1 olacak şekilde ikiye ayıran
değerdir ve o nedenle kritik bir değer olarak düşünülür.
Bu kez yine aynı örnekte 15.51 den daha yüksek khi-kare değerlerinin oranını bulalım.
Şekilden de görüldüğü gibi sekiz serbestlik dereceli khi-kare dağılışında 2 15.51 değeri
dağılışı %95:%5 olmak üzere iki kısma ayırmaktadır. O nedenle bu da başka bir kritik değerdir.
Herhangi bir khi-kare değerinin 15.51 den daha yüksek olması şansı %5 dır.
Çoğu khi-kare testlerinde uygun serbestlik derecelerindeki khi-kare değerlerinin yukarıdaki
örneklerde olduğu gibi verilen bir khi-kare değerinden daha yüksek olma olasılıkları
kullanılmaktadır. İntegral alma sorununu ortadan kaldırmak için çeşitli serbestlik derecelerinde
çeşitli daha fazla olasılıkları sınırlandıran khi-kare değerleri EKTABLO IV de verilmiştir.
Tabloda ilk sütunda serbestlik dereceleri, ilk sırada ise 0.995 den yani yaklaşık 1 den
başlayarak 0.005 e kadar daha fazla olasılıklar ve tablonun orta kısmında ise bu olasılıkları
sınırlandıran khi-kare değerleri yer alır.
Örneğin sekiz serbestlik dereceli sıra aşağı da olduğu gibi görülür.
Görüldüğü gibi 15.51 den daha yüksek khi-kare elde etme olasılığı %5 ve daha düşük bir khi-
kare elde etme olasılığı ise %95 dır. 20.09 dan daha yüksek khi-kare elde etme olasılığı %1 ve
21.96 dan daha yüksek khi-kare değeri elde etme olasılığın ise %0.005 dır.
Yukarıda da belirtildiği gibi khi-kare dağılış pozitif veya sağa eğik bir dağılıştır. Ancak örnek
büyüklüğü ve buna bağlı olarak serbestlik derecesi arttıkça khi-kare dağılışı da normale
yaklaşır. Aşağıdaki şekilde serbestlik derecesi arttıkça dağılışın nasıl normale yaklaştığı
görülmektedir.
Öte yandan X şans değişkeni ortalaması ve varyansı 2 olan normal değişken ise buna ait
Z değerinin karesi de bir serbestlik dereceli khi-kare dağılışı gösterir.
X
2 Z 2 =[ ]2
2. X 1 , X 2 ,... X i ,... X k bağımsız normal değişkenleri i ortalaması ve i2 varyanslarına sahip
olsunlar.Bunların standart değerlerinin toplamı da khi-kare dağılışı gösterir.
k
( X i i )2
2
i 1 i2
(n 1)S 2 n
( X i )2
2
2 i 1 2
Bu khi-karenin serbestlik derecesi ise v n 1 dır. Bu eşitlik çok yaygın olarak kullanılan bir
khi-kare dağılış özelliğidir.
5.Varyantları çeşitli sayıda sınıflara, örneğin k adet sınıfa, ayrılmış şans örneklerinde f
gözlenen mutlak frekans ve f ' beklenen veya teorik mutlak frekanslar ise aşağıdaki eşitlik
de bir khi-kare dağılışı gösterir.
k ( f j f j' ) 2
2
j 1 fj
Burada k = sınıf sayısıdır. Söz konusu eşitlik daha sonra da görüleceği gibi iki mutlak ferkans
arasındaki farklılığın sıfır olup olmadığını veya şanstan kaynaklanıp kaynaklanmadığını test
etmede kullanılır.
ÖRNEK 5.35.
On bir serbestlik dereceli bir örneğin khi-kare değeri 2 = 23.32 olarak bulunmuştur. Söz
konusu örneğin 11 serbestlik dereceli veya içinde 12 adet varyant bulunan bir populasyondan
çekilme olasılığı nedir? EKTABLO IV den de görüldüğü gibi % 2.5 ve % 1.0 arasında olup
takriben %l.75'dir. Eğer % 5 düzeyi kritik düzey olarak alınırsa, bu örneğin böyle bir
populasyona temsil etmediği veya böyle bir populasyondan çekilmediği sonucu ortaya çıkar.
Öte yandan v30 örneklerin 2 değerlerinin √22 değerleri ortalaması √2v-l ve varyans l
olan normal bir dağılış izler. O nedenle Khi-kare tablolarında 30 veya daha fazla serbestlik
dereceli örneklerin 2 olasılıkları verilmez. Bu gibi durumlarda t-dağılışından yararlanılır. Z2
değerleri (Xi-µ)/ nın karesi alınarak bulunduğundan Khi-kare dağılışı yalnız 0 ile + arasında
olan pozitif 2 değerleri için geçerlidir.
Mendel’in Açılma Oranlarına Uyum Kontrolü ( Khi-Kare Testi)
ÖRNEK 5.36. Susamda açık kapsüllü ve beyaz taneli bir çeşit (AABB) ile kapalı kapsüllü ve
sarı taneli bir çeşit (aabb) arasında yapılan melezlemenin F2 açılma generasyonunda elde
edilen bitkilerin, oluşan 4 fenotipe göre sayısal olarak dağılımı şu şekilde gözlenmiştir.
Fenotip F2’de Bitki Sayısı(Adet)
Açık kapsüllü + Beyaz taneli : 2604
Açık kapsüllü + Sarı taneli : 876
Kapalı kapsüllü + Beyaz taneli : 847
Kapalı kapsüllü + Sarı taneli : 273
Not : Susamda açık kapsüllü olma dominant A geni ile ve beyaz taneli olma ise dominant B
geni ile idare edilmektedir. F2 generasyonunda dihibrit (9:3:3:1 açılımı) söz konusudur. Buna
göre aşağıdaki soruları yanıtlayınız.
Bu denemede F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılımına uygun mudur ? 0.01 olasılık
düzeyinde test ediniz.
Çözüm için hipotezler şu şekilde kurulur;
Kapalı kapsüllü ve sarı taneli bitki görülme olasılığı (beklenen frekans) 4600 x 1/16 = 287.5
2 = ∑ (𝐟 − 𝐟 )𝟐 /𝐟′
( . ) ( . ) ( . ) ( . )
2 = + + + = 1.33
. . . .
SD = k -1 = 4 -1 = 3
3 SD’li Khi-kare dağılışında 2 =1.33 değerinin girdiği olasılık % 75’e yakındır. Bu nedenle,
F2 deki açılımın dihibrit açılıma uygun olduğu kabul edilir.
F=S²1/S²2
şeklinde tanımlanır ve bunlar 1 etrafında bir dağılım gösterirler ki buna F-Dağılımı denir.
Dağılışın iki parametresi vardır: v1 ve v2. O nedenle diğer dağılışlardan farklı olarak her bir
serbestlik derecesi çifti için ayrı bir F dağılışı vardır. F-dağılışı simetrik değildir ve sağa doğru
eğiktir. v1 ve v2 arttıkça dikleşir, aksi durumda ise yatıklaşır (Şekil-19). F-dağılışı iki dağılışın
varyanslarını karşılaştırmada ve varyans analizi tekniğinde kullanılır.
Örneğ n 4/12 SD'de üsttek değer 3.26 dır. Şek lden de görüldüğü g b 3.26 değer eğr y % 5
ve % 95 k alanına ayıran b r değerd r. Bu değer şu şek lde yorumlamak mümkündür. 4 ve
12 SD'l çok sayıda örnekler alınıp, varyanslarına a t F değerler bulunsa, bunların % 95' 3.26
dan küçük F değer ve % 5' se 3.26'dan büyük F değer ver r. Veya herhang b r F değer n n
3.26 dan büyük olma olasılığı % 5 d r.
Şimdi de 4 ve 6 serbestlik derecesine ait F- dağılışında den daha büyük değerlerinin oranını
veya herhangi bir değerinin bu verilen değerden büyük olması olasılığını bulalım.
Dikkat edildiğinde F=4.534 değeri dağılış eğrisini %95:%5 olacak şekilde iki olasılık alanına
ayırmıştır. O nedenle 4:6 serbestlik dereceli F dağılışında kiritik bir F değeridir. Herhangi bir F
oranının bu değerden yüksek olma şansı %5 ve düşük olması şansı ise %95 dır.
ÖRNEK 5.37
10 serbestlik dereceli bir örneğin varyans 20.6 ve 15 serbestlik dereceli ikinci bir örneğin
varyans ise 13.6 dır. Her iki örnek, aynı varyanslı bir populasyondan mı çekilmiştir veya
çekildikleri populasyonların varyansları eşit midir? % 5 kritik değerini kullanarak
çözümleyelim.
S12 20.6 ve v1 10
S22 13.6 ve v2 15
İlk çekilen örneğin çekildiği populasyonon varyansını 12 ve ikincisinin varyansını 22 ile
gösterelim. Bunlar eşit iseler oranlarının bire eşit olması beklenir.
12
F 1
12
Eğer birden büyükse iki örneğin alındığı populasyonların varyanslarının aynı olmadığı ileri
sürülür. Örneklerden bulunan F değeri ise
S12 20.6
F 1.51
S22 13.6
dır.
Öte yandan 10:15 serbestlik derecelerinde % 5 kritik değer 2.55 dir. 1.51<2.55 olduğu için
örneklerin, eşit varyanslı ( F =1) iki populasyondan gelme olasılığı % 5 den büyüktür. O
nedenle 12 22 2 olduğu kabul edilebilir. Ayrıca F 1.51 oranının tam F 1 olmaması
tesadüflükten kaynaklanır. Öte yandan eğer iki örneğin varyanslarının oranı 1.15 değilde F =
2.70 olsaydı, bu taktirde 10 ve 15 serbestlik dereceli bu iki örneğin varyansları eşit iki
populasyondan gelme olasılığı % 5 den küçük olacak ve 12 22 sonucu ortaya çıkacaktı.
ALIŞTIRMALAR
1.100 adet elektrik ampulünde ortalama dayanma süresi 1280 saat ve standart sapması ise 142
saattir. Ortalamanın standart hatasını hesaplayınız ve bu örneğin ortalaması 1300 saat olan bir
populasyona girme olasılığını bulunuz.
2.400 radyo lambasının test edilmesinden sonra 140 tanesinin bozuk olduğu gözlenmiştir.
Bozuk lamba oranını ve standart sapmasını bulunuz. Bozuk lamba oranının 1/2 olduğu
söylenebilir mi?
3.İki fabrikanın ürettiği lastiklerin dayanma sürelerinin aynı olup olmadığı araştırılmaktadır.
Her iki fabrikadan alınmış 100'er lastikli iki örnekte ortalama dayanma süreleri ve varyansları
şöyle bulunmuştur.
1.Fabrika 2.Fabrika
_ _
X1=26400 km X2=25100 kg
x12= 1.440.000 x22= 1.960.000
İki ortalama değer arası farklılığın standart hatasını bulunuz. Dayanma sürelerinin aynı olduğu
söylenebilir mi? Veya µ1-µ2=0 olduğu kabul edilebilir mi?
NOT: Yukarıdaki sorularda test olasılığı % 5 ve test yönü iki yönlü testtir.
9.2.HİPOTEZ VE KURULMASI
Hipotez testlerinde en önemli basamak hipotez kurulmasıdır. İyi bir hipotez anlam
taşımalı, karşıtı bulunmalı ve kontrol edilebilmelidir.
Populasyonların dağılışları hakkında karar verilirken ya bir tahminde bulunulur ya
da konu ile ilgili belirli bir varsayımda bulunulur. İster gerçekleşsin veya isterse gerçekleşmesin
ileri sürülen bu varsayımlara hipotez denir. İstatistikte hipotezler, populasyonların olasılık
dağılışları üzerinde ileri sürülen iddialar şeklinde tanımlanır. Yani hipotezler parametreler veya
parametreler arası farklılıklar için kurulur.
İki farklı çeşitin verimleri arasında (iki populasyonun ortalaması arasında) "farklılık
yoktur" veya "farklılık vardır" şeklindeki iki önerme veya varsayım bir hipotezdir. Birinci
çeşitin geldiği populasyon ortalaması 1 ve ikincisininki 2 ise bunlar arasında "farklılık
yoktur" önermesi
9.3.HİPOTEZ KONTROLÜ _ _
Hipotez kontrolünün esası; örnekten hesaplanmış, x,r,(x1 - x2) gibi herhangi bir
istatistiğin, sıfır hipotezi ile belirlenmiş hipotetik populasyondan şansa bağlı olarak çekilmiş
aynı büyüklükteki örneklere ait istatistiklerin örnekleme dağılımına girme olasılığını
hesaplayarak buna göre hipotezi red veya kabul etmektir. O nedenle hipotez kontrolünde ilk
basamak hipotezin kurulması ve hipotetik populasyonun, bir önceki konuda belirtildiği şekilde,
tanımlanmasıdır. Aksi durumda hipotez kontrolü yapılamaz.
Hipotez kontrolünde ikinci basamak, örnekleme dağılışının H0 hipotezi kullanılarak
tanımlanmasıdır.
Üçüncü kademede, örneğin hipotetik populasyonu temsil etme veya örnekleme
dağılışına girme olasılığı hesaplanır. Bunun için istatistiklerin z,t,khi-kare ve F gibi standart
değerleri veya test istatistikleri kullanılır.
Hipotez kontrolünde sonuncu kademe karar aşamasıdır. Üçüncü kademede hesaplanan
olasılığa göre hipotez red veya kabul edilir. Fakat karar vermede, örneğin, örnekleme dağılışına
girme olasılığının hesaplanması yeterli değildir. Bunun, hangi değerden büyük olunca
hipotezin kabul edileceği veya küçük olunca hipotezin reddedileceği önceden
kararlaştırılmalıdır. Yani bir sınır olasılık düzeyi belirlenmelidir. Buna hipotez kontrolünde
"önemlilik seviyesi" denir. Araştırmalarda daha çok % 5 ve % 1 gibi önemlilik seviyeleri
kullanılır. Örneğin % 5 önemlilik seviyesi alınmış ise; hesaplanan olasılık bundan büyükse
hipotez kabul, küçükse hipotez reddedilir. Hipotezin kabul edilmesi, örneğin hipotezle belirtilen
populasyonu temsil ettiği ve hipotezi doğruladığı desteklediği anlamını taşır. Aksi durumda
sıfır hipotezi doğrulanmaz ve H1 kabul edilmiş olur.
Yukarıdaki ifadelerden de anlaşılacağı gibi kontrol edilen hipotez, sıfır hipotezidir.
Hipotez kontrolünde hangi karşıt hipotezin seçileceği önemli bir sorundur. Genel olarak
benimsenen iki-yönlü teste uygun olan karşıt hipotezdir. Eğer hipotezi kurulan parametrenin
hipotetik değere bakarak küçük veya büyük olduğu konusunda ön bilgiler varsa bu takdirde tek-
yönlü kontrollere uygun olan karşıt hipotez kurulabilir.
Yukarıda, bir test olasılığı şeklinde belirtilen "önemlilik seviyesine" "testin
büyüklüğü" adı da verilir ve ile gösterilir. Bu seviye aynı zamanda "H0 gerçek olduğu zaman,
H0'ın maksimum reddedilmesi olasılığıdır".Bir bakıma testin riskidir. Örneğin; =0.05 ise
gerçek olan H0 hipotezinin maksimum reddedilme olasılığı % 5 olur.
Hipotez kontrollerinde, örneğin örnekleme dağılışına girme olasılığını hesaplayıp, bunu
ile karşılaştırma yerine örnek istatistiğinin (veya parametrenin sapmasız tahmininin)
seviyesindeki bir kritik değerle veya istatistiğin standart değerinin uygun bir test-dağılışı kritik
değeri ile karşılaştırmak daha büyük bir kolaylık sağlar.
H0 :µ=µo
H1 :µ>µo
Eğer H0 hipotezi geçerli veya gerçek ise X değerlerinin benzer şekilde bu kez
ortalaması µo ve varyans 2/n olan normal örnekleme dağılışı da izlediği ileri sürülür (Şekil-
22). Bu karşıt hipotezde X'ların µ0'dan büyük olan değerleri H0'ın reddedilmesini sağlayan
değerlerdir. Acaba X'ın değeri µo'dan ne kadar büyük olmalıdır ki H0 reddedilsin. Veya
önemlilik seviyesine göre öyle bir kritik C değeri tanımlayalım ki, bundan daha büyük X
değerleri H0 hipotezini reddetsinler. Eğer =0.05 ise, normal
_
Şekil 22.H0 kabul edildiğinde X'ların dağılışı
dağılış ve standart normal dağılış özelliklerinden, Tablo Ek-1'den yararlanarak C'nin µ0'dan
+l.645 X kadar uzakta olması gerektiği kolaylıkla görülür veya kritik C değeri
C=µ0+l.645 X
olarak bulunabilir. Herhangi bir X değerinin C'den büyük bir değer alması olasılığı %5 dir.
Dolayısı ile H 0 'ın geçerli veya doğru olduğunda X'ın C'den büyük olması, yanlışlıkla H0 'ı
reddetme olasılığı ve bu örneğe göre %5 dir.
Eğer ortalaması µ olan populasyondan alınmış bir örneğin ortalaması C'den büyükse H0
reddedilir ve µ>µ0 H1 hipotezi kabul edilir. O nedenle alanı ile sınırlı C'den büyük X
değerlerinin bulunduğu alan RED alanı, sağdaki kısım ise KABUL alanı adını alır.
Öte yandan
_
X-µ0
z= ----------
X
oranın standart normal dağılış izlediğinden C kritik değerinin Z değeri +1.645 olur. Buna göre
de standart değeri veya test istatistiği +1.645 den büyük olan X değerleri de H0 hipotezini
reddeder.
Karşıt hipotez H1: µ<µ0 şeklinde seçilmiş olsaydı, bu kez C kritik değeri
C=µ0 -l.645 X _
olacaktı. Bundan daha küçük değer veren X değerleri yine H0 hipotezini reddeder ve H1 :
µ<µ0 hipotezini kabul eder. X değerinin yukarıdaki eşitlikten bulunan Z test istatistiği de -l.645
den küçükse yine H0 reddedilir.
Yukarıda açıklandığı gibi dağılışın yalnız sağ veya sol tarafı ile ilgili olan hipotez
kontrollerine TEK-YÖNLÜ kontroller denir.
Örneğe ait istatistiğin veya sapmasız tahminin, hipotezin Belirlediği populasyon
ortalamasından her iki yönde olan sapmaları da göz önüne alındığında yapılan test İKİ-YÖNLÜ
test olur.
Daha önce ele alınan örneğin buna uygun hipotezi
H0 :µ=µ0
H1 : µµ0
şeklinde olanıdır. Bu testlerde, H0 gerçek iken, bunu reddetme olasılığı X değerlerinin C1
gibi kritik bir değerden küçük ve C2 gibi bir değerden büyük olma olasılıklarına eşit
olduğundan, iki eşit kısma bölünür (Şekil 23). Eğer =0.05 ise C1 ve C2 kritik değerleri,
EK TABLO 1'den yararlanarak:
C2 =µ0+l.96 X ve C1 =µ0-l.96 X
şeklinde hesaplanır. Ortalaması µ olan populasyondan çekilen bir örneğin ortalaması C1 den
küçük veya C2 den büyükse H0 reddedilir ve H1 kabul edilir. Veya örneğin ortalamasına ait
z'nin mutlak değeri z > 1.96 ise yine H0 reddedilir.
Eğer parametre tahminlerin test istatistiği t-dağılışına uygun t ise, bunlarla da iki ve tek
yönlü hipotez kontrollerinin yapılması mümkündür. Ama burada t'nin serbestlik derecesine
bağlı olduğunu hatırlamalıyız.
oranı (n-1) serbestlik dereceli bir t-dağılışı gösterir. Serbestlik derecesinin 20 olduğu durumda
= 0.05 için iki ve tek yönlü kritik değerler EK TABLO 3'den bulunarak Şekil 24'de
verilmiştir.
Şekil 24. 20 serbestlik derecesinde =0.05 için iki-yönlü(a) ve tek-yönlü testler için (b,c) kritik
t değerleri
İki-yönlü hitopez için kritik t değerleri verilen serbestlik derecesinde 0.05 sütununda;
tek-yönlü testler için ise 2x=2x0.05=0.10 sütununda yer almaktadır.
Hatırlanacağı gibi khi-kare ve F-dağılışları da serbestlik derecesine bağlıdır.
Yukarıda alınan z ve t örneklerinden de görüldüğü gibi iki-yönlü hipotez kontrollerinde
kritik değerler hipotetik ortalamadan daha uzakta bulunmaktadır. Yani iki-yönlü hipotezin
kabulü için daha büyük sapmalara tolerans gösteriir.
Hipotez kontrollerinde karar verme aşamasında iki tip hata yapma olasılığı veya riski
vardır. Birincisi; H0 hipotezi gerçekte doğru iken bunun yani H0 'ın reddedilmesidir (Yani yanlış
olan H1 hipotezinin kabul edilmesidir). Buna 1.Tip Hata denir ve daha önce önemlilik seviyesi
tanımlanırken verilen olasılığı 1.Tip Hataya eşittir. İkincisi ise; H0 hipotezi gerçekte yanlış
iken H0 hipotezinin kabul edilmesidir (veya doğru H1 hipotezinin reddedilmesidir). Buna 2.Tip
Hata denir ve ile gösterilir.
H0 hipotezinin gerçek durumu ile karar verme sonucu arasındaki bu iki tip hata doğuşu
Tablo 11'de verilmiştir.
Tablo 11.Hipotez kontrolünde riskler
H0 Hipotezinin Gerçek Durumu Test Sonucu Verilen Karar
RED KABUL
Öte yandan , yalnız H0 hipotezinin doğru olduğu ve ise H0 hipotezinin yanlış olduğu
durumdaki bir frekans dağılışının,belirli bir olasılığıdır.
İkinci tip hata olasılığı, , H0 hipotezine katılan ve üzerinde durulan populasyon
parametresinin gerçek değerine bağlıdır ve buna göre de değişir. Bunu belirliyebilmek için
populasyon ortalaması ile ilgili H0 : µ=µo ve H1: µ>µo hipotezini ele alalım.
Daha öncede görüldüğü gibi bu hipotez X değerleriyle kontrol edilir. XN(µ,2) dağılışı
izllyorsa, X N (µ,X2) dağılışını izler. _
Eğer H0 doğru ise yani µ=µ0 ise X değerleri yine X(µ0, X2) normal dağılışını izler.
Bu örnekleme dağılışı Şekil 23'de en üst sırada bulunan dağılıştır. Ayrıca doğru bir H0 'ı
reddetme olasılığı ise buna ait kritik değer C ile gösterilmiştir.
H0 hipotezi yanlış da, doğru olarak kabul ediliyorsa, µ'nün karşıt hipoteze göre µo'dan
daha büyük bir değer alması gerekir. Bu µ1 olsun. yani, H1: µ=µ1 olsun. Bu takdirde X değerleri
XN(µ1,X2) şeklinde ortalaması µı olan bir başka normal örnekleme dağılışı izler (Şekil
24'deki altta yer alan dağılış). İşte, 2.Tip Hata olasılığı X değerinin C'den küçük bir değer
alması olasılığıdır. , şekil 22'deki alttaki dağılışın taralı alanıdır. Bu alanın değeri normal
dağılış, standart normal dağılış ilişkisinden ve EK TABLO l'den yararlanılarak bulunabilir.
Bir testde, H0 yanlışken, bunu reddetme doğru kararının olasılığına kontrolün "güç
fonksiyonu" denir. Yani güç fonksiyonu Tablo 11'den de görüldüğü gibi
Güç fonksiyonu = 1-
Herhangi bir verilen parametre değeri için gücün mümkün olduğu kadar yüksek olması
arzulanır. Bu öncelikle etkili test istatistiğinin (z,t gibi) seçimine bağlıdır. Ayrıca H1 hipotezi
koşullarında bütün parametreler için
Güç fonksiyonu >
olmalıdır. Bu şu anlama gelir: H0 yanlış olduğu durumda onu reddetme olasılığı, gerçek
olduğunda reddetme olasılığından daha büyüktür. Eğer bu koşul yerine gelirse kontrole
sapmasız kontrol denir. Bu konuda ve ilerideki bazı konularda verilen test istatistikleri
etkilidir ve kontroller sapmasızdır.
değerleri yukarıdaki tek-yönlü kontrollerde olduğu gibi iki yönlü kontrollerde de
benzer şekilde tanımlanabilir.
126.8-129
z= ------------------= 1.96
1.12
O halde H0:µ=125 hipotezine ait kontrolün H1: µ=129 hipotezine karşı gücü 1-
=1-0.025= % 97.5 olmaktadır.
Şekil 26.H0 :µ= 125 hipotezinin H2:µ= 129 hipotezine karşı kontrolünde ve
değerleri. (1.tip ve 2.tip hatalar)
BÖLÜM 6
HİPOTEZ KONTROLLERİ
6.l.HİPOTEZ KONTROLÜNÜN ÖNEMİ
Gözlem veya deneme yapmadan, aslında, amaç, bunların sonuçlarından gidilerek daha genel sonuçlara
ulaşmaktır. Bu şekilde bir amaca ulaşmak için ya populasyondan örnekler çekilerek bunlar üzerinde gözlemler
yapılır ya da deneme ile bu örnekler suni olarak oluşturulur ve kendilerine ait teorik muamele
populasyonlarının bir örneği şeklinde düşünülür. Fakat ne şekilde olursa olsun, sınırlı sayıda rakamlar ve
sınırlı sayıda bilgi elde olunur. Sınırlı sayıda olan bu bilgilerden daha genel sonuçlara ulaşmak ancak
hipotez kontrolü ile mümkün olur. Diğer bir anlamda hipotez kontrolü için örnek çekilir veya deneme yapılır.
Ancak istatistiki açıdan ise alınan örneklerle, bunların çekildiği populasyonların dağılışları (parametreleri)
belirli risklerle tanımlanmaya çalışılır.
Örneğin, bir n adet X,Y çiftini içeren bir örnekte ikisi arasındaki korrelasyon katsayısının r=0.296
olduğu saptanabilir. Bu değer X,Y arasındaki gerçek ilişkinin () de =0.296 olduğu anlamına gelmeyebilir.
Sözgelimi gerçekte, =0 olduğu halde örneklemeden dolayı r=0.296 olarak saptanmış olabilir. O nedenle
değerinin sıfır olup olmadığının araştırılması gerekir. Bu da r'nin kullanıldığı bir hipotez kontrolü ile
mümkündür. Fakat belirli bir hatası veya riski de vardır. Öte yandan r'den gidilerek 'nun tanımlanması
yukarıda açıklandığı şekilde bir genel sonuca ulaşmadır.
Korrelasyon örneğine benzer şekilde, iki çeşitin verimlerinin farklı olup olmadıkları, iki ilacın
etkinliklerinin aynı olup olmadığı ve bir konserve fabrikasında üretilen salçaların % 32.5 kuru madde içerip
içermedikleri ancak hipotez kontrolü ile mümkündür.
Hipotez kontrollerinde sıkça geçen hipotezin öncelikle tanımlanması gerekir.
6.2.HİPOTEZ VE KURULMASI
Hipotez testlerinde en önemli basamak hipotez kurulmasıdır. İyi bir hipotez anlam taşımalı, karşıtı
bulunmalı ve kontrol edilebilmelidir.
Populasyonların dağılışları hakkında karar verilirken ya bir tahminde bulunulur ya da konu ile ilgili
belirli bir varsayımda bulunulur. İster gerçekleşsin veya isterse gerçekleşmesin ileri sürülen bu varsayımlara
hipotez denir. İstatistikte hipotezler, populasyonların olasılık dağılışları üzerinde ileri sürülen iddialar şeklinde
tanımlanır. Yani hipotezler parametreler veya parametreler arası farklılıklar için kurulur.
İki farklı çeşitin verimleri arasında (iki populasyonun ortalaması arasında) "farklılık yoktur" veya
"farklılık vardır" şeklindeki iki önerme veya varsayım bir hipotezdir. Birinci çeşitin geldiği populasyon
ortalaması 1 ve ikincisininki 2 ise bunlar arasında "farklılık yoktur" önermesi
1 -µ2=0 (yani µ1=µ2) şeklinde ve "farklılık vardır" önermesi ise
µ1 -µ2 0 (yani µ1 µ2) şeklinde
yazılabilir.
Bir firmanın ürettiği ilaçların etkinlik oranı "% 80 dir" veya "% 80 değildir" önermeleri de
=0.80 ve 0.80
şeklinde tanımlanabilir.
Her iki örnekten de görüldüğü gibi hipotez iki kısımdan oluşmaktadır. Birincisi farklılığın olmadığı
veya parametrenin herhangi bir varsayım değerine eşit olduğu hipotez kısmıdır. Buna "sıfır" hipotezi denilir ve
H0 ile gösterilir, yukarıda verilen birinci örnekte
H0: µ1 -µ2=0
Sıfır hipotezidir. İkinci hipotez kısmı ise bunun karşıtıdır. "Karşıt hipotez" veya "alternatif hipotez" adını alır ve
H1 ile gösterilir. Örneğin;
H1:µ1 -µ20
birincisinin karşıtıdır. İkinci örnek için
H0 : =0.80 ve H1: 0.80
şeklinde yazılabilir.
Sıfır hipotezi (H0 ) "Kontrol edilen" veya iddia edilen hipotezdir. Her iki hipotez de birarada görülmez
ve ayrıntılıdır. Eğer H0 kabul edilirse H1 reddedilmiş olur. Veya H0'ın reddedilmesi H1'in kabul edilmesi
anlamına gelir.
Karşıt hipotez, farklı üç şekilde yazılabilir. Örneğin H0:µ1 -µ2=0 hipotezi için karşıt hipotezin bu
formları
H1: µ1 -µ20; H1: µ1 > µ2 veya H1: µ1 < µ2
olmaktadır.
Karşıt hipotezin bu formları, H0 'ın iki-yönlü veya tek-yönlü kontrol edillp, edilmeyeceği konusunda yol
göstericidir. H1: µ1 -µ20 karşıt hipotezi, Sıfır hipotezinin iki-yönlü; diğer iki karşıt hipotez ise tek-yönlü
kontrol edilmesini gerektirir.
Daha önce ele alınan ikinci örneğin karşıt hipotezleri de benzer şekilde
H1: 0.80; H1: >0.80 veya H1: <0.80
şeklinde yazılabilir.
6.3.HİPOTEZ KONTROLÜ
Hipotez kontrolünün esası; örnekten hesaplanmış, x,r,(x , x ) gibi herhangi bir istatistiğin, sıfır hipotezi
ile belirlenmiş hipotetik populasyondan şansa bağlı olarak çekilmiş aynı büyüklükteki örneklere ait
istatistiklerin örnekleme dağılımına girme olasılığını hesaplayarak buna göre hipotezi red veya kabul etmektir.
O nedenle hipotez kontrolünde ilk basamak hipotezin kurulması ve hipotetik populasyonun, bir önceki konuda
belirtildiği şekilde, tanımlanmasıdır. Aksi durumda hipotez kontrolü yapılamaz.
Hipotez kontrolünde ikinci basamak, örnekleme dağılışının H0 hipotezi kullanılarak tanımlanmasıdır.
Üçüncü kademede, örneğin hipotetik populasyonu temsil etme veya örnekleme dağılışına girme olasılığı
hesaplanır. Bunun için istatistiklerin z,t,khi-kare ve F gibi standart değerleri veya test istatistikleri kullanılır.
Hipotez kontrolünde sonuncu kademe karar aşamasıdır. Üçüncü kademede hesaplanan olasılığa göre hipotez
red veya kabul edilir. Fakat karar vermede, örneğin, örnekleme dağılışına girme olasılığının hesaplanması
yeterli değildir. Bunun, hangi değerden büyük olunca hipotezin kabul edileceği veya küçük olunca hipotezin
reddedileceği önceden kararlaştırılmalıdır. Yani bir sınır olasılık düzeyi belirlenmelidir. Buna hipotez
kontrolünde "önemlilik seviyesi" denir. Araştırmalarda daha çok % 5 ve % 1 gibi önemlilik seviyeleri
kullanılır. Örneğin % 5 önemlilik seviyesi alınmış ise; hesaplanan olasılık bundan büyükse hipotez kabul,
küçükse hipotez reddedilir. Hipotezin kabul edilmesi, örneğin hipotezle belirtilen populasyonu temsil ettiği
ve hipotezi doğruladığı desteklediği anlamını taşır. Aksi durumda sıfır hipotezi doğrulanmaz ve H1 kabul
edilmiş olur.
Yukarıdaki ifadelerden de anlaşılacağı gibi kontrol edilen hipotez, sıfır hipotezidir.
Hipotez kontrolünde hangi karşıt hipotezin seçileceği önemli bir sorundur. Genel olarak benimsenen iki-
yönlü teste uygun olan karşıt hipotezdir. Eğer hipotezi kurulan parametrenin hipotetik değere bakarak küçük
veya büyük olduğu konusunda ön bilgiler varsa bu takdirde tek-yönlü kontrollere uygun olan karşıt hipotez
kurulabilir.
Yukarıda, bir test olasılığı şeklinde belirtilen "önemlilik seviyesine" "testin büyüklüğü" adı da verilir
ve α ile gösterilir. Bu seviye aynı zamanda "H0 gerçek olduğu zaman, H0'ın maksimum reddedilmesi
olasılığıdır".Bir bakıma testin riskidir. Örneğin; =0.05 ise gerçek olan H0 hipotezinin maksimum
reddedilme olasılığı % 5 olur.
Hipotez kontrollerinde, örneğin örnekleme dağılışına girme olasılığını hesaplayıp, bunu ile
karşılaştırma yerine örnek istatistiğinin (veya parametrenin sapmasız tahmininin) seviyesindeki bir kritik
değerle veya istatistiğin standart değerinin uygun bir test-dağılışı kritik değeri ile karşılaştırmak daha büyük
bir kolaylık sağlar.
sapmasız tahmini değeridir. Eğer X değerleri Normal dağılışlı populasyondan (µ, 2) alınmış ise
değerleri de Normal (µ, 2) olan örnekleme dağılışı izler. Tek-yönlü teste ait hipotezleri aşağıda olduğu gibi
kurmuş olalım.
H0 :µ = µo
H1 :µ > µo
Eğer H0 hipotezi geçerli veya gerçek ise değerlerinin benzer şekilde bu kez ortalaması µo ve
varyansı 2/n olan normal örnekleme dağılışı da izlediği ileri sürülür (Şekil 1). Bu karşıt hipotezde 'ların
µ0' dan büyük olan değerleri H0' ın reddedilmesini sağlayan değerlerdir. Acaba 'ın değeri µo' dan ne
kadar büyük olmalıdır ki H0 reddedilsin. Veya önemlilik seviyesine göre öyle bir kritik C değeri
tanımlayalım ki, bundan daha büyük değerleri H0 hipotezini reddetsinler. Eğer =0.05 ise, normal dağılış
ve standart normal dağılış özelliklerinden, Tablo Ek-1'den yararlanarak C'nin µ0' dan +l.645 X kadar uzakta
olması gerektiği kolaylıkla görülür veya kritik C değeri
α
Kabul Alanı
µ0 C
Red Alanı
Herhangi bir X değerinin C'den büyük bir değer alması olasılığı %5 dir.
Eğer ortalaması µ olan populasyondan alınmış bir örneğin ortalaması C'den büyükse H0 reddedilir ve
µ>µ0 H1 hipotezi kabul edilir. O nedenle alanı ile sınırlı C'den büyük değerlerinin bulunduğu alan RED
( )
z=
oranın standart normal dağılış izlediğinden C kritik değerinin Z değeri +1.645 olur. Buna göre de standart
değeri veya test istatistiği +1.645 den büyük olan X değerleri de H0 hipotezini reddeder.
Karşıt hipotez H1: µ< µ0 şeklinde seçilmiş olsaydı, bu kez C kritik değeri
C=µ0 -l.645 X
olacaktı. Bundan daha küçük değer veren değerleri yine H0 hipotezinin reddedilmesini ve
H1: µ < µ0 hipotezinin kabul edilmesini gerektirir. değerinin yukarıdaki eşitlikten bulunan Z test istatistiği de
α /2 α /2
Ortalaması µ olan populasyondan çekilen bir örneğin ortalaması C1 den küçük veya C2 den büyükse H0
reddedilir ve H1 kabul edilir. Veya örneğin ortalamasına ait z'nin mutlak değeri z > 1.96 ise yine H0 reddedilir.
Eğer parametre tahminlerinin test istatistiği t-dağılışına uygun t ise, bunlarla da iki ve tek yönlü hipotez
kontrollerinin yapılması mümkündür. Ama burada t'nin serbestlik derecesine bağlı olduğunu hatırlamalıyız.
Örneğin; yine µ ile ilgili
H0 : µ=µ0
H1: µµ0, H1:µ>µ0 ve H1 : µ<µ0
hipotezlerini kurmuş olalım. Küçük örneklerde ve varyansın bilinmediği durumlarda, örnekleme dağılışının
varyans S = S2/n olarak tahminleniyordu. Ancak
( )
t= oranı (n-1) serbestlik dereceli bir t-dağılışı gösterir.
Serbestlik derecesinin 20 olduğu durumda = 0.05 için iki ve tek yönlü kritik değerler EK TABLO 3'den
bulunabilir.
% 2.5 % 2.5 %5 %5
İki-yönlü hitopez için kritik t değerleri verilen serbestlik derecesinde 0.05 sütununda; tek-yönlü testler için ise
2x=2x0.05=0.10 sütununda yer almaktadır.
Hatırlanacağı gibi khi-kare ve F-dağılışları da serbestlik derecesine bağlıdır.
Yukarıda alınan z ve t örneklerinden de görüldüğü gibi iki-yönlü hipotez kontrollerinde kritik değerler
hipotetik ortalamadan daha uzakta bulunmaktadır. Yani iki-yönlü hipotezin kabulü için daha büyük sapmalara
tolerans gösterir.
ÖRNEK: Tarımsal mücadele ilacı üretilen fabrikalarda belirtilen bir insektisitin 1 kg preparat başına 125 gr
aktif madde içermesi ve varyansının da 45 olması gerekmektedir. Bir A firmasının ürettiği aynı tip ilaçların 36
adet birer kg'lık paketlerinde aktif madde miktarı 129 gr bulunmuştur. Şu hipotezi kontrol edelim: A firmasının
ürettiği ilaçlarda da aktif madde miktarının 125 gr’dan daha fazla olduğu kabul edilebilir mi?
A firmasının ortalaması µ ise
H0 : µ= l25
H1: µ> l25
Örnekleme dağılışının ortalaması, µx=125 ve varyans ise x2= 2/n=l.25 dir. Önemlilik seviyesi =
0.05 ise bunun tek yönlü C kritik değeri :
%5
µ0= 125µC=
0= 125
126.8C= 126.8
Söz konusu örnekleme dağılışı Şekil 4'de yer almaktadır. Örneğin ortalaması = 129 gr değeri C'nin sağına
düştüğünden H0 hipotezi reddedilmektedir. H1 kabul edilir. A firmasının ilaçlarında aktif madde miktarı µ>125
olduğu ortaya çıkar.
( µ) ( )
z = =
oranları z-standart normal dağılışını, N(0,1) izler. O nedenle örneğimize ait X değerinin Z standart değeri veya
test istatistiği hipotezin kontrolünde kullanılabilir. Söz konusu z değerinin verilen bir önemlilik seviyesinde
belirlenecek kritik bir z değeri ile karşılaştırılması gerekir. önemlilik seviyesindeki kritik z değeri EK
TABLO 1'de (1-/2) düzeyindeki z değeridir. Örnekten bulunan z'nin mutlak değeri ve kritik z-değeri aşağıda
olduğu gibi karşılaştırılarak H0 hipotezi red veya kabul edilir.
( ) ( . )
z= = .
= - 2.33
Sonuç: 2.33 > l.96 olduğundan H0 hipotezi reddedilir. Veya populasyon ortalaması (µ) 55 olarak kabul
edilemez.
Şimdi, populasyon ortalaması 55'den küçük müdür ? şeklinde sorulan sorunun yanıtını arayalım. Bu tek-yönlü
bir testi gerektirir. Önemlilik seviyesi yine α = 0.05 olsun. Hipotezler:
H0 : µ=55 ve H1: µ<55
Kritik Z değeri -z(1-2/2 )= z(0.45)= -l.645 dir.
Sonuç: -2.33<-l.645 olduğundan H0 reddedilir. Populasyon ortalaması 55'den küçüktür.
S = S 2/n
olur. Merkezi limit teoremine dayanarak, H0 hipotezinin geçerli olduğu durumda,
( )
z=
oranları da yine N(0.1) dağılışı izler. Yani x 'ın standart değeri yine z dir ve hipotez kontrolünde standart
normal test dağılışı kullanılabilir.
İki ve tek yönlü testlerde izlenecek yollar, bir önceki konuda olduğu gibidir.
ÖRNEK: Rasgele seçilmiş 85 mısır bitkisinde ortalama koçan uzunluğu 37.5 cm ve varyans ise 11.5 olarak
bulunmuştur. Mısır populasyonunun ortalama koçan uzunluğunun (µ=40 cm olduğu düşünülebilir mi? =
0.01 olsun.
H0 : µ= 40 ve H1: µ 40
S = S2/n= 11.5/85= 0.135 ve S = 0.367
Örneğin standart değeri veya test istatistiği;
z = (x - µ)/ S = (37.5-40)/0.367= - 6.81
EK TABLO 1'den kritik z değeri:
z(1- /2)= z(0.495)= 2.575
Sonuç: |6.81| > 2.575 olduğundan H0 reddedilir. Veya µ40 olduğu ortaya çıkar.
ÖRNEK:Bir A insektisitinin 1 kg'ında 125 gr aktif madde bulunması yönetmelik gereğidir. Bu ilacı üreten bir
firmadan alınan 16 kutuluk bir örnekte ortalama aktif madde miktarı 118 g/kg ve varyans da 48.5 olarak
bulunmuştur. Söz konusu fabrikanın üretimi yönetmeliğe uygun mudur? =0.05 olarak alınsın. Fabrikanın aktif
madde miktarı µ ise hipotezler şöyle oluşturulur.
H0: µ= 125 ve H1: µ 125
.
S = = = 1.74 g/kg SD = n -1 = 16-1 = 15
σ( ) = +
şeklinde tanımlanır. Populasyon ortalamaları arası farklılığa ait hipotezler ise şu şekilde kurulur:
H0 : (µ1-µ2)= µ0
H1: (µ1-µ2)= µ0; (µ1 -µ2) > µ0 ve (µ1 -µ2) < µ0
( ) (µ µ )
z=
( )
oranı standart normal dağılış izlediğinden (x − x ) farklılığının standart değeri z 'dir. O nedenle hipotez
kontrolü z-standart Normal Dağılışı kullanılarak yapılır. Yani iki-yönlü kontrol için kritik z değeri z(1-/2) ve
tek-yönlü kontroller için ise z(1-2/2) dır. İzlenen yol 9.7.1’de olduğu gibidir.
S( ) = +
olur. Büyük örneklerde farklılıklarının ortalaması µ1 -µ2 ve varyans S( ) olan takribi bir normal dağılış
izlediği kabul edilir. O nedenle
( ) (µ µ )
z=
( )
oranı da takribi olarak standart normal dağılış izler. Böylece hipotez kontrolü 9.8.1'de olduğu gibi yapılır.
ÖRNEK: 85 adet Karaman koyunu kuzusunda 6 ay sonra kazanılan ortalama canlı ağırlık 28 kg ve varyans 3.5
dur. 50 ivesi kuzusunun aynı sürede kazandığı ağırlık 22 kg ve varyans 4.5 olmuştur.
Her iki koyun ırkının 6 ay sonra aldığı ağırlıklar eşit kabul edilebilir mi? = 0.05 olsun.
. .
S( )= + = + = 0.131 S( ) = 0.362 kg
( ) (µ µ ) ( )
z= = = + 16.57
( ) .
( ) (µ µ )
t=
( )
oranı serbestlik derecesi n1+n2-2 olan t dağılışı izlemekteydi. O nedenle (x − x ) istatistiğinin standart değeri
veya test istatistiği t dir. Böylece iki-yönlü hipotez kontrollerinde kritik t değeri;
t(n1+ n2-2) ()
ve tek-yönlü testlerde ise
t(n1- n2-2) (2 )
ÖRNEK: A yemi verilen 11 hayvanda günlük ortalama canlı ağırlık artışı 97 gr ve varyans 847.2 dir. Fakat B
yemi alan yine 11 hayvanda günlük ortalama artış 57 gr ve varyans 774.8 dir.
Her iki yemin verdiği canlı ağırlık artışları aynı mıdır? = 0.01 olsun.
A yemi için günlük artış µ1 ve B yemi için µ2 ise hipotezler şöyle kurulur.
H0 : µ1-µ2= 0 ve H1: µ1-µ20
Öte yandan
x12=( n1-1)S12=10x847.2= 8472
x22=( n2-1)S22=10x774.8= 7748
∑ ∑
S2 = = = 811 ve SD= 20 dir.
O halde;
( )
S( )= = = 147.5
( ) (µ µ ) ( )
t= =
.
= + 3.29
( )
3.29
Kritik t değerinin, t20 (0.01)= 2.845, olduğu EK TABLO 3'den görülebilir.
Sonuç: 3.29 > 2.845 olduğundan H0 reddedilir. A yemi ve B yeminin sağladıkları günlük canlı ağırlık artışları
aynı değildir. Şüphesiz A yemi daha yüksek canlı ağırlık artışı sağlamıştır.
S( ) = +
dir. Ancak
( ) (µ µ )
t=
( )
oranı Fisher'in yaklaşımı ile n +n - 2 serbestlik dereceli değilde v serbestlik dereceli bir t dağılışı izler. v' nin
değeri aşağıdaki eşitlikle hesaplanır.
/ /
= ( )2 + ( )2
ÖRNEK: Bir kimyasal maddenin,bir çözeltideki konsantrasyonu hızlı ve standart metod olmak üzere iki
metodla analiz edilmektedir. Standart metod 4, hızlı metod ise 8 örnekte uygulanmış ve kimyasal maddenin
1 litredeki mg olarak konsantrasyonları aşağıda verilmiştir.
Standart Metod: 25 24 25 26
Hızlı Metod : 23 18 22 28 17 25 19 16
Yeni geliştirilen hızlı metod, standart metodun yerini alabilecek midir? = 0.05 olsun. Standart metodla tayin
edilen konsantrasyon µ1 ve hızlı metodla tayin edilen µ2 olsun. O halde;
H0 : µ1-µ2=0 ve H1: µ1-µ2 0
Yukarıdaki örneklere ait varyantlardan;
x = 21 mg/lt; S22= 17.71; v2= n2-1=7; S22/n2= 2.21 olduğu hesaplanabilir. Örneklerin varyansları,
O halde;
( ) (µ µ ) ( )
t= = = + 2.60
( ) .
/ /
= ( )2 + ( )2
. .
= ( )2 + ( )2 = 0.125
. .
v = 8 olmaktadır.
Buna göre; t kritik değeri t8 (0.05)= 2.306 dır (EK TABLO 3).
Sonuç:2.60>2.306 olduğundan H0 reddedilmektedir. % 5 düzeyinde farklılık önemlidir. Hızlı metod standart
metodun yerini alamaz. Zira kimyasal maddenin konsantrasyonunu daha düşük bir düzeyde ölçmektedir.
Tek-yönlü testlerde kritik t değeri tv(2) olarak yine aynı tablodan bulunur.
z=
oranları da standart normal dağılış izler. Böylelikle p'nın test istatistiğinin z olduğu görülebilir. Bu durum bize:
H0 : p=p0 ve H1: p p0; H1:p> p0 veya H1:p< p0
hipotezlerinin z-Test Dağılışı ile kontrol edilmesi olanağını sağlar. Şüphesiz karar vermede örnekten bulunan z
değeri ve kritik z değerleri, daha önce belirtildiği şekilde (9.7.l) karşılaştırılır.
Fakat p parametresi verilmiyorsa 2p'nın örnekten tahmini kullanılabilir.
S = pq/n
Büyük örneklerde
z=
oranı da, yaklaşık olarak standart normal dağılış izler ve hipotez kontrollerinde yine z-test dağılışı benzer
şekilde kullanılabilir.
ÖRNEK-1:Bir ilacın belirli bir hastalığı iyileştirme oranının 0.80 olması gerektiği belirtilmektedir. Bir firma
tarafından üretilen aynı tip ilacın 180 hastanın l30'unu iyileştirdiği saptanmıştır. Söz konusu firmaya ait ilacın
iyileştirme oranı belirtilen
% 80'den düşük müdür? = 0.05 olsun. Örnekte n=180 dir.
Firmanın ilacının iyileştirme oranı p ise hipotezler şöyle kurulur:
H0 : p=0.80 H1: p<0.80
Öte yandan;
130
P = 180 = 0.72
. .
σ = = = 0.00089
σ = 0.03’ dür.
. .
z= = = - 2.67
.
Red -1.645 0
-2.67
ÖRNEK 2: Bir pamuk çeşitinden alınan 300 tohumdan 280'ının çimlendiği gözlenmiştir. Çimlenme oranının %
90 olduğu düşünülebilir mi? % 1 düzeyinde, hipotezi kurarak, siz test ediniz.
2 p1 * q1 p2 * q2
^ ^
= n
( p1p2)
1 n2
( ) ( )
z=
( )
oranı z N(0,1) dağılışı izlemekteydi. O nedenle (p − p ) farklılığının test istatistiği z dir ve hipotezler z-
Test Dağılışı ile bilinen şekilde kontrol edilebilir. Populasyonların başarı oranları bilinmiyorsa, ki çoğunlukla
bilinmez, dağılışın varyans örneklerden tahminlenir:
p1 * q1 p2 * q2
𝑆( ) =
n1 n2
Şüphesiz büyük örneklerde yukarıda belirtilen oranın paydasına bunun yazılması, yine yaklaşık olarak N (0.1)
dağılışı izler.
ÖRNEK: Bir elma çeşitinde (A) 200 elmanın 80'ninde, ikinci bir çeşitte (B) 180 elmanın 120'sinde elma iç
kurdu görülmüştür. A ve B çeşitlerinin kurtlu meyve oranları aynı mıdır?% 5 önemlilik seviyesinde kontrol
edelim.
A çeşitinde kurtlu meyve oranı p1 ve B çeşitinde p2 ise
H0:p1- p2 =0 ve H1: p1- p2=0 (Burada p0=0)
şeklinde yazılabilir.
. . . .
𝑆( )= + = 0.0024
𝑆( )= 0.049 olur.
( . . )
z= = 5.51
.
Sonuç: 5.51 > 1.96 olduğundan iki çeşitin kurtlu meyve oranlarının aynı olduğu söylenemez.
t=
oranları (n-2) serbestlik dereceli bir t dağılışı izliyordu (8.4.5). Yani r' nin test istatistiği t dir ve serbestlik
derecesi (n-2) dir. Kritik t değerleri ise iki-yönlü testler için t(n-2) () ve tek yönlü testler için t(n-2)(2 )
olmaktadır. Şüphesiz t ve kritik t değerleri (9.7.3)'de olduğu gibi karşılaştırılarak kontrol sonuçlandırılır.
ÖRNEK:16 soya bitkisinde yan dal sayısı ile bitki başına tane verimi arasında korrelasyon katsayısı r=+0.443
olarak bulunmuştur. Bu iki değişken arasındaki korrelasyon önemli midir? % 5 düzeyinde kontrol edelim.
H0 : =0 H1: =0
( . )
S = = = 0.0574 ve S = 0.24 SD = n - 2 = 14
.
t= = = + 1.80
.
( ) (µ µ )
t=
( )
oranı n1+n2-6 serbestlik dereceli bir t dağılışı gösterir (8.4.6.'da belirtildiği gibi). Burada (z1-z2) farklılığının test
istatistiği t dir. O halde kontrol t-test dağılışı ile yapılır. Kritik t değerleri; t(nı+n2-6) ( ) veya t(n1+n2-6) (2 ) dır.
ÖRNEK:Bir çiftlikte yetiştirilen montafon sığırlarından 28'inde 3 ve 6 aylık ağırlıklar arasındaki korrelasyon
katsayısı r=+0.503 olarak bulunmuştur. Bir ikinci çiftllkte 39 hayvanda saptanan aynı değişkenler arasındaki
korrelasyon katsayısı r=+0.400 olmuştur. Her iki çiftlikte 3 ve 6 aylık canlı ağırlıklar arasındaki korrelasyon
katsayısı aynı kabul edilebilir mi? % 5 önemlilik seviyesinde kontrol edelim. Birinci çiftlik için 1 ve ikinci için
2 ise
S2(Z1-Z2) = + = + = 0.068
S( ) = 0.260 dır.
O halde;
( ) (µ µ ) ( . . )
t= = = 0.481
( ) .
t=
oranı (n-2) serbestlik dereceli t dağılışı izler. O halde hipotez kontrolünde t-Test dağılışı kullanılır. Kritik t
değerleri iki-yönlü testler için t(n-2)() tek-yönlü testler için ise t(n-2)(2 ) dır.
ÖRNEK: 9 toprak örneğinde tuz konsantrasyonunun (%), elektiriği geçirgenlik (mmhos) üzerine olan
regresyon katsayısı b=+0.49 olarak bulunmuştu. Yine, bulunan b değerinin 7 serbestlik dereceli standart hatası
Sb= 0.031 ve bu standart hata için SD = 7 idi.
Tuz konsantrasyonunun elektiriği geçirgenllk üzerine olan regresyon katsayısı önemlimidir? 0.05 düzeyinde
kontrol edelim. Söz konusu regresyon katsayısı ile gösterilirse
H0 : =0 (önemsizdir)
H0 : 0 (önemlidir)
.
t= = = = +15.81
.
değerinin 1'e eşit olup olmadığı ve 1'den küçük olup olmadığı hipotezlerini kurarak 0.05 düzeyinde sizler
kontrol ediniz.
oranı n1+n2-4 serbestlik dereceli t dağılışı izlemektedir. Kritik t değerleri t (n1+n2-4) ( ) veya t(n1+n2-4)(2) dır.
ÖRNEK: Bir tarlada yakalanan 8 lahana kelebeğinde vücut ağırlığı (X) ve kanat açıklığı (Y) değerleri şöyle
bulunmuştur.
İkinci bir tarlada bu kez 7 lahana kelebeğinde gözlenen aynı değişkenlerin değerleri ise aşağıda
verilmiştir.
Gözlemlerin yapıldığı her iki tarlada kanat açıklığının vücut ağırlığı üzerine olan regresyon
katsayılarının aynı olduğu söylenebilir mi? 0.05 düzeyinde kontrol edelim.
Birinci tarla verilerinden
y12= 56.58; x12= 0.74; x1 y1= 6.37 ; n1=8
ve b1=+8.61mm olduğu hesaplanır. Yine regresyondan sapmaların varyansının S2Dı= 0.2911 ve b1'ın
varyansının S2b1= S2D1 / x12= 0.2911/ 0.74= 0.393 olduğu görülür.
İkinci tarlada yapılan gözlemler için aynı değerler ise şöyledir:
Birinci tarlada ilgili regresyon katsayısı 1 ve ikinci tarlada 2 ise uygun hipotezler şöyle kurulur.
H0 : 1-2=0 ve H1: 1-20
( ) 0 ( . . )
t= = = +0.881 SD = n1+n2 – 4 = 8+7 - 4 = 11 dir.
( ) .
Kritik t değeri t11 (0.05)= 2.201 dir.
Sonuç: 0.881 < 2.201 olduğundan H0 hipotezi kabul edilir. Her iki tarlanın regresyon katsayıları aynıdır. 8.61-
6.78=1.83 mm llk farklılık tesadüflükten kaynaklanmıştır.
Verilecek kontrol yöntemlerinin geçerli olması değerlerin normal dağılış göstermesine bağlı
olduğundan, burada verilerin normal dağılış gösterdiği varsayılacaktır.
X1, X2,......Xn varyantları bağımsız fakat aynı N( ,2 ) normal dağılışa sahip olduğu durumda
∑
2 = =
oranının v serbestlik dereceli (v = n - l) bir khi-kare dağılışı izlediğini daha önce görmüştük (7.2.3). O
nedenle x2 veya vS2 'nin test istatistiği serbestlik dereceli bir 2 değeridir. Bu durum bize, örneğin
çekildiği populasyonun varyansının (2) herhangi bir hipotetik değere, örneğin 02 değerine, eşit olup
olmadığının kontrol edelmesi olanağını sağlar.
Hipotetik değerin 02 olduğunu kabul edersek iki ve tek-yönlü kontrollere ait hipotezler aşağıda olduğu gibi
yazılabilir.
H0 : 2 = 02
H1 : 2 02; H1: 2 >02 ; H1: 2 < 02
Şüphesiz H0, geçerli olduğu durumda;
2 =
ÖRNEK l: 20 adet kobayın vücut ağırlıklarının varyans 1225 olarak bulunmuştur. Hayvanların alındığı
populasyonun vücut ağırlıkları varyansının 676 olduğu söylenebillrmi? 0.05 olasılık düzeyinde test edelim.
Populasyonun varyans 2 ile gösterilirse hipotezler,
H0 : 2 = 676
H1: 2 676
2 = = = 34.43
Sonuç: 34.43 > 32.85 olduğundan H0 hipotezi reddedilecektir. 34.43 değeri red alanına düşmüştür. Populasyon
varyansının 676 olması söz konusu değildir.
Populasyon varyansının, hipotetik değerden büyük olduğuna dair (H1:2 > 02) hipotez kontrolünde ise
kritik khi-kare değeri 2v() olmaktadır. Eğer
2 > 2v () ise H0 reddedilir ve aksi durumda H0 kabul edilir.
% 2.5
% 95
% 2.5
Populasyona girme alanı
19 SD’li Khi-Kare-dağılışı
ÖRNEK 2: Yukarıdaki kobay örneğinde populasyonun varyansının 676 dan büyük olduğu söylenebilir mi?
Yine 0.05 önemlilik seviyesinde kontrol edelim.
H0 : 2 = 676
H1 : 2 >676
2 = = = 34.43
30.14 34.43
19 SD’li Khi-Kare-dağılışı
/
F= =
/
oranları f1 ve f2 serbestlik dereceli bir F dağılışı izliyordu. O nedenle oranın test istatistiği F olmaktadır. Çeşitli
f1 ve f2 serbestlik derecelerinde ve yalnız % 5 ve % l düzeylerindeki kritik değerler EK TABLO 5'de verilmiştir.
Söz konusu tablodaki değerler, dağılışın yalnız sağ tarafındaki % 95 ve % 5 veya % 99 ve % 1'lik kabul-red
alanlarını ayıran kritik değerler olduğundan ve l'den daha büyük F kritik değerleri verildiğinden;
1-EK TABLO 5 kullanılarak ancak H1: 12 > 22 hipotezi kontrol edilebilir. H1: 2 1 22 ve H1: 21
< 22 hipotez kontrolleri için yeni tablı değerlerine ihtiyaç vardır.
2-Örneklerin varyans oranları hesaplanırken büyük varyans paya ve küçük varyans ise paydaya yazılır.
3-Hipotez kontrolleri yalnız 0.05 veya 0.01 seviyelerinde yapılabilir ki bu iki olasılık çoğu araştırmalar
için yeterlidir.
Yukarıda belirtilen noktaların ışığı altında, büyük varyans S12, serbestlik derecesi f1; küçük varyans S22
ve serbestlik derecesi f2 ise önemlilik seviyesinde kritik F değeri EK TABLO 5'de
Ffı,f2 ()
olarak bulunur. Eğer F > Ff1,f2 ( ) ise H0 hipotezi reddellllr. Aksi durumda H0 hipotezi kabul edilir.
ÖRNEK: 18 varyantlık bir örnekte varyans 28.56 ve 25 varyantlık bir başka örnekte varyans 36.86
bulunmuştur. Her iki örneğin çekildiği populasyonların varyanslarının eşit olduğu kabul edilebilir mi? 0.01
olasılık düzeyinde kontrol edelim.
İkinci örneğin varyansı daha büyük olduğundan bunu S12=36.86 olarak ele alalım ve f1=n1-l= 24 dür.
Buna göre
S22= 28.56 ve f2=n2-1= 17 dir.
.
F= = = 1.29
.
O halde; 1.29 < 3.08 olduğundan H0 kabul edilir, populasyonların varyansları eşittir.
Yukarıda belirtildiği şekilde iki populasyonun varyanslarının eşit olup olmadığı konusunda, H1: 12 > 22
tek-yönlü hipotez kontrolü yeterlidir. İki-yönlü ve dağılışın sol tarafı ile ilgili tek-yönlü testlere gerek yoktur. O
nedenle burada ele alınmayacaktır.
6.14.3.Mendel’in Açılma Oranlarına Uyum Kontrolü
ÖRNEK: İki mısır çeşiti melezlenmiş ve F2 generasyonunda incelenen 1308 bitkinin sap renklerine göre
dağılımı aşağıda olduğu gibi dört farklı sınıfta toplanmıştır. Buna göre sap rengi açısından 4 farklı fenotip sınıfı
oluşmuştur. Dihidrit bir açılmayı ima etmektedir. Örneğin; ebeveynler muhtemel AABB= yeşil-düz ve
aabb=altın-çizgilidir. Yeşil renk altına ve düz şekil çizgiliye baskındır. Bu ön bilgilere göre F2'de 9:3:3:l
oranında açılma olması beklenir.
Gözlenen Beklenen
Sap Rengi frek.(f) frek.(fı) f-fı (f-fı)2/fı
sıfır hipotezi; "1308 bitkilik örnekte açılım 9:3:3:1 Mendel açılımına uyar" hipotezidir. sıfır hipotezi geçerli
olduğunda bir yeşil-düz bitki görülme olasılığı 9/16 dır. O halde örnekte birinci sınıfın beklenen bitki sayısı
1308x9/16= 735.8 dir. Diğer üç sınıfın beklenen frekansları sırası ile 3/16, 3/16 ve 1/16 olasılıklarıyla
hesaplanır. Beklenen frekanslar (fı), f-fı farklılıkları ve bunların Khi-kareye katkıları da aynı tablonun son
sütunlarında verilmiştir. Toplam Khi-kare;
2 = ∑ (𝐟 − 𝐟 )𝟐 /𝐟′
. . . .
2 = ( )2+( )2 + ( )2 + ( )2 = 5.96
. . . .
2 =5.96 olup SD=k-1=3 tür. Aynı serbestlik derecesinde 5.96'nın olasılığının (p) % 10'dan fazla olduğu
görülür. Öte yandan, 23(0.05) = 7.815 dir. Sonuçta, 5.96 < 7.815 olduğundan sıfır hipotezi kabul edilir.
Örnekteki sap renginin açılımı 9:3:3:1 oranına uyar. Mısırda sap renginin iki allelli iki lokus tarafından idare
edildiği söylenebilir.
ÖRNEK: Susamda açık kapsüllü ve beyaz taneli bir çeşit (AABB) ile kapalı kapsüllü ve sarı taneli bir
çeşit (aabb) arasında yapılan melezlemenin F2 açılma generasyonunda elde edilen bitkilerin, oluşan 4 fenotipe
göre sayısal olarak dağılımı şu şekilde gözlenmiştir.
Fenotip F2’de Bitki Sayısı(Adet)
Açık kapsüllü + Beyaz taneli : 2604
Açık kapsüllü + Sarı taneli : 876
Kapalı kapsüllü + Beyaz taneli : 847
Kapalı kapsüllü + Sarı taneli : 273
Not : Susamda açık kapsüllü olma dominant A geni ile ve beyaz taneli olma ise dominant B geni ile idare
edilmektedir. F2 generasyonunda dihibrit (9:3:3:1 açılımı) söz konusudur. Buna göre aşağıdaki soruları
yanıtlayınız.
Bu denemede F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılımına uygun mudur ? 0.01 olasılık düzeyinde test
ediniz.
Kapalı kapsüllü ve sarı taneli bitki görülme olasılığı (beklenen frekans) 4600 x 1/16 = 287.5
2 = ∑ (𝐟 − 𝐟 )𝟐 /𝐟′
. . . .
2 = ( )2+( )2 + ( )2 + ( )2 = 1.33 SD = k -1 = 4 -1 = 3
. . . .
SD = 3 de 2 (0.01) kritik değeri ; 2 3(0.01) = 11.345 dir. Buna göre, 1.33 < 11.345 olduğundan sıfır hipotezi
kabul edilir. F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılıma uymaktadır.
ÖRNEK: Bir bölgede bulunan 5l7 adet tarım çiftliği üç toprak fertilitesine (R=3) ve üç farklı kullanım
şekline (C=3) göre 9 farklı sınıfa gruplandırılmış ve sonuçları aşağıda verilmiştir.
Böyle bir sayı tablosunda çok çeşitli sorular sorulabilir. Örneğin; arazi kullanım şeklinin oransal miktarı
(Kiralık işletme oranı gibi) üç toprak fertilite tipinde de aynı mıdır? Veya toprak verimlilik seviyesinin dağılışı
üç arazi kullanım şeklinde de aynı mıdır? Her iki sorunun yanıtı da arazi kullanım şeklinin toprak verimlilik
seviyesine bağlı olup olmadığı ile verilebilir. O halde sıfır hipotezi (H0): Arazi kullanım şekli, toprak verimlilik
seviyesine bağlı değildir. Veya her iki karakter bağımsızdır.
Sıfır hipotezinin geçerli olduğu durumda her bir sınıfın beklenen sayıları fı=O sınıfın sıra toplamı x sütun
toplamı/genel toplam eşitliğiyle bulunabilir. Örneğin; "Kendisi" tarafından kullanılan üç toprak tipinin beklenen
frekansları sıra ile;
f1=152x125/517= 36.75
f4= 140x125/517= 33.85
f7= 225x125/517= 54.40
Toplam 125.00
Diğer beklenen frekanslar ve f-fı farklılıkları ise aşağıdaki tabloda topluca verilmiştir. Beklenen değerlerin de
sıra ve sütunlar üzerinden toplamları da aynıdır. Ayrıca sıralar ve sütünlar üzerinden f- fı toplamları sıfırdır.
Toprak A. K u l l a n ı m Ş e k l i
fertilitesi Frekans Kendisi Kiralık Karışık Toplam
f 36 67 49
Zayıf fı 36.75 62.92 52.33 152
f- fı -0.75 4.08 -3.33 0
f 31 60 49
Orta fı 33.95 57.95 48.20 140
f- fı -2.85 2.05 0.80 0
f 58 87 80
Verimli fı 54.40 93.13 77.47 225
f- fı 3.60 -6.13 2.53 5.7
(-0.075)2 (2.53) 2
2 = ----------- + .......+ ---------= 1.54 dür.
36.75 77.47
SD=(R-1)(C-1)=2x2= 4 dür. p>% 80 olduğundan sıfır hipotezi kabul edilir. Arazi kullanım şekli, toprak
verimlilik seviyesine bağlı değildir, bu iki karakter bağımsızdır.
Sıfır hipotezi reddedildiği durumda, bağımsızlıktan ayrılışın nedenlerini detaylı olarak araştırmak gerekir.
Örneğin; Khi-kareye en fazla katkıda bulunan sınıfların incelenmesi çok önemlidir. İkinci olarak, bir sütunda
sıraların veya bir sırada sütunların seviyelerinin oransal değerleride hesaplanarak bunlardan anlamlı bilgiler
üretilir. Örneğin; sıra seviyelerinin oransal dağılışı iki sütunda aynı ise sadece bu iki sütunu içine alan bir Khi-
kare testi yapılabilir.
EK TABLO III
Z Cetveli
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
t-Cetveli
Önem düzeyi ()
sd 0.2 0.1 0.05 0.02 0.01 0.002 0.001
1 3.078 6.314 12.706 31.821 63.656 318.289 636.578
2 1.886 2.920 4.303 6.965 9.925 22.328 31.600
3 1.638 2.353 3.182 4.541 5.841 10.214 12.924
4 1.533 2.132 2.776 3.747 4.604 7.173 8.610
5 1.476 2.015 2.571 3.365 4.032 5.894 6.869
6 1.440 1.943 2.447 3.143 3.707 5.208 5.959
7 1.415 1.895 2.365 2.998 3.499 4.785 5.408
8 1.397 1.860 2.306 2.896 3.355 4.501 5.041
9 1.383 1.833 2.262 2.821 3.250 4.297 4.781
10 1.372 1.812 2.228 2.764 3.169 4.144 4.587
11 1.363 1.796 2.201 2.718 3.106 4.025 4.437
12 1.356 1.782 2.179 2.681 3.055 3.930 4.318
13 1.350 1.771 2.160 2.650 3.012 3.852 4.221
14 1.345 1.761 2.145 2.624 2.977 3.787 4.140
15 1.341 1.753 2.131 2.602 2.947 3.733 4.073
16 1.337 1.746 2.120 2.583 2.921 3.686 4.015
17 1.333 1.740 2.110 2.567 2.898 3.646 3.965
18 1.330 1.734 2.101 2.552 2.878 3.610 3.922
19 1.328 1.729 2.093 2.539 2.861 3.579 3.883
20 1.325 1.725 2.086 2.528 2.845 3.552 3.850
21 1.323 1.721 2.080 2.518 2.831 3.527 3.819
22 1.321 1.717 2.074 2.508 2.819 3.505 3.792
23 1.319 1.714 2.069 2.500 2.807 3.485 3.768
24 1.318 1.711 2.064 2.492 2.797 3.467 3.745
25 1.316 1.708 2.060 2.485 2.787 3.450 3.725
26 1.315 1.706 2.056 2.479 2.779 3.435 3.707
27 1.314 1.703 2.052 2.473 2.771 3.421 3.689
28 1.313 1.701 2.048 2.467 2.763 3.408 3.674
29 1.311 1.699 2.045 2.462 2.756 3.396 3.660
30 1.310 1.697 2.042 2.457 2.750 3.385 3.646
60 1.296 1.671 2.000 2.390 2.660 3.232 3.460
120 1.289 1.658 1.980 2.358 2.617 3.160 3.373
∞ 1.282 1.645 1.960 2.326 2.576 3.091 3.291
Ki-Kare Cetveli
Önem düzeyi ()
sd .995 .990 .975 .950 .900 .750 .500 .250 .100 .050 .025 .010 .005
1 0.00004 0.00016 0.00098 0.00393 0.01579 0.10153 0.45494 1.32330 2.70554 3.84146 5.02389 6.63490 7.87944
2 0.01003 0.02010 0.05064 0.10259 0.21072 0.57536 1.38629 2.77259 4.60517 5.99146 7.37776 9.21034 10.59663
3 0.07172 0.11483 0.21580 0.35185 0.58437 1.21253 2.36597 4.10834 6.25139 7.81473 9.34840 11.34487 12.83816
4 0.20699 0.29711 0.48442 0.71072 1.06362 1.92256 3.35669 5.38527 7.77944 9.48773 11.14329 13.27670 14.86026
5 0.41174 0.55430 0.83121 1.14548 1.61031 2.67460 4.35146 6.62568 9.23636 11.07050 12.83250 15.08627 16.74960
6 0.67573 0.87209 1.23734 1.63538 2.20413 3.45460 5.34812 7.84080 10.64464 12.59159 14.44938 16.81189 18.54758
7 0.98926 1.23904 1.68987 2.16735 2.83311 4.25485 6.34581 9.03715 12.01704 14.06714 16.01276 18.47531 20.27774
8 1.34441 1.64650 2.17973 2.73264 3.48954 5.07064 7.34412 10.21885 13.36157 15.50731 17.53455 20.09024 21.95495
9 1.73493 2.08790 2.70039 3.32511 4.16816 5.89883 8.34283 11.38875 14.68366 16.91898 19.02277 21.66599 23.58935
10 2.15586 2.55821 3.24697 3.94030 4.86518 6.73720 9.34182 12.54886 15.98718 18.30704 20.48318 23.20925 25.18818
11 2.60322 3.05348 3.81575 4.57481 5.57778 7.58414 10.34100 13.70069 17.27501 19.67514 21.92005 24.72497 26.75685
12 3.07382 3.57057 4.40379 5.22603 6.30380 8.43842 11.34032 14.84540 18.54935 21.02607 23.33666 26.21697 28.29952
13 3.56503 4.10692 5.00875 5.89186 7.04150 9.29907 12.33976 15.98391 19.81193 22.36203 24.73560 27.68825 29.81947
14 4.07467 4.66043 5.62873 6.57063 7.78953 10.16531 13.33927 17.11693 21.06414 23.68479 26.11895 29.14124 31.31935
15 4.60092 5.22935 6.26214 7.26094 8.54676 11.03654 14.33886 18.24509 22.30713 24.99579 27.48839 30.57791 32.80132
16 5.14221 5.81221 6.90766 7.96165 9.31224 11.91222 15.33850 19.36886 23.54183 26.29623 28.84535 31.99993 34.26719
17 5.69722 6.40776 7.56419 8.67176 10.08519 12.79193 16.33818 20.48868 24.76904 27.58711 30.19101 33.40866 35.71847
18 6.26480 7.01491 8.23075 9.39046 10.86494 13.67529 17.33790 21.60489 25.98942 28.86930 31.52638 34.80531 37.15645
19 6.84397 7.63273 8.90652 10.11701 11.65091 14.56200 18.33765 22.71781 27.20357 30.14353 32.85233 36.19087 38.58226
20 7.43384 8.26040 9.59078 10.85081 12.44261 15.45177 19.33743 23.82769 28.41198 31.41043 34.16961 37.56623 39.99685
21 8.03365 8.89720 10.28290 11.59131 13.23960 16.34438 20.33723 24.93478 29.61509 32.67057 35.47888 38.93217 41.40106
22 8.64272 9.54249 10.98232 12.33801 14.04149 17.23962 21.33704 26.03927 30.81328 33.92444 36.78071 40.28936 42.79565
23 9.26042 10.19572 11.68855 13.09051 14.84796 18.13730 22.33688 27.14134 32.00690 35.17246 38.07563 41.63840 44.18128
24 9.88623 10.85636 12.40115 13.84843 15.65868 19.03725 23.33673 28.24115 33.19624 36.41503 39.36408 42.97982 45.55851
25 10.51965 11.52398 13.11972 14.61141 16.47341 19.93934 24.33659 29.33885 34.38159 37.65248 40.64647 44.31410 46.92789
26 11.16024 12.19815 13.84390 15.37916 17.29188 20.84343 25.33646 30.43457 35.56317 38.88514 41.92317 45.64168 48.28988
27 11.80759 12.87850 14.57338 16.15140 18.11390 21.74940 26.33634 31.52841 36.74122 40.11327 43.19451 46.96294 49.64492
28 12.46134 13.56471 15.30786 16.92788 18.93924 22.65716 27.33623 32.62049 37.91592 41.33714 44.46079 48.27824 50.99338
29 13.12115 14.25645 16.04707 17.70837 19.76774 23.56659 28.33613 33.71091 39.08747 42.55697 45.72229 49.58788 52.33562
30 13.78672 14.95346 16.79077 18.49266 20.59923 24.47761 29.33603 34.79974 40.25602 43.77297 46.97924 50.89218 53.67196
F Cetveli (=0.05)
sd2
/sd 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1
161. 199. 215. 224. 230. 233. 236. 238. 240. 241. 243. 245. 248. 249. 250. 251. 252. 253. 254.
1
4476 5000 7073 5832 1619 9860 7684 8827 5433 8817 9060 9499 0131 0518 0951 1432 1957 2529 3144
18.5 19.0 19.1 19.2 19.2 19.3 19.3 19.3 19.3 19.3 19.4 19.4 19.4 19.4 19.4 19.4 19.4 19.4 19.4
2
128 000 643 468 964 295 532 710 848 959 125 291 458 541 624 707 791 874 957
10.1 9.55 9.27 9.11 9.01 8.94 8.88 8.84 8.81 8.78 8.74 8.70 8.66 8.63 8.61 8.59 8.57 8.54 8.52
3
280 21 66 72 35 06 67 52 23 55 46 29 02 85 66 44 20 94 64
7.70 6.94 6.59 6.38 6.25 6.16 6.09 6.04 5.99 5.96 5.91 5.85 5.80 5.77 5.74 5.71 5.68 5.65 5.62
4
86 43 14 82 61 31 42 10 88 44 17 78 25 44 59 70 77 81 81
6.60 5.78 5.40 5.19 5.05 4.95 4.87 4.81 4.77 4.73 4.67 4.61 4.55 4.52 4.49 4.46 4.43 4.39 4.36
5
79 61 95 22 03 03 59 83 25 51 77 88 81 72 57 38 14 85 50
5.98 5.14 4.75 4.53 4.38 4.28 4.20 4.14 4.09 4.06 3.99 3.93 3.87 3.84 3.80 3.77 3.73 3.70 3.66
6
74 33 71 37 74 39 67 68 90 00 99 81 42 15 82 43 98 47 89
5.59 4.73 4.34 4.12 3.97 3.86 3.78 3.72 3.67 3.63 3.57 3.51 3.44 3.41 3.37 3.34 3.30 3.26 3.22
7
14 74 68 03 15 60 70 57 67 65 47 07 45 05 58 04 43 74 98
5.31 4.45 4.06 3.83 3.68 3.58 3.50 3.43 3.38 3.34 3.28 3.21 3.15 3.11 3.07 3.04 3.00 2.96 2.92
8
77 90 62 79 75 06 05 81 81 72 39 84 03 52 94 28 53 69 76
5.11 4.25 3.86 3.63 3.48 3.37 3.29 3.22 3.17 3.13 3.07 3.00 2.93 2.90 2.86 2.82 2.78 2.74 2.70
9
74 65 25 31 17 38 27 96 89 73 29 61 65 05 37 59 72 75 67
4.96 4.10 3.70 3.47 3.32 3.21 3.13 3.07 3.02 2.97 2.91 2.84 2.77 2.73 2.69 2.66 2.62 2.58 2.53
10
46 28 83 80 58 72 55 17 04 82 30 50 40 72 96 09 11 01 79
4.84 3.98 3.58 3.35 3.20 3.09 3.01 2.94 2.89 2.85 2.78 2.71 2.64 2.60 2.57 2.53 2.49 2.44 2.40
11
43 23 74 67 39 46 23 80 62 36 76 86 64 90 05 09 01 80 45
4.74 3.88 3.49 3.25 3.10 2.99 2.91 2.84 2.79 2.75 2.68 2.61 2.54 2.50 2.46 2.42 2.38 2.34 2.29
12
72 53 03 92 59 61 34 86 64 34 66 69 36 55 63 59 42 10 62
4.66 3.80 3.41 3.17 3.02 2.91 2.83 2.76 2.71 2.67 2.60 2.53 2.45 2.42 2.38 2.33 2.29 2.25 2.20
13
72 56 05 91 54 53 21 69 44 10 37 31 89 02 03 92 66 24 64
4.60 3.73 3.34 3.11 2.95 2.84 2.76 2.69 2.64 2.60 2.53 2.46 2.38 2.34 2.30 2.26 2.22 2.17 2.13
14
01 89 39 22 82 77 42 87 58 22 42 30 79 87 82 64 29 78 07
4.54 3.68 3.28 3.05 2.90 2.79 2.70 2.64 2.58 2.54 2.47 2.40 2.32 2.28 2.24 2.20 2.16 2.11 2.06
15
31 23 74 56 13 05 66 08 76 37 53 34 75 78 68 43 01 41 58
4.49 3.63 3.23 3.00 2.85 2.74 2.65 2.59 2.53 2.49 2.42 2.35 2.27 2.23 2.19 2.15 2.10 2.05 2.00
16
40 37 89 69 24 13 72 11 77 35 47 22 56 54 38 07 58 89 96
4.45 3.59 3.19 2.96 2.81 2.69 2.61 2.54 2.49 2.44 2.38 2.30 2.23 2.18 2.14 2.10 2.05 2.01 1.96
17
13 15 68 47 00 87 43 80 43 99 07 77 04 98 77 40 84 07 04
4.41 3.55 3.15 2.92 2.77 2.66 2.57 2.51 2.45 2.41 2.34 2.26 2.19 2.14 2.10 2.06 2.01 1.96 1.91
18
39 46 99 77 29 13 67 02 63 17 21 86 06 97 71 29 66 81 68
4.38 3.52 3.12 2.89 2.74 2.62 2.54 2.47 2.42 2.37 2.30 2.23 2.15 2.11 2.07 2.02 1.97 1.93 1.87
19
07 19 74 51 01 83 35 68 27 79 80 41 55 41 12 64 95 02 80
4.35 3.49 3.09 2.86 2.71 2.59 2.51 2.44 2.39 2.34 2.27 2.20 2.12 2.08 2.03 1.99 1.94 1.89 1.84
20
12 28 84 61 09 90 40 71 28 79 76 33 42 25 91 38 64 63 32
4.32 3.46 3.07 2.84 2.68 2.57 2.48 2.42 2.36 2.32 2.25 2.17 2.09 2.05 2.01 1.96 1.91 1.86 1.81
21
48 68 25 01 48 27 76 05 60 10 04 57 60 40 02 45 65 57 17
4.30 3.44 3.04 2.81 2.66 2.54 2.46 2.39 2.34 2.29 2.22 2.15 2.07 2.02 1.98 1.93 1.88 1.83 1.78
22
09 34 91 67 13 91 38 65 19 67 58 08 07 83 42 80 94 80 31
4.27 3.42 3.02 2.79 2.64 2.52 2.44 2.37 2.32 2.27 2.20 2.12 2.04 2.00 1.96 1.91 1.86 1.81 1.75
23
93 21 80 55 00 77 22 48 01 47 36 82 76 50 05 39 48 28 70
2
4.25 3.40 3.00 2.77 2.62 2.50 2.42 2.35 2.30 2.25 2.18 2.10 2.02 1.98 1.93 1.89 1.84 1.78 1.73
24
97 28 88 63 07 82 26 51 02 47 34 77 67 38 90 20 24 96 30
4.24 3.38 2.99 2.75 2.60 2.49 2.40 2.33 2.28 2.23 2.16 2.08 2.00 1.96 1.91 1.87 1.82 1.76 1.71
25
17 52 12 87 30 04 47 71 21 65 49 89 75 43 92 18 17 84 10
4.22 3.36 2.97 2.74 2.58 2.47 2.38 2.32 2.26 2.21 2.14 2.07 1.98 1.94 1.90 1.85 1.80 1.74 1.69
26
52 90 52 26 68 41 83 05 55 97 79 16 98 64 10 33 27 88 06
4.21 3.35 2.96 2.72 2.57 2.45 2.37 2.30 2.25 2.20 2.13 2.05 1.97 1.92 1.88 1.83 1.78 1.73 1.67
27
00 41 04 78 19 91 32 53 01 43 23 58 36 99 42 61 51 06 17
4.19 3.34 2.94 2.71 2.55 2.44 2.35 2.29 2.23 2.19 2.11 2.04 1.95 1.91 1.86 1.82 1.76 1.71 1.65
28
60 04 67 41 81 53 93 13 60 00 79 11 86 47 87 03 89 38 41
4.18 3.32 2.93 2.70 2.54 2.43 2.34 2.27 2.22 2.17 2.10 2.02 1.94 1.90 1.85 1.80 1.75 1.69 1.63
29
30 77 40 14 54 24 63 83 29 68 45 75 46 05 43 55 37 81 76
4.17 3.31 2.92 2.68 2.53 2.42 2.33 2.26 2.21 2.16 2.09 2.01 1.93 1.88 1.84 1.79 1.73 1.68 1.62
30
09 58 23 96 36 05 43 62 07 46 21 48 17 74 09 18 96 35 23
4.08 3.23 2.83 2.60 2.44 2.33 2.24 2.18 2.12 2.07 2.00 1.92 1.83 1.79 1.74 1.69 1.63 1.57 1.50
40
47 17 87 60 95 59 90 02 40 72 35 45 89 29 44 28 73 66 89
4.00 3.15 2.75 2.52 2.36 2.25 2.16 2.09 2.04 1.99 1.91 1.83 1.74 1.70 1.64 1.59 1.53 1.46 1.38
60
12 04 81 52 83 41 65 70 01 26 74 64 80 01 91 43 43 73 93
3.92 3.07 2.68 2.44 2.28 2.17 2.08 2.01 1.95 1.91 1.83 1.75 1.65 1.60 1.55 1.49 1.42 1.35 1.25
120
01 18 02 72 99 50 68 64 88 05 37 05 87 84 43 52 90 19 39
3.84 2.99 2.60 2.37 2.21 2.09 2.00 1.93 1.87 1.83 1.75 1.66 1.57 1.51 1.45 1.39 1.31 1.22 1.00
∞ 15 57 49 19 41 86 96 84 99 07 22 64 05 73 91 40 80 14 00
F Cetveli (=0.01)
sd2
/sd 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1
4052 4999 5403 5624 5763 5858 5928 5981 6022 6055 6106 6157 6208 6234 6260 6286 6313 6339 6365
1
.181 .500 .352 .583 .650 .986 .356 .070 .473 .847 .321 .285 .730 .631 .649 .782 .030 .391 .864
98.5 99.0 99.1 99.2 99.2 99.3 99.3 99.3 99.3 99.3 99.4 99.4 99.4 99.4 99.4 99.4 99.4 99.4 99.4
2
03 00 66 49 99 33 56 74 88 99 16 33 49 58 66 74 82 91 99
34.1 30.8 29.4 28.7 28.2 27.9 27.6 27.4 27.3 27.2 27.0 26.8 26.6 26.5 26.5 26.4 26.3 26.2 26.1
3
16 17 57 10 37 11 72 89 45 29 52 72 90 98 05 11 16 21 25
21.1 18.0 16.6 15.9 15.5 15.2 14.9 14.7 14.6 14.5 14.3 14.1 14.0 13.9 13.8 13.7 13.6 13.5 13.4
4
98 00 94 77 22 07 76 99 59 46 74 98 20 29 38 45 52 58 63
16.2 13.2 12.0 11.3 10.9 10.6 10.4 10.2 10.1 10.0 9.88 9.72 9.55 9.46 9.37 9.29 9.20 9.11 9.02
5
58 74 60 92 67 72 56 89 58 51 8 2 3 6 9 1 2 2 0
13.7 10.9 9.78 9.14 8.74 8.46 8.26 8.10 7.97 7.87 7.71 7.55 7.39 7.31 7.22 7.14 7.05 6.96 6.88
6
45 25 0 8 6 6 0 2 6 4 8 9 6 3 9 3 7 9 0
12.2 9.54 8.45 7.84 7.46 7.19 6.99 6.84 6.71 6.62 6.46 6.31 6.15 6.07 5.99 5.90 5.82 5.73 5.65
7
46 7 1 7 0 1 3 0 9 0 9 4 5 4 2 8 4 7 0
11.2 8.64 7.59 7.00 6.63 6.37 6.17 6.02 5.91 5.81 5.66 5.51 5.35 5.27 5.19 5.11 5.03 4.94 4.85
8
59 9 1 6 2 1 8 9 1 4 7 5 9 9 8 6 2 6 9
10.5 8.02 6.99 6.42 6.05 5.80 5.61 5.46 5.35 5.25 5.11 4.96 4.80 4.72 4.64 4.56 4.48 4.39 4.31
9
61 2 2 2 7 2 3 7 1 7 1 2 8 9 9 7 3 8 1
10.0 7.55 6.55 5.99 5.63 5.38 5.20 5.05 4.94 4.84 4.70 4.55 4.40 4.32 4.24 4.16 4.08 3.99 3.90
10
44 9 2 4 6 6 0 7 2 9 6 8 5 7 7 5 2 6 9
11 9.64 7.20 6.21 5.66 5.31 5.06 4.88 4.74 4.63 4.53 4.39 4.25 4.09 4.02 3.94 3.86 3.77 3.69 3.60
3
6 6 7 8 6 9 6 4 2 9 7 1 9 1 1 0 6 0 2
9.33 6.92 5.95 5.41 5.06 4.82 4.64 4.49 4.38 4.29 4.15 4.01 3.85 3.78 3.70 3.61 3.53 3.44 3.36
12
0 7 3 2 4 1 0 9 8 6 5 0 8 0 1 9 5 9 1
9.07 6.70 5.73 5.20 4.86 4.62 4.44 4.30 4.19 4.10 3.96 3.81 3.66 3.58 3.50 3.42 3.34 3.25 3.16
13
4 1 9 5 2 0 1 2 1 0 0 5 5 7 7 5 1 5 5
8.86 6.51 5.56 5.03 4.69 4.45 4.27 4.14 4.03 3.93 3.80 3.65 3.50 3.42 3.34 3.26 3.18 3.09 3.00
14
2 5 4 5 5 6 8 0 0 9 0 6 5 7 8 6 1 4 4
8.68 6.35 5.41 4.89 4.55 4.31 4.14 4.00 3.89 3.80 3.66 3.52 3.37 3.29 3.21 3.13 3.04 2.95 2.86
15
3 9 7 3 6 8 2 4 5 5 6 2 2 4 4 2 7 9 8
8.53 6.22 5.29 4.77 4.43 4.20 4.02 3.89 3.78 3.69 3.55 3.40 3.25 3.18 3.10 3.01 2.93 2.84 2.75
16
1 6 2 3 7 2 6 0 0 1 3 9 9 1 1 8 3 5 3
8.40 6.11 5.18 4.66 4.33 4.10 3.92 3.79 3.68 3.59 3.45 3.31 3.16 3.08 3.00 2.92 2.83 2.74 2.65
17
0 2 5 9 6 2 7 1 2 3 5 2 2 4 3 0 5 6 3
8.28 6.01 5.09 4.57 4.24 4.01 3.84 3.70 3.59 3.50 3.37 3.22 3.07 2.99 2.91 2.83 2.74 2.66 2.56
18
5 3 2 9 8 5 1 5 7 8 1 7 7 9 9 5 9 0 6
8.18 5.92 5.01 4.50 4.17 3.93 3.76 3.63 3.52 3.43 3.29 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.48
19
5 6 0 0 1 9 5 1 3 4 7 3 3 5 4 1 4 4 9
8.09 5.84 4.93 4.43 4.10 3.87 3.69 3.56 3.45 3.36 3.23 3.08 2.93 2.85 2.77 2.69 2.60 2.51 2.42
20
6 9 8 1 3 1 9 4 7 8 1 8 8 9 8 5 8 7 1
8.01 5.78 4.87 4.36 4.04 3.81 3.64 3.50 3.39 3.31 3.17 3.03 2.88 2.80 2.72 2.63 2.54 2.45 2.36
21
7 0 4 9 2 2 0 6 8 0 3 0 0 1 0 6 8 7 0
7.94 5.71 4.81 4.31 3.98 3.75 3.58 3.45 3.34 3.25 3.12 2.97 2.82 2.74 2.66 2.58 2.49 2.40 2.30
22
5 9 7 3 8 8 7 3 6 8 1 8 7 9 7 3 5 3 5
7.88 5.66 4.76 4.26 3.93 3.71 3.53 3.40 3.29 3.21 3.07 2.93 2.78 2.70 2.62 2.53 2.44 2.35 2.25
23
1 4 5 4 9 0 9 6 9 1 4 1 1 2 0 5 7 4 6
7.82 5.61 4.71 4.21 3.89 3.66 3.49 3.36 3.25 3.16 3.03 2.88 2.73 2.65 2.57 2.49 2.40 2.31 2.21
24
3 4 8 8 5 7 6 3 6 8 2 9 8 9 7 2 3 0 1
7.77 5.56 4.67 4.17 3.85 3.62 3.45 3.32 3.21 3.12 2.99 2.85 2.69 2.62 2.53 2.45 2.36 2.27 2.16
25
0 8 5 7 5 7 7 4 7 9 3 0 9 0 8 3 4 0 9
7.72 5.52 4.63 4.14 3.81 3.59 3.42 3.28 3.18 3.09 2.95 2.81 2.66 2.58 2.50 2.41 2.32 2.23 2.13
26
1 6 7 0 8 1 1 8 2 4 8 5 4 5 3 7 7 3 1
7.67 5.48 4.60 4.10 3.78 3.55 3.38 3.25 3.14 3.06 2.92 2.78 2.63 2.55 2.47 2.38 2.29 2.19 2.09
27
7 8 1 6 5 8 8 6 9 2 6 3 2 2 0 4 4 8 7
7.63 5.45 4.56 4.07 3.75 3.52 3.35 3.22 3.12 3.03 2.89 2.75 2.60 2.52 2.44 2.35 2.26 2.16 2.06
28
6 3 8 4 4 8 8 6 0 2 6 3 2 2 0 4 3 7 4
7.59 5.42 4.53 4.04 3.72 3.49 3.33 3.19 3.09 3.00 2.86 2.72 2.57 2.49 2.41 2.32 2.23 2.13 2.03
29
8 0 8 5 5 9 0 8 2 5 8 6 4 5 2 5 4 8 4
7.56 5.39 4.51 4.01 3.69 3.47 3.30 3.17 3.06 2.97 2.84 2.70 2.54 2.46 2.38 2.29 2.20 2.11 2.00
30
2 0 0 8 9 3 4 3 7 9 3 0 9 9 6 9 8 1 6
7.31 5.17 4.31 3.82 3.51 3.29 3.12 2.99 2.88 2.80 2.66 2.52 2.36 2.28 2.20 2.11 2.01 1.91 1.80
40
4 9 3 8 4 1 4 3 8 1 5 2 9 8 3 4 9 7 5
7.07 4.97 4.12 3.64 3.33 3.11 2.95 2.82 2.71 2.63 2.49 2.35 2.19 2.11 2.02 1.93 1.83 1.72 1.60
60
7 7 6 9 9 9 3 3 8 2 6 2 8 5 8 6 6 6 1
6.85 4.78 3.94 3.48 3.17 2.95 2.79 2.66 2.55 2.47 2.33 2.19 2.03 1.95 1.86 1.76 1.65 1.53 1.38
120
1 7 9 0 4 6 2 3 9 2 6 2 5 0 0 3 6 3 1
6.63 4.60 3.78 3.31 3.01 2.80 2.63 2.51 2.40 2.32 2.18 2.03 1.87 1.79 1.69 1.59 1.47 1.32 1.00
∞ 5 5 2 9 7 2 9 1 7 1 5 9 8 1 6 2 3 5 0
4
BÖLÜM 6
HİPOTEZ KONTROLÜ İLE İLGİLİ UYGULAMA SORULARI
VE ÇÖZÜMLERİ
► Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü sonundaki
bozulma oranları araştırılmaktadır. Bu amaçla yapılan bir çalışmada Pastorizasyon tekniği ile
işlenmiş olan 740 süt şişesinden 326’sının ve UHT tekniği ile işlenmiş olan 850 süt şişesinden
281’inin 6 ay sonunda bozulduğu belirlenmiştir. Bu deneme ile ilgili aşağıdaki soruları
yanıtlayınız.
1. Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü
sonundaki bozulma oranları nedir ?
n1 = 850 X1 = 281 P = X1/ n1 = 281/850 = 0.33
n2 = 740 X2 = 326 P = X2/ n2 = 326/740 = 0.44
2. Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü
sonunda bozulma oranları arasındaki farklılığın standart hatasını (S(p1 -p2) )
hesaplayınız.
^ ^ ^ ^
p1 * q1 p2 * q2 . . . .
S ^ ^ = + = 0.0243
( p1 p2 ) n1 n2
3. Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü
sonundaki bozulma oranları arasında farklılık olup olmadığına ilişkin hipotez
kurup, % 1 olasılık düzeyinde test ediniz ve sonucu yorumlayınız.
( ) ( ) ( . . )
z= = = +4.52
( ) .
z (0.4950) = + 2.575
% 0.5 0.99 % 0.5
+ 4.52
Sonuç; + 4.52> + 2.575 olduğundan sıfır hipotezi % 1 olasılık düzeyinde reddedilir ve karşıt
hipotez kabul edilir. Buna göre; UHT ve pastörizasyon tekniği ile işlenen sütlerin bozulma
oranlarının farklı olduğuna karar verilir.
►Gıda Yönetmeliğine göre ekmeklik buğday unlarında gluten miktarının 212 mg/100g olması
esastır. Ekmeklik buğday unu üreten bir un fabrikasından rastgele seçilen 27 un çuvalında
ortalama gluten miktarı 208 mg/100g ve standart sapması 3.85 mg/100g olarak saptanmıştır.
Bu deneme ile ilgili aşağıdaki soruları yanıtlayınız.
4. Bu denemede örnek ortalamasının standart hatasını ve serbestlik derecesini
hesaplayınız.
.
S = = = = 0.74 mg/100g. ve SD = n -1 = 27 -1 = 26
√ √
26 SD’li t- dağılışı
0.025 0.95
0.025
-5.41
Sonuç; - 5.41 < - 2.056 olduğundan H0 hipotezi % 5 olasılık düzeyinde reddedilir, karşıt hipotez
H1 kabul edilir. Buna göre, firma yönetmeliğe uygun üretimde bulunmamaktadır.
6.Bu firmanın ürettiği unlarda gluten miktarı 212 mg/100g dan daha az kabul edilebilir
mi ? Uygun hipotezleri kurup 0.05 olasılık düzeyinde test ediniz.
t= = = - 5.41
.
26 SD’li t- dağılışı
0.05 0.95
-5.41
► Bursa’da üretilen Deveci armutlarında zirai ilaç kalıntı miktarını analiz etmek için
kullanılan ve doğruluğu kanıtlanmış olan “Klasik Metot” yanında daha kısa sürede sonuç veren
fakat doğruluğu kanıtlanmamış olan “Hızlı Metot” geliştirilmiştir. Yapılan bir araştırmada bu
iki metot karşılaştırılmıştır. Bu amaçla, zirai ilaç uygulanmış olan Deveci armutunun bulunduğu
bir bahçeden rastgele seçilen 12 ağacın meyvelerine Klasik Metot, yine aynı bahçeden rastgele
seçilen 10 ağacın meyvelerine Hızlı Metot uygulanarak zirai ilaç kalıntı miktarları
belirlenmiştir. Her iki metoda ait zirai ilaç kalıntı miktarları (ppm) aşağıdaki tabloda verilmiştir.
1 2 3 4 5 6 7 8 9 10 11 12
Klasik 62 74 56 61 75 53 59 66 61 55 64 70
Hızlı 49 56 62 48 67 64 58 54 50 65 - -
7.Her iki analiz metodunun (sırasıyla Klasik; S12 ve Hızlı ; S22 metot) varyanslarını
hesaplayınız.
(∑ ) ( )
∑𝑥 = ∑x - = (622+742+…..+702) - = 562.0
∑ .
Varyansı; S = = = 51.1
(∑ ) ( )
∑𝑥 = ∑x - = (492+562+…..+652) - = 442.1
∑ .
Varyansı; S = = = 49.1
∑ ∑ . .
𝑺𝟐 = = = 50.2 SD = n1 + n2 − 2 = 12 + 10 – 2 = 20
8.Bu denemede hesaplanan iki farklı analiz metodunun ortalama kalıntı miktarları
arasındaki farklılıkların standart hatasını S( ) hesaplayınız.
S 2 (n1 n2 ) . ( )
S ( X1 X 2 ) = = 3.033 ppm
n1n2
9.Klasik ve Hızlı metot ile analiz edilen Deveci armutlarının zirai ilaç kalıntı
miktarları arasında farklılık olup olmadığına ilişkin hipotezleri kurarak, 0.01 olasılık
düzeyinde test ediniz ve bulduğunuz sonucu yorumlayınız.
( ) (µ µ ) ( . . )
t= = = +1.879 SD = 20
( ) .
p*q . .
^ = = 0.005848
p n
12. Bu firmanın ürettiği hibrit ayçiçeği tohumluğunda çimlenme oranının 0.97 olduğu
kabul edilebilir mi ? Uygun hipotezi kurup 0.01 olasılık düzeyinde test ediniz ve sonucu
yorumlayınız.
. .
z= = = - 3.42 z( . ) = ∓ 2.575
.
- 3.42
Sonuç; - 3.42 < - 2.575 olduğundan sıfır hipotezi % 1 olasılık düzeyinde reddedilerek
karşıt hipotez kabul edilir. Buna göre firmanın ürettiği hibrit ayçiçeği tohumluğunun
çimlenme oranı 0.97 olarak kabul edilemez.
.
S = = = = 15.34 g/L. SD = n -1 = 25 -1 = 24
√ √
14. Söz konusu firmanın yönetmeliğe uygun üretimde bulunup bulunmadığına ilişkin
hipotezi kurarak 0.01 olasılık düzeyinde test ediniz ve sonucu yorumlayınız.
t= = = - 1.95 SD = n -1 = 25 -1 = 24
.
24 SD’li t- dağılışı
-1.95
Sonuç; - 1.95 < - 2.797 olduğundan H0 hipotezi kabul edilir. Firma yönetmeliğe uygun
üretimde bulunmaktadır.
► Bursa bölgesinde iki farklı bünyeye sahip olan (Tın ve Kil) tarlalardan alınan toprak
örnekleri aynı metotla analiz edilerek fosfor kapsamları (P2O5 kg/da) belirlenmiş ve elde edilen
veriler aşağıda olduğu gibi bulunmuştur. Fosfor analizi kil bünyeli toprakta 11, tın bünyeli
toprakta 10 örnekte yapılmıştır.
(∑ ) ( )
∑𝑥 = ∑x - = (672+402+…..+402) - = 2996.6
(∑ ) ( )
∑𝑥 = ∑x - = (632+362+…..+502) - = 954.0
16. Kil ve tın bünyeli toprakların fosfor kapsamlarına ilişkin varyansları ( sırasıyla S12 ve
S22) aşağıdakilerden hangisidir ?
∑ 𝐱𝟐𝟏 .
Kil bünyeli toprağın varyansı; S = = = 299.6 SD = n1 – 1 = 11-1 = 10
∑ 𝐱𝟐𝟐 .
Tın bünyeli toprağın varyansı; S = = = 106.0 SD = n2 – 1 = 10-1 = 9
∑ ∑ . .
𝑺𝟐 = = = 207.9 SD = n1 + n2 − 2 = 11 + 10 – 2 = 19
S 2 (n1 n2 ) . ( )
S ( X1 X 2 ) = = 6.3 kg/da
n1n2
19. Kil ve tın bünyeli toprakların fosfor miktarları arasında farklılık olup olmadığına
ilişkin hipotez kurulup 0.05 olasılık düzeyinde test edilirse, hesaplanan t istatistiği değeri
ve elde edilen sonuç aşağıdakilerden hangisinde doğrudur?
H0 : µ1 -µ2= 0 (Kil ve tın bünyeli toprakların fosfor miktarları aynıdır)
H1: µ1 -µ2 0 (Kil ve tın bünyeli toprakların fosfor miktarları farklıdır)
( ) (µ µ ) ( . . )
t= = = +1.17 SD = 19
( ) .
19 SD’li t- dağılışı
+ 1.17
►Gıda Güvenliği uyarınca pazarda satışa sunulan kirazlarda zirai ilaç kalıntı miktarının en
fazla 120 mg.kg-1 olması gerekmektedir. Bursa Haline gelen 27 farklı kiraz ürününde ortalama
zirai ilaç kalıntı miktarının 132 mg.kg-1 ve standart sapmasının (S) 9.42 mg.kg-1 olduğu
belirlenmiştir. Bursa Haline gelen kirazlarla ilgili olarak aşağıdaki soruları yanıtlayınız.
20.Bursa Haline gelen kirazlarda zirai ilaç kalıntı miktarı 120 mg.kg-1 olarak kabul
edilebilir mi ? Uygun hipotez kurup, 0.05 olasılık düzeyinde test ediniz ve sonucu
yorumlayınız.
H0: µ= 120 mg.kg-1 (Zirai ilaç kalıntı miktarı 120 mg.kg-1 dir)
H1: µ 120 mg.kg-1 (Zirai ilaç kalıntı miktarı 120 mg.kg-1 değildir)
.
S = = = = 1.813 mg.kg-1 SD = n -1 = 27 – 1= 26
√ √
t= = = +6.62 SD = 26
.
H0: µ= 120 mg.kg-1 (Zirai ilaç kalıntı miktarı 120 mg.kg-1 dir)
H1: µ > 120 mg.kg-1 (Zirai ilaç kalıntı miktarı 120 mg.kg-1 dan daha fazladır)
.
S = = = = 1.813 mg.kg-1 SD = n -1 = 27 – 1= 26
√ √
t= = = +6.62 SD = 26
.
Sonuç; 6.62 > 1.706 olduğundan H0 hipotezi % 5 olasılık düzeyinde reddedilir, karşıt
hipotez H1 kabul edilir. Buna göre, kirazlarda kalıntı miktarının 120 mg.kg-1 dan daha fazla
olduğu sonucuna varılmıştır.
26 SD’li t dağılışı
+ 6.62
► Oniki adet inek sütünde kalsiyum (Ca) miktarı (mg/g) ile laktik asit miktarı (g/100g)
aşağıda olduğu gibi bulunmuştur.
22) İki değişken arasındaki korelasyon katsayısı (r) değeri nedir ? Bu katsayı hangi
sonucu gösterir?
Örnek Kalsiyum Laktik
No miktarı asit X i2 Yi 2 X i .Yi
(mg/g) (g/100g)
Y X
1 5.0 7.9 62.41 25.0 39.5
2 1.0 3.7 13.69 1.0 3.7
3 3.0 6.8 46.24 9.0 20.4
4 5.5 10.5 110.25 30.25 57.75
5 2.0 2.5 6.25 4.0 5.0
6 4.5 9.2 84.64 20.25 41.4
7 6.0 8.0 64.00 36.0 48.0
8 0.5 2.0 4.0 0.25 1.0
9 4.5 5.0 25.0 20.25 22.5
10 1.0 2.0 4.0 1.0 2.0
11 5.0 9.7 94.09 25.0 48.5
12 4.0 5.5 30.25 16.0 22.0
Toplam 42.0 72.8 544.82 188.0 311.75
Ortalama 3.5 6.06
( Yi )2 ( . )
Kalsiyum miktarı KT= y Yi
2
i
2
= 188.0 - = 41.0
n
( X i ) 2 ( . )
Laktik asit KT= xi2 X i2 544.82 - = 103.17
n
( X i )( Yi ) ( . ) ( . )
İki değişkenin ÇT= xi yi X i .Yi = 311.75 - = 56.95
n
Sonuç olarak inek sütlerinde laktik asit miktarı ile kalsiyum miktarı arasındaki korelasyon
katsayısı,
r
x y i i
=
.
= + 0.876
x . y
2
i
2
i
√ . .
Bu korelasyon katsayısı inek sütlerinde laktik asit miktarı ile kalsiyum miktarı arasında pozitif
yönde yüksek bir doğrusal ilişki olduğunu göstermektedir. Buna göre inek sütlerinde laktik asit
miktarı artıkça kalsiyum miktarının da arttığı söylenebilir.
23) Korelasyon katsayısının standart hatası (Sr) ve serbestlik derecesini hesaplayınız.
( . )
S = = = 0.153 SD = n – 2 = 12 – 2 = 10
24) İnek sütlerinde laktik asit miktarı ile kalsiyum miktarı arasındaki korelasyon
katsayısının önemli olup olmadığını uygun hipotezleri de yazarak 0.01 olasılık düzeyinde
test ediniz ve sonucu yorumlayınız.
.
t= = = + 5.72 SD = 10
.
10 SD’li t-dağılışı
+5.72
►Bir araştırmada traktörlerin bakım harcamaları (TL/yıl) ile yaşları (Yıl) arasında doğrusal
bir ilişki olup olmadığı araştırılmaktadır. Bunun için rastgele seçilen 10 adet traktörün bakım
harcamaları (Y değişkeni) ve yaşları (X değişkeni) aşağıda olduğu gibi bulunmuştur.
Traktör No.
Değişkenler
1 2 3 4 5 6 7 8 9 10
Bakım 230 540 110 220 75 280 140 320 30 420
Harcamaları
Traktörün 8 14 3 7 2 9 4 10 1 12
Yaşı
25) Traktörlerin bakım harcamaları ve yaşları arasındaki ilişkiye ait korelasyon katsayısı
(r) değeri nedir ? Bu katsayı hangi sonucu gösterir ?
( Yi ) 2 ( )
Bakım harcamaları KT= y Yi
2
i
2
= 787600 - = 230640
n
( X i ) 2 ( )
Traktör Yaşı KT= xi2 X i2 664 - = 174
n
( X i )( Yi ) ( ) ( )
İki değişkenin ÇT= xi yi X i .Yi = 22760 - = 6240
n
Sonuç olarak traktör yaşı ile bakım masrafları arasındaki korelasyon katsayısı,
r
x y i i
= = + 0.985
x . y
2
i
2
i
√
Bu korelasyon katsayısı traktörlerin yaşı ve bakım masrafları arasında pozitif yönde yüksek bir
doğrusal ilişki olduğunu göstermektedir. Buna göre traktörlerin yaşı artıkça bakım
harcamalarının da arttığı söylenebilir.
26) Uygun hipotezleri kurarak korelasyon katsayısının önemli olup olmadığını % 1
olasılık düzeyinde test ediniz.
H0 : ρ = 0 (Korelasyon katsayısı önemsizdir)
H1 : ρ ≠ 0 (Korelasyon katsayısı önemlidir)
( . )
S = = = 0.061
.
t= = = + 16.15 SD = n -2 =8
.
27) Uygun hipotezleri kurarak bakım harcamalarının (Y) traktör yaşı (X) üzerine
regresyon katsayısının önemli olup olmadığını % 1 olasılık düzeyinde test ediniz.
H0 : =0 (önemsizdir)
H0 : 0 (önemlidir)
( Yi ) 2
y Y
2
i i
2
n
= 230640
( X i ) 2
xi2 X i2 n
174
x y X .Y n = 6240
( X )( Y ) i i
i i i i
byx
x y i i
= = 35.86 TL
x 2
i
( )
2
S =
yx = 857.6 ve S = √857.6 = 29.28
.
t= = = = +16.15
.
►Susamda açık kapsüllü ve beyaz taneli bir çeşit (AABB) ile kapalı kapsüllü ve sarı taneli
bir çeşit (aabb) arasında yapılan melezlemenin F2 açılma generasyonunda elde edilen bitkilerin,
oluşan 4 fenotipe göre sayısal olarak dağılımı şu şekilde gözlenmiştir.
Fenotip F2’de Bitki Sayısı(Adet)
Açık kapsüllü + Beyaz taneli : 2604
Açık kapsüllü + Sarı taneli : 876
Kapalı kapsüllü + Beyaz taneli : 847
Kapalı kapsüllü + Sarı taneli : 273
Not : Susamda açık kapsüllü olma dominant A geni ile ve beyaz taneli olma ise dominant B
geni ile idare edilmektedir. F2 generasyonunda dihibrit (9:3:3:1 açılımı) açılım söz konusudur.
Buna göre aşağıdaki soruları yanıtlayınız.
28) Bu denemede F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılımına uygun mudur ? 0.01
olasılık düzeyinde test ediniz.
Kapalı kapsüllü ve sarı taneli bitki görülme olasılığı (beklenen frekans) 4600 x 1/16 = 287.5
2 = ∑ (𝐟 − 𝐟 )𝟐 /𝐟′
( . ) ( . ) ( . ) ( . )
2 = + + + = 1.33
. . . .
SD = k -1 = 4 -1 = 3
SD = 3 de 2 (0.01) kritik değeri ; 2 3(0.01) = 11.345 dir. Buna göre, 1.33 < 11.345
olduğundan sıfır hipotezi kabul edilir. F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılıma
uymaktadır.
► Soyada iri baklalı ve tüylü bir çeşit (AABB) ile küçük baklalı ve tüysüz bir çeşit (aabb)
arasında yapılan melezlemenin F2 açılma generasyonunda elde edilen bitkilerin, oluşan 4
fenotipe göre sayısal olarak dağılımı şu şekilde gözlenmiştir.
Fenotip F2’de Bitki Sayısı(Adet)
İri baklalı + Tüylü : 1178
İri baklalı + Tüysüz : 391
Küçük baklalı + Tüylü : 271
Küçük baklalı + Tüysüz : 156
Not : Soyada iri baklalı olma dominant A geni ile ve tüylü olma ise dominant B geni ile idare
edilmektedir. F2 generasyonunda dihibrit (9:3:3:1 açılımı) açılım söz konusudur. Buna göre
aşağıdaki soruları yanıtlayınız.
Kapalı kapsüllü ve sarı taneli bitki görülme olasılığı (beklenen frekans) 1998 x 1/16 = 124.875
30) Bu denemede F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılımına uygun mudur ? 0.01
olasılık düzeyinde test ediniz.
2 = ∑ (𝐟 − 𝐟 )𝟐 /𝐟′
. . . .
2 = ( )2+( )2 + ( )2 + ( )2 = 38.67
. . . .
SD = k -1 = 4 -1 = 3
SD = 3 de 2 (0.01) kritik değeri ; 2 3(0.01) = 11.345 dir. Buna göre, 38.67 > 11.345
olduğundan sıfır hipotezi 0.01 olasılık düzeyinde reddedilir. F2’ deki açılım dihibrit (9:3:3:1
açılımı) açılıma uymamaktadır.
► Bir soya fasulyesi çeşidinde iki farklı tohumluk rutubet oranının (% 8 ve % 11) çimlenme
gücü üzerine etkisi araştırılmaktadır. Yapılan deneme sonunda oda sıcaklığında % 8 rutubet
oranında 1 yıl depolanan 750 tohumdan 675 tanesinin ve oda sıcaklığında % 11 rutubet oranında
1 yıl depolanan aynı çeşide ait 900 tohumdan 765 tanesinin çimlendiği belirlenmiştir. Bu
deneme ile ilgili aşağıdaki soruları yanıtlayınız.
31) İki farklı tohumluk rutubet oranlarına (% 8 ve % 11) ait çimlenen tohum sayıları
arasındaki farklılık olup olmadığına ilişkin hipotezleri yazarak % 1 olasılık düzeyinde
test ediniz ve sonucu yorumlayınız.
Test istatistiği;
( ) ( ) ( . . )
z= = = +3.125
( ) .
z (0.4950) = + 2.575
+3.125
Sonuç; 3.125 > 2.575 olduğundan sıfır hipotezi reddedilir, karşıt hipotez kabul edilir. Buna göre
iki farklı rutubet oranında depolanan soya tohumlarının 1 yıl sonudaki çimlenme oranları
arasında % 1 olasılık düzeyinde önemli farklılık bulunmuştur. Çimlenme oranlarından % 8
rutubette depolanan soya tohumlarında çimlenme oranının daha yüksek olduğu görülmektedir.
► Türk Gıda Kodeksine göre birinci sınıf meyve sularında brix oranının (kuru madde oranı)
0.45 olması gerekmektedir. Meyve sularında brix oranına ait standart sapmanın (σ) 0.80 olduğu
bilinmektedir. Bir meyve suyu fabrikasından rastgele alınan 100 adet 1 litrelik meyve suyu
kutularında ortalama brix oranı 0.37 olarak bulunmuştur. Bu deneme ile ilgili aşağıdaki soruları
yanıtlayınız.
32) Söz konusu meyve suyu fabrikasının Türk Gıda Kodeksine uygun üretimde bulunup
bulunmadığına ilişkin hipotezleri kurarak 0.05 olasılık düzeyinde test ediniz ve
bulduğunuz sonucu yorumlayınız.
.
σ = = = = 0.08 %
√ √
Test istatistiği;
. .
z= = = - 1.0 Kritik değer; z( . ) = ∓ 1.96
.
-1.0
Sonuç; -1.0 > - 1.96 olduğundan H hipotezi kabul edilir. Buna göre firmanın ürettiği meyve
sularında brix oranı 0.45 olarak kabul edilebilir. Buna göre, firma yönetmeliğe uygun üretimde
bulunmaktadır.
Sulama Parsel No :
Yöntemi 1 2 3 4 5 6 7 8 9 10 11
Damla 76 98 123 107 88 96 127 103 93 119 -
Karık 47 54 71 49 65 57 52 58 63 70 62
33) Bu denemede hesaplanan iki sulama yönteminin ortalama domates verimleri arasındaki
farklılıklarının standart hatasını (S(x1-x2) ) ve serbestlik derecesini hesaplayınız.
(∑ ) ( )
∑𝑥 = ∑x - = (472+542+…..+622) - = 648.9
∑ ∑ .
S = = = 159.2
S 2 (n1 n2 ) . ( )
S ( X1 X 2 ) = = 5.51 kg/parsel
n1n2
SD = n1 + n2 − 2 = 10 + 11 – 2 = 19
34) Damla ve karık usulü sulama yöntemlerinin ortalama domates verimleri arasında
farklılık olup olmadığına ilişkin hipotezleri kurarak 0.01 olasılık düzeyinde test ediniz ve
sonucu yorumlayınız.
( ) (µ µ ) ( . . )
t= = = +8.0 SD = 19
( ) .
19 SD’li t-dağılışı
+8.0
35) Bir salça fabrikası ürettiği domates salçalarında ortalama C vitamini miktarının 17
ml/L olduğunu iddia etmektedir. Domates salçalarında C vitamini miktarının standart
sapması 2.75 ml/L dir. Bu fabrikadan rastgele seçilen 40 kutu domates salçasında
ortalama C vitamini miktarı 15.7 ml/L olarak bulunmuştur. Fabrikanın iddiası doğru
mudur? Yani, fabrikanın ürettiği domates salçalarında ortalama C vitamini miktarı 17
ml/L olarak kabul edilebilir mi? Uygun hipotezi yazarak % 1 olasılık düzeyinde test
ediniz.
ÇÖZÜM:
𝜇 ̅ = 𝜇 = 17 ml/L
n= 40 kutuluk salça örnekleri kadar ve daha fazla sapma gösteren örneklerin oranını
bulmak için;
P (z < -2.99) = 0.5000 – 0.4986 = 0.0014 = % 0.14 olarak bulunur. Buna göre, n=40
kutuluk örneklerin 𝜇 = 17 ml/L olan popülasyona girme olasılığı % 0.14 dür. Bu
olasılık % 1 den çok daha düşük bir olasılıktır. Bu nedenle bu fabrikadan çekilen n=40
kutuluk örneğin 𝜇 = 17 ml/L ve 𝜎 = 2.75 ml/L olan populasyonu temsil etmesi
mümkün değildir. Buna göre H0 hipotezi reddedilir, H1 kabul edilir. Fabrikanın
iddiasının doğru olmadığı sonucuna varılır.
Öte yandan; z (0.4950) kritik değeri ± 2.575 olduğu için – 2.99 < - 2.575 olduğundan H0
hipotezi % 1 olasılık düzeyinde reddedilir, karşıt hipotez H1 kabul edilir.
% 99
% 0.14
Test istatistiği;
( ) ( ) ( . . )
z= = = +2.61
( ) .
z (0.4750) = + 1.96
% 95
+2.61
Sonuç; 2.61 > 1.96 olduğundan sıfır hipotezi reddedilir, karşıt hipotez kabul edilir. Buna göre
iki farklı insektisitin beyaz sinek zararlılarını öldürme oranları arasında % 5 olasılık düzeyinde
önemli farklılık bulunmuştur. Ortalamalara göre A insektisitinin beyaz sineğe karşı daha etkili
olduğu sonucuna varılmıştır.