You are on page 1of 191

BÖLÜM 4

UYGULAMA SORULARI VE ÇÖZÜMLERİ


►Arazilerin eğim derecesi ile erozyonla toprak kaybı arasındaki ilişki araştırılmaktadır. Bu
amaçla yapılan bir çalışmada farklı eğim derecelerine sahip alanlarda yıllık olarak erozyonla
toprak kaybı (cm3) gözlenmiştir. Elde edilen değerler aşağıdaki tabloda verilmiştir.
Değişken Arazi Örnekleri
1 2 3 4 5 6 7 8 9
Arazi Eğimi (%) 13 26 5 11 27 34 25 4 8
Erozyonla Toprak 72 81 45 67 86 99 84 55 62
Kaybı (cm3)

1) İki değişken arasındaki korelasyon katsayısı (r) değeri nedir ? Bu katsayı hangi sonucu
gösterir?
Örnek Erozyonla Arazi
No Toprak Eğimi Yi 2 X i2 X i .Yi
Kaybı X
Y
1 72 13 5184 169 936
2 81 26 6561 676 2106
3 45 5 2025 25 225
4 67 11 4489 121 737
5 86 27 7396 729 2322
6 99 34 9801 1156 3366
7 84 25 7056 625 2100
8 55 4 3025 16 220
9 62 8 3844 64 496
Toplam 651 153 49381 3581 12508
Ortalama 72.3 17.0

( Yi ) 2 ( )
Erozyonla Toprak Kaybının KT=  y   Yi  2
i
2
= 49381 - = 2292
n

( X i ) 2 ( )
Arazi Eğimi KT=  x   X 
2
i i
2
 3581 - = 980
n

( X i )( Yi ) ( ) ( )
İki değişkenin ÇT=  xi yi   X i .Yi  = 12508 - = 1441
n

r
x y i i
= = +0.961
 x . y
2
i
2
i

Bu sonuca göre, arazi eğimi arttıkça erozyonla toprak kaybı da artmaktadır.


2) Korelasyon katsayısının standart hatasını (Sr) serbestlik derecesini hesaplayınız.
( . )
S = = 0.104 SD = n – 2 = 9 - 2 = 7
3) Erozyonla toprak kaybı miktarının (Y) arazilerin eğim derecesi (X) üzerine olan
regresyon katsayısı ve bu katsayının ne anlam ifade ettiğini açıklayınız.


𝑏 =

= = +1.470 cm3

Arazilerin eğim derecesi 1 birim değiştiğinde erozyonla toprak kaybı ortalama 1.470 cm3
değişmektedir.

►Topraktaki azot miktarı (kg/da) ile soya fasulyesi köklerinde Rhizobium japonicum
bakterileri tarafından oluşturulan nodül (nodozite) sayıları arasındaki ilişki araştırılmaktadır.
Bu amaçla, 9 farklı toprakta yetiştirilen soya fasulyesi köklerinde Rhizobium japonicum
bakterileri tarafından oluşturulan nodül (nodozite) sayıları bu toprakların azot miktarları (kg/da)
aşağıdaki tabloda verilmiştir.

Değişken Örnekler
1 2 3 4 5 6 7 8 9

Nodül sayısı (adet) 86 64 78 95 58 44 70 98 34


Azot miktarı (kg/da) 5 7 6 4 9 10 6 3 12

4) Soya fasulyesi köklerinde nodül sayısı ile topraktaki azot miktarı arasındaki korelasyon
katsayısı (r) değeri nedir ve bu katsayı hangi sonucu ifade eder?

Örnek Nodül Azot


No Sayısı Miktarı Yi 2 X i2 X i .Yi
Y X
1 86 5 7396 25 430
2 64 7 4096 49 448
3 78 6 6084 36 468
4 95 4 9025 16 380
5 58 9 3364 81 522
6 44 10 1936 100 440
7 70 6 4900 36 420
8 98 3 9604 9 294
9 34 12 1156 144 408
Toplam 627 62 47561 496 3810
Ortalama 69.7 6.88
( Yi ) 2 ( )
Nodül Sayısı KT=  y   Yi  2
i
2
= 49381 - = 2292
n

( X i ) 2 ( )
Azot Miktarı KT=  x   X  2
i i
2
 3581 - = 980
n

( X i )( Yi ) ( ) ( )
İki değişkenin ÇT=  xi yi   X i .Yi  = 12508 - = 1441
n

r
x y i i
= = +0.961
 x . y
2
i
2
i

Bu sonuca göre, arazi eğimi arttıkça erozyonla toprak kaybı da artmaktadır.

5) Korelasyon katsayısının standart hatasını (Sr) ve serbestlik derecesini bulunuz.

( . )
S = = 0.065 SD = n – 2 = 9 - 2 = 7

6) Soya fasulyesi köklerindeki nodül sayısının (Y) topraktaki azot miktarı (X) üzerine olan
regresyon katsayısını bulunuz ve bu katsayının ne anlam ifade ettiğini açıklayınız.
∑ .
𝑏 =

= = - 7.39 adet
.

Topraklarda azot miktarındaki bir birim değişmeye karşılık soya köklerindeki nodül sayısının
zıt yönde ortalama olarak 7.39 adet değiştiğini ortaya koymaktadır.

7) Soya fasulyesi köklerindeki nodül sayısının (Y) topraktaki azot miktarı (X) üzerine olan
Regresyon doğru denklemi aşağıdakilerden hangisinde doğru olarak verilmiştir.
^
Yi  a  b. X i

a  Y  bX = 69.7 – (-7.39) x 6.88 = 120 54

∑ .
𝑏=𝑏 =

= = - 7.39 adet
.

Ŷ= 120.54 – 7.39X
►Domates salçalarında askorbik asit miktarı ile likopen miktarı arasındaki ilişki
araştırılmaktadır. Bu amaçla yapılan çalışmada, bir salça fabrikasından alınan 10 salça
örneğinde askorbik asit miktarı (mg/100g) ve likopen miktarı (ppm) saptanmıştır. Elde edilen
değerler aşağıdaki tabloda verilmiştir.

Değişken Örnek No.


1 2 3 4 5 6 7 8 9 10
Likopen (ppm) 2 16 4 18 3 21 8 11 15 6
Askorbik Asit 9 53 12 57 13 63 23 28 47 20
(mg/100g)

8) İki değişken arasındaki korelasyon katsayısı (r) değeri nedir ? Bu katsayı hangi
sonucu gösterir ?

Örnek Askorbik Likopen


No asit (ppm) Yi 2 X i2 X i .Yi
(mg/100g) X
Y
1 9 2 81 4 18
2 53 16 2809 256 848
3 12 4 144 16 48
4 57 18 3249 324 1026
5 13 3 169 9 39
6 63 21 3969 441 1323
7 23 8 529 64 184
8 28 11 784 121 308
9 47 15 2209 225 705
10 20 6 400 36 120
Toplam 325 104 14343 1496 4619
Ortalama 32.5 10.4

( Yi )2 ( )
Askorbik asit KT=  y   Yi 
2
i
2
= 14343 - = 3780.5
n

( X i ) 2 ( )
Likopen KT=  xi2   X i2   1496 - = 414.4
n

( X i )( Yi ) ( ) ( )
İki değişkenin ÇT=  xi yi   X i .Yi  = 4619 - = 1239
n

Sonuç olarak domateste askorbik asit ile likopen arasındaki korelasyon katsayısı,
r
x y i i
= = + 0.989
 x . y
2
i
2
i
√ . .

Bu korelasyon katsayısı domateste askorbik asit ve likopen miktarı arasında pozitif yönde
yüksek bir doğrusal ilişki olduğunu göstermektedir. Buna göre domateste askorbik asit artıkça
likopen miktarının da arttığı söylenebilir.

9) Korelasyon katsayısının standart hatası (Sr) ve serbestlik derecesini belirleyiniz.


( . )
S = = 0.0524 SD = n – 2 = 10 - 2 = 8

10) Askorbik asit miktarının (Y) Likopen miktarı (X) üzerine olan regresyon katsayısı
ve bu katsayının ne anlam ifade ettiği aşağıdaki seçeneklerden hangisinde doğru
olarak verilmiştir?


𝑏 =

= = 2.99 mg/100g
.

Domateste likopen miktarında 1 ppm’lik değişmeye karşılık askorbik asit miktarının ortalama
olarak 2.99 mg/100g değiştiğini ortaya koymaktadır.

10) Bu çalışmada Askorbik Asit miktarının (Y) Likopen miktarı (X) üzerine olan
regresyon doğru denklemini oluşturunuz.

^
Yi  a  b. X i b
x y i i
= = 2.99
x 2
i
.

a  Y  bX = 32.5 – 2.99 x (10.4) = 1.41

Ŷ = 1.41 + 2.99 X

► Oniki adet inek sütünde kalsiyum (Ca) miktarı (mg/g) ile laktik asit miktarı (g/100g)
aşağıda olduğu gibi bulunmuştur.

Değişken Süt Örnekleri


1 2 3 4 5 6 7 8 9 10 11 12
Kalsiyum 5.0 1.0 3.0 5.5 2.0 4.5 6.0 0.5 4.5 1.0 5.0 4.0
miktarı (mg/g)
Laktik asit 7.9 3.7 6.8 10.5 2.5 9.2 8.0 2.0 5.0 2.0 9.7 5.5
miktarı
(g/100g)

11) İki değişken arasındaki korelasyon katsayısı (r) değeri nedir ? Bu katsayı hangi
sonucu gösterir?
Örnek Kalsiyum Laktik
No miktarı asit X i2 Yi 2 X i .Yi
(mg/g) (g/100g)
Y X
1 5.0 7.9 62.41 25.0 39.5
2 1.0 3.7 13.69 1.0 3.7
3 3.0 6.8 46.24 9.0 20.4
4 5.5 10.5 110.25 30.25 57.75
5 2.0 2.5 6.25 4.0 5.0
6 4.5 9.2 84.64 20.25 41.4
7 6.0 8.0 64.00 36.0 48.0
8 0.5 2.0 4.0 0.25 1.0
9 4.5 5.0 25.0 20.25 22.5
10 1.0 2.0 4.0 1.0 2.0
11 5.0 9.7 94.09 25.0 48.5
12 4.0 5.5 30.25 16.0 22.0
Toplam 42.0 72.8 544.82 188.0 311.75
Ortalama 3.5 6.06

( Yi )2 ( . )
Kalsiyum miktarı KT=  y   Yi 
2
i
2
= 188.0 - = 41.0
n

( X i ) 2 ( . )
Laktik asit KT=  xi2   X i2   544.82 - = 103.17
n

( X i )( Yi ) ( . ) ( . )
İki değişkenin ÇT=  xi yi   X i .Yi  = 311.75 - = 56.95
n
Sonuç olarak inek sütlerinde laktik asit miktarı ile kalsiyum miktarı arasındaki korelasyon
katsayısı,

r
x y i i
=
.
= + 876
 x . y
2
i
2
i
√ . .

Bu korelasyon katsayısı inek sütlerinde laktik asit miktarı ile kalsiyum miktarı arasında pozitif
yönde yüksek bir doğrusal ilişki olduğunu göstermektedir. Buna göre inek sütlerinde laktik asit
miktarı artıkça kalsiyum miktarının da arttığı söylenebilir.

12) Korelasyon katsayısının standart hatası (Sr) ve serbestlik derecesini hesaplayınız.

( . )
S = = = 0.153 SD = n – 2 = 12 – 2 = 10
13) Kalsiyum miktarının (Y) Laktik asit miktarı (X) üzerine olan regresyon katsayısını
hesaplayınız ve bu katsayının ne anlam ifade ettiğini açıklayınız.

∑ .
𝑏 =

= = 0.552 mg/g
.

İnek sütlerinde laktik asit miktarında 1 birimlik değişmeye karşılık kalsiyum miktarının
ortalama olarak 0.552 mg/g değiştiğini ortaya koymaktadır.

14) Laktik asit miktarının (Y) Kalsiyum miktarı (X) üzerine regresyon doğrusunu
oluşturunuz.

^
Yi  a  b. X i b
x y
i i
=
.
= 0.552 mg/g
x 2
i
.

a  Y  bX = 3.5 – 0.552 x (6.06) = 0.15

Ŷ = 0.15 + 0.552 X

Şekil 1. İnek sütünde kalsiyum miktarının laktik asit üzerine olan regresyon doğrusu
İSTATİSTİK
BÖLÜM 4
DOĞRUSAL KORRELASYON VE REGRESYON

Çoğu zaman araştırmalarda ve denemelerde, deneme ünitesi


veya bireyler üzerinde iki veya daha çok karakter (değişken)
gözlenebilir ve bunlar arasındaki benzerliğin, ilişkinin
tanımlanması istenebilir. Herhangi iki değişkenin arasında
gözlenebilecek en basit ilişki tipleri doğrusal korrelasyon ve
regresyondur.
4.l.KORRELASYON VE KORRELASYON KATSAYISI
Çok sayıda (n adet) deneme ünitesinde gözlenmiş herhangi iki değişken
arasındaki karşılıklı doğrusal ilişkinin en basit tanımı korrelasyon ve bunun değeri
olan korrelasyon katsayısıdır. Örneğin 8 adet şekerpancarı gövdesinde gövde ağırlığı
(gr) ile şeker oranı (%) aşağıda olduğu gibi bulunmuş olsun;

Gövde No 1 2 3 4 5 6 7 8
Gövde ağırlığı (gr) 250 280 340 450 240 350 900 875
Şeker oranı (%) 18 17 14 13 19 15 13 12

Rakamlardan da çok açık bir şekilde görüldüğü gibi gövde ağırlığı arttıkça,
şeker oranı azalmaktadır. İşte bu ilişki korrelasyondur. Bu tip ilişkilerin derecelerine
ise "Korrelasyon Katsayısı" denir. Bu katsayı örneklerde r ile gösterilir. Yani r, iki
değişken arasındaki doğrusal ilişkinin derecesini ve yönünü belirten katsayıdır.
Deneme üniteleri üzerinde gözlenen iki değişken X ve Y
değişkenleri olsun. Böyle iki herhangi değişken arasında
doğrusal ilişkinin olup olmadığını saptamada en basit yol
bunların değerlerini aynı koordinat sisteminde
göstermektir. Örneğin; X değişkeni x ekseninde ve Y
değişkeni ise y ekseninde gösterilerek kesişme noktaları
belirlenebilir. Kesişme noktalarının koordinat düzleminde
gösterdikleri dağılım durumuna göre farklı doğrusal
korrelasyon formları ortaya çıkar.
l- X ve Y aynı yönde değişiyor ve noktalar bir doğru üzerinde
yerleşiyorsa ilişki tamdır. Yani r = + l dir (Şekil 4A).

2- Kesişme noktaları bir elips içinde toplanıyor ve elipsin


uzun çapı sağ-üst yöne doğru ise korrelasyon katsayısı 0 < r < + l
arasındadır (Şekil 4B). Öte yandan r'nin sıfıra veya bire
yaklaşması elipsin büyük ve küçük çapları arasındaki ilişkiye
bağlıdır. Küçük çap, büyük çapa yaklaştıkça doğrusal ilişki
zayıflar, yani r sıfıra yaklaşır. Büyük çap arttıkça ilişki
kuvvetlenir ve r, bire yaklaşır.
3- X ve Y'nin kesişme noktaları bir daire içinde dağılıyorsa
doğrusal ilişki yoktur ve r = 0 dır (Şekil 4C).

4- X ve Y zıt yönde değişiyor ve kesişme noktaları yine bir


doğru üzerinde toplanıyorsa, doğrusal ilişki tam fakat
negatiftir (r = - l) (Şekil 4D).

5- X ve Y değişkenleri zıt yönde değişiyor ve 2'de olduğu gibi


kesişme noktaları bir elips üzerinde toplanıyorsa, -l < r < 0
konumu belirir. r'nin iki sınır değerine yaklaşması yine
elipsin çaplarının ilişkisine bağlıdır (Şekil 4E).
Şekil 4.1. Farklı Doğrusal Korelasyon Formlarına İlişkin Dağılım Grafikleri
Verilen bu örneklerden korrelasyon katsayısının bazı özelliklerini
çıkarmak mümkündür.

1. Korrelasyon katsayısı iki değişkenin birlikte değişim ölçüsüdür.


2. r her zaman -l ve +l arasında bir değer alır.

3. Pozitif r değerleri X ve Y’nin birlikte artış ve azalış meylini


gösterir. Ama negatif r değerleri X ve Y’nin zıt yönde değiştiğini
örneğin, X değerleri artarken Y değerlerinin azaldığını gösterir.

4. r'nin +l ve -l değerleri tam doğrusal ilişkiyi gösterir. Fakat


biyolojide bu tip ilişkileri bulmak zordur.

5. Korrelasyon katsayısının birimi yoktur.


4.2.3. Korelasyon Katsayısının Hesaplanması
Yukarıda belirtildiği gibi doğrusal ilişkinin büyüklüğünü ve yönünü gösteren korelasyon
katsayısı hesaplanabilmektedir.
Değişkenlerden birisini Y diğerini de X değişkeni olarak adlandıralım. Eğer gözlemler n
adet birey veya deneme ünitesi üzerinde yapılmış ise gözlem sonuçları aşağıda olduğu gibi
bir veri tablosunda gösterilebilir.

Örnek Y X
No Değişkeni Değişkeni Yi 2 X i2 X i .Yi

1 Y1 X1 Y12 X12 X 1 .Y1


2 Y2 X2 Y22 X 22 X 2 .Y2
3 Y3 X3 Y32 X 32 X 3 .Y3
4 Y4 X4 Y42 X 42 X 4 .Y4
. . . . . .
i Yi Xi Yi 2 X i2 X i .Yi
. . . . . .
. . . . . .
n Yn Xn Yn2 X n2 X n .Yn
Toplam Y i X i Y i
2
X i
2
X i .Yi
Ortalama Y X

Tablo 4.1. Korelasyon katsayısı analizinde veri tablosu hazırlık işlemleri


Korelasyon katsayılarının hesaplanabilmesi için üç temel istatistiğe ihtiyaç vardır:
Y değişkeninin ayrılışlarının kareleri toplamı (KT):
( Yi ) 2
y 2
i   (Yi  Y ) 2   Yi 2 
n
X değişkeninin ayrılışlarının kareleri toplamı (KT):
( X i ) 2
x 2
i   (Xi  X )   X 
2
i
2

X ve Y değişkenlerinin ayrılışlarının çarpımları toplamı(Cros-Product)(ÇT):

( X i )( Yi )
 xi yi   ( X i  X )(Yi  Y )   X i .Yi 
n
Yukarıda tanımlanan üç istatistik kullanılarak korelasyon katsayısı aşağıdaki Pearson
eşitliğinden bulunur.

r
x y i i

 x . y
2
i
2
i
ÖRNEK 4.1.
Dokuz farklı toprak örneğinde tuz konsantrasyonu(%) ve elektriksel geçirgenlik miktarı
(mmhos) değerleri aşağıda verilmiştir(Tablo 4.2).

Örnek Tuz Elektriksel


No Konsantrasyonu Geçirgenlik Yi 2 X i2 X i .Yi
Y X
1 0 0 0 0 0
2 2 4 4 16 8
3 4 6 16 36 24
4 3 8 9 64 24
5 7 12 49 144 84
6 6 14 36 196 84
7 8 16 64 256 128
8 11 22 121 484 242
9 13 26 169 676 338
Toplam 54 108 468 1872 932
Ortalama 6 12

Tablo 4.2. Dokuz toprak örneğinde tuz konsantrasyonu ve elektriksel geçirgenlik


değerleri ve çeşitli istatistikleri
Korelasyon katsayısını hesaplamadan önce her iki değişkenin dağılım grafiğine bakmak
yerinde olacaktır (Şekil 4.3). Dağılım grafiğinden de anlaşılacağı gibi doğrusal ilişki aynı
yönlüdür. Yani toprakların elektriksel geçirgenliği arttıkça tuz konsantrasyonu da
artmaktadır. Korelasyon katsayısının değeri ise +1'e oldukça yakındır.
Şimdi sıra bu katsayıyı hesaplamaya gelmiştir.
( Yi ) 2 (54)2
Tuz konsantrasyonunun KT=  yi2   Yi 2  = 468   144
n 9
( X i ) 2 (108)2
Elektriksel geçirgenlik KT=  xi2   X i2   1872   576
n 9
( X i )( Yi ) 54 x108
İki değişkenin ÇT=  xi yi   X i .Yi  = 932   284
n 9
Şekil 4.3. Dokuz adet toprak örneğinde tuz konsantrasyonu ve elektriksel
geçirgenlik dağılım grafiği
Sonuç olarak tuz konsantrasyonu ile elektriksel geçirgenliği arasındaki korelasyon
katsayısı,

r
x y i i
=
284
 0.97
 x . y
2
i
2
i
576 x144

dır. O halde yapılan bu analiz iki önemli sonucu ortaya koymuştur.


1. Toprakların tuz konsantrasyonu elektriksel geçirgenlik miktarı ile aynı yönde
doğrusal bir ilişki göstermiştir. Biri arttıkça diğeri de artmakta veya biri azaldıkça
diğeri de azalmaktadır.
2. Doğrusal ilişki tama veya %100 e yakındır, yani son derecede kuvvetli bir ilişkidir.
ÖRNEK 4.2. Bir araştırmada traktörlerin bakım harcamaları (TL/yıl) ile yaşları (Yıl)
arasında doğrusal bir ilişki olup olmadığı araştırılmaktadır. Bunun için rastgele seçilen
10 adet traktörün bakım harcamaları (Y değişkeni) ve yaşları (X değişkeni) aşağıda
olduğu gibi bulunmuştur.

Traktör No.
Değişkenler
1 2 3 4 5 6 7 8 9 10
Bakım 230 540 110 220 75 280 140 320 30 420
Harcamaları
Traktörün 8 14 3 7 2 9 4 10 1 12
Yaşı

-Traktörlerin bakım harcamaları ve yaşları arasındaki ilişkiye ait korelasyon katsayısı


(r) değeri nedir ? Bu katsayı hangi sonucu gösterir ?
Örnek Bakım Traktör
No Harcamaları Yaşı X Yi 2 X i2 X i .Yi
Y
1 230 8 52900 64 1840
2 540 14 291600 196 7560
3 110 3 12100 9 330
4 220 7 48400 49 1540
5 70 2 4900 4 140
6 280 9 78400 81 2520
7 140 4 19600 16 560
8 320 10 102400 100 3200
9 30 1 900 1 30
10 420 12 176400 144 5040
Toplam 2360 70 787600 664 22760
Ortalama 236 7.0
( Yi )2 (𝟐𝟑𝟔𝟎)𝟐
Bakım harcamaları KT=  i  i 
y 2
 Y 2
= 787600 - = 230640
n 𝟏𝟎

( X i ) 2
(𝟕𝟎)𝟐
Traktör Yaşı KT=  i  i 
x 2
 X 2
 664 - = 174
n 𝟏𝟎

( X i )( Yi ) 𝟕𝟎 𝒙 (𝟐𝟑𝟔𝟎)
İki değişkenin ÇT=  xi yi   X i .Yi  = 22760 - = 6240
n 𝟏𝟎
Sonuç olarak traktör yaşı ile bakım masrafları arasındaki korelasyon katsayısı,

r
x y i i
=
𝟔𝟐𝟒𝟎
= + 0.985
 x . y
2
i
2
i
𝟏𝟕𝟒 𝒙 𝟐𝟑𝟎𝟔𝟒𝟎

Bu korelasyon katsayısı traktörlerin yaşı ve bakım masrafları arasında pozitif yönde


yüksek bir doğrusal ilişki olduğunu göstermektedir. Buna göre traktörlerin yaşı artıkça
bakım harcamalarının da arttığı söylenebilir.
ÖRNEK 4.3. Oniki adet inek sütünde kalsiyum (Ca) miktarı (mg/g) ile laktik asit miktarı
(g/100g) aşağıda olduğu gibi bulunmuştur.

Değişken Süt Örnekleri


1 2 3 4 5 6 7 8 9 10 11 12
Kalsiyum 5.0 1.0 3.0 5.5 2.0 4.5 6.0 0.5 4.5 1.0 5.0 4.0
miktarı
(mg/g)
Laktik asit 7.9 3.7 6.8 10.5 2.5 9.2 8.0 2.0 5.0 2.0 9.7 5.5
miktarı
(g/100g)
İki değişken arasındaki korelasyon katsayısı (r) değeri nedir ? Bu katsayı hangi sonucu
gösterir?

Örnek Kalsiyum Laktik


No miktarı asit X i2 Yi 2 X i .Yi
(mg/g) (g/100g)
Y X
1 5.0 7.9 62.41 25.0 39.5
2 1.0 3.7 13.69 1.0 3.7
3 3.0 6.8 46.24 9.0 20.4
4 5.5 10.5 110.25 30.25 57.75
5 2.0 2.5 6.25 4.0 5.0
6 4.5 9.2 84.64 20.25 41.4
7 6.0 8.0 64.00 36.0 48.0
8 0.5 2.0 4.0 0.25 1.0
9 4.5 5.0 25.0 20.25 22.5
10 1.0 2.0 4.0 1.0 2.0
11 5.0 9.7 94.09 25.0 48.5
12 4.0 5.5 30.25 16.0 22.0
Toplam 42.0 72.8 544.82 188.0 311.75
Ortalama 3.5 6.06
( Yi ) 2 (𝟒𝟐.𝟎)𝟐
Kalsiyum miktarı KT=  yi2   Yi 2  = 188.0 - = 41.0
n 𝟏𝟐

( X i ) 2 (𝟕𝟐.𝟖)𝟐
Laktik asit KT=  xi2   X i2   544.82 - = 103.17
n 𝟏𝟐

( X i )( Yi ) 𝟕𝟐.𝟖 𝒙 (𝟒𝟐.𝟎)


İki değişkenin ÇT=  xi yi   X i .Yi  = 311.75 - = 56.95
n 𝟏𝟐
Sonuç olarak inek sütlerinde laktik asit miktarı ile kalsiyum miktarı arasındaki
korelasyon katsayısı,

r
x y i i
=
𝟓𝟔.𝟗𝟓
= + 0.876
 x . y
2
i
2
i
𝟏𝟎𝟑.𝟏𝟕𝒙 𝟒𝟏.𝟎
Şekil 4.7. İnek sütünde kalsiyum miktarının laktik asit üzerine olan regresyon doğrusu
ÖRNEK 4.5
8 adet öğrencinin harçlığı ile aile geliri aşağıda olduğu gibi bulunmuştur.

Sıra No Harçlık (TL) Aile Geliri (TL)


1 125 625
2 130 700
3 135 750
4 140 780
5 140 800
6 145 950
7 160 980
8 165 995

Tablo 4.3. Sekiz aile-öğrenci çiftinde aile geliri ve harçlık miktarı (TL)
İki değişken arasındaki korelasyon katsayısını hesaplayarak sonucunu tartışalım.

Sıra No Harçlık (TL) Aile Geliri Y 2 X2 X .Y


Y (TL)
X
1 125 625 15625 390625 78125
2 130 700 16900 490000 91000
3 135 750 18225 562500 101250
4 140 780 19600 608400 109200
5 140 800 19600 640000 112000
6 145 950 21025 902500 137750
7 160 980 25600 960400 156800
8 165 995 27225 990025 164175
Toplam 1140 6580 163800 5544450 950300
Ortalama 142.5 822.5

Tablo 4.4. Harçlık-aile geliri değerleri ve çeşitli istatistikleri


( Yi ) 2 (1140)2
Harçlık KT:  y   Yi 
2
i
2
= 163800   1350
n 8
( X i ) 2 (6580)2
Aile geliri KT: x X
2
i i
2

n
 5544450 
8
 132400

( X i )( Yi ) 1140 x6580


Harçlık-aile geliri ÇT:  x y   X .Y 
i i i i
n
= 950300 
8
 12650

Korelasyon katsayısı,

r
x y i i
=
12650
= + 0.95
 x . y
2
i
2
i
1350 x132400

Tıpkı bir önceki örneğe benzer şekilde bir doğrusal ilişki durumu ortaya çıkmıştır. Aile geliri arttıkça öğrenci
harçlığı da artmakta veya aile geliri azaldıkça harçlık miktarı da almaktadır. Ayrıca doğrusal ilişki tam olmasa
bile tama yakındır.
4.2.DOĞRUSAL REGRESYON
4.2.l.Regresyon Katsayısı
X ve Y gibi herhangi iki değişken arasında bir ilişki varsa matematikte
y=f(x) şeklinde gösterilir. Burada X'e bağımsız değişken, Y'e ise bağımlı
değişken denir. Böylece X'in verilen bazı değerlerinde Y'nin alacağı
değerlerde hesaplanabilir. Örneğin toprağa verilen gübre, verim
açısından bakıldığında bağımsız değişkendir. Ancak gübre verimi
etkiliyor ve değiştirmeye meyil gösteriyorsa verim bir bağımlı
değişkendir. Geriye dönüş anlamına sahip regresyon; Y değişkeninin X
değişkenine matematiksel bağımlılığını gösterir.
İstatistikte bağımlı değişkenler Y ve bağımsız değişkenler ise X ile
gösterilir.
Y ve X arasında önemli bir ilişki var ve korrelasyon katsayısı
yeterince önemli ise, bağımsız değişkenin bir ölçü birimi değiştiğinde
bağımlı değişkenin ne kadar değiştiği karşılaşılan önemli bir sorudur.
Bu regresyon katsayısıdır. Yani; X değişkeninin l ölçü birimi
değişmesi durumunda , Y değişkeninin kendi birimi cinsinden
ortalama değişme miktarıdır. İşte bu regrasyon katsayısıdır. Esasen
tanımlanan bu değere Y'nin X'e göre regresyon katsayısı denir ve byx
şeklinde gösterilir. Ancak bunun terside olabilir. X'in Y'e göre regresyon
katsayısı da vardır ve bu bxy şeklinde gösterilebilir.
Biraz sonrada kanıtlanacağı gibi,

byx=
Ç𝐚𝐫𝐩ı𝐦𝐥𝐚𝐫 𝐓𝐨𝐩𝐥𝐚𝐦ı
byx 
 xyi i

x
𝐁𝐚ğı𝐦𝐬ı𝐳 𝐃𝐞ğ𝐢ş𝐤𝐞𝐧 𝐊𝐓 2
i

σ 𝒙𝒊 𝒚𝒊
bxy= 𝟐 (Burada Y'i bağımsız değişkenmiş gibi düşünmek gerekir)
σ 𝒚𝒊
Yukarıdaki toprak analizi örneğinde (ÖRNEK 4.1); tuz konsantrasyonunun (Y),
elektriki geçirgenlik (X) üzerine olan regresyon katsayısı;

byx= 284/576= 0.499l (%)


Bu regresyon elektriki geçirgenlikteki 1 ölçü birimi değişmeye karşılık tuz
konsantrasyonunun ortalama % 0.49 oranında değiştiğini göstermektedir.
Elektriki geçirgenliğin tuz konsantrasyonu üzerine olan regresyon katsayısı ise;
bxy= 284/l44= l.97 (mmhos)

Görüldüğü gibi korrelasyon katsayısından farklı olarak, regresyon katsayılarının ölçü


birimleri vardır. Öte yandan korrelasyon ve regresyon katsayılarının işaretleri
aynıdır.
ÖRNEK 4.2. (Devam): Örnek 4.2 de verilen Bakım harcamalarının ((Y) traktör yaşı (X)
üzerine olan regresyon katsayısını (𝒃𝒚𝒙) hesaplayınız ve bunun ne anlam ifade ettiğini
açıklayınız.

byx 
 x y 𝟔𝟐𝟒𝟎
i i
= = 35.86 TL
 x 𝟏𝟕𝟒
2
i

Bu sonuç, traktörlerin bir yaş yaşlanması ile bakım masraflarında ortalama 35.86 TL
artış olacağını ortaya koymaktadır.
ÖRNEK 4.3’de verilen Kalsiyum miktarının (Y) Laktik asit miktarı (X) üzerine olan
regresyon katsayısını hesaplayınız ve bu katsayının ne anlam ifade ettiğini açıklayınız.

σ 𝒙𝒚 𝟓𝟔.𝟗𝟓
𝒃𝒚𝒙 =
σ 𝒙𝟐
= = 0.552 mg/g
𝟏𝟎𝟑.𝟏𝟕

İnek sütlerinde laktik asit miktarında 1 birimlik değişmeye karşılık kalsiyum miktarının
ortalama olarak 0.552 mg/g değiştiğini ortaya koymaktadır.
4.2.2.Regresyon Doğrusu

Matematikte y= a+bx şeklinde tanımlanan doğrunun istatistikteki karşılığı regresyon


doğrusudur. Burada a doğrunun y eksenini kesme noktası ve b ise doğrunun eğimidir.
Regresyon doğrusu Şekil 6'da gösterildiği gibi X ve Y değişkenlerinin kesim noktalarını
ortalayan doğrudur. n adet X, Y çiftinde Y'nin X'e göre regresyon doğrusu;

Yi= a+bXi veya çok genel formu ile

Y = a+bX şeklinde tanımlanabilir.
Söz konusu doğru aynı zamanda, verilen herhangi bir X değerinde Y'nin alacağı değeri de
tahminlediğinden, aynı zamanda bir tahminleme eşitliğidir.
Regresyon doğrusu X, Y kesim noktalarını o şekilde ortalamalıdır ki, gözlenen Yi
değerlerinin bu doğrudan sapmaları minimum olabilsin.
Dikkat edilirse regresyon doğrusunun eğimini gösteren b değeri bir önceki konuda
açıklanan Y bağımlı değişkeninin X bağımsız değişkeni üzerine olan regresyon
katsayısına eşittir. Yani,
b  byx

O halde normal eşitlikleri kullanmadan da a ve b sabitlerinin hesaplanması


mümkündür.
a  Y  bX

b
 xyi i

x 2
i

Bunlardan önce b değeri ve ardından ise a değeri hesaplanabilir.


ÖRNEK 4.1’de verilen değerlerden, tuz konsantrasyonunun elektiriki geçirgenlik
üzerine regresyon doğrusunu oluşturalım. Orada;  xy= 284 ve  x2 = 576; 𝐘
ത=6
ഥ= l2 idi. O halde;
ve 𝐗
b=byx=  xy/  x2 = 284/576= 0.49 % ve
ത 𝐗
a= 𝐘-b ഥ = 6 - 0.49 x l2= 0.0833 dir.

𝐘෠ = 0.0833+0.49X
Bulunan doğru denklemine, daha öncede değinildiği gibi "Önceden Tahminleme
Denklemi" de denir. Örneğin; elektriki geçirgenlik X=20 mmhos olduğunda tuz
konsantrasyonu;
𝐘෠ = 0.0833+0.49x20 = % 9.92 olur. Tahminlenen bu değere X=20 ye ait
regresyon değeri denir ve bütün istatistiklerde olduğu gibi bunun da bir standart
hatası vardır.
Şekil 4.3. Dokuz adet toprak örneğinde tuz konsantrasyonu ve elektriksel
geçirgenlik dağılım grafiği
ÖRNEK 4.2.(Devam). Örnek 4.2’de verilen traktörlerin yaşı ve bakım harcamaları
arasındaki ilişki ile ilgili soruda bakım harcamalarının (Y) traktör yaşı (X) üzerine olan
regresyon doğru denklemini oluşturunıuz.
Bakım harcamaları ortalaması : 𝐘ഥ = 236 TL
Traktör yaşı ortalaması : 𝐗ഥ = 𝟕

byx 
 x y 𝟔𝟐𝟒𝟎
i i
= = 35.86 TL
 x 𝟏𝟕𝟒
2
i

a  Y  bX = 236 – 35.86 x 7 = - 15.0


O halde bakım harcamalarının traktör yaşı üzerine regresyon doğrusu ,
^
Yi  a  b.X i = - 15.0 + 35.86 Xi
^
Yi  - 15.0 + 35.86 Xi
Şekil 4.6. Traktör yaşı ile bakım masrafları arasındaki ilişkiye ait regresyon doğrusu
ÖRNEK 4.3’de verilen Kalsiyum miktarının (Y) laktik asit miktarı (X) üzerine regresyon
katsayısını bulunuz ve bu katsayının ne ifade ettiği
^
Yi  a  b.X i b
 x y 56.95
i i
= = 0.552 mg/g
 x 103.17
2
i

a  Y  bX = 3.5 – 0.552 x (6.06) = 0.15

Ŷ = 0.15 + 0.552 X
Şekil 4.7. İnek sütünde kalsiyum miktarının laktik asit üzerine olan regresyon doğrusu
Örnek 4.8
Daha önce çeşitli istatistikleri hesaplanmış olan harçlık-aile geliri örneğinde öğrenci harçlıklarının aile geliri
üzerine olan regresyon doğru denklemini tanımlayalım. Bunun için a ve b katsayılarının hesaplanması
gerekir.
Tablo 3.4 den de görüldüğü gibi,

Harçlık ortalaması : Y  142.5 YTL

Aile geliri ortalaması : X  822.5 YTL


ve ayrıca,

 x y  12650
i i

 x  132400
2
i

olduğu bulunmuştu.

byx 
x y i i
=
12650
 0.096 YTL
x 2
i 132400

a  Y  bX = 142.5  0.096 x822.5  63.5 YTL


O halde harçlıkların aile geliri üzerine regresyon doğrusu ,
^
Yi  a  b. X i = 63.5  0.096. X i
^
Yi  63.5  0.096. X i
Şekil 4.4. Sekiz adet aile-öğrenci çiftinde harçlık ve aile gelirlerinin
dağılım grafiği ve harçlığın aile geliri üzerine olan regresyon doğrusu.
►Arazilerin eğim derecesi ile erozyonla toprak kaybı arasındaki ilişki araştırılmaktadır. Bu
amaçla yapılan bir çalışmada farklı eğim derecelerine sahip alanlarda yıllık olarak erozyonla
toprak kaybı (cm3) gözlenmiştir. Elde edilen değerler aşağıdaki tabloda verilmiştir.
Değişken Arazi Örnekleri
1 2 3 4 5 6 7 8 9
Arazi Eğimi (%) 13 26 5 11 27 34 25 4 8
Erozyonla Toprak 72 81 45 67 86 99 84 55 62
Kaybı (cm3)
1) İki değişken arasındaki korelasyon katsayısı (r) değeri nedir ? Bu katsayı hangi sonucu
gösterir?
Örnek Erozyonla Arazi
No Toprak Eğimi Yi 2 X i2 X i .Yi
Kaybı X
Y
1 72 13 5184 169 936
2 81 26 6561 676 2106
3 45 5 2025 25 225
4 67 11 4489 121 737
5 86 27 7396 729 2322
6 99 34 9801 1156 3366
7 84 25 7056 625 2100
8 55 4 3025 16 220
9 62 8 3844 64 496
Toplam 651 153 49381 3581 12508
Ortalama 72.3 17.0
( Yi ) 2 (651)2
Erozyonla Toprak Kaybının KT=  y   Yi  2
i
2
= 49381 - = 2292
n 9

( X i ) 2 (153)2
Arazi Eğimi KT=  xi   X i   3581 - = 980
2 2

n 9

( X i )( Yi ) 153 𝑥 (651)


İki değişkenin ÇT=  xi yi   X i .Yi  = 12508 - = 1441
n 9

r
x y i i
=
1441
= +0.961
 x . y
2
i
2
i
980 𝑥 2292

Bu sonuca göre, arazi eğimi arttıkça erozyonla toprak kaybı da artmaktadır.


2) Erozyonla toprak kaybı miktarının (Y) arazilerin eğim
derecesi (X) üzerine olan regresyon katsayısı ve bu katsayının ne
anlam ifade ettiğini açıklayınız.

σ 𝑥𝑦 1441
𝑏𝑦𝑥 = σ 𝑥2
= = +1.470 cm3
980

Arazilerin eğim derecesi 1 birim değiştiğinde erozyonla toprak kaybı


ortalama 1.470 cm3 değişmektedir.
3) Erozyonla toprak kaybı miktarının (Y) arazilerin eğim derecesi (X) üzerine olan
Regresyon doğrusunu oluşturunuz.
^
Yi  a  b. X i

a  Y  bX = 72.3 – (+1.470) x 17.0 = 47.34

σ 𝑥𝑦 1441
𝑏 = 𝑏𝑦𝑥 =
σ 𝑥2
= = +1.470
980

Ŷ= 47.34 + 1.470X
BÖLÜM 5
UYGULAMA SORULARI VE ÇÖZÜMLERİ
ÖRNEK 5.1.Varyans bilinmeyen populasyondan çekilmiş 25 varyantlık bir örneğin ortalaması
22.5 cm ve varyans 2.56 dır. Örnek ortalamasının standart hatası nedir?

.
S = = = 0.32 cm dir.

Ortalama ile birlikte ; x±S


22.5±0.32 cm şeklinde yazılabilir.

Standart hatanın serbestlik derecesi ise SD = n-1 = 25 – 1 = 24 dür.

ÖRNEK 5.2.
Tarla koşullarında yetiştirilmiş patates bitkilerinde bitki başına yaprak alanı ortalaması 800
cm 2 ve standart sapması 90 cm 2 olan normal bir dağılış göstermektedir. Aşağıdaki iki soruyu
yanıtlayalım.
a. Bitkilerin yer aldığı populasyonda bunların yüzde kaçı 750-850 cm 2 arsında yaprak
alanına sahiptir.

Şekildeki alanın toplam alana oranını veya integralini z-tablosundan yaralanarak hesaplayalım.
750 ve 850 cm 2 lik yaprak alanlarının standart değerleri,
750  800 850  800
z1   -0.56 ve z1   +0.56
90 90
EKTABLO I de z dağılışının ortalaması olan sıfır ile 0.56 arasındaki olasılık 0.2123 dır. O
halde,
P(750  xi  850) =0.2123+0.2123=0.4246 (%42.5)
olur. Tarladaki bitkilerin %42.5 unda yaprak alanının 750-850 cm 2 olması beklenir. Yada
herhangi rast gele alınan bir yaprağın alanının bu iki değer arsına düşme olasılığı %42.5 dır.
b. Bitkilerin yer aldığı tarladan dört bitkilik örnekler alındığında ( n  4 ) bu örneklerin
yüzde kaçında ortalama yaprak alanının yine 750-850 cm 2 olması beklenir.
Örnekleme dağılışının ortalaması ve standart sapması,
 90
 X   =800 cm 2 ve  X  =  45 cm 2
n 4
İstenen olasılık bu kez dört yapraklık örneklerin ortalamalarının örnekleme dağılışındaki
aşağıda verilen şekilde gösterilen olasılıktır.

Örnekleme dağılışındaki ortalama 750 ve 850 cm 2 lik yaprak alanlarının standart değerleri ise
bu kez,
750  800 850  800
z1   -1.11 ve z1   +1.11
45 45
Bunların EKTABLO I de verilen olasılıkları ise 0.3665 dır. Sonuç olarak,
P(750  X i  850) =0.3665+0.3665=0.733 (% 73.3)

dır. Her birisi 4 adet bitki olan sınırsız sayıda örnekler alınıp ortalamaları hesaplanırsa bunların
%73.3 ünün 750-850 cm 2 arasına düşmesi beklenir.
ÖRNEK 5.3.
Yeni doğmuş ivesi kuzularından rast gele alınmış 28 adet kuzunun doğum ağırlıkları (Kg)
aşağıda olduğu gibi bulunmuştur.

Doğum ağırlığı
4.3 5.2 6.2 6.7 5.3 4.9 4.7 5.5 5.3 4.0 4.9 5.2 4.9 5.3
5.4 5.5 3.6 5.8 5.6 5.0 5.2 5.8 6.1 4.9 4.5 4.8 5.4 4.7
Söz konusu örneğin ortalamasını, varyansını, standart hatasını ve serbestlik derecesini
hesaplayalım. Eğer gerekli işlemler yapılırsa,
X  5.2 ve S 2  0.428 ve S  0.654
olduğu görülür. O halde ortalamanın standart hatası,
S 0.654
SX  =  0.124 ve serbestlik derecesi ise 28-1=27
n 28
dır.
ÖRNEK 5.4.
Ampul üreten A fabrikasında ampullerin ortalama dayanma süresi 1400 saat ve standart
sapması ise 200 saattir (varyansı 40.000). B fabrikasında ise ortalama süre 1200 saat ve standart
sapması 100 saat olmaktadır (varyansı 10.000). Her iki firmanın ürettiği ampullerden 125 er
adetlik örnekler aldığımızı varsayalım. A fabrikasında üretilen ampullerin B fabrikasında
üretilenlere göre ,
a. En az 160 saat daha fazla dayanması ve
b. 250 saatten daha fazla dayanması olasılıkları nedir.
Farklılığın örnekleme dağılışının ortalaması,
( X 1X2 )
 1  2 = 1400-1200=200 saat

ve farklılığın standart hatası ise veya örnekleme dağılışının standart sapması ise,
40000 10000
 (X X )   =20 saat
1 2
125 125
A fabrikasında üretilen ampullerin 160 ve daha fazla saat dayanması olasılığı aşağıdaki dağılış
eğrisinden de görüldüğü gibi taralı alan veya 160 h ile  arasındaki integraldir. Bunu
EKTABLO I den bulalım. 160 saate ait olan standart değer,
160  200
z  2.00
20
EKTABLO I de ortalama 0 olan z değeri ile 2.00 arasındaki olasılık 0.4772 dır. O halde,
P( X A  X B )  160 =0.5000+0.4772=0.9772 (%97.7)

dır. A fabrikasında üretilen ampullerin B fabrikasında üretilenlere göre 160 saatten daha fazla
dayanması şansı %97.7 dır.
A fabrikasında üretilen ampullerin 250 saatten daha fazla dayanması ise bu kez aşağıdaki
şekilde gösterilen alandır.

250 saatlik farklılığı ait standart değer,


250  200
z  2.50
20
EKTABLO I de 2.50 ile sıfır z değeri arasındaki olasılık 0.4938 dır.
P( X A  X B )  250 =0.5000-0.4938=0.0062 (%0.62)

dır.

ÖRNEK 5.5.
Bir ülkede liseyi bitirenlerin oranı 0.25 dır. Populasyondan alınan 100 kişilik örneklerde liseyi
bitirme oranlarının ortalamasını ve standart sapmasını bulalım.
 =p=0.25
^
p

0.25* 0.75
 
^  0.04
p 100
Öte yandan n * p  100 * 0.25  25  5 olduğundan dağılış tipi normaldir.
Buna göre liseyi bitirenlerin oranlarının 0.30 dan daha fazla olma şansını hesaplayalım.
Söz konusu olasılık EKTABLO I den yaralanılarak hesaplanabilir. 0.30 oranının standart
değeri,
^
p  ^ ^
p p p 0.30  0.25
z   =1.25
 ^  ^ 0.04
p p

EKTABLO I de 1.25 ile sıfır ortalama arasındaki olasılık 0.3955 dır. Buna göre aranan yanıt,
^
P ( p  0.30) =0.5000-0.3955=0.1045

dır. O halde 100 varyantlık örneklerde liseyi bitirme oranının 0.30 ve daha yüksek olması
şansının %10.5 olduğunu ileri sürmek mümkündür.

ÖRNEK 5.6. Domates salçalarında bir yıllık raf ömrü sonunda bozulma oranının 0.10 olması
yönetmelik gereğidir. Bir salça fabrikasının ürettiği salçalardan rastgele seçilen 550 salça
kutuluk örneklerde örnekleme dağılışının ortalamasını ve standart sapmasını hesaplayalım.
Söz konusu örnekleme dağılışının ortalaması;

p*q . .
 = p = 0.10 ve standart sapması;  ^ 
^
p p n
= = 0.0128

ÖRNEK 5.7. Bir elma çeşitinde 200 elmadan 80'inde ve ikinci bir çeşitte ise 180 elmanın
120'sinde elma içi kurdu görülmüştür. Elma iç kurdu oranlarını ve farklılığının standart hatasını
bulunuz.

^ ^
p1 = = 0.40 ve p2 = = 0.67

^ ^ ^ ^
p1 * q1 p2 * q2 . . . .
S ^ ^   = + = 0.49
( p1  p2 ) n1 n2

(0.40-0.67) ± 0.049
ÖRNEK 5.8.
Aynı populasyondan alınan 200 kişilik bir örnekte 12 kişinin ve 150 kişilik bir örnekte ise 5
kişinin solak olduğu görülmüştür. Her iki örnekte solakların oranını, farkını ve bu farklılığın
standart hatasını hesaplayalım.
^ 12 ^ 5
p1 =  0.06 ve p2 =  0.03
200 150
Bu iki örnekteki oranların farkı,
^ ^
p1 _ p2 =0.06-0.03=0.03

ve standart hatası ise,


0.06 * 0.94 0.03* 0.97
S ^ ^   =0.02
( p1  p2 ) 200 150

ÖRNEK 5.9.
On iki adet traktörün yaşı ve bakım masrafları arasındaki korelasyon katsayısı r  0.875 dır.
Populasyonun korelasyon katsayısının sıfır olduğunu (   0 ) kabul ederek standart hatasını ve
serbestlik derecesini bulalım.

(1  (0.8752 )
Sr  =0.153 ve SD=10
(12  2)

ÖRNEK 5.10.
Aynı dersi alan bayan öğrencilerde sözlü ve yazılı sınarlar arasındaki korelasyon katsayısı 0.60
ve erkek öğrencilerde ise 0.50 dır. Eğer 40 adet bayan ve 35 adet erkek olan şans örnekleri
alınırsa bayanlara ait korelasyonun erkeklere ait korelasyondan daha düşük olma şansı nedir.
r1  0.60 için z1  0.69 ( EKTABLO II den)

r2  0.50 için z2  0.55 (EKTABLOII den)

Olduğundan farklılık,
z1  z2  0.69  0.55 = 0.14

ve standart hatası ise,

1 1
S( z1  z2 )   =0.24
40  3 35  3
dır. Bayanlarda korelasyonun erkeklerden daha düşük olması için farkın sıfırın altında olması
gerekir. O nedenle söz konusu olasılık aşağıdaki şekilde verilen taralı alan yada sıfır ile eksi
sonsuz arasındaki olaıslık veya sıfır olan farkın eklemeli olasılığıdır. Bunu EKTABLO I den
yararlanarak bulalım. Sıfır farkının standart değeri,
0  0.14
z  0.58
0.24
İlgili tabloda 0.58 ile sıfır z değeri arasındaki olasılık 0.2190 dır. O halde aranan yanıt 0.5000-
0.2190=0.281 (%28.1) dır. Yani bayan öğrencilerdeki korelasyon katsayısının erkeklere göre
daha düşük olma şansı %28 dır.

PROBLEM 5.11.
Ergin yaşa gelmiş erkeklerde boy 175 cm ve standart sapma 6.4 cm dır( varyansı 41). Ergin
kadınlarda ise ortalama boy 165 cm ve standart sapması 6.4 cm dır (varyansı 41). Birinci
populasyon erkeklerin boyu ve ikinci populasyon ise kadınların boyu olsun. Her iki
populasyondan da 50 şer kişi seçilmiş olsun.
a. İki cinsiyet populasyonundan alınan örneklerin X 1  X 2 ortalama farklılığının örnekleme
dağılışının ortalaması,
( X 1X2 )
 1   2 =175-165=10 cm

b. X 1  X 2 ortalama farklılığının örnekeleme dağılışının standart sapması daha doğrusu iki


ortalama farklılığının standart hatası,

 12  22 41 41
(X X )   =  =1.28 cm
1 2
n1 n2 50 50

c. Erkeklerin boylarının kadınların boylarından 12 cm daha uzun olması şansı nedir?. Yani,
P( X 1  X 2 )  12

olasılığı araştırılmaktadır. Bu olasılık aşağıdaki şekilden de görüldüğü gibi taralı alandır.


Standart hata populasyon varyansı ile hesaplandığından ve örnekler büyük olduğundan söz
konusu olaıslığı z dağılışı veya standart normal dağılıştan yararlanarak bulabiliriz.
İstenen 12 cm lık farklılığın standart değeri,
( X 1  X 2 )  ( X1  X 2 ) 12  10
z   1.56
 ( X X
1 2)
1.28

EKTABLO I de 0 z değeri ile 1.56 değeri arsındaki olasılık 0.4406 dır. Buna göre,
P( X 1  X 2 )  12 =0.5000-0.4406=0.0594 (%5.9)

ÖRNEK 5.12.

Serbestlik derecesi v  n  1  9  1  8 olan bir khi-kare dağılışı için çeşitli olasılık tanımlamaları
yapalım
Sekiz serbestlik dereceli bu khi-kare değişkeninin dağılış eğrisi aşağıda verilmiştir.

Şekil 7.4. Sekiz serbestlik dereceli khi-kare dağılışı

Ortalaması v  8 ve varyansı 16 dır. Dağılış 0 ile artı sonsuz arasındaki bütün khi-kare
değerlerini kapsar. Öte yandan z ve t dağılışları simetrik olduğu halde khi-kare dağılışı sağa
veya pozitif yana eğikdir. Dağılış eğrisi sekiz serbestlik dereceli khi-kare değerleri ile ilgili
bütün olasılıkların tanımlanmasında kullanılabilir.
ÖRNEK 5.13.
Sekiz serbestlik dereceli khi-kare dağılışında khi-kare değerlerinin yüzde kaçı 20.09 dan daha
büyüktür. Herhangi bir khi-kare değerinin 20.09 dan daha büyük olması şansı nedir.

Khi-kare dağılış grafiğinden de görüldüğü gibi 20.09 dan daha düşük khi-karelerin oranı %99
dır.
Ortalaması ve varyansı bilinen normal populasyondan alınan 8 serbestlik dereceli örneklerin
khi-kare değerleri hesaplanırsa bunların %1 i 20.09 dan daha yüksek ve %99 u ise daha düşük
khi-kare değerleri gösterirler. Sekiz serbestlik dereceli herhangi bir şans örneğinin 20.09 dan
daha yüksek bir değer alması şansı da %1 dır. Burada örnek olarak alınan 20.09 khi-kare değeri
serbestlik derecesi 8 olan örneklerde khi-kare dağılışını %99:%1 olacak şekilde ikiye ayıran
değerdir ve o nedenle kritik bir değer olarak düşünülür.
Bu kez yine aynı örnekte 15.51 den daha yüksek khi-kare değerlerinin oranını bulalım.
Şekilden de görüldüğü gibi sekiz serbestlik dereceli khi-kare dağılışında  2  15.51 değeri
dağılışı %95:%5 olmak üzere iki kısma ayırmaktadır. O nedenle bu da başka bir kritik değerdir.
Herhangi bir khi-kare değerinin 15.51 den daha yüksek olması şansı %5 dır.
Çoğu khi-kare testlerinde uygun serbestlik derecelerindeki khi-kare değerlerinin yukarıdaki
örneklerde olduğu gibi verilen bir khi-kare değerinden daha yüksek olma olasılıkları
kullanılmaktadır. İntegral alma sorununu ortadan kaldırmak için çeşitli serbestlik derecelerinde
çeşitli daha fazla olasılıkları sınırlandıran khi-kare değerleri EKTABLO IV de verilmiştir.
Tabloda ilk sütunda serbestlik dereceleri, ilk sırada ise 0.995 den yani yaklaşık 1 den
başlayarak 0.005 e kadar daha fazla olasılıklar ve tablonun orta kısmında ise bu olasılıkları
sınırlandıran khi-kare değerleri yer alır.
Örneğin sekiz serbestlik dereceli sıra aşağı da olduğu gibi görülür.

Görüldüğü gibi 15.51 den daha yüksek khi-kare elde etme olasılığı %5 ve daha düşük bir khi-
kare elde etme olasılığı ise %95 dır. 20.09 dan daha yüksek khi-kare elde etme olasılığı %1 ve
21.96 dan daha yüksek khi-kare değeri elde etme olasılığın ise %0.005 dır.
ÖRNEK 5.14.
On bir serbestlik dereceli bir örneğin khi-kare değeri  2 = 23.32 olarak bulunmuştur. Söz
konusu örneğin 11 serbestlik dereceli veya içinde 12 adet varyant bulunan bir populasyondan
çekilme olasılığı nedir? EKTABLO IV den de görüldüğü gibi % 2.5 ve % 1.0 arasında olup
takriben %l.75'dir. Eğer % 5 düzeyi kritik düzey olarak alınırsa, bu örneğin böyle bir
populasyona temsil etmediği veya böyle bir populasyondan çekilmediği sonucu ortaya çıkar.

► Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü sonundaki
bozulma oranları araştırılmaktadır. Bu amaçla yapılan bir çalışmada Pastorizasyon tekniği ile
işlenmiş olan 740 süt şişesinden 326’sının ve UHT tekniği ile işlenmiş olan 850 süt şişesinden
281’inin 6 ay sonunda bozulduğu belirlenmiştir. Bu deneme ile ilgili aşağıdaki soruları
yanıtlayınız.
5.15.Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü
sonundaki bozulma oranları nedir ?
n1 = 850 X1 = 281 P = X1/ n1 = 281/850 = 0.33
n2 = 740 X2 = 326 P = X2/ n2 = 326/740 = 0.44
5.16.Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü
sonunda bozulma oranları arasındaki farklılığın standart hatasını (S(p1 -p2) )
hesaplayınız.

q = 1- p = 1 – 0.33 = 0.67 q = 1- p = 1 – 0.44 = 0.56

^ ^ ^ ^
p1 * q1 p2 * q2 . . . .
S ^ ^   = + = 0.0243
( p1  p2 ) n1 n2

► Bursa’da üretilen Deveci armutlarında zirai ilaç kalıntı miktarını analiz etmek için
kullanılan ve doğruluğu kanıtlanmış olan “Klasik Metot” yanında daha kısa sürede sonuç veren
fakat doğruluğu kanıtlanmamış olan “Hızlı Metot” geliştirilmiştir. Yapılan bir araştırmada bu
iki metot karşılaştırılmıştır. Bu amaçla, zirai ilaç uygulanmış olan Deveci armutunun bulunduğu
bir bahçeden rastgele seçilen 12 ağacın meyvelerine Klasik Metot, yine aynı bahçeden rastgele
seçilen 10 ağacın meyvelerine Hızlı Metot uygulanarak zirai ilaç kalıntı miktarları
belirlenmiştir. Her iki metoda ait zirai ilaç kalıntı miktarları (ppm) aşağıdaki tabloda verilmiştir.

Metot Örnek No.

1 2 3 4 5 6 7 8 9 10 11 12
Klasik 62 74 56 61 75 53 59 66 61 55 64 70
Hızlı 49 56 62 48 67 64 58 54 50 65 - -

5.17.Her iki analiz metodunun (sırasıyla Klasik; S12 ve Hızlı ; S22 metot) varyanslarını
hesaplayınız.

Klasik metodun kareleri toplamı:

(∑ ) ( )
∑ 𝒙𝟐𝟏 = ∑ x - = (622+742+…..+702) - = 562.0

∑ 𝐱𝟐𝟏 .
Varyansı; S = = = 51.1

Hızlı metodun kareleri toplamı:

(∑ ) ( )
∑ 𝒙𝟐𝟐 = ∑ x - = (492+562+…..+652) - = 442.1

∑ 𝐱𝟐𝟐 .
Varyansı; S = = = 49.1
5.18. Bu örneğe ait müşterek (toplanmış) varyansı ve serbestlik derecesini bulunuz.

∑ ∑ . .
S = = = 50.2 SD = n1 + n2 − 2 = 12 + 10 – 2 = 20

► Bursa bölgesinde iki farklı bünyeye sahip olan (Tın ve Kil) tarlalardan alınan toprak
örnekleri aynı metotla analiz edilerek fosfor kapsamları (P2O5 kg/da) belirlenmiş ve elde edilen
veriler aşağıda olduğu gibi bulunmuştur. Fosfor analizi kil bünyeli toprakta 11, tın bünyeli
toprakta 10 örnekte yapılmıştır.

Toprak Toprak Örneği No.


Bünyesi
1 2 3 4 5 6 7 8 9 10 11
Kil 67 40 57 69 21 66 54 72 61 29 40
Tın 63 36 46 29 42 43 58 47 36 50 -

5.19.Kil ve tın bünyeli toprakların kareleri toplamlarını hesaplayınız.


Kil bünyeli toprağın kareleri toplamı:

(∑ ) ( )
∑ 𝒙𝟐𝟏 = ∑ x - = (672+402+…..+402) - = 2996.6

Tın bünyeli toprağın kareleri toplamı:

(∑ ) ( )
∑ 𝒙𝟐𝟐 = ∑ x - = (632+362+…..+502) - = 954.0

5.20. Kil ve tın bünyeli toprakların fosfor kapsamlarına ilişkin varyanslarını ( sırasıyla
S12 ve S22) ve serbestlik derecelerini bulunuz.
∑ 𝐱𝟐𝟏 .
Kil bünyeli toprağın varyansı; S = = = 299.6 SD = n1 – 1 = 11-1 = 10

∑ 𝐱𝟐𝟐 .
Tın bünyeli toprağın varyansı; S = = = 106.0 SD = n2 – 1 = 10-1 = 9

► Türk Gıda Kodeksine göre birinci sınıf meyve sularında brix oranının (kuru madde oranı)
0.45 olması gerekmektedir. Meyve sularında brix oranına ait standart sapmanın (σ) 0.80 olduğu
bilinmektedir. Bir meyve suyu fabrikasından rastgele alınan 100 adet 1 litrelik meyve suyu
kutularında ortalama brix oranı 0.37 olarak bulunmuştur.

5.21. Bu meyve suyu fabrikasından alınan meyve suyu örneklerinin brix oranına ilişkin
örnekleme dağılışının varyansını ve standart sapmasını hesaplayınız.
Örnekleme dağılışının varyansı;
( . )
= = = 0.0064
Örnekleme dağılışının standart sapması;

σ .
σ =
√n
= = 0.08 % değerindedir.

5.22.Söz konusu meyve suyu fabrikasının Türk Gıda Kodeksine uygun üretimde bulunup
bulunmadığına ilişkin hipoteznin testi için hesaplanması gereken test istatistiğinin
değerini hesaplayınız.

Xi  X . .
zi 
X
= = - 1.0 dır.
.

► Bir soya fasulyesi çeşidinde iki farklı tohumluk rutubet oranının (% 8 ve % 11) çimlenme
gücü üzerine etkisi araştırılmaktadır. Yapılan deneme sonunda oda sıcaklığında % 8 rutubet
oranında 1 yıl depolanan 750 tohumdan 675 tanesinin ve oda sıcaklığında % 11 rutubet oranında
1 yıl depolanan aynı çeşide ait 900 tohumdan 765 tanesinin çimlendiği belirlenmiştir. Bu
deneme ile ilgili aşağıdaki soruları yanıtlayınız.

5.23. Oda sıcaklığında iki farklı tohumluk rutubet oranında (% 8 ve % 11) 1 yıl süreyle
depolanan soya tohumlarında çimlenme oranlarını bulunuz.

n1 = 750 X1 = 675 P = X1/ n1 = 675/750 = 0.90 (% 8 rutubet)


n2 = 900 X2 = 765 P = X2/ n2 = 765/900 = 0.85 (% 11 rutubet)

5.24.İki farklı tohumluk rutubet oranlarına (% 8 ve % 11) ait çimlenen tohum sayıları
arasındaki farklılığın standart hatasını ( S(p -p ) ) hesaplayınız.

^ ^ ^ ^
p1 * q1 p2 * q2 . . . .
S ^ ^   = + = 0.016 %
( p1  p2 ) n1 n2

5.25. İki farklı rutubet oranında çimlenen tohum oranlarının farklı olup olmadığına dair
hipotez testi için hesaplanması gereken test istatistiğinin değerini bulunuz.
(µ µ ) ( . . )
z=
.
= + 3.25
( )

►Damla ve karık usulü sulama yöntemlerinin domateste verim üzerine etkileri


araştırılmaktadır. Bunun için yapılan bir denemede damla sulama yöntemi 10, karık usulü
sulama yöntemi ise 11 domates parselinde uygulanmıştır. Hasatta her iki sulama yönteminin
uygulandığı parsellerden elde edilen domates verimleri (kg/parsel) aşağıdaki tabloda
verilmiştir. Bu deneme ile ilgili aşağıdaki soruları cevaplayınız.

Sulama Parsel No :
Yöntemi 1 2 3 4 5 6 7 8 9 10 11
Damla 76 98 123 107 88 96 127 103 93 119 -

Karık 47 54 71 49 65 57 52 58 63 70 62

5.26.Damla ve karık usulü sulama yöntemlerinin ayrı ayrı örnekleme varyanslarını ( S12
ve S 22 ) ve müşterek varyansı hesaplayınız.

Damla sulama yönteminin kareleri toplamı:

(∑ ) ( )
∑ 𝒙𝟐𝟏 = ∑ x - = (762+982+…..+1192) - = 2376

∑ 𝐱𝟐𝟏
Varyansı; S = = = 264.0

Karık sulama yönteminin kareleri toplamı:

(∑ ) ( )
∑ 𝒙𝟐𝟐 = ∑ x - = (472+542+…..+622) - = 648.9

∑ 𝐱𝟐𝟐 .
Varyansı; S = = = 64.9

5.27. Müşterek (toplanmış) varyansı ve serbestlik derecesini hesaplayınız.

∑ ∑ .
S = = = 159.2 SD = n1 + n2 − 2 = 10 + 11 – 2 = 19

5.28. Farklılıkların standart hatasını hesaplayınız.

S 2 (n1  n2 ) . ( )
S ( X1  X 2 )  = = 5.51 kg/parsel
n1n2
-1
►Elmada kara leke hastalığına karşı kullanılan b r fungus t n 285 mg.g etk l madde çermes
yönetmel k gereğ d r. Aynı t p fungus t üreten b r fabr kadan rastgele alınan 27 kutuluk b r
-1 2
örnekte ortalama etk l madde m ktarı 279 mg.g ve varyansı (S ) se 38.9 olarak bulunmuştur.
5.29.Denemede örnek ortalamasının örnekleme dağılışının standart hatasını ve test
stat st ğ n hesaplayınız.
Bu fabr kadan alınan 27 kutuluk örnekler n oluşturduğu örnekleme dağılışının ortalaması;

= µ = 285 mg.g-1
.
Örnek ortalamasının standart hatası; S = = = 1.20 mg.g-1

SD = n -1 = 27 – 1= 26
Örneğin standart değeri veya test istatistiği;

t= = = - 5.0
.

5.30. Fabr ka yönetmel ğe uygun üret m yapmakta mıdır ? Test ederek sonucu
yorumlayınız.

26 SD’l t- dağılışı
0.99 0.05
0.05

- 2.779 +2.779

Sonuç; - 5.0 t değeri 26 SD’li t- dağılışında % 1 olasılık düzeyinin kritik t-değeri olan -2.779
dan daha küçük olduğu için 27 kutuluk örneğin etkili madde miktarı 285 mg.g-1 olan bir
popülasyona girmesinin, böyle bir popülasyondan çekilmiş şans örneklerinden biri olma
olasılığının % 1 den daha düşük olduğu kabul edilir. Yani, - 5.0 < - 2.779 olduğundan bu
fabrikada elmada kara leke hastalığına karşı üretilen fungusitlerin etkili madde miktarının 285
mg.g-1 olduğu kabul edilemez. Buna göre fabrika yönetmeliğe uygun üretimde
bulunmamaktadır.
►10 adet ayç çeğ çeş d n n yağında ole k as t le l nole k as t oranı arasındak l şk ye a t
korelasyon katsayısı r = - 0.926 bulunmuştur.

5.31. Korelasyon katsayısının standart hatasını ve serbestl k dereces n bulunuz.


(1  r 2 ) 𝟏 ( 𝟎.𝟗𝟐𝟔)𝟐
Sr 
( n  2)
= 𝟏𝟎 𝟐
= 0.133 SD = n -2 = 10 – 2 = 8

5.32. Buna göre ayç çeğ yağında ole k as t le l nole k as t oranı arasında negat f yönde
tam doğrusal l şk olduğu söyleneb l r m ? Test ederek sonucu yorumlayınız.

Korelasyon katsayısının 𝜌 = 0 a göre standart değeri ya da test istatistiği;


.
t= = = - 6.96 t8 SD (0.01) = 3.355
.
Sonuç; - 6.96 t değeri 8 SD’li t- dağılışında % 1 olasılık düzeyinin kritik t-değeri olan -3.355
den daha küçük olduğu için r = - 0.926 olan korelasyon katsayısının 𝜌 = 0 olan bir
populasyona girmesinin, böyle bir populasyondan çekilmiş şans örneklerinden biri olma
olasılığının % 1 den daha düşük olduğu kabul edilir. Yani, - 6.96 < - 3.355 olduğundan söz
konusu korelasyon katsayısının sıfır olduğu veya istatistiksel olarak önemsiz olduğu kabul
edilemez. Buna göre ayç çeğ yağında ole k as t le l nole k as t oranı arasında negat f yönde ve
öneml düzeyde tam doğrusal l şk olduğu söyleneb l r.

8 SD’l t- dağılışı
0.99
0.05 0.05

- 3.355 + 3.355
- 6.96
BÖLÜM 5:ÖRNEKLEME DAĞILIŞLARI ve TEST DAĞILIŞLARI

5.l.ÖRNEKLEME DAĞILIŞLARI
Çeşitli tip populasyonlardan çekilen şans örneklerinden hesaplanan X, S, r ve b gibi çeşitli
istatistikler de örnekten örneğe değişiklik gösterirler ve o nedenle yine bir dağılış izlerler. Bu
istatistiklerin izledikleri dağılışa örnekleme dağılışı denir. Bu dağılışlar da teoriktir ve her
biri dağılış ortalaması, varyans ve dağılış tipi ile tanımlanabilirler. Örnekleme dağılışlarının
belirtilen bu parametreleri ve tipi birinci derecede örneğin alındığı esas populasyonun
parametrelerine ve tipine bağlıdır. Burada daha önce tanımlanan bazı istatistiklerin örnekleme
dağılışları açıklanacaktır.
_
5.l.l.Örnek Ortalamalarının (X) Örnekleme Dağılımı
Ortalaması µ ve varyansı 𝜎 olan bir populasyondan herbirinde aynı sayıda varyant bulunan
(n adet) örnekler çekilmiş olsun. Bulunan örnek ortalamaları X1, X2, X3 ... Xk şeklinde
gösterilirse bunlarda örnekten örneğe farklılık göstererek kendine özgü bir dağılış gösterir. Bu

örnekleme dağılışının ortalaması 𝜇 ̅ ve varyans ise 𝜎 ̅ şeklinde tanımlanabilir. Söz konusu


örnekleme dağılışının;

Ortalaması ; ̅ =µ

Varyansı ; ̅ = ve

Standart sapması ; ̅ = veya ̅ =


olmaktadır. Daha öncede belirtildiği gibi örnekleme dağılışı parametreleri asıl dağılışın

parametrelerine bağlıdır. Fakat 𝜎 eşitliğinden de görüldüğü gibi örnek ortalamalarının


standart sapması orjinal populasyonun varyantlarının standart hatasının l/ n de biridir. Her örnek
n adet varyantı içerdiğinden bunların ortalamasının sapmasının daha düşük olması beklenir. O
nedenle µ'yü tahminlemede herhangi bir varyanta göre daha gerçekçidir ve X değerleri
populasyon ortalamasının sapmasız bir tahminidir.
Genel olarak populasyon parametreleri ve 𝜎 bilinmediğinden 𝜎 ̅ 'ın bilinmesi mümkün olmaz.
O nedenle bunlar örnekten tahminlenir, şöyleki;
S = veya S =

şeklinde tanımlanır. Buna örnek ortalamasının "standart hatası" denir ve ortalama ile birlikte x
± S şeklinde gösterilir. S , 𝜎 ̅ 'ın sapmasız bir tahmini olmayıp (n-1) serbestlik derecesine
sahiptir.
Standart sapma ve standart hata aslında eş anlamlıdır. Populasyon ortalamasını x ile
tahminlerken, x'daki hata miktarı hakkında bilgi verirler. Örneklerden elde edilen standart
sapmaların standart hata şeklinde tanımlanması özellikle bu açıdan uygundur.
Örnek ortalamaların gösterdiği örnekleme dağılışının tipi de belirlenmelidir. Yine merkezi
limit teoreminden de anlaşılacağı gibi örneklerin geldiği populasyon ne olursa olsun (normal,
binomiyal poisson v.b.) büyük n değerlerinde dağılış tipi "Normal" dir. O nedenle örnek
ortalamaları ile ilgili bütün olasılık hesaplamalarında standart normal dağılış kullanılabilir.

µ
Zira ; Z = değerleri de ortalaması sıfır, varyansı 1 olan normal dağılış gösterir.

ÖRNEK 5.1 : Fasulyede tane ağırlıkları ortalaması 500 mg ve standart sapması 120 mg olan
normal bir dağılış göstermektedir. Bu populasyondan çekilen 4 er fasulyelik örneklerin
ortalamasının gösterdiği dağılışın ortalaması, varyansı ve standart sapması nedir;
2 14400 
X   =500 mg ;  X2  =  3600 ve  X  = 3 6 0 0 = 60 mg
n 4 n

ÖRNEK 5.2: 2000 hastaya ait boy uzunluklarının ortalaması 1.70 m ve varyans 4.0 dır. 100
hastalık örneklerin örnekleme dağılışının ortalaması ve varyansı nedir?

Örnekleme dağılışının ortalaması;


𝜇 ̅ = µ = 1.70 m

Örnekleme dağılışının varyansı;

𝜎̅ = = = 0.04 ve

Standart Sapması;
𝜎̅= = √0.04 = 0.2 m.

ÖRNEK 5.3 :Varyans bilinmeyen populasyondan çekilmiş 25 varyantlık bir örneğin ortalaması
22.5 cm ve varyans 2.56 dır. Örnek ortalamasının standart hatası nedir?

.
S = = = 0.32 cm dir.

Ortalama ile birlikte ; x±S


22.5±0.32 cm şeklinde yazılabilir.

Standart hatanın serbestlik derecesi ise SD = n-1 = 25 – 1 = 24 dür.

ÖRNEK 5.4
Bir önceki örnekte 4 varyantlık veya danelik fasulyelerin ortalamalarının
X   =500 mg ve  X
 60 mg
olan normal bir dağılış izlediği belirtilmişti. Buna göre rastgele alınan dört fasulyelik bir
örneğin ortalamasının 600 mg dan daha yüksek olması olasılığı nedir veya her birinde 4 adet
fasulye örneklerinin ortalamalarının yüzde kaçı 600 mg dan daha yüksek ortalamaya sahiptir.
Aşağıdaki şekilden de görüldüğü gibi aranan olasılık örnekleme dağılışında 600 mg ile + 
arsındaki integral veya olasılıktır.

Bu olasılığın bulunmasında z-tablosundan yaralanmak için 600 mg lık ortalamanın standart


değerini hesaplamak gerekir.
( X i  X ) ( Xi  ) (600  500)
z   =1.67
X / n 60
EKTABLO I de gösterilen z-tablosundan da görüldüğü gibi 0 ile 1.67 arasındaki integral veya
olasılık 0.4525 dır. O halde,
P ( X i  600)  0.5000  0.4525  0.0475
(%4.75)
olur. Sonuç olarak her birisinde dört adet fasulye olan örnekler alınıp ortalamaları hesaplanırsa
bunların %4.75 inin ortalamasının 600 mg dan daha yüksek olması beklenir.

ÖRNEK 5.5.
Tarla koşullarında yetiştirilmiş patates bitkilerinde bitki başına yaprak alanı ortalaması 800
cm 2 ve standart sapması 90 cm 2 olan normal bir dağılış göstermektedir. Aşağıdaki iki soruyu
yanıtlayalım.
a. Bitkilerin yer aldığı populasyonda bunların yüzde kaçı 750-850 cm 2 arsında yaprak
alanına sahiptir.

Şekildeki alanın toplam alana oranını veya integralini z-tablosundan yaralanarak hesaplayalım.
750 ve 850 cm 2 lik yaprak alanlarının standart değerleri,
750  800 850  800
z1   -0.56 ve z1   +0.56
90 90
EKTABLO I de z dağılışının ortalaması olan sıfır ile 0.56 arasındaki olasılık 0.2123 dır. O
halde,
P (750  xi  850) =0.2123+0.2123=0.4246 (%42.5)
olur. Tarladaki bitkilerin %42.5 unda yaprak alanının 750-850 cm 2 olması beklenir. Yada
herhangi rast gele alınan bir yaprağın alanının bu iki değer arsına düşme olasılığı %42.5 dır.
b. Bitkilerin yer aldığı tarladan dört bitkilik örnekler alındığında ( n  4 ) bu örneklerin
yüzde kaçında ortalama yaprak alanının yine 750-850 cm 2 olması beklenir.
Örnekleme dağılışının ortalaması ve standart sapması,

X   =800 cm 2 ve  X   = 90  45 cm 2
n 4
İstenen olasılık bu kez dört yapraklık örneklerin ortalamalarının örnekleme dağılışındaki
aşağıda verilen şekilde gösterilen olasılıktır.

Örnekleme dağılışındaki ortalama 750 ve 850 cm 2 lik yaprak alanlarının standart değerleri ise
bu kez,
750  800 850  800
z1   -1.11 ve z1   +1.11
45 45
Bunların EKTABLO I de verilen olasılıkları ise 0.3665 dır. Sonuç olarak,
P (75 0  X i  85 0 ) =0.3665+0.3665=0.733 (% 73.3)
dır. Her birisi 4 adet bitki olan sınırsız sayıda örnekler alınıp ortalamaları hesaplanırsa bunların
%73.3 ünün 750-850 cm 2 arasına düşmesi beklenir.
ÖRNEK 5.6.
Yeni doğmuş ivesi kuzularından rast gele alınmış 28 adet kuzunun doğum ağırlıkları (Kg)
aşağıda olduğu gibi bulunmuştur.

Doğum ağırlığı
4.3 5.2 6.2 6.7 5.3 4.9 4.7 5.5 5.3 4.0 4.9 5.2 4.9 5.3
5.4 5.5 3.6 5.8 5.6 5.0 5.2 5.8 6.1 4.9 4.5 4.8 5.4 4.7

Söz konusu örneğin ortalamasını, varyansını, standart hatasını ve serbestlik derecesini


hesaplayalım. Eğer gerekli işlemler yapılırsa,
X  5.2 ve S 2  0.428 ve S  0.654
olduğu görülür. O halde ortalamanın standart hatası,
S
SX  = 0.654  0.124 ve serbestlik derecesi ise 28-1=27
n 28

dır.
5.1. 2.Örnek Ortalamaları Arasındaki Farklılıklarının Örnekleme Dağılışları
Ortalaması  ve varyansı  2 olan bir normal dağılışı populasyondan iki grup örnekler almış
olalım. Birinci grup örneklerde örnek büyüklüğünü n 1 ve ortalamaları ise,
X 11 , X 12 ,... X 1i ,.. X 1 k

olarak gösterelim.İkinci grup örneklerde örnek büyüklüğünü n 2 ve örneklerin ortalaması ise,


X 21 , X 2 2 ,... X 2 i , .. X 2 k

olsun. Birinci ve ikinci grup ortalamaları mümkün bütün kombinasyonlarda eşleştirilir ve


farklılıkları bulunursa bu farklılıkların aynı olmadığı ve az veya çok bir varyasyon gösterdiği
görülür. İşte söz konusu bu farklılıkların gösterdiği dağılışa örnek ortalamaları arasındaki
farklılıkların örnekleme dağılışı denir. Bu dağılışın özelliklerini tanımlamak da özellikle iki
populasyonun ortalamaları arasındaki farklılıkları test etmek ve tahminlemek açısından
önemlidir.
Söz konusu örnekleme dağılışının ortalamasını ( X1  X2 ) ile gösterelim. İlk gruptaki

ortalamaların ortalamasını X1 ve ikinci gruptaki ortalamaların ortalamasını ise X2 ile


gösterelim. Buna göre örnekleme dağılışının ortalaması,
( X  X ) = E ( X 1 
1 2
X2)      0

olur. Çünkü her iki örnek aynı populasyondan çekilmiştir ve her iki grubun ortalamalarının
beklenen değerleri aynıdır.
Eğer her iki gruptaki örnekler farklı iki populasyondan çekilmiş ise ve bunların ortalamaları
da  1 ve  2 ise bu kez iki gruptaki ortalamaların farklılıklarının gösterdiği örnekleme
dağılışının ortalaması,
( X  X ) = E ( X 1  X 2 )   1   2
1 2

şeklinde tanımlanabilir.
Şimdi farklılıkların gösterdiği örnekleme dağılışının varyansını tanımlamaya çalışalım.
Farklılıkların varyansı  (2X1  X 2 ) ile gösterilir. Eğer birinci ve ikinci grup örnekler bağımsız veya

aralarında bir ilişki yoksa farklılıkların varyansı ayrı ayrı varyansların toplamına eşit olur.
 (2X  X ) = X2 +  X2 = 
2
2  2 ( n1  n 2 )
1 2 1 2
 
n1 n2 n1 n 2

Görüldüğü gibi ortalamalar arası farklılıkların örnekleme dağılışının varyansı örneklerin


çekildiği populasyonun varyansı ile ilişkilidir. Eğer her iki grubun örnek büyüklükleri aynı ise
(yani n1  n 2  n ) bu kez örnekleme dağılışının varyansı daha basite indirgenebilir.
 (2X  X ) = 2
2

1 2
n
Söz konusu varyansın kare kökü örnekleme dağılışının standart sapması veya iki ortalama değer
arasındaki farklılığın standart hatasıdır.

 2 ( n1  n2 )
 (X 1X2 )

n1n2

veya örnek büyüklükleri aynı olduğu durumda,

2 2
(X X )  1 2
n
şeklinde yazılabilir.
Birinci ve ikinci grup örneklerin varyansları  12 ve  22 olan farklı iki populasyondan alındığını
varsayarsak bu farklılıkların örnekleme dağılışlarının varyansı,
 (2X  X ) = X2 +  X2 =  1  22
2

1 2 1 2

n1 n2

ve örnek ortalamalarının farkının standart sapması yani farklı populasyonlardan alınmış iki
örnek ortalamasının farklılığının standart hatası ise,

 12  22
(X X )  
1 2
n1 n2

olur.
ÖRNEK 5.7.
Buğday bitkilerinde ortalama boy 120 cm ve varyansı ise 16 dır. Bu populasyondan rast gele
alınan 20 bitkinin ortalama boyu 124 cm ve 18 bitkinin ortalama boyu ise 130 cm olarak
bulunmuştur. Ortalamalar arası farklılığın gösterdiği dağılışın ortalamasını, varyansını ve
standart hatasını bulalım. Aynı populasyondan çekildiği için,
( X  X )      0
1 2

ve varyansı ise ,

 (2X  X ) = 16(20  18) =1.7 ve  ( X  X )  1.7 =1.3 cm


1 2
20 *18 1 2

olur. Öte yandan iki ortalama değer arasındaki farklılık,


X1  X 2  124-130= - 6 cm
dır ve yukarıdaki 1.3 cm lik standart hata bu farklılığın standart hatasıdır.
Ortalamalar arasındaki farklılıkların örnekleme dağılışının tipi veya şekli de tanımlanmalıdır.
Eğer populasyon normal dağılış gösteriyorsa ortalamalar arasındaki farlılık da normal dağılışlı
olur. Populasyonun dağılış tipi ne olursa olsun her iki grubun örnek büyüklüğü yüksekse
Merkezi Limit Teoremine göre farklılıklar yaklaşık normal dağılış gösterir.
Çoğu zaman örneklerin alındığı populasyonun varyansı  2 bilinmez. Bu gibi durumlarda
populasyondan alınan iki örneğin varyanslarından ve daha çok ayrılışlarının kareleri
toplamından tahminlenirler. Hesaplanan bu varyansa iki örneğin müşterek varyansı denir ve S 2
ile gösterilir.
Müşterek varyans,

S 2

x 2
1  x 2
2

n1  n 2  2
eşitliğinden bulunur. Burada eşitliğin payında olan değerler birinci ve ikinci örneklerin
ayrılışlarının kareleri toplamı ve payda da yer alan değer ise müşterek serbestlik derecesidir.

Eğer 2 yerine müşterek varyans alınırsa iki ortalama farklılığının standart hatası ,
(  ( X 1  X 2 ) ), aşağıdaki eşitlikle tahminlenebilir.

S 2 ( n1  n 2 )
S (X1 X 2 ) 
n1 n 2

veya örnek büyüklükleri aynı ise standart hata,

2S 2
S ( X1  X 2 ) 
n
şeklinde de gösterilebilir. Örnekten bulunan bu standart hatanın serbestlik derecesi ,
n1  n 2  2 veya örnek büyüklüğünün aynı olduğu durumda 2 ( n  1 ) dır.

ÖRNEK 5.8
A ve B yemleri verilen 11'er hayvanda günlük ağırlık artışları gram olarak şöyle bulunmuştur.

Yemler Günlük ağırlık artışları (g) Toplam Ortalama


A 57 120 101 137 119 117 104 73 53 68 118 1067 97
B 89 30 82 50 39 22 57 32 96 31 88 616 56

Bunların varyansı aynı populasyondan çekildiğini düşünerek ortalamalarını, ortalamalar


arasındaki farklılığı, standart hatasını ve serbestlik derecesini bulunuz.
X A  1067/11=97 g ve XB  616/11=56 g
İlk A ve B yemlerindeki ayrılışların kareleri toplamı hesaplanırsa,
x 2
A  8472 ve x 2
B  7748

olduğu görülür. Buna göre müşterek varyans,

S 2

x x 2
1
2
2
= 8472  7748 =811
n1  n2  2 2(11  1)

Ortalamalar arası farklılık X A  X B  97-56=41 g ve standart hatası ise,


2 * 811 =12.1 g
S ( X1  X 2 ) 
11

olur. Sonuç olarak farklılığı ve standart hatasını birlikte yazabiliriz.


41  12.1 g
Söz konusu standart hatanın serbestlik derecesi ise 2( n  1)  2(11  1)  20 dır.
ÖRNEK 5.9
Azot uygulanan 12 bitkide ve uygulanmayan 7 bitkide bitki boyu değerleri (cm) aşağıda olduğu
gibi bulunmuştur. Her iki örneğin aynı populasyondan çekildiğini varsayarak, ortalama boy
değerlerini, ayrılışların kareleri toplamlarını, müşterek varyansı , ortalamaların farklılığının
standart hatasını ve serbestlik derecesini hesaplayalım.

Azot Bitki boyu (cm)


Azotlu 134 146 104 119 124 161 107 83 113 129 97 123
Azotsuz 70 118 101 85 107 132 94

Azotlu boy değerleri birinci ve azotsuz boy değerleri ise ikinci örnek olsun.
Ortalama boy değerleri,
X 1  1440 /12  120 cm ve X 2  707 / 7  101 cm
Ayrılışların kareleri toplamları,

x 2
1  5032 ve x 2
2  2552

Müşterek varyans,
5032  2552
S2  =446
12  7  2
ve ortalamalar arsı farklılığın standart hatası,
446(12  7) =10.0 cm
S ( X1  X 2 ) 
12 * 7

ve serbestlik derecesi ise 12+7-2=17 dır.


Öte yandan örneklerin çekildiği populasyonların varyansları farklı ise (  12   22 ) farklılığın
standart hatası,
S12 S 22
S ( X1  X 2 )   = 457.2  425.3 =9.9 cm
n1 n2 12 7

ve daha önce bulunan değere oldukça yakındır. Fakat bu standart hatanın serbestlik derecesi
tanımsızdır.
Ortalamalar arasındaki farklılıkların örnekleme dağılışları normal olduğunda çeşitli
olasılıkların hesaplanmasında normal dağılış özelliklerinden ve standart normal dağılış
özelliklerinden yararlanılabilir.
ÖRNEK 5.10
Ampul üreten A fabrikasında ampullerin ortalama dayanma süresi 1400 saat ve standart
sapması ise 200 saattir (varyansı 40.000). B fabrikasında ise ortalama süre 1200 saat ve standart
sapması 100 saat olmaktadır (varyansı 10.000). Her iki firmanın ürettiği ampullerden 125 er
adetlik örnekler aldığımızı varsayalım. A fabrikasında üretilen ampullerin B fabrikasında
üretilenlere göre ,
a. En az 160 saat daha fazla dayanması ve
b. 250 saatten daha fazla dayanması olasılıkları nedir.
Farklılığın örnekleme dağılışının ortalaması,
( X  X )  1   2 = 1400-1200=200 saat
1 2

ve farklılığın standart hatası ise veya örnekleme dağılışının standart sapması ise,
40000 10000 =20 saat
 (X 1X2 )
 
125 125

A fabrikasında üretilen ampullerin 160 ve daha fazla saat dayanması olasılığı aşağıdaki dağılış
eğrisinden de görüldüğü gibi taralı alan veya 160 h ile  arasındaki integraldir. Bunu
EKTABLO I den bulalım. 160 saate ait olan standart değer,
160  200
z  2.00
20
EKTABLO I de ortalama 0 olan z değeri ile 2.00 arasındaki olasılık 0.4772 dır. O halde,
P(X A  X B )  160 =0.5000+0.4772=0.9772 (%97.7)
dır. A fabrikasında üretilen ampullerin B fabrikasında üretilenlere göre 160 saatten daha fazla
dayanması şansı %97.7 dır.
A fabrikasında üretilen ampullerin 250 saatten daha fazla dayanması ise bu kez aşağıdaki
şekilde gösterilen alandır.

250 saatlik farklılığı ait standart değer,


250  200
z  2.50
20
EKTABLO I de 2.50 ile sıfır z değeri arasındaki olasılık 0.4938 dır.
P ( X A  X B )  250 =0.5000-0.4938=0.0062 (%0.62)
dır.

7.1.3.Binomial Dağılışda Oranların (p) Örnekleme Dağılışı

Ortalaması µ = np ve varyans σ2 = npq olan bir binomial dağılışlı populasyondan alınan n


büyüklüklü örneklerde istenen olayın olasılıkları (p) hesaplanabilir. Eğer n denemede istenen
olay x kez görülüyorsa p = x/n şeklinde bulunabilir. Şüphesiz p değerleri örnekten örneğe
değişerek bir örnekleme dağılışı izler. Bu dağılışa “Binomial Dağılışta Oranların Örnekleme
Dağılışı” denir. Bunun ortalaması 𝜇 ve varyans ise 𝜎 şeklinde gösterilir.

ÖRNEK 5.11
Bir ülkede çalışma yaşına gelmiş nüfus miktarı 66.510.000 ve işsizlerin sayısı 3.677.500 ise o
ülkede işsizlik oranı,
3677500
p  0.055
66510000
dır. Buna ülkenin veya daha doğrusu populasyonun işsizlik oranı denir ve %5.5 dır. Ülke
bazında bir sayım yapma olanağı yoksa bu oranın tahminlenmesi gerekir. Nitekim 32.500 kişi
sorgulanmış ve bunlardan 1950 adedinin işsiz olduğu görülmüştür. Örnek büyüklüğü 32.500 ve
istenen sonuca sahip kişilerin sayısı ise 1.950 dır. Buna göre örnekten işsizlik oranı,
^ 1950
p  0.06
32500
Hesaplanan bu oran populasyonda istenen sonucun görülmesi olasılığının bir tahminidir ve %
6.0 dır.
Aynı büyüklükte örnekler alınıp bunlarda işsizlik oranı hesaplanmış olsaydı bunların örnekten
örneğe değiştiği veya bir varyasyon gösterdiği izlenir. Buna örnekten hesaplanan oranların
örnekleme dağılışı denir. Burada sorun işte bu örnekleme dağılışının ortalamasının, varyansının
ve dağılış tipinin ne olacağını ortaya koymaktır.
Eğer bir örnek büyüklüğü n ve bu örnekte istenen sonucu gösteren birey sayısı x ise istenen
sonucun örnekteki oranı,
^ x
p
n
ile hesaplanabilir. Eğer bir binomiyal deneme yapılmış ise örneğin oranı daha önce de
açıklandığı gibi,
^ X
p
n
eşitliği ile de hesaplanabilir. Hangi eşitlik kullanılırsa kullanılsın oran örnekten örneğe değişir
ve tanımlanması gereken bir örnekleme dağılışı gösterir.
İstenen sonucun görülme oranının p olduğu bir populasyondan alınan aynı büyülükteki
örneklerde çeşitli örneklerin oranlarını,
^ ^ ^ ^
p1 , p2 ,... pi ,... pk

ile gösterelim. Tıpkı örnek ortalamalarında olduğu gibi sınırsız sayıda oran hesaplamak
mümkündür. İşte bu oranların oluşturduğu populasyona örnek oranlarının populasyonu ve
gösterdiği dağılışa ise örnek oranlarının örnekleme dağılışı denir. Söz konusu populasyonda
ortalama oranı ve varyansı sırası ile
 ^ ve 2 ^
p p
ile gösterelim ve bunların alacağı değerleri tartışalım.
Bunlar yukarıda da belirtildiği gibi bir örnekten diğerine değiştiği için örnekleme dağılışı
gösterir ve buna örnek oranlarının örnekleme dağılışı denir.
Örnekleme dağılışının ortalaması istenen sonucun populasyonda görülmesi olasılığına eşittir.

 =p
^
p

Varyansı ise aşağıda olduğu gibi p olasılığı yanında populasyon büyüklüğü ( N) ve örnek
büyüklüğü ( n ) ile ilişkilidir.
p (1  p ) N  n
2= *
N 1
^
p n
^
Bu varyansın kare köküne örnekleme dağılışının standart sapması veya bir oranın ( p )
standart hatası denir.
p (1  p ) N n
 
^ *
p n N 1

Eşitliğin sağ yanında yer alan,


N n
N 1
oranına sınırlı populasyon düzeltme faktörü denir. Eğer örnek büyüklüğü populasyon
büyüklüğünün %5 inden daha az ise ( n  0.05* N ) yada populasyon sınırsız ise söz konusu
faktör bire yaklaşır ve bu durumda örnekten hesaplanan oranın standart hatası
p (1  p )
 ^
p n

şeklinde daha basit bir eşitlikle tanımlanabilir. Genel olarak populasyonun sınırsız olduğu
varsayılarak bu son eşitlik standart hata olarak kullanılır.
Binomial değişkende istenmeyen sonucun görülmesi olasılığı q  1  p olduğundan standart
sapma eşitliği,
p*q
 
^
p n olarak tanımlanmıştır.
ÖRNEK 5.12
Tütün bitkilerinde bir virus hastalığına yakalanma olasılığı p  0.25 dır. Bitkilerin oluşturduğu
populasyondan rast gele alınmış 50 bitkilik örneklerde örnek oranlarının örnekleme dağılışının
ortalamasını ve standart sapmasını hesaplayalım. Ortalaması,
 = p = 0.25
^
p

ve standart sapması,
0.25 * 0.75
  ^  0.06
p 50

dır. Populasyon sınırsız olduğundan düzeltme faktörü 1 olarak alınmıştır.


Örnek oranlarının örnekleme dağılışının ortalaması ve varyansını tanımlamak yetmez ve aynı
zamanda olasılık dağılışını da açıklamak gerekir. Örnek oranlarının dağılış tipinin normal
olup olmaması n ve p değerlerine bağlıdır.
Eğer np  5 ve nq  5 eşitsizliklerinin sağladığı koşullar yerine geliyorsa örneklere ait oranlar
ortalaması  =p ve varyansı  2 olan normal veya yaklaşık bir normal dağılış gösterir.
^ ^
p p

ÖRNEK 5.13
Bir ülkede liseyi bitirenlerin oranı 0.25 dır. Populasyondan alınan 100 kişilik örneklerde liseyi
bitirme oranlarının ortalamasını ve standart sapmasını bulalım.
 =p=0.25
^
p

0.25 * 0.75
 ^  0.04
p 100

Öte yandan n * p  100 * 0.25  25  5 olduğundan dağılış tipi normaldir.


Buna göre liseyi bitirenlerin oranlarının 0.30 dan daha fazla olma şansını hesaplayalım.

Söz konusu olasılık EKTABLO I den yaralanılarak hesaplanabilir. 0.30 oranının standart
değeri,
^
p  ^ ^
p p p 0.30  0.25
z   =1.25
 ^  ^ 0.04
p p

EKTABLO I de 1.25 ile sıfır ortalama arasındaki olasılık 0.3944 dır. Buna göre aranan yanıt,
^
P( p  0.30) =0.5000-0.3944=0.1056
dır. O halde 100 varyantlık örneklerde liseyi bitirme oranının 0.30 ve daha yüksek olması
şansının %10.6 olduğunu ileri sürmek mümkündür.
Eğer populasyonun oranı veya istenen sonucun görülmesi olasılığı ( p) bilinmiyorsa
örnekleme dağılışının standart hatası örnekten tahminlenir.
^ ^
p* q
S^ 
p n
ÖRNEK 5.14
Bir elma çeşidinde 200 elmadan 80 tanesinde elma iç kurdu larvası görülmüştür. Elma iç kurdu
görülen elma oranını ve standart hatasını hesaplayalım. Kurtlu elma oranı,
^ x 80
p =  0.40
n 200
ve standart hatası ise,
0.40 * 0.60 =0.03
S^ 
p 200

olarak bulunur. Öte yandan 200*0.40=80 > 5 olduğundan 200 elmalık örneklerde kurtlu meyve
oranları normal dağılış gösterir.

ÖRNEK 5.15. Pamukta pembe kurt zararlısına karşı uygulanan bir insektisitin 750 pamuk
bitkisinden 705’inde tamamen pembe kurtları öldürdüğü belirlenmiştir. Bu insektisitin pembe
kurt öldürme oranını ve standart hatasını bulalım. Pembe kurt öldürme oranı ;

^ x
p = = 0.94
n

^ ^
p* q . .
Standart hatası ; S ^ 
p n
= = 0.0087

ÖRNEK 5.16. Domates salçalarında bir yıllık raf ömrü sonunda bozulma oranının 0.10 olması
yönetmelik gereğidir. Bir salça fabrikasının ürettiği salçalardan rastgele seçilen 550 salça
kutuluk örneklerde örnekleme dağılışının ortalamasını ve standart sapmasını hesaplayalım.
Söz konusu örnekleme dağılışının ortalaması;

. .
 = p = 0.10 ve standart sapması;  
^ ^
p*q
= = 0.0128
p p n

7.l.4.Oranlar Arası Farklılıkların (p1- p2) Örnekleme Dağılımı


Bu bölümde aynı veya farklı binomial populasyonlardan çekilmiş şans örneklerinin oranları
arasındaki farklılıkların örnekleme dağılışı üzerinde durulacaktır. İstenilen olayın yüzdesinin
p olduğu bir populasyondan alınan n1 varyantlı örnekte oranı
^
p1 = x1
n1

ve yine aynı populasyondan alınan n 2 varyantlı örnekte ise

^
p2 = x 2
n2

olsun.

Aynı binomiyal populasyondan çekilen nı büyüklüklü birinci grup örneklerde istenen olayın
oranları p11, pl2......p1i.......p1k ve yine aynı populasyondan alınan n2 büyüklüklü ikinci grup
örneklerde p21, p22......p2i.......p2k oranları hesaplanmış olsun. Bunlar rasgele ikişerli olarak
eşleştirilip farklılıkları alınırsa, bu farklılıklarda bir örnekleme dağılışı izler. Söz konusu
örnekleme dağılışının ortalaması ve varyansı,

 ^ ^ ve  2
( p1  p2 ) ^ ^
( p1  p2 )

olarak tanımlanır.
Oranların farklıklarının örnekleme dağılışının ortalaması,
^ ^
 ^ ^
= E ( p1  p2 )  p  p  0
( p1  p 2 )

Çünkü her iki örnek grubu da aynı binomial populasyondan alınmıştır. Örnekleme dağılışının
varyansı ise,

2 ^ ^
= p*q  p*q
( p1  p2 ) n1 n2

ve standart sapması ise


p*q p*q
 ^ ^  
( p1  p2 ) n1 n2

olarak tanımlamak mümkündür. Bu standart sapma aynı zamanda iki örneğin oranın farkının
standart hatasıdır.

ÖRNEK 5.17.
Bir iki sonuçlu populasyonda istenilen sonucun görülmesi olasılığı 0.84 olduğuna göre bu
populasyondan alınan 120 ve 100 varyantlık örneklerin oranlarının farkının gösterdiği
örnekleme dağılışının ortalamasını, varyansını ve standart hatasını hesaplayalım.
 ^ ^
= 0.84  0.84  0
( p1  p 2 )

0.84 * 0.16 0.84 * 0.16


2 ^ ^
=  =0.0025
( p1  p2 ) 120 100

 ^ ^  0.0 025 = 0.05


( p1  p 2 )

Örnek büyüklükleri n 1 ve n 2 olan örneklerin, olasılıkları p1 ve p 2 olan farklı iki binomil


populasyondan çekildiğini varsayalım. Buna göre örnekleme dağılışının ortalaması sıfır değil,
 ^ ^
^ ^
= E ( p1  p 2 )  p1  p 2
( p1  p2 )

ve varyansı ise,
p1 * q1 p2 * q2
2 ^ ^ = 
( p1  p2 ) n1 n2
olur. Burada p1 ve p 2 olasılıkları yukarıda da belirtildiği gibi birinci ve ikinci binomial
populasyonlarda istenen sonucun görülmesi olasılığıdır. Eğer her ikisi de bilinmiyorsa iki
populasyonladan alınan birer örnekle standart hata aşağıdaki eşitlikle tahminlenebilir.
^ ^ ^ ^
p1* q1 p2 * q2
S ^ ^  
( p1  p2 ) n1 n2

ÖRNEK 5.18.
A pamuk çeşidinde solgunluk hastalığına yakalanma şansı 0.62 ve B çeşidinde ise 0.76 dır.
İlk çeşitten 120 bitkilik ve ikinci çeşitten ise 60 bitkilik örnek alınıyorsa bunların oranlarının
farkının örnekleme dağılışının ortalaması, varyansı ve standart hatası ne olur?
 ^ ^
= 0.62  0.76  0.14
( p1  p 2 )

0.62 * 0.38 0.76 * 0.24


2 ^ ^
=  =0.005
( p1  p2 ) 120 60

 ^ ^  0.005 = 0.07
( p1  p 2 )

ÖRNEK 5.19.
İki farklı ilde A partisine verilen oy oranlarının farklı olup olmadığı araştırılmaktadır. Birinci
ilde rast gele alınan 120 kişiden 45 inin ve ikinci ilde ise yine rastgele alınan 80 kişiden 28 inin
A partisine oy verdiği belirlenmiştir. Her iki ilde A partisine verilen oyların oranını, farkını ve
standart hatasını hesaplayalım.
^ 45 ^ 28
p1 =  0.38 ve p2 =  0.35
120 80
Farklılık,
^ ^
p1 _ p2 =0.38-0.35=0.03

ve standart hatası ise,


0.38 * 0.62 0.35 * 0.65 =0.07
S ^ ^  
( p1  p 2 ) 120 80

ÖRNEK 5.20. Bir elma çeşitinde 200 elmadan 80'inde ve ikinci bir çeşitte ise 180 elmanın
120'sinde elma içi kurdu görülmüştür. Elma iç kurdu oranlarını ve farklılığının standart hatasını
bulunuz.

^ ^
p1 = = 0.40 ve p2 = = 0.67

^ ^ ^ ^
p1* q1 p2 * q2 . . . .
S ^ ^   = + = 0.49
( p1  p2 ) n1 n2

(0.40-0.67) ± 0.049

ÖRNEK 5.21.
Aynı populasyondan alınan 200 kişilik bir örnekte 12 kişinin ve 150 kişilik bir örnekte ise 5
kişinin solak olduğu görülmüştür. Her iki örnekte solakların oranını, farkını ve bu farklılığın
standart hatasını hesaplayalım.
^ 12 ^ 5
p1 =  0.06 ve p2 =  0.03
200 150
Bu iki örnekteki oranların farkı,
^ ^
p1 _ p2 =0.06-0.03=0.03

ve standart hatası ise,


0.06 * 0.94 0.03 * 0.97 =0.02
S ^ ^  
( p1  p 2 ) 200 150

7.l.5.Korrelasyon katsayısının (r) Örnekleme Dağılışı


X ve Y gibi iki değişkenin oluşturduğu populasyonlarda, değişkenler arasındaki korrelasyon
katsayısı  (rho) ile gösterilmektedir. Böyle bir populasyondan alınan n adet X,Y çiftini
içeren örneklerden hesaplanmış korelasyon katsayıları da (r değerleri) bir örnekleme dağılışı

gösterir. Bunun ortalaması r =  ve varyans ise r2 = (l-  2)/n dir. Varyansdaki (l- 2)
miktarı, X ve Y değişkenlerinin regresyondan kaynaklanmayan varyansın oransal miktarıdır.

Öte yandan  'nun bilinmediği durumlarda  r2 , örnekten tahminlenir.

Örneklere ait korelasyon katsayılarının gösterdikleri örnekleme dağılışının ortalaması


populasyonun korelasyon katsayısına eşittir.

r  
Varyansı ve bunun kare kökü olan standart sapması yani korelasyon katsayısının standart hatası
ise aşağıda olduğu gibi tanımlanır.

(1 2 ) (1   2 )
 
2
r ve  r 
n n

Eşitliklerin payında bulunan 1 2 değeri doğrusal ilişkiden kaynaklanmayan veya çok genel
olarak hatadan kaynaklanan varyans miktarını temsil eder.
Pratikte çoğu zaman populasyonun korelasyon katsayısını bilmek veya tanımlamak
olanaksızdır. Bunun için rast gele seçilen n adet veri çiftine sahip olan bir örnekte korelasyon

katsayısı ( r ) hesaplanarak  parametresinin tahminlenmesi mümkündür. Bu durumda


hesaplanan korelasyon katsayısının standart hatası ise aşağıdaki eşitlikle tahminlenir.

(1  r 2 )
Sr 
( n  2)
Eşitliğin paydasında yer alan ( n  2) değerine söz konusu standart hatanın serbestlik derecesi
denir ve daha önce de açıklandığı gibi SD  ( n  2) şeklinde yazılır.
ÖRNEK 5.22.
Bir buğday tarlasından rastgele seçilmiş 50 adet bitkinin boyları ve sahip oldukları kardeş
sayıları belirlendikten sonra ikisi arasındaki korelasyon katsayısının r  0.34 olduğu
belirlenmiştir. Bunun standart hatasını ve serbestlik derecesini hesaplayalım.

(1  (0.342 )
Sr  =0.14
(50  2)
ve SD=50-2=48 dır.

ÖRNEK 5.23.
On iki adet traktörün yaşı ve bakım masrafları arasındaki korelasyon katsayısı r  0.875 dır.
Populasyonun korelasyon katsayısının sıfır olduğunu (   0 ) kabul ederek standart hatasını
ve serbestlik derecesini bulalım.

(1  (0.8752 )
Sr  =0.153 ve SD=10
(12  2)

5.1.6. İki Korelasyon Katsayısı Arasındaki Farklılığın Örnekleme Dağılışı

Korelasyon katsayısı  olan populasyondan veri çifti sayısı n 1 ve n 2 olan iki grup örnek

alarak X ve Y değişkenleri arasındaki korelasyon katsayılarını bulalım ve ardından bunları


eşleştirerek farklılıklarını hesaplayalım. Söz konusu korelasyon katsayısı çiftleri arasındaki
varyasyon nedeni ile iki korelasyon katsayısı arasındaki farklılıkların örnekleme dağılışı ortaya
çıkar. Bu farklılıkların örnekleme dağılışı normal olmadığı için korelasyon katsayılarının
farklılıklarının dağılış tipinin tanımlanmasında yukarıda açıklanan z dönüşümü kullanılır.
Yani bütün korelasyon katsayıları z değerlerine dönüştürülerek bunların farkının örnekleme
dağılışı tanımlanır.

Korelasyon katsayılarına ait z değerlerinin farklılıkları ortalaması ( z z )


1 2
ve varyansı

 (2z  z
1 2)
olan normal bir örnekleme dağılış gösterir. Bu değerler aşağıda olduğu gibi

tanımlanır.

( z z ) = E( z1  z2 )  E( z1)  E( z2 )  z  z  0
1 2

Ama birinci grup ve ikinci grup örnekler farklı populasyonlardan alınmışlarsa,


(z z )  z  z
1 2 1 2

 (2z z ) =  z2 +  z2 =
1

1
1 2 1 2
(n1  3) (n2  3)
Standart sapma veya iki z değeri farkının standart hatası ise,

1 1
( z z )  
1 2
n1  3 n2  3
Çoğu zaman söz konusu farklılığın standart hatası örneklerden tahminlenir. Bunun için farklı
iki pupulasyonda örnekler alınarak korelasyon katsayıları, bunların z değerleri ve bu değerlerin
farklılıkları hesaplandıktan sonra standart hata aşağıdaki eşştilikten tahminlenir.

1 1
S( z1z2 )  
n1  3 n2  3
Söz konusu standart hatanın serbestlik derecesi ise n1  3  n2  3 dır. Sonuç olarak farklılığı
ve standart hatasını,
(z1  z2 )  S(z1z2 )
şeklinde birlikte gösterebiliriz.

ÖRNEK: 5.24.

12 bitkide bitki boyu ile başak uzunluğu arasında r  0.88 ve yine aynı populasyondan alınmış
başka bir 18 bitkilik örnekte ise aynı iki değişken için r  0.96 olarak bulunmuştur. Z değerleri
arası farklılığı ve standart sapmasını bulalım.
r1  0 .8 8 için z 1  1 .3 7 5 8 ( EKTABLO II den)

r2  0 .9 6 için z 2  1 .9 4 5 9 (EKTABLOII den)


Buna göre iki korelasyon katsayısının z değerleri arası farklılık,
z1  z2  1.3758 1.9459 = - 0.57
Standart hatası ise,
1 1
S( z1  z2 )   =0.42
12  3 18  3
dır. O nedenle 0.57  0.42 yazılabilir. Görüldüğü gibi standart hatanın serbestlik derecesi,
12  3  18  3 =24

dır. Söz konusu farklılık ve standart hatası örneklerin alındıkları iki populasyonun korelasyon
katsayılarını (  1 ve  2 ) karşılaştırmada ve bunlarla ilgili çeşitli hipotez testlerinde kullanılır.

ÖRNEK 5.25.
Aynı dersi alan kız öğrencilerde sözlü ve yazılı sınavlar arasındaki korelasyon katsayısı 0.60 ve
erkek öğrencilerde ise 0.50 dır. Eğer 40 adet kız ve 35 adet erkek olan şans örnekleri alınırsa
kızlara ait korelasyonun erkeklere ait korelasyondan daha düşük olma şansı nedir.
r1  0.60 için z1  0.69 ( EKTABLO II den)
r2  0.50 için z2  0.55 (EKTABLOII den)
Olduğundan farklılık,

z1  z2  0.69  0.55 = 0.14


ve standart hatası ise,

1 1
S( z1z2 )   =0.24
40 3 35 3
dır. Kızlarda korelasyonun erkeklerden daha düşük olması için farkın sıfırın altında olması
gerekir. O nedenle söz konusu olasılık aşağıdaki şekilde verilen taralı alan yada sıfır ile eksi
sonsuz arasındaki olasılık veya sıfır olan farkın eklemeli olasılığıdır. Bunu EKTABLO I den
yararlanarak bulalım. Sıfır farkının standart değeri,
0  0.14
z  0.58
0.24
İlgili tabloda 0.58 ile sıfır z değeri arasındaki olasılık 0.2190 dır. O halde aranan yanıt 0.5000-
0.2190=0.281 (%28.1) dır. Yani kız öğrencilerdeki korelasyon katsayısının erkeklere göre daha
düşük olma şansı %28 dır.

5.1.7. Regresyon Katsayıları ve Katsayılar Arası Farklılıkların Örnekleme Dağılışı


Genel olarak aralarında doğrusal ilişki olan birisi bağımlı diğeri bağımsız iki değişkenden
bağımsız değişken bir birim değiştiğinde bağımlı değişkenin ortalama değişme miktarı daha
önce de belirtildiği gibi bağımlı değişkenin bağımsız değişken üzerine olan regresyon katsayısı
veya bağımlı değişkenin bağımsız değişken üzerine olan regresyon doğrusunun eğimidir.
Populasyon parametresi olarak regresyon katsayısı  (beta) ile gösterilmektedir. Örnekten
hesaplanan regresyon katsayıları bu parametrenin tahminleyici değerleri olup b ile
gösterilirler. Eğer regresyon katsayısı  olan populasyonlardan her birinde veri çifti sayısı n
olan örnekler alınıp regresyon katsayıları ( b ) hesaplanırsa bunların da bir örnekleme dağılışı
gösterdiği veya katsayıların bir örnekten diğerine değişme eğiliminde olduğu görülür. Buna
örneklerin regresyon katsayılarının örnekleme dağılışı denir. Bu dağılışın ortalaması ve
varyansı aşağıdaki eşitliklerle tanımlanırlar.
b  

 2

 2

yx


b
x i2
ve standart sapması veya bir regresyon katsayısının standart hatası ise,

 yx
b 
x i
2

dır. Eğer her iki değişken de normal ise örnekleme dağılışının tipi de normal olur.
Burada payda yer alan varyans populasyonda regresyondan ayrılışların veya hataların kareleri
ortalaması ve diğer terim ise bağımsız değişkenin ayrılışlarının kareleri toplamıdır. Şüphesiz
populasyonlarda hata kareleri ortalaması ve bağımsız değişkene ait kareleri toplamı
bilinmediğinden regresyon katsayılarının varyans ve standart hataları aşağıdaki eşitliklerle
örneklerden tahminlenirler.

S yx2 S yx
S 
2
ve S b 
x x
b 2 2
i i

Standart hatanın serbestlik derecesi (n  2) dır. Daha önce üçüncü bölümde de açıklandığı gibi
eşitliklerin payında yer alan varyans örnekteki ayrılışların yani hataların kareleri ortalaması ve
bir bakıma populasyonun ayrılışlarının kareleri ortalamasının tahminidir.
(  xi yi ) 2
y 2

S 2
yx =
i
x 2
i

( n  2)
ÖRNEK 5.25.
Dokuz adet toprak örneğinin tuz oranı ( Y ) ile elektriksel geçirgenliği ( X ) arasında önemli bir
doğrusal ilişki olduğu belirlenmiş ve

 x y  284 ,  x
i i
2
i  576 ; y 2
i  144 , b  0.49

olarak bulunmuştu. Söz konusu katsayının standart hatasını hesaplayarak serbestlik derecesini
belirleyelim. Hata veya regresyondan ayrılışların kareleri ortalaması,
(284)2
144 
2
S yx = 576  0.57 ve S  0.57  0.75
(9  2)
yx

Olduğundan regresyon katsayısının standart hatası,


S yx 0.75
Sb  = =0.03
x 2
i
576

ve serbestlik derecesi yedidir. Sonuç olarak regresyon katsayısı standart hatası ile birlikte
yazılabilir.
0.49  0.03
Bir sonraki bölümde de görüleceği gibi örneklerden elde edilen regresyon katsayısı ve standart
hatası kullanılarak populasyona ait regresyon katsayısının (  ) büyüklüğü tahminlenebilir ve
bu parametre ile ilgili çeşitli hipotezler ileri sürülerek test edilebilir.
Aynı veya farklı populasyondan alınmış iki örneğin regresyon katsayılarının farkını ve bu farka
ait standart hata kullanılarak bu kez iki farklı populasyonun regresyon katsayıları ile farklılığa
ait tahminlemeler yapılabilir ve çeşitli hipotezler test edilebilir. Bunun için de regresyon
katsayıları arasındaki farklılığın örnekleme dağılışını tanımlamak gerekir. İki farklı örneğe ait
regresyon katsayılarının farkının gösterdiği dağılışın ortalaması ve varyansı aşağıda olduğu
gibidir.

(b b )  1  1  0 (İki örnek de aynı populasyondan alınmış ise)


1 2

(b b )  1  2 (İki örnek farklı populasyondan alınmış ise)


1 2

 (2b b )   b2   b2
1 2 1 2

Söz konusu varyansın örnekten elde edilen tahmini ise,


S(2b1 b2 )  Sb21  Sb22

dır. Buna göre iki farklı regresyon katsayısının standart hatası,

S(b1 b2 )  Sb21  Sb22

olup serbestlik derecesi n1  2  n 2  2 dır. Bu eşitliklerdeki n 1 ve n 2 değerleri sırası ile birinci

ve ikinci örneklerin veri çiftlerinin sayısıdır. Yine Y ve X değişkenlerine bağlı olarak


farklılığın örnekleme dağılışı normaldir.
İki regresyon katsayısının farkını standart hatası ile birlikte,
b1  b2  S ( b1  b2 )

şeklinde yazmak mümkündür. Yukarıda da belirtildiği gibi bu farklılık ve standart hatası


kullanılarak örneğin iki populasyonun regresyon katsayılarının farkının sıfır olup olmadığını,
1   2  0 ve 1   2  0
test edebiliriz.

5.2.TEST DAĞILIMLARI

Populasyonlardan alınmış şans örneklerinin içerdikleri çeşitli istatistikleri ile çekildikleri


populasyonu temsil edip etmediklerini saptamak veya temsil etme olasılığını bulmak
istatistiğin önemli görevlerinden birisidir. Bunun içinde öncelikle örneğe ait herhangi bir
istatistiğin örnekleme dağılışının parametrelerini kullanarak kendisine ait uygun bir standart
değerini hesaplamak gerekir. Bu standart değerlere ait dağılışlara Test Dağılımları denir. Öte
yandan bu tip standart değerler ve test dağılışları olmadan bir hipotez kontrolü mümkün
değildir. Uygulamalı istatistikte önemli yeri olan veya önemli test dağılışları çeşitli örnekleri
ile aşağıda verilmiştir.
5.2.1 Standart Normal Dağılış (Z-Dağılışı)
Bir normal değişkene ait varyantların ( X i ) , değişkenin ortalaması ve standart sapması
kullanılarak elde edilen,

X  
zi  i


standart değerlerinin, ortalaması sıfır ve varyansı 1 olan normal dağılış gösterdiğini ve buna
Standart Normal Dağılış denildiğini bir önceki bölümde görmüştük. Söz konusu bu dağılımla
herhangi bir varyantın belirtilen bir populasyona girme veya girmeme olasılığı
saptanabiliyordu. Standart normal dağılışın bu özelliğinden, örnekleme dağılışı tanımlanabilen
ve normal olan istatistikler için de yararlanabiliriz. Örneğin örnek ortalamaları, ortalaması ve
standart sapması,

 X   ve  X 
n
olan normal bir örnekleme dağılışı izlemekteydi. O halde çok sayıdaki örnek ortalamalarının
aşağıdaki ,

Xi  X
zi 
X
değerleri yada oranları da aynı şekilde bir standart normal dağılış gösterir. Ancak buradaki z i

değeri örnek ortalamasının ( X i ) standart değeridir. Söz konusu eşitlikle ve standart normal
dağılışın olasılık özelliklerinden yararlanarak bir örnek ortalamasının söz konusu örnekleme
dağılımına girip giremeyeceğini ve bunun sonucu olarak çekildiği populasyonu temsil edip
etmediğini ortaya koyabiliriz.
Benzer şekilde büyük n değerlerinde binomial dağılışta oranların da ortalaması ve standart
sapması aşağıda verilen bir normal örnekleme dağılışına sahip olduğunu görmüştük;

 p
^ ve  ^ 
pq
p p n
O halde çok sayıda P değerlerinin;
^
pi   ^
p
zi 
 ^
p

oranı ile bulunan zi değerleri de ortalaması sıfır ve standart sapması 1 olan normal dağılış izler.
Yine bu z değerini kullanarak istenilen olayın veya sonucun görülme oranının örnekleme
dağılışına girip girmediğini veya girme olasılığını ortaya koyabiliriz. Standart normal dağılışın
bu amaçla test dağılışı olarak kullanılmasını bazı örneklerle görelim.
ÖRNEK 5.26.
Bir fabrika ürettiği ampullerin ortalama ömrünün l500 saat ve standart sapmasının l5 saat
olduğunu ileri sürmektedir. Bu fabrikanın ürettiği ve şansa bağlı olarak seçilen 36 ampulde
ortalama ömür l492 saat olarak bulunmuştur. Fabrikanın iddiası doğru mudur?
Sorunun yanıtlanabilmesi için, 36 ampullük örneğin;  =l500 saat ve  =l5 saat olan
populasyondan çekilen şans örneklerinden biri olma olasılığını hesaplamak ve ardından bu
olasılığı tartışmak gerekir. Bu fabrikada üretilen n36 ampullük sonsuz sayıda alınan
örneklerin oluşturduğu örnekleme dağılışının

Ortalaması: X   = l500 saat

 15
Standart Sapması:  X   = 2.5 saat
n 36
Örneğimizin ortalaması olan 1492 saat değerinin ,standart değeri ise

X i  X 1492  1500
zi  = = - 3.2
X 2.5
EK TABLO 1' den de görüldüğü gibi, ortalama ile veya z =0 ile -3.20 arasındaki olasılık 0.4993
dür. Bunun solundaki alan ise 0.50-0.4993= 0.0007 veya % 0.07 dır. O halde ortalamanın
solunda n =36'lık örneğimiz kadar veya daha fazla sapma gösteren örneklerin oransal miktarı
% 0.07 dır. Bu aynı zamanda çekilen n =36'lık örneğin bu populasyona girme olasılığıdır.
Şüphesiz düşük bir olasılıktır. O nedenle bu örneğin  = 1500 saat ve  =15 saat olan
populasyonu temsil etmesi söz konusu olamaz. Fabrikanın iddiası doğru değildir. Öte yandan
standart normal dağılışta daha öncede belirtildiği gibi -1.96 ve +1.96 değerleri %95 olasılığı
sınırlandıran değerlerdir. Örnekten elde edilen -3.2 standart değeri bu sınırlandırıcı değerlerle
karşılaştırıldığında örneğimizin söz konusu ampul populasyonuna girme olasılığının %5 in
altında olduğu söylenebilir. Bu da düşük bir olasılıktır. O nedenle yine fabrikanın iddiasının
doğru olduğunu söyleyemeyiz.
ÖRNEK 5.27.
Bir fabrika ürettiği ilacın ülser hastalığını tedavi etme oranının 0.62 olduğunu ileri sürmektedir.
100 hastalık bir örnekte iyileşme oranı 0.52 bulunmuştur. Fabrikanın iddiası doğru mudur?
Bu sorunun yanıtlanması için bu ilacın uygulandığı n = 100 hastalık örneğin, tedavi etme oranı
0.62 olan populasyona girme olasılığının hesaplanması gerekir. Bu ilacın uygulandığı n = 100
hastalık sonsuz sayıda alınan örneklerin oluşturduğu örnekleme dağılışının ortalaması ve
standart sapması ( yani oranın standart hatası);

0.62*0.38
  p  0.62
^ ve  ^  =0.049
p p 100
İlaç alan hastaların yer aldığı populasyondan alınan örneğin iyileşme oranı,
^
pi  0.52
ve standart değeri ise,
^
pi   ^ 0.52  0.62
p
zi  = = - 2.05
 ^ 0.049
p

dır. Yine EKTABLO I'deki değerlerden de anlaşılacağı gibi örneğin bu populasyona girme
olasılığı % 2.02 dır. Bu da düşük bir olasılıktır. İlaçların iyileştirme oranı 0.62 den daha
düşüktür.

0.4798 (%47.98)

0.5000 - 0.4798 = 0.0202

- 2.05 + 2.05
EK TABLO 1 den görüldüğü g b Z= 0 le -2.05 arasındak olasılık, P (- 2.05 < z < 0) = 0.4798
d r. Bunun solunda kalan alanın olasılığı, P (z < - 2.05) = 0.50 – 0.4798 = 0.0202 (% 2.02) d r.
Bu % 2.02’l k olasılık aynı zamanda n=100 hastalık örneğ n ve daha fazla sapma gösteren
örnekler n söz konusu populasyona yan , ortalama tedav etme oranı 0.62 olan populasyona
g rme olasılığıdır. Kuşkusuz bu olasılık da düşük b r olasılıktır. Aynı zamanda bu olasılık % 5
den de düşüktür. Bu nedenle, n=100 hastalık örneğ n ortalama y leşt rme oranı 0.62 olan b r
populasyonu tems l etmes mümkün değ ld r. Fabr kanın dd ası doğru değ ld r.

ÖRNEK 5.28.
İki firmanın ürettiği meyve sularında kuru madde oranının aynı olup olmadığı araştırılmaktadır.
Birinci firmada kuru madde miktarının standart sapması 2.5 gr/l ve ikinci firmada ise 3.2 g/l
olduğu bilinmektedir. Birinci firmadan rast gele alınan 136 şişelik örnekte kuru madde miktarı
17.2 g/l ve ikinci firmadan alınan 125 şişelik örnekte ise 18.6 g/l bulunmuştur. Her iki firmanın
ürettiği sularda kuru madde miktarı aynı mıdır?
Sorunun çözümü için iki örnek ortalaması arasındaki farklılığın örnekleme dağılışının ve
standart normal dağılışın özellikleri kullanılır. Birinci ve ikinci firmaların ortalama kuru madde
miktarlarını,
X 1  17.2 g/l ve X 1  18.6 g/l
Farklılığı ise,
X 1  X 2  1 7 .2  1 8 .6   1.4 g/l
Birinci firmadan alınan 136 şişelik ve ikinci firmadan alınan 125 şişelik örneklerin
farklılıklarının gösterdiği örnekleme dağılışının ortalaması ve standart sapması aşağıda olduğu
gibi tanımlanır.
( X X )  1  2  0 ( her iki firmada da kuru madde miktarı aynıdır)
1 2

 12 2.52 3.22
 22
(X X )   =  =0.36 g/l
1 2
n1 n2 136 125

Öte yandan X 1  X 2  17.2  18 .6   1 .4 g/l farkının standart değeri ise,


( X 1  X 2 )   ( X1  X 2 ) 1.4  0
zi   =- 3.89
(X 1 X2 )
0.36

dır. EKTABLO I den yararlanarak,


X 1  X 2  1 7 .2  1 8 .6   1.4 g/l
lık farklılığın ortalama farklılığı,
( X X )  1  2  0
1 2

sıfır olan bir populasyona girme olasılığının %1 in çok altında olduğunu görebiliriz. Firmaların
ürettiği meyve sularında kuru madde miktarları farklıdır. İkinci firmanın ürettiği meyve
sularında kuru madde miktarı daha yüksektir

PROBLEM 5.29.
Ergin yaşa gelmiş erkeklerde boy 175 cm ve standart sapma 6.4 cm dır( varyansı 41). Ergin
kadınlarda ise ortalama boy 165 cm ve standart sapması 6.4 cm dır (varyansı 41). Birinci
populasyon erkeklerin boyu ve ikinci populasyon ise kadınların boyu olsun. Her iki
populasyondan da 50 şer kişi seçilmiş olsun.
a. İki cinsiyet populasyonundan alınan örneklerin X1  X 2 ortalama farklılığının örnekleme
dağılışının ortalaması,
( X  X )  1  2 =175-165=10 cm
1 2

b. X1  X 2 ortalama farklılığının örnekeleme dağılışının standart sapması daha doğrusu iki


ortalama farklılığının standart hatası,

 12  22
(X X )   = 4 1  4 1 =1.28 cm
1 2
n1 n2 50 50

c. Erkeklerin boylarının kadınların boylarından 12 cm daha uzun olması şansı nedir?. Yani,
P ( X 1  X 2 )  12

olasılığı araştırılmaktadır. Bu olasılık aşağıdaki şekilden de görüldüğü gibi taralı alandır.


Standart hata populasyon varyansı ile hesaplandığından ve örnekler büyük olduğundan söz
konusu olaıslığı z dağılışı veya standart normal dağılıştan yararlanarak bulabiliriz.

İstenen 12 cm lık farklılığın standart değeri,


( X 1  X 2 )   ( X1  X 2 ) 12  10
z   1.56
(X 1X2 )
1.28

EKTABLO I de 0 z değeri ile 1.56 değeri arsındaki olasılık 0.4406 dır. Buna göre,
P ( X 1  X 2 )  12 =0.5000-0.4406=0.0594 (%5.9)

0.4406 (%44.06)

0.5000 - 0.4406 = 0.0594

- 1.56 + 1.56

5.2.2. T-Dağılışı (Student’in t-Dağılışı)


Örnek ortalamalarının normal dağılışı olduğu durumda, yukarıda da belirtildiği gibi bir örneğin
ortalamasının standart değeri standart normal dağılışla tanımlanmış ve,
Xi  X
zi 
X

olduğu ileri sürülmüştü. Bu oranda yer alan paydadaki değer örnekleme dağılışının standart
sapması veya örnek ortalamasının standart hatası olup yine yukarıda da belirtildiği gibi örneğin
çekildiği populasyonun standart sapması kullanılarak,

X 
n

eşitliği ile bulunmuştu. Eğer örnek küçük veya varyant sayısı 30 dan düşük ise ve üstelik
populasyonun varyansı veya standart sapması bilinmiyorsa bu kez örnekten tahminlenmesi
gerekir. Daha önce de belirtildiği gibi örneğin varyansı (S 2 ) populasyon varyansının bir tahmini
olduğundan örnekleme dağılışının standart sapması (  X ) aşağıdaki eşitlikle örnekten
tahminlenir.
S
SX 
n

Söz konusu standart hatanın serbestlik derecesi yine daha önce de belirtildiği gibi n1
dır.Populasyon varyasnının bilinmediği ve standart sapmanın örneklerden tahminlendiği
durumlarda,
Xi  X
SX

oranı standart normal dağılış göstermez ve o nedenle standart değeri de z i değildir. Bu özel
durumda yukarıdaki oranın t-dağılışı veya Student’in t-dağılışını izlediği söylenir ve söz
konusu oran da,
Xi  X
t
SX

şeklinde tanımlanır.
Varyansı bilinmeyen bir populasyondan çekilen ve varyant sayısı (n) olan sınırsız sayıda
örnekler alıp ortalamaları hesaplanıp yukarıdaki eşitlikten t değerleri hesaplanırsa yine sınırsız
sayıda t değerleri hesaplamak mümkün olur. Hesaplanan bu t değerleri eksi ve artı sonsuz
arasında olabilir. Örneğin örnek ortalaması örnekleme dağılışının ortalamasından büyükse t
değeri artı işaretli aksi durumda ise eksi işaretli olur. Öte yandan t değerlerinin ortalaması tıpkı
z değerleri gibi sıfırdır. Ancak z değerlerinin veya standart normal dağılışın varyansı 1 olduğu
v
halde t değerlerinin varyansı dır. Yani,
v2
t  0 ( v 1)
v
 t2  (v  2)
v2
Bu eşitliklerde kullanılan v değeri o istatistiğin veya t değerinin serbestlik derecesidir. Örneğin
örnek ortalamasına ait SX standart hatasına ait serbestlik derecesi v  n  1 dır. Yirmi varyantlık
bir örnekleme yapılmış ise serbestlik derecesi,
v  n 1  20 1 19
olur.
Yukarıda belirtilen şekilde hesaplanan , ortalaması sıfır ve varyansı,
v
 t2 
v2
olan t değerleri veya oranların olasılık yoğunluk fonksiyonu aşağıda verilmiştir.
v 1
( )
2 t 2 ( v 1)
f (t )  (1  ) 2
v v
( )* v
2
dır. Söz konusu yoğunluk fonksiyonu t değerlerinin olasılıklarının tanımlanmasında kullanılan
bir yoğunluk fonksiyonudur. Zira eksi ve artı sonsuz arasındaki integrali bire eşittir. Küçük
örneklere ait t değerlerinin olasılıklarını tanımlamaya yarayan bu yoğunluk fonksiyonu ilk kez
W.S.Gosset (1908) tarafından önerilmiştir. Çalıştığı firma bu bilim adamının çalışmasını kendi
adı ile yayınlamasını istemediğinden W.S.Gosset araştırmasını Student takma adı ile
yayınlamıştır. Daha sonra çok sayıda bilim adamı ve özellikle Fisher bu fonksiyonun pratikte
kullanılması yönünde önemli katkılarda bulunmuştur. Ama t oranlarının dağılışı Student’in t
-dağılışı veya çok yaygın olarak t -dağılışı olarak isimlendirilmiştir.
Dağılış sıfır etrafında simetriktir. v arttıkça dağılış dikleşmektedir. Daha öncede belirtildiği
gibi v veya n arttıkça t dağılışı z dağılışına yaklaşır. n>30 olduğu durumda bunların yaklaşık
olarak eşit olduğu kabul edilebilir. Ancak bütün normal dağılımları karakterize eden tek bir z
dağılışı olduğu halde örnek büyüklüğüne veya her serbestlik derecesine ait ayrı bir t-dağılışı
vardır. Çok sayıda serbestlik derecelerine ait t-dağılışlarının çeşitli t-değerlerinin olasılıkları
EK TABLO 3'de verilmiştir. Tablodan da görüldüğü gibi ilk sütunda yukarıdan aşağı doğru
serbestlik dereceleri ( v ) verilmiştir. İlk sırada ise 0.20,0.10,0.05,0.01 gibi olasılıklar yer
almıştır. Söz konusu olasılıklar yukarıdaki şekilden de görüldüğü gibi dağılış eğrisinin iki
kuyruğunda yer alan iki olasılığın toplamını göstermektedir. Tablonun ortasında yer alan
değerler ise bu olasılıkların sınırlarını belirleyen t değerleridir. Örneğin t-dağılışı tablosu veya
kısaca t tablosu adı verilen bu tabloda 8 serbestlik dereceli sıraya bakalım.

Tablodan da görüldüğü gibi 0.05 sütunu ile 8 sırasının kesim noktasında bulunan değer 2.306
dır.

Serbestlik derecesi 8 olan t değerlerinin %95 i -2.306 ile 2.306 arasında %5 ise bunun
dışındadır. Ama %2.5 kadarı 2.306 dan daha büyük ve %2.5 kadarı ise -2.306 dan daha
düşüktür. %5 olasılığı yukarıdaki şekilde de gösterilen dağılışın eğrisinin iki kuyruk kısmında
yer alan olasılıkların toplamını göstermektedir.
Bu kez 8 serbestlik dereceli t değerlerinin %99 unun hangi iki t değeri arasında olduğunu
görelim. Sekiz serbestlik dereceli sırada 0.01 olasılıkla kesim noktasında görülen t değeri
t  3.355 dır. Yani aşağıdaki şekilden de görüleceği gibi bu serbestlik derecelerindeki t
değerlerinin %99 u -3.355 ve +3.355 arasında %1 i ise bunun dışında bulunur.

ÖRNEK 5.30.
Serbestlik derecesi 5 olan t değerlerinin %5 i hangi iki t değerinin dışında yer alır. Ya da
serbestlik derecesi 5 olan örneklerde t değerlerinin %95 i hangi iki t değeri arasında yer alır.
Bunu yanıtlamak için EKTABLO III de serbestlik derecesi 5 olan sıra ile yukarıdaki 0.05
olasılığı kesiştirilir. Tablodan da görüldüğü gibi bu kesim noktasındaki değer 2.571 dır. O halde
t değerlerinin %95 i -2.571 ve +2.571 arasında %5 i ise bunun dışında yer alır.
Student’in t dağılış eğrisi standart normalin dağılış eğrisine bakarak biraz daha yatıktır. Ancak
serbestlik derecesi ( v ) daha doğrusu örnek büyüklüğü (n) arttıkça dağılış dikleşir ve ortalaması
sıfır ve varyansı 1 olan standart normal dağılış eğrisine yaklaşır (Şekil 7.4).Pratikte genel olarak
büyük örneklerde ( n  30) her iki eğrinin de çakıştığı kabul edilerek çeşitli olasılık
tanımlamalarında standart normal dağılış kullanılabilir.
Şekil 5.4 : t-dağılışında serbestlik derecesi (v) arttıkça standart normal dağılışa yaklaşma

Çeşitli örnekler alarak bunların sorduğu olasılık sorularını t dağılışından yararlanarak


tanımlayalım.
ÖRNEK 5.31.
Belediye Encümeninin kararına göre ekmeklerin 475 g olması gerekmektedir. Bir fırından
rast gele alınan 25 ekmeklik örneğin ortalama ağırlığı 465 g ve standart sapması ise 20 g
olarak saptanmıştır. Örnek alınan bu fırın kurala uygun üretimde bulunmakta mıdır?
Söz konusu fırından alınacak 25 ekmeklik örneklerin örnekleme dağılışının ortalaması,
X   = 475 g
dır. Fırında üretilen ekmek ağırlıklarının varyansı veya standart sapması verilmediğinden
örnekleme dağılışının standart sapması yani örnek ortalamasının standart hatasını tahminlemek
gerekir.
S
SX  = 20 =4.0 g
n 25

ve serbestlik derecesi n 1  25 1  24 dır. Örnek küçük olduğu için t dağılışından


yararlanmak gerekir. Örnek ortalaması 465 g ve örnekleme dağılışının ortalaması da 475 g
olduğundan örneğe ait 24 serbestlik dereceli t değeri,
X   X 465  475
t  = - 2.5
SX 4.0

dır. EKTABLO III de 24 serbestlik dereceli sırada işaretine bakmaksızın 2.5 değerinin yerini
bularak yukarı dik çıkalım.
24 SD’ t - dağılışı

% 1.75
+ 2.5

- 2.5 + 2.5

Görüldüğü gibi örneğe ait t  2.5 değeri %2 ile %1 arasında bir olasılığı göstermektedir.
Yaklaşık %1.75 dır. Bu olasılık ortalaması 465 g olan ekmeklerin ortalaması 475 g olan
populasyona girme olasılığı veya onu temsil etme olasılığıdır. Bu 25 ekmeklik örneğimiz ve
yine aynı sayıda ekmek içeren örneklerin %1.75 i 2.5 ve daha yüksek t değerlerine sahiptir.
Görüldüğü gibi bu olasılık çok düşüktür ve alınan örneğin populasyonu temsil etmediği ve
fırının kurallara uymadığı yani daha düşük ağırlıkta ekmek ürettiği kabul edilir.
ÖRNEK 5.32.
Daha önce 7.11 nolu örnekte azot uygulanan 12 bitkide ortalama boyun X 1  1 20 cm,
uygulanmayan 7 bitkide ise X 2  10 1 cm ve iki ortalama değer arsındaki farklılığın standart
hatasının,
S( X1 X2 )  =10.0 cm
olduğu belirtilmişti. Söz konusu farklılığın serbestlik derecesi n1  n 2  1  12  7  2  17 dır.
Her iki örneğin alındığı populasyonların bitki boyu değerleri eşit kabul edilebilir mi?
İki grup örneklerin ortalamaları arasındaki farklılığın örnekleme dağılışının ortalaması,
( X X )  1  2  0 (Boyları aynıdır)
1 2

Örnekleme dağılışın standart sapması ise tahminlenmiştir ve ayrıca her iki örnek de küçüktür.
O halde soruyu yanıtlamak için t dağılışından yararlanmak gerekir. Brirnci ve ikinci örnek
ortalamaları arasındaki farklılığın standart değeri yani t değeri aşağıda olduğu gibi bulunur.
( X 1  X 2 )   ( X1  X 2 ) (120  101)  0
t  =+1.89
S ( X1  X 2 ) 10.0
Söz konusu t değerinin de serbestlik derecesi 17 dır. EK TABLO III den de görüldüğü gibi l7
serbestlik dereceli iki örnek ortalaması arası farklılığın, 1   2  0 olan örnekleme dağılışına
girme olasılığı % 7-8 civarında veya oldukça yüksektir. O nedenle iki örnek yada azot
uygulaması arasındaki 19 cm lik tesadüflükten kaynakladığını ileri sürebiliriz. O nedenle söz
konusu ortalaması sıfır olan örnekleme dağılışına girdiği söylenebilir. Yani azot uygulaması
ve uygulanmaması eşit bitki boyu değeri vermektedir.

5.2.3. Khi-kare (  2 ) Test Dağılımı.


İstatistikte çeşitli hipotez testlerinde standart değer tanımlamada kullanılan önemli bir istatistik
de khi-kare istatistiğidir. Bu istatistiğin kullanımına dayanan testlere genel olarak khi-kare testi
denir. Tarımda, genetik, biyoloji, tıp ve özellikle medikal biyoloji bilim alanlarında çok fazla
olarak yer alan test yöntemleridir. O nedenle tıpkı daha önce verilen iki test dağılışında olduğu
gibi bu test dağılımını da tanıtmak gerekir.

Ortalaması  ve varyansı 2 olan normal dağılışlı bir populasyondan alınan ve büyüklüğü


n olan sınırsız sayıda şans örneklerinin kareleri toplamının veya serbestlik derecesi ile
varyansının çarpımın populasyon varyansına oranına khi-kare denir ve Latin alfabesinde yer
alan khi harfinin (  ) karesi ile gösterilir. Tanım gereği örneklerin khi-kare değerleri,

 2

x 2
i

(n  1) Si2
2 2
Öte yandan eşitliğin payında yer alan n1 değeri örneğin varyansının serbestlik derecesi
olduğundan,
v  n 1
olarak alırsak khi-kare şans değişkeninin varyantlarını,

 2

x 2
i

(n 1)Si2
=
vS i2
şeklinde de yazmak mümkündür.
2 2 2

Khi-kare şans değişkeninin ortalaması onun serbestlik derecesi ( v ) ve varyansı ise serbestlik
derecesinin iki katıdır ( 2v ) dır.
E( 2 )   2  v ve  2 2  2v

Sonuç olarak khi-kare şans değişkeni 0 ile +  arasında değer alan, ortalaması v ve varyansı
2v olan sürekli bir şans değişkenidir. Tek bir parametresi vardır, buda onun serbestlik
derecesidir. Bu bakımdan t dağılışına benzemektedir.
Bir khi-kare olasılığını tanımlamak için şüphesiz v 0ve 0   2   olmalıdır.

ÖRNEK 5.33.

Serbestlik derecesi v  n 1  9 1  8 olan bir khi-kare dağılışı için çeşitli olasılık


tanımlamaları yapalım
Sekiz serbestlik dereceli bu khi-kare değişkeninin dağılış eğrisi aşağıda verilmiştir.

Şekil 7.4. Sekiz serbestlik dereceli khi-kare dağılışı

Ortalaması v 8 ve varyansı 16 dır. Dağılış 0 ile artı sonsuz arasındaki bütün khi-kare

değerlerini kapsar. Öte yandan z ve t dağılışları simetrik olduğu halde khi-kare dağılışı sağa
veya pozitif yana eğikdir. Dağılış eğrisi sekiz serbestlik dereceli khi-kare değerleri ile ilgili
bütün olasılıkların tanımlanmasında kullanılabilir.

ÖRNEK 5.34
Sekiz serbestlik dereceli khi-kare dağılışında khi-kare değerlerinin yüzde kaçı 20.09 dan daha
büyüktür. Herhangi bir khi-kare değerinin 20.09 dan daha büyük olması şansı nedir.
Khi-kare dağılış grafiğinden de görüldüğü gibi 20.09 dan daha düşük khi-karelerin oranı %99
dır.
Ortalaması ve varyansı bilinen normal populasyondan alınan 8 serbestlik dereceli örneklerin
khi-kare değerleri hesaplanırsa bunların %1 i 20.09 dan daha yüksek ve %99 u ise daha düşük
khi-kare değerleri gösterirler. Sekiz serbestlik dereceli herhangi bir şans örneğinin 20.09 dan
daha yüksek bir değer alması şansı da %1 dır. Burada örnek olarak alınan 20.09 khi-kare değeri
serbestlik derecesi 8 olan örneklerde khi-kare dağılışını %99:%1 olacak şekilde ikiye ayıran
değerdir ve o nedenle kritik bir değer olarak düşünülür.
Bu kez yine aynı örnekte 15.51 den daha yüksek khi-kare değerlerinin oranını bulalım.

Şekilden de görüldüğü gibi sekiz serbestlik dereceli khi-kare dağılışında  2  15.51 değeri
dağılışı %95:%5 olmak üzere iki kısma ayırmaktadır. O nedenle bu da başka bir kritik değerdir.
Herhangi bir khi-kare değerinin 15.51 den daha yüksek olması şansı %5 dır.
Çoğu khi-kare testlerinde uygun serbestlik derecelerindeki khi-kare değerlerinin yukarıdaki
örneklerde olduğu gibi verilen bir khi-kare değerinden daha yüksek olma olasılıkları
kullanılmaktadır. İntegral alma sorununu ortadan kaldırmak için çeşitli serbestlik derecelerinde
çeşitli daha fazla olasılıkları sınırlandıran khi-kare değerleri EKTABLO IV de verilmiştir.
Tabloda ilk sütunda serbestlik dereceleri, ilk sırada ise 0.995 den yani yaklaşık 1 den
başlayarak 0.005 e kadar daha fazla olasılıklar ve tablonun orta kısmında ise bu olasılıkları
sınırlandıran khi-kare değerleri yer alır.
Örneğin sekiz serbestlik dereceli sıra aşağı da olduğu gibi görülür.

Görüldüğü gibi 15.51 den daha yüksek khi-kare elde etme olasılığı %5 ve daha düşük bir khi-
kare elde etme olasılığı ise %95 dır. 20.09 dan daha yüksek khi-kare elde etme olasılığı %1 ve
21.96 dan daha yüksek khi-kare değeri elde etme olasılığın ise %0.005 dır.
Yukarıda da belirtildiği gibi khi-kare dağılış pozitif veya sağa eğik bir dağılıştır. Ancak örnek
büyüklüğü ve buna bağlı olarak serbestlik derecesi arttıkça khi-kare dağılışı da normale
yaklaşır. Aşağıdaki şekilde serbestlik derecesi arttıkça dağılışın nasıl normale yaklaştığı
görülmektedir.

Şekil 5.5, Üç farklı serbestlik derecelerindeki khi-kare dağılışları

Bağımsız khi-kare şans değişkenlerini,


 12 ,  22 ,  32 ,  42 ....  i2 ,....  k2
ve serbestlik derecelerini ise,
v1 , v2 , v3 , v4 ,....vi ,....v k
ile gösterelim. Bu bağımsız k adet khi-kare şansa değişkeninin toplamı da bir khi-kare dağılışı
gösterir,
k
 2    i2
i 1

Bu toplamın serbestlik derecesi ise,


k
v v
i 1
i

olur. Bu özelliğe khi-kare dağılışının eklemeli özelliği denir.


İstatistikte çok sayıda değişkenler khi-kare şans değişkeni olma özellikliğine sahiptirler.
Bunlardan bazılarını görelim.
1.Ortalaması sıfır ve varyansı 1 olan dağılış gösteren bir standart normal değişkenin ( Z )
karesi de khi-kare dağılışı gösterir ve serbestlik derecesi 1 dır.
2  Z2

Öte yandan X şans değişkeni ortalaması  ve varyansı  2 olan normal değişken ise buna ait
Z değerinin karesi de bir serbestlik dereceli khi-kare dağılışı gösterir.
X 
 2  Z 2 =[ ]2

2. X 1 , X 2 ,... X i ,... X k bağımsız normal değişkenleri  i ortalaması ve  i2 varyanslarına sahip
olsunlar.Bunların standart değerlerinin toplamı da khi-kare dağılışı gösterir.
k
( X i  i )2
2  
i 1  i2

Serbestlik derecesi ise k dır.


3.Ortalaması  ve varyansı  2 olan populasyondan çekilen n varyantlık bir örneğin
varyantları,
X 1 , X 2 ,.... X i ,.... X n

ise aşağıda verilen oran da bir khi-kare dağılışı gösterir,


n
( X i   )2
2   i 1  2

serbestlik derecesi ise n dır.

4. Varyantları X1 ,......X n olan şans örneği ortalaması  ve varyansı 2 olan normal


populasyondan çekilmiş bir örnek ise aşağıdaki tanım da khi-kare dağılışı gösterir.

(n 1)S 2 n
( X i   )2
 
2

2 i 1 2
Bu khi-karenin serbestlik derecesi ise v  n  1 dır. Bu eşitlik çok yaygın olarak kullanılan bir
khi-kare dağılış özelliğidir.
5.Varyantları çeşitli sayıda sınıflara, örneğin k adet sınıfa, ayrılmış şans örneklerinde f 
gözlenen mutlak frekans ve f '  beklenen veya teorik mutlak frekanslar ise aşağıdaki eşitlik
de bir khi-kare dağılışı gösterir.
k ( f j  f j' ) 2
 
2

j 1 fj

Burada k = sınıf sayısıdır. Söz konusu eşitlik daha sonra da görüleceği gibi iki mutlak ferkans
arasındaki farklılığın sıfır olup olmadığını veya şanstan kaynaklanıp kaynaklanmadığını test
etmede kullanılır.
ÖRNEK 5.35.
On bir serbestlik dereceli bir örneğin khi-kare değeri  2 = 23.32 olarak bulunmuştur. Söz
konusu örneğin 11 serbestlik dereceli veya içinde 12 adet varyant bulunan bir populasyondan
çekilme olasılığı nedir? EKTABLO IV den de görüldüğü gibi % 2.5 ve % 1.0 arasında olup
takriben %l.75'dir. Eğer % 5 düzeyi kritik düzey olarak alınırsa, bu örneğin böyle bir
populasyona temsil etmediği veya böyle bir populasyondan çekilmediği sonucu ortaya çıkar.

Öte yandan v30 örneklerin 2 değerlerinin √22 değerleri ortalaması √2v-l ve varyans l
olan normal bir dağılış izler. O nedenle Khi-kare tablolarında 30 veya daha fazla serbestlik
dereceli örneklerin 2 olasılıkları verilmez. Bu gibi durumlarda t-dağılışından yararlanılır. Z2
değerleri (Xi-µ)/ nın karesi alınarak bulunduğundan Khi-kare dağılışı yalnız 0 ile + arasında
olan pozitif 2 değerleri için geçerlidir.
Mendel’in Açılma Oranlarına Uyum Kontrolü ( Khi-Kare Testi)
ÖRNEK 5.36. Susamda açık kapsüllü ve beyaz taneli bir çeşit (AABB) ile kapalı kapsüllü ve
sarı taneli bir çeşit (aabb) arasında yapılan melezlemenin F2 açılma generasyonunda elde
edilen bitkilerin, oluşan 4 fenotipe göre sayısal olarak dağılımı şu şekilde gözlenmiştir.
Fenotip F2’de Bitki Sayısı(Adet)
Açık kapsüllü + Beyaz taneli : 2604
Açık kapsüllü + Sarı taneli : 876
Kapalı kapsüllü + Beyaz taneli : 847
Kapalı kapsüllü + Sarı taneli : 273

Not : Susamda açık kapsüllü olma dominant A geni ile ve beyaz taneli olma ise dominant B
geni ile idare edilmektedir. F2 generasyonunda dihibrit (9:3:3:1 açılımı) söz konusudur. Buna
göre aşağıdaki soruları yanıtlayınız.

Bu denemede F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılımına uygun mudur ? 0.01 olasılık
düzeyinde test ediniz.
Çözüm için hipotezler şu şekilde kurulur;

H0 = F2’ deki açılım dihibrit (9:3:3:1 açılımı)


H1 = F2’ deki açılım dihibrit (9:3:3:1 açılımı)

Fenotipler Gözlenen Teorik Beklenen Frekans


Frekans Frekans
Açık Kapsüllü + Beyaz Taneli 2604 9 4600 X 9/16 = 2587.5
Açık Kapsüllü + Sarı Taneli 876 3 4600 X 3/16 = 862.5
Kapalı Kapsüllü+Beyaz Taneli 847 3 4600 X 3/16 = 862.5
Kapalı Kapsüllü + Sarı Taneli 273 1 4600 X 3/16 = 287.5
Toplam 4600 16 4600.0

Kapalı kapsüllü ve sarı taneli bitki görülme olasılığı (beklenen frekans) 4600 x 1/16 = 287.5

2 = ∑ (𝐟 − 𝐟 )𝟐 /𝐟′

( . ) ( . ) ( . ) ( . )
2 = + + + = 1.33
. . . .

SD = k -1 = 4 -1 = 3

3 SD’li Khi-kare dağılışında 2 =1.33 değerinin girdiği olasılık % 75’e yakındır. Bu nedenle,
F2 deki açılımın dihibrit açılıma uygun olduğu kabul edilir.

5.2.4. F-Dağılışı (Varyans Oranlarının Dağılışı)


Varyans aynı olan bir populasyondan alınan iki örneğin varyansları S²1 ve S²2 ise, her ikisi
de 2'yi tahminlediklerinden bunların S²1 / S²2 oranının 1 olması beklenir. Ancak örneklemeye
bağlı olarak bunlar birbirine eşit olmayabilir.
Bir populasyondan alınan sonsuz sayıda örneklerin varyansları rasgele oranlanırsa elde edilen
oranlar, R.A.Fisher'in isminden,

F=S²1/S²2

şeklinde tanımlanır ve bunlar 1 etrafında bir dağılım gösterirler ki buna F-Dağılımı denir.
Dağılışın iki parametresi vardır: v1 ve v2. O nedenle diğer dağılışlardan farklı olarak her bir
serbestlik derecesi çifti için ayrı bir F dağılışı vardır. F-dağılışı simetrik değildir ve sağa doğru
eğiktir. v1 ve v2 arttıkça dikleşir, aksi durumda ise yatıklaşır (Şekil-19). F-dağılışı iki dağılışın
varyanslarını karşılaştırmada ve varyans analizi tekniğinde kullanılır.

Şekil 5.5. Farklı üç serbestlik derecesi çiftinde F-dağılış eğrileri


Çeşitli serbestlik dereceleri çiftlerinde bulunan F oranlarının olasılıklarını saptamak oldukça
zordur. Çeşitli hipotezlerin kontrol edilmesinde % 5 ve % 1 F-dağılış noktalarının değerleri
Tablo EK TABLO-5 de verilmiştir.
Tabloda üstten birinci sırada büyük varyansın serbestlik derecesi (vı) ve birinci sütunda ise
küçük varyansın (paydada yer alan) serbestlik derecesi (v1) yer almaktadır. Bu ikisinin kesiştiği
yerde bulunan üstteki değer % 5 ve alttaki değer ise % 1 sınırlarının F değerleridir (kritik
değer).

Örneğ n 4/12 SD'de üsttek değer 3.26 dır. Şek lden de görüldüğü g b 3.26 değer eğr y % 5
ve % 95 k alanına ayıran b r değerd r. Bu değer şu şek lde yorumlamak mümkündür. 4 ve
12 SD'l çok sayıda örnekler alınıp, varyanslarına a t F değerler bulunsa, bunların % 95' 3.26
dan küçük F değer ve % 5' se 3.26'dan büyük F değer ver r. Veya herhang b r F değer n n
3.26 dan büyük olma olasılığı % 5 d r.
Şimdi de 4 ve 6 serbestlik derecesine ait F- dağılışında den daha büyük değerlerinin oranını
veya herhangi bir değerinin bu verilen değerden büyük olması olasılığını bulalım.
Dikkat edildiğinde F=4.534 değeri dağılış eğrisini %95:%5 olacak şekilde iki olasılık alanına
ayırmıştır. O nedenle 4:6 serbestlik dereceli F dağılışında kiritik bir F değeridir. Herhangi bir F
oranının bu değerden yüksek olma şansı %5 ve düşük olması şansı ise %95 dır.
ÖRNEK 5.37
10 serbestlik dereceli bir örneğin varyans 20.6 ve 15 serbestlik dereceli ikinci bir örneğin
varyans ise 13.6 dır. Her iki örnek, aynı varyanslı bir populasyondan mı çekilmiştir veya
çekildikleri populasyonların varyansları eşit midir? % 5 kritik değerini kullanarak
çözümleyelim.
S12  20.6 ve v1  10

S22  13.6 ve v2  15

İlk çekilen örneğin çekildiği populasyonon varyansını 12 ve ikincisinin varyansını  22 ile
gösterelim. Bunlar eşit iseler oranlarının bire eşit olması beklenir.
12
F 1
12
Eğer birden büyükse iki örneğin alındığı populasyonların varyanslarının aynı olmadığı ileri
sürülür. Örneklerden bulunan F değeri ise
S12 20.6
F   1.51
S22 13.6
dır.

Öte yandan 10:15 serbestlik derecelerinde % 5 kritik değer 2.55 dir. 1.51<2.55 olduğu için
örneklerin, eşit varyanslı ( F =1) iki populasyondan gelme olasılığı % 5 den büyüktür. O
nedenle 12   22   2 olduğu kabul edilebilir. Ayrıca F  1.51 oranının tam F  1 olmaması

tesadüflükten kaynaklanır. Öte yandan eğer iki örneğin varyanslarının oranı 1.15 değilde F =
2.70 olsaydı, bu taktirde 10 ve 15 serbestlik dereceli bu iki örneğin varyansları eşit iki
populasyondan gelme olasılığı % 5 den küçük olacak ve 12   22 sonucu ortaya çıkacaktı.

ALIŞTIRMALAR
1.100 adet elektrik ampulünde ortalama dayanma süresi 1280 saat ve standart sapması ise 142
saattir. Ortalamanın standart hatasını hesaplayınız ve bu örneğin ortalaması 1300 saat olan bir
populasyona girme olasılığını bulunuz.

2.400 radyo lambasının test edilmesinden sonra 140 tanesinin bozuk olduğu gözlenmiştir.
Bozuk lamba oranını ve standart sapmasını bulunuz. Bozuk lamba oranının 1/2 olduğu
söylenebilir mi?

3.İki fabrikanın ürettiği lastiklerin dayanma sürelerinin aynı olup olmadığı araştırılmaktadır.
Her iki fabrikadan alınmış 100'er lastikli iki örnekte ortalama dayanma süreleri ve varyansları
şöyle bulunmuştur.

1.Fabrika 2.Fabrika
_ _
X1=26400 km X2=25100 kg
x12= 1.440.000 x22= 1.960.000
İki ortalama değer arası farklılığın standart hatasını bulunuz. Dayanma sürelerinin aynı olduğu
söylenebilir mi? Veya µ1-µ2=0 olduğu kabul edilebilir mi?

4.Bir araştırıcı A ve B patates çeşitlerinin kızartma sürelerini araştırmaktadır. A çeşitinde 10


ve B çeşitinde ise 8 örnek kızartılmış ve kızartma süreleri (dakika) şöyle bulunmuştur.
A çeşidi: 18,18,25,16,14,13,22,21,20,18
B çeşidi: 26,29,35,32,33,32,36,37
Her iki çeşitin ortalama kızartma süreleri farklılığını ve bu farklılığın standart hatasını bulunuz.
Çeşitlerin bu farklılıklarının sıfır olduğu söylenebilir mi?
5.A ırkı koyunlarda 180 dişiden 70'inin ve B ırkı koyunlarda ise 200 dişiden 90'ının gebe kaldığı
saptanmıştır. Her iki örneğin binom oranlarını, bunların farklılıklarını ve standart sapmalarını
bulunuz. P1-P2=0 kabul edilebilir mi?

NOT: Yukarıdaki sorularda test olasılığı % 5 ve test yönü iki yönlü testtir.

BÖLÜM 9: HİPOTEZ KONTROLLERİ

9.l.HİPOTEZ KONTROLÜNÜN ÖNEMİ


Gözlem veya deneme yapmadan, aslında, amaç, bunların sonuçlarından gidilerek daha
genel sonuçlara ulaşmaktır. Bu şekilde bir amaca ulaşmak için ya populasyondan örnekler
çekilerek bunlar üzerinde gözlemler yapılır ya da deneme ile bu örnekler suni olarak
oluşturulur ve kendilerine ait teorik muamele populasyonlarının bir örneği şeklinde düşünülür.
Fakat ne şekilde olursa olsun, sınırlı sayıda rakamlar ve sınırlı sayıda bilgi elde olunur. Sınırlı
sayıda olan bu bilgilerden daha genel sonuçlara ulaşmak ancak hipotez kontrolü ile mümkün
olur. Diğer bir anlamda hipotez kontrolü için örnek çekilir veya deneme yapılır. Ancak
istatistiki açıdan ise alınan örneklerle, bunların çekildiği populasyonların dağılışları
(parametreleri) belirli risklerle tanımlanmaya çalışılır.
Örneğin, bir n adet X,Y çiftini içeren bir örnekte ikisi arasındaki korrelasyon
katsayısının r=0.296 olduğu saptanabilir. Bu değer X,Y arasındaki gerçek ilişkinin () de
=0.296 olduğu anlamına gelmeyebilir. Sözgelimi gerçekte, =0 olduğu halde örneklemeden
dolayı r=0.296 olarak saptanmış olabilir. O nedenle  değerinin sıfır olup olmadığının
araştırılması gerekir. Bu da r'nin kullanıldığı bir hipotez kontrolü ile mümkündür. Fakat belirli
bir hatası veya riski de vardır. Öte yandan r'den gidilerek 'nun tanımlanması yukarıda
açıklandığı şekilde bir genel sonuca ulaşmadır.
Korrelasyon örneğine benzer şekilde, iki çeşitin verimlerinin farklı olup olmadıkları,
iki ilacın etkinliklerinin aynı olup olmadığı ve bir konserve fabrikasında üretilen salçaların %
32.5 kura madde içerip içermedikleri ancak hipotez kontrolü ile mümkündür.
Hipotez kontrollerinde sıkça geçen hipotezin öncelikle tanımlanması gerekir.

9.2.HİPOTEZ VE KURULMASI
Hipotez testlerinde en önemli basamak hipotez kurulmasıdır. İyi bir hipotez anlam
taşımalı, karşıtı bulunmalı ve kontrol edilebilmelidir.
Populasyonların dağılışları hakkında karar verilirken ya bir tahminde bulunulur ya
da konu ile ilgili belirli bir varsayımda bulunulur. İster gerçekleşsin veya isterse gerçekleşmesin
ileri sürülen bu varsayımlara hipotez denir. İstatistikte hipotezler, populasyonların olasılık
dağılışları üzerinde ileri sürülen iddialar şeklinde tanımlanır. Yani hipotezler parametreler veya
parametreler arası farklılıklar için kurulur.
İki farklı çeşitin verimleri arasında (iki populasyonun ortalaması arasında) "farklılık
yoktur" veya "farklılık vardır" şeklindeki iki önerme veya varsayım bir hipotezdir. Birinci
çeşitin geldiği populasyon ortalaması 1 ve ikincisininki 2 ise bunlar arasında "farklılık
yoktur" önermesi

1 -µ2=0 (yani µ1=µ2) şeklinde ve "farklılık vardır" önermesi ise


µ1 -µ2 0 (yani µ1 µ2) şeklinde
yazılabilir.
Bir firmanın ürettiği ilaçların etkinlik oranı "% 80 dir" veya "% 80 değildir" önermeleri de
=0.80 ve 0.80
şeklinde tanımlanabilir.
Her iki örnekten de görüldüğü gibi hipotez iki kısımdan oluşmaktadır. Birincisi
farklılığın olmadığı veya parametrenin herhangi bir varsayım değerine eşit olduğu hipotez
kısmıdır. Buna "sıfır" hipotezi denilir ve H0 ile gösterilir, yukarıda verilen birinci örnekte
H0: µ1 -µ2=0
Sıfır hipotezidir. İkinci hipotez kısmı ise bunun karşıtıdır. "Karşıt hipotez" veya "alternatif
hipotez" adını alır ve H1 ile gösterilir. Örneğin;
H1:µ1 -µ20
birincisinin karşıtıdır. İkinci örnek için
H0 : =0.80 ve H1: 0.80
şeklinde yazılabilir.
Sıfır hipotezi (H0 ) "Kontrol edilen" veya iddia edilen hipotezdir. Her iki hipotez de
birarada görülmez ve ayrıntılıdır. Eğer H0 kabul edilirse H1 reddedilmiş olur. Veya H0'ın
reddedilmesi H1'in kabul edilmesi anlamına gelir.
Karşıt hipotez, farklı üç şekilde yazılabilir. Örneğin H0:µ1 -µ2=0 hipotezi için karşıt
hipotezin bu formları
H1: µ1 -µ2=0; H1: µ1 <µ2 veya H1: µ1 <µ2
olmaktadır.
Karşıt hipotezin bu formları, H0 'ın iki-yönlü veya tek-yönlü kontrol edillp,
edilmeyeceği konusunda yol göstericidir. H1: µ1 -µ20 karşıt hipotezi, Sıfır hipotezinin iki-
yönlü; diğer iki karşıt hipotez ise tek-yönlü kontrol edilmesini gerektirir.
Daha önce ele alınan ikinci örneğin karşıt hipotezleri de benzer şekilde
H1: 0.80; H1: >0.80 veya H1: <0.80
şeklinde yazılabilir.

9.3.HİPOTEZ KONTROLÜ _ _
Hipotez kontrolünün esası; örnekten hesaplanmış, x,r,(x1 - x2) gibi herhangi bir
istatistiğin, sıfır hipotezi ile belirlenmiş hipotetik populasyondan şansa bağlı olarak çekilmiş
aynı büyüklükteki örneklere ait istatistiklerin örnekleme dağılımına girme olasılığını
hesaplayarak buna göre hipotezi red veya kabul etmektir. O nedenle hipotez kontrolünde ilk
basamak hipotezin kurulması ve hipotetik populasyonun, bir önceki konuda belirtildiği şekilde,
tanımlanmasıdır. Aksi durumda hipotez kontrolü yapılamaz.
Hipotez kontrolünde ikinci basamak, örnekleme dağılışının H0 hipotezi kullanılarak
tanımlanmasıdır.
Üçüncü kademede, örneğin hipotetik populasyonu temsil etme veya örnekleme
dağılışına girme olasılığı hesaplanır. Bunun için istatistiklerin z,t,khi-kare ve F gibi standart
değerleri veya test istatistikleri kullanılır.
Hipotez kontrolünde sonuncu kademe karar aşamasıdır. Üçüncü kademede hesaplanan
olasılığa göre hipotez red veya kabul edilir. Fakat karar vermede, örneğin, örnekleme dağılışına
girme olasılığının hesaplanması yeterli değildir. Bunun, hangi değerden büyük olunca
hipotezin kabul edileceği veya küçük olunca hipotezin reddedileceği önceden
kararlaştırılmalıdır. Yani bir sınır olasılık düzeyi belirlenmelidir. Buna hipotez kontrolünde
"önemlilik seviyesi" denir. Araştırmalarda daha çok % 5 ve % 1 gibi önemlilik seviyeleri
kullanılır. Örneğin % 5 önemlilik seviyesi alınmış ise; hesaplanan olasılık bundan büyükse
hipotez kabul, küçükse hipotez reddedilir. Hipotezin kabul edilmesi, örneğin hipotezle belirtilen
populasyonu temsil ettiği ve hipotezi doğruladığı desteklediği anlamını taşır. Aksi durumda
sıfır hipotezi doğrulanmaz ve H1 kabul edilmiş olur.
Yukarıdaki ifadelerden de anlaşılacağı gibi kontrol edilen hipotez, sıfır hipotezidir.
Hipotez kontrolünde hangi karşıt hipotezin seçileceği önemli bir sorundur. Genel olarak
benimsenen iki-yönlü teste uygun olan karşıt hipotezdir. Eğer hipotezi kurulan parametrenin
hipotetik değere bakarak küçük veya büyük olduğu konusunda ön bilgiler varsa bu takdirde tek-
yönlü kontrollere uygun olan karşıt hipotez kurulabilir.
Yukarıda, bir test olasılığı şeklinde belirtilen "önemlilik seviyesine" "testin
büyüklüğü" adı da verilir ve ile gösterilir. Bu seviye aynı zamanda "H0 gerçek olduğu zaman,
H0'ın maksimum reddedilmesi olasılığıdır".Bir bakıma testin riskidir. Örneğin; =0.05 ise
gerçek olan H0 hipotezinin maksimum reddedilme olasılığı % 5 olur.
Hipotez kontrollerinde, örneğin örnekleme dağılışına girme olasılığını hesaplayıp, bunu
 ile karşılaştırma yerine örnek istatistiğinin (veya parametrenin sapmasız tahmininin)
seviyesindeki bir kritik değerle veya istatistiğin standart değerinin uygun bir test-dağılışı kritik
değeri ile karşılaştırmak daha büyük bir kolaylık sağlar.

9.4.İKİ VE TEK-YÖNLÜ HİPOTEZ KONTROLLERİ


Hipotez kontrollerinde kullanılan istatistiğin, hipotezle belirtilen populasyonun veya
örnekleme dağılımının ortalamasından, yalnız + ve - tarafa olan sapmaları göz önüne
alındığında hipotez kontrolü tek-yönlü yapılır.
Örneğin; hipotez kontrolü bilinmeyen bir populasyon ortalaması (µ) için kurulmuş
olsun. Bunun sapmasız tahmini X değeridir. Eğer XN (µ,2) ise X değerleri de XN(µ,2)
olan örnekleme dağılışı izler. tek-yönlü teste ait hipotezleri aşağıda olduğu gibi kurmuş olalım.

H0 :µ=µo
H1 :µ>µo

Eğer H0 hipotezi geçerli veya gerçek ise X değerlerinin benzer şekilde bu kez
ortalaması µo ve varyans 2/n olan normal örnekleme dağılışı da izlediği ileri sürülür (Şekil-
22). Bu karşıt hipotezde X'ların µ0'dan büyük olan değerleri H0'ın reddedilmesini sağlayan
değerlerdir. Acaba X'ın değeri µo'dan ne kadar büyük olmalıdır ki H0 reddedilsin. Veya 
önemlilik seviyesine göre öyle bir kritik C değeri tanımlayalım ki, bundan daha büyük X
değerleri H0 hipotezini reddetsinler. Eğer  =0.05 ise, normal

_
Şekil 22.H0 kabul edildiğinde X'ların dağılışı

dağılış ve standart normal dağılış özelliklerinden, Tablo Ek-1'den yararlanarak C'nin µ0'dan
+l.645 X kadar uzakta olması gerektiği kolaylıkla görülür veya kritik C değeri

C=µ0+l.645 X
olarak bulunabilir. Herhangi bir X değerinin C'den büyük bir değer alması olasılığı %5 dir.
Dolayısı ile H 0 'ın geçerli veya doğru olduğunda X'ın C'den büyük olması, yanlışlıkla H0 'ı
reddetme olasılığı ve bu örneğe göre %5 dir.
Eğer ortalaması µ olan populasyondan alınmış bir örneğin ortalaması C'den büyükse H0
reddedilir ve µ>µ0 H1 hipotezi kabul edilir. O nedenle  alanı ile sınırlı C'den büyük X
değerlerinin bulunduğu alan RED alanı, sağdaki kısım ise KABUL alanı adını alır.
Öte yandan
_
X-µ0
z= ----------
X

oranın standart normal dağılış izlediğinden C kritik değerinin Z değeri +1.645 olur. Buna göre
de standart değeri veya test istatistiği +1.645 den büyük olan X değerleri de H0 hipotezini
reddeder.
Karşıt hipotez H1: µ<µ0 şeklinde seçilmiş olsaydı, bu kez C kritik değeri
C=µ0 -l.645 X _

olacaktı. Bundan daha küçük değer veren X değerleri yine H0 hipotezini reddeder ve H1 :
µ<µ0 hipotezini kabul eder. X değerinin yukarıdaki eşitlikten bulunan Z test istatistiği de -l.645
den küçükse yine H0 reddedilir.
Yukarıda açıklandığı gibi dağılışın yalnız sağ veya sol tarafı ile ilgili olan hipotez
kontrollerine TEK-YÖNLÜ kontroller denir.
Örneğe ait istatistiğin veya sapmasız tahminin, hipotezin Belirlediği populasyon
ortalamasından her iki yönde olan sapmaları da göz önüne alındığında yapılan test İKİ-YÖNLÜ
test olur.
Daha önce ele alınan örneğin buna uygun hipotezi
H0 :µ=µ0
H1 : µµ0
şeklinde olanıdır. Bu testlerde, H0 gerçek iken, bunu reddetme olasılığı X değerlerinin C1
gibi kritik bir değerden küçük ve C2 gibi bir değerden büyük olma olasılıklarına eşit
olduğundan, iki eşit kısma bölünür (Şekil 23). Eğer =0.05 ise C1 ve C2 kritik değerleri,
EK TABLO 1'den yararlanarak:

C2 =µ0+l.96 X ve C1 =µ0-l.96 X

şeklinde hesaplanır. Ortalaması µ olan populasyondan çekilen bir örneğin ortalaması C1 den
küçük veya C2 den büyükse H0 reddedilir ve H1 kabul edilir. Veya örneğin ortalamasına ait
z'nin mutlak değeri z > 1.96 ise yine H0 reddedilir.
Eğer parametre tahminlerin test istatistiği t-dağılışına uygun t ise, bunlarla da iki ve tek
yönlü hipotez kontrollerinin yapılması mümkündür. Ama burada t'nin serbestlik derecesine
bağlı olduğunu hatırlamalıyız.

Şekil 23. İki yönlü testlerde kritik bölgeler (H0 geçerli).

Örneğin; yine µ ile ilgili


H0 : µ=µ0
H1: µµ0, H1:µ>µ0 ve H1 µ<µ0
hipotezlerini kurmuş olalım. Küçük örneklerde ve varyansın bilinmediği durumlarda,
örnekleme dağılışının varyans S2X = S2/n olarak tahminleniyordu. Ancak
_
(X-µ0)
t=------------
Sx

oranı (n-1) serbestlik dereceli bir t-dağılışı gösterir. Serbestlik derecesinin 20 olduğu durumda
 = 0.05 için iki ve tek yönlü kritik değerler EK TABLO 3'den bulunarak Şekil 24'de
verilmiştir.
Şekil 24. 20 serbestlik derecesinde =0.05 için iki-yönlü(a) ve tek-yönlü testler için (b,c) kritik
t değerleri

İki-yönlü hitopez için kritik t değerleri verilen serbestlik derecesinde 0.05 sütununda;
tek-yönlü testler için ise 2x=2x0.05=0.10 sütununda yer almaktadır.
Hatırlanacağı gibi khi-kare ve F-dağılışları da serbestlik derecesine bağlıdır.
Yukarıda alınan z ve t örneklerinden de görüldüğü gibi iki-yönlü hipotez kontrollerinde
kritik değerler hipotetik ortalamadan daha uzakta bulunmaktadır. Yani iki-yönlü hipotezin
kabulü için daha büyük sapmalara tolerans gösteriir.

9.5.HİPOTEZ KONTROLÜNDE HATALAR ve KONTROLÜN GÜCÜ

Hipotez kontrollerinde karar verme aşamasında iki tip hata yapma olasılığı veya riski
vardır. Birincisi; H0 hipotezi gerçekte doğru iken bunun yani H0 'ın reddedilmesidir (Yani yanlış
olan H1 hipotezinin kabul edilmesidir). Buna 1.Tip Hata denir ve daha önce önemlilik seviyesi
tanımlanırken verilen  olasılığı 1.Tip Hataya eşittir. İkincisi ise; H0 hipotezi gerçekte yanlış
iken H0 hipotezinin kabul edilmesidir (veya doğru H1 hipotezinin reddedilmesidir). Buna 2.Tip
Hata denir ve  ile gösterilir.
H0 hipotezinin gerçek durumu ile karar verme sonucu arasındaki bu iki tip hata doğuşu
Tablo 11'de verilmiştir.
Tablo 11.Hipotez kontrolünde riskler
H0 Hipotezinin Gerçek Durumu Test Sonucu Verilen Karar
RED KABUL

H0 DOĞRU 1.Tip HATA Doğru Karar


H0 YANllŞ Doğru Karar 2.Tip HATA


Öte yandan , yalnız H0 hipotezinin doğru olduğu ve  ise H0 hipotezinin yanlış olduğu
durumdaki bir frekans dağılışının,belirli bir olasılığıdır.
İkinci tip hata olasılığı, , H0 hipotezine katılan ve üzerinde durulan populasyon
parametresinin gerçek değerine bağlıdır ve buna göre de değişir. Bunu belirliyebilmek için
populasyon ortalaması ile ilgili H0 : µ=µo ve H1: µ>µo hipotezini ele alalım.
Daha öncede görüldüğü gibi bu hipotez X değerleriyle kontrol edilir. XN(µ,2) dağılışı
izllyorsa, X  N (µ,X2) dağılışını izler. _
Eğer H0 doğru ise yani µ=µ0 ise X değerleri yine X(µ0,  X2) normal dağılışını izler.
Bu örnekleme dağılışı Şekil 23'de en üst sırada bulunan dağılıştır. Ayrıca doğru bir H0 'ı
reddetme olasılığı  ise buna ait kritik değer C ile gösterilmiştir.
H0 hipotezi yanlış da, doğru olarak kabul ediliyorsa, µ'nün karşıt hipoteze göre µo'dan
daha büyük bir değer alması gerekir. Bu µ1 olsun. yani, H1: µ=µ1 olsun. Bu takdirde X değerleri
XN(µ1,X2) şeklinde ortalaması µı olan bir başka normal örnekleme dağılışı izler (Şekil
24'deki altta yer alan dağılış). İşte, 2.Tip Hata olasılığı X değerinin C'den küçük bir değer
alması olasılığıdır. , şekil 22'deki alttaki dağılışın taralı alanıdır. Bu alanın değeri normal
dağılış, standart normal dağılış ilişkisinden ve EK TABLO l'den yararlanılarak bulunabilir.

1.Bir hipotez kontrolünün başarısı  ve  olasılıklarına bağlıdır. seçilen bir kontrolde


her ikisinin de düşük seviyede olması arzulanır.
2.  ve  arasında ters bir ilişki vardır. arttıkça  küçülür veya tersi olur.
3.  ve  olasılıkları n'e bağlıdır. Örnek büyüklüğü arttıkça her ikisi de küçülür. Zira
örnekten daha fazla ve sağlıklı bilgi elde edilir.
4.Şekil 25'den de anlaşılacağı gibi 'nın değeri, gerçek populasyon ortalamasının (µ)
veya hipoteze konu olan parametrenin Sıfır hipotezi ile verilen değerden, buradaki örnekte
µ0'dan sapmasına bağlıdır. µ, µ0'dan uzaklaştıkça, sabit bir  seviyesinde  küçülür. O
halde , burada µ'nün bir fonksiyonudur.
5.  ve  arasındaki ters ilişki nedeniyle hipotez kontrollerinde  sabit tutular ve yeterll n sayısı
ile  düşünülmeye çalışılır.

Şekil 25. 'nın tanımı ve µ'nın µo'dan uzaklaşmasının 'ya etkisi

Bir testde, H0 yanlışken, bunu reddetme doğru kararının olasılığına kontrolün "güç
fonksiyonu" denir. Yani güç fonksiyonu Tablo 11'den de görüldüğü gibi
Güç fonksiyonu = 1-
Herhangi bir verilen parametre değeri için gücün mümkün olduğu kadar yüksek olması
arzulanır. Bu öncelikle etkili test istatistiğinin (z,t gibi) seçimine bağlıdır. Ayrıca H1 hipotezi
koşullarında bütün parametreler için
Güç fonksiyonu > 
olmalıdır. Bu şu anlama gelir: H0 yanlış olduğu durumda onu reddetme olasılığı, gerçek
olduğunda reddetme olasılığından daha büyüktür. Eğer bu koşul yerine gelirse kontrole
sapmasız kontrol denir. Bu konuda ve ilerideki bazı konularda verilen test istatistikleri
etkilidir ve kontroller sapmasızdır.
 değerleri yukarıdaki tek-yönlü kontrollerde olduğu gibi iki yönlü kontrollerde de
benzer şekilde tanımlanabilir.

ÖRNEK:Tarımsal mücadele ilacı üretilen fabrikalarda belirtilen bir insektisitin 1 kg preparat


başına 125 gr aktif madde içermesi ve varyansının da 45 olması gerekmektedir. Bir A firmasının
ürettiği aynı tip ilaçların 36 adet birer kg'lık paketlerinde aktif madde miktarı 129 gr
bulunmuştur. Şu hipotezleri kontrol edelim: A firmasının ürettiği ilaçlarda da aktif madde
miktarı 125 gr veya değildir. A firmasının ortalaması µ ise
H0 : µ= l25
H1: µ> l25
Örnekleme dağılışının ortalaması, µx=125 ve varyans ise x2= x2/n=l.25 dir. Önemlilik
seviyesi  = 0.05 ise bunun tek yönlü C kritik değeri :

C= 125+1.645 x= 125+1.645x1.12= 126.8


Söz konusu örnekleme dağılışı Şekil 23'de en üst sırada yer almaktadır. Örneğin
ortalaması X= 129 gr değeri C'nin sağına düştüğünden H0 hipotezi reddedilmektedir. H1 kabul
edilir. A firmasının ilaçlarında aktif madde miktarı µ>125 olduğu ortaya çıkar.
Yukarıda ulaşılan sonucun veya verilen kararın isabetli olma olasılığı, karşıt hipotezin
daha başka belirli bir değeri için kontrolün gücü veya (1-) değeridir.
H1:µ>125 olduğuna göre H1: µ=l29 olarak kabul edelim. Bu karşıt hipotezinin geçerli
olması halinde, H0 test hipotezi kabul edilirse, bu reddedilmesi gereken test hipotezinin kabulü
olur ki, bunun olasılığı  dır. Şekil 23'te alttaki dağılış. Normal dağılış kurallarından

126.8-129
z= ------------------= 1.96
1.12

= 0.50-0.4750= 0.025= % 2.5

O halde H0:µ=125 hipotezine ait kontrolün H1: µ=129 hipotezine karşı gücü 1-
=1-0.025= % 97.5 olmaktadır.
Şekil 26.H0 :µ= 125 hipotezinin H2:µ= 129 hipotezine karşı kontrolünde  ve 
değerleri. (1.tip ve 2.tip hatalar)
BÖLÜM 6
HİPOTEZ KONTROLLERİ
6.l.HİPOTEZ KONTROLÜNÜN ÖNEMİ
Gözlem veya deneme yapmadan, aslında, amaç, bunların sonuçlarından gidilerek daha genel sonuçlara
ulaşmaktır. Bu şekilde bir amaca ulaşmak için ya populasyondan örnekler çekilerek bunlar üzerinde gözlemler
yapılır ya da deneme ile bu örnekler suni olarak oluşturulur ve kendilerine ait teorik muamele
populasyonlarının bir örneği şeklinde düşünülür. Fakat ne şekilde olursa olsun, sınırlı sayıda rakamlar ve
sınırlı sayıda bilgi elde olunur. Sınırlı sayıda olan bu bilgilerden daha genel sonuçlara ulaşmak ancak
hipotez kontrolü ile mümkün olur. Diğer bir anlamda hipotez kontrolü için örnek çekilir veya deneme yapılır.
Ancak istatistiki açıdan ise alınan örneklerle, bunların çekildiği populasyonların dağılışları (parametreleri)
belirli risklerle tanımlanmaya çalışılır.
Örneğin, bir n adet X,Y çiftini içeren bir örnekte ikisi arasındaki korrelasyon katsayısının r=0.296
olduğu saptanabilir. Bu değer X,Y arasındaki gerçek ilişkinin () de =0.296 olduğu anlamına gelmeyebilir.
Sözgelimi gerçekte, =0 olduğu halde örneklemeden dolayı r=0.296 olarak saptanmış olabilir. O nedenle 
değerinin sıfır olup olmadığının araştırılması gerekir. Bu da r'nin kullanıldığı bir hipotez kontrolü ile
mümkündür. Fakat belirli bir hatası veya riski de vardır. Öte yandan r'den gidilerek 'nun tanımlanması
yukarıda açıklandığı şekilde bir genel sonuca ulaşmadır.
Korrelasyon örneğine benzer şekilde, iki çeşitin verimlerinin farklı olup olmadıkları, iki ilacın
etkinliklerinin aynı olup olmadığı ve bir konserve fabrikasında üretilen salçaların % 32.5 kuru madde içerip
içermedikleri ancak hipotez kontrolü ile mümkündür.
Hipotez kontrollerinde sıkça geçen hipotezin öncelikle tanımlanması gerekir.

6.2.HİPOTEZ VE KURULMASI
Hipotez testlerinde en önemli basamak hipotez kurulmasıdır. İyi bir hipotez anlam taşımalı, karşıtı
bulunmalı ve kontrol edilebilmelidir.
Populasyonların dağılışları hakkında karar verilirken ya bir tahminde bulunulur ya da konu ile ilgili
belirli bir varsayımda bulunulur. İster gerçekleşsin veya isterse gerçekleşmesin ileri sürülen bu varsayımlara
hipotez denir. İstatistikte hipotezler, populasyonların olasılık dağılışları üzerinde ileri sürülen iddialar şeklinde
tanımlanır. Yani hipotezler parametreler veya parametreler arası farklılıklar için kurulur.
İki farklı çeşitin verimleri arasında (iki populasyonun ortalaması arasında) "farklılık yoktur" veya
"farklılık vardır" şeklindeki iki önerme veya varsayım bir hipotezdir. Birinci çeşitin geldiği populasyon
ortalaması 1 ve ikincisininki 2 ise bunlar arasında "farklılık yoktur" önermesi
1 -µ2=0 (yani µ1=µ2) şeklinde ve "farklılık vardır" önermesi ise
µ1 -µ2 0 (yani µ1 µ2) şeklinde
yazılabilir.
Bir firmanın ürettiği ilaçların etkinlik oranı "% 80 dir" veya "% 80 değildir" önermeleri de
=0.80 ve 0.80
şeklinde tanımlanabilir.
Her iki örnekten de görüldüğü gibi hipotez iki kısımdan oluşmaktadır. Birincisi farklılığın olmadığı
veya parametrenin herhangi bir varsayım değerine eşit olduğu hipotez kısmıdır. Buna "sıfır" hipotezi denilir ve
H0 ile gösterilir, yukarıda verilen birinci örnekte
H0: µ1 -µ2=0
Sıfır hipotezidir. İkinci hipotez kısmı ise bunun karşıtıdır. "Karşıt hipotez" veya "alternatif hipotez" adını alır ve
H1 ile gösterilir. Örneğin;
H1:µ1 -µ20
birincisinin karşıtıdır. İkinci örnek için
H0 : =0.80 ve H1: 0.80
şeklinde yazılabilir.
Sıfır hipotezi (H0 ) "Kontrol edilen" veya iddia edilen hipotezdir. Her iki hipotez de birarada görülmez
ve ayrıntılıdır. Eğer H0 kabul edilirse H1 reddedilmiş olur. Veya H0'ın reddedilmesi H1'in kabul edilmesi
anlamına gelir.
Karşıt hipotez, farklı üç şekilde yazılabilir. Örneğin H0:µ1 -µ2=0 hipotezi için karşıt hipotezin bu
formları
H1: µ1 -µ20; H1: µ1 > µ2 veya H1: µ1 < µ2
olmaktadır.
Karşıt hipotezin bu formları, H0 'ın iki-yönlü veya tek-yönlü kontrol edillp, edilmeyeceği konusunda yol
göstericidir. H1: µ1 -µ20 karşıt hipotezi, Sıfır hipotezinin iki-yönlü; diğer iki karşıt hipotez ise tek-yönlü
kontrol edilmesini gerektirir.
Daha önce ele alınan ikinci örneğin karşıt hipotezleri de benzer şekilde
H1: 0.80; H1: >0.80 veya H1: <0.80
şeklinde yazılabilir.

6.3.HİPOTEZ KONTROLÜ
Hipotez kontrolünün esası; örnekten hesaplanmış, x,r,(x , x ) gibi herhangi bir istatistiğin, sıfır hipotezi
ile belirlenmiş hipotetik populasyondan şansa bağlı olarak çekilmiş aynı büyüklükteki örneklere ait
istatistiklerin örnekleme dağılımına girme olasılığını hesaplayarak buna göre hipotezi red veya kabul etmektir.
O nedenle hipotez kontrolünde ilk basamak hipotezin kurulması ve hipotetik populasyonun, bir önceki konuda
belirtildiği şekilde, tanımlanmasıdır. Aksi durumda hipotez kontrolü yapılamaz.
Hipotez kontrolünde ikinci basamak, örnekleme dağılışının H0 hipotezi kullanılarak tanımlanmasıdır.
Üçüncü kademede, örneğin hipotetik populasyonu temsil etme veya örnekleme dağılışına girme olasılığı
hesaplanır. Bunun için istatistiklerin z,t,khi-kare ve F gibi standart değerleri veya test istatistikleri kullanılır.
Hipotez kontrolünde sonuncu kademe karar aşamasıdır. Üçüncü kademede hesaplanan olasılığa göre hipotez
red veya kabul edilir. Fakat karar vermede, örneğin, örnekleme dağılışına girme olasılığının hesaplanması
yeterli değildir. Bunun, hangi değerden büyük olunca hipotezin kabul edileceği veya küçük olunca hipotezin
reddedileceği önceden kararlaştırılmalıdır. Yani bir sınır olasılık düzeyi belirlenmelidir. Buna hipotez
kontrolünde "önemlilik seviyesi" denir. Araştırmalarda daha çok % 5 ve % 1 gibi önemlilik seviyeleri
kullanılır. Örneğin % 5 önemlilik seviyesi alınmış ise; hesaplanan olasılık bundan büyükse hipotez kabul,
küçükse hipotez reddedilir. Hipotezin kabul edilmesi, örneğin hipotezle belirtilen populasyonu temsil ettiği
ve hipotezi doğruladığı desteklediği anlamını taşır. Aksi durumda sıfır hipotezi doğrulanmaz ve H1 kabul
edilmiş olur.
Yukarıdaki ifadelerden de anlaşılacağı gibi kontrol edilen hipotez, sıfır hipotezidir.
Hipotez kontrolünde hangi karşıt hipotezin seçileceği önemli bir sorundur. Genel olarak benimsenen iki-
yönlü teste uygun olan karşıt hipotezdir. Eğer hipotezi kurulan parametrenin hipotetik değere bakarak küçük
veya büyük olduğu konusunda ön bilgiler varsa bu takdirde tek-yönlü kontrollere uygun olan karşıt hipotez
kurulabilir.
Yukarıda, bir test olasılığı şeklinde belirtilen "önemlilik seviyesine" "testin büyüklüğü" adı da verilir
ve α ile gösterilir. Bu seviye aynı zamanda "H0 gerçek olduğu zaman, H0'ın maksimum reddedilmesi
olasılığıdır".Bir bakıma testin riskidir. Örneğin; =0.05 ise gerçek olan H0 hipotezinin maksimum
reddedilme olasılığı % 5 olur.
Hipotez kontrollerinde, örneğin örnekleme dağılışına girme olasılığını hesaplayıp, bunu  ile
karşılaştırma yerine örnek istatistiğinin (veya parametrenin sapmasız tahmininin) seviyesindeki bir kritik
değerle veya istatistiğin standart değerinin uygun bir test-dağılışı kritik değeri ile karşılaştırmak daha büyük
bir kolaylık sağlar.

6.4.İKİ VE TEK-YÖNLÜ HİPOTEZ KONTROLLERİ


Hipotez kontrollerinde kullanılan istatistiğin, hipotezle belirtilen populasyonun veya örnekleme
dağılımının ortalamasından, yalnız + ve - tarafa olan sapmaları göz önüne alındığında hipotez kontrolü tek-
yönlü yapılır.
Örneğin; hipotez kontrolü bilinmeyen bir populasyon ortalaması (µ) için kurulmuş olsun. Bunun

sapmasız tahmini değeridir. Eğer X değerleri Normal dağılışlı populasyondan (µ, 2) alınmış ise

değerleri de Normal (µ, 2) olan örnekleme dağılışı izler. Tek-yönlü teste ait hipotezleri aşağıda olduğu gibi
kurmuş olalım.

H0 :µ = µo
H1 :µ > µo

Eğer H0 hipotezi geçerli veya gerçek ise değerlerinin benzer şekilde bu kez ortalaması µo ve

varyansı 2/n olan normal örnekleme dağılışı da izlediği ileri sürülür (Şekil 1). Bu karşıt hipotezde 'ların

µ0' dan büyük olan değerleri H0' ın reddedilmesini sağlayan değerlerdir. Acaba 'ın değeri µo' dan ne

kadar büyük olmalıdır ki H0 reddedilsin. Veya  önemlilik seviyesine göre öyle bir kritik C değeri

tanımlayalım ki, bundan daha büyük değerleri H0 hipotezini reddetsinler. Eğer =0.05 ise, normal dağılış

ve standart normal dağılış özelliklerinden, Tablo Ek-1'den yararlanarak C'nin µ0' dan +l.645 X kadar uzakta
olması gerektiği kolaylıkla görülür veya kritik C değeri

C=µ0+l.645 X olarak bulunabilir.

α
Kabul Alanı

µ0 C
Red Alanı

Herhangi bir X değerinin C'den büyük bir değer alması olasılığı %5 dir.

Eğer ortalaması µ olan populasyondan alınmış bir örneğin ortalaması C'den büyükse H0 reddedilir ve

µ>µ0 H1 hipotezi kabul edilir. O nedenle  alanı ile sınırlı C'den büyük değerlerinin bulunduğu alan RED

alanı, soldaki kısım ise KABUL alanı adını alır.


Öte yandan

( )
z=

oranın standart normal dağılış izlediğinden C kritik değerinin Z değeri +1.645 olur. Buna göre de standart
değeri veya test istatistiği +1.645 den büyük olan X değerleri de H0 hipotezini reddeder.
Karşıt hipotez H1: µ< µ0 şeklinde seçilmiş olsaydı, bu kez C kritik değeri
C=µ0 -l.645 X
olacaktı. Bundan daha küçük değer veren değerleri yine H0 hipotezinin reddedilmesini ve

H1: µ < µ0 hipotezinin kabul edilmesini gerektirir. değerinin yukarıdaki eşitlikten bulunan Z test istatistiği de

-l.645 den küçükse yine H0 reddedilir.


Yukarıda açıklandığı gibi dağılışın yalnız sağ veya sol tarafı ile ilgili olan hipotez kontrollerine TEK-
YÖNLÜ kontroller denir.
Örneğe ait istatistiğin veya sapmasız tahminin, hipotezin belirlediği populasyon ortalamasından her iki
yönde olan sapmaları da göz önüne alındığında yapılan test İKİ-YÖNLÜ test olur.
Daha önce ele alınan örneğin buna uygun hipotezi
H0 :µ=µ0
H1 : µµ0
şeklinde olanıdır. Bu testlerde, H0 gerçek iken, bunu reddetme olasılığı X değerlerinin C1 gibi kritik bir
değerden küçük ve C2 gibi bir değerden büyük olma olasılıklarına eşit olduğundan, iki eşit kısma bölünür
(Şekil 2). Eğer =0.05 ise C1 ve C2 kritik değerleri, EK TABLO 1'den yararlanarak:

C2 =µ0+l.96 X ve C1 =µ0-l.96 X şeklinde hesaplanır.

α /2 α /2

Red Alanı C1 Kabul Alanı C2 Red Alanı

Ortalaması µ olan populasyondan çekilen bir örneğin ortalaması C1 den küçük veya C2 den büyükse H0
reddedilir ve H1 kabul edilir. Veya örneğin ortalamasına ait z'nin mutlak değeri z > 1.96 ise yine H0 reddedilir.
Eğer parametre tahminlerinin test istatistiği t-dağılışına uygun t ise, bunlarla da iki ve tek yönlü hipotez
kontrollerinin yapılması mümkündür. Ama burada t'nin serbestlik derecesine bağlı olduğunu hatırlamalıyız.
Örneğin; yine µ ile ilgili
H0 : µ=µ0
H1: µµ0, H1:µ>µ0 ve H1 : µ<µ0
hipotezlerini kurmuş olalım. Küçük örneklerde ve varyansın bilinmediği durumlarda, örnekleme dağılışının
varyans S = S2/n olarak tahminleniyordu. Ancak

( )
t= oranı (n-1) serbestlik dereceli bir t-dağılışı gösterir.

Serbestlik derecesinin 20 olduğu durumda  = 0.05 için iki ve tek yönlü kritik değerler EK TABLO 3'den
bulunabilir.

Red -1.725 Kabul Kabul +1.725 Red


Red -2.086 Kabul +2.086 Red

% 2.5 % 2.5 %5 %5
İki-yönlü hitopez için kritik t değerleri verilen serbestlik derecesinde 0.05 sütununda; tek-yönlü testler için ise
2x=2x0.05=0.10 sütununda yer almaktadır.
Hatırlanacağı gibi khi-kare ve F-dağılışları da serbestlik derecesine bağlıdır.
Yukarıda alınan z ve t örneklerinden de görüldüğü gibi iki-yönlü hipotez kontrollerinde kritik değerler
hipotetik ortalamadan daha uzakta bulunmaktadır. Yani iki-yönlü hipotezin kabulü için daha büyük sapmalara
tolerans gösterir.

ÖRNEK: Tarımsal mücadele ilacı üretilen fabrikalarda belirtilen bir insektisitin 1 kg preparat başına 125 gr
aktif madde içermesi ve varyansının da 45 olması gerekmektedir. Bir A firmasının ürettiği aynı tip ilaçların 36
adet birer kg'lık paketlerinde aktif madde miktarı 129 gr bulunmuştur. Şu hipotezi kontrol edelim: A firmasının
ürettiği ilaçlarda da aktif madde miktarının 125 gr’dan daha fazla olduğu kabul edilebilir mi?
A firmasının ortalaması µ ise
H0 : µ= l25
H1: µ> l25
Örnekleme dağılışının ortalaması, µx=125 ve varyans ise x2= 2/n=l.25 dir. Önemlilik seviyesi  =
0.05 ise bunun tek yönlü C kritik değeri :

C= 125+1.645 x= 125+1.645x1.12= 126.8

%5

µ0= 125µC=
0= 125
126.8C= 126.8

Söz konusu örnekleme dağılışı Şekil 4'de yer almaktadır. Örneğin ortalaması = 129 gr değeri C'nin sağına

düştüğünden H0 hipotezi reddedilmektedir. H1 kabul edilir. A firmasının ilaçlarında aktif madde miktarı µ>125
olduğu ortaya çıkar.

6.7.POPULASYON ORTALAMASI İÇİN HİPOTEZ KONTROLLERİ


Populasyon ortalaması (µ) ile ilgili hipotez kontrollerinde daha önce güven aralığı konusunda belirtildiği
şekilde (8.4.1) farklı üç konum ele alınacaktır.
6.7.l.Bilinen Varyanslı Normal Dağılış
Gözlemler N(µ,2) normal dağılışını izlemiş olsunlar. Burada µ bilinmemekte fakat 2 bilinmektedir. µ'nün
doğru değerinin µ0 olduğunu kabul edelim ve gözlemlerimizin buna uyup uymadığı konusunda yol gösterici
iki-yönlü hipotezler aşağıda olduğu gibi kurulmuş olsun:
H0 : µ=µ0 ve H1: µ µ0
Populasyon ortalamasının (µ) örnekten tahmini x dır ve örnekleme dağılışının ortalaması µx= µ=µ0 (H0
hipotezine göre) ve varyans da σ = 2/n dir. O nedenle;

( µ) ( )
z = =

oranları z-standart normal dağılışını, N(0,1) izler. O nedenle örneğimize ait X değerinin Z standart değeri veya
test istatistiği hipotezin kontrolünde kullanılabilir. Söz konusu z değerinin verilen bir  önemlilik seviyesinde
belirlenecek kritik bir z değeri ile karşılaştırılması gerekir.  önemlilik seviyesindeki kritik z değeri EK
TABLO 1'de (1-/2) düzeyindeki z değeridir. Örnekten bulunan z'nin mutlak değeri ve kritik z-değeri aşağıda
olduğu gibi karşılaştırılarak H0 hipotezi red veya kabul edilir.

z > z(1- /2) ise H0 reddedilir


z < z(1-/2) ise H0 kabul edilir.
H1:µ>µo şeklinde tanımlanan tek-yönlü hipotez kontrolünde; kritik z değeri (1-) olasılığındaki z tablo
değeridir. Buna göre
z>z(1- ) ise H0 reddedilir.
z<z(1- ) ise H1 kabul edilir.
H1: µ<µ0 şeklinde tanımlanan tek-yönlü hipotez kontrolünde
z>-z(1- ) ise H0 kabul edilir.
z<-z(1-) ise H0 reddedilir.
ÖRNEK: Varyansı 36 olan normal bir populasyondan alınan 16 varyantlık bir örneğin ortalaması 51.5
bulunmuştur. Populasyon ortalamasının 55 olması mümkün müdür? % 5 düzeyinde kontrol ediniz. Soru iki-
yönlü teste uygun bir sorudur.
H0 : µ= 55 (populasyon ortalaması 55'dir)
H1: µ 55 (populasyon ortalaması 55 değildir)
σ = σ /n= 36/16= 2.25 ve σ =1.5 olmaktadır. Öte yandan = 0.05 olduğuna göre kritik z değeri;
z(1- /2)= z(1-0.05/2)= z(0.475)= 1.96 olarak bulunur.
Örneğimizin standart değeri

( ) ( . )
z= = .
= - 2.33

Sonuç: 2.33 > l.96 olduğundan H0 hipotezi reddedilir. Veya populasyon ortalaması (µ) 55 olarak kabul
edilemez.
Şimdi, populasyon ortalaması 55'den küçük müdür ? şeklinde sorulan sorunun yanıtını arayalım. Bu tek-yönlü
bir testi gerektirir. Önemlilik seviyesi yine α = 0.05 olsun. Hipotezler:
H0 : µ=55 ve H1: µ<55
Kritik Z değeri -z(1-2/2 )= z(0.45)= -l.645 dir.
Sonuç: -2.33<-l.645 olduğundan H0 reddedilir. Populasyon ortalaması 55'den küçüktür.

6.7.2.Büyük Örnekler Olduğunda Sınırlı Varyanslı Herhangi Bir Dağılış


Populasyon varyansının bilinmediği büyük örneklerde σ 'ın en yakın tahmini

S = S 2/n
olur. Merkezi limit teoremine dayanarak, H0 hipotezinin geçerli olduğu durumda,

( )
z=

oranları da yine N(0.1) dağılışı izler. Yani x 'ın standart değeri yine z dir ve hipotez kontrolünde standart
normal test dağılışı kullanılabilir.

İki ve tek yönlü testlerde izlenecek yollar, bir önceki konuda olduğu gibidir.

ÖRNEK: Rasgele seçilmiş 85 mısır bitkisinde ortalama koçan uzunluğu 37.5 cm ve varyans ise 11.5 olarak
bulunmuştur. Mısır populasyonunun ortalama koçan uzunluğunun (µ=40 cm olduğu düşünülebilir mi?  =
0.01 olsun.
H0 : µ= 40 ve H1: µ 40
S = S2/n= 11.5/85= 0.135 ve S = 0.367
Örneğin standart değeri veya test istatistiği;
z = (x - µ)/ S = (37.5-40)/0.367= - 6.81
EK TABLO 1'den kritik z değeri:
z(1- /2)= z(0.495)= 2.575
Sonuç: |6.81| > 2.575 olduğundan H0 reddedilir. Veya µ40 olduğu ortaya çıkar.

6.7.3.Bilinmeyen Varyanslı Normal Dağılış "Küçük Örnekler"


Bu özel durumda da populasyon varyans bilinmediğinden Sx değeri, yine örneğin varyansından belirlenir. Yani
S = S 2/n
dir. Ancak (x -µ0)/ S oranı bu kez (n-1) SD'li t dağılışı izlediğinden x 'ın standart değeri t dir ve hipotez
kontrolünde t-test dağılışı kullanılır.
Hipotez iki-yönlü kontrol ediliyorsa (H1:µµ0) kritik t değeri t(n-1) () olup, EK TABLO 3'den bulunur. Eğer
t>t (n-1) () ise H0 reddedilir.
t < t(n-1) () ise H0 kabul edilir.
H0 :µ>µ0 tek-yönlü hipotez kontrolünde önemlilik seviyesindeki kritik t değeri
t(n-1)(2 ) olmaktadır.
Eğer t>t(n-l)(2 ) ise H0 reddedilir
t<t(n-l)(2  ) ise H0 kabul edilir.
H0 : µ<µ0 hipotez kontrolünde ise
t>-t(n-l) (2  ) ise H0 kabul edilir.
t<-t(n-l)(2 ) ise H0 reddedilir.

ÖRNEK:Bir A insektisitinin 1 kg'ında 125 gr aktif madde bulunması yönetmelik gereğidir. Bu ilacı üreten bir
firmadan alınan 16 kutuluk bir örnekte ortalama aktif madde miktarı 118 g/kg ve varyans da 48.5 olarak
bulunmuştur. Söz konusu fabrikanın üretimi yönetmeliğe uygun mudur? =0.05 olarak alınsın. Fabrikanın aktif
madde miktarı µ ise hipotezler şöyle oluşturulur.
H0: µ= 125 ve H1: µ 125

.
S = = = 1.74 g/kg SD = n -1 = 16-1 = 15

t= (x -µ0)/ S = (118-125)/1.74= - 4.02


Kritik t değeri, EK TABLO 3'den
t (n-l) ()= t l5(0.05)= 2.131
Sonuç: |4.02| > 2.l3l olduğundan H0 reddedilir. Yani firmanın ürettiği ilaçlarda aktif madde miktarı
yönetmeliğe uymamaktadır.
Şimdi, belirtilen bu fabrikada üretilen ilacın aktif madde miktarının yönetmelikte belirtilen miktardan düşük
olup olmadığına ait hipotezleri yazarak yine 0.05 seviyesinde kontrol edelim.
H0 : µ= 125 ve H1: µ<125
Kritik t değeri
t(n-1) (2 )= tl5(0.10)= 1.753
Sonuç: -4.02 < -1.753 olduğundan H0 reddedilir. Veya µ< 125 olduğu gerçeği ortaya çıkar.

6.8.İKİ POPULASYON ORTALAMASI ARASINDAKİ FARKLlLlKLA İLGİLİ


HİPOTEZ KONTROLLERİ
İki populasyon ortalaması arasındaki farklılıkların (µ1-µ2) kontrolü ile ilgili hipotez testlerinde her iki
populasyondan alınan birer örneğin ortalamasının farklılığı (x - x2 ) ve bu farklılığın gösterdiği örnekleme
dağılışının varyans kullanılır.
Burada da, tıpkı 8.4.2'de olduğu gibi 4 farklı durum ele alınarak kontrollerin nasıl ve hangi test dağılışı
kullanılarak yapılacağı açıklanacaktır. Ayrıca "eş yapma" nın hipotez kontrolüde ele alınacaktır.
6.8.l.Varyansları Bilinen Normal Dağılışlar
Birinci örneğin çekildiği populasyonda gözlemler N(µ1,12) ve ikinci örneğin çekildiği populasyonda
gözlemler N(µ2, 22) normal dağılışları izlemektedir. Ayrıca 12 ve 22 bilinmektedir. Bu özel durumda
(x − x ) farklılığının örnekleme dağılışının varyansı;

σ( ) = +

şeklinde tanımlanır. Populasyon ortalamaları arası farklılığa ait hipotezler ise şu şekilde kurulur:
H0 : (µ1-µ2)= µ0
H1: (µ1-µ2)= µ0; (µ1 -µ2) > µ0 ve (µ1 -µ2) < µ0

Hipotezlerdeki µ0 değeri çoğunlukla Sıfır olarak alınır. Öte yandan

( ) (µ µ )
z=
( )

oranı standart normal dağılış izlediğinden (x − x ) farklılığının standart değeri z 'dir. O nedenle hipotez
kontrolü z-standart Normal Dağılışı kullanılarak yapılır. Yani iki-yönlü kontrol için kritik z değeri z(1-/2) ve
tek-yönlü kontroller için ise z(1-2/2) dır. İzlenen yol 9.7.1’de olduğu gibidir.

6.8.2.n1 ve n2 Büyük Olduğu Zaman Sınırlı Varyanslı İki Herhangi Dağılış


Bu özel durumda 12 ve 22 değerleri bilinmemekte ve bunlar yerine örneklerin S12 ve S22 varyansları
kullanılmaktadır. O nedenle (x − x ) farklılığının varyansı;

S( ) = +

olur. Büyük örneklerde farklılıklarının ortalaması µ1 -µ2 ve varyans S( ) olan takribi bir normal dağılış
izlediği kabul edilir. O nedenle
( ) (µ µ )
z=
( )
oranı da takribi olarak standart normal dağılış izler. Böylece hipotez kontrolü 9.8.1'de olduğu gibi yapılır.

ÖRNEK: 85 adet Karaman koyunu kuzusunda 6 ay sonra kazanılan ortalama canlı ağırlık 28 kg ve varyans 3.5
dur. 50 ivesi kuzusunun aynı sürede kazandığı ağırlık 22 kg ve varyans 4.5 olmuştur.
Her iki koyun ırkının 6 ay sonra aldığı ağırlıklar eşit kabul edilebilir mi? = 0.05 olsun.

. .
S( )= + = + = 0.131 S( ) = 0.362 kg

Karaman koyunu ırkında 6 ay sonraki canlı ağırlık µ1 ve İvesi ırkında µ2 ise

H0 : µ1 -µ2= 0 ve H1: µ1 -µ2 0

( ) (µ µ ) ( )
z= = = + 16.57
( ) .

Kritik z değeri z= 1.96 dır.


Sonuç: 16.57 > 1.96 olduğundan H0 reddedilir. Yani ağırlıkları aynı değildir. Karaman ırkının 6 ay sonraki
canlı ağırlık artışı daha fazladır. Ortalamalar arası farklılığın % 95 güven aralığı

5.29 < (µ1-µ2) < 6.71

kg olup, görüldüğü gibi bu aralıkta sıfır yoktur.

6.8.3.Varyansları Aynı Fakat Bilinmeyen Normal Dağılışlı İki Populasyon


Bu özel konum da populasyonlar N(µ1, 2) ve N(µ2, 2) şeklinde olan iki normal populasyondur. Ancak 2
bilinmemektedir. Eğer örnekler büyükse 9.8.2'de tanımlanan yol izlenir. Burada küçük örnekler üzerinde
durulacaktır. Küçük örneklerde, (x − x ) farklılığı ortalaması (µ1-µ2) ve varyans S( )= S2(n1+n2)/ n1.n2
olan normal dağılış izlemesine karşılık,

( ) (µ µ )
t=
( )

oranı serbestlik derecesi n1+n2-2 olan t dağılışı izlemekteydi. O nedenle (x − x ) istatistiğinin standart değeri
veya test istatistiği t dir. Böylece iki-yönlü hipotez kontrollerinde kritik t değeri;
t(n1+ n2-2) ()
ve tek-yönlü testlerde ise
t(n1- n2-2) (2 )

olmaktadır. Kontrolün sonuçlandırılmasında 9.7.3'de belirtilen yol izlenir.

ÖRNEK: A yemi verilen 11 hayvanda günlük ortalama canlı ağırlık artışı 97 gr ve varyans 847.2 dir. Fakat B
yemi alan yine 11 hayvanda günlük ortalama artış 57 gr ve varyans 774.8 dir.
Her iki yemin verdiği canlı ağırlık artışları aynı mıdır?  = 0.01 olsun.
A yemi için günlük artış µ1 ve B yemi için µ2 ise hipotezler şöyle kurulur.
H0 : µ1-µ2= 0 ve H1: µ1-µ20
Öte yandan
x12=( n1-1)S12=10x847.2= 8472
x22=( n2-1)S22=10x774.8= 7748

∑ ∑
S2 = = = 811 ve SD= 20 dir.

O halde;

( )
S( )= = = 147.5

S( ) = 12.14 gr. olur. Buna göre;

( ) (µ µ ) ( )
t= =
.
= + 3.29
( )

Red -2.845 0 +2.845 Red

3.29
Kritik t değerinin, t20 (0.01)= 2.845, olduğu EK TABLO 3'den görülebilir.
Sonuç: 3.29 > 2.845 olduğundan H0 reddedilir. A yemi ve B yeminin sağladıkları günlük canlı ağırlık artışları
aynı değildir. Şüphesiz A yemi daha yüksek canlı ağırlık artışı sağlamıştır.

6.8.4.Eşit Olmayan ve Bilinmeyen Varyanslı İki Normal Dağılışlı Populasyon


Söz konusu durumda, 1222 olup bilinmemekte ve örnekler küçüktür. Eğer 12 ve 22 çok farklı değilse ve
n1=n2 ise takribi olarak 9.8.3'de açıklanan yol izlenebilir. Ancak serbestlik .derecesi=(n-1) alınır. O nedenle
burada n1n2 durumu ele alınacaktır.
Örnekleme dağılışının varyansı;

S( ) = +

dir. Ancak

( ) (µ µ )
t=
( )

oranı Fisher'in yaklaşımı ile n +n - 2 serbestlik dereceli değilde v serbestlik dereceli bir t dağılışı izler. v' nin
değeri aşağıdaki eşitlikle hesaplanır.

/ /
= ( )2 + ( )2

Buna göre kritik t değerleri


tv ( ) veya tv (2 )
şeklinde yine EK TABLO 3'den bulanabilir.

ÖRNEK: Bir kimyasal maddenin,bir çözeltideki konsantrasyonu hızlı ve standart metod olmak üzere iki
metodla analiz edilmektedir. Standart metod 4, hızlı metod ise 8 örnekte uygulanmış ve kimyasal maddenin
1 litredeki mg olarak konsantrasyonları aşağıda verilmiştir.
Standart Metod: 25 24 25 26
Hızlı Metod : 23 18 22 28 17 25 19 16
Yeni geliştirilen hızlı metod, standart metodun yerini alabilecek midir? = 0.05 olsun. Standart metodla tayin
edilen konsantrasyon µ1 ve hızlı metodla tayin edilen µ2 olsun. O halde;
H0 : µ1-µ2=0 ve H1: µ1-µ2 0
Yukarıdaki örneklere ait varyantlardan;

x = 25 mg/lt; S12= 0.67; vı=n1-1=3; S12/n1=0.17 ve

x = 21 mg/lt; S22= 17.71; v2= n2-1=7; S22/n2= 2.21 olduğu hesaplanabilir. Örneklerin varyansları,

çekildikleri populasyonun varyanslarının çok farklı olduğunu ima etmektedir. (x − x ) farklılığının


dağılışının varyansı;

S( ) = + = 0.17 + 2.21 = 2.38 ve

S( ) = 1.54 mg/lt olarak bulunur.

O halde;

( ) (µ µ ) ( )
t= = = + 2.60
( ) .

Dağılışın serbestlik derecesi, v, ise

/ /
= ( )2 + ( )2

. .
= ( )2 + ( )2 = 0.125
. .

v = 8 olmaktadır.
Buna göre; t kritik değeri t8 (0.05)= 2.306 dır (EK TABLO 3).
Sonuç:2.60>2.306 olduğundan H0 reddedilmektedir. % 5 düzeyinde farklılık önemlidir. Hızlı metod standart
metodun yerini alamaz. Zira kimyasal maddenin konsantrasyonunu daha düşük bir düzeyde ölçmektedir.
Tek-yönlü testlerde kritik t değeri tv(2) olarak yine aynı tablodan bulunur.

6.9.BİNOMİAL ORANLARLA İLGİLİ HİPOTEZ KONTROLLERİ


Daha önce, n denemede X başarı sayılarının (n,p) binomial dağılışını izlediği belirtilmişti (8.4.3). Öte yandan
çok sayıda denemelerden bulunan p değerleri, ortalaması p ve varyans 2P= p q/n olan örnekleme dağılışı
gösteriyordu. n değeri yeterince büyükse söz konusu örnekleme dağılışı Merkezi limit Teoremine göre normal
olur. Yani p N(p, p q/n). O nedenle

z=

oranları da standart normal dağılış izler. Böylelikle p'nın test istatistiğinin z olduğu görülebilir. Bu durum bize:
H0 : p=p0 ve H1: p p0; H1:p> p0 veya H1:p< p0
hipotezlerinin z-Test Dağılışı ile kontrol edilmesi olanağını sağlar. Şüphesiz karar vermede örnekten bulunan z
değeri ve kritik z değerleri, daha önce belirtildiği şekilde (9.7.l) karşılaştırılır.
Fakat p parametresi verilmiyorsa 2p'nın örnekten tahmini kullanılabilir.

S = pq/n
Büyük örneklerde

z=

oranı da, yaklaşık olarak standart normal dağılış izler ve hipotez kontrollerinde yine z-test dağılışı benzer
şekilde kullanılabilir.

ÖRNEK-1:Bir ilacın belirli bir hastalığı iyileştirme oranının 0.80 olması gerektiği belirtilmektedir. Bir firma
tarafından üretilen aynı tip ilacın 180 hastanın l30'unu iyileştirdiği saptanmıştır. Söz konusu firmaya ait ilacın
iyileştirme oranı belirtilen
% 80'den düşük müdür? = 0.05 olsun. Örnekte n=180 dir.
Firmanın ilacının iyileştirme oranı p ise hipotezler şöyle kurulur:
H0 : p=0.80 H1: p<0.80
Öte yandan;

130
P = 180 = 0.72

. .
σ = = = 0.00089
σ = 0.03’ dür.

. .
z= = = - 2.67
.

Red -1.645 0

-2.67

Kritik z değeri z (0.4500)= 1.645 dir.


Sonuç: -2.67 < -1.645 olduğundan H0 reddedilir. Firmaya ait ilacın iyileştirme oranı 0.80'den düşüktür.

ÖRNEK 2: Bir pamuk çeşitinden alınan 300 tohumdan 280'ının çimlendiği gözlenmiştir. Çimlenme oranının %
90 olduğu düşünülebilir mi? % 1 düzeyinde, hipotezi kurarak, siz test ediniz.

6.10.İKİ BİNOMİAL ORANIN FARKLILIĞI İLE İLGİLİ HİPOTEZ KONTROLLERİ


İki binomial populasyon B (n1,p1) ve B(n2,p2) şeklinde tanımlanırsa bunların başarı olasılıklarıyla ilgili (p1,p2)
aşağıdaki hipotezler de yine standart normal dağılışla kontrol edilebilir.
H0 : p1-p2= p0
H1: p1- p2 p0; H1: p1- p2> p0 veya p1- p2< p0
Daha öncede açıklandığı gibi (8.4.4.) bu populasyonlardan alınan örneklerden bulunmuş (p1-p2) farklılıkları,
büyük örneklerde ortalaması p1- p2 ve varyansı;

2 p1 * q1 p2 * q2
^ ^
= n 
( p1p2)
1 n2

olan normal dağılış ve

( ) ( )
z=
( )
oranı z  N(0,1) dağılışı izlemekteydi. O nedenle (p − p ) farklılığının test istatistiği z dir ve hipotezler z-
Test Dağılışı ile bilinen şekilde kontrol edilebilir. Populasyonların başarı oranları bilinmiyorsa, ki çoğunlukla
bilinmez, dağılışın varyans örneklerden tahminlenir:

p1 * q1 p2 * q2
𝑆( ) = 
n1 n2

Şüphesiz büyük örneklerde yukarıda belirtilen oranın paydasına bunun yazılması, yine yaklaşık olarak N (0.1)
dağılışı izler.

ÖRNEK: Bir elma çeşitinde (A) 200 elmanın 80'ninde, ikinci bir çeşitte (B) 180 elmanın 120'sinde elma iç
kurdu görülmüştür. A ve B çeşitlerinin kurtlu meyve oranları aynı mıdır?% 5 önemlilik seviyesinde kontrol
edelim.
A çeşitinde kurtlu meyve oranı p1 ve B çeşitinde p2 ise
H0:p1- p2 =0 ve H1: p1- p2=0 (Burada p0=0)
şeklinde yazılabilir.

p = 80/200= 0.40 ve p = 120/180 = 0.67


n1= 200 ve n2= 180

. . . .
𝑆( )= + = 0.0024

𝑆( )= 0.049 olur.

( . . )
z= = 5.51
.

Sonuç: 5.51 > 1.96 olduğundan iki çeşitin kurtlu meyve oranlarının aynı olduğu söylenemez.

6.11.KORRELASYON KATSAYISI İLE İLGİLİ HİPOTEZ KONTROLLERİ


6.11.1.Önemlilik Kontrolü (=0 Olma Durumu)
Populasyon düzeyinde X ve Y değişkenleri arasındaki korrelasyon katsayısı ile ilgili
H0: =0 (korrelasyon önemsizdir)
H1: 0 (korrelasyon önemlidir)
şeklinde yapılan hipotez kontrollerine önemlilik kontrolü denir. Belirtilen bu hipotezler t-test dağılışı ile kontrol
edilirler. Zira =0 olan populasyonlardan alınmış örneklerin r değerlerinin;

t=

oranları (n-2) serbestlik dereceli bir t dağılışı izliyordu (8.4.5). Yani r' nin test istatistiği t dir ve serbestlik
derecesi (n-2) dir. Kritik t değerleri ise iki-yönlü testler için t(n-2) () ve tek yönlü testler için t(n-2)(2 )
olmaktadır. Şüphesiz t ve kritik t değerleri (9.7.3)'de olduğu gibi karşılaştırılarak kontrol sonuçlandırılır.

ÖRNEK:16 soya bitkisinde yan dal sayısı ile bitki başına tane verimi arasında korrelasyon katsayısı r=+0.443
olarak bulunmuştur. Bu iki değişken arasındaki korrelasyon önemli midir? % 5 düzeyinde kontrol edelim.
H0 : =0 H1: =0

( . )
S = = = 0.0574 ve S = 0.24 SD = n - 2 = 14

.
t= = = + 1.80
.

Kritik t değeri tl4(0.05)= 2.145 olarak EK TABLO 3'den bulunur.


Sonuç: 1.80<2.145 olduğundan H0 kabul edilir. İki değişken arasındaki korrelasyon önemsizdir.

6.l2.İKİ KORRELASYON KATSAYISININ FARKLlLlĞI İLE İLGİLİ HİPOTEZ KONTROLLERİ


İki populasyonun aynı X ve Y değişkenlerine ait korrelasyon katsayıları 1 ve 2 ise bunların
farklılıkları ile (1 - 2) ilgili hipotez kontrollerinde yine z yaklaşımı kullanılır.
H0: 1 - 2= 0 H1: 1 - 20; 1 - 2>0 ve 1 - 2 <0 hipotezlerinin kontrollerinde 1 - 2 farklılığının (r1-
r2) tahminleri kullanılamaz. Zira (r1 -r2) farklılıkları normal bir örnekleme dağılışı izlemezler.
Eğer 1 ve 2'nin z cinsinden değerleri µz1 ve µz2 ise hipotezler de z cinsinden tanımlanır:
H0:µz1-µz=µz0; H1 : µz1-µz=µz0; µz1-µz >µz0 gibi.
Öte yandan r1-r2 farklılığının z cinsinden tanımı z1-z2 ise yukarıdaki hipotezler (z1-z2) örnekleme dağılışı ile
kontrol edilebillr. Nitekim

( ) (µ µ )
t=
( )
oranı n1+n2-6 serbestlik dereceli bir t dağılışı gösterir (8.4.6.'da belirtildiği gibi). Burada (z1-z2) farklılığının test
istatistiği t dir. O halde kontrol t-test dağılışı ile yapılır. Kritik t değerleri; t(nı+n2-6) ( ) veya t(n1+n2-6) (2 ) dır.

ÖRNEK:Bir çiftlikte yetiştirilen montafon sığırlarından 28'inde 3 ve 6 aylık ağırlıklar arasındaki korrelasyon
katsayısı r=+0.503 olarak bulunmuştur. Bir ikinci çiftllkte 39 hayvanda saptanan aynı değişkenler arasındaki
korrelasyon katsayısı r=+0.400 olmuştur. Her iki çiftlikte 3 ve 6 aylık canlı ağırlıklar arasındaki korrelasyon
katsayısı aynı kabul edilebilir mi? % 5 önemlilik seviyesinde kontrol edelim. Birinci çiftlik için 1 ve ikinci için
 2 ise

H0: 1-2=0 (veya µz1-µz=0)


H1: 1-20 (veya µz1-µz=0)
rı=+0.503 için z1=+0.549 ve r2=+0.400 için z2=+0.424 ve

S2(Z1-Z2) = + = + = 0.068

S( ) = 0.260 dır.

O halde;
( ) (µ µ ) ( . . )
t= = = 0.481
( ) .

Kritik t değeri t 6l(0.05)= 2.000 dır.


Sonuç 0.481 < 2.000 olduğundan H0 kabul edilir. Her iki çiftllğin 3 ve 6 aylık ağırlıkları arasındaki korrelasyon
katsayıları aynıdır. Korrelasyon çiftlikten çiftliğe değişmemektedir.

6.l3.REGRESYON KATSAYISI VE İKİ REGRESYON KATSAYISI ARASINDAKİ


FARKLlLlKLA İLGİLİ HİPOTEZ KONTROLLERİ

6.l3.l.Regresyon Katsayısı İle İlgill Hipotez Kontrolleri


Populasyonların regresyon katsayıları ile ilgili
H0 :  =0
H1:   0; H1:  >0 ve H1:  <0
hipotezleri,  'nın tahmini olan b değerlerinin örnekleme dağılışı ile kontrol edilebillr. nitekim daha öncede
görüldüğü gibi (8.4.7) b değerleri ortalaması  ve varyansı
S2b= S2D/ 2
olan normal dağılış izlemekteydi. Buna göre;

t=

oranı (n-2) serbestlik dereceli t dağılışı izler. O halde hipotez kontrolünde t-Test dağılışı kullanılır. Kritik t
değerleri iki-yönlü testler için t(n-2)() tek-yönlü testler için ise t(n-2)(2 ) dır.

ÖRNEK: 9 toprak örneğinde tuz konsantrasyonunun (%), elektiriği geçirgenlik (mmhos) üzerine olan
regresyon katsayısı b=+0.49 olarak bulunmuştu. Yine, bulunan b değerinin 7 serbestlik dereceli standart hatası
Sb= 0.031 ve bu standart hata için SD = 7 idi.
Tuz konsantrasyonunun elektiriği geçirgenllk üzerine olan regresyon katsayısı önemlimidir? 0.05 düzeyinde
kontrol edelim. Söz konusu regresyon katsayısı  ile gösterilirse
H0 :  =0 (önemsizdir)
H0 :  0 (önemlidir)

.
t= = = = +15.81
.

Kritik t değeri t7 (0.05)= 2.365 (EK TABLO 3).


Sonuç: 15.81 > 2.365 olduğundan H0 reddedilir. 0 veya 0.05 düzeyinde istatistiki olarak önemlidir.

 değerinin 1'e eşit olup olmadığı ve 1'den küçük olup olmadığı hipotezlerini kurarak 0.05 düzeyinde sizler
kontrol ediniz.

6.l3.2.İki Regresyon Katsayısının Farklılığı İle İlgill Hipotez Kontrolleri


Aynı X (bağımsız) ve Y (bağımlı) değişkenlerinin farklı iki populasyonlardaki regresyon katsayıları 1 ve 2 ise
bunlarla ilgili
H0 : 1-2 = 0
H1: 1-2 =0; 1-2 > ve 1-2 <0 hipotezleri de yine t dağılışı ile kontrol edilir. Nitekim (b1-b2)
farklılıklarının örnekleme dağılışının ortalaması 1-2 ve varyans ise S2(bı-b2) olup, dağılış tipi normaldir. O
nedenle;
( ) (  ) ( ) 0
t= =
( ) ( )

oranı n1+n2-4 serbestlik dereceli t dağılışı izlemektedir. Kritik t değerleri t (n1+n2-4) ( ) veya t(n1+n2-4)(2) dır.
ÖRNEK: Bir tarlada yakalanan 8 lahana kelebeğinde vücut ağırlığı (X) ve kanat açıklığı (Y) değerleri şöyle
bulunmuştur.

X (gr) : 1.0 1.2 1.3 1.5 1.6 1.8 1.6 2.0


Y (mm) :10.0 12.0 12.3 15.0 15.6 17.8 15.3 18.0

İkinci bir tarlada bu kez 7 lahana kelebeğinde gözlenen aynı değişkenlerin değerleri ise aşağıda
verilmiştir.

X (gr) : 1.1 1.2 1.4 1.6 1.9 1.4 1.9


Y (mm): 12.0 12.0 13.4 14.5 16.0 16.4 19.0

Gözlemlerin yapıldığı her iki tarlada kanat açıklığının vücut ağırlığı üzerine olan regresyon
katsayılarının aynı olduğu söylenebilir mi? 0.05 düzeyinde kontrol edelim.
Birinci tarla verilerinden
y12= 56.58; x12= 0.74; x1 y1= 6.37 ; n1=8
ve b1=+8.61mm olduğu hesaplanır. Yine regresyondan sapmaların varyansının S2Dı= 0.2911 ve b1'ın
varyansının S2b1= S2D1 / x12= 0.2911/ 0.74= 0.393 olduğu görülür.
İkinci tarlada yapılan gözlemler için aynı değerler ise şöyledir:

y22= 39.36; x22 = 0.60; x2 y2 = 4.07 ; n2=7


b2=+6.78 mm; S2D2= 2.35 ve S2b2= 3.92

Birinci tarlada ilgili regresyon katsayısı 1 ve ikinci tarlada 2 ise uygun hipotezler şöyle kurulur.
H0 : 1-2=0 ve H1: 1-20

(b1-b2) farklılığının standart hatası

S(b1-b2) = 𝑆 + 𝑆 = √ 0.393 + 3.92 = 2,077 dir.

( ) 0 ( . . )
t= = = +0.881 SD = n1+n2 – 4 = 8+7 - 4 = 11 dir.
( ) .
Kritik t değeri t11 (0.05)= 2.201 dir.
Sonuç: 0.881 < 2.201 olduğundan H0 hipotezi kabul edilir. Her iki tarlanın regresyon katsayıları aynıdır. 8.61-
6.78=1.83 mm llk farklılık tesadüflükten kaynaklanmıştır.

6.14.VARYANSLARLA İLGİLİ HİPOTEZ KONTROLLERİ


Varyans, varyantların kendi ortalaması etrafında dağılışının standart bir ölçüsü olduğundan, varyanslarla
ilgili hipotez kontrolleri daha ziyade farklı populasyonların veya dağılımların, dağılış durumlarını
karşılaştırmak için kullanılır. Ancak mevcut çoğu kontrol metodları, değerlerin normal bir dağılış gösterdiğ
ivarsayımına dayanır. O nedenle, daha önce ele alınan ortalama değerlere ait testlerden farklı olarak,
varyanslarla ilgili hipotez kontrolleri normalden sapmaya karşı pek güçlü testler değillerdir.
Varyanslarla ilgili farklı üç tip hipotez kontrolü ele alınacaktır.
l.Tek bir varyansla ilgili hipotez kontrolü: Tek bir dağılışın varyansının verilen bir hipotetik değerle
karşılaştırılması.
2.İki farklı dağılışın varyanslarının eşit olup olmadığının kontrolü; İki varyansın karşılaştırılması
3.Çok sayıda varyansların eşitlik kontrolü; çok sayıda varyansın karşılaştırılması.

Verilecek kontrol yöntemlerinin geçerli olması değerlerin normal dağılış göstermesine bağlı
olduğundan, burada verilerin normal dağılış gösterdiği varsayılacaktır.

6.l4.l.Tek Bir Varyansla İlgill Hipotez Kontrolü

X1, X2,......Xn varyantları bağımsız fakat aynı N(  ,2 ) normal dağılışa sahip olduğu durumda


2 = =

oranının v serbestlik dereceli (v = n - l) bir khi-kare dağılışı izlediğini daha önce görmüştük (7.2.3). O
nedenle  x2 veya vS2 'nin test istatistiği  serbestlik dereceli bir 2 değeridir. Bu durum bize, örneğin
çekildiği populasyonun varyansının (2) herhangi bir hipotetik değere, örneğin 02 değerine, eşit olup
olmadığının kontrol edelmesi olanağını sağlar.
Hipotetik değerin 02 olduğunu kabul edersek iki ve tek-yönlü kontrollere ait hipotezler aşağıda olduğu gibi
yazılabilir.
H0 : 2 = 02
H1 : 2  02; H1: 2 >02 ; H1: 2 < 02
Şüphesiz H0, geçerli olduğu durumda;

2 =

oranı da  serbestlik dereceli bir khi-kare dağılışı izleyecektir.


Eğer önemlilik seviyesi ve sıfır hipotezi iki-yönlü kontrol ediliyorsa (H1:2  20) bu takdirde kritik
khi-kare değerleri;
2v (1- /2) ve 2v ( /2)
olacaktır. Bu durumda eğer
2 < 2v (l-  /2) ve 2 > 2v (  /2)
ise H0 hipotezi reddedilecektir. Aksi durumda H0 hipotezi kabul edilecektir.

ÖRNEK l: 20 adet kobayın vücut ağırlıklarının varyans 1225 olarak bulunmuştur. Hayvanların alındığı
populasyonun vücut ağırlıkları varyansının 676 olduğu söylenebillrmi? 0.05 olasılık düzeyinde test edelim.
Populasyonun varyans 2 ile gösterilirse hipotezler,

H0 : 2 = 676
H1: 2  676

şeklinde kurulabilir. Öte yandan =n-1=19 olduğundan örneğin test istatistiği

2 = = = 34.43

Kritik değerler, EK TABLO 4'den bulunur.

219 (0.975)= 8.9l ve 2 19 (0.025)= 32.85

Sonuç: 34.43 > 32.85 olduğundan H0 hipotezi reddedilecektir. 34.43 değeri red alanına düşmüştür. Populasyon
varyansının 676 olması söz konusu değildir.
Populasyon varyansının, hipotetik değerden büyük olduğuna dair (H1:2 > 02) hipotez kontrolünde ise
kritik khi-kare değeri 2v() olmaktadır. Eğer
2 > 2v () ise H0 reddedilir ve aksi durumda H0 kabul edilir.
% 2.5

% 95
% 2.5
Populasyona girme alanı

8.91 32.85 34.43

19 SD’li Khi-Kare-dağılışı

ÖRNEK 2: Yukarıdaki kobay örneğinde populasyonun varyansının 676 dan büyük olduğu söylenebilir mi?
Yine 0.05 önemlilik seviyesinde kontrol edelim.
H0 : 2 = 676
H1 : 2 >676

2 = = = 34.43

Kritik khi-kare değeri 219(0.05)=30.l4 dür. 34.43>30.l4 olduğundan H0 reddedilecektir. Populasyonun


varyansı 676 dan büyük bir değerdir.
Öte yandan H1: 2<02 'yi içeren tek-yönlü kontrollerde ise kritik khi-kare değeri 2 >2v (1- ) dır. O
nedenle:
2 > 2v (1-  ) ise H0 kabul edilir.
2 < 2v (1-  ) ise H0 reddedilir.
% 95
Populasyona girme alanı
%5

30.14 34.43

19 SD’li Khi-Kare-dağılışı

6.l4.2.İki Dağılışın Varyansları ile İlgill Hipotez Kontrolü


İki grup gözlemden, birincisinin varyantları X11, X12,....X1n1 ve bunlar bağımsız, fakat aynı, N(1,12)
normal dağılışını izlesinler. İkinci grubun gözlemleri de, X21, X22.....X2n2, N( 2, 22) normal dağılışını
izlesinler ve ayrıca birinci grubun varyans S12 ve ikincisinin varyans ise S22 olsun.
Söz konusu örneklerin alındığı populasyonların varyanslarının (12 ve 22) eşit olup olmadığına ait sıfır
hipotezi ve karşıt hipotezleri şöyledir.:
H1: 12= 22 (Her iki populasyonun varyans birbirine eşittir).
H1: 12  22; H1: 12> 12 veya H1: 12 < 22
Bu tip hipotezler, daha öncede belirtildiği gibi, F-test dağılışı ile kontrol edilir (7.2.4.) Varyansları aynı
olan (2 ) iki populasyondan alınmış örneklerin varyanslarının

/
F= =
/

oranları f1 ve f2 serbestlik dereceli bir F dağılışı izliyordu. O nedenle oranın test istatistiği F olmaktadır. Çeşitli
f1 ve f2 serbestlik derecelerinde ve yalnız % 5 ve % l düzeylerindeki kritik değerler EK TABLO 5'de verilmiştir.
Söz konusu tablodaki değerler, dağılışın yalnız sağ tarafındaki % 95 ve % 5 veya % 99 ve % 1'lik kabul-red
alanlarını ayıran kritik değerler olduğundan ve l'den daha büyük F kritik değerleri verildiğinden;
1-EK TABLO 5 kullanılarak ancak H1: 12 > 22 hipotezi kontrol edilebilir. H1: 2 1  22 ve H1: 21
< 22 hipotez kontrolleri için yeni tablı değerlerine ihtiyaç vardır.
2-Örneklerin varyans oranları hesaplanırken büyük varyans paya ve küçük varyans ise paydaya yazılır.
3-Hipotez kontrolleri yalnız 0.05 veya 0.01 seviyelerinde yapılabilir ki bu iki olasılık çoğu araştırmalar
için yeterlidir.
Yukarıda belirtilen noktaların ışığı altında, büyük varyans S12, serbestlik derecesi f1; küçük varyans S22
ve serbestlik derecesi f2 ise önemlilik seviyesinde kritik F değeri EK TABLO 5'de

Ffı,f2 ()

olarak bulunur. Eğer F > Ff1,f2 ( ) ise H0 hipotezi reddellllr. Aksi durumda H0 hipotezi kabul edilir.

ÖRNEK: 18 varyantlık bir örnekte varyans 28.56 ve 25 varyantlık bir başka örnekte varyans 36.86
bulunmuştur. Her iki örneğin çekildiği populasyonların varyanslarının eşit olduğu kabul edilebilir mi? 0.01
olasılık düzeyinde kontrol edelim.
İkinci örneğin varyansı daha büyük olduğundan bunu S12=36.86 olarak ele alalım ve f1=n1-l= 24 dür.
Buna göre
S22= 28.56 ve f2=n2-1= 17 dir.

H0 : 12= 22 H1 : 12 > 22 ve

.
F= = = 1.29
.

0.01 düzeyinde kritik F değeri, EK TABLO 5'den

F(24,17) (0.01)= 3.08

O halde; 1.29 < 3.08 olduğundan H0 kabul edilir, populasyonların varyansları eşittir.

Yukarıda belirtildiği şekilde iki populasyonun varyanslarının eşit olup olmadığı konusunda, H1: 12 > 22
tek-yönlü hipotez kontrolü yeterlidir. İki-yönlü ve dağılışın sol tarafı ile ilgili tek-yönlü testlere gerek yoktur. O
nedenle burada ele alınmayacaktır.
6.14.3.Mendel’in Açılma Oranlarına Uyum Kontrolü
ÖRNEK: İki mısır çeşiti melezlenmiş ve F2 generasyonunda incelenen 1308 bitkinin sap renklerine göre
dağılımı aşağıda olduğu gibi dört farklı sınıfta toplanmıştır. Buna göre sap rengi açısından 4 farklı fenotip sınıfı
oluşmuştur. Dihidrit bir açılmayı ima etmektedir. Örneğin; ebeveynler muhtemel AABB= yeşil-düz ve
aabb=altın-çizgilidir. Yeşil renk altına ve düz şekil çizgiliye baskındır. Bu ön bilgilere göre F2'de 9:3:3:l
oranında açılma olması beklenir.

Gözlenen Beklenen
Sap Rengi frek.(f) frek.(fı) f-fı (f-fı)2/fı

Yeşil-Düz 773 735.8 +37.2 1.88


Altın-Düz 231 245.2 -14.2 0.82
Yeşil-Çizgili 238 245.2 -7.2 0.21
Altın-Çizgili 66 81.8 -15.8 3.05

Toplam 1308 1308.0 0.0 5.96

sıfır hipotezi; "1308 bitkilik örnekte açılım 9:3:3:1 Mendel açılımına uyar" hipotezidir. sıfır hipotezi geçerli
olduğunda bir yeşil-düz bitki görülme olasılığı 9/16 dır. O halde örnekte birinci sınıfın beklenen bitki sayısı
1308x9/16= 735.8 dir. Diğer üç sınıfın beklenen frekansları sırası ile 3/16, 3/16 ve 1/16 olasılıklarıyla
hesaplanır. Beklenen frekanslar (fı), f-fı farklılıkları ve bunların Khi-kareye katkıları da aynı tablonun son
sütunlarında verilmiştir. Toplam Khi-kare;

2 = ∑ (𝐟 − 𝐟 )𝟐 /𝐟′

. . . .
2 = ( )2+( )2 + ( )2 + ( )2 = 5.96
. . . .

2 =5.96 olup SD=k-1=3 tür. Aynı serbestlik derecesinde 5.96'nın olasılığının (p) % 10'dan fazla olduğu
görülür. Öte yandan, 23(0.05) = 7.815 dir. Sonuçta, 5.96 < 7.815 olduğundan sıfır hipotezi kabul edilir.
Örnekteki sap renginin açılımı 9:3:3:1 oranına uyar. Mısırda sap renginin iki allelli iki lokus tarafından idare
edildiği söylenebilir.

ÖRNEK: Susamda açık kapsüllü ve beyaz taneli bir çeşit (AABB) ile kapalı kapsüllü ve sarı taneli bir
çeşit (aabb) arasında yapılan melezlemenin F2 açılma generasyonunda elde edilen bitkilerin, oluşan 4 fenotipe
göre sayısal olarak dağılımı şu şekilde gözlenmiştir.
Fenotip F2’de Bitki Sayısı(Adet)
Açık kapsüllü + Beyaz taneli : 2604
Açık kapsüllü + Sarı taneli : 876
Kapalı kapsüllü + Beyaz taneli : 847
Kapalı kapsüllü + Sarı taneli : 273

Not : Susamda açık kapsüllü olma dominant A geni ile ve beyaz taneli olma ise dominant B geni ile idare
edilmektedir. F2 generasyonunda dihibrit (9:3:3:1 açılımı) söz konusudur. Buna göre aşağıdaki soruları
yanıtlayınız.

Bu denemede F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılımına uygun mudur ? 0.01 olasılık düzeyinde test
ediniz.

Çözüm için hipotezler şu şekilde kurulur;

H0 = F2’ deki açılım dihibrit (9:3:3:1 açılımı)


H1 = F2’ deki açılım dihibrit (9:3:3:1 açılımı)
Fenotipler Gözlenen Frekans Teorik Frekans Beklenen Frekans
Açık Kapsüllü + Beyaz Taneli 2604 9 4600 X 9/16 = 2587.5
Açık Kapsüllü + Sarı Taneli 876 3 4600 X 3/16 = 862.5
Kapalı Kapsüllü+Beyaz Taneli 847 3 4600 X 3/16 = 862.5
Kapalı Kapsüllü + Sarı Taneli 273 1 4600 X 3/16 = 287.5
Toplam 4600 16 4600.0

Kapalı kapsüllü ve sarı taneli bitki görülme olasılığı (beklenen frekans) 4600 x 1/16 = 287.5

2 = ∑ (𝐟 − 𝐟 )𝟐 /𝐟′

. . . .
2 = ( )2+( )2 + ( )2 + ( )2 = 1.33 SD = k -1 = 4 -1 = 3
. . . .

SD = 3 de 2 (0.01) kritik değeri ; 2 3(0.01) = 11.345 dir. Buna göre, 1.33 < 11.345 olduğundan sıfır hipotezi
kabul edilir. F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılıma uymaktadır.

7.3.3. RxC Tabloları


Bireyler iki karaktere göre sınıflandırılıyor ve sıradaki karakterin seviye sayısı=R ve sütundaki karakterin
seviye sayısı=C ise oluşturulan iki yönlü tablolara RxC tablosu denir. Böyle bir tabloda RxC adet sınıf bulunur.
Bu tabloda da iki karakterin birbirine bağlı olup olmadığının testi yapılabilir.

ÖRNEK: Bir bölgede bulunan 5l7 adet tarım çiftliği üç toprak fertilitesine (R=3) ve üç farklı kullanım
şekline (C=3) göre 9 farklı sınıfa gruplandırılmış ve sonuçları aşağıda verilmiştir.

Toprak Arazi Kullanım Şekli


fertilitesi Kendisi Kiralık Karışık Toplam
Zayıf 36 67 49 152
Orta 31 60 49 140
Verimli 58 87 80 225
Toplam 125 214 178 517

Böyle bir sayı tablosunda çok çeşitli sorular sorulabilir. Örneğin; arazi kullanım şeklinin oransal miktarı
(Kiralık işletme oranı gibi) üç toprak fertilite tipinde de aynı mıdır? Veya toprak verimlilik seviyesinin dağılışı
üç arazi kullanım şeklinde de aynı mıdır? Her iki sorunun yanıtı da arazi kullanım şeklinin toprak verimlilik
seviyesine bağlı olup olmadığı ile verilebilir. O halde sıfır hipotezi (H0): Arazi kullanım şekli, toprak verimlilik
seviyesine bağlı değildir. Veya her iki karakter bağımsızdır.
Sıfır hipotezinin geçerli olduğu durumda her bir sınıfın beklenen sayıları fı=O sınıfın sıra toplamı x sütun
toplamı/genel toplam eşitliğiyle bulunabilir. Örneğin; "Kendisi" tarafından kullanılan üç toprak tipinin beklenen
frekansları sıra ile;

f1=152x125/517= 36.75
f4= 140x125/517= 33.85
f7= 225x125/517= 54.40
Toplam 125.00
Diğer beklenen frekanslar ve f-fı farklılıkları ise aşağıdaki tabloda topluca verilmiştir. Beklenen değerlerin de
sıra ve sütunlar üzerinden toplamları da aynıdır. Ayrıca sıralar ve sütünlar üzerinden f- fı toplamları sıfırdır.
Toprak A. K u l l a n ı m Ş e k l i
fertilitesi Frekans Kendisi Kiralık Karışık Toplam
f 36 67 49
Zayıf fı 36.75 62.92 52.33 152
f- fı -0.75 4.08 -3.33 0

f 31 60 49
Orta fı 33.95 57.95 48.20 140
f- fı -2.85 2.05 0.80 0

f 58 87 80
Verimli fı 54.40 93.13 77.47 225
f- fı 3.60 -6.13 2.53 5.7

Toplam 125 214 178 517

Örneğe ait Khi-kare değeri;

(-0.075)2 (2.53) 2
2 = ----------- + .......+ ---------= 1.54 dür.
36.75 77.47

SD=(R-1)(C-1)=2x2= 4 dür. p>% 80 olduğundan sıfır hipotezi kabul edilir. Arazi kullanım şekli, toprak
verimlilik seviyesine bağlı değildir, bu iki karakter bağımsızdır.
Sıfır hipotezi reddedildiği durumda, bağımsızlıktan ayrılışın nedenlerini detaylı olarak araştırmak gerekir.
Örneğin; Khi-kareye en fazla katkıda bulunan sınıfların incelenmesi çok önemlidir. İkinci olarak, bir sütunda
sıraların veya bir sırada sütunların seviyelerinin oransal değerleride hesaplanarak bunlardan anlamlı bilgiler
üretilir. Örneğin; sıra seviyelerinin oransal dağılışı iki sütunda aynı ise sadece bu iki sütunu içine alan bir Khi-
kare testi yapılabilir.
EK TABLO III

Z Cetveli

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
t-Cetveli
Önem düzeyi ()
sd 0.2 0.1 0.05 0.02 0.01 0.002 0.001
1 3.078 6.314 12.706 31.821 63.656 318.289 636.578
2 1.886 2.920 4.303 6.965 9.925 22.328 31.600
3 1.638 2.353 3.182 4.541 5.841 10.214 12.924
4 1.533 2.132 2.776 3.747 4.604 7.173 8.610
5 1.476 2.015 2.571 3.365 4.032 5.894 6.869
6 1.440 1.943 2.447 3.143 3.707 5.208 5.959
7 1.415 1.895 2.365 2.998 3.499 4.785 5.408
8 1.397 1.860 2.306 2.896 3.355 4.501 5.041
9 1.383 1.833 2.262 2.821 3.250 4.297 4.781
10 1.372 1.812 2.228 2.764 3.169 4.144 4.587
11 1.363 1.796 2.201 2.718 3.106 4.025 4.437
12 1.356 1.782 2.179 2.681 3.055 3.930 4.318
13 1.350 1.771 2.160 2.650 3.012 3.852 4.221
14 1.345 1.761 2.145 2.624 2.977 3.787 4.140
15 1.341 1.753 2.131 2.602 2.947 3.733 4.073
16 1.337 1.746 2.120 2.583 2.921 3.686 4.015
17 1.333 1.740 2.110 2.567 2.898 3.646 3.965
18 1.330 1.734 2.101 2.552 2.878 3.610 3.922
19 1.328 1.729 2.093 2.539 2.861 3.579 3.883
20 1.325 1.725 2.086 2.528 2.845 3.552 3.850
21 1.323 1.721 2.080 2.518 2.831 3.527 3.819
22 1.321 1.717 2.074 2.508 2.819 3.505 3.792
23 1.319 1.714 2.069 2.500 2.807 3.485 3.768
24 1.318 1.711 2.064 2.492 2.797 3.467 3.745
25 1.316 1.708 2.060 2.485 2.787 3.450 3.725
26 1.315 1.706 2.056 2.479 2.779 3.435 3.707
27 1.314 1.703 2.052 2.473 2.771 3.421 3.689
28 1.313 1.701 2.048 2.467 2.763 3.408 3.674
29 1.311 1.699 2.045 2.462 2.756 3.396 3.660
30 1.310 1.697 2.042 2.457 2.750 3.385 3.646
60 1.296 1.671 2.000 2.390 2.660 3.232 3.460
120 1.289 1.658 1.980 2.358 2.617 3.160 3.373
∞ 1.282 1.645 1.960 2.326 2.576 3.091 3.291
Ki-Kare Cetveli
Önem düzeyi ()
sd .995 .990 .975 .950 .900 .750 .500 .250 .100 .050 .025 .010 .005

1 0.00004 0.00016 0.00098 0.00393 0.01579 0.10153 0.45494 1.32330 2.70554 3.84146 5.02389 6.63490 7.87944

2 0.01003 0.02010 0.05064 0.10259 0.21072 0.57536 1.38629 2.77259 4.60517 5.99146 7.37776 9.21034 10.59663

3 0.07172 0.11483 0.21580 0.35185 0.58437 1.21253 2.36597 4.10834 6.25139 7.81473 9.34840 11.34487 12.83816

4 0.20699 0.29711 0.48442 0.71072 1.06362 1.92256 3.35669 5.38527 7.77944 9.48773 11.14329 13.27670 14.86026

5 0.41174 0.55430 0.83121 1.14548 1.61031 2.67460 4.35146 6.62568 9.23636 11.07050 12.83250 15.08627 16.74960

6 0.67573 0.87209 1.23734 1.63538 2.20413 3.45460 5.34812 7.84080 10.64464 12.59159 14.44938 16.81189 18.54758

7 0.98926 1.23904 1.68987 2.16735 2.83311 4.25485 6.34581 9.03715 12.01704 14.06714 16.01276 18.47531 20.27774

8 1.34441 1.64650 2.17973 2.73264 3.48954 5.07064 7.34412 10.21885 13.36157 15.50731 17.53455 20.09024 21.95495

9 1.73493 2.08790 2.70039 3.32511 4.16816 5.89883 8.34283 11.38875 14.68366 16.91898 19.02277 21.66599 23.58935

10 2.15586 2.55821 3.24697 3.94030 4.86518 6.73720 9.34182 12.54886 15.98718 18.30704 20.48318 23.20925 25.18818

11 2.60322 3.05348 3.81575 4.57481 5.57778 7.58414 10.34100 13.70069 17.27501 19.67514 21.92005 24.72497 26.75685

12 3.07382 3.57057 4.40379 5.22603 6.30380 8.43842 11.34032 14.84540 18.54935 21.02607 23.33666 26.21697 28.29952

13 3.56503 4.10692 5.00875 5.89186 7.04150 9.29907 12.33976 15.98391 19.81193 22.36203 24.73560 27.68825 29.81947

14 4.07467 4.66043 5.62873 6.57063 7.78953 10.16531 13.33927 17.11693 21.06414 23.68479 26.11895 29.14124 31.31935

15 4.60092 5.22935 6.26214 7.26094 8.54676 11.03654 14.33886 18.24509 22.30713 24.99579 27.48839 30.57791 32.80132

16 5.14221 5.81221 6.90766 7.96165 9.31224 11.91222 15.33850 19.36886 23.54183 26.29623 28.84535 31.99993 34.26719

17 5.69722 6.40776 7.56419 8.67176 10.08519 12.79193 16.33818 20.48868 24.76904 27.58711 30.19101 33.40866 35.71847

18 6.26480 7.01491 8.23075 9.39046 10.86494 13.67529 17.33790 21.60489 25.98942 28.86930 31.52638 34.80531 37.15645

19 6.84397 7.63273 8.90652 10.11701 11.65091 14.56200 18.33765 22.71781 27.20357 30.14353 32.85233 36.19087 38.58226

20 7.43384 8.26040 9.59078 10.85081 12.44261 15.45177 19.33743 23.82769 28.41198 31.41043 34.16961 37.56623 39.99685

21 8.03365 8.89720 10.28290 11.59131 13.23960 16.34438 20.33723 24.93478 29.61509 32.67057 35.47888 38.93217 41.40106

22 8.64272 9.54249 10.98232 12.33801 14.04149 17.23962 21.33704 26.03927 30.81328 33.92444 36.78071 40.28936 42.79565

23 9.26042 10.19572 11.68855 13.09051 14.84796 18.13730 22.33688 27.14134 32.00690 35.17246 38.07563 41.63840 44.18128

24 9.88623 10.85636 12.40115 13.84843 15.65868 19.03725 23.33673 28.24115 33.19624 36.41503 39.36408 42.97982 45.55851

25 10.51965 11.52398 13.11972 14.61141 16.47341 19.93934 24.33659 29.33885 34.38159 37.65248 40.64647 44.31410 46.92789

26 11.16024 12.19815 13.84390 15.37916 17.29188 20.84343 25.33646 30.43457 35.56317 38.88514 41.92317 45.64168 48.28988

27 11.80759 12.87850 14.57338 16.15140 18.11390 21.74940 26.33634 31.52841 36.74122 40.11327 43.19451 46.96294 49.64492

28 12.46134 13.56471 15.30786 16.92788 18.93924 22.65716 27.33623 32.62049 37.91592 41.33714 44.46079 48.27824 50.99338

29 13.12115 14.25645 16.04707 17.70837 19.76774 23.56659 28.33613 33.71091 39.08747 42.55697 45.72229 49.58788 52.33562
30 13.78672 14.95346 16.79077 18.49266 20.59923 24.47761 29.33603 34.79974 40.25602 43.77297 46.97924 50.89218 53.67196
F Cetveli (=0.05)
sd2
/sd 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1

161. 199. 215. 224. 230. 233. 236. 238. 240. 241. 243. 245. 248. 249. 250. 251. 252. 253. 254.
1
4476 5000 7073 5832 1619 9860 7684 8827 5433 8817 9060 9499 0131 0518 0951 1432 1957 2529 3144

18.5 19.0 19.1 19.2 19.2 19.3 19.3 19.3 19.3 19.3 19.4 19.4 19.4 19.4 19.4 19.4 19.4 19.4 19.4
2
128 000 643 468 964 295 532 710 848 959 125 291 458 541 624 707 791 874 957

10.1 9.55 9.27 9.11 9.01 8.94 8.88 8.84 8.81 8.78 8.74 8.70 8.66 8.63 8.61 8.59 8.57 8.54 8.52
3
280 21 66 72 35 06 67 52 23 55 46 29 02 85 66 44 20 94 64

7.70 6.94 6.59 6.38 6.25 6.16 6.09 6.04 5.99 5.96 5.91 5.85 5.80 5.77 5.74 5.71 5.68 5.65 5.62
4
86 43 14 82 61 31 42 10 88 44 17 78 25 44 59 70 77 81 81

6.60 5.78 5.40 5.19 5.05 4.95 4.87 4.81 4.77 4.73 4.67 4.61 4.55 4.52 4.49 4.46 4.43 4.39 4.36
5
79 61 95 22 03 03 59 83 25 51 77 88 81 72 57 38 14 85 50

5.98 5.14 4.75 4.53 4.38 4.28 4.20 4.14 4.09 4.06 3.99 3.93 3.87 3.84 3.80 3.77 3.73 3.70 3.66
6
74 33 71 37 74 39 67 68 90 00 99 81 42 15 82 43 98 47 89

5.59 4.73 4.34 4.12 3.97 3.86 3.78 3.72 3.67 3.63 3.57 3.51 3.44 3.41 3.37 3.34 3.30 3.26 3.22
7
14 74 68 03 15 60 70 57 67 65 47 07 45 05 58 04 43 74 98

5.31 4.45 4.06 3.83 3.68 3.58 3.50 3.43 3.38 3.34 3.28 3.21 3.15 3.11 3.07 3.04 3.00 2.96 2.92
8
77 90 62 79 75 06 05 81 81 72 39 84 03 52 94 28 53 69 76

5.11 4.25 3.86 3.63 3.48 3.37 3.29 3.22 3.17 3.13 3.07 3.00 2.93 2.90 2.86 2.82 2.78 2.74 2.70
9
74 65 25 31 17 38 27 96 89 73 29 61 65 05 37 59 72 75 67

4.96 4.10 3.70 3.47 3.32 3.21 3.13 3.07 3.02 2.97 2.91 2.84 2.77 2.73 2.69 2.66 2.62 2.58 2.53
10
46 28 83 80 58 72 55 17 04 82 30 50 40 72 96 09 11 01 79

4.84 3.98 3.58 3.35 3.20 3.09 3.01 2.94 2.89 2.85 2.78 2.71 2.64 2.60 2.57 2.53 2.49 2.44 2.40
11
43 23 74 67 39 46 23 80 62 36 76 86 64 90 05 09 01 80 45

4.74 3.88 3.49 3.25 3.10 2.99 2.91 2.84 2.79 2.75 2.68 2.61 2.54 2.50 2.46 2.42 2.38 2.34 2.29
12
72 53 03 92 59 61 34 86 64 34 66 69 36 55 63 59 42 10 62

4.66 3.80 3.41 3.17 3.02 2.91 2.83 2.76 2.71 2.67 2.60 2.53 2.45 2.42 2.38 2.33 2.29 2.25 2.20
13
72 56 05 91 54 53 21 69 44 10 37 31 89 02 03 92 66 24 64

4.60 3.73 3.34 3.11 2.95 2.84 2.76 2.69 2.64 2.60 2.53 2.46 2.38 2.34 2.30 2.26 2.22 2.17 2.13
14
01 89 39 22 82 77 42 87 58 22 42 30 79 87 82 64 29 78 07

4.54 3.68 3.28 3.05 2.90 2.79 2.70 2.64 2.58 2.54 2.47 2.40 2.32 2.28 2.24 2.20 2.16 2.11 2.06
15
31 23 74 56 13 05 66 08 76 37 53 34 75 78 68 43 01 41 58

4.49 3.63 3.23 3.00 2.85 2.74 2.65 2.59 2.53 2.49 2.42 2.35 2.27 2.23 2.19 2.15 2.10 2.05 2.00
16
40 37 89 69 24 13 72 11 77 35 47 22 56 54 38 07 58 89 96

4.45 3.59 3.19 2.96 2.81 2.69 2.61 2.54 2.49 2.44 2.38 2.30 2.23 2.18 2.14 2.10 2.05 2.01 1.96
17
13 15 68 47 00 87 43 80 43 99 07 77 04 98 77 40 84 07 04

4.41 3.55 3.15 2.92 2.77 2.66 2.57 2.51 2.45 2.41 2.34 2.26 2.19 2.14 2.10 2.06 2.01 1.96 1.91
18
39 46 99 77 29 13 67 02 63 17 21 86 06 97 71 29 66 81 68

4.38 3.52 3.12 2.89 2.74 2.62 2.54 2.47 2.42 2.37 2.30 2.23 2.15 2.11 2.07 2.02 1.97 1.93 1.87
19
07 19 74 51 01 83 35 68 27 79 80 41 55 41 12 64 95 02 80

4.35 3.49 3.09 2.86 2.71 2.59 2.51 2.44 2.39 2.34 2.27 2.20 2.12 2.08 2.03 1.99 1.94 1.89 1.84
20
12 28 84 61 09 90 40 71 28 79 76 33 42 25 91 38 64 63 32

4.32 3.46 3.07 2.84 2.68 2.57 2.48 2.42 2.36 2.32 2.25 2.17 2.09 2.05 2.01 1.96 1.91 1.86 1.81
21
48 68 25 01 48 27 76 05 60 10 04 57 60 40 02 45 65 57 17

4.30 3.44 3.04 2.81 2.66 2.54 2.46 2.39 2.34 2.29 2.22 2.15 2.07 2.02 1.98 1.93 1.88 1.83 1.78
22
09 34 91 67 13 91 38 65 19 67 58 08 07 83 42 80 94 80 31

4.27 3.42 3.02 2.79 2.64 2.52 2.44 2.37 2.32 2.27 2.20 2.12 2.04 2.00 1.96 1.91 1.86 1.81 1.75
23
93 21 80 55 00 77 22 48 01 47 36 82 76 50 05 39 48 28 70
2

4.25 3.40 3.00 2.77 2.62 2.50 2.42 2.35 2.30 2.25 2.18 2.10 2.02 1.98 1.93 1.89 1.84 1.78 1.73
24
97 28 88 63 07 82 26 51 02 47 34 77 67 38 90 20 24 96 30

4.24 3.38 2.99 2.75 2.60 2.49 2.40 2.33 2.28 2.23 2.16 2.08 2.00 1.96 1.91 1.87 1.82 1.76 1.71
25
17 52 12 87 30 04 47 71 21 65 49 89 75 43 92 18 17 84 10

4.22 3.36 2.97 2.74 2.58 2.47 2.38 2.32 2.26 2.21 2.14 2.07 1.98 1.94 1.90 1.85 1.80 1.74 1.69
26
52 90 52 26 68 41 83 05 55 97 79 16 98 64 10 33 27 88 06

4.21 3.35 2.96 2.72 2.57 2.45 2.37 2.30 2.25 2.20 2.13 2.05 1.97 1.92 1.88 1.83 1.78 1.73 1.67
27
00 41 04 78 19 91 32 53 01 43 23 58 36 99 42 61 51 06 17

4.19 3.34 2.94 2.71 2.55 2.44 2.35 2.29 2.23 2.19 2.11 2.04 1.95 1.91 1.86 1.82 1.76 1.71 1.65
28
60 04 67 41 81 53 93 13 60 00 79 11 86 47 87 03 89 38 41

4.18 3.32 2.93 2.70 2.54 2.43 2.34 2.27 2.22 2.17 2.10 2.02 1.94 1.90 1.85 1.80 1.75 1.69 1.63
29
30 77 40 14 54 24 63 83 29 68 45 75 46 05 43 55 37 81 76

4.17 3.31 2.92 2.68 2.53 2.42 2.33 2.26 2.21 2.16 2.09 2.01 1.93 1.88 1.84 1.79 1.73 1.68 1.62
30
09 58 23 96 36 05 43 62 07 46 21 48 17 74 09 18 96 35 23

4.08 3.23 2.83 2.60 2.44 2.33 2.24 2.18 2.12 2.07 2.00 1.92 1.83 1.79 1.74 1.69 1.63 1.57 1.50
40
47 17 87 60 95 59 90 02 40 72 35 45 89 29 44 28 73 66 89

4.00 3.15 2.75 2.52 2.36 2.25 2.16 2.09 2.04 1.99 1.91 1.83 1.74 1.70 1.64 1.59 1.53 1.46 1.38
60
12 04 81 52 83 41 65 70 01 26 74 64 80 01 91 43 43 73 93

3.92 3.07 2.68 2.44 2.28 2.17 2.08 2.01 1.95 1.91 1.83 1.75 1.65 1.60 1.55 1.49 1.42 1.35 1.25
120
01 18 02 72 99 50 68 64 88 05 37 05 87 84 43 52 90 19 39

3.84 2.99 2.60 2.37 2.21 2.09 2.00 1.93 1.87 1.83 1.75 1.66 1.57 1.51 1.45 1.39 1.31 1.22 1.00
∞ 15 57 49 19 41 86 96 84 99 07 22 64 05 73 91 40 80 14 00

F Cetveli (=0.01)
sd2
/sd 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1

4052 4999 5403 5624 5763 5858 5928 5981 6022 6055 6106 6157 6208 6234 6260 6286 6313 6339 6365
1
.181 .500 .352 .583 .650 .986 .356 .070 .473 .847 .321 .285 .730 .631 .649 .782 .030 .391 .864

98.5 99.0 99.1 99.2 99.2 99.3 99.3 99.3 99.3 99.3 99.4 99.4 99.4 99.4 99.4 99.4 99.4 99.4 99.4
2
03 00 66 49 99 33 56 74 88 99 16 33 49 58 66 74 82 91 99

34.1 30.8 29.4 28.7 28.2 27.9 27.6 27.4 27.3 27.2 27.0 26.8 26.6 26.5 26.5 26.4 26.3 26.2 26.1
3
16 17 57 10 37 11 72 89 45 29 52 72 90 98 05 11 16 21 25

21.1 18.0 16.6 15.9 15.5 15.2 14.9 14.7 14.6 14.5 14.3 14.1 14.0 13.9 13.8 13.7 13.6 13.5 13.4
4
98 00 94 77 22 07 76 99 59 46 74 98 20 29 38 45 52 58 63

16.2 13.2 12.0 11.3 10.9 10.6 10.4 10.2 10.1 10.0 9.88 9.72 9.55 9.46 9.37 9.29 9.20 9.11 9.02
5
58 74 60 92 67 72 56 89 58 51 8 2 3 6 9 1 2 2 0

13.7 10.9 9.78 9.14 8.74 8.46 8.26 8.10 7.97 7.87 7.71 7.55 7.39 7.31 7.22 7.14 7.05 6.96 6.88
6
45 25 0 8 6 6 0 2 6 4 8 9 6 3 9 3 7 9 0

12.2 9.54 8.45 7.84 7.46 7.19 6.99 6.84 6.71 6.62 6.46 6.31 6.15 6.07 5.99 5.90 5.82 5.73 5.65
7
46 7 1 7 0 1 3 0 9 0 9 4 5 4 2 8 4 7 0

11.2 8.64 7.59 7.00 6.63 6.37 6.17 6.02 5.91 5.81 5.66 5.51 5.35 5.27 5.19 5.11 5.03 4.94 4.85
8
59 9 1 6 2 1 8 9 1 4 7 5 9 9 8 6 2 6 9

10.5 8.02 6.99 6.42 6.05 5.80 5.61 5.46 5.35 5.25 5.11 4.96 4.80 4.72 4.64 4.56 4.48 4.39 4.31
9
61 2 2 2 7 2 3 7 1 7 1 2 8 9 9 7 3 8 1

10.0 7.55 6.55 5.99 5.63 5.38 5.20 5.05 4.94 4.84 4.70 4.55 4.40 4.32 4.24 4.16 4.08 3.99 3.90
10
44 9 2 4 6 6 0 7 2 9 6 8 5 7 7 5 2 6 9

11 9.64 7.20 6.21 5.66 5.31 5.06 4.88 4.74 4.63 4.53 4.39 4.25 4.09 4.02 3.94 3.86 3.77 3.69 3.60
3

6 6 7 8 6 9 6 4 2 9 7 1 9 1 1 0 6 0 2

9.33 6.92 5.95 5.41 5.06 4.82 4.64 4.49 4.38 4.29 4.15 4.01 3.85 3.78 3.70 3.61 3.53 3.44 3.36
12
0 7 3 2 4 1 0 9 8 6 5 0 8 0 1 9 5 9 1

9.07 6.70 5.73 5.20 4.86 4.62 4.44 4.30 4.19 4.10 3.96 3.81 3.66 3.58 3.50 3.42 3.34 3.25 3.16
13
4 1 9 5 2 0 1 2 1 0 0 5 5 7 7 5 1 5 5

8.86 6.51 5.56 5.03 4.69 4.45 4.27 4.14 4.03 3.93 3.80 3.65 3.50 3.42 3.34 3.26 3.18 3.09 3.00
14
2 5 4 5 5 6 8 0 0 9 0 6 5 7 8 6 1 4 4

8.68 6.35 5.41 4.89 4.55 4.31 4.14 4.00 3.89 3.80 3.66 3.52 3.37 3.29 3.21 3.13 3.04 2.95 2.86
15
3 9 7 3 6 8 2 4 5 5 6 2 2 4 4 2 7 9 8

8.53 6.22 5.29 4.77 4.43 4.20 4.02 3.89 3.78 3.69 3.55 3.40 3.25 3.18 3.10 3.01 2.93 2.84 2.75
16
1 6 2 3 7 2 6 0 0 1 3 9 9 1 1 8 3 5 3

8.40 6.11 5.18 4.66 4.33 4.10 3.92 3.79 3.68 3.59 3.45 3.31 3.16 3.08 3.00 2.92 2.83 2.74 2.65
17
0 2 5 9 6 2 7 1 2 3 5 2 2 4 3 0 5 6 3

8.28 6.01 5.09 4.57 4.24 4.01 3.84 3.70 3.59 3.50 3.37 3.22 3.07 2.99 2.91 2.83 2.74 2.66 2.56
18
5 3 2 9 8 5 1 5 7 8 1 7 7 9 9 5 9 0 6

8.18 5.92 5.01 4.50 4.17 3.93 3.76 3.63 3.52 3.43 3.29 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.48
19
5 6 0 0 1 9 5 1 3 4 7 3 3 5 4 1 4 4 9

8.09 5.84 4.93 4.43 4.10 3.87 3.69 3.56 3.45 3.36 3.23 3.08 2.93 2.85 2.77 2.69 2.60 2.51 2.42
20
6 9 8 1 3 1 9 4 7 8 1 8 8 9 8 5 8 7 1

8.01 5.78 4.87 4.36 4.04 3.81 3.64 3.50 3.39 3.31 3.17 3.03 2.88 2.80 2.72 2.63 2.54 2.45 2.36
21
7 0 4 9 2 2 0 6 8 0 3 0 0 1 0 6 8 7 0

7.94 5.71 4.81 4.31 3.98 3.75 3.58 3.45 3.34 3.25 3.12 2.97 2.82 2.74 2.66 2.58 2.49 2.40 2.30
22
5 9 7 3 8 8 7 3 6 8 1 8 7 9 7 3 5 3 5

7.88 5.66 4.76 4.26 3.93 3.71 3.53 3.40 3.29 3.21 3.07 2.93 2.78 2.70 2.62 2.53 2.44 2.35 2.25
23
1 4 5 4 9 0 9 6 9 1 4 1 1 2 0 5 7 4 6

7.82 5.61 4.71 4.21 3.89 3.66 3.49 3.36 3.25 3.16 3.03 2.88 2.73 2.65 2.57 2.49 2.40 2.31 2.21
24
3 4 8 8 5 7 6 3 6 8 2 9 8 9 7 2 3 0 1

7.77 5.56 4.67 4.17 3.85 3.62 3.45 3.32 3.21 3.12 2.99 2.85 2.69 2.62 2.53 2.45 2.36 2.27 2.16
25
0 8 5 7 5 7 7 4 7 9 3 0 9 0 8 3 4 0 9

7.72 5.52 4.63 4.14 3.81 3.59 3.42 3.28 3.18 3.09 2.95 2.81 2.66 2.58 2.50 2.41 2.32 2.23 2.13
26
1 6 7 0 8 1 1 8 2 4 8 5 4 5 3 7 7 3 1

7.67 5.48 4.60 4.10 3.78 3.55 3.38 3.25 3.14 3.06 2.92 2.78 2.63 2.55 2.47 2.38 2.29 2.19 2.09
27
7 8 1 6 5 8 8 6 9 2 6 3 2 2 0 4 4 8 7

7.63 5.45 4.56 4.07 3.75 3.52 3.35 3.22 3.12 3.03 2.89 2.75 2.60 2.52 2.44 2.35 2.26 2.16 2.06
28
6 3 8 4 4 8 8 6 0 2 6 3 2 2 0 4 3 7 4

7.59 5.42 4.53 4.04 3.72 3.49 3.33 3.19 3.09 3.00 2.86 2.72 2.57 2.49 2.41 2.32 2.23 2.13 2.03
29
8 0 8 5 5 9 0 8 2 5 8 6 4 5 2 5 4 8 4

7.56 5.39 4.51 4.01 3.69 3.47 3.30 3.17 3.06 2.97 2.84 2.70 2.54 2.46 2.38 2.29 2.20 2.11 2.00
30
2 0 0 8 9 3 4 3 7 9 3 0 9 9 6 9 8 1 6

7.31 5.17 4.31 3.82 3.51 3.29 3.12 2.99 2.88 2.80 2.66 2.52 2.36 2.28 2.20 2.11 2.01 1.91 1.80
40
4 9 3 8 4 1 4 3 8 1 5 2 9 8 3 4 9 7 5

7.07 4.97 4.12 3.64 3.33 3.11 2.95 2.82 2.71 2.63 2.49 2.35 2.19 2.11 2.02 1.93 1.83 1.72 1.60
60
7 7 6 9 9 9 3 3 8 2 6 2 8 5 8 6 6 6 1

6.85 4.78 3.94 3.48 3.17 2.95 2.79 2.66 2.55 2.47 2.33 2.19 2.03 1.95 1.86 1.76 1.65 1.53 1.38
120
1 7 9 0 4 6 2 3 9 2 6 2 5 0 0 3 6 3 1

6.63 4.60 3.78 3.31 3.01 2.80 2.63 2.51 2.40 2.32 2.18 2.03 1.87 1.79 1.69 1.59 1.47 1.32 1.00
∞ 5 5 2 9 7 2 9 1 7 1 5 9 8 1 6 2 3 5 0
4
BÖLÜM 6
HİPOTEZ KONTROLÜ İLE İLGİLİ UYGULAMA SORULARI
VE ÇÖZÜMLERİ
► Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü sonundaki
bozulma oranları araştırılmaktadır. Bu amaçla yapılan bir çalışmada Pastorizasyon tekniği ile
işlenmiş olan 740 süt şişesinden 326’sının ve UHT tekniği ile işlenmiş olan 850 süt şişesinden
281’inin 6 ay sonunda bozulduğu belirlenmiştir. Bu deneme ile ilgili aşağıdaki soruları
yanıtlayınız.
1. Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü
sonundaki bozulma oranları nedir ?
n1 = 850 X1 = 281 P = X1/ n1 = 281/850 = 0.33
n2 = 740 X2 = 326 P = X2/ n2 = 326/740 = 0.44

2. Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü
sonunda bozulma oranları arasındaki farklılığın standart hatasını (S(p1 -p2) )
hesaplayınız.

q = 1- p = 1 – 0.33 = 0.67 q = 1- p = 1 – 0.44 = 0.56

^ ^ ^ ^
p1 * q1 p2 * q2 . . . .
S ^ ^   = + = 0.0243
( p1  p2 ) n1 n2

3. Pastörizasyon ve UHT teknikleri ile işlenmiş olan süt şişelerinde 6 aylık raf ömrü
sonundaki bozulma oranları arasında farklılık olup olmadığına ilişkin hipotez
kurup, % 1 olasılık düzeyinde test ediniz ve sonucu yorumlayınız.

H0 : p1-p2= p0; Bozulma oranları arasında fark yoktur


H1: p1- p2 ≠ p0; Bozulma oranları farklıdır

( ) ( ) ( . . )
z= = = +4.52
( ) .

z (0.4950) = + 2.575
% 0.5 0.99 % 0.5

Red -2.575 Kabul +2.575 Red

+ 4.52

Sonuç; + 4.52> + 2.575 olduğundan sıfır hipotezi % 1 olasılık düzeyinde reddedilir ve karşıt
hipotez kabul edilir. Buna göre; UHT ve pastörizasyon tekniği ile işlenen sütlerin bozulma
oranlarının farklı olduğuna karar verilir.

►Gıda Yönetmeliğine göre ekmeklik buğday unlarında gluten miktarının 212 mg/100g olması
esastır. Ekmeklik buğday unu üreten bir un fabrikasından rastgele seçilen 27 un çuvalında
ortalama gluten miktarı 208 mg/100g ve standart sapması 3.85 mg/100g olarak saptanmıştır.
Bu deneme ile ilgili aşağıdaki soruları yanıtlayınız.
4. Bu denemede örnek ortalamasının standart hatasını ve serbestlik derecesini
hesaplayınız.

.
S = = = = 0.74 mg/100g. ve SD = n -1 = 27 -1 = 26
√ √

5. Söz konusu fabrikanın yönetmeliğe uygun üretimde bulunup bulunmadığına


ilişkin hipotezi kurup, 0.05 olasılık düzeyinde test edildiniz ve sonucu
yorumlayınız.

H0: µ= 212 ve H1: µ 212

t= = = - 5.41 t (0.05) = ± 2.056


.

26 SD’li t- dağılışı

0.025 0.95
0.025

Red -2.056 Kabul +2.056 Red

-5.41
Sonuç; - 5.41 < - 2.056 olduğundan H0 hipotezi % 5 olasılık düzeyinde reddedilir, karşıt hipotez
H1 kabul edilir. Buna göre, firma yönetmeliğe uygun üretimde bulunmamaktadır.

6.Bu firmanın ürettiği unlarda gluten miktarı 212 mg/100g dan daha az kabul edilebilir
mi ? Uygun hipotezleri kurup 0.05 olasılık düzeyinde test ediniz.

H0 : µ= 212 mg/100g ve H1: µ<212 mg/100g

t= = = - 5.41
.

Kritik t değeri için 2 olasılık düzeyi dikkate alınır;


t(n-1) (2 )= t26(0.10)= 1.706
Sonuç: - 5.41 < -1.706 olduğundan H0 reddedilir. Buna göre µ< 212 mg/100g olduğu gerçeği
ortaya çıkar. Bu firmanın ürettiği unlarda gluten miktarı 212 mg/100g dan daha az olduğu kabul
edilir.

26 SD’li t- dağılışı

0.05 0.95

Red -1.706 Kabul

-5.41
► Bursa’da üretilen Deveci armutlarında zirai ilaç kalıntı miktarını analiz etmek için
kullanılan ve doğruluğu kanıtlanmış olan “Klasik Metot” yanında daha kısa sürede sonuç veren
fakat doğruluğu kanıtlanmamış olan “Hızlı Metot” geliştirilmiştir. Yapılan bir araştırmada bu
iki metot karşılaştırılmıştır. Bu amaçla, zirai ilaç uygulanmış olan Deveci armutunun bulunduğu
bir bahçeden rastgele seçilen 12 ağacın meyvelerine Klasik Metot, yine aynı bahçeden rastgele
seçilen 10 ağacın meyvelerine Hızlı Metot uygulanarak zirai ilaç kalıntı miktarları
belirlenmiştir. Her iki metoda ait zirai ilaç kalıntı miktarları (ppm) aşağıdaki tabloda verilmiştir.

Metot Örnek No.

1 2 3 4 5 6 7 8 9 10 11 12
Klasik 62 74 56 61 75 53 59 66 61 55 64 70
Hızlı 49 56 62 48 67 64 58 54 50 65 - -
7.Her iki analiz metodunun (sırasıyla Klasik; S12 ve Hızlı ; S22 metot) varyanslarını
hesaplayınız.

Klasik metodun kareleri toplamı:

(∑ ) ( )
∑𝑥 = ∑x - = (622+742+…..+702) - = 562.0

∑ .
Varyansı; S = = = 51.1

Hızlı metodun kareleri toplamı:

(∑ ) ( )
∑𝑥 = ∑x - = (492+562+…..+652) - = 442.1

∑ .
Varyansı; S = = = 49.1

8. Bu örneğe ait müşterek (toplanmış) varyansı ve serbestlik derecesini bulunuz.

∑ ∑ . .
𝑺𝟐 = = = 50.2 SD = n1 + n2 − 2 = 12 + 10 – 2 = 20

8.Bu denemede hesaplanan iki farklı analiz metodunun ortalama kalıntı miktarları
arasındaki farklılıkların standart hatasını S( ) hesaplayınız.

S 2 (n1  n2 ) . ( )
S ( X1  X 2 )  = = 3.033 ppm
n1n2
9.Klasik ve Hızlı metot ile analiz edilen Deveci armutlarının zirai ilaç kalıntı
miktarları arasında farklılık olup olmadığına ilişkin hipotezleri kurarak, 0.01 olasılık
düzeyinde test ediniz ve bulduğunuz sonucu yorumlayınız.

H0 : µ1 -µ2= 0 (Klasik ve hızlı metodun zirai ilaç kalıntı miktarları aynıdır)


H1: µ1 -µ2 0 (Klasik ve hızlı metodun zirai ilaç kalıntı miktarları farklıdır)

( ) (µ µ ) ( . . )
t= = = +1.879 SD = 20
( ) .

Kritik t değerinin, t20 (0.01)= 2.845, olduğu EK TABLO 3'den görülebilir.


Sonuç; 1.879 < 2.845 olduğundan sıfır hipotezi kabul edilir. Buna göre, her iki metodla
belirlenen zirai ilaç kalıntı miktarları arasında % 1 olasılık düzeyinde önemli farklılık
bulunmamaktadır. Buna göre hızlı metot klasik metodun yerini alabilir.
► Türkiye’de Tohumluk Tescil ve Sertifikasyon Müdürlüğü’nün Yönetmeliğine göre
sertifikalı hibrit ayçiçeği tohumluklarında çimlenme oranının 0.97 olması gerekmektedir. Bir
tohumculuk firmasının ürettiği bir sertifikalı hibrit ayçiçeği çeşidine ait 850 tohumdan 808
adedinin çimlendiği belirlenmiştir.

10. Bu firmanın ürettiği hibrit ayçiçeği tohumluğunda çimlenme oranını belirleyiniz.


^ x
p = = 0.95
n

11. Söz konusu örnekleme dağılışının standart sapmasını hesaplayınız.

p*q . .
  ^ = = 0.005848
p n

12. Bu firmanın ürettiği hibrit ayçiçeği tohumluğunda çimlenme oranının 0.97 olduğu
kabul edilebilir mi ? Uygun hipotezi kurup 0.01 olasılık düzeyinde test ediniz ve sonucu
yorumlayınız.

H : P = 0.97 (Tohumluğun çimlenme oranı 0.97 dir)


H : P ≠ 0.97 (Tohumluğun çimlenme oranı 0.97 değildir)

. .
z= = = - 3.42 z( . ) = ∓ 2.575
.

Red -2.575 Kabul +2.575 Red

- 3.42

Sonuç; - 3.42 < - 2.575 olduğundan sıfır hipotezi % 1 olasılık düzeyinde reddedilerek
karşıt hipotez kabul edilir. Buna göre firmanın ürettiği hibrit ayçiçeği tohumluğunun
çimlenme oranı 0.97 olarak kabul edilemez.

► Patateste patates böceğine (Leptinotarsa decemlineata) karşı kullanılan Gaucho adlı


insektisitin etkili madde miktarının 600 g/L olması yönetmelik gereğidir. Aynı tip insektisit
üreten bir firmadan alınan 25 kutuluk bir örnekte ortalama etkili madde miktarı 570 g/L ve
standart sapması (S) 76.7 g/L olarak bulunmuştur. Bu deneme ile ilgili aşağıdaki soruları
yanıtlayınız.

13. Denemede örnek ortalamasının standart hatasını ve serbestlik derecesini hesaplayınız.

.
S = = = = 15.34 g/L. SD = n -1 = 25 -1 = 24
√ √

14. Söz konusu firmanın yönetmeliğe uygun üretimde bulunup bulunmadığına ilişkin
hipotezi kurarak 0.01 olasılık düzeyinde test ediniz ve sonucu yorumlayınız.

H0: µ= 600 g/L ve H1: µ 600 g/L

t= = = - 1.95 SD = n -1 = 25 -1 = 24
.

t24 (0.01)= ± 2.797

24 SD’li t- dağılışı

Red -2.797 Kabul +2.797 Red

-1.95

Sonuç; - 1.95 < - 2.797 olduğundan H0 hipotezi kabul edilir. Firma yönetmeliğe uygun
üretimde bulunmaktadır.

► Bursa bölgesinde iki farklı bünyeye sahip olan (Tın ve Kil) tarlalardan alınan toprak
örnekleri aynı metotla analiz edilerek fosfor kapsamları (P2O5 kg/da) belirlenmiş ve elde edilen
veriler aşağıda olduğu gibi bulunmuştur. Fosfor analizi kil bünyeli toprakta 11, tın bünyeli
toprakta 10 örnekte yapılmıştır.

Toprak Toprak Örneği No.


Bünyesi
1 2 3 4 5 6 7 8 9 10 11
Kil 67 40 57 69 21 66 54 72 61 29 40
Tın 63 36 46 29 42 43 58 47 36 50 -
15.Kil ve tın bünyeli toprakların kareleri toplamlarını hesaplayınız.

Kil bünyeli toprağın kareleri toplamı:

(∑ ) ( )
∑𝑥 = ∑x - = (672+402+…..+402) - = 2996.6

Tın bünyeli toprağın kareleri toplamı:

(∑ ) ( )
∑𝑥 = ∑x - = (632+362+…..+502) - = 954.0

16. Kil ve tın bünyeli toprakların fosfor kapsamlarına ilişkin varyansları ( sırasıyla S12 ve
S22) aşağıdakilerden hangisidir ?

∑ 𝐱𝟐𝟏 .
Kil bünyeli toprağın varyansı; S = = = 299.6 SD = n1 – 1 = 11-1 = 10

∑ 𝐱𝟐𝟐 .
Tın bünyeli toprağın varyansı; S = = = 106.0 SD = n2 – 1 = 10-1 = 9

17. Toplanmış (müşterek) varyans ve serbestlik derecesini hesaplayınız.

∑ ∑ . .
𝑺𝟐 = = = 207.9 SD = n1 + n2 − 2 = 11 + 10 – 2 = 19

18 Bu denemede hesaplanan iki toprak bünyesinin ortalama fosfor miktarları arasındaki


farklılığın standart hatasını (S(x1-x2) ) hesaplayınız.

S 2 (n1  n2 ) . ( )
S ( X1  X 2 )  = = 6.3 kg/da
n1n2

19. Kil ve tın bünyeli toprakların fosfor miktarları arasında farklılık olup olmadığına
ilişkin hipotez kurulup 0.05 olasılık düzeyinde test edilirse, hesaplanan t istatistiği değeri
ve elde edilen sonuç aşağıdakilerden hangisinde doğrudur?
H0 : µ1 -µ2= 0 (Kil ve tın bünyeli toprakların fosfor miktarları aynıdır)
H1: µ1 -µ2 0 (Kil ve tın bünyeli toprakların fosfor miktarları farklıdır)
( ) (µ µ ) ( . . )
t= = = +1.17 SD = 19
( ) .

Kritik t değerinin, t19 (0.05)= 2.093, olduğu EK TABLO 3'den görülebilir.


Sonuç; 1.17 < 2.093 olduğundan H0 hipotezi 0.05 olasılık düzeyinde kabul edilir. Kil ve tın
bünyeli toprakların fosfor miktarları arasında istatistiksel olarak önemli farklılık yoktur.

19 SD’li t- dağılışı

Red -2.093 Kabul +2.093 Red

+ 1.17

►Gıda Güvenliği uyarınca pazarda satışa sunulan kirazlarda zirai ilaç kalıntı miktarının en
fazla 120 mg.kg-1 olması gerekmektedir. Bursa Haline gelen 27 farklı kiraz ürününde ortalama
zirai ilaç kalıntı miktarının 132 mg.kg-1 ve standart sapmasının (S) 9.42 mg.kg-1 olduğu
belirlenmiştir. Bursa Haline gelen kirazlarla ilgili olarak aşağıdaki soruları yanıtlayınız.

20.Bursa Haline gelen kirazlarda zirai ilaç kalıntı miktarı 120 mg.kg-1 olarak kabul
edilebilir mi ? Uygun hipotez kurup, 0.05 olasılık düzeyinde test ediniz ve sonucu
yorumlayınız.
H0: µ= 120 mg.kg-1 (Zirai ilaç kalıntı miktarı 120 mg.kg-1 dir)
H1: µ 120 mg.kg-1 (Zirai ilaç kalıntı miktarı 120 mg.kg-1 değildir)

Örnek ortalamasının standart hatası;

.
S = = = = 1.813 mg.kg-1 SD = n -1 = 27 – 1= 26
√ √

Örnek ortalamasının standart değeri veya test istatistiği ;

t= = = +6.62 SD = 26
.

Kritik t değerinin, t26 (0.05)= 2.056, olduğu EK TABLO 3'den görülebilir.


Sonuç; 6.62 > 2.056 olduğundan H0 hipotezi % 5 olasılık düzeyinde reddedilir, karşıt hipotez
H1 kabul edilir. Buna göre, kirazlarda kalıntı miktarının 120 mg.kg-1 olduğu kabul edilemez.
21.Bursa Haline gelen kirazlarda zirai ilaç kalıntı miktarlarının 120 mg.kg-1dan daha
fazla olduğu kabul edilebilir mi ? Uygun hipotezleri yazarak, 0.05 olasılık düzeyinde test
ediniz ve sonucu yorumlayınız.

H0: µ= 120 mg.kg-1 (Zirai ilaç kalıntı miktarı 120 mg.kg-1 dir)
H1: µ > 120 mg.kg-1 (Zirai ilaç kalıntı miktarı 120 mg.kg-1 dan daha fazladır)

Örnek ortalamasının standart hatası;

.
S = = = = 1.813 mg.kg-1 SD = n -1 = 27 – 1= 26
√ √

Örnek ortalamasının standart değeri veya test istatistiği ;

t= = = +6.62 SD = 26
.

Tek yönlü dağılışa girdiği için kritik t değeri;

t(n-1) (2 )= t26(0.10)= 1.706

Sonuç; 6.62 > 1.706 olduğundan H0 hipotezi % 5 olasılık düzeyinde reddedilir, karşıt
hipotez H1 kabul edilir. Buna göre, kirazlarda kalıntı miktarının 120 mg.kg-1 dan daha fazla
olduğu sonucuna varılmıştır.

26 SD’li t dağılışı

Kabul +1.706 Red

+ 6.62

► Oniki adet inek sütünde kalsiyum (Ca) miktarı (mg/g) ile laktik asit miktarı (g/100g)
aşağıda olduğu gibi bulunmuştur.

Değişken Süt Örnekleri


1 2 3 4 5 6 7 8 9 10 11 12
Kalsiyum 5.0 1.0 3.0 5.5 2.0 4.5 6.0 0.5 4.5 1.0 5.0 4.0
miktarı (mg/g)
Laktik asit 7.9 3.7 6.8 10.5 2.5 9.2 8.0 2.0 5.0 2.0 9.7 5.5
miktarı
(g/100g)

22) İki değişken arasındaki korelasyon katsayısı (r) değeri nedir ? Bu katsayı hangi
sonucu gösterir?
Örnek Kalsiyum Laktik
No miktarı asit X i2 Yi 2 X i .Yi
(mg/g) (g/100g)
Y X
1 5.0 7.9 62.41 25.0 39.5
2 1.0 3.7 13.69 1.0 3.7
3 3.0 6.8 46.24 9.0 20.4
4 5.5 10.5 110.25 30.25 57.75
5 2.0 2.5 6.25 4.0 5.0
6 4.5 9.2 84.64 20.25 41.4
7 6.0 8.0 64.00 36.0 48.0
8 0.5 2.0 4.0 0.25 1.0
9 4.5 5.0 25.0 20.25 22.5
10 1.0 2.0 4.0 1.0 2.0
11 5.0 9.7 94.09 25.0 48.5
12 4.0 5.5 30.25 16.0 22.0
Toplam 42.0 72.8 544.82 188.0 311.75
Ortalama 3.5 6.06

( Yi )2 ( . )
Kalsiyum miktarı KT=  y   Yi 
2
i
2
= 188.0 - = 41.0
n

( X i ) 2 ( . )
Laktik asit KT=  xi2   X i2   544.82 - = 103.17
n

( X i )( Yi ) ( . ) ( . )
İki değişkenin ÇT=  xi yi   X i .Yi  = 311.75 - = 56.95
n
Sonuç olarak inek sütlerinde laktik asit miktarı ile kalsiyum miktarı arasındaki korelasyon
katsayısı,

r
x y i i
=
.
= + 0.876
 x . y
2
i
2
i
√ . .

Bu korelasyon katsayısı inek sütlerinde laktik asit miktarı ile kalsiyum miktarı arasında pozitif
yönde yüksek bir doğrusal ilişki olduğunu göstermektedir. Buna göre inek sütlerinde laktik asit
miktarı artıkça kalsiyum miktarının da arttığı söylenebilir.
23) Korelasyon katsayısının standart hatası (Sr) ve serbestlik derecesini hesaplayınız.

( . )
S = = = 0.153 SD = n – 2 = 12 – 2 = 10

24) İnek sütlerinde laktik asit miktarı ile kalsiyum miktarı arasındaki korelasyon
katsayısının önemli olup olmadığını uygun hipotezleri de yazarak 0.01 olasılık düzeyinde
test ediniz ve sonucu yorumlayınız.

H0 : ρ = 0 (Korelasyon katsayısı önemsizdir)


H1 : ρ ≠ 0 (Korelasyon katsayısı önemlidir)

.
t= = = + 5.72 SD = 10
.

10 SD’li t-dağılışı

Red -3.169 Kabul +3.169 Red

+5.72

Kritik t değerinin, t10 (0.01)= 3.169 , olduğu EK TABLO 3'den görülebilir.


Sonuç; 5.72 > 3.169 olduğundan inek sütlerinde kalsiyum miktarı ile laktik asit miktarı
arasındaki doğrusal ilişki % 1 olasılık düzeyinde önemlidir.

►Bir araştırmada traktörlerin bakım harcamaları (TL/yıl) ile yaşları (Yıl) arasında doğrusal
bir ilişki olup olmadığı araştırılmaktadır. Bunun için rastgele seçilen 10 adet traktörün bakım
harcamaları (Y değişkeni) ve yaşları (X değişkeni) aşağıda olduğu gibi bulunmuştur.

Traktör No.
Değişkenler
1 2 3 4 5 6 7 8 9 10
Bakım 230 540 110 220 75 280 140 320 30 420
Harcamaları
Traktörün 8 14 3 7 2 9 4 10 1 12
Yaşı

25) Traktörlerin bakım harcamaları ve yaşları arasındaki ilişkiye ait korelasyon katsayısı
(r) değeri nedir ? Bu katsayı hangi sonucu gösterir ?

Örnek Bakım Traktör


No Harcamaları Yaşı X Yi 2 X i2 X i .Yi
Y
1 230 8 52900 64 1840
2 540 14 291600 196 7560
3 110 3 12100 9 330
4 220 7 48400 49 1540
5 70 2 4900 4 140
6 280 9 78400 81 2520
7 140 4 19600 16 560
8 320 10 102400 100 3200
9 30 1 900 1 30
10 420 12 176400 144 5040
Toplam 2360 70 787600 664 22760
Ortalama 236 7.0

( Yi ) 2 ( )
Bakım harcamaları KT=  y   Yi 
2
i
2
= 787600 - = 230640
n

( X i ) 2 ( )
Traktör Yaşı KT=  xi2   X i2   664 - = 174
n

( X i )( Yi ) ( ) ( )
İki değişkenin ÇT=  xi yi   X i .Yi  = 22760 - = 6240
n

Sonuç olarak traktör yaşı ile bakım masrafları arasındaki korelasyon katsayısı,

r
x y i i
= = + 0.985
 x . y
2
i
2
i

Bu korelasyon katsayısı traktörlerin yaşı ve bakım masrafları arasında pozitif yönde yüksek bir
doğrusal ilişki olduğunu göstermektedir. Buna göre traktörlerin yaşı artıkça bakım
harcamalarının da arttığı söylenebilir.
26) Uygun hipotezleri kurarak korelasyon katsayısının önemli olup olmadığını % 1
olasılık düzeyinde test ediniz.
H0 : ρ = 0 (Korelasyon katsayısı önemsizdir)
H1 : ρ ≠ 0 (Korelasyon katsayısı önemlidir)

( . )
S = = = 0.061

.
t= = = + 16.15 SD = n -2 =8
.

Kritik t değerinin, t8 (0.01)= 3.355 , olduğu EK TABLO 3'den görülebilir.


Sonuç; 16.15 > 3.355 olduğundan traktörlerin bakım masrafları ile traktör yaşı arasındaki
doğrusal ilişki % 1 olasılık düzeyinde önemlidir.

27) Uygun hipotezleri kurarak bakım harcamalarının (Y) traktör yaşı (X) üzerine
regresyon katsayısının önemli olup olmadığını % 1 olasılık düzeyinde test ediniz.
H0 :  =0 (önemsizdir)
H0 :  0 (önemlidir)
( Yi ) 2
 y  Y
2
i i
2

n
= 230640

( X i ) 2
 xi2   X i2  n
 174

 x y   X .Y   n  = 6240
( X )( Y ) i i
i i i i

byx 
x y i i
= = 35.86 TL
x 2
i

( )
2
S =
yx = 857.6 ve S = √857.6 = 29.28

Regresyon katsayısının standart hatası,


S yx .
Sb  = = 2.22 ve SD = 8
x 2
i

.
t= = = = +16.15
.

Kritik t değeri t8 (0.01)= 3.355 (EK TABLO 3).


Sonuç: 16.15 > 3.355 olduğundan H0 reddedilir. 0 veya regresyon katsayısı 0.01 düzeyinde
istatistiki olarak önemlidir.

►Susamda açık kapsüllü ve beyaz taneli bir çeşit (AABB) ile kapalı kapsüllü ve sarı taneli
bir çeşit (aabb) arasında yapılan melezlemenin F2 açılma generasyonunda elde edilen bitkilerin,
oluşan 4 fenotipe göre sayısal olarak dağılımı şu şekilde gözlenmiştir.
Fenotip F2’de Bitki Sayısı(Adet)
Açık kapsüllü + Beyaz taneli : 2604
Açık kapsüllü + Sarı taneli : 876
Kapalı kapsüllü + Beyaz taneli : 847
Kapalı kapsüllü + Sarı taneli : 273

Not : Susamda açık kapsüllü olma dominant A geni ile ve beyaz taneli olma ise dominant B
geni ile idare edilmektedir. F2 generasyonunda dihibrit (9:3:3:1 açılımı) açılım söz konusudur.
Buna göre aşağıdaki soruları yanıtlayınız.

28) Bu denemede F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılımına uygun mudur ? 0.01
olasılık düzeyinde test ediniz.

Çözüm için hipotezler şu şekilde kurulur;

H0 = F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılıma uygundur


H1 ≠ F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılıma uygun değildir

Fenotipler Gözlenen Teorik Beklenen Frekans


Frekans Frekans
Açık Kapsüllü + Beyaz Taneli 2604 9 4600 X 9/16 = 2587.5
Açık Kapsüllü + Sarı Taneli 876 3 4600 X 3/16 = 862.5
Kapalı Kapsüllü+Beyaz Taneli 847 3 4600 X 3/16 = 862.5
Kapalı Kapsüllü + Sarı Taneli 273 1 4600 X 1/16 = 287.5
Toplam 4600 16 4600.0

Kapalı kapsüllü ve sarı taneli bitki görülme olasılığı (beklenen frekans) 4600 x 1/16 = 287.5

2 = ∑ (𝐟 − 𝐟 )𝟐 /𝐟′

( . ) ( . ) ( . ) ( . )
2 = + + + = 1.33
. . . .

SD = k -1 = 4 -1 = 3

SD = 3 de 2 (0.01) kritik değeri ; 2 3(0.01) = 11.345 dir. Buna göre, 1.33 < 11.345
olduğundan sıfır hipotezi kabul edilir. F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılıma
uymaktadır.
► Soyada iri baklalı ve tüylü bir çeşit (AABB) ile küçük baklalı ve tüysüz bir çeşit (aabb)
arasında yapılan melezlemenin F2 açılma generasyonunda elde edilen bitkilerin, oluşan 4
fenotipe göre sayısal olarak dağılımı şu şekilde gözlenmiştir.
Fenotip F2’de Bitki Sayısı(Adet)
İri baklalı + Tüylü : 1178
İri baklalı + Tüysüz : 391
Küçük baklalı + Tüylü : 271
Küçük baklalı + Tüysüz : 156

Not : Soyada iri baklalı olma dominant A geni ile ve tüylü olma ise dominant B geni ile idare
edilmektedir. F2 generasyonunda dihibrit (9:3:3:1 açılımı) açılım söz konusudur. Buna göre
aşağıdaki soruları yanıtlayınız.

29) Bu melez popülasyonun F2 açılma generasyonuna ilişkin beklenen frekansları


hesaplayınız.

Fenotipler Gözlenen Frekans Teorik Beklenen Frekans


Frekans
İri baklalı + Tüylü 1178 9 1998 X 9/16 = 1123.875
İri baklalı + Tüysüz 391 3 1998 X 3/16 = 374.625
Küçük baklalı + Tüylü 273 3 1998 X 3/16 = 374.625
Küçük baklalı + Tüysüz 156 1 1998 X 1/16 = 124.875
Toplam 1998 16 1998.0

Kapalı kapsüllü ve sarı taneli bitki görülme olasılığı (beklenen frekans) 1998 x 1/16 = 124.875

30) Bu denemede F2’ deki açılım dihibrit (9:3:3:1 açılımı) açılımına uygun mudur ? 0.01
olasılık düzeyinde test ediniz.

Çözüm için hipotezler şu şekilde kurulur;

H0 = F2’ deki açılım dihibrit (9:3:3:1 açılımı)


H1 = F2’ deki açılım dihibrit (9:3:3:1 açılımı)

2 = ∑ (𝐟 − 𝐟 )𝟐 /𝐟′

. . . .
2 = ( )2+( )2 + ( )2 + ( )2 = 38.67
. . . .

SD = k -1 = 4 -1 = 3

SD = 3 de 2 (0.01) kritik değeri ; 2 3(0.01) = 11.345 dir. Buna göre, 38.67 > 11.345
olduğundan sıfır hipotezi 0.01 olasılık düzeyinde reddedilir. F2’ deki açılım dihibrit (9:3:3:1
açılımı) açılıma uymamaktadır.

► Bir soya fasulyesi çeşidinde iki farklı tohumluk rutubet oranının (% 8 ve % 11) çimlenme
gücü üzerine etkisi araştırılmaktadır. Yapılan deneme sonunda oda sıcaklığında % 8 rutubet
oranında 1 yıl depolanan 750 tohumdan 675 tanesinin ve oda sıcaklığında % 11 rutubet oranında
1 yıl depolanan aynı çeşide ait 900 tohumdan 765 tanesinin çimlendiği belirlenmiştir. Bu
deneme ile ilgili aşağıdaki soruları yanıtlayınız.

31) İki farklı tohumluk rutubet oranlarına (% 8 ve % 11) ait çimlenen tohum sayıları
arasındaki farklılık olup olmadığına ilişkin hipotezleri yazarak % 1 olasılık düzeyinde
test ediniz ve sonucu yorumlayınız.

H0 : p1-p2= p0; Çimlenen tohum oranları arasında fark yoktur


H1: p1- p2 ≠ p0; Çimlenen tohum oranları farklıdır

n1 = 750 X1 = 675 P = X1/ n1 = 675/750 = 0.90 (% 8 rutubet)


n2 = 900 X2 = 765 P = X2/ n2 = 765/900 = 0.85 (% 11 rutubet)

Oranlar arası farklılıkların standart hatası;


^ ^ ^ ^
p1 * q1 p2 * q2 . . . .
S ^ ^   = + = 0.016 %
( p1  p2 ) n1 n2

Test istatistiği;

( ) ( ) ( . . )
z= = = +3.125
( ) .

z (0.4950) = + 2.575

Red -2.575 Kabul +2.575 Red

+3.125
Sonuç; 3.125 > 2.575 olduğundan sıfır hipotezi reddedilir, karşıt hipotez kabul edilir. Buna göre
iki farklı rutubet oranında depolanan soya tohumlarının 1 yıl sonudaki çimlenme oranları
arasında % 1 olasılık düzeyinde önemli farklılık bulunmuştur. Çimlenme oranlarından % 8
rutubette depolanan soya tohumlarında çimlenme oranının daha yüksek olduğu görülmektedir.

► Türk Gıda Kodeksine göre birinci sınıf meyve sularında brix oranının (kuru madde oranı)
0.45 olması gerekmektedir. Meyve sularında brix oranına ait standart sapmanın (σ) 0.80 olduğu
bilinmektedir. Bir meyve suyu fabrikasından rastgele alınan 100 adet 1 litrelik meyve suyu
kutularında ortalama brix oranı 0.37 olarak bulunmuştur. Bu deneme ile ilgili aşağıdaki soruları
yanıtlayınız.
32) Söz konusu meyve suyu fabrikasının Türk Gıda Kodeksine uygun üretimde bulunup
bulunmadığına ilişkin hipotezleri kurarak 0.05 olasılık düzeyinde test ediniz ve
bulduğunuz sonucu yorumlayınız.

H : 𝜇 ̅ = 0.45 (Firmada üretilen meyve sularında brix oranı 0.45 dir)


H : 𝜇 ̅ ≠ 0.45 (Firmada üretilen meyve sularında brix oranı 0.45 değildir)

Söz konusu örnekleme dağılışının standart sapması;

.
σ = = = = 0.08 %
√ √

Test istatistiği;

. .
z= = = - 1.0 Kritik değer; z( . ) = ∓ 1.96
.

Red -1.96 Kabul +1.96 Red

-1.0
Sonuç; -1.0 > - 1.96 olduğundan H hipotezi kabul edilir. Buna göre firmanın ürettiği meyve
sularında brix oranı 0.45 olarak kabul edilebilir. Buna göre, firma yönetmeliğe uygun üretimde
bulunmaktadır.

►Damla ve karık usulü sulama yöntemlerinin domateste verim üzerine etkileri


araştırılmaktadır. Bunun için yapılan bir denemede damla sulama yöntemi 10, karık usulü
sulama yöntemi ise 11 domates parselinde uygulanmıştır. Hasatta her iki sulama yönteminin
uygulandığı parsellerden elde edilen domates verimleri (kg/parsel) aşağıdaki tabloda
verilmiştir. Bu deneme ile ilgili aşağıdaki soruları cevaplayınız.

Sulama Parsel No :
Yöntemi 1 2 3 4 5 6 7 8 9 10 11
Damla 76 98 123 107 88 96 127 103 93 119 -

Karık 47 54 71 49 65 57 52 58 63 70 62

33) Bu denemede hesaplanan iki sulama yönteminin ortalama domates verimleri arasındaki
farklılıklarının standart hatasını (S(x1-x2) ) ve serbestlik derecesini hesaplayınız.

Damla sulama yönteminin kareleri toplamı:


2 ( )
(∑ x1 )
∑𝑥 = ∑x -
n1
= (762+982+…..+1192) - = 2376

Karık sulama yönteminin kareleri toplamı:

(∑ ) ( )
∑𝑥 = ∑x - = (472+542+…..+622) - = 648.9

∑ ∑ .
S = = = 159.2

Farklılıkların standart hatası ;

S 2 (n1  n2 ) . ( )
S ( X1  X 2 )  = = 5.51 kg/parsel
n1n2

SD = n1 + n2 − 2 = 10 + 11 – 2 = 19

34) Damla ve karık usulü sulama yöntemlerinin ortalama domates verimleri arasında
farklılık olup olmadığına ilişkin hipotezleri kurarak 0.01 olasılık düzeyinde test ediniz ve
sonucu yorumlayınız.

( ) (µ µ ) ( . . )
t= = = +8.0 SD = 19
( ) .

Kritik t değerinin, t19 (0.01)= 2.861, olduğu EK TABLO 3'den görülebilir.


Sonuç; 8.0 > 2.861 olduğundan H0 hipotezi 0.01 olasılık düzeyinde reddedilir. Buna göre, damla
ve karık usulü sulama yöntemlerinin ortalama domates verimleri arasında % 1 olasılık
düzeyinde istatistiksel olarak önemli farklılık vardır. Ortalamalar incelendiğinde damla sulama
yönteminin daha fazla domates verimi verdiği ve bu nedenle üreticilere damla sulama
yönteminin önerilebileceğini söylemek mümkündür.

19 SD’li t-dağılışı

Red -2.861 Kabul +2.861 Red

+8.0

35) Bir salça fabrikası ürettiği domates salçalarında ortalama C vitamini miktarının 17
ml/L olduğunu iddia etmektedir. Domates salçalarında C vitamini miktarının standart
sapması 2.75 ml/L dir. Bu fabrikadan rastgele seçilen 40 kutu domates salçasında
ortalama C vitamini miktarı 15.7 ml/L olarak bulunmuştur. Fabrikanın iddiası doğru
mudur? Yani, fabrikanın ürettiği domates salçalarında ortalama C vitamini miktarı 17
ml/L olarak kabul edilebilir mi? Uygun hipotezi yazarak % 1 olasılık düzeyinde test
ediniz.
ÇÖZÜM:

H : 𝜇 ̅ = 17 (Fabrikada üretilen domates salçalarının C vitamini miktarı 17 ml/L


dir)
H : 𝜇 ̅ ≠ 17 (Fabrikada üretilen domates salçalarının C vitamini miktarı 17 ml/L
değildir)

Bu fabrikadan n=40 kutuluk sonsuz sayıda alınan örneklerin oluşturduğu örnekleme


dağılışının ortalaması ;

𝜇 ̅ = 𝜇 = 17 ml/L

Örnekleme dağılışının standart sapması;


. .
σ = = = = = 0.435
√ √ .
Örneğin standart değeri;
.
z= = = - 2.99
.

P (- 2.99 < z < 0) = 0.4986

n= 40 kutuluk salça örnekleri kadar ve daha fazla sapma gösteren örneklerin oranını
bulmak için;
P (z < -2.99) = 0.5000 – 0.4986 = 0.0014 = % 0.14 olarak bulunur. Buna göre, n=40
kutuluk örneklerin 𝜇 = 17 ml/L olan popülasyona girme olasılığı % 0.14 dür. Bu
olasılık % 1 den çok daha düşük bir olasılıktır. Bu nedenle bu fabrikadan çekilen n=40
kutuluk örneğin 𝜇 = 17 ml/L ve 𝜎 = 2.75 ml/L olan populasyonu temsil etmesi
mümkün değildir. Buna göre H0 hipotezi reddedilir, H1 kabul edilir. Fabrikanın
iddiasının doğru olmadığı sonucuna varılır.
Öte yandan; z (0.4950) kritik değeri ± 2.575 olduğu için – 2.99 < - 2.575 olduğundan H0
hipotezi % 1 olasılık düzeyinde reddedilir, karşıt hipotez H1 kabul edilir.

% 99
% 0.14

Red -2.575 Kabul +2.575 Red


2.99
- 2.99

36) Pamukta beyaz sinek (Bemisia tabaci) zararlısına karşı uygulanan A ve B


insektisitlerinin etkilerinin farklı olup olmadığı karşılaştırılmaktadır. Yapılan
araştırmada A insektisiti uygulanan 500 pamuk bitkisinden 380’inde ve B insektisiti
uygulanan 600 pamuk bitkisinden 414’ünde tamamen beyaz sinek zararlısının öldüğü
saptanmıştır. Her iki insektisitin beyaz sinek öldürme oranlarını, oranlar arası farklılığı
ve farklılığın standart hatasını bulunuz. Uygun hipotezi yazarak her iki insektisitin beyaz
sinek öldürme oranları arasındaki farklılığının istatistiksel olarak önemli olup olmadığını
0.05 olasılık düzeyinde test ediniz. Hangi insektisit daha etkili olmuştur, açıklayınız.
nA = 500 XA = 380 P = XA/ nA = 380/500 = 0.76
nB = 600 XB = 414 P = XB/ nB = 414/600 = 0.69
q = 1 - P = 1 – 0.76 = 0.24 q = 1 - P = 1 – 0.69 = 0.31
(P - P ) farklılığının standart hatası;
^ ^ ^ ^
p1 * q1 p2 * q2 . . . .
S ^ ^   = + = 0.0268
( p1  p2 ) n1 n2

(P - P ) ± S( ) (0.76 – 0.69) ± 0.0268 0.07 ± 0.0268


H : P - P = 0 ( Her iki insektisitin beyaz sinek öldürme oranları arasında farklılık yoktur)

H : P - P ≠ 0 ( Her iki insektisitin beyaz sinek öldürme oranları farklıdır)

Test istatistiği;

( ) ( ) ( . . )
z= = = +2.61
( ) .

z (0.4750) = + 1.96

% 95

Red -1.96 Kabul +1.96 Red

+2.61
Sonuç; 2.61 > 1.96 olduğundan sıfır hipotezi reddedilir, karşıt hipotez kabul edilir. Buna göre
iki farklı insektisitin beyaz sinek zararlılarını öldürme oranları arasında % 5 olasılık düzeyinde
önemli farklılık bulunmuştur. Ortalamalara göre A insektisitinin beyaz sineğe karşı daha etkili
olduğu sonucuna varılmıştır.

You might also like