Professional Documents
Culture Documents
Olasilik h13-14
Olasilik h13-14
Ana-kütle
𝑓(𝑥; 𝜃1 , … , 𝜃𝑘 )
Örneklem: 𝑋1 , 𝑋2 , … , 𝑋𝑛
Bu derste ana-kütle çoğu durumda normal dağılama sahip kabul edilecektir, yani
𝑋1 , 𝑋2 , … , 𝑋𝑛 ~𝑁(𝜇, 𝜎 2 ). O halde 𝜽 = (𝜃1 , 𝜃2 ) = (𝜇, 𝜎 2 ) olacaktır.
Eğer ana-kütle normal dağılıma sahipse, ana-kütle parametreleri 𝜇, 𝜎 2 dir. Bu parametreleri tahmin
etmek için istatistikler kullanılır. Örneğin
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1
ve
𝑛
1
2
𝑆 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1
𝛼
𝑃 (𝑇𝑛−1 ≤ 𝑡𝑛−1,1−𝛼 ) = 1 −
2 2
eşitliğini sağlayan yüzdelik 𝑡-değeridir ve
𝑛
1
𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1
Not:
Örnek.
Aşağıda verilen gözlemler, ana-kütle ortalaması µ olan, bir normal dağılıma sahip ana-kütleden
seçilmiş bir rasgele örneklemdir.
52, 69, 73, 88, 87, 56
Verilen örneklemi kullanarak ana-kütle ortalaması µ için %95 güven düzeyinde bir güven
aralığını hesaplayınız.
Çözüm:
Xi, i. gözlem olsun. Bu durumda 𝑋𝑖 ~𝑁(𝜇, 𝜎 2 ) dır.
Ana-kütle ortalaması µ için %95 güven düzeyinde (α=0.05) bir güven aralığı
𝑠 𝑠
𝑥̅ − 𝑡1−𝛼,𝑛−1 < 𝜇 < 𝑥̅ + 𝑡1−𝛼,𝑛−1
2 √𝑛 2 √𝑛
Burada α=0.05, n=6 olduğundan
Hipotez testi önce iki hipotezin oluşturulması ile başlar. Bu iki hipotez birbirinin karşıtıdır. H 0
ile gösterilen hipotez genelde mevcut durumu yansıtır. H1 (Ha) ile gösterilen araştırma hipotezi
(alternatif hipotez) ise H0 hipotezinin karşıtıdır.
Ana-Kütle Ortalaması için Tek Yönlü (< veya >) Hipotez Testi
𝑋1 , 𝑋2 , … , 𝑋𝑛 ~𝑁(𝜇, 𝜎 2 ) bir rasgele örneklem olsun. Eğer 𝜎 biliniyorsa, 𝜇 ana-kütle ortalaması
için tek yönlü hipotez testi z-istatistiği ile yapılır.
Hipotez Testi:
𝐻0 : 𝜇 ≥ 𝜇0
𝐻1 : 𝜇 < 𝜇0
Test İstatistiği:
𝑥̅ − 𝜇0
𝑧=
𝜎/√𝑛
Örnek.
Kahve üreten bir şirketin kahve içeren bir poşetinde en az 300 gram kahve içerdiği
yazmaktadır. Tüketicileri Koruma Derneğine yapılan bir şikayet üzerine dernek kahve miktarını
gözden geçirmek istiyor. Eğer poşette yazılandan daha az miktarda kahve çıkarsa şirketin ceza
ödemesi gündeme gelebilir.
a) İddiayı test edebilmek için hipotez testi olarak ifade ediniz.
b) Rasgele seçilen 36 paket için örneklem ortalaması 292 gram çıktığına göre
ve 𝜎 = 18 gram ise α=0.01 anlamlılık seviyesinde hipotez testi sonucu ne
olur?
Çözüm:
a) Burada ana-kütle ilgili kahveden üretilen poşetler olup ana-kütle parametresi 𝜇 de bu
poşetlerdeki ortalama kahve miktarıdır (gram). Yani 𝜇0 = 300 ve hipotezler:
𝐻0 : 𝜇 ≥ 300
𝐻1 : 𝜇 < 300
Test İstatistiği:
𝑥̅ − 𝜇0 292 − 300
𝑧= = = −2.67
𝜎/√𝑛 18/6
Not:
1) 𝑃(𝑍 ≤ 𝑧0.99 ) = 0.99 => 2.33
2) Karar vericinin tutumuna göre sonuç değişebileceği için 𝛼 yerine p-değeri tercih
edilir. Bu örnekte
𝑝 − 𝑑𝑒ğ𝑒𝑟𝑖 = 𝑃(𝑍 ≤ 𝑧ℎ |𝐻0 ) = 𝑃(𝑍 ≤ −2.67) ≅ 0.0038
Karar verici 𝛼 = 0.01 seçerse
𝑝 − 𝑑𝑒ğ𝑒𝑟𝑖 = 0.0038 < 0.0100 = 𝛼
olduğundan H0 reddedilir.
Örnek.
Büyük miktarlarda suya karıştığı takdirde mikroorganizmalar cıvayı zehirli bir organik olan
metil-cıvaya (𝐶𝐻3203 ) dönüştürürler. Balıklar da taşıyıcıdır; onlar metil-cıvayı sindirir ve
yayarlar. Diğer yandan erkek ve kadınlar metil-cıvayı aynı oranda metabolizmalarına
almayabilirler. Bu durumu araştıran bir çalışmada rasgele belirlenen 6 kadına belirli
miktarlarda protein-bazlı metil-cıva verilmiştir. Sonuçlar tabloda özetlenmiştir.
Denek 𝑪𝑯𝟐𝟎𝟑
𝟑 yarı-ömrü (gün)
1 52
2 69
3 73
4 88
5 87
6 56
Erkekler için ortalama 𝐶𝐻3203 yarı-ömrünün 80 gün olduğu kabul edilmektedir. Hem kadınlar
hem de erkekler için 𝐶𝐻3203 yarı-ömrünün, standart sapması 8 gün olan bir normal dağılıma
uyduğu kabul edilmektedir. Bu bilgiler ışığında kadın ve erkekler için ortalama 𝐶𝐻3203 yarı-
ömrünün eşit olduğu söylenebilir mi? α=0.05 ile test ediniz.
Çözüm:
Burada 𝑋𝑖 kadınlarda 𝐶𝐻3203 yarı-ömür olup 𝑋𝑖 ~𝑁(𝜇, 𝜎 2 = 64). Araştırılmak istenen hipotez
Hipotez Testi:
𝐻0 : 𝜇 = 80
𝐻1 : 𝜇 ≠ 80
Test İstatistiği:
𝑥̅ − 𝜇0 70.83 − 80
𝑧ℎ = = = −2.81
𝜎/√𝑛 8/√6
α=0.05 anlamlılık seviyesinde karar kuralı:
Eğer |𝑧ℎ | > 𝑧0.975 ise H0 reddedilir.
𝑧0.975 = 1.96 ve
|𝑧ℎ | = 2.81 > 1.96 = 𝑧0.975 olduğundan H0 reddedilir.
Sonuç:
α=0.05 anlamlılık seviyesinde kadın ve erkekler için ortalama 𝐶𝐻3203 yarı-ömürlerinin
eşit olmadığı sonucuna varılır.
Not:
Çift yönlü hipotez testinde p-değeri 2 ile çarpılır. Bu örnekte
veya
Örnek.
Büyük miktarlarda suya karıştığı takdirde mikroorganizmalar cıvayı zehirli bir organik olan
metil-cıvaya (𝐶𝐻3203 ) dönüştürürler. Balıklar da taşıyıcıdır; onlar metil-cıvayı sindirir ve
yayarlar. Diğer yandan erkek ve kadınlar metil-cıvayı aynı oranda metabolizmalarına
almayabilirler. Bu durumu araştıran bir çalışmada rasgele belirlenen 6 kadına belirli
miktarlarda protein-bazlı metil-cıva verilmiştir. Sonuçlar tabloda özetlenmiştir.
Denek 𝑪𝑯𝟐𝟎𝟑
𝟑 yarı-ömrü (gün)
1 52
2 69
3 73
4 88
5 87
6 56
Erkekler için ortalama 𝐶𝐻3203 yarı-ömrünün 80 gün olduğu kabul edilmektedir. Hem kadınlar
hem de erkekler için 𝐶𝐻3203 yarı-ömrünün bir normal dağılıma uyduğu kabul edilmektedir. Bu
bilgiler ışığında kadın ve erkekler için ortalama 𝐶𝐻3203 yarı-ömrünün eşit olduğu söylenebilir
mi? α=0.05 ile test ediniz.
Çözüm:
Burada 𝑋𝑖 kadınlarda 𝐶𝐻3203 yarı-ömür olup 𝑋𝑖 ~𝑁(𝜇, 𝜎 2 ). Araştırılmak istenen hipotez
Hipotez Testi:
𝐻0 : 𝜇 = 80
𝐻1 : 𝜇 ≠ 80
Test İstatistiği:
Burada 𝜎 bilinmediğinden örneklem standart sapması hesaplanmalıdır. Burada
𝑛
2
1 (51 − 70.83)2 + (69 − 70.83)2 + ⋯ + (56 − 70.83)2
𝑠 = ∑(𝑥𝑖 − 𝑥̅ )2 = = 227.7667
𝑛−1 5
𝑖=1
ve
𝑥̅ − 𝜇0 70.83 − 80
𝑡ℎ = = ≅ −1.49
𝑠/√𝑛 15.09/√6
α=0.05 anlamlılık seviyesinde karar kuralı:
Eğer |𝑡ℎ | > 𝑡5,0.975 ise H0 reddedilir.
Sonuç:
α=0.05 anlamlılık seviyesinde kadın ve erkekler için ortalama 𝐶𝐻3203 yarı-ömürlerinin
eşit olduğu sonucuna varılır.
Not:
R yazılımında t.test() fonksiyonu yapılırsa p-değeri=0.197 elde edilir. O halde
𝑝 − 𝑑𝑒ğ𝑒𝑟𝑖 = 2 ∗ 𝑃(𝑡5 ≤ 𝑡ℎ |𝐻0 ) = 𝑃(𝑡5 ≤ −1.49) ≅ 0.196
Karar verici α=0.05 seçerse
𝑝 − 𝑑𝑒ğ𝑒𝑟𝑖 = 0.196 ≮ 0.050 = 𝛼
olduğundan H0 red edilemez.
Chebychev Eşitsizliği
X bir r.d. ve g(x) negatif olmayan bir fonksiyon olsun. Bu durumda r>0 için
𝐸[𝑔(𝑋)]
𝑃(𝑔(𝑋) > 𝑟) ≤
𝑟
Örnek.
Chebychev eşitsizliğinde, 𝜇 = 𝐸(𝑋) ve 𝜎 2 = 𝑉𝑎𝑟(𝑋) olmak üzere,
(𝑥 − 𝜇)2
𝑔(𝑥) =
𝜎2
ve 𝑟 = 𝑡 2 alınırsa
(𝑋 − 𝜇)2 2
𝐸[(𝑋 − 𝜇)2 ] 𝜎2 1
𝑃( 2
> 𝑡 ) ≤ 2 2
= 2 2
= 2
𝜎 𝜎 𝑡 𝜎 𝑡 𝑡
veya
1
𝑃((𝑋 − 𝜇)2 > 𝑡 2 𝜎 2 ) ≤
𝑡2
1
𝑃(|𝑋 − 𝜇| > 𝑡𝜎) ≤
𝑡2
Chebyshev Teoremi
Bir ana-kütlenin ortalaması µ ve standart sapması σ olsun. Eğer k>1 ise [𝜇 − 𝑘𝜎, 𝜇 + 𝑘𝜎] aralığı
gözlemlerin en az
1
100 ∙ [1 − ]%
𝑘2
içermektedir. Burada k bir gerçel sayıdır.
1
Örneğin k=1.5 ise [𝜇 − 1.5𝜎, 𝜇 + 1.5𝜎] gözlemerin en az 100 ∙ [1 − (1.5)2] % = 55.56%
kadarını içerecektir.
Örnek.
Bir üniversitedeki Genel Matematik dersinin final sınavlarına ait ortalamasını 55 ve standart
sapmasının 12 olduğu bilinmektedir.
a) Buna göre [40,70] aralığında not alma olasılığı için ne söylenebilir?
b)Hangi not aralığı için bu aralıkta bir not alma olasılığı en az %75 olacaktır?
Çözüm:
Ana-kütle ortalaması µ =55
Ana-kütle standart sapması σ=12
a) [40,70] = [𝜇 − 𝑘𝜎, 𝜇 + 𝑘𝜎] = [55 − 12𝑘, 55 + 12𝑘] => 55 − 12𝑘 = 40 => 12k=55-
40=15
O halde k=5/4 ve Chebychev teoreminde [40,70] aralığının gözlemlerin en az 100 ∙
1
[1 − (5/4)2] % = 36%
Ampirik Kural
Birçok ana-kütle için bu kural geçerli kabul edilmektedir (özellikle çan-eğrisi şekline sahipse).
Bu kurala göre
0.4
0.3
0.3
0.3
Standart Normal
Standart Normal
Standart Normal
0.2
0.2
0.2
0.1
0.1
0.1
0.0
0.0
0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
z z z
Örnek. Newbold, Carlson, Thorne (2013). s. 77
Bir fabrikada ortalama dayanma süresi (ömrü) 1,200 saat ve standart sapması da 50 saat olan
ampuller üretilmektedir. Bu ampüllerin dayanma sürelerinin dağılımını,
a) dağılım hakkında herhangi bir bilgi olmadığı varsayımı altında, tarife diniz.
b)Dağılımın çan-eğrisi şeklinde olduğu varsayımı altında dağılım hakkında ne söylenebilir?
Çözüm:
a) Dağılım hakkında herhangi bir bilgi olmadığından ancak Chebychev teoremi
uygulanabilir. O halde, k>1 olmak üzere, [1200 − 50𝑘, 1200 + 50𝑘] olduğundan
• k=2 için ampullerin en az %75’inin dayanma süresi 1,100 ile 1.300 saat arasında
• k=3 için ampullerin en az %88.89’unun dayanma süresi 1,050 ile 1.350 saat
arasında
olduğu söylenebilir.
b)Ampullerin dağılımı çan-eğrisi şeklinde
• Ampullerin yaklaşık %68 kadarı için dayanma süresi 1,150 ile 1,250 saat
arasındadır
• Ampullerin yaklaşık %95 kadarı için dayanma süresi 1,100 ile 1,300 saat
arasındadır
• Ampullerin hemen hemen tamamı 1,050 ile 1,350 saat arasında dayanacaktır
Örnek.
𝑋~𝑁(𝜇 = 10, 𝜎 2 = 25) olduğuna göre
a) 𝑃(4 < 𝑋 < 16) =?
b) 𝑃(𝑋 ≥ 𝑥0 ) = 0.10 ise x0=?
Çözüm.
a)
4 − 10 𝑋 − 𝜇 16 − 10
𝑃(4 < 𝑋 < 16) = 𝑃 ( < < )
5 𝜎 5
6 6 6 6
= 𝑃 (− < 𝑍 < ) = Φ ( ) − Φ (− )
5 5 5 5
= 2Φ(1.2) − 1 ≅ 2(0.8849) − 1 = 𝟎. 𝟕𝟔𝟗𝟖
b) 𝑃(𝑋 ≥ 𝑥0 ) = 0.10 olduğuna göre 𝑃(𝑋 < 𝑥0 ) = 0.90. O halde
𝑋 − 𝜇 𝑥0 − 10
𝑃( ≤ ) = 0.90
𝜎 5
𝑃(𝑍 ≤ 𝑧0 ) = 0.90 => Φ(𝑧0 ) = 0.90
ve
𝑥0 − 10
𝑧0 = ≅ 1.28 => 𝒙𝟎 = 𝟏𝟔. 𝟒
5
Ki-Kare Dağılımı
𝑋~𝑔𝑎𝑚𝑚𝑎(𝑟, 𝜆) ise X r.d.nin o.y.f.
𝜆𝑟 𝑟−1 −𝜆𝑥
𝑓(𝑥; 𝑟, 𝜆) = 𝑥 𝑒 ,𝑥 > 0
Γ(𝑟)
𝑘 1
k pozitif bir tamsayı olmak üzere, 𝑟 = 2 ve 𝜆 = 2 ise
𝑘 1 1 𝑘
−1 −
𝑥
𝑓 (𝑥; 𝛼 = , 𝜆 = ) = 𝑥 2 𝑒 2, 𝑥 > 0
2 2 𝑘 𝑘
Γ(2)22
olur ve bu durumda X r.d. k serbestlik dereceli 𝜒 2 (Ki-Kare) dağılımına sahiptir denir; kısaca
2
𝜒(𝑘) yazılır.
𝑟 𝑟
Not: 𝑋~𝑔𝑎𝑚𝑚𝑎(𝑟, 𝜆) ise 𝐸(𝑋) = 𝜆 ve 𝑉𝑎𝑟(𝑋) = 𝜆2
Teorem.
𝑋1 , 𝑋2 , … , 𝑋𝑛 r.d.leri, ana-kütle ortalaması 𝐸(𝑋𝑖 ) = 𝜇 ve ana-kütle varyansı 𝑉𝑎𝑟(𝑋) = 𝜎 2 olan bir
rasgele örneklem olsun. Bu durumda
a) 𝐸(𝑋̅) = 𝜇
𝜎2
b) 𝑉𝑎𝑟(𝑋̅) = 𝑛
c) 𝐸(𝑆 2 ) = 𝜎 2