You are on page 1of 122

Olasılık,

Rastgele Değişkenler
ve
İstatistik
Dr. Cahit Karakuş

Esenyurt Üniversitesi
İçindekiler
1. İSTATİSTİK........................................................................................................................................ 5
1.1. Merkezi Eğilim Ölçümleri ........................................................................................................ 5
2. Olasılık ........................................................................................................................................... 15
2.1. Olasılıklarda toplama ve çarpma kuralları ............................................................................ 18
2.2. Koşullu olasılık ....................................................................................................................... 20
2.3. Bayes Kuramı......................................................................................................................... 25
3. Faktoriyel - Permütasyon - Kombinasyon ..................................................................................... 31
3.1. Faktoriyel .............................................................................................................................. 31
3.2. Permütasyon (Sıradüzen) ...................................................................................................... 32
3.3. Kombinasyon (Birleşim) ........................................................................................................ 34
3.4. İki Terimli (Binom) Katsayılar ................................................................................................ 39
4. Olasılık Dağılımları (Probability Distribution) ................................................................................ 41
4.1. Rassal Değişkenler................................................................................................................. 41
4.2. Rasgele – Değişken Sürekli Olasılık Dağılımı ......................................................................... 44
4.3. Ayrık Olasılık Dağılımı ............................................................................................................ 49
4.3.1. Bernoulli Dağılımı .......................................................................................................... 49
4.3.2. Binom Dağılımı .............................................................................................................. 50
4.3.3. Poisson Dağılımı ............................................................................................................ 55
4.3.4. Hipergeometrik Dağılım ................................................................................................ 61
4.4. Sürekli Rassal Değişkenler ..................................................................................................... 63
4.4.1. Düzgün Dağılım Fonksiyonları ...................................................................................... 63
4.4.2. Olasılık Yoğunluk Fonksiyonu ........................................................................................ 66
4.4.3. Normal Dağılım ............................................................................................................. 70
Uygulama .......................................................................................................................................... 82
3. Eğri uydurma ve en küçük kareler yöntemi .................................................................................. 87
Linear Regression .............................................................................................................................. 88
4. Markov Zincirleri Analizi.............................................................................................................. 103
4.1. Stokastik (Rassal) Süreçler .................................................................................................. 103
4.2. Markov Zinciri ile Olasılık Analizleri .................................................................................... 108
4.3. Ergodik Markov Zincirleri .................................................................................................... 115
4.4. Denge Durumu Koşulları ..................................................................................................... 118
5. Kaynaklar..................................................................................................................................... 122
1. İSTATİSTİK
1.1. Merkezi Eğilim Ölçümleri
Aritmetik ortalama:

∑𝑛𝑖=1 𝑥𝑖 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝜇= =
𝑛 𝑛

Dağılımın yapısı hakkında sadece ağırlık ortalamanın verdiği bilginin yetersiz olduğu
anlaşılmaktadır. Bu nedenle dağılımın değişkenlik ölçüleri: Ortalama mutlak sapma,
varyans, standart sapma ve değişim katsayıları ile hesaplanır.

Dağılım Genişliği:
Dağılım Genişliği (Aralık), Bir veri kümesindeki en büyük değer ile en küçük değer
arasındaki farktır. DG= Maks(A) – Min(A)

Mod:
Mod dağılım kümesinde olasılığı en yüksek değerdir. Dizide en çok tekrarlanma
sayısıdır. Dağılımda en yüksek olasılık değeri birden fazla nokta ile temsil ediliyorsa,
mod bu değerlerin hepsine karşılık geldiğinden sonuç tek anlamlı olmaktan çıkar.
Böylesi durumlarda dağılımın bimodal, trimodal ya da multimodal olduğundan söz
edilir.

Medyan – Ortanca:
Sınıflandırılmamış serilerde ortanca hesaplanırken, veriler öncelikle küçükten büyüğe
doğru sıralanırlar. n çift ise n/2 değer ile n/2+1 değerlerin ortalaması, n tek ise
(n+1)/2 değeri ortancadır.
Ortalama Mutlak Sapma (OMS):
OMS, Verilerin ortalamalarından sapmalarını gösteren bir dağılım ölçüsüdür.
Değişkenlik düzeyinin anlaşılması için kullanılır.

∑𝑛𝑖=1|𝑥𝑖 − 𝜇|
𝑂𝑀𝑆 =
𝑛

Kıyaslanırken aynı ortalamaya sahip olsalar bile, Ortalama Mutlak Sapmalarının farklı
olduğu görülmektedir. OSM’si küçük olan veriler ortalamadan daha az sapar, yani
değişkenliği daha az olması şeklindedir.
Varyans - Standart Sapma:
Bir veri dağılımındaki değişimin önemli bir ölçüsü varyanstır. Varyansın karekökü
alınarak standart sapma elde edilir.

∑𝑛
𝑖=1(𝑥𝑖 −𝜇)
2
Örnek için Varyans: 𝑆2 =
𝑛−1
∑𝑛
𝑖=1(𝑥𝑖 −𝜇)
2
Ana Kütle için Varyans : 𝜎2 =
𝑁

∑𝑛
𝑖=1(𝑥𝑖 −𝜇)
2
Örnek için Standart Sapma: 𝑆=√
𝑛−1

∑𝑛
𝑖=1(𝑥𝑖 −𝜇)
2
Ana Kütle için Standart Sapma: 𝜎=√
𝑁

Yorum: Varyansı daha küçük olanın değerleri daha homojendir.

Not: Örneklem için neden (n-1)’e bölünüyor ?


10 koltuk bulunan bir minübüse yolcular sırasıyla binsinler. İlk yolcunun 10 koltuktan
birini seçme serbestliği var. İkinci yolcunun kalan 9 koltuktan birini seçme serbestliği
var. Bu şekilde devam edilirse, 9. yolcunun kalan 2 koltuktan birini seçme serbestliği
var. Ancak 10. yolcunun koltuk seçme serbestliği kalmamıştır. Demek ki 9 yolcunun
seçme serbestliği varken 1 yolcunun yoktur.
Değişim Katsayısını (DK):
Değişim katsayısı standart sapmanın karşılaştırmadaki dezavantajını ortadan kaldıran
ve iki veya daha fazla serinin dağılımlarını karşılaştırarak hangi serideki birimlerin
daha homojen olduklarını belirlemek amacıyla kullanılan bir ölçüdür.

𝑠
𝐷𝐾 = 100
𝜇
Verilerin ortalamaları ve standart sapmaları arasında büyük farklılıklar olduğunda,
karşılaştırma için değişim katsayısının kullanılması daha uygun olacaktır.

Çarpıklık Katsayısı:
Dağılımın ortalamaya göre biçimine ilişkin bazı bilgileri çarpıklık ve basıklık katsayıları
ile öğrenebiliriz. Çarpıklık Katsayısı aşağıdaki eşitlik ile hesaplanabilir,

∑𝑛𝑖=1(𝑥𝑖 − 𝜇)3⁄
𝑛
Ç𝐾 =
𝑆3

Merkezi Eğilim Ölçüleri Yardımıyla Serilerin Çarpıklığının Hesaplanması:


Serilerin mod ya da medyanının aritmetik ortalamadan farkının o serinin standart
sapmasına bölünmesi ile serinin asimetrisi yani çarpıklığı hesaplanabilir. Bulucusunun
adından dolayı Pearson Asimetri Ölçüsü denilen bu çarpıklık katsayıları (ÇK)
aşağıdaki formüller yardımıyla hesaplanır.
3( 𝜇−𝑀𝑒𝑑𝑦𝑎𝑛)
Ç𝐾 = (𝜇 − 𝑀𝑜𝑑)/𝜎 ve Ç𝐾 = 𝜎

ÇK=0 ise dağılım simetriktir.


ÇK<0 ise dağılım sola doğru çarpık ya da - yöne eğilimlidir.
ÇK>0 ise dağılım sağa doğru çarpık ya da + yöne eğilimlidir.
Basıklık Katsayısı:

∑𝑛𝑖=1(𝑥𝑖 − 𝜇)4⁄
𝑛
𝐵𝐾 = −3
𝑆4
BK=0 ise dağılımın yüksekliği standart normal dağılıma uygundur.
BK<0 ise dağılım standart normal dağılımdan daha basıktır.
BK>0 ise dağılım standart normal dağılımdan daha sivridir.

Örnek Büyüklüğünün Belirlenmesi:


Bazı durumlarda, yapılan tahminlerde belli bir doğruluk veya isabet derecesine
ulaşmak hedef olarak alınabilir. Bu gibi durumlarda istenen hedefe ulaşabilmek için
örnek büyüklüğünün hesaplanmasında aşağıdaki formüller kullanılabilir.
Merkezi eğilim ölçülerinin kıyaslanması:
A B C
Ortalama
Maksimum
Minumum
Dağılım Genişliği
OMS
Varyans
Standart Sapma
Değişim Katsayısı
Çarpıklık Katsayısı
Basıklık Katsayısı

 A ve B verileri aynı ortalama ve medyana sahip ise Ortalama mutlak sapma,


varyans, standart sapma ve değişim katsayıları değerleri kıyaslanır.
 Ortalama mutlak sapma, varyans, standart sapma ve değişim katsayılarından
daha homojen diyebilmek için hesaplanan katsayıların bir birine benzer olması
gerekir.
 Çapıklık katsayıları A’ya ait verilerin, B, C’lere ait veriler ile kıyaslanarak yorum
yapılır.
 Basıklık katsayıları standart normal dağılımdan daha basık olup olmadığı ya da
birlerine göre basıklık durumları karşılaştırılır.

Soru: Bir fabrikada bulunan üç adet üretim bandında aylık üretilen ürün miktarları aylık
olarak aşağıda verilmiştir.
A B C
Ay xi xi xi
1 11 8 15
2 11 7 10
3 10 1 15
4 9 6 20
5 8 10 10
6 12 10 2
7 10 5 10
8 10 40 9
9 9 4 2
10 8 10 10
11 10 9 10
12 12 10 7
Herbir üretim bandı için “Aritmetik Ortalamayı” hesaplayınız.

A B C
Toplam 120 120 120
N 12 12 12
Aritmetik Ortalama 10 10 10

Dağılımın yapısı hakkında sadece ağırlık ortalamanın verdiği bilginin yetersiz olduğu
anlaşılmaktadır. Bu nedenle dağılımın değişkenlik ölçüleri: Ortalama mutlak sapma,
varyans, standart sapma ve değişim katsayıları ile hesaplanır.

a) Herbir üretim bandı için maksimum ve minumum üretim miktarını bulunuz ve


“Dağılım Genişliğini” hesaplayınız..

A B C
Maksimum 12 40 20
Minumum 8 1 2
Dağılım Genişliği 4 39 18

b) Herbir üretim bandı için “Medyan - Ortanca” değerini bulunuz.

1 2 3 4 5 6 7 8 9 10 11 12
A 8 8 9 9 10 10 10 10 11 11 12 12
B 1 4 5 6 7 8 9 10 10 10 10 40
C 2 2 7 9 10 10 10 10 10 15 15 20
n=12 ve çift olduğundan 6’ıncı ve 7’inci değerlerin ortalaması alınır.
A B C
Medyan – Ortanca 10 (8+9)/2=17/2 10
c) Herbir üretim bandı için “Ortalama Mutlak Sapmayı - OMS” hesaplayın.

A B C
Ay I Xi-Xo I I Xi-Xo I I Xi-Xo I
1 1 2 5
2 1 3 0
3 0 9 5
4 1 4 10
5 2 0 0
6 2 0 8
7 0 5 0
8 0 30 1
9 1 6 8
10 2 0 0
11 0 1 0
12 2 0 3
Toplam 12 60 40

A B C
OMS 1 5 3.33

A, B ve C kıyaslanırken aynı ortalamaya sahip olsalar bile, Ortalama Mutlak


Sapmalarının farklı olduğu görülmektedir. A’nın OSM’si B’nin ve C’nin OSM’sinden
küçük olduğundan A’ya ait veriler ortalamadan daha az sapar, yani değişkenliği daha
az olması şeklindedir.
d) Herbir üretim bandı için “Varyansları” ve “Standart Sapmaları” hesaplayınız.
A B C
2 2
Ay (Xi-Xo) (Xi-Xo) (Xi-Xo)2
1 1.00 4.00 25.00
2 1.00 9.00 0.00
3 0.00 81.00 25.00
4 1.00 16.00 100.00
5 4.00 0.00 0.00
6 4.00 0.00 64.00
7 0.00 25.00 0.00
8 0.00 900.00 1.00
9 1.00 36.00 64.00
10 4.00 0.00 0.00
11 0.00 1.00 0.00
12 4.00 0.00 9.00
20.00 1,072.00 288.00

Varyans - Standart Sapma:

A B C
Varyans 20/11 1072/11 288/11
Standart Sapma 1.35 9.87 5.12

A’nın varyansı ya da standart sapması, B’nin ve C’nin varyansından daha küçük


olduğundan A’nın değerleri daha homojendir.

e) Herbir üretim bandı için Değişim Katsayısını (DK) hesaplayınız.

A B C
Değişim Katsayısı 13.48 98.72 51.17

Verilerin ortalamaları ve standart sapmaları arasında büyük farklılıklar olduğunda,


karşılaştırma için değişim katsayısının kullanılması daha uygun olacaktır.
f) A, B, C üretim bandı için “Çarpıklık” ve “Basıklık” katsayıları aşağıda verilmiştir.
Yorumlayınız.

A B C
Çarpıklık Katsayısı 0.00 2.24 0.12
Basıklık Katsayısı -1.29 4.18 -0.63

A simetriktir, B sağa çarpıktır. C ise A göre sağa B göre ise sola çarpıktır.
A basıktır. B sivridir. C ise A ya gçre daha az basıktır.

g) Aşağıda verilen tabloda hesaplanan değeleri yerine koyunuz. Kıyaslayınız.


A B C
Ortalama 10.00 10.00 10.00
Maksimum 12.00 40.00 20.00
Minumum 8.00 1.00 2.00
Dağılım Genişliği 4.00 39.00 18.00
OMS 1.00 5.00 3.33
Varyans 1.82 97.45 26.18
Standart Sapma 1.35 9.87 5.12
Değişim Katsayısı 13.48 98.72 51.17
Çarpıklık Katsayısı 0.00 2.24 0.12
Basıklık Katsayısı -1.29 4.18 -0.63

Merkezi eğilim ölçülerinin kıyaslanması:


 A ve B verileri aynı ortalama ve medyana sahip ise Ortalama mutlak sapma,
varyans, standart sapma ve değişim katsayıları değerleri kıyaslanır.
 Ortalama mutlak sapma, varyans, standart sapma ve değişim katsayılarından
daha homojen diyebilmek için hesaplanan katsayıların bir birine benzer olması
gerekir.
 Çapıklık katsayıları A’ya ait verilerin, B, C’lere ait veriler ile kıyaslanarak yorum
yapılır.
 Basıklık katsayıları standart normal dağılımdan daha basık olup olmadığı ya da
birlerine göre basıklık durumları karşılaştırılır.
2. Olasılık
Olasılık:
Bir olayın ortaya çıkış sayısı, toplam olaylar sayısına bölündüğünde, elde edilen oran o olayın
olasılığıdır.
P=a/n

Örnek: Bir zarın bir kere atılışı deneyinde her olayın olasılığı 1 / 6 dır. Örnek uzay ise;
S = {1, 2,3,4,5,6 }

2 veya 5’in üste gelmesi olayını A ile gösterirsek;

A = { 2, 5 } P(A) = 1/6 + 1/6 =2/6 = 1/3

A’nın ortaya çıkmama olasılığını(1,3,4 veya 6’nın üste gelmesi) A' ile gösterirsek;

P(A' ) = 1/6 + 1/6 + 1/6 + 1/6 = 4 / 6 = 2/ 3 veya


P(A' ) = 1- P(A) = 1 – 1/ 3 = 2 / 3

Örnekten anlaşılacağı gibi bir olayın olasılığı 0 ve 1 arasında değişmektedir. Olayın ortaya
çıkması mümkün değilse olasılığı 0, ortaya çıkması muhakkak ise olasılığı 1 dir.

Eğer bir olayın meydana gelme olasılığı p ise, olayın gerçekleşme olasılığının oranı(
gerçekleşme şansı) p/q, gerçekleşmeme olasılığının oranı q / p dir.
Örneğin zar atıldığında 3 veya 4 gelmemesi şansı (2 / 3) / (1 / 3 ) = 2 /1 dir.

Olasılık Yasaları
1) Bir olayın olma olasılığı [0,1] aralığında bir sayıdır. 0 olasılığı olayın olmazlığını, 1 ise
kesin olurluğunu belirtir.
2) Bir olayın olabilirlik ile olamazlık olasılıklarının toplamı daima 1 dir.
3) İki olayın birlikte olma olasılığı, birincinin olma olasılığı ile ikincinin birinci olayla birlikte
olma olasılığının çarpımına eşittir.

Bu yasaların matematiksel ifadeleri, p olasılık fonksiyonu, A olay, A c onun tümleyeni olmak


üzere, aşağıdaki bağıntılarla verilir.
1. 0  p( A)  1
2. p( Ac )  1  p( A)
3. p( A  B)  p( A). p( B | A)
Dağılım: Olaylar (ya da önermeler) üzerinde tanımlı ve bir olayın kaç kez olduğunu gösteren
bir fonksiyondur. Olasılığın bir uygulaması olan istatistikte önem taşır.

Olasılığın incelenmesinde sonucu bilinemeyen deneyler gözönüne alınır. Bu deneylerin bir


çoğu tekrar edilebilir deneylerdir ve rasgele deneyler(random experiment) olarak
adlandırılır. Her deneyin sonucu gözlenebilir ve liste olarak yazılabilir. Üretilen makine
parçaları arasından kusurlu olanları belirlemek, bir ana kitle içinden örnek seçmek
tekrarlanabilir deneylerdir.

Örnek: Madeni para ile iki defa atış yapalım. Bu iki atımda 4 durumdan biri ortaya çıkacaktır.
Y ile yazı , T ile tura gösterilmek üzere; YY YT TY TT.

Deneylerin sonuçları olay olarak tanımlanmaktadır. Zar ile yapılan atışta olaylarımız veya
sonuçlarımız 1,2,3,4,5 ve 6 nın üste gelmesi olacaktır. Bu sonuçların herbiri birer basit
olaydır. Özetle basit olay tek bir deneyde tek bir sonuç veren olaylardır. P(E) ile basit olayın
gerçekleşme olasılığı gösterilir. Madeni para ile tek atışta tura gelmesi basit olaya örnek
olarak verilebilir. Bir deneyin bütün sonuçları o deneyin örnek uzayını meydana getirir.
Örnek uzay S harfi ile gösterilir.

Bir deneyin olası sonuçlarından herbirini pi ve örnek uzayı P ile gösterirsek bir zarın
atılışında örnek uzay; P= {p1 , p2, .......,p6 } şeklindedir.

Örnek: Bir lotarya oyununda üç basamaklı bir tam sayı rasgele seçilmektedir.Üç basamaklı
sayıların herbiri olası bir sonuçdur. Örnek uzay: S = { 000,001,002,.........,998,999 }

Örnek: Bir kutuda siyah ve sarı renkde toplar bulunmaktadır. Kutudan bir top çekip tekrar
yerine koyarsak ve bu deneyi 100 defa tekrarlarsak çekilen topun sarı ya da siyah olması
gerektiğinden deneyin 2 basit olayı olacaktır.
E 1  siyah topun çekilmesi,
E 2  sarı topun çekilmesi,
örnek uzay S = {E1 , E2 }

İki veya daha çok olayın birlikte veya birbiri ardına gerçekleşmesi ile bileşik olay meydana
gelir. Bileşik olayın gerçekleşme olasılığı E1 , E2 iki olayı göstermek üzere P(E1,E2)
şeklindedir. Para ile iki atış yapıldığında; YY YT TY TT sonuçlarının çıkması bir bileşik
olaydır. Aynı şekilde zarla yapılan 2 atışta 6 x 6=36 sonucu da bileşik olaydır. Basit ve bileşik
olay tanımlarından başka olayı bağımlı ve bağımsız olay olarak da tanımlayabiliriz. Bir olayın
ortaya çıkması diğer bir olayın veya olayların ortaya çıkmasına neden olmuyorsa bu olaylar
bağımsız olaylardır. Zarın 2 defa atılmasında 1. atışın sonucu, 2. atışı etkilemeyeceği için
bağımsız olay olarak adlandırılır. Bir olayın meydana gelmesi diğer bir olayın veya olayların
meydana gelmesini etkiliyorsa bu tür olaylar bağımlı olaylardır. 52’lik iskambil destesinden
iadesiz olarak arka arkaya 2 kağıt çekildiğinde, ikinci kartın sonucu birinci kartın sonucuna
bağımlıdır.

Nisbi Frekansla Olasılık Belirleme


Para ile atış yapıldığında deney sonuçları yazı ve tura basit olaylarından biri olacaktır.
Deneyin 300 defa tekrarlandığını varsayarsak ilk atışlarda yazı olayının toplam atışa oranı %
50 ‘den uzak olacak, deney sayısı çoğaldıkça oran % 50’ye çok yakın seyredecektir. y
ekseninde yazı gelme sayısının toplam atış sayısına oranı (m / n), x ekseninde de toplam atış
sayısı(n) gösterildiğinde, aşağıdaki şekilde görüldüğü gibi atış sayısı arttıkça yazı sayısı (m)
%50 cıvarında olacaktır.

m/n

0.6

0.5

0.4

50 100 150 200 250 300 n

Bir deney çok tekrar edilirse o olayın nisbi frekansı yaklaşık olarak o olayın olasılığına eşit
olacaktır. Nisbi frekans bir olayın olasılığını vermemekte ancak gerçek olasılığın tahminini
yapabilmemizi sağlamaktadır. Para atışında görüleceği gibi m ≤ n olacaktır. Yazı sayısı
toplam atış sayısından küçük veya eşittir. Nisbi frekans;
m / n <= 1
atışlarda hiç yazı çıkmamışsa m=0 ve m / n =0 olacaktır. Bu durumda nisbi frekans;
0≤m/n≤1
m / n, P(A)’nın bir tahmini olduğuna gore P(A) için de aynı şey söylenebilir;
0 ≤ P(A) ≤ 1

nisbi frekans yaklaşımına göre bir olayın olasılığının 1 olması o olayın ortaya çıkmasının kesin
olduğu anlamına gelmemektedir. n’nin çok büyük olduğu durumlarda olay çok sayıda
ortaya çıkmaktadır. Nisbi frekans yaklaşımı ancak tekrarlanabilir olaylara uygulanabilir.
Tekrar edilemeyen olaylara uygulanması risklidir. Örneğin uzay deneyinin başarı olasılığının
belirlenmesinde olay fazla tekrar edilemiyeceği için uygulamak zordur.
2.1. Olasılıklarda toplama ve çarpma kuralları
Olasılığın toplama ve çarpım kuralı olmak üzere iki temel kuralı vardır. Bu kurallar, olayların
birleştirilerek incelenmesine olanak verir.

Toplam olasılık - Birbirlerini Engeleyen Olaylar:


Toplama kuralının uygulanabilmesi için olayların birbirini dışlayan olaylar olması gerekir.
Bileşik olayların birbirlerini engelleyip engellememelerine göre olasılıklar değişecektir.
A ve B birbirini engelleyen olaylar olduğundan A olayının veya B olayının ortaya çıkması bu
olayların basit olasılıklarının toplamına eşittir. (A+B) ile gösterilir. Birbirlerini engelleyen
olayların olasılıkları toplamı 1 dir.

P(A+B) = P(A) + P(B)


P( A veya B) = P(A) + P(B)

Bileşik bir olayın ortaya çıkma olasılığı o olayı meydana getiren basit olayların olasılıkları
toplamına eşittir. Örneğin 2 zarın birlikte atılışında toplam 4 gelme olasılığı P(A), 1-3, 3-1 ve
2-2 basit olayların olasılıkları toplamına eşittir:
P(A) = 1/ 36 + 1 / 36 + 1 / 36 = 1/ 12

Örneğin bir deste iskambil kağıdından bir defada bir as çekme (A) ve bir papaz çekme(B)
olayları birbirini engeller. Bir defada hem as hem de papaz çekme olasılığı sıfırdır.
P(A , B) = 0

Benzer şekilde 2 zarın bir arada atılışında toplam 5 gelme olasılığı 4 basit olayın olasılıkları
toplamına eşittir. (2-3),(3-2),(4-1),(1-4)

P(A)=P(2-3)+P(3-2)+P(1-4)+P(4-1) = 1 / 36 + 1 / 36 + 1 / 36 + 1 / 36= 4 / 36
Toplam Olasılık - Birbirlerini Engellemeyen Olaylar:
Eğer olaylar birbirini engellemiyorsa A olayının veya B olayının ortaya çıkması, ya A olayının
ya B olayının ya da A ve B olaylarının her ikisinin birlikte gerçekleşmesi anlamındadır. A ve B
birbirlerini engellemiyorsa;

P(A+B)=P(A) + P(B) – P(AB)


veya P(A veya B)=P(A) + P(B) – P(A ve B)

örnek: Bir deste iskambil kağıdından bir vale çekme olayı A ile, bir maça çekme olayı da B ile
gösterilsin. Bu iki olay birbirini engellemediğinden A veya B nin olma olasılığı yani maça
valesi çekme olasılığı vardır. Bu durumda A’nın veya B’nin olma olasılığı;

P(A+B)=(4/52) + (13/52)-(1/52)=4/13
2.2. Koşullu olasılık
Çarpma kuralı(bağımlı olay)
Bağımlı iki olaydan B olayı A olayından sonra ortaya çıkıyorsa,olayların birlikte gerçekleşme
olasılığı:
P(A ve B) =P(A) * (B \ A)

Bağımlı olaylardan birinin(A) gerçekleştiği bilindiğinde diğerinin (B) ona bağlı olarak
meydana gelme olasılığı;

P(B\ A) =P(A ve B) / P(A)

Örnek: Elektrik - Elektronik mühendisliği bölümü 2. sınıf öğrencilerinin %25’i matematik


dersinde, %15’i de hem matematik hem fizik dersinde üstün başarı göstermiştir. Bu sınıftan
rastgele bir öğrenci seçildiğinde, seçilen öğrenci matematik dersinden üstün başarılı ise, fizik
dersinden de üstün başarılı olma olasılığı nedir ? M: Matematik, F: Fizik.
P(M) = 0.25
P(M ve F) = 0.15
P(F \M)=P(M ve F) / P(M) =0.15 / 0.25=0.60

Çarpma kuralı(bağımsız olay)


Bağımsız olaylarda çarpma kuralı;
P(A ve B)= P(A) * P(B) şeklindedir.

Aynı anda atılan iki zarın üzerinde 2 olması olasılığı:


P( 2 ve 2)= P(1/6) * P(1/6) = 1/36

Örnek: Bir piyangoda 8 boş, 2 ikramiyeli bilet vardır. Bu piyangodan 2 bilet alan bir kişinin
ikramiye kazanma olasılığı nedir ? (iadesiz)
Birinci biletin kazanma olasılığı 2/10’dur. Birinci bilet ikramiye kazanırsa geriye 8 boş 1
ikramiyeli 9 bilet kalır. Ikinci biletin kazanma olasılığı 1/9’dur. Her iki biletin de ikramiye
kazanma olasılığı:

P(B1ve B2)= (2/10)*(1/9) = 1/45

Örnek: Bir kutuda 5 adet yeşil renkte, 3 adet de beyaz renkte top bulunmaktadır. Kutudan 2
top çekildiğinde her ikisinin yeşil olma olasılığı nedir ? (Toplar kutuya iade edilmiyor)
A: ilk çekilen topun yeşil olması olayı,
B: ikinci çekilen topun yeşil olması olayı gösterilsin.
A ve B bağlı olaylar olduğu için P(A ve B) hesaplanacaktır. 1. topun yeşil olma olasılığı :
P(A) = (5 / 8 )
1. topun yeşil olması durumunda 2. topun yeşil olma olasılığı:
P(B \ A) = (4 / 7)
P( A ve B ) = P(A) * P(B \ A) = (5/8)*(4/7) = 0.357

Örnek: A’nın 15 yıl sonra hayatta kalma olasılığı %80, B’nin 15 yıl sonra hayatta kalma
olasılığı %60 ise, her ikisinin 15 yıl sonra hayatta kalma olasılığı nedir?

P(A ve B)=0.80 * 0.60 = 0.48

Olasılık ve Kümeler:
Olasılıkla ilgili bu hesaplamalar kümelerle de ifade edilebilir. Bir deneyin sonuçlarını veya
basit olaylarını bir örnek uzayı içinde noktalar olarak belirtebiliriz. Basit olaylar noktalarla
gösterilebilirler ancak bunların toplamı olan bileşik olaylar bir küme veya noktalar grubu
olarak gösterilirler. A ve B gibi birbirini engellemeyen iki bileşik olay Venn diyagramı ile
aşağıdaki gibi çizilebilir:
A∩B
A B

Birbirini engelleyen olaylarda ortak nokta yoktur yani P(AB) = 0 olmaktadır.

A∩B=0
A B
Küme notasyonu kullanılırken A + B olayı A U B (bileşim) olarak, AB olayı da A∩ B
(kesişim) olarak gösterilir.

Örnek: Bir gazete bayii toplam 200 kişinin A,B,C dergilerine abone olma sayılarını aşağıdaki
gibi saptamıştır:

Dergi Kişi sayısı

A dergisi 50

B dergisi 70

C dergisi 80

A ve B dergisi 15

A ve C dergisi 12

B ve C dergisi 20

A, B ve C dergisi 10

Hiç biri 37

Venn Diyagramı:

A∩B
A B

A∩B∩C

A∩C B∩C
C

Bir kişinin bu dergilerden en az birine abone olma olasılığı :

P( hiç abone olmama) = 1- (37/200) = 0.815

Bir kişinin A veya C dergisine abone olma olasılığı:

P(A + C) =P(A) + P(C) – P(AC) = (50 / 200) + ( 80 / 200) – (12/ 200) = 0.59
Soru: 12 adet Kırmızı, 4 adet Siyah, 4 Adet Yeşil ve 4 adet Mavi renkli GSM telefon kılıfları
bir torbanın içerisine konulmuştur. Torbanın içerisinden 1 adet kılıf çekilmiştir. Çekilen
kılıfın Kırmızı veya Yeşil olma olasılığını bulunuz.

Toplama:
 Ayrık olaylar:
P(K veya Y)=P(K) + P(Y)

Soru ayrık olay olasılık sorusudur.


P(K)=12/24=1/2=0.5
P(Y)=4/24=1/6
P(K veya Y)=P(K) + P(Y)=12/24+4/24=16/24=2/3

Soru: Bir mağazadaki reyonda kutunun içerisinde aşağıda tabloda verilmiş ölçütlerde ve
renklerde tişörtler konulmuştur. Bir adet tişörtün satıldığını biliyoruz.
Mavi Kırmızı Beyaz Siyah
Küçük 3 3 3 3
Orta 4 4 4 4
Büyük 3 3 3 3

a) Satılan tişörtün Mavi olma olasılığı nedir?


10/40=1/4
b) Satılan tişörtün Beyaz renkli veya Orta boy olma olasılığı nedir?

 Birleşik olaylar:
P(B veya O)=P(B) + P(O) – P(B ve O)
=10/40+16/40-4/40=22/40=11/20

c) Satılan tişörtün Beyaz renkli ve Orta boy olma olasılığı nedir?


P(B ve O)=4/40
Soru: Bir kutuda 6 adet limon ve 4 adet portakal bulunmaktadır.
a) İadeli olarak sırayla torbadan çekilen iki narenciyenin ilkinin portakal ve diğerinin
limon olma olasılığı nedir?
İaedeli, Birbirinden bağımsız olaylar:
P(P ve L)= P(P)*P(L), Portakal çekiliyor ve tekrar kutuya konuluyor.
P(P ve L)=4/10 * 6/10=24/100=6/25

b) İadesiz olarak sırayla torbadan çekilen iki narenciyenin ilkinin portakal ve diğerinin
limon olma olasılığı nedir?
İaedesiz, Birbirine bağımlı olaylar:
P(P ve L)= P(P)*P(L /P), Portakal çekildikten ve kutudan ayrıldıktan sonra geriye
kalanlardan limon çekilme olasılığı.
İlki portakal, ikincisi limon, P(P ve L)=4/10 * 6/9 =24/90=8/30=4/15
İlki limon, ikincisi portakal, P(L ve P)=6/10 * 4 /9 =24/90=4/15

c) İadesiz olarak sırayla torbadan çekilen iki narenciyenin de limon olma olasılığı nedir?
İaedesiz, Birbirine bağımlı olaylar: P(L ve L)= P(L)*P(L /L), Limon çekildikten ve
kutudan ayrıldıktan sonra geriye kalanlardan limon çekilme olasılığı.
P(L ve L)= 6/10 * 5/9=30/90=1/3
2.3. Bayes Kuramı
Thomas Bayes tarafından geliştirilen, koşullu olasılıkların hesaplanmasında kullanılan bir
teoremdir. Bir olayın ortaya çıkmasında birden fazla bağımsız nedenin etkili olması
durumunda, bu nedenlerden herhangi birinin o olayı meydana getirme olasılığını
hesaplamada kolaylık sağlar.

P(A|B) =B olayı gerçekleştiğinde A olayının gerçekleşme olasılığı


P(A) = A olayının gerçekleşme olasılığı
P(B|A) = A olayı gerçekleştiğinde B olayının gerçekleşme olasılığı
P(B) = B olayının gerçekleşme olasılığı
B olayını etkileyen n adet birbirini engelleyen olayın veya nedenin (A 1, A 2 ,..............., A n )
bulunduğunu varsayarsak Bayes kuralına göre B olayının Ai nedeninden meydana gelme
olasılığı ;

P( A i ) * P ( B \ A i )
P( Ai \ B) =
∑ P( A i ) * P ( B \ A i )

i=1,2,3,....n

P( A i ) ile Ai olayının olasılığı,


P ( B \ A i ) ile de Ai olayının ortaya çıkması durumunda B’nin olasılığı gösterilmektedir.

Bayes Teoremi'nin açıklayabileceği dört durum vardır:


1- Bayes ’Teoremi, yeni bir düşünce oluşturmak amacıyla yeni kanıtlara dayalı bir
düşünceyi güncellememize yardımcı olur.
2- Bayes 'Theoremi yeni kanıtlar verildiğinde bir olasılığın gözden geçirilmesine yardımcı
oluyor.
3- Bayes Teoremi, yeni kanıtlara dayalı bir olasılık hakkındaki düşüncelerimizi
değiştirmemize yardımcı olur.
4- Bayes Teoremi yeni kanıtlara dayanan bir hipotezi güncellememize yardımcı olur.
Örnek: Küçük bir ofisde 3 adet fotokopi makinası kullanılmaktadır. Çekimlerin %60’ı
1.makinada, %30’u 2.makinada ve %10’u da 3.makinada yapılmaktadır. Makinaların fire
oranları da 1.makine için %10, 2.makine için %20 ve 3. makine için %40 olmaktadır. Tüm
kopyalar için hata oranı nedir ?

M1,M2,M3 makinaları, D hatalı kopyayı(fire) göstersin. Makinaların kullanılma olasılıkları:

P(M1) = 0.60 , P(M2) = 0.30 , P(M3) = 0.10 ve fire oranları;

P(D\ M1) = 0.10 , P(D\M2) = 0.20 , P( D\ M3) = 0.40

Olayları A , B , C ile gösterirsek;

A = M1 ∩ D , B = M2 ∩ D , C = M3 ∩ D yazılabilir. Önce A olayı için hesaplama yapalım:


P( A ) = P(M1 ∩ D ) = P(M1)*P(D\M1)= (0.60)*(0.10) = 0.06

Aynı şekilde diğer olaylar için de hesaplama yapabiliriz:

P( B ) = (0.30)* (0.20) = 0.06,


P( C ) = (0.10) * (0.40) = 0.04

Her makine için hesaplanan fire olasılıkların toplamı bize toplam fire olasılığını verecektir.

P( D ) = P( A ) + P( B ) + P( C ) = 0.06 + 0.06 + 0.04 = 0.16

Tüm kopyaların %16’ı hatalı çıkmaktadır diyebiliriz.


Soru: Motor üretilen bir fabrikada 4 adet üretim bandı bulunmaktadır. Herbir üretim
bandının günlük üretim oranları aşağıdaki tabloda verillmiştir.
A B C D
Üretim Oranı %20 %40 %30 %10

Üretilenlerden kusurlu olanların yüzdesi ise aşağıdaki tabloda verilmiştir.


A B C D
Kusurlu Yüzdeleri %2 %1 %5 %4

Kusurlu parçalar birbirinden bağımsız olarak A, B, C, D üretim bandlarında üretilmektedir.

Küme tanımı yapıldığında; A, B, C, D ve K kümeleri mevcuttur. K kümesinde A, B, C, D üretim


bandında üretilenlerden kusurlu ürünlerin oranları mevcuttur. Herbir üretim bandı için
kusurlu ürün miktarı belirlidir ve ayrıktır (iadesiz).

Kusurlu ürün miktarı, ilgili üretim bandında üretilen ürün miktarı ile kusurlu yüzdesi
çarpılarak bulunur. Bu nedenle herbir üretim band için hatalı olasılığı aşağıdaki çarpım ile
hesaplanır.

𝑃(𝐴 ∩ 𝐾)
𝑃(𝐴 /𝐾) =
𝑃(𝐴 ∩ 𝐾) + 𝑃(𝐵 ∩ 𝐾) + 𝑃(𝐶 ∩ 𝐾) + 𝑃(𝐷 ∩ 𝐾)

𝑃(𝐴 ∩ 𝐾) = 𝑃(𝐴) ∗ 𝑃(𝐾 /𝐴)


𝑃(𝐵 ∩ 𝐾) = 𝑃(𝐵) ∗ 𝑃(𝐾 /𝐵)
𝑃(𝐶 ∩ 𝐾) = 𝑃(𝐶) ∗ 𝑃(𝐾 /𝐶)
𝑃(𝐷 ∩ 𝐾) = 𝑃(𝐷) ∗ 𝑃(𝐾 /𝐷)

𝑃(𝐴 ∩ 𝐾) = 𝑃(𝐴) ∗ 𝑃(𝐾 /𝐴)

Günün sonunda rasgele bir motor seçiliyor ve kusurlu olduğu görülüyor.


a) Herbir üretim bandında üretim olasıkları hesaplayınız. P(A), P(B), P(C), P(D)
P(A)= 0.2
P(B)= 0.4
P(C)= 0.3
P(D)= 0.1
b) Herbir üretim bandı için hata olasılıklarını hesaplayınız. P(H/A), P(H/B), P(H/C),
P(H/D).

P(H/A)= 0.02
P(H/B)= 0.01
P(H/C)= 0.05
P(H/D)= 0.04

c) Bu kusurlu motorun A, B, C, D üretim bandında çıkma olasıklarını hesaplayınız.


Yorumlayınız.
P(AꓵH)=P(A)*P(H/A)=0.004
P(BꓵH)=P(B)*P(H/B)= 0.004
P(CꓵH)=P(C)*P(H/C)= 0.015
P(DꓵH)=P(D)*P(H/D)=0.004
Toplam=0.0270

P(A/H)=0.148, toplam hatalı olanlardan A daki hatalı olanların olasılığı


P(B/H)=1.25
P(C/H)=3.75

d) Söz gelimi günün sonunda 1000 ürün üretilmiş olsun


 Herbir üretim bandı için yüzde oranlarını kullanarak üretim miktarlarını bulunuz.
 Herbir üretim bandı için verilen kusurlu oranlarını kullanarak her bir üretim bandı
için kusurlu adetlerini bulunuz.

NA=200, NB=400, NC=300, ND=100 olur. Hatalı ürün miktarları ise;


NAH= NA*2 /100=4
NBH= NB*1 /100=4
NCH= NC*5 /100=15
NDH= ND*4 /100=4

Rasgele seçilen bir motor kusurlu olduğu görülüyor. Kusurlu motorun A üretim
bandında üretilme olasılığı nedir?
P(H/A)= NAH /( NAH + NBH + NCH + NDH )=4/27=0.148
e) Dallanma metotu ile çözüm

1000
A B C D
%20 %40 %30 %10

200 400 300 100

%2 %1 %5 %4

4 196 4 396 15 285 4 96

P(H/A)= NAH /( NAH + NBH + NCH + NDH )=4/27=0.148


P(H/B)= NBH /( NAH + NBH + NCH + NDH )=4/27=0.148
P(H/C)= NCH /( NAH + NBH + NCH + NDH )=15/27=0.555
P(H/D)= NDH /( NAH + NBH + NCH + NDH )=4/27=0.148
3. Faktoriyel - Permütasyon - Kombinasyon

3.1. Faktoriyel
(n+1)!=(n+1) x n!
n!=n x (n-1)!
(n-1)!=(n-1) x (n-2)!

0!=1
1!=1
n! = 1 x 2 x ... x n-1 x n

n büyüdükçe, n!’li bulmak güçleşir. Bu durumda Stirling formülü kullanılarak n!


yaklaşık olarak bulunur.
𝑛! = √2𝜋𝑛 𝑛𝑛 𝑒 −𝑛 ile yaklaşık değeri hesaplanabilir.

Teorem: n tane birbirinden farklı nesne sıralandığında elde edilecek değişik düzen
sayısı n!’dır.

Örnek: 7 kişi bir gişe önünde kaç farklı düzende sıralanabilir?


7!

Fatoriyel sorusu:
11 𝑛! (𝑛 − 1)!
=?
(𝑛 − 2)! (𝑛 + 1)!

11 𝑛! (𝑛 − 1)! 11 𝑛(𝑛 − 1)(𝑛 − 2)! (𝑛 − 1)! 11(𝑛 − 1)


= =
(𝑛 − 2)! (𝑛 + 1)! (𝑛 − 2)! (𝑛 + 1)𝑛(𝑛 − 1)! (𝑛 + 1)
3.2. Permütasyon (Sıradüzen)
Nesnelerin değişik düzenlerde sıralanma sayısı nasıl bulnur? Örneğin; 8 kişi bir sıraya kaç
farklı düzende oturabilir? n tane nesneyi sıralama, belirli bir sırada düzenleme ilgi alanımıza
giriyorsa, olası düzenlemelerin tümüne sıradüzen (permütasyon) adı verilir

Örnek: 1, 2, 3, 4, 5 rakamları ile hiçbir rakamı tekrarlamadan üç rakamlı kaç farklı sayı
yazılabilir?

Çarpma ilkesi: İlk göze, beş rakamın herhangi biri (1, 2, 3, 4, 5) ile yani 5 farklı şekilde
doldurulabilir. İkinci göze, geriye kalan dört rakamın herhangi biri ile yani 4 farklı şekilde
doldurulabilir. Son göze yani üçüncü göze, geriye kalan üç rakamdan bir ile yani 3 farklı
şekilde doldurulabilir. Çarpma ilkesine göre, oluşturulabilecek üç basamaklı sayıların toplam
sayısı; 5. 4 .3 = 60 olur.

Toplama ilkesi: Birincisi n1 farklı şekilde, ikincisi n2 farklı şekilde yapılabilen iki
işlemi göz önüne alalım. İki işlemden ancak birinden biri yapılabilirse, bu işlemlerden bir ya
da öteki (n1 + n2) yolda yapılabilir. Toplama ilkesi, sonlu sayıda işlemi içine alan durumlar
için de genellenebilir.

Örneğin bir öğrencinin Üniversiteye ulaşımda kullanacağı seçenekler: 3 farklı servis aracı, 2
farklı arkadaşın otomobili, Babasının veya bir komşunun otomobili olsun. Bu öğrenci o sabah
Üniversiteye kaç farklı yolla ulaşabilir?
Cevap: 3+2+2=7 olur.
𝑛!
𝑃(𝑛, 𝑘) = 𝑃𝑘𝑛 =
(𝑛 − 𝑘)!

Örnek: ORHAN sözcüğünün harflerinden iki harfli kaç farklı sözcük yapılabilir?

5!
𝑃(5,2) = 𝑃25 = = 5 ∗ 4 = 20
(5 − 2)!

Birbirinin aynı nesnelerin düzenlerinin sayısı incelendiğinde,


Teorem: n1 tanesi bir türden, n2 tanesi ikinci bir türden, ...,nk tanesi k nıncı türden olan
n=(n1+ ..+nk) tane nesne olsun. n tane nesnenin tümü sıralanırsa, elde edilecek farklı
düzenlerin sayısı,

𝑛!
oranından bulunur.
𝑛1 ! 𝑛2 ! … 𝑛𝑘 !
Örnek: İSTATİSTİK sözcüğünün harflerini her düzende kullanmak koşulu altında, kaç farklı
sözcük elde edebiliriz?
İ harfinden 3 adet
S harfinden 2 adet
T harfinden 3 adet
A harfinden 1 adet
K harfinden 1 adet
Toplam 5 adet harf vardır.
Toplam harf sayısı, n=5

10!
=50400
3!2!3!1!1!

Dairesel Düzen: n tane farklı nesneyi bir daire çevresinde sıralarsak elde edilecek farklı
düzenlerin sayısı (n-1)! bulunur.
Örnek: 7 kişi yuvarlak bir masa çevresinde kaç farklı düzende oturabilir?
(7-1)! =6! = 720

Permütasyon sorusu:
A={1,2,3,4,5,6,7} sayıları etiketlenmiş ürünlerde 4 ve 6 nolu ürünler kusurludur. A
ürün kümesinin üçlü permütasyonunlarının kaçında 4 veya 6 nolu ürün bulunur.

𝑛!
𝑃(𝑛, 𝑟) = 𝑃𝑟𝑛 =
(𝑛 − 𝑟)!
4 ve 6 nolu ürünleri ayırırsak kalan elemanlardan oluşturulacak permütasyonlar,
P(5,3)=5!/2!=60 adetttir.

Tamamında üçlü permütasyonlar oluşturursak,


P(7,3)=7!/4!=210

P(7,3)-P(5,3)=210-60=150 adet üçlü gruplamada 4 ve 6 nolu ürünler bulunmaktadır.

Üçlü gruplamalarda 4 ve 6 nolu ürünlerin bulunma olasılığı=150/210=5/7


3.3. Kombinasyon (Birleşim)
Permütasyonda sıralama sayısı önemli iken kombinasyonda sıralama sayısı değil seçim sayısı
önemlidir.

𝑛!
𝐶(𝑛, 𝑘) = 𝐶𝑘𝑛 =
(𝑛 − 𝑘)! 𝑘!

Örneğin; A, B ve C ile gösterilen üç nesneden ikişerli sıralanmasından elde edilecek farklı


düzen sayılarını bulmak istersek sıralama sayısı önemli olduğundan permütasyon yardımıyla,
6 bulunur. Sıralama sayısı değil seçim sayısı istersek istersek AB, AC, BC gibi üç farklı seçim
yapılabilir. Burada nesnelerin sırasını dikkate almadığımız için AB ile BA, AC ile CA, BC ile CB
aynı seçimlerdir.

Kombinasyon (Gruplama) sorusu


4 adet Masa üstü bilgisayar (PC1, PC2, PC3, PC4 etiketli) ve 5 adet Dizüstü bilgisayar
(Laptop: L1, L2, L3, L4, L5 etiketli) arasından
a) Oluşturulacak tüm bilgisayarlardan üçlü grup sayısı nedir?
b) İçinde Dizüstü bilgisayar bulunmadan oluşturulacak tüm 3’lü grup sayısı nedir?
c) İçinde disüstü bilgisayar bulunmayan üçlü grup olasılığı nedir?

4 adet Masaüstü bilgisayar (PC) ve 5 adet Dizüstü bilgisayar (Laptop) arasında

a) Oluşturulacak tüm bilgisayarlardan üçlü grup sayısı nedir?

9!
𝐶(9,3) = = 84
(9 − 3)! 3!

b) İçinde Dizüstü bilgisayar bulunmadan oluşturulacak tüm 3’lü grup sayısı nedir?

4!
𝐶(4,3) = =4
(4 − 3)! 3!

c) İçinde disüstü bilgisayar bulunmayan üçlü grup olasılığı nedir?

C(4,3)/C(9,3)=4/84 =1/21
Permütasyon ve Kombinasyon
Bileşik olayların olasılıklarının hesaplanmasını kolaylaştırmak için permütasyon(permutation)
ve kombinasyon (combination) analizinden yararlanılır. Eğer bir olay n1 halde ortaya
çıkabiliyorsa ve bu olaydan bağımsız diğer bir olay n2 halde ortaya çıkabiliyorsa her iki olay
bir arada n1 * n2 halde ortaya çıkabilecektir. Birinci olayın 2, ikinci olayın da 3 halde
meydana çıkması durumunu ağaç diyagramı ile aşağıdaki gibi gösterebiliriz.
c

a d

e
b c
d

e
Birinci olayın şıkları a ve b, ikinci olayın şıkları c,d ve e ile gösterilmektedir. Her iki olay bir
arada 6 defa ortaya çıkmaktadır.

a–c b–c
a–d b–d
a–e b- e

Permütasyon

n birimlik kütle içinden r birimlik gruplar alarak bunları, değişik sırayı değişik hal sayarak
yerleştirir veya sıralarsak sıralamaların herbiri bir permütasyon olacaktır. Diğer bir deyişle
birimlerin sıralanışlarının önemli olduğu gruplara permütasyon adı verilir. n birimlik grup
içinden r birimlik gruplar seçerek meydana getirilecek permütasyon sayısı;

n P r = n ! =n (n-1) (n-2) ....................(n - r +1)

formülü (n-r)! ile çarpıp bölersek;


n!
nPr =
(n – r ) !
formülü bize çekim iadesiz yapıldığında permütasyon sayısını verir. n adet birimden r birim
iadeli olarak çekiliyorsa permütasyon sayısı;

n P r = n r formülü ile elde edilir.


Örnek: 1,2 ve 8 rakamlarından kaç adet 2 rakamlı sayı oluşturulabilir ? ( çekimler iadesiz)

3!
3 P2 = = 6 adet sayılar: 12,18,28,21,81,82
(3 – 2) !

Bu örneği çekimlerin iadeli yapıldığını kabul ederek hesaplarsak, her rakamın tekrarlanma
olanağı doğduğu için permütasyon sayısı;

3 P 2 = 3 2 = 9 olacaktır. sayılar: 11,12,18,22,21,28,81,82,88

Kombinasyon
Kombinasyonlarda birimlerin sıraları önemli değildir. n birimden oluşan bir gruptan r birim
seçilerek gruplar oluşturuluyorsa, sıralar önemsiz ve çekim iadesiz yapılıyorsa mümkün
kombinasyon sayısı;

n!
n Cr =
r! (n – r ) !

Örnek: 9 soru arasından 6 soru kaç sekilde çekilebilir ?


9!
9C6 = = 84
6! (9 – 6 ) !

Kombinasyon - Olasılık ilişkişi

Örnek: Bir kutuda 6 kırmızı, 4 siyah top vardır. Kutudan rasgele 3 top çekildiğinde bunların;
 Üçünün de kırmızı olma olasılığı,
 Üçünün de siyah olma olasılığı,
 En az birinin kırmızı olma olasılığı nedir ?

Birinci,ikinci ve üçüncü çekişlerde kırmızı top çekme olaylarını E1,E2 ve E3 ile gösterelim.
Olayların bir arada ortaya çıkma olasılığı;

P(E1 E2 E3) = P(E1) *P(E2\E1)* P(E3\E1E2) = (6/10)*(5/9)*(4/8) = (1/6)


Kombinasyonla hesaplarsak;

6 kırmızı toptan üçünün seçimi


10 toptan üçünün seçimi

6𝐶3
= 10𝐶3

Üçünün de siyah olma olasılığı olasılıkla aşağıdaki gibi hesaplanır :

(4/10)*(3 / 9) * (2 / 8) = (1 / 30)

Kombinasyonla:

4 C3
= = 4/120 = 1/30
10 C3

En az birinin kırmızı olma olasılığı ise,1’den hepsinin siyah olma olasılığı çıkarılarak bulunur

P( en az 1 Kırmızı) = 1 - (1 / 30 ) = ( 29 / 30)
3.4. İki Terimli (Binom) Katsayılar

(x+y)2 = x2+ 2xy+ y2


(x+y)3= x3 + 3x2y +3xy2 +y3
(x+y)4 = x4 + 4x3y + 6x2y2 + 4xy3 +y4
4. Olasılık Dağılımları (Probability Distribution)
x değişkeni sürekli ise, olasılık dağılımı, sürekli olasılık dağılımı(continuous probability
distribution), x değişkeni süreksiz ise, ayrık (süreksiz) olasılık dağılımı(discrete probability
distribution) olarak adlandırılır.

Bir değer aralığında sadece tam sayılarla ifade edilebilen bazı değerleri alabilen ayrık
değişkenler, Binom, Hipergeometrik, Poisson dağılımı göstermektedirler. Bir değer
aralığında tüm değerleri alan sürekli değişkenlerin dağılımı da Normal dağılım
göstermektedir.

4.1. Rassal Değişkenler


Belli olasılıklarla değişik değerler alabilen değişkenler rastsal değişkenler olarak adlandırılır.
Bir zar atıldığında elde edilen 1,2,3,4,5 ve 6 sonuçları x rastsal değişkeninin değerleridir. Bu
sonuçlardan her biri 1/6 olasılığı ile ortaya çıkar. Stokastik değişken olarak da adlandırılan
rastsal değişken süreklilik açısından ikiye ayrılır: Ayrık rastsal değişken, Sürekli rastsal
değişken.

Rassal denemelerin sonuçları sayılarla ifade edilebilir. Örneğin atılan bir zar, öğrencilerin
notları, kişilerin gelirleri vb. Bununla birlikte bazı rassal denemelerin sonuçları sayılarla ifade
edilemeyebilir. Örneğin bir malın kusurlu olup-olmaması, bir müsabakanın galibi-mağlubu,
kişinin medeni hali ve eğitim durumu vb. Sayılarla ifade edilemeyen rassal deneme
sonuçlarını bile sayılarla ifade edilebilir ve böylece olasılık fonksiyonları belirlenebilir. Bir
üretim sürecinde Arızalı mallar = 1 ve Arızasız mallar = 0 sayısal değerlerini verebiliriz.
Cinsiyet sonuçlarında Erkek = 1 ve Bayan = 0 sayısal değerlerini verebiliriz.

Rassal denemenin sonuçlarını gösteren bu sayısal değerlere “Rassal Değişkenler” denir.


Rassal değişkenler X ve rassal değişkenin alabileceği değerler ise x ile gösterilir.

Örneğin bir zar atılmadan gelebilecek sonuç için X rassal değişkeninin muhtemel sonuçları
(x=1, x=2, x=3, x=4, x=5 ve x=6) için ise x kullanılır.
 Rassal denemenin sonuçları sayılabilir sayıda değer alıyorsa yani sayı çizgisinde
birbirinden ayrı noktalar halinde ise “ Ayrık (Kesikli) Rassal Değişkenler” olarak
adlandırılır. Öğrencilerin aldığı notlar, Hastane de bir günde doğan çocukların cinsiyeti.
 Rassal denemenin sonuçları belli bir aralıkta bütün değerleri alabiliyorsa yani sayı
çizgisinde bir aralığı kaplıyorsa ise “Sürekli Rassal Değişkenler” olarak adlandırılır.
Genellikle ölçümler sürekli rassal değişkenlerdir. Hisse senetlerinin günlük getirileri,
Aylık ithal edilen doğalgaz miktarları, Bir otobüsün İstanbul’dan Ankara’ya varış süresi.
Ayrık bir rassal değişken X ve bu rassal değişkenin alabileceği değerler ise xi ile gösterilsin. Bu
durumda Ayrık bir X rassal değişkeninin belli bir x değerinin alma olasılığı x’in bir fonksiyonu
olarak şu şekilde ifade edilebilir, Px (X) = P(X=x).

Yukarıdaki ifade Ayrık X rassal değişkeninin olasılık dağılımını vermektedir. Belli olayla ilgili
olasılık dağılımı bir kez hesaplandığında olasılık fonksiyonu da çıkarılmış olur. Ayrık bir rassal
değişkenin olasılık fonksiyonunun iki özelliği vardır.
 Her x değeri için P(X = x) ≥ 0, X rassal değişkeninin herhangi bir x değerini alma olasılığı
sıfırdan büyüktür veya eşittir.
 ∑𝑛𝑥=1 𝑃(𝑋 = 𝑥) = 1, X rassal değişkeninin her bir x değerini alma olasılığın toplamı bire
eşittir.

ÖRNEK: Örneğin bir zar atıldığında gelen sonuç rassal değişken (X) iken, gelebilecek sonuçlar
xi =1, 2, 3, 4, 5 ve 6’dır ve her birinin gelme olasılığı 1/6’dır. Bu durumda bu olayın olasılık
fonksiyonu aşağıdaki gibi olacaktır.
Px (x) = P(X=x) = 1/6 > 0
∑𝑛𝑥=1 𝑃(𝑋 = 𝑥) = 1 /6 + 1/6 +1/6 + 1/6 +1/6 +1/6 = 1

Ayrık Rassal Değişkenin Kümülatif Olasılık Fonksiyonu


Ayrık bir rassal değişken olan X’in herhangi bir x0 değerini aşmama olasılığı Kümülatif Olasılık
Fonksiyonu ile aşağıdaki gibi gösterilebilir.

F(x0) = P (X ≤ x0 ) = ∑𝑛𝑥≤𝑥0 𝑃(𝑋 = 𝑥)

Ayrık bir rassal değişkenin kümülatif olasılık fonksiyonunun iki özelliği vardır.
 Her x0 değeri için 0 ≤ F(x0) ≤ 1arasındadır.
 x0 < x1 ise , F(x0) ≤ F(x1) olur.

ÖRNEK: Atılan bir zarın 3’ten küçük gelme olasılıklarının fonksiyonunu yazınız.
Atılan bir zarın 3’ten küçük gelmesi 1 veya 2 gelmesi durumudur.
F(x0) = P (X ≤ x0 ) = ∑2𝑥=1 𝑃(𝑋 = 1, 𝑋 = 2) = 1/6 +1/6= 2/6

ÖRNEK: Atılan bir zarın 1’den büyük ve 6’dan küçük gelme olasılıklarının fonksiyonunu
yazınız.
Atılan bir zarın1’den büyük ve 6’dan küçük gelmesi 2, 3, 4 veya 5 gelmesi durumudur.
F(x0) = P (X ≤ x0 ) = ∑5𝑥=2 𝑃(𝑋 = 2, 𝑋 = 3, 𝑋 = 4, 𝑋 = 5 ) = 4/6
Örnek: bir kutuda aşağıda verilen iskambil kağıtları bulunmaktadır:
Kupa: 2, 3, 4
Maça: 1, 2
Sinek: 3, 4
Karo: 1, 2, 3

a) Kutudan rasgele bir kağıt çekersek x rasgele değişkeni çekilen siyah kağıt sayısını
göstermek üzere olasılık dağılımı ne olacaktır ?
Kutudaki toplam 10 kağıdın 4’ü siyah olduğu için çekilen kağıdın siyah olma olasılığı:
f(1) = P( x = 1) = 4 / 10

b) Kırmızı kağıt çekme olasılığı:


f(0) = P( x = 0) = 6 / 10

c) Kutudan rasgele bir kağıt çekersek ve x ile kağıdın üzerindeki sayıyı gösterirsek, x
1,2,3,4 değerlerini alabilme olasılıkları:
f(1) = P(x = 1) = 2 / 10 ( 2 as)
f(2) = P(x = 2) = 3 / 10 ( 3 adet ikili)
f(3) = P(x = 3) = 3 / 10 ( 3 adet üçlü)
f(4) = P(x = 4) = 2 / 10 ( 2 adet dörtlü)

d) iadeli olarak iki kağıt çektiğimizde x siyah kağıt sayısını göstermek üzere olasılık
dağılımı nasıl olacaktır ? K ( kırmızı) , S ( siyah)

İki kağıt çekildiğinde sonuçlar:


KK , KS , SK , SS olacaktır. Olaylar bağımsız olduğundan olasılıklar K ve S olaylarının
olasılıkları çarpımı ile hesaplanacaktır.

P(x = 0) = P(KK) = 6/10 * 6/10 = 9/25


P(x = 1) = P(KS) = 6/10 * 4/10 = 6/25
P(x = 1) = P(SK) = 4/10 * 6/10 = 6/25
P(x = 2) = P(SS) = 4/10 * 4/10 = 4/25

Örnek: 2 zarla atış yapıldığında x rastsal değişkeni zarların üste gelen yüzlerindeki sayıların
toplamını gösterirse, şıklar 2 ve 12 arasında olacaktır. Olasılıklar şu şekildedir:

x(şıklar) 2 3 4 5 6 7 8 9 10 11 12
P(x) 1/36 2/36 3/36 4 /36 5/ 36 6/36 5/36 4/36 3/36 2/36 1/36
4.2. Rasgele – Değişken Sürekli Olasılık Dağılımı
4.3. Ayrık Olasılık Dağılımı

4.3.1. Bernoulli Dağılımı


Aynı koşullar altında ayrık bir rassal denemenin sonuçları olumlu-olumsuz, başarılı-başarısız,
geçti-kaldı şeklinde birbiriyle bağdaşmayan ve bütünü kapsayan iki sonuçlu olaylarda,
gözlemlerde ya da deneylerde “Bernoulli Dağılımı” kullanılır.

Öğrencinin dersinden geçme olasılığı p ise, dersinden kalma olasılığı (1-p) olacaktır. X raslantı
değişkeni başarı için 1, başarısızlık için 0 değerini alsın. X’in olasılık fonksiyonu;
• P(X=1)=p, P(X=0)=1-p=q olur. Ya da
• P(X=x)=px(1-p)1-x ; x=0,1 ise bu dağılıma Bernoulli dağılımı denir.

Bernoulli Dağılımının Aritmetik Ortalaması ve Varyansı


 Bernoulli rassal değişkeninin aritmetik ortalaması:

µx = E (x) = p

 Bernoulli rassal değişkeninin varyansı:


𝜎𝑥2 = E [ (X - µx)2 ] = p (1 – p)

ÖRNEK: Bir öğrenci, Fizik dersinden geçme olasılığının %70 olduğuna inanmaktadır. Olasılık
dağılımının fonksiyonunu yazınız? Ortalamasını ve varyansını bulunuz?
Öğrenci dersten geçerse X rassal değişkeni x = 1 ve kalırsa x = 0 değerini alırsa, X rassal
değişkeninin olasılık dağılımı şöyle yazılabilir:
P (x=1) = 0.7 ve P (x=0) = 0.3

Olasılık dağılım fonksiyonu:


P ( X = x ) = px (1 – p)1-x = 0.7x (1 – 0.7)1-x = 0.7x *0.31-x olarak bulunur.

x’in alacağı 1 ve 0 değerlerine göre olasılık dağılımı aşağıdaki gibi bulunur.


P ( x = 1 ) = p1 (1 – p)1-1 = 0.71 (1 – 0.7)0 = 0.71 *0.30 = 0.7

P ( x = 0 ) = p0 (1 – p)1-0 = 0.70 (1 – 0.7)1 = 0.70 *0.31= 0.3

Aritmetik ortalaması: µx = E (X) = p = 0.7


Varyansı: 𝜎𝑥2 = E [ (X - µx)2 ] = p (1 – p) = 0.7*0.3 =0.21 olarak bulunur.
4.3.2. Binom Dağılımı
Bernoulli denemelerinin n kez tekrarlandığı düşünülsün. Bu denemelerde başarılı sonuçların
toplam sayısı X raslantı değişkeni olarak gösterilsin. X raslantı değişkeni aşağıdaki koşulları
sağlıyorsa, bu raslantı değişkeni binom raslantı değişkenidir. İki sonuçlu rassal deneme aynı
koşullar altında n kere tekrarlanırsa “Binom Dağılımı” adı verilen dağılım elde edilir.
Bernoulli dağılımının özel bir şeklidir.

Koşullar:
• Deneyde iki sonuç vardır. Başarılı olma olasılığı p, başarısız olma olasılığı (1-p)=q olarak
tanımlanır.
• Deney boyunca yapılan n deneme, aynı koşullar altında gerçekleştirilir.
• Bir tek deneme için başarılı olma olasılığı p ve başarısızlık olasılığı q her deneme için
aynıdır.
• Denemeler birbirinden bağımsızdır.
• Deney boyunca n sabit kalır.

Birçok deneyde iki farklı sonuç ortaya çıkmaktadır. Bir sınav sonucu başarılı ve başarısız
olmak üzere iki durumda tanımlanabilir ya da kalite kontrolu için alınan bir ürün sağlam veya
kusurlu olarak iki şekilde ortaya çıkabilir. Bu türde iki sonucu olan deneyler “ Bernoulli
Deneyleri veya Süreçleri” olarak adlandırılır. Bernoulli süreci, her deneyde birbirini
engelleyen iki sonuçtan birinin gerçekleştiği bir süreçtir. Madeni para atışı deneyinde her
deneyde yazı(Y) ve tura(T) mümkün sonuçlarından sadece biri gerçekleşir ve her atışta P(Y)
ile P(T) olasılıkları deneyler birbirinden bağımsız olduğu için aynıdır(1 / 2).

Bernoulli deneylerinde ortaya çıkan iki sonuçtan biri başarı diğeri ise başarısızlık olarak
adlandırılır. p başarı olasılığını, q’da başarısızlık olasılığını göstermektedir, 1- p = q.

Deney n defa tekrarlanırsa toplam başarılı durum sayısı x ile gösterilen bir rasgele
değişkendir. Bu değişken binom değişkeni adını alır. x değişkenini binom değişkeni olarak
kabul edebilmemiz için tekrarlanan deneylerin birbirlerinin aynı olmaları, olasılıkların
deneyden deneye değişmemesi, seçimlerin iadeli yapılması gerekir.

Genel olarak n Bernoulli deneyinde p=başarı olasılığı, q=başarısızlık olasılığı olmak üzere x
sayıda başarı olasılığı aşağıda verilen binom olasılık fonksiyonu kullanılarak hesaplanır,

P(x) = n C k px q n- x = ( n! / (x!( n – x)!))* px q n- x

x’in bütün hallerinin hesaplanması ile x’in olasılık dağılımı elde edilir. Bu dağılıma Binom
dağılımı adı verilir. Binom olasılıkları standart “Binom Dağılımı Tabloları” kullanılarak
hesaplanabilir. Çeşitli p ve n değerleri için k’nın (x’in) alabileceği tüm değerlerin olasılıkları
bu tablolarda verildiğinden istenilen bir x için olasılık bulunabilir.

Binom dağılımındaki p ve q olasılıkları birbirine eşitse dağılımın şekli simetrik olacaktır. Para
atışı deneyinde p ve q olasılıkları aynı olduğu için dağılım simetrik olacaktır. p’nin q’ya eşit
olmadığı durumlarda ise, dağılımın şekli asimetriktir.

Öncelikle, n tane deneme olduğu için n tane iki olasılıklı sonuç olacaktır. İncelenen olay
başarı ya da başarısızlık ise n tane denemede x tane başarılı ve (n-x) tane başarısız sonuç
olacaktır ve denemeler birbirinden bağımsız olduklarından sonuçların herhangi bir dizilimin
olasılığı, tekil sonuçların olasılıklarının çarpımına eşittir ve aşağıdaki gibidir.

P (x, n-x) = p.p.p………p.(1-p).(1-p)…….(1-p) = px (1-p)n-x

Her bir denemenin başarılı olma olasılığı p ve başarısız olma olasılığı (1-p) dir. n tane rassal
denemede x tane başarının (n-x) tane başarısızlıkla birlikte çok farklı dizilişlerde
gerçekleşebilir yukarıda sadece bir tanesi dikkate alındı.

Diziliş sırası önemli değilse n rassal denemede x tane başarı içeren dizilişlerin sayısı:
𝑛!
𝐶𝑛𝑥 = 𝑥!(𝑛−𝑥)! (n rassal denemenin x taneli kombinasyonu) olarak bulunur.

n tane rassal denemenin x tanesinin başarılı olma olasılık fonksiyonu:


𝑛!
P(x; n,p) = px (1-p)n-x = 𝐶𝑛𝑥 px (1-p)n-x şeklinde yazılır ve bu formül yardımıyla
𝑥!(𝑛−𝑥)!
hesaplanır. x = 0, 1, 2, 3, ……n

Binom Dağılımının Aritmetik Ortalaması, Varyansı ve Momentleri


 Aritmetik ortalaması: µx = E (X) = n.p
 Varyansı: 𝜎𝑥2 = E [ (X - µx)2 ] = n.p. (1 – p)
 Momentleri:
µ1 = 0
µ2 = 𝜎𝑥2
µ3 = n.p.(1-p)[(1-p) – p]
µ4 = n.p.(1-p)[(1-6 p(1-p)+3n.p(1-p)]
 Asimetri (Çarpıklık) ve Basıklık Katsayıları:
(1−𝑝)−𝑝 1−6𝑝 (1−𝑝)
ÇK = ve BK = 3 +
√𝑛𝑝(1−𝑝) 𝑛𝑝(1−𝑝)
ÖRNEK: Bir madeni para 4 kere atılmaktadır. 0, 1, 2, 3 ve 4 tane yazı gelme olasılıklarını
sırayla hesaplayınız.

Bu bir Binom dağılımıdır ve olasılık fonksiyonu


P(x; 4,0.5) = 𝐶𝑛𝑥 px (1-p)n-x olarak yazılır.

𝑛! 4!
0 tane yazı gelme olasılığı: P(0; 4,0.5) = px (1-p)n-x = 0!(4−0)! 0.50 0.54 = 0.0625
𝑥!(𝑛−𝑥)!
𝑛! 4!
1 tane yazı gelme olasılığı: P(1; 4,0.5) = px (1-p)n-x = 1!(4−1)! 0.51 0.53 = 0.25
𝑥!(𝑛−𝑥)!
𝑛! 4!
2 tane yazı gelme olasılığı: P(2; 4,0.5) = px (1-p)n-x = 2!(4−2)! 0.52 0.52 = 0.375
𝑥!(𝑛−𝑥)!
𝑛! 4!
3 tane yazı gelme olasılığı: P(3; 4,0.5) = px (1-p)n-x = 3!(4−3)! 0.53 0.51 = 0.25
𝑥!(𝑛−𝑥)!
𝑛! 4!
4 tane yazı gelme olasılığı: P(4; 4,0.5) = px (1-p)n-x = 4!(4−4)! 0.54 0.50 = 0.0625
𝑥!(𝑛−𝑥)!

Örneğimizdeki gibi p = (1-p) ise simetrik binom dağılımı, p ≠ (1-p) ise asimetrik binom
dağılımı söz konusudur.

ÖRNEK: Yukarıdaki örnekte aritmetik ortalamayı, varyansı, momentleri, çarpıklık ve basıklık


katsayılarını hesaplayınız.
Aritmetik ortalaması: µx = E (X) = n.p = 4*0.5 = 2
Varyansı: 𝜎𝑥2 = E [ (X - µx)2 ] = 4*0.5*0.5 =1
Momentleri:
µ1 = 0
µ2 = 𝜎𝑥2 = 1
µ3 = n.p.(1-p)[(1-p) – p] = 4*0.5*0.5 [ 0.5 – 0.5] = 0
µ4 = n.p(1-p) [(1-6 p(1-p) + 3n.p(1-p)] =
4*0.5*0.5 [1- 6*0.5*0.5 + 3*4*0.5*0.5] = 2.5

Asimetri (Çarpıklık) ve Basıklık Katsayıları:


(1−𝑝)−𝑝 (1−0.5)−0.5 0
ÇK = = = =0
√𝑛𝑝(1−𝑝) √4∗0.5∗0.5 1

1−6𝑝 (1−𝑝) 1−6∗0.5∗0.5 −0.5


BK = 3 + =3+ =3+ = 2.5
𝑛𝑝(1−𝑝) 4∗0.5∗0.5 1

Çarpıklık katsayısı bu olasılık dağılımının simetrik olduğunu, basıklık katsayısı ise normale
göre basık olduğunu işaret etmektedir.
Örnek: 6 defa atılan bir madeni paranın tam olarak 2 defa tura gelmesi olasılığı nedir ?
Simetrik binom dağılımı, p ve q birbirine eşit.
n = 6 , x =2, p=0.50, q= 0.50

P(x=2) = 6 C 2 (0.50)2* (0.50) 6- 2 = ( 6! / (2!( 6 – 2)!))* (0.50)2 * (0.50) 4 =0.23

Binom Dağılım tablosunu kullanarak hesaplarsak;

P(x;n,p)= P(2;6, 0.50) = (0.3438 – 0.1094) = 0.2344

Aynı 6 atışta en az 4 defa tura gelmesi olasılığı ise tablodan şu şekilde hesaplanabilir;
P( x ≥ 4) P( 3; 6 , 0.50 ) = 0.6562
P( x ≥ 4) = 1 – 0.6562 = 0.3438
Veya
P(x=0)+P(x=1)+P(x=2) = 0.3438

Örnek: 5000 sayfalık bir ansiklopedinin 1500 sayfasında baskı hataları vardır. Bu
ansiklopediden rasgele seçilen 5 sayfadan en fazla 4 tanesinde baskı hatası olma olasılığı
nedir ?
Asimetrik binom dağılımı. Baskı hatası oranı: p= (1500 / 5000) =0.30 q=0.70

P( x ≤ 4) = 1 – P(x=5)

P(x=5) = (5! / (5!*0!))*(0.30)5 *(0.70)0 = 0.00243

P(x ≤ 4) = 1 – 0.00243 = 0.99757

Tablodan;

P(4;5, 0.30) = 0.9976

Örnek: Bir kutuda bulunan 12 ampulün 3’ünün kusurlu olduğu bilinmektedir. Bu kutudan
rasgele ve iadeli olarak 3 ampul çekildiğinde;
 İkisinin kusurlu olma olasılığı nedir ?
 Bu deney sonunda beklenen ortalama kusurlu sayısı ve standart sapma nedir ?

İki tanesinin kusurlu olma olasılığı;


p= 3 / 12 = 0.25 q = 0.75

P(x=2) = (3! /(2!*1!))*(0.25)2* (0.75)1 = 0.1406


Tablodan;
P(2;3, 0.25) =0.9844 bu kümülatif olduğu için P(x=1) bu değerden çıkarılır.
P(1;3, 0.25) =0.8438
(0.9844 – 0.8438) = 0.1406

ortalama kusurlu sayısı : E(x)= n*p = 3*(0.25) =0.75


standart sapma : σ = 0.75
4.3.3. Poisson Dağılımı
Simetrik binom dağılımı n sonsuza yaklaşırken normal dağılıma yaklaşmaktadır. p=q
durumunda normal dağılım binom dağılımı yerine kullanılabilmektedir.n’nin çok büyük p’nin
çok küçük olduğu durumlarda asimetri arttığı için normal dağılım uygulanamamakta, binom
dağılımının da hesaplanması güçleşmektedir.p’nin q’ya göre küçük olduğu durumlarda
binom dağılımı yerine Fransız matematikçi S.D.Poisson(1781-1840) tarafından geliştirilen
Poisson dağılımı kullanılmaktadır.

Binom dağılımının özel bir durumu olan Poisson dağılımı gözlem sayısının belli bir zaman
diliminde çok yüksek ve beklenen sonucun gelme olasılığının çok küçük olduğu durumlarda
kullanılır. Kısaca büyük n ve küçük p sahip olaylarda kullanılır.
Aşağıdaki rassal değişkenler (olaylar) binom dağılım özelliği gösterirler.
 Son bir haftada meydana gelen yangın sayısı.
 Dün hastaneye gelen hastalardan ölen sayısı.
 Bir dönem içinde hatalı girilen not sayısı
 Bir yıl içinde ertelenen uçak sefer sayısı
 200 sayfalık bir kitap da hatalı kelime sayısı

Yukarıda sayılan olayların (rassal değişkenlerin) büyük n ve küçük p olasılığına sahip oldukları
için Poisson Olasılık dağılımının temsil edecektir. Yukardaki olayda beklenen sonuçların
gerçekleşme olasılığı düşüktür. Diğer bir ifadeyle nadir gerçekleşen olaylardır.

Bir olayın nadir kabul edilebilmesi ve Poisson Olasılık dağılımına sahip olabilmesi için genel
kabul gören görüş;
1. Rassal deneme sayısı n ≥ 50 olmalıdır.
2. np = ʎ < 5 olmalıdır.
3. Rassal denemeler iki sonuçlu olmalıdır ve aynı koşullar altında n kez tekrarlanmalıdır.
4. Rassal denemeler birbirinden bağımsızdır.

Bu varsayımlar altında Poisson olasılık dağılımında X rassal değişkeni n deneme sonunda


beklenen sonucun gerçekleşme sayısına göre x = { 0, 1, 2, …….n} değerleri alabilir. Poisson
dağılımın olasılık fonksiyonu aşağıdaki gibi ifade edilebilir.
𝑒 −ʎ ʎ𝑥
P(x) = , x = 0, 1, 2,……n
𝑥!

Burada
ʎ = np, beklenen sonucun ortalama gerçekleşme sayısını (Aritmetik ortalama),
e = 2.71828 doğal logaritmanın tabanıdır.
Poisson Dağılımının Aritmetik Ortalaması, Varyansı ve Momentleri
Aritmetik ortalaması: µx = E (X) = n.p = ʎ
Varyansı: 𝜎𝑥2 = E [ (X - µx)2 ] = n.p. (1 – p) = ʎ
Momentleri:
µ1 = 0
µ2 = 𝜎𝑥2 = ʎ
µ3 = ʎ
µ4 = ʎ + 3ʎ2

Asimetri (Çarpıklık) ve Basıklık Katsayıları:


µ 1 µ 1
ÇK = 𝜎33 = ve BK = µ42 = 3 +
√ʎ 2 ʎ

ÖRNEK: 40000 öğrencisi olan bir üniversitede bir yıl içinde girilen hatalı notların aritmetik
ortalaması ʎ = 0.4’tür.
Bu örnekte;
1. ʎ = 0.4 < 5
2. n = 40000 > 50
ʎ 0.4
3. p = 𝑛 = 40000 = 0.00001
4. Rassal denemenin beklenen sonucu hatalı-hatasız olmak üzere iki sonuçludur ve n
kez tekrarlanabilir.

Bu şartlar altında bu olayın Poisson Olasılık dağılımına sahip olduğunu söyleyebilir ve olasılık
fonksiyonunu aşağıdaki gibi ifade edebiliriz.
𝑒 −ʎ ʎ𝑥 𝑒 −0.4 (0.4)𝑥
P(x) = = , x = 0, 1, 2, …….n ve 𝑒 −0.4 = 0.67
𝑥! 𝑥!

Bu Poisson dağılımının,
Aritmetik ortalaması: µx = E (X) = n.p = ʎ = 0.4
Varyansı: 𝜎𝑥2 = E [ (X - µx)2 ] = n.p. (1 – p) = ʎ = 0.4
Momentleri:
µ1 = 0
µ2 = 𝜎𝑥2 = ʎ = 0.4
µ3 = ʎ = 0.4
µ4 = ʎ + 3ʎ2 = 0.4 + 3 (0.4)2 = 0.88

Asimetri (Çarpıklık) ve Basıklık Katsayıları:


µ 1 1
ÇK = 𝜎33 = = = 1.58
√ʎ √0.4
µ 1 1
BK = µ42 = 3 + = 3 + 0.4 = 3 + 2.5 = 5.5 bulunur.
2 ʎ
Bir yılda gerçekleşebilecek hata sayısının (x) olasılıkları hesaplayabiliriz.
𝑒 −0.4 (0.4)𝑥 0.67 (0.4)0
Bir yıl boyunca hiç hata olmama olasılığı: P(x=0) = = = 0.67
𝑥! 0!
𝑒 −0.4 (0.4)𝑥 0.67 (0.4)1
Bir yıl boyunca bir adet hata olmama olasılığı:P(x=1) = = = 0.268
𝑥! 1!
𝑒 −0.4 (0.4)𝑥 0.67 (0.4)2
Bir yıl boyunca iki adet hata olmama olasılığı: P(x=2) = = = 0.0536
𝑥! 2!
𝑒 −0.4 (0.4)𝑥 0.67 (0.4)3
Bir yıl boyunca üç adet hata olmama olasılığı: P(x=3) = = = 0.007
𝑥! 3!

Örnek: bir üretim hattında parçaların %5’i kusurlu çıkmaktadır. Rasgele seçilen 22 parça
içinde 2 tanesinin kusurlu olma olasılığı nedir ?

Binom dağılımı ile hesaplarsak;


𝑛!
P(x; n,p) = px (1-p)n-x = 𝐶𝑛𝑥 px (1-p)n-x
𝑥!(𝑛−𝑥)!
p=0.05, n=22, q=1-p=0.95, x=2, P(k=2)= 0.2070

Poisson dağılımı ile hesaplarsak;


ʎ = np, beklenen sonucun ortalama gerçekleşme sayısını (Aritmetik ortalama),
np= λ = 22 * 0.05=1.1

𝑒 −ʎ ʎ𝑥
P(x) = , x = 0, 1, 2,……n
𝑥!

P(x=2)=0.201
Burada, e = 2.71828 doğal logaritmanın tabanıdır.

Tablo değerlerini kullanırsak;


F(x; λ) = F(2;1.1)= 0.9
F(x; λ) = F(1;1.1)= 0.699
P(k=2)= F(2;1.1) - F(1;1.1)= 0.201
Örnek: Bir fabrikanın ürettiği pillerin %1’i kusurlu çıkarsa, 200 birimlik üretimde 3 tane
kusurlu pil çıkma olasılığı nedir ?

n=200, p=0.01, np= λ =200*0.01= 2

𝑒 −ʎ ʎ𝑥
P(x) = , x = 0, 1, 2,……n
𝑥!

P(x=3)=0.18045

Tablo değerlerini kullanırsak; F(3;2) - F(2;2)= 0.857 – 0.677 0 = 0.18

Örnek: Bir sigorta şirketi 1000 kişiyi trafik kazalarına karşı sigortalamıştır. Bu kazalardaki
ölüm oranı %1 olduğuna göre, sigorta şirketinin 5 kişiye para ödeme olasılığı nedir?

P=0.01, λ =1000*0.01=10

P(x=5)=0.0375

Tablo değerlerini kullanırsak;


F(5;10) - F(4;10)= 0.067 – 0.029 = 0.038

Örnek: Bir sınıftaki öğrencilerin %2’sinin boyları 190 cm’nin üzerindedir. Rasgele seçilen 100
öğrenciden; 6’sının, en az 2’sinin boylarının 190 cm’den fazla olması olasılıklarını bulunuz.
𝑒 −ʎ ʎ𝑥
P(x) = , x = 0, 1, 2,……n
𝑥!

λ =2

P(x=6)=0.1203
P(x=0)=0.13534
P(x=1)=0.27068
P(k≥2) = 1- P(k=0) –P(k=1) = 1 – 0.13584 -0.27068 = 0.59398

Tablo değerlerini kullanırsak;


F(0;2)= 0.135
F(1;2)= 0.406 – 0.135 = 0.271 P(k>=2) = 1 - 0.135 - 0.271 = 0.594
veya P(k>=2) = 1 - 0.406= 0.594
Örnek: Bir şehirdeki 30 yaşın üzerindeki nüfusun %5’nin üniversite mezunu olduğu
bilinmektedir. Rasgele seçilecek 100 kişi arasında;
a) 5 üniversite mezunu bulunması,
b) Hiç üniversite mezunu bulunmaması olasılığını hesaplayınız.
λ=5,x=5
 P(k=5) = F(5;5) - F(4;5) = 0.616 – 0.440 = 0.176
 P(k=0) = F(0;5) = 0.007

Poisson Süreci
Bazı durumlarda n ve p ayrı ayrı bilinmemekte fakat n*p bilinmektedir.Belirli bir süre içinde
hava alanına inen ortalama uçak sayısının veya belirli bir süre içinde bir telefon santraline
gelen ortalama çağrı sayısının bilindiği durumlarda λ yani n*p biliniyor demektir. Olayların
rasgele meydana geldiği ve birbirinden bağımsız bu gibi durumlara Poisson Süreci adı verilir.

Örnek: Bir banka şubesine her yarım saat içinde ortalama 15 müşteri gelmektedir.
Müşterilerin gelmelerinin Poisson sürecine uyduğu varsayılırsa, 10 dakika içinde bankaya en
az 1 müşteri gelmesi olasılığını hesaplayınız. 10 dakikada 15/3 = 5 müşteri beklenecektir. λ =
5 alınarak, 1’den sıfır müşteri gelmesi olasılığı çıkarılırsa;

P(en az 1) = 1 – P(x=0)

e –5 * 50
P(x=0) = = 0.00674 P(0) = F(0;5) = 0.007
0!

P(en az 1) = 1 – 0.00674 = 0.99326

Örnek: Bir elektrik santralında ayda ortalama 4 arıza meydana gelmektedir. Bu santralde bir
ay içinde hiç arıza görülmemesi olasılığı nedir ?

𝑒 −ʎ ʎ𝑥
P(x) = , x = 0, 1, 2,……n
𝑥!

λ=4
P(x=0)= 0.01832
4.3.4. Hipergeometrik Dağılım
Binom dağılımı rassal deneme sonuçlarının birbirinden bağımsız olduğunu varsaymaktaydı.
Rassal denemelerin sonuçları birbirinden bağımsız değilse yani birinci rassal denemenin
sonucu daha sonraki rassal denemelerin sonuçlarını etkiliyorsa Binom dağılımını
kullanamayabiliriz. Bu gibi durumlarda iki sonuçlu rassal denemelerde özellikle örneklem
sayısı küçükse “Hipergeometrik Dağılım” kullanılabilir.

Örneklem sayısı artıkça Hipergeometrik Dağılım Binom dağılıma yaklaşacaktır. Özellikle


rassal denemeler iadesiz yapılırsa küçük örneklemlerde Hipergeometrik dağılım söz konusu
olur.

Örneğin seçilen 20 tane Maliye Bölümü öğrencisinin 12 tanesinin İstatistik dersinden başarılı
olduğunu varsayalım.
 Rassal olarak seçilen bir öğrencinin İstatistik dersinden başarılı olma olasılığı: 12/20 =
0.6’dır.

 Rassal olarak ikinci öğrenciyi seçtiğimizde İstatistik dersinden başarılı olma olasılığı ilk
rassal denemenin sonucuna bağlı olarak değişecektir.
Rassal olarak seçilen ilk öğrenci İstatistik dersinden başarılıysa, rassal olarak seçilen ikinci
öğrencinin İstatistik dersinden başarılı olma olasılığı 11/19 = 0.579 olacaktır.
Rassal olarak seçilen ilk öğrenci İstatistik dersinden başarısızsa, rassal olarak seçilen
ikinci öğrencinin İstatistik dersinden başarılı olma olasılığı 12/19 = 0.632 olacaktır.

Seçilen ilk ve ikinci öğrencinin İstatistik dersinden başarılı olma olasılıkları birbirinden
bağımsız değildir. Bu şekilde n tane rassal deneme yapıldığında her biri birbirine bağlı
olaylar olacaktır.

Yukarıdaki örnek yardımıyla Hipergeometrik dağılımın olasılık fonksiyonunu aşağıdaki şekilde


ifade edebiliriz.
𝐵! (𝑁 − 𝐵)!
𝐶𝐵𝑥 𝐶𝑁−𝐵
𝑛−𝑥 ∗
𝑥! (𝐵 − 𝑥)! (𝑛 − 𝑥)! (𝑁 − 𝐵 − 𝑛 + 𝑥)!
𝑃 (𝑥) = =
𝐶𝑁𝑛 𝑁!
𝑛! (𝑁 − 𝑛)!
N: Ana kütledeki gözlem sayısı
n: Örneklemdeki gözlem sayısı
B: Ana kütledeki başarılı öğrenci sayısı
X: örneklemdeki başarılı öğrenci sayısı
𝐶𝑛𝑁 : N taneli ana kütleden n taneli farklı örneklem seçilme sayısı.
𝐶𝑥𝐵 : Ana kütledeki B tane başarılı öğrenciden x tanesinin örnekleme seçilmesinin yollarının
sayısı.
𝑁−𝐵
𝐶𝑛−𝑥 : Ana kütledeki (N – B) tane başarısız öğrenciden (n-x) tanesinin örnekleme
seçilmesinin yollarının sayısı.

Hipergeometrik Dağılımının Aritmetik Ortalaması, Varyansı

 Aritmetik ortalaması: µx = E (X) = n.p

𝑁−𝑛
 Varyansı: 𝜎𝑥2 = E [ (X - µx)2 ] = ( 𝑁−1) n.p. (1 – p)
𝐵
Burada p = 𝑁 olacaktır.
4.4. Sürekli Rassal Değişkenler
Bu bölümde belli bir sayı çizgisi aralığında bütün değerleri alabilen değişkenler incelenecektir
ki bu değişkenlere “Sürekli Rassal Değişkenler” denir. Zaman, uzaklık, sıcaklık, boy, kilo vb.
ölçüler sürekli rassal değişkene örnek olarak verilebilir. Genellikle sürekli rassal değişkenlerin
belli bir aralıkta olma olasılığı bu bölümde ilgi alanımızdır.

Örneğin;
 Rassal olarak seçilen bir öğrencinin not ortalamasının 85-90 arasında olma olasılığı
 Rassal olarak seçilen bir ailenin yıllık gelirinin 15000-20000 TL arasında olma olasılığı
 Rassal olarak seçilen bir öğrencinin not ortalamasının 50’den düşük olma olasılığı
 Rassal olarak seçilen bir ailenin yıllık gelirinin 20000 TL’den yüksek olma olasılığı gibi

4.4.1. Düzgün Dağılım Fonksiyonları

Birikimli Olasılık Fonksiyonu


X sürekli bir rassal değişkeni ve x ise bu değişkenin alabileceği belli bir değeri
göstermektedir. X’in Birikimli Olasılık Fonksiyonu, X sürekli rassal değişkeninin belli bir x
değerini aşmama olasılığını x’in bir fonksiyonu olarak verir.

𝑥
X’in Birikimli Olasılık Fonksiyonu: F (x) = P (X ≤ x ) = ∫−∞ ƒ (𝑡)𝑑𝑡

Aralık Olasılığı ve Birikimli Olasılık Fonksiyonu

X sürekli rassal değişkeni a ve b gibi iki değer alabiliyorsa, rassal değişkenin bu iki aralık
arasında bir değer alma olasılığı,

P (a < X < b) = F (b) – F (a)


4.4.2. Olasılık Yoğunluk Fonksiyonu
X sürekli rassal değişkeninin belli bir aralıkta olma olasılığı “Olasılık Yoğunluk Fonksiyonu” ile
hesaplanabilir. Sürekli rassal bir değişkenin Olasılık Yoğunluk Fonksiyonu aşağıdaki
özelliklere sahiptir:

1. Olasılık Yoğunluk Fonksiyonu ƒ(x) ile gösterilir.


2. x’in bütün değerleri için ƒ(x) ≥ 0 (eğri yatay ekseni kesmez)
3. Olasılık Yoğunluk Fonksiyonu eğrisi altında kalan alan 1’e eşittir.


∫ ƒ (𝑥)𝑑𝑥 = 1
−∞

X rassal değişkeninin a ve b değerleri arasında bir değer olma olasılığı, Olasılık Yoğunluk
Fonksiyonu altında bu iki değer arasında kalan alandır. (a<b)

𝑏
P ( a < X < b ) = ∫𝑎 ƒ (𝑥)𝑑𝑥
ÖRNEK:

𝑐𝑥 2 , 0≤𝑥≤3
𝑓(𝑥) = {
0, 𝑑𝑖ğ𝑒𝑟 𝑥 𝑑𝑒ğ𝑒𝑟𝑙𝑒𝑟𝑖 𝑖ç𝑖𝑛

a) Yukarıdaki fonksiyonun olasılık yoğunluk fonksiyonu olabilmesi için c hangi değeri


almalıdır?

𝑥 3
𝑓(𝑥) = ∫ 𝑓(𝑥)𝑑𝑥 = ∫ 𝑐𝑥 2 𝑑𝑥 = 1
−∞ 0

x3 3 33 03 27 27
=c ( ) |0 = c ( ) − c ( ) = 𝑐= 𝑐 = 1′𝑑𝑒𝑛
3 3 3 3 3

3
𝑐= bulunur.
27
b) Olasılık yoğunluk fonksiyonunu gösteriniz?

3 2
𝑥 , 0≤𝑥≤3
𝑓(𝑥) = {27
0, 𝑑𝑖ğ𝑒𝑟 𝑥 𝑑𝑒ğ𝑒𝑟𝑙𝑒𝑟𝑖 𝑖ç𝑖𝑛

c) F (x) kümülatif olasılık dağılım fonksiyonunu bulunuz?

𝑥 𝑥
3 2 3 x3 x 3 x3 𝑥3
𝐹(𝑥) = ∫ 𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 𝑑𝑥 = = ( )| = ( ) =
−∞ 0 27 27 3 0 27 3 27

d) F (2) ‘yi hesaplayınız?

3 23 8
𝐹(2) = 𝑝 (𝑥 ≤ 2) = 27 ( 3 ) = = 0.3
27
X rassal değişkeninin 2’den küçük olma olasılığı yüzde 30’dur.
e) P ( x ≥ 1) ‘in olasılık yoğunluk fonksiyonunu hesaplayınız?

3
3 2 3 x3 3 3 33 3 13
𝑝 (𝑥 ≥ 1) = ∫ 𝑥 𝑑𝑥 = ( )| = ( )− ( )=
1 27 27 3 1 27 3 27 3

27 1 26
= − = = 0.96
27 27 27

X rassal değişkeninin 1’den büyük olma olasılığı yüzde 96’dır.

f) P ( 1 ≤ X ≤ 2) ‘in olasılık yoğunluk fonksiyonunu hesaplayınız?

2
3 2 3 x3 2
𝑝 (1 ≤ 𝑥 ≤ 2) = ∫ 𝑥 𝑑𝑥 = ( )|
1 27 27 3 1

3 23 3 13 8 1 7
= ( )− ( )= − = = 0.26
27 3 27 3 27 27 27
X rassal değişkeninin 1ile 2 arasında olma olasılığı yüzde 26’dır.
4.4.3. Normal Dağılım

Günlük hayatta karşılaşılan birçok olayın olasılık yoğunluk fonksiyonu aritmetik ortalama
etrafında yüksek ve uçlara doğru ise azalan bir seyir göstermektedir. Bu tür dağılımlara
“Normal Dağılım” denir ve istatistik analizlerinde en çok kullanılandır.

Normal olasılık yoğunluk fonksiyonu aşağıdaki şekilde görüldüğü üzere aritmetik ortalama
etrafında simetrik bir dağılıma sahiptir. Normal olasılık yoğunluk fonksiyonu çana
benzediğinden “Çan Eğrisi” olarak ta adlandırılır.

Eğrinin kuyrukları x eksenini sonsuzda keser ve eğrinin altında kalan alan 1’e eşittir.
Süreklilik gösteren olayların dağılımına uygundur ve tek maksimuma sahip olduğu için
çarpıklık ve basıklık katsayıları kolaylıkla hesaplanabilir ki buda çalışmalarda büyük
kolaylıklar sağlar.
Normal Dağılım Olasılık Yoğunluk Fonksiyonu
X rassal değişkeninin Normal dağılımın olasılık yoğunluk fonksiyonu aşağıda verilmiştir.

(𝑥− µ)2
1 −
𝑓(𝑥 ) = 𝑒 2𝜎2 , - ∞ < x < ∞ için
𝜎 √2𝜋

Normal dağılımın olasılık yoğunluk fonksiyonunda yer alan sembollerin açıklanmaya ihtiyacı
vardır.

x = olasılığı hesaplanacak tesadüfi değişken


µ = X rassal değişkenin aritmetik ortalaması
σ2 = X rassal değişkeninin varyansı
e = 2.718 (tabii logaritmanın tabanı)
π = 3.141 (pi sayısı)

µ ve σ2, eksi sonsuz ile artı sonsuz arasında bir değer alabilir. Bundan dolayı tek bir normal
dağılım yoktur µ ve σ2 alacağı değerlere göre farklı olabilirler.
X rassal değişkeninin ortalaması µ ve varyansı σ2 olan normal dağılıma sahip ise bu aşağıdaki
şekilde gösterilir.
X N (μ ,σ2 )

X rassal değişkeninin istenilen bir aralıkta olma olasılığı aşağıdaki şekilde hesaplanabilir.

𝑏
1 (𝑥− µ)2

𝑓(𝑥) = 𝑃 (𝑎 < 𝑋 < 𝑏) = ∫ 𝑒 2𝜎2 𝑑𝑥
𝜎√2𝜋
𝑎

X rassal değişkenin normal dağılıma sahip olduğundan olasılıklar Z (Normal dağılım tablosu)
𝑥− µ
tablosu yardımıyla daha kolay hesaplanabilir. Z = olarak ifade edilebilir.
𝜎

X rassal değişkeninin istenilen bir aralıkta olma olasılığı aşağıdaki şekilde de ifade edilebilir.

𝑏
1 𝑍2
𝑓(𝑥) = 𝑃 (𝑎 < 𝑋 < 𝑏) = ∫ 𝑒− 2 𝑑𝑥
𝜎√2𝜋
𝑎
Normal Dağılımın Özellikleri

X rassal değişkeninin ortalaması µ ve varyansı σ2 olan normal dağılıma uyduğu düşünülürse


aşağıdaki özelliklere sahip olacaktır.

1. X rassal değişkeninin ortalaması E (X) = µ


2. X rassal değişkeninin varyansı Var (X) = E [ ( X- µ )2 ] = σ2
3. Skewness = 0 (Basıklık katsayısı)
4. Kurtosis = 3 (Çarpıklık Katsayısı)

X rassal değişkeninin dağılımın ortalaması ve varyansı bu değişkenin olasılık fonksiyonunun


şeklini belirler. Dağılımın iki parametresi olan ortalama ve varyansı değiştikçe normal
dağılım grafiğinin şeklide aşağıdaki örneklerde görüldüğü üzere değişecektir.

Şekil A’da normal dağılıma sahip ortalamaları aynı varyansları farklı iki tane olasılık yoğunluk
fonksiyonu verilmektedir. Şekilden de görüldüğü üzere varyans azaldıkça olasılık yoğunluk
fonksiyonu sivrileşmektedir (Basıklığı azalmaktadır).

Şekil B’de normal dağılıma sahip varyansları aynı ortalamaları farklı iki tane olasılık yoğunluk
fonksiyonu verilmektedir. Şekilden de görüldüğü üzere ortalama artıkça yoğunluk
fonksiyonu yana kayarken biçiminde herhangi bir değişme söz konusu değildir.
Yukarıdaki şekilde X rassal değişkeninin olasılık yoğunluk fonksiyonu normal dağılıma
sahiptir ve dört farklı şekilde verilmiştir. Ortalama ve standart sapmadaki değişmelere göre
olasılık yoğunluk fonksiyonu eğrisinin değişimleri net olarak görülmektedir.

Normal Rassal Değişkenlerin Kümülatif (Birikimli) Olasılık Fonksiyonu


Ortalaması µ ve varyansı σ2 olan normal dağılıma sahip bir X rassal değişkeninin Kümülatif
olasılık fonksiyonu F (x) = P ( X ≤ x0 ) olarak gösterilir.
X rassal değişkeninin belli bir x0 değerinde küçük olma olasılığını gösterir.

Yukarıdaki şekilde gri taralı alan, normal dağılıma sahip X rassal değişkeninin herhangi bir x0
değerinden küçük olma olasılığını vermektedir. Bu alan aşağıdaki genel formül yardımıyla
bulunabilir.

𝑥0
1 (𝑥− µ)2

𝐹(𝑥) = 𝑃 (𝑋 ≤ 𝑥0 ) = ∫ 𝑒 2𝜎2 𝑑𝑥
𝜎√2𝜋
−∞
Normal Rassal Değişkenlerin Aralıklı Olasılık Fonksiyonu
Ortalaması µ ve varyansı σ2 olan normal dağılıma sahip bir X rassal değişkeninin aralıklı
olasılık fonksiyonu F (a) – F (b) = P ( a < X < b ) olarak gösterilir.
X rassal değişkeninin a ve b gibi iki değer arasında olma olasılığını gösterir (a < b koşuluyla).

Yukarıdaki şekilde gri taralı alan, normal dağılıma sahip X rassal değişkeninin a ve b gibi iki
değer arasında olma olasılığını vermektedir. Bu alan aşağıdaki genel formül yardımıyla
bulunabilir.
𝑏
1 (𝑥− µ)2

𝑓(𝑥) = 𝑃 (𝑎 < 𝑋 < 𝑏) = ∫ 𝑒 2𝜎2 𝑑𝑥
𝜎√2𝜋
𝑎
Dağılım normal bir dağılımsa o zaman aşağıdaki normal dağılım tablosu kullanılır.
Standart Normal Dağılım
Normal olasılık fonksiyonlarını hesaplamak bazı güçlükler içerdiğinden her seferinde
bilgisayar yardımıyla sayısal yöntemler kullanılarak hesaplamamız gerekir. Bu işlemi yapmak
yerine standart normal dağılım (Z) tablosu kullanılabilir. Bu tablolarda her bir normal olasılık
dağılımının olasılıkları çizelgeleştirilmiş ve tek bir normal dağılım olasılıklarıyla ifade
edilmiştir.

X ortalaması 0 ve varyansı 1 olan normal rassal değişken ise Standart normal dağılıma (Z)
sahip demektir ve aşağıdaki şekilde gösterilir.

Z N (μ=0 ,σ2 =1)


X rassal değişkeninin Normal dağılımın olasılık yoğunluk fonksiyonu aşağıda verilmiştir.

𝑍2
1
𝑓(𝑧) = 𝑒− 2 , - ∞ < x < ∞ için
√2𝜋

Standart normal dağılımın olasılık yoğunluk fonksiyonunda yer alan sembollerin


açıklanmaya ihtiyacı vardır.
𝑋− µ
Z= 𝜎
E (Z) = µ = 0
Var (Z) = σ = 1
Z değeri belirli bir değerin aritmetik ortalamadan kaç standart sapma aşağıda ya da yukarıda
olduğunu belirlemek için kullanılır.
Yukarıdaki iki şekilde standart normal dağılıma sahiptir. Standart normal dağılım Özellikleri:
1. Dağılım ortalamaya göre simetriktir. %50'si sağda, %50'si soldadır.
2.Normal dağılım eğrisinin altında kalan alan 1’e eşittir.
3. Aritmetik ortalama, ortanca, tepe değer (mod) birbirine eşittir ve maksimum yüksekliğin
bulunduğu yerdedir.
4. Normal dağılımı gösteren değişkenlerin aldıkları değerlerin;
 Gözlemlerin %68 ‘ i ortalama ile  1 standart sapma aralığına,
 Gözlemlerin %95‘ i ortalama ile  2 standart sapma aralığına, ve
 Gözlemlerin %99 ‘ i ortalama ile  3 standart sapma aralığına düşer.
Normal Dağılımın Standart Normal Dağılıma Çevrilmesi
Normal dağılımları standart normal dağılımlara kolaylıkla çevirebiliriz. Bu çevirme
işleminden sonrada olasılıkları standart normal dağılım (Z) tablosu yardımıyla bulabiliriz.

ÖRNEK 1:
Üniversite öğrencilerinin gelirleri normal dağılıma sahiptir. Ortalamasının (μ) 400 ve
standart sapmanın (σ) 50 olduğu bilindiğine göre tesadüfü seçilen bir öğrencinin geliri 500
(X) olsun. Bu normal dağılımı standart normal dağılıma çeviriniz.
𝑋− µ 500−400
Z= = =2
𝜎 50
Bu durumda seçilen öğrencinin geliri, ortalamadan 2 standart sapma daha yüksektir.

ÖRNEK 2:
Üniversite öğrencilerinin gelirleri normal dağılıma sahiptir. Ortalamasının (μ) 400 ve
standart sapmanın (σ) 50 olduğu bilindiğine göre tesadüfü seçilen bir öğrencinin geliri 350
(X) olsun. Bu normal dağılımı standart normal dağılıma çeviriniz.
𝑋− µ 350−400
Z= = = −1
𝜎 50
Bu durumda seçilen öğrencinin geliri, ortalamadan 1 standart sapma düşüktür.

Standart normal dağılım tablosu aşağıda verilmiştir. Bu tabloyu okumayı bilmemiz gerekir.
Z tablosu
•Artı eksi 3.49 arasında değişiyor.
•Bu, teorik evrenin %99.98’ine karşılık geliyor.
•Z tablosu 1/10’luk aralarla standart sapmayı gösteriyor
•Araştırmacılar z tablosundaki birkaç değerle ilgilenir. Çünkü çoğu hipotez testlerinde %95
ve %99’luk alanlarla ilgileniyor.
Tablo 1. Standart normal dağılım tablosu
Z .0 .01 .02 .03 .04 .05 .06 .07 .08 .09
.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
.1 .5398 .5438 .5578 .5517 .5557 .5596 .5636 .5675 .5714 .5753
.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
2.2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890
2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
3.0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
3.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993
3.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995
3.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997
3.4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998
Yukarıdaki tabloda çeşitli Z değerleri için normal eğrilerin alanlarını hesaplanmıştır. Bu
tablolar yardımıyla doğrudan olasılıkları hesaplayabiliriz bunun için Z tablosunu okumasını
bilmemiz gerekir. Z tablosunun nasıl okunacağını aşağıdaki örnekler yardımıyla daha iyi
anlayabiliriz.

 Standart normal dağılıma dönüştürülen bir normal dağılımın P(Z<0.68) olduğunu


varsayalım. Bunun için ilk önce mavi dikey ve mavi yatay sütunlara bakmalıyız. 0.68
bu sütunlarda .6 ve .08 noktalarının (.6 + .08 = .68) kesiştiği yerde aranır. Böylece
P(Z<0.68) = .7517 deriz.

 Standart normal dağılıma dönüştürülen bir normal dağılımın P(Z<1.36) olduğunu


varsayalım. Bunun için ilk önce mavi dikey ve mavi yatay sütunlara bakmalıyız. 1.36
bu sütunlarda 1.3 ve .06 noktalarının (1.3 + .06 = 1.24) kesiştiği yerde aranır. Böylece
P(Z<1.36) = .9131 deriz.
 Standart normal dağılıma dönüştürülen bir normal dağılımın P(Z>2.18) olduğunu
varsayalım. Bu olasılığı tabloda arayabilmenin tek koşulu P(Z<Z0) şeklinde
yazılabilmesidir. P(Z>2.18) = 1 - P(Z<2.18) = 1- 0.9854 = 0.0146 şeklinde bulunur.

 Standart normal dağılıma dönüştürülen bir normal dağılımın P(Z< -1.36) olduğunu
varsayalım. Bu olasılığı tabloda arayabilmenin tek koşulu aranan değerin pozitif
olmasıdır. P(Z<-1.36) = 1 - P(Z<1.36) = 1- 0.9131 = 0.0869 şeklinde bulunur.
 Standart normal dağılıma dönüştürülen bir normal dağılımın P(Z>-2.96) olduğunu
varsayalım. Normal dağılımın simetri özelliğinden bu dağılım P(Z<2.96) şeklinde
yazılabilir.
 Standart normal dağılıma dönüştürülen bir normal dağılımın P(1.36<Z<1.96)
olduğunu varsayalım. Bu aralıklardaki olasılık P(Z<1.96) - P(Z<1.36) = 0.9750- 0.9131
=0.0619 şeklinde bulunur.

 Standart normal dağılıma dönüştürülen bir normal dağılımın P(-1.26<Z<1.26)


olduğunu varsayalım. Bu aralıklardaki olasılık P(Z<1.26) - [ 1 - P(Z<1.26) ] =
2P(Z<1.28) - 1 şeklinde bulunur.
Uygulama

Example: Calculate the chances (probability) of getting exactly two heads (in any order) on
three tosses of a fair coin.
Solution: We can use the above binomial formula to calculate desired probability. For this
we can express the values as follows:
p = characteristic probability or probability of success = 0.5
q = (1-p) = probability of failure = 0.5
r = number of successes desired = 2
n = number of trials undertaken = 3
3!
Probability of 2 successes (heads) in 3 trials = 2!(3−2)! 0.52 0.5(3−2)
3×2×1
= 0.52 0.51
(2×1)(1×1)
= 3 × 0.25 × 0.5 = 0.375
Thus, there is a 0.375 probability of getting two heads on three tosses of a fair coin.
Mean of a Binomial Distribution, μ = np
Where
n = number of trials
p = probability of success
Standard Deviation of Binomial Distribution, σ = √𝒏𝒑𝒒
Where
n = number of trials
p = probability of success
q = probability of failure = 1- p

Example: A packaging machine that produces 20 percent defective packages. If we take a


random sample of 10 packages, what is the mean and standard deviation of the binomial
distribution?
Solution: Mean, μ = np = 10×0.2 = 2
Standard Deviation, σ = √𝑛𝑝𝑞 = √10 × 0.2 × 0.8 = √1.6 = 1.265
The Poisson Distribution
It is a discrete probability distribution developed by a French mathematician Simeon Denis
Poisson. It may be expected in cases where the chance of any individual event being a
success is small. This distribution is used to describe the behaviour of rare events such as
the number of accidents on road, number of printing mistakes in a book, etc., and has been
called “the law of improbable events”.
Poisson Formula:
𝝀𝒏 𝒆−𝝀
Probability of exactly X occurrences, P(X) = 𝒙!
Where

λ𝑛 = lambda (the mean number of occurrences per interval of time) raised to the power x
𝑒 −𝜆 = e, or 2.71828 (the base of the Napierian, or natural, logarithm system), raised to the
power negative lambda,
𝑥! = x factorial.

Example: Suppose that we are investigating the safety of a dangerous intersection. Past
police records indicate a mean of five accidents per month at this intersection. The number
of accidents is distributed according to a Poisson distribution, and the Highway Safety
Division wants us to calculate the probability in any month of exactly 0, 1, 2, 3, or 4
accidents.
Solution: Using the Poisson formula, we can calculate the probability of no accidents:
λ𝑛 𝑒 −𝜆 50 𝑒 −5 (1)(0.0067)
P(0) = = = = 0.00674
𝑥! 0! 1
For exactly one accident:
λ𝑛 𝑒 −𝜆 51 𝑒 −5 (5)(0.0067)
P(1) = = = = 0.03370
𝑥! 1! 1
For exactly two accidents:
λ𝑛 𝑒 −𝜆 52 𝑒 −5 (25)(0.0067)
P(2) = = = = 0.08425
𝑥! 2! 2×1
For exactly three accidents:
λ𝑛 𝑒 −𝜆 53 𝑒 −5 (125)(0.0067)
P(3) = = = = 0.14042
𝑥! 3! 3×2×1
For exactly four accidents:
λ𝑛 𝑒 −𝜆 54 𝑒 −5 (625)(0.0067)
P(4) = = = = 0.17552
𝑥! 4! 4×3×2×1
Our calculations will answer several questions. If we want to know the
probability of 0, 1, or 2 accidents in any month, we can add these probabilities as:
P(0,1, or 2) = P(0) + P(1) + P(2)
= 0.00674 + 0.03370 + 0.08425 = 0.12469
For, P(3 or fewer) = P(0, 1, 2, or 3) = P(0) + P(1) + P(2) + P(3)
= 0.00674 + 0.03370 + 0.08425 + 0.14042 = 0.26511
If we want to calculate the probability of more than three then we must be 0.73489 (1-
0.26511).
Important Point:
The poisson distribution is a good approximation of the binomial distribution when n is
greater than or equal to 20 and p is less than or equal to 0.05.

The Normal Distribution


It is a continuous probability distribution developed by Karl Gauss. The normal probability
distribution is often called Gaussian distribution.
The normal curve is represented in several forms. The following is the basic form relating to
the curve with mean μ and standard deviation σ:

−(𝒙−𝝁)
𝟏
The Normal Distribution, P(X) = 𝝈√𝟐𝝅.𝒆 𝟐𝝈𝟐

Where
X = values of the continuous random variable
μ = mean of the normal random variable
e = mathematical constant (= 2.7183)
π = mathematical constant (= 3.1416)

Characteristics (Graph) of Normal Probability Distribution:


 The curve has a single peak; thus it is unimodal.
 The normal curve is” bell- shaped” and symmetric.
 For a normal probability distribution, mean median and mode all are equal.
 The two tails of the normal probability distribution extend indefinitely and never
touch the horizontal axis.

Areas under the Normal Curve:
No matter what the values of mean (π) and standard deviation (σ) are for a normal
probability distribution, the total area under the normal curve is 1.00. Mathematically it is
true that-
 Approximately 68% of all the values in a normally distributed population lie within
±1σ from mean (π);
 Approximately 95.5% of all the values in a normally distributed population lie within
±2σ from mean (π); and
 Approximately 99.7% of all the values in a normally distributed population lie within
±3σ from mean (π). These are shown in the following graph:
Formula for measuring distances under normal curve:
Standardizing a Normal Random Variable,
𝑋−𝜇
Z= 𝜎
Where
x = value of the random variable with which we are concerned;
μ = mean of the distribution of this random variable;
σ = standard deviation of this distribution;
z = number of standard deviations from x to the mean of this distribution.

Example 1: What is the probability that a participant selected at random will require more
than 500 hours to complete the training program?
Solution: We can see that half of the area under the curve is located on either side of the
mean of 500 hours. Thus, we can deduce that the probability that the random variable will
take on a value higher than 500 is half, or 0.5.

Example 2: What is the probability that a candidate selected at random will take between
500 and 650 hours to complete the training program?
Solution: The probability that will answer this question is the area between the mean (π =
500 hours) and the x value in which we are interested (650 hours). Using equation, we get a
z value of
𝑋−𝜇 650−500 150
Z= = = 100 =1.5 standard deviation
𝜎 100
If we look up z = 1.5 in Z- table, we find a probability of 0.4332. Thus, the chance that a
candidate selected at random would require between 500 and 650 hours to complete the
training program is slightly higher than 0.4.
Example 3: What is the probability that a candidate selected at random will take more
than 700 hours to complete the training program?
Solution: This situation is different from the above example 2. We are interested in the area
to the right of the value 700 hours. So, first we will find out z value by using the formula-
𝑋−𝜇 700−500 200
Z= = = 100 =2.0 standard deviation
𝜎 100
Looking in the Z- table for z value of 2.0, we find a probability of 0.4772. That represents the
probability the program will require between 500 and 700 hours. But, we have to find out
the probability that take more than 700 hours. Because the right half of the curve (between
the mean and the right- hand tail) represents a probability of 0.5, we can get our answer
(the area to the right of the 700- hour point) if we subtract 0.4772from 0.5; 0.5000- 0.4772
= 0.0228. Therefore, there are just over 2 percent chances (or 2 out of 100) that a
participant chosen at random would take more than 700 hours to complete the course.

Example 4: Suppose the training program director wants to know the probability that a
participant chosen at random would require between 550 and 650 hours to complete the
required work.
Solution: First calculate a z value for the 650 hour point, as follows:
𝑋−𝜇 650−500 150
Z= = = 100 =1.5 standard deviation
𝜎 100
When we look up a z of 1.5 in z table, we see a probability value of 0.4332 (the probability
that the random variable will fall between the mean and 650 hours). Now we calculate a z
value for 550 hours as follows:
𝑋−𝜇 150−500 50
Z= = = 100 =0.5 standard deviation
𝜎 100
When we look up a z of 0.5 in z table, we see a probability value of 0.1915 (the probability
that the random variable will fall between the mean and 550 hours). To answer our
question, we must subtract as follows to get probability that the random variable will lie
between 550 and 650 hours = 0.4332 – 0.1915 = 0.2417.
Thus, the chance of a candidate selected at random taking between 550 and 650 hours to
complete the program is 24 in 100.
3. Eğri uydurma ve en küçük kareler yöntemi
Standart eğriler:
• Düz çizgi
• İkinci dereceden eğriler
• Üçüncü dereceden eğriler
• Çember
• Elips
• Hiperbol
• Logaritmik eğriler
• Üstel eğriler
• Hiperbolik eğriler
• Trigonometrik eğriler

Standard curves - Second-degree curves

The simplest second-degree curve is expressed by:

y  x2
Its graph is a parabola, symmetrical about
The y-axis and existing only for y ≥ 0. y = ax2 gives a thinner parabola if a > 1 and a flatter parabola if
0 < a < 1. The general second-degree curve is:

y  ax 2  bx  c
where a, b and c determine the position,‘width’ and orientation of the parabola.
Linear Regression

"En iyi" düz çizgiyi eşleştirilmiş veri noktalarına sığdırmak istiyoruz: (x1,Y1), (x2,Y2), …,(xi,Yi).
Hesaplanan değerler için matematiksel ifade:

yi = a1 + a2 xi

where yi is the calculated (linear) value approximating the experimental value Yi. The model error,
or residual, ei can be represented as

ei = Yi - a1 - a2 xi

where ei is discrepancy between the measured value Yi and the approximated value yi as predicted
by the linear equation.

Let’s define

ei = Yi - yi

to be the difference between the experimental and predicted values. The least-squares
criterion requires that S defined by Eq. be a minimum

N
2 2
S = e1 + e2 + ..... + eN = 2
 ei 2
i 1
or
N
S=  {Yi - [a1 + a2 (xi)]}2
i 1

Setting the derivative of this sum with respect to each coefficient equal to zero will result in
a minimum for the sum. Thus the coefficients a1 and a2 must satisfy the conditions

N
S
=
a1 i 1

{-2}{Yi - [a1 + a2 (xi)]} = 0

N
S
=
a 2 i 1

{-2(xi)}{Yi - [a1 + a2 (xi)]} = 0

rearranging Eqs.

N N
a1 N + a2  xi =  Yi
i 1 i 1
N N N
a1  xi + a2  xixi =  xiYi
i 1 i 1 i 1

The system can be expressed in the matrix notation

A.a = B

or
 N   N 
 N  i  a1 
x    iY
 i 1  
= Ni 1 
N N  a 2   
 x i  i i
x x    i i 
x Y
i 1 i 1  
i 1 

In linear regression model, we wish to predict response to n data points


( x1 , y1 ), ( x2 , y2 ),......,( xn , yn ) by a regression model given by
y  a0  a1 x (1)
where a 0 and a1 are the constants of the regression model.
A measure of goodness of fit, that is, how well a0  a1 x predicts the response
variable y is the magnitude of the residual  i at each of the n data points.
Ei  yi  (a0  a1 xi ) (2)
Ideally, if all the residuals  i are zero, one may have found an equation in which all the
points lie on the model. Thus, minimization of the residual is an objective of obtaining
regression coefficients.
The most popular method to minimize the residual is the least squares methods, where the
estimates of the constants of the models are chosen such that the sum of the squared
n

E
2
residuals is minimized, that is minimize i
.
i 1

Why minimize the sum of the square of the residuals? Why not, for instance, minimize the
sum of the residual errors or the sum of the absolute values of the residuals? Alternatively,
constants of the model can be chosen such that the average residual is zero without making
individual residuals small. Will any of these criteria yield unbiased parameters with the
smallest variance? All of these questions will be answered below. Look at the data in Table
1.
Table 1 Data points.
x y
2.0 4.0
3.0 6.0
2.0 6.0
3.0 8.0

To explain this data by a straight line regression model,


y  a0  a1 x (3)
n
and using minimizing E
i 1
i
as a criteria to find a 0 and a1 , we find that for (Figure 1)
y  4x  4 (4)

10

6
y

0
0 1 2 3 4

Figure 1 Regression curve y  4x  4 for y vs. x data.

4
the sum of the residuals, E
i 1
i  0 as shown in the Table 2.

Table 2 The residuals at each data point for regression model y  4x  4 .


x y y predicted   y  y predicted
2.0 4.0 4.0 0.0
3.0 6.0 8.0 -2.0
2.0 6.0 4.0 2.0
3.0 8.0 8.0 0.0
4


i 1
i 0

4
So does this give us the smallest error? It does as E
i 1
i  0 . But it does not give unique

values for the parameters of the model. A straight-line of the model


y 6 (5)
4
also makes E
i 1
i  0 as shown in the Table 3.
Table 3 The residuals at each data point for regression model y  6
x y y predicted   y  y predicted
2.0 4.0 6.0 -2.0
3.0 6.0 6.0 0.0
2.0 6.0 6.0 0.0
3.0 8.0 6.0 2.0
4

E
i 1
i 0

9
y=6

7
y

3
1.5 2 2.5 3 3.5

Figure 2 Regression curve y  6 for y vs. x data.

Since this criterion does not give a unique regression model, it cannot be used for finding
the regression coefficients. Let us see why we cannot use this criterion for any general data.
We want to minimize
n n

 E   y
i 1
i
i 1
i  a0  a1 xi  (6)

Differentiating Equation (6) with respect to a 0 and a1 , we get


n
  Ei n
i 1
  1   n (7)
a0 i 1

n
  Ei n _
i 1
   xi   n x (8)
a1 i 1

Putting these equations to zero, give n  0 but that is not possible. Therefore, unique
values of a 0 and a1 do not exist.
n
You may think that the reason the minimization criterion E
i 1
i
does not work is that
n
negative residuals cancel with positive residuals. So is minimizing E
i 1
i
better? Let us
4
look at the data given in the Table 2 for equation y  4x  4 . It makes E
i 1
i  4 as shown

in the following table.

Table 4 The absolute residuals at each data point when employing y  4x  4 .


x y y predicted   y  y predicted
2.0 4.0 4.0 0.0
3.0 6.0 8.0 2.0
2.0 6.0 4.0 2.0
3.0 8.0 8.0 0.0
4


i 1
i 4
4
The value of E i 1
i  4 also exists for the straight line model y  6 . No other straight line
4
model for this data has  Ei  4 . Again, we find the regression coefficients are not unique,
i 1

and hence this criterion also cannot be used for finding the regression model.
Let us use the least squares criterion where we minimize
n n 2

S r   Ei    yi  a0  a1 xi 
2
(9)
i 1 i 1

S r is called the sum of the square of the residuals.


To find a 0 and a1 , we minimize S r with respect to a 0 and a1 .
S r n
 2  yi  a0  a1 xi  1  0 (10)
a0 i 1

S r n
 2  yi  a0  a1 xi  xi   0 (11)
a1 i 1

giving
n n n
  yi   a0   a1 xi  0 (12)
i 1 i 1 i 1
n n n
  y i x i   a 0 x i   a1 x i2  0 (13)
i 1 i 1 i 1
n
Noting that a
i 1
0  a 0  a 0  . . .  a 0  na0
n n
na0  a1  xi  y i (14)
i 1 i 1
n n n
a 0  x i  a1  x i2   x i y i (15)
i 1 i 1 i 1
( xn , yn )
y
xi , yi 
Ei  yi  a0  a1 xi

 x2 , y 2 

x3 , y3 

y  a0  a1 x
x1 , y1 
x

Figure 3 Linear regression of y vs. x data showing residuals and square of residual at a
typical point, x i .

Solving the above Equations (14) and (15) gives


n n n
n xi y i  xi  y i
i 1 i 1 i 1
a1  2
(16)
 n
 n
n xi2   xi 
i 1  i 1 
n n n n

 xi2  y i   xi  xi y i
i 1 i 1 i 1 i 1
a0  2
(17)
n
  n
n xi2   xi 
i 1  i 1 
Redefining
n _ _
S xy   x i y i  n x y (18)
i 1
n _2
S xx   xi2  n x (19)
i 1
n

_ x
i 1
i
x (20)
n
n

_ y
i 1
i
y (21)
n
we can rewrite
S xy
a1  (22)
S xx
_ _
a 0  y  a1 x (23)

Example 1

The torque T needed to turn the torsional spring of a mousetrap through an angle,  is
given below
Table 5 Torque versus angle for a torsion spring.
Torque,
Angle, 
T
Radians
Nm
0.698132 0.188224
0.959931 0.209138
1.134464 0.230052
1.570796 0.250965
1.919862 0.313707

Find the constants k1 and k 2 of the regression model


T  k1  k 2

Solution

Table 6 shows the summations needed for the calculation of the constants of the regression
model.

Table 6 Tabulation of data for calculation of needed summations.


i  T 2 T
1 radians Nm radians 2
Nm
1
2 0.698132 0.188224 4.87388 10 1.31405 101
1
3 0.959931 0.209138 9.21468 10 2.00758  10 1
4 1.134464 0.230052 1.2870 2.60986  10 1
5 1.570796 0.250965 2.4674 3.94215  10 1
6 1.919862 0.313707 3.6859 6.02274  10 1
5


i 1
6.2831 1.1921 8.8491 1.5896

n5
5 5 5
n  i Ti   i  Ti
k2  i 1 i 1 i 1
2
 5
 5
n     i  i
2

i 1  i 1 
5(1.5896)  (6.2831)(1.1921)

5(8.8491)  (6.2831) 2
 9.6091  102 N - m/rad
5

_ T i
T i 1
n
1.1921

5
 2.3842  101 N-m
5

_  i
 i 1
n
6.2831

5
 1.2566 radians
_ _
k1  T  k 2 
 2.3842 10 1  (9.609110 2 )(1.2566)
 1.1767  101 N - m

Figure 4 Linear regression of torque vs. angle data


Example 2

To find the longitudinal modulus of a composite material, the following data, as given in
Table 7, is collected.

Table 7 Stress vs. strain data for a composite material.


Strain Stress
(%) ( MPa )
0 0
0.183 306
0.36 612
0.5324 917
0.702 1223
0.867 1529
1.0244 1835
1.1774 2140
1.329 2446
1.479 2752
1.5 2767
1.56 2896

Find the longitudinal modulus E using the regression model.


  E (24)

Solution

Rewriting data from Table 7, stresses versus strain data in Table 8

Table 8 Stress vs strain data for a composite in SI system of units


Strain Stress
( m/m ) ( Pa )
0.0000 0.0000
1.8300 103 3.0600 108
3.6000 10 3 6.1200  108
5.3240 10 3 9.1700 108
7.0200 103 1.2230  109
8.6700  10 3 1.5290  109
1.0244 10 2 1.8350  109
1.1774 10 2 2.1400  109
1.3290 10 2 2.4460  109
1.4790 10 2 2.7520  109
1.5000 10 2 2.7670  109
1.5600 10 2 2.8960  109
Applying the least square method, the residuals  i at each data point is
 i   i  E i
The sum of square of the residuals is
n
S r    i2
i 1
n
   i  E i 
2

i 1

Again, to find the constant E , we need to minimize S r by differentiating with respect to E


and then equating to zero
n
  2 i  E i (  i )  0
dS r
dE i 1

From there, we obtain


n

  i i
E i 1
n
(25)

i 1
i
2

Note, Equation (25) only so far has shown that it corresponds to a local minimum or
maximum. Can you show that it corresponds to an absolute minimum.
The summations used in Equation (25) are given in the Table 9.

Table 9 Tabulation for Example 2 for needed summations


i   2 
1 0.0000 0.0000 0.0000 0.0000
3
2 1.8300 10 3.0600 10 8
3.3489 106 5.5998 105
3 3.6000 10 3 6.1200  108 1.2960 10 5 2.2032  10 6
4 5.3240 10 3 9.1700 108 2.8345 105 4.8821106
3
5 7.0200 10 1.2230  10 9
4.9280 105 8.5855 106
6 8.6700  10 3 1.5290  109 7.5169 105 1.3256  107
7 1.0244 10 2 1.8350  109 1.0494 10 4 1.8798 107
8 1.1774 10 2 2.1400  109 1.3863 104 2.5196  10 7
9 1.3290 10 2 2.4460  109 1.7662 10 4 3.2507  10 7
10 1.4790 10 2 2.7520  109 2.1874 104 4.0702  10 7
11 1.5000 10 2 2.7670  109 2.2500 104 4.1505  10 7
12 1.5600 10 2 2.8960  109 2.4336 104 4.5178  10 7
12

i 1
1.2764 103 2.3337  108

n  12
12


i 1
i
2
 1.2764  10 3
12

 
i 1
i i  2.3337  10 8
12

  i i
E i 1
12


i 1
i
2

2.3337  108

1.2764  10 3
 182.84 GPa

Figure 5 Linear regression model of stress vs. strain for a composite material.

QUESTION:
Given n data pairs, x1 , y1 , , xn , y n  , do the values of the two constants a0 and a1 in the
least squares straight-line regression model y  a0  a1 x correspond to the absolute
minimum of the sum of the squares of the residuals? Are these constants of regression
unique?

ANSWER:

Given n data pairs x1 , y1 , , xn , y n  , the best fit for the straight-line regression model
y  a0  a1 x (A.1)
is found by the method of least squares. Starting with the sum of the squares of the
residuals S r
n
S r    y i  a 0  a1 xi 
2
(A.2)
i 1

and using
S r
0 (A.3)
a0
S r
0 (A.4)
a1
gives two simultaneous linear equations whose solution is
n n n
n xi y i  xi  y i
a1  i 1 i 1 i 1
2
(A.5a)
n
  n
n xi2   xi 
i 1  i 1 
n n n n

x y x x y
2
i i i i i
a0  i 1 i 1 i 1 i 1
2
(A.5b)
 n n
n x   xi  2
i
i 1  i 1 
But do these values of a0 and a1 give the absolute minimum of value of S r (Equation (A.2))?
The first derivative analysis only tells us that these values give a local minima or maxima of
S r , and not whether they give an absolute minimum or maximum. So, we still need to
figure out if they correspond to an absolute minimum.

We need to first conduct a second derivative test to find out whether the point (a0 , a1 )
from Equation (A.5) gives a local minimum or local maximum of S r . Only then can we
proceed to show if this local minimum (or maximum) also corresponds to the absolute
minimum (or maximum).

What is the second derivative test for a local minimum of a function of two variables?

If you have a function f  x, y  and we found a critical point a, b  from the first derivative
test, then a, b  is a minimum point if
2
2 f 2 f  2 f 
   0 , and (A.6)
x 2 y 2  xy 
2 f 2 f
 0 OR 0 (A.7)
x 2 y 2
From Equation (A.2)
S r n
  2 y i  a0  a1 xi (1)
a0 i 1
(A.8)
n
 2  yi  a0  a1 xi 
i 1

S r
 
n
  2 yi  a0  a1 xi ( xi )
a1 i 1
(A.9)
 
n
  2 xi yi  a0 xi  a1 xi2
i 1
then
 2Sr n

a 02
 2 
i 1
 1  2n (A.10)

 2Sr n
 2 xi2 (A.11)
a1 2
i 1

 2Sr n
 2 x i (A.12)
a 0 a1 i 1

So, we satisfy condition (A.7) because from Equation (A.10) we see that 2n is a positive
n
number. Although not required, from Equation (A.11) we see that 2 xi2 is also a positive
i 1

number as assuming that all x data points are NOT zero is reasonable.
Is the other condition (Equation (A.6)) for S r being a minimum met? Yes, we can show
(proof not given that the term is positive)
2 2
 2 Sr  2 Sr   2 Sr   n 2  n 
   2n  2 xi    2 xi 
a02 a12  a0 a1   i 1   i 1 
 n 2  n 2 
 4  n  xi    xi  
 i 1  i 1  
n
 4 ( x i  x j ) 2  0 (A.13)
i 1
i j
So the values of a 0 and a1 that we have in Equation (A.5) do correspond to a local minimum
of S r . But, is this local minimum also an absolute minimum. Yes, as given by Equation
(A.5), the first derivatives of S r are zero at only one point. This observation also makes the
straight-line regression model based on least squares to be unique.
As a side note, the denominator in Equations (A.5) is nonzero as shown by Equation (A.13).
This shows that the values of a0 and a1 are finite.
4. Markov Zincirleri Analizi

4.1. Stokastik (Rassal) Süreçler


Rassal değişkenlerin zamanla nasıl değiştiği stokastik süreçleri de içerir. Örneğin borsada bir
hissenin fiyatının nasıl değiştiği veya bir firmanın piyasa payının nasıl değiştiği stokastik
süreçle ilgilidir. Bir stokastik süreç örneği olan Markov Zincirleri eğitim, pazarlama, sağlık
hizmetleri, muhasebe ve üretim alanları gibi alanlara uygulanmaktadır.

Kesikli zamanlarda, bir sistemin özelliklerinden Xt değeri t zamanından önce kesin olarak
bilinmemektedir ve rassal bir değişkendir.

Markov zincirleri, ayrık zamanlı stokastik süreçlerin özel bir türüdür. Basit bir ifadeyle
herhangi bir zamanda ayrık zamanlı stokastik süreç sonlu sayıda durumdan birinde olabilir.

Ayrık zamanlı stokastik süreç aşağıdaki koşulu sağlıyorsa süreç markov zinciridir.
t= 0,1,2,… için ve her bir durum için

P(Xt=j / Xt-1=i, Xt-2=k, ...) = P(Xt=j / Xt-1=i)

ise süreç markov zinciridir. Şu anki duruma bir önceki adımda, durumlardan herhangi
birinden gelmiştir. Bu duruma Xt-1 anında i’inci durumdan gelmiştir. Oraya ise Xt-1 anında
k’ıncı durumdan gelmiştir. Böylece geriye doğru gidilirse ilk başlangıç anı ve durumu bellidir.
Şu anda Xt anında ve j’inci durumdadır, geldiği Xt-1 anı ve i’inci durumu bilmek yeterlidir.
bellidir.
(X=q)
Markov Modeli
• Senaryo
• Grafik gösterimi
• Tanım
• Sıra olasılığı
• Durum olasılığı
Problem
Bir havanın üç durumunu sınıflandıralım,
Durum 1: Yağmurlu
Durum 2: Bulutlu
Durum 3: Güneşli

Varsayım: yarın hava durumu sadece bugünün hava durumuna bağlıdır!

Hava durumuna ait Yağmurlu, Bulutlu ve Güneşli olma olasıkları aşağıdaki derlenmiş olsun.

Bir sonraki durum (n=1)


Şimdiki durum Yağmur (%) Bulut (%) Güneş (%)
(n=0)
Yağmur 40 30 30
Bulut 20 50 30
Güneş 25 25 50

Tablo, halen Yağmurlu olan havanın daha sonra, yani birinci adımda Yağmurlu, Bulutlu,
Güneşli olma olasılıklarını vermektedir. Notasyonda kolaylık olması için S i halen içinde
bulunulan i. durumu ve Sj ise sürecin j. durumda bulunacağı daha sonraki adımı (=genel
olarak birinci adım) temsil etmektedir.

Tablodaki bilgiler yeniden bir olasılıklar tablosunda yazılırsa P ile göstereceğimiz bir geçiş
matrisi bulunur. S1 S2 S3
S 1 0.40 0.30 0.30
P= S 2 0.20 0.50 0.30
S 3 0.25 0.25 0.50

Geçiş matrisinin her bir elemanı bir durumdan diğer bir duruma geçme olasılığını verir ve bu
elemanlara p ij denir. Bu ise, halen i. durumda olan sürecin bir sonraki adımda j. durumda
olacağını gösteren şartlı olasılıktır. Örneğin P13=0.30 elemanının, n=0 da S 1 durumunda
Yağmur olan havanın n=1 de S 3 durumunda Güneşli olma olasılığının 0.30 olacağı
anlamındadır.
Güneşli olan bir havanın daha sonra Yağmur olma olasılığı P31=0.25 dir.
Geçiş matrisinin aşağıdaki koşulları sağlaması gerekir:
1) Her bir eleman olasılıktır ve değeri 0 ile 1 arasındadır. Olasılıklar negatif ve birden
büyük olamaz.
2) Her bir satırdaki olasılıkların toplamı 1’e eşittir. Geçiş matrisinin bir satırdaki elemanları
muhtemel olayların gerçeklenme olasılıklarından doğan sonuçları vermesi nedeni ile,
olasılıklar toplamının bir olması açıktır.
Geçiş matrisi genel bir notasyon ile
0  Pij  1,
m

P
j 1
İJ  1, (i  1,2,....,m)

olmak üzere
m S1 S 2 .... Sm
S1  P11 P12 .... P1m 
P P22 .... P2 m 
S2  21
 .. .. .... .. 
 
m .  Pm1 Pm 2 .... Pmm 

kareP=
matrisi
. yazılır. i satırı temsil etmek üzere v i satır vektörü olarak tanımlanır. v i satır

vektörlerinin
S birer olasılık vektörü olduğu unutulmamalıdır. Örneğin v =(0.20; 0.50; 0.30)
2
m

olasılık vektörü geçiş matrisinin ikinci satırını temsil eder ve vektör elemanları sırasıyla S 1 ,
S 2 ,S 3 durumlarına S 2 durumundan geçme olasılıklarıdır. O halde P geçiş matrisi v i olasılık
vektörlerinden oluşur ve geöiş matrisi koşullarını sağlar.

Geçiş Diyagramı:

- Her durum bir gözleme karşılık gelir


- Herbir durumda giden kenar ağırlıklarının toplamı birdir.
4.2. Markov Zinciri ile Olasılık Analizleri
Bir havanın n=0 da Yağmur olması, n=1 de Yağmur olması ve n=2 de Bulutlu olma olasılığı ne
olacaktır? Soruyu olasılık teorisi teknikler ile cevaplamak olanağı vardır. Yağmur olan bir
havanın ikinci adımda Bulut olana kadar olan değişik seçeneklerini teker teker ayırmak için
bir diyagramla çalışmak kolaylık sağlar.

Şu an hava Yağmur ise ikinci adımda Bulutlu olma olasılığı nedir?

İlk Adım Birinci Adım İkinci Adım Şartlı


n=0 n=1 n=2 olasılıklar

P=0.40
Yağmur

Yağmur P=0.30 Bulut (0.40)*(0.30)=0.120


P=0.40 P=0.30
Güneş

P=0.20 Yağmur
P=0.30
Yağmur Bulut P=0.50
Bulut (0.30)*(0.50)=0.150

P=0.30
Güneş
P=0.30
Yağmur
P=0.25

P=0.25
Güneş Bulut (0.30)*(0.25)=0.075 m
P=0.50
Güneş 0.345

Şekil: n=2, ikinci adımda mümkün sonuçlar

Şekilde, 2. adımda Bulutlu olması için verilen olasılıkların toplanması ile 0,345 bulunur. Bu
ise şartlı olasılıktır. Aşağıdaki tablo grafikteki işlemleri özetlemektedir ve n=0 adımında
Yağmur olan havanın n=1 de Yağmur ve n=2 adımda Bulutlu olma olasılığı 0,345 dir.
n=0 n=1 de n=2 de Şartlı Olasılık
Yağmur 0.40 Bulut 0.30 (0.40)*(0.30)=0.120
Yağmur Bulut 0.30 Bulut 0.50 (0.30)*(0.50)=0.150
Güneş 0.30 Bulut 0.25 (0.30)*(0.25)=0.075
0.345
Bulunan sonuç Markov zincirlerinin sağladığı analiz tekniğiyle de elde edilebilir.
Önce V1 olasılık vektörünün ne anlamda kullanıldığını açıklamaya gerek vardır. S1 durumu için
olasılık vektörü V1= (0.40; 0.30; 0.30) dur. n=0 adımında Yağmur olan bir havanın ikinci
adımdaki tüm tedarik olasılıklarını V1 vektörü verecektir. V1 vektörünün P matrisi ile çarpımı
ile V2 bulunur.

0.4 0.3 0.3


2 1
𝑣 = 𝑣 𝑃 = [0.4 , 0.3 , 0.3] [ 0.2 0.5 0.3 ]
0.25 0.25 0.5

= [0,295 0,345 0,360]

V2 vektörü n=0 adımda Yağmur olan havanın n=1 adımında Yağmur iken n=2 adımdında
Yağmur, Bulutlu ve Güneşli olma olasıklarını vermektedir.

Markov zincirleri,olasılık problemlerinin özel halini formüle etmek için teknik ve analiz
vermiştir.

V2=P x P

0.2950 0.3450 0.3600


V2= 0.2550 0.3850 0.3600
0.2750 0.3250 0.4000

n: Yağmur iken
n=1’inci adımda [Yağmur, Bulutlu, Güneşli]=[0.4, 0.3, 0.3]
n=2’inci adımda [Yağmur, Bulutlu, Güneşli]=[0.295, 0.345, 0.360]
olarak bulunur.
Kumarbazın İflası Problemi
Oyuna başlagıç anında kumarbaz 2 TL’ye sahiptir. 1,2,… zamanlarında kumarbaz oyun oynar
ve 1TL bahse girer ve p olasılıkla oyunu kazanır ve (1-p) olasılıkla oyunu kaybeder. Burada
hedef 4 TL sahibi olunca oyunu bitirmektir. Dikkat edilirse elde 0 TL kalınca da oyun
bitmektedir.

X0, X1, …..,Xt ayrık zamanlı stokastik süreç olarak ortaya çıkar. X0 = 2 bilinmektedir ve sabittir.
Fakat X1 ve sonra Xt değerleri rassaldır.

Örneğin p olasılıkla X1=3 ve (1-p) olasılıkla X1=1 olur. Eğer Xt , 0 veya 4 değerlerine eşit
değilse p olasılıkla Xt+1=Xt + 1 ve 1-p olasılıkla Xt+1=Xt-1 olur.
Eğer Xt=0 ise Xt+1 ve daha sonraki Xt değerleri 0’a eşittir
Eğer Xt=4 ise Xt+1 ve daha sonraki Xt değerleri 4’e eşittir

t+1’deki para t zamanına kadar birikmiş paraya (t zamanındaki paraya) bağlı olduğundan bu
süreç bir Markov zinciridir. Oyunun kuralları zamanla değişmediği için bu aynı zamanda
stasyoner(sabit) Markov zinciridir.
Problem:
Aşağıda Geçiş Matrisi verilmiş olan üç durumlu Markov zincirini göz önüne alın, S={1,2,3}.

1 1 1
2 4 4
1 2
𝑃= 0
3 3
1 1
[2 0]
2

a) Bu zincir için Geçiş Durum Diyagramını çizin

b) Eğer P(X1=1) = P(X1=2)=1/4 ise P(X1=3, X2=2, X3=1) değerini hesaplayınız.

P(X1=1) : t=1 anında 1’inci durumdaki olasılık değeri


P(X1=2) : t=1 anında 2’inci durumda olasılık değeri
P(X1=3) : t=1 anında 3’üncü durumda olasılık değeri

P(X1=1) + P(X1=2) + P(X1=3)=1;


P(X1=3)=1 - P(X1=1) - P(X1=2)
P(X1=3)=1 - 1/4 – 1/4
P(X1=3)=1/2
P(X1=3, X2=2, X3=1) = P(X1=3)* p32*p21 =1/2*1/2*1/3=1/12
1’inci adımda 3’üncü durumda, 2’inci adıma 2’inci duruma gidecek, 3’üncü adımda
1’inci duruma gidecek.
ÖRNEK: Bir markov sürecinin başlama vektörü 𝑣 0 = (0.6 0.4) ve geçiş olasılık matrisi

0.9 0.1
𝑃=[ ]
0.8 0.2
Birinci adım için 𝑣 1 = 𝑣 0 𝑃 olduğundan

0.9 0.1
𝑣 1 = (0.6 0.4) [ ] = (0.86 0.14) = (𝑣11 𝑣21 ) bulunur.
0.8 0.2

O sürecin bir adım sonunda 𝑆 1 durumunda bulunma olasılığı 0.86 ve 𝑆 2 durumunda


bulunma olasılığı 0.14 dir.Bu sonuşlar ağaç diyagramı ile de elde edilebilir.

𝑆 1 (0.6) (0.9)=0.54
0.9

𝑆1
0.6

0.1
𝑆 2 (0.6) (0.1) =0.06
Başlama
𝑆 1 (0.4) (0.8)=0.32
0.4 0.8
𝑆2

0.2
𝑆 2 (0.4) (0.2)=0.08

Şekil: Başlama olasılıkları (0.6 0.4) olmak üzere bir adım sonra durum uzayı.

0.9
𝑣11 = (0.6 0.4) ( )=0.54+0.32=0.86
0.8

0.1
𝑣21 = (0.6 0.4) ( )=0.06+0.08=0.14
0.2

0.9 0.1
𝑣 2 = 𝑣 1 𝑃 = (0.86 0.14) [ ] = (0.886 0.114) = (𝑣12 𝑣22 )
0.8 0.2
veya
0.9 0.1 0.9 0.1
𝑣 2 = 𝑣 0 𝑃2 = (0.6 0.4) [ ][ ] = (0.886 0.114) = (𝑣12 𝑣22 )
0.8 0.2 0.8 0.2
4.3. Ergodik Markov Zincirleri
Denge durumu koşullarına erişilmesini sağlamak için zincir mutlaka ergodik olmalıdır.Ergodik
zincir, matematik olarak herhangi bir durumdan diğer bütün durumlara geçişin mümkün
olduğu bir süreci tanımlar. Bu tanımda tam bir adımda bulunma şansı yoktur, ama başlama
durumuna bakmadan bir duruma erişilmiş olmalıdır.

1’ den diğer durumlara geçiş ve diğer durumlardan 1’ e geçiş olanağının bulunması geçiş
matrisinin ergodik olduğunu gösterir.

Ergodik markov zincirini sınırlayan hal düzenli (=reguler) zincirdir. Düzenli zincir, P geçiş
olasılıkları matrisinin kuvvetlerinde bulunan elemanların sıfırdan farklı ve pozitif olmasını
gerektirir. Ergodik zincirin kuvvetleri alınırsa veya matriste sıfır eleman kalmayıncaya kadar
kuvvetler alınırsa ergodik zincirin düzenli olduğu görülür. Bu işlem aşağıda verilmiştir.Bütün
düzenli zincirlerin ergodik olduğu doğrudur, ama tersininde doğru olmasına ihtiyaç yoktur.
Bütün ergodik zincirlerin düzenli olmadığına dikkat etmelidir.

x x 0 x x x x x x x x x x x x
0 x x 0 x x x x x x  x x x x x 
  
P= 0 0 0 x x , P 2   x x x 0 x  ,P 4   x x x x x
     
x 0 x 0 x x x 0 x x x x x x x
 x x 0 0 0  x x x x x   x x x x x 

Örnek: Aşağıdaki geçiş matrislerinin a) düzenli ve b) ergodik olmasını açıklayınız.

1  x x 0  x x x
   
P   x x x
2
P= 2  x 0 x 
3 0 x x   x x x 

P geçiş matrisinin P 2 kuvvetinin elemanları pozitif veya sıfırdan farklı olduğundan P geçiş
matrisi ile verilen Markov zinciri düzenlidir. Düzenli Markov zincirleri ise ergodiktir. Ayrıca 1
den 1 veya 2 ye doğrudan geçiş vardır,daha sonra da 2 den 3 e geçiş olanaklıdır.2 den 1e
geçilebilir ve 3 den 2 ye ,1 e geçiş vardır.Dolayısıyla zincir ergodiktir,bütün durumlara geçiş
olanağı vardır.
Örnek:

1 2 3 4
x 0 x 0 x 0 x 0 x 0 x 0
1  0  
0 x 0 x x 0 x 4 0 x 0 x 
P= P 
2
P
2 x 0 x 0 x 0 x 0 x 0 x 0
     
3
0 x 0 x 0 x 0 x 0 x 0 x

P geçiş matrisinin kuvvetleri


4 P matrisini tekrar vermektedir.Dolayısıyle P stokastik
matrisi düzenli bir zincir değildir.Zira ilk matriste sıfır elemanları vardır ve kuvvetlerde sıfır
elemanlar aynen kalmıştır. Ayrıca 1 den 1 veya 3 e,ve 3 den 3 veya 1 e geçiş vardır.
Dolayısıyle 1. durumdan 2. duruma veya 4. duruma geçiş olanağı yoktur, ve zincir ergodik
değildir.

Örnek: Aşağıda verilen Markov zincirinin ergodik ve düzenli olmasını araştırınız.

 1 0   1 0 
P=   P2  
1 / 2 1 / 2 3 / 4 1 / 4

P matrisinin kuvvetleri alınırsa (1.2) elemanı daima (0) olacaktır. Dolayısıyla verilen Markov
zincir düzenli ve ergodik değildir.

Örnek:
 0 1 
P=  
1 / 3 2 / 3

Düzenli Markov zinciri olduğunu gösteriniz.

 0 1   0 1  1 / 3 2 / 3
P2 P*P    *  
1 / 3 2 / 3 1 / 3 2 / 3 2 / 9 7 / 9

P 2 nin bütün elemanları pozitif olduğundan P düzenli Markov zinciridir.

Örnek: Aşağıdaki matrisin reguler (düzenli) olup olmadığını bulunuz.


0.75 0.25 0
𝑃=[ 0 0.5 0.5]
0.6 0.4 0

0.5625 0.3125 0.125


𝑃2 = [ 0.3 0.45 0.25 ]
0.45 0.35 0.2
𝑃2 matrisindeki bütün değerler pozitif olduğunda 𝑃 matrisi düzenlidir.

Örnek: Aşağıdaki matrisin reguler (düzenli) olup olmadığını bulunuz.


0.5 0 0.5
𝑃=[ 0 1 0 ]
0 0 1

0.25 0 0.75
𝑃2 = [ 0 1 0 ]
0 0 1

0.125 0 0.875
𝑃3 = [ 0 1 0 ]
0 0 1

0.0625 0 0.9375
4
𝑃 =[ 0 1 0 ]
0 0 1

𝑃2 matrisindeki bütün değerler pozitif olmadığından 𝑃 matrisi düzenli değildir.


4.4. Denge Durumu Koşulları
Düzenli ergodik zincirlerde denge durumu koşullarının varlığı,n kuvveti göstermek üzere
n
P nin hesaplanması ile göstermek kolaylık sağlar.P nin n. kuvvetlerine göre n=1 den n=8 e
kadar değerler için otomobil-müşterileri örneğimize ilişkin hesaplar verilmiştir.

 0.4 0.3 0.3 0.295 0.345 0.360


   
P  0.255 0.385 0.360
2
P=  0.2 0.5 0.3
0.25 0.25 0.5 0.275 0.325 0.400

0.277 0.351 0.372 0.2740 0.3516 0.3744


   
P  0.269 0.359 0.372 P  0.2724 0.3744 0.3744
3 4

0.275 0.345 0.380 0.2740 0.3500 0.3760

0.27352 0.35160 0.37488 0.273448 0.351576 0.374976


 
P  0.27320 0.35192 0.37488 P 0.273384 0.356400 0.374976
6
5
 
0.27360 0.35120 0.37520 0.273480 0.351400 0.375040

0.2734384 0.3515664 0.3749952


 
P  0.2734256 0.3515792 0.3749952
7

0.2734480 0.3515440 0.3750080

0.27343744 0.35156352 0.37499904


 
P  0.27343488 0.35156608 0.3749904 
8

0.27244000 0.35155840 0.37500160

P nin kuvvetlerinde izlenebileceği gibi n büyüdükçe P ij değerleri sabit bir sayıya veya limite
yaklaşmaktadırlar ve her bir v in olasılık vektörleri i nin bütün değerleri için eşit olmaya
meyletmektedir.Dolayısıyle aşağıdaki iki kural yazılır:

1) n nin yeterince daha büyük değerleri için,V in olasılık vektörleri bütün o değerleri için
aynıdır ve değişmez.
2) V in 1  Vi * P ve V in 1  Vi n olduğundan V*P=V eşitliğini sağlayan bir V denge vektörü
vardır.

V vektörü denge durumu koşullarını içeren olasılıkları kapsar.

P
j 1
i
j
 1 bağıntısı bu değerleri elde etmek için analitik yöntemi sağlar.V olasılık

vektöründeki j. Elemanları v j ile gösterelim V bir olasılık vektörü olduğundan

v
j 1
i
j
1 (6)

bağıntısı geçerlidir.(2) nolu bağıntıdan

[v 1 v 2 v 3 ......v m ]*P=[v 1 v 2 v 3 .....v m ] (7)


yazılır.Sol tarafta bulunan satır vektörü ile P geçiş matrisi çarpımından yine bir satır vektörü
bulunarak eşitliğin sağ tarafındaki vektör elemanlara her bir eleman eşit olması yazılarak (m)
adet denklem elde edilir.Olasılıkların toplamı nın 1 e eşit olma şartı ile de (m)
bilinmeyen,(m+1) denklemden çözülebilir.Ama y=0 olursa (6) bağıntısı 8m) denklem
arasında bulunması şarttır,yani (m+1) adet denklemden biri denklem takımına katılmayabilr.

Örneğimize belirlenen kuralları uygulayalım.

v
j 1
1 1 ..........................v 1 v2  v3  1

[v 1 v 2 v 3 ] * P =[v 1 v 2 v 3 ] ....0.4v 1 0.2v2  0.25v3  v1


0.3v 1 0.5v2  0.25v3  v2
0.4v 1 +0.3v 2 0.5v3  v3
Üç bilinmeyenli denklem sisteminin çözümü ile;

v 1  0.273 v 2  0.352 v 3  0.375


bulunur.İncelemelerimize göre aşağıdaki yorumları yapabiliriz:

1)Uzun dönemde Anadol müşterisi toplam müşterinin(pazarın) %27.3’ünü,Murat


müşterisi %35.2’sini ve Renault müşterisi %37.5’unu oluşturacaktır.
2)Uzun dönemde bir müşterinin Anadol alma olasılığı 0.273 dir ve benzer yorum
yapılır.
Örnek: Aşağıdaki geçiş matrisinden hareketle denge durumu koşullarını bulunuz.

0.2 0.5 0.3


 
P=  0.1 0.6 0.3
0.5 0 0.5
V=[v 1 v 2 v 3 ] denge vektörünün bulunması istenmektedir.O halde,

v 1 v2  v3  1
0.2v 1 0.1v2  0.5v3  v1
0.5v 1 0.6v2  (0)v3  v2
0.3v 1 0.3v2  0.5v3  v3
bağıntıları yazılır.İkinci eşitlik elimine edilerek

v 1 v2  v3  1
0.5v 1 0.4v 2  0
0.3v 1 0.3v2  0.5v3  0
yazılır ve çözüm
v 1  0.282
v 2  0.352
v 3  0.366
olarak bulunur.Dolayısiyle denge vektörü:V=[0.282 0.352 0.366] olur.

Örnek: (İmalat problemi)Bir imalat tezgahında standart bir mamul imalinden sonra,takip
eden mamulünde aynı kalitede olma olasılığı 0.9 ve hatalı bir mamul imalinden sonra takip
eden mamulün standart olma olasılığı 0.8 dir.Üretim sürecinde her kademe sonuçları bir ön
sonuca bağlı olacağı varsayımı ile geçiş matrisini kurunuz ve süreci irdeleyiniz.
Standart bir mamul üretimi S 1 , hatalı bir mamul üretimi S 2 ile gösterilerek

0.9 0.1
P=  
0.8 0.2
Geçiş matrisi bulunur.Geçiş matrisi kuvvetleri alınarak

0.9 0.1 0.9 0.1 0.89 0.11


P2  *  
0.8 0.2 0.8 0.2 0.88 0.12

0.89 0.11 0.9 0.1 0.889 0.111


P 3  P2P   *  
0.88 0.12 0.8 0.2 0.888 0.112

0.889 0.111 0.9 0.1 0.8889 0.1111


P 4  P3P   *  
0.888 0.112 0.8 0.2 0.8888 0.1112
Bulunur ve hesaplara devam ederek sürecin denge vektörünün V=(8/9,1/9) olduğu
gösterilebilir.O halde verilen süreç düzenli bir Markov zinciridir.Sürecin uzun bir dönemde S 1
durumuna gitme olasılığı 8/9 ve S 2 durumuna girme olasılığı 1/9 dur.Diğer bir deyişle uzun
bir dönemde üretimin 8/9 u standart mamul,1/9 u hatalı mamul olacaktır.Örneğin 999
adetlik bir parti üretiminde 888 mamul standart,111 mamul ise hatalı olur.

Örnek:
1 / 2 1 / 4 1 / 4
 
P= 1 / 2 1 / 4 1 / 4
 0 1 / 2 1 / 2
(m) durum sayısını göstermek üzere P geçiş matrisi

m m

 Pij   Pij  1
i 1 j 1

bağıntısını sağlarsa katı stokastik matris adını alır.Katı stokastik matrislerde denge
vektörü bileşenleri bütün matrislerde j değerleri için v j  1 / m dir.Örnekte denge vektörü,
V=[v 1 v 2 v 3 ], v 1  v2  v3  1 ,V=(1/3 1/3 1/3) olur.

Örnek:
0 1 
P=  
1 0 

P geçiş matrisinin denge vektörü, VP=V bağıntısından


V=(1/2 1/2)
Olarak bulunur.P nin kuvvetleri alınırsa
n=tek sayı için P n =P
1 0 
n=çift sayı için P n   
0 1 
bulunur ve P nin kuvvetlerinde sıfır bulunduğu için zincir düzenli değildir.
5. Kaynaklar
1. https://www.wiley.com/legacy/Australia/Landing_Pages/c12ContinuousProbabilityD
istributions_web.pdf
2. Olasılık ve İstatistik, Aydın Üstün, 2014.
3. Olasılığın Matematiksel Temelleri , Timur KARAÇAY, Başkent Üniversitesi, Fen-
Edebiyat Fakültesi
4. https://www.probabilitycourse.com/chapter11/11_2_7_solved_probs.php

You might also like