You are on page 1of 81

Counting Statistics

Sayım istatistiği
NEM601 RADYASYON ÖLÇÜM VE ANALİZLERİ
Bölüm Amaçı

– Radyoaktif bozunmanın İstatiksel bir süreç olduğunu


göstermek
– Ölçülen İstatiksel parametreleri ve verileri teorik
istatistiksel parametreler ve verilerle karşılaştırmak
– Radyoaktif bozunma bir random porosestir.

– Radyasyon ölçümleri ve sonuçlarının analizleri için


gereken istastiksel yöntemler tartışılacaktır.
Bölüm Amaçı

• Radyasyonun doğası gereği olasılıksal olan deneylerin


analizlerinde
– Deneysel hataların azaltılması

– Deney verilerinin değerlendirilmesi

• için istatistiksel yöntemlerin bilinmesi gerekmektedir.


ERRORS AND ACCURACY AND PRECISION OF
MEASUREMENTS
• ÖLÇÜM:
– Belirli bir parametrenin veya miktarın değerinin belirlenmesi
işlemidir.
Kabul 1: Hatasız sonuç veren ölçüm yoktur
Kabul 2: Bir ölçüm sonucu o ölçüme ait hata raporlanmadıkca
neredeyse hiç bir değer taşımaz
• Ölçüm sonuçları ile ilgili bu iki kabul kesinlikler unutulmamalıdır.
ERRORS AND ACCURACY AND PRECISION OF
MEASUREMENTS
• ACCURACY AND PRECISION
• Ölçüm belirsizliği ile ilgili doğruluk ve kesinlik kavramları vardır.
• Sözlükte aynı anlama gelselerde deneysel çalışmlarda farklı kavramlar
olarak tanımlanmaktadırlar.
• ACCURACY:
– Bir deneyin doğruluğu bize,
– ölçüm sonucunun, ölçülen miktarın gerçek değerine ne kadar
yakın olduğunu söyler.
• PRECISION
– Bir deneyin kesinliği elde edilen sonucun kesinliğinin bir ölçüsüdür.
ERRORS AND ACCURACY AND PRECISION OF
MEASUREMENTS
• Örnek
• Işık hızı ölçümü:
– Ölçümlerden 2,997930 × 108 m/s'ye eşit olduğu bilinmektedir.

– Ölçüm 1: Bir ölçümün 2,9998 × 108 m/s sonucunu verdiğini varsayalım.


• Bu iki sayı arasındaki fark, ölçümün doğruluğunun bir ölçüsüdür.
• Öte yandan ölçümün kesinliği,
– sonucu temsil eden anlamlı rakamların sayısıyla ilgilidir.
» 2,9998 × 108 sayısı, sonucun 2,9997 ile 2,9999 arasında
belirlendiğini
– Veya
» eşdeğer olarak 30.000'de 1 (1/29998) oranında bilindiğini
gösterir.
ERRORS AND ACCURACY AND PRECISION OF
MEASUREMENTS
– Eğer ölçüm tekrarlanacak olursa,
– yeni 2.9999 × 108 m/s sonucunun
» doğruluğu derişirken,
» kesinliği değişmiyecektir.

– Öte yandan ölçüm sonucu 2,99985 × 108 m/s ise


– hem kesinliği
– hem de doğruluk değişmiş demektir.
ERRORS AND ACCURACY AND PRECISION OF
MEASUREMENTS
• Tekrarlamalardan
kaydedilen sonuçlar aynı
değildir.
• Genellikle, veriler
Gaussian Dağılım
gösterirler
• Raporlanan ölçülen değer,
ölçülen verilerin dağılım
şekline bağlı ortalama
bir değerdir.
• Bireysel sonuçların
dağılım gelişliği ölçüm
kesinliğinin bir
ölçüsüdür.
• Dağılım ortalamasının
gerçek değerden uzaklığı
ise ölçüm doğruluğunun
bir ölçüsüdür.
ERRORS AND ACCURACY AND PRECISION OF
MEASUREMENTS

• Every experimenter should consider accuracy and precision


simultaneously.
• It would be a waste of effort to try to improve the precision of
a measurement if it is known that the result is inaccurate.
• On the other hand, it is almost useless to try to achieve very
high accuracy if the precision of the measurement is low.
Introduction
• Radyoaktif bozunma raslantısal (random) bir prosestir.

– Ölçülen değerler istatistiksel bir dağılıma sahiptir ve belirli


oranda belirsizlik içermektedir.
• Sayım istatistiği iki amaca hizmet etmektedir.

I. Cihaz ve Süreçlerin normal işleyişinin doğrulanmasına


• Belirlenen koşullar altında ölçülen parametreler ile
beklenilen sonuçlar ile karşılaştırılması

II.Ölçümlerden elde edilen miktarların (precision) kesinliği


hakkında tahminler yapmak
2.2 DEFINITION OF PROBABILITY

• Olasılığın Tanımı.
– Bir deneyin defalarca tekrarlandığını ve elde edilen x türünün gerçek
sunuç olup olmadığının gözlendiğini varsayalım.
• X türü olay: deneyi yapan kişi tarafından belirlenen ve değişimi takip
edilebilen bir sonuç olacaktır.
– Eğer deney N kez tekrarlanacak olursa ve

– Elde edilen sonuçlardan n tanesinin x türü olay olacak olursa

– her hangi bir olayın x türü olay olma olasılığı P(x)

eşit olacaktır.
2.2 DEFINITION OF PROBABILITY

• Olasılığın Tanımı

• Burada

– n/N oranı: ilk N denemelerinde x’în bağıl oluşma sıklığı


olarakda tanımlanmaktadır.
– Bu eşitliğin hesaplanmasında bazı zorluklar bulunmaktadır.

– Bu eşitlikte ortaya çıkan zorluklardan biri sonsuz sayıda


deney tekrarının gerekli olmasıdır.
– Sonsuz sayıda deney yapılması imkansızdır.
2.2 DEFINITION OF PROBABILITY

Sonsuz sayıda deney yapılması yerine


•N sayıda deney tekrarı yapıdığında

•n sayıda x türü olay meydana gelecek olursa P(x) olasılığı

Eşit olacaktır.
Bu eşitlik ise uygulamada yaygın olarak kullanılmaktadır.
2.2 DEFINITION OF PROBABILITY

Örnek: Madeni para 100 kez atıldığında kaç kez “tura” kaç kez “yazı” geldiğine

yönelik bir deney yapılsın. Deney sonucunda 48 kez tura ve 52 kez yazı geldiği

tespit edilsin. Ture ve yazı gelme olasılıkları nedir?


2.2 DEFINITION OF PROBABILITY

Cevap

Tura ve yazı gelme olasılığı:

Eşitliğinden

Deneme sayısı artıkça doğru sonuca ulaşma olasılığıda artacaktır.


2.2 DEFINITION OF PROBABILITY

(2.1)

olması
2.2 DEFINITION OF PROBABILITY

Örnekler:

x olayı deney her yapıldığında meydana geliyorsa,

 x belirli (kesin) bir olaydır;

 Bu durumda

n = N ve P(x) = 1 olacaktır.

 Dolayısıyla, belirli (kesin) bir x olayın meydana gelme

olasılığı 1'e eşittir.


2.2 DEFINITION OF PROBABILITY

 Eğer x olayı asla gerçekleşmezse, x imkansız bir

olaydır,

Bu durumda

 n = 0 ve P(x) = 0 eşit olacaktır.


2.2 DEFINITION OF PROBABILITY

 Eğer bir ölçüm sonucu, her biri eşit olasılığa sahip N olasığına

sahip ise,

 Bu durumda

Bireysel xi olayının meydana gelme olasılığını

Şeklinde yazabiliriz.

 Burada i değeri 1 den N kadar değerler alacaktır.


2.2 DEFINITION OF PROBABILITY

 Örnek

 Yazı tura atma durumunda, eşit olasılıklı iki olay olduğuna

göre;
2.3 BASIC PROBABILITY THEOREMS

 Temel Olasılık Teoremleri:

 Olasılık dilinde,

Bir "olay", bir veya daha fazla deney veya denemenin


sonucudur
Bu olayın ne olacağı deneyi yapan kişi tarafından
tanımlanmaktadır.
2.3 BASIC PROBABILITY THEOREMS

Örnek Olaylar
 Bir kez yazı tura atmak ve yazı gelmesi

 İki kez yazı tura atmak ve iki kez tura almak

 10 kez yazı tura atmak ve ilk beşinde tura gelmesi,

 Bir radyoaktif numuneyi 10 saniye boyunca sayma ve 100 sayım


kaydetmek
 Bir nükleer reaktördeki tüm yakıt çubuklarının incelenmesi ve ikisinde
arıza bulunması
Yeterli bilgi verildiğinde, bu olaylardan herhangi birinin meydana gelme
olasılığı hesaplanabilmektedir.
2.3 BASIC PROBABILITY THEOREMS

Örnek:
x ve y birer olay olsun.

N sayıda deneme yapılsın.

Her denemenin sonunda, aşağıdaki dört olasılıktan yalnızca birinin olduğunu


varsayalım:

1. x oluştu ama y olmadı(n1)

2. y oldu ama x olmadı (n2)

3. x ve y meydana geldi (n3)

4. Ne x ne de y meydana geldi (her ikiside oluşmadı)


2.3 BASIC PROBABILITY THEOREMS

 n1, n2, n3, ve n4, ilgili olayın olma değeri

 N sayıda yapılan deneme sonucunda ilgili olayların olma olasılıkların sayısı

olsun.

 Bu durumda:

tüm olayların olma olasılık sayılarının

toplamı deneme sayısını verecektir.

Eşit olacaktır.
2.3 BASIC PROBABILITY THEOREMS
 x ve y olaylarına göre olasılıkları şu şekilde tanımlayabiliriz.

1. P(x) = x'in meydana gelme olasılığı

2. P(y) = y'nin olma olasılığı

3. P(x + y) = x veya y’nin olma olasığı

4. P(xy) = hem x hem de y'nin meydana gelme olasılığı

5. P(x|y) = x ve y'in koşullu olasılığı

= y gerçekleştiğinde, x'in olma olasılığı

6. P(y|x) = y ve x'in koşullu olasılığı

= x gerçekleştiğinde y'in olma olasılığı


2.3 BASIC PROBABILITY THEOREMS
Denklem 2.2

kullanılarak bu olasılıklar şu şekilde yazabiliriz.


n1 ve n3 de x olayı oluyor

n2 ve n3 de y olayı oluyor

n1 ve n3 de x olayı oluyor n2
de x olmuyor.

n3 de x ve y olayları oluyor.

x olduğunda y nin olma


olasılığı n3 de y oluyor.

y olduğunda x nin olma


olasılığı n3 de x oluyor.
2.3 BASIC PROBABILITY THEOREMS
 Denklem 2.4'ten 2.9'a kadar olan altı olasılık için aşağıdaki iki bağıntı
geçerlidir:

 Denklem 2.10 olasılığın toplama yasası iken

 Denklem 2.11 olasılığın çarpma yasasıdır.


2.3 BASIC PROBABILITY THEOREMS
Örnek 2.1
İyi karıştırılmış iki deste kart olsun. Her iki desteden bir maca ası
çekme olasılığı nedir?
2.3 BASIC PROBABILITY THEOREMS
Cevap 2.1
2.3 BASIC PROBABILITY THEOREMS
Cevap 2.1

Olasılığın çarpma yasası denklem 2.11


2.3 BASIC PROBABILITY THEOREMS
Örnek 2.2

İyice karıştırılmış iki deste kart düşünün ve her birinden bir kart
çekildiğini varsayalım. İki karttan birinin maça ası olma olasılığı
nedir?
2.3 BASIC PROBABILITY THEOREMS
Cevap 2.2
2.3 BASIC PROBABILITY THEOREMS

Durum 1

=0
2.3 BASIC PROBABILITY THEOREMS
Durum 2
II. Örnek 2.1 de gösterildiği gibi x’in oluşma olasılı

y’nin olup olmamasından bağımsız olması durumunda


2.3 BASIC PROBABILITY THEOREMS

 Bu durumda, x ve y olaylarına stokastik olarak bağımsız denir


ve çarpma yasasıda aşağıdaki şekilde olacaktır:

 Eşitlik 2.12 ve 2.13 de olasılığın toplama ve çarpma yasası


olmaktadır.

Ancak bu eşitliklerin Eşitlik 2.12 ve 2.13liklerinin özel


koşullarda geçerli olduğu unutulmamalıdır.
2.3 BASIC PROBABILITY THEOREMS

Bir zarın tek bir atışla 2 veya 5 ile sonuçlanma olasılığı nedir?
2.3 BASIC PROBABILITY THEOREMS
2.3 BASIC PROBABILITY THEOREMS

Örnek 2.4

İyice karıştırılmış iki deste kart düşünün ve her desteden bir kart çekildiğini
varsayalım. Her iki kartın da maça olma olasılığı kaçtır?
2.3 BASIC PROBABILITY THEOREMS

Cevap 2.4
2.3 BASIC PROBABILITY THEOREMS
P(x+y)= P(x)+P(y) 2.12

P(xy) = P(x)P(y) 2.13

Denklemleri stokastik olarak birbirinden bağımsız olan herhangi bir


sayıda olay için geçerlidir.

Böylece, N tane olayımız varsa, xn|n=1,…,N


toplama ve çarpma yasasları
Probability Distributions and
Random Variables

 Bir deney aynı koşullar altında bir çok kez tekrarlandığında


ölçüm sonuçları aynı olmayacaktır.
 Aslında sonuçların farklı olması bir istisna değil bir
kuraldır
 Dolayısıyla her bir deney sonuçlarının meydana gelme
olasılığını yöneten bir yasanın olup olmadığının bilinmesi
çok önemlidir.
Ex: Probability of rolling a die and getting a 1,2,3,4,5 or 6 is exactly 1.
Probability Distributions and
Random Variables
 Böyle bir yasanın var olması ve bilinmesi iki yaklaşım için
önemli olacaktır.
 Birincisi: az sayıda ölçüm yapıldığında sonraki
ölçümlerden beklenen sonuçlar hakkında bilgi
edinilmektedir.
 Ikincisi hataları control etmek için bir seri ölçüm
tekrarlanabilir.
Probability Distributions and
Random Variables
 Eğer elde edilen deney sonuçlarının belirli bir yasaya uyması
gerektiği biliniyorsa
 Yapılan bir seri ölçüm sonuçlarının bu yasaya uymadığı
görülürse,
 Bu sonuçlar dizisinin doğru olduğu kabul edilmeden
önce iyice araştırılması gerekmektedir.
Probability Distributions and
Random Variables
 KAVRAMLAR

 Rasgele (Random) Değişken:

 Nicel olarak belirlenebilen ancak benzer ölçümlerden farklı sonuçlar elde


edilen x nicelliğine raslantısal (rasgele) değişken denir.
 Rastgele değişkenlere örnek olarak,

bir kart destesinden bir kart çekmenin sonucu,

bir zarın atılmasının sonucu,

bir nükleer yakıt çubuğunun uzunluğunun ölçülmesinin sonucu

bir numunenin radyoaktivitesinin sayılmasının sonucu verilebilir.


Probability Distributions and
Random Variables
 KAVRAMLAR

 KESIKLI VE SÜREKLI olmak üzere iki tür raslantısal değişken


bulunmaktadır.
Kesikli raslantısal değişken bir seri farklı değerden biri alabilir.

Bu değişken, sonuçları tam sayı olan değişkenlerin tanımlanmasında


faydalı olmaktadır

Örneğin,

kişi sayısı, kusurlu pil sayısı veya ölçüm sonuçlarının kaydedildiği


sayım sayısı
Probability Distributions and
Random Variables
 KAVRAMLAR

 Sürekli random değişken:

belirli bir aralık içinde herhangi bir değeri alabilen değişkenlerdir.

 Örneğin,

insanların ağırlığı veya boyu,

bir çubuğun uzunluğu

 bir reaktörden çıkan suyun sıcaklığı

 gibi süreklilik gösteren değişkenleri ifade etmektedir


Probability Distributions and Random Variables

 Her raslantısal değişken x için olasılık,

yoğunluk fonksiyonu (pdf) (frekans fonksiyonu olarak da

adlandırılır) olarak adlandırılan bir fonksiyon f(x) ile

tanımlanmaktadır.

 Kesikli raslantısal değişken için

 f(xi) = random değişken değeri xi (i=1,2,…N) dir.

 N: x’in kesikli olasılık değerini vermektedir.

 Çünkü x belirli bir zamanda yalnızca tek değer almaktadır.


Probability Distributions and
Random Variables
 x tek seferde yalnızca bir değer aldığında f(xi) olasılıklarıyla temsil edilen

olaylar birbirinden bağımsızdır.

 Dolayısıyla eşitlik 2. 14 kullanılmaktadır.


Probability Distributions and Random Variables

• Kesikli random değişken


• Discrete Random Variable
– Discrete random variable takes on “discrete” values – usually integers –
e.g., number of people, number of counts, etc.
– Given a collection of N independent (discrete) measurements of the same
physical quantity (x1, x2, x3, x4,… xN)

f(xi) = probability the value of the random variable is x i

 f (x )  1
i 1
i
Probability Distributions and
Random Variables
 Continuous random variables

 Raslantısal (random) olarak a ve b (a ≤ x ≤ b) arasında herhangi bir değeri

alabileceği kabul edilmektedir.

 Böylelikle

f(x) dx = x değerinin x ile x + dx arasında olma olasılığıdır.

 Burada dikkat edilmesi gereken konu bir sürekli değişken x'in belirli bir

değer alma olasılığı değil, yalnızca x'in iki x değeriyle tanımlanan bir

aralığa düşme olasılığıdır.


Probability Distributions and
Random Variables
 Continuous random variables

 Dolayısıyla, kesikli raslantısal olasılık için verilen eşitlik

 Sürekli raslantısal olasılık için aşağıdaki şekilde değişecektir.


Probability Distributions and Random Variables

 2.16 ve 2.17 denklemleri kesin bir olayın olma olasılığını verir, çünkü x

kesinlikle x1, x2, …, xN değerlerinden birine sahip olacaktır ve kesinlikle a ile

b arasında bir değere sahip olacaktır.


Probability Distributions and Random
Variables
• Continuous Random Variable
– May have any value within some range, such as temperature (35.3, 423.15),
velocity (22, 36.5, 55.997), etc.
– Given a continuous random variable between a and b (a≤ x ≤ b)
• there are an infinite number of values of x between a and b
• f(x)dx = probability that the random variable x lies between x and x+dx

 f ( x )dx  1
a

– Ex: 100 resistor, with manufacturing tolerances 99.99 – 100.01 


• Probability the resistance is exactly 100 is zero, f(100) = 0
• Probability the resistance is between 99.9999 and 100.0001 is non-zero
Probability Distributions and
Random Variables
 Şimdi sürekli bir değişken için aşağıdaki işlevi göz önünde bulunduralım

 Kesikli değişken için

 F(x) fonksiyon anlamı

 F(xj ) = probability that the value of x is less than or equal to xj


Probability Distributions and
Random Variables
 F(x) fonksiyonuna kümülatif (toplam) dağılım fonksiyonu (cdf)

denilmektedir.

 integral veya toplam dağılım fonksiyonu olarak da bilinir

 Kümülatif dağılım fonksiyonunun (cdf) özellikleri:

 Kümülatif dağılım fonksiyonu pozitif artan bir fonksiyondur. Ki burada

 F(b) > F(a), eğer b>a olursa


Density Functions
• f(x) is the probability density function (pdf)
– May be discrete or continuous

j x
F(x j )= f(x i ) F ( x )   f ( x ' )dx '
i=1 a
• F(x) is the cumulative distribution function (cdf)
Probability Distributions and
Random Variables
 cdf pozitif monoton artan bir fonksiyondur, yani b > a ise F(b) > F(a).

 Gerçekte cdf and eşitlik 2.18 den elde edilen pdf arasında bir ilişki

bulunmaktadır.
2.5 LOCATION INDEXES (MODE, MEDIAN, MEAN)
Konum İndeksleri (MOD, ORTAM, ORTALAMA)

 Eğer Dağılım fonksiyonu F(x) veya f(x) biliniyorsa, RANDOM x değişken

değerleri hakkında çok fazla bilgi elde edilebilir.

 Bunun tersi durumda, yani

 Eğer F(x) veya f(x) tam olarak bilinmiyorsa, x’in belirli değerleri dağılım

fonksiyonları hakkında değerli bilgiler sağlamaktadır.

 Bir çok uygulamada x’in önemli değerleri nispeten çok dar bir aralıkta

kümeleşmektedir.
2.5 LOCATION INDEXES (MODE, MEDIAN, MEAN)
Konum İndeksleri (MOD, ORTAM, ORTALAMA)

 Tüm dağılım hakkında genel bir bilgiye sahip olmak için x'in tipik

değerlerini sağlayan "konum indeksleri" ile bu aralık konumunun

belirlenmesi yeterli olmaktadır.

 Teoride, random bir değişkenin değerler dağılımı için sonsuz sayıda konum

indeksi oluşturulabilir,

 Ancak uygulamada genellikle üç konum indeksi kullanılmaktadır.

 Kullanılan Konum İndexleri:

 1. mode, 2. ortam, 3. ortalama


2.5 LOCATION INDEXES (MODE, MEDIAN, MEAN)

Bir sürekli olası dağılım fonksiyonu


için X1 Mode, X2 median ve m mean

Şekildeki f(x) fonksiyonu aşağıdaki


Eşitliği sağlamaktadır.
2.5 LOCATION INDEXES (MODE, MEDIAN, MEAN)
Location Indexes
• Mode (most prob. value) Mode en olası x değeri olmaktadır. Bu nedenle, x1
kipi, f(x)'in maksimum olduğu değerdir.
• Buna göre: df ( x )
0
dx

x2
1
• Median F ( x2 )   f ( x )d ( x ) 

2

• X değerinin 2 den küçük değer alma olasılığı ile 2 den büyük değer alma
olasılığı birbirine eşittir.
Also known as the “expectation value” or “first moment”
Location Indexes
• Mean: x’in ortalama veya beklenilen değeri aşağıdaki eşitlik ile
hesaplanmaktadır.


xm  x  f ( x )dx


• f(x)'in Denklem 2.17'yi karşılayıp karşılamadığına bakılmaksızın, herhangi


bir g(x) fonksiyonunun ortalamasını veya ortalamasını veren Denklem
2.26'nın genel bir ifadesi,

Also known as the “expectation value” or “first moment”


Location Indexes

• Ayrı bir yoğunluk fonksiyonu Pdf için konum indeksi benzer şekilde
tanımlanmaktadır.
• Eğer pdf denklem 2.17 yi karşılıyor ise.
• Ortalama eşitlik aşağıdaki gibi yazılır

Bu eşitlik bir yaklaşım fonksiyonudur.


Çünkü gerçek ortalama yalnızca sonsuz
sayıda ölçüm ile belirlenmektedir.

Also known as the “expectation value” or “first moment”


Location Indexes
• A general expression for the mean is given by
 N

 g ( x )f ( x )dx  g ( x )f ( x )
i i

g( x )   g( x )  i 1
N

 f ( x )dx  f (x )
i 1
i



• And the nth moment is given by



x   x f ( x )dx
n n


DISPERSION INDEXES, VARIANCE, AND STANDARD
DEVIATION
Dağılım İndekseleri, varyasyonlar ve standard sapma

• Pdf (probability of density function) veya cdf (cumulative distribution function)


yaklaşık olarak herhangi bir konum indeksi ile belirlenebilmektedir.
• uygulamalarda, bir konum indeksinin değeri ile birlikte örneğin ortalama
yoğunluğunun seçilen konum indeksi etrafında nasıl dağıldığını gösteren bir ölçütün
bilinmesi yeterli olacaktır.
• Dağılım indeksleri adı verilen birçok ölçüm bulunmaktadır.
• En yaygın olarak kullanılar, V(x) varyansı
• (standard sapmanın karesi varyans ve varyansın karekökü standard spma)

standard sapma σ olarak adlandırılmaktadır.


Dispersion Indexes
• Variance (bir pdf için sürekli dağılımlarda varyans)

V (x)   2    2 Continuous dağılımlar
( x m ) f ( x )dx
için


Discrete (kesikli)
N
V ( x )   2   ( x i  m )2 f ( x i )
dağılımlar için

i 1
• Standard Deviation
– square root of the variance

s   2
Dispersion Indexes
• F(x) denleminin sürekli ve kesikli dağılımlare için ve 2.17 yi sağladığı kabul
edilmektedir.
Eşitlik 2.16 Eşitlik 2.17

• Aslında varyans yalnızca (x-m)2 değerinin ortalamsından başka birşey değildir.


• X, a+bx gibi doğrusal fonksiyonun varyansı aşağıdaki eşitlik olacaktır.
2.7 COVARIANCE AND CORRELATION
(Kovaryans) Ortak değişken ve korelasyon
2.7 COVARIANCE AND CORRELATION
Ortak değişken ve korelasyon
2.7 COVARIANCE AND CORRELATION
Ortak değişken ve korelasyon

 Bu eşitliğin çözümünde önemli sorunlar bulunmaktadır . Bu eşitliklerle tanımlanan

ortak değişkenler, Xi, Xj ölçümü için kullanılan birimlerle değişmemektedir.

 Bu etkiyi ortadan kaldırmak için kovaryans, σi, σj standart sapmalarının çarpımına


bölünür ve elde edilen orana korelasyon katsayısı ρ(Xi,Xj) denir.
Dispersion Indexes
• Recall that m and x are synonymous

2      
2 2 2 2
( x m ) f ( x )dx and ( x - m ) x 2 xm m

 8 
2  

x 2f ( x )dx  2m  xf ( x )dx  m 2  f ( x )dx
 

 2  x 2  2mm  m 2  x 2  m 2


The variance is the difference between 2
the mean of the squares and the mean
squared
 x - x
2 2
Example: Calculating Variance
DATA Data Squared
5 25 • The Microsoft Excel function “stdev” uses the “n-
6 36 1” method for a population sample and returns
3 9 2.089 (population variance)
8 64
9 81
3 9
• The Microsoft Excel function “stdevp” uses the
4 16 unbiased method and returns 2 (sample variance)
7 49
5 25 • As “n” gets very large, there is little difference
6 36 between the two methods


7 49 2
9 81
• Be careful using
 x - x
2 2

=72/12 =480/12
Mean = 6 Mean of Sq. =
on small samples, unless the sample is large or
40 reflects the entire population
2 = 40 – (6)2 = 4
=2
Covariance and Correlation
• Correlation is a measure of how one random variable depends on another
random variable
– If data is strictly independent (purely random)  correlation is zero

• Covariance is the correlation with the mean values removed from the data
(subtracted out)

• Correlation coefficient is a normalization of the correlation by removing the


mean and dividing by the standard deviation
– Resulting variable has zero mean and unit variance
Covariance and Correlation
• Covariance
cov( xi , x j )   xi  mi   x j  m j 

• Correlation coefficient
cov( xi , x j )
ij    xi , x j  
 i j

• Random variable for which ij = 0 are said to be


uncorrelated
Binomial Distribution
• A pdf (probability density function) with properties
– Two possible outcomes, A or B
– Probability of A and B are constant, regardless of # of
observations
– A and B are independent of each other

n!
P( x ) 
p = probability that the outcome ispAx (1  p )n  x
1-p = probability that  xoutcome
(n the )! x ! is B
n = number of objects or trials
Binomial Distribution
n
x  pn
mean  x   xP ( x )  pn If an event has a 50% chance of occurring, then we
x 0 expect for 10 trials to observe (0.5*10 = 5) successes

 
n
 2   x  x P(x )
x 0

  np(1  p ) & since x  np


2
 2  x(1  p )
 2  x(1  p )
Poisson Distribution
• A simplification of the binomial distribution where
N∞ and p << 1 (p0)
– Radioactive decay
• Large number of nuclei (N) with only a small fraction (p)
decaying
– Spallation product formation
• Large number of particles from accelerator striking a target
and producing reaction products

 
x
 pn  e x
x
e  pn x For mean value >20 the Poisson
P( x )   distribution is essentially symmetric
x! x! and resembles a normal distribution

p = individual success
probability
n = number of objects or trials
xbar = mean = pn
Normal (Gaussian) Distribution
• A simplification of the binomial distribution where the mean is large (>
20)
– Ex: Birthdays of a random group of 10,000 people
• p = 1/365 n = 10,000 m = p*n = 10000/365 = 27.4
• mean is larger than 20, so can use Normal (Gaussian) distribution

• Properties
– Normalized
 
 p( x )  1
 x )dxmean
– Symmetric aboutp(the
 x 0

– Predicted variance

2  x  = x
Normal (Gaussian) Distribution
  x  m 
2
1
G( x )dx  exp   dx
 2
2
2 2

m = average of distribution
2 = variance of distribution
G(x)dx = probability that x lies between x & x+dx

 = Full Width Half Maximum (FWHM)


width of Gaussian distribution at half of its maximum = ½ G(m)

 
  2 2Ln 2   2.35
Normal (Gaussian) Distribution
• Confidence Limits
m 
A   G( x )dx  0.683
m
68.3% of all measurements will fall between 1

A2  0.977 97.7% within 2 

A3  0.9987 99.87% within 3 

You might also like