You are on page 1of 36

Verilerin Özetlenmesi

Sayısal olarak Özetleme---Tanımlayıcı İstatistikler

Prof.Dr. Pelin GÜRKAN ÜNAL/19.10.2020

1
Verilerin Özetlenmesi
Merkezi Eğilim Ölçüleri

• Örnek verilerini kullanarak frekans dağılışlarını sayısal olarak


özetleyen değerlere tanımlayıcı örnek istatistikleri adı verilmektedir.
İki tip tanımlayıcı istatistik vardır. Bunlardan biri değişkenin x
eksenindeki durumunu belirleyen merkezi eğilim ölçüleri (aritmetik
ortalama, medyan, mod), diğeri ise frekans dağılışının şeklini
açıklayan “değişkenlik ölçüleridir”.
Verilerin Özetlenmesi
Merkezi Eğilim Ölçüleri

Merkezi
Eğilim
Ölçüleri

Ortalama Medyan Mod

Harmonik Kuadratik Kırpılmış Geometrik


Ortalama Ortalama Ortalama Ortalama
Verilerin Özetlenmesi
Merkezi Eğilim Ölçüleri
∑$!"# 𝑥!
Aritmetik Ortalama =
𝑛

$
!
!
Geometrik Ortalama = 𝑋# . 𝑋% … … … 𝑋$ = ( 𝑋!
!"#

𝑁
Harmonik Ortalama = & 1
∑!"#
𝑋!

En yüksek ve en düşük verilerin yüzdesel olarak bir kısmının


Kırpılmış Ortalama = atılmasının ardından geriye kalan verilerin ortalamasının
alınması

&
1
Kuadratik Ortalama = . + 𝑋!%
𝑁
!"#
Verilerin Özetlenmesi
Merkezi Eğilim Ölçüleri

Merkezi Eğilim
Ölçüleri

Duyarlı
Duyarlı
olmayan
ortalamalar
ortalamalar
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

• Bir seriyi oluşturan gözlem değerlerinin toplamının, gözlem sayısına


oranı olarak tanımlanır. Merkezi eğilim ölçülerinden en güçlüsü ve
en çok kullanılanıdır. Aritmetik ortalama “ 𝑥̅ ” şeklinde sembolize
edilir ve matematiksel formülü ise şu şekildedir:

$
∑!"# 𝑥!
𝑥̅ =
𝑛
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

• Basit verilerde; $
∑!"# 𝑥! 𝑥# + 𝑥% … … … … … . . +𝑥$
𝑥̅ = =
𝑛 𝑛
• Gruplandırılmış verilerde;
&
∑!"# 𝑓! 𝑥! 𝑓# 𝑥# + 𝑓% 𝑥% … … … … … . . +𝑓$ 𝑥$
𝑥̅ = &
=
∑!"# 𝑓! 𝑓# + 𝑓% … … … . +𝑓&
• Sınıflandırılmış verilerde;
&
∑!"# 𝑓! 𝑚! 𝑓# 𝑚# + 𝑓% 𝑚% … … … … … . . +𝑓$ 𝑚$
𝑥̅ = & =
∑!"# 𝑓! 𝑓# + 𝑓% … … … . +𝑓&
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

∑ 𝑓! 𝑢
𝑥̅ = 𝑚/ + ×𝑐
𝑛
$
∑!"# 𝑤! 𝑥! 𝑤# 𝑥# + 𝑤% 𝑥% … … … … … . . +𝑤& 𝑥&
𝑥̅ = $ =
∑!"# 𝑤! 𝑤# + 𝑤% … … … . +𝑤$
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

• ÖRNEK: Bazı kumaşlarda suyun kumaşı ıslatma süreleri


ölçülmüştür. Bulunan sonuçlar şöyledir: 5.5, 6.1, 6.4, 5.7, 6.0, 5.6, 6.3,
6.2, 5.7, 6.0 (dk). Bu verilere göre suyun kumaşları ortalama ıslatma
süresini hesaplayınız.
$
∑!"# 𝑥! 59.5
𝑥̅ = = = 5.95 𝑑𝑘
𝑛 10
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

• ÖRNEK: Bir öğrencinin fizik, matematik ve istatistik derslerinden


almış olduğu notların haftalık ders saatine göre ağırlıklı
ortalamasını hesaplayınız.
Ders Haftalık ders saati (w) Alınan not
Fizik 5 60
Matematik 3 70
İstatistik 3 75
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

/
∑,-. ", #, ". #. $"0 #0 ……………..$"1 #1 '×)*$+×,*$+×,'
𝑥̅ = / = = = 66.8
∑,-. ", ". $"0 ……….$"/ '$+$+
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

• Aritmetik ortalama daha önceden de bahsedildiği


üzere duyarlı bir ortalamadır. Serideki ekstrem
değerlerden etkilenir.

𝑥̅
x 23 25 26 28 25.5
f 1 25 26 28 20.0
y 23 25 26 100 43.5
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

• Gözlem değerlerinin aritmetik ortalamadan


cebirsel sapmalarının toplamı sıfırdır.
&

) 𝑥! − 𝑥̅ = 0
!"#
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

&

) 𝑥! − 𝑥̅ = 0
!"#
İSPAT:
𝑥2 + 𝑥3 … … . . +𝑥4 𝑥2 + 𝑥3 … … … . . +𝑥4 𝑥2 + 𝑥3 … … . . +𝑥4
𝑥2 − + 𝑥3 − … … … + 𝑥4 −
𝑛 𝑛 𝑛

#. $#0 ………..$#1
𝑥- + 𝑥. … … . +𝑥/ − 𝑛× =0
/
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

• Gözlem değerlerinin aritmetik ortalamadan


cebirsel sapmalarının karelerinin toplamı
minimumdur.
x 𝑥! − 𝑥̅
10 10-30=-20
20 20-30=-10
30 30-30=0
40 40-30=10
50 50-30=20

𝑥̅ 30 $ 𝑥! − 𝑥̅ = 0
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

• Gözlem değerlerine a sayısı eklendiğinde veya


gözlem değerlerinden a sayısı çıkartıldığında, yeni
ortalama a kadar artar veya azalır.
+
∑()*(𝑥( ±𝑎)(𝑥* ±𝑎) + 𝑥, ± 𝑎 … . . +(𝑥+ ± 𝑎)
𝑥̅ = =
𝑛 𝑛
𝑥* + 𝑥, … … . . +𝑥+ n×a
=( ) ±
𝑛 n
= 𝑥̅ ± a
Verilerin Özetlenmesi
Aritmetik Ortalama ve Özellikleri

• Gözlem değerleri a sayısı ile çarpıldığında veya a


sayısına bölündüğünde, yeni ortalama a veya 1/a
katı olur. 4
∑562(𝑎𝑥5 ) (𝑎𝑥2 ) + 𝑎𝑥3 … . . +(𝑎𝑥4 )
𝑥̅ = =
𝑛 𝑛
𝑥2 + 𝑥3 … … . . +𝑥4
= 𝑎×( )
𝑛
= 𝑎𝑥̅
Verilerin Özetlenmesi
Medyan ve Kullanım Durumları

• Biristatistik sıralı serisinde tam ortaya düşen ve


dolayısıyla seriyi iki eşit parçaya bölen gözlem
değeri olarak tanımlanır. Aşağıda verilen sıralı seri
için medyan değeri 15 olup, bu gözlem değeri seriyi
tam ortadan ikiye bölmektedir.
x 10 12 15 17 20
Verilerin Özetlenmesi
Medyan ve Kullanım Durumları

• Kesikliserilerde medyanın hangi sıradaki gözlem değeri


olduğunu bulmak amacıyla n serideki gözlem sayısını
göstermek üzere (n+1)/2’inci gözlem değeri bulunur. n çift
sayı olduğunda (n+1)/2 formülünden çıkan sonuç buçuklu
olacağından bu durumda çıkan virgüllü sayı bir alt ve bir üst
olacak şekilde yuvarlanır. Yuvarlanan değerlere karşılık
gelen gözlem değerlerinin ortalaması alınır.

x 2 3 3 4 7 7 8 10
Verilerin Özetlenmesi
Medyan ve Kullanım Durumları

• Basit ve gruplandırılmış veriler söz konusu olduğunda sıralı


veri setlerinde medyan, orta eleman ya da orta elemanların
aritmetik ortalamasıdır.
• Sınıflandırılmış verilerde medyanın hesaplanmasında ise
aşağıdaki formül kullanılmaktadır. Formülde yer alan 𝐿!"#
medyan sınıfının alt sınır değerini, 𝑓$ toplam frekans
değerini, 𝑓3 medyan sınıfından bir önceki sınıfın kümülatif
frekans değerini, 𝑓012 medyan sınıfının frekans değerini ve
son olarak c sınıf aralık değerini ifade etmektedir.
∑ 𝑓3
− 𝑓4
𝑀𝑒𝑑 = 𝐿012 + 2 ×𝑐
𝑓012
Verilerin Özetlenmesi
Medyanın Aritmetik Ortalama Yerine Alternatif Olarak Kullanıldığı Durumlar

• Uç değerler ve asimetrik dağımlar durumunda


ÖRNEK: Bir araştırmacı farelerin öğrenme yeteneği üzerine deneyler yapmaktadır. Bu
amaçla rastgele seçilen 10 fare labirentte teste tabi tutulmakta ve labirentin sonunda
fareler yiyecekle ödüllendirilmektedir. Deneylerde farelerin hatalı dönüş sayıları tespit
edilmiş olup, aşağıdaki gibidir.

x 10 11 11 11 11 12 12 12 13 100

Elde edilen verilere göre farelerin ortalama öğrenme yetenekleri üzerine yorum
yapınız.
'
∑$%& 𝑥$ 203
𝑥̅ = = = 20.3
𝑛 10
Verilerin Özetlenmesi
Medyanın Aritmetik Ortalama Yerine Alternatif Olarak Kullanıldığı Durumlar

• Uç değerler ve asimetrik
dağımlar durumunda
x 10 11 11 11 11 12 12 12 13 100

Bu veri setine dair medyan hesaplanırsa;


(n+1)/2=(10+1)/2=5.5 veri setindeki x5. ve x6.
gözlem değerlerinin ortalaması medyan
değerini verecektir. Bu durumda medyan
(11+12)/2=11.5’dir. Bu değer verilen veri setine
dair dağılımı aritmetik ortalamaya göre daha
iyi temsil etmektedir.
Verilerin Özetlenmesi
Medyanın Aritmetik Ortalama Yerine Alternatif Olarak Kullanıldığı Durumlar
• Veri setinde belirsiz gözlemlerin olması durumunda
Bazı durumlarda birimin bilinmeyen veya belirlenemeyen gözlem değeri ile
karşılaşılabilir. Bu gibi durumlarla genellikle Psikoloji alanında yapılan öğrenme
testlerinde bireylerin yaptığı hatalar veya öğrenme sürelerinde sıklıkla karşılaşılır.
ÖRNEK: Altı kişinin tahta bir bulmacayı (puzzle) olabildiğince çabuk yapması
istenmektedir. Gözlemci her bir kişinin bulmacayı tamamlama süresini kaydetmiş
olup, sonuçlar aşağıdaki gibidir;
Kişiler 1 2 3 4 5 6
Süre (dk) 8 11 12 13 17 ∞

Verilen veri seti için aritmetik ortalamanın hesaplanması mümkün değildir. Medyan
ise bu veri seti için x3. ve x4. gözlem değerlerinin ortalaması olup 12.5’dir.
Verilerin Özetlenmesi
Medyanın Aritmetik Ortalama Yerine Alternatif Olarak Kullanıldığı Durumlar
• Açık uçlu dağılımlar söz konusu
olduğunda
Çocuk Sayısı (x) n
Bir dağılımın herhangi bir kategori için üst veya alt
sınırı yoksa bu durumda söz konusu dağılım açık uçlu 5 ve daha fazla 3
olarak nitelendirilir. Bu gibi dağılımlar söz konusu
olduğunda aritmetik ortalamanın kullanımı mümkün 4 2
değildir.
3 2
ÖRNEK: Aile planlamasına istinaden yapılan bir
çalışmada yirmi aileye çocuk sayısı sorulmuştur. Verilen 2 3
sonuçlara göre ailelerin sahip oldukları ortalama çocuk 1 6
sayısı hakkında yorum yapınız.
0 4
∑ 20
Verilerin Özetlenmesi
Medyanın Aritmetik Ortalama Yerine Alternatif Olarak Kullanıldığı Durumlar
• Açık uçlu dağılımlar söz konusu olduğunda
Söz konusu veri setinde “5 ve daha fazla” Çocuk Sayısı (x) n
çocuk sayısı olduğundan bu gibi durumlarda 5 ve daha fazla 3
aritmetik ortalama hesaplanamaz. Aynı veri
seti için ise medyan (20+1)/2=10.5’e karşılık 4 2
gelen gözlem değeridir. Bu durumda x10. ve
x11. gözlem değerlerinin ortalaması olup 3 2
(1+2)/2=1.5’dir. 2 3
Diğer bir deyişle, bu veri seti açık bir şekilde 1 6
ifade küçükten büyüğe ifade edilecek olursa;
0 4
0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 5
ve daha fazla, 5 ve daha fazla, 5 ve daha fazla. ∑ 20
Verilerin Özetlenmesi
Medyanın Aritmetik Ortalama Yerine Alternatif Olarak Kullanıldığı Durumlar
• Ordinal derecelendirme söz konusu olduğunda
Sıralı verilerde aritmetik ortalama kullanımı uygun olmayıp, bu gibi veri setlerinde
medyan kullanılır. Sıralı ölçümler büyüklük-küçüklük hakkında bilgi verirken,
aralarındaki farka dair fikir vermez. Medyan bu durumda kullanılabilecek merkezi
eğilim ölçüsüdür, çünkü değerlerin tam ortasına denk gelecektir. Aritmetik ortalama
ise mesafe olarak ölçülen değerlerin tam ortasına denk geldiğinden ve ordinal
verilerde ölçüm sonuçları mesafeye dayanmadığından bu gibi durumlar için
medyanın kullanımı uygundur.
Verilerin Özetlenmesi
Medyanın Aritmetik Ortalama Yerine Alternatif Olarak Kullanıldığı Durumlar
• Ordinal derecelendirme söz
konusu olduğunda Şıklar n
ÖRNEK: Yapılan bir anket çalışmasında beş A 5
şıkka sahip bir soru için verilen cevaplar
aşağıdaki gibidir. Verilen sonuçlara göre ankete B 6
katılan kişilerin ilgili soruya ortalama olarak C 10
verdikleri cevap hakkında yorum yapınız.
D 3
E 1
∑ 25
Verilerin Özetlenmesi
Mod ve Kullanım Durumları

• Mod, bir veri setinde en çok tekrarlanan değer, en sık rastlanan değer veya durum
olarak ifade edilir.
• Basit ve gruplandırılmış veriler söz konusu olduğunda mod yukarıdaki tanımda da
belirtildiği üzere en çok tekrar eden değerdir.
• Sınıflandırılmış verilerde ;

∆#
𝑀𝑜𝑑 = 𝐿()* + ×𝑐
∆# + ∆%
Verilerin Özetlenmesi
Modun Aritmetik Ortalama Yerine Alternatif Olarak Kullanıldığı Durumlar

• Nominal veriler söz konusu olduğunda


• Nominal verileri oluşturan kategoriler sadece isim olarak
birbirinden farklılık gösterir. Nominal veri sonuçlarında miktar
söz konusu olmadığından, medyan veya ortalama
hesaplanmaz.
• ÖRNEK: Yapılan bir anket çalışmasında demografik
değişkenlerin belirlenmesi amacıyla sorulan soru aşağıdaki
gibi cevaplanmıştır. Verilen sonuçlara göre ankete katılan Durum n
kişilerin evlilik durumları ile ilgili yorum yapınız. Evli 40
Bekâr 60
Boşanmış 20
Dul 10
Verilerin Özetlenmesi
Modun Aritmetik Ortalama Yerine Alternatif Olarak Kullanıldığı Durumlar

• Kesikli veriler söz konusu olduğunda


• Nümerik verilerde ortalama değeri hesaplamak mümkündür fakat bu gibi
durumlarda elde edilen ortalama değerler gerçekte var olmayan kesirli sayılar
olacaktır. Diğer yandan mod değeri sıklıkla tekrarlanan değeri vereceğinden bu
nedenle merkezi eğilim ölçüsü olarak daha mantıklı sonuçlar üretecektir.
Verilerin Özetlenmesi
Modun Aritmetik Ortalama Yerine Alternatif Olarak Kullanıldığı Durumlar

• Şekil anlatımı söz konusu olduğunda


• Mod değeri aritmetik ortalama ile beraber verildiğinde eldeki veri setinin
dağılımının şekli hakkında bilgi elde edilir.
• ÖRNEK: İstatistik dersinin sınav ortalaması 72 ve modu 80’dir denildiğinde dağılıma
dair fikir sahibi olmuş oluruz.
Verilerin Özetlenmesi
Çeyrek Değer ve Kullanım Durumları

• Küçükten büyüğe doğru sıralanmış verileri dört eşit parçaya bölen


değerlere çeyrek değerler denir. Birinci çeyreklik (Q1), veriler
küçükten büyüğe sıralandığında verilerin %25’ini solunda, %75’ini
sağında bırakan değerdir. İkinci çeyreklik ortancaya denk
gelmektedir. Üçüncü çeyrek değer (Q3), veriler küçükten büyüğe
sıralandığında verilerin %75’ini solunda, %25’ini sağında bırakan
değerdir. Yani sıralı verilerde, ortancadan küçük olan değerlerin
ortancası birinci çeyrek değer, ortancadan büyük olan verilerin
ortancası üçüncü çeyrek değerdir.
Verilerin Özetlenmesi
Çeyrek Değer ve Kullanım Durumları

• ÖRNEK: İlaçla tedavi edilen 8 hastanın iyileşme süreleri gün olarak aşağıda
verilmiştir. Çeyrek değerleri hesaplayınız.

30, 20, 24, 40, 65, 70, 10, 62

X1 X2 X3 X4 X5 X6 X7 X8

10 20 24 30 40 62 65 70
Verilerin Özetlenmesi
Çeyrek Değer ve Kullanım Durumları

Ortancadan küçük olan Ortancadan büyük olan


değerler değerler
X1 X2 X3 X4 X5 X6 X7 X8
10 20 24 30 40 62 65 70

(" )(# *+)*, 𝑥. + 𝑥/ 62 + 65


𝑄& = = = 22 𝑄- = = = 63.5
* * 2 2
Verilerin Özetlenmesi
Merkezi Eğilim ve Dağılım Şekli

Mod Mod 𝑥̅ 𝑥̅
𝑥̅
Med Med
Med
Mod
Verilerin Özetlenmesi
Merkezi Eğilim ve Dağılım Şekli

You might also like