You are on page 1of 19

2022 – 2023 GÜZ DÖNEMİ

(YBS2 – ULY2 – BAN2 – ULF2 – HVY2)

BÖLÜM 3: Tanımlayıcı İstatistik – Sayısal Ölçüler

 Göreceli Konum Ölçüleri (Yüzde birlikler, Çeyreklikler)

 Bir Dağılımın Şekli

İSTATİSTİK - I 1
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER
 Şu ana kadar verinin özetlenmesi için tablo ve grafikleri kullandık.

 Şimdi verinin özetlenmesi için ilave olarak sayısal ölçüleri kullanacağız.

 Sayısal ölçülerin açıklamasını, tablo ve grafiklerde olduğu gibi, tek değişken üzerinden
yapacağız. Ancak veri seti birden fazla değişken içeriyorsa, aynı ölçüler her bir değişken için
ayrı ayrı hesaplanabilir.

 Unutmayalım! İstatistikte, (popülasyona ait) parametreler Yunan harfleri ile (örnekleme ait)
istatistikler ise Latin harfleri ile temsil edilir.

Hatırlatma:
BİR SAYISAL ÖLÇÜ,
 Eğer örneklemden elde edilen verilerden hesap edildiyse, Örnek(lem) İstatistiği,
 Eğer popülasyona ait verilerden hesap edildiyse, Popülasyon Parametresi şeklinde
adlandırılır.

 Konulara başlamadan önce YUVARLAMA konusunu ele alacağız.

İSTATİSTİK - I 2
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER
YUVARLATMA
YUVARLATMA HATASI – İŞLEM HATASI AYIRIMI

Yapacağımız işlem 

60.29 60.29 60.3 60

30.37 30.37 30.4 30

1831.0073 1831 1833.12 1800

1831 1831 1831 1831


Yuvarlama
0.0073 0 2.12 -31 Hataları

Kural: İstatistik çalışmalarında hesaplama yolu ile elde edilen sayısal ölçülerin bir amacı da veri
setindeki sayıların (skorların, gözlem değerlerinin) arasındaki küçük farkların (benzerlikler,
farklılıklar) bulunmaya çalışılması olduğundan, ara hesaplama aşamalarında yuvarlatma
yapılmamalı veya mümkün olduğunca fazla sayıda (ondalık) basamak kullanılmalıdır.
İSTATİSTİK - I 3
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER
YUVARLATMA
Kural: Hesaplama ile elde edilen sayısal ölçülerde orijinal veriden en az 2 veya daha fazla sayıda
basamak kullanılmalıdır. Örneğin, orijinal veri tamsayı olarak ölçümlenmiş ise, sonuçlar 2 veya
daha fazla sayıda ondalık basamak içermelidir.

ÖRNEK: Değişkene ait skorlar tamsayı (ondalık basamak içermiyor) olsun.

Hesaplanan Sayısal Değer Yuvarlama Sonucu


12.12123 12.12
12.12759 12.13
12.124 12.12
12.12507 12.13
12.125 12.13
12.135 12.14
12 12.00

İSTATİSTİK - I 4
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – GÖRECELİ KONUM ÖLÇÜLERİ
YÜZDELİK DİLİM (PERSANTİL – PERCENTILE)
Yüzdelik dilim, verilerin en küçük değerden en büyük değere kadar olan aralıkta nasıl yayıldığı
hakkında bilgi sağlar.
Çok sayıda tekrarlanan değer içermeyen veriler için p ’inci yüzdelik dilim, verileri iki kısma böler:
 Gözlemlerin yaklaşık yüzde p'si p ’inci persantil ’den daha küçük değerlere sahiptir.
 Gözlemlerin yaklaşık yüzde (100 - p) 'si p ‘inci persantil’den daha büyük değerlere sahiptir.
O halde, p ‘inci persantil (yüzdelik dilimi ya da yüzde birlik değeri) aşağıdaki gibi tanımlanır.

p ‘inci yüzdelik dilim (persantil) değeri, gözlemlerin en az yüzde p'sinin bu değere eşit veya daha
küçük ve gözlemlerin en az yüzde (100 – p) ‘sinin bu değere eşit veya daha büyük olduğunu
belirtir. Bu haliyle, bir skorun dağılım içerisindeki göreceli konumunu gösterir.
Örneğin, bir öğrencinin bir sınavdan 54 puan aldığını varsayalım.
Bu öğrencinin aynı sınava giren diğer öğrencilerle ilgili olarak nasıl bir performans sergilediği
kolayca anlaşılamayabilir.
Ancak, 54 ham puan 70. yüzdelik dilime karşılık geliyorsa, öğrencilerin yaklaşık %70'inin bu
öğrenciden daha düşük puan aldığını ve öğrencilerin yaklaşık %30'unun bu öğrenciden daha
yüksek puan aldığını biliriz.
İSTATİSTİK - I 5
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – GÖRECELİ KONUM ÖLÇÜLERİ
YÜZDELİK DİLİM (PERSANTİL – PERCENTILE)
Bir p ‘inci yüzdelik dilimin değerinin hesaplanışı:
Adım 1: Veriler artan sırada (küçükten büyüğe doğru) sıralanır.
Adım 2: i endeksi hesaplanır.

Burada p, ilgilenilen yüzdelik dilim ve n, gözlemlerin sayısıdır.

Adım 3:
(a) Eğer i tam sayı değilse, bir üst tam sayıya yuvarlanır. Bu sayı, p ‘inci persantilin pozisyonunu
gösterir. Yani, sıralanmış verideki i. terim aranan persantildir.
(b) Eğer i tamsayı ise, i. ve (i + 1). terimlerin ortalaması aranan persantili verir.

Örneğin, ilk işe giriş maaşlarına ait veri, sıralanmış olarak aşağıdaki gibi olsun.
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
85. persantili bulmak için;

En yakın bir üst tam sayı 11 olduğundan, verideki 11. terim olan 3730 değeri verinin 85. persantil
değeridir.

İSTATİSTİK - I 6
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – GÖRECELİ KONUM ÖLÇÜLERİ
YÜZDELİK DİLİM (PERSANTİL – PERCENTILE)
Aynı veri için 50. yüzdelik dilim değeri bulmak istersek;
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925

Endeks değeri (i) tam sayı olduğundan, verideki 6. terim olan 3490 ile 7. terim olan 3520
skorlarının ortalaması (3490 + 3520) / 2 = 3505 değeri verinin 50. persantil değeridir.
50. yüzdelik dilime (persantil’e) medyan adı da verilir.
 Yüzdelik dilimleri kullandığınızda dikkat etmeniz gereken iki husus vardır.
İlk olarak, yüzdelik dilimler göreceli konumun ordinal (sıralı) bir endeksidir.

Yani, bir skorun yüzdelik dilimi, ölçümlerin % p'sinin o skor değerinden daha küçük olduğunu
gösterir, ne kadar küçük olduğunu göstermez.

İSTATİSTİK - I 7
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – GÖRECELİ KONUM ÖLÇÜLERİ
YÜZDELİK DİLİM (PERSANTİL – PERCENTILE)
ikincisi, yüzdelik dilimler yalnızca belirli bir dağılım bağlamında yorumlanabilir.
Bir örnek bu hususu netleştirmeye yardımcı olacaktır.
İngilizce dil başarı testindeki puanınızın % 15'lik bir yüzdelik dilimde olduğunu varsayalım (yani
puanınız 15. yüzdelik dilimdedir).
Bu kadar düşük bir puan ilk başta endişe verici olabilir.
Ancak, dağılımdaki diğer tüm ölçümler İngilizce hazırlık öğrencilerinden geliyorsa, puanınız
tamamen makuldür.
Test lise öğrencilerine yapıldıysa aynı puan değeri 75. yüzdelik dilimde de olabilirdi.
Unutmayın, yüzdelik dilimler göreceli konumun bir ölçüsüdür - dağılımdaki diğer ölçümlere göre
belirli bir skor değerinin konumudur.
Bu nedenle, bir yüzdelik dilim değerinin yorumlanması, dağılım tarafından tanımlanan
örneklemin (veya popülasyonun) dikkatlice değerlendirilmesine bağlıdır.

İSTATİSTİK - I 8
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – GÖRECELİ KONUM ÖLÇÜLERİ
ÇEYREKLİKLER (Dörtte Birlikler – Kartiller) (Quartiles)
Genellikle, her bir dilimin gözlemlerin yaklaşık dörtte birini veya % 25'ini içerecek şekilde, verileri
dört kısma bölmek isteriz.

1. Kartil 2. Kartil 3.Kartil

Bölme noktaları kartiller olarak adlandırılır ve şu şekilde tanımlanır:

1. kartil veya 25. persantil


2. kartil veya 50. persantil (aynı zamanda medyan olarak da adlandırılır)
3. kartil veya 75. persantil

İSTATİSTİK - I 9
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – GÖRECELİ KONUM ÖLÇÜLERİ
ÇEYREKLİKLER (Dörtte Birlikler – Kartiller) (Quartiles)
İlk işe giriş maaşları verisi için 1. ve 3. kartilleri bulmak istersek;
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925

Endeks değeri (i) tam sayı olduğundan, verideki 3. terim olan 3450 ile 4. terim olan 3480
skorlarının ortalaması (3450 + 3480) / 2 = 3465 değeri verinin 1.kartil değeridir. Benzer şekilde;

Endeks değeri (i) tam sayı olduğundan, verideki 9. terim olan 3550 ile 10. terim olan 3650
skorlarının ortalaması (3550 + 3650) / 2 = 3600 değeri verinin 3.kartil değeridir.

Sonuç olarak; kartiller ilk işe giriş maaşları verisini, her biri gözlemlerin (skorların) %25 ‘ini içeren,
4 parçaya ayırır.

**Yüzdelik dilimler için dikkat edilmesi gereken iki husus kartiller için de geçerlidir.
İSTATİSTİK - I 10
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – GÖRECELİ KONUM ÖLÇÜLERİ
Soru: Aşağıda verilen veri seti için 20., 25., 65. ve 75. yüzdelik dilim değerlerini hesaplayınız.

27 25 20 15 30 34 28 25

Soru: Aşağıda verilen veri seti için 1., 2. ve 3. kartil değerlerinin hesaplayınız.

53 55 70 58 64 57 53 69 57 68 53

Soru: Bir öğrenci, İstatistik ve matematik sınavlarından 70 almıştır. Ancak, her iki sınavdaki
notlarının sırasıyla 60. ve 80. persantillere denk geldiği gözlenmiştir.
(a) Notların aynı olması persantillerin de aynı olmasını gerektirmez mi? Neden?
(b) Öğrenci hangi sınavda göreceli olarak daha iyi konumdadır? Neden?

Soru: 80 kişilik bir sınıfta bir dersten sınıfın %75’i kalmıştır. Geçme notunun 60 olduğu bilindiğine
göre, durumu yorumlayınız.

İSTATİSTİK - I 11
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – DAĞILIMIN ŞEKLİ
SİMETRİ ve ÇARPIKLIK
Dağılımlar üç temel karakteristiklerine göre farklılaşırlar:
 merkezi eğilim,
 değişkenlik ve
 şekil.

Bilgi : Dağılıma ait şekiller histogramlar yerine düzgünleştirilmiş histogramlar (yoğunluk eğrisi)
yardımıyla da gösterilir.

İSTATİSTİK - I 12
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – DAĞILIMIN ŞEKLİ
SİMETRİ ve ÇARPIKLIK
Simetrik Dağılım: Histogram üzerinde (veya yoğunluk eğrisi üzerinde), sol yarısı ile sağ yarısını
birbirinin aynadaki görüntüleri şeklinde ayıran düşey bir simetri çizgisi var ise, dağılım
simetriktir.

Yaklaşık Simetrik

İSTATİSTİK - I 13
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – DAĞILIMIN ŞEKLİ
SİMETRİ ve ÇARPIKLIK
Unimodal (tek tepeli), Bimodal (iki tepeli) ve Uniform (eş biçimli, dikdörtgensel) Dağılımlar
Bir dağılımın şekli ile ilgili bir soru da şeklin sadece bir yüksek tepesi olup olmadığıdır. Yani
histogramda sadece bir adet yüksek tepe (çubuk) olup olmadığıdır.

 Bir dağılımın sadece tek bir tepesi var ise bu tür dağılımlara unimodal (tek tepeli, tek mod’lu)
dağılım denir.

Unimodal (Tek Tepeli) Unimodal (Tek Tepeli)

İSTATİSTİK - I 14
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – DAĞILIMIN ŞEKLİ
SİMETRİ ve ÇARPIKLIK
Unimodal (tek tepeli), Bimodal (iki tepeli) ve Uniform (eş biçimli, dikdörtgensel) Dağılımlar

 Eğer dağılımın tam olarak (ya da hemen hemen) iki yüksek tepesi var ise, bimodal (iki tepeli,
iki mod’lu) dağılımdır.

 Daha genel olarak, bir dağılımın iki veya daha fazla tepe noktası var ise, multimodal (çok
tepeli, çok mod’lu) dağılımdır.

 Kesin konuşursak, bir dağılımın bimodal veya multimodal olabilmesi için tepe değerlerinin
tam olarak eşit olması gerekir. Ancak pratikte yaklaşık olarak eşit olması bimodal veya
multimodal olarak adlandırılması için yeterlidir.

Bimodal (İki Tepeli) Yaklaşık Bimodal

İSTATİSTİK - I 15
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – DAĞILIMIN ŞEKLİ
SİMETRİ ve ÇARPIKLIK
Unimodal (tek tepeli), Bimodal (iki tepeli) ve Uniform (eş biçimli, dikdörtgensel) Dağılımlar

 Eğer bir dağılımda tüm skorlar aynı frekans değerini alıyor ise, uniform (eş biçimli) dağılımdan
söz ederiz.

Uniform (Eş biçimli) Yaklaşık Uniform

İSTATİSTİK - I 16
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – DAĞILIMIN ŞEKLİ
SİMETRİ ve ÇARPIKLIK
Çarpık Dağılımlar
Çarpık dağılım: Skorların dağılımın bir tarafında yığılması, diğer tarafında ise yayılması (kuyruk)
durumunda çarpık dağılımdan söz ederiz. Yani bir dağılım simetrik değil ise çarpıktır.
 Çarpık dağılımlarda, bir kuyruk gibi, uzun ve yayık bir taraf vardır ve skorların düşük
frekanslara sahip olduğu bu bölge çarpıklığın yönünü belirler.
 Bu durumda kuyruk yatay eksenin sol tarafında ise, yani çok sayıda küçük değere sahip
skorlar daha küçük frekans değerlerine sahip ise (daha az sayıda gözlenmiş ise), dağılım sola
çarpıktır.
 Aksi durumda, yani çok sayıda büyük değere sahip skorlar daha küçük frekans değerlerine
sahip ise (daha az sayıda gözlenmiş ise), dağılım sağa çarpıktır.

Sağa Çarpık Sola Çarpık

İSTATİSTİK - I 17
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – DAĞILIMIN ŞEKLİ
SİMETRİ ve ÇARPIKLIK
Çarpıklık için sayısal değer, bilinen bir formül aracılığı (karmaşıklığı nedeniyle vermeyeceğiz) ile
hesaplanır ve dağılımın çarpıklık değeri olarak adlandırılır. Çarpıklık değeri negatif veya pozitif bir
değer olabilir ya da sıfır değerini alabilir.

 Bir dağılım sağa çarpık ise o dağılıma ait çarpıklık değeri pozitif bir sayıdır ve bu nedenle
pozitif olarak çarpık şeklinde de adlandırılır.
 Bir dağılım sola çarpık ise o dağılıma ait çarpıklık değeri negatif bir sayıdır ve bu nedenle
negatif olarak çarpık şeklinde de adlandırılır.

 Bir dağılımın çarpıklık ölçüsünün çarpıklık = -0.85 çarpıklık = 0.85


(değerinin) mutlak değeri ne kadar büyük
ise çarpıklık o derece büyüktür.
 Bir dağılımın çarpıklık değeri 0 (sıfır) ise, o
dağılım simetrik dağılımdır.
O halde,
çarpıklık = 0 çarpıklık = 1.62
 Bir dağılımın çarpıklık değeri mutlak
değerce sıfıra yaklaşıyorsa, o dağılım
yaklaşık olarak simetriktir.
 Sıfırdan uzaklaştıkça aşırı çarpıklık
göstermeye başlar.
İSTATİSTİK - I 18
TANIMLAYICI İSTATİSTİK: SAYISAL ÖLÇÜLER – DAĞILIMIN ŞEKLİ
SİMETRİ ve ÇARPIKLIK
Soru: A, B ve C dağılımları için çarpıklık ölçüsü, sırasıyla, -0.0023, 1.876 ve 0 olarak
hesaplanmıştır. Söz konusu üç dağılımın şekilleri hakkında yorum yapınız.

Soru: Büyük bir şirketteki personelin maaşlarının dağılımının şekli hakkında yorum yapınız.

Soru: Covid19 hastalarının yaş gruplarına göre ölüm oranlarının dağılımının şeklini yorumlayınız.

Soru: Aşağıda verilen dağılımın şeklini belirtiniz.

İSTATİSTİK - I 19

You might also like