You are on page 1of 35

TANIMLAYICI İSTATİSTİKLER

Veri seti: tanımlayıcı.sav

Dr. Öğr. Üyesi Mesut AKYOL


Arş. Gör. Afra ALKAN

AYBÜ
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı
2

Dağılımları Tanımlayıcı Ölçüler

Yer Gösteren Ölçüler Yaygınlık Ölçüleri

Konum ölçüleri:  Değişim aralığı


 Çeyrekler  Çeyrekler arası genişlik
 Yüzdelikler  Standart Sapma
Ortalama (merkez) ölçüleri:  Varyans
 Aritmetik Ortalama  Değişim Katsayısı
 Ortanca
 Tepe değeri
 Geometrik ortalama
3

Yer Gösteren Ölçüler


Konum ölçüleri:
 Çeyrekler
 Yüzdelikler
Ortalama (merkez) ölçüleri:
 Aritmetik Ortalama
 Ortanca
 Tepe değeri
 Geometrik ortalama
4

Çeyrekler ve yüzdelikler

Bir dağılımı dört eşit parçaya bölen değerlere çeyrekler, yüz eşit parçaya bölen değerlere
yüzdelikler denir.

Yüzdelik, dağılım üzerinde; altında ve üstünde belirli oranda ölçümler bulunan bir noktanın
değerini belirtir.

%30: Ölçümlerin yüzde 30’udur.

30. yüzdelik: Ölçümlerin %30’unu altında, %70’ini de üstünde bırakan noktanın değeridir.
5

22.0 35.0 47.0 55.0 68.0


Yaş (yıl)
30. yüzdelik
Min 25. yüzdelik 50. yüzdelik 75. yüzdelik Maks

Verilerin % 25’i bu aralıktadır.

Verilerin % 50’si bu aralıktadır.

Verilerin % 75’i bu aralıktadır.

Verilerin % 100’ü bu aralıktadır.


6

I. Çeyrek II. Çeyrek III. Çeyrek

22.0 35.0 47.0 55.0 68.0


30. yüzdelik
Yaş (yıl)
Min 25. yüzdelik 50. yüzdelik 75. yüzdelik Maks

Ortanca
(Median)
7

Sayısal değişkenlerde simetrik ve çarpık dağılımlar


Simetrik Sağa çarpık Sola çarpık
1 1 -4
1 1 1
2 2 2
2 2 2
2 2 2
3 3 3
3 3 3
3 3 3
3 3 3
4 4 4
4 4 4
4 4 4
4 4 4
4 4 4
5 5 5
5 5 5
5 5 5
5 5 5
6 6 6
6 6 6
6 6 6
7 7 7
7 12 7
8

Aritmetik Ortalama

Tek tepeli simetrik yapıya sahip sürekli sayısal değişkenlerde kullanılır. Büyüklük belirtmesi
açısından kesikli sayısal değişkenlerde de kullanılabilir. Aşırı değerlerden etkilenir.

Tüm değerlerin toplamının, örneklem sayısına bölünmesi ile elde edilir.


9

Ortanca

50. yüzdeliktir. Bir dağılımdaki değerleri iki eşit parçaya böler. Tam ortadaki değerdir.

Aşırı gözlemlerin bulunduğu ve dağılımın çarpık olduğu durumlarda kullanılan bir ortalama
ölçüdür. Aşırı değerlerden etkilenmez.
Veriler küçükten büyüğe sıralanır.
n tek ise
n çift ise
10

Tepe değeri

Dağılımda en çok tekrar eden değerdir (). Her gözlemin tekrar sayısı aynı ise o dağılımda tepe
değeri yoktur.

En yüksek tekrar sayısına sahip tek bir değer varsa tek tepeli,
Aynı sayıda en yüksek tekrar sayısı olan iki değer varsa iki tepeli,
Aynı sayıda en yüksek tekrar sayısı olan ikiden fazla değer varsa çok tepeli dağılım adını alır.
11

Geometrik ortalama

Geometrik artış gösteren (birbirinin katları şeklinde artan) verilerde kullanılır.


Pozitif değerler için hesaplanır.
12

Sayısal değişkenlerde dağılıma göre ortalama, ortanca ve tepe değerinin konumu


13

Aynı değişken için elde edilen farklı iki veri setinin ortalama, ortanca ve tepe değerleri

Veri I Veri II
2 6
6 5
1 6
15 7
6 6

Her iki veri için de elde edilen merkezi ölçüler aynıdır. Ancak veri I değerleri veri II’ye göre
daha geniş aralıkta dağılmaktadır.
14

Yaygınlık Ölçüleri
 Değişim aralığı
 Çeyrekler arası genişlik
 Standart sapma
 Varyans
 Değişim katsayısı
15

Değişim aralığı (Range)

Maksimum ile minimum değer arasındaki farktır. (min – maks) şeklinde de gösterilir.
Range=maks-min

Çeyrekler arası genişlik (ÇAG, Interquartile Range-IQR)

3.çeyrek (75. yüzdelik) ile 1.çeyrek (25. yüzdelik) arasındaki farktır. (ÇAG: Ç1 – Ç3) şeklinde
de gösterilir. Aşırı uç değerlerden standart sapma kadar etkilenmez.
ÇAG=Ç3 - Ç1
16

Standart sapma

Dağılımdaki tüm değerlerin ortalamaya olan uzaklıklarının ortalama ölçüsüdür.

Standart sapma arttıkça dağılımın yaygınlığı artar.

Birimi, incelenen değişken birimi ile aynıdır.

Simetrik dağılımlarda kullanılmalıdır.


17

Varyans

Standart sapmanın karesidir. (Verilerin ortalamaya uzaklıklarının karesidir)

Birimi incelenen değişken biriminin karesidir. Bu nedenle varyans yerine standart sapmanın
kullanımı daha yaygındır.
18

Değişim Katsayısı (DK)

Standart sapmanın ortalama etrafında yüzde kaçlık bir değişim gösterdiği konusunda bilgi
verir.

DK’nın sıfıra yaklaşması dağılımın yaygınlığının azaldığını, %25’in üzerinde olması ise
incelenen dağılımın yaygınlığının oldukça fazla olduğunu ifade eder.
19

İki değişkenin yaygınlıklarının karşılaştırılmasında değişim katsayısının kullanımı daha uygun


olacaktır.
Değişken 1 Değişken 2
12 6
16 5
11 12
22 7
16 6
=28.16 = 38.54

Yukarıda verilen örnekte, farklı iki değişken için değişim katsayısına göre Değişken 2’nin
yaygınlığı Değişken 1’e göre daha fazladır.
[Ortalamalar dikkate alınmadan standart sapma üzerinden karşılaştırma yapılmış olsaydı, yorum tam tersi ve
hatalı olacaktı.]
20

Yaygınlık Ölçüleri
Bir sınıftan rastgele seçilen 5 öğrencinin yaşı inceleniyor. Bu işlem 3 kere tekrarlanıyor.

Sıra No Örnek1 Örnek2 Örnek3 Tanımlayıcı İstatistikler Örnek1 Örnek2 Örnek3


1. Öğrenci 18 18 18 Ortalama 18.2 21.2 25.6
2. Öğrenci 20 20 20 Varyans 1.7 37.7 253.3
3. Öğrenci 19 19 19 Standart Sapma 1.3 6.1 15.9
4. Öğrenci 17 17 17 Ortanca 18 19 19
5. Öğrenci 17 32 54 Değişim Aralığı 17-20 17-32 17-54
1. Çeyrek 17 17.5 17.5
3. Çeyrek 19.5 26 37
ÇAG 2.5 8.5 19.5
21

NOT:
Parametre: Evreni tanımlamak için kullanılan ölçülerdir.
İstatistik: Örneklemi tanımlamak için kullanılan ölçülerdir.

Evren için Örneklem için


Ölçüler
(Parametre) (İstatistik)
Gözlem sayısı N n
Ortalama µ
Oran  p
Standart sapma  S
Korelasyon katsayısı  r
Regresyon katsayısı  b
22

Değişken türüne göre tanımlayıcı istatistikler

• İsimsel ya da sıralı kategorik değişkenlerin özetlenmesinde frekans (n) ve yüzde (%)

kullanılır.

• Sayısal değişkenlerin özetlenmesinde yer gösteren ölçüler ve yaygınlık ölçüleri birlikte

kullanılır.
Kesikli sayısal değişkenlerde Ortanca (ÇAG), Ortanca (Ç1-Ç3) veya Ortanca (min-maks)

Sürekli sayısal değişkenlerde değişkenin dağılımına göre Ortalama±Standart sapma,

Ortanca (ÇAG), Ortanca (Ç1-Ç3) veya Ortanca (min-maks)


23

NOT:
Konum ve yaygınlık ölçülerinin
Ortanca (ÇAG), Ortanca (Ç1-Ç3), Ortanca (min, max)
Ortalama±Standart sapma, Ortalama (Standart hata)

gibi farklı gösterimler ile birlikte kullanılır.

Ders kapsamında
Ortalama±standart sapma, Ortanca (Ç1-Ç3)
kullanılacaktır.
24

SPSS programında tanımlayıcı istatistiklerin


hesaplanması
25

Kategorik değişkenler için frekansların hesaplanması

SPSS adımları: Analyze – Descriptive statistics - Frequencies

Frekansları hesaplanacak olan


değişken(ler) variables bölümüne
alınır ve OK tıklanır.
26

Çalışmada yer alan bireylerin %54.2’si (n=39) kontrol grubundadır.

Çalışmada yer alan bireylerin 37’si (%51.4) erkek, 35’i (%48.6) kadındır.
27

NOT: Kayıp veri olması durumunda «percent» ile «valid percent» değerleri aynı olmaz.
Örneğin; veri setinde 2 kişinin cinsiyeti bilinmesin:

72 bireyin %47.2’si (n=34) kadın. Cinsiyeti bilinen 70 bireyin %48.6’sı (n=34) kadındır.
Cinsiyeti veri setinde tanımlanmamış 2 (%2.8) birey vardır.
28

Sayısal değişkenler için tanımlayıcı istatistiklerin hesaplanması

1-Analyze – Descriptive statistics – Explore

2-Analyze – Descriptive statistics – Frequencies

3-Analyze – Compare Means - Means


29

NOT:
Tanımlayıcı istatistiklerin hesaplanmasında farklı menüler kullanılabilmektedir.

Frequencies ve means menülerinden çeyreklikler arası genişlik değerleri doğrudan


hesaplanmadığı için bu menüler kısaca tanıtılacak ancak ders kapsamında tanımlayıcı
istatistiklerin hesaplanmasında «Explore» menüsünden yararlanılacaktır.
30

SPSS adımları: Analyze – Descriptive statistics – Explore

Tanımlayıcı istatistiği hesaplanacak değişken(ler)


Dependent list bölümüne alınır, Statistics
menüsünden Percentiles seçilir ve OK tıklanır.
31

NOT:
Aynı anda birden fazla değişken için tanımlayıcı istatistik hesaplanacağı zaman olası kayıp
verilerin yalnızca kaybın olduğu değişkenden çıkarılması için Options menüsünden «exclude
cases pairwise» seçeneği seçilebilir.
32

Çalışmada yer alan 72 bireyin yaş ortalaması


22.47±1.76 yıl (min-maks:19-28), yaş ortancası
23.0 yıl (ÇAG:22-23) olarak elde edilmiştir.
33

Tanımlayıcı istatistikler tüm bireyler için hesaplanabileceği gibi alt gruplar için de
hesaplanabilir. Örneğin; yaş için tanımlayıcı istatistikleri cinsiyet gruplarında hesaplayalım:

Sayısal değişken dependent list’e,


kategorik değişken factor list’e
alınır.
34

Erkeklerin yaş ortalaması 22.16±1.39 yıl, yaş


ortancası 23 yıl (ÇAG: 21-23);
kadınların yaş ortalaması 22.80±2.06 yıl,
ortancası 23 yıl (ÇAG: 22-24) şeklinde
hesaplanmıştır.
35

Mean: Ortalama
Std. deviation: Standart sapma
Median: Ortanca
Interquartile range: Çeyrekler arası genişlik, Ç3-Ç1
Range: Değişim aralığı
Skewness: Çarpıklık
Kurtosis: Basıklık

You might also like