Professional Documents
Culture Documents
İstatistik
• İstatistik, belli amaçlar için veri toplama, toplanan verileri düzenleme,
çözümlemenin yanı sıra yorumlama teknik ve yöntemleri olarak
tanımlanabilir.
• Betimsel (Descriptive) İstatistik: Verilerin ve bilgilerin düzenlenmesi,
özetlenmesi ve açıklanması
• Çıkarımsal (İnferential) İstatistik: Veriler ve betimsel istatistik
sonuçları kullanılarak bir olay veya olgu hakkında varsayımda
bulunmak, genellemeler yapmaktır.
EM Kullanım Alanları
• Saha Araştırmaları
• Performans Analizleri
Temel Kavramlar
• Anakitle-Evren (Population)
• Örneklem (Sample)
• Örnekleme (Sampling)
• Parametre-İstatistik
• Ölçek Tipleri
• Parametrik/Nonparametrik istatistik testler
Örneklem-Örnekleme
Örneklem
• Araştırılmak istenen bir olayla ilgili kütleden, belli kurallara göre
seçilmiş, kütleyi temsil ettiği varsayılan küçük bir küme örneklem
olarak adlandırılır. Örneklem anakütleyi oluşturan varlıkların alt
parçalarından oluşur.
Örnekleme
• Anakütle özelliklerini ortaya koyabilmek amacıyla anakütleden örnek
seçme işlemine örnekleme denir. Örnekleme ile yapılacak bir
araştırmanın anakütledeki gerçek durumu ortaya çıkarabilmesi için en
önemli koşul örneklemin anakütleyi temsil edebilir nitelikte olmasıdır.
Örneklem-Örnekleme
• Anakütleyi temsil yeteneğine sahip bir örneklemin temel özellikleri
şunlardır.
• Örneklemin büyüklüğü (hacmi, miktarı) yeterli olmalıdır.
• Örneklem anakütledeki dağılıma çeşit ve oran yönünden benzer
olmalıdır.
• Örneklem olasılıklı örnekleme yöntemlerinden biriyle seçilmelidir.
• Örneklem seçiminde tarafsız davranılmalıdır. Anakütledeki bütün
birimlerin örneğe girme şanslarını eşit kılmak gerekir.
Örnekleme Yöntemleri
• Örneklem seçimi çeşitli tekniklerle yapılır. Bütün bu teknikler
araştırmanın türüne ve amacına bağlıdır.
Basit Örnekleme
Rassal Örnekleme
Sistematik Örnekleme
Karara Bağlı
Katmanlı Örnekleme
Kotalı
Kümeleme
Ölçek Tipleri
Ölçek Tipi Açıklama Örnek
Sadece kalitatif (niteliksel) sınıflandırmalarda
Medeni Hal, Cinsiyet, Meslek,
kullanılırlar.
Nominal (İsimsel) Göz Rengi, Kan Grubu, Uyruk
Bu değişkenlerin ölçümü ve sıralanması
vb.
mümkün değildir.
S: Sınıf Aralığı
Xmax: Verinin en büyük değeri X X
S
max min
Xmin: Verinin en küçük değeri
1 3 , 322 log N
N: Veri sayısı
Frekans Dağılımları
Kesikli karakterdeki niceliksel verileri gruplarken sınıf
aralıklarında boşluklar oluşur.
Sınıf Limitleri
• Alt Limit Çalışan İşçi Sayısı KOBİ Sayısı
• Üst Limit 1 – 10 100
• Sınıf Sınırları 11 – 50 40
MECE
51 – 100 25
• Ayrık Sınıflar
101 – 200 15
• Dışarıda Değer
Kalmamalı 201 – 249 5
Anadolu 50 55 36 8 17 9
Fen 2 3 0 0 0 0
End.
2 0 2 1 0 0
Meslek
İHL 4 2 6 3 5 2
Ticaret 0 0 0 1 0 1
Toplam 60 60 27 13 22 12
Sütun (Çubuk) Grafiği
•Niteliksel seriler ve Tasnif edilmiş seriler için çubuk diyagramı
12
Öğrenci sayısı
1 3 10
8
2 7 6
4
3 10
2
0
4 6 1 2 3 4 5
5 2 Notlar
Histogram Grafiği
• Grafiğin özelliği sürekli karakterde verilerin grafiği olması sebebiyle
histogram sütunların birbirine bitişik olmasıdır
Başarı Not Sınıfları Öğrenci Sınıf Aralığı Öğrencilerin İstatistik Dersi Not Dağılımları
Derecesi (Gruplar) Sayısı (Frekansı) (s) 120
100
100 90
AA 90-100 den az 30 90-100=10 80
BA 80-90 den az 55 80-90=10 80
Sınıf Sıklıkları
60
BB 70-80 den az 80 70-80=10 60 55
50
CB 60-70 den az 100 60-70=10
40 35
30
CC 50-60 den az 90 50-60=10
DC 40-50 den az 60 40-50=10 20
Öğrenci
Not sınıfları
sayısı
25 – 36 den az 2
36 – 47 “ “ 4
47 – 58 “ “ 9
58 – 69 “ “ 12
69 – 80 “ “ 5
80 – 91 “ “ 3
91 – 100 “ “ 1
Frekans Eğrisi (Poligonu)
İstatistik Ders Notlarının Frekans Poligonu
120
100 100
90
80 80
Frekanslar
60 60
55
50
40
35
30
20
0
90-100 80-90 70-80 60-70 50-60 40-50 30-40 20-30
Gruplar
Dairesel Grafikler (Pasta Grafiği)
• Özellikle niteliksel (sayısal olmayan) değişken değerlerinin grafikle
gösterilmesinde kullanılırlar. Dairenin frekanslara açısal olarak
paylaştırılması ile elde edilir. Bir birimin açısal karşılığı şöyle bulunur.
360 360
• Açısal değer 3 derece
Toplam frekans 120
Memnun Değilim
Memnunum 57 50,4 81,4 50%
Hiç Memnun Değilim
Çok Memnunum 21 18,6 100,0
Toplam 113 %100
Zaman Serisi Grafiği
İstatistik Matematik
Notu Notu
Dağılım Grafiği
60 70
İstatistik notu
90
80
70
30 25 60
50
50 40 40
30
40 55 20
10
80 90 0
0 20 40 60 80 100
20 15 Matematik notu
80 70
Radar Grafiği
5S Kategorisi Puan
1. Sınıflandırma 5
2. Sırala-Düzenle 3,7
3. Temizle 2,7
4. Standartlaştır 2
5. Sahiplen-Koru 2,2
Merkezi Eğilim ve Dağılım Ölçüleri
Merkezi Eğilim ve Dağılım Ölçüleri
• Aritmetik Ortalama
• Ağırlıklı (Tartılı) Aritmetik Ortalama Bir veri setinin merkez
• Geometrik Ortalama noktasını gösteren, serinin
• Harmonik Ortalama normal değerinin bir
• Kareli Ortalama göstergesi olan ve veriyi
tek bir değerle ifade eden
Analitik Olmayan Ortalamalar
değerlere merkezi eğilim
ölçüleri adı verilir.
• Mod
• Medyan
• Kartil, Desil ve Santiller
Aritmetik Ortalama
Aritmetik ortalama serideki gözlem değerleri toplamının toplam gözlem sayısına
oranıdır.
Basit Seride X
X 1 X 2 .......... . X N
X i
Sınav
N N
ortalamaları
f 1X 1 f 2 X 2 .... f k X k fX
Gruplanmış Seride X
i i
f 1 f 2 .... f k f i
Sınıflandırılmış Seride X
f 1 m 1 f 2 m 2 .... f k m k
fm i i
f 1 f 2 .... f k f i
Bir serideki gözlem değerlerinin önem dereceleri farklı olursa, bu tür serilerin
aritmetik ortalaması ağırlıklı olarak hesaplanır.
ortalaması hesaplanırken
Gruplanmış Seride X
t i
fi X i kullanılır.
T
ti f i • Ortalama maliyet ve satış
fiyatı, bileşik fiyat ve miktar
Sınıflandırılmış Seride X
t f i i
mi indekslerinin
t
T
i
fi hesaplanmasında da tartılı
ortalama kullanılır.
Örnekler
Başarı Not Sınıfları Sınıf Orta Öğrenci Sayısı
Derecesi (Gruplar) Değeri mi (Frekansı) mifi
Öğrencilerin Notları Notların Sıklığı fi
(Xi) (Frekansı) = fi fiXi AA 90-100 95 50 4750
40 1 40 BA 85-89 87 60 5220
50 2 100 BB 80-84 82 40 3280
60 4 240 CB 75-79 77 50 3850
70 6 420 CC 70-74 72 100 7200
80 4 320 DC 60-69 64,5 50 3225
90 2 180 DD 50-59 54,5 60 3270
100 1 100 DF 40-49 44,5 40 1780
FF 0-39 19,5 50 975
𝑛 𝒏
Toplam 𝑓𝑖 = 20 𝒇𝒊 𝑿𝒊 = 𝟏𝟒𝟎𝟎 𝑛 𝑛
𝑖=1 𝒊=𝟏
Toplam 𝑓𝑖 = 500 𝑓𝑖 𝑚𝑖 = 33550
𝑖=1 𝑖=1
Aritmetik Ortalamanın Özellikleri
• Aritmetik ortalama hassas bir ortalama olup serideki aşırı değerlerden etkilenir ve aşırı
değere doğru kayma gösterir.
• Serinin gözlem sayısı ile aritmetik ortalaması çarpılırsa serinin toplam değeri elde edilir.
NX X i
X )
2
(X i
Minimum
• Aritmetik ortalama özellikle normal dağılıma yakın serilerin ortalaması için elverişlidir.
• Bir serinin değerleri, diğer iki serinin değerleri toplamından oluşuyorsa bu serinin
aritmetik ortalaması da diğer iki serinin aritmetik ortalamaları toplamına eşit olur.
X =Y +Z
Geometrik Ortalama
Bir serideki gözlem değerlerinin birbirleri ile çarpımlarının, gözlem sayısı derecesinde
kökünün alınması ile elde edilir.
Logaritmik Dönüşüm
N
G X 1 X X XN
N
N
2 3 log X i
Basit Seride G N
X
i log G
i 1
X 1 X 2 X 3 X N
X i
i 1 N
f i log X i
Gruplanmış Seride fi i 1
G X1 X X X
f f f fk
log G
1 2 3
2 3 k k
fi
i 1
fi f i log m i
G m 1 m 2 m 3 m k
f 1 f 2 f 3 fk
Sınıflandırılmış Seride log G
i 1
k
fi
i 1
Örnek
Günler Altın Fiyatlarındaki %
Artışlar (Xi)
Pazartesi 1
Salı 2
Çarşamba 4
Perşembe 8
𝑁 4 4
G= 𝑋1 𝑋2 … … … 𝑋𝑁 = 1∗2∗4∗8= 64 = 2.83
Harmonik Ortalama
Harmonik ortalama bir serideki gözlem değerlerinin terslerinin aritmetik ortalamasının
tersine eşittir.
1 N N
H H N
1 1 1 1 1 1 1 1 1
Basit Seride X 1
X 2
X 3
X X1
X
X 3
XN
Xi
N 2 i 1
H
fi
Gruplanmış Seride Harmonik ortalama (H) zaman birimi
fi
Xi
başına hız ve üretim, para birimi başına
satın alınan mal miktarı, vb. oransal
verilerin ortalamasını bulmakta kullanılır.
fi
Sınıflandırılmış Seride H
fi
mi
Örnek
Bir işletmede çalışan ve aynı parçayı işleyen 4 İşçiler Üretim süresi (dk)
işçinin bu parçayı üretim sürelerinin dağılımı
aşağıda verilmiştir. A 5
Bu işçiler hep birlikte bu parçayı 4 saat süre ile B 6
ürettiklerinde ürettikleri parçaların ortalama C 10
üretim süresini bulunuz.
D 20
Üretim süresi 4*60=240 dakika
1. İşçinin üretimi 240/5=48 parça
2. İşçinin üretimi 240/6=40 parça, N 4
H
3. İşçinin üretimi 240/10=24 parça, 1 0 . 517
4. İşçinin üretimi 240/20=12 parça. X
İşçilerin 4 saatteki toplam üretimi 48+40+24+12=124 parça i
2
X i
X X X
2 2 2 2
X i 1
K K
1 2 3 N
Basit Seride N N
2
fi X
f2 X f3 X fk X
2 2 2 2 i
f1 X i 1
K K
1 2 3 k
f f fk
k
f
Gruplanmış Seride
1 2 3
fi
i 1
2
fimi
f1m 1 f 2 m 2 f 3 m 3 f k m k
2 2 2 2
i 1
Sınıflandırılmış Seride K
f1 f f fk
K k
2 3
fi
i 1
Mod
Bir seride en çok tekrarlanan değere mod adı verilir. Veri setinin modu
olmayacağı gibi birden fazla da modu olabilir.
En fazla
Basit Seride: En Çok Tekrarlanan Değer aldığınız
harf notu
N 1
Gruplanmış Seride: 2
. değer sıra numarasına ait grup medyan değeri
( X Mod) 3( X Medyan)
Kartil(Q), Desil(D) ve Santiller(C)
Bir serinin elemanları küçükten büyüğe doğru sıralandığında, seriyi dört eşit
parçaya bölen değerlere kartil, on eşit parçaya bölen değerlere desil, yüz eşit
parçaya bölen değerlere santil adı verilir. 2.kartil, 5.desile ve 50.santile eşit
olup, bu değer seriyi iki eşit parçaya bölen medyana eşittir.
Simetrik serilerde Q3 - Q2 = Q2 - Q1
m 1
R = Xmax – Xmin
• Bu dağılım ölçüsü oldukça basit ve anlaşılır olmasına karşılık sadece iki uç değere
bağlı olması sebebiyle serideki aşırı değerlerin etkisi altında kalması zayıf yönünü
oluşturur.
• Sadece iki uç değeri dikkate alması diğer gözlem değerlerinin dağılımının hiç
dikkate alınmamasına sebep olmaktadır.
Kartil ve Desil Aralığı
• Kartil aralığı 3. kartil ile 1.kartil arasındaki fark olup serinin orta
bölgesindeki %50’lik gözlem kümesinin değişim aralığını verir.
• Q = Q3 – Q1 şeklinde belirlenir.
• Desil aralığı ise 9. desil ile 1.desil arasındaki fark olup, her iki uçtaki
%10 gözlem değeri haricinde kalan %80 lik gözlem değerinin
değişim aralığını verir.
• D = D9 – D1 şeklinde belirlenir.
Ortalama (Mutlak) Sapma
• Basit Seri
• Bilindiği gibi sapmalar serisinin ( ( X i X ) 0) (aritmetik ortalamadan
elde edilebilir.
• Sınıflandırılmış Seri
• Bu sapma ölçüsü diğer değişim aralığı ölçülerinin aksine serinin bütün
değerlerini dikkate almaktadır. fi m i X
• Bu sebeple daha kullanışlı ve daha temsili bir sapma ölçüsü elde edilmiş O .S
olmaktadır. fi
Standart Sapma ve Varyans
• Mutlak işlemler yerine kare alma yolu ile sapmalar serisi toplamı sıfır
olmaktan kurtarılabilir. Böylece yeni bir sapma ölçüsü elde edilmektedir.
• Bir veri grubunda verilerin aritmetik ortalamadan ne kadar uzaklaştığının
ölçüsüdür.
• SS verilerin oluşturduğu dizinin homojenliğiyle ilgili bilgi verir.
• SS, bir veri grubunun ortalaması etrafındaki dağılımını belirlemek
amacıyla kullanılır.
• SS, Negatif değerler almaz.
Standart Sapma ve Varyans
• Veri grubundaki tüm değerler aynı ise SS sıfırdır.
• SS veri grubundaki uç değerlere karşı duyarlı olup tek bir uç değer dahi
değerini artırabilir. Yani, dağılımı çarpık hale getirir.
• Değerlerin ortalamadan olan farklarının, kareleri toplamının
ortalamasının (Varyans), kareköküne eşittir.
• Varyans standart sapmanın karesine eşittir.
• Aynı ölçü birimini kullanan farklı serilerdeki gözlem değerlerini standart
sapma cinsinden karşılaştırabiliriz.
Örnek
• Bir öğrenci istatistik dersi birinci vizesinden 40 (𝑋 = 30 𝑣𝑒 𝑆 = 5) ve ikinci
vizesinden 80 (𝑋 = 60 𝑣𝑒 𝑆 = 20) almıştır.
• Bu öğrenci hangi sınavda daha Başarılı?
fi ( xi )
2
fi ( mi X )
2
i 1
Gruplanmış Seri Anakitle Örneklem
k
S
fi ( fi ) 1
i 1
fi (m i )
2
fi ( Xi X )
2
Sınıflandırılmış Anakitle i 1
k
Örneklem S
fi ( fi ) 1
i 1
2 1 1 2 2
N1 N 2
Değişim Katsayısı
• Standart sapmanın ortalamanın bir yüzdesi olarak ifade edilmesine değişim katsayısı adı
verilir. Bu tanıma göre standart sapmanın büyüklüğü aritmetik ortalamaya göre ifade
edilmektedir.
D .K . 100
X
• Bu ölçü farklı cins ve büyüklüklerdeki serileri aynı cins ve büyüklükte (yüzde cinsinden) ifade
etme imkanı sağlamaktadır.
• Ancak bu ölçünün bir dezavantajı bir üst sınırının olmamasıdır. Yani değişim katsayısı %100 ü
geçen değerler de alabilmesi bu ölçünün zayıf tarafıdır. Eğer bu ölçünün üst sınırı %100
olsaydı verinin değişkenliğini daha iyi yorumlamak mümkün olurdu.
• Özellikle ortalaması sıfıra yakın seriler için kullanımı pek uygun değildir.
Çarpıklık ve Basıklık
PEARSON ÇARPIKLIK ÖLÇÜSÜ Ortalamalara Dayanan
3
3 m2=Varyans
3
m3, Çarpıklık
• 3 = 0 ise seri simetrik m4, Basıklık
• 3 > 0 ise seri sağa çarpık
• 3 < 0 ise seri sola çarpık olmaktadır.
• 3 için bir üst sınır olmamakla birlikte 3
0 ,5 olursa asimetrinin kuvvetli olduğu
kabul edilir.
Çarpıklık ve Basıklık
Basıklık Ölçüsü ortalamaya göre dördüncü momentten gidilerek hesaplanır ve α4
olarak gösterilir.
x
4
m4 x
4 Basit Seri İçin
i 1
i
s
4 m4
n