Professional Documents
Culture Documents
5 Muy Ist Tanımlayıcı 20 21
5 Muy Ist Tanımlayıcı 20 21
D. İÇEN
2020-2021 Bahar Dönemi
1
NİTEL DEĞİŞKENLER:
NİCEL DEĞİŞKENLER:
Birimlerin ölçülerek ya da tartılarak değeri saptanan özellikleridir. Bu
değişkenlere sayısal değişken de denir.
2
NİTEL VE NİCEL VERİLERİN
SINIFLANDIRMASI
Sınıflandırma ya da gruplandırma, veri setinde belirli bir değere ya
da belirli iki değer aralığında değerlere sahip kaç birim bulunduğunu
tablo düzeninde gösterme işlemidir.
Sınıflandırılmış verilerin uygun tablo ile gösterilmesine frekans
tablosu adı verilir.
1343214231264332325422332
1162536514543233545243656
3
Her nitelikte kaç ürün üretildiği sayılarak ya da dizideki her
kod tek tek ele alınarak aşağıdaki tablodaki seçeneklerden
hangisine girdiği bir çizgi ile belirlenerek sınıflandırma
işlemi yapılır.
4
NİCEL VERİLERİN SINIFLANDIRILMASI
5
GRAFİKLER
• Grafikler, verilerin şekilsel gösterimidir.
edilir.
• Dağılımın biçimi, aralığı ve verilerin toplandığı değerler grafik kullanarak çok daha
kolay görülür.
• Grafiğin türü önemlidir. Aksi takdirde veriler hakkında yanıltıcı bilgiler verilebilir.
gösterir.
belirlenmelidir.
6
HİSTOGRAM
7
ÖRNEK:
18
16
14
12
Frekans
10
8
6
4
2
50 60 70 80 90 100 110
Maliyet ($)
5
4
3
2
1
Değerlendirme
8
PASTA GRAFİĞİ
ÖRNEK:
yorum
suz. Kötü
5% 10%
Yetersiz
İyi 15%
45%
Orta
25%
Değerlendirmeler
9
ÖRNEK:
91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73
10
Dal Yaprak Grafiği
11
KUTU Grafiği
KUTU Grafiği
12
MERKEZİ EĞİLİM (KONUM) ÖLÇÜLERİ
•Veri dağılımının nerede toplandığını gösterir.
• Ortalama (mean)
• Aritmetik ortalama
• Ortanca (median)
• Tepe Değer (mod)
• Yüzdelikler
• Çeyreklikler
ÖRNEK:
Otomobillerin yıllık bakım maliyetleri artan sırada
verilmiştir.
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
13
xi 34,356
x 490.80
n 70
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
MEDYAN = ORTANCA
14
MEDYAN = ORTANCA
ÖRNEK:
n=70 (çift) olduğundan,
35. ve 36. Değerler dikkate alınarak;
Medyan = (475 + 475)/2 = 475
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
15
MOD = TEPE DEĞER
YÜZDELİKLER
Bir veri kümesinin p. yüzdesi, o veri kümesindeki kaç verinin
%p’ nin altında kaldığını ifade eder.
16
ÖRNEK:
90.lık yüzde;
i = (p/100)n = (90/100)70 = 63
63. ve 64. Değerlerin ortalaması:
90. yüzde = (580 + 590)/2 = 585
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
ÇEYREKLİKLER
17
ÖRNEK:
• Üçüncü Çeyreklik
Üçüncü Çeyreklik = 75.Yüzde değeri
i = (p/100)n = (75/100)70 = 52.5 = 53
Üçüncü Çeyreklik = 525
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
18
Çarpıklık ve Basıklık
• Aralık
• Varyans
• Standard Sapma
• Değişim Katsayısı
19
ARALIK (RANGE)
ÖRNEK:
Aralık = en büyük değer – en küçük değer
Aralık = 615 - 425 = 190
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
20
VARYANS
2
2 ( xi x )
s
n1
STANDART SAPMA
“S” harfi ile gösterilir. Standart sapma, gözlemlerin
ortalama etrafından ne kadar uzaklaştığını gösterir.
2 ( X i )2
Xi
Standart sapma (S) n
n1
21
Standart sapma, dağılımın simetrik bir dağılım
olması durumunda ve tek tepe noktası olduğu
durumlarda anlamlıdır. Bu nedenle standart sapma
aritmetik ortalamanın hesaplandığı, normal ya da
normale yakın veri kümelerinde kullanılır.
22
DEĞİŞİM KATSAYISI
S
DK * 100
X
•DK< %5 ise; Veri kümesi homojendir, dar bir yayılma
söz konusudur.
vardır.
23
İKİ DEĞİŞKEN ARASINDAKİ
ÖLÇÜLER
• Kovaryans
• Korelasyon Katsayısı
KOVARYANS
• Pozitif kovaryans, iki değişken arasında pozitif yönlü bir
ilişki olduğunu belirtir.
(xi x)(yi y)
Cov(X; Y)
n1
24
KORELASYON KATSAYISI
25