You are on page 1of 80

ΚΑΤΑΝΟΜΕΣ ΣΥΧΝΟΤΗΤΩΝ - ΔΙΑΓΡΑΜΜΑΤΑ

Γιώργος Χελιδόνης, Ph.D.


Εθνική Αναλογιστική Αρχή

1 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


ΚΑΤΑΝΟΜΕΣ

2 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Κανονική Κατανομή (1)
 Η πιο σημαντική συνεχής κατανομή της
θεωρίας των Πιθανοτήτων
 Πολλά χαρακτηριστικά όπως το βάρος, το
ύψος, η βαθμολογία σε εξετάσεις, κ.ο.κ.
περιγράφονται από την κανονική κατανομή
 Είναι μια συνεχής συμμετρική κατανομή σε
μορφή καμπάνας, που καλείται καμπύλη
κανονικής κατανομής ή κατανομή των Gauss
Laplace
 Συμβολίζουμε Χ~Ν(μ,σ2))
3 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Κανονική Κατανομή (2)
 Συμβολίζουμε Χ~Ν(μ,σ2))
 Η συνάρτηση πυκνότητας πιθανότητας δίνεται
από τον τύπο
1 𝑥−𝜇 2
𝑓 𝑥 = 𝑒−
𝜎 2𝜋 2𝜎 2
όπου μ ο μέσος, σ2 η διασπορά, σ η τυπική
απόκλιση, e =2,7183 και π=3,1416

Ε(Χ)=μ και Var(X)=σ2

4 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Κανονική Κατανομή (3)
Κανονική κατανομή με μέση τιμή 3 και τυπική απόκλιση 1,3 (Χ~Ν(3, 1,69))

Distribution Plot
Normal; Mean=3; StDev=1,3

0,30

0,25

0,20
Density

0,15

0,10

0,05

0,00
-1 0 1 2 3 4 5 6 7 8
X

5 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Κανονική Κατανομή (4)
Κανονική κατανομή με μέση τιμή 5 και τυπική απόκλιση 3 (Χ~Ν(5, 9))

Distribution Plot
Normal; Mean=5; StDev=3
0,14

0,12

0,10

0,08
Density

0,06

0,04

0,02

0,00
-5 0 5 10 15
X

6 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Ιδιότητες Κανονικής Κατανομής (1)
 Είναι συμμετρική γύρω από το μ
 Το εμβαδόν που περικλείεται μεταξύ της καμπύλης
και του οριζόντιου άξονα ισούται με 1
 Τα σημεία μ+σ αποτελούν σημεία καμπής
 Μια κανονική κατανομή προσδιορίζεται πλήρως από
τις παραμέτρους μ και σ
 Όσο μεγαλύτερη είναι η μέση τιμή τόσο δεξιότερα
προς τον οριζόντια άξονα βρίσκεται η καμπύλη. Ενώ
όσο μεγαλύτερη είναι η τυπική απόκλιση τόσο πιο
«απλωμένη» είναι η καμπύλη

7 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Ιδιότητες Κανονικής Κατανομής (2)
 Εάν Χ~Ν(μ,σ2)
 𝑃 𝜇 − 𝜎 ≤ Χ ≤ 𝜇 + 𝜎 = 0,6827 ≅ 68%
 𝑃 𝜇 − 2𝜎 ≤ Χ ≤ 𝜇 + 2𝜎 = 0,9445 ≅ 95%
 𝑃 𝜇 − 3𝜎 ≤ Χ ≤ 𝜇 + 3𝜎 = 0,9973 ≅ 99%

8 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Ιδιότητες Κανονικής Κατανομής (4)

9 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Τυπική Κανονική Κατανομή (1)
 Η τυπική κανονική κατανομή έχει:
μ=0 και σ2=1
 Ο μετασχηματισμός μιας τ.μ. Χ γίνεται με τον τύπο
Χ−𝜇
Ζ=
𝜎
 Ζ~Ν(0,1))
1
1 −2 𝑧 2
 𝑓 𝑥 = 𝑒
2𝜋
 E(Z)=0 & Var(Z)=1
 Η Z είναι ανεξάρτητη από τη μονάδα μέτρησης της
τ.μ. Χ (δεν εκφράζεται σε καμιά μονάδα μέτρησης)

10 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Τυπική Κανονική Κατανομή (2)
 Πίνακες της τυπικής κανονικής (Ζ) υπάρχουν στα εγχειρίδια
στατιστικής
 Το κύριο σώμα του Πίνακα δίνει αθροιστικές πιθανότητες
 Η πρώτη γραμμή και η πρώτη στήλη συνθέτουν από κοινού
τις τιμές (zi)
 Για παράδειγμα αν ενδιαφερόμαστε για την P(Z<1,48), τότε
ανατρέχοντας στον Πίνακα των Gauss-Laplace κοιτάμε στη
γραμμή που έχει τίτλο «1,4» δηλ. στη γραμμή με το πρώτο
δεκαδικό ψηφίο της zi που ζητείται, και στη στήλη «0,08»
δηλ. στη στήλη με το δεύτερο δεκαδικό ψηφίο της zi που
ζητείται
 Βρίσκουμε ότι η ζητούμενη πιθανότητα P(Z<1,48)=0,4306
 Στην επόμενη διαφάνεια δίνεται τμήμα του πίνακα
αθροιστικών πιθανοτήτων της τυπικής κανονικής κατανομής
11 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Τυπική Κανονική Κατανομή (3)

12 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Τυπική Κανονική Κατανομή (4)
 Παράδειγμα: Η ηλικία εργαζομένων μεγάλης επιχείρησης
ακολουθεί την κανονική κατανομή πιθανότητας με μέσο 55
και τυπική απόκλιση 9 έτη, δηλ. Χ~Ν(55, 81).
Τι πιθανότητα υπάρχει τυχαία επιλεγόμενος εργαζόμενος να έχει:
• ηλικία μέχρι 58 έτη
𝑋−𝜇 58−55
𝑃 𝑋 < 58 = 𝑃( < )=Ρ(Ζ< 0,333) = 0,1293
𝜎 9

• ηλικία μεταξύ 46 και 60 ετών


46−55 Χ−μ 60−55
Ρ 46 < Χ < 60 = Ρ( < < )=Ρ(-1< Ζ < 0,5556) =
9 𝜎 9
𝐹𝑧 (0,5556)-𝐹𝑧 (-1)=0,2088-0,1587=0,05

• Ηλικία άνω των 62 ετών


𝛸−𝜇 62−55
𝛲 𝛸 > 62 = 1 − 𝛲 𝛸 < 62 = 1 − 𝛲(
𝜎
<
9
)=1-Ρ(Ζ<0,7778)=
=1-0,2823=0,7177
13 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Κατανομή Bernoulli
• Δοκιμή Bernoulli είναι ένα τυχαίο πείραμα με δυο
μόνο δυνατά αποτελέσματα, π.χ. αγόρι-κορίτσι,
γράμματα-κορώνα, κ.ο.κ.
• Έχουμε μόνο δυο δυνατά αποτελέσματα που
συμβολίζονται τυχαία με 1 και 0, και ονομάζονται
επιτυχία και αποτυχία αντίστοιχα
• Η πιθανότητα επιτυχίας είναι p και αποτυχίας q=1-p
(p+q=1)
• Η πιθανότητα p παραμένει σταθερή όσες φορές και
αν επαναληφθεί το πείραμα
• Έστω Χ ο αριθμός των επιτυχιών σε ένα πείραμα
Bernoulli. Η κατανομή της τυχαίας μεταβλητής Χ
(παίρνει δυο τιμές, 1 επιτυχία, 0 αποτυχία) καλείται
Κατανομή Bernoulli με παράμετρο p .

14 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διωνυμική Κατανομή (1)
 Έστω ότι επαναλαμβάνουμε ένα πείραμα Bernoulli n
φορές
 Οι δοκιμές είναι ανεξάρτητες (το αποτέλεσμα μιας
συγκεκριμένης δοκιμής δεν επηρεάζει το
αποτέλεσμα οποιασδήποτε άλλης δοκιμής)
 Οι δοκιμές είναι ίδιες ακριβώς με δύο ενδεχόμενα (1
και 0 με πιθανότητες επιτυχίας και αποτυχίας p ,q
αντίστοιχα)
 Έστω X ο αριθμός των επιτυχιών σε n δοκιμές
Bernoulli με σταθερή πιθανότητα επιτυχίας p και
πιθανότητα αποτυχίας q , σε όλες τις επαναλήψεις

15 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διωνυμική Κατανομή (2)
 Τότε λέμε ότι η X ακολουθεί τη Διωνυμική
Κατανομή (Binomial Distribution) με
παραμέτρους n και p
 Συμβολίζουμε Χ~Β(n,p))
• Συνάρτηση πιθανότητας:
𝑛!
p𝑘 = 𝑝𝑘 (𝑞)𝑛−𝑘 , 𝑘 = 0,1,2, . . 𝑛 & 0 ≤ 𝑝 ≤ 1
𝑘! 𝑛−𝑘 !

• Μέση τιμή Ε(Χ)=np


• Διασπορά Var(X)=npq
• Η διωνυμική κατανομή είναι διακριτή κατανομή

16 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διωνυμική Κατανομή (3)
 Χ~Β(100, 0,2)
Distribution Plot
Binomial; n=100; p=0,2

0,10

0,08
Probability

0,06

0,04

0,02

0,00
10 15 20 25 30 35
X

17 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διωνυμική Κατανομή (4)
 Χ~Β(200, 1/6) δηλ. 200 ρίψεις ζαριού
Distribution Plot
Binomial; n=200; p=0,166667
0,08

0,07

0,06

0,05
Probability

0,04

0,03

0,02

0,01

0,00
20 25 30 35 40 45 50 55
X

18 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διωνυμική Κατανομή (5)
Παράδειγμα: Ρείχνουμε ένα ζάρι 6 φορές. Ποια η πιθανότητα
να φέρει το ζάρι:
3 φορές «3», τουλάχιστον 2 φορές «3», το πολύ 4 φορές
«3»
• Έστω Χ=ο αριθμός των ρίψεων που έρχεται “3”
 Χ~Β(6, 1/6))
6! 1 3 1 6−3 720 1 3 5 3
 Ρ(Χ = 3)= 1 − = =0,0536
3! 6−3 ! 6 6 6∗6 6 6

 𝑃 𝑋 ≥2 =1−𝑃 𝑋 <2 =1−𝑃 𝑋 ≤1 =


1 − 𝑃 𝑋 = 0 − 𝑃 𝑋 = 1 =1-0,3349-0,4019=0,2632
 𝑃 𝑋 ≤4 =𝑃 𝑋 =0 +𝑃 𝑋 =1 +𝑃 𝑋 =2 +𝑃 𝑋 =3 +
𝑃 𝑋 − 4 = 0,3349+0,4019+0,2009 + 0,0536 + 0,0080 = 0,9993

19 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διωνυμική Κατανομή (6)
Παράδειγμα (συνέχεια):
 Η μέση τιμή της προηγούμενης κατανομής είναι
1
𝐸 𝑋 = 6 =1
6

Δηλ. αναμένουμε 1 επιτυχία (δηλ να έρθει «3») στις 6


ρίψεις

 Η διασποράς της
15
𝑉𝑎𝑟 𝑋 = 6
66
=56 = 0,8333

20 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διωνυμική Κατανομή (7)
 Κατανομές πιθανότητας και αθροιστικής της
κατανομή Χ~Β(10, 0,4)
x f(x)=P(X=x) F(x)=P(X≤x)
0 0,0060 0,0060
1 0,0403 0,0464
2 0,1209 0,1673
3 0,2150 0,3823
4 0,2508 0,6331
5 0,2007 0,8338
6 0,1115 0,9452
7 0,0425 0,9877
8 0,0106 0,9983
9 0,0016 0,9999
10 0,0001 1,0000

21 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διωνυμική Κατανομή (8)
 Διάγραμμα συνάρτησης πιθανότητας της
κατανομή Χ~Β(10, 0,4)
X~B(10, 0,4)
0,3000

0,2508
0,2500

0,2150
0,2007
0,2000

0,1500
0,1209
0,1115
0,1000

0,0500 0,0403 0,0425

0,0060 0,0106
0,0016 0,0001
0,0000
0 1 2 3 4 5 6 7 8 9 10

22 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διωνυμική Κατανομή (9)
 Κατανομές πιθανότητας και αθροιστικής της
κατανομή Χ~Β(5, 0,25)
x f(x)=P(X=x) F(x)=P(X≤x)

0 0,2373 0,2373

1 0,3955 0,6328

2 0,2637 0,8965

3 0,0879 0,9844

4 0,0146 0,9990

5 0,0010 1,0000

23 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διωνυμική Κατανομή (10)
 Διάγραμμα συνάρτησης πιθανότητας της
κατανομή Χ~Β(5, 0,25)
X~B(5, 0,25)
0,4500

0,3955
0,4000

0,3500

0,3000
0,2637
0,2500 0,2373

0,2000

0,1500

0,1000 0,0879

0,0500
0,0146
0,0010
0,0000
0 1 2 3 4 5

24 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διαγράμματα κατανομών και υπολογισμοί
πιθανοτήτων στη MINITAB (1)
Για να κάνουμε γραφική παράσταση της συνάρτησης πυκνότητάς
κατανομής με τη Minitab ακολουθούμε τα παρακάτω βήματα και
επιλέγουμε αν θέλουμε ένα γράφημα μίας κατανομής (View Single) ή
και δύο (Two Distributions)

25 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διαγράμματα κατανομών και υπολογισμοί πιθανοτήτων στη
MINITAB (2)
Επιλέγουμε την κατανομή (Distribution) και εισάγουμε τις
αντίστοιχες παραμέτρους της κατανομής (n, p για τη διώνυμή και
μ, σ για την κανονική)

26 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διαγράμματα κατανομών και υπολογισμοί πιθανοτήτων στη
MINITAB (3)

Distribution Plot Distribution Plot


Normal; Mean=21; StDev=6 Binomial; n=50; p=0,5
0,07 0,12

0,06
0,10

0,05
0,08

Probability
0,04
Density

0,06
0,03

0,04
0,02

0,02
0,01

0,00 0,00
0 10 20 30 40 15 20 25 30 35
X X

27 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διαγράμματα κατανομών και υπολογισμοί πιθανοτήτων στη
MINITAB (4)

Γραφική παράσταση δύο κανονική κατανομών με μέση τιμή 32


και τυπικές αποκλίσεις 3 και 6 αντίστοιχα

28 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διαγράμματα κατανομών και υπολογισμοί πιθανοτήτων στη
MINITAB (5)
• Για να υπολογισμό πιθανοτήτων και αθροιστικών πιθανοτήτων
κατανομής μπορεί να γίνει στη Minitab με την παρακάτω διαδικασία
• Αρχικά εισάγουμε στη Minitab τις τιμές των οποίων θέλουμε να
υπολογίσουμε τις πιθανότητες και τις αθροιστικές πιθανότητες

29 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διαγράμματα κατανομών και υπολογισμοί πιθανοτήτων στη
MINITAB (6)
• Επιλέγουμε “Probability” ή “Cumulative probability” για πιθανότητα Ρ(Χ=x) ή
P(X≤x) αντίστοιχα (σημειακή και αθροιστική)
• Εισάγουμε τις παραμέτρους της διωνυμικής n=60 & p=0,175
• Επιλέγουμε τη στήλη στην οποία έχουμε εισάγει τις τιμές των οποίων τις
πιθανότητες θέλουμε να υπολογίσουμε (εδώ στη C1) και δίνουμε όνομα για
τη στήλη που θα αποθηκευτούν οι τιμές πιθανότητας Ρ για απλές
πιθανότητες και C για αθροιστικές (η διαδικασία επαναλαμβάνεται 2 φορές
και απλές και αθροιστικές πιθανότητες αντίστοιχα)

30 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διαγράμματα κατανομών και υπολογισμοί πιθανοτήτων στη
MINITAB (7)
• Στα δεδομένα της Minitab υπάρχουν δύο νέες στήλες με τις πιθανότητες
Ρ(Χ=x) και P(X≤x) (αθροιστική) της Χ~Β(60, 01,75). Για παράδειγμα:
 Ρ(Χ=3)=0,003173 ενώ P(X≤3)=0,00408
 P(X =8)=0,101839 ενώ P(X≤8)=0,25503

31 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διαγράμματα κατανομών και υπολογισμοί πιθανοτήτων στη
MINITAB (8)
• Για κανονική κατανομής με παραμέτρους μ=32 & σ=15
• Οι αντίστοιχες πιθανότητες P(X≤x) για τις τιμές που μας
ενδιαφέρουν

32 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


ΔΙΑΓΡΑΜΜΑΤΑ ΚΑΤΑΝΟΜΩΝ

33 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Διαγράμματα Κατανόμών

Κυριότερα Γραφήματα
 Ραβδόγραμμα / Ιστόγραμμα

 Φυλλόγραμμα (Stem and Leaf Plot)

 Διάγραμμα Πίτας (Pie Chart)

 Θηκόγραμμα (Box Plot)

 Διάγραμμα Διασποράς (Scatter Plot)

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


34 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διαγράμματα Κατανομών
 Σε προηγούμενο παράδειγμα, είχαμε την ηλικία 36 ατόμων
σε σεμινάριο του ΕΚΔΑΑ και δημιουργήσαμε τον παρακάτω
πίνακα συχνοτήτων
Αθροιστική
Απόλυτη Σχετική Αθροιστική Σχετική
Ηλικία
Συχνότητα (fi) Συχνότητα (%) Συχνότητα Συχνότητα
(%)

18-25 16 44,44% 16 44,44%


26-33 9 25,00% 25 69,44%
34-41 3 8,33% 28 77,78%
42-49 4 11,11% 32 88,89%
50 & άνω 4 11,11% 36 100,00%
∑fi = 36

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Ιστόγραμμα Συχνοτήτων / Πολύγωνο Συχνοτήτων (1)
 Ένα ιστόγραμμα συχνοτήτων είναι ένα γράφημα ράβδων που
αναπαριστά την κατανομή συχνοτήτων ενός συνόλου δεδομένων
 Εάν σε ένα σύστημα κάθετων αξόνων χρησιμοποιήσουμε
ορθογώνια παραλληλόγραμμα με εύρος ίσο με το εύρος κάθε
κλάσης των τιμών των παρατηρήσεών μας και με ύψος ίσο με τη
συχνότητα της κάθε κλάσης έχουμε το ιστόγραμμα συχνοτήτων

 Εάν στο ιστόγραμμα συχνοτήτων ενώσουμε μεταξύ του τα


σημεία που προσδιορίζονται ως το μέσον της επάνω βάσης κάθε
ορθογώνιου παραλληλόγραμμου σχηματίζουμε μία πολυγωνική
γραμμή
 Προκειμένου η γραμμή αυτή να εφάπτεται στα δύο άκρα της
επάνω στον οριζόντιο άξονα θα πρέπει να υποθέσουμε την
ύπαρξη δύο εικονικών τάξεων με μηδενική συχνότητα πριν την
πρώτη και μετά την τελευταία τάξη. Η κατασκευή που έχουμε
λέγεται πολυγωνική γραμμή ή αλλιώς πολύγωνο
συχνοτήτων

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


36 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Ιστόγραμμα Συχνοτήτων / Πολύγωνο Συχνοτήτων (2)

Ιστόγραμμα Συχνοτήτων
18
16
16

14

12
Συχνότητα

10 9

6
4 4
4 3

0
18-25 26-33 34-41 42-49 50 & άνω
Ηλικία

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


37 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Ιστόγραμμα Συχνοτήτων / Πολύγωνο Συχνοτήτων (2)

Πολύγωνο Συχνοτήτων
18
16
16

14

12

10 9

6
4 4
3
4

0
έως 18 18-25 26-33 34-41 42-49 50-58 58 & άνω

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


38 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Ιστόγραμμα Συχνοτήτων / Πολύγωνο Συχνοτήτων (3)

Ιστόγραμμα Σχετικών Συχνοτήτων


50,0%

44,4%
45,0%

40,0%

35,0%

30,0%
Συχνότητα

25,0%
25,0%

20,0%

15,0%
11,1% 11,1%
10,0% 8,3%

5,0%

0,0%
18-25 26-33 34-41 42-49 50 & άνω
Ηλικία

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


39 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Ιστόγραμμα Συχνοτήτων / Πολύγωνο Συχνοτήτων (4)
Διάγραμμα Σχετικής Αθροιστικής Συχνότητας
120,00%

100,00%
100,00%
88,89%
77,78%
80,00%
69,44%
Συχνότητα

60,00%
44,44%

40,00%

20,00%

0,00%
18-25 26-33 34-41 42-49 50 & άνω
Ηλικία

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


40 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Ιστόγραμμα με τη MINITAB (1)
Ακολουθούμε τα παρακάτω βήματα και επιλέγουμε τύπο
ιστογράμματος (simple για ιστόγραμμα μιας μεταβλητής)

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


41 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Ιστόγραμμα με τη MINITAB (2)
 Εισάγουμε τη μεταβλητής της οποίας θέλουμε το ιστόγραμμα

 Με την επιλογή “Scale” & “Y-Scale Type” μπορούμε να επιλέξουμε %


αντί για απολυτές συχνότητες

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


42 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Ιστόγραμμα με τη MINITAB (3)
Εισάγουμε τη μεταβλητής της οποίας θέλουμε
κατασκευάσουμε το ιστόγραμμα

Histogram of Income Histogram of Income


12 40

10

30

8
Frequency

Percent
6 20

10

0 0
20000 30000 40000 50000 60000 70000 80000 90000 20000 30000 40000 50000 60000 70000 80000 90000
Income Income

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


43 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
ΣΧΗΜΑΤΙΚΕΣ ΜΟΡΦΕΣ ΚΑΙ
ΜΕΤΡΑ ΣΧΗΜΑΤΙΚΗΣ ΜΟΡΦΗΣ
ΚΑΤΑΝΟΜΗΣ

44 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Συμμετρικές Κατανομές (1)

 Μια καμπύλη συχνοτήτων είναι συμμετρική όταν


τραβηχτεί μια κατακόρυφη γραμμή στο κέντρο του
γραφήματος της και το «διπλώσουμε» στη μέση, τα μισά
του γραφήματος που προκύπτουν είναι όμοια (είδωλο το
ένα του άλλου)
 Όταν μια καμπύλη συχνοτήτων είναι συμμετρική ως προς
τον κατακόρυφο άξονα (άξονας συμμετρίας) που
διέρχεται από την κορυφή της κατανομής,, τότε η
κατανομή είναι συμμετρική
 Σε μια συμμετρική κατανομή, δεξιά και αριστερά του άξονα
συμμετρίας βρίσκεται το ίδιο ποσοστόπαρατηρήσεων
(50%)
 Στις συμμετρικές κατανομές η μέση τιμή ταυτίζεται με
τη διάμεσο και την επικρατούσα τιμή
ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ
45 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Συμμετρικές Κατανομές (2)

Συμμετρική κατανομή
30,0%

25,0%

20,0%

15,0%

10,0%

5,0%

0,0%
1 2 3 4 5 6 7

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


46 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Συμμετρικές Κατανομές (3)

Συμμετρική κατανομή

30,0%

25,0%

20,0%

15,0%

10,0%

5,0%

0,0%
1 2 3 4 5 6 7 8 9

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


47 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Συμμετρικές Κατανομές (4)
 Όταν η καμπύλη συχνοτήτων δεν είναι
συμμετρική, δηλαδή, όταν δεξιά και αριστερά του
κατακόρυφου άξονα που περνάει από την κορυφή
δε βρίσκεται το ίδιο ποσοστό παρατηρήσεων,
τότε η κατανομή είναι ασύμμετρη
 Υπάρχουν δύο είδη ασυμμετρίας:
 Θετική ασυμμετρία (δεξιά ασυμμετρία) όταν
οι περισσότερες παρατηρήσεις βρίσκονται αριστερά
της κορυφής (Μέσος > Διάμεσος> Επικρατούσας
Τιμής)
 Αρνητική ασυμμετρία (αριστερή ασυμμετρία)
όταν οι περισσότερες παρατηρήσεις βρίσκονται
δεξιά της κορυφής (Μέσος <Διάμεσος
<Επικρατούσας Τιμής)
ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ
48 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Συμμετρικές Κατανομές (5)
Συμμετρική

Μέσος = Διάμεσος = Επικρατουσα Τιμή

Θετική Ασυμμετρία Αρνητική Ασυμμετρία

Μέσος > Διάμεσος > Επικρατούσα Τιμή Μέσος < Διάμεσος < Επικρατούσα Τιμή
Μέτρα Ασσυμετρίας

 Συντελεστής Ασυμμετρίας (Skewness)


𝒏 𝟑
𝟏 𝒛𝒊
β𝟏 =
𝒏
όπου zi οι τυποποιημένες τιμές της Χ

 β1 = 0, έχουμε συμμετρία
 β1 < 0, έχουμε αρνητική ασυμμετρία
 β1 > 0, έχουμε θετική ασυμμετρία

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


50 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Κύρτωση Κατανομής
 Η κύρτωση χαρακτηρίζει το ύψος της κορυφής της
κατανομής και δίνει πληροφορίες για την αιχμηρότητα
της καμπύλης
 Οι καμπύλες συχνοτήτων, ανάλογα με το βαθμό
συγκέντρωσης των παρατηρήσεων στο μέσο και στα
άκρα της κατανομής, διακρίνονται σε μεσόκυρτες,
λεπτόκυρτες, και πλατύκυρτες
 Λεπτόκυρτη κατανομή αν παρουσιάζει σχετικά τη
μεγαλύτερη συγκέντρωση των παρατηρήσεων της γύρω
από το μέσο
 Πλατύκυρτη κατανομή αν η μέγιστη συχνότητα είναι
σχετικά μικρή
 Μεσόκυρτη κατανομή αν προσεγγίζει την κανονική
κατανομή

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


51 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Μέτρα Κύρτωσης

 Συντελεστής Κύρτωσης (Kurtosis) του Pearson


𝒏 𝟒
𝟏 𝒛𝒊
β𝟐 =
𝒏
όπου zi οι τυποποιημένες τιμές της Χ

 β2 = 3, έχουμε μεσόκυρτη κατανομή


 β2 < 3, έχουμε πλατύκυρτη κατανομή
 β2 > 3, έχουμε λεπτόκυρτη κατανομή
ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ
52 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Μέτρα Συμμετρίας & Κύρτωσης

 Κανονική Κατανομή
 Ασσυμετρία = 0
 Κύρτωση = 3
ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ
53 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Υπολογισμός Παραμέτρων Κύρτωση & Ασυμμετρίας στη
ΜΙΝΙΤΑΒ (1)
 Στην προηγούμενη παρουσίαση δείξαμε τη διαδικασία
υπολογισμού περιγραφικών στατιστικών στη Minitab.
 Από την επιλογή “Statistics” επιλέγουμε επιπλέον: Skewness
& Kurtosis

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


54 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Υπολογισμός Παραμέτρων Κύρτωση & Ασυμμετρίας στη
ΜΙΝΙΤΑΒ (2)

 Για τη μεταβλητή “Savings” έχουμε:


 β1= 1,23 (skewness)
 β2= 1,28 (kurtosis)

 H μεταβλητή “Savings” έχει θετική ασσυμετρία (β1=1,23>0)


και είναι πλατύκυρτη (β2= 1,28<3)

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


55 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
ΔΙΑΓΡΑΜΜΑΤΑ ΚΑΤΑΝΟΜΩΝ
(συνέχεια)

56 ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ


Φυλλόγραμμα (Steam & Leaf Plot) (1)
 Στο φυλλόγραμμα (stem & leaf plot), κάθε
τιμή των δεδομένων χωρίζεται σε δύο τμήματα,
έναν «κορμό» (τα αριστερά ψηφία της τιμής) και
ένα φύλλο (το δεξί ψηφίο της τιμής)
 Παράδειγμα:
Στο παράδειγμα με τους 36 συμμετεχόντων σε ένα
σεμινάριο του ΕΚΔΔΑ, αρχικά ταξινομούμε τις ηλικίες
σε αύξουσα σειρά
18 19 22 30 33 47
18 20 23 30 34 49
19 20 24 30 38 51
19 21 25 32 40 54
19 21 27 32 43 56
19 22 29 33 44 58
ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ
57 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Φυλλόγραμμα (Steam & Leaf Plot) (2)
 Παράδειγμα (συνέχεια):

Ηλικία
Συμβολισμός: 1|8 = 18
1 8899999

2 00112234579
3 000223348
4 03479
5 1468
Το γράφημα αυτό μας δίνει τη δυνατότητα
να δούμε ταυτόχρονα το σχήμα των
δεδομένων και τις τιμές τους.

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


58 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Φυλλόγραμμα στη MINITAB (1)
 Ακολουθούμε αντίστοιχη διαδικασία με το ιστόγραμμα
επιλέγουμε “Stem-and-Leaf και εισάγουμε τη μεταβλητή (εδώ
την “Age”)

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


59 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Φυλλόγραμμα στη MINITAB (2)

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


60 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διάγραμμα Πίτας (1)
 Ένα διάγραμμα πίτας είναι ένας κύκλος που
χωρίζεται σε τομείς που αντιπροσωπεύουν τις
κλάσεις (κατηγορίες) της μεταβλητής.
 Η έκταση κάθε τομέα είναι ανάλογη με τη
συχνότητα (απόλυτη ή σχετική) της κάθε
κατηγορίας.
 Παράδειγμα:
Για προηγούμενο παράδειγμα με τον αριθμό των
υπνοδωματίων (1-5), το αντίστοιχο διάγραμμα πίτας
δίνεται πιο κάτω

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


61 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διάγραμμα Πίτας (2)
 Παράδειγμα (συνέχεια):
Αριθμός Σχετική Συχνότητά
Συχνότητα (fi)
Υπνοδωματίων (fi)
1 1 3,1%
2 9 28,1%
3 15 46,9%
4 5 15,6%
5 2 6,3%

Διάγραμμα Πίτας (συχνοτήτων)

2 1
5
9

15

1 2 3 4 5

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


62 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διάγραμμα Πίτας (3)
 Παράδειγμα (συνέχεια):
Διάγραμμα πίτας με σχετικές συχνότητες
Διάγραμμα Πίτας

3,1%

6,3%

15,6%
28,1%

46,9%

1 2 3 4 5

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


63 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διάγραμμα Πίτας στη MINITAB (1)
 Επιλέγουμε “Pie Chart”,εισάγουμε τη μεταβλητή (εδώ
την “Credit cards”) και από την επιλογή “Labels”
επιλέγουμε: “Percent”

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


64 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διάγραμμα Πίτας στη MINITAB (2)
Pie Chart of Credit cards
Category
1
3,3% 6,7% 2
10,0% 3
4
5
6

13,3%

43,3%

23,3%

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


65 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Θηκόγραμμα (1)
 Τα θηκογράμματα (Box Plot) χρησιμοποιούνται για την
απεικόνιση της μεταβλητότητας κατανομών
 Κάθε κατανομή αντιπροσωπεύεται με ένα ορθογώνιο
παραλληλόγραμμο του οποίου το μήκος ισούται με το
ενδοτεταρτημοριακό πλάτος των παρατηρούμενων τιμών δηλ. η
κάτω βάση του ορθογωνίου βρίσκεται στο Q1 και η πάνω στο Q3
 Στις βάσεις του ορθογωνίου τοποθετούνται δύο ευθύγραμμα
τμήματα (ουρές) που εκτείνονται μέχρι τη μέγιστη και ελάχιστη
παρατηρούμενη τιμή της κατανομής.
 Επιπλέον σημειώνεται και η διάμεσος (αναπαριστάνεται με ένα
οριζόντιο ευθύγραμμο τμήμα μέσα στο ορθογώνιο.)
 Οι παρατηρήσεις που βρίσκονται έξω από το ορθογώνιο
χαρακτηρίζονται σαν παράτυπα σημεία (outliers) ή σαν ακραίες
τιμές (extreme values)
 Γενικά θεωρούνται σαν παράτυπα σημεία τιμές που απέχουν από τις
βάσεις του ορθογωνίου πάνω από 1,5 μήκη του ορθογωνίου, και
σαν ακραίες τιμές εκείνες που απέχουν πάνω από 3 μήκη του
ορθογωνίου

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


66 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Θηκόγραμμα (2)
 Το θηκόγραμμα προσφέρεται ιδιαιτέρως για την ανίχνευση
ακραίων τιμών
 Για την αναγνώριση της συμμετρίας ή του είδους της
ασυμμετρίας της κατανομής. Αν το ευθύγραμμο τμήμα που
αναπαριστά τη διάμεσο βρίσκεται :
 στο μέσο του ορθογωνίου, η κατανομή είναι συμμετρική,
 αν βρίσκεται προς την κάτω πλευρά του ορθογωνίου, η
κατανομή παρουσιάζει θετική ασυμμετρία ,
 αν βρίσκεται προς την πάνω πλευρά του ορθογωνίου, η
κατανομή παρουσιάζει αρνητική ασυμμετρία.
 Τα θηκογράμματα είναι εξαιρετικά χρήσιμα για τη σύγκριση
των κατανομών δύο ή περισσοτέρων δειγμάτων (σχετικό
παράδειγμα στη συνέχεια).
 Σημειώνουμε, τέλος, ότι το θηκόγραμμα μπορεί να
σχεδιασθεί και οριζόντια αντί για κατακόρυφα
ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ
67 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Θηκόγραμμα (3)

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


68 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Θηκόγραμμα (4)
Παράδειγμα: Ένας ερευνητής μελετά την παχυσαρκία
σε κορίτσια στην εφηβεία. Ο ερευνητής συλλέγει το
δείκτης μάζας σώματος (BMI) και το ποσοστό
σωματικού λίπους των 92 κοριτσιών.
BMI % Λίπους
19,3083 23,9
22,9642 28,8
27,79 32,4
20,9174 25,8
20,3784 22,5
20,3862 22,1
19,6575 19,6
20,2983 25,3
20,6038 22,8
20,3064 26,4
21,2133 33,7
22,1067 27,9
28,6048 33,5
… …

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


69 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Θηκόγραμμα (5)
 Διαδικασία στη Minitab

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


70 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Θηκόγραμμα (6)

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


71 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Θηκόγραμμα (7)
Παράδειγμα (συνέχεια):

Boxplot of BMI
35

30

25
BMI

20

15

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


72 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Θηκόγραμμα (8)
Παράδειγμα (συνέχεια):

Boxplot of %Fat
50

45

40

35
%Fat

30

25

20

15

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


73 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διαγράμματα Διασποράς (1)
 Το διάγραμμα διασποράς και αποτελεί μια
γραφική απεικόνιση του τρόπου συσχέτισης
μεταξύ ποσοτικών μεταβλητών, περιγράφοντας
τη δυσδιάστατη κατανομή τους.
 Αναπαραστήσουμε δηλαδή τα ζεύγη των
παρατηρήσεων σε ένα διάγραμμα, δηλ. κάθε
σημείο απεικονίζει ένα ζεύγος παρατηρήσεων των
δύο μεταβλητών.
 Με το διάγραμμα διασποράς εντοπίζονται εύκολα:
 σχέσεις μεταξύ των μεταβλητών

 ακραίες τιμές.

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


74 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διαγράμματα Διασποράς (2)
Παράδειγμα: Ένας ερευνητής μελετά την παχυσαρκία
σε κορίτσια στην εφηβεία. Ο ερευνητής συλλέγει το
δείκτης μάζας σώματος (BMI) και το ποσοστό
σωματικού λίπους των 92 κοριτσιών.
BMI % Λίπους
19,3083 23,9
22,9642 28,8
27,79 32,4
20,9174 25,8
20,3784 22,5
20,3862 22,1
19,6575 19,6
20,2983 25,3
20,6038 22,8
20,3064 26,4
21,2133 33,7
22,1067 27,9
28,6048 33,5
… …

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


75 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διαγράμματα Διασποράς (3)
Διάγραμμα Διασποράς
50

45

40

35

30
ΒΜΙ

25

20

15

10

0
0 5 10 15 20 25 30 35 40
% Λίπους

 Στο παραπάνω διάγραμμα διασποράς:


 Δε διακρίνουμε ακραίες τιμές
 Αυξανομένου του % λίπους αυξάνεται και ο δείκτης ΒΜΙ
 Η σχέση των δύο μεταβλητών είναι γραμμική
ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ
76 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διαγράμματα Διασποράς στη MINITAB (1)

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


77 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διαγράμματα Διασποράς στη MINITAB (2)

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


78 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
Διαγράμματα Διασποράς στη MINITAB (3)
Scatterplot of BMI vs %Fat
35

30

25
BMI

20

15

15 20 25 30 35 40 45 50
%Fat

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


79 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ
 Στην ιστοσελίδα της MINITAB μπορείτε να βρείτε
περισσότερα σύνολα δεδομένων για εξάσκηση
http://support.minitab.com/en-us/datasets/

ΙΝΕΠ: ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ


80 ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ

You might also like