You are on page 1of 21

Επικρατούσα τιμή.

• Σε περιπτώσεις, που διαφορετικές τιμές μιας


μεταβλητής επαναλαμβάνονται περισσότερο από
μια φορά, η επικρατούσα τιμή είναι η συχνότερη
τιμή στα δεδομένα.
– Για παράδειγμα στα δεδομένα 7, 7, 7, 8, 8, 8,
8, 10, 10, 10, 10, 10, 12, 12, 13 επικρατούσα
τιμή είναι η 10.
Επικρατούσα τιμή.

• Όταν όλες οι τιμές έχουν την ίδια συχνότητα, δεν


υπάρχει επικρατούσα τιμή .
• Αν 2 γειτονικές τιμές έχουν την ίδια συχνότητα,
που συγχρόνως είναι η μεγαλύτερη απ' όλες, τότε
παίρνουμε ως επικρατούσα τιμή το ημιάθροισμα
των δύο τιμών.
• Στην περίπτωση μιας δικόρυφης κατανομής
υπάρχουν δυο επικρατέστερες τιμές και είναι οι
τιμές που βρίσκονται κάτω από τις δύο κορυφές
της κατανομής.
Σύγκριση μέσου, διαμέσου και επικρατούσης τιμής.

• Στο μέσο όρο, όλες οι τιμές συμμετέχουν κατά


τον υπολογισμό του και είναι καθαρό μέτρο
κεντρικής τάσης.
• Η διάμεσος στηρίζεται στη σειρά των τιμών.
Όπως είδαμε, αν οι τιμές διαταχθούν, διάμεσος
είναι η κεντρική τιμή.
• Η επικρατούσα δεν εξαρτάται από το μέγεθος
των τιμών, ούτε από τη σειρά τους, αλλά από τη
συχνότητά τους.
Σύγκριση μέσου, διαμέσου και
επικρατούσης τιμής.

• Μπορούμε να συγκρίνουμε τα τρία μέτρα, τοποθετώντας


τους στη γραφική παράσταση της κατανομής συχνοτήτων
μιας μεταβλητής. Ο μέσος είναι το κέντρο βάρους της
κατανομής. Η κάθετη ευθεία στον άξονα των τιμών, στο
σημείο που βρίσκεται η διάμεσος, χωρίζει το εμβαδόν
που ορίζει η κατανομή σε 2 ίσα μέρη. Η επικρατούσα
είναι η τιμή που αντιστοιχεί στο ψηλότερο σημείο της
καμπύλης.
Μορφές της κατανομής συχνοτήτων ποσοτικών μεταβλητών
και σχετικές θέσεις των μέτρων κεντρικής θέσης

(α) (β) (γ)

Μέση τιμή Επικρατέστερη Μέση τιμή


Διάμεσος Διάμεσος Διάμεσος
Επικρατέστερη

(δ)

Επικρατέστερη Επικρατέστερη
Διάμεσος
Μέση τιμή
Στο ερώτημα, ποιο μέτρο χρησιμοποιείται
συνήθως, η απάντηση εξαρτάται από:

1. Τον τύπο των δεδομένων

2. Από τη μορφή της κατανομής των τιμών

• H κατανομή εμφανίζει μεγάλη ασυμμετρία

υπάρχουν ιδιαίτερα ακραίες τιμές (α)

• Κάποια υποκείμενα παίρνουν απροσδιόριστες τιμές (β)

• Η κατανομή είναι ανοικτών ορίων (γ)


Ποιο μέτρο κεντρικής θέσης είναι κατάλληλο;
Κατηγορικά δεδομένα

Τρόπος μεταφοράς στο Πανεπιστήμιο


80
60
40
20
0
ά ς ζή σ ο
ε
ορ Π μέ
ταφ τικ
ό
ε
ς μ
δ ιω
ζι κή ει
α Μ
μ
ο
έσ
Μ
Ποιο μέτρο κεντρικής θέσης είναι κατάλληλο;
Ασυμμετρία ή/και παρουσία ακραίων τιμών

6
5 Διάμεσος
4
3 Μέση τιμή
2
1
0
2 3 4 5 6 7 8 9 50
Σχήμα 4.2 Κατανομή συχνοτήτων οικογενειακού
εισοδήματος
Ποιο μέτρο κεντρικής θέσης είναι κατάλληλο;
Κάποια υποκείμενα παίρνουν απροσδιόριστες τιμές

μαθητής Χρόνος (min) Χρόνος που χρειάστηκε ο


μαθητής για να
1 7
ολοκληρώσει ένα έργο
2 10 στα πλαίσια με 45λεπτης
διδακτικής ώρας
3 14
4 15
5 Δεν τέλειωσε
Ποιο μέτρο κεντρικής θέσης είναι κατάλληλο;
Η κατανομή είναι ανοικτών ορίων
Κατανομή του αριθμού
παιδιών σε ένα σύνολο
Αριθμός f 24 οικογενειών
παιδιών
0 4
1 8
2 7
3 3
4 και άνω 2
Μέτρα διασποράς: έννοια της μεταβλητότητας

Είναι φανερή η διαφορά διακύμανσης στις τρεις παρακάτω ομάδες δεδομένων Α, Β


και Γ
παρά το ότι έχουν την ίδια μέση τιμή X =17.

Α : 14, 16, 17, 18, 20


Β : 1, 5, 14, 25, 40
Γ : 17, 17, 17, 17, 17
Μέτρα διασποράς

• Το εύρος (L) μιας ομάδας δεδομένων, ορίζεται ως


διαφορά της μικρότερης από τη μεγαλύτερη τιμή.
Από τον πίνακα 2.2, για τις τιμές WPPSI έχουμε L = 25 - 2
= 23.
• Tο εύρος του 50% των μεσαίων τιμών, ονομάζεται
ενδοτεταρτημοριακό εύρος (ΕΤΕ).

ΕΤΕ = Q3 – Q1 όπου :
Q1 το 1Ο τεταρτημόριο, δηλ το 25% των περιπτώσεων
έχουν τιμή ≤ Q1
Q3 το 3Ο τεταρτημόριο δηλ το 75% των περιπτώσεων
έχουν τιμή ≤ Q3
Μέτρα διασποράς :Υπολογισμός ΕΤΕ σε Ομαδοποιημένη Κατανομή
Συχνοτήτων
Η Q1 βρίσκεται στο πρώτο
Κέντρο Αθροιστική
Διάστ Συχνότητα διάστημα (k), για το οποίο
διαστήμα- Συχνότητα
ημα cf > Ν/4 και υπολογίζουμε:
τος Απόλυτη Σχετική Απόλυτη Σχετική
N
2– 4 3 1 1,7 1 1,7  cf k 1
5– 7 6 9 15,0 10 16,7 Q1  Lk  4 h
8 – 10 9 19 31,7 29 48,4 fk
11 – 13 12 11 18,3 40 66,7 Η Q3 βρίσκεται στο πρώτο
14 – 16 15 6 10,0 46 76,7 διάστημα (k), για το οποίο
17 – 19 18 7 12,6 53 88,3 cf > 3Ν/4 και υπολογίζουμε:
20 – 22 21 5 8,3 58 96,6 3N
 cf k 1
23 – 25 24 2 3,4 60 101,0
Q 3  Lk  4 h
Σύνολο 60 101,0 fk
60 4  10 (3  60) 4  40   Q3  Q1
Q1  7 ,5  3 Q 3  13,5  3
19 6  16  8,29
 7 ,5  0,79  13,5  2,5
 7,71
 8,29  16
Μέτρα διασποράς: Διακύμανση και τυπική απόκλιση

• Έστω για παράδειγμα οι τιμές από κάποια μέτρηση :


8, 13, 18, 24, 27, 30.
Αν θέλουμε τη μεταβλητότητα των τιμών της ομάδας,
γύρω από τη μέση τιμή τους που είναι 20, μπορούμε να
σχηματίσουμε τις αποκλίσεις xi από τη μέση τιμή :
di  X i  X
-12, -7, -2, +4, +7, +10.
Η συνολική μεταβλητότητα μπορεί να εκφραστεί ως
άθροισμα των αποκλίσεων: 
d
i 1
i

 i 1 d i
N
και η μέση απόκλιση μια τιμής:

Μέτρα διασποράς :Διακύμανση και τυπική απόκλιση

Όμως η τιμή είναι
i 1
d πάντα ίση με 0 π.χ:
i

( 12)  (  7)  (  2)  4  7  10 0
 0
6 6
Το πρόβλημα μπορεί να διορθωθεί αν χρησιμοποιηθούν οι απόλυτες τιμές
των αποκλίσεων ως μέτρο μεταβλητότητας

 di Μέση απόλυτη απόκλιση


|  12 |  |  7 |  |  2 |  | 4 |  | 7 |  | 10 |
7
6
Μέτρα διασποράς: Διακύμανση και τυπική
απόκλιση
Διακύμανση της Χ σε Τυπική απόκλιση της Χ σε
πληθυσμό πληθυσμό
n

  
2
n
 ( X i  ) 2
  2  i 1
i

2  i =1
, n
n

X i  Οι τιμές της μεταβλητής


  Η μέση τιμή του πληθυσμού
n  Τo μέγεθος του πληθυσμού
2 2 2 2 2 2
(12) (7) (2) (4 ) (7) (10) 362
 
2
  60,3
6 6
Μέτρα διασποράς :Διακύμανση και τυπική απόκλιση

• Διακύμανση και τυπική απόκλιση δείγματος

N
 X
N
 ( Xi 2 2
 X) i
S2  i =1
, S  S2  i 1
N 1 N 1
X i  Οι τιμές της μεταβλητής
X  Η μέση τιμή του δείγματος
N  Τo μέγεθος του δείγματος
Μέτρα διασποράς: Υπολογιστικοί τύποι για
διακύμανση
2
N
 N

  i 
2
X i  X N
Από απλό πίνακα τιμών:
S 2  i 1  i 1 
N 1
2

 
K
 K 
X k  fk     X k  fk  
Από πίνακα κατανομής 2
συχνοτήτων:
N
S2  k 1  k 1 
N 1
Από πίνακα ομαδοποιημένης στη θέση των τιμών Χκ στον παραπάνω τύπο
κατανομής συχνοτήτων: τοποθετούνται τα κέντρα των διαστημάτων

Για την τυπική απόκλιση S


ισχύει: S  S2
Μέτρα διασποράς :
Υπολογισμός τυπικής απόκλισης στην περίπτωση
ομαδοποιημένης κατανομής για την υποκλίμακα WPPSI
Διάστη Κέντρο Συχν/τα 2 2
μα Xk Xk fk Xk Xk fk 2

X 
fk K
 K 
τιμών
 fk     X k  fk  
2
k N
2 - 4 3 1 3 9 9 S2  k 1  k 1 
5 - 7 6 9 54 36 324 N 1
8 - 10 9 19 171 81 1539 K

11 - 13 12 11 132 144 1584 ( X k  fk )


729
14 - 16 15 6 90 225 1350 Χ  k 1   12,15
17 - 19 18 7 126 324 2268
N 60
20 - 22 21 5 105 441 2205
23 - 25 24 2 48 576 1152 10431 7292 60 1573,65
S 
2
  26,67
Σύνολα 60 729 10431 60 1 59
K K
S  S 2  26,67  5,16
   fk ( Xk  fk )
K 2

k 1
( X
k 1
k  fk )
k 1
Μέτρα διασποράς: Συντελεστής μεταβλητότητας

• Για να συγκριθούν δυο χαρακτηριστικά που μετρώνται με


διαφορετικές κλίμακες ή με διαφορετικές μονάδες μέτρησης
(πχ. βάρος(kgr) με ύψος(cm) σε ένα πληθυσμό) δεν μπορεί
να χρησιμοποιηθεί κανένα από τα προηγούμενα μέτρα
μεταβλητότητας που παρουσιάστηκαν
• Μια ικανοποιητική προσέγγιση είναι ο συντελεστής
μεταβλητότητας:

S
CV  100
X
Μέτρα διασποράς: Οι παράγοντες που επιδρούν στη
μεταβλητότητα των τιμών και καθορίζουν την επιλογή του
μέτρου διασποράς

• Ακραίες τιμές και έντονη ασυμμετρία


Επιδρούν στο εύρος, διακύμανση και τυπική απόκλιση
• Το μέγεθος του δείγματος
Επιδρά στο εύρος
• Σταθερότητα της δειγματοληψίας.
Όταν σχηματίζονται μερικά δείγματα από τον ίδιο
πληθυσμό τότε αναμένεται μια ομοιότητα μεταξύ αυτών
των δειγμάτων. Στο εύρος δεν υπάρχει αυτή η σταθερότητα
• Κατανομή ανοικτών ορίων. Όταν η μεγαλύτερη ή η
μικρότερη τιμή μια κατανομής δεν είναι σαφώς ορισμένες
τότε έχουμε μια κατανομή ανοικτών ορίων.
Μόνο το ενδοτεταρημοριακό εύρος υπολογίζεται

You might also like