Professional Documents
Culture Documents
Μέτρα Θέσης
Τα πιο συνηθισμένα μέτρα που χρησιμοποιούνται για την περιγραφή της θέσης ενός συνόλου δεδομένων πάνω στον
οριζόντιο άξονα Οχ, εκφράζοντας την “κατά μέσο όρο” απόστασή τους από την αρχή των αξόνων, είναι ο αριθμητικός
μέσος ή μέση τιμή (arithmetic mean or average) και η διάμεσος (median).
α) Μέση Τιμή ( x )
Η μέση τιμή ενός συνόλου ν παρατηρήσεων ορίζεται ως το άθροισμα των παρατηρήσεων διά του πλήθους των
παρατηρήσεων.
Όταν σε ένα δείγμα μεγέθους ν οι παρατηρήσεις μιας μεταβλητής Χ είναι t1, t 2 ,..., t v , τότε η μέση τιμή συμβολίζεται
με x και δίνεται από τη σχέση:
t + t + ... + t ν
∑t i
1
ν
x= 1 2
ν
= i =1
ν
=
ν ∑t
i =1
i
ν
όπου το σύμβολο ∑t
i =1
i παριστάνει μια συντομογραφία του αθροίσματος t1 + t2 + ... + t v και διαβάζεται
“άθροισμα των t i από i = 1 έως ν”. Συχνά, όταν δεν υπάρχει πρόβλημα σύγχυσης, συμβολίζεται και ως ∑t i .
Παράδειγμα 1: Έστω ότι έχουμε τις παρακάτω 8 παρατηρήσεις : 2, 5, 7, 1, 0, 3, 4, 1018. Τότε η μέση τιμή θα
2 + 5 + 7 + 1 + 0 + 3 + 4 + 14 36
είναι: x = = = 4,5
8 8
Προσέξτε ότι η μέση τιμή ΔΕΝ είναι υποχρεωτικά μία από τις παρατηρήσεις αλλά θα t1 + t 2 + ... + t ν
πρέπει να ανήκει στο διάστημα [tmin,tmax], όπου tmin και tmax η μικρότερη και
x =
ν
μεγαλύτερη παρατήρηση του δείγματος.
1
Σε μια κατανομή συχνοτήτων, αν x1, x 2 ,..., x κ είναι οι τιμές της μεταβλητής Χ με συχνότητες v1, v 2 ,..., v κ
αντίστοιχα, η μέση τιμή ορίζεται ισοδύναμα από τη σχέση:
x ν + x 2 ν 2 + ... + xκ νκ
∑x ν i i
1
κ
x= 1 1
ν1 + ν 2 + ... + ν κ
= i=1
κ
=
ν ∑x ν i i
∑ν i=1
i
i=1
κ κ
νi
x= ∑x
i =1
i
ν
= ∑x f
i =1
i i
Παράδειγμα 3: Έστω ότι έχουμε το παρακάτω δείγμα δοσμένο με πίνακα σχετικών συχνοτήτων:
Χi fi
1 0,2
2 0,1 x = χ 1 ⋅ f1 + x 2 ⋅ f2 + ... + x κ ⋅ fκ
3 0,4
4 0,3
Σε αυτή την περίπτωση η μέση τιμή θα είναι: x = 1 ⋅ 0,2 + 2 ⋅ 0,1 + 3 ⋅ 0,4 + 4 ⋅ 0,3 = 0,2 + 0,2 + 1,2 + 1,2 = 2,8
β) Σταθμικός Μέσος
Στις περιπτώσεις που δίνεται διαφορετική βαρύτητα (έμφαση) στις τιμές x1, x2 ,..., xν ενός συνόλου δεδομένων, τότε
αντί του αριθμητικού μέσου χρησιμοποιούμε τον σταθμισμένο αριθμητικό μέσο ή σταθμικό μέσο (weighted mean).
Εάν σε κάθε τιμή x1, x 2 ,..., x ν δώσουμε διαφορετική βαρύτητα, που εκφράζεται με τους λεγόμενους συντελεστές
στάθμισης (βαρύτητας) w1, w 2 ,..., w ν , τότε ο σταθμικός μέσος βρίσκεται από τον τύπο:
x w + x 2 w 2 + ... + x ν w ν
∑x w
i =1
i i
x= 1 1 = ν .
w1 + w 2 + ... + w ν
∑w
i =1
i
2
Παράδειγμα 5: Μας δίνονται οι παρατηρήσεις 12, 15, 18, 16 με συντελεστές στάθμισης 1, 2, 2 και 5 αντίστοιχα. Ο
12 ⋅ 1 + 15 ⋅ 2 + 18 ⋅ 2 + 16 ⋅ 5 12 + 30 + 36 + 80 158
σταθμικός μέσος είναι : x = = = = 15,8
1+ 2 + 2 + 5 10 10
γ) Διάμεσος (δ)
Οι χρόνοι (σε λεπτά) που χρειάστηκαν 9 μαθητές, για να λύσουν ένα πρόβλημα είναι: 3, 5, 5, 36, 6, 7, 4, 7, 8 με μέση
τιμή x = 9 . Παρατηρούμε όμως ότι οι οκτώ από τις εννέα παρατηρήσεις είναι μικρότερες του 9 και μία (ακραία τιμή), η
οποία επηρεάζει και τη μέση τιμή είναι, αρκετά μεγαλύτερη του 9. Αυτό σημαίνει ότι η μέση τιμή δεν ενδείκνυται ως
μέτρο θέσης (“κέντρο”) των παρατηρήσεων αυτών. Αντίθετα, ένα άλλο μέτρο θέσης που δεν επηρεάζεται από
ακραίες παρατηρήσεις είναι η διάμεσος (median), η οποία ορίζεται ως εξής:
Διάμεσος (δ) ενός δείγματος ν παρατηρήσεων οι οποίες έχουν διαταχθεί σε αύξουσα σειρά ορίζεται ως η μεσαία
παρατήρηση, όταν το ν είναι περιττός αριθμός, ή ο μέσος όρος (ημιάθροισμα) των δύο μεσαίων παρατηρήσεων όταν
το ν είναι άρτιος αριθμός.
Παράδειγμα 6: Μας δίνονται οι τιμές 2, 1, 0, 2, 2 3, 5, 2, 1 ενός δείγματος. Για να βρούμε την διάμεσο πρέπει
πρώτα να διάταξουμε σε αύξουσα σειρά τις παρατηρήσεις : 0, 1, 1, 2, 2, 2, 2, 3, 5 και επειδή το
ν +1
πλήθος είναι περιττό η διάμεσος είναι η παρατήρηση που βρίσκεται στην θέση = 5 , δηλαδή δ=2.
2
Παράδειγμα 7: Μας δίνονται οι τιμές 1, 1, 0, 2, 5, 2, 3, 5, 1, 1 ενός δείγματος. Για να βρούμε την διάμεσο πρέπει
πρώτα να διάταξουμε σε αύξουσα σειρά τις παρατηρήσεις : 0, 1, 1, 1, 1, 2, 2, 3, 5, 5 και επειδή το
πλήθος είναι άρτιο η διάμεσος είναι το ημιάθροισμα των παρατήρησεων που βρίσκονται στις θέσεις
ν ν
και + 1 , δηλαδή στις θέσεις 5 και 6 οπότε δ=1,5 .
2 2
Προσέξτε ότι στην περίπτωση που το μέγεθος του δείγματος είναι ΠΕΡΙΤΤΟ τότε η διάμεσος
είναι οπωσδήποτε ΜΙΑ από τις παρατηρήσεις, ενώ στην περίπτωση που το πλήθος είναι ΑΡΤΙΟ,
αυτό δεν είναι απαραίτητο.
Παράδειγμα 8: Δίνονται οι τιμές των 80 παρατηρήσεων ενός δείγματος με την μορφή του πίνακα (απόλυτων)
συχνοτήτων :
Χi νi
1 15
2 30
3 25
4 10
40 41
δηλαδή αναπτυγμένα το δείγμα θα ήταν 111
...
1 22
..
22
.2 33
...3 44
...4 και η διάμεσος (το μέγεθος του
15 φορ ές 30 φορ ές 25 φορ ές 10 φορ ές
tν + tν
δείγματος είναι άρτιο) θα είναι 2 2
+1 t 40 + t 41 2 + 2
δ= = = =2
2 2 2
Παράδειγμα 9: Δίνονται οι τιμές των 101 παρατηρήσεων ενός δείγματος με την μορφή του πίνακα (απόλυτων)
συχνοτήτων :
Χi νi
1 25
2 25
3 30
4 21
51
δηλαδή αναπτυγμένα το δείγμα θα ήταν 111
...
1 22
...2
3 3
...3 44
...4 και η διάμεσος (το μέγεθος του
25 φορ ές 25 φορ ές 30 φορ ές 21 φορ ές
δ = t ν +1 = t 51 = 3
δείγματος είναι περιττό) θα είναι
2
Παράδειγμα 10: Δίνονται οι τιμές των παρατηρήσεων ενός δείγματος με την μορφή του πίνακα σχετικών
συχνοτήτων :
Χi fi
1 0,3
2 0,4
3 0,2
3
4 0,1
50%
δηλαδή αναπτυγμένα το δείγμα θα ήταν 111
...
1 22
..
2 ...2 33
...3 44
...4 ,και επειδή Θελουμε την παρατήρηση
30% 40% 20% 10%
που έχει τιμή μικρότερη από το 50% των παρατηρήσεων και μεγαλύτερη από το 50% των παρατηρήσεων, οπότε
δ=2
Παρατηρούμε ότι, η διάμεσος είναι η τιμή που χωρίζει ένα σύνολο παρατηρήσεων σε δύο ίσα μέρη όταν οι
παρατηρήσεις αυτές τοποθετηθούν με σειρά τάξης μεγέθους. Ακριβέστερα, η διάμεσος είναι η τιμή για την οποία το
πολύ 50% των παρατηρήσεων είναι μικρότερες από αυτήν και το πολύ 50% των παρατηρήσεων είναι μεγαλύτερες
από την τιμή αυτήν.
Fi (%)
50
δ−8 50 − 36 δ − 8 14 40
έχουμε = ⇔ = ⇔ δ = 9,55 30
12 − 8 72 − 36 4 36 20
10
0
0-4 4 -8 8 -12 1 2-1 6 16 -20
Μέτρα Διασποράς
Στα προηγούμενα είδαμε ότι τα μέτρα θέσης παρέχουν κάποια πληροφορία για την κατανομή ενός πληθυσμού. Αυτά
όμως δεν επαρκούν, για να περιγράψουν πλήρως την κατανομή. Παράλληλα λοιπόν με τα μέτρα θέσης κρίνεται
απαραίτητη και η εξέταση κάποιων μέτρων διασποράς ή μεταβλητότητας, δηλαδή μέτρων που εκφράζουν τις
αποκλίσεις των τιμών μιας μεταβλητής γύρω από τα μέτρα κεντρικής τάσης. Τέτοια μέτρα λέγονται μέτρα διασποράς
(measures of variation, dispersion measures). Τα σπουδαιότερα μέτρα διασποράς είναι το εύρος, η διακύμανση και η
τυπική απόκλιση.
α) Εύρος (R)
Το απλούστερο από τα μέτρα διασποράς είναι το εύρος ή κύμανση (range) (R), που ορίζεται ως η διαφορά της
ελάχιστης παρατήρησης από τη μέγιστη παρατήρηση, δηλαδή:
Όταν έχουμε ομαδοποιημένα δεδομένα, το εύρος δίνεται από τη διαφορά του κατώτερου ορίου της πρώτης κλάσης
από το ανώτερο όριο της τελευταίας κλάσης. Το εύρος είναι ένα αρκετά απλό μέτρο, που υπολογίζεται εύκολα δε
θεωρείται όμως αξιόπιστο μέτρο διασποράς, γιατί βασίζεται μόνο στις δυο ακραίες παρατηρήσεις.
γ) Διακύμανση (s2)
(απόδειξη της πρότασης : Η μέση τιμή των διαφορών της μέσης τιμής από κάθε παρατήρηρη είναι 0)
4
Ένας άλλος τρόπος για να υπολογίσουμε τη διασπορά των παρατηρήσεων t1 , t 2 ,..., t v μιας μεταβλητής Χ θα ήταν να
αφαιρέσουμε τη μέση τιμή x από κάθε παρατήρηση και να βρούμε τον αριθμητικό μέσο των διαφορών αυτών, δηλαδή
v
(t 1 − x) + (t 2 − x) + ... + (t v − x) i=1
(t i − x)
.∑
=
v v
Ο αριθμός όμως αυτός είναι ίσος με μηδέν, αφού
(t 1 − x) + (t 2 − x) + ... + (t v − x) t 1 + t 2 + ... + t v vx
= − = x−x = 0.
v v v
Γι’αυτό, ως ένα μέτρο διασποράς παίρνουμε τον μέσο όρο των τετραγώνων των αποκλίσεων των t i από τη μέση
τιμή τους x . Το μέτρο αυτό καλείται διακύμανση ή διασπορά (variance) και ορίζεται από τη σχέση:
1
ν
( t1 − x ) 2 + ( t2 − x ) 2 ... + (t ν − x)2
s2 =
ν ∑
i=1
(t i − x)2 =
ν
Ο τύπος αυτός αποδεικνύεται ότι μπορεί να πάρει την ισοδύναμη μορφή:
Παράδειγμα 12: Δίνονται οι τιμές 6, 8, 4, 0, 1, 3, 1, 1 ενός δείγματος. Η μέση τιμή είναι
6 + 8 + 4 + 0 + 1 + 3 + 1 + 1 24
x= = = 3 , οπότε η διακύμναση θα είναι
8 8
(6 − 3)2 + ( 8 − 3 ) 2 + ( 4 − 3) 2 + ( 0 − 3) 2 + (1 − 3) 2 + ( 3 − 3) 2 + (1 − 3) 2 + (1 − 3) 2 9 + 25 + 1 + 9 + 4 + 0 + 4 + 4 56
s2 = = = =7
8 8 8
Ο τύπος αυτός αποδεικνύεται ότι μπορεί να πάρει την ισοδύναμη μορφή:
ν
2 ν
2
ν 2
1
ν
ti
∑
1
ν
∑ ti
1
ν
∑t i
1
ν
s2 = t 2i − i=1
∑ = ∑ t 2i − i=1 2 = ∑ 2
t i − i =1
= ∑t 2
i −χ 2
ν i=1 ν ν i=1 ν ν i =1 ν ν i =1
η οποία διευκολύνει σημαντικά τους υπολογισμούς κυρίως όταν η μέση τιμή x δεν είναι ακέραιος αριθμός.
Παράδειγμα 13: Δίνονται οι τιμές 3, 2, 4, 0, 1, 3ενός δείγματος. Η μέση τιμή είναι
3 + 2 + 4 + 0 + 1 + 3 13
x= = = 2,167 , οπότε η διακύμναση θα είναι:
6 6
∑t 2
i = 9 + 4 + 16 + 0 + 1 + 9 = 39 , ∑t i = 3 + 2 + 4 + 0 + 1 + 3 = 13 , ν=6 και από τον παραπάνω τύπο θα έχουμε:
ν
2
1
ν
∑
i=1
ti
1 13 2 1 169 1 234 −169 65
s2 = ∑
ν i=1
2
ti −
ν
=
6
39 − 6 = 6
39 −
6
=
6 6
=
36
= 1,805
Όταν έχουμε πίνακα συχνοτήτων ή ομαδοποιημένα δεδομένα, η διακύμανση ορίζεται από τη σχέση:
1
κ
( χ1 − χ ) 2 ⋅ ν 1 + ( χ 2 − χ ) 2 ⋅ ν 2 + ... + ( χ κ − χ ) 2 ⋅ ν κ
s = 2
ν ∑
i =1
(x i − x)2 ν i =
ν
Παράδειγμα 14: Έστω ότι έχουμε το παρακάτω δείγμα δοσμένο με πίνακα (απόλυτων) συχνοτήτων:
Χi νi
1 8 1
κ
( χ − χ ) 2 ⋅ ν 1 + ( χ 2 − χ ) 2 ⋅ ν 2 + ... + ( χ κ − χ ) 2 ⋅ ν κ
2 6
2
s = (x i − x)2 ν i = 1
ν ∑
i =1
ν
5
3 4
4 2
1
κ
∑ xiv i
1
κ ∑
xiv i
1
κ
∑ x iv i
1
κ
s2 = ∑ x 2i v i − i=1
= ∑ χ 2i ⋅ ν i − i=1 2 = ∑ χ 2i ⋅ ν i − i =1
= ∑χ 2
i ⋅ ν i −x 2
v i=1 v ν i=1 v ν i =1 v ν i =1
κ
2 κ
2
κ
2
1
κ
∑ xiv i
1
κ
∑ xiv i
1
κ
∑ x iv i
1
κ
s2 = ∑ x 2i v i − i=1
= ∑ χ 2i ⋅ ν i − i=1 2 = ∑ 2
χ i ⋅ ν i − i =1
= ∑χ 2
i ⋅ ν i −x 2
v i=1 v ν i=1 v ν i =1 v2 ν i =1
όπου x1, x 2 ,..., x κ οι τιμές της μεταβλητής (ή τα κέντρα των κλάσεων) με αντίστοιχες συχνότητες ν1, ν 2 ,..., ν κ .
Παράδειγμα 15: Δίνονται οι παρακάτω ομαδοποιημένες παρατηρήσεις
Κλάσεις Χi νi Χiνi Χi 2νi
[0,4) 2 8 16 32 Συμπληρώνουμε στον πίνακα συχνοτήτων
[4,8) 6 10 60 360 δύο στήλες με τα γινόμενα Χiνi και Χi 2νi
[8,12) 10 12 120 1200
[12,16) 14 14 196 2744 2
κ
[16,20) 18 6 108 1944 x i ⋅ ν1
∑
∑ ∑
κ
x 2i ⋅ ν i =6280 1
x2 ⋅ ν −
∑
ν=50 x i ⋅ ν i =500 i =1
s2 = i i
ν i =1
ν
1 2
2
οπότε η διακύμναση είναι : s = 6280 − 500 = 6280 − 250000 = 628 − 100 = 128 = 25,6
50 50 50 2500 5 5
s= s2
Παραδείγματα
1. Απλές παρατηρήσεις
Να βρείτε την μέση τιμή, τη διάμεσο, τη διακύμανση και την τυπική απόκλιση των παρακάτω δειγμάτων:
ΔΕΙΓΜΑ Α : 3, 5, 8, 1, 3, 2, 6
ΔΕΙΓΜΑ Β : 1, 0, 4, 2, 1, 1, 5, 7
2. Παρατηρήσεις δοσμένες με πίνακα (απόλυτων) συχνοτήτων (χi – νi)
Να βρείτε την μέση τιμή, τη διάμεσο, τη διακύμανση και την τυπική απόκλιση του παρακάτω δείγματος:
Χi νi
6
2 10
4 12
6 13
8 10
ΤΥΠΟΛΟΓΙΟ
1. Απλές παρατηρήσεις
t + t + ... + t ν 1
ν
( t1 − x ) 2 + ( t2 − x ) 2 ... + (t ν − x)2
x= 1 2
ν
s2 =
ν ∑
i=1
(t i − x)2 =
ν
ν
2
1
ν
∑ti
1
ν
ή s2 = t 2i − i =1
∑ = ∑t 2
i −χ 2
ν i =1 ν ν i=1
2. Παρατηρήσεις δοσμένες με πίνακα συχνοτήτων ή ομαδοποιημένα δεδομένα
χ1⋅ ν 1 + χ 2 ⋅ ν 2 + ... + χ κ ⋅ ν κ
x=
ν 1 + ν 2 + ... + ν κ
1
κ
( χ1 − χ ) 2 ⋅ ν 1 + ( χ 2 − χ ) 2 ⋅ ν 2 + ... + ( χ κ − χ ) 2 ⋅ ν κ
s2 =
ν ∑
i =1
(x i − x)2 ν i =
ν
κ κ κ
1 νi
x = χ 1 ⋅ f1 + x 2 ⋅ f2 + ... + x κ ⋅ fκ s2 =
ν ∑
i=1
( x i − x)2 ν i = ∑i=1
(x i − x)2
ν
= ∑(x
i =1
i − x)2 fi
7
κ
2
∑
κεντρική τιμή
x iv i
↑
1
κ κ
1
χ1 ⋅ ν 1 + χ 2 ⋅ ν 2 + ... + χ κ ⋅ ν κ ή s
2
= x 2i v i − i=1
∑
= ∑χ 2
⋅ ν i −x 2
x= v i=1 v ν i =1
i
ν 1 + ν 2 + ... + ν κ
κ
2 κ
2
κ 2
1
κ
∑ x iv i
1
κ ∑
x iv i
κ
ν
∑x ν i ι
κ κ
2
s2 = ∑ x 2i v i − i=1
= ∑ χ 2i ⋅ ν i − i=1 2 = ∑ 2
χi ⋅ i
− i=1
= ∑χ 2
⋅ fi − ∑ x i fi
v i =1 v
i
ν i =1 v i=1
ν v i=1 i=1
8
ΑΣΚΗΣΕΙΣ
1. Ημερήσια επαναληπτικές 2008
9
3. Ημερήσια επαναληπτικές 2009
10
4. Ημερήσια 2006 (λείπει το (δ) ερώτημα – πιθανότητες)
11