You are on page 1of 33

Περιγραφή, διερεύνηση και

σύγκριση δεδομένων
Μέτρα του κέντρου
Μέτρα της μεταβλητότητας
Μέτρα σχετικής θέσης και θηκογράμματα

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Βασική έννοια

Η μεταβλητότητα είναι από τα πιο σημαντικά θέματα στη


στατιστική.

Τρία σημαντικά μέτρα της μεταβλητότητας: εύρος, τυπική


απόκλιση και διασπορά.
Αυτοί οι στατιστική όροι είναι αριθμοί, αλλά ο στόχος μας
δεν είναι μόνο να υπολογίσουμε αυτούς τους αριθμούς
αλλά να αναπτύξουμε την ικανότητα να τους καταλάβουμε
και να τους ερμηνεύσουμε.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Εύρος

❖Εύρος
Το εύρος ενός συνόλου τιμών των δεδομένων
είναι η διαφορά μεταξύ της μέγιστης τιμής και
της ελάχιστης τιμής των δεδομένων.

Εύρος = (μέγιστη τιμή των δεδομένων)


– (ελάχιστη τιμή των δεδομένων)

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Σημαντικές ιδιότητες του εύρους

❖Το εύρος χρησιμοποιεί μόνο τις μέγιστες και τις


ελάχιστες τιμές των δεδομένων, οπότε είναι πολύ
ευαίσθητο στις ακραίες τιμές. Το εύρος δεν είναι
ανθεκτικό.
❖Επειδή το εύρος χρησιμοποιεί μόνο τις μέγιστες
και τις ελάχιστες τιμές, δεν λαμβάνει υπόψη όλες
τις τιμές και επομένως δεν αντικατοπτρίζει
πραγματικά τη μεταβλητότητα μεταξύ όλων
τιμών των δεδομένων.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
ΠΑΡΑΔΕΙΓΜΑ 1 Εύρος

Βρείτε το εύρος των πρώτων πέντε τιμών των σφυγμών σε


άνδρες : 84, 74, 50, 60, 52 (όλα σε bpm).

ΛΥΣΗ
Εύρος = (μέγιστη τιμή) – (ελάχιστη τιμή)
= 84 – 50 = 34,0 bpm

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Τυπική απόκλιση ενός δείγματος

❖Τυπική απόκλιση
Η τυπική απόκλιση ενός συνόλου τιμών δείγματος,
που συμβολίζεται με το s, είναι ένα μέτρο που δείχνει
πόσο αποκλίνουν οι τιμές των δεδομένων.

Συμβολισμός
s = δειγματική τυπική απόκλιση
𝜎 = πληθυσμιακή τυπική απόκλιση

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Τυπική απόκλιση ενός δείγματος

❖Τυπική απόκλιση

( x − x )
2

τυπική απόκλιση δείγματος


s=
n −1

n ( x ) − ( x )
2
2 συντομογραφία τύπου τυπικής
s= απόκλισης δείγματος
n ( n − 1) (χρησιμοποιείται από
αριθμομηχανές και λογισμικό)

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Σημαντικές ιδιότητες της τυπικής
απόκλισης
❖Η τυπική απόκλιση είναι ένα μέτρο του πόσο
αποκλείνουν οι τιμές από τη μέση τιμή (μέσος).
❖Η τιμή της τυπικής απόκλισης s δεν είναι ποτέ
αρνητική. Είναι μηδέν μόνο όταν όλες οι τιμές του
δείγματος είναι ακριβώς οι ίδιες.
❖Μεγαλύτερες τιμές του s δείχνουν μεγαλύτερες
τιμές μεταβλητότητας.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Σημαντικές ιδιότητες της τυπικής
απόκλισης
❖Η τυπική απόκλιση μπορεί να αυξηθεί θεαματικά με
μια ή περισσότερες ακραίες τιμές.
❖Οι μονάδες της τυπικής απόκλισης s (όπως τα
λεπτά, τα πέλματα, τα κιλά) είναι οι ίδιες με τις
μονάδες των αρχικών τιμών.
❖Η τυπική απόκλιση δείγματος s είναι ένας
μεροληπτικός εκτιμητής της τυπικής απόκλισης του
πληθυσμού σ, που σημαίνει ότι οι τιμές της τυπικής
απόκλισης s του δείγματος δεν επικεντρώνονται
γύρω από την τιμή της τυπικής απόκλισης σ του
πληθυσμού.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
ΠΑΡΑΔΕΙΓΜΑ 2 Υπολογισμός τυπικής απόκλισης

Βρείτε την τυπική απόκλιση των παρακάτω πέντε


τιμών των σφυγμών σε άνδρες : 84, 74, 50, 60, 52
(όλα σε bpm).

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
ΠΑΡΑΔΕΙΓΜΑ 3 Υπολογισμός τυπικής
απόκλισης με τον εναλλακτικό τύπο
Bρείτε την τυπική απόκλιση των πέντε τιμών
σφυγμών των ανδρών»: 84, 74, 50, 60, 52.

ΛΥΣΗ

n ( x ) − ( x )
2 2
𝟓(𝟐𝟏. 𝟑𝟑𝟔) – (𝟑𝟐𝟎)𝟐
=
s= 5 5−1
n ( n − 1)

4.280
= = 14,6 Mbps
20

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Προσεγγιστικός κανόνας εύρους για
την κατανόηση της τυπικής απόκλισης
❖Προσεγγιστικός κανόνας εύρους
Ο προσεγγιστικός κανόνας εύρους είναι ένα
αδρό αλλά απλό εργαλείο για την κατανόηση και
την ερμηνεία της τυπικής απόκλισης.
Η συντριπτική πλειοψηφία (όπως το 95%) της
δειγματοληψίας βρίσκεται εντός 2 τυπικών
αποκλίσεων του μέσου.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Προσεγγιστικός κανόνας για τον προσδιορισμό
σημαντικών τιμών του εύρους

❖Σημαντικά χαμηλές τιμές είναι μ – 2σ ή χαμηλότερες.


❖Σημαντικά υψηλές τιμές είναι μ + 2σ ή υψηλότερες.
❖Τιμές που δεν είναι σημαντικές: Μεταξύ (μ – 2σ ) και (μ + 2σ)

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Προσεγγιστικός κανόνας για την εκτίμηση
της τιμής της τυπικής απόκλισης s

❖Προσεγγιστικός κανόνας για την


εκτίμηση της τιμής της τυπικής
απόκλισης s
Για να εκτιμηθεί προσεγγιστικά η τυπική
απόκλιση από μια συλλογή γνωστών τιμών
δεδομένων:
εύρος
s≈
4

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Τυπική απόκλιση ενός πληθυσμού

❖Τυπική απόκλιση ενός πληθυσμού


Χρησιμοποιείται ένας ελαφρώς διαφορετικός
τύπος για τον υπολογισμό της τυπικής
απόκλισης σ σε ένα πληθυσμό. Αντί να
διαιρούμε με n – 1, διαιρούμε με το μέγεθος του
πληθυσμού N, όπως φαίνεται εδώ:

σ x−𝜇 2
Τυπική απόκλιση πληθυσμού 𝜎 =
N

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Διασπορά ενός δείγματος και ενός
πληθυσμού
❖Διασπορά
Η διασπορά ενός συνόλου τιμών έχει μέτρο
μεταβλητότητας ίσο με το τετράγωνο της
τυπικής απόκλισης.
• Διασπορά δείγματος: s2 = τυπική απόκλιση s
στο τετράγωνο.
• Διασπορά πληθυσμού: σ2 = τυπική απόκλιση
πληθυσμού σ στο τετράγωνο.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Συμβολισμός

s = τυπική απόκλιση δείγματος

s2 = διασπορά δείγματος

 = τυπική απόκλιση πληθυσμού

2 = διασπορά πληθυσμού

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Σημαντικές ιδιότητες της διασποράς

• Οι μονάδες της διασποράς είναι τα τετράγωνα των


μονάδων των αρχικών τιμών δεδομένων.
• Η τιμή της διασποράς μπορεί να αυξηθεί θεαματικά
με τη συμπερίληψη των ακραίων τιμών. (Η
διασπορά δεν είναι ανθεκτική).
• Η τιμή της διασποράς δεν είναι ποτέ αρνητική. Είναι
μηδέν μόνο όταν όλες οι τιμές των δεδομένων είναι
ο ίδιος αριθμός.
• Η διασπορά δείγματος s2 είναι ένας αμερόληπτος
εκτιμητής της πληθυσμιακής διασποράς σ2,.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Γιατί διαιρούμε με n – 1;
• Υπάρχουν μόνο n – 1 τιμές που μπορούν να
εκχωρηθούν χωρίς περιορισμό. Με δεδομένο
μέσο, μπορούμε να χρησιμοποιήσουμε
οποιουσδήποτε αριθμούς για τις πρώτες τιμές n
– 1, αλλά η τελευταία τιμή θα προσδιοριστεί
αυτόματα.
• Διαιρώντας με n – 1, οι διασπορές του δείγματος
s2 τείνουν να επικεντρωθούν γύρω από την τιμή
της διασποράς πληθυσμού σ2, ενώ διαιρώντας
με n, οι διασπορές του δείγματος s2 τείνουν να
υποτιμήσουν την τιμή της διασποράς του
πληθυσμού σ2.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Σύγκριση της μεταβλητότητας σε διαφορετικά
δείγματα ή πληθυσμούς
Ο συντελεστής της μεταβλητότητας (ή coefficinet of
variation, CV) για ένα σύνολο μη αρνητικών τιμών
δεδομένων δείγματος ή πληθυσμού, εκφράζεται ως σχετική
τυπική απόκλιση του μέσου και δίνεται από τα παρακάτω:
Δείγμα Πληθυσμός
𝑠 𝜎
CV = . 100% CV = . 100%
𝑥ҧ Μ

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
ΠΑΡΑΔΕΙΓΜΑ 6 Τιμές σφυγμών και ύψη
ΛΥΣΗ
Μπορούμε να συγκρίνουμε την τυπική απόκλιση εάν
χρησιμοποιούνται οι ίδιες κλίμακες και οι ίδιες μονάδες που
και οι δύο μέσοι είναι περίπου ίσοι, αλλά εδώ έχουμε
διαφορετικές κλίμακες και διαφορετικές μονάδες μέτρησης,
έτσι χρησιμοποιούμε τους συντελεστές της μεταβλητότητας:
𝑆 11,3 𝑏𝑝𝑚
Τιμές σφυγμών ανδρών: CV= . 100% = . 100% = 16,2%
𝑥ҧ 69,6 𝑏𝑝𝑚

𝑠 7,10 𝑐𝑚
Ύψος ανδρών: CV = . 100% = . 100% = 4,1%
𝑥ҧ 174,12 𝑐𝑚

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Μεροληπτικοί και αμερόληπτοι
εκτιμητές
• Η τυπική απόκλιση s δείγματος είναι ένας μεροληπτικός
εκτιμητής της τυπικής απόκλισης του πληθυσμού σ.
• Σημαίνει ότι οι τιμές της τυπικής απόκλισης του δείγματος
s δεν τείνουν να επικεντρωθούν γύρω από την τιμή της
τυπικής απόκλισης του πληθυσμού σ.
• Ενώ οι μεμονωμένες τιμές του s θα μπορούσαν να είναι
ίσες ή μεγαλύτερες από το σ, οι τιμές του s γενικά τείνουν
να υποεκτιμούν την τιμή του σ.
• Δεν υπάρχει καμία διόρθωση που να μας επιτρέπει να
άρουμε τη μεροληψία για όλες τις κατανομές δεδομένων.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Μεροληπτικοί και αμερόληπτοι εκτιμητές
Η διασπορά δείγματος s2 είναι ένας αμερόληπτος
εκτιμητής της πληθυσμιακής διασποράς σ2, που
σημαίνει ότι οι τιμές του s2 τείνουν να επικεντρωθούν
γύρω από την τιμή του σ2 αντί να τείνουν συστηματικά
να υπερεκτιμούν ή να υποεκτιμούν το σ2.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Επιλέγοντας τον κατάλληλο δείκτη
διασποράς
Μεγάλη σημασία έχουν οι ακραίες τιμές στην επιλογή του
κατάλληλου δείκτη.
Ωστόσο, πρέπει να εξετάσουμε και το επίπεδο μέτρησης που
έχουμε επιτύχει.
Έτσι, στην ιεραρχική κλίμακα μέτρησης, μεγαλύτεροι αριθμοί
δείχνουν μεγαλύτερη ποσότητα από οτιδήποτε μετριέται, αλλά
μεγαλύτερες και μικρότερες διαφορές μεταξύ των αριθμών
μπορεί να μη δείχνουν μεγαλύτερες και μικρότερες διαφορές
ανάμεσα στα πράγματα που μετρώνται. Σε μια τέτοια περίπτωση
αρκεί ο υπολογισμός του εύρους.
Σε κλίμακα ίσων διαστημάτων ή αναλογική κλίμακα, μεγάλες
διαφορές στις μετρήσεις αντιστοιχούν πράγματι σε μεγάλες
διαφορές στα πράγματα που μετρώνται. Σε αυτή την περίπτωση,
και εφόσον δεν αναμένεται να υπάρχουν ακραίες τιμές,
επιλέγουμε το μέσο όρο και την τυπική απόκλιση.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Επιλέγοντας τον κατάλληλο δείκτη
διασποράς
• Αν είναι πιθανό να υπάρχουν ακραίες τιμές ή αν η μέτρηση είναι σε
ιεραρχική κλίμακα, τότε πρέπει να χρησιμοποιούνται η διάμεσος και
το ενδοτεταρτημοριακό εύρος. Η δεσπόζουσα τιμή και το εύρος
μπορούν να χρησιμοποιηθούν αν επαρκεί μία κατά προσέγγιση
εικόνα των τιμών του δείγματος.

• Ο συνηθέστερος τρόπος περιγραφής της διασποράς των τιμών μιας


μεταβλητής είναι μέσω της τυπικής απόκλισης. Ο σημαντικότερος
λόγος για τον οποίο προτιμάται η τυπική απόκλιση από τους
υπόλοιπους δείκτες διασποράς είναι η δυνατότητα που προσφέρει
να υπολογίσουμε παραμέτρους του πληθυσμού.

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Παράδειγμα

Σε ένα δείγμα 5 ατόμων, ηλικίας πάνω από 50 χρονών


μετρήθηκε η συστολική πίεση και βρέθηκαν οι εξής
τιμές μέτρησης:

11 12 13 17 22

Να βρεθεί η διακύμανση των μετρήσεων .

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Παράδειγμα

Σε ένα δείγμα 5 ατόμων, ηλικίας πάνω από 50 χρονών


μετρήθηκε η συστολική πίεση και βρέθηκαν οι εξής
τιμές μέτρησης:

11 12 13 17 22

Να βρεθεί η διακύμανση των μετρήσεων .

s 2
=
(11 − 15) + (12 − 15) + (13 − 15) + (17 − 15) + (22 − 15)
2 2 2 2 2
= 16,4
5
© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Παράδειγμα

• Στο προηγούμενο παράδειγμα να βρεθεί η τυπική


απόκλιση :

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Παράδειγμα

• Στο προηγούμενο παράδειγμα να βρεθεί η τυπική


απόκλιση :

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Παράδειγμα

• Στο προηγούμενο παράδειγμα να βρεθεί η τυπική


απόκλιση :
s= 16,4 = 4,04

• Επιχειρώντας μια ερμηνεία στο αποτέλεσμα


«Η τιμή της τυπικής απόκλισης εκφράζει τον μέσο όρο της
μεταβλητότητας των πέντε μετρήσεων από την τυπική
μέτρηση 15.»

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.
Παράδειγμα

• Στο ίδιο παράδειγμα υπολογίζουμε την μεταβλητότητα


του δείγματος που είναι:
ή _ ό 4,04
CV = = = 0,26 ή
έ _ ό 15 26%

• Μπορώ να το συγκρίνω με το δείγμα των πέντε ατόμων


ως προς την ηλικία τους που είναι :
50 53 61 58 65

© BROKEN HILL PUBLISHERS LTD. May nοt be scanned, cοpied οr duplicated, οr posted tο a publicly accessible website, in whole οr in part.

You might also like