You are on page 1of 12

Περιγραφική Στατιστική Δεδομένων

 Κατά προσέγγιση κανονικές κατανομές


Μέση Τιμή
Σταθερή απόκλιση

 Ασύμμετρες κατανομές
Διάμεσο
Τεταρτημόρια (25ο, 75ο), Εκατοστημόρια (10ο,90ο)
Σε μια έρευνα σε δείγμα 1500 ενήλικων ατόμων καταγράφηκαν,
μεταξύ άλλων, οι παρακάτω πληροφορίες:
Μονάδες μέτρησης ή
Μεταβλητή κατηγορίες
Ηλικία Έτη
Φύλο Άνδρας, Γυναίκα
Κατάσταση Κακή, μέτρια, καλή,
στοματικής υγιεινής πολύ καλή
Χοληστερόλη mg/dl

Χαρακτηρίστε το είδος της κάθε μεταβλητής ως προς την κλίμακα


μέτρησης. Πως θα περιγράφατε συνοπτικά τα αποτελέσματα του
δείγματος αυτού για κάθε μια από τις μεταβλητές αυτές;
Στην κλινική ενός νοσοκομείου εισήχθησαν στη διάρκεια μίας χρονικής περιόδου 600 ασθενείς.
Στον παρακάτω πίνακα δίνονται τα μέτρα θέσης και διασποράς για την ηλικία των ασθενών
κατά την εισαγωγή τους στην κλινική και τη διάρκεια παραμονής τους
Μέση Σταθερή 25ο, 75ο Ελάχιστη-
Διάμεσος
τιμή απόκλιση εκατοστημόριο Μέγιστη τιμή
Ηλικία (έτη) 63.3 64.5 14.8 (55, 74) 18-93
Διάρκεια παραμονής
15.1 9.0 15.9 (4, 23) (1, 158)
στην κλινική (μέρες)
Ποιο μέτρο θέσης και ποιο μέτρο διασποράς είναι τα πιο κατάλληλα για να περιγράψετε (i) την
ηλικία και (ii) τη διάρκεια παραμονής στην κλινική; Αιτιολογήστε συνοπτικά την επιλογή σας
(επιλέξτε μόνο ένα μέτρο θέσης και μόνο ένα μέτρο διασποράς)
Ακραίες Τιμές (Outliers)
“παρατηρήσεις που
ξεχωρίζουν από τα
υπόλοιπα δεδομένα”

Προέρχονται από:
– Πραγματικές ακραίες τιμές, πχ υπέρβαρα άτομα
– Λάθος κατά την εισαγωγή δεδομένων

Προβλήματα αν είναι πραγματικές τιμές γιατί επηρεάζουν


δυσανάλογα τα αποτελέσματα. Αντιμετώπιση:
– Ανάλυση με και χωρίς αυτά τα άτομα
– Αν διαφορετικά αποτελέσματα μετασχηματισμός /
μη παραμετρικές μεθόδους
Ακραίες Τιμές (Outliers)
Εκτίμηση κανονικότητας
• Ιστόγραμμα - Θηκόγραμμα
• Περιγραφικά δεδομένα

Τι κάνουμε αν τα δεδομένα δεν


κατανέμονται κανονικά;
Πότε να μετασχηματίσουμε;

Όταν παραβιάζεται η κανονικότητα (προϋπόθεση πολλών


στατιστικών δοκιμασιών), …για να ικανοποιήσουμε τις
προϋποθέσεις εφαρμογής στατιστικών δοκιμασιών.

Ποιος Μετασχηματισμός;

Το λογαριθμικό μετασχηματισμό z=log(y) για θετικά


λοξές κατανομές, (ln, log10)
Λογαριθμική συνάρτηση για x>0

ln

log10

Μεταβλητή x1 x2 x3 x4 x5
Αρχικές τιμές 10 100 1.000 10.000 100.000
log10 1 2 3 4 5
Λογαριθμικός μετασχηματισμός

Μέτρηση δείκτη ήπατος σε


σχέση με αλκοόλ σε 7.613 άντρες
μέσης ηλικίας. Μέση τιμή 19,2
IU/lt
Γεωμετρικός μέσος
=αντιλογάριθμος (mean(log))
= 15.6 IU/lt

Πηγή: Shaper et al. 1983


Φυσιολογικές τιμές
x  2 * SD
Διάκριση φυσιολογικές / παθολογικές
Μεταβλητότητα βιολογικού μεγέθους που δεν
οφείλεται σε διαπιστωμένους εξωγενείς ή
εργαστηριακούς παράγοντες.

Όχι προσδιοριστικό
πιθανολογικό χαρακτήρα

οποιαδήποτε τιμή μπορεί να ανήκει σε υγιές άτομο,


αλλά η πιθανότητα είναι μικρότερη, όταν η απόσταση
από μέση τιμή είναι μεγαλύτερη.
Για Ασύμμετρες κατανομές

Θέλουμε το 95% του πληθυσμού να ανήκει μέσα στο


διάστημα, όταν χαμηλές και ψηλές τιμές
θεωρούνται προβληματικές

Εκατοστημόρια (2.5, 97.5)


2.5% 2.5%

You might also like