You are on page 1of 52

Δειγματοληψία

Μάθημα 6ο
Τα δεδομένα
 Τα ερευνητικά δεδομένα αποτελούν την
πρώτη ύλη η οποία με κατάλληλες
μεθόδους επεξεργασίας δίνει
 τα τελικά αποτελέσματα
 με βάση τα οποία θα γίνει η εξαγωγή των
συμπερασμάτων.
Τα δεδομένα
 Δεν είναι δυνατόν σε μια έρευνα να
μην υπάρχει σφάλμα,
 σκοπός όμως των ερευνητών είναι να
ελαττωθεί σε ανεκτά όρια.
Οι πηγές των δεδομένων
 Πρωτεύον ρόλο στη διεξαγωγή μιας έρευνας
είναι ο καθορισμός των πηγών μέσω των
οποίων θα γίνει η συλλογή των διαφόρων
στοιχείων τα οποία στη συνέχεια θα
αναλυθούν με τη συμβολή της στατιστικής.
 Οι πηγές εύρεσης των δεδομένων διακρίνονται σε:
 πρωτογενείς &

 δευτερογενείς.
Οι πηγές των δεδομένων
 Μια πηγή θα λέγεται πρωτογενής αν τα
δεδομένα έχουν συλλεχτεί απευθείας
από την ίδια την πηγή,
 ενώ θα λέγεται δευτερογενής αν για την
συλλογή των δεδομένων
χρησιμοποιήθηκαν στοιχεία από
διάφορες πρωτογενείς πηγές.
Οι πηγές των δεδομένων
 Κύριες πηγές πρωτογενών δεδομένων είναι
 οι κατά τόπους Στατιστικές υπηρεσίες,
 στην Ελλάδα κύρια πηγή συγκέντρωσης πρωτογενών
δεδομένων είναι η Γενική Γραμματεία Εθνικής
Στατιστικής Υπηρεσίας Ελλάδος (Ε.Σ.Υ.Ε., www.statistics.
gr).
 διάφοροι κρατικοί φορείς και Οργανισμοί,
 αλλά και οι πληθυσμιακές έρευνες και κλινικές
μελέτες.
Οι πηγές των δεδομένων
 Κύριες πηγές δευτερογενών δεδομένων είναι
 Δημοσιευμένα στοιχεία σε επιστημονικά περιοδικά,
εφημερίδες, Μ.Μ.Ε., κλπ.
Οι πηγές των δεδομένων
 Είναι προφανές ότι οι πρωτογενείς πηγές
έχουν περισσότερο αξιόπιστα αποτελέσματα
από τις δευτερογενείς γιατί:
 η πρωτογενής πηγή περιέχει πολλές φορές
πληροφορίες για τον ακριβή τρόπο συλλογής των
δεδομένων,
 η πρωτογενής πηγή είναι περισσότερο αναλυτική
στην παρουσίαση των δεδομένων,
 στις δευτερογενείς πηγές περιέχονται σφάλματα
λόγω της μεταφοράς από τις πρωτογενείς πηγές.
Συλλογή δεδομένων
 Μια κύρια πρωτογενής πηγή συλλογής
στοιχείων είναι η διενέργεια
πληθυσμιακών ερευνών
 Π.χ. απογραφικών ή δειγματοληπτικών.
Συλλογή δεδομένων, απογραφή
 Η μέθοδος της απογραφής στηρίζεται στη
συγκέντρωση στοιχείων από όλες τις μονάδες
ενός πληθυσμού που ενδιαφέρει στη
συγκεκριμένη έρευνα.
 Επειδή το σύνολο των ερωτώμενων είναι μεγάλο,
παράλληλα με το μεγάλο πλήθος των μεταβλητών
που εξετάζονται, η μέθοδος αυτή απαιτεί μεγάλο
χρόνο και πολύ μεγάλο κόστος για την συλλογή
των στοιχείων και την εξαγωγή συμπερασμάτων.
 Έτσι συχνά οι ερευνητές καταφεύγουν στη διαδικασία
της δειγματοληψίας, που κρύβει και μεγαλύτερο σφάλμα.
Συλλογή δεδομένων, δειγματοληψία
 Από τις πιο συχνά εφαρμόσιμες μεθόδους
συλλογής δεδομένων είναι η
δειγματοληψία, η οποία ορίζεται ως η
μερική απογραφή σε ένα υποσύνολο του
πληθυσμού το οποίο λέγεται δείγμα.
 Βασική φιλοσοφία της δειγματοληπτικής μεθόδου
είναι η εξαγωγή συμπερασμάτων από το μερικό
για το ολικό, δηλαδή από το υποσύνολο που
εξετάστηκε (δείγμα) για το ευρύτερο σύνολο
(πληθυσμός).
Συλλογή δεδομένων, δειγματοληψία
 Όμως αν δεν πραγματοποιηθεί με σωστές
μεθόδους τότε υπάρχει μεγάλος κίνδυνος
εξαγωγής λανθασμένων συμπερασμάτων.
 Ένα χαρακτηριστικό παράδειγμα λανθασμένης
εκλογής δείγματος ήταν η Αμερικάνικες προεδρικές
εκλογές του 1936 όπου η πρόβλεψη οδήγησε σε
πλήρη αποτυχία γιατί το δείγμα επιλέχθηκε από
τους τηλεφωνικούς καταλόγους οι οποίοι την
εποχή εκείνη περιείχαν μόνο τις “ανώτερες”
κοινωνικές τάξεις που διέθεταν τηλέφωνο.
Συλλογή δεδομένων, δειγματοληψία
 Έχουμε δύο κυρίως είδη δειγματοληψίας,
 την τυχαία και
 τη μη-τυχαία δειγματοληψία.
 Στην πρώτη περίπτωση τα άτομα του
δείγματος επιλέγονται τυχαία από τον
πληθυσμό αναφοράς (μέσω κάποιου ειδικού
αλγόριθμου),
 ενώ στη δεύτερη περίπτωση η επιλογή των
ατόμων ακολουθεί κάποιο συστηματικό τρόπο
(π.χ. όλοι οι ασθενείς που εισήχθησαν σε μια
συγκεκριμένη κλινική το μήνα Μάρτιο).
Απλή Τυχαία δειγματοληψία
 Στην απλή τυχαία δειγματοληψία ισχύει ο
ακόλουθος κανόνας:
 «όλα τα άτομα του πληθυσμού έχουν την ίδια
πιθανότητα να περιληφθούν στο δείγμα»
 Τεχνικές
 Κάλπη, νόμισμα, ακολουθία τυχαίων αριθμών (π.χ.
δημιουργείται εύκολα ακόμα και από το MSEcxel
με την εντολή: =rand()).
Τεχνικές για απλή τυχαία
δειγματοληψία

Ακολουθία τυχαίων Ακολουθία τυχαίων Κάλπη.


αριθμών, π.χ. επιλέγουμε αριθμών, π.χ. επιλέγουμε
μονό για τη θεραπεία Α 1 για τη θεραπεία Α και 0
και άρτιο για τη θεραπεία για τη θεραπεία Β.
Β.
Συλλογή δεδομένων, δειγματοληψία
 Υπάρχουν επίσης:
 η διαστρωματοποιημένη (τυχαία ή μη)
δειγματοληψία (π.χ. ανά φύλο, ηλικιακή
ομάδα κλπ) και
 η δειγματοληψία κατά στάδια (τυχαία ή
μη) όπου πρώτα επιλέγεται το στάδιο (π.χ.
πόλη, περιφέρεια, υπερτασικοί ασθενείς)
και στη συνέχεια γίνεται η δειγματοληψία.
Διαστρωματοποιημένη δειγματοληψία

Πληθυσμός (π.χ. 4 ηλικιακά στρώματα


<18 ε 18-35 ε 35-65 ε >65 ε

Δείγμα (π.χ. 4 ηλικιακά στρώματα, αναλογικά


του πληθυσμού)
Διαστρωματοποιημένη δειγματοληψία

Πληθυσμός (π.χ. 4 ηλικιακά στρώματα


<18 ε 18-35 ε 35-65 ε >65 ε

Αρχικά υπολογίζουμε το Έπειτα διαμερίζουμε το ν σε


συντελεστή λ = ν/Ν τόσα στρώματα (π.χ. 4) ανάλογα
με το %μέγεθος στον πληθυσμό.

Δείγμα (π.χ. 4 ηλικιακά στρώματα)


Το δειγματοληπτικό σχέδιο
Πληθυσμός Δείγμα
<18 125000 ν1=λ χ Ν1 179
18--35 250000 ν2=λ χ Ν2 359
35--65 658000 ν3=λ χ Ν3 944
>65 12000 ν4=λ χ Ν4 17
Ας υποθέσουμε ότι ο N= 1.045.000 1.500
πληθυσμός είναι …
Ας θεωρήσουμε ότι το ν= 1.500
δυνατό δείγμα είναι …
Άρα … λ=ν/Ν= 0,001435407
Σταδιακή δειγματοληψία
Στάδιο 1ο, π.χ. επιλέγουμε τις
πόλεις όπου θα γίνει η έρευνα

Στάδιο 2ο, π.χ.


επιλέγουμε τα νοικυριά σε
κάθε πόλη

Διαλέγουμε (π.χ. τυχαία) ένα άτομο ανά νοικυριό


Οι «αρχές» της δειγματοληψίας
 ΣΩΣΤΗ ΕΠΙΛΟΓΗ ΤΟΥ ΠΛΗΘΥΣΜΟΥ ΑΝΑΦΟΡΑΣ Σε μια
δειγματοληπτική έρευνα ιδιαίτερο ρόλο παίζει η εκλογή του
κατάλληλου πληθυσμού αναφοράς, δηλαδή να αποφασιστεί
αν ο πληθυσμός θα είναι ατόμων, οικογενειών, επιχειρήσεων ή
κάτι άλλο.
 ΑΝΤΙΠΡΟΣΩΠΕΥΤΙΚΟΤΗΤΑ Στη συνέχεια προσδιορίζονται τα
στοιχεία εκείνα του πληθυσμού τα οποία πρέπει να έχει και το
δείγμα έτσι ώστε να θεωρηθεί αντιπροσωπευτικό.
 Αυτό συνήθως επιτυγχάνεται με τη διαστρωμάτωση ως προς
διάφορα βασικά χαρακτηριστικά του πληθυσμού, π.χ. φύλο,
ηλικιακή κατανομή, κοινωνικό – οικονομικά χαρακτηριστικά.
 Με τον τρόπο αυτό η στατιστική ανάλυση του δείγματος που θα
ακολουθήσει θα δώσει σωστότερες πληροφορίες και για
ολόκληρο τον πληθυσμό.
 ΤΥΧΑΙΑ ΕΠΙΛΟΓΗ Με την τυχαία επιλογή διασφαλίζεται ο
περιορισμός της μεροληψίας στην επιλογή.
Πόσα άτομα χρειάζονται σε μια
έρευνα;
 Το μέγεθος του δείγματος είναι θέμα
κρίσιμης σημασίας κατά το
σχεδιασμό μιας έρευνας (κλινικής
δοκιμής, αλλά και μιας επιδημιολογικής
μελέτης).
Το μέγεθος του δείγματος
 Το μέγεθος του δείγματος καθορίζεται από:
 το επίπεδο στατιστικής σημαντικότητας των ελέγχων
 το μέγεθος της αναζητούμενης διαφοράς,
 π.χ. πόσο μεγάλη θα πρέπει να είναι η διαφορά στα επίπεδα ολικής
χοληστερόλης μεταξύ της θεραπευτικής προσέγγισης Α και της
θεραπευτικής προσέγγισης Β έτσι ώστε να θεωρείται κλινικά αξιόλογη,
 τη στατιστική ισχύ των ελέγχων,
 η οποία συνήθως θέλουμε να είναι > 0,80 ή > 0,90,
 το επίπεδο ακρίβειας στις μετρήσεις,
 το οποίο εξαρτάται και από την συνείδηση των ερευνητών που
διεξάγουν την έρευνα, αλλά και το εργαστηριακό σφάλμα
 το μέγεθος του πληθυσμού αναφοράς,
 τη διακύμανση στα χαρακτηριστικά του πληθυσμού, η οποία αν
είναι μεγάλη συνεπάγεται και ανάλογη αύξηση του μεγέθους του
δείγματος, και
 το διαθέσιμο χρηματικό ποσό για την έρευνα.
Σφάλματα στις στοχαστικές
αποφάσεις
δείγμα
δείγμα
Αποδοχή Απόρριψη
υπόθεσης υπόθεσης
Υπόθεση Σφάλμα

πληθυσμός
πληθυσμός
πραγματικά
αληθής  τύπου Ι

Υπόθεση Σφάλμα
πραγματικά
ψευδής
τύπου ΙΙ

Πόσα άτομα χρειάζονται?
 Σύγκριση ενός ποσοτικού
χαρακτηριστικού μεταξύ 2 ομάδων (π.χ.
έρευνα ασθενών-μαρτύρων)
Ίσες
υποομάδες.

Συνήθως Ζα=1,96 για α=0,05 και


Ζβ=1,64 για ισχύ 90%.
Πόσα άτομα χρειάζονται?
 Σύγκριση ενός ποιοτικού
χαρακτηριστικού μεταξύ 2 ίσων ομάδων
(π.χ. έρευνα ασθενών-μαρτύρων)
Πόσα άτομα χρειάζονται?
 Σύγκριση ενός ποιοτικού
χαρακτηριστικού μεταξύ 2 άνισων
ομάδων (π.χ. έρευνα ασθενών-
μαρτύρων)
Πόσα άτομα χρειάζονται?
ΠΑΡΑΔΕΙΓΜΑ: Πόσα άτομα χρειάζονται για να αξιολογήσουμε
έναν παράγοντα με συχνότητα p1=0,25 & p2=0,4 στις ομάδες
των ασθενών & μαρτύρων, αντίστοιχα (ΣΛ = 0,5), σε επίπεδο
σημαντικότητας α = 0,05 και ισχύ 1-β = 0,95;
Πόσα άτομα χρειάζονται?
 Σε μια προοπτική μελέτη παρακολούθησης για
να υπολογιστεί ο αριθμός των ατόμων
χρειάζεται να γνωρίζουμε εκ των προτέρων:
 Το ποσοστό των ατόμων στην κάθε κατηγορία του
παράγοντα που μας ενδιαφέρει,
ή
 το σχετικό κίνδυνο και την πιθανότητα επιβίωσης
της ομάδας ελέγχου,
ή
 τη διάμεση πιθανότητα επιβίωσης στην κάθε
κατηγορία του παράγοντα που μας ενδιαφέρει.
Πόσα άτομα χρειάζονται?
 Αν λοιπόν p1, p2 οι πιθανότητες επιβίωσης της κάθε
ομάδας, στο τέλος της παρακολούθησης, τότε:
Πόσα άτομα χρειάζονται?
ΠΑΡΑΔΕΙΓΜΑ: Πόσα άτομα χρειάζονται για να αξιολογήσουμε
έναν παράγοντα σε μια προοπτική έρευνα όταν ο
πιθανολογούμενος σχετικός κίνδυνος μεταξύ των ομάδων είναι
h=1,5, η πιθανότητα επιβίωσης στην μία ομάδα p1=0,25, σε
επίπεδο σημαντικότητας α = 0,05 και ισχύ 1-β = 0,90;
Πόσα άτομα χρειάζονται?
 Στον υπολογισμό του μεγέθους του δείγματος μιας
προοπτικής μελέτης παρακολούθησης πρέπει να
ληφθεί υπόψη και το ποσοστό των πιθανών
απωλειών σε άτομα, και ο τελικός αριθμός των
ατόμων να αυξηθεί ανάλογα.
 Επίσης θεωρήθηκε ότι ο κίνδυνος είναι
σταθερός μεταξύ των ομάδων σε όλη τη
διάρκεια της έρευνας, αλλιώς …
Πόσα άτομα χρειάζονται?

Υπολογισμός μεγέθους δείγματος σε προοπτική μελέτη,


όταν ο κίνδυνος διαφέρει μεταξύ των ομάδων.
Πόσα άτομα χρειάζονται?
 Στον υπολογισμό του μεγέθους του δείγματος μιας
προοπτικής μελέτης παρακολούθησης, όταν ο
παράγοντας ενδιαφέροντος είναι ποσοτική μεταβλητή
(π.χ. μεταβολές στην ολική χοληστερόλη ορού).

Όπου χ είναι ο χρόνος


παρακολούθησης του κάθε
ατόμου…
Πόσα άτομα χρειάζονται?
 ΠΑΡΑΔΕΙΓΜΑ: Ένα νέο φάρμακο θα ελεγχθεί για
την αποτελεσματικότητα του να μειώσει τη ΣΑΠ κατά
0,5mmHg το έτος, σε μια κλινική δοκιμή που θα
διαρκέσει 5 έτη. Ποιο το μέγεθος του δείγματος για
α=0,05 και β=0,20 (έστω σ2 = 100);

Υποθέτουμε διάφορα επίπεδα για την


αυτοσυσχέτιση … ρ = 0,2 ή 0,5 ή 0,8
Πόσα άτομα χρειάζονται?
Κλινικές δοκιμές όπου η τυχαιοποίηση
γίνεται με βάση το κέντρο …
Αρχικά υπολογίζεται η μεταβλητότητα μεταξύ
των ομάδων (Intra Class Correlation)…

m αριθμός των ατόμων ανά ομάδα (Design


effect = # ατόμων που απαιτείται / ατομική
τυχαιοποίηση)…
Πόσα άτομα χρειάζονται?

Όπου …
Νομόγραμμα για τον υπολογισμό του μεγέθους
του δείγματος ή της στατιστικής ισχύος
Παράδειγμα
Πόσα άτομα χρειάζονται?
 Υπάρχουν ακόμα και δωρεάν
προγράμματα στο διαδίκτυο που
υπολογίζουν το μέγεθος του δείγματος.
Η στατιστική ισχύς είναι συνάρτηση
του μεγέθους του δείγματος
Παράδειγμα δειγματοληπτικού σχεδίου
 Το τελικό μέγεθος του δείγματος της μελέτης
ΑΤΤΙΚΗ προέκυψε έπειτα από ανάλυση
στατιστικής ισχύος με βάση
 την αποτίμηση διαφορών στον εκτιμούμενο
σχετικό κίνδυνο (hazard ratio) για προοπτική
παρακολούθηση 10 ετών μεγαλύτερων από 10%,
 σε επίπεδο στατιστικής σημαντικότητας <5% και
 με στατιστική ισχύ >80%
 για αμφίπλευρους ελέγχους.
Παράδειγμα δειγματοληψίας
 Η δειγματοληψία είναι
 τυχαία,
 πολυσταδιακή (ανά πόλη),
 στρωματοποιημένη (ανά ηλικιακή κατηγορία και
φύλο), και αναλογική (με βάση τον πληθυσμό των
Δήμων και Κοινοτήτων της Υπέρ-νομαρχίας
Αττικής καθώς επίσης και των νομαρχιών
Ανατολικής και Δυτικής Αττικής).
 Η συνεισφορά των ευρύτερων περιοχών της Αττικής στο
τελικό δείγμα της μελέτης θα είναι η ακόλουθη: Δήμος
Αθηναίων (20%), Δήμος Πειραιώς (8%), ευρύτερη
περιφέρεια πρωτευούσης (41%), «υπόλοιπο» Αττικής
(29%) και νήσοι (2%).
Παράδειγμα δειγματοληψίας
 Με βάση τον σχεδιασμό επιλέγονταν τυχαία
εργασιακοί χώροι (Δημόσιοι και Ιδιωτικοί), κέντρα
συγκέντρωσης ηλικιωμένων, καθώς επίσης Δημοτικοί
χώροι όπου τυχαία επιλογή εφαρμόστηκε στις λίστες
των ατόμων
 δυαδική ακολουθία τυχαίων αριθμών 10010101010001…, 1
= ένταξη στην μελέτη, 0 = μη ένταξη στην μελέτη.
 Με τον τρόπο αυτό ελαχιστοποιείται η συμμετοχή εθελοντών
στην μελέτη και του συστηματικού σφάλματος κατά την
επιλογή.
 Το πρωτόκολλο προβλέπει να επιλέγεται ένα άτομο
ανά οικογένεια, οικοδομικό συγκρότημα και
τετράγωνο.
Σφάλματα κατά τη δειγματοληψία
 Τα σφάλματα μιας δειγματοληψίας
διακρίνονται σε δύο κύριες κατηγορίες:
 τα δειγματοληπτικά σφάλματα
 τα μη δειγματοληπτικά σφάλματα
Σφάλματα κατά τη δειγματοληψία
 Τα δειγματοληπτικά σφάλματα προκύπτουν
από την ίδια τη δειγματοληπτική μέθοδο
γεγονός μη επιθυμητό σε μια έρευνα.
 Για παράδειγμα αναλογισθείτε πόσο λάθος είναι να
γίνει δειγματοληψία στα εξωτερικά ιατρεία των
νοσοκομείων μιας χώρας με σκοπό να αποτιμηθεί
ο επιπολασμός των παραγόντων καρδιαγγειακού
κινδύνου.
 Είναι όμως γνωστό ότι όσο μεγαλύτερο είναι το δείγμα
τόσο τα δειγματοληπτικά σφάλματα τείνουν να
εξαλειφθούν, αλλά αυτό δεν συμβαίνει πάντα.
Σφάλματα κατά τη δειγματοληψία
 Τα μη δειγματοληπτικά σφάλματα διακρίνονται σε συστηματικά
 π.χ. μια ζυγαριά ζυγίζει πάντα 10 gr. περισσότερο από το κανονικό )
 και σε μη συστηματικά.
 Π.χ. στην κατηγορία αυτή των σφαλμάτων ανήκουν:
 σφάλματα του ερωτηματολογίου (ακατανόητες ερωτήσεις, δύσκολες λέξεις
και αοριστολογίες),
 σφάλματα κατά τη συνέντευξη,
 για αυτό το λόγο απαιτείται συνεχής εκπαίδευση των ατόμων που θα διεξάγουν
την έρευνα και υψηλό επιστημονικό ήθος των ερευνητών που την διεξάγουν,
 σφάλματα που οφείλονται στην απόκρυψη στοιχείων από τον ερωτώμενο
για προσωπικούς κυρίως λόγους,
 πολλές φορές συνίσταται η διασταύρωση των στοιχείων από άλλα άτομα που
γνωρίζουν των ερωτώμενο,
 σφάλματα επεξεργασίας των απαντήσεων,
 σφάλματα που πηγάζουν από το αυξημένο κόστος της έρευνας, γιατί για
παράδειγμα αν το κόστος υπερβεί τον προϋπολογισμό της έρευνας τότε
γίνονται περικοπές στο μέγεθος του δείγματος και στους ερευνητές.
Μέθοδοι συλλογής δεδομένων
Οι κυριότεροι τρόποι συλλογής των πληροφοριών είναι
οι ακόλουθοι :
 Ταχυδρομικά, η μέθοδος αυτή έχει μικρό κόστος,
αλλά απαντά συνήθως πολύ μικρό ποσοστό
ερωτώμενων (20-40%).
 Τηλεφωνικά, έχει και αυτή η μέθοδος μικρό κόστος
και εύκολο τρόπο επιλογής τυχαίου δείγματος, π.χ.
τυχαίοι αριθμοί από τηλεφωνικό κατάλογο, όμως
πρέπει να γίνεται προσεκτικά και σε ώρες που να μην
είναι ενοχλητικές για τους ερωτώμενους.
 Συνήθως ανταποκρίνεται το 60-80% των ερωτώμενων, αλλά
πολλές φορές οι απαντήσεις είναι μικρής εγκυρότητας.
Μέθοδοι συλλογής δεδομένων
 Συνέντευξη, ίσως ο πιο ασφαλής τρόπος
αλλά με μεγάλο κόστος. Οι ερευνητές επίσης
πρέπει να είναι κατάλληλα καταρτισμένοι για
την επιτυχή διεξαγωγή της έρευνας. Συνήθως
ανταποκρίνεται το 70-80% των ερωτώμενων.
 Συνδυασμός των παραπάνω μεθόδων, η
μέθοδος αυτή είναι δαπανηρή αλλά δίνει τα
καλύτερα αποτελέσματα και με την μικρότερη
πιθανότητα σφάλματος.
Συμπερασματικά
 Η δειγματοληπτική διαδικασία
(δειγματοληπτικό σχέδιο) είναι μεγίστης
σημασίας σε μια έρευνα.
 Μια σωστή διαδικασία ενισχύει την
εγκυρότητα της έρευνας, των
αποτελεσμάτων της και των
συμπερασμάτων της.

You might also like