Professional Documents
Culture Documents
Επαγωγική Στατιστική
Επαγωγική Στατιστική
Inferential Statistics
Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης
Δημήτρης Μαυρίδης
Δείγμα και πληθυσμός
- Πληθυσμός (target/study population) είναι το σύνολο των στοιχείων για τα οποία
ενδιαφερόμαστε να εξάγουμε συμπεράσματα (όλοι οι Έλληνες/άνδρες/γυναίκες/μαθητές
Δημοτικού κλπ όλα τα ελαιόδενδρα, παραγόμενα προϊόντα κλπ όλα τα κοτόπουλα/βοειδή κλπ)
Συνήθως, λόγω χρηματικών και χρονικών περιορισμών, δεν μπορούμε να αναλύσουμε όλο τον
πληθυσμό και καταφεύγουμε στην ανάλυση ενός αντιπροσωπευτικού δείγματος αυτού.
- Δείγμα (sample) είναι ένα υποσύνολο του πληθυσμού που μας ενδιαφέρει
Ενδέχεται, ο ερευνητής, να μην έχει πρόσβαση σε όλα τα υποκείμενα του πληθυσμού παρά μόνο
σε ένα υποσύνολό του (sampled population)
Δείγμα και πληθυσμός
Παράδειγμα: με ενδιαφέρουν οι απόψεις των
φοιτητών ΠΤΔΕ για ένα θέμα για την πρωτοβάθμια
εκπαίδευση/ ποιότητα των σπουδών τους
Πληθυσμός δειγματοληψίας
Πληθυσμός
Αντιπροσωπευτικότητα δείγματος
• Το δείγμα μας πρέπει να είναι αντιπροσωπευτικό του πληθυσμού για να είναι
έγκυρη η γενίκευση των αποτελεσμάτων του
• Δείγμα υπολογιζόμενο με πιθανότητες (probability sampling): κάθε μέλος του
πληθυσμού (ο οποίος θεωρείται γνωστός εκ των προτέρων) έχει την ίδια
πιθανότητα συμμετοχής. Σε μεγάλα δείγματα, η θεωρία πιθανοτήτων
εξασφαλίζει ότι το δείγμα μας έχει τα ίδια χαρακτηριστικά με τον πληθυσμό
• Δείγμα υπολογιζόμενο χωρίς πιθανότητες (non-probability samples): Δεν έχουν
όλα τα υποκείμενα την ίδια πιθανότητα συμμετοχής στο δείγμα.
Δείγμα ευκολίας (convenient sampling)
• Πολλές φορές καταφεύγουμε σε δείγματα ευκολίας, σε υποσύνολα του
πληθυσμού στα οποία έχουμε εύκολη πρόσβαση.
• Στην εκπαιδευτική έρευνα, ο ερευνητής καταφεύγει σε μια τάξη στην οποία έχει
εύκολη πρόσβαση.
• Η απόκτηση δείγματος υπολογιζόμενο με πιθανότητες μπορεί να είναι
χρονοβόρα, να έχει υψηλό κόστος ή να είναι ανέφικτη
• Έστω ότι ένας φοιτητής συγκεντρώνει απαντήσεις από ένα ερωτηματολόγιο που
έδωσε την ώρα κάποιου μαθήματος. Τα αποτελέσματα ενδεχομένως να μη
γενικεύονται στους φοιτητές που δεν παρακολουθούν το μάθημα
Επαγωγική Στατιστική
Inferential Statistics
• Η εξαγωγή συμπερασμάτων από το δείγμα στον πληθυσμό που μας ενδιαφέρει
• Μας ενδιαφέρει να εξάγουμε συμπεράσματα για συγκεκριμένους παραμέτρους του
πληθυσμού π.χ. για το μέσο όρο ή το ποσοστό
• Από τα δείγματα, θα πάρουμε μια σημειοεκτίμηση (point estimation) π.χ. ένα μέσο όρο,
ένα ποσοστό...
• Κάθε δείγμα, θα μας δίνει και μια διαφορετική εκτίμηση
• Δεν έχουμε τη δυνατότητα να πάρουμε πολλά διαφορετικά δείγματα
• Ιδανικά θα θέλαμε ένα διάστημα τιμών που θα συμπεριλαμβάνει με μεγάλη
πιθανότητα (συνήθως την ορίζουμε ως 95%) τις τιμές που θα προέκυπταν από τα
πολλαπλά δείγματα ή θα περιλαμβάνει τις πιθανές τιμές της παραμέτρου που με
ενδιαφέρει
• Η θεωρία πιθανοτήτων μας προσφέρει αυτό το εργαλείο με τα διαστήματα
εμπιστοσύνης
Επαγωγική Στατιστική
Inferential Statistics
• Συνήθως με ενδιαφέρει να ελέγξω μια συγκεκριμένη υπόθεση
π.χ. η πολιτική παράταξη Α θα πάρει πάνω από 35%, η μέση σχολική επίδοση
αυτών που χρησιμοποίησαν επιπροσθέτως μια συγκεκριμένη εκπαιδευτική
παρέμβαση είναι μεγαλύτερη από αυτούς που δεν την χρησιμοποίησαν
πληθυσμός
1.1 1.6 2.1
δείγμα
10
Δείγμα και πληθυσμός
μέσος 𝑥𝑥̅ 𝜇𝜇
διασπορά 𝑠𝑠 2 𝜎𝜎 2
Πιθανότητα/ποσοστό 𝑝𝑝 𝜋𝜋
Κανονική κατανομή (Normal distribution)
𝜇𝜇 − 𝛼𝛼 𝜇𝜇 𝜇𝜇 + 𝛼𝛼
Εμπειρικός κανόνας
το 68% των παρατηρήσεων βρίσκονται στο διάστημα που τα άκρα του απέχουν μια
τυπική απόκλιση από το μέσο των παρατηρήσεων (μ-σ, μ+σ)
το 95.5% των παρατηρήσεων βρίσκονται στο διάστημα που τα άκρα του απέχουν δυο
τυπικές αποκλίσεις από το μέσο των παρατηρήσεων (μ-2σ,μ+2σ)
το 99.7% των παρατηρήσεων βρίσκονται στο διάστημα που τα άκρα του απέχουν τρεις
τυπικές αποκλίσεις από το μέσο των παρατηρήσεων (μ-3σ,μ+3σ)
𝑃𝑃 𝜇𝜇 − 3 × 𝜎𝜎 < 𝑥𝑥 < 𝜇𝜇 + 3 × 𝜎𝜎 = 0.997
68% των δεδομένων
• Επίσης 𝜇𝜇 + 2 × 𝜎𝜎 = 185 ↔ 𝜎𝜎 = 5
𝑥𝑥~𝑁𝑁(175,52 )
95%
Τυποποιημένες τιμές
𝑥𝑥𝑖𝑖 − 𝜇𝜇
𝑍𝑍𝑖𝑖 = ~Ν(0,1)
𝜎𝜎
• Δυο διαφορετικά διαγωνίσματα μαθηματικών δόθηκαν για τη χορήγηση υποτροφιών.
Υποτροφία θα έπαιρναν όσοι φοιτητές πετύχαιναν βαθμολογία από 19 και πάνω. Στο πρώτη
διαγώνισμα ο μέσος όρος των βαθμολογιών είναι 17 ενώ στο δεύτερο 13. Η τυπική απόκλιση
και στις 2 τάξεις είναι 2. Ο υψηλότερος βαθμός της πρώτης τάξης πήρε 20 ενώ ο υψηλότερος
βαθμός στη δεύτερη τάξη είναι 17.
• Για να δούμε τις τυποποιημένες βαθμολογίες των 2 μαθητών. Του πρώτου είναι (20-17)/2
=1.5 ενώ του δεύτερου είναι (17-13)/2=2
• επομένως ο δεύτερος μαθητής αν και έχασε την υποτροφία στην πραγματικότητα ίσως να
πήγε καλύτερα από τον πρώτο γιατί τα θέματα στα οποία διαγωνίστηκε ήταν δυσκολότερα
από αυτά του πρώτου
• Η τυποποίηση εξασφαλίζει το ότι οι διάφορες τιμές έχουν την ίδια κατανομή και επομένως
είναι συγκρίσιμες
Τυπικη κανονική κατανομή
2 𝑥𝑥−𝜇𝜇
Αν 𝑥𝑥~𝑁𝑁(𝜇𝜇, 𝜎𝜎 ) τότε 𝑍𝑍 = ~Ν(0,1)
𝜎𝜎
0.4
0.3
0.2
Ακραίες τιμές Ακραίες τιμές
0.1
Εμβαδόν: Εμβαδόν:
πιθανότητα 2.5 % πιθανότητα 2.5 %
0.0
-6 -4 -2 0 2 4
Τυπική κανονική κατανομή
Εμπειρικός κανόνας
𝑃𝑃(−1 < 𝑧𝑧 < 1) = 0.68
Βασικά είναι
𝜎𝜎 2
𝑥𝑥~𝑁𝑁
̅ 𝜇𝜇,
𝑛𝑛
̅
𝑥𝑥−𝜇𝜇
z= 𝜎𝜎 ~𝑁𝑁 0,1
𝑛𝑛
95% διάστημα εμπιστοσύνης
𝑃𝑃 −1.96 < 𝑍𝑍 < 1.96 = 0.95 (1)
𝐿𝐿−𝜇𝜇
𝑃𝑃(L<𝑥𝑥<U)=
̅ 0.95 Επομένως, = −1.96 ↔ 𝐿𝐿 = 𝜇𝜇 − 1.96 × 𝜎𝜎/ 𝑛𝑛
𝜎𝜎/ 𝑛𝑛
𝐿𝐿 − 𝜇𝜇 𝑥𝑥̅ − 𝜇𝜇 𝑈𝑈 − 𝜇𝜇 και
𝑃𝑃 < 𝜎𝜎 < = 0.95 U−𝜇𝜇
𝜎𝜎/ 𝑛𝑛 𝜎𝜎/ 𝑛𝑛
𝑛𝑛 = 1.96 ↔ 𝑈𝑈 = 𝜇𝜇 + 1.96 × 𝜎𝜎/ 𝑛𝑛
𝜎𝜎/ 𝑛𝑛
και το 95% διάστημα εμπιστοσύνης είναι
𝑠𝑠
𝑃𝑃
𝐿𝐿−𝜇𝜇
<𝑧𝑧<
𝑈𝑈−𝜇𝜇
= 0.95 (2) 𝑥𝑥̅ ± 1.96 ×
𝜎𝜎/ 𝑛𝑛 𝜎𝜎/ 𝑛𝑛 𝑛𝑛
Η είσοδος σε ένα Πανεπιστήμιο εξαρτάται από την επίδοση σε ένα διαγώνισμα. Η
κατανομή των βαθμών 400 μαθητών σε αυτό το διαγώνισμα είναι κανονική με μέσο
όρο 500 και τυπική απόκλιση 100. Mπορούμε να ισχυριστούμε ότι η μέση βαθμολογία
είναι ίση με 515;
• Να φτιαχτεί ένα 95% διάστημα εμπιστοσύνης
𝑠𝑠 100
𝐿𝐿 = 𝑥𝑥̅ − 1.96 × = 500 − 1.96 × = 490.2
𝑛𝑛 400
𝑠𝑠 100
𝑈𝑈 = 𝑥𝑥̅ + 1.96 × = 500 + 1.96 × = 509.8
𝑛𝑛 400
𝑠𝑠
𝜇𝜇 ± 1.96 ×
𝑛𝑛
𝜎𝜎12 𝜎𝜎22
𝑠𝑠. 𝑒𝑒. 𝑀𝑀𝑀𝑀 = +
𝑛𝑛1 𝑛𝑛2
95% διάστημα εμπιστοσύνης:
𝑝𝑝 × (1 − 𝑝𝑝)
𝑠𝑠. 𝑒𝑒. 𝑝𝑝 =
𝑛𝑛
𝑝𝑝 × (1 − 𝑝𝑝)
𝑝𝑝 ± 1.96 ×
𝑛𝑛
Παράδειγμα
Βελτίωση Ναι Όχι Σύνολο
Χρήση ΤΠΕ 70 30 100
70 𝑝𝑝 × (1 − 𝑝𝑝)
𝑝𝑝 = = 0.7 𝑝𝑝 ± 1.96 ×
100 𝑛𝑛
0.3 × 0.7
0.7 × 0.3 0.7 ± 1.96 ×
𝑠𝑠. 𝑒𝑒. = = 0.046 100
100
(0.61,0.79)
Έστω ότι σε μια δημοσκόπηση πήραμε ένα δείγμα 400 ατομών και οι 180 είπαν ότι
ψηφίζουν το κόμμα Α
180
Ποσοστό 𝑝𝑝 = = 0.45
400
Για να έχει αυτοδυναμία το κόμμα Α θα πρέπει να πάρει πάνω από το 50% των ψήφων
Έχει αυτοδυναμία;