You are on page 1of 27

Στατιστική Ι

Τμήμα Ψυχολογίας
Πάντειο Πανεπιστήμιο Κοινωνικών και Πολιτικών Επιστημών

Μάθημα 1ο

Αθήνα, 2023
Γενικά Στοιχεία

Φώτης Μηλιένος
Διδάσκων: Επίκουρος Καθηγητής, Τμήμα Κοινωνιολογίας
Γραφείο: Ε4, Νέο Κτήριο
Τρίτη 12:00-13:00
Ώρες Γραφείου: Πέμπτη 12:00-13:00
ή οποιαδήποτε άλλη στιγμή κατόπιν συνεννόησης
E-mail: milienos@panteion.gr

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 2


Περίγραμμα Μαθήματος

• Εισαγωγικά Στοιχεία
• Μέθοδοι Δειγματοληψίας
• Είδη Μεταβλητών και Κλίμακες Μέτρησης
• Περιγραφική Στατιστική
• Στοιχεία Πιθανοτήτων
• Τυχαίες Μεταβλητές
• Μέση Τιμή και Διασπορά Τυχαίας Μεταβλητής
• Κανονική Κατανομή και άλλες Βασικές Κατανομές
• Κεντρικό Οριακό Θεώρημα
• Εκτιμητική: Σημειακή Εκτίμηση και Εκτίμηση με Διάστημα Εμπιστο-
σύνης
• Αναφορά στη Χρήση Στατιστικών Πακέτων Η/Υ (π.χ. SPSS, και R) για
την Εφαρμογή των Παραπάνω Μεθόδων.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 3


Ενημερωτικά στοιχεία

Η ύλη του μαθήματος (βλ. και Περιεχόμενο Μαθήματος-Διδακτέα Ύλη,


όπως έχει αναρτηθεί στο eclass και την ιστοσελίδα του τμήματος) θα είναι
οι διαφάνειες που θα χρησιμοποιήσουμε και ότι άλλο αναφέρουμε, κατά
τη διάρκεια των μαθημάτων.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 4


Τρόπος εξέτασης: Ενδιάμεσες και Γραπτές εξετάσεις
Κατά τη διάρκεια του εξαμήνου, θα πραγματοποιηθούν δύο
ενδιάμεσες εξετάσεις μέσω του eclass.
Η πρώτη ενδιάμεση εξέταση θα συμμετέχει στην τελική
βαθμολογία με 40% και η δεύτερη, με 60%. Όποιος/α συγκεντρώσει, από
τις δύο ενδιάμεσες εξετάσεις, συνολική βαθμολογία μεγαλύτερη ή ίση από
50%, τότε θεωρείται ότι επιτυχώς έχει ολοκληρώσει το μάθημα. Δεν είναι
απαραίτητο να βαθμολογηθεί και στις δύο ενδιάμεσες εξετάσεις με βαθμό
μεγαλύτερο ή ίσο του 50%.
Τα θέματα στις ενδιάμεσες εξετάσεις θα αποτελούνται από δύο μέρη:
• το πρώτο μέρος θα έχει ερωτήσεις Σωστό/Λάθος (χωρίς
αιτιολόγηση)
• το δεύτερο Πολλαπλής Επιλογής (χωρίς αιτιολόγηση).
Εάν κάποιος/α δεν καταφέρει να ολοκληρώσει επιτυχώς το μάθημα μέσω
των ενδιάμεσων εξετάσεων, τότε προσέρχεται κανονικά στις γραπτές
εξετάσεις που πραγματοποιούνται την εξεταστική περίοδο του
Ιανουαρίου/Φεβρουαρίου ή/και του Σεπτεμβρίου.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 5


Γραπτές Εξετάσεις Ιανουαρίου/Φεβρουαρίου και Σεπτεμβρίου:

Θα είναι με ανοικτές σημειώσεις* και τα θέματα θα είναι χωρισμένα σε


τρία μέρη:
• το πρώτο μέρος θα είναι Σωστό/Λάθος
• το δεύτερο Πολλαπλής Επιλογής
• το τρίτο Ασκήσεις.

*Κατά τη διάρκεια των εξετάσεων θα έχετε μαζί σας ένα χαρτί Α4, πάνω στο οποίο θα έχετε
σημειώσει ότι εσείς θεωρείτε απαραίτητο για τις εξετάσεις.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 6


ΣΗΜΑΝΤΙΚΕΣ ΠΑΡΑΤΗΡΗΣΕΙΣ

Προσοχή: δεν μπορείτε να συμμετέχετε στις εξετάσεις εάν δε γίνει η


δήλωση του μαθήματος.

H εγγραφή των φοιτητών στο eclass του μαθήματος, είναι


απαραίτητη για την επίτευξη των διδακτικών στόχων.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 7


Εισαγωγή

Είναι γεγονός ότι η γνώση των βασικών αρχών της Στατιστικής, στον χώρο
των Κοινωνικών, Παιδαγωγικών και Πολιτικών Επιστημών, μεταξύ
άλλων, είναι χρήσιμη και απαραίτητη!

Τι είναι όμως η Στατιστική;

Θα μπορούσαμε να πούμε ότι είναι η επιστήμη που ασχολείται με τη


συλλογή, παρουσίαση και αξιολόγηση δεδομένων, με σκοπό τη
γενίκευση των αποτελεσμάτων και εξαγωγή ασφαλών συμπερασμάτων,
για το υπό μελέτη πρόβλημα.

R. Fisher

Είναι ίσως ο πιο δημοφιλής κλάδος των εφαρμοσμένων μαθηματικών, στις


κοινωνικές επιστήμες.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 8


Ας αναρωτηθούμε:
• Πώς μπορούμε να εξετάσουμε την απήχηση των θέσεων ενός κόμματος,
σε μια κοινωνία;
• Πώς αξιολογούμε μια νέα διδακτική μέθοδο;
• Τι μπορούμε να πούμε για τη συμπεριφορά παιδιών, που προέρχονται
από οικογένειες με συγκεκριμένα χαρακτηριστικά;
• Τι μπορούμε να πούμε για την εξέλιξη της θεραπείας ενός ασθενούς;
• Τι μπορούμε να πούμε για τον χρόνο ζωής μιας μηχανής;
• Πώς εξακριβώνουμε την ποιότητα προϊόντων, που παράγονται από
διάφορες βιομηχανίες;

Βασικό εργαλείο, για την αντιμετώπιση των παραπάνω προβλημάτων


αποτελούν οι μέθοδοι και οι τεχνικές της Στατιστικής.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 9


Έχει ειπωθεί όμως ότι:

«Υπάρχουν τριών ειδών ψέματα: τα ψέματα, τα μεγάλα ψέματα και η


Στατιστική»

“There are three kinds of lies: lies, damned lies, and statistics”.

Γιατί;

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 10


Αυτό που καταλαβαίνουμε είναι ότι η στατιστική θα μπορούσε να
παραπλανήσει, και ειδικότερα αυτούς που δεν είναι σε θέση να την
ερμηνεύσουν.

Η στατιστική υπάρχει γύρω μας, στην καθημερινότητα μας…από τον μέσο


όρο του χρόνου που χρειάζεται κάποιος να πάρει πτυχίο, και τον μέσο όρο
της βαθμολογίας του, έως μια δημοσκόπηση που προβλέπει ποιο πολιτικό
κόμμα είναι πιθανό να κερδίσει τις επόμενες εκλογές.

Σε κάθε περίπτωση, τα στατιστικά στοιχεία χρησιμοποιούνται για να μας


ενημερώσουν. Η πρόκληση είναι να είμαστε σε θέση να κατανοούμε και
να ερμηνεύουμε τι εννοούν.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 11


Σημαντικότατο ρόλο στον χώρο της Στατιστικής, παίζει η έννοια του
πληθυσμού (population). Από ποια ομάδα ατόμων/υποκειμένων θα
συλλέξουμε στοιχεία;

Για παράδειγμα, όταν θέλουμε να μελετήσουμε το βάρος των μαθητών της


πρωτοβάθμιας εκπαίδευσης, τότε ο πληθυσμός της έρευνάς μας είναι
προφανώς οι μαθητές των δημοτικών σχολείων.

Οι μαθητές του γυμνασίου ανήκουν στον πληθυσμό μας;

Εάν για παράδειγμα, θέλουμε να εξετάσουμε τη στάση των ψηφοφόρων


μιας περιφέρειας, τότε ο πληθυσμός της έρευνάς μας θα είναι οι
ψηφοφόροι της συγκεκριμένης περιφέρειας.

Ενήλικα άτομα που κατοικούν στην περιφέρεια αυτή, χωρίς δικαίωμα


ψήφου, ανήκουν στον πληθυσμό της παραπάνω έρευνας;

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 12


Το ιδανικό θα ήταν να μπορούσαμε να συλλέξουμε ΟΛΕΣ τις
πληροφορίες που χρειαζόμαστε, από ΟΛΑ τα άτομα του πληθυσμού μας
(απογραφή, census).

Κάτι τέτοιο όμως είναι, στη συντριπτική πλειοψηφία των περιπτώσεων,


αδύνατο να συμβεί λόγω κυρίως περιορισμένων οικονομικών πόρων ή/και
χρονικού ορίζοντα.

Άρα η λύση είναι να πάρουμε και να μελετήσουμε ένα δείγμα (sample)


ατόμων (ή γενικότερα, υποκειμένων) από τον παραπάνω πληθυσμό.

Μελετώντας τα χαρακτηριστικά του δείγματος μας, βάσει κατάλληλων


στατιστικών τεχνικών (μεθόδων), επιθυμούμε να καταλήξουμε σε ασφαλή
και ακριβή συμπεράσματα για τον πληθυσμό, από τον οποίο προέρχεται
το δείγμα μας.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 13


Το δείγμα αυτό όμως πρέπει να έχει κάποια σημαντικά χαρακτηριστικά!

Γενικά, θα λέμε ότι το δείγμα μας πρέπει να είναι αντιπροσωπευτικό του


πληθυσμού στόχου (διαφορετικά, πρέπει να είναι μια «μικρογραφία» του
πληθυσμού).

Πώς επιτυγχάνεται κάτι τέτοιο;

Επιλέγοντας την κατάλληλη μέθοδο δειγματοληψίας (sampling method)


και παίρνοντας το κατάλληλο μέγεθος δείγματος (sample size).

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 14


Μέθοδοι Δειγματοληψίας (sampling methods)

Οι βασικές μέθοδοι δειγματοληψίας, που μπορεί κάποιος να ακολουθήσει,


και βάσει των οποίων έχουν προταθεί και πολλές άλλες, είναι:

• Απλή τυχαία δειγματοληψία (simple random sampling)

• Στρωματοποιημένη τυχαία δειγματοληψία (stratified random


sampling)

• Συστηματική δειγματοληψία (systematic sampling)

• Δειγματοληψία κατά συστάδες (cluster sampling).

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 15


Έστω ότι θέλουμε να επιλέξουμε ένα δείγμα μεγέθους 𝑛, όταν ο συνολικός
μας πληθυσμός αποτελείται από 𝑁 άτομα (ασφαλώς, 𝑁 ≥ 𝑛).

Ας θεωρήσουμε το Ν γνωστό.

Επίσης, ας υποθέσουμε ότι υπάρχει ένας κατάλογος με καταγεγραμμένα


όλα τα άτομα του πληθυσμού (πλαίσιο δειγματοληψίας, sampling frame).

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 16


Απλή Τυχαία Δειγματοληψία

Με την απλή τυχαία δειγματοληψία κάθε δείγμα μεγέθους 𝑛, είναι το ίδιο


πιθανόν να επιλεγεί από τον ερευνητή.

Αυτό μπορεί να επιτευχθεί, π.χ., επιλέγοντας ένα-ένα τα άτομα, όπου σε


κάθε βήμα κάθε άτομο είναι το ίδιο πιθανόν να επιλεγεί. Μπορούμε να
φανταστούμε ένα βαρέλι που περιέχει όλα τα υποκείμενα του πληθυσμού
μας, και εμείς να βάζουμε το χέρι μας μέσα και να τραβάμε, χωρίς να
βλέπουμε, ένα-ένα τα υποκείμενα, έως ότου σχηματίσουμε το δείγμα με
τα n υποκείμενα.

Η απλή τυχαία δειγματοληψία μπορεί να είναι με επανάθεση (with


replacement-για πιο εξειδικευμένα προβλήματα) ή χωρίς επανάθεση
(without replacement-για τα περισσότερα προβλήματα).

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 17


Συστηματική Δειγματοληψία

Στη συστηματική δειγματοληψία, αφού έχουμε προσδιορίσει το μέγεθος


του δείγματος μας, δηλαδή το 𝑛, επιλέγουμε τυχαία ένα ακέραιο αριθμό
από το 1 έως το 𝑘 = 𝑁/𝑛, έστω το 𝑚.

Έπειτα, το δείγμα μας θα απαρτίζεται από τα άτομα 𝑚, 𝑚 + 𝑘, 𝑚 + 2𝑘, . ..


(ορθότερα, το 𝑘 θα είναι ίσο με το ακέραιο μέρος του 𝑁/𝑛).

Ουσιαστικά, τον κατάλογο με όλα τα υποκείμενα του πληθυσμού τον


χωρίζουμε σε k ομάδες, διαδοχικών υποκειμένων. Έπειτα, από κάθε τέτοια
ομάδα επιλέγουμε ένα μόνο υποκείμενο.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 18


Για παράδειγμα, έστω ότι 𝑁 = 30 και 𝑛 = 6. Τότε, πρέπει να επιλέξουμε
τυχαία ένα αριθμό από το 1 έως το 5 (αφού k=30/6=5). Έστω ότι ο αριθμός
αυτός είναι το 𝑚 = 2. Τότε το δείγμα μας θα αποτελείται από τα άτομα:
2, 7, 12, 17, 22 και 27.

Π.χ. 𝑁 = 60 και 𝑛 = 10. Τότε, k=60/10=6 και έστω ότι ο τυχαίος αριθμός
από το 1 έως το 6, είναι το 4. Το δείγμα στην περίπτωση αυτή θα
αποτελείται από τα άτομα: 4, 10, 16, 22, 28, 34, 40, 46, 52, 58.

Γιατί να χρησιμοποιήσουμε συστηματική δειγματοληψία και όχι π.χ. απλή


τυχαία δειγματοληψία; Οι περιπτώσεις που φαίνεται να υπερέχει ο
συγκεκριμένος τρόπος δειγματοληψίας είναι όταν: α) οι τιμές στον
πληθυσμό είναι αρκετά διάσπαρτες, β) υπάρχει τυχαία διάταξη των
υποκείμενων στον κατάλογο (πλαίσιο δειγματοληψίας), γ) όταν τα
υποκείμενα είναι διατεταγμένα ανά «μέγεθος».

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 19


Στρωματοποιημένη Τυχαία Δειγματοληψία

Ο πληθυσμός χωρίζεται σ’ ένα αριθμό από ομοιογενή (στη βάση κάποιου


κοινού χαρακτηριστικού) και αμοιβαίως αποκλειόμενα στρώματα/ομάδες
(strata). Από κάθε στρώμα λαμβάνεται ένα δείγμα.

Όλα τα δείγματα μαζί, αποτελούν το συνολικό μας δείγμα.

Γιατί να χρησιμοποιήσουμε στρωματοποιημένη δειγματοληψία;

Π.χ. σε μία έρευνα κοινής γνώμης μπορούμε να χωρίσουμε τον πληθυσμό


σε τρία στρώματα: τα άτομα που ζουν σε αστικές, ημιαστικές ή αγροτικές
περιοχές. Σε μία έρευνα για την ικανοποίηση των φοιτητών από τις
σπουδές τους, θα μπορούσαμε να χωρίσουμε τον πληθυσμό σε φοιτητές
πρωτοετείς, δευτεροετείς, τριτοετείς και τελειόφοιτους.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 20


Δειγματοληψία κατά Συστάδες

Ο πληθυσμός χωρίζεται σε ένα αριθμό από αντιπροσωπευτικές συστάδες


(clusters), όχι απαραίτητα ομοιογενείς. Από αυτές επιλέγουμε τυχαία
κάποιες και συνήθως, μελετάμε όλα τα υποκείμενα που ανήκουν στις
επιλεχθείσες συστάδες.

Όλα τα δείγματα μαζί, αποτελούν το συνολικό μας δείγμα.

Π.χ. έστω ότι επιθυμούμε να μελετήσουμε πόσο ικανοποιημένοι είναι οι


κάτοικοι μιας πόλης από τις υπηρεσίες καθαριότητας. Τότε, μπορούμε να
χωρίσουμε την πόλη σε συνοικίες (ή πολεοδομικά τετράγωνα) και από
αυτές να επιλέξουμε τυχαία κάποιες. Έπειτα, να δώσουμε κατάλληλο
ερωτηματολόγιο προς συμπλήρωση σε όλους τους κατοίκους των
συνοικιών που επελέγησαν.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 21


Ποια η διαφορά της από τη στρωματοποιημένη δειγματοληψία;

Γιατί να χρησιμοποιήσουμε δειγματοληψία κατά συστάδες;

Συνήθως μας δίνει καλύτερα αποτελέσματα όταν δεν υπάρχει κατάλογος


με όλα τα υποκείμενα του πληθυσμού (ή είναι δύσκολο να δημιουργηθεί).
Επίσης, το «κόστος» πραγματοποίησης μίας δειγματοληψίας κατά
συστάδες μπορεί να είναι μικρότερο καθώς ενδέχεται οι αποστάσεις και οι
μετακινήσεις των ερευνητών να είναι μικρότερες.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 22


Παρατηρήσεις:

• Στην πράξη πολλές φορές, όχι απλά δεν μπορούμε να έχουμε ένα
πλαίσιο δειγματοληψίας, αλλά μπορεί να μην ξέρουμε καν το
μέγεθος του πληθυσμού μας (δηλ., το 𝑁).

Τότε τι κάνουμε;

• Τι μπορούμε να πούμε για το μέγεθος δείγματος; Γενικώς,


εξαρτάται από τα χαρακτηριστικά του πληθυσμού, το πρόβλημα
που μελετάμε και την ακρίβεια που επιθυμούμε.

• Ένα μεγάλο μέγεθος δείγματος, λύνει όλα τα προβλήματα που


σχετίζονται με τον τρόπο δειγματοληψίας;

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 23


Ερωτηματολόγιο

Πολλές φορές, όπως συμβαίνει στις κοινωνικές επιστήμες, τα άτομα του


δείγματός μας καλούνται να απαντήσουν σ' ένα πλήθος ερωτήσεων-σ’ ένα
ερωτηματολόγιο (ή αλλιώς, κλίμακα, scale).

Τα ερωτηματολόγια στις κοινωνικές επιστήμες, είναι από τα


σπουδαιότερα εργαλεία.

Όμως, η κατασκευή (δημιουργία) ενός ερωτηματολογίου, χρειάζεται


ιδιαίτερη προσοχή.

Η Αξιοπιστία (Reliability) και η Εγκυρότητα (Validity) ενός


ερωτηματολογίου, θα πρέπει να διερευνάται.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 24


Τι σημαίνει αξιοπιστία και εγκυρότητα, ενός ερωτηματολογίου;

Γενικώς, θα μπορούσαμε να πούμε ότι ένα ερωτηματολόγιο (ή όργανο


μέτρησης) θεωρείται έγκυρο αν όντως μετράει το χαρακτηριστικό για το
οποίο σχεδιάστηκε.

Αξιόπιστο θα είναι εάν π.χ. μας δίνει τις ίδιες μετρήσεις, όταν
χρησιμοποιείται για τα ίδια άτομα και κάτω από τις ίδιες συνθήκες.

Προσοχή:

• Ένα ερωτηματολόγιο κατάλληλο («έγκυρο» και «αξιόπιστο») για


ένα πληθυσμό, δε σημαίνει ότι θα είναι κατάλληλο και για ένα άλλο!

• Προφανώς, ένα μη κατάλληλο ερωτηματολόγιο, μας οδηγεί σε


λανθασμένα συμπεράσματα!

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 25


Γενικώς, ένα ερωτηματολόγιο πρέπει:

1. Να μην έχει ούτε πολύ μεγάλο, ούτε πολύ μικρό, πλήθος


ερωτήσεων.

2. Οι ερωτήσεις πρέπει να είναι ξεκάθαρες, κατανοητές και


τοποθετημένες σε λογική σειρά.

3. Εάν χρειάζεται, να υπάρχουν ερωτήσεις που διασταυρώνουν την


ορθότητα των απαντήσεων του ερωτώμενου.

4. κ.α.

Οι ερωτήσεις μπορεί να είναι «Ανοικτές», «Κλειστές» ή και συνδυασμός


αυτών.

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 26


Προσοχή!

To call in the statistician (in statistics!) after the experiment is done may
be no more than asking him to perform a post-mortem examination: he
may be able to say what the experiment died of.
R. Fisher

Τι εννοούμε με το παραπάνω;

Στατιστική Ι, Πάντειο Πανεπιστήμιο, Αθήνα 2023 Μάθημα 1ο, Σελ. 27

You might also like