Professional Documents
Culture Documents
SPSS δωρεάν εγχειρίδιο test 001
SPSS δωρεάν εγχειρίδιο test 001
ο σύντομος οδηγός
από την
Εύα Παρασκευαδάκη
Eύα Παρασκευαδάκη
Msc. Ηλ. Μηχανικός & Μηχανικός Υπολογιστών, ΕΜΠ
ΑΘΗΝΑ, 2020
1. ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ............................................8
2. ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ................................................16
3. ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ....................................24
ΠΡΙΝ ΞΕΚΙΝΉΣΕΤΕ...
Εάν δεν έχετε πρόσβαση στην πλήρη έκδοση του SPSS, μπορείτε να κατεβάσετε
το λογισμικό στη δοκιμαστική έκδοση, κάνοντας εγγραφή στο παρακάτω link:
https://www.ibm.com/account/reg/us-en/signup?formid=urx-19774
Εάν δεν έχετε καθόλου πρόσβαση στο SPSS, μπορείτε να κατεβάσετε το αντί-
στοιχο λογισμικό ανοικτού κώδικα PSPP το οποίο και θα βρείτε στο παρακάτω link:
https://sourceforge.net/projects/pspp4windows/
Βήμα 2o : Ανοίξτε το πρόγραμμα SPSS (ή PSPP αντίστοιχα) Βήμα 3o : Κατεβάστε τα αρχεία δεδομένων
Ανοίξτε το αρχείο δεδομένων
Μετά την εγκατάσταση, θα πρέπει να έχει δημιουργηθεί μία συντόμευση του Ανοίξτε το αρχείο example_database.sav, που λάβατε στο e-mail:
προγράμματος στην επιφάνεια εργασίας σας. Κάνετε διπλό κλικ πάνω στη
συντόμευση και το πρόγραμμα θα ανοίξει. Από το Μενού ακολουθήστε File → Open → Data
Θα πρέπει να βλέπετε το παρακάτω παράθυρο. Επίσης έχουμε μια μεταβλητή που ονομάζεται Ικανοποίηση από τη Ζωή. Οι τιμές
που παίρνει, είναι το σκορ του κάθε συμμετέχοντα σε μια κλίμακα.
Πηγαίνετε στο φάκελο που έχετε αποθηκεύσει το αρχείο:
example_database.sav Όσο μεγαλύτερος είναι ο αριθμός τόσο μεγαλύτερη η ικανοποίηση που νιώθει ο
Eπιλέξτε το και στη συνέχεια πατήστε Open. συμμετέχοντας. Με την ίδια λογική έχουν κωδικοποιηθεί και οι μεταβλητές Στρες
και Αυτοεκτίμηση.
Επιλογή Μεταβλητών
Αποτελέσματα
Στα αποτελέσματα εμφανίζονται δύο πίνακες, ο πρώτος για το φύλο και ο
δεύτερος για την οικογενειακή κατάσταση.
Ας δούμε τον πίνακα για το φύλο, όπως φαίνεται παρακάτω:
Η πρώτη στήλη Frequency παρουσιάζει τον αριθμό των ατόμων ανά κατηγορία
της μεταβλητής. Επομένως στο παράδειγμα έχουμε 185 άνδρες και 254 γυναίκες.
Η δεύτερη στήλη Percent παρουσιάζει το ποσοστό στο οποίο αντιστοιχεί κάθε
ένα από τα παραπάνω νούμερα. Έτσι, το 42.1% του δείγματος είναι άνδρες.
Το ποσοστό αυτό υπολογίζεται διαιρώντας τον αριθμό των ανδρών (185) με το
σύνολο του δείγματος (439) και πολλαπλασιάζοντας το αποτέλεσμα με 100 ώστε
να προκύψει ποσοστό (%).
Ομοίως γίνεται και για τις γυναίκες. Προκύπτει ότι οι γυναίκες αποτελούν το
57.9% του δείγματος.
Η τρίτη στήλη Valid percent παρουσιάζει το έγκυρο ποσοστό. Αυτό, στο 1.2 ΔΗΜΙΟΥΡΓΊΑ ΓΡΑΦΗΜΆΤΩΝ
παράδειγμά μας, είναι ίδιο με το απλό ποσοστό, καθώς δεν έχουμε missing
values.
Για τη δημιουργία γραφημάτων έχουμε δύο επιλογές.
Αν κάποιοι από το δείγμα μας, δεν είχαν απαντήσει στην ερώτηση φύλο τότε
το έγκυρο ποσοστό θα υπολογιζόταν διαιρώντας με τον αριθμό των έγκυρων Επιλογή 1
απαντήσεων (όχι το 439 που είναι το σύνολο του δείγματος).
Από το κεντρικό μενού ακολουθούμε τη διαδρομή:
Analyze→ Descriptive Statistics→ Frequencies-→ Charts
Επιλογή 2
2. Κάνουμε drag & drop του πρώτου γραφήματος στο πλαίσιο Chart preview.
1.3 ΔΕΊΚΤΕΣ ΚΕΝΤΡΙΚΉΣ ΤΆΣΗΣ ΚΑΙ Από το μενού που βρίσκεται στα δεξιά του παραθύρου, επιλέγουμε το κουμπί
ΔΙΑΣΠΟΡΆΣ Statistics.
Ανοίγει ένα παράθυρο που παρουσιάζει διάφορους δείκτες κεντρικής τάσης
Από το κεντρικό μενού ακολουθούμε τη διαδρομή: (Central Tendency) και διασποράς (Dispersion).
Analyze→ Descriptive Statistics→ Frequencies Επιλέγουμε τον δείκτη κεντρικής τάσης Mean (μέσος όρος) και τον δείκτη
διασποράς Std. Deviation (τυπική απόκλιση).
Επιλέγουμε όλες τις συνεχείς μεταβλητές που έχουμε στη βάση δεδομένων,
δηλαδή:
•• ηλικία
•• ικανοποίηση από τη ζωή
•• αντιληπτό στρες
•• αυτοεκτίμηση
Φροντίζουμε να μην είναι επιλεγμένο το κουτί Display frequency tables.
Ο μέσος όρος (ή η μέση τιμή) είναι ο πιο δημοφιλής και γνωστός δείκτης
κεντρικής τάσης. Υπολογίζεται συνήθως για συνεχείς μεταβλητές.
Ο μέσος όρος είναι ίσος με το άθροισμα όλων των τιμών στο σύνολο δεδομένων
δια τον αριθμό των τιμών. Έτσι, αν έχουμε n δεδομένα και αυτά έχουν τιμές x1,
x2, ..., xn, ο μέσος όρος υπολογίζεται από την εξίσωση:
Η τυπική απόκλιση είναι ένας δείκτης της διασποράς των τιμών γύρω από το Παρουσιάζουμε τα αποτελέσματα ως εξής:
μέσο όρο, σε ένα σύνολο δεδομένων. Ο τύπος της τυπικής απόκλισης είναι: Το δείγμα παρουσιάζει μέσο όρο ηλικίας:
37.44±13.20 έτη
ή 37.44 έτη (Τ.Α.=13.20)
Ο μέσος όρος της βαθμολογίας του δείγματος στη κλίμακα της ικανοποίησης από
όπου:
τη ζωή είναι:
s = τυπική απόκλιση δείγματος
22.38±6.77
Σ= άθροισμα
ή 22.38 (Τ.Α.=6.77)
Χ = μέσος όρος δείγματος
Χ = επιμέρους τιμές δείγματος
n = αριθμός δεδομένων στο δείγμα. Ο μέσος όρος της βαθμολογίας του δείγματος στη κλίμακα αντιληπτού στρες είναι:
26.73±5.85.
Πατάμε Continue και στη συνέχεια ΟΚ. Στο αρχείο των αποτελεσμάτων ή 26.73 (Τ.Α.=5.85)
παρουσιάζεται ο πίνακας με υπολογισμένες τους μέσους όρους και τις τυπικές
αποκλίσεις όλων των μεταβλητών που βάλαμε.
Ο έλεγχος σημαντικότητας της μηδενικής υπόθεσης είναι μια διαδικασία Για να ελέγξουμε αν η εναλλακτική υπόθεση, στο δικό μας παράδειγμα, είναι
που ακολουθούμε για να μάθουμε αν η εναλλακτική υπόθεση είναι πιθανόν αληθής, θα πρέπει να βρούμε αν η διαφορά στη μέση τιμή του στρες μεταξύ
να είναι αληθής, αν δηλαδή ισχύει. Τα βήματα της διαδικασίας είναι τα εξής: των φύλων, είναι στατιστικά σημαντική. Επειδή το φύλο είναι μια κατηγορική
μεταβλητή με δύο μόνο κατηγορίες, θα υλοποιήσουμε t-test ανεξαρτήτων
δειγμάτων.
Σχολιασμός αποτελεσμάτων
Ελέγχουμε τώρα τις επόμενες στήλες. Η στατιστική σημαντικότητα του t-test Ποιο φύλο όμως έχει υψηλότερα επίπεδα στρες;
φαίνεται από τη στήλη Sig. (2-tailed) και συγκεκριμένα θα πρέπει αυτή η τιμή να
είναι μικρότερη από 0.05 (το αντίθετο από το test του Levene).
Αυτό θα το δούμε από τον πρώτο πίνακα, συγκρίνοντας τις μέσες τιμές του στρες
Στο παράδειγμά μας η τιμή του Sig. (2-tailed) είναι 0.004 < 0.05, επομένως υπάρχει για τα δύο φύλα.
στατιστικά σημαντική διαφορά στα επίπεδα στρες μεταξύ των δύο φύλων.
Παρατηρούμε ότι η μέση τιμή στρες για τις γυναίκες είναι 27.42 και η μέση
τιμή στρες για τους άνδρες είναι 25.79. Επομένως οι γυναίκες παρουσιάζουν
υψηλότερα επίπεδα στρες από τους άνδρες.
Έστω ότι θέλουμε να ελέγξουμε μία υπόθεση που περιλαμβάνει δύο συνεχείς Ακολουθούμε τη διαδρομή:
μεταβλητές, πχ. την αυτοεκτίμηση και το στρες.
Analyze → Correlate → Bivariate
Τότε η εναλλακτική μας υπόθεση διατυπώνεται ως εξής:
Η1: Όσο υψηλότερα είναι τα επίπεδα αυτοεκτίμησης τόσο χαμηλότερα είναι
τα επίπεδα στρες.
Επιλογή Μεταβλητών
Τώρα επιλέγουμε τις μεταβλητές των οποίων τη συσχέτιση θέλουμε να
μελετήσουμε. Στο παράδειγμά μας, αυτές είναι η Αυτοεκτίμηση και το Αντιληπτό
Στρες.
Μεταφέρουμε λοιπόν αυτές τις μεταβλητές στο πλαίσιο Variables.
Εφόσον ελέγξουμε ότι στα Correlation Coefficients είναι επιλεγμένο του κουτί
Pearson, πατάμε ΟΚ.
Σχολιασμός αποτελεσμάτων
Μας ενδιαφέρουν οι δύο τιμές που έχουν επισημανθεί στον Πίνακα με κίτρινο
χρώμα.
Η πρώτη, είναι η τιμή του συντελεστή συσχέτισης Pearson Correlation και είναι ίση
με -0.576. Εφόσον η τιμή αυτή είναι μεγαλύτερη από 0.5 λέμε ότι υπάρχει ισχυρή
συσχέτιση. Το πρόσημο της τιμής είναι αρνητικό, επομένως η συσχέτιση είναι
αρνητική. Η αρνητική συσχέτιση σημαίνει ότι όταν η μία μεταβλητή αυξάνεται,
η άλλη μειώνεται.
Η δεύτερη τιμή Sig. (2-tailed) είναι η στατιστική σημαντικότητα, η οποία, όπως
και στο t-test, θα πρέπει να είναι μικρότερη του 0.05 για να έχουμε στατιστικά
σημαντική συσχέτιση. Στο παράδειγμά μας η τιμή είναι 0.000<0.05 επομένως το
αποτέλεσμα είναι στατιστικά σημαντικό.
Η παρουσίαση των αποτελεσμάτων της ανάλυσης συσχετίσεων γίνεται ως εξής:
Υπάρχει αρνητική, ισχυρή, στατιστικά σημαντική συσχέτιση μεταξύ αντιληπτού
στρες και αυτοεκτίμησης (r=-0.576, p=0.000<0.05)
Σχολιασμός αποτελεσμάτων Αρχικά πηγαίνουμε στον δεύτερο πίνακα ANOVA και εξετάζουμε την τιμή του
Sig. στη τελευταία στήλη. Η τιμή αυτή θέλουμε να είναι μικρότερη του 0.05 για
Στο παράθυρο των αποτελεσμάτων παρουσιάζονται οι τρεις πίνακες, όπως
να είναι στατιστικά σημαντικό το μοντέλο της γραμμικής παλινδρόμησης. Στο
φαίνονται παρακάτω. Με κίτρινο έχουν επισημανθεί οι τιμές που μας ενδια-
παράδειγμά μας, η τιμή αυτή είναι 0.000<0.05 και συμπεραίνουμε ότι το μοντέλο
φέρουν για να εξάγουμε συμπεράσματα.
είναι στατιστικά σημαντικό.
Στη συνέχεια πηγαίνουμε στον πρώτο πίνακα και εξετάζουμε την τιμή R square
στη δεύτερη στήλη. Το R square παίρνει τιμές μεταξύ 0 και 1. Όσο πιο κοντά
στο 1 είναι η τιμή τόσο καλύτερα ταιριάζει το μοντέλο στα δεδομένα μας. Το 1
ισοδυναμεί με το 100% της μεταβλητότητας. Στο παράδειγμά μας, λέμε ότι το
μοντέλο εξηγεί το 23.8% της μεταβλητότητας.
Τέλος εξετάζουμε τον τρίτο πίνακα και βλέπουμε από την τιμή του Sig. στη
τελευταία στήλη ότι η Αυτοεκτίμηση είναι στατιστικά σημαντική για το μοντέλο
μας καθώς Sig. =0.000<0.05.
Ακολουθούμε τη διαδρομή:
Analyze →Regression → Linear
Σχολιασμός αποτελεσμάτων Αρχικά πηγαίνουμε στον δεύτερο πίνακα ANOVA και εξετάζουμε την τιμή του
Sig. στη τελευταία στήλη. Η τιμή αυτή θέλουμε να είναι μικρότερη του 0.05 για
Στο παράθυρο των αποτελεσμάτων παρουσιάζονται οι τρεις πίνακες,
να είναι στατιστικά σημαντικό το μοντέλο της γραμμικής παλινδρόμησης. Στο
όπως φαίνονται παρακάτω. Με κίτρινο έχουν επισημανθεί οι τιμές που μας
παράδειγμά μας, η τιμή αυτή είναι 0.000<0.05 και συμπεραίνουμε ότι το μοντέλο
ενδιαφέρουν για να εξάγουμε συμπεράσματα.
είναι στατιστικά σημαντικό.
Στη συνέχεια πηγαίνουμε στον πρώτο πίνακα και εξετάζουμε την τιμή R square
στη δεύτερη στήλη. Στο παράδειγμά μας, λέμε ότι το μοντέλο εξηγεί το 31% της
μεταβλητότητας.
Τέλος εξετάζουμε τον τρίτο πίνακα και βλέπουμε από την τιμή του Sig. στη
τελευταία στήλη ότι η Αυτοεκτίμηση είναι στατιστικά σημαντική για το μοντέλο
μας καθώς Sig. =0.000<0.05. Το Aντιληπτό στρες είναι επίσης στατιστικά
σημαντικό για το μοντέλο μας καθώς Sig. =0.000<0.05.
Ακολουθούμε τη διαδρομή:
Analyze→Regression→Binary Logistic
Σχολιασμός αποτελεσμάτων Αρχικά πηγαίνουμε στον πρώτο πίνακα Omnibus Tests of Model Coefficients
και εξετάζουμε την τιμή του Sig. στη τελευταία στήλη (συγκεκριμένα την τιμή
Στο παράθυρο των αποτελεσμάτων παρουσιάζονται οι τρεις πίνακες,
στη τελευταία γραμμή, η οποία αντιστοιχεί στο μοντέλο). Η τιμή αυτή θέλουμε
όπως φαίνονται παρακάτω. Με κίτρινο έχουν επισημανθεί οι τιμές που μας
να είναι μικρότερη του 0.05 για να είναι στατιστικά σημαντικό το μοντέλο της
ενδιαφέρουν για να εξάγουμε συμπεράσματα.
γραμμικής παλινδρόμησης. Στο παράδειγμά μας, η τιμή αυτή είναι 0.656>0.05
και συμπεραίνουμε ότι το μοντέλο δεν είναι στατιστικά σημαντικό.
Στη συνέχεια πηγαίνουμε στον δεύτερο πίνακα Model Summary και εξετά-
ζουμε την τιμή Nagelkerke R square στη δεύτερη στήλη. Στο παράδειγμά μας,
λέμε ότι το μοντέλο εξηγεί μόνο το 0.6% της μεταβλητότητας.
Τέλος εξετάζουμε τον τρίτο πίνακα και βλέπουμε από την τιμή του Sig. στη
τελευταία στήλη ότι καμία από τις ανεξάρτητες μεταβλητές που μελετήσαμε δεν
είναι στατιστικά σημαντική για το μοντέλο καθώς Sig. >0.05.