SPSS δωρεάν εγχειρίδιο test 001

SPSS
ο σύντομος οδηγός
από την
Εύα Παρασκευαδάκη
Εγχειρίδιο SPSS για αρχάριους

SPSS
ο σύντομος οδηγός
Eύα Παρασκευαδάκη
Msc. Ηλ. Μηχανικός & Μηχανικός Υπολογιστών, ΕΜΠ
ΑΘΗΝΑ, 2020
ΧΑΡΙΛΑΟΥ ΤΡΙΚΟΥΠΗ 83, ΑΘΗΝΑ 10681

THΛ.: +(30) 213 037 9875, +(30) 698 239 0154
Web site: stepupadvisor.gr • e-mail: info@stepupadvisor.gr
Το παρόν εγχειρίδιο SPSS θα σας βοηθήσει να κάνετε
τα πρώτα σας βήματα στον κόσμο της ανάλυσης
δεδομένων με το SPSS!
Περιεχόμενα
0. ΕΙΣΑΓΩΓΉ........................................................................6
1. ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ............................................8
1.1 Ανάλυση Συχνοτήτων..............................................................8
1.2 Δημιουργία Γραφημάτων.................................................... 10
1.3 Δείκτες Κεντρικής Τάσης και Διασποράς....................... 14
2. ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ................................................16
2.1 Διατύπωση Υποθέσεων....................................................... 17
2.2 T-test Ανεξάρτητων Δειγμάτων......................................... 18
2.3 Συσχέτιση Pearson................................................................ 21
3. ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ....................................24
3.1 Απλή Παλινδρόμηση.............................................................. 24
3.2 Πολλαπλή Παλινδρόμηση................................................... 27
3.3 Λογιστική Παλινδρόμηση................................................... 29

Εισαγωγή
ΠΡΙΝ ΞΕΚΙΝΉΣΕΤΕ...
Βήμα 1o : Εγκαταστήστε το SPSS στον υπολογιστή σας
Εάν δεν έχετε πρόσβαση στην πλήρη έκδοση του SPSS, μπορείτε να κατεβάσετε
το λογισμικό στη δοκιμαστική έκδοση, κάνοντας εγγραφή στο παρακάτω link:
https://www.ibm.com/account/reg/us-en/signup?formid=urx-19774
Εάν δεν έχετε καθόλου πρόσβαση στο SPSS, μπορείτε να κατεβάσετε το αντί-
στοιχο λογισμικό ανοικτού κώδικα PSPP το οποίο και θα βρείτε στο παρακάτω link:
https://sourceforge.net/projects/pspp4windows/
Βήμα 2o : Ανοίξτε το πρόγραμμα SPSS (ή PSPP αντίστοιχα) Βήμα 3o : Κατεβάστε τα αρχεία δεδομένων
Ανοίξτε το αρχείο δεδομένων
Μετά την εγκατάσταση, θα πρέπει να έχει δημιουργηθεί μία συντόμευση του Ανοίξτε το αρχείο example_database.sav, που λάβατε στο e-mail:
προγράμματος στην επιφάνεια εργασίας σας. Κάνετε διπλό κλικ πάνω στη
συντόμευση και το πρόγραμμα θα ανοίξει. Από το Μενού ακολουθήστε File → Open → Data
Με το άνοιγμα του προγράμματος αναδύεται ένα παράθυρο το οποίο σας ρωτά

αν επιθυμείτε να ανοίξετε ένα υπάρχον αρχείο δεδομένων. Πατήστε Cancel,
ώστε να κλείσει το παράθυρο αυτό.
Σελίδα 6 SPSS - O σύντομος οδηγός

Περιεχόμενα stepupadvisor.gr
Εισαγωγή
Θα πρέπει να βλέπετε το παρακάτω παράθυρο. Επίσης έχουμε μια μεταβλητή που ονομάζεται Ικανοποίηση από τη Ζωή. Οι τιμές
που παίρνει, είναι το σκορ του κάθε συμμετέχοντα σε μια κλίμακα.
Πηγαίνετε στο φάκελο που έχετε αποθηκεύσει το αρχείο:
example_database.sav Όσο μεγαλύτερος είναι ο αριθμός τόσο μεγαλύτερη η ικανοποίηση που νιώθει ο
Eπιλέξτε το και στη συνέχεια πατήστε Open. συμμετέχοντας. Με την ίδια λογική έχουν κωδικοποιηθεί και οι μεταβλητές Στρες
και Αυτοεκτίμηση.
Θα πρέπει τώρα στην οθόνη σας να εμφανιστεί η βάση δεδομένων.

Η πρώτη σειρά δείχνει τα ονόματα των μεταβλητών. Μπορούμε να καταλάβουμε
ότι έχουμε 9 μεταβλητές και μεταξύ αυτών, είναι το φύλο (1=άνδρες, 2=γυναίκες).
SPSS - O σύντομος οδηγός Σελίδα 7

stepupadvisor.gr Περιεχόμενα
Ενότητα 1 - Περιγραφική Στατιστική
Η περιγραφική στατιστική μας βοηθά να “ανακαλύψουμε” τα μοτίβα ή

τις τάσεις που κρύβουν τα δεδομένα μας. Ωστόσο, τα περιγραφικά
στατιστικά στοιχεία:
Ανοίγει το παράθυρο που φαίνεται παρακάτω:
•• δεν μας επιτρέπουν να καταλήξουμε σε συμπεράσματα

•• δεν μπορούν να ελέγξουν υποθέσεις
1.1 ΑΝΆΛΥΣΗ ΣΥΧΝΟΤΉΤΩΝ
Επιλογή της ανάλυσης
Από το κεντρικό μενού ακολουθούμε τη διαδρομή:

Analyze→Descriptive Statistics→ Frequencies
Επιλογή Μεταβλητών
Στην ανάλυση συχνοτήτων περιλαμβάνονται ΜΟΝΟ κατηγορικές μεταβλητές.

Μόνο σε αυτές έχει νόημα το ποσοστό και το αθροιστικό ποσοστό.
Στο παράδειγμα μας, επιλέγουμε τη μεταβλητή φύλο και οικογενειακή κατάσταση.
Προσέχουμε, ώστε το κουτάκι Display Frequency Tables κάτω αριστερά να
είναι επιλεγμένο!

Αποτελέσματα
Στα αποτελέσματα εμφανίζονται δύο πίνακες, ο πρώτος για το φύλο και ο
δεύτερος για την οικογενειακή κατάσταση.
Ας δούμε τον πίνακα για το φύλο, όπως φαίνεται παρακάτω:
Πατάμε ΟΚ και λαμβάνουμε τα αποτελέσματα, δηλαδή τους πίνακες των

συχνο-τήτων, στο παράθυρο Output.
Η πρώτη στήλη Frequency παρουσιάζει τον αριθμό των ατόμων ανά κατηγορία
της μεταβλητής. Επομένως στο παράδειγμα έχουμε 185 άνδρες και 254 γυναίκες.
Η δεύτερη στήλη Percent παρουσιάζει το ποσοστό στο οποίο αντιστοιχεί κάθε
ένα από τα παραπάνω νούμερα. Έτσι, το 42.1% του δείγματος είναι άνδρες.
Το ποσοστό αυτό υπολογίζεται διαιρώντας τον αριθμό των ανδρών (185) με το
σύνολο του δείγματος (439) και πολλαπλασιάζοντας το αποτέλεσμα με 100 ώστε
να προκύψει ποσοστό (%).
Ομοίως γίνεται και για τις γυναίκες. Προκύπτει ότι οι γυναίκες αποτελούν το
57.9% του δείγματος.

Η τρίτη στήλη Valid percent παρουσιάζει το έγκυρο ποσοστό. Αυτό, στο 1.2 ΔΗΜΙΟΥΡΓΊΑ ΓΡΑΦΗΜΆΤΩΝ
παράδειγμά μας, είναι ίδιο με το απλό ποσοστό, καθώς δεν έχουμε missing
values.
Για τη δημιουργία γραφημάτων έχουμε δύο επιλογές.
Αν κάποιοι από το δείγμα μας, δεν είχαν απαντήσει στην ερώτηση φύλο τότε
το έγκυρο ποσοστό θα υπολογιζόταν διαιρώντας με τον αριθμό των έγκυρων Επιλογή 1
απαντήσεων (όχι το 439 που είναι το σύνολο του δείγματος).
Από το κεντρικό μενού ακολουθούμε τη διαδρομή:
Analyze→ Descriptive Statistics→ Frequencies-→ Charts
Όταν ανοίξει το παράθυρο Charts βλέπουμε ότι έχουμε τη δυνατότητα

επιλογής μεταξύ 3 τύπων γραφήματος: Bar charts (ραβδογράμματα), Pie charts
(διαγράμματα πίτας) και Histograms (ιστογράμματα).

Στο παράθυρο των αποτελεσμάτων εμφανίζονται δύο διαγράμματα πίτας, ένα

για κάθε μεταβλητή.
Κάνουμε διπλό κλικ πάνω στο πρώτο διάγραμμα για το φύλο. Ανοίγει ο Chart
Editor και το παράθυρο Properties:
Για το παράδειγμά μας, επιλέγουμε να απεικονίσουμε τις μεταβλητές φύλο

και οικογενειακή κατάσταση, σε μορφή διαγραμμάτων πίτας, στα οποία να
φαίνονται τα ποσοστά κάθε κατηγορίας. Έτσι επιλέγουμε:
Chart type → Pie Chart

Chart Values → Percentages
Πατάμε το κουμπί Show Data Labels που βρίσκεται αριστερά, στο μενού του
Chart Editor. Εμφανίζονται τα ποσοστά στο διάγραμμα πίτας. Κλείνουμε με Χ το
Πατάμε Continue, αναιρούμε την επιλογή Display frequencies tables και στη
παράθυρο του Chart Editor και τα ποσοστά εμφανίζονται πλέον στο διάγραμμα
συνέχεια πατάμε ΟΚ.
του παραθύρου Output.

Επιλογή 2
Γραφήματα μπορούμε να δημιουργήσουμε και με άλλον τρόπο. Από το κεντρικό

μενού ακολουθούμε τη διαδρομή:
Graphs→ Chart Builder
Με αυτόν τον τρόπο έχουμε περισσότερες επιλογές όσον αφορά τους τύπους
διαγραμμάτων που μπορούμε να δημιουργήσουμε.
Το παράθυρο του Chart Builder εμφανίζεται.
Ας δημιουργήσουμε τώρα ένα ιστόγραμμα για τη μεταβλητή της
αυτοεκτίμησης.

1. Επιλέγουμε τον τύπο γραφήματος Histogram από τη καρτέλα Gallery.
3. Κάνουμε drag & drop της

μεταβλητής της Στρες στον
άξονα χ του Chart preview
και στη συνέχεια πατάμε ΟΚ.
2. Κάνουμε drag & drop του πρώτου γραφήματος στο πλαίσιο Chart preview.
Στο παράθυρο των

αποτελεσμάτων Output,
εμφανίζεται το παρακάτω
ιστόγραμμα:

1.3 ΔΕΊΚΤΕΣ ΚΕΝΤΡΙΚΉΣ ΤΆΣΗΣ ΚΑΙ Από το μενού που βρίσκεται στα δεξιά του παραθύρου, επιλέγουμε το κουμπί
ΔΙΑΣΠΟΡΆΣ Statistics.
Ανοίγει ένα παράθυρο που παρουσιάζει διάφορους δείκτες κεντρικής τάσης
Από το κεντρικό μενού ακολουθούμε τη διαδρομή: (Central Tendency) και διασποράς (Dispersion).
Analyze→ Descriptive Statistics→ Frequencies Επιλέγουμε τον δείκτη κεντρικής τάσης Mean (μέσος όρος) και τον δείκτη
διασποράς Std. Deviation (τυπική απόκλιση).
Επιλέγουμε όλες τις συνεχείς μεταβλητές που έχουμε στη βάση δεδομένων,
δηλαδή:
•• ηλικία
•• ικανοποίηση από τη ζωή
•• αντιληπτό στρες
•• αυτοεκτίμηση
Φροντίζουμε να μην είναι επιλεγμένο το κουτί Display frequency tables.

Ο μέσος όρος (ή η μέση τιμή) είναι ο πιο δημοφιλής και γνωστός δείκτης
κεντρικής τάσης. Υπολογίζεται συνήθως για συνεχείς μεταβλητές.
Ο μέσος όρος είναι ίσος με το άθροισμα όλων των τιμών στο σύνολο δεδομένων
δια τον αριθμό των τιμών. Έτσι, αν έχουμε n δεδομένα και αυτά έχουν τιμές x1,
x2, ..., xn, ο μέσος όρος υπολογίζεται από την εξίσωση:
Η τυπική απόκλιση είναι ένας δείκτης της διασποράς των τιμών γύρω από το Παρουσιάζουμε τα αποτελέσματα ως εξής:
μέσο όρο, σε ένα σύνολο δεδομένων. Ο τύπος της τυπικής απόκλισης είναι: Το δείγμα παρουσιάζει μέσο όρο ηλικίας:
37.44±13.20 έτη
ή 37.44 έτη (Τ.Α.=13.20)
Ο μέσος όρος της βαθμολογίας του δείγματος στη κλίμακα της ικανοποίησης από
όπου:
τη ζωή είναι:
s = τυπική απόκλιση δείγματος
22.38±6.77
Σ= άθροισμα
ή 22.38 (Τ.Α.=6.77)
Χ = μέσος όρος δείγματος
Χ = επιμέρους τιμές δείγματος
n = αριθμός δεδομένων στο δείγμα. Ο μέσος όρος της βαθμολογίας του δείγματος στη κλίμακα αντιληπτού στρες είναι:
26.73±5.85.
Πατάμε Continue και στη συνέχεια ΟΚ. Στο αρχείο των αποτελεσμάτων ή 26.73 (Τ.Α.=5.85)
παρουσιάζεται ο πίνακας με υπολογισμένες τους μέσους όρους και τις τυπικές
αποκλίσεις όλων των μεταβλητών που βάλαμε.

Ενότητα 2 - Έλεγχος Υποθέσεων
Έ χουμε δει ότι τα περιγραφικά στατιστικά στοιχεία παρέχουν πληροφορίες

σχετικά με την ομάδα δεδομένων μας. Για παράδειγμα, υπολογίσαμε τη
μέση τιμή και την τυπική απόκλιση για το αντιληπτό στρες του δείγματός μας.
Πατάμε ΟΚ και στο παράθυρο των αποτελεσμάτων παρουσιάζεται το
γράφημα, όπως φαίνεται παρακάτω:
Επίσης δημιουργήσαμε και το ιστόγραμμα του αντιληπτού στρες.

Έστω ότι θέλουμε να μάθουμε ποιο από τα δύο φύλα, οι άνδρες ή οι γυναίκες,
παρουσιάζει υψηλότερα επίπεδα στρες. Μπορούμε να υπολογίσουμε τη μέση
τιμή και την τυπική απόκλιση για τα επίπεδα στρες κάθε φύλου ξεχωριστά.
Ακολουθώντας την ίδια διαδικασία που αναφέρθηκε στην Επιλογή 2 της
δημιουργίας γραφημάτων, ανοίγουμε ξανά το Chart Builder και επιλέγουμε τον
τύπο διαγράμματος Boxplot.
Στον άξονα x κάνουμε drag & drop τη μεταβλητή φύλο και στον άξονα y βάζουμε
τη μεταβλητή αντιληπτό στρες:
Βλέπουμε ότι οι γυναίκες έχουν υψηλότερα επίπεδα στρες.

Αυτό αποτελεί, προς το παρόν, μια παρατήρηση και όχι ένα εύρημα.
Κι αυτό, γιατί δεν γνωρίζουμε ακόμα αν η μικρή διαφορά, που παρατηρούμε
μεταξύ των μέσων όρων στρες των δύο φύλων, είναι στατιστικά σημαντική!

2.1 ΔΙΑΤΎΠΩΣΗ ΥΠΟΘΈΣΕΩΝ

•• Υποθέτουμε ότι η εναλλακτική υπόθεση (H1) ισχύει – είναι αληθής.
•• Επιλέγουμε ένα στατιστικό μοντέλο που αναπαριστά την εναλλακτική
Για να ελέγξουμε τη στατιστική σημαντικότητα, θα πρέπει να διατυπώσουμε μια
υπόθεση (H1).
υπόθεση. Έστω λοιπόν ότι:
•• Εφαρμόζουμε αυτό το μοντέλο στα δεδομένα μας και βλέπουμε αν έχει
Η1: Οι γυναίκες παρουσιάζουν υψηλότερα επίπεδα στρες από τους άνδρες.
καλή προσαρμογή. Βλέπουμε δηλαδή αν εξηγεί τη διασπορά των τιμών.
Αυτή η υπόθεση ονομάζεται εναλλακτική υπόθεση (συχνά συμβολίζεται ως Η1).
•• Υπολογίζουμε την πιθανότητα, το μοντέλο μας να ισχύει και για τη
μηδενική υπόθεση (H0).
Η αντίθετη υπόθεση, ονομάζεται μηδενική και συνήθως λέει ότι δεν υπάρχει •• Αν η πιθανότητα είναι μικρή (p<0,05) τότε λέμε ότι το μοντέλο μας είναι
επίδραση (συμβολίζεται ως Η0). Στην περίπτωση μας, η μηδενική υπόθεση είναι: καλό, γιατί εξηγεί καλά τη μεταβλητότητα των τιμών.
Η0: Το φύλο δεν επηρεάζει τα επίπεδα στρες. •• Συμπεραίνουμε έτσι, ότι η η μηδενική υπόθεση (H0) απορρίπτεται και
αποδεχόμαστε την εναλλακτική (H1).
Ο έλεγχος σημαντικότητας της μηδενικής υπόθεσης είναι μια διαδικασία Για να ελέγξουμε αν η εναλλακτική υπόθεση, στο δικό μας παράδειγμα, είναι
που ακολουθούμε για να μάθουμε αν η εναλλακτική υπόθεση είναι πιθανόν αληθής, θα πρέπει να βρούμε αν η διαφορά στη μέση τιμή του στρες μεταξύ
να είναι αληθής, αν δηλαδή ισχύει. Τα βήματα της διαδικασίας είναι τα εξής: των φύλων, είναι στατιστικά σημαντική. Επειδή το φύλο είναι μια κατηγορική
μεταβλητή με δύο μόνο κατηγορίες, θα υλοποιήσουμε t-test ανεξαρτήτων
δειγμάτων.

2.2 Τ-TEST ΑΝΕΞΑΡΤΉΤΩΝ ΔΕΙΓΜΆΤΩΝ Επιλογή Μεταβλητών

Η επιλογή των μεταβλητών σχετίζεται άμεσα με την υπόθεση που θέλουμε να
ελέγξουμε. Στο παράδειγμά μας:
Η1: Οι γυναίκες παρουσιάζουν υψηλότερα επίπεδα στρες από τους άνδρες.
Ακολουθούμε τη διαδρομή:
Επομένως θα πρέπει να χρησιμοποιήσουμε τις μεταβλητές φύλο και αντιληπτό
Analyze→ Compare Means→ Independent Samples T-Test
στρες.
Όπως έχουμε διατυπώσει την υπόθεσή μας, η μεταβλητή φύλο είναι η ανεξάρτητη
μεταβλητή και η μεταβλητή αντιληπτό στρες είναι η εξαρτημένη μεταβλητή.
Η ανεξάρτητη μεταβλητή φύλο, στο παράθυρο του t-test, τοποθετείται στη θέση
της Grouping Variable.
Η εξαρτημένη μεταβλητή αντιληπτό στρες, στο παράθυρο του t-test, τοποθετείται
στη θέση της Test Variable.
Έτσι, το παράθυρο του

Ανοίγει το παράθυρο:
t-test θα πρέπει να έχει τη
παρακάτω μορφή:
Παρατηρούμε ότι στη θέση
Grouping Variable, η
μεταβλητή φύλο εμφανίζει
κάποια ερωτηματικά (? ?).

Σχολιασμός αποτελεσμάτων
Για να παρουσιάσουμε τα αποτελέσματα του

Αυτό σημαίνει ότι θα πρέπει
T-test μας ενδιαφέρουν συγκεκριμένες τιμές
να συμπληρώσουμε τις τιμές
των δύο πινάκων.
που αντιστοιχούν στις δύο
κατηγορίες (1=άνδρας και Αρχικά θέλουμε να δούμε αν υπάρχει στα-
2=γυναίκα). τιστικά σημαντική διαφορά μεταξύ των δύο
φύλων. Για να αποδεχτούμε τα αποτελέσματα
του t-test ως έγκυρα, θα πρέπει να υπάρχει
ομοιογένεια διακυμάνσεων, η οποία εξε-τάζεται
από το test του Levene.
Αυτό γίνεται επιλέγοντας Define Groups και βάζοντας στο Group 1 την τιμή 1
και στο Group 2 την τιμή 2.
Ομοιογένεια διακυμάνσεων υπάρχει εάν στη στήλη Sig. του Levene η τιμή
Πατάμε Continue και στη συνέχεια ΟΚ. Στο παράθυρο των αποτελεσμάτων, είναι μεγαλύτερη του 0.05.
εμφανίζονται οι ακόλουθοι πίνακες
Στο παράδειγμά μας η τιμή του Sig. είναι 0.165>0.05 επομένως υπάρχει
ομοιογένεια διακυμάνσεων και μπορούμε να αποδεχτούμε ως έγκυρα τα
αποτελέσματα του t-test.

Ελέγχουμε τώρα τις επόμενες στήλες. Η στατιστική σημαντικότητα του t-test Ποιο φύλο όμως έχει υψηλότερα επίπεδα στρες;
φαίνεται από τη στήλη Sig. (2-tailed) και συγκεκριμένα θα πρέπει αυτή η τιμή να
είναι μικρότερη από 0.05 (το αντίθετο από το test του Levene).
Αυτό θα το δούμε από τον πρώτο πίνακα, συγκρίνοντας τις μέσες τιμές του στρες
Στο παράδειγμά μας η τιμή του Sig. (2-tailed) είναι 0.004 < 0.05, επομένως υπάρχει για τα δύο φύλα.
στατιστικά σημαντική διαφορά στα επίπεδα στρες μεταξύ των δύο φύλων.
Παρατηρούμε ότι η μέση τιμή στρες για τις γυναίκες είναι 27.42 και η μέση
τιμή στρες για τους άνδρες είναι 25.79. Επομένως οι γυναίκες παρουσιάζουν
υψηλότερα επίπεδα στρες από τους άνδρες.
Η παρουσίαση των αποτελεσμάτων του t-test ανεξαρτήτων δειγμάτων γίνεται

ως εξής:
Υλοποιήθηκε t-test ανεξαρτήτων δειγμάτων για να εξετασθεί η επίδραση του
φύλου στα επίπεδα αντιληπτού στρες. Βρέθηκε ότι υπάρχει στατιστικά σημαντική
διαφορά μεταξύ των φύλων στο αντιληπτό στρες [ t(431)=-2.89, p=0.004<0.05) ]
και, πιο συγκεκριμένα, οι γυναίκες παρουσιάζουν υψηλότερα επίπεδα στρες από
τους άνδρες.
Εφόσον υπάρχει επίδραση του φύλου στο στρες και οι γυναίκες έχουν
περισσότερο στρες από τους άνδρες, απορρίπτουμε τη μηδενική υπόθεση και
αποδεχόμαστε την εναλλακτική υπόθεση Η1.

2.3 ΣΥΣΧΈΤΙΣΗ PEARSON Επιλογή της ανάλυσης
Έστω ότι θέλουμε να ελέγξουμε μία υπόθεση που περιλαμβάνει δύο συνεχείς Ακολουθούμε τη διαδρομή:
μεταβλητές, πχ. την αυτοεκτίμηση και το στρες.
Analyze → Correlate → Bivariate
Τότε η εναλλακτική μας υπόθεση διατυπώνεται ως εξής:
Η1: Όσο υψηλότερα είναι τα επίπεδα αυτοεκτίμησης τόσο χαμηλότερα είναι
τα επίπεδα στρες.
Η μηδενική υπόθεση είναι:

Η0: Δεν υπάρχει σχέση μεταξύ των επιπέδων αυτοεκτίμησης και στρες.
Όταν πρόκειται για δύο συνεχείς μεταβλητές, θα πρέπει να διερευνήσουμε αν

υπάρχει συσχέτιση μεταξύ τους. Αυτό γίνεται υπολογίζοντας τον συντελεστή
συσχέτισης Pearson, που είναι ο πιο δημοφιλής δείκτης συσχέτισης μεταξύ Το παράθυρο που ανοίγει έχει αυτή τη μορφή:
συνεχών μεταβλητών.
Το μέτρο και το πρόσημο του συντελεστή συσχέτισης θα μας δώσει περαιτέρω
πληροφορίες για το είδος της συσχέτισης.

Επιλογή Μεταβλητών
Τώρα επιλέγουμε τις μεταβλητές των οποίων τη συσχέτιση θέλουμε να
μελετήσουμε. Στο παράδειγμά μας, αυτές είναι η Αυτοεκτίμηση και το Αντιληπτό
Στρες.
Μεταφέρουμε λοιπόν αυτές τις μεταβλητές στο πλαίσιο Variables.
Εφόσον ελέγξουμε ότι στα Correlation Coefficients είναι επιλεγμένο του κουτί
Pearson, πατάμε ΟΚ.

Σχολιασμός αποτελεσμάτων
Στο παράθυρο αποτελεσμάτων, εμφανίζεται ένας πίνακας της παρακάτω

μορφής:
Μας ενδιαφέρουν οι δύο τιμές που έχουν επισημανθεί στον Πίνακα με κίτρινο
χρώμα.
Η πρώτη, είναι η τιμή του συντελεστή συσχέτισης Pearson Correlation και είναι ίση
με -0.576. Εφόσον η τιμή αυτή είναι μεγαλύτερη από 0.5 λέμε ότι υπάρχει ισχυρή
συσχέτιση. Το πρόσημο της τιμής είναι αρνητικό, επομένως η συσχέτιση είναι
αρνητική. Η αρνητική συσχέτιση σημαίνει ότι όταν η μία μεταβλητή αυξάνεται,
η άλλη μειώνεται.
Η δεύτερη τιμή Sig. (2-tailed) είναι η στατιστική σημαντικότητα, η οποία, όπως
και στο t-test, θα πρέπει να είναι μικρότερη του 0.05 για να έχουμε στατιστικά
σημαντική συσχέτιση. Στο παράδειγμά μας η τιμή είναι 0.000<0.05 επομένως το
αποτέλεσμα είναι στατιστικά σημαντικό.
Η παρουσίαση των αποτελεσμάτων της ανάλυσης συσχετίσεων γίνεται ως εξής:
Υπάρχει αρνητική, ισχυρή, στατιστικά σημαντική συσχέτιση μεταξύ αντιληπτού
στρες και αυτοεκτίμησης (r=-0.576, p=0.000<0.05)

Ενότητα 3 - Ανάλυση Παλινδρόμησης
Η ανάλυση παλινδρόμησης είναι μια ισχυρή στατιστική μέθοδος που μας

επιτρέπει να εξετάσουμε τη σχέση μεταξύ δύο ή περισσοτέρων μεταβλητών.
Υπάρχουν πολλοί τύποι ανάλυσης παλινδρόμησης. Όλοι όμως εξετάζουν την
3.1 ΑΠΛΉ ΠΑΛΙΝΔΡΌΜΗΣΗ
Η απλή γραμμική παλινδρόμηση χρησιμοποιείται όταν θέλουμε να προβλέψουμε
επίδραση μιας ή περισσότερων ανεξάρτητων μεταβλητών, σε μια εξαρτημένη
την τιμή μιας μεταβλητής με βάση την τιμή μιας άλλης μεταβλητής.
μεταβλητή.
Η μεταβλητή που θέλουμε να προβλέψουμε ονομάζεται εξαρτημένη μεταβλητή
Η διαδικασία εκτέλεσης μιας παλινδρόμησης, μας επιτρέπει να προσδιορίσουμε
(ή μερικές φορές μεταβλητή αποτελέσματος).
με βεβαιότητα (στατιστική σημαντικότητα) τους παράγοντες που έχουν
μεγαλύτερη σημασία. Επίσης εντοπίζουμε τους παράγοντες που μπορούν να Η μεταβλητή που χρησιμοποιούμε για να προβλέψουμε την τιμή της άλλης
αγνοηθούν και πώς επιδρά ο ένας παράγοντας στον άλλο. μεταβλητής ονομάζεται ανεξάρτητη μεταβλητή (ή μερικές φορές μεταβλητή
πρόβλεψης).
Προκειμένου να κατανοηθεί πλήρως η ανάλυση παλινδρόμησης, είναι σημαντικό
να κατανοήσουμε τους ακόλουθους όρους: Για παράδειγμα, θα μπορούσαμε να χρησιμοποιήσουμε απλή γραμμική
παλινδρόμηση για να καταλάβουμε αν η Ικανοποίηση από τη Ζωή μπορεί να
προβλεφθεί από την Αυτοεκτίμηση.
Εξαρτημένη μεταβλητή
Είναι η μεταβλητή που προσπαθούμε να καταλάβουμε ή να προβλέψουμε. Επιλογή της ανάλυσης
Ανεξάρτητες μεταβλητές Analyze → Regression → Linear
Αυτές είναι οι μεταβλητές που υποθέτουμε ότι επηρεάζουν την εξαρτημένη

μεταβλητή.

Ανοίγει το εξής παράθυρο: Επιλογή μεταβλητών
Στη θέση Dependent μεταφέρουμε τη μεταβλητή Ικανοποίηση από τη Ζωή.

Στη θέση Independents μεταφέρουμε τη μεταβλητή Αυτοεκτίμηση.
Πατάμε ΟΚ και λαμβάνουμε τα αποτελέσματα.

Σχολιασμός αποτελεσμάτων Αρχικά πηγαίνουμε στον δεύτερο πίνακα ANOVA και εξετάζουμε την τιμή του
Sig. στη τελευταία στήλη. Η τιμή αυτή θέλουμε να είναι μικρότερη του 0.05 για
Στο παράθυρο των αποτελεσμάτων παρουσιάζονται οι τρεις πίνακες, όπως
να είναι στατιστικά σημαντικό το μοντέλο της γραμμικής παλινδρόμησης. Στο
φαίνονται παρακάτω. Με κίτρινο έχουν επισημανθεί οι τιμές που μας ενδια-
παράδειγμά μας, η τιμή αυτή είναι 0.000<0.05 και συμπεραίνουμε ότι το μοντέλο
φέρουν για να εξάγουμε συμπεράσματα.
είναι στατιστικά σημαντικό.
Στη συνέχεια πηγαίνουμε στον πρώτο πίνακα και εξετάζουμε την τιμή R square
στη δεύτερη στήλη. Το R square παίρνει τιμές μεταξύ 0 και 1. Όσο πιο κοντά
στο 1 είναι η τιμή τόσο καλύτερα ταιριάζει το μοντέλο στα δεδομένα μας. Το 1
ισοδυναμεί με το 100% της μεταβλητότητας. Στο παράδειγμά μας, λέμε ότι το
μοντέλο εξηγεί το 23.8% της μεταβλητότητας.
Τέλος εξετάζουμε τον τρίτο πίνακα και βλέπουμε από την τιμή του Sig. στη
τελευταία στήλη ότι η Αυτοεκτίμηση είναι στατιστικά σημαντική για το μοντέλο
μας καθώς Sig. =0.000<0.05.

3.2 ΠΟΛΛΑΠΛΉ ΠΑΛΙΝΔΡΌΜΗΣΗ

Αν έχουμε δύο ή περισσότερες ανεξάρτητες μεταβλητές, αντί για μία, πρέπει να
χρησιμοποιήσουμε πολλαπλή παλινδρόμηση. Ανοίγει το εξής παράθυρο:
Η πολλαπλή παλινδρόμηση είναι μια επέκταση της απλής γραμμικής

παλινδρόμησης.
Χρησιμοποιείται όταν θέλουμε να προβλέψουμε την τιμή μιας μεταβλητής που
βασίζεται στην τιμή δύο ή περισσοτέρων άλλων μεταβλητών. Επιλογή μεταβλητών
Η πολλαπλή παλινδρόμηση μας επιτρέπει επίσης να προσδιορίσουμε τη Στη θέση Dependent μεταφέρουμε τη μεταβλητή Ικανοποίηση από τη Ζωή.
συνολική προσαρμογή (εξήγηση διακύμανσης) του μοντέλου και τη σχετική
Στη θέση Independents μεταφέρουμε τη μεταβλητή Αυτοεκτίμηση και τη
συνεισφορά καθενός από τους παράγοντες πρόβλεψης στην εξήγηση της
μεταβλητή Αντιληπτό Στρες.
συνολικής διακύμανσης.
Έτσι, μπορούμε τώρα να δούμε αν η Ικανοποίηση από τη Ζωή μπορεί να
προβλεφθεί από το Στρες και την Αυτοεκτίμηση.
Analyze →Regression → Linear

Σχολιασμός αποτελεσμάτων Αρχικά πηγαίνουμε στον δεύτερο πίνακα ANOVA και εξετάζουμε την τιμή του
Sig. στη τελευταία στήλη. Η τιμή αυτή θέλουμε να είναι μικρότερη του 0.05 για
Στο παράθυρο των αποτελεσμάτων παρουσιάζονται οι τρεις πίνακες,
να είναι στατιστικά σημαντικό το μοντέλο της γραμμικής παλινδρόμησης. Στο
όπως φαίνονται παρακάτω. Με κίτρινο έχουν επισημανθεί οι τιμές που μας
παράδειγμά μας, η τιμή αυτή είναι 0.000<0.05 και συμπεραίνουμε ότι το μοντέλο
ενδιαφέρουν για να εξάγουμε συμπεράσματα.
είναι στατιστικά σημαντικό.
Στη συνέχεια πηγαίνουμε στον πρώτο πίνακα και εξετάζουμε την τιμή R square
στη δεύτερη στήλη. Στο παράδειγμά μας, λέμε ότι το μοντέλο εξηγεί το 31% της
μεταβλητότητας.
τελευταία στήλη ότι η Αυτοεκτίμηση είναι στατιστικά σημαντική για το μοντέλο
μας καθώς Sig. =0.000<0.05. Το Aντιληπτό στρες είναι επίσης στατιστικά
σημαντικό για το μοντέλο μας καθώς Sig. =0.000<0.05.

3.3 ΛΟΓΙΣΤΙΚΉ ΠΑΛΙΝΔΡΌΜΗΣΗ

Η λογιστική παλινδρόμηση (logistic regression ή logit regression ή logit model),
είναι μια ανάλυση που χρησιμοποιείται όταν η εξαρτημένη μεταβλητή είναι Ανοίγει το εξής παράθυρο:
διχοτομική (δηλαδή κατηγορική με δύο μόνο κατηγορίες).
Προβλέπει την πιθανότητα μια παρατήρηση να εμπίπτει σε μία από τις δύο
κατηγορίες της εξαρτημένης μεταβλητής.
Οι ανεξάρτητες μεταβλητές μπορεί να είναι είτε συνεχείς είτε κατηγορικές.
Για παράδειγμα, θα μπορούσαμε να χρησιμοποιήσουμε τη λογιστική Επιλογή μεταβλητών
παλινδρόμηση για να εξετάσουμε σε ποιο βαθμό η Ικανοποίηση από τη Ζωή,
Στη θέση Dependent μεταφέρουμε τη μεταβλητή Κάπνισμα.
η Αυτοεκτίμηση και το Στρες, μπορούν να προβλέψουν το αν κάποιος είναι
καπνιστής ή όχι. Στη θέση Independents μεταφέρουμε τις μεταβλητές Αυτοεκτίμηση, Αντιληπτό
Στρες και Ικανοποίηση από τη Ζωή.
Analyze→Regression→Binary Logistic

Σχολιασμός αποτελεσμάτων Αρχικά πηγαίνουμε στον πρώτο πίνακα Omnibus Tests of Model Coefficients
και εξετάζουμε την τιμή του Sig. στη τελευταία στήλη (συγκεκριμένα την τιμή
Στο παράθυρο των αποτελεσμάτων παρουσιάζονται οι τρεις πίνακες,
στη τελευταία γραμμή, η οποία αντιστοιχεί στο μοντέλο). Η τιμή αυτή θέλουμε
όπως φαίνονται παρακάτω. Με κίτρινο έχουν επισημανθεί οι τιμές που μας
να είναι μικρότερη του 0.05 για να είναι στατιστικά σημαντικό το μοντέλο της
ενδιαφέρουν για να εξάγουμε συμπεράσματα.
γραμμικής παλινδρόμησης. Στο παράδειγμά μας, η τιμή αυτή είναι 0.656>0.05
και συμπεραίνουμε ότι το μοντέλο δεν είναι στατιστικά σημαντικό.
Στη συνέχεια πηγαίνουμε στον δεύτερο πίνακα Model Summary και εξετά-
ζουμε την τιμή Nagelkerke R square στη δεύτερη στήλη. Στο παράδειγμά μας,
λέμε ότι το μοντέλο εξηγεί μόνο το 0.6% της μεταβλητότητας.
τελευταία στήλη ότι καμία από τις ανεξάρτητες μεταβλητές που μελετήσαμε δεν
είναι στατιστικά σημαντική για το μοντέλο καθώς Sig. >0.05.


SPSS δωρεάν εγχειρίδιο test 001

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

SPSS δωρεάν εγχειρίδιο test 001

Uploaded by

Copyright:

Available Formats

SPSS

Εγχειρίδιο SPSS για αρχάριους

ΧΑΡΙΛΑΟΥ ΤΡΙΚΟΥΠΗ 83, ΑΘΗΝΑ 10681

1.1 Ανάλυση Συχνοτήτων..............................................................8

1.2 Δημιουργία Γραφημάτων.................................................... 10

1.3 Δείκτες Κεντρικής Τάσης και Διασποράς....................... 14

2.1 Διατύπωση Υποθέσεων....................................................... 17

2.2 T-test Ανεξάρτητων Δειγμάτων......................................... 18

2.3 Συσχέτιση Pearson................................................................ 21

3.1 Απλή Παλινδρόμηση.............................................................. 24

3.2 Πολλαπλή Παλινδρόμηση................................................... 27

3.3 Λογιστική Παλινδρόμηση................................................... 29

Βήμα 1o : Εγκαταστήστε το SPSS στον υπολογιστή σας

Με το άνοιγμα του προγράμματος αναδύεται ένα παράθυρο το οποίο σας ρωτά

Σελίδα 6 SPSS - O σύντομος οδηγός

Θα πρέπει τώρα στην οθόνη σας να εμφανιστεί η βάση δεδομένων.

SPSS - O σύντομος οδηγός Σελίδα 7

Η περιγραφική στατιστική μας βοηθά να “ανακαλύψουμε” τα μοτίβα ή

•• δεν μας επιτρέπουν να καταλήξουμε σε συμπεράσματα

1.1 ΑΝΆΛΥΣΗ ΣΥΧΝΟΤΉΤΩΝ

Επιλογή της ανάλυσης

Από το κεντρικό μενού ακολουθούμε τη διαδρομή:

Στην ανάλυση συχνοτήτων περιλαμβάνονται ΜΟΝΟ κατηγορικές μεταβλητές.

Σελίδα 8 SPSS - O σύντομος οδηγός

Πατάμε ΟΚ και λαμβάνουμε τα αποτελέσματα, δηλαδή τους πίνακες των

SPSS - O σύντομος οδηγός Σελίδα 9

Όταν ανοίξει το παράθυρο Charts βλέπουμε ότι έχουμε τη δυνατότητα

Σελίδα 10 SPSS - O σύντομος οδηγός

Στο παράθυρο των αποτελεσμάτων εμφανίζονται δύο διαγράμματα πίτας, ένα

Για το παράδειγμά μας, επιλέγουμε να απεικονίσουμε τις μεταβλητές φύλο

Chart type → Pie Chart

SPSS - O σύντομος οδηγός Σελίδα 11

Γραφήματα μπορούμε να δημιουργήσουμε και με άλλον τρόπο. Από το κεντρικό

Σελίδα 12 SPSS - O σύντομος οδηγός

1. Επιλέγουμε τον τύπο γραφήματος Histogram από τη καρτέλα Gallery.

3. Κάνουμε drag & drop της

Στο παράθυρο των

SPSS - O σύντομος οδηγός Σελίδα 13

Σελίδα 14 SPSS - O σύντομος οδηγός

SPSS - O σύντομος οδηγός Σελίδα 15

Έ χουμε δει ότι τα περιγραφικά στατιστικά στοιχεία παρέχουν πληροφορίες

Επίσης δημιουργήσαμε και το ιστόγραμμα του αντιληπτού στρες.

Βλέπουμε ότι οι γυναίκες έχουν υψηλότερα επίπεδα στρες.

Σελίδα 16 SPSS - O σύντομος οδηγός

2.1 ΔΙΑΤΎΠΩΣΗ ΥΠΟΘΈΣΕΩΝ

SPSS - O σύντομος οδηγός Σελίδα 17

2.2 Τ-TEST ΑΝΕΞΑΡΤΉΤΩΝ ΔΕΙΓΜΆΤΩΝ Επιλογή Μεταβλητών

Έτσι, το παράθυρο του

Σελίδα 18 SPSS - O σύντομος οδηγός

Για να παρουσιάσουμε τα αποτελέσματα του

SPSS - O σύντομος οδηγός Σελίδα 19

Η παρουσίαση των αποτελεσμάτων του t-test ανεξαρτήτων δειγμάτων γίνεται

Σελίδα 20 SPSS - O σύντομος οδηγός

2.3 ΣΥΣΧΈΤΙΣΗ PEARSON Επιλογή της ανάλυσης

Η μηδενική υπόθεση είναι:

Όταν πρόκειται για δύο συνεχείς μεταβλητές, θα πρέπει να διερευνήσουμε αν

SPSS - O σύντομος οδηγός Σελίδα 21

Σελίδα 22 SPSS - O σύντομος οδηγός

Στο παράθυρο αποτελεσμάτων, εμφανίζεται ένας πίνακας της παρακάτω

SPSS - O σύντομος οδηγός Σελίδα 23

Η ανάλυση παλινδρόμησης είναι μια ισχυρή στατιστική μέθοδος που μας

Ανεξάρτητες μεταβλητές Analyze → Regression → Linear

Αυτές είναι οι μεταβλητές που υποθέτουμε ότι επηρεάζουν την εξαρτημένη