You are on page 1of 91

ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων

Υποδειγματοποίηση Δομικών Εξισώσεων (Structural Equation Modeling - SEM)

Γεώργιος Σ. Ανδρουλάκης

Διατμηματικό Μεταπτυχιακό Πρόγραμμα Σπουδών


Πληροφορική Επιστημών Ζωής,
http://androulakis.bma.upatras.gr/mediawiki
http://eclass.upatras.gr

9 Απριλίου 2018

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 1 / 91
Εισαγωγή

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 2 / 91
Εισαγωγή

Υπόδειγμα Δομικών Εξισώσεων

Τα Υποδείγματα Δομικών Εξισώσεων (Sructural Equation Models) είναι μια


οικογένεια πολυμεταβλητών στατιστικών αναλύσεων που αναφέρονται σε
γραμμικές συσχετίσεις μεταξύ (ποσοτικών, κυρίως) μεταβλητών και έχουν
επικυρωτικό/επιβεβαιωτικό χαρακτήρα.
Δηλαδή, τα SEM επιτρέπουν:
την απεικόνιση θεωρητικών σχημάτων-υποθέσεων,
την εκτίμηση των στατιστικών παραμέτρων τους (π.χ. φορτία, διακυμάνσεις και
συνδιακυμάνσεις παραγόντων, διακυμάνσεις σφαλμάτων υπολοίπων και σφαλμάτων
μέτρησης), και
τον έλεγχο της προσαρμογής τους στα εμπειρικά δεδομένα.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 3 / 91
Εισαγωγή

Παράδειγμα Δομικού Υποδείγματος


Οι λανθάνουσες μεταβλητές σχεδιάζονται ως κύκλοι. Οι μετρήσιμες μεταβλητές
εμφανίζονται ως τετράγωνα. Τα κατάλοιπα και οι διαφορές απεικονίζονται ως διπλά
βέλη σε ένα αντικείμενο. Σημειώστε λανθάνουσα μεταβλητή IQ σταθερή στο 1 για να
παράσχετε κλίμακα στο υπόδειγμα. 1

1Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 4 / 91
Εισαγωγή

Που χρησιμοποιούμε SEM: (1) Path analysis

Ανάλυση διαδρομής είναι η εφαρμογή


υποδειγματοποίησης διαρθρωτικών
εξισώσεων χωρίς λανθάνουσες
μεταβλητές.

Ένα από τα πλεονεκτήματα είναι η


συμπερίληψη σχέσεων μεταξύ
μεταβλητών που χρησιμεύουν ως
πρόβλεψη σε ένα ενιαίο μοντέλο.

Στο υπόδειγμα περιλαμβάνονται


μεταβλητές με διαφορετικές σχέσεις
διαμεσολάβησης.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 5 / 91
Εισαγωγή

Που χρησιμοποιούμε SEM: (2) Επιβεβαιωτική Ανάλυση


Παραγόντων (Confirmatory Factor Analysis - CFA)

Η επιβεβαιωτική ανάλυση παραγόντων


περιλαμβάνει παρατηρήσιμες, όσο και
λανθάνουσες μεταβλητές.
Στη CFA το μοντέλο μέτρησης
(measurement model) αφορά στις
σχέσεις ανάμεσα στη λανθάνουσα
μεταβλητή και τις παρατηρήσιμες
μεταβλητές που την προσδιορίζουν...
...ενώ το δομικό μοντέλο (structural
model) αναφέρεται στις αιτιώδεις
σχέσεις μεταξύ των λανθανουσών
μεταβλητών.
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 6 / 91
Εισαγωγή

Που χρησιμοποιούμε SEM: (3) Ανάλυση διαδρομής σε


λανθάνουσες μεταβλητές

Χρησιμοποιεί κυρίως τις μετρηθείσες


λανθάνουσες μεταβλητές εντός του
πλαισίου ανάλυσης διαδρομής.
Μόλις δηλώσετε τις λανθάνουσες
μεταβλητές, μπορείτε να υποθέσετε
και να δοκιμάσετε τις σχέσεις τους.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 7 / 91
Εισαγωγή

Που χρησιμοποιούμε SEM: (4) Υποδείγματα καμπυλών


ανάπτυξης

Υπό την προϋπόθεση ότι έχετε


πολλαπλές παρατηρήσεις της ίδιας
μεταβλητής με την πάροδο του
χρόνου, μπορείτε να ορίσετε ένας
σταθερό όρο και μία κλίση για τις
παρατηρούμενες τιμές των
υποκειμένων με την πάροδο του
χρόνου ως λανθάνουσες μεταβλητές
περιορίζοντας τους συντελεστές
διαδρομής με έναν συγκεκριμένο
τρόπο.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 8 / 91
Εισαγωγή

Υπόδειγμα δομικών εξισώσεων

Τα βήματα που ακολουθούμε για μία ανάλυση SEM


1 Διαμόρφωση των θεωρητικών υποθέσεων
2 Προσδιορισμός της δομής του υποδείγματος
3 Ταυτοποίηση της δομής του υποδείγματος
4 Υπολογισμός των παραμέτρων
5 Αξιολόγηση των παραμέτρων
6 (Πιθανή) τροποποίηση του υποδείγματος

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 9 / 91
Βασικές έννοιες γραμμικής άλγεβρας

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 10 / 91
Βασικές έννοιες γραμμικής άλγεβρας

Προσδοκίες και συνδιακύμανση

Είναι χρήσιμο να μάθετε πώς να εργάζεστε με τις προσδοκίες και τις διακυμάνσεις.
Θα εισαγάγουμε ορισμένους κανόνες την προσδοκία, τη διακύμανση και τη
συνδιακύμανση που θα είναι χρήσιμοι καθώς αναπτύσσουμε τη θεωρία για τα
υποδείγματα δομικών εξισώσεων.
Συμβολισμός:
E προσδοκία ή μαθηματική ελπίδα ή αναμενόμενη μέση τιμή,
V η διακύμανση,
C η συνδιακύμανση

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 11 / 91
Βασικές έννοιες γραμμικής άλγεβρας

Προσδοκία - μαθηματική ελπίδα


Βασικές αρχές της προσδοκίας:
1 Ο μέσος μίας σταθεράς ... είναι σταθερός
E(α) = α
2 Ο πολλαπλασιασμός με σταθερά ... πολλαπλασιάζει ομοίως την προσδοκία
E(αX) = αE(X)
3 Προσθέτοντας σταθερά ... σταθερά αυξάνουμε την προσδοκία
E(X + α) = E(X) + α
4 Η προσδοκία του αθροίσματος ... είναι άθροισμα των προσδοκιών
E(X + Y) = E(X) + E(Y)

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 12 / 91
Βασικές έννοιες γραμμικής άλγεβρας

Διακύμανση
Έστω Χ μία τυχαία μεταβλητή με μαθηματική ελπίδα Ε(Χ) και διακύμανση σ 2 .
Βασικές αρχές της διακύμανσης:
1 Ο διακύμανση σταθερής μεταβολής ... είναι αναλλοίωτη

V(X + α) = V(X)

2 Ο πολλαπλασιασμός με σταθερά ... πολλαπλασιάζει τετραγωνικά2 την


διακύμανση
V(αX) = α2 V(X) = α2 σX
3 Η προσδοκία του αθροίσματος (αλλά και της διαφοράς!!!) ... είναι άθροισμα των
προσδοκιών
V(X ± Y) = V(X) + V(Y) = σX
2
+ σY2

2
προσοχή: μην σας μπερδεύουν τα τετράγωνα, η σχέση είναι γραμμική !!!
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 13 / 91
Βασικές έννοιες γραμμικής άλγεβρας

Διακύμανση (συνέχεια)

Βασικές αρχές της διακύμανσης (συνέχεια):


4 Αν X και Y είναι ανεξάρτητα

E(XY) = E(X) · E(Y)

Προσοχή το αντίστροφο δεν ισχύει πάντα.


5 Αν E(XY) ̸= E(X) · E(Y) τότε οι Χ και Y δεν είναι ανεξάρτητες.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 14 / 91
Βασικές έννοιες γραμμικής άλγεβρας

Συνδιακύμανση
Ορισμός της συνδιακύμανσης:
1 Συνδιακύμανση των X και Y είναι
C(XY) = E(XY) − E(X) · E(Y)
2 Εναλλακτικός ορισμός
C(XY) = E [(X − µX ) · E(Y − µY )]

Βασικές αρχές της συνδιακύμανσης:


1 Η συνδιακύμανση με σταθερά είναι πάντα μηδέν
C(X, α) = 0
2 Η συνδιακύμανση με πολλαπλάσιο είναι πολλαπλάσιο της συνδιακύμανσης
C(X, αY) = αC(X, Y)

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 15 / 91
Βασικές έννοιες γραμμικής άλγεβρας

Συνδιακύμανση (συνέχεια)

Βασικές αρχές της συνδιακύμανσης (συνέχεια):


3 H διακύμανση μιας τυχαίας μεταβλητής X ισούται με τη συνδιακύμανση με τον
εαυτό της
V(X) = C(X, X)
4 Η συνδιακύμανση του αθροίσματος τυχαίων μεταβλητών μεταβιβάζεται σε
άθροισμα των συνδιακυμάνσεων

V(X, Y + Z) = V(X, Y) + X(X, Z)

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 16 / 91
Βασικές έννοιες γραμμικής άλγεβρας

Συνδιακύμανση και συσχέτιση

Μπορούμε τώρα να ξαναγυρίσουμε στη συνδιακύμανση δύο τυχαίων μεταβλητών όταν


αυτές δεν είναι ανεξάρτητες:
2
σX±Y = σX + σY2 ± 2 · C(X, Y)

Επειδή, η συνδιακύμανση επηρεάζεται από τις μονάδες μέτρησης των X και Y,


ορίζουμε το συντελεστή συσχέτισης:

C(X, Y)
ρ=
σX · σY

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 17 / 91
Βασικές έννοιες γραμμικής άλγεβρας Μήτρες συνδιασποράς

Μήτρες συνδιασποράς

Αν θέλουμε να απεικονίσουμε τις συνδιασπορές μεταξύ τριών τυχαίων μεταβλητών


όταν αυτές δεν είναι ανεξάρτητες, αναγκαστικά πρέπει να υιοθετήσουμε πίνακες:
 
V(X) V(X, Y) V(X, Z)
V(Y, X) V(Y) V(Y, Z) 
V(Z, X) V(Z, Y) V(Z)

Επειδή, η συνδιακύμανση των X και Y, είναι ίδια ανεξάρτητα από ποιο θα προηγηθεί,
ο παραπάνω πίνακας είναι πάντα συμμετρικός.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 18 / 91
Βασικές έννοιες γραμμικής άλγεβρας Μήτρες συσχέτισης

Μήτρες συσχέτισης

Ισοδύναμα μπορούμε να φτιάξουμε το συντελεστή συσχετίσεων όπου:


 
1 C(X, Y) C(X, Z)
C(Y, X) 1 C(Y, Z) 
C(Z, X) C(Z, Y) 1

Κάνοντας μίξη των δύο παραπάνω πινάκων, πολλές φορές αναφέρεται ένας μικτός
πίνακας με την άνω διαγώνιο να έχει συνδιασπορές και την κάτω συσχετίσεις:
 
V(X) C(X, Y) C(X, Z)
V(Y, X) V(Y) C(Y, Z) 
V(Z, X) V(Z, Y) V(Z)

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 19 / 91
Βασικές έννοιες γραμμικής άλγεβρας Εξάρτηση δύο συνδιακυμάνσεων

Έλεγχος εξάρτησης μεταξύ δύο μεταβλητών

Πώς μπορούμε να ελέγξουμε αν δύο διακυμάνσεις από δύο μεταβλητές είναι


εξαρτημένες;
Με έναν έλεγχο ανάλογο με το t-test για τους μέσους.
Η συσχέτιση μεταξύ του αθροίσματος και της διαφοράς των δύο μεταβλητών είναι
ίδια με τη διαφορά των διακυμάνσεων των δύο εξαρτημένων μεταβλητών. Για να
δείτε αυτό, εξετάστε τον όρο συνδιακύμανσης, εφαρμόστε τον κανόνα αθροίσματος
και εφαρμόστε τον ορισμό ότι η συνδιακύμανση μιας μεταβλητής με τον εαυτό της
ισούται με τη διακύμανση. Αυτό δημιουργεί την ισότητα

C(X − Y, X + Y) = V(X) + V(Y)


Μπορούμε να δούμε ότι η δοκιμή αν η συνδιακύμανση (ή η συσχέτιση) είναι μηδέν,
είναι ισοδύναμη με το να εξετάσουμε εάν η διαφορά στις εξαρτώμενες διακυμάνσεις
είναι ίση με 0.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 20 / 91
Διασύνδεση παλινδρόμησης και μήτρας συνδιακυμάνσεων

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 21 / 91
Διασύνδεση παλινδρόμησης και μήτρας συνδιακυμάνσεων

Παλινδρόμηση και συνδιακυμάνσεις


Ποια είναι η σύνδεση μεταξύ ενός πίνακα συσχέτισης και της παλινδρόμησης;
Οι «συντελεστές βήτα» για κάθε μεταβλητή σε μια παλινδρόμηση μπορούν να
υπολογιστούν από τη μήτρα συσχέτισης των αντίστοιχων μεταβλητών.
Οι «συντελεστές βήτα» είναι τα βάρη παλινδρόμησης όταν κανονικοποιούνται
όλες οι μεταβλητές (αιτίες και αποτελέσματα). Σε ένα τέτοιο μοντέλο δεν
υπάρχει σταθερός όρος.
Έστω R η μήτρα συσχέτισης μόνο των αιτιών, b είναι το διάνυσμα των
«τυποποιημένων συντελεστών βήτα» και r το διάνυσμα των συσχετίσεων μεταξύ κάθε
αιτίας με το αποτέλεσμα. Η πολλαπλή παλινδρόμηση ικανοποιεί την ακόλουθη
εξίσωση:
R · b = r ⇒ b = R−1 · r
Με άλλα λόγια, αν έχουμε τον πίνακα συνδιακύμανσης δεν χρειαζόμαστε πλέον τα
αρχικά δεδομένα για να υπολογίσουμε τις παλινδρομήσεις.
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 22 / 91
Αξιοπιστία

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 23 / 91
Αξιοπιστία

Ορισμός αξιοπιστίας

Τι είναι η αξιοπιστία;
Ο τυπικός ορισμός χρησιμοποιεί το απλό υπόδειγμα αθροίσματος

X=T+ε

όπου το Χ είναι το παρατηρούμενο σκορ, το Τ είναι το πραγματικό σκορ και το ε


είναι το σφάλμα μέτρησης. Το σφάλμα μέτρησης μπορεί να είναι θετικό ή αρνητικό.
Συμπεριφέρεται με παρόμοιο τρόπο με το ε στην παλινδρόμηση / ANOVA, αλλά
υπάρχει μια μικρή διαφορά στην ερμηνεία.
Το ε στην παλινδρόμηση / ANOVA αξιολογεί την απόκλιση πρόβλεψης, δηλαδή, την
απόκλιση μεταξύ του σταθμισμένου αθροίσματος των αιτιών και του σταθερού όρου
και της παρατηρούμενης εξαρτημένης μεταβλητής.
Ωστόσο, το ε της αξιοπιστίας ερμηνεύεται ως σφάλμα μέτρησης. Μπορούμε να
έχουμε και τα δύο είδη σφαλμάτων στο ίδιο πρόβλημα.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 24 / 91
Αξιοπιστία

Ορισμός αξιοπιστίας

Η έννοια της αξιοπιστίας βασίζεται σε αποκλίσεις. Η αξιοπιστία της μεταβλητής X


ορίζεται ως

V(T) V(T)
reliability X= =
V(T) + V(ε) V(X)
Αλλά στην πράξη δεν γνωρίζουμε την πραγματική βαθμολογία Τ (ούτε το σφάλμα ε),
έτσι τι μπορούμε να κάνουμε; Πώς διαχωρίζουμε την πραγματική βαθμολογία από
την παρατηρούμενη βαθμολογία;
Μια προσέγγιση είναι ένα πείραμα test-retest. Ελέγξτε το άτομο στην ίδια μεταβλητή
δύο φορές. Υποθέτοντας ότι δεν υπάρχουν μεταβολές με την πάροδο του χρόνου στην
πραγματική βαθμολογία, ο χρόνος 1 επηρεάζεται από την ίδια "λανθάνουσα
μεταβλητή" όπως ο χρόνος 2. Το υπόδειγμα υποθέτει ότι η μόνη διαφορά μεταξύ των
δύο χρονικών περιόδων είναι το σφάλμα, το οποίο ορίζουμε ως ε1 και ε2 .

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 25 / 91
Αξιοπιστία

Μελέτη αξιοπιστίας

Το υπόδειγμα βασίζεται στην υπόθεση ότι τα μόνα σφάλματα που υπάρχουν είναι τα
σφάλματα

X 1 = T + ε1 X2 = T + ε2
Μπορούμε να εκμαιεύσουμε το πραγματικό σκορ με την απλή υπόθεση ότι τα
σφάλματα είναι ανεξάρτητα:

C(X1 , X2 ) = C(T + ε1 , T + ε2 )
= C(T, T) + C(T, ε1 ) + C(T, ε2 ) + C(ε1 , ε2 ) =
= C(T, T) =
= V(T)

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 26 / 91
Αξιοπιστία

Μελέτη αξιοπιστίας

Αν πάρουμε τον ορισμό της συσχέτισης έχουμε:

C(X1 , X2
ρ(X1 , X2 ) = √ =
V(X1 ) · V(X2 )
V(T)
= √ =
V(T + ε1 ) · V(T + ε2 )
V(T)
= =
V(T + ε)
= reliability X

Επομένως η αξιοπιστία ισούται με το συντελεστή συσχέτισης ενός πειράματος


test-retest !!!

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 27 / 91
Αξιοπιστία

Δομικό υπόδειγμα για το test-retest

Το αντίστοιχο δομικό μοντέλο είναι:

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 28 / 91
Αξιοπιστία

Μελέτη αξιοπιστίας
Η ίδια λογική επεκτείνεται στην πραγματική συσχέτιση μεταξύ δύο μεταβλητών,
καθεμία από τις οποίες μετριέται με το δικό της σφάλμα.

ρ(X, Y)
ρ(XT , T ) = √
reliability X · reliability Y
Αυτή η εξίσωση είναι σημαντική στη θεωρία των ελέγχων. Δείχνει ότι μια πραγματική
συσχέτιση είναι ίση με την παρατηρούμενη συσχέτιση (τον αριθμητή στη δεξιά
πλευρά) διαιρούμενη με το προϊόν των τετραγωνικών ριζών των συντελεστών
αξιοπιστίας.
Επομένως, το προϊόν της αξιοπιστίας χρησιμεύει για τη διόρθωση της
παρατηρούμενης συσχέτισης μεταξύ των δύο μεταβλητών.
Όσο και οι δύο αξιοπιστίες είναι μη μηδενικές και τουλάχιστον μία δεν είναι επίσης
ίση με 1, τότε η διόρθωση θα είναι πάντα η αύξηση της τιμής της παρατηρούμενης
συσχέτισης μεταξύ Χ και Υ. Η συσχέτιση στην παραπάνω Εξίσωση ονομάζεται
διόρθωση για εξασθένηση.
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 29 / 91
Τύπος Spearman-Brown

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 30 / 91
Τύπος Spearman-Brown

Τύπος Spearman-Brown

Η λογική του τύπου SB είναι να εκτιμηθεί η αξιοπιστία μιας δοκιμασίας του στοιχείου
k από τη γνώση της αξιοπιστίας των μεμονωμένων αντικειμένων.
Για παράδειγμα, ας υποθέσουμε ότι έχω ερωτηματολόγιο 5 ερωτήσεων και
γνωρίζω τις διασυνδέσεις κάθε ερώτησης με τις άλλες.
Ωστόσο, δεν γνωρίζω (χωρίς περαιτέρω υπολογισμούς) πώς το σκορ ενός ατόμου
σε αυτές τις 5 ερωτήσεις (δηλαδή, το άθροισμα των 5 ερωτήσεων) θα
συσχετίζονταν με το αθροισμένο σκορ τους σε άλλες 5 ερωτήσεις (όπου έχουν
δειγματιστεί από την ίδια ομάδα ερωτήσεων) ή πώς το άθροισμα αυτών των
πέντε ερωτήσεων σήμερα θα συσχετιστεί με τις ίδιες πέντε ερωτήσεις αύριο.
Με άλλα λόγια, θα θέλαμε να γνωρίζουμε την αξιοπιστία του τεστ πέντε
ερωτήσεων ως συνολικό σκορ, αλλά το μόνο που έχουμε είναι η ατομική
αξιοπιστία κάθε ερώτησης.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 31 / 91
Τύπος Spearman-Brown

Τύπος Spearman-Brown
Συμβολίζουμε τη συσχέτιση ενός ερωτήματος με ένα άλλο ερώτημα ως r11 (μερικά
βιβλία χρησιμοποιούν το rij για να δηλώσουν το στοιχείο i με το στοιχείο j).
Η συσχέτιση ενός αθροίσματος των αντικειμένων k με ένα άλλο άθροισμα των
στοιχείων k υποδηλώνεται με rkk .
Τύπος SB: Για να υπολογίσουμε το rkk , παίρνουμε
k · r11
rkk =
1 + (k − 1)r11
Έτσι, από τις εσωτερικές συσχετίσεις μεταξύ των k ερωτήσεων εκτιμάται η
αξιοπιστία του αθροίσματος των k ερωτήσεων. Αυτή η μορφή είναι γνωστή ως
τυποποιημένη έκδοση επειδή βασίζεται σε συσχετίσεις. (Υπάρχει επίσης μια μη
τυποποιημένη έκδοση που παρουσιάζεται παρακάτω)
Το όριο του SB όταν το k πηγαίνει στο άπειρο (μια απείρως μεγάλη δοκιμή) είναι
1, που αντιπροσωπεύει την τέλεια αξιοπιστία. Αυτό σημαίνει ότι καθώς αυξάνεται
ο αριθμός των ερωτήσεων μιας ομάδας, η αξιοπιστία θα αυξηθεί επίσης.
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 32 / 91
Το α του Cronbach

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 33 / 91
Το α του Cronbach

Το α του Cronbach

Τι κάνετε αν έχετε πολλές διαφορετικές συσχετίσεις μεταξύ ερωτημάτων, δηλαδή


έχετε αρκετές εκτιμήσεις του r11 ;
Θέλετε να υπολογίσετε ένα ενιαίο rkk χρησιμοποιώντας το Spearman-Brown, αλλά
πώς επιλέγετε μεταξύ των διαφόρων παρατηρούμενων r11 ;
Απλώς πάρτε τη μέση συσχέτιση, εφαρμόστε το S-B στο μέσο όρο και παίρνετε
αυτό που είναι γνωστό ως το τυποποιημένο Cronbach's α.
Έτσι, για να υπολογίσουμε το r11 από τα k στοιχεία, υπολογίζουμε όλες τις
πιθανές συσχετίσεις και το μέσο όρο (ναι, μέσο) των συσχετίσεων για να
υπολογίσουμε το r11 ∑
ij rij
r11 = ( k )
2

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 34 / 91
Αξιοπιστία και απλή παλινδρόμηση

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 35 / 91
Αξιοπιστία και απλή παλινδρόμηση

Αξιοπιστία και απλή παλινδρόμηση

Πώς επηρεάζεται το σφάλμα μέτρησης μιας γραμμικής παλινδρόμησης με έναν


προγνωστικό παράγοντα;
Έστω μια απλή γραμμική παλινδρόμηση. Το είδος του υποδείγματος
παλινδρόμησης που θέλουμε να μελετήσουμε είναι

Y = β0 + β1 X + ε

που το δηλώνει το πραγματικό Χ.


Ωστόσο, όταν υπάρχει σφάλμα μέτρησης στο Χ (χρησιμοποιώ το Χ για να
δηλώσω την παρατηρούμενη βαθμολογία), τότε το επιθυμητό μοντέλο μπορεί να
εκφραστεί ως
Y = β0 + β1 (X − εX ) + ε
όπου εX είναι το σφάλμα μέτρησης του Χ.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 36 / 91
Αξιοπιστία και απλή παλινδρόμηση

Αξιοπιστία και απλή παλινδρόμηση

Αυτή η τελευταία εξίσωση δείχνει ότι παραβιάζεται μια κρίσιμη υπόθεση στην
παλινδρόμηση: η ανεξαρτησία των όρων σφάλματος !!! Με την αναδιοργάνωση
των όρων έχουμε
Y = β0 + β1 X + (ε − β1 · εX )
επομένως το συνολικό σφάλμα ... συσχετίζεται με το Χ.
Ας μελετήσουμε τώρα τι επίπτωση έχει στο β το σφάλμα μέτρησης. Είναι γνωστό
ότι:
C(X, Y) C(XT , Y)
β1 = β1true =
V(X) V(XT )

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 37 / 91
Αξιοπιστία και απλή παλινδρόμηση

Αξιοπιστία και απλή παλινδρόμηση

Η συνδιακύμανση των Χ και Υ είναι ίση με

C(XT + εX ) = C(XT , Y) = β1true · V(XT )

Αν θυμηθούμε λίγο τον τύπο της αξιοπιστίας και συμβολίσουμε την αξιοπιστία
του Χ ως rXX καταλήγουμε με λίγες πράξεις στο

C(X, Y) β true · V(XT )


β1 = = 1 = β1true · rXX
V(X) V(X)

Επειδή η αξιοπιστία είναι πάντα ένας αριθμός μεταξύ 0 και 1, το β1 αποτελεί


πάντα υποεκτίμηση του πραγματικού. Επομένως, τα σφάλματα μετρήσεων
πάντα οδηγούν σε συστηματική μεροληψία στην κλίση της ευθείας
παλινδρόμησης.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 38 / 91
Αξιοπιστία και απλή παλινδρόμηση

Τι κάνουμε όταν ο προγνωστικός μας όρος έχει σφάλμα


μέτρησης;
Υπάρχουν πολλά πράγματα να κάνουμε για να αντιμετωπίσουμε το σφάλμα
μέτρησης.
Πρώτον, αν βρεθεί στατιστική σημαντικότητα με έναν "θορυβώδη" προγνωστικό
παράγοντα, τότε πιθανόν να είμαστε εντάξει επειδή ο θόρυβος πιθανώς έκανε τη
δοκιμή λιγότερο ισχυρή. Το πρόβλημα είναι όταν αποτυγχάνουμε να βρούμε
σημαντικότητα - όταν δηλαδή η πραγματική μεταβλητή X σχετίζεται, αλλά το
σφάλμα μέτρησης κάλυψε αυτή τη σχέση.
Δεύτερον, μια τεχνική που χρησιμοποιούμε περιλαμβάνει τη χρήση βοηθητικών
μεταβλητών». Μια βοηθητική μεταβλητή συσχετίζεται με το πραγματικό Χ αλλά
όχι με το σφάλμα μέτρησης στο Χ. Οι βοηθητικές μεταβλητές μπορούν στη
συνέχεια να συμπεριληφθούν στις αναλύσεις κατά τρόπο που βοηθά να
προσαρμόσουμε το πρόβλημα σφάλματος. Ένα πρακτικό πρόβλημα με αυτή την
τεχνική είναι ότι είναι δύσκολο να γνωρίζουμε πότε μια μεταβλητή συσχετίζεται
με το πραγματικό Χ αλλά όχι με το εX .
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 39 / 91
Αξιοπιστία και απλή παλινδρόμηση

Τι κάνουμε όταν ο προγνωστικός μας όρος έχει σφάλμα


μέτρησης;

Μια τρίτη τεχνική περιλαμβάνει τη χρήση υποδειγμάτων δομικών εξισώσεων


(SEM). Αυτά τα υποδείγματα περιλαμβάνουν το λάθος μέτρησης απευθείας στην
εξίσωση παλινδρόμησης. Η κατασκευή ενός υποδείγματος και η ανάπτυξη ενός
αλγορίθμου για την εκτίμηση / δοκιμή των παραμέτρων του υποδείγματος είναι,
προφανώς, το καλύτερο πράγμα που πρέπει να κάνουμε.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 40 / 91
Αξιοπιστία και πολλαπλή παλινδρόμηση

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 41 / 91
Αξιοπιστία και πολλαπλή παλινδρόμηση

Αξιοπιστία και πολλαπλή παλινδρόμηση

Όλα είναι εναντίον μας όταν προσπαθούμε να κατανοήσουμε τα αποτελέσματα


του σφάλματος μέτρησης στους προγνωστικούς παράγοντες στο πλαίσιο της
πολλαπλής παλινδρόμησης.
Το σφάλμα μέτρησης μπορεί να αυξήσει, να μειώσει ή να μην αλλάξει το πρόσημο
των συσχετίσεων και βήτα στο παρατηρούμενο επίπεδο. Όπως μπορεί να
υποψιάζεστε, η σωστή κατανόηση των επιπτώσεων του σφάλματος μέτρησης στο
πλαίσιο της πολλαπλής παλινδρόμησης δεν είναι εύκολη.
Διαισθητικά η έννοια των μερικών συσχετίσεων φαίνεται να μπορεί να
ακουμπήσει στο πρόβλημά μας.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 42 / 91
Αξιοπιστία και πολλαπλή παλινδρόμηση

Αξιοπιστία και πολλαπλή παλινδρόμηση

Ένας τρόπος να σκεφτούμε αυτό είναι να φανταστούμε μια συσχέτιση μεταξύ


του Υ και του Χ για τα αποτελέσματα μιας μεταβλητής W.
Η μερική συσχέτιση μεταξύ Υ και Χ (διαχωρίζοντας τα αποτελέσματα του W)
ισοδυναμεί με την εκτέλεση δύο παλινδρομήσεων (Y στο W και X στο W) και τη
συσχέτιση των καταλοίπων από τις δύο παλινδρομήσεις.
Με άλλα λόγια, η παλινδρόμηση του Υ επί του W δημιουργεί κατάλοιπα που
έχουν τη γραμμική επίδραση του W αν "αφαιρεθεί" από το Υ και η παλινδρόμηση
του Χ επί του W δημιουργεί κατάλοιπα που έχουν το γραμμικό αποτέλεσμα του
W αν "αφαιρεθεί" από το Χ. Η συσχέτιση αυτών των καταλοίπων είναι η μερική
συσχέτιση.
ryx − ryw rxw
ryz,w = √
(1 − r2yw )(1 − r2xw )

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 43 / 91
Αξιοπιστία και πολλαπλή παλινδρόμηση

Αξιοπιστία και πολλαπλή παλινδρόμηση

Το αντίστοιχο δομικό μοντέλο είναι: λανθάνουσες μεταβλητές.


Δεν παρατηρούμε άμεσο σφάλμα
μέτρησης ή σφάλμα πρόβλεψης, αλλά
το υπολογίζουμε από τα δεδομένα.
Το Y έχει δύο προγνωστικούς
δείκτες, ώστε δύο βέλη να μπαίνουν
στο κουτί του.
Οι προγνώστες X και W επιτρέπεται
να συσχετίζονται όπως και με
οποιαδήποτε παλινδρόμηση.
Τα τετράγωνα υποδεικνύουν τις
Ένας από τους δείκτες, W, περιέχει
παρατηρούμενες μεταβλητές και οι
σφάλμα μέτρησης.
κύκλοι μη παρατηρούμενες ή

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 44 / 91
Βοηθητικές (instrumental) μεταβλητές

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 45 / 91
Βοηθητικές (instrumental) μεταβλητές

Βοηθητικές (instrumental) μεταβλητές

Οι βοηθητικές μεταβλητές είναι μια δημοφιλής τεχνική σε μερικές από τις


κοινωνικές επιστήμες που επιτρέπει σε κάποιον να εκμεταλλευτεί μια δομή που
μοιάζει με τυχαιοποίηση, για να πάρει καλύτερες αιτιώδεις εκτιμήσεις ακόμη και
στο πλαίσιο ενός συσχετιστικού σχεδιασμού.
Ένα απλό παράδειγμα, από το Gennetian et al, 2008, Developmental Psychology,
44, 381-, περιλαμβάνει τη σχέση μεταξύ της εκπαίδευσης της μητέρας (ME) και
της απόδοσης του παιδιού (CP). Στην καλύτερη περίπτωση, η σχέση μεταξύ
αυτών των δύο μεταβλητών είναι μια συσχέτιση και χωρίς πρόσθετες
πληροφορίες ή υποθέσεις δεν θα μπορούσε κανείς να κινηθεί προς «αιτιακές
συνέπειες» της επίδρασης της ΜΕ στην CP. Οι βοηθητικές μεταβλητές
εξυπηρετούν το ρόλο αυτών των πρόσθετων πληροφοριών που επιτρέπουν σε
κάποιον να κάνει λίγο περισσότερο με συσχετιστικές πληροφορίες3 .
3
η τυχαία ανάθεση είναι ένας άλλος τρόπος να κινηθούμε προς αιτιώδη συμπεράσματα, αλλά η
τυχαία ανάθεση δεν είναι πάντοτε δυνατή.
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 46 / 91
Βοηθητικές (instrumental) μεταβλητές

Βοηθητικές (instrumental) μεταβλητές

Ας υποθέσουμε ότι οι μητέρες κατανέμονται τυχαία σε ένα τυχαίο πείραμα (Τ),


για παράδειγμα, μια παρέμβαση που επιδιώκει να επηρεάσει το εκπαιδευτικό
της επίπεδο (αλλά δεν επηρεάζει με άμεσο τρόπο την εκπαιδευτική επίδοση του
παιδιού).
Το εκπαιδευτικό επίτευγμα της μαμάς (ME) αξιολογείται μετά από αυτή την
παρέμβαση.
Μπορούμε να κάνουμε μια παλινδρόμηση με ME = β0 + β1 T + ε1 , το οποίο εάν το
Τ είναι ψευδομεταβλητή τότε η κλίση αντιπροσωπεύει τη διαφορά μεταξύ της
πειράματος και του ελέγχου. Έτσι, μπορεί να αποδειχθεί η «αιτιακή επίδραση»
του πειράματος Τ στη ΜΕ.
Αλλά ακόμα δεν ξέρουμε για το αποτέλεσμα του ενδιαφέροντος CP. Οι αλλαγές
στο ME προκαλούν μεταγενέστερες αλλαγές στο CP; Είναι δυνατόν να
επηρεάσετε το CP επηρεάζοντας το ME;
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 47 / 91
Βοηθητικές (instrumental) μεταβλητές

Διαδικασία δύο παλινδρομήσεων

Θα χρησιμοποιήσουμε αυτό που ονομάζεται "εκτίμηση ελαχίστων τετραγώνων δύο


βημάτων" (two stage least squares estimation):
1 Η πρώτη παλινδρόμηση είναι αυτή που αναφέραμε στην προηγούμενη διαφάνεια:
ˆ το εκπαιδευτικό επίτευγμα της μαμάς έλαβε
πάρτε τις προβλεπόμενες τιμές ME:
την τυχαία ανάθεσή της στο πείραμα Τ, αυτές οι προβλεπόμενες τιμές δεν
περιλαμβάνουν τα κατάλοιπα (δηλ. θόρυβο) και επομένως οποιαδήποτε
συσχέτιση μεταξύ των καταλοίπων ε1 με άλλες μεταβλητές έχει αφαιρεθεί. Με
άλλα λόγια, τα ME και CP θα μπορούσαν να συσχετιστούν επειδή έχουν μια κοινή
μεταβλητή, αλλά με τη χρήση του MEˆ που σχετίζεται με το πείραμα T, μειώνουμε
τις επιπτώσεις σε τέτοια θέματα, όπως ο κοινός παράγοντας και τα
συσχετιζόμενα κατάλοιπα.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 48 / 91
Βοηθητικές (instrumental) μεταβλητές

Διαδικασία δύο παλινδρομήσεων

2 Στη συνέχεια, χρησιμοποιήστε αυτήν την προβλεπόμενη τιμή του ME σε μια


δεύτερη εξίσωση για να προβλέψετε την εκπαιδευτική επίδοση του παιδιού,
δηλαδή την παλινδρόμηση CP = β0′ + β1′ ME
ˆ + ε2 . Τα δύο σύνολα καταλοίπων
σημειώνονται με 1 και 2 για την πρώτη και την δεύτερη παλινδρόμηση. Εάν
κάνουμε κάποιες υποθέσεις, όπως η σχέση μεταξύ του πειράματος και των
καταλοίπων στη δεύτερη παλινδρόμηση είναι 0, μπορούμε να υπολογίσουμε το
άμεσο αποτέλεσμα (μερικοί θα έλεγαν τον αιτιώδη σύνδεσμο) μεταξύ της
εκπαιδευτικής επίτευξης της μητέρας και της απόδοσης του παιδιού.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 49 / 91
Βοηθητικές (instrumental) μεταβλητές

Βοηθητικές μεταβλητές και SEM


Η αναπαράσταση βοηθητικών μεταβλητών με υπόδειγμα δομικών εξισώσεων είναι:

Αυτό είναι παρόμοιο με το μοντέλο διαμεσολάβησης, αλλά η εστίαση στις βοηθητικές


μεταβλητές είναι στην ενδιάμεση διαδρομή μεταξύ ME και CP και όχι εάν υπάρχει
άμεση διαδρομή μεταξύ Τ και CP (όπως στην περίπτωση της διαμεσολάβησης). Μία
από τις βασικές υποθέσεις της βοηθητικής μεταβλητής είναι ότι ΔΕΝ έχει άμεση
πορεία προς την τελική μεταβλητή, οπότε η βοηθητική μεταβλητή δεν πρέπει να
επηρεάζει άμεσα την CP εκτός από τον διαμεσολαβητή. Στη βιβλιογραφία της
διαμεσολάβησης αυτό ονομάζεται ως τέλεια διαμεσολάβηση.
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 50 / 91
Διαμεσολάβηση

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 51 / 91
Διαμεσολάβηση

Διαμεσολάβηση

Η βασική ανάλυση διαμεσολάβησης χρησιμοποιεί μια παρόμοια δομή με τις


βοηθητικές μεταβλητές, αλλά η έμφαση δίνεται σε ένα διαφορετικό μέρος του
διαγράμματος διαδρομής. Ενώ στις βοηθητικές μεταβλητές επικεντρώνεται στην
εξέταση της διαδρομής μεταξύ Μ και Υ, στην ανάλυση διαμεσολάβησης το ερώτημα
είναι εάν το Χ επηρεάζει άμεσα το Y (η καμπύλη διαδρομή) ή αν το Χ επηρεάζει
έμμεσα το Υ μέσω του Μ.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 52 / 91
Υποδειγματοποίηση δομικών εξισώσεων (SEM)

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 53 / 91
Υποδειγματοποίηση δομικών εξισώσεων (SEM)

Υποδειγματοποίηση δομικών εξισώσεων (SEM)

Μετά από όλα τα παραπάνω μπορούμε να δώσουμε έναν καλύτερο ορισμό για τα
υποδείγματα δομικών εξισώσεων

Tο SEM είναι μια γενική απεικόνιση που περιλαμβάνει όλο το γράφο αιτιακών
εξαρτήσεων μεταξύ πραγματικών και λανθανουσών μεταβλητών και μπορεί να
εκτελέσει όλες τις διαδικασίες ANOVA, παλινδρόμηση, PCA, MANOVA και κανονική
συσχέτιση. Το πλαίσιο επιτρέπει επίσης σφάλμα μέτρησης. Είναι δυνατή η ανάμιξη
και η αντιστοίχιση αυτών των τεχνικών, όπως η εκτέλεση ενός PCA με σφάλμα
μέτρησης σε ένα υπόδειγμα παλινδρόμησης.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 54 / 91
Υποδείγματα παραγόντων στην SEM

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 55 / 91
Υποδείγματα παραγόντων στην SEM

Υποδειγματοποίηση παραγόντων στην SEM

Η Υποδειγματοποίηση των διαρθρωτικών εξισώσεων παρουσιάζει έναν εξαιρετικό


τρόπο εκτίμησης των συσχετισμών μεταξύ λανθανουσών μεταβλητών ή παραγόντων,
διότι
1 η τεχνική λαμβάνει αυτόματα τα λάθη μέτρησης (δηλ., δεν χρειάζεται να
διορθωθεί η εξασθένηση).
2 Επίσης, η ανάλυση παρέχει αυτόματα τις φορτίσεις συντελεστών και
3 την αξιοπιστία μαζί
4 με τη σχέση μεταξύ των παραγόντων.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 56 / 91
Δείκτης GFI

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 57 / 91
Δείκτης GFI

Υποδείγματα

Υπενθυμίζουμε ότι στα υποδείγματα παλινδρόμησης αξιολογείται η προσαρμογή


μεταξύ του παρατηρούμενου αποτελέσματος y και της τιμής που ερμηνεύεται
από το μοντέλο, ŷ.
Μια μήτρα καταλοίπων είναι δύσκολο να ερμηνευθεί επειδή η μετρική δεν είναι
καλά προσδιορισμένη (π.χ., ένα -0.75 κατάλοιπο είναι μικρό ή μεγάλο;).
Επομένως, χρειαζόμαστε έναν δείκτη που να μπορεί να ερμηνευτεί ως δείκτης
προσαρμογής του υποδείγματος. Ένας τέτοιος δείκτης συνήθως ονομάζεται GFI
(δείκτης καλής προσαρμογής - goodness of fit index).

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 58 / 91
Δείκτης GFI

Δείκτης GFI: déjà vu


Τα έχουμε ξαναπεί αυτά; Βεβαίως
όλοι θυμόμαστε το R2 της παλινδρόμησης.

SSE
R2 = 1 −
SST
το άθροισμα τετραγώνων των στοιχείων στην υπολειμματική μήτρα (μήτρα με τα
κατάλοιπα όλων των απλών παλινδρομήσεων) είναι ένας καλός υποψήφιος για το
ανάλογο προς το SSE.
Το ανάλογο με το SST είναι το άθροισμα των τετραγώνων των στοιχείων στην
μήτρα συνδιακύμανσης των παρατηρούμενων μεταβλητών:

άθροισμα τετραγώνων υπολειμματικής μήτρας


GFI = 1 −
άθροισμα τετραγώνων μήτρας συνδιακυμάνσεων

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 59 / 91
Δείκτης GFI

Δείκτης GFI

άθροισμα τετραγώνων υπολειμματικής μήτρας


GFI = 1 −
άθροισμα τετραγώνων μήτρας συνδιακυμάνσεων
Πώς ερμηνεύεται αυτός ο δείκτης4 ;
Όταν το υπόδειγμα είναι τέλειο, τότε το άθροισμα των τετραγώνων των
καταλοίπων θα είναι 0 και το GFI = 1.
Όταν το μοντέλο είναι "τραγικό" υπό την έννοια ότι το υπόδειγμα προβλέπει τον
ίδιο αριθμό για κάθε υποκείμενο, το άθροισμα των τετραγώνων των καταλοίπων
θα είναι ίσο με το άθροισμα τετραγώνων όρων από τον πίνακα συνδιακύμανσης.
Σημειώστε ότι αυτό το "τραγικό" υπόδειγμα θα μπορούσε να προκύψει σε
περιπτώσεις όπου δεν γνωρίζετε τίποτα και η καλύτερη πρόβλεψη για κάθε
μεταβλητή είναι ο μέσος όρος αυτής της μεταβλητής.
Είναι πιθανό ο δείκτης αυτός να είναι αρνητικός.
4
ο δείκτης παρουσιάζεται για διδακτικούς λόγους ... έχει πλέον αντικατασταθεί από καλύτερους.
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 60 / 91
Έλεγχος προσαρμογής του υποδείγματος

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 61 / 91
Έλεγχος προσαρμογής του υποδείγματος

Έλεγχος προσαρμογής του υποδείγματος


Ένας απλός έλεγχος X2 είναι επαρκής για να ελέγξει την προσαρμογή του
υποδείγματος5
N−1
X2 = × άθροισμα τετραγώνων υπολειμματικής μήτρας
2

Το υπολογιζόμενο X2 μπορεί να συγκριθεί με την Chi-square τιμή της κατανομής


με
k(k + 1)
−p
2
βαθμούς ελευθερίας όπου k είναι ο συνολικός αριθμός μεταβλητών και p είναι ο
αριθμός των παραμέτρων που εκτιμώνται (π.χ., ο συνολικός αριθμός συντελεστών
παλινδρόμησης που χρησιμοποιούνται για τον υπολογισμό της αναμενόμενης
μήτρας συνδιακύμανσης, χωρίς να υπολογίζεται οποιαδήποτε παράμετρος που
σχετίζεται με σφάλμα).
5
ο δείκτης παρουσιάζεται για διδακτικούς λόγους ... έχει πλέον αντικατασταθεί από καλύτερους.
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 62 / 91
Έλεγχος προσαρμογής του υποδείγματος

ΠΡΟΣΟΧΗ στα παρακάτω

Υπάρχουν πολλά περίεργα πράγματα σε αυτόν τον έλεγχο


1 ο αριθμός των μεταβλητών δεν υπάρχει στον υπολογισμό των βαθμών ελευθερίας.
Ο λόγος είναι ότι χρησιμοποιούμε την μήτρα συνδιακύμανσης. Η παράμετρος k, ο
αριθμός μεταβλητών, καταγράφει το "μέγεθος" της μήτρας συνδιακύμανσης.
2 η μηδενική υπόθεση εδώ είναι το υπόδειγμα που προσπαθούμε να
προσαρμόσουμε. Δηλαδή στόχος είναι η μη απόρριψη της μηδενικής υπόθεσης!!!
Στατιστικά σημαντικό X2 σημαίνει ότι το υπόδειγμα μας δεν ταιριάζει με τα
δεδομένα, όπου ως "προσαρμογή των δεδομένων" εννοούμε ότι η μήτρα
συνδιακύμανσης που προκύπτει από το υπόδειγμα ταιριάζει με τη μήτρα
συνδιακύμανσης των δεδομένων.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 63 / 91
Έλεγχος προσαρμογής του υποδείγματος

ΠΡΟΣΟΧΗ στα παρακάτω (συνέχεια)

3 το μέγεθος του δείγματος λαμβάνετε υπόψη στον υπολογισμό της πραγματικής


στατιστικής X2 , παρόλο που δεν περιλαμβάνετε στον δείκτη GFI. Έτσι, με χρήση
του δείκτη ισχύος, θα μπορούμε συνήθως να απορρίψουμε την μηδενική υπόθεση.
ΠΡΟΣΟΧΗ: Υπάρχει ένα ασυνήθιστο πρόβλημα εδώ: για να είμαστε σίγουροι για
την μη απόρριψη της μηδενικής υπόθεσης χρειαζόμαστε πολλή ισχύ, αλλά η
υπερβολική ισχύς μπορεί να οδηγήσει σε εσφαλμένη απόρριψη ενός λογικού
υποδείγματος.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 64 / 91
Θεωρητικό vs. εμπειρικό υπόδειγμα

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 65 / 91
Θεωρητικό vs. εμπειρικό υπόδειγμα

Θεωρητικό vs. εμπειρικό υπόδειγμα

Εάν γνωρίζουμε τις πραγματικές παραμέτρους, μπορούμε να υπολογίσουμε την


αναμενόμενη μήτρα συνδιακύμανσης και να τη συγκρίνουμε με την παρατηρούμενη
μήτρα συνδιακύμανσης χρησιμοποιώντας το δείκτη GFI και X2 .
Ωστόσο, συνήθως δεν γνωρίζουμε τις πραγματικές παραμέτρους των μοντέλων.
Με ποια μήτρα συγκρίνουμε την παρατηρούμενη μήτρα συνδιακύμανσης όταν το
πραγματικό μοντέλο δεν είναι γνωστό; Η απάντηση είναι εύκολη.
Υποθέτουμε ένα υπόδειγμα και εκτελούμε τις παλινδρομήσεις για να
υπολογίσουμε τους σχετικούς συντελεστές. Τώρα έχουμε υπόδειγμα με
αριθμητικές εκτιμήσεις.
Χρησιμοποιούμε τις κλίσεις που υπολογίζονται από αυτές τις εξισώσεις
παλινδρόμησης για να δημιουργήσουμε τον υποθετικό πίνακα συνδιακυμάνσεων.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 66 / 91
Θεωρητικό vs. εμπειρικό υπόδειγμα

Θεωρητικό vs. εμπειρικό υπόδειγμα


Για παράδειγμα, ας υποθέσουμε ότι δοκιμάζουμε ένα υπόδειγμα όπου το w
διαμεσολαβεί τη σχέση μεταξύ x και y. Κατά τους Baron & Kenny θα εκτελέσουμε
δύο παλινδρομήσεις:
1 του y με τα δύο w και x και
2 του x στο w.
Έστω ότι βρήκαμε

y = 3.84 + 0.46w + 0.27x


w = −2.22 + 1.62x

Με αυτή την πληροφορία μπορούμε να υπολογίσουμε τον υποθετικό πίνακα


συνδιακύμανσης και να το συγκρίνουμε με την παρατηρούμενη συνδιακύμανση.
Δηλαδή, η έξοδος παλινδρόμησης παρέχει εκτιμήσεις που χρησιμοποιούνται για τον
υπολογισμό του "αναμενόμενου" πίνακα συνδιακύμανσης.
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 67 / 91
Θεωρητικό vs. εμπειρικό υπόδειγμα

Θεωρητικό vs. εμπειρικό υπόδειγμα

Αυτή η "αναμενόμενη" μήτρα συνδιακύμανσης μπορεί να συγκριθεί με την


παρατηρούμενη μήτρα συνδιακύμανσης για να δούμε πόσο καλά προσαρμόζεται
το υπόδειγμα στα παρατηρούμενα δεδομένα.
Ο δείκτης GFI και η δοκιμή X2 μπορούν επίσης να υπολογιστούν. Με αυτόν τον
τρόπο λειτουργούμε.
Αντί να είναι γνωστά τα βήτα των παλινδρομήσεων, εκτιμώνται για να
μεγιστοποιηθεί το GFI. Δηλαδή, αναζητάμε τον βέλτιστο συνδυασμό βήτα που
παράγουν την αναμενόμενη μήτρα συνδιακύμανσης που είναι πλησιέστερη προς
την παρατηρούμενη μήτρα συνδιακύμανσης. Με αυτό τον τρόπο μπορούμε να
αξιολογήσουμε ταυτόχρονα την εφαρμογή αρκετών μοντέλων παλινδρόμησης.
Έτσι, με χρήση του SEM μπορούν να εκτιμηθούν ταυτόχρονα αρκετές εξισώσεις
παλινδρόμησης (σύστημα εξισώσεων παλινδρόμησης).

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 68 / 91
Παρουσίαση του SEM

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 69 / 91
Παρουσίαση του SEM

Παρουσίαση του SEM

Επειδή ο εχθρός του καλού είναι το καλύτερο ... πριν αποφασίσετε για το καλύτερο
υπόδειγμα πρέπει να τα δείτε συγκριτικά μεταξύ τους.
να φτιάξετε έναν πίνακα με τρόπο που να διευκολύνει τη σύγκριση.
AA ♯ μεταβλητών GFI CFI RMSEA X2 β.ε.
1
2
3
4

Μόλις αποφασίσετε για ένα "καλύτερο υπόδειγμα", τότε θα παρουσιάσετε τις


σχετικές εκτιμήσεις παραμέτρων και θα ερμηνεύσετε τις παραμέτρους
προσαρμογής του καλύτερου υποδείγματος.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 70 / 91
Παρουσίαση του SEM

Παρουσίαση του SEM

Λάβετε υπόψη ότι υπάρχει αντιστάθμιση μεταξύ του πλήθους των παραμέτρων
και του βαθμού προσαρμογής του υποδείγματος.
Υπάρχουν κάποια μοντέλα που ξεχωρίζουν σαφώς ότι δεν είναι καλά σε σχέση με
τα υπόλοιπα; Για τα εγκιβωτισμένα υποδείγματα έχουμε μέτρο σύγκρισης.
Κάθε φορά που έχετε ένα τυπικό σφάλμα για μια παράμετρο, μπορείτε να
δημιουργήσετε ένα διάστημα εμπιστοσύνης γύρω από αυτήν την παράμετρο
χρησιμοποιώντας τον συνήθη κανόνα "συν ή μείον 1,96 φορές τον τυπικό
σφάλμα". Είναι ασφαλέστερο να συγκρίνουμε διαστήματα εμπιστοσύνης.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 71 / 91
Συνοψίζοντας για τα SEM

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 72 / 91
Συνοψίζοντας για τα SEM

Υπόδειγμα δομικών εξισώσεων

Τα βήματα που ακολουθούμε για μία ανάλυση SEM


1 Διαμόρφωση των θεωρητικών υποθέσεων
2 Προσδιορισμός της δομής του υποδείγματος
3 Ταυτοποίηση της δομής του υποδείγματος
4 Υπολογισμός των παραμέτρων
5 Αξιολόγηση των παραμέτρων
6 (Πιθανή) τροποποίηση του υποδείγματος

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 73 / 91
Συνοψίζοντας για τα SEM

Βήμα 1: Διαμόρφωση των θεωρητικών υποθέσεων

1 Ο τρόπος με τον οποίο συνδέονται οι υπό μελέτη εννοιολογικές κατασκευές


καθοδηγείται από τις υπάρχουσες θεωρίες και την προηγούμενη βιβλιογραφία.
2 Στο βήμα αυτό αποφασίζουμε:
1 ποιες παρατηρούμενες μεταβλητές θα συμπεριλάβουμε στο υπόδειγμα,
2 εάν θα δημιουργήσουμε λανθάνουσες μεταβλητές και από ποιες μετρήσιμες
μεταβλητές θα προσδιορίζονται,
3 ποιες είναι οι αιτιακές διαδρομές μεταξύ των μεταβλητών.
3 Είναι δυνατή η διαμόρφωση και, κατ’ επέκταση, ο συγκριτικός στατιστικός
έλεγχος εναλλακτικών υποδειγμάτων.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 74 / 91
Συνοψίζοντας για τα SEM

Βήμα 2: Προσδιορισμός της δομής του υποδείγματος


1 Τα ορθογώνια παραλληλόγραμμα αναπαριστούν τις μετρήσιμες μεταβλητές.
2 Οι ελλείψεις αναπαριστούν τις μη μετρήσιμες (λανθάνουσες) μεταβλητές.
3 Τα βέλη μονής κατεύθυνσης δηλώνουν αιτιώδεις σχέσεις. Οι συντελεστές τους
είναι συντελεστές παλινδρόμησης ή φορτία παραγόντων.
4 Τα βέλη διπλής κατεύθυνσης δηλώνουν συνδιακυμάνσεις.
5 Κάθε εξαρτημένη μετρήσιμη μεταβλητή συνδέεται με σφάλμα μέτρησης.
6 Κάθε εξαρτημένη λανθάνουσα μεταβλητή συνδέεται με σφάλμα υπολοίπου.
7 Τα σφάλματα δεν πρέπει να συσχετίζονται με τις λανθάνουσες μεταβλητές (αυτό
θα σήμαινε ότι κάποιες άγνωστες μεταβλητές επηρεάζουν συστηματικά το δομικό
υπόδειγμα).
8 Επιπλέον, προτείνεται να αποφεύγεται η συσχέτιση μεταξύ των σφαλμάτων
(αυτό θα σήμαινε ότι κάποιο συστηματικό σφάλμα επηρεάζει τις ανεξάρτητες
μεταβλητές).
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 75 / 91
Συνοψίζοντας για τα SEM

Βήμα 3: Ταυτοποίηση της δομής του υποδείγματος

1 Έχουν προταθεί διάφοροι κανόνες σχετικά με το μέγεθος του δείγματος, ώστε


να έχουμε επαρκή ισχύ για τον προσδιορισμό των παραμέτρων σε ένα υπόδειγμα
SEM, όπως: ελάχιστος αριθμός 200 συμμετεχόντων ή 5-15 περιπτώσεις για κάθε
άγνωστη παράμετρο ή 10-20 άτομα ανά μεταβλητή.
2 Για την εκτίμηση ενός υποδείγματος είναι ανάγκη να προκαθοριστούν ορισμένες
παράμετροι (δεν γίνεται να είναι όλες άγνωστες). Αυτό ισχύει π.χ. για τους
συντελεστές παλινδρόμησης των σφαλμάτων και για το φορτίο τουλάχιστον μίας
μετρήσιμης μεταβλητής πάνω στη λανθάνουσα μεταβλητή που προσδιορίζει.
3 Απαιτείται προσοχή σε εκ των υστέρων αλλαγές του υποδείγματος, καθώς
αυτές μπορεί να καταστήσουν την ταυτοποίησή του αδύνατη (διακοπή ανάλυσης,
μήνυμα σφάλματος).

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 76 / 91
Συνοψίζοντας για τα SEM

Βήμα 4: Υπολογισμός των παραμέτρων

1 Οι παράμετροι μιας ανάλυσης SEM εκτιμώνται ελαχιστοποιώντας την απόκλιση


ανάμεσα στη μήτρα συνδιακυμάνσεων, η οποία προκύπτει από τα εμπειρικά
δεδομένα (S), και στη μήτρα συνδιακυμάνσεων που απορρέει από το υποθετικό
υπόδειγμα (Σ).
2 Υπάρχουν διάφορες στατιστικές τεχνικές για τη διαδικασία αυτή:
1 Οι μέθοδοι της Μέγιστης Πιθανοφάνειας (Maximum Likelihood) και των
Γενικευμένων Ελάχιστων Τετραγώνων (Generalized Least Squares) προϋποθέτουν
πολυμεταβλητή κανονικότητα, μεγάλα δείγματα και συνεχείς μεταβλητές.
2 Οι μέθοδοι των Μη Σταθμισμένων Ελάχιστων Τετραγώνων (Unweighted Least
Squares) και της Ασυμπτωματικά Ελεύθερης Κατανομής (Asymptotically
Distribution Free) δεν απαιτούν πολυμεταβλητή κανονικότητα.
3 Για το υπόδειγμα μέτρησης υπολογίζεται το παραγοντικό φορτίο (loading: λ)
κάθε μετρήσιμης μεταβλητής πάνω στη λανθάνουσα μεταβλητή (δηλ. στον
παράγοντα) που προσδιορίζει.
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 77 / 91
Συνοψίζοντας για τα SEM

Βήμα 4: Υπολογισμός των παραμέτρων (συνέχεια)

4 Για το δομικό υπόδειγμα υπολογίζεται ο συντελεστής διαδρομής (path


coefficient: γ), δηλ. ένας συντελεστής παλινδρόμησης που δηλώνει σε ποιο βαθμό
μια ενδογενής μεταβλητή εξηγείται από μια εξωγενή. Όταν πρόκειται για τη
συσχέτιση (συνδιακύμανση) μεταξύ δύο ενδογενών μεταβλητών, ο συντελεστής
διαδρομής συμβολίζεται με το ελληνικό γράμμα β.
5 Οι μη τυποποιημένοι (non standardized) συντελεστές εκφράζουν συσχετίσεις με
βάση την κλίμακα μέτρησης. Οι τυποποιημένοι (standardized) συντελεστές, προς
διευκόλυνση της μεταξύ τους σύγκρισης, εκτιμώνται προαιρετικά.
6 Η ανάλυση SEM υπολογίζει τις διακυμάνσεις των μετρήσιμων και των
λανθανουσών μεταβλητών, καθώς και τους μέσους όρους (intercepts) των
μετρήσιμων μεταβλητών (και, προαιρετικά, των λανθανουσών μεταβλητών).

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 78 / 91
Συνοψίζοντας για τα SEM

Βήμα 4: Υπολογισμός των παραμέτρων (συνέχεια)


7 Οι παράμετροι ενός μοντέλου SEM μπορεί να είναι ελεύθερες, προκαθορισμένες ή
περιορισμένες:
1 οι ελεύθερες παράμετροι είναι άγνωστες και χρειάζεται να εκτιμηθούν,
2 οι προκαθορισμένες παράμετροι λαμβάνουν εκ των προτέρων μια δεδομένη τιμή
(συνήθως, 0 ή 1) προκειμένου να καταστεί δυνατή η ταυτοποίηση του μοντέλου,
3 οι περιορισμένες παράμετροι είναι άγνωστες, αλλά λογίζονται εκ των προτέρων ως
ίσες με μία ή άλλες παραμέτρους.
8 Επιπλέον, υπολογίζονται οι δείκτες καλής προσαρμογής του υποδεόγματος
SEM, οι οποίοι δηλώνουν κατά πόσο αυτό είναι συμβατό με τα εμπειρικά
δεδομένα. Υπάρχουν τρεις ομάδες δεικτών καλής προσαρμογής, με κριτήρια:
1 την απόλυτη προσαρμογή του υποδείγματος συγκριτικά με το υποθετικό υπόδειγμα,
2 την επαυξητική προσαρμογή του υποδείγματος συγκριτικά με άλλα υποδείγματα,
και
3 τη φειδωλότητα (οικονομία) του υποδείγματος, δηλαδή με πόσο λίγες παραμέτρους
μπορεί να υπολογιστεί.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 79 / 91
Συνοψίζοντας για τα SEM

Βήμα 5: Αξιολόγηση των παραμέτρων

Δείκτες απόλυτης προσαρμογής


1 Κριτήριο χ2 (chi-square): δηλώνει το βαθμό ανεξαρτησίας μεταξύ θεωρητικών και
εμπειρικών δεδομένων. Επιθυμητή η στατιστική ασημαντότητα. Πολύ ευαίσθητος
στο μέγεθος του δείγματος.
2 χ2 /df ή CMIN/df: προσαρμογή του δείκτη χ2 για τους βαθμούς ελευθερίας.
Επιθυμητές τιμές <3 ή <2-5.
3 Δείκτης καλής προσαρμογής (Googness-of-Fit Index, GFI): Συγκρίνει το υποθετικό
με το μηδενικό υπόδειγμα. Ευαίσθητος στο μέγεθος του δείγματος. Επιθυμητές
τιμές >0.90 ή >0.95.
4 Διορθωμένος δείκτης καλής προσαρμογής (Adjusted Googness- of-Fit Index,
AGFI): Διορθώνει τον δείκτη GFI για τους βαθμούς ελευθερίας. Επιθυμητές τιμές
>0.90 ή >0.95.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 80 / 91
Συνοψίζοντας για τα SEM

Βήμα 5: Αξιολόγηση των παραμέτρων

Δείκτες απόλυτης προσαρμογής (συνέχεια)


5 Τετραγωνική ρίζα του μέσου του σφάλματος εκτίμησης (Root Mean Square Error
of Approximation, RMSEA): Συγκρίνει το υποθετικό υπόδειγμα με το ιδανικό.
Επιθυμητές τιμές <0,08.
6 Τετραγωνική ρίζα του μέσου των υπολοίπων (Root Mean Square Residual, RMR).
Ευάλωτος δείκτης στα μικρά δείγματα, γι’ αυτό προτιμάται η τυποποιημένη
εκδοχή του.
7 Τυποποιημένη τετραγωνική ρίζα του μέσου των υπολοίπων (Standardized Root
Mean Square Residual, SRMR). Επιθυμητές τιμές <0,08, ακόμα καλύτερα < 0,05.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 81 / 91
Συνοψίζοντας για τα SEM

Βήμα 5: Αξιολόγηση των παραμέτρων

Δείκτες επαυξητικής προσαρμογής


1 Κανονικοποιημένος δείκτης προσαρμογής (Normed Fit Index, NFI): Συγκρίνει την
τιμή χ2 του υποθετικού και του μηδενικού μοντέλου. Ευάλωτος στο μέγεθος του
δείγματος. Επιθυμητές τιμές 0,95 ή μεγαλύτερες.
2 Δείκτης συγκριτικής προσαρμογής (Comparative Fit Index, CFI): Διορθωμένη
εκδοχή του NFI για το μέγεθος του δείγματος. Επιθυμητές τιμές 0,95 ή
μεγαλύτερες.
3 Δείκτης επαυξητικής προσαρμογής (Incremental Fit Index, IFI): Επιθυμητές τιμές
0,95 ή μεγαλύτερες.
4 Δείκτης Tucker-Lewis (Tucker-Lewis Index, TLI): Επιθυμητές τιμές 0,95 ή
μεγαλύτερες.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 82 / 91
Συνοψίζοντας για τα SEM

Βήμα 5: Αξιολόγηση των παραμέτρων

Δείκτες φειδωλότητας
1 Πληροφοριακό κριτήριο του Akaike (Akaike Information Criterion, AIC):
Χρησιμοποιείται για τη σύγκριση μεταξύ μη εμφωλευμένων (non-nested)
υποδειγμάτων. Μικρότερη τιμή δηλώνει καλύτερο (πιο οικονομικό) μοντέλο.
2 Σταθερό Πληροφοριακό κριτήριο του Akaike (Consistent Akaike Information
Criterion, CAIC): Όπως στον δείκτη AIC, μικρότερη τιμή δηλώνει προτιμώμενο
υπόδειγμα.
3 Φειδωλός κανονικοποιημένος δείκτης προσαρμογής (Parsimonious Norm Fit
Index, PNFI): Χωρίς κατώφλι αποδοχής.
4 Φειδωλός δείκτης καλής προσαρμογής (Parsimonious Good- ness-of-Fit Index,
PGFI). Χωρίς κατώφλι αποδοχής.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 83 / 91
Συνοψίζοντας για τα SEM

Βήμα 5: Συγκριτική αξιολόγηση υποδειγμάτων

1 Όταν δύο υποδείγματα είναι εμφωλευμένα (nested), δηλ. όταν έχουν τις ίδιες
μετρήσιμες μεταβλητές, τότε η στατιστικώς σημαντική μείωση της τιμής του
κριτηρίου χ2 υποδεικνύει το προτιμώμενο υπόδειγμα.
2 Όταν δύο υποδείγματα δεν είναι εμφωλευμένα (non-nested), δηλ. δεν έχουν
ακριβώς τις ίδιες μετρήσιμες μεταβλητές, τότε καλύτερη προσαρμογή στα
δεδομένα θεωρείται ότι έχει το υπόδειγμα με τη μικρότερη τιμή AIC/CAIC.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 84 / 91
Συνοψίζοντας για τα SEM

Βήμα 6: (Πιθανή) τροποποίηση του υποδείγματος

1 Όταν οι δείκτες καλής προσαρμογής δεν είναι ικανοποιητικοί, μπορούμε να


σκεφτούμε την τροποποίηση του μοντέλου για να βελτιώσουμε την προσαρμογή
του. Αυτό γίνεται:
1 Με απλοποίηση, διαγράφοντας διαδρομές που δεν είναι στατιστικά σημαντικές ή
αφαιρώντας μεταβλητές που δεν έχουν στατιστικά σημαντικές συσχετίσεις με άλλες.
2 Με επέκταση, προσθέτοντας διαδρομές ή συνδιακυμάνσεις με βάση τους δείκτες
τροποποίησης (modification indices).
2 Προσοχή: Η τροποποίηση του μοντέλου ΔΕΝ ορίζεται εμπειρικά, αλλά πρέπει να
είναι συμβατή με τις ΘΕΩΡΗΤΙΚΕΣ παραδοχές!

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 85 / 91
Συνοψίζοντας για τα SEM Επιβεβαιωτική Ανάλυση Παραγόντων

Επιβεβαιωτική Ανάλυση Παραγόντων

Η Επιβεβαιωτική Ανάλυση Παραγόντων (Confirmatory Factor Analysis) έχει


επικυρωτικό χαρακτήρα, ώστε να διαπιστώσουμε κατά πόσο τα δεδομένα μας
στηρίζουν μια προκαθορισμένη δομή των υπό μελέτη μεταβλητών.
Η CFA συγκρίνει τον πίνακα συνδιακυμάνσεων ενός συνόλου δεδομένων με τον
εκτιμώμενο πίνακα συνδιακυμάμνσεων που προκύπτει από τη συνάρτηση των
εκτιμήσεων των παραμέτρων του υποδείγματος που αξιολογούμε.
Στη CFA οι υποθετικοί παράγοντες εμφανίζονται ως λανθάνουσες μεταβλητές, οι
οποίες προσδιορίζονται από συγκεκριμένες κάθε φορά μετρήσιμες
μεταβλητές-δείκτες. Τη σχέση αυτή δηλώνει το φορτίο (loading) κάθε δείκτη στη
λανθάνουσα μεταβλητή.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 86 / 91
Συνοψίζοντας για τα SEM Επιβεβαιωτική Ανάλυση Παραγόντων

Επιβεβαιωτική vs. Διερευνητική Παραγοντική Ανάλυση

H Διερευνητική Ανάλυση Παραγόντων (Exploratory Factor Analysis) έχει


περιγραφικό χαρακτήρα και περιορισμένες δυνατότητες ελέγχου πάνω στα
δεδομένα...
...ενώ η CFA χρησιμοποιείται για να ελέγξουμε συγκεκριμένες υποθέσεις
αναφορικά με την παραγοντική δομή των δεδομένων και παρέχει αυξημένο
έλεγχο σε αυτά.
Η EFA ενδείκνυται στην αρχική διαδικασία της κατασκευής μιας κλίμακας ή όταν
δεν έχουμε επαρκή θεωρητική τεκμηρίωση...
...ενώ η CFA είναι κατάλληλη όταν εφαρμόζουμε μια κλίμακα σε διαφορετικό
πληθυσμό (π.χ. άλλη χώρα), ώστε να ελέγξουμε τη δυνατότητα επιβεβαίωσης της
αρχικής παραγοντικής δομής (ή να προχωρήσουμε σε αναπροσαρμογή αν
χρειαστεί).

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 87 / 91
Συνοψίζοντας για τα SEM Επιβεβαιωτική Ανάλυση Παραγόντων

Εφαρμογές της CFA

Αξιολόγηση της παραγοντικής δομής μιας κλίμακας (εγκυρότητα εννοιολογικού


περιεχομένου).
Αξιολόγηση της εγκυρότητας εννοιολογικής κατασκευής μιας κλίμακας
(συγκλίνουσα και αποκλίνουσα εγκυρότητα).
Αξιολόγηση της ισοδυναμίας (invariance) ενός δομικού μοντέλου σε
διαφορετικούς πληθυσμούς, το οποίο αποτελεί προϋπόθεση για τη σύγκριση των
πληθυσμών σε επίπεδο μέσων όρων.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 88 / 91
Συνοψίζοντας για τα SEM Επιβεβαιωτική Ανάλυση Παραγόντων

Προδιαγραφές για την εφαρμογή της CFA

Έλεγχος των στατιστικών προϋποθέσεων ( πολυμεταβλητής κανονικότητας,


λανθασμένος προσδιορισμός του υποδείγματος, πολυσυγγραμμικότητα).
Για την ταυτοποίηση του υποδείγματος, δηλ. για τον υπολογισμό των ελεύθερων
παραμέτρων, απαιτείται:
ορισμένες παράμετροι των λανθανουσών μεταβλητών να προκαθοριστούν.
οι βαθμοί ελευθερίας, δηλαδή ο αριθμός των μετρήσιμων μεταβλητών μείον τον
αριθμό των μη γνωστών παραμέτρων, να έχουν τιμή > 0 (εάν df = 0, τότε το μοντέλο
θα είναι κορεσμένο και οι δείκτες προσαρμογής πλασματικοί), και
να έχουμε τουλάχιστον 3-4 δείκτες ανά λανθάνουσα μεταβλητή.
Όσον αφορά το μέγεθος του δείγματος, προτείνεται μια αναλογία που κυμαίνεται
μεταξύ 5-15 συμμετέχοντες ανά μεταβλητή.
Επισκόπηση των ελλιπών τιμών (<5% του δείγματος) και, εφόσον χρειαστεί,
συμπλήρωσή τους.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 89 / 91
Υλοποίηση στο R

Περιεχόμενα

1 Εισαγωγή 9 Βοηθητικές (instrumental) μεταβλητές


10 Διαμεσολάβηση
2 Βασικές έννοιες γραμμικής άλγεβρας
11 Υποδειγματοποίηση δομικών
Μήτρες συνδιασποράς
εξισώσεων (SEM)
Μήτρες συσχέτισης
12 Υποδείγματα παραγόντων στην SEM
Εξάρτηση δύο συνδιακυμάνσεων
13 Δείκτης GFI
3 Διασύνδεση παλινδρόμησης και μήτρας 14 Έλεγχος προσαρμογής του
συνδιακυμάνσεων υποδείγματος
4 Αξιοπιστία 15 Θεωρητικό vs. εμπειρικό υπόδειγμα
5 Τύπος Spearman-Brown 16 Παρουσίαση του SEM
6 Το α του Cronbach 17 Συνοψίζοντας για τα SEM
7 Αξιοπιστία και απλή παλινδρόμηση Επιβεβαιωτική Ανάλυση
8 Αξιοπιστία και πολλαπλή Παραγόντων
παλινδρόμηση 18 Υλοποίηση στο R
Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 90 / 91
Υλοποίηση στο R

Υλοποίηση στο R

Για την υλοποίηση των SEM στο R χρειαζόμαστε τις παρακάτω βιβλιοθήκες
lavaan: Fit a variety of latent variable models, including confirmatory factor
analysis, structural equation modeling and latent growth curve models.
semPlot (εντολή semPaths): Path diagrams and visual analysis of various SEM
packages' output.
psych: A general purpose toolbox for personality, psychometric theory and
experimental psychology. Functions are primarily for multivariate analysis and
scale construction using factor analysis, principal component analysis, cluster
analysis and reliability analysis, although others provide basic descriptive statistics.
Item Response Theory is done using factor analysis of tetrachoric and polychoric
correlations.

Γεώργιος Σ. Ανδρουλάκης (ΔΠΜΣ) ΔΠΜΣ - Αρχές Στατιστικής και Ανάλυσης Δεδομένων 2016-2017 91 / 91

You might also like