Professional Documents
Culture Documents
Lecture9 Egirotita Axiopistia
Lecture9 Egirotita Axiopistia
Εισαγωγή
Εγκυρότητα
Αξιοπιστία
Μέτρα αξιοπιστίας
Ένα εργαλείο είναι έγκυρο ή αληθές, εάν αντιπροσωπεύει επακριβώς τις διαστάσεις
ενός φαινομένου, που σκοπεύει να περιγράψει, να εξηγήσει ή να διαμορφώσει σε
θεωρητικό επίπεδο (Hammersley )
Η εγκυρότητα συνίσταται στο κατά πόσο η κλίμακα μετρά αυτό που επικαλείται
ότι μετρά (π.χ. Για παράδειγμα, αν μετράμε την ικανοποίηση ενός υπαλλήλου από την χρησιμότητα του
πληροφοριακού συστήματος στον χώρο εργασίας, πρέπει να βεβαιωθούμε ότι δεν μετράμε την ικανοποίηση
του υπαλλήλου μόνο από το αν έχει σύγχρονο εξοπλισμό). Η εγκυρότητα των ψυχομετρικών
κλιμάκων εμφανίστηκε ως όρος μετά την πρωτοβουλία της Επιτροπής του
Αμερικανικού Συνδέσμου Ψυχολόγων ΑΡΑ (1950–1954) να προσδιορίσει ποια
χαρακτηριστικά θα έπρεπε να αξιολογηθούν πριν δημοσιευθεί μια κλίμακα.
Υπάρχουν 4 τύποι εγκυρότητας είναι: α)η προβλεπτική ή προγνωστική
εγκυρότητα (predictive validity), β)η συντρέχουσα εγκυρότητα (concurrent validity),
γ)η εγκυρότητα περιεχομένου (content validity) και δ)η εγκυρότητα εννοιολογικής
κατασκευής (construct validity).
Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 5
Προβλεπτική Εγκυρότητα
Μια ψυχομετρική κλίμακα διακρίνεται για την προβλεπτική της εγκυρότητα στο
βαθμό που είναι σε θέση, με βάση τις σημερινές αξιολογήσεις, να προβλέψει
μελλοντικές παραμέτρους, που αποτελούν ειδοποιά χαρακτηριστικά της σημερινής
εννοιολογικής κατασκευής . Για παράδειγμα, το κριτήριο για την εκτίμηση της
προβλεπτικής εγκυρότητας μιας κλίμακας που εκτιμά την ικανοποίηση των
υπαλλήλων από την χρήση πληροφοριακών συστημάτων είναι η δυνατότητα
πρόβλεψης της μελλοντικής συμπεριφοράς των υπαλλήλων, με την ερώτηση «θα
προτείνατε την χρήση ΠΣ σε ένα φίλο σας” δεδομένου ότι η τάση του ανθρώπου
προς την εκδήλωση μιας συμπεριφοράς και η μελλοντική του συμπεριφορά
θεωρούνται συνώνυμοι όροι.
Η Smith σημειώνει ότι, επειδή αυτή η τελευταία συσχέτιση σπάνια επιβεβαιώνεται,
είναι πιο ακριβές να θεωρούμε αυτή την ερώτηση περισσότερο ως ένδειξη
συγχρονικής εγκυρότητας και συμπληρώνει ότι ένας παράγοντας που καθιστά
προβληματική την προβλεπτική ικανότητα των κλιμάκων για την ικανοποίηση των
ασθενών είναι η απουσία μιας διακύμανσης στις απαντήσεις που προσπαθούν να
αποτυπώσουν τη μελλοντική συμπεριφορά των ασθενών.
Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 6
Συντρέχουσα Εγκυρότητα
Ένα ψυχομετρικό μέσο διακρίνεται για την εγκυρότητα του περιεχομένου όταν
απαντά στην ερώτηση «οι ερωτήσεις του μέσου καλύπτουν το εύρος του
περιεχομένου της εννοιολογικής κατασκευής που υποστηρίζουν αρά και την
ανάλυση των απόψεων των ειδικών στο θέμα».
Μια άλλη διάσταση της εγκυρότητας του περιεχομένου του μέσου είναι η
εμπειρική εγκυρότητα (empirical validity), σύμφωνα με την οποία εξετάζεται αν
και κατά πόσο οι υποκλίμακες (subscales) της συνολικής κλίμακας σχετίζονται με
άλλες μεταβλητές, που αποτελούν βασικές διαστάσεις της εννοιολογικής
κατασκευής με τις οποίες θα έπρεπε να σχετίζονται.
Για παράδειγμα, οι Meterko et al χρησιμοποίησαν ως δείκτες εγκυρότητας της
κλίμακάς τους, για την ικανοποίηση των ασθενών, τις επιμέρους κλίμακες που
εκτιμούν τη συνολική εκληφθείσα ποιότητα της φροντίδας και την πρόθεση των
ασθενών να επιστρέψουν στο νοσοκομείο, αλλά και να το προτείνουν σε κάποιο
γνωστό τους.
Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 8
Εγκυρότητα εννοιολογικής κατασκευής
Η ύπαρξη μιας μόνο διάστασης είναι μια απαραίτητη προϋπόθεση για τις
αναλύσεις αξιοπιστίας (reliability) και εγκυρότητας (validity) (Nunnally 1978)
(Μια δομή είναι μονοδιάστατη (ή αδιάστατη) αν τα στοιχεία που την
αποτελούν αναπαριστούν μια μόνο υποκείμενη ιδιότητα. Στην επιβεβαιωτική
παραγοντική ανάλυση, ο προσδιορισμός ενός μοντέλου μέτρησης που ορίζει
τη σχέση ανάμεσα σε κάθε μια δομή και τα στοιχεία που τη συνθέτουν,
αποτελεί έναν έλεγχο του μονοδιάστατου των δομών).
Η ύπαρξη μιας μόνο διάστασης δεν είναι αρκετή για να εξασφαλίσει τη
χρησιμότητα ενός μοντέλου αφού, ακόμα και ένα τελείως μονοδιάστατο
μοντέλο μπορεί να έχει σαν αποτέλεσμα μια συνδυασμένη βαθμολογία που
προσδιορίζεται πρωταρχικά από το σφάλμα μέτρησης (Gerbing και Anderson
1988).
Επομένως, υπάρχει η ανάγκη αφού πρώτα προσδιοριστεί η μονοδιάστατη
φύση κάθε μοντέλου, στη συνέχεια να τεκμηριωθεί και η αξιοπιστία της.
Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 14
Μέτρα μέτρησης αξιοπιστίας (2)
Ο Cronbach alpha είναι ο πιο ευρέως χρησιμοποιούμενος από τους δείκτες αξιοπιστίας και
είναι γενικά αποδεκτό ότι η τιμή του πρέπει να είναι μεγαλύτερη του 0,7 (Nunnally και
Bernstein 1994, Cronbach 1951, Nunnally 1988). Εντούτοις, μερικοί ερευνητές
επιτρέπουν μια μικρότερη τιμή της τάξης του 0,6 (Devellis 1991), ενώ άλλοι επιμένουν σε
πιο αυστηρή τιμή της τάξεως του 0,8 (Hatcher 1994). Ο δείκτης Cronbach alpha μπορεί να
ερμηνευθεί σαν το εκατοστιαίο ποσοστό που εξηγεί ο χρησιμοποιούμενος παράγοντας
έναν υποθετικό που περιλαμβάνει όλες τις πιθανές μεταβλητές.
Εναλλακτικά, μπορεί να ερμηνευθεί ως ο συσχετισμός του χρησιμοποιούμενου παράγοντα
με τους πιθανούς άλλους παράγοντες που μετρούν το ίδιο πράγμα και που χρησιμοποιούν
τον ίδιο αριθμό μεταβλητών. Σημειωτέο επίσης είναι ότι, η τιμή του Cronbach alpha
αυξάνεται με την αύξηση των μεταβλητών σε έναν παράγοντα ή μοντέλο, μέθοδος η
οποία ακολουθείται από πολλούς ερευνητές για να ωθήσουν τη τιμή του δείκτη σε ένα
αποδεκτό επίπεδο. Αυτό απεικονίζει την υπόθεση ότι, οι παράγοντες και τα όργανα με
έναν μεγαλύτερο αριθμό μεταβλητών είναι πιο αξιόπιστες. Επίσης, σημαίνει ότι, η
σύγκριση των τιμών του Cronbach alpha μεταξύ παραγόντων με διαφορετικό αριθμό
μεταβλητών δεν είναι κατάλληλη .
Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 15
Μέτρα μέτρησης αξιοπιστίας (3)
Η χρήση των μέτρων αξιοπιστίας, όπως του Cronbach Alpha, δεν εξασφαλίζει τη
μονοδιάστατη φύση αλλά, αντ' αυτού, υποθέτει ότι υπάρχει. Ο ερευνητής ενδείκνυται να
εκτελέσει τις δοκιμές για μονοδιάστατη φύση σε όλες τις δομές οι οποίες αποτελούνται
από πολλούς δείκτες πριν αξιολογήσει την αξιοπιστία τους. Το επόμενο βήμα είναι να
εξεταστούν οι υπολογισμένες φορτίσεις και να αξιολογηθεί η στατιστική σημασία της
κάθε μιας από αυτές. Εάν δεν επιτυγχάνεται στατιστική σημαντικότητα, ο ερευνητής
πρέπει να αποβάλει το δείκτη ή να προσπαθήσει να το μετασχηματίσει για καλύτερη
προσαρμογή με τη δομή.
Η καλή προσαρμογή του μοντέλου μέτρησης στα δεδομένα, φανερώνει πως σύμφωνα
με την υπόθεσή μας, όλα τα στοιχεία επιδρούν σημαντικά πάνω σε μια υποκείμενη
κρυφή μεταβλητή. Η προσαρμογή του μοντέλου μέτρησης προσδιορίζεται από το δείκτη
κατάλληλης προσαρμογής (GFI). Κλίμακες με GFI μεγαλύτερο από 0,8 είναι
μονοδιάστατες (αδιάστατες).
Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 16
Μέτρα μέτρησης αξιοπιστίας (4)
Πέρα από την εξέταση των φορτίσεων για κάθε δείκτη, η κύρια προσέγγιση που
χρησιμοποιείται στην αξιολόγηση του μοντέλου μέτρησης είναι η σύνθετη αξιοπιστία
(composite reliability) και η υπολογισμένη διακύμανση (variance extracted) για κάθε
δομή (Werts et al. 1978).
Η σύνθετη αξιοπιστία είναι, ένα μέτρο της εσωτερικής συνέπειας των δεικτών της
δομής, απεικονίζοντας το βαθμό στον οποίο "δείχνουν" την κοινή λανθάνουσα
(απαρατήρητη) δομή. Τα πιο αξιόπιστα μέτρα παρέχουν στον ερευνητή μεγαλύτερη
εμπιστοσύνη σχετικά με το ότι, οι μεμονωμένοι δείκτες είναι όλοι συνεπείς στις
μετρήσεις τους.
Συνήθως, οι ενδεδειγμένες τιμές για τη σύνθετη αξιοπιστία είναι από 0,7 και πάνω
(Nunnally και Bernstein 1994). Εντούτοις, αυτό δεν είναι απόλυτο και, πολλές φορές,
μπορούν να γίνουν αποδεκτές και τιμές κάτω από 0,7, ειδικά όταν η έρευνα είναι
διερευνητικής φύσης.
Πρέπει να σημειώσουμε, εντούτοις ότι, η αξιοπιστία δεν εξασφαλίζει την εγκυρότητα
(validity). Η εγκυρότητα είναι ο βαθμός στον οποίο οι δείκτες μετρούν "ακριβώς" αυτό
που υποτίθεται πως πρέπει να μετρήσουν.
Ένα άλλο μέτρο της αξιοπιστίας είναι η υπολογισμένη διακύμανση (variance extracted).
Αυτό το μέτρο απεικονίζει το γενικό ποσό της διακύμανσης των δεικτών που
υπολογίστηκε για τις αφανείς δομές. Οι υψηλότερες τιμές αυτού του μέτρου
εμφανίζονται όταν οι δείκτες είναι αληθινά αντιπροσωπευτικοί της αφανούς δομής. Το
μέτρο είναι ένα συμπληρωματικό μέτρο της αξιοπιστίας της δομής. Προτείνεται η τιμή
του για μία δομή να υπερβαίνει το 0,5 (Nunnally και Bernstein 1994). Τα μέτρα που
περιγράφηκαν πρέπει να υπολογίζονται χωριστά για κάθε σύνολο δεικτών οι οποίοι
αποτελούν μια αφανή δομή.
Για τον υπολογισμό της σύνθετης αξιοπιστίας (composite reliability) χρησιμοποιείται η
σχέση:
( i ) 2
CR
( i ) 2 i
VA i
2
i i
όπου λi είναι οι τυποποιημένες φορτίσεις και εi το σφάλμα μέτρησης για κάθε δείκτη
x1 x2 x3 x4 x5 x6 x7
συγκεκριμένη περίπτωση παρατηρούμε x1 1,000 ,685 ,635 ,028 ,693 ,681 ,675
x2 ,685 1,000 ,854 -,012 ,741 ,692 ,717
ότι η μεταβλητή Χ4 σε μικρό βαθμό με x3 ,635 ,854 1,000 ,066 ,694 ,725 ,692
x4 ,028 -,012 ,066 1,000 ,006 ,095 ,077
τις υπόλοιπες μεταβλητές. x5 ,693 ,741 ,694 ,006 1,000 ,712 ,668
x6 ,681 ,692 ,725 ,095 ,712 1,000 ,692
Ο πίνακας Item to total statistics x7 ,675 ,717 ,692 ,077 ,668 ,692 1,000
Τέλος όσον αφορά την σύνθετη αξιοπιστία (composite reliability) καθώς και την υπολογισμένη
διακύμανση (variance extracted) πρέπει πρώτα να εκτελεστεί παραγοντική ανάλυση ή επιβεβαιωτική
παραγοντική ανάλυση και στην συνέχεια να υπολογιστούν οι τιμές των σύμφωνα με τους τύπους
Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 20