You are on page 1of 51

VALIDITATEA

TESTELOR
PSIHOLOGICE
Definiţia validităţii
“Modalitatea în care un test măsoară ceea ce îşi propune să
măsoare, respectiv cat de bine reuseste acest lucru” (Anastasi,
1976).

 Trebuie atribuită întotdeauna inferenţelor făcute pe


baza performanţelor la un test
 Validitatea determină relaţia dintre inferenţele făcute
pe baza performanţelor la un test şi realitate
Validarea
 Validarea implica un proces de culegere de
informatii despre test si evaluarea lor
 Autorii testului ofera aceste informatii in
manual.
 Utilizatorii pot sa realizeze studii de
validare.
 Proces continuu
Validare:

 Utilizatorul realizeaza validare:


~ Pentru diferite scopuri
~ Daca populatia difera de cea pe care s-a validat
testul
Formele validităţii

 Validitate de criteriu
 Validitate de conţinut
 Validitate de construct
(Anastasi, 1976; Cohen, et. all, 2000)

Validitatea de aspect
Validitatea de aspect
 Validitatea de aspect
 “ceea ce un test pare să măsoare, mai degrabă decât ceea ce măsoară”
(APA, 1974)
 Modul în care persoana evaluată percepe itemii testului
 Dacă persoana evaluată apreciază că testul măsoară ceea ce
îşi propune, spunem că testul are o validitate de aspect
ridicată
 Nu este un criteriu important pentru inferenţele pe baza
unui test
Validarea de criteriu
 Cum se comporta testul comparativ cu alte masuratori
 Utilitatea diagnostica
A. Validitatea de criteriu
(validitate empirică)
Indică măsura în care testul este un bun predictor pentru un
eşantion de comportamente viitoare
 Compararea scorurilor la test cu alte criterii cantitative definite
 Testul poate sau nu să măsoare acelaşi construct
 Performanţa la un test (predictor) trebuie raportată la o altă
performanţă pe care o numim criteriu
Criteriul este definit ca standardul la care este raportată
performanţa la un test.
Un test psihologic este adecvat dacă este relaţionat cu un criteriu
şi deci poate fi considerat un bun substitut al criteriului - testul
este predictor pentru criteriul respectiv
Caracteristicile unui criteriu

 Reprezintă o măsură directă şi independentă a ceea ce testul


doreşte să prezică
 Condiţii:
 Să fie relevant pentru activitatea sau caracteristica la care
se referă
 Să fie fidel, adică să fie congruent cu evaluări diferite ale
performanţelor la care se referă, evaluări realizate la
momente diferite
 Să fie practic
 Sa fie necontaminat
 Să fie exprimat în aceleaşi unităţi pentru toate persoanele
Tipuri de validitate de criteriu – validitate
predictiva

1. Validitatea predictivă
= acurateţea cu care putem estima în ce măsură o anumită caracteristică sau
aptitudine a unei persoane se va manifesta în viitor pe baza măsurii în care
persoana posedă o serie de caracteristici sau aptitudini curente

Predicţia este procesul de stabilire a unor expectaţii despre viitor având la bază
date / evenimente curente:
 datele actuale = „predictori”
 variabilele care descriu performanţa se numesc „criteriu”
Tipuri de validitate de criteriu – validitate
concurenta

2. Validitatea concurentă
= rezultatele predictorului (testului) sunt obţinute
simultan cu rezultatele la criteriu
 Exprimă în ce măsură scorurile la test pot fi utilizate
pentru a estima performanţa actuală a unei persoane
la un anumit criteriu
Validarea predictivă: Validarea concurentă:
 presupune existenţa unui interval
 presupune obţinerea scorurilor la
de timp între test şi verificarea
criteriului criteriu aproximativ în acelaşi timp
 validarea predictivă vizează
cu scorurile la test
evoluţia sa în viitor  are ca scop rezolvarea unei
probleme privind starea actuală a
subiectului
 exprimă în ce măsură scorurile la
test pot fi utilizate pentru a estima
performanţa actuală a unei persoane
la un anumit criteriu
Validarea de criteriu pentru teste diagnostice
dihotomice
 In ce masura pe baza rezultatului la test putem decide
daca subiectul are un diagnostic (ex. Depresie,
anxietate)?
 In ce masura pe baza rezultatului la test putem decide
daca subiectul are o boala ?
 Analiza pe baza teoriei detectarii semnalului
Diagnostic
 Abordarea categoriala
 Prezent vs. absent
Utilitatea diagnostica
 Cum se analizeaza?
 Conditii: doua instrumnete:
 Unul standard
 Unul experimental
 Algoritm de analiza
Rezultatul la un test pe care dorim sa il
validam
Pozitiv Negativ

Prezent AP FN
(da) (Adevărat pozitiv) (Fals negativ)
(Hit) (Miss)
Criteriu
Diagnostic
FP AN
Absent (Alarme false) (Adevărat negativ)
(nu) (False Alarm) (True Negative)
Utilitatea diagnostică
CONCEPTE:
 Adevăraţi pozitivi (Hits) - AP
 Adevăraţi negativi - AN
 Falşi pozitivi (false alarm) - FP
 Falşi negativi (Miss) - FN
 Utilitatea diagnostică
Utilitatea diagnostică a unui test
 Sensibilitatea = AP/ adică AP + FN

Sensibilitatea=Ce proporţie din diagnosticaţii reali


identifica testul?

Ex. Specificitate=.98  2% dintre cei care au


diagnostic rămân neidentificaţi de destul nostru
Utilitatea diagnostică a unui test
 Specificitatea = AN/ D- (adică AN + FP)

Specificitatea = câţi dintre cei care nu au diagnostic sunt


identificaţi de test ca neavând diagnostic

Specificitate = .80  20% dintre cei care nu au


diagnostic sunt identificaţi ca având diagnostic.
Utilitatea diagnostică a unui test

Utilitatea
diagnostică =
(AP + AN)/ n
Validitatea de continut
 Itemii care alcătuiesc testul să fie reprezentativi
pentru ceea ce testul doreşte să măsoare.

 Testul acoperă un eşantion reprezentativ din


domeniul care se cere a fi evaluat prin test (Anastasi,
1976).
Procedura standard
 Crocker & Algina (1986)
 Definirea domeniului de interes
 Selectia unui panel de experti in domeniul de continut
 Generarea itemilor in cadrul domeniului
 Analiza, colectarea si sumarizarea datelor
Validitatea de continut
 Definirea şi descrierea domeniului de conţinut a testului.
 extrem de clară
 să includă toate faţetele domeniul care se doreşte a fi evaluat.
 Generarea itemilor
 Nr. mai mare decat numarul final
 Analiza itemilor care sunt incluşi în test.
 Compararea structurii testului cu domeniul de conţinut. Astfel se va
analiza dacă itemii acoperă toate aspectele domeniului, respectiv
dacă ei sunt proporţionali în test cu importanţa şi mărimea fiecărui
aspect.
 Eliminaţi itemii inadecvati
 Reanalizarea itemilor ramasi
1. Construcţia de itemi
Formularea itemilor

 Definiţi clar ceea ce aveţi de măsurat, pentru a putea formula itemii cât
mai specific posibil.
 Evitaţi formularea unor itemi lungi, care ar putea fi greu înţeleşi.
 Încercaţi să formulaţi itemii într-un limbaj accesibil persoanelor
evaluate cu acest instrument.
 Evitaţi formularea unor itemi care surprind două aspecte sau idei, de
exemplu:
 „Îmi place să lucrez într-un mediu bine organizat, pentru că vreau
să fiu cel mai bun la locul de muncă”
 Încercaţi să formulaţi itemi pozitivi şi negativi în aceeaşi măsură, pentru
a evita biasarea care apare în cazul formulării itemilor pozitivi. Această
biasare este determinată de tendinţa persoanei evaluate de a fi de acord
cu toţi itemii testului.
1. Construcţia de itemi
Formatul opţiunilor de răspuns
a.Itemii dihotomici – oferă două alternative de răspuns (da sau nu; adevărat sau
fals)
Avantajele:
 sunt uşor de cotat;
 sunt uşor de construit (în construirea unui test de evaluare a cunoştinţelor
profesorul poate utiliza fragmente din suportul de curs pentru a formula
itemii);
 completarea lor nu necesită mult timp deoarece răspunsul nu trebuie scris;
 necesită o evaluare în termeni absoluţi (alb sau negru);
Dezavantaje :
 în cadrul testelor de cunoştinţe acest tip de itemi pot încuraja studenţii să â
memoreze materialul;
 şansa de a ghici răspunsul corect este foarte mare, de 50%.
b. Itemi cu mai multe opţiuni
(polinomici)
Au mai mult de două alternative de răspuns. Se acordă un punct numai unei opţiuni de
răspuns, iar celelalte care nu sunt corecte poartă denumirea de distractori. Itemii
construiţi în scopul evaluării performanţei academice au de cele mai multe ori acest
format.

Avantajele acestui tip de itemi sunt:


 aceşti itemii sunt uşor de cotat;
 sunt uşor de construit;
 completarea lor nu necesită mult timp deoarece răspunsul nu trebuie scris;
 şansa de a ghici răspunsul corect este redusă;

Dezavantajul cel mai mare al acestui tip de itemi se referă la construirea unor
distractori buni, procedeu care necesită mai mult timp. În cazul itemilor polinomici,
probabilitatea de a ghici răspunsul există, deşi este mai mică decât în cazul itemilor
dihotomici (este de 25% în cazul a patru alternative, de 33.33% în cazul a trei
alternative).
c. Scala Likert
 5 sau 7 gradatii

 (dezacord total dezacord indif. acord acord total)

 Indica intensitatea acordului sau dezacordului subiectului asupra


unei afirmatii/unei caracteristici anume.
 numar de optiuni
 tendinta centrala
 dezirabilitate sociala
Itemi
d. Scala categoriala
 Este similară cu scalele Likert, dar utilizează un număr mai mare de opţiuni de
răspuns, de cele mai multe ori sunt utilizate scale cu 10 opţiuni de răspuns.
 Pentru utilizarea lor adecvată este foarte important ca punctele extreme ale scalei să
fie clar definite şi permanent reamintite celor care realizează evaluarea.
 Una dintre principalele probleme legate de acest tip de scală este numărul de
categorii care poate fi utilizat, care poate fi de 10 şi 15 sau 66? S-au realizat câteva
studii în acest sens, ele au arătat că depinde mult de scopul pe care îl avem şi de
nivelul de expertiză al evaluatorului. De exemplu dacă dorim să evaluăm
performanţa unor jucători de fotbal, o scală cu 7 nivele va fi suficientă pentru
ochiul unui nonexpert care nu sesizează aspectele de fineţe, dar nu şi în cazul unui
expert, al unui antrenor care poate sesiza mai multe diferenţe între jucători.
e. Q- sort – este o metodă utilizată cu precădere în evaluarea personalităţii. Persoana
evaluată va primi o listă de adjective pe care le va sorta în funcţie de măsura în care
acestea îl caracterizează
2. Analiza de itemi
 Analiza cantitativa de itemi
 indicele de dificultate al itemului;
 indicele de discriminare;
 Analiza calitativă de itemi
Indicele de dificultate al unui item
 Indicele de dificultate al unui item (px) se obţine calculând
proporţia subiecţilor care au răspuns corect la item. Valoarea
teoretică a indicelui de dificultate se găseşte între 0 (dacă nici
un subiect nu a rezolvat itemul corect) şi 1 (dacă toţi subiecţii
au răspuns corect la un item).
 Cu cât indicele de dificultate al itemului este mai mare cu atât
itemul este mai uşor. Deoarece „p” se referă la procentul celor
care au rezolvat corect itemul, putem spune că cu cât este mai
mare valoarea indicelui cu atât itemul este mai uşor.
Indicele de discriminare al unui item
 Indicele de discriminare al unui item (d) constituie o măsură a
cât de bine reuşeşte un item să separe sau să discrimineze
subiecţii care au obţinut scoruri mari şi cei care au obţinut
coruri mici la test.
 Un item este considerat discriminativ dacă subiecţii care au
obţinut o performanţă bună la test au rezolvat corect itemul,
respectiv dacă cei care au obţinut o performanţă scăzută la test
nu au rezolvat corect itemul
 Indicele de discriminare are în vedere performanţa
eşantionului la un item ţinând cont de performanţa scorurilor
din ultima treime sau din prima treime a distribuţiei totale a
scorurilor.
Validitatea de construct
 Validitatea de construct=măsura în care putem
spune că testul măsoară o variabilă sau o
trăsătură specifică
 Constructul este desprins dintr-o teorie
psihologică
 Constructul are rolul să fundamenteze analiza
semnificaţiei psihologice a rezultatelor la test
 Constructului trebuie operaţionalizat în termeni
comportamentali concreţi
Operaţionalizarea unui construct

 1. Care sunt comportamentele care au legătură cu


constructul?
 2. Ce alte constructe sunt legate de constructul
masurat de noi?
 3. Alcătuiţi pentru fiecare construct o lista de
comportamente prin care se manifestă.
 4. Indentificaţi, pe baza relaţiilor dintre constructe
şi comportamente, dacă fiecare comportament are
sau nu legătură cu constructul măsurat de test.
Analiza factorială
Analiza factorială Analiză factorială
exploratorie confirmatorie

Cum sunt relaţionate Testarea modului în


variabilele, care sunt care un set de
factorii care le pot variabile defineşte un
explica construct
EFA CFA
Concepte în Analiza Factorială
 Atribute interne sau factori
 Atribute de suprafaţă
 Factor comun
 Factor specific
 Factor determinat de ERM
 Factor unic
ATRIBUTE INTERNE

Punctul central al AF în constituie asumpţia existenţei


unor atribute interne (AI)
- caracteristică neobservată a populaţiei sub care oamenii diferă;
- nu sunt observabile în mod direct;
- efectele lor se pot înregistra prin intermediul AS;
- sunt denumite factori sau variabile latente;

Ex. Atribute interne (aptitudinea academică)  Atribute de


suprafaţă (nota la matematică)

Ex. Anxietatea
Relaţia dintre atributele interne şi
cele de suprafaţă
 Atributele interne influenţează sistematic atributele de
suprafaţă;

 Atunci când avem o măsură a unui atribut de suprafaţă


(ex. Test la aritmetică), această măsură este, cel puţin în
parte, rezultatul influenţei atributelor interne (ex.
Aptitudinea numerică);
Factori comuni şi specifici
Factori comuni
 Atribut intern care afectează /influenţează mai mult de o variabilă de suprafaţă

Factori specifici
 Atribut intern care afectează /influenţează doar o singură variabilă de suprafaţă

 Factorul comun se poate transforma în factor specific (prin înlăturarea de


variabile) şi invers (prin adăugarea unor variabile)

! Eroarea de măsură
Factori şi covarianţa atributelor de suprafaţă

 variabilele de suprafaţă dintr-un domeniu specific tind


să coreleze într-o anumită măsură una cu cealaltă;

 această corelaţie este datorată influenţei factorilor


comuni;

 Exemplu - scorul la un test de adunare va tinde să coreleze


pozitiv cu scorul la un test de înmulţire deoarece ambele
variabile depind de acelaşi factor comun – aptitudinea numerică
Principii ale AFE
 Variabilele de suprafaţă dintr-un domeniu specific tind să coreleze într-o
anumită măsură una cu cealaltă această corelaţie este datorată influenţei
factorilor comuni.
 Ex.scorul la un test de adunare va tinde să coreleze pozitiv cu scorul la un
test de înmulţire deoarece ambele variabile depind de acelaşi factor comun –
aptitudinea numerică.
 Ex. rezultatul la testul de adunare va corela mai puţin cu rezultatul la un test
de citire deoarece cele două variabile de suprafaţă sunt influenţate de factori
comuni diferiţi.
 Doar factorii comuni pot explica corelaţia variabilelor de suprafaţă; factorii
unici nu determină astfel de corelaţii!
 La fel, factorii specifici sau erorile de măsură nu pot determina corelaţii între
atributele de suprafaţă deoarece prin definiţie ei influenţează doar o singură
variabilă de suprafaţă.
Cum se realizează AFE?

1. Colecţia de date – matricea originală.


2. Matricea de corelaţie.
3. Matricea factorială.
1. Colecţia de date – matricea originală

Variabile
Observaţii

V1 V2 V3 ...... Vk
O1

O2

O3
Date observaţionale
...

On
2. Matricea de corelaţie
Variabile
Variabile

V1 V2 V3 ...... Vk
V1

V2

V3
Coeficienţi de
...
corelaţie
Vk
3. Matricea factorială
Factori
Variabile

F1 F2 ...... Fm
V1

V2

V3
Încărcare factorială
...

Vk
Matricea de intercorelaţie

Variabile
Variabile

Lovire Viteză Apucare Citire


Lovire --

Viteză .78 --

Apucare .65 .77 --

Citire .10 .04 -.03 --


Analiza factorială
F1: Aptitudinea pentru baseball
Lovire Viteză Apucare Citire Scris

Lovire --

Viteză .78 --

Apucare .65 .77 --

Citire .10 .04 -.03 --

Scris .09 .07 -.01 .86 --


Analiza factorială
F1: Aptitudinea pt. baseball
Lovire Viteză Apucare Citire Scris

Lovire --

Viteză .78 --
F2: aptitudinea
.65
Apucare .77 --
academică

Citire .10 .04 -.03 --

Scris .09 .07 -.01 .86 --


Corelaţii item-factor
F1 .04 F2
Aptitudinea pt. baseball aptitudinea academică
Lovire .92 .03

Viteză .87 .08

Apucare .86 -.04

Citire .02 .95

Scris .00 .94


Critici ale AF
 Etichetarea factorilor - atenţie la etichetările
neadecvate!
 Uneori factorii sunt atât de evidenţi încât ar fi putut fi
identificaţi fără AF
 Principiul GIGO – “Garbage In, Garbage Out” –
AF nu creează noi date!!!!!
 atenţie la datele pe care le introducem – măsurători
incomplete sau din puţine surse determină o AF inutilă

You might also like