VII.

Validitatea testelor psihologice

DEFINIŢIA VALIDITĂŢII În legătură cu validitatea unui test, se pun două probleme: 1) Care este caracteristica măsurată de test ? 2) Prin testul respectiv chiar măsurăm ceea ce ne-am propus ? Când se construieşte un test, trăsătura (însuşirea) psihică luată în consideraţie pentru a fi măsurată trebuie, în prealabil, să fie definită pentru a putea fi operaţionalizată în indicatori măsurabili / înregistrabili în mod obiectiv (de exemplu, itemi). Definiţia iniţială a validităţii unui test arată că aceasta se referă la ceea ce se consideră că măsoară efectiv testul. Este greu de garantat însă că produsul final (ceea ce rezultă din operaţionalizarea definiţiei caracteristicii de măsurat – de exemplu, itemii) se referă într-adevăr numai la fenomenul respectiv (trăsătura, însuşirea), nu şi la altceva. Validitatea testului psihologic este un concept mai puţin bine definit decât fidelitatea. Definiţia clasică (validitatea = calitatea testului psihologic de a măsura în realitate şi cu precizie ceea ce şi-a propus să măsoare) este prea restrictivă. Există situaţii când nu avem decât o vagă idee despre ceea ce măsoară în realitate un test, dar totuşi îl utilizăm de exemplu, în practica selecţiei, pur şi simplu pentru că s-a demonstrat existenţa unei legături constante (corelaţie pozitivă) între scorurile la test şi criteriul reuşitei profesionale într-un anumit domeniu. În acest caz, se poate susţine că sunt respectate exigenţele definiţiei validităţii, şi anume: testul măsoară – indirect – reuşita profesională într-un anumit domeniu. Însă, ştim oare exact cărei caracteristici psihice se adresează testul ? Extinzând definiţia clasică a validităţii unui test, putem spune că aceasta se referă la pertinenţa testului, la măsura în care testul este adecvat scopului pe care şi-l propune psihologul care, de cele mai ulte ori, vizează prezicerea unui anumit tip de comportament sau performanţă. Aşadar, validitatea terbuie definită în termeni de valoare funcţională a testului. Un test este pe deplin valid atunci când scorurile obţinute de un subiect permit o concluzie nemijlocită şi fără echivoc în legătură cu gradul de reliefare a caracteristicii psihice a subiectului care este cercetată. Validitatea unui test permite psihologului să-şi justifice (fundamenteze) afirmaţiile pe care le face pornind de la scorurile testului. În ultimă instanţă, validitatea va determina alegerea unui 29

cât de bine (precis) sunt măsurate aceste cracteristici. dacă dorim să utilizăm chestionarul de personalitate EPI pentru testarea extra .anumit test pentru măsurarea unei anumite caracteristici. ci la inferenţele care pot fi făcute plecând de la rezultatele acestuia. Preocupările sistematice privind validitatea testului psihologic au apărut la începutul secolului al XX . comportamentele etc. 1985). Standard for Educational and Psychological Testing publicată de American Psychological Association (APA) şi American Educational Research Association (AERA) arată că validitatea unui test este un concept care nu se referă la testul în sine. Validarea unui test este întotdeauna legată de o situaţie particulară sau de un anume scop în care utilizăm testul. În nici un caz validitatea unui test nu poate fi garantată pentru întreg ansamblul de situaţii în care poate fi folost testul respectiv. De pildă. utilitatea lui. trăsăturile de personalitate. Cu alte cuvinte. cât şi rezultatele practic obţinute prin utilizarea acestuia – aspect care îi va reliefa măsura în care testul permite atingerea unui scop sau. În 1985. Spearman a creat o procedură bazată pe corelaţia statistică şi destinată controlului validităţii. Pentru stabilirea caracterului adecvat al unui test (unii autori vorbesc de pertinenţa testului). neputând să ne bazăm pe coeficienţii de validitate obţinuţi din datele rezultate de la alte populaţii.lea când psihologul englez Ch.) care pot fi evaluate utilizând testul respectiv. aptitudinile. este vorba de un ansamblu de proceduri calitative şi cantitative care au drept finalitate asigurarea validităţii testului. elaborându-se printre altele noţiunea de eroare standard a măsurării (ESM) – esenţială în aprecierea specificului şi exigenţelor legate de măsurarea caracteristicilor psihice. Observaţia poate fi legată de definiţia testului în termeni de eşantion de comportamente pe baza cărora se pot prognoza alte comportamente. validarea sa trebuie făcută pe un eşantion de subiecţi extras din populaţia corespunzătoare acelei categorii profesionale pentru care trebuie să existe şi un etalon. a fost fundamentată teoria clasică a testului. În anii 60 – 70. altfel spus. psihologul trebuie să studieze atât datele teoretice referitoare la validitatea lui.introversiunii şi a nevrotismului la o anumită categorie profesională. Psihologul va putea astfel stabili: 1) 2) care sunt caracteristicile psihice (de exemplu. Validarea unui test este procesul prin care se determină gradul de validitate (adecvare) a interpretării propuse de test (Standard for Educational and Psychological Testing. 30 . Coeficienţii de validitate a unui test vor avea valori diferite pentru populaţii diferite.

o validitate aparentă ridicată a unui test nu este în mod necesar într-un raport cu ceea ce măsoară testul şi nu indică cum pot fi utilizate rezultatele la test. b) în acelaşi timp. pentru evaluator validitatea aparentă poate avea un interes practic. De exemplu. Deşi în practică. orientarea şcolară şi profesională. Este necesar ca stimulii să fie acceptaţi de subiect şi să fie adecvaţi vârstei / ocupaţiei / nivelului de înţelegere a acestuia. adulţii candidaţi la un post de management pot aprecia itemii unui test de inteligenţă generală (de pildă raţionament) ca fiind sarcini de tip şcolăresc.TIPURI DE VALIDITATE Validitatea unui test trebuie stabilită în funcţie de mai multe criterii. promovarea pe linie profesională etc. Ca atare. Astfel avem: 1) validitatea aparentă (de aspect). şi 4)validitatea de criteriu (empirică). ordinea prezentării lor este determinată de posibilităţile de cuantificare şi de importanţă. După unii autori. respectiv patru modalităţi de evaluare a validităţii. Validitatea aparentă a unui test va genera o atitudine pozitivă a subiectului faţă de sarcina – test. Tot aşa. există tot atâtea tipuri de validitate câte exigenţe trebuie să îndeplinească testul. sunt adecvate situaţiei reale. Există cel puţin patru utilizări ale termenului de validitate. 1) Validitatea aparentă (de aspect) Validitatea aparentă reflectă măsura în care subiecţii testaţi consideră că probele la care sunt supuşi sunt pertinente. în funcţie de care se va preciza şi domeniul în care poate fi utilizat testul. 2) validitatea de conţinut. un electrician va aprecia mai mult un test de precizie a mişcărilor decât un test de reprezentare spaţială. Deşi din punct de vedere strict psihometric. ea poate accentua diferenţele între subiecţi (de exemplu. 3) validitatea de construcţie sau de construct (validitatea teoretică sau ipotetico-deductivă). importanţa validităţii aparente este limitată (aprecierile subiecţilor testaţi trebuie corelate cu alte măsuri ale validităţii). poate avea efecte indirecte: a) acceptarea testului poate creşte fidelitatea scorurilor care se obţin cu acesta. acceptare şi colaborare a subiectului cu evaluatorul. Rezultatele unui test pot constitui un factor determinant în luarea unor decizii diagnostice în diverse situaţii: diagnosticul nivelului de cunoştinţe sau a nivelului de dezvoltare a unor competenţe în vederea formării într-un anumit domeniu sau a consilierii. alocarea şi/sau realocare posturilor într-o organizaţie. unii subiecţi pot fi mai familiarizaţi cu situaţia de testare decât alţii sau testul poate să nu acopere diferenţele interindividuale dintre subiecţi 31 . selecţia şi formarea profesională. ajutând la stabilirea unei relaţii de încredere.

se pun două probleme importante: 32 . în acelaşi timp. Diferenţa între cele două aspecte ale validităţii rezidă în faptul că validitatea aparentă se referă la acceptabilitatea sarcinilor testului pentru subiect. dar pot fi utilizate cu succes în selecţia. ci este necesară şi suficientă doar o relaţie (corespondenţă) dovedită experimental între cele două aspecte. deci nu va avea validitate de aspect. Dar. Din acest punct de vedere. conţinutul testului trebuie să fie adecvat celui al caracteristicii / comportamentului urmărite de un test. De pildă. astfel de teste sunt costisitoare în timp şi bani. Cu alte cuvinte. problema validităţii aparente – acceptabilitatea conţinutului sarcinilor pentru subiect – devine esenţială. Testele situaţionale îl plasează pe subiect în condiţii asemănătoare celor în care ar lucra dacă ar fi acceptat la selecţie şi determină cât de adecvate sunt răspunsurile acestora. Anastasi (1976) defineşte testul psihologic ca o măsură obiectivă şi standardizată a unui eşantion reprezentativ de comportament. Scopul acestora fiind deghizat. se cunosc testele situaţionale – probe de performanţă care eşantionează comportamente semnificative ce au legătură cu munca pe care o poate desfăşura o persoană într-un anumit post. corespunzător nivelului care se cere pentru postul pe care acesta candidează. de pildă. O sarcină care depăşeşte cu mult resursele pe care subiectul le poate aloca pentru rezolvarea sa nu ne va comunica nimic din aspectele cantitative şi calitative legate de criteriul vizat prin test. în timp ce validitatea de conţinut vizează estimarea (evaluarea) făcută de profesionişti (experţi în domeniu testelor psihologice sau în domeniul profesional din care testul eşantionează aptitudini/deprinderi/comportamente) privind pertinenţa conţinutului testului. printre testele de eficienţă care măsoară diferite aptitudini intelectuale/practice. Autoarea precizează că itemii unui test nu trebuie neapărat să se asemene strict comportamentului vizat de test. În general. Astfel. Ele măsoară aptitudinile şi deprinderile esenţiale care asigură performanţa într-o anumită muncă. Ambele se referă la măsura în care conţinutul sarcinilor incluse într-un test . pentru astfel de teste..se apropie” sau acoperă (de) ansamblul sarcinilor reale prin care poate fi operaţionalizată caracteristica psihică măsurată. Din acest punct de vedere. am văzut că A. Este vorba despre acele deprinderi practice care nu pot fi operaţionalizate sau sunt mai greu operaţionalizabile prin teste de aptitudini cognitive. sarcinile de rezolvat trebuie să aibă un grad de dificultate acceptabil pentru subiect şi. 2) Validitatea de conţinut Există o asemănare aparentă între validitatea de conţinut şi validitatea aparentă.în ceea ce priveşte experienţele pe care le-au trăit). a managerilor. subiectul nu îşi poate da seama care aspecte ale performanţei sale sunt vizate.

deoarece conţine un mare număr de întrebări asemănătoare. aşa cum precizează şi A. fenomenelor. în psihologie. în majoritatea cazurilor. dar nu şi suficient de valid sub raportul conţinutului – deoarece întrebările pot să nu acopere integral domeniul cunoştinţelor de istorie pe care elevul de pe o anumită treaptă şcolară ar trebui să le aibă la un anumit nivel. Acest lucru poate fi corelat cu faptul că. validitatea de conţinut a unui test nu depinde de relevanţa aparentă a itemilor acestuia (care poate fi evaluată în mod subiectiv de specialişti). inteligenţa nu există sub o formă fizică sau tangibilă. cât de relevanţa răspunsurilor pe care le pot da subiecţii la itemii testului. măsurarea faptelor. Aprecierile specialiştilor privind validitatea de conţinut a testului trebuie mai degrabă considerate ca o etapă necesară dar nu şi suficientă în procesul de elaborare a testului. este posibil ca un test docimologic de cunoştinţe în istorie să fie foarte omogen (aşa. De aceea. 3) Cât de relevant este conţinutul fiecărei sarcini pentru un aspect sau altul al caracteristicii psihice / comportamentului vizate prin test ? Anumite metode şi proceduri vor permite aflarea răspunsurilor la aceste întrebări. încurajatoare) cu privire la validitatea de conţinut a testului care nu pot fi luate drept probe în procesul de validare a testului. acoperindu-se unul din aspectele fidelităţii unui test). se 33 . pot fi consultaţi specialişti în domeniul la care se referă testul şi se poate apela la procedurile legate de analiza de itemi binecunoscute de psihometricieni. cu alte cuvinte. Dar. eşantionul de sarcini propus de test este suficient de variat pentru a acoperi toate aspectele esenţiale legate de caracteristica psihică / comportamentul presupuse a fi măsurate ? De exemplu. 3) Validitatea de construcţie (teoretică / de construct / ipotetico-deductivă) Validarea la acest nivel oferă cadrul teoretic pentru fundamentarea analizei semnificaţiei psihologice a rezultatelor unui test. Validitatea de construcţie indică la ce concepte sau ipoteze trebuie să se recurgă pentru interpretarea rezultatelor unui subiect la un test (Standards for Educational and Psychological Tests. proceselor. la fel ca şi extraversiunea sau aptitudinea spaţială). adică a căror prezenţă este presupusă la subiect (trăsături latente) (de exemplu. Numeroase teste sunt construite pentru a măsura trăsături ipotetice. pentru evaluarea pertinenţei / relevanţei sarcinilor (itemilor) testului în raport cu universul real de sarcini prin care pot fi operaţionalizate o caracteristică psihică sau un comportament. Trebuie precizat că unii autori – înscriindu-se în aripa dură a psihometriei – consideră evaluările realizate de experţi cu privire la pertinenţa sarcinilor unui test doar ca nişte simple opinii (uneori. caracteristicilor psihice are. Anastasi (1976). un caracter indirect. 1985).1) Cât de reprezentativ este eşantionul de itemi (sarcini) sau conţinutul testului pentru conţinutul real al caracteristicii psihologice măsurate sau comportamentului vizat ? 2) Sarcinile (itemii) testului acoperă toate aspectele importante ale domeniului vizat prin test ? Sau. De pildă.

. trebuie să ne asigurăm că sarcinile testului se referă numai la inteligenţa verbală nu şi alte caracteristici – de pildă. examenul validităţii de construcţie a unui test se face gradat. prin definiţie. aici se impune precizarea că nici un test nu este . printr-o serie de acumulări de date din variate surse. inteligenţa. După Standards for Educational and Psychological Tests (1985). fluenţa verbală sau discriminarea simbolurilor verbale. sistemic. anxietatea sau introversiunea ci ceea ce cred autorii lor că sunt inteligenţa. Totuşi. Demersul de cercetare a validităţii de construcţie a unui test comportă două dimensiuni (proceduri): una logică (validarea deductivă) şi alta empirică (validarea inductivă) indisociabile şi este un proces continuu. prin ele însele. În cadrul validării deductive. pe baza cărora se determină conţinutul itemilor (sarcinilor) testului şi se generează ipoteze privind variabilele psihologice cu care testul ar trebui sau nu să coreleze. nu pot fi direct observabile. L.pur” din punct de vedere psihologic (aşa cum observa şi J. de pildă. De exemplu. În practică. testele de cunoştinţe (docimologice) sau testele situaţionale despre care am discutat deja. Psihometricienii englezi utilizează termenul de construct pentru a desemna modelizarea unui concept – în acest sens. neputându-se considera terminat niciodată. când vrem să construim un test de inteligenţă verbală. constructele sunt noţiuni teoretice derivate din cercetare şi care au fost construite pentru a facilita explicarea unor pattern-uri de comportament observabile. procedurile analizei factoriale sunt utile pentru izolarea trăsăturii/trăsăturilor care sunt presupuse a sta la baza construirii unui test. 34 . se porneşte de la teoria / modelul teoretic subiacente conceptului presupus a fi măsurat de test. De aceea. Sunt însă şi teste care se referă la domenii explicite ce pot fi direct operaţionalizate prin indicatori de performanţă: de exemplu. între diferitele procese. funcţii. reprezintă mijloace pentru înţelegerea şi/sau explicarea diferenţelor interindividuale în ceea ce priveşte anumite comportamente sau performanţe în spatele cărora se ascunde o caracteristică sau un complex de caracteristici care. Cronbach)– adică nici o trăsătură psihică nu poate fi izolată în totalitate şi măsurată separat – aceasta deoarece dezvoltarea psihică a omului are un caracter unitar.preferă termenul de construct atunci când se vorbeşte despre trăsăturile sau procesele psihice vizate în cadrul măsurării – constructele. anxietatea sau introversiunea. Este vorba despre luarea în considerare a tuturor rezultatelor experimentale referitoare la contextul teoretic căruia îi aparţine conceptul preupus a fi măsurat de test. Validitatea de construcţie se apropie cel mai mult de definiţia conceptului de validitate în general (un test măsoară realmente trăsătura/comportamentul pe care se presupune că o măsoară). putem spune că testele nu măsoară. aptitudini sau trăsături de personalitate existând relaţii de interdependenţă evidenţiate prin corelaţii statistice mai ridicate sau mai slabe.

eticehetele atribuite testelor (de pildă.00). putem corela scorurile acestora cu scorurile obţinute la un chestionar deja construit şi recunoscut ca fiind valid (ca măsurând variabila extraversiune). Acest procedeu. testul de extraversiune) nu corelează semnificativ cu rezultatele la un test deja validat care măsoară o altră trăsătură diferită de cea care stă la baza construcţiei testului nostru. se numeşte verificarea validităţii convergente (i se mai spune şi validitate concurentă). Valorile corelaţiilor obţinute ar trebui să fie pozitive şi semnificativ ridicate (apropiate de + 1. Este vorba. corelaţia scorurilor testului pe care dorim să-l validăm cu scorurile la chestionarul de extraversiune a cărui validitate a fost deja studiată trebuie să aibă o valoare semnificativ mai ridicată decât corelaţia scorurilor la testul pe care dorim să-l validăm şi. dintre care una are o validitate deja recunoscută. în conţinutul celor două teste. De pildă. corelaţia ridicată între scorurile la un test de nevrotism pe care dorim să-l validăm şi cel la un test de nevrotism deja validat poate fi cauzată de existenţa. dacă am testat subiecţii cu un chestionar presupus a măsura variabila extraversiune. în acest caz. El presupune corelarea rezultatelor obţinute prin studierea aceleiaşi trăsături cu două metode (teste) distincte. Aceasta deoarece. se porneşte de la scorurile furnizate de un test şi se încearcă identificarea (determinarea prin inferenţe succesive) trăsăturii care este presupusă a sta la baza testului. De aceea. Totuşi.În demersul validării inductive. În acelaşi timp. de verificarea validităţii divergente. datele trebuie completate cu cele provenite din efectuarea unei analize factoriale asupra itemilor din cele două teste pe care le corelăm (ca şi cum am considera itemii teste în sine). test de stabilitate emoţională sau test de extraversiune) denumesc trăsăturile pe care testul ar trebui să le măsoare nu despre care ştim deja că sunt măsurate de test. Acest tip de validitate mai este cunoscut sub denumirea de validitate discriminantă. Studierea validităţii discriminante a unui test permite să se demonstreze că scorurile la test depind (variază în funcţie) de nivelul de prezenţa latentă a trăsăturii presupuse a fi măsurată de test şi nu de metoda de măsurare 35 . o faţetă a trăsăturii extraversiune !). a unor itemi asemănători şi nu de reprezentativitatea itemilor testului pe care tocmai l-am construit pentru constructul pe care acesta intenţionează să-l măsoare. La baza inferenţelor amintite stă determinarea relaţiei scorurilor la test cu scorurile la teste care măsoară alte variabile – desigur apropiate în ceea ce priveşte semnificaţia şi conţinutul de variabila presupusă a fi măsurată prin testul a cărei validare se caută. Luând exemplul dat mai înainte. de exemplu. calculul corelaţiilor pentru a dovedi validitatea convergentă a unui test este necesar dar nu şi suficient pentru a dovedi că testul măsoară ceea ce se doreşte. scorurile la un test de sociabilitate deja validat (sociabilitatea poate constitui doar un aspect. De pildă. trebuie să ne asigurăm că rezultatele la testul pe care dorim să-l validăm (de pildă.

4) Validitatea de criteriu (empirică). De aceea. să zicem. reuşita la un stagiu d formare sau la un examen. sunt şi cazuri în care trăsăturile psihice au fost operaţionalizate prin indicatori distribuiţi pe un continuum bipolar (de exemplu. Un individ nu are cum să fie în acelaşi timp şi stabil şi instabil emoţional. Criteriile – care pot avea diferite grade de complexitate – trebuie definite cât mai clar (de pildă. la testul de stabilitate emoţională tinde să se asocieze cu scorul mic la testul de instabilitate emoţională. conservatorism – deschidere către schimbare etc. Dar. ci scorul mare. preocuparea principală nu mai este de a şti care trăsătură subiacentă (ipotetică. stabilitate emoţională – instabilitate emoţională. deci nu măsoară numai inteligenţa verbală (în teoria analizei factoriale. performanţa cantitativă şi calitativă într-o sarcină specifică de muncă etc. ci dacă scorurile la testul în cauză po prezice un anumit comportament (un aspect specific al acestuia) sau o anumită performanţă a subiectului (de exemplu. Variabilele care trebuie prezise pe baza scorurilor la un test sau la mai multe teste sunt denumite prin termenul general criterii. Să mai luăm două exemple. presupusă în stare latentă) este măsurată de test. să zicem. reflectând sistemul constructelor sau subiectivitatea judecăţilor evaluatorului). putem spune că primul test nu are validitate discriminantă. Dacă am dispune. Una din strategiile de verificare a validităţii de criteriu constă în corelarea scorurilor la testul de validat cu notele (aprecierile cantitative) referitoare la 36 .utilizată (testul pe care dorim să-l validăm sau alte teste care măsoară aceeaşi trăsătură şi a căror validitate a fost deja studiată). se spune că testul este saturat atât în factorul inteligenţă practică cât şi în factorul inteligenţă verbală). valoarea corelaţiei între scoruri trebuie să fie apropiată de 0. atunci corelaţiile între scorurile la acestea trebuie să aibă valori semnificativ negative. ce indicatori cantitativi/calitativi trebuie să luăm în considerare pentru a evalua reuşita într-un post de muncă sau care sunt faţetele unui comportament aşteptat).).). se vorbeşte despre imposibilitatea identificării unor criterii cât mai apropiate de viaţa reală a subiectului (subiectivitatea criteriilor care pot fi adesea ipotetice. numărul de sedinţe de psihoterapie necesare în urma stabilirii gravităţii simptomelor unei tulburări.00 (corelaţie nulă). introversiune-extraversiune. Coeficientul de validitate În cazul acestei etape a procesului de validare. În acest caz. adică apropiate de valoarea (-1) (corelaţii inverse). de teste separate operaţionalizând cei doi poli ai unei trăsături. Dacă scorurile la un test de inteligenţă practică corelează semnificativ pozitiv cu scorurile la un test de inteligenţă verbală deja recunoscut.

cu atât vom avea mai multe argumente cu privire la generalizarea validităţii acestuia. se poate specifica o baterie de teste pertinentă şi adaptată – desigur. S-a demonstrat că un test este un bun predictor al reuşitei în activitaţi similare. Corelaţia obţinută poartă numele de coeficient de validitate. se vorbeşte de aşa-numita validitate sintetică. În felul acesta. Este de fapt un concept mai vechi (prima dată a fost utilizat în 1920). 37 . cu cât vom acumula mai multe informaţii asupra validităţii predictive a unui test. Cu cât activităţile sunt mai apropiate . Notele la criteriu pot fi colectate paralel cu notele la test (predictor) – caz în cale se mai vorbeşte de strategie de validare concurentă sau după un anumit interval de timp – caz în care avem de-a face cu o strategie bazată pe validarea predictivă.reuşita într-un anumit domeniu profesional sau la comportamentul urmărit (notele la criteriul de performanţă sau la criteriul comportamental). trebuie să dispunem şi de informaţii referitoare la validitatea fiecărui test în parte care pot fi legate de descrierea fiecărei componente a activităţii presupusă a fi evaluată prin bateria de teste sau a comportamentului complex. De pildă. Problema asigurării obiectivităţii criteriilor alese pentru validare este esenţială pentru asigurarea validităţii de criteriu a unui test. Aici putem face o analogie cu validitatea de construct: astfel. Strâns legat de validitatea de criteriu. dar care a atras din nou atenţia. cu atât generalizarea validităţii unui test este mai justificabilă. poate fi vorba despre deducerea validităţii unui instrument de evaluare referitor la mai multe aspecte ale unei activităţi profesionale sau ale unui comportament pornind de la o analiză logică a activităţii respective sau a comportamentului respectiv.

Sign up to vote on this title
UsefulNot useful