Psihodiagnostic

Universitatea Babe-Bolyai
PSIHODIAGNOSTIC
Sem I
Conf. Univ. Dr. Anca Dobrean
I. Informatii generale Date de identificare ale cursului : Numele cursului : PSIHODIAGNOSTIC Codul cursului : Psy 2093 Anul : II ; Semestrul I Tipul cursului : Obligatoriu Numr de credite : 6,5 Pagina web a cursului : www.psychology.ro Date de contact ale titularului de curs: Nume: Anca Dobrean Birou: str. Republicii, nr. 37 Telefon: 0264-434141 Fax: 0264-434141 E-mail: AncaDobrean@psychology.ro Consultatii : Joi 10-12 Date de identificare curs si contact tutori: Tutori : Asistent de cercetare drd. Madalina Sucala Asistent de cercetare drd. Cristina Mogoae Adresa e-mail tutori: psihodiagnostictutor@psychology.ro
Cerine: Parcurgerea cu succes a cursului presupune: nvarea suportului de curs electronic Parcurgerea bibliografiei obligatorii Efectuarea lucrrilor de seminar Examinare: Nota final se compune din: a. punctajul obinut la examenul scris n proporie de 70% (7 puncte) b. evaluarea proiectului de semestru 30% ( 3 puncte). Calendarul cursului: - consultaiile fa n fa vor avea loc n data de 14 noiembrie 2010, ora 13, Amfiteatrul Mrgineanu i 15 ianuarie 2011, ora 13, Amfiteatrul Mrgineanu. - consultaiile online vor avea loc n zilele de luni de la ora 20 la 21 i miercuri, de la ora 10 la 11, prin intermediul yahoo messenger (ID: psihodiagnostictutor) Proiectul va fi trimis pn n data de 20 ianuarie 2011 pe adresa de email psihodiagnostictutor@psychology.ro Tutori: conf. dr. Anca Dobrean, drd. Cristina Mogoase, drd. Madalina Sucala. Adresa de contact: psihodiagnostictutor@psychology.ro Obs.: toate mesajele legate de aceast disciplin se vor trimite doar pe adresa psihodiagnostictutor@psychology.ro Ore de consultaii conf. univ. dr. Anca Dobrean: joi 10-12, Institutul de Psihologie, str. Republicii nr 37. Disciplina Psihodiagnostic este o disciplin obligatorie pentru anul II. Scopul principal pentru semestrul I este acela de a asimila principalele cunotine i deprinderi de a analiza un instrument de evaluare psihologic.
Conditionri si cunostinte prerechizite nscrierea la acest curs este condiionat de parcurgerea i promovarea urmtoarelor discipline Psihologie general I , Psihologie general II, Psihologie Experimental I i Psihologie Experimental II. Cunotinele dobndite prin aprofundarea acestor discipline sporesc considerabil accesibilitatea temelor propuse n acest curs. n totalitatea lor, aceste prerechizite vor fi foarte utile n rezolvarea sarcinilor de lucru i, respectiv n promovarea examenului de evaluare final. Descrierea cursului Cursul de Psihodiagnostic face parte din pachetul de discipline fundamentale ale specializrii psihologie, nivel licen, din cadrul Facultii de Psihologie i tiine ale Educaiei a Universitii Babe-Bolyai din Cluj-Napoca. Cursul are ca obiectiv formarea cunotinelor de baz n ceea ce priveste psihodiagnosticul i evaluarea psihologic, elemente eseniale n anatomia oricrui demers psihologic. Cursul abordeaz o serie de modaliti i instrumente de evaluare psihologic, urmrind formarea cunotinelor i competenelor de analiz a principalelor caliti psihometrice ale acestor instrumente (fidelitatea, validitatea, etalonarea) precum i oferirea unor cunotine de baz privind construcia, aplicarea i interpretarea testelor psihologice. Organizarea temelor n cadrul cursului Cursul este structurat pe opt module de nvare, prezentate n continuare: Conceptele de msurare, evaluare in psihologie, Evaluarea psihologic: indici statistici de msurare/evaluare, Etalonarea testelor, Fidelitatea testului psihologic, Validitatea testului psihologic, Algoritmul construciei unui test psihologic, Utilitatea diagnostic a unui test psihologic, Adaptarea instrumentelor pentru alte culturi. Nivelul de intelegere si, implicit, utilitatea informatiilor pe care le regsiti in fiecare modul vor fi optimizate dac, n timpul parcurgerii suportului de curs, veti consulta sursele bibliografice recomandate. De asemenea, rezolvarea sarcinilor de lucru presupune parcurgerea referinelor obligatorii, menionate la finalul fiecrui modul. Formatul si tipul activitilor implicate de curs Parcurgerea celor opt module descrise va presupune att ntlniri fa n fa (consultatii), ct i munc individual. Consultatiile, pentru care prezenta este facultativa, reprezinta un sprijin direct acordat dumneavoastra din partea titularului si a tutorilor. Acestea vor presupune prezentarea teoretic a informaiilor fiecrui modul. Pentru fiecare modul, dumneavoastra veti parcurge materialele bibliografice obligatorii. Vor exista doua sarcini obligatorii, discutate i detaliate la fiecare dintre cele dou consultaii. Grila de notare si enunul acestora vor fi specificate la aceste ntlniri. Modalitatea de notare si, respectiv, ponderea acestor activitati obligatorii, n nota finala va sunt precizate n seciunea politica de evaluare i notare. Pe scurt, avnd n vedere particularitile nvmntului la distan dar i reglementrile interne ale CFCID al UBB parcurgerea i promovarea acestei discipline presupune antrenarea studenilor n urmtoarele tipuri de activiti: a. consultaii pe parcursul semestrului vor fi organizate dou ntlniri de consultaii fa n fa; prezena la aceste ntlniri este facultativ; b. realizarea a dou sarcini de lucru obligatorii, anunate cu cel puin 30 de zile naintea datei de depunere a acesteia, trimise tutorilor n conformitate cu calendarul disciplinei. Materiale bibliografice obligatorii In suportul de curs, la finalul fiecarui modul sunt precizate referinele biblografice obligatorii. Sursele bibliografice au fost astfel stabilte nct s ofere posibilitatea adncirii nivelului de analiz si, implicit, comprehensiunea fiecrei teorii, facilitnd nelegerea i aprofundarea temelor de studiu abordate n fiecare modul.
Acestea pot fi accesate la Biblioteca Centrala Universitara LUCIAN BLAGA, Cluj-Napoca. Albu, M. (1998). Construirea i utilizarea testelor psihologice, Editura Clusium. Albu, M. (2000). Metode i instrumente de evaluare n psihologie. Editura Argonaut. Kaplan, R.M. i Saccuzzo, D.P. (2001) Psychological Testing, Principles, Applications and Issues, Wadsworth Thomson Learning, Fifth Edition. Stan, A. (2002). Testul psihologic. Evoluie construcie, aplicaii. Editura Polirom Materiale si instrumente necesare - retroproiector - staie sonorizare (pentru curs) - laptop - videoproiector - materiale xeroxate pentru activiti seminar Calendarul cursului Sunt programate 2 ntlniri fa n fa (consultaii) cu toi studenii loc n data de 14 noiembrie 2010, ora 13, Amfiteatrul Mrgineanu i 15 ianuarie 2011, ora 13, Amfiteatrul Mrgineanu. Pentru prima ntlnire se recomand lectura atent a primelor patru module; la cea de a doua se discuta ultimele patru module si se realizeaza o secventa recapitulativa pentru pregatirea examenului final. De asemenea in cadrul celor doua intalniri studenti au posibilitatea de solicita titularului si/sau tutorilor sprijin pentru sarcinilor de lucru obligatorii. Pentru a valorifica maximal timpul alocat celor doua intalniri se recomand parcurgerea obligatorie a cel putin a uneia dintre sursele bibliografice de referinta, pe suportul de curs. La fiecare dintre aceste dou ntlniri vor fi prezentate detaliat sarcinile obligatorii i termenul limit de predare a lor. Politica de evaluare si notare Evaluarea finala se va realiza pe baz unui examen gril desfasurat in sesiunea de la finele semestrului III. Nota final se compune din: a. punctajul obtinut la acest examen n proporie de 70% (7puncte) b. evaluarea sarcinilor obligatorii de pe parcurs 30% (3 puncte, adica 1.5 puncte/sarcin). Instruciuni suplimentare privind modalitile de elaborare, redactare, dar i criteriile de notare ale lucrrilor, v vor fi furnizate de ctre titularul de curs sau tutori n cadrul ntlnirilor fa n fa. Pentru predarea sarcinilor se vor respecta cu strictee cerintele formatorilor. Sarcinile predate dupa data afiata nu vor fi luate n considerare pentru notare. Rezultatele finale vor fi puse la dispoziia studentilor prin afisaj electronic. Elemente de deontologie academic Studenii care susin examene de mrire de not sau restante trebuie s prezinte toate sarcinile aferente cursului. Fraudarea examenului sau a sarcinilor de lucru de pe parcursul semestrului se penalizeaz prin exmatriculare. Proiectele copiate, discuiile sau colaborrile n timpul examenelor se sancioneaz cu nota 1. Nepredarea lucrrii scrise de ctre un student care se prezint la examen este sancionat cu nota 1. Orice material elaborat de catre studenti pe parcursul activitilor va face dovada originalitatii. Studentii ale cror lucrri se dovedesc a fi plagiate nu vor fi acceptati la examinarea finala. Discuiile sau colaborrile n timpul examenelor se sancioneaz cu nota 1. Nepredarea lucrrii scrise de ctre un student care se prezint la examen este sancionat cu nota 1. Contestarea notei primite la examen se face n scris, la secretariatul facultii, n termen de 48 ore de la afiarea rezultatelor. Nota final la disciplina respectiv este cea obinut n urma contestaiei.
Studenti cu nevoi speciale Studentii afectati de dizabilitti motorii sau intelectuale pot contacta titularul cursului sau tutorii pentru a li se acorda materialele de studiu necesare si suportul informational necesar. Titularul cursului si echipa de tutori i exprima disponibilitatea, n limita constrangerilor tehnice si de timp, de a adapta coninutul i metodelor de transmitere a informaiilor precum i modalitile de evaluare (examen oral, examen on line etc) n funcie de tipul dizabilitii cursantului. Adresa contact titular de curs : AncaDobrean @psychology.ro Adresa contact tutori : psihodiagnostictutor@psychology.ro
Strategii de studiu recomandate Pentru fiecare modul, studenilor li se recomand s citeasc notiele de la curs i capitolul aferent din minim una din crile prezentate la bibliografie. Realizarea sarcinilor oligatorii va facilita intelegerea i aprofundarea cunotinelor din aceste module. Lectura fiecrui modul i rezolvarea la timp a lucrrilor de evaluare garanteaz nivele nalte de nelegere a coninutului tematic i totodat sporesc ansele promovrii cu succes a acestei discipline
I. CONCEPTELE DE MSURAREA I EVALUARE N PSIHOLOGIE
Titlul i numrul modulului: 1. Conceptele de msurare, evaluare in psihologie.
Scopul i obiectivele: obiectivul esenial al acestui modul este s se poat face diferena ntre conceptele de evaluare psihologic i testare psihologic. Acest modul este unul introductiv care i ajut pe studeni s i fac o imagine iniial a ceea ce nseamn psihodisgnosticul.
Obiective de studiu:
Dup parcurgerea acestui capitol:

Vei fi familiarizai cu termenii de testare psihologic i evaluare psihologic Vei putea oferi o serie de informaii legate de istoricul testului psihologic Vei cunoate o serie de informaii specifice legate de testele psihologice (de ex. care sunt scalele de msur, ce este un item, de cte tipuri sunt itemii, etc)
1. 2. 3. 4. 5. 6. 7. 8. 9.
Structura logic a modulului Evaluare versus testare psihologic Definiii ale testului psihologic Testul ca instrument de msurare / evaluare Testul vizeaz un eantion de comportament Testul implic o procedur de standardizare Testul ca rezultant a unei colecii de itemi Scopul utilizrii testelor psihologice Domenii ale utilizrii testelor psihologice Clasificri ale testelor psihologice Coninutul informaional detaliat EVALUARE VERSUS TESTARE PSIHOLOGIC Thorndike (1918) - Dac ceva exist, atunci exist ntr-o oarecare msur McCall (1939) - Orice exist ntr-o oarecare msur poate fi evaluat
CE ESTE EVALUAREA PSIHOLOGICA? Maloney & Ward (1976) definesc evaluarea psihologica ca fiind un proces de rezolvare de probleme care vizeaz descoperirea manifestrilor realitatii. Acest proces implica un scop bine precizat, o serie de instrumente de evaluare - printre care si testul - precum si o serie de variabile specifice situatiei. Evaluare versus testare psihologica Termenii de evaluare respectiv testare psihologica sunt doi temeni distincti. Evaluarea psihologica include testarea psihologica. Testarea psihologica constituie procesul de administrare, cotare si interpretarea a rezultatelor unui test psihologic. Ea are un camp mult mai ngust deoarece include doar testul psihologic ca instrument de evaluare. A reduce evaluarea psihologica la testare este o practica nestiintifica. Predictiile pe care le facem pe baza unui test iau in considerare doar o singura sursa si anume testul respectiv. Predictiile pe care le facem pe baza unei evaluri psihologice in seama de o multitudine de surse de informaie (incluznd bineinteles si testarea psihologica).
REPERE ISTORICE N EVOLUIA TESTRII PSIHOLOGICE Tabelul 1. Repere istorice n evoluia testrii psihologice 2200 C 1877 1884 1890 Chinezii ncorporau militarii pe baza unor evaluri prealabile Wilhem Wundt nfiineaz primul laborator de testare psihologic la Leipzig, Germania Francis Galton realizeaz prima baterie de teste James McKeen Cattell utilizeaz pentru prima dat termenul de "mental test", evalund aptitudinile intelectuale pe baza unor probe ce vizau timpul de reacie i capacitatea de discriminare senzorial Clark Wissler susine c indicii obinui de Cattell nu coreleaz cu notele olare Scala Metrica a Inteligentei - primul test de inteligen elaborat de Binet-Simon Stern introduce termenul de coeficient de inteligen (IQ) = vrsta mintal/vrsta cronologic Lewis Terman reia scalele Binet-Simon, publicnd Scalele Stanford-Binet. Acestea vor fi revizuite treptat n anii 1937, 1960, 1986 Robert Yerkes realizeaz testele pentru ncorporarea n armata american n timpul Primului Rzboi Mondial: Army Alpha i Army Beta Dezvoltarea major a testelor de personalitate Testul Rorchach Este fondat Psychological Corporation (Cattell, Thorndike, Woodworth) Este elaborat primul chestionar ce viza orientarea profesional Wechsler Bellevue Intelligence Scale elaboarat de David Wechsler. Va fi revzut ulterior i mbuntit n anii 1955 (WAIS) i 1981 (WAIS-R) Minesota Multiphasic Personality Inventory (MMPI) Weschler Intelligence Scale for Children (WISC). Va fi revzut i mbuntit n anii 1974 (WISC-R) i 1990 (WISC-III) Wechsler Primary and Prescholl Intelligence Scale (WPPSI)
1901 1905 1914 1916 1917 1920-1940 1920 1921 1927 1939 1942 1949 1967
I.2. DEFINIII ALE TESTULUI PSIHOLOGIC Testul reprezint alturi de alte instrumente ale metodei experimentale o surs de informaii extrem de util n evaluarea comportamentului uman. Literatura de specialitate indic diferite definiii ale testului psihologic: Testul psihologic const dintr-o prob, mai frecvent dintr-o serie de probe, construite n scopul stabilirii prezenei (sau absenei) unui aspect psihic, a particularitilor de comportare sau a gradului de dezvoltare psihic (Roca, 1972); Un test psihologic este o procedur standardizat prin care se formeaz un eantion de comportamente care va fi descris prin categorii sau scoruri. n plus, multe teste au norme sau standarde care fac posibil utilizarea rezultatelor la predicia altor comportamente, mai importante (Gregory, 1992); Testul reprezint o msur obiectiv i standardizat a unui eantion de comportament (A. Anastasi, 1976). instrument de evaluare; vizeaz un eantion de comportament; implic o procedur standard privind administrarea, cotarea i interpretarea rezultatelor.
I.3. TESTUL CA INSTRUMENT DE MSURARE/EVALUARE A msura nseamn a atribui numere obiectelor sau fenomenelor potrivit unor reguli determinate (Stevens, 1951). Aceste reguli stabilesc o coresponden ntre proprietile numerelor i proprietile obiectelor/fenomenelor.
testele psihologice vizeaz atribute/trsturi specifice; are ca instrumente scalele de msur.
scale nominale
I.3.1. SCALE DE MSUR Distingem 4 tipuri de scale de msur (Stevens, 1946):
scale ordinale scale de interval scale de raport / proporii
I.3.1.1. SCALELE NOMINALE Definiie
Msurarea pe o scal nominal poate fi realizat ori de cte ori caracteristica studiat permite mprirea n clase de elemente echivalente.
relaie de echivalen Orice dou submulimi ale unei clase, nu trebuie s se intersecteze
Exemple: 1. sexul (femei / brbai) - o clas de elevi cuprinde 31 elevi din care 14 biei i 17 fete; 2. categoriile socioprofesionale
Statistic, nu este posibil realizarea nici unei analize (X2, procente).

I.3.1.2. SCALELE ORDINALE
Definiie
Msurarea pe o scal ordinal realizeaz ierarhizarea claselor.
relaie de echivalen relaie de ordine

Observaie:
Clasele sunt ordonate, dar distana dintre ele nu poate fi estimat.

Exemple: Statistic poate fi calculat mediana, centilele.
A>B>C Aprecierile ca foarte bun, bun, slab
Grafic putem s ne referim la histograme.
I.3.1.2. SCALELE DE INTERVAL Definiie
Msurarea pe o scal de interval presupune o unitate de msur comun i constant.
relaie de echivalen relaie de ordine distana ntre clase (zero arbitrar)

Exemple: 1. IQ 2. Coeficient perceptiv. Permite utilizarea celor mai numeroi indici statistici (media, variana, coeficieni de corelaie).
I.3.1.4. SCALELE DE PROPORII Definiie
Posed proprietile scalelor de interval, dar n plus au un punct zero nonarbitrar.
n psihologie msurarea nu se realizeaz pe scale de proporii.
Concluzii privind scalele de msur Tabelul 2. Principalele caracteristici ale scalelor de msur Prelucrri statistice Scale Nominale Ordinale De interval Ordine Existena unei uniti de msur De proporii Relaii Echivalen Echivalen Ordine Echivalen Modul, frecvene Mediana, centilele, coef. de corelaie al lui Spearman Media, variana, coeficientul de corelaie Bravais-Pearson
I.4. TESTUL VIZEAZ UN EANTION DE COMPORTAMENT Testul psihologic, la fel ca testele n alte tiine realizeaz observaii pe un eantion de comportamente ale unui subiect. Dac un psiholog dorete s evalueze vocabularul unui copil sau
aptitudinile sale aritmetice sau coordonarea motric la un pilot va trebui s aleag din totalitatea comportamentelor disponibile cteva reprezentative pentru ale include ntr-o prob psihologic. I. 5. TESTUL IMPLIC O PROCEDUR DE STANDARDIZARE Standardizarea = procesul de obiectivare i uniformitate a unui test raportat la: modalitatea de aplicare/administrare; modalitatea de cotare; modalitatea de interpretare i raportare la norme/etaloane I.6. TESTUL CA REZULTANT A UNEI COLECII DE ITEMI I.6.1. CE ESTE UN ITEM ? Item este un stimul specific care determin un anumit comportament ce poate fi cotat i evaluat independent.
I.6.2. TIPURI DE ITEMI n funcie de tipul de rspus solicitat putem distinge ntre itemi de tip eseu i itemi cu rspunsuri date: I. Itemi de tip "eseu" - subiectului i se cere s rspund liber la un item. ex. Discutai implicaiile teoriei lui Piaget n practica educaional. II. Itemi cu rspunsuri date care pot fi: 1. Itemi de tip "da-nu", "adevrat-fals" ex. Bogota este capitala Columbiei? sunt utilizai cel mai adesea n testele de cunotine; uneori sunt utilizai i n testele de personalitate; sunt considerai inadecvai n chestionarele de atitudini sau n cele ce evalueaz simptomele clinice (n aceste domenii nu exist rspunsuri corecte sau greite); avantaje: uor i rapid de administrat; dezavantaje: subiectul are 50% anse de a ghici rspunsul. 2. Itemi cu rspunsuri la alegere ex. Care este capitala Columbiei ? A. La Paz B. Bogota C. Lima D. Santiago sunt utilizai n testele de cunotine; avantaje: procentul de a ghici rspunsul scade; 3. Itemi cu rspunsuri pe scale de tip: "da-nu-nu tiu", "de acord-acord parial-dezacord", "ntotdeauna-adesea-uneori-niciodat" ex. Sunt o persoan anxioas n situaii de examen. A. ntotdeauna B. adesea C. uneori D. niciodat 4. Itemi cu rspunsuri ce trebuie alturate dup diferite criterii ex. __ 1. primul test de inteligen A. Raven __ 2. test proiectiv de personalitate B. Binet-Simon __ 3. test de inteligen de grup C. Rorschach
10
! Itemul este un stimul specific care determin un anumit comportament ce poate fi cotat i
evaluat independent Tipuri de itemi: I. Itemi de tip "eseu" II.Itemi cu rspunsuri date: a. itemi de tip "da-nu", b. "adevrat-fals", itemi cu rspunsuri la alegere, c. itemi cu rspunsuri pe scale de tip: "da-nu-nu tiu", "de acord-acord parial-dezacord", d. Itemi cu rspunsuri ce trebuie alturate dup diferite criterii I.7. SCOPUL UTILIZRII TESTELOR PSIHOLOGICE
1. 2. 3. 4. 5.
Selecie/clasificare. Diagnostic i intervenie Autocunoatere Proiecte de evaluare a unor modificri intervenite n urma unor intervenii educative, psihoterapeutice. Instrumente ale cercetrii tiinifice
I.8. DOMENII DE UTILIZARE A TESTELOR PSIHOLOGICE Tabelul 3. Domenii de utilizare a testelor Domeniu de aplicabilitate Activitatea vizat spre evaluare Psihologia clinic - evaluarea inteligenei - evaluarea psihopatologiei Consilierea psihologic - orientarea colar i profesional - evaluarea aptitudinal - evaluarea comportamentului relaional/social - evaluarea potenialului managerial - evaluarea aptitudinilor cognitive i psihomotorii - evaluarea maturitii colare - evaluarea progresului n procesul instructiv-educativ - evaluarea potenialului de nvare - evaluarea copiilor cu cerine speciale - evaluarea leziunilor cerebrale
Psihologia industrial/organizaional Psihologia colar
Neuropsihologia
I.9. CLASIFICRI ALE TESTELOR PSIHOLOGICE Testele psihologice pot fi clasificate n funcie de diferite criterii (Albu, 1999). 1. Clasificri n funcie de coninutul testului: a). dup modul de executare a sarcinii de ctre subiect teste orale; teste scrise; teste de performan : teste cu manipulare de aparate i piese; teste administrate de calculator. b). dup utilizarea limbajului n rezolvarea sarcinii teste verbale ; teste nonverbale.
11
c). dup modul de procesare implicat: teste de eficien teste de aptitudini; teste de dezvoltare intelectual; teste de cunotine; probe de lucru; teste situaionale teste de personalitate (nonintelective). 2. Clasificri n funcie de modul de administrare a testului: a). dup numrul persoanelor care pot fi examinate simultan: teste individuale; teste de grup. b). dup timpul de execuie teste de vitez; teste de randament: cu limit de timp; cu timp de lucru nelimitat. 3. Clasificri n funcie de modul de cotare a testului i de interpretare a scorului: a). dup modul de stabilire a cotei la test: teste obiective; teste subiective. b). dup modul n care se interpreteaz scorurile testelor teste normative; teste centrate pe criteriu; teste idiografice; teste ipsative.
1. Ce este un test psihologic? 2. Ce este evaluarea psihologic? 3. Ce sunt scalele de msurare i de cte tipuri sunt acestea? 4. Ce este un item? 5. Cum se clasific testele psihologice?
12
Sumar Termenii de evaluare respectiv testare psihologica sunt doi temeni distinci. Evaluarea psihologica include testarea psihologica. Testarea constituie procesul de administrare, cotare si interpretarea a rezultatelor unui test psihologic. Testul psihologic reprezint, alturi de alte instrumente ale metodei experimentale, o surs de informaii extrem de util n evaluarea comportamentului uman. n literatura de specialitate gsim diferite definiii ale testului psihologic. Este important de reinut c acesta reprezint o colecie de itemi care pot fi, fie de tip eseu, fie cu rspunsuri date. Prin conceptul de msurare se nelege atribuirea de numere obiectelor sau fenomenelor potrivit unor reguli determinate (Stevens, 1951). Aceste reguli stabilesc o coresponden ntre proprietile numerelor i proprietile obiectelor / fenomenelor. Astfel, prin testul psihologic se vizeaz acele atribute / trsturi specifice iar pentru a le msura se utilizeaz scalele de msur (scale nominale, ordinale, de interval, de raport / proporii). Bibliografie modul
Albu, M. (1998). Construirea i utilizarea testelor psihologice, Editura Clusium. p 13-20 Albu, M. (2000). Metode i instrumente de evaluare n psihologie. Editura Argonaut p 37-40 Kaplan, R.M. i Saccuzzo, D.P. (2001) Psychological Testing, Principles, Applications and Issues, Wadsworth Thomson Learning, Fifth Edition. P 3-27 Stan, A. (2002). Testul psihologic. Evoluie construcie, aplicaii. Editura Polirom p 11-36
13
II. ETALONAREA TESTELOR
Titlul i numrul modulului 2. Etalonarea testelor.
Scopul i obiectivele: n cadrul acestui modul studenii vor acumula informaii cu privire la modalitile de interpretare a rezultatelor obinute n urma aplicrii unui test psihologic.

Vei putea defini etalonul (norma sau standardele) Vei cunoate paii de construcie a unui etalon Vei cunoate scopurile etalonrii Vei putea enumera metodele de normare
Scurt recapitulare a conceptelor prezentate anterior Termenii de evaluare respectiv testare psihologica sunt doi temeni distinci. Evaluarea psihologica include testarea psihologica. Testarea constituie procesul de administrare, cotare si interpretarea a rezultatelor unui test psihologic. Testul psihologic reprezint, alturi de alte instrumente ale metodei experimentale, o surs de informaii extrem de util n evaluarea comportamentului uman. n literatura de specialitate gsim diferite definiii ale testului psihologic. Este important de reinut c acesta reprezint o colecie de itemi care pot fi, fie de tip eseu, fie cu rspunsuri date. Prin conceptul de msurare se nelege atribuirea de numere obiectelor sau fenomenelor potrivit unor reguli determinate (Stevens, 1951). Aceste reguli stabilesc o coresponden ntre proprietile numerelor i proprietile obiectelor / fenomenelor. Astfel, prin testul psihologic se vizeaz acele atribute / trsturi specifice iar pentru a le msura se utilizeaz scalele de msur (scale nominale, ordinale, de interval, de raport / proporii). 1. 2. 3. 4. Structura logic a modulului Definiia etalonului Scopurile etalonului Paii de construcie ai unui etalon Metodele de etalonare a. distribuia normal b. scorurile standard c. scorurile n clase normalizate Coninutul informaional detaliat NORMELE TESTELOR
Cum interpretm rezultatul obinut de un subiect la un test? n general, numrul de itemi rezolvai corect de subiect la un test este operaionalizat prin scor sau cot brut. Aceast valoare ns nu are nici o semnificaie dac nu o comparm cu anumite norme, standarde sau etaloane.
14
Etalonul (norma sau standardele) reprezint deci cadrul de referin al unui subiect cu populaia. Un scor brut obinut la un test nu are nici o valoare deoarece pe baza lui nu putem ti unde se situeaz performana unui subiect. S lum un exemplu. S presupunem c la un test de cunotine de matematic alctuit din 100 de itemi un subiect rezolv corect 30 de itemi. Scorul brut obinut de subiect la acest test este 30. Ce reprezint aceast valoare? Reprezint o performan slab, medie sau bun la test? Pentru a putea rspunde la aceast ntrebare trebuie s comparm aceast valoare cu un cadru de referin sau etalon. Acest etalon poate fi reprezentat de performana obinut de ceilali subieci la test i astfel raportm subiectul la performana celorlali sau dimpotriv, cadrul de referin l poate constitui o norm naional n care cadrul de referin l constituie ntreaga populaie din care face parte. Procesul de etalonare al unui test reprezint stabilirea unui cadru de referin, a unei scri care s permit determinarea locului ocupat de rezultatele unui subiect fa de rezultatele unei populaii de referin, suficient de numeroas, format din persoane comparabile cu cea examinat.
ETALONAREA
Etalonarea are astfel urmtoarele scopuri: 1. confer semnificai scorurilor i permite interpretarea acestora; 2. permite compararea direct a scorurilor. Astfel, un scor de 33 obinut de un subiect la un test poate s nu aib aceeai semnificaie la un al doilea test. Procesul de construcie a unui etalon respect urmtorii pai: 1. 2. 3. 4. definirea populaiei sau a cadrului de referin pentru care se dorete construcia testului; eantionarea; administrarea testului la eantionul ales; construcia cotelor sau a normelor testului.
1. Definirea populaiei constituie primul pas n construirea normelor. Acest proces cuprinde de fapt circumscriera persoanelor pentru care este destinat testul. Astfel, aceast definire se face prin prezentarea unor caracteristici care vor permite recunoaterea unei persoane ca aparinnd sau nu populaiei pentru care a fost construit testul. Exemplu. a. Testul Bender Gestalt evalueaz funcia perceptiv motric ntre 5 i 10 ani. n aceast situaie tim c orice persoan cu vrsta ntre 5 i 10 ani poate fi evaluat cu testul Bender pentru a se identifica nivelul dezvoltrii funciei perceptiv motrice. b. Testul de cunotine matematice X cuprinde toi copiii de liceu (14-18 ani) din judeul Cluj. Pentru ca performana unui copil la acest test de cunotina matematice s poat fi raportat la etalon, copilul respectiv trebuie s aib urmtoarele caracteristici: s aib vrsta cuprins ntre 14-18 ani i s urmeze un liceu n judeul Cluj.
2. Deoarece testul nu poate fi aplicat la ntreaga populaie pentru care a fost construit se impune selecia din cadrul populaiei (stabilite anterior) a unui grup sau eantion de normare. Eantionarea n psihologie se constituie mult mai greu dect n alte domenii cum ar fi sociologia deoarece examinrile sunt costisitoare dac se fac la domiciliul subiecilor.
!ATENIE! la eantionarea pe baz de cunotine, voluntariat, etc. deformri sistematice

n estimarea parametrilor !(eantionarea deconvenien duce la supraestimarea scorurilor) 15
Eantionul trebuie s fie reprezentativ pentru populaie. Astfel structura eantionului trebuie s respecte structura populaiei. Variabilele care se vor lua n considerare n construirea eantionului in cont att de caracteristicile populaiei (vezi definirea acesteia) ct i de caracteristicile constructului msurat de test. Exemplu Dac avem un test adaptat n Romnia care evalueaz inteligena la copiii precolari, populaia testului o constituie copiii de vrsta 4 7 ani din Romnia. Acestea reprezint caracteristicile populaiei. n afara acestor caracteristici trebuie s inem cont ns i de caracteristicile constructului. n acest caz, inteligena depinde i de mediul din care fac parte copii, iar astfel pentru fiecare grupa de vrst construit vom avea ca variabil mediul (ex. Rural sau urban). Construirea eantionului se poate realiza prin mai multe tipuri de selecie. Cele mai des ntlnite selecii sunt cele aleatoare i cele stratificate. n cazul seleciei aleatoare oricare membru al populaiei are anse egale de a fi inclus n eantion. n cazul seleciei stratificate se face nti o mprire a populaiei n clase (n funcie de variabilele relevante) i apoi pentru fiecare clas se trece la o selecie aleatoare. Cnd poate fi considerat un eantion aleatoriu? dac fiecare subiect are o probabilitate aleatoare de a fi selectat. Extragerea Loto este aleatoare? La primul nr da.
Programele statistice au opiuni de a genera numere aleatoare.

A etalona un test sau a norma un test sunt considerate activiti identice. 3. Deoarece rezultatele nu se pot culege de un singur examinator, la un singur moment n timp, este important ca n timpul etalonrii administrarea s se realizeze standard, pstrnd aceleai condiii de aplicare i cotare. 4. Dup ce s-a aplicat testul la ntregul eantion se obine o colecie de date pe baza crora se impune construirea normelor testului.
Scopurile etalonrii sunt: 1. conferirea de semnificaii scorurilor i permiterea interpretrii acestora i 2. perminterea comparrii directe a scorurilor
! Paii construciei nui etalon sunt: 1. definirea populaiei; 2. eantionarea;

3. administrarea testului , 4. construcia cotelor
METODE DE ETALONARE (NORMARE) Orice persoan evaluat obine la un instrument de evaluare un rezultat observabil
a. la testele de aptitudini cognitive: rspunsuri corecte sau greite b. la testele de personalitate: evidenierea unei trsturi investigate fa de coninutul aseriunii unui item Distribuia normal Cu ct avem o colecie mai mare de date cu att acestea respect mai mult distribuia lui Gauss. - proprietile curbei normale (figura 1): 68% este ntre + 1sigma, 95% este intre + 2sigma, Beneficiul interpretrii rezultatelor pe baza distribuiei normale = simplific interpretarea scorurilor individuale la un test. In cazul distribuiei normale media, mediana i modul au aceeai valoare - cunoscnd c o persoana se gsete n intervalul + 1 sigma ne spune ca aproximativ 2 treimi din populaie are acelai scor.
16
Figura 1. Proprietile distribuiei normale Scorurile standard - Transformrile liniare n scoruri standard, folosind media i abaterea standard a distribuiilor Un scor standard este un scor care a fost transformat dintr-o scal n alta, ultima fiind una pe baza creia se pot face comparaii. - cele mai cunoscute sunt scorurile z i T Scorurile z - scorul z are media 0 si abaterea standard 1 z = (X M)/ Exemplu La un test de citire un subiect obine un scor brut de 24 (media=20, sigma=3), iar la matematic un scor brut de 42, media = 60, sigma=10. Calculai scorul z pentru ambele performane. Interpretai valorile obinute. Scorurile T T = 50 + 10z T este o scal a crei medie este 50 si sigma este 10; Propus de McCall (1922, 1939) n cinstea profesorului sau Thorndike (T);
17
Cuprinde 5 sigma sub/peste medie; Scorul care se gaseste la exact 5 sub medie va reprezentat un scor T de 0, media va fi 10, iar 5 sigma peste medie va fi 100; Avantajul la scorurile T este ca nu avem o valoare negativa; Utilizat de exemplu la testul Minesota Multiphasic Personalty Inventory (MMPI).
Scorurile n clase normalizate 5 clase: 7%, 24%, 38%, 24%, 7% 7 clase: 5, 11%, 21%, 26%, 21%, 11%, 5%, 9 clase (stanine): 4%, 7%, 12%, 17%, 20%, 17%, 12%, 7%, 4%, Pai: 1. se aranjeaz scorurile de la cel mai mare la cel mai mic; 2. se stabilete frecventa pentru fiecare scor; 3. se stabilete frecventa cumulata; 4. se calculeaz procentul fiecrei clase; 5. se face corespondena scor + procent din distribuia de frecven cumulat; Exemplu S presupunem c un test a fost aplicat la 325 de subieci. Scorul maxim al testului este 42 iar scorul minim este 2. Tabelul 1 prezint frecvena fiecrui scor, frecvena cumulat i stanina corespunztoare.
Scor brut 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23
Frecvena fiecrui scor 1 1 2 6 7 4 9 4 10 7 13 19 11 14 16 12 13 11 18 22
Frecven Stanine cumulat
Scor brut 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 -
1 2 4 10 17 21 30 34 44 51 64 83 94 108 124 136 149 160 178 200
Stanina 9
Stanina 8
Stanina 7
Stanina 6
Stanina5
Frecvena fiecrui scor 16 11 14 12 13 14 8 9 6 3 6 2 3 2 2 2 1 0 0 0 1 325
Frecven cumulat
Stanine
216 227 241 253 266 280 288 297 303 306 312 314 317 319 321 323 324 324 324 324 325
Stanina 4
Stanina 3
Stanina 2
Stanina 1
Cum obinem staninele pentru fiecare scor? Calculul scorului care intr n stanina 9. Se ia procentul corespunztor acestei stanine (4%) i se raporteaz la datele existente astfel:
18
325....................100% x.........................4% x=13 Valoarea obinut reprezint frecvena cumulat a scorurilor din stanina 9. Observm n coloana frecvenelor cumulate c aceast valoare nu exist, deci vom lua valoarea existent cea mai apropiat de 13. n coloana frecvenelor cumulate avem valorile 10 i 17. Deoarece 10 este mai aproape de 13 vom lua aceast valoare ca limit pentru stanina 9. Deci scorurile care intr n stanina 9 sunt cele cuprinse ntre 42 i 39 (este corespunztor frecvenei cumulate 10). Pentru a afla scorurile care intr n stanina 8 lum procentul din populaie din stanina 9 la care adugm procentul corespunztor staninei 8 adic: 4% + 7% = 11% Repetm apoi algoritmul utilizat n stabilirea scorurilor pentru stanina 9: 325....................100% x.........................11% x=35,75 Valoarea frecvenei cumulate cea mai apropiat de 35,75 este valoarea 34, valoarea creia i corespunde scorul brut de 35. deci, n stanina 8 avem toate scorurile ntre 38 i 35. Pentru stanina 7 calculul este urmtorul: 11%+12%=23% 325.................100% x......................23% x= 74,75 Pentru stanina 6 calculul este urmtorul: 23% +17% = 40% 325.................100% x......................40% x=130 Pentru stanina 5 calculul este urmtorul: 40% + 20% = 60% 325.................100% x......................60% x=195 Pentru stanina 4 calculul este urmtorul: 60% + 17% = 77% 325.................100% x......................77% x=250,25 Pentru stanina 3 calculul este urmtorul: 77% + 12% = 89% 325.................100% x......................89% x=289,25 Pentru stanina 2 calculul este urmtorul: 89% + 7% = 96% 325.................100% x......................96% x=312
19
Dac performana subiectului se gsete n staninele 4, 5 sau 6 putem spune c performana sa la test este una medie. O performana ncadrat n staninele 2 i 3 este un slab, iar o performan ncadrat n stanina 1 este una foarte slab. De cealalt parte a medie, staninele 7 i 8 indic o performan bun la un test, iar stanina 9 reprezint o performan foarte bun. Etaloanele n decile, quartile, centile, mpart distribuia n clase egale; decilele cuprind 10 clase (10% din populaie n fiecare clas), quartilele cuprind 4 clase (25%), iar centilele 100.
Orice manual al unui test psihologic conine normele testului i trebuie s includ urmtoarele aspecte: 1. indicii demografici ai populaiei pentru care a fost construit testul. Cei mai frecveni indicatori sunt: vrsta, sexul, mediul din care fac parte subiecii, nivelul de colarizare Putem spune c aceti indicatori definesc populaia pentru care este destinat testul. Astfel, un test care evalueaz inteligena la copiii precolari (4-7 ani) nu poate fi aplicat la un copil de 9 ani deaorece nu avem un cadru de referin la care s raportm performana obinut de acest copil. 2. numrul persoanelor pe care a fost etalonat testul i modul de eantionare ales. Aceast informaie este uti pentru analiza semnificaiei etalonului. Ne intereseaz n acest caz dac etalonul testului are la baz un numr suficient de mare de persoane dintr-o populaie pentru a-l putea considera reprezentativ. 3. data construirii normelor. Aceast informaie este util deoarece ne ajut identificm dac populaia pe care a fost etalonat testul mai posed caracteristicile populaiei din care face parte subiectul testat. Este cunoscut faptul c unele constructe psihologice sau cunotine sunt dependente de evoluie. De exemplu un test care evalua nivelul dezvoltrii vocabularului la o anumit populaie n anii 1940-1950 nu mai are aceleai norme n prezent deoarece populaia a evoluat i astfel normele trebuie mereu reactualizate.
1. Ce reprezint etalonul? 2. Care sunt scopurile etalonrii? 3. Care este procesul de construcie de construcie al unui etalon? 4. ce metode de msurare se utilizeaz?
Sumar n general, numrul de itemi rezolvai corect de subiect la un test este operaionalizat prin scor sau cot brut. Aceast valoare ns nu are nici o semnificaie dac nu o comparm cu anumite norme, standarde sau etaloane. Etalonul (norma sau standardele) reprezint deci cadrul de referin al unui subiect cu populaia. Un scor brut obinut la un test nu are nici o valoare deoarece pe baza lui nu putem ti unde se situeaz performana unui subiect. Etalonarea confer semnificai scorurilor i permite interpretarea acestora i permite compararea direct a scorurilor. Pe lng aceasta este foarte important ca procesul de construcie a unui etalon s respecte o serie de pai. n cadrul metodelor de etalonare trebuie s inem cont de distribuie (cu ct avem o colecie mai mare de date cu att acestea respect mai mult distribuia lui Gauss) i de o serie de scoruri: standard sau in clase normalizate.
20
Sarcini i teme ce vor fi notate 1. La un test de performan de citire, un subiect are scorul brut de 24. Care este nivelul nsuirii cunotinelor sale dac: i. media la test este 30 i este 4? ii. media la test este 30 i este 7? iii. media la test este 40 i este 5? 2. Pentru fiecare din studiile urmtoare se va descrie procedura de eantionare. Citii fiecare descriere i identificai tipul de eantionare folosit: A. Un profesor de psihologie ataeaz un scurt chestionar care vizeaz obiceiurile de studiu al elevilor la fiecare al patrulea test i distribuie aceste teste elevilor pe msur ce acetia intr n clas. B. Cercettorul selecteaz aleatoriu jumtate din celulele unui penitenciar i intervieveaz toi indivizii din celulele selectate. C. Un administrator dintr-un cmin de studeni selecteaz aleatoriu cinci dormitoare din campus i din studenii acestora selecteaz aleator 60% studeni de anul I i 40% studenii din anii mai mari pentru un studiu viznd consumul de alcool. Bibliografie modul
Albu, M. (2000). Metode i instrumente de evaluare n psihologie. Editura Argonaut. p 14-37, 6582 Kaplan, R.M. i Saccuzzo, D.P. (2001) Psychological Testing, Principles, Applications and Issues, Wadsworth Thomson Learning, Fifth Edition. p 3-27
21
III. FIDELITATEA TESTULUI PSIHOLOGIC
Titlul i numrul modulului 3. Fidelitatea testului psihologic Scopul i obiectivele: scopul acestui modul este de a i nva pe studeni ce reprezint fidelitatea testului psihologic, de cte tipuri este aceasta, cum se calculeaz fidelitatea i modalitile de influenare a fidelitii unui test. Aceste elemente sunt foarte importante pentru c fidelitatea reprezint absena relativ dintr-o prob psihologic a erorilor de msurare. n psihologie acest lucru nu poate fi ntlnit; de aceea orice test psihologic trebuie s estimeze valoarea acestor erori aleatoare de msur. Astfel, calculul fidelitii i ajut pe studeni s indice msura n care scorurile obinute la test exprim de fapt valorile reale ale constructului pe care testul l msoar.

Vei putea o definiie corect a fidelitii testului Vei putea enumera tipurile de fidelitate Vei tii s calculai fidelitatea unui test Vei putea enumera modalitile de influenare a fidelitii unui test
Scurt recapitulare a conceptelor prezentate anterior n general, numrul de itemi rezolvai corect de subiect la un test este operaionalizat prin scor sau cot brut. Aceast valoare ns nu are nici o semnificaie dac nu o comparm cu anumite norme, standarde sau etaloane. Etalonul (norma sau standardele) reprezint deci cadrul de referin al unui subiect cu populaia. Un scor brut obinut la un test nu are nici o valoare deoarece pe baza lui nu putem ti unde se situeaz performana unui subiect. Etalonarea confer semnificai scorurilor i permite interpretarea acestora i permite compararea direct a scorurilor. Pe lng aceasta este foarte important ca procesul de construcie a unui etalon s respecte o serie de pai. n cadrul metodelor de etalonare trebuie s inem cont de distribuie (cu ct avem o colecie mai mare de date cu att acestea respect mai mult distribuia lui Gauss) i de o serie de scoruri: standard sau in clase normalizate. Structura logic a modulului 1. Consistena intern 2. Stabilitatea n timp a rezultatelor 3. Metode de calcul a fidelitii interne a. Metoda consistenei interne b. Metoda test retest c. Metoda formelor paralele d. Metoda fidelitatea interevaluatori Coninutul informaional detaliat
FIDELITATEA TESTELOR The meter (m) is the Si unit of length and is defined as the length of the path traveled by light in vacuum during the time interval of 1/299 792 458 of a second. This replaces the two previous definitions of the meter: the original adopted by CGPM in 1889 based on a platinum-iridium prototype bar, and a definition adopted in 1960 based on a krypton86 radiation from an electrical discharge lamp. In each case, the change in definition achieved not only an increase in accuracy, but also progress toward the goal of
22
using fundamental physical quantities as standards, in particular, the quantum mechanical characteristics of atomic systems. - Taylor,1991. Fidelitatea unui test psihologic se refer la dou aspecte: 1. consistena intern; 2. stabilitatea n timp a rezultatelor testrii. Analiza fidelitii unui test pornete de la conceptul de eroare. Orice scor la un test psihologic este rezultatul scorului real i al unei erori de msur: Xobservat = Xreal + e (e = eroarea de msur) Fidelitatea reprezint absena relativ dintr-o prob psihologic a erorilor de msurare. Acest lucru ns n psihologie nu poate fi ntlnit; de aceea orice test psihologic trebuie s estimeze valoarea acestor erori aleatoare de msur. Calculul fidelitii indic msura n care scorurile obinute la test exprim de fapt valorile reale ale constructului pe care testul l msoar. Fidelitatea unui test poate fi calculat pe baza a patru metode: 1. metoda consistenei interne coeficieni de consistenta intern; 2. test retest coeficieni de stabilitate; 3. metoda formelor paralele coeficieni de echivalen; 4. metoda fidelitii interevaluatori coeficieni interevaluatori. II.1.1. CONSISTENA INTERN Consistena intern a unui test se refer la msura n care toi itemii testului msoar aceeai variabil. Calculul coeficientului de consisten intern va consta n analiza corelaiei ce exista ntre fiecare item. Pornind de la scorurile observate la un test, pentru analiza consistentei interne pot fi calculai urmtorii coeficieni: 1. Cronbach pentru testele cu orice tip de itemi; 2. 3 Guttman; 3. 20 i 21 Kuder Richardson (dac itemii testului sunt binari).
Toi coeficienii prezentai se bazeaz pe un calcul de corelaie ntre itemii ce alctuiesc testul. Un coeficient de consisten ridicat exprim faptul c toi itemii testului se refer la aceeai variabil. n afara coeficienilor prezentai anterior, consistena intern a unui test poate fi calculat i pe baza metodei njumtirii. Pe baza acestei metode testul este mprit n jumtate, calculndu-se coeficientul de corelaie dintre cele dou pri. Dac acest coeficient este ridicat el ne indic o bun fidelitate (consistena intern) a testului. O form particular a metodei njumtirii o constituie metoda item cu item, n care testul este mprit n dou prin selectarea itemilor pari respectiv a celor impari. Aceasta tehnic este util mai ales n cazul testelor n care itemii sunt prezentai n ordinea crescnd a dificultii. Se calculeaz i acest caz coeficientul de consisten intern ntre cele doua pri ale testului, valoarea lui reprezentnd valoarea coeficientului de fidelitate.
II.1.2. STABILITATEA Stabilitatea rezultatelor testrii ne indic n ce msur la aplicri diferite n timp un subiect obine rezultate similare la un test psihologic. Calculul coeficientului de stabilitate se realizeaz astfel: a) se administreaz testul la un grup de persoane; b) dup un interval de timp se readministreaz testul; c) se calculeaz un coeficient de corelaie ntre rezultatele la cele dou administrri. O valoare mare a acestui coeficient indic o bun stabilitate n timp a rezultatelor. Se poate spune despre acel instrument c este fidel deoarece relev aceleai valori ale unei variabile la msurtori diferite n timp.
23
Factori care influeneaz calculul fidelitii test-retest (stabilitii): Intervalul de timp ntre test i retest. Dac timpul este prea scurt exist o mare probabilitate ca subiecii s i reaminteasc rspunsurile date anterior; respectiv un timp prea lung ntre test i retest poate determina maturizarea eantionului de subieci. Astfel dac aplicm un test de percepie la 4 ani i l reaplicm la un interval de 6 luni exist o mare probabilitate s obinem rezultate diferite la cele dou administrri ale testului deoarece n intervalul de 6 luni subiecii s-au maturizat. n acest caz retestul va include n evaluare nivelul de maturizare al subiecilor. Datorit acestor argumente este destul de dificil de stabilit cu exactitate un timp optim ntre test i retest. ntotdeauna cnd se calculeaz acest coeficient trebuie precizat intervalul scurs ntre test i retest, vrsta subiecilor precum i condiiile n care s-au administrat testele pentru a putea identifica eventualele surse de eroare de msur. Gradul de dificultate al itemilor. Dac itemii sunt fie prea uori fie prea dificili se vor obine coeficieni de stabilitate ridicai deoarece itemii testului fie vor fi rezolvai de majoritatea subiecilor (n primul caz) fie nu vor fi rezolvai nici la test nici la retest (al doilea caz). Schimbri ale subiectului determinate de prima aplicare. Pot exista o serie de situaii n care se obin performane diferite la retest deoarece subiectul fie a nvat s rspund la itemi dup prima administrare, fie aceast prim administrare a determinat schimbri de atitudini fa de o anumit problem.
! Factori care influeneaz calculul fidelitii test - retest (stabilitii):

1. intervalul de timp ntre test i retest 2. gradul de dificultate al itemilor 3. schimbri ale subiectului determinate de prima aplicare
II.1.3. METODA FORMELOR PARALELE Exist o serie de situaii practice care necesit aplicri repetate a unui test psihologic la un interval foarte scurt de timp. n acest caz aplicarea aceluiai test este improprie deoarece s-a vzut anterior c la un interval scurt de timp subiecii pot s i reaminteasc rspunsurile date anterior. n acest caz trebuie s se construiasc forme echivalente sau paralele ale unui test. Dou teste sunt paralele dac pentru un subiect erorile de msur la cele dou administrri sunt variabile aleatoare independente. n acest caz itemii celor dou teste trebuie s fie logic izomorfi, adic s aib acelai nivel de dificultate. Avantajul acestei metode este acela c nu mai permite reamintirea rspunsurilor i nici posibilitatea cutrii rspunsurilor la ntrebrile la care nu s-a tiut rspunde. Dezavantajele acestei metode sunt urmtoarele: necesit consum de timp prin dou administrri; subiecii se pot plictisi dac testrile sunt prea lungi; este greu de realizat fiind dificil i costisitoare.
II.1.4. FIDELITATEA INTEREVALUATORI

Este necesar a fi calculat n cazul testelor care nu au o cotare obiectiv aa cum sunt testele proiective de personalitate la care scorul este influenat i de interpretarea pe care o d persoana care face cotarea. Pentru a verifica n ce msur scorul la test este influenat de modalitatea n care se face cotarea de diferite persoane se va cere la diferii evaluatori s calculeze scorurile la test, iar apoi se va realiza un coeficient de corelaie
24
interevaluatori. Acest coeficient va exprim msura n care testul este independent de erori datorate modalitii de cotare a rspunsurilor subiectului. Coeficienii de fidelitate transformai n coeficieni de determinare (ptratul coeficientului de fidelitate) relev proporia n care variana total a rezultatelor psihometrice se datoreaz varianei reale diferenelor individuale reale sau din contr, varianei eroare, definit diferit, n funcie de metoda particular urmat n stabilirea tipului de fidelitate (Kulcsar, 1980). n consecin, dei semnificaia diferiilor coeficieni de fidelitate nu este aceeai, totui orice coeficient de fidelitate, ridicat la ptrat, poate fi interpretat n termeni de procentaj al variantei randamentului la test. Astfel de exemplu, un coeficient de fidelitate de .80 nseamn c .802=64% din variana total a rezultatelor psihometrice considerate se datoreaz varianei reale a domeniului explorat, iar 36% varianei eroare, generat de unele din sursele multiple ale deosebirilor n rezultatele psihometrice.
! Trebuie menionat faptul ca dei fidelitatea unui test este importanta, ea nu este suficient
pentru un test bun. Un test poate avea o bun consisten intern (toi itemii evalueaz aceeai variabil) respectiv o bun stabilitate n timp, dar s msoare altceva dect i propune. Problema evalurii corecte a ceea ce i propune s msoare un test constituie subiectul validitii testelor.
Interpretarea unui coeficient de fidelitate Murphy & Davidshopher (1998) prezint urmtoarele repere n interpretarea coeficienilor de fidelitate (tabelul 1):
Tabelul 1. Semnificaia coeficienilor de fidelitate Valori ale Tipul testului coeficienilor de fidelitate 0.95 Testele de inteligen de grup 0.90 Testele de performan 0.85 0.80 Testele cu rspunsuri multiple 0.75 Scalele comportamentale 0.70 0.65 Unele msurtori proiective 0.60 0.55 0.50
Interpretare
Fidelitate mare
Fidelitate moderat
Fidelitate sczut Scorul real i eroarea au efect egal asupra scorurilor la test
Aa cum am precizat anterior orice rezultat (scorul observat) pe care o persoan l obine la un test este alctuit din aptitudinea real (scor real) creia i se adaug eroarea de msur. Adic: Xobservat = Xreal + e (e = eroarea de msur) ntrebarea pe care este necesar s o analizm n acest caz ar fi urmtoarea: care este intervalul n care se gsete scorul real. Altfel spus, dat fiind faptul c o persoan obine un anumit scor la un test, ne intereseaz care este intervalul n care putem spune c se gsete scorul real la test. Acest interval este denumit interval de ncredere i este definit ca probabilitatea ca scorul real al persoanei la un test s se gseasc ntre anumite limite.
25
Calculul intervalului de ncredere (IC). Intervalul de ncredere se obine astfel: IC = Xobservat + z*SEm SEm = SD* SEm= eroarea standard de msur
(1 r )
SD= abaterea standard a scorurilor la test; r= coeficientul de fidelitate
S lum un exemplu. Presupunem c la un test de inteligen o persoan a obinut un scor de 115. Coeficientul de fidelitate alpha este de 0,98, iar abaterea standard a scorurilor la test este de 15. Cum aflm intervalul n care se gsete scorul real al persoanei la test? 1. Calculm eroarea standard de msur SEm = SD* SEm = 15* SEm = 15* SEm = 2.12 2. Calculm intervalul de ncredere IC = Xobservat + z*SEm IC = 115 + z*2.12 Alegerea scorului z care va intra n calcul se face n funcie de precizia cu care dorim s lucrm. Dac alegem s lucrm cu o probabilitate de 95% scorul z corespunztor este de 1.96 . Pentru o probabilitate de 90% scorul z corespunztor este de 1.65. n acest exemplu s vom lucra cu o precizie de 95%, deci z=1.96. Astfel vom avea: IC = 115 + 1.96*2.12 IC= 115 + 4.15 n acest caz putem spune cu o probabilitate de 95% c scorul real al persoanei se gsete n intervalul 110.85 119.15.
(1 r ) (1 0.98)
0.02
! DE REINUT:
intervalul de ncredere depinde de coeficientul de fidelitate al testului; dac avem un coeficieni de fidelitate mici, atunci intervalul se mrete, deci eroarea este mai mare. intervalul de ncredere depinde de abaterea standard a scorurilor la test.
26
1. La ce se refer fidelitatea unui test? 2. De la ce pornete analiza fidelitii unui test? 3. Ce este consistena intern a unui test? 4. Ce reprezint fidelitatea interevaluatori? 5. Care sunt factorii care influeneaz calculul fidelitii test retest? 6. Care sunt avantajele i dezavantajele metodei formelor paralele? Sumar Fidelitatea reprezint absena relativ dintr-o prob psihologic a erorilor de msurare. Acest lucru ns n psihologie nu poate fi ntlnit; de aceea orice test psihologic trebuie s estimeze valoarea acestor erori aleatoare de msur. Calculul fidelitii indic msura n care scorurile obinute la test exprim de fapt valorile reale ale constructului pe care testul l msoar. Fidelitatea unui test psihologic se refer la dou aspecte: 1. consistena intern i 2. stabilitatea n timp a rezultatelor testrii. Fidelitatea unui test poate fi calculat pe baza a patru metode: 1. metoda consistenei interne, 2. test retest, 3. metoda formelor paralele, 4. metoda fidelitii interevaluatori
Sarcini i teme ce vor fi notate Rezolvai urmtoarele probleme: Testul A are abaterea standard 4, fidelitatea testului este 0.89 Testul B are abaterea standard 7, fidelitatea testului este 0.88 Considernd c toi ceilali parametri ai celor 2 teste sunt egali, pe care dintre teste l considerai mai bun? 1. 2. Testul C are eroarea standard de msur 3,20 iar fidelitatea testului 0,76 Testul D are eroarea standard de msur 5,6 iar fidelitatea testului 0,62 Considernd c toi ceilali parametri ai celor 2 teste sunt egali, pe care dintre teste l considerai mai bun?
3. Calculai eroarea standard de msur pentru un scor observat de 15 i utilizai valoarea obinut pentru a determina intervalul de ncredere al scorului real pentru 90 % respectiv 95%. Abaterea standard a scorurilor la test este 8; Fidelitatea testului este 0,74. Calculai: a. Eroarea standard de msur:______________ b. Intervalul de ncredere la 90%_________________________________ c. Explicai semnificaia acestui interval. d. Intervalul de ncredere la 95%_________________________________ e. Explicai semnificaia acestui interval. Bibliografie modul
Kaplan, R.M. i Saccuzzo, D.P. (2001) Psychological Testing, Principles, Applications and Issues, Wadsworth Thomson Learning, Fifth Edition. p 27-63, 63-98
27
IV. VALIDITATEA TESTULUI PSIHOLOGIC
Titlul i numrul modulului 4. Validitatea testului psihologic Scopul i obiectivele: obiectivul acestui modul este s le ofere studenilor o serie de informaii cu privire la validitatea testelor psihologice i importana acesteia, adic faptul c e necesar s demonstrm c testul msoar ceea ce i-a propus. Orice instrument de evaluare psihologic trebuie s satisfac cerinele validitii.

Vei putea defini validitatea testelor psihologice Vei putea enumera tipurile de validitate existente Vei recunoate modalitile de influenare a validitii
Scurt recapitulare a conceptelor prezentate anterior Fidelitatea reprezint absena relativ dintr-o prob psihologic a erorilor de msurare. Acest lucru ns n psihologie nu poate fi ntlnit; de aceea orice test psihologic trebuie s estimeze valoarea acestor erori aleatoare de msur. Calculul fidelitii indic msura n care scorurile obinute la test exprim de fapt valorile reale ale constructului pe care testul l msoar. Fidelitatea unui test psihologic se refer la dou aspecte: 1. consistena intern i 2. stabilitatea n timp a rezultatelor testrii. Fidelitatea unui test poate fi calculat pe baza a patru metode: 1. metoda consistenei interne, 2. test retest, 3. metoda formelor paralele, 4. metoda fidelitii interevaluatori Structura logic a modulului 1. Definiia validitii testului 2. Istoric al studiilor despre validitate 3. Forme ale validitii a. validitate de criteriu b. validitate de coninut c. validitate de construct Coninutul informaional detaliat VALIDITATEA TESTELOR Definiia validitii Evaluarea psihologic vizeaz o anumit realitate fie intern, fie extern. Numim domeniu de evaluare orice realitate (intern sau extern) care este supus evalurii. n orice proces de evaluare psihologic pornim de la definirea domeniului de evaluare i apoi propunem o serie de modaliti cantitative prin care observm dac indivizii posed sau nu caracteristicile domeniului respectiv. Deoarece definirea domeniului poate s fie mai mult sau mai puin corect ne punem ntrebarea dac aptitudinile /caracteristicile msurate de test corespund domeniului de evaluare. Astfel, pentru ca testul s fie considerat o msur bun a domeniului de evaluare este necesar s obinem o serie de informaii care s reflecte faptul c testul msoar ceea ce i-a propus. Din aceste cerine decurge problema validitii unei msurtori.
28
Orice instrument de evaluare psihologic trebuie s satisfac cerinele validitii. Tradiional, definiia cea mai des ntlnit a validitii este modalitatea n care un test msoar ceea ce i propune s msoare (Anastasi, 1976). Validitatea se refer deci la relaia dintre scorul obinut la un test i un anumit criteriu sau o performan extern. Acest criteriu poate s aparin oricrui domeniu; poate include selecia de personal, reuita colar sau nosologia. Istoric al studiilor despre validitate Este cunoscut deja faptul c msurarea psihologic i deci implicit i validarea i au rdcinile demult n timp. ntr-un articol care viza rolul testelor n selecia de personal, Guion (1976) realizeaz o trecere n revist a principalelor aspecte de care se inea cont la vremea respectiv n analiza validitii unei msurtori psihologice. Acestea sunt prezentate n tabelul 2: Tabelul 2.2. Referiri la validitate Aspecte Observaii Scopul validrii* este acela de a prezice o esteimportant a se cunoate dac scorurile la performan viitoare un test sunt ntr-o modalitate mai mare sau mai mic predictive pentru succesele ulterioare (Bingham, 1937, p.216) Predictorii i criteriile trebuie s fie selectai pe baza analizei muncii. Instrumentele de evaluare trebuie Pentru a putea compara performanele unei standardizate. persoane la un test la diferite momente n timp, testul trebuie s fie uniform (Freyd, 1923, p.232) Testele trebuie validate empiric. Un test nu are nici o semnificaie nainte ca acesta s fie validat (Link, 1924) Validarea este specific unei situaii. Un singur test nu este suficient. Hull (1928) susine c pentru a putea prezice cu mare acuratee un anumit criteriu, trebuie utilizat o baterie alctuit din 4, 5 sau mai multe teste (Guion, 1976, p.783). Este bine s se utilizeze doar un singur Freyd (1923) descrie procesele prin care este criteriu. selectat un criteriu Metodele psihometrice sunt preferate Evaluatorul nu se va limita la un instrument metodelor nepsihometrice. anume de msur, dar cele pe care trebuie s le utilizeze cel mai des sunt testele i chestionarele (Freyd, 1923, p.231) Un test trebuie s in cont de diferenele Performanele la un test trebuie analizate - acolo individuale. unde este cazul - diferit n funcie de sexe (Freyd, 1923).
1.
2. 3.
4. 5. 6.
7. 8.
9.
Analiza fcut de Guion (1976) ne ofer o imagine global a ceea ce nsemna la nceputul sec. xx modaliti tradiionale de realizare a studiilor de validitate a unui instrument de evaluare psihologic. O abordare mai recent i poate mai corect a validitii este formulat de APA1, AERA2, NCSEPT3 n 1974. Conform standardelor asociaiilor amintite Validitatea se refer la corectitudinea inferenelor realizate pe baza unui test sau a altei forme de evaluare (p.25). Altfel spus, dar fiind un set de ntrebri la care dorim s rspundem pe baza unei evaluri psihologice trebuie s ne verificm ct de corecte (sau valide) sunt rspunsurile (sau informaiile) oferite de un test psihologic (Ghiselli & all, 1986). Validitatea trebuie atribuit ntotdeauna inferenelor fcute pe baza performanelor la un test. Validitatea nu este o caracteristic a testului psihologic ci este mai degrab o caracteristic a inferenelor care
*
Validarea este procesul prin care se obin informaii legate de validitatea unui test.
1 2
American Psychological Association American Educational Research Association 3 National Council on Standards for Educational and Psychological Tests
29
rezult n urma utilizrii acestuia (unei forme de evaluare - chiar a observaiei). Altfel spus, validitatea determin relaia dintre inferenele fcute pe baza performanelor la un test i realitate (este inclus aici orice aspect care este supus evalurii). Dac analizm definiia dat de Nunnally (1978) validitii, i anume ct de util tiinific este un instrument de msur observm c i n acest caz este vorba de inferene, sau judeci realizate pe baza instrumentului respectiv. Forme ale validitii. Literatura de specialitate indic diferite tipuri de validitate psihologic. Ele trebuie nelese ca fiind tehnici, modaliti prin care se ncearc optimizarea unui instrument de msur psihologic. Modalitatea cea mai des ntlnit n literatura de specialitate (Anastasi, 1976; Cohen, et. all, 2000) de a concepe validitatea o constituie urmtoarea taxonomie: validitate de criteriu validitate de coninut validitate de construct. n afara celor trei tipuri de validitate, normele APA analizeaz validitatea de aspect. Validitatea de aspect este definit ca ceea ce un test pare s msoare, mai degrab dect ceea ce msoar (APA, 1974). Exprim de fapt modul n care persoana evaluat percepe itemii testului; ea este important n msura n care poate influena rspunsurile persoanei examinate la test. Dac persoana examinat apreciaz c testul msoar ceea ce i propune s msoare de fapt, atunci putem spune c testul are o validitate de aspect ridicat. Conform Standardelor de Evaluare APA (1974) validitatea de aspect nu constituie un criteriu important pentru inferenele fcute pe baza unui test.
II.2.1.VALIDITATEA DE CRITERIU
CRITERIU
Nu de puine ori suntem confruntai cu ntrebri ca: n ce msur performana la un test de inteligen este predictiv pentru reuita colar?, n ce msur rezultatul la un test de aptitudini prezice performana n munc?, n ce msur performana la un test de memorie constituie un bun predictor pentru declinul cognitiv la vrsta a treia?. Aceste ntrebri se adreseaz validitii de criteriu. Adesea acest tip de validitate este ntlnit sub denumirea de validitate empiric (Lyman, 1998). Validitatea de criteriu indic deci msura n care testul este un bun predictor pentru un eantion de comportamente viitoare. n acest caz performana la un test trebuie raportat la o alt performan pe care o numim criteriu. Criteriul este definit ca standardul la care este raportat performana la un test. Astfel criteriul poate fi performana unui pilot care conduce un Boeing 767, numrul de zile petrecut ntr-un spital de psihiatrie, notele obinute de un elev la disciplinele umane, performana la un alt test. Aa cum se poate observa nu exist reguli stricte pentru ceea ce numim criteriu. Acesta poate fi un comportament specific sau un grup de comportamente, o perioad de timp, un diagnostic psihiatric, indicele de absenteism, alcoolemia din snge, etc. Dei la o prima vedere se poate spune c un criteriu poate constitui orice, acest lucru este adevrat doar dac criteriul este relevant pentru domeniul de evaluare, dac este necontaminat, dac este valid i fidel. Un test psihologic este adecvat dac este relaionat cu un criteriu i deci poate fi considerat un bun substitut al criteriului. n general numim testul ca fiind predictor pentru criteriul respectiv. Caracteristicile unui criteriu. Criteriul reprezint o msur direct i independent a ceea ce testul dorete s prezic. Astfel pentru un test de aptitudini mecanice criteriul l poate constitui performana n munca de mecanic; pentru un test de cunotine criteriul l pot constitui notele colare. Criteriul trebuie s ndeplineasc cteva condiii (Corsini, 1994): s fie relevant pentru activitatea sau caracteristica la care se refer; adic ordinea subiecilor la test s coincid cu ordinea performanei la criteriu; s fie fidel, adic s fie congruent cu evaluri diferite ale performanelor la care se refer, evaluri realizate la momente diferite.
30
s fie practic, adic s nu coste mult; s fie exprimat n aceleai uniti pentru toate persoanele. Dac de exemplu, valorile variabilei criteriu sunt dependente de vrsta subiecilor atunci aceste valori trebuie transformate n cote standard (de exemplu: z sau T); Anastasi (1954) exemplific cteva criterii utilizate n analizarea validitii testelor care vizeaz constructe: vrsta se folosete ca i criteriu n cazul constructelor ce vizeaz procese care cunosc o maturizare (ex. inteligena, funciile perceptive, etc.). Nu este un criteriu bun pentru testele care vizeaz aspecte invariabile n timp (ex. variabilele ce in de temperament). performanele colare sunt un criteriu bun pentru testele de cunotine sau pentru testele care evalueaz aptitudini colare. performanele la diverse programe de instruire special (muzic, sport, etc.) sunt criterii adecvate pentru testele de aptitudini speciale. rezultatele altor teste se utilizeaz adesea ca i criteriu n construirea de noi teste. Astfel Scala Metrica a inteligenei construit de Binet-Simon (1905) a folosit drept criteriu pentru teste ulterioare construite n scopul evalurii inteligenei; grupele contrastante - pentru un test de inteligen acestea ar fi constituite din copiii care frecventeaz coala de mas, respectiv copiii integrai n coala ajuttoare. Ca i scorurile la test, un criteriu trebuie s fie fidel (Cohen, 1999). Dac ar fi posibil ntotdeauna s obinem direct scoruri la criteriu pentru un anumit individ nu am mai avea nevoie de msura predictorului i de nici o aproximare a validitii de criteriu. Din pcate ns nu putem obine imediat scorurile la un criteriu; ele pot fi obinute doar la anumite intervale n timp sau pot fi adesea extrem de costisitoare pentru a fi obinute la cerere pentru orice individ. S considerm un exemplu. S-a pus nu de puine ori ntrebarea ce nseamn o performan bun ntr-o anumit organizaie. Performana poate fi definit din mai multe puncte de vedere. Astfel, organizaia poate fi interesat de ct de mult contribuie o persoan la creterea profitului, iar pentru persoana respectiv performana poate nsemna msura n care simte c este apreciat. Avem n acest caz de-a face cu mai multe dimensiuni ale unui criteriu. Aceste surse de informaii pot fi utilizate pentru a prezice fiecare dintre cele dou surse ale criteriului iar validitatea acestora va fi determinat diferit. Dac un criteriu este adecvat este cel mai adesea o judecat de valoare (Ghiselli et. all). Putem estima prin diferite modaliti fidelitatea unui criteriu (stabilitatea acestuia n timp de ex.) ns formularea lui, respectiv coninutul acestuia constituie cel mai adesea un raionament sau o judecat a celui care realizeaz evaluarea. n exemplul anterior criteriul aparine viitorului i n momentul evalurii nu este disponibil, deci avem nevoie de o serie de predictori pentru estimarea acestuia. S presupunem ns c avem de-a face cu un criteriu care poate fi estimat acum (adic n momentul evalurii). ntrebarea pe care trebuie s ne-o punem este urmtoarea: avem la dispoziie msurtori economice ale criteriului care pot fi folosite acum?. Un exemplu de astfel de criteriu este msura n care o serie de indivizi prezint o form sau alta de tulburare psihic. O analiz complet a acestei dimensiuni ar dura cteva zile i ar fi neeconomic. Dac n plus sarcina psihologului este acela de a analiza un numr mare de persoane din prisma acestor criterii ar trebui gsit o alt modalitate dect cea clinic, complet. Problema cu care ne confruntam acum este aceea de a gsi o modalitate economic (rapid n timp i necostisitoare) care ar putea substitui examinarea clinic complet care constituie criteriul. Exist de multe ori evenimente care s-au petrecut n trecut i care deci nu mai pot fi evaluate n mod direct. Care este n acest caz predictorul utilizat pentru evaluarea criteriului (evenimentul trecut)? De exemplu, analiza de ctre medic a unei electrocardiograme (predictor) poate fi utilizat ca modalitate de a decide dac pacientul respectiv a suferit sau nu un atac de cord (criteriu). Un alt exemplu care intr n aceast categorie este rolul pe care l are un judector de a stabili dac un individ a comis o crim n trecut (criteriul) pe baza prezentrii faptelor la proces (predictor).
31
nainte de a prezenta diferitele tipuri de validitate de criteriu trebuie reinut urmtoarea afirmaie. O anumit variabil poate constitui un criteriu ntr-o anumit situaie respectiv predictor n alt situaie. Ceea ce este astzi criteriu poate s nu mai fie mine. APA (1974) difereniaz ntre dou tipuri de validitate de criteriu: validitate predictiv. validitate concurent
Validitatea predictiv. Termenul de predicie poate fi utilizat fie n sens larg cnd se refer la predicia unui test pentru orice situaie, sau n sens restrns cnd se refer la predicie ntr-un interval de timp. Validitatea predictiv vizeaz cel de-al doilea sens. Validitatea predictiv este definit ca acurateea cu care putem estima n ce msur o anumit caracteristic sau aptitudine a unei persoane se va manifesta n viitor pe baza msurii n care persoana posed o serie de caracteristici sau aptitudini curente (Ghiselli, et. all). De exemplu, la un examen de admitere la facultate ne poate intereseaz n ce msur aptitudinile de care dispune acum o persoana sunt predictive pentru performana academic. Pe baza notei la examenul de admitere (predictor) am putea face o predicie asupra reuitei academice ulterioare (criteriu). n practica clinic de exemplu, un test care ar reui s prezic tentativele viitoare de suicid ar constitui un bun predictor pentru acest criteriu.
Ce este predicia? Predicia este procesul de stabilire a unor expectaii despre viitor avnd la baza date / evenimente curente de exemplu desprinderea unor date despre performana viitoare n munc pornind de la caracteristicile actuale ale unei persoane. n literatura de specialitate, datele actuale se numesc predictori, n timp ce variabilele care descriu performana se numesc criteriu.
Principii ale prediciei. Psihologia personalului, orientat pe selecie ofer 2 modele tiinifice ale prediciei: abordarea pe baz de trsturi i abordarea pe baza generalizrii comportamentelor (Wernimont & Campbell, 1968). Abordarea pe baz de trsturi (figura 1) pornete de la asumpia c exist un numr de relaii bine precizate ntre trsturile unei persoane i activitile pe care persoana le desfoar, relaii exprimate n forma legilor psihologice. Aceast abordare are la baz principiul deductiv nomologic (principiul DN) din teoria tiinei (Stegmuller, 1974). Cnd pentru un grup de persoane o anumit lege psihologic stabilete c exist o legtur ntre o caracteristic A a persoanei i un anumit tip de comportament E, putem realiza, pe baza acestei legi, predicia c o persoan care posed caracteristica A va manifesta comportamentul E. Principiul nu poate fi aplicat n aceast form simpl din mai multe motive. n primul rnd, relaia dintre predictor i criteriu este mai degrab una probabilistic i nu determinist. Astfel, cunoscnd scorul unei persoane la o variabil predictor, putem face doar o inferen despre scorul la criteriu; aceast inferen se realizeaz cu o anumit probabilitate i nu cu certitudine. n al doilea rnd, trsturile i caracteristicile comportamentale, nu pot fi msurate n mod direct, ci ele sunt msurate pe baza unor instrumente care au caracteristici psihometrice specifice. n al treilea rnd legile dintre trsturi i comportamente trebuie stabilite foarte clar, fr contradicii logice. Astfel de contradicii ar putea apare atunci cnd un test ar realiza o predicie a unei performane bune a persoanei, iar un alt test ar prezice o performan slab.
32
Caracteristica A
Lege psihologic
Comportamentul E
Ipoteze pe baz de observaie Predicie Caracteristica a observat
Ipoteze pe baz de observaie
Comportamentul observat e
Figura 2.1. Predicia pe baza principiului deductiv-nomologic Abordarea pe baza generalizrii comportamentului (figura 2) are la baz urmtoarea asumpie: atunci cnd o persoan se comport de o manier E ntr-o anumit situaie G1 se poate concluziona c persoana respectiv se va comporta de aceeai manier E ntr-o alt situaie Gi, situaie similar cu prima. Avem de-a face n acest caz cu o generalizare a comportamentului observat ntr-un eantion de situaii la un o alt situaie similar cu cele din eantionul ales. Pe baza acestei generalizri putem vorbi de principiul eantionului de situaii. Figura 2 prezint grafic o reprezentare a acestui principiu.
Eantion de situaii
Reprezentativitate
Univers de situaii
Reprezentare
Reprezentare
Eantion de sarcini
Predicie
Univers de sarcini
Figura 2.2. Predicia pe baza principiului generalizrii comportamentului Cele dou modele ale prediciei difer din punctul de vedere al bazei lor epistemologice. Abordarea pe baza trsturilor relaioneaz o caracteristic durabil a unei persoane (ceva ce persoana are) cu activitatea sa (ceva ce persoana face). Abordarea pe baza generalizrii comportamentului nu ia n considerare trstura, ea relaioneaz comportamente (ce face o persoan cu altceva ce face). Aceast a doua abordare are la baz o similaritate mai mare ntre predictor i criteriu, fapt ce poate determina o mai bun predicie. Acest argument susine i faptul c instrumentele de tipul celor orientate pe coninut au o validitate predictiv mai mare dect cele bazate pe trsturi (Schmitt&Noe, 1986). Similaritatea dintre cele dou abordri se refer la faptul c ele au la baz asumpia c exist o stabilitate a comportamentului; n primul caz stabilitatea este dat de trstur, iar n al doilea caz stabilitatea este dat de o constant comportamental (comportamentul nu se schimb atta timp ct situaia nu se schimb). Ce model de predicie este utilizat n testul de personalitate 16PF? Validarea predictiv presupune existena unui interval de timp ntre test i verificarea criteriului. Pentru un test care are ca scop predicia reuitei colare la scris-citit n clasa I testul va fi aplicat la intrarea n clasa I, iar criteriul (performanele la scris-citit) va fi verificat fie dup un semestru, fie la sfritul clasei I.
33
Studiul de validare al unui test care vizeaz prognoza reuitei la citire n clasa I, trebuie s parcurg urmtoarele etape (Kulcsar, 1980) (figura 1): analiza psihologic a activitii de citire; indicarea premiselor psihologice ale reuitei la citire; alegerea unui test sau a unor teste psihologice care exploreaz tocmai acele aspecte psihologice care condiioneaz reuita la citire; aplicarea testului sau a testelor psihologice destinate prediciei reuitei la citire; msurarea criteriului, adic evaluarea gradului de nsuire a deprinderii de citire pe baza notelor colare sau a unor probe de citire elaborate n acest scop; analiza cantitativ i calitativ a rezultatelor la test i la criteriu; studierea legturii ntre cele dou categorii de rezultate. 15 septembrie 1980 15 iunie 1981
Aplicarea testului sau a bateriei de teste predictive Msurarea criteriului (notele colare; aplicarea unor (la intrarea n clasa I) probe de citire)
TEST (15 sept. 1980) Studierea legturii ntre reuita la i CITIRE (15 iunie 1981) metoda grupelor reprezentative; intercorelarea celor dou categorii de rezultate (coeficientul de validitate relev eroarea estimrii) metoda grupelor extreme sau contrastante; se studiaz comparativ media i dispersia rezultatelor la dou categorii de subieci semnificativ diferite sub aspectul criteriului reuita la citire / nereuita la citire Figura 2.3. Ilustrarea procesului de validare predictiv (Kulcsar, 1980). Validarea concurent presupune obinerea scorurilor la criteriu aproximativ n acelai timp cu scorurile la test. n cazul validitii concurente este vorba tot de o predicie, dar la aceasta se ajunge pe o cale puin diferit fa de cea urmat n studierea validitii predictive (Cronbach, 1970). Trebuie menionat faptul c distincia logic ntre validitatea predictiv i cea concurent (figura 2) nu se bazeaz pe relaia temporal dintre test i criteriu ci mai ales pe obiectivele testrii. Astfel, n timp ce validitatea concurent are ca scop rezolvarea unei probleme privind starea actual a subiectului, validarea predictiv vizeaz evoluia sa n viitor. Diferena ntre cele dou tipuri de validitate poate fi sumarizat pe baza urmtoarelor ntrebri: Este X anxios? (validare concurent) i Este posibil ca X s devin anxios? (validare predictiv). 15 septembrie 1980 Testare psihologic 15 septembrie 1980 Msurarea criteriului prin:
Studierea legturii ntre cele dou categorii de rezultate Figura 2.4. Ilustrarea procesului de validare concurent (Kulcsar, 1980) Dac rezultatele la predictor (test) sunt obinute simultan cu rezultatele la criteriu, msura relaiei dintre predictor i criteriu o constituie validitatea concurent. Validitatea concurent exprim deci n ce
34
msur scorurile la test pot fi utilizate pentru a estima performana actual a unei persoane la un anumit criteriu. Analiza validitii de criteriu (fie ea predictiv sau concurent) se bazeaz pe dou tipuri de analize statistice: coeficienii de validitate. Coeficienii de validate Validitatea de criteriu a unui test reprezint o modalitate cantitativ i obiectiv a relaiei dintre scorurile la predictor i scorurile la criteriu. Astfel coeficienii de corelaie sunt o modalitate de a estima validitatea predictiv. Cnd acetia sunt utilizai pentru a indica relaia dintre un predictor i un criteriu, ei sunt denumii coeficieni de validitate.
! APA (1974) difereniaz ntre dou tipuri de validitate de criteriu:

- validitate predictiv (este definit ca acurateea cu care putem estima n ce msur o anumit caracteristic sau aptitudine a unei persoane se va manifesta n viitor pe baza msurii n care persoana posed o serie de caracteristici sau aptitudini curente (Ghiselli, et. all) - validitate concurent (presupune obinerea scorurilor la criteriu aproximativ n acelai timp cu scorurile la test. n cazul validitii concurente este vorba tot de o predicie, dar la aceasta se ajunge pe o cale puin diferit fa de cea urmat n studierea validitii predictive (Cronbach, 1970)
II.2.2. VALIDITATEA DE CONINUT
CONINUT
Validitatea de coninut implic examinarea sistematic a coninutului testului pentru a se verifica dac testul acoper un eantion reprezentativ din domeniul care se cere a fi evaluat prin test (Anastasi, 1976). Astfel pentru a vorbi de o validitate de coninut ridicat trebuie ca itemii care alctuiesc testul s fie reprezentativi pentru ceea ce testul dorete s msoare. Analiza validitii de coninut a unui test trebuie s surprind: 1. Definirea i descrierea domeniului de coninut a testului. Aceast descriere trebuie s fie extrem de clar i s includ toate faetele domeniul care se dorete a fi evaluat. 2. Analiza itemilor care sunt inclui n test. Vor trebui s fie eliminai acei itemi care nu evalueaz aspecte ale domeniului de coninut identificat anterior. Aceast analiz se va face de ctre experi care pot s aprecieze relevana fiecrui item pentru un domeniu dat. Validitatea de coninut nu depinde ns de relevana aparent a coninutului itemilor ci de caracterul relevant al rspunsurilor subiectului la itemi (Anastasi, 1976). Pentru a stabili validitatea de coninut a testului, orice analiz teoretic trebuie deci s fie confirmat empiric (Kulcsar, 1980). 3. Compararea structurii testului cu domeniul de coninut. Astfel se va analiza dac itemii acoper toate aspectele domeniului, respectiv dac ei sunt proporionali n test cu importana i mrimea fiecrui aspect. Deoarece acest tip de validare nu reclam metode i modele statistice, ea fcndu-se doar pe baza de raionamente, o gsim n literatura de specialitate i sub denumirea de validare logic sau raional (Thorndike, Hagen, 1961).
Validarea referitoare la coninut se impune a fi calculat n urmtoarele cazuri: 1. n cazul testelor de cunotine atunci cnd nu exista un criteriu extern adecvat pentru analiza validitii de criteriu;
35
2. n cazul testelor utilizate la msurarea unui atribut ce nu poate fi exprimat printr-un construct (Murphy & Davidshofer, 1991). De exemplu, se poate descrie cu uurina domeniul de coninut al unui test construit pentru cunotine de aritmetic la elevii clasei I, dar este foarte dificil s gsim comportamente prin care aceast caracteristic s poat fi observat. 3. n cazul testelor care evalueaz performana n munca n scopuri de selecie i clasificare a angajailor. Acest tip de validare este adecvat cnd testul reprezint un eantion de comportamente din ceea ce reprezint deprinderile i cunotinele specifice muncii respective.
CONSTRUCT
II.2.3. VALIDITATEA DE CONSTRUCT Validitatea de construct reprezint msura n care se poate susine c testul msoar o variabil sau o trstur specific. n termeni generali constructul este sinonim cu acela de concept (Kline, 1992) fiind utilizat pentru a desemna o serie de fenomene ntr-un cadru tiinific. El este util atunci cnd poate fi operaionalizat. Dac lum de exemplu conceptul de specie, el este extrem de util n investigare i clasificare n tiinele naturii. Cu toate aceste nu exist o entitate distinct pe care putem s o etichetm specie, ea nu poate fi deci studiat i observat direct. Este doar o categorie, creat n scopul nelegerii diferitelor tipuri de organisme vii. Constructul este desprins dintr-o teorie psihologic care ofer cadrul menit s fundamenteze analiza semnificaiei psihologice a rezultatelor la test. Vorbim de validitate relativ la construct n cazul testelor de personalitate. Pentru a putea fi utilizat i evaluat, un concept trebuie corect i precis operaionalizat. Aceast operaionalizare impune descrierea constructului n termeni comportamentali concrei. Murphy & Davidshofer (1991) identific urmtorii pai n operaionalizarea unui construct: 1. identificarea comportamentelor care au legtur cu constructul; 2. identificarea altor constructe, pentru fiecare decizndu-se dac au sau nu legtur cu constructul msurat de test; 3. alctuirea pentru fiecare construct a unei liste de comportamente prin care acestea se exprim. Pentru fiecare comportament, pe baza relaiilor dintre constructe se decide dac are sau nu legtur cu constructul msurat de test. Spunem despre un test c are validitate convergent dac evalueaz aceleai constructe ca i alte teste, adic dac ntre scorurile sale i scorurile altor teste exist o relaie funcional. Un test are validitate de discriminare dac evalueaz altceva dect alte teste despre care se tie c se refer la constructe ce nu au legtur cu constructul msurat de test. Acest lucru nseamn c ntre scorurile la test i scorurile la alte teste sau variabile nu exist o relaie funcional. Campbell & Fiske (1959) propun ca i metod de verificare a validitii convergente i de discriminare a unui test metoda bazat pe matricea trsturi multiple-metode multiple (tabelul 6). Pe baza acestei metode sunt relevai coeficienii de corelaie ntre diferite msurtori ale acelorai constructe, msurtori obinute prin teste diferite. Metoda 1 Trsturi A1 Metoda 1 B1 C1 A2 Metoda 2 B2 C2 A3 Metoda 3 B3 C3 A1 (.89) .51 .38 .57 .22 .11 .56 .23 .11 .(89) .37 .22 .57 .11 .22 .58 .11 (.76) .09 .10 .46 .11 .12 .45 (.93) .68 .59 .67 .43 .34 (.94) .58 .42 .66 .32 (.84) .33 .34 .58 (.94) .67 .58 (.92) .60 (.85) B1 C1 Metoda 2 A2 B2 C2 Metoda 3 A3 B3 C3
Tabelul 2.6. (Campbell & Fiske, 1959). Matrice de tipul trsturi multiple-metode multiple
36
Tabelul de mai sus prezint toate corelaiile posibile ntre scorurile obinute cnd sunt evaluate trei trsturi (A, B, C) prin trei metode / teste. Cele trei trsturi reprezint trsturi de personalitate cum ar fi: (A) dominana, (B) sociabilitatea, (C) motivaia de realizare. Cele trei metode prin care se evalueaz aceste caracteristici pot fi (1) un chestionar, (2) un test proiectiv, (3) scale de comportament. Astfel A1 indic scorurile la dominan evaluate pe baza unui chestionar, A2 indic scorurile la dominan evaluate pe baza unui test proiectiv, iar C3 indic scorurile pentru motivaia de realizare evaluat printr-o scal de comportament. Tabelul include pe de o parte corelaiile ntre trsturi diferite evaluate pe baza aceleiai metode (chenar ntreg) precum i corelaiile ntre trsturi diferite prin metode diferite (chenar ntrerupt). Pentru verificarea validitii convergente n cazul constructului (A) avem urmtorii coeficieni: .57 metoda 1 cu metoda 2 .56 metoda 1 cu metoda 3 .67 metoda 2 cu metoda 3 Validarea convergent a unui test este necesar, dar nu i suficient pentru a dovedi c testul msoar ceea ce i-a propus; etichetele atribuite testelor reprezint trsturile sau caracteristicile pe care testele ar trebui s le msoare. Corelaia mare ntre dou teste nseamn c testele msoar acelai lucru, ns nu se poate spune c itemii cuprini n teste sunt reprezentativi pentru constructul pe care testele intenioneaz s l msoare. Analiza factorial sau analiza de clusteri efectuat asupra itemilor din testele care evalueaz aceleai constructe poate ajuta la explicarea corelaiilor dintre scorurile testelor (Albu, 1999)
1. Ce reprezint validitatea? 2. Ce reprezint validitatea de criteriu? 3. Ce reprezint validitatea de coninut? 4. C reprezint validitatea de aspect? 5. Care sunt caracteristicile unui criteriu? 6. Care sunt tipurile validitii de criteriu? 7. Ce trebuie s surprind analiza validitii de coninut? Sumar n orice proces de evaluare psihologic pornim de la definirea domeniului de evaluare i apoi propunem o serie de modaliti cantitative prin care observm dac indivizii posed sau nu caracteristicile domeniului respectiv. Deoarece definirea domeniului poate s fie mai mult sau mai puin corect ne punem ntrebarea dac aptitudinile /caracteristicile msurate de test corespund domeniului de evaluare. Astfel, pentru ca testul s fie considerat o msur bun a domeniului de evaluare este necesar s obinem o serie de informaii care s reflecte faptul c testul msoar ceea ce i-a propus. Din aceste cerine decurge problema validitii unei msurtori. Orice instrument de evaluare psihologic trebuie s satisfac cerinele validitii. Exist diferite tipuri de validitate psihologic. Aceste tipuri reprezint modaliti prin care se ncearc optimizarea unui instrument de msurare psihologic. Modalitatea cea mai des ntlnit n literatura de specialitate (Anastasi, 1976; Cohen, et. all, 2000) de a concepe validitatea o constituie urmtoarea taxonomie: 1. validitate de criteriu, 2. validitate de coninut, 3. validitate de construct.
Bibliografie modul
Albu, M. (1998). Construirea i utilizarea testelor psihologice, Editura Clusium. p 237-256
37
Kaplan, R.M. i Saccuzzo, D.P. (2001) Psychological Testing, Principles, Applications and Issues, Wadsworth Thomson Learning, Fifth Edition. p 27-63
V. ALGORITMUL CONSTRUCIEI UNUI TEST PSIHOLOGIC
Titlul i numrul modulului 5.Algoritmul construciei unui test psihologic Scopul i obiectivele: n cadrul acestui modul obiectivul principal este ca studenii s nvee modalitile cele mai bune de construcie de itemi astfel nct acetia s ofere imaginea acurat a constructului de msurat.

Vei putea formula corect itemi Vei realiza itemi utiliznd un format adecvat al opiunilor de rspuns Vei realiza analiz de itemi Vei putea calcula validitatea de construct Vei putea realiza analiza factorial
Scurt recapitulare a conceptelor prezentate anterior n orice proces de evaluare psihologic pornim de la definirea domeniului de evaluare i apoi propunem o serie de modaliti cantitative prin care observm dac indivizii posed sau nu caracteristicile domeniului respectiv. Deoarece definirea domeniului poate s fie mai mult sau mai puin corect ne punem ntrebarea dac aptitudinile /caracteristicile msurate de test corespund domeniului de evaluare. Astfel, pentru ca testul s fie considerat o msur bun a domeniului de evaluare este necesar s obinem o serie de informaii care s reflecte faptul c testul msoar ceea ce i-a propus. Din aceste cerine decurge problema validitii unei msurtori. Orice instrument de evaluare psihologic trebuie s satisfac cerinele validitii. Exist diferite tipuri de validitate psihologic. Aceste tipuri reprezint modaliti prin care se ncearc optimizarea unui instrument de msurare psihologic. Modalitatea cea mai des ntlnit n literatura de specialitate (Anastasi, 1976; Cohen, et. all, 2000) de a concepe validitatea o constituie urmtoarea taxonomie: 1. validitate de criteriu, 2. validitate de coninut, 3. validitate de construct. 1. 2. 3. 4. 5. Structura logic a modulului Formularea itemilor Formatul opiunilor de rspuns Analiza de itemi Validitatea de construct Analiza factorial Coninutul informaional detaliat
38
CONSTRUCIA I ANALIZA DE ITEMI 1. Construcia de itemi Atunci cnd dorim s evalum ceva, prima ntrebare pe care ne-o formulm este ce anume dorim s evalum, care este formatul pe care trebuie s-l aib itemii, astfel nct s ne ofere imagine acurat a aspectului care ne intereseaz. Formularea itemilor Construirea de itemi este un proces pretenios, n continuare vom prezenta cteva aspecte orientative legate de formularea lor: 1. Definii clar ceea ce avei de msurat, pentru a putea formula itemii ct mai specific posibil. 2. Generai o baz de itemi, evitai itemii redundani. 3. Evitai formularea unor itemi lungi, care ar putea fi greu nelei. 4. ncercai s formulai itemii ntr-un limbaj accesibil persoanelor evaluate cu acest instrument. 5. Evitai formularea unor itemi care surprind dou aspecte sau idei, de exemplu: mi place s lucrez ntr-un mediu bine organizat, pentru c vreau s fiu cel mai bun la locul de munc Acest item are n vedere dou aspecte: mi place s lucrez ntr-un mediu bine organizat i vreau s fiu cel mai bun la locul de munca, astfel n momentul n care persoana evaluat va alege o opiune de rspuns, va fi imposibil de decelat la care din cele dou aspecte evaluate se refer. 6. ncercai s formulai itemi pozitivi i negativi n aceeai msur, pentru a evita biasarea care apare n cazul formulrii itemilor pozitivi. Aceast biasare este determinat de tendina persoanei evaluate de a fi de acord cu toi itemii testului. Formatul opiunilor de rspuns
n funcie de constructul pe care dorim s-l evalum anumite formate devin mai mult sau mai puin adecvate. Prezentm n continuare cele mai frecvent ntlnite forme ale itemilor.
a. Itemii dihotomici ofer dou alternative de rspuns (adevrat i fals), de obicei uneia dintre acestea i se acord un punct la cotarea performanei persoanei evaluate. Itemii au forma unor afirmaii, iar sarcina subiecilor este de a decide asupra valorii de adevra a acesteia. Avantajele acestui tip de itemi sunt: sunt uor de cotat; sunt uor de construit (n construirea unui test de evaluare a cunotinelor profesorul poate utiliza fragmente din suportul de curs pentru a formula itemii); completarea lor nu necesit mult timp deoarece rspunsul nu trebuie scris; necesit o evaluare n termeni absolui (alb sau negru); Dezavantaje acestui tip de itemi sunt: n cadrul testelor de cunotine acest tip de itemi pot ncuraja studenii s memoreze materialul; ansa de a ghici rspunsul corect este foarte mare, de 50%. b. Itemi cu mai multe opiuni (polinomici) au un format similar celor dihotomici, atta doar c au mai mult de dou alternative de rspuns. Se acord un punct numai unei opiuni de rspuns, iar celelalte care nu sunt corecte poart denumirea de distractori. Itemii construii n scopul evalurii performanei academice au de cele mai multe ori acest format. Avantajele acestui tip de itemi sunt: aceti itemii sunt uor de cotat; sunt uor de construit; completarea lor nu necesit mult timp deoarece rspunsul nu trebuie scris; ansa de a ghici rspunsul corect este redus;
39
Dezavantajul cel mai mare al acestui tip de itemi se refer la construirea unor distractori buni, procedeu care necesit mai mult timp. n cazul itemilor polinomici, probabilitatea de a ghici rspunsul exist, dei este mai mic dect n cazul itemilor dihotomici (este de 25% n cazul a patru alternative, de 33.33% n cazul a trei alternative). Aceste lucru poate fi corectat prin utilizarea unei formule de ajustare a scorului obinut de ctre fiecare persoan evaluat. Aceast formul se exprim astfel:
Scorul corect = R W/ n 1 R este numrul opiunilor corecte; W este numrul opiunilor greite; n este numrul opiunilor de rspuns ale itemilor. Rspunsurile omise nu sunt incluse deoarece acestea nici nu cresc i nici nu duc la scderea scorului final. De exemplu n cazul unui test de 100 de itemi, cu cte 4 opiuni de rspuns (din care una singur este corect, celelalte trei sunt greite la fiecare item), dac vom completa aleator rspunsurile corecte vom obine scorul de 25 (bine neles aceasta este o situaie ipotetic n realitate avem puine anse s obinem tocmai 25 de puncte care este scorul mediu ateptat). n acest caz, conform formulei anterioare, scorul corect este de: 25 - 75/4-1 = 25 25 = 0 Astfel, dup aplicarea coreciei scorul expectat este 0. ntrebarea este n ce msur n cazul testelor de cunotine este recomandat ca studenii s ncerce s ghiceasc rspunsul? n cazul n care nu se utilizeaz procedura de corecie rspunsul este clar, ncercai s nimerii, dar nu i n cazul n care se utilizeaz procedura de corecie. Exist situaia n care nu suntei siguri de rspunsul corect, dar tii sigur c dou din cele patru alternative de rspuns sunt greite, n acest caz v sftuim s ncercai s ghicii. Formula de corecie are la baz asumpia c fiecare din cele patru alternative de rspuns are aceeai probabilitate de a fi aleas, deci avei ansa de 1 la 4. n cazul n care eliminai dou dintre alternative ansa dvs. crete la 1 la 2, ceea ce v ofer un avantaj asupra procedurii de corecie. c. Scale Likert prezint o form foarte popular, utilizat mai ales n cadrul testelor de personalitate, n care persoana evaluat trebuie s-i exprime acordul sau dezacordul fa de a o afirmaie (se numete scal Likert, pentru c a fost introdus de ctre Likert n 1932, n scopul evalurii atitudinilor). De exemplu la itemul: mi este fric de nlime. Avem urmtoarele opiuni de rspuns: 1 acord total 2 acord 3 nici acord nici dezacord 4 dezacord 5 dezacord total
Pentru a se evita alegerea unui rspuns neutru din partea celui evaluat (n cazul exemplului de mai sus 3), se utilizeaz scale cu un numr par de opiuni de rspuns, de exemplu: 1 acord puternic 2 acord moderat 3 acord 4 dezacord 5 dezacord moderat 6 dezacord puternic
40
Acest tip de rspuns permite cotarea invers, scorul total este calculat prin nsumarea numerelor corespunztoare rspunsurilor. d. Scal categorial este similar cu scalele Likert, dar utilizeaz un numr mai mare de opiuni de rspuns, de cele mai multe ori sunt utilizate scale cu 10 opiuni de rspuns. Pentru utilizarea lor adecvat este foarte important ca punctele extreme ale scalei s fie clar definite i permanent reamintite celor care realizeaz evaluarea. Una dintre principalele probleme legate de acest tip de scal este numrul de categorii care poate fi utilizat, care poate fi de 10 i 15 sau 66? S-au realizat cteva studii n acest sens, ele au artat c depinde mult de scopul pe care l avem i de nivelul de expertiz al evaluatorului. De exemplu dac dorim s evalum performana unor juctori de fotbal, o scal cu 7 nivele va fi suficient pentru ochiul unui nonexpert care nu sesizeaz aspectele de finee, dar nu i n cazul unui expert, al unui antrenor care poate sesiza mai multe diferene ntre juctori. e. Q- sort este o metod utilizat cu precdere n evaluarea personalitii. Persoana evaluat va primi o list de adjective pe care le va sorta n funcie de msura n care acestea l caracterizeaz.
!Cele mai frecvent ntlnite forme ale itemilor:

1. 2. 3. 4. 5. itemi dihotomici itemi polinomici scale Likert scale categoriale Q - sort
2. Analiza de itemi Care sunt criteriile pe baza crora putem spune c un item este bun? Aa dup cum putem analiza un test din prisma fidelitii i validitii, la fel putem analiza conform acestor criterii un item. Mai precis, un item bun discrimineaz ntre dou categorii de subieci; putem spune de asemenea c un item este bun dac performana la item coreleaz cu performana la test.
Care este procesul pe baza cruia putem analiza itemii? Dup ce am generat itemii, dup ce acetia au fost aplicai unui eantion de subieci, ne intereseaz n ce msur ei pot fi considerai itemi buni, respectiv la care dintre itemi ar trebui s renunm deoarece nu satisfac criteriile. Totalitatea procedeelor statistice cunoscute sub denumirea de analiz de itemi servesc scopurilor prezentate. Este important de menionat faptul c analiza de itemi cuprinde att procedee cantitative ct i procedee calitative.
Analiza calitativ de itemi Tehnicile de analiz calitativ a itemilor unui test constituie un procedeu des ntlnit n analiza itemilor unui test. Tabelul 5 prezint o serie de aspecte ale analizei calitative de itemi pe care trebuie s le ia n calcul o persoan care construiete un test. Tabelul 2.3. Aspecte ale analizei calitative de itemi Aspecte Specificitatea cultural Validitatea de aspect ntrebri Crezi c itemii testului sunt discriminativi pentru un grup anume de persoane? De ce? Testul msoar ceea ce crezi tu c msoar? Dac nu este aa ce anume din test
41
te ndreptete s susii acest lucru? Examinatorul Crezi c performana obinut la test a fost influenat de comportamentul examinatorului? Dac da, care au fost acele comportamente care te-au influenat? Crezi c unele condiii ale mediului n care ai fost testat au influenat performanele la test? Dac da, care au fost acelea? Modalitatea de prezentare a instruciunilor sau alte aspecte verbale ale testului au influenat performana la test? Care este opinia ta n privina lungimii testului se vor discuta 2 aspecte: timpul total i numrul itemilor Au fost itemi n test la care ai dat rspunsuri la ntmplare? Care este procentajul de itemi la care ai rspuns la ntmplare? Ai folosit anumite strategii specifice? Crezi c s-a putut tria la acest test? Dac da, care crezi c au fi sunt modalitile de a tria?
Mediul de testare Limbajul testului Lungimea testului Rspunsurile aleatoare
Corectitudinea testrii
Starea psihic/fizic a Cum ai descrie starea ta (psihic sau fizic) din timpul testului? Crezi ca subiectului n timpul aceast stare ar putea influena n vre-un fel performana la test? examinrii Impresia general Preferine Pregtirea anterioar Care este impresia ta general lsat de acest test? Care sunt sugestiile pe care le-ai face pentru mbuntirea testului? Ce i-a plcut/displcut la acest test? Au existat pri ale testului pe care le-ai resimit ca provocndu-i anxietate sau alte stri negative? Cum te-ai pregtit pentru acest test? Dac ar trebui s sftuieti pe cineva privind modul n care ar trebui s se pregteasc pentru acest test ce i-ai sugera?
Analiza cantitativ de itemi din perspectiva teoriei clasice Atunci cnd ne referim la teoria clasic a testelor avem n vedere modelul de msurare prezentat n cadrul modulului II. n acest subcapitol vom prezenta procedurile de analiz a itemilor bazate pe acest model i pe asumpiile sale. Procedurile statistice utilizate n analiza itemilor sunt nu de puine ori extrem de complexe, de aceea scopul nostru este de a prezenta aici doar procedurile de baz. Vom prezenta n continuare modalitile principale utilizate n analiza itemilor. Este important de reinut faptul c importana acestor procedee depinde de funcia i obiectivele pe care autorul testului dorete s le atribuie testului. Printre indicatorii care ar trebui luai n calcul n analiza de itemi se gsesc: indicele de dificultate al itemului; indicele de discriminare; Indicele de dificultate al unui item S presupunem c un item al unui test este rezolvat corect de toi subiecii. Putem spune c itemul acesta este un item bun? Ce se ntmpl dac dimpotriv, nici un subiect nu rspunde corect la acest item. n ambele cazuri putem considera c itemul respectiv nu este unul bun. Dac la un item toi subiecii rspund corect nseamn c itemul este prea uor; dac dimpotriv, nici un subiect nu rspunde la un item atunci putem spune c itemul este prea dificil. n ambele cazuri, se recomand rescrierea itemului sau eliminarea din test.
42
Observaie. La unele teste de cunotine, primul item al testului este unul extrem de facil (rspund deci majoritatea subiecilor). Acest lucru este indicat a se realiza fie pentru a verifica dac subiectul a neles sarcina de lucru, fie pentru a-i forma o atitudine pozitiv fa de test i astfel de a-i crete motivaia. Indicele de dificultate al unui item (px) se obine calculnd proporia subiecilor care au rspuns corect la item. Valoarea teoretic a indicelui de dificultate se gsete ntre 0 (dac nici un subiect nu a rezolvat itemul corect) i 1 (dac toi subiecii au rspuns corect la un item). Exemple. 1. Dac 50 din cei 100 de subieci la care a fost aplicat un test au rspuns la itemul 2 corect atunci putem spune c indicele de dificultate al itemului 2 este 50/100 adic p2=0,5 2. Dac 75 din cei 100 de subieci la care a fost aplicat un test au rspuns la itemul 3 corect atunci putem spune c indicele de dificultate al itemului 3 este 75/100 adic p3=0,75 i vom spune c itemul 3 este mai uor dect itemul 2. Se poate observa c cu ct indicele de dificultate al itemului este mai mare cu att itemul este mai uor. Deoarece p se refer la procentul celor care au rezolvat corect itemul, putem spune c cu ct este mai mare valoarea indicelui cu att itemul este mai uor. Vorbim de indice de dificultate pentru testele de performan, ns n cazul testelor de personalitate acest indice exprim procentul de subieci care a rspuns da la item, sau n alte cazuri procentul de subieci care a agreeat itemul. Un indice global de dificultate al itemilor unui test se poate calcula fcnd media indicilor fiecrui item. Astfel se face suma tuturor indicilor de dificultate i rezultatul obinut se mparte la numrul itemilor testului. Pentru o maxim discriminare, este important ca media indicilor de dificultate al unui test s fie 0.5, deci indicii fiecrui item al testului s varieze ntre 0.3 i 0.8. Ceea ce trebuie s lum n calcul cnd analizm indicele de dificultate al unui item este ansa ca subiectul s dea rspunsul corect la ntmplare (adic de a ghici rspunsul). n acest caz indicele optim de dificultate al unui item se gsete la mijlocul distanei dintre 1 i rata de rspuns la ntmplare care pentru un item cu 2 rspunsurile este de 0,50. Mijlocul distanei dintre 1 i 0.50 este 0.75 deci indicele optim de dificultate al acestui item este 0.75. n general acest indice optim se obine nsumnd valoarea ansei cu 1 i apoi mprind valoarea obinut la 2, sau: 0,50+1,00=1,5 1,5/2=0,75 Pentru un item care are 5 variante de rspuns ansa de a rspunde corect este 1/5 adic 0,20. n acest caz, indicele de dificultate optim se va obine astfel: 0,20+1,00=1,20 1,20/2=0,60 Indicele de discriminare al unui item Indicele de discriminare al unui item (d) constituie o msur a ct de bine reuete un item s separe sau s discrimineze subiecii care au obinut scoruri mari i cei care au obinut coruri mici la test. Mai precis, un item este considerat discriminativ dac subiecii care au obinut o performan bun la test au rezolvat corect itemul, respectiv dac cei care au obinut o performan sczut la test nu au rezolvat corect itemul. Dac majoritatea subiecilor cu performan mare la test nu au rezolvat corect un item atunci nseamn c itemul respectiv nu discrimineaz ntre categorii diferite de subieci. Similar, n cazul testelor de personalitate subiecii care au un scor mare la o anumit trstur (evaluat de ntregul test) trebuie s aib un scor mare i la un item care se presupune c evalueaz trstura respectiv. Indicele de discriminare are n vedere performana eantionului la un item innd cont de performana scorurilor din ultima treime sau din prima treime a distribuiei totale a scorurilor. Limita pn la
43
care putem considera prima/ultima arie a distribuiei scorurilor este valoarea de 27% din scoruri (Kelley, 1939). Indicele de discriminare al unui item este reprezentat de msura diferenei dintre proporia celor care au rezolvat corect itemul i cei care nu au rezolvat corect itemul. Cu ct valoarea lui d este mai mare cu att este mai mare numrul subiecilor buni care au rezolvat itemul. O valoare negativ pentru un d reprezint o problem a itemului deoarece indic situaia n care cei care au avut o performan slab la test rezolv corect itemul. n aceast situaie se cere revizuirea sau eliminarea itemului.
Exemplu. S presupunem c un profesor administreaz un test la 119 persoane i selecteaz primele 27% i ultimele 27% din performanele la test, selectnd 32 de teste n fiecare grup. n continuare n tabelul 3 sunt prezentate valorile necesare calcului indicelui de discriminare pentru cei 5 itemi ai testului: Tabelul 2.4. Indicele de discriminare pentru 5 itemi ipotetici ai unui test Item 1 2 3 4 5 Superior (S) 20 30 32 20 0 Inferior (I) 16 10 0 20 32 S-I 4 20 32 0 -32 n 32 32 32 32 32 d = (S-I)/n 0,43 0,63 1,00 0,00 -1,00
Pentru itemul 1 se poate observa c 20 dintre subiecii care au obinut performane superioare la test au rezolvat corect itemul, n timp ce 16 dintre cei care au obinut performane inferioare la test au rezolvat corect itemul. Cu un indice de discriminare de 0.13, itemul 1 poate fi considerat un item bun deoarece mai muli subieci dintre cei care au obinut o performan bun la test, au rspuns corect la item. Se poate observa c cu ct este mai mare valoarea indicelui de discriminare cu att itemul separ mai bine categoriile de subieci i este deci mai discriminativ. Valoarea cea mai mare pe care o poate avea un indice de discriminare este +1 (toi subiecii care au obinut performana superioare la test au rezolvat corect itemul); valoarea cea mai mic pe careo poate avea un indice de discriminare al unui item este 1 (nici unul dintre subiecii care au obinut performane superioare la test nu au rezolvat corect itemul). Analiza alternativelor de rspuns la itemi. Calitatea fiecrei alternative de rspuns la itemii cu rspunsuri multiple poate fi analizat comparnd-o cu performana obinut de subiecii care au avut performane superioare (primii 27%) i cei care au obinut performane inferioare (ultimii 27%) la un test. S analizm (tabelul 4) performana la 5 itemi ipotetici, test la care 32 de subieci au obinut performane inferioare (I) i 32 de subieci au obinut performane superioare (S).
44
Tabelul 2.5. Rspunsurile la 5 itemi ai unui test (Rspunsul corect al fiecrui item este marcat cu caractere ngroate) Alternative Item 1 S I 2 S I 3 S I 4 S I 5 S I 24 10 2 6 0 3 5 4 14 7 3 5 13 7 0 2 15 5 0 0 2 6 3 5 32 22 0 4 0 0 0 6 2 7 0 2 5 4 5 16 3 5 12 7 0 3 7 15 13 9 a b c d e
Analiza itemilor. Itemul 1 este un item bun mai multe persoane cu performan superioar la test l-au rezolvat corect. Itemul 2 un numr mare de S au ales un distractor n locul rspunsului corect (rspunsul b). Acest item ar trebui revzut. Itemul 3 reprezint modalitatea optim de rspuns la un item; toii S au rspuns corect Itemul 4 este mai dificil dect itemul 3 deoarece o proporie mai mic de S au rspusn corect la item, dar discrimineaz mai bine (o proporie mai mic de I au rspuns cirect la item). Itemul 5 este un item slab deoarece mai muli de I au rpsuns corect la item. Analiza curbei caracteristice itemului O modalitate de a afla noi informaii despre comportamentul itemilor este trasarea curbei caracteristice itemului. Astfel, pentru un anumit item vom reprezenta pe axa X scorurile posibile la test, iar pe axa Y proporia persoanelor care au rspuns corect la item (vezi figura 2.5).
1
0.5
0 0 5 10 15 20 25 30 35 40 45 Scorul total la test 50 55 60 65
Figura 2.5. Curba caracteristic a itemului
45
Scorul total reprezint nivelul de abilitate al persoanei evaluate, acest nivel nu poate fi msurat, doar estimat pe baza acestui scor. Relaia dintre performana la unul dintre itemi i cea obinut la aplicarea ntregului test ne ofer informaii legate de item. Astfel figura de mai sus reprezint curba caracteristic a unui item relativ bun, observm cum curba crete pe msur ce crete i scorul total la test, aceasta nseamn c itemul discrimineaz bine n cazul tuturor nivelelor de performan. S lum spre exemplu o persoan care are un scor mai mic de 20 puncte, conform curbei (Figura 2.6), aceasta va avea o probabilitate de aproape 40% de a rezolva corect acest item.
1
0.5
0 0 5 10 15 20 25 30 35 40 45 Scorul total la test 50 55 60 65
Figura 2.6. Curba caracteristic a itemului n cazul n care scorul este mai mare, de 40 respectiv 65 de puncte, probabilitatea de a rspunde corect este de 50 respectiv 100%. Un item bun trebuie s prezinte un asemenea patern de comportament, adic pe msur ce crete nivelul de abilitate a persoanelor testate s creasc i ansa de a fi rezolvat corect. n figura 2.7 dorim s prezentm itemi care prezint un patern comportamental diferit de cel 1 prezentat anterior. V rugm s analizai curba trasat cu linie ntrerupt.
0.5
10
15
20
25 30 35 40 45 Scorul total la test
50
55
60
65
Figura 2.7. Curba caracteristic a 2 itemi Observm c i dac nivelul de abilitate al persoanelor din eantionul nostru crete, probabilitatea de a rspunde corect la acest item este aceeai, cu alte cuvinte itemul nu ne ofer nici o informaie despre nivelul de abilitate al persoanei care l-a rezolvat (itemul trasat cu linie ntrerupt). Este posibil ca acest item s msoare un alt aspect dect cel pe care l evalueaz ceilali itemi ai testului. Spre deosebire de acesta, itemul trasat cu linie nentrerupt este rezolvat numai de persoanele care au un scor brut de cel puin 25 de puncte, probabilitatea de a-l rezolva corect crete apoi treptat mpreun cu nivelul de abilitate. Acest item este de dificultate medie, este puin probabil ca el s fie rezolvat corect de persoanele cu scor mai mic de 25.
2. Analiza de itemi din perspectiva teoriei rspunsului la item (item response theory - IRT)
46
Teoria rspunsului la item propune un nou model de explicare i de analiz a itemului i a comportamentului acestuia. Rasch (1960) a fost principalul promotor, care a propus primul model, dup care acesta a fost dezvoltat i adaptat la diferite situaii de testare. Aceste modele sunt unidimensionale, adecvate testelor care au ca scop evaluarea unei singure trsturi latente sau multidimensionale, n cazul testelor care evalueaz mai multe dimensiuni. De asemenea n funcie de rspunsul la item dihotomic sau cu mai mute opiuni avem mai multe tipuri de modele. n continuare vom discuta despre modele unidimensionale dihotomice. n cazul modelelor IRT unidimensionale diferenele dintre persoanele care alctuiesc eantionul pot fi explicate numai pe baza unei singure dimensiuni. Modelele IRT implic dou asumpii: Curba caracteristic itemului (item characteristic curve - ICC) trebuie s aib o form specific (acesta descrie modul n care modificrile la nivelul abilitii induc modificri la nivelul probabilitii de apariie a rspunsului corect); Trebuie ndeplinit condiia de independen local (aceasta nseamn c nu trebuie s avem corelaie ntre itemi, n condiiile n care nivelul de abilitate al persoanelor evaluate este meninut constant).
nainte a trece la prezentarea concret a unui model IRT, dorim s reamintim modelul care st la baza teoriei clasice. Xobservat = Xreal + e Acesta are urmtoarele asumpii: Valoare expectat a erorii pentru fiacre persoan n parte este 0; Eroarea nu covariaz cu alte variabile (aceste asumpii sunt importante pentru interpretarea erorii standard de msurare). (e = eroarea de msur)
Limitele care au fost reproate acestui model sunt urmtoarele: 1. sunt menionate dou variabile independente de care depinde scorul obinut de o persoan, i anume scorul real i eroarea de msurare, dar acestea nu pot fi separate n mod real n cadrului scorului obinut de ctre o persoan, astfel modelul este util n cadrul realizrii unor estimri la nivel de populaie; 2. Din acest model sunt omise proprietile itemului care i ele au un impact asupra scorului persoanei (dac de exemplu toi itemii sunt uori, atunci majoritatea persoanelor vor ave un scor maxim); Modelele IRT explic performana la test considernd doi sau mai muli parametrii: nivelul de abilitate al persoanei evaluate, parametrul de dificultate al itemului, parametrul de discriminare, probabilitatea de a ghici rspunsul corect, iat notaiile utilizate. X is = rspunsul persoanei s la itemul i (care n cazul itemilor dihotomici poate fi 0 sau 1) p(Xis=1) = probabilitatea ca persoana s s ofere un rspuns corect la itemul i s = nivelul de abilitate al persoanei s i = dificultatea itemului i i = discriminarea itemului i i = probabilitatea de a ghici rspunsul corect la itemul i
47
Vom explicita modelul de msurare utilizat de aceast abordare prin prezentarea modelului uniparametric 1PL. p(Xis=1) = 1/(1 + e (-( - i)) n cadrul acestuia probabilitatea de a rspunde un rspuns corect la un item i, depinde de nivelul de abilitate al persoanei evaluate i de parametrul de dificultate al itemului. Acesta se numete model uniparametric deoarece este considerat numai un singur parametru al itemului. Dac analizm acest model la nivel grafic (vezi figura de mai jos, unde pe axa X este reprezentat nivelul de abilitate al persoanei testate , iar pe axa Y probabilitatea de a oferi un rspuns corect la itemii a cror curb este trasat), observm cum curbele caracteristice itemilor au acelai unghi de nclinare, ceea ce difer este locaia lor de-a lungul nivelului de abilitate, practic aceast locaie este un indicator al dificultii itemului. De exemplu itemul trasat cu linie ntrerupt (figura 2.8) este rezolvat de persoanele cu un nivel de abilitate de 01 n proporie de aproximativ 55%, n timp ce aceleai persoane rezolv itemul trasat cu linia punctat n proporie de 20%, deci acesta din urm este mai dificil dect primul.
0.5
0 -3 -2 -1 0 1 nivelul de abilitate 2 3
Figura 2.8. Curba caracteristic a 2 itemi
n cazul acestui model, parametrul de discriminare este meninut constant (egal cu 1).
nivelul de abilitate i parametrii itemilor (dificultate, discriminare) pot lua valori ntre minus i plus infinit deoarece sunt pe scal logit.
48
n cadrul modelului biparametric 2PL, este considerat i parametrul de discriminare a itemului. n figura 2.9 prezentm itemi care au acelai nivel de dificultate, dar care au o discriminare diferit. p(Xis=1) = 1/(1 + e (- i ( - i))
0.5
Figura 2.9. Curba caracteristic a 3 itemi Discriminarea este reprezentat grafic prin gradul de nclinare a curbelor care descriu comportamentul itemului. Un item cu o curb abrupt discrimineaz mai bine comparativ cu un item cu o curb mai domoal. Acest lucru nseamn c o modificare mic la nivelul abilitii persoanelor testate va duce la o modificare mare a probabilitii de a rspunde corect la item. Curba trasat cu linie nentrerupt reprezint un item care are o discriminare perfect, deoarece nici o persoan cu un nivel de abilitate mai mic de 0.25 nu va avea ansa de a rezolva acest item, n schimb persoanele cu o abilitate mai mare l vor rezolva. Modelul tri-parametric 3PL, introduce i parametrul care permite estimarea ansei de a ghici rspunsul corect la item. p(Xis=1) = i + (1 - i)[1/(1 + e (- i ( - i))] Probabilitatea de ghici rspunsul corect este vizibil n punctul n care curba caracteristic itemului intersecteaz axa Y. Aceasta nseamn c i persoanele care au un nivel de abilitate sczut vor rezolva corect itemul, ghicind rspunsul corect (Figura 2.10).
49
Utilizarea unui model 3PL devine necesar mai ales n situaia n care probabilitatea de a ghici rspunsul corect este mare, de exemplu n cazul unui item cu 2 posibiliti de rspuns acesta este de 1 din 2, spre deosebire de cea cu 6 opiuni, n care probabilitatea de a ghici rspunsul corect este semnificativ mai mic, 1 din 6.
0.5
Figura 2.10. Curba caracteristic itemului Aceste modele reflect modul n care IRT a contribuit la perfecionarea procedurilor de dezvoltare a instrumentelor de msurare, dar analiza atent a asumpiilor acestora ofer o nou perspectiv asupra vechilor reguli de msurare, aa cum spunea Emreston i Reise (2000).
ANALIZA FACTORIAL Una dintre metodele utilizate n validara de construct este analiza factorial. Analiza factorial este definit ca un set de proceduri matematice utilizate pentru a identifica dimensiunile care stau la baza uneui set de msurori empirice. Cel mai adesea este utilizat pentru: identificarea factorilor care stau la baza performanei la un test de aptitudini identificarea unor dimensiuni ale personalitii identificarea unor sindroame clinice identificarea factorilor relaionai cu satisfacia n munc n continuare vor fi discutate principalele concepte implicate n analiza factorial. Concepte generale
Atributele interne pot fi gndite ca i constructe ipotetice. Ele nu sunt cu necesitate reale sau concrete. Acestea sunt mai degrab constructe care aa cum vom vedea pot fi utilizate pentru a nelege i a explica o serie de fenomene observate. Aceste constructe ipotetice nu trebuie vzute ca o critic a abordrii factoriale. Utilizarea constructelor ipotetice constituie o practic obinuit n multe domenii ale tiinei. De exemplu, fizicienii utilizeaz o serie de constructe (gravitate, magnetism) pentru a explica o serie de fenomene. Aceste fore reprezint de fapt constructe neobservabile, a cror existen a fost inferat pe baza fenomenelor observabile. Aceste constructe, mpreun cu teoriile care le nsoesc pot explica o serie de fenomene observabile. ntr-o manier asemntoare, analiza factorial postuleaz c exist atribute interne neobservabile care pot explica variaia i covariaia dintre o serie de atribute de suprafa, adic acele atribute care pot fi msurate i observate direct.
Un concept teoretic central al analizei factoriale l constituie deci relaia dintre atributele interne i cele de suprafa. Principiul de baz este acela c atributele interne influeneaz sistematic atributele de suprafa. Acest fapt implic ideea c atunci cnd avem o msur a unui atribut de suprafa, aceast msur
50
este, cel puin n parte, rezultatul influenei atributelor interne. De exemplu, scorul obinut de o persoan la un test de adunare (atribut de suprafa) este influenat de aptitudinea numeric (atribut intern). Tradiional, aceste relaii dintre atributele de suprafa i cele interne sunt considerate a fi lineare. n continuare este util s distingem ntre 2 tipuri de atribute interne sau factori: factori comuni i factori specifici. Factorul comun este definit ca un atribut intern care afecteaz /influeneaz mai mult de o variabil de suprafa. De exemplu, dac factorul aptitudine numeric influeneaz mai mult dect o variabil de suprafa (s presupunem c influeneaz att adunarea ct i nmulirea) atunci acesta factor este un factor comun. Factorii specifici influeneaz doar o singur variabil de suprafa; astfel poate exista un numr de factori specifici pentru fiecare variabil de suprafa. Prin schimbarea variabilelor de suprafa factorul comun se poate transforma n factor specific dac se nltur toate variabilele de suprafa care l alctuiesc, mai puin una; sau dimpotriv, dac lrgim bateria, un factor specific se poate transforma ntr-un factor comun dac el influeneaz mai multe variabile de suprafa. n afara celor 2 variabile interne (factorii comuni i specifici) care influeneaz variabilele de suprafa, exist o a treia influen asupra acestora. Aceast a treia influen o constituie erorile de msur asociate observrii atributelor de suprafa. Aceste erori sunt reprezentate n analiza factorial ca factori adiionali, dei ele nu fac parte din cadrul atributelor interne; adic nu reprezint caracteristici neobservate ale indivizilor. Mai degrab erorile de msur apar ca rezultat al influenelor datorate msurtorii atributelor de suprafa. Se poate observa relaia direct ntre factorii de suprafa i erorile de msur; astfel, cu ct fidelitatea msurtorilor este mai mare cu att erorile sunt mai mici. Deci, utilizarea unor teste mai puin fidele va influena erorile de msur, dar nu n mod necesar factorii comuni sau specifici. De asemenea, adugarea sau nlturarea unor variabile de suprafa va influena factorii comuni sau specifici, ns nu va influena erorile de msur. Factorii specifici i erorile de msur caracteristice unui set de observaii se pot combina rezultnd factori unici. Un factor unic este alctuit dintr-un factor specific caracteristic unei singure variabile de suprafa precum i din eroarea de msur asociat variabilei de suprafa respective. Factorul unic se va modifica la orice modificare a factorului specific sau a erorii de msur. Pornind de la aceste definiii ale factorilor, innd cont de faptul c factorii influeneaz atributele de suprafa se poate nelege c factorii se combin pentru a putea explica un anumit nivel al trsturilor de suprafa. Mai precis, orice nivel al atributelor de suprafa poate fi vzut ca o rezultant a factorilor relevani. De exemplu, scorul unei persoane la un test de adunare poate fi vzut ca o rezultant a factorului comun aptitudine numeric i a factorului specific asociat adunrii. De asemenea, eroarea de msur contribuie la scorul obinut la testul de adunare. Generaliznd putem spune c diferenele individuale sau variana atributelor de suprafa poate fi atribuit factorilor adiaceni acestor atribute. Astfel diferenele la nivelul atributelor de suprafa sunt datorate diferenelor la nivelul factorilor ce influeneaz aceste atribute i de asemenea diferenele sunt datorate i erorilor de msur. Distincia realizat anterior ntre factorii comuni, specifici i eroarea de msur ne ajut s nelegem modul n care factorii explic variana atributelor de suprafa. Este important de reinut faptul c variana observat la nivelul atributelor de suprafa poate rezulta din trei surse. O parte din varian este datorat influenei factorilor comuni aceasta poart numele de varian comun sau comunalitate. O alt parte din variana atributelor de suprafa poate fi datorat factorului specific aceast varian este denumit varian specific sau specificitate. Cea de-a treia surs de varian este datorat erorilor de msur i este denumit variana erorii de msur. Variana specific este adesea combinat cu variana erorii de msur i formeaz variana unic sau unicitatea. Altfel spus, variana observat la nivelul unui atribut de suprafa este datorat n parte factorilor care influeneaz i alte atribute de suprafa i n parte factorilor care influeneaz doar atributul respectiv. Printr-o extensie a conceptelor putem spune c analiza factorial ine cont i de covariana dintre variabilele de suprafa. Adesea se poate observa c variabilele de suprafa dintr-un domeniu specific tind s coreleze ntr-o anumit msur una cu cealalt. Potrivit analizei factoriale aceast corelaie este datorat influenei factorilor comuni. Deci, o corelaie ntre dou variabile de suprafa este datorat dependenei celor dou variabile de unul sau mai muli factori comuni. De exemplu scorul la un test de adunare va tinde s coreleze pozitiv cu scorul la un test de nmulire deoarece ambele variabile depind de acelai factor comun aptitudinea numeric. Din contr ns, rezultatul la testul de adunare va corela mai puin cu rezultatul la un test de citire deoarece cele dou variabile de suprafa sunt influenate de factori comuni diferii. Putem spune c nivelul de intercorelaie dintre atributele de suprafa este rezultatul dependenei acestor atribute de aceiai factori comuni. Este extrem de important a se reine faptul c doar factorii comuni pot explica corelaia variabilelor de suprafa; factorii unici nu determin astfel de corelaii. La fel, factorii specifici sau erorile de msur nu
51
pot determina corelaii ntre atributele de suprafa deoarece prin definiie ei influeneaz doar o singur variabil de suprafa. Pentru a sumariza aceste principii putem spune c ntr-un anumit domeniu exist un numr mic de factori comuni care influeneaz un vast numr de atribute de suprafa. Variaia factorilor de suprafa este datorat n parte variaiei factorilor comuni. Ceea ce rmne se datoreaz factorilor unici sau factorilor specifici i erorilor de msur. Covariana variabilelor de suprafa este atribuit dependenei acestora de aceiai factori comuni. n continuare (figura 5) vor fi prezentate conceptele i principiile discutate anterior n forma propus de Tucker (1940) pentru a ilustra teoria analizei factoriale. n cadrul diagramelor, ptratele reprezint atributele de suprafa, iar cercurile reprezint atributele interne i ali factori. Sgeile unidirecionale exprim o relaie liniar (printr-un proces cauzal), iar cele bidirecionale reprezint corelaii fr influen cauzal.
Factori comuni (atribute interne)
Atribute de suprafa
Factori specifici (atribute interne)
Factori unici
Factori ERM
Figura 2.11. Relaia dintre atributele de suprafa i cei trei tipuri de factori
! DE REINUT:
Teoria factorial este o teorie care explic dinamica i influenele care determin variaia i covariaia atributelor de suprafa. 52
Obiectivele analizei factoriale 1. Identificarea factorilor adiaceni variabilelor de suprafa Obiectivul primar ala analizei factoriale este acela de a determina umrul i natura factorilor comuni precum i modul n care acetia influeneaz atributele de suprafa. Prin identificarea factorilor care explic un mare numr de variabile se pot nelege mai bine datele de care dispunem. De exemplu o companie aerian dorete s studieze aproximativ 50 de variabile pe care le consider importante din puntul de vedere al consumatorului care trebuie s opteze pentru o companie (variabilele pot fi: respectarea orelor de aterizare /decolare, flexibilitatea orarului, amabilitatea personalului de zbor, facilitile oferite n timpul zborului, etc.). Dac pe baza analizei factoriale aceste 50 de variabile pot fi explicate pe baza unor factori vom nelege mai bine variabilele fundamentale care stau la baza alegerii fcute de consumator. 2. Screeningul variabilelor O a doua utilizare a analizei factoriale se refer la analiza pe baz de screening a variabilelor care ulterior pot fi incluse n investigaii statistice ca analiza de regresie. Deoarece analiza factorial identific grupe de variabile care sunt corelate ntre ele putem opta la alegerea unei singura variabile din fiecare factor i includerea acestei variabile ntr-o ecuaie de predicie. 3. Sumarizarea datelor O alt aplicaie a analizei factoriale se refer la flexibilitatea de a extrage ci factori se dorete dintr-un set iniial de variabile. Primii factori extrai dintr-un set de variabile explic cea mai mare parte din variana acestora; cu fiecare extragere ulterioar se obine tot mai puin. 4. Selecia variabilelor AF ne permite extragerea factorilor diferii dintr-un set de variabile. De exemplu dac se pune problema selecie caracteristicilor definitorii ale unui automobil n vederea construciei unei reclame ne intereseaz s pstrm un numr de variabile rezonabil pentru a putea construi reclama. Este important ns ca acest variabile selectate s nu se refere la acelai factor, ele trebuind s nu coreleze ntre ele. Lund n considerare aspectele prezentate privind validitatea unui test psihologic, se poate spune c trebuie s avem ntotdeauna n vedere funcia i scopul pe care le va avea testul pentru a putea aprecia corect tipurile de validitate. Exemplul (tabelul 7) urmtor ilustreaz modul n care putem privi validitatea unui test de cunotine la matematic (Anastasi, 1976): Tabelul 2.7. Tipuri de validitate a unui test de cunotine matematice. (Anastasi, 1976). SCOPUL TESTRII PROBLEMA STUDIAT elevul TIPUL DE VALIDITATE din Validitate de coninut
Evaluarea cunotinelor de Ct de mult a nva matematic n ciclul primar matematica predat?
Anticipare a performanelor Care vor fi performanele elevului n Validitate predictiv elevului n gimnaziu gimnaziu la matematic? Psihodiagnosticul dificultilor Care sunt dificultile specifice pe care le Validitate concurent de nvare ntmpin elevul n nvarea matematicii Evaluarea gndirii logice Prin ce elevului? se caracterizeaz gndirea Validitate de construct
! Obiectivele analizei factoriale sunt:

Identificarea factorilor adiaceni variabilelor de suprafa Screeningul variabilelor Sumarizarea datelor Selecia variabilelor
53
1. Care sunt aspectele eseniale de care trebuie s inem cont cnd formulm un item? 2. Ce sunt itemii dihotomici i care sunt avantajele i dezavantajele lor? 3. Ce sunt itemii polinomici i care sunt avantajele i dezavantajele lor? 4. Ce sunt scalele Likert? 5. Ce este o scal categorial? 6. Ce reprezint Q Sort? 7. Care este procesul pe baza cruia se realizeaz analiza factorial? 8. Ce reprezint analiza calitativ de itemi? 9. Ce reprezint analiza cantitativ de itemi? 10. Care sunt obiectivele analizei factoriale?
Sumar
Atunci cnd dorim s evalum ceva, prima ntrebare pe care ne-o formulm este ce anume dorim s evalum, care este formatul pe care trebuie s-l aib itemii, astfel nct s ne ofere imagine acurat a aspectului care ne intereseaz. Pentru a construi itemii trebuie s parcurgem un proces pretenios n cazul cruia trebuie s urmm o serie de pai. Mai mult dect att, trebuie s inem cont i de formatul opiunilor de rspuns. Astfel, n funcie de constructul pe care dorim s-l evalum anumite formate devin mai mult sau mai puin adecvate. Pentru a putea spune despre un item c este bun sau nu trebuie s inem cont de o serie de criterii pe care le descoperim n urma unei analize a itemilor. Aa dup cum putem analiza un test din prisma fidelitii i validitii, la fel putem analiza conform acestor criterii un item. Mai precis, un item bun discrimineaz ntre dou categorii de subieci; putem spune de asemenea c un item este bun dac performana la item coreleaz cu performana la test. Un element foarte important este validitatea de construct care reprezint msura n care se poate susine c testul msoar o variabil sau o trstur specific. Una dintre metodele utilizate n validara de construct este analiza factorial. Analiza factorial este definit ca un set de proceduri matematice utilizate pentru a identifica dimensiunile care stau la baza uneui set de msurori empirice.
54
Exerciii 1. Mai jos sunt prezentate descrierile ctorva studii de validare. Citii fiecare descriere i identificai orice probleme poteniale care ar putea afecta rezultatele. A. Un profesor de matematic de la un liceu, face un test pentru a identifica elevii supradotai la matematic i aplic acest test la o sut de elevi din coal. Cei care vor obine cel mai mare punctaj la test vor avea posibilitatea s se nscrie la facultate. La sfritul semestrului, profesorul face o corelaie ntre scorul obinut la test i notele obinute de elevi la matematic. El nu a gsit nici o corelaie semnificativ ntre aceste variabile. B. Un psiholog industrial face un test pentru a selecta personal pentru un serviciu cleric la o anumit corporaie i cere supraveghetorilor s noteze muncitorii prezeni pe o scal cu urmtoarele categorii : peste medie, mediu, sub medie. Dup aceasta psihologul testeaz muncitorii din categoria peste medie i sub medie i compar mediile celor dou grupuri. n urma analizei psihologul gsete o diferen semnificativ n favoarea grupului peste medie. 2. Pentru fiecare din urmtoarele situaii indicai ce tip de studiu de validare ar fi cel mai potrivit. A. Un psiholog social dezvolt un inventar cu scopul de a identifica peroanele care lucreaz n domeniul sntii care prezint sindromul de epuizare (burnout). Pentru a defini sindromul de burnout se utilizeaz o varietate de comportamente cum ar fi: absenteismul, eec n a respecta politica firmei, relaii reci cu colegii i efii etc. B. Un psiholog al dezvoltrii specializat n problemele adolescenilor dorete s dezvolte un inventar care s se adreseze elevilor din clasele IX X pentru a prezice cine va trece mai departe n clasele XI-XII. C. Un test de aptitudini non-verbale este dezvoltat pentru copiii precolari cu deficit de auz. Se intenioneaz ca testul s fie o msur de screening pentru identificarea copiilor care ar putea avea dificulti n nvarea cititului (ncadrai ntr-o clas cu copii normali). Bibliografie obligatorie Urbina, S. (2010). Testarea psihologic, Editura Trei. Bibliografie facultativa
Albu, M. (1998). Construirea i utilizarea testelor psihologice, Editura Clusium. p 170-173 Kaplan, R.M. i Saccuzzo, D.P. (2001) Psychological Testing, Principles, Applications and Issues, Wadsworth Thomson Learning, Fifth Edition. p 133-135 Stan, A. (2002). Testul psihologic. Evoluie construcie, aplicaii. Editura Polirom, P 202-242
55
VI. ASPECTE METODOLOGICE I CONCEPTUALE ALE CONSTRUCIEI TESTELOR
Titlul i numrul modulului 6. Aspecte metodologice i conceptuale ale construciei testelor psihologice Scopul i obiectivele: obiectivul esenial al acestui modul este ca studenii s poat face diferena ntre evalurile psihologice, acestea fiind diferite cel puin n cazul a trei aspecte.

Vei diferenia ntre tipurile de evaluare psihologic Vei ti care este algoritmul de construcie al unui instrument de evaluare Vei putea enumera tipurile de scale utilizate
Vei recunoate aspectele care in de coninutul manualului unui test
Scurt recapitulare a conceptelor prezentate anterior
Atunci cnd dorim s evalum ceva, prima ntrebare pe care ne-o formulm este ce anume dorim s evalum, care este formatul pe care trebuie s-l aib itemii, astfel nct s ne ofere imagine acurat a aspectului care ne intereseaz. Pentru a construi itemii trebuie s parcurgem un proces pretenios n cazul cruia trebuie s urmm o serie de pai. Mai mult dect att, trebuie s inem cont i de formatul opiunilor de rspuns. Astfel, n funcie de constructul pe care dorim s-l evalum anumite formate devin mai mult sau mai puin adecvate. Pentru a putea spune despre un item c este bun sau nu trebuie s inem cont de o serie de criterii pe care le descoperim n urma unei analize a itemilor. Aa dup cum putem analiza un test din prisma fidelitii i validitii, la fel putem analiza conform acestor criterii un item. Mai precis, un item bun discrimineaz ntre dou categorii de subieci; putem spune de asemenea c un item este bun dac performana la item coreleaz cu performana la test. Un element foarte important este validitatea de construct care reprezint msura n care se poate susine c testul msoar o variabil sau o trstur specific. Una dintre metodele utilizate n validara de construct este analiza factorial. Analiza factorial este definit ca un set de proceduri matematice utilizate pentru a identifica dimensiunile care stau la baza uneui set de msurori empirice.
Structura logic a modulului 1. Aspectele care difereniaz evalurile psihologice 2. Algoritmul de construcie al unui instrument 3. Tipuri de scale 4. Coninutul manualului unui test Coninutul informaional detaliat
56
ASPECTE CONCEPTUALE I METODOLOGICE ALE CONSTRUCIEI TESTELOR PSIHOLOGICE Evalurile psihologice nu sunt echivalente. Ele difer n cel puin trei aspecte. n primul rnd ele difer din punctul de vedere al ntrebrilor teoretice la care ncearc s rspund. n al doilea rnd ele difer n privina structurii logice. Iar n al treilea rnd ele difer din perspectiva informaiilor pe care ele le aduc, sau mai precis din perspectiva greutii inferenelor pe care aceste le suport. Algoritmul de construcie al unui instrument de evaluare ar trebui s respecte urmtorii pai 1. POSTULATE Asumpii, valori, credine, metafore
2. CONSTRUCTE TEORETICE FORMALE Constructe ipotetice, procese, relaii, predicii (e.g. memorie implicit, anxietate, depresie)
3. REFERENTI Msuri obiective sau reflecii ale constructelor (e.g. anxietate: transpiraia palmelor, etc.)
4. METODE INSTRUMENTALE Sarcini, tehnici, teste, instrumente proceduri
5. MODEL DE MSUR atribuirea unei scale de msur fenomenelor
6. CULEGEREA DATELOR
7. ANALIZA DATELOR metode statistice, modele matematice
8. INTERPRETRI I INFERENE Inferena statistic, evaluare logic, analiza modelului

Figura 1. Componente ale unui model tiinific de construcie a unui intrument de evaluare (McFall & Townsend, 1998)
57
Scopul oricrei evaluri psihologice este acela de a clarifica (de a oferi informaii) o serie de Nivelul de plecare n construcia unui instrument de evaluare se esenial ntre teorie probleme, fie ele teoretice sau practice. Astfel putem spune c exist o relaie gsete la nivelul i postulatelor care servete ca punct fundmental (Polya, 1957, unor ntrebri teoretice. sunt simplu evaluare: evaluarea trebuei astfel construit nct s rspund Smith, 1984). Postulatele tratate ca ceva ce este dat. O dat stipulate ns ele constrng tot procesul ulterior, intrun mod adesea foarte subtil (Lakoff & Johnson, 1980). Nivelul urmtor cuprinde constructele teoretice formale. Acest nivel trebuie s fie congruent cu postulatele anterioare deoarece deriv logic din acestea. Cu toate acestea ns exist o multitudine de teorii plauzibile care pot satisface postulatele nct cercettorii trebuie s ia n calcul o serie de aspecte legate de validitatea teoriilor care adesea sunt n competiie. Este vorba deci de a opta, pe baza unei analize de cele mai multe ori dificile, pentru o teorie innd cont de atuurile acesteia n competiia cu altele. Personalitatea ca i construct glogal sau temperamentul ca i construct mai specific pot fi abordate din perspectiva mai multor teorii. Opiunea pentru o teorie a personalitii se face, n construcia unui instrument de evaluare, la acest nivel al constructelorteoretice formale. Procesul de validare al unui test ncepe la nivelul constructelor teoretice prin formularea constructelor derivate dintr-o teorie, din cercetri anterioare sau din observaii sistematice ale unui domeniu relevant de comportamente. Itemii testului vor fi mai trziu (la nivelul referenilor) formulai, astfel nct s ating cerinele formulate la acest nivel. La acest al doilea nivel pe care l-am putea denumi acela de conceptualizare al testului trebuie s ne punem urmtoarele ntrebri: Ce dorim s msoare testul? Aceast ntrebare este legat de modul n care este definit constructul i de cum aceast definiie este diferit de altele care i propun s msoare acelai construct. Care este obiectivul testului? Cnd sau pentru ce scop va fi utilizat testul? Va fi analizat la acest nivel n ce msur obiectivul testului este diferit de testele existente. Este nevoie de construcia acestui test? Cine va utiliza testul? Clinicienii, psih. educaional sau alte categorii. Cui se adreseaz testul? Cine este populaia int. Aici se impune o analiz detaliat a caracteristicilor populaiei (vrst, sex, mediu socioeconomic ce factori culturali pot influena performana la test). Ce nivel de citire este necesar pentru aplicarea testului. Cel de al treilea nivel, al referenilor, cuprinde msurtori observabile ale constructelor formulate. Astfel, constructul de anxietate se poate exprima la nivelul referenilor prin msurtori ale conductanei electrice a pielii, prin rata cardiac, etc. Pentru ca datele de la nivelul anterior s poat fi culese avem nevoie de o serie de medode instrumentale. Este vorba de generarea unor msurtori, care n cadrul testului adesea iau forma itemilor. Itemii (vezi modulul 1) unui test sunt: n majoritatea cazurilor generai de psihologi pornind de la constructele formulate; n cazul testelor de cunotine itemii sunt formulai de specialiti n domeniul respectiv; Pot fi luai din testele existente. n general, este generat un numr mai mare de itemi dect numrul final al itemilor testului, crendu-se banca de itemi. Aiken (1994) recomand ca numrul itemilor de plecare s fie mai mare cu 20% dect lungimea tesului.
58
Msurrile sunt realizate pe diferite tipuri de scale. Acest problematic a alegerii scalei sau a formatului itemlor se ncadreaz la nivelul modelului de msurare. Nu exist un tip general corect de scal de msurare. Tipuri de scale. Scala de tip Likert. Este o scal sumativ (propus de Likert n 1932) utilizat destul de des n psihologie mai ales n msurarea atitudinilor. Este o scal ordinal (distana dintre 2i 3 nu este ntotdeauna egal cu distana dintre 4 i 5) Format: niciodat rareori cteodat adesea ntotdeauna Are 5 trepte Dezavantaje: nu exist o interpretare identic pentru fiecare subiect aceea ce nseamn fiecare categorie prezentat. Scalele Guttman Cnd se dorete ierarhizarea unor comportamente. Se prezint comportamentele i cere ierarhizarea acestora prin atribuirea de numere (de la 1 la X, pentru X comportamente) Nivelul culegerii datelor se refer la obinerea unei variante a testului i aplicarea acesteia pe populaia int. Se in cont n aceast faz de condiiile de standardizare. Analiza datelor cuprinde n cadrul testului procesul de analiz a itemilor, analiza tipurilor de validitate de criteriu precum i aprecierea fidelitii testului. Dac rezultatele obinute sunt satisfctoare se trece la construirea manualului testului. Dac pe baza rezultatelor obinute nu se pot face inferene valoroase atunci se recomand identificarea erorilor i reluarea procedeului. Manualul unui test trebuie s cuprind aspectele pe baza crora utilizatorul testului s poat analiza valoarea testului, s poat utiliza testul i s poat interpreta rezultatele acestuia. Aceste aspecte se refer la informaii legate de:
1. Datele de identificare ale testului - autorul (autorii) testului - editura care a publicat testul - anul publicrii - numele testului 2. Standardizarea testului - pe cte persoane a fost etalonat testul - care sunt caracteristicile demografice ale eantionului - cum s-a fcut eantionarea 3. Fidelitatea testului - care au fost metodele utilizate pentru estimarea fidelitii testului - n ce msur valorile coeficienilor de fidelitate sunt sufiecte pentru scopul testului 4. Validitatea testului - care au fost criteriile pe baza crora s-a validat testul - n ce msur testul este satisfctor pentru ceea ce i propune s msoare 5. Modul de aplicare, cotare i interpretare a rezultatelor - care sunt instruciunile de lucru - care sunt criteriile de acordare a punctajului pentru rspunsurile subiecilor? - n ce msur testul poate fi cotat electronic (acolo unde este cazul)
59
6. Consideraii practice - ct timp dureaz aplicarea testului care este nivelul de pregtire pe care trebuie s l aib cel care administreaz testul i cum se poate obine aceast pregtire.
60
1. Care sunt paii algoritmului de construcie al unui instrument de evaluare? 2. Care este scopul oricrei evaluri psihologice? 3. Ce ntrebri trebuie s ne punem la nivelul de conceptualizare al testului? 4. La ce se refer nivelul de culegere al datelor?
Sumar
Evalurile psihologice nu sunt echivalente. Ele difer n cel puin trei aspecte. n primul rnd ele difer din punctul de vedere al ntrebrilor teoretice la care ncearc s rspund. n al doilea rnd ele difer n privina structurii logice. Iar n al treilea rnd ele difer din perspectiva informaiilor pe care ele le aduc, sau mai precis din perspectiva greutii inferenelor pe care aceste le suport. Pentru construcia unei scale trebuie s se respecte un algoritm. Un element foarte important l reprezint manualul testului.
Bibliografie modul
Kaplan, R.M. i Saccuzzo, D.P. (2001) Psychological Testing, Principles, Applications and Issues, Wadsworth Thomson Learning, Fifth Edition. p 529-563
61
III. Anexe Bibliografia complet a cursului : Obligatorie: 1. Suportul de curs, Psihodiagnostic 2. Capitolele aferente tematicii de mai sus din urmtoarele surse: Albu, M. (1998). Construirea i utilizarea testelor psihologice, Editura Clusium. Messick, S. (1995). Validity of Psychological Assessment. Validation of Inferences From Persons' Responses and Performances as Scientific Inquiry Into Score Meaning. American Psychologist, September 1995 Vol. 50, No. 9, 741-749. Stan, A. (2002). Testul psihologic. Evoluie construcie, aplicaii. Editura Polirom. Urbina, S. (2010). Testarea psihologic, Editura Trei.
Facultativ: - Anastasi, A. (1988). Psychological Testing. (6th ed). New York: Macmillan. - Murphy,K & Davidshofer, C. O. (1994). Psychological testing: Priciples and applications (3rd ed). Englewood Cliffs, NJ: Pretince Hall. - www.rash.org
62
Increasing the Validity of Adapted Tests: Myths to be Avoided and Guidelines for Improving Test Adaptation Practices1,2 Ronald K. Hambleton and Liane Patsula University of Massachusetts at Amherst Adapting or translating achievement, ability, and personality tests and questionnaires prepared in one language and culture into other languages and cultures has had a long history in educational and psychological testing though this fact is not well-known among educational researchers and measurement specialists. At least five reasons can be found in the literature for adapting tests: 1. very often adapting a test is considerably cheaper and faster than constructing a new test in a second language, 2. when the purpose for the adapted test is cross-cultural or cross-national assessment (such as with many credentialing exams), an adapted test is the most effective way to produce an equivalent test in a second language, 3. there may be a lack of expertise for developing a new test in a second language, 4. there is a sense of security that is associated with an adapted test more so than a newly constructed test especially when the original test is well-known, and 5. fairness to examinees often results from the presence of multiple language versions of a test (see Hambleton & Patsula, 1998). Unfortunately, though the practice of adapting or (simply) translating tests can be traced to the intelligence tests of the French psychologist Alfred Binet at the beginning of this century, there is substantial evidence to suggest that improved methods for adapting or translating tests from one language and culture to others are needed, and that considerably more attention should be given to this important task than it is typically given by researchers and/or test developers. Too often in practice the test adaptation process seems to be viewed as a routine task that can be completed by anyone who knows the relevant languages. One consequence is adapted tests in the target languages of interest with only superficial equivalence to the tests in the source language. The purposes of this paper are two-fold: First, a set of myths or problems which need to be discarded/overcome about the test adaptation process will be presented. These myths are widespread and undermine effective test adaptation initiatives. Second, steps for adapting tests will be offered along with a discussion of the importance of each step in the test adaptation process. Myths About Adapting Tests There are a number of myths associated with adapting tests which appear in measurement practice and should be discarded as quickly as possible: Myth 1. The preferable strategy is always to adapt an existing test rather than develop a new test for a second language group.
63
There are many good reasons for adapting a test, but there are reasons for not proceeding with a test adaptation as well. Especially when cross-cultural comparisons are not of interest, it may be substantially easier and more relevant to construct a new test for a second language group. This avoids any complications with copyright, insures that the format will be suitable, and any desired modifications in the definition of the construct of interest can be made at the outset of the test development process. Sometimes, too, it may be desirable not to adapt a test but rather to require all examinees to take a test in a single language. For example, in the United States, there has been interest in some states in making high school graduation tests available in both English and Spanish. Technically this is possible, but the question of whether or not to make two language versions of a test available depends on many factors including the definition of the construct being measured. Is the language in which performance is to be demonstrated a part of the construct definition or not? In the case of reading, reading in the language of English is almost always part of the construct of interest. Producing a Spanish equivalent version of a reading test in English makes very little sense because inferences of English reading proficiency cannot be made from a test administered in Spanish. The situation with a mathematics test may be very different. The construct of interest may be focused on computation skills, concepts, and problem-solving skills and here, the purpose of the test is to look for a demonstration of the skills, and the language in which the performance is assessed and demonstrated may be of little or no interest. Of course, if the desired inference is mastery of mathematics skills when the test questions are presented in English, then a Spanish version of the test would be inappropriate in this situation too. Myth 2. Anyone who knows the two languages can produce an acceptable translation of a test. This is one of the most troublesome myths because it results in unqualified persons adapting tests. There is considerable evidence suggesting that test translators need to be familiar with both source and target languages and the cultures, and they need to be generally familiar with the construct being assessed, and the principles of good test development practices. How, for example, can someone translate a high school physics test from English into Spanish without some knowledge of the content? Would a translator with little knowledge of test development principles be aware to preserve the relevant features of the original test in an adapted test such as clearly written item stems, a single correct or best answer, answer choices of approximately the same length, etc.? Myth 3. A well-translated test guarantees that the test scores will be valid in a second language or culture for cross-language comparative purposes. Van de Vijver and Poortinga (1997) make the point that not only should the meaning of a test be consistent across persons within a language group and culture but, that meaning, whatever it is, must be consistent across language groups and cultures. For example, if a test is more speeded in a second language version because of the nature of that language, then the two language versions of the test are not equally valid. We have encountered just such a problem in some German test translations we are
64
currently working on. Quite simply, the German words are longer than English words and take correspondingly longer to read. The result is a slightly more speeded German version of the test. In this instance, the test may be equally valid in each language group and culture, but still not be suitable for cross-cultural comparisons. Many other examples could be introduced. For one, the non-equivalent familiarity of students in different cultures with certain item formats, e.g., the multiple-choice format, places examinees from this second cultural group at a serious disadvantage. The translation could be excellent, but the scores from the two language versions are not equally valid. Myth 4. Constructs are universal, and therefore all tests can be translated into other languages and cultures. One of the best counter examples of this myth concerns intelligence tests. The Western notion of intelligence places considerable emphasis on speed of response. In some cultures, speed of response is of minor importance as a operating characteristic for life, and members of these cultural groups often score lower on Westernized intelligence tests because of a failure to perform quickly. But, it only in this limited sense of the Western definition of the construct of intelligence that these cultural groups appear of less intelligence. By another definition, perhaps one that devalues speed of response and emphasizes other human attributes of intelligence (see Sternberg and Gardner (1983) for broader definitions of intelligence which incorporate, for example, social and artistic skills) the results would be opposite. There is currently considerable interest in cross-cultural comparisons of quality of life. It is interesting to discover that the construct associated with quality of life in this country is often very different in other countries and this makes cross-cultural comparisons very different. Televisions, portable telephones, personal computers, the great outdoors, and college sports are of no importance and do not affect the quality of life for persons in many other cultures. Cross-cultural comparisons of quality of life are difficult to carry out because the construct may have very different meanings across cultures. Myth 5. Translators are capable of finding flaws in a test adaptation. Field testing is not usually necessary. This is another of the major myths about adapting tests. There are literally thousands of examples of poorly adapted test items in the literature, and many of the items in these tests were approved by translators. The fact is translators are not able to anticipate all of the problems encountered by examinees taking a test in a second language. One of the best examples because it was discovered on an international comparative study of reading achievement (and a study where the American students were about the middle of 20 countries) is the following: Determine whether these two words are similar or different--
65
p e s s i m i s t i c s a n g u i n e In the English version of the test item, only about 54% of the American students were able to determine the correct response (a performance level slightly above chance) which is that the two words have a different meaning. In a second language version, the item was adapted as follows-p e s s i m i s t i c o p t i m i s t i c
66
In the foreign language version of the test item, almost 100% of the examinees answered the item correctly. Clearly, a poor translation had made the test item considerably easier. The reason given was that the word "sanguine" had no equivalent word in the second language and therefore another word was chosen which too, had a different meaning to pessimistic. Interestingly, this easier version of the test item was used in the country which finished number one among the 20 countries. One wonders what role this item and other improperly adapted test items played in the final rankings of the 20 countries. In summary, all of the myths can seriously compromise the validity of a test in a second language or cultural group, or negatively influence the validity of adapted tests for use in cross-language comparison studies. Fortunately, each myth is straightforward to address in practice. What follows are steps for adapting tests which should eliminate all of the myths and other shortcomings in test adaptation methodology. Steps for Adapting Tests The International Test Commission (ITC) guidelines (Hambleton, 1994; van de Vijver & Hambleton, 1996) provide an excellent framework to guide researchers in the test adaptation process. Appendix A contains a copy of those guidelines. The following steps for adapting a test from one culture and/or language for use in another are a mixture of findings and recommendations from the ITC guidelines and many empirical studies (e.g., Angoff & Cook, 1988, Prieto, 1992; Hambleton, 1994). Geisinger's (1994) work in cross-cultural assessment was especially influential in our thinking about the topic of steps for adapting tests. The steps are still evolving. Through the application of the steps in different contexts new insights will be gained and certain additions, deletions, and clarifications may be necessary. Step 1 Ensure that construct equivalence exists in the language and cultural groups of interest. Assess whether construct equivalence exists between the cultures of interest and if it does not, either consider "decentering" (that is, revising the definition of the construct to be equally equivalent in each language and cultural group) or discontinue the project. The publication by Harkness (1998) is especially helpful in the study of construct equivalence. Central questions are as follows: Does the particular construct that a researcher (e.g., the content domain for a credentialing exam) is interested in measuring exist in both cultures? Does it make sense to compare these two cultures on this construct? Would any cross-cultural comparison on this construct be meaningful? Does the construct that is being measured mean the same thing in all cultures being compared? Researchers familiar with both languages and cultures are in a strong position to make judgments about construct equivalence between cultures. One can also judge whether cross-cultural construct equivalence exists by interviewing or observing people from the cultures of interest, researching the cultures of interest, asking others who know about the cultures, or visiting people in the culture.
67
Suggestions: 1. Through discussions with psychologists and other knowledge persons in each culture, determine if the construct exists, and if the same definition applies equally well in both language and cultural groups. Step 2 Decide whether to adapt an existing test or develop a new test. Consider the purpose of the adapted test, and the advantages and disadvantages of adapting an existing test rather than developing a new test. It is clear too that some tests will be more amenable to translation into certain languages than others (Ahluwalia, 1990, p. 20). The more similar the target language and/or culture are to the source language and/or culture, the easier will be the adaptation (thus, English to Spanish adaptations may make more sense than English to Arabic or English to Chinese adaptations). With tests intended for cross-cultural comparisons, test adaptation (possibly with some decentering) may be the only option. But when crosscultural comparisons are not of interest, it may be easier to actually produce a new test that meets the cultural parameters in the second language group, than to adapt an already existing test which may have a number of shortcomings (e.g., a less than satisfactory definition of the construct, inappropriate item formats, use of some cultural specific content, etc.). The standards with which to evaluate whether to adapt an existing test require some level of expertise in measurement, some knowledge of the relevant literature of the original test, and some knowledge of the language and culture to which the test is being adapted. Suggestions: 1. Consider the purpose of the adapted test, and carefully consider the advantages and disadvantages of adapting a test versus constructing a new test. Step 3 Select well-qualified translators. This is often one of the major shortcomings of a test adaptation project. Two points can be made: First, in selecting translators, search for persons who are fluent in both languages and who are very familiar with the cultures under study, and who have some knowledge of test construction and the construct being measured. As knowledge of test construction practices is not common among translators, this may be addressed with some training prior to initiating the test adaptation process. Adding a psychometrician to the mix may be desirable, too. Second, some researchers have found that panels or committees of people translate the test better than individuals. Committees produce pooled adaptations that are often more accurate than translations from a single translator. Suggestions:
68
1. Seek out translators with language proficiency, knowledge of the relevant cultures, and some subject matter knowledge/knowledge of the construct of interest. 2. Involve more than one translator in the process to provide a mix of perspectives and to enable checking to be conducted. Step 4 Translate and adapt the test. One approach to increasing the likelihood of a valid test adaptation is to adopt one of the two (or both) standard designs: forward- and back-translation. Forward translation designs are the most technically sound because the focus of the review is on both the source and target language versions of the test. Backward translation designs can also be revealing of poor translations but without a focus on the target language version of the test, problems in the adaptation can be missed. For example, with a hard-totranslate concept like "ice hockey" into Chinese, these English words may be used in the adapted version. They are very easy to back translate, but they may be quite meaningless in the target language version of the test. Suggestions: 1. Use a forward translation design but a backward translation design can be useful too, but not as the only design. Step 5 Review the adapted version of the test and make necessary revisions. In a forward translation design, another set of translators examine the adapted version of the test for any errors that may lead to differences in meaning between the two language versions. The group of translators' focus at this point would be on the quality of the translation or adaptation of the test. As Geisinger (1994) suggests, this review can be accomplished in a group meeting, individually, or by some combination of individual and group work. Geisinger believes that the most effective strategy is to first have the translators review the items and react in writing and then to have the individuals share their comments with one another and to reconcile any differences in opinion and make any changes in the original and/or adapted language versions as necessary. The National Institute for Testing and Evaluation in Israel is responsible for adapting college admissions tests into five languages from the original Hebrew-language version. One special feature in their process is that their translators work from the translated version first and attempt to determine the validity of the questions: For example, is the stem clear? Is there a single correct answer? Are there grammatical clues that lead the test-wise candidate to the correct answer? After it is determined that the test items can stand on their own merits, then the equivalence of the adapted version and the original Hebrew version are compared. Translators look at several features of the adapted items: accuracy of the translation as well as the clarity of the sentences, the level of difficulty of the words, and the fluency of the translation. With a backward translation design, translators would take the adapted version of the test, back translate to the source language, and then judgments would be made about the equivalence of the original and back-translated versions of the test. Where non-
69
equivalence is identified, changes in the adapted version of the test are considered. The idea is that if the adaptation has been effective, the back-adapted version of the test should look very much like the original. Of course, when the adaptation involves format changes, time changes, and other changes, the target language version of the test may be fine, but a back-translated test may not look at all like the original. In general, back-translation designs seem like an excellent supplement to the forward translation design, but they are not likely to be able to stand on their own. The information they provide about the validity of the adapted test is limited. Based on the comments of the reviewers, changes can be made in the original and/or adapted version of the test, as necessary. Of course, if many changes are made, there may be advantages to repeating step 4 and 5. Suggestions: 1. Review and revision of the adapted test is absolutely necessary, following the initial translation. In most cases, the adapted test is too important to be dependent on the insights of a single translator or group of translators. Step 6 Conduct a small tryout of the adapted version of the test. It is at this step that many studies seem to go wrong. Too many researchers and test developers feel that judgmental review is sufficient evidence to establish the validity of a test in a second language. But validity evidence for using a test in a second language depends on stronger evidence than that the test seems to look acceptable to translators and/or reviewers. Not only is empirical evidence needed to support the validity of inferences from an adapted version of a test, but perhaps two or more empirical studies are needed. A good example of what researchers might learn from a tryout of test items in a second language and culture is clearly highlighted in the paper by Allalouf and Sireci (1998). Beginning with a small tryout of the adapted test seems to be prudent before investing considerable resources in a more ambitious field test. Pilot test the instrument using a small sample of individuals representative of the eventual target population and compare the results to results obtained from a source sample. The pilot test should consist of administering the test, as well as interviewing the individuals to obtain their criticisms of the test itself, instructions, time limits, etc. These findings form the basis for revising the test. One good suggestion from Ellis and Mead (1998) might be carried out at this point. Ellis and Mead suggest that when there are disagreements about the best adaptation of a test item, these variations might all be field tested, and the results used to make the final decision about which adaptation is best. Suggestions: 1. Conduct a pilot test to gain preliminary information about the test, and revise accordingly. Step 7 Carry out a more ambitious field test.
70
This is one of the most important steps in the total test adaptation process. Good translators are often capable of identifying and fixing many shortcomings in adapted tests. But many problems go unidentified until test items are field tested. For example, in a recent study by Hambleton, Slater, and Yu (in press) in which National Assessment of Educational Progress (NAEP) mathematics items were adapted into Chinese, the NAEP test item went unidentified by the translators. A field test revealed a major problem with the item which could not be identified by the translators because it was a curriculum issue. Chinese students at the eighth grade were unfamiliar with the concept of estimation. Field test the adapted test using a larger sample of individuals representative of the eventual target population and conduct preliminary statistical analyses, such as a reliability analysis and a classical item analysis. In addition, check for construct equivalence using factor analysis should be carried out. Suggestions: 1. Design and carry out an ambitious field test to check out test items (using classical or modern item analysis procedures), test and subtest reliabilities, and the factor structure of the test (factor analysis or structural equating modeling are popular for this analysis). Compare findings to those obtained with the source language version of the test. Step 8 Choose a statistical design for connecting scores on the source and target language versions of the test. This step is necessary when cross-cultural comparisons are of interest, or the test score norms or performance standards (i.e., the passing score on a credentialing exam) with the source language version of the test are of interest with the target language version of the test. At this step (which might be combined with step 7), a linking design is needed to place the test scores from the different versions of the test on a common scale. There are three popular linking designs: 1. bilingual group design, 2. matched monolingual group design, and 3. monolingual group design. All three designs are popular, though the third design may be the easiest to implement in practice (see, for example, Angoff & Cook, 1988). For a worked example based on item response modeling of the data, studies by Angoff and Cook (1988) or Woodcock and Munoz-Sandoval (1993) would be of special interest. Suggestions: 1. Choose a linking design to equate scores from the source and target language versions of the test. Item response modeling is a standard way to proceed. Large samples are highly desirable at this step to produce a stable linking of scores from one test to the other.
71
Step 9 If cross-cultural comparisons are of interest, ensure equivalence of the language versions of the test. This step, too, may be combined with steps 7 and 8. We have highlighted this activity as a step because of its central importance in the test adaptation process. Administer the source version of the test to a large sample of the source population and perform statistical analyses to determine whether or not the items function similarly in both the adapted and source language versions of the test. This is accomplished through the use of an item bias study (often called a "differential item functioning" or DIF study). If there are items that function differently for each group, rewrite or retranslate, readminister, and reanalyze those items to determine whether they function the same for both groups. The Muniz, Hambleton, and Xing (1998) study highlights the fact that even small samples (i.e., 50 candidates per group) can be useful in detecting flaws in the translation/adaptation process. Suggestions: 1. Conduct a DIF study using one or more of the standard statistical procedures--Mantel-Haenszel statistic, logistic regression, IRT-based area procedures, etc. Step 10 Perform validation research as appropriate. Regardless of the interest in cross-cultural comparisons of scores from the two language versions of the test, and the related research generated by that concern, there is also a need to ensure that the test scores of the newly adapted test are valid and reliable. Step 1 involved judgmental strategies for collecting evidence of construct equivalence, as there was no data available with which to conduct statistical analyses. Now that the test has been administered, there are data available and so evidence of construct-related validity can be compiled. This may be compiled from factor analytic, experimental, or other correlational information (e.g., predictive or concurrent validity studies). Again, this step may be combined with steps 7 to 9. Suggestions: 1. Conduct empirical studies which address the equivalence of the multilanguage versions of the test in the populations where the test will be used. Evidence of construct equivalence as well as the absence of method and item bias are important. Step 11 Document the process and prepare a manual for the users of the adapted test. Document results obtained from steps 1 to 10 and prepare a manual for the users of the adapted test. The manual should include specifics regarding the administration of the test, as well as how to interpret the test scores. This is a very important step, yet often overlooked. Suggestions:
72
1. Document the full process of adapting a test. Everything from the persons involved, and designs used, to the findings and the nature of the changes which were made needs to be compiled and placed in a technical manual for future reference. Step 12 Train users. Where possible, train the users of the test. Although documentation and a manual will assist users of the adapted instrument, training will further assist them. Suggestions: 1. Train test administrators to follow the directions and to answer any questions appropriately which may arise. Especially when cross-cultural comparisons are being made, or the norms for the target language version of the test are being used, standardized test administrations are essential across language groups. Step 13 Ongoing monitoring of the adapted test. Often cross-cultural studies are a "one-shot affair." But some tests are adapted for ongoing use in a second language group. Popular intelligence, credentialing, aptitude, and personality tests would be ones which are adapted and intended for ongoing use. Researchers should remain vigilant to potential flaws in their adapted tests, and this means that ongoing monitoring of adapted tests is needed. Re-investigation and reevaluation of the reliability and validity of test scores should be ongoing. Suggestions: 1. Continue to monitor the evaluation of adapted tests and assess their reliability and validity on a regular basis. The reliability and validity of all tests can be expected to change over time due to changes in curriculum, values, experiences, exposure to the test, etc. Conclusions An increasing number of educational, credentialing, and psychological tests are being adapted for use in other languages and cultures. At the same time, these adapted tests will have limited value unless they are adapted with a high degree of concern for issues of usability, reliability and validity. There is a rapidly emerging psychometric literature on the topic of test adaptation methodology, and more advances can be expected in the coming years as researchers respond to the expanding need for adapted tests of high technical quality. Avoiding the five myths and following the 13 steps introduced in this paper for the test adaptation process should go a long way toward improving current practices. In addition, the 13 steps provide a framework for incorporating new methodology into the process as it is developed. References
73
Ahluwalia, N. T. (1990). Comparability of translated tests in occupational testing. CLEAR Exam Review, 1, 19-21. Allalouf, A., & Sireci, S. G. (1998, April). Detecting sources of DIF in translated verbal items. Paper presented at the meeting of AERA, San Diego. Angoff, W. H., & Cook, L. L. (1988). Equating the scores of the Prueba de Aptitud Academica and the Scholastic Aptitude Test (Report No. 88-2). New York, NY: College Entrance Examination Board. Ellis, B., & Mead, A. (1998, August). Measurement equivalence of a 16PF Spanish translation: An IRT differential item and test functioning analysis. Paper presented at the 24th meeting of the International Association of Applied Psychology, San Francisco. Geisinger, K. F. (1994). Cross-cultural normative assessment: Translation and adaptation issues influencing the normative interpretation of assessment instruments. Psychological Assessment, 6, 304-312. Hambleton, R. K. (1994). Guidelines for adapting educational and psychological tests: A progress report. European Journal of Psychological Assessment, 10, 229-244. Hambleton, R. K., & Patsula, L. (1998). Adapting tests for use in multiple languages and cultures. Social Indicators Research, 45, 153-171. Hambleton, R. K., Slater, S. C., & Yu, J. (in press). Field test of the ITC guidelines for adapting psychological tests. European Journal of Psychological Assessment. Harkness, J. (Ed.). (1998), Cross-cultural equivalence. Mannheim, Germany: ZUMA. Muniz, J., Hambleton, R. K., & Xing, D. (1998). Small sample studies to detect flaws in test translation. Paper presented at the meeting of AERA, San Diego. Prieto, A. J. (1992). A method for translation of instruments to other languages. Adult Education Quarterly, 43, 1-14.
74
Sternberg, R. L., & Gardner, M. K. (1983). Unities in inductive reasoning. Journal of Experimental Psychology: General, 112, 80-116. Van de Vijver, F. J. R., & Hambleton, R. K. (1996). Translating tests: Some practical guidelines. European Psychologist, 1, 89-99. van de Vijver, F. J. R., & Poortinga, Y. H. (1997). Towards an integrated analysis of bias in cross-cultural assessment. European Journal of Psychological Assessment, 13, 29-37. Woodcock, R. W., & Munoz-Sandoval, A. F. (1993). An IRT approach to cross-language test equating and interpretation. European Journal of Psychological Assessment, 9, 233-241.
Appendix A ITC Test Adaptation Guidelines Context C.1 Effects of cultural differences which are not relevant or important to the main purposes of the study should be minimized to the extent possible. C.2 The amount of overlap in the constructs in the populations of interest should be assessed. Test Development and Adaptation D.1 Test developers/publishers should insure that the adaptation process takes full account of linguistic and cultural differences among the populations for whom adapted versions of the instrument are intended. D.2 Test developers/publishers should provide evidence that the language use in the directions, rubrics, and items themselves as well as in the handbook are appropriate for all cultural and language populations for whom the instrument is intended. D.3 Test developers/publishers should provide evidence that the choice of testing techniques, item formats, test conventions, and procedures are familiar to all intended populations.
75
D.4 Test developers/publishers should provide evidence that item content and stimulus materials are familiar to all intended populations. D.5 Test developers/publishers should implement systematic judgmental evidence, both linguistic and psychological, to improve the accuracy of the adaptation process and compile evidence on the equivalence of all language versions. D.6 Test developers/publishers should ensure that the data collection design permits the use of appropriate statistical techniques to establish item equivalence between the different language versions of the instrument. D.7 Test developers/publishers should apply appropriate statistical techniques to 1. establish the equivalence of the different versions of the instrument, and 2. identify problematic components or aspects of the instrument which may be inadequate to one or more of the intended populations. D.8 Test developers/publishers should provide information on the evaluation of validity in all target populations for whom the adapted versions are intended. D.9 Test developers/publishers should provide statistical evidence of the equivalence of questions for all intended populations. D.10 Non-equivalent questions between versions intended for different populations should not be used in preparing a common scale or in comparing these populations. However, they may be useful in enhancing content validity of scores reported for each population separately. Administration A.1 Test developers and administrators should try to anticipate the types of problems that can be expected, and take appropriate actions to remedy these problems through the preparation of appropriate materials and instructions.
76
A.2 Test administrators should be sensitive to a number of factors related to the stimulus materials, administration procedures, and response modes that can moderate the validity of the inferences drawn from the scores. A.3 Those aspects of the environment that influence the administration of an instrument should be made as similar as possible across populations for whom the instrument is intended. A.4 Test administration instructions should be in the source and target languages to minimize the influence of unwanted sources of variation across populations. A.5 The test manual should specify all aspects of the instrument and its administration that require scrutiny in the application of the test in a new cultural context. A.6 The administrator should be unobtrusive and the administrator-examinee interaction should be minimized. Explicit rules that are described in the manual for the test should be followed. Documentation/Score Interpretations I.1 When a test is adapted for use in another population, documentation of the changes should be provided, along with evidence of the equivalence. I.2 Score differences among samples of populations administered the test should not be taken at face value. The researcher has the responsibility to substantiate the differences with other empirical evidence. I.3 Comparisons across populations can only be made at the level of invariance that has been established for the scale on which scores are reported. I.4 The test developer should provide specific information on the ways in which the socio-cultural and ecological contexts of the populations might affect performance on the test, and should suggest procedures to account for these effects in the interpretation of results.
August 1999, JATT, Volume1, No.1, 1-30. Paper presented at the annual meeting of CLEAR, Denver, September, 1998.
77
Normele de avizare a metodelor i tehnicilor de evaluare i asisten psihologic (Colegiul Psihologilor din Romania, www.copsi.ro)
Capitolul 1 - Dispoziii generale Art. 1 (1) - n temeiul Legii nr. 213/2004, art.33, lit. h, publicat n Monitorul Oficial din 1.06.2004, Comitetul Director (CD) al Colegiului Psihologilor din Romnia (CPR), prin Comisia Metodologic (CM) elaboreaz normele de avizare i avizeaz metodele i tehnicile de evaluare i asisten psihologic utilizate n practic. (2) - CD al CPR, prin CM reprezint autoritatea central abilitat pentru a analiza valoarea metodelor i tehnicilor de evaluare i asisten psihologic i a emite avize de utilizare a acestora. Art. 2 (1) - Avizarea metodelor i tehnicilor de evaluare i asisten psihologic se realizeaz pentru a asigura calitatea serviciilor psihologice oferite n Romnia. (2) - Valoarea serviciilor psihologice este dependent de calitatea metodelor i tehnicilor de evaluare i asisten psihologic existente precum i de cunotinele i abilitile psihologului de a le alege i utiliza corect. Art. 3 (1) - Comisia Metodologic a Colegiului Psihologilor din Romnia, prin normele de avizare prezente, stabilete standardele de calitate i procedurile de avizare pentru metodele i tehnicile de evaluare i asisten psihologic. (2) - Comisiile aplicative din cadrul Colegiului Psihologilor din Romnia, prin normele de avizare specifice, atest competenele profesionale ale psihologilor de a utiliza metode i tehnici de evaluare i asisten psihologic. Toate comisiile de specialitate vor avea n vedere competenele generale de utilizare a testelor psihologice precizate n documentul de fa. Art. 4 (1) - Metodele i tehnicile de evaluare i asisten psihologic ce au fost avizate, sunt consemnate ntr-un Catalog al metodelor i tehnicilor utilizate n Romnia. (2) - Comitetul Director al Colegiului Psihologilor din Romnia are obligaia s asigure publicarea i actualizarea acestui Catalog prin mijloace electronice, ori de cte ori este necesar. Art. 5 (1) - n cuprinsul prezentelor norme sunt utilizai anumii termeni de specialitate care au un neles specific. (2) - Metodele i tehnicile de evaluare psihologic: demersuri fundamentate tiinific i efectuate n scopul cercetrii, investigrii unei persoane, grup de persoane sau organizaii sub aspect psihologic; (3) - Metodele i tehnicile de asisten psihologic: demersuri fundamentate tiinific, efectuate n scopul declarat al ameliorrii sau optimizrii activitii psihice a unei persoane, grup de persoane sau organizaii; (4) Norme: set prescripii minime metodologice, explicit formulate, adoptate i respectate n mod obligatoriu de ctre membri organizaiilor profesionale ale psihologilor ce asigur coeren n formularea investigaiilor i a concluziilor diagnostice;
78
(5) - Utilizatorul de metode i tehnici de evaluare sau de asisten psihologic: orice persoan care are certificat competena profesional de a folosi aceste instrumente; (6) - Testele psihologice: probe sau dispozitive standardizate de extragere a unei secvene relevante din comportamentul sau procesrile cognitivafective ale unei persoane sau grup, fundamentate pe un etalon sau un reper pertinent i pe o interpretare responsabil din partea specialistului; (7) - Utilizatorul de teste psihologice: persoana responsabil cu selecia, administrarea, cotarea unui test, ori care ia decizii, n parte, pe baza rezultatelor la test. n categoria utilizatorilor de teste intr i persoanele care realizeaz doar etapa de administrare a unor teste complexe cum ar fi probele proiective; (8) - Distribuirea pe pia: aciunea de a face disponibil contra cost sau gratuit un produs sau un serviciu de natur psihologic n vederea utilizrii sale, n condiiile n care acesta nu se regsete n Catalogul metodelor i tehnicilor de evaluare i asisten psihologic avizate; (9) - Solicitantul de aviz: persoane fizice sau juridice care introduc pe pia serviciul sau produsul de natur psihologic, n condiiile n care acesta nu se regsete n Catalogul metodelor i tehnicilor de evaluare i asisten psihologic. n aceast categorie regsim: autorul, productorul, reprezentantul autorizat al acestuia, importatorul ori utilizatorul.
Capitolul 2 - Avizarea metodelor i tehnicilor de evaluare psihologic
Seciunea 1 Documentele necesare pentru avizare Art. 6 - n vederea obinerii avizului, solicitantul adreseaz CM din cadrul CPR o cerere nsoit de o declaraie de conformitate i de un dosar tehnic. Art. 7 - Cererea are un format tipizat i este prezentat n anexa I, iar declaraia de conformitate se face pe proprie rspundere i este prezentat n Anexa II pentru a evidenia c datele prezentate n documentaia tehnic corespund cu realitatea i c metodele sau tehnicile respective nu sunt nocive pentru sntatea individului. CM poate solicita suplimentar un certificat de calitate eliberat de firma productoare conform legilor n vigoare, dup caz. Art. 8 (1) - Dosarul va conine documentaia tehnic a metodei sau tehnicii respective, trebuind s cuprind n mod explicit: a) fundamentarea teoretic; b) domeniul de aplicabilitate (ex. domeniul clinic, organizaional, colar, aprare etc.); c) scopul metodei sau tehnicii (ex. diagnostic; predicie; monitorizare etc.); d) descrierea detaliat a metodei sau a tehnicii, inclusiv a instruciunilor de utilizare, cotare i interpretare;
e) prezentarea calitilor tehnice, psihometrice (validitate, fidelitate, etalonare);
f) competenele necesare pentru utilizare; g) instituii i persoane care ofer stagii de formare, dup caz;
79
h) bibliografie; i) alte informaii utile n aprecierea metodei. (2) n cazul probelor psihologice standardizate utilizate n evaluarea psihologic, informaiile din dosar trebuie s corespund standardelor de calitate menionate n Anexa III. (3) - n cazul n care datele cuprinse n dosarul tehnic nu sunt suficiente pentru acordarea avizului, se pot cere probe, documente i clarificri suplimentare prin consultarea Comisiilor aplicative, pe cheltuiala solicitantului. Seciunea 2 Procedura de avizare Art. 9 (1) - Studierea dosarului tehnic se face de ctre CM a CPR. (2) - Fiecare metod supus avizrii va fi analizat independent de ctre doi membri ai Comisiei Metodologice, ce vor fi alei prin tragere la sori dintre membrii disponibili. (3) - n cazul probelor psihologice standardizate, evaluarea se va face pe baza ghidului ce conine standardele de calitate ale testelor psihologice, precizate n anexa III. Art. 10 (1) - n urma analizei, evaluatorii pot propune acordarea a trei tipuri de avize: a) avizarea pe o perioad nedeterminat; b) avizare temporar; c) respingere a metodei sau tehnicii respective. (2) - Evaluatorii vor ntocmi un referat prin care s justifice tipul de aviz dat i recomandrile fcute pentru mbuntirea calitilor psihometrice ale probelor. (3) - n cazul n care concluziile celor doi evaluatori difer, n ceea ce privete tipul de aviz acordat, metoda sau tehnica va fi reevaluat de o a treia persoan din cadrul CM, aleas prin tragere la sori de ctre Preedintele Comisiei, dar alta dect primele dou. Art. 11 (1) - n cazul testelor psihologice, avizul pe o perioad nedeterminat i oblig pe cei care distribuie pe pia produsele sau serviciile respective s le actualizeze periodic la un interval de maximum 10 ani pe populaia autohton. (2) - Dac reactualizarea conduce la modificri n punctele b i c din cadrul art.8, alin.1 ori n coninutul probei, n modul de administrare a acesteia sau n modalitatea de cotare i interpretare a rezultatelor este necesar o rennoire a avizului. Art. 12 (1) - Metodele i tehnicile de evaluare psihologic pot primi un aviz temporar, pe o durata de 24 luni, cu condiia punerii n practic de ctre persoanele responsabile a recomandrilor membrilor CM. (2) - Avizul temporar poate fi acordat, att probelor noi, aflate n perioad de experimentare, dar utilizate n procesul de evaluare psihologic, ct i probelor care necesit mbuntiri din perspectiva caracteristicilor tehnice. (3) - La expirarea celor 24 de luni de utilizare a metodei sau tehnicii pe baza avizului temporar, se reevalueaz situaia metodei sau tehnicii. Dac solicitantul nu satisface normele de avizare definitiv a metodei sau tehnicii aflat n aceast situaie, CM prin CD al CPR va retrage avizul temporar de utilizare a metodei.
80
Art. 13 (1) - Avizul primit din partea CD se rezum la aria de aplicabilitate specificat n caracteristicile domeniului vizat, i nu poate fi extins spre alte domenii de activitate fr o testare prealabil. (2) - Excepie de la necesitatea obinerii avizului fac probele aflate n perioad de experimentare, ale cror rezultate nu sunt luate n considerare n procesul de evaluare psihologic. Art. 14 (1) - Tipul de aviz primit poate fi contestat de ctre solicitant, printr-o cerere, adresat n prim instan Preedintelui CD, n care s argumenteze motivele pentru care consider c avizul este nejustificat. (2) Dac argumentele prezentate sunt considerate viabile, Preedintele CM va extrage aleator ali doi membri pentru reevaluarea metodei sau tehnicii respective, n caz contrar cererea se respinge. (3) - Decizia luat n urma re-evalurii este definitiv. (4) - n cazul n care dosarul a fost respins, solicitantul poate cere o nou evaluare, pe baza unei documentaii reactualizate, dup un an de zile de la data deciziei de respingere a metodei i tehnicii respective.
Capitolul 3 - Dreptul de utilizare a testelor psihologice
Seciunea 1 Dobndirea i certificarea competenelor utilizatorilor Art. 15 - Orice psiholog va trebui s dovedeasc o serie de competene pentru a putea utiliza probe psihologice. Art. 16 (1) - Competenele pot fi grupate n dou categorii: competene generale i competene complementare, specifice domeniului de aplicaie. (2) - Competenele generale includ cunotine i abiliti legate de activitatea de testare psihologic, indiferent de aria de aplicabilitate. (3) - Competenele complementare n utilizarea testelor psihologice includ cunotine i abiliti dependente de aria n care i desfoar activitatea psihologul. (4) Competenele complementare presupun dobndirea anterioar a celor generale. Art. 17 (1) - Competenele generale dobndite trebuie s acopere sfera de competene stabilite la nivel internaional de Comisia Internaional de Testare. (2) - Categoriile majore de competene, vizeaz urmtoarele aspecte etice n aplicarea testelor: a) adoptarea unei conduite profesioniste, n acord cu normele deontologice ale psihologului i cu respectarea legilor internaionale i naionale privind copyrightul (legea drepturilor de autor i a drepturilor conexe - nr. 8/1996); b) utilizarea doar a acelor teste pentru care au competena necesar; c) asumarea responsabilitii pentru modul de utilizare a testelor; d) asigurarea securitii pentru testele utilizate, astfel nct ele s nu-i piard calitile din cauza deconspirrii publice a coninutului ori a mecanismelor de cotare; e) asigurarea confidenialitii rezultatelor; f) acordul scris sau n form electronic de includere a rezultatelor n baza de date a utilizatorului probei psihologice.
81
(3) - Categoriile majore de competene, vizeaz urmtoarele aspecte tehnice n aplicarea testelor: a) determinarea necesitii de a utiliza teste psihologice n funcie de contextul evalurii psihologice i a calitilor psihometrice ale acestora; b) asigurarea faptului c testarea psihologic nu va avea un impact discriminatoriu pentru anumite categorii de persoane; c) pregtirea adecvat a sesiunii de testare psihologic; d) administrarea corect, n acord cu instruciunile din manual, a probelor; e) cotarea corect a testelor administrate; f) interpretarea adecvat a rezultatelor obinute; g) comunicarea rezultatelor ntr-un mod concis i pe nelesul persoanelor care au solicitat testarea i/sau au fost testate; h) revizuirea calitilor psihometrice ale probelor utilizate; Art. 18 (1) - Competenele generale n utilizarea testelor psihologice standardizate de ctre absolvenii cu licen n psihologie sau asimilat sunt acoperite de urmtorul pachet de cursuri: a) Psihologia personalitii b) Psihodiagnostic; c) Introducere n teoriile msurrii i psihometrie; d) Statistic psihologic i prelucrarea informatizat a datelor; e) Metodologia cercetrii n psihologie. (2) Competenele complementare se pot obine de ctre absolvenii cu licen n psihologie sau asimilat prin programe universitare, masterale sau doctorale ori prin cursuri formative de specializare n diverse metodologii recunoscute de CPR, conform cerinelor Comisiilor aplicative. Art. 19 - Persoanele, cu licen n psihologie sau asimilat, care nu au urmat aceste cursuri le pot urma n regim de tax, prin cursuri organizate de ctre asociaii profesionale recunoscute de CPR ori persoane juridice specializate acreditate de CPR; Art. 20 (1)- Absolvenii cu licen n psihologie sau asimilat, dobndit dup intrarea n vigoare ale acestor norme, vor certifica n faa comisiei aplicative de la care dorete s obin atestatul de liber practic, dobndirea competenelor de utilizare a testelor. Se pot prezenta copii dup documente care dovedesc parcurgerea cerinelor precizate la art.18 alin.1 sau alin.2. (2) Absolvenii cu licen n psihologie care obin titlul de Doctor n specializarea Psihologie au competene generale de utilizare a testelor, nefiind nevoii s intre sub incidena prevederilor art.18, alin.1.
Art. 21 (1) - Autorii sau productorii unor teste psihologice pot propune criterii suplimentare cu scopul de a restriciona dreptul de utilizare a testelor pe care le introduc pe pia, inclusiv o anumit experien de utilizare sub supervizare, cursuri de formare. (2) - Decizia de includere a acestor criterii suplimentare rmne un atribut exclusiv al CM.
82
Seciunea 2 Reglementarea utilizrii testelor psihologice Art. 22 (1) Distribuitorul de teste, solicitant de aviz este obligat s difuzeze testele psihologice ctre utilizatori numai nsoite de un manual tehnic i de utilizare a probei respective, indiferent de tipul de test: creion-hrtie, aparate, prob computerizat. n caz contrar, probele respective nu vor primi aviz favorabil, fie el temporar sau pe o perioad nedeterminat. (2) Distribuitorul de teste, solicitant de aviz este obligat s pun la dispoziia utilizatorului de teste care achiziioneaz un anumit produs, toate elementele necesare pentru administrarea, cotarea i interpretarea rezultatelor de ctre utilizator. (3) Psihologii cu drept de liber practic care utilizeaz teste psihologice nu le pot utiliza n absena unui manual de utilizare i a informaiilor psihometrice menite s mbunteasc interpretarea rezultatelor obinute, indiferent de forma de prezentare a testului: creion-hrtie, aparate, probe computerizate. (4) Psihologii cu drept de liber practic care folosesc metode sau tehnici avizate fr a avea drept de licen asupra metodelor respective ncalc prevederile legale n vigoare i sunt pasibili de sanciuni potrivit legii. (5) Psihologii care achiziioneaz probe psihologice, dar le utilizeaz n alte condiii dect cele prevzute prin licena cumprat de la distribuitor sau autor, ori le nstrineaz unei tere persoane ncalc prevederile legale n vigoare privind legea drepturilor de autor. (6) Psihologii cu drept de liber practic care folosesc metode sau tehnici avizate fr s dovedeasc competenele necesare utilizrii de probe psihologice, cele care nu respect prevederile aliniatelor (4) i (5) ale prezentului articol sau cele care utilizeaz n exclusivitate metode care nu sunt avizate de ctre CM al CPR, ncalc prevederile codului deontologic i sunt pasibili de sanciuni conform prevederilor codului deontologic adoptat de CPR. (7) Prima abatere de se sancioneaz cu retragerea temporar a atestatului de liber practic. Repetarea abaterii conduce la retragerea definitiv a atestatului de liber practic. Art.23 Cei care comercializeaz teste psihologice se supun reglementrilor i dispoziiilor Consiliului Concurenei i Oficiului pentru Protecia Consumatorului din Romnia. Seciunea 3 Acreditarea cursurilor de specializare Art. 24 (1) - Cursurile de formare a competenelor generale specificate trebuie avizate de CD al CPR la propunerea CM. (2) - CM al CPR va ntocmi i reactualiza anual o list a cursurilor acreditate pentru dobndirea competenelor generale de utilizare a testelor psihologice, aceasta fiind fcut public prin mijloace electronice. Art. 25 (1) - Pentru a obine acreditarea cursurilor, persoanele sau instituiile interesate de a organiza astfel de cursuri vor depune o cerere ctre CM a CPR, nsoit de o documentaie tehnic ce include programa cursului / cursurilor respective, un CV al trainerului/formatorului i resursele avute la dispoziie pentru a realiza ntr-o manier profesionist aceste cursuri.
83
(2) - n cazul unui rspuns favorabil, se pltete anual o tax ctre CPR n valoare de 5% din veniturile brute obinute n urma derulrii cursurilor n anul respectiv. (3) - Acreditarea primit din partea CPR, prin intermediul CM, are durata de doi ani de zile, ea putnd fi rennoit. (4) - Retragerea acreditrii poate fi fcut nainte de termenul de valabilitate al acesteia atunci cnd CM constat c organizatorul cursurilor nu respect documentaia tehnic specificat la obinerea acreditrii, dac nu se pltete taxa ctre CPR sau dac survin probleme de natur deontologic sau penal legate de modul de desfurare a cursurilor. Art. 26 (1) - Persoanele care vor urma astfel de cursuri vor susine n final un examen de cunotine, pe baza unei metodologii i a unei bibliografii specificate de ctre CM. (2) - Participanii care vor promova acest examen vor putea primi un certificat de absolvire a disciplinei sau disciplinelor evaluate.
Capitolul 4 - Avizarea tehnicilor i metodelor de asisten psihologic Art. 27 - Psihologul cu drept de liber practic, poate apela la orice metod sau tehnic de asisten psihologic pentru care i asum responsabilitatea, conform normelor deontologice, c este benefic pentru client i pentru care certific competena de a o utiliza. Art. 28 (1) - Metodele i tehnicile de asisten psihologic sunt avizate implicit dac sunt dobndite n urmtoarele condiii: a) pe parcursul studiilor universitare, masterale sau doctorale; b) prin intermediul unor training-uri sau altor cursuri de formare desfurate sub egida CPR sau a altor asociaii profesionale ale psihologilor ori asimilate care au fost acreditate de CPR; c) prin experien sub supervizare, acolo unde este cazul. (2) - Metodele i tehnicile de asisten psihologic pot fi avizate explicit de ctre CM, la cererea unei Comisii aplicative a CPR. Art. 29 (1) - n vederea obinerii avizului explicit, CM cere solicitantului, interesat de promovarea unei anumite metode sau tehnici de asisten psihologic, un dosar tehnic nsoit de o declaraie de conformitate. (2) - Declaraia de conformitate este o declaraie pe proprie rspundere c datele prezentate n documentaia tehnic sunt conforme cu realitatea i c metodele sau tehnicile respective nu sunt nocive asupra individului sau organizaiei evaluate. (3) - Dosarul tehnic trebuie s cuprind informaii despre: a) fundamentarea teoretic; b) domeniul de aplicabilitate (ex. domeniul clinic, organizaional, colar, aprare etc.); c) scopul metodei sau tehnicii; d) descrierea detaliat a metodei sau a tehnicii; e) dovezi despre eficiena metodei; f) limitele i contraindicaiile existente; g) competenele necesare pentru utilizare; h) instituii i persoane care ofer stagii de formare; i) bibliografia aferent cu trimitere spre studii care susin valoarea metodei;
84
j) alte informaii utile n aprecierea metodei. Art. 30 (1) - Metodele i tehnicile de asisten psihologic, care intr sub procedura de avizare explicit pot primi aviz favorabil sau pot fi respinse. (2) - n cazul primirii unui aviz nefavorabil, solicitantul poate cere o nou evaluare, pe baza unei documentaii reactualizate, dup un an de zile de la data deciziei de respingere a metodei i tehnicii respective. Art. 31 (1) - CM se poate sesiza din oficiu cu privire la utilizarea de metode sau tehnici de asisten psihologic neavizate (2) - Procedura de avizare pentru situaiile prevzute la alin. (1) este cea prevzut n prezentele norme.
Capitolul 5 - Dispoziii finale Art. 32 Nivelul taxelor necesare acoperirii costurilor de avizare a metodelor i tehnicilor de evaluare i asisten psihologic se aprob de Consiliul Colegiului, la propunerea Comitetului director. Art. 33 - Normele de avizare a metodelor i tehnicilor de evaluare i asisten psihologic se aprob de ctre Convenia Naional a CPR i intr n vigoare la data aprobrii. Art. 34 - Normele de avizare a metodelor i tehnicilor de evaluare i asisten psihologic se aduc la cunotina tuturor membrilor CPR, dup aprobare, prevederile acestora devenind obligatorii pentru toi psihologii. Art. 35 Normele prezente se completeaz cu prevederile Legii 213/2004 i cu normele metodologice de aplicare a legii respective. Art. 36 Normele prezente pot fi modificate i completate numai la propunerea CM cu aprobarea CD al CPR.
ANEXA 1 Model cerere tip

Domnule Preedinte, Subsemnatul .... de profesie , CNP . cu domiciliul in.. n calitate de ..... va rog sa avizati metoda/tehnica/testul . pentru a putea fi utilizat(a) in. In acest scop anexez dosarul tehnic Data : si declaratia de conformitate. Semnatura:
ANEXA 2
DECLARATIE DE CONFORMITATE Nr. ................
85
Noi, .........................................................................., (denumirea completa a persoanei juridice sau persoanei fizice autorizate) ..............................................................................., (sediul) cu Certificat de nregistrare/Autorizaie nr. .............../................., asiguram, garantam si declaram pe propria rspundere, conform prevederilor art. 5 din Hotrrea Guvernului nr. 1.022/2002 privind regimul produselor si serviciilor care pot pune in pericol viata, sntatea, securitatea muncii si protecia mediului, ca produsul/serviciul ...................................... ................................................................................ (denumirea, tipul sau modelul, eventual numrul lotului, seriei i numrul de exemplare) la care se refera aceasta declaraie nu pune in pericol viaa, sntatea, securitatea muncii, nu produce un impact negativ asupra mediului i este n conformitate cu: ............................................................... ................................................................................ (titlul si/sau numrul i data publicrii documentului/documentelor normativ/normative) ................................. ............................................ (locul si data emiterii) (numele si prenumele in clar si stampila)
ANEXA 3
n curs de traducere i de dezbatere: The Revised Dutch Rating System for Test Quality.
Glosar
86
A msura nseamn a atribui numere obiectelor sau fenomenelor potrivit unor reguli determinate (Stevens, 1951). Analiza factorial - un set de proceduri matematice utilizate pentru a identifica dimensiunile care stau la baza uneui set de msurori empirice Consistena intern a unui test - se refer la msura n care toi itemii testului msoar aceeai variabil Criteriul standardul la care este raportat performana la un test Definirea populaiei - circumscriera persoanelor pentru care este destinat testul Etalon - reprezint deci cadrul de referin al unui subiect cu populaia Etalonarea unui test - reprezint stabilirea unui cadru de referin, a unei scri care s permit determinarea locului ocupat de rezultatele unui subiect fa de rezultatele unei populaii de referin, suficient de numeroas, format din persoane comparabile cu cea examinat. Etalonul (norma sau standardele) reprezint deci cadrul de referin al unui subiect cu populaia Evaluarea psihologica este un proces de rezolvare de probleme care vizeaz descoperirea manifestrilor realitatii. Fidelitatea - reprezint absena relativ dintr-o prob psihologic a erorilor de msurare. Fidelitatea interevaluatori exprim msura n care testul este independent de erori datorate modalitii de cotare a rspunsurilor subiectului Item - stimul specific care determin un anumit comportament ce poate fi cotat i evaluat independent. Itemi cu mai multe opiuni (polinomici) au un format similar celor dihotomici, atta doar c au mai mult de dou alternative de rspuns Itemii dihotomici ofer dou alternative de rspuns (adevrat i fals), de obicei uneia dintre acestea i se acord un punct la cotarea performanei persoanei evaluate Metoda formelor paralele - dou teste sunt paralele dac pentru un subiect erorile de msur la cele dou administrri sunt variabile aleatoare independente Predicia - este procesul de stabilire a unor expectaii despre viitor avnd la baza date / evenimente curente Q- sort este o metod utilizat cu precdere n evaluarea personalitii. Persoana evaluat va primi o list de adjective pe care le va sorta n funcie de msura n care acestea l caracterizeaz Scal categorial este similar cu scalele Likert, dar utilizeaz un numr mai mare de opiuni de rspuns, de cele mai multe ori sunt utilizate scale cu 10 opiuni de rspuns Scale Likert prezint o form foarte popular, utilizat mai ales n cadrul testelor de
87
personalitate, n care persoana evaluat trebuie s-i exprime acordul sau dezacordul fa de a o afirmaie Scor standard - este un scor care a fost transformat dintr-o scal n alta, ultima fiind una pe baza creia se pot face comparaii. Stabilitatea rezultatelor testrii - ne indic n ce msur la aplicri diferite n timp un subiect obine rezultate similare la un test psihologic Standardizarea - procesul de obiectivare i uniformitate a unui test Testarea psihologica - constituie procesul de administrare, cotare si interpretarea a rezultatelor unui test psihologic Validarea procesul prin care se obin informaii legate de validitatea unui test Validitate concurent (presupune obinerea scorurilor la criteriu aproximativ n acelai timp cu scorurile la test. n cazul validitii concurente este vorba tot de o predicie, dar la aceasta se ajunge pe o cale puin diferit fa de cea urmat n studierea validitii predictive Validitate convergent - msura n care testul evalueaz aceleai constructe ca i alte teste Validitate de discriminare msura n care testul evalueaz altceva dect alte teste despre care se tie c se refer la constructe ce nu au legtur cu constructul msurat de test Validitatea de aspect - ceea ce un test pare s msoare, mai degrab dect ceea ce msoar Validitatea de aspect este definit ca ceea ce un test pare s msoare, mai degrab dect ceea ce msoar Validitatea de construct - reprezint msura n care se poate susine c testul msoar o variabil sau o trstur specific Validitatea de coninut - implic examinarea sistematic a coninutului testului pentru a se verifica dac testul acoper un eantion reprezentativ din domeniul care se cere a fi evaluat prin test Validitatea de criteriu - indic msura n care testul este un bun predictor pentru un eantion de comportamente viitoare Validitatea predictiv - este definit ca acurateea cu care putem estima n ce msur o anumit caracteristic sau aptitudine a unei persoane se va manifesta n viitor pe baza msurii n care persoana posed o serie de caracteristici sau aptitudini curente
Scurt biografie a titularului de curs
88
Lector univ. dr. Anca DOBREAN este titular la Catedra de Psihologie Clinic i Psihoterapie din cadrul Universitatii Babes Bolyai. Domeniile sale de competen includ: psihodiagnostic, psihodiagnostic validat tiinific, patologia copilului i adolescentului. Anca Dobrean participat in calitate de director, coordonator sau membru in 8 proiecte de cercetare naionale i internaionale, i a publicat ca autor sau coautor peste 30 de studii stiintifice in reviste de specialitate, indexate ISI, recenzate in baze de date internaionale i/sau recunoscute CNCSIS.
89

Psihodiagnostic

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Psihodiagnostic

Uploaded by

Copyright:

Available Formats

Universitatea Babe-Bolyai

Conf. Univ. Dr. Anca Dobrean

I. CONCEPTELE DE MSURAREA I EVALUARE N PSIHOLOGIE

Titlul i numrul modulului: 1. Conceptele de msurare, evaluare in psihologie.

Dup parcurgerea acestui capitol:

testele psihologice vizeaz atribute/trsturi specifice; are ca instrumente scalele de msur.

scale ordinale scale de interval scale de raport / proporii

I.3.1.1. SCALELE NOMINALE Definiie

Statistic, nu este posibil realizarea nici unei analize (X2, procente).

Msurarea pe o scal ordinal realizeaz ierarhizarea claselor.

relaie de echivalen relaie de ordine

Clasele sunt ordonate, dar distana dintre ele nu poate fi estimat.

A>B>C Aprecierile ca foarte bun, bun, slab

Grafic putem s ne referim la histograme.

I.3.1.2. SCALELE DE INTERVAL Definiie

Msurarea pe o scal de interval presupune o unitate de msur comun i constant.

relaie de echivalen relaie de ordine distana ntre clase (zero arbitrar)

I.3.1.4. SCALELE DE PROPORII Definiie

Posed proprietile scalelor de interval, dar n plus au un punct zero nonarbitrar.

n psihologie msurarea nu se realizeaz pe scale de proporii.

Psihologia industrial/organizaional Psihologia colar

II. ETALONAREA TESTELOR

Titlul i numrul modulului 2. Etalonarea testelor.

Dup parcurgerea acestui capitol:

!ATENIE! la eantionarea pe baz de cunotine, voluntariat, etc. deformri sistematice

Programele statistice au opiuni de a genera numere aleatoare.

! Paii construciei nui etalon sunt: 1. definirea populaiei; 2. eantionarea;

Frecvena fiecrui scor 1 1 2 6 7 4 9 4 10 7 13 19 11 14 16 12 13 11 18 22

Frecven Stanine cumulat

1 2 4 10 17 21 30 34 44 51 64 83 94 108 124 136 149 160 178 200

Frecvena fiecrui scor 16 11 14 12 13 14 8 9 6 3 6 2 3 2 2 2 1 0 0 0 1 325

III. FIDELITATEA TESTULUI PSIHOLOGIC

Dup parcurgerea acestui capitol:

! Factori care influeneaz calculul fidelitii test - retest (stabilitii):

II.1.4. FIDELITATEA INTEREVALUATORI

SD= abaterea standard a scorurilor la test; r= coeficientul de fidelitate

IV. VALIDITATEA TESTULUI PSIHOLOGIC

Dup parcurgerea acestui capitol:

Ipoteze pe baz de observaie Predicie Caracteristica a observat

Ipoteze pe baz de observaie

! APA (1974) difereniaz ntre dou tipuri de validitate de criteriu:

II.2.2. VALIDITATEA DE CONINUT

Albu, M. (1998). Construirea i utilizarea testelor psihologice, Editura Clusium. p 237-256

V. ALGORITMUL CONSTRUCIEI UNUI TEST PSIHOLOGIC

Dup parcurgerea acestui capitol:

!Cele mai frecvent ntlnite forme ale itemilor:

Mediul de testare Limbajul testului Lungimea testului Rspunsurile aleatoare

0 0 5 10 15 20 25 30 35 40 45 Scorul total la test 50 55 60 65

Figura 2.5. Curba caracteristic a itemului

0 0 5 10 15 20 25 30 35 40 45 Scorul total la test 50 55 60 65

25 30 35 40 45 Scorul total la test

Figura 2.8. Curba caracteristic a 2 itemi

Factori comuni (atribute interne)

Factori specifici (atribute interne)

Evaluarea cunotinelor de Ct de mult a nva matematic n ciclul primar matematica predat?

! Obiectivele analizei factoriale sunt:

VI. ASPECTE METODOLOGICE I CONCEPTUALE ALE CONSTRUCIEI TESTELOR

Dup parcurgerea acestui capitol:

Vei recunoate aspectele care in de coninutul manualului unui test

Scurt recapitulare a conceptelor prezentate anterior

4. METODE INSTRUMENTALE Sarcini, tehnici, teste, instrumente proceduri

5. MODEL DE MSUR atribuirea unei scale de msur fenomenelor

7. ANALIZA DATELOR metode statistice, modele matematice

8. INTERPRETRI I INFERENE Inferena statistic, evaluare logic, analiza modelului