You are on page 1of 3

PSICOMETRIA: Anàlisi de qualsevol TEST: Procediment estandarditzat que serveix per mostrejar certes conductes de les persones a partir

sones a partir de les Test de rendiment òptim Test de rendiment típic


assignació numèrica que es realitza sobre respostes a una sèrie d’indicadors (ítems), puntuar i inferir el seu nivell veritable en el constructe o variable latent. Mesura el rendiment màxim que és capaç d’aconseguir Mesura el comportament usual de la persona.
variables psicològiques, obtinguda per Els tests inclouen procediments per al mesurament de conductes tant normals com anormals (avalua a una una persona. Tests de personalitat o escales d’actituds.
diversos instruments o procediments, en persona en un atribut de interès), estan dissenyats per ser aplicats sota condicions controlades i estandarditzades Test d’intel·ligència i aptituds. En els de velocitat es fixa el temps d’administració i
termes de la seva precisió i validesa. i comporten la utilització de protocols de puntuació rigorosos. El temps és suficient i es presta atenció a les l’important és saber quants ítems és capaç de fer.
Teories de la mesura: Responsables Disseny del test: El primer a especificar és el constructe a avaluar i el propòsit del test. Es recomana prestar atenció característiques dels ítems que es fa (Potència). Podem trobar biaixos de resposta.
d’establir els requisits lògics i matemàtics al que diuen les restriccions administratives (Schmeiser i Welch). Es té en compte la transcendència del test, l’edat És possible obtenir encerts responent a l’atzar. Opció binària (antagonistes).
que s’han de complir perquè les dels avaluats i els tipus d’ítems. Opcions prestablertes: vertaders - fals i opció múltiple. Categories ordenades.
assignacions numèriques representin Taula d’especificacions: Es detallen els continguts del test, assegura que la prova serveix per a l’objectiu que va Preguntes obertes: elements de resposta construïda, Escales de resposta: Grau d’acord (Likert) i
realment els atributs psicològics. ser construïda. resposta extensa però breu i resposta extensa. Freqüència.

VALIDESA: En un test tenim unes puntuacions a partir de les quals fem inferència. La validesa de les Redacció de ítems d’opció múltiple (Moreno, Martínez y Muñiz) Redacció d’ítems de categories
puntuacions d’un test és el grau d’evidències i teories que donen suport a les inferències pels usos Ítem ha d’avaluar el contingut d’una casella de la taula d’especificacions. // El central Utilitzar el temps present i rellevància. // El contingut ha de ser clar i s’ha
que es proposa que serveix un test. El que s’hauria d’aconseguir demostrar és que tot constructe està ha d’expressar-se en l’enunciat de l’ítem. // Les opcions han de ser preferiblement 3. d’evitar generalitat. // Minimitzar l’aquiescència redactant ítems de manera
ben representat. A més, s’intenta corregir que el constructe no estigui contaminat per un procés de // Les opcions han de presentar-se en vertical. // El conjunt d’opcions de cada ítem ha inversa. // Evitar l’ús de negacions.
resposta en concret. Els Standard s’encarreguen de generar unes directrius i normes per a la d’estar ordenat. Es quantifiquen les possibles respostes a un ítem tenint en compte si és un ítem
construcció dels tests. Primer s’ha de fer una hipòtesis, informació proposada de les puntuacions del Ítem dicotòmic (0,1): La puntuació directa és la suma de les puntuacions en els J ítems directe o invers. // Opció binària: Quantifiquem l’acord amb 2 si està redactat
test: finalitats en les que es pot fer servir un test. Després s’ha de demostrar l’evidència científica a i indicarà el seu número d’encerts. // Ítem poliatòmic: Fer una llista de respostes de manera directa el constructe d’interès, i 1 si està redactat de manera
través d’un mètode, obtenint unes conclusions. acceptables i puntuar 0 o 1. Aplicar rúbriques detallant elements. inversa.
ARGUMENT INTERPRETATIU: Proposar amb detall interpretacions i utilitzacions de les puntuacions. Cal saber com interpretar i utilitzar el test. ARGUMENT DE Estàndards de 1985: Validesa de contingut, validesa de constructe i validesa de criteri (3 categories).
VALIDESA: Reflexió sobre si l’argument interpretatiu és bo o no. Implica l’avaluació de les interpretacions propostes a través de la cerca d’evidències que justifiquin Estàndards de 1999: Evidències de validesa basades en el contingut del test, en el procés de resposta, en les
l’ús del test amb la finalitat proposada. Parlem, doncs, de diferents aspectes del test en els que podem especificar hipòtesis i obtenir evidència científica. conseqüències de l’avaluació, en l’estructura interna i en relació amb altres variables (5 categories).

CONTINGUT DEL TEST: Comprova si les preguntes o ítems del test parlen sobre el constructe que PROCÉS DE RESPOSTA: L’objectiu és l’anàlisi dels processos / procediments de resposta que CONSEQÜÈNCIES DE L’AVALUACIÓ: Es basa en l’anàlisi de les conseqüències
mesuren i també si totes aquelles preguntes estan ben repartides dins del constructe. També es els subjectes realitzen per a obtenir les puntuacions. Per a això, es requereix d’un model intencionades i no intencionades que es deriven de l’aplicació de tests en
refereix a les instruccions per a la seva administració i als criteris de correcció i puntuació. Segons explicatiu d’aquests processos de resposta que permeti guiar el procés de construcció del test. determinats contextos d’avaluació. Quan passem un test, el fet de passar-lo
Sireci s’ha de tenir en compte la definició del domini i la representació del domini: Primer es dona S’han de dissenyar els ítems d’acord amb el model de processament, una mala traducció o d’una determinada manera pot tenir unes conseqüències, i això pot afectar
una definició operativa del contingut a través d’una taula d’especificacions i després es comprova contextualització (“freaming”) ens pot fer fallar o no entendre la pregunta, evitar ítems a les puntuacions de les persones de forma diferent.
si el contingut del test és representatiu i rellevant. És a dir, si el contingut del test representa ambigus. Les instruccions han de ser clares i comprensibles. Tenir en compte l’Efecte halo (si Important detallar les conseqüències previstes i indagar sobre l’existència de
totes les facetes del domini i el grau en que queda cada ítem del test mesura el domini. et causa una bona impressió tendeixes a contestar tot bé i al contrari), l’aquiescència possibles conseqüències no previstes: Degudes a deficiències en la
METODOLOGIA QUALITATIVA: Revisió bibliogràfica, opinió d’especialistes en el constructe (respondre de forma afirmativa sense raonament) i la tendència a respostes centrals representació del constructe (Infrarrepresentació) o degudes a la inclusió
avaluat, població diana que ha de contestar el test. Per avaluar el contingut del test es consulta (extremes o positives). Les motivacions de qui respon poden ser defensar interessos propis, d’aspectes irrellevants.
a la població diana que ha de contestar al test perquè aportarà coses que no aportin els experts optimització o suficiència, desitjabilitat (tendència a donar una bona imatge d’un mateix) i Metodologia: entrevistes a persones afectades, estudis comparatius entre
però no se’ls hi administrarà el test. El fet que el contingut d’un qüestionari es basi en l’adaptació desviació social (tendència a escollir opcions estranyes). grups i estudis longitudinals. Analitzar la representació del constructe, mirar
d’un test que ha demostrat la seva qualitat en els seus estudis científics fa que creiem més en el Molta variabilitat en el procés de resposta ha de reconsiderar el format amb el que s’aplica el si l’estructura interna es manté en un altre context i fer un estudi del biaix
seu contingut. test. (factors irrellevants pel constructe).
ESTRUCTURA INTERNA: Comporta l’obtenció i anàlisi de les respostes emeses. Aquestes evidències ens permetran saber si el test mesura un constructe RELACIÓ AMB ALTRES VARIABLES: L’objectiu és establir si les relacions observades entre les puntuacions en el test i
coherent o es tracta simplement d’un conjunt d’ítems no relacionats. L’estructura interna és el grau en què les relacions entre els ítems i els components altres variables externes rellevants són consistents amb la interpretació proposta per les puntuacions.
del test conformen el constructe que es vol mesurar i sobre el què es basaran les interpretacions. Evidència convergent i discriminants: Es busca examinar les relacions que es preveuen entre les puntuacions en el
Anàlisi paral·lela: Elegir les components amb un valor propi més gran que el que s’esperaria per atzar. Anàlisi de residuals: Error entre lo observar i el que test i altres constructes, ja siguin similars als que es pretén mesurar amb el test (convergent) o diferents
s’esperava observar. Com més petits siguin els residuals millor. Puntuacions factorials: Puntuació de cada subjecte en el factor. Valors propis > 1: Que la (discriminant).
variància de la component sigui més gran que la d’un ítem. Variància explicada: Més de 50 - 60 %. Comunalitats homogènies: Com més gran millor. Salts Evidència que dos constructes teòricament relacionats presenten les mateixes relacions en les seves mesures:
en els valors propis: Identificar on es produeixen salts rellevants (canvis de direcció) en les variàncies de les components. CRITERIS DE REDUCCIÓ DE DADES. S’espera que la correlació sigui alta. // Evidència que dos constructes teòricament independents presenten
DIMENSIONALITAT: Permet determinar l’estructura del test i es basa en les relacions entre els ítems del test. Anàlisi factorial... Correlacions ítems... Matriu independència en les seves mesures: S’espera que la correlació sigui baixa.
factorial. Anàlisi factorial exploratòria: Tècnica de reducció de la dimensionalitat que ens permet passar d’un conjunt de variables observades (ítems) a Evidència predictiva: Primer el criteri i després el test. Aplicat en processos judicials, per a detectar factors de risc de
un nombre menor de variables latents (factors). Es tracta d’identificar un conjunt de factors hipotètics que poden explicar les correlacions observades certs diagnòstics. // Evidència concurrent: Tots dos al mateix temps. El test s’aplica per establir el criteri en el
entre els ítems del test. // Condicions d’aplicació: Test d’especificitat de Barlett: p < 0,05, rebuig Ho: La matriu de correlacions no és de identitat. KMO: moment actual. Aplicat en la validació de proves diagnòstiques. Corbes ROC que permeten escollir un punt de tall en
Avalua les correlacions parcials entre els ítems (0,80: Meritori / 0,90: Meravellós) // Estructura simple: Cada ítem ha de pesar sobretot en un factor (> una prova diagnòstica per optimitzar la sensibilitat i l’especificitat i es basa en el càlcul d’aquests dos índexs per a
0,30). Interpretabilitat: Comprovar si tots els ítems que pesen en un mateix factor avaluen el mateix. // Nous eixos rotats: Relació ortogonal (no cadascun punts de tall. // Evidència predictiva: Primer test, després criteri. Regressió simple on VI test i VD criteri.
relacionats, correlació baixa) i Relació obliqua (relacionats, correlació alta). L’objectiu de la rotació és obtenir sempre una estructura simple, però dependrà COEFICIENT DE VALIDESA: Indica el grau en que les puntuacions en el test serveixen per a pronosticar amb precisió
de com els ítems estiguin relacionats entre ells que serà possible o no obtenir-la. Serà possible en el cas que els ítems estiguin relacionats en forma de les puntuacions en el criteri. Depèn de la fiabilitat del test, la fiabilitat del criteri i l’autentica relació entre el test i el
subgrups. criteri. Quan la fiabilitat no és perfecte, s’atenua el valor del coeficient de validesa.
Anàlisi factorial confirmatori: Es posa a prova si una solució factorial és o no adequada. S’especifica el nombre de factors, si estan o no relacionats, quins Rxy: Correlació desatenuada (puntuació factorial). SEMPRE és més alta. // rxy: Coeficient de correlació atenuat
ítems saturen, etc. CFI i TLI valors propers a 1 (ajustament) / RMSEA i SRMR valors propers a 0. (puntuació total per suma dels ítems).
FIABILITAT: Precisió de la mesura i consistència de les puntuacions. Estabilitat temporal de la mesura: ESTRATÈGIA TEST – RETEST
TCT: Quina part de la variabilitat en les puntuacions del test es deu a la variabilitat de l’atribut mesurat i quina part s’explica per la presència de l’error. S’ha d’obtenir les mateixes mesures quan es mesura el mateix en moments diferents. S’aplica el mateix test en dues ocasions. Entre les dues mesures
Error: Discrepància entre la puntuació observada (X) i la puntuació vertadera (V). hi ha un interval de temps. L’interval de temps ha de ser controlat i, depèn de l’estabilitat del constructe. Si el constructe és molt estable es pot deixar
El model clàssic ens diu que si repetim el mesurament moltes vegades, es preveu que la mitjana d’aquestes puntuacions observades coincideixi amb la vertadera passar un interval de temps relativament llarg entre el test i el retest. No obstant, si és massa llarg es poden produir canvis reals en el test i se subestimi
puntuació: Necessitat de repetir les mesures. Errors causats per factors transitoris: Factors que canvien d’una sessió a una altra, però que, dins d’una mateixa sessió, la prova. Si el constructe és menys estable s’haurà de reduir aquest interval. Si l’interval és massa curt es pot produir una sobreestimació de la fiabilitat
afecten per igual a tots els ítems. Poden ser deguts a variables personals (humor, motivació, concentració) o variables situacionals (ambient, temps). Poden detectar- (es recorden les respostes). Sensible a factors transitoris: Són iguals en tota la sessió. Presència de factors aleatoris.
se estudiant com varia el rendiment de la persona en diferents moments temporals. // Errors causats per l’especificitat: Es deuen al contingut concret dels ítems que Estabilitat entre mesures: ESTRATÈGIA DE MESURES EQUIVALENTS
se li presenten. Poden detectar-se estudiant com varia el rendiment de la persona en diferents parts del test. // Errors causats per factors aleatoris: No es pot atribuir S’ha d’obtenir les mateixes mesures quan es mesura el mateix amb proves equivalents. La forma paral·lela intenta avaluar el mateix que el test original,
directament al contingut dels ítems, ni a altres factors de la persona o situació (ex: distracció). però amb diferents ítems. Dues formes es consideren paral·leles si els seus continguts són similars i si s’apliquen a la mateixa mostra de persones.
ERROR ESTÀNDARD DE MESURA (EEM): Indica la variabilitat de les puntuacions X si prenguéssim per la mateixa persona diferents mesures. El test amb alta fiabilitat, Calculem l’associació entre ambdues mesures mitjançant la correlació de Pearson. Sensible a l’especificitat de les mesures: una persona pot saber
el valor esperat en X és en funció de V. El test amb baixa fiabilitat, el valor esperat en X no depèn de V. Ens permet conèixer el rang de les puntuacions en el qual es molt millor la resposta a un ítem que a un altre. Presència de factors aleatoris. És difícil disposar de dues formes exactament paral·leles: és molt costós.
troba la puntuació vertadera d’una persona. A mida que augmenta la desviació estàndard de la puntuació observada (X), veiem que l’interval de la puntuació vertadera Ex: permutació.
(V) va augmentant, és més ampli, menys precís. CONCORDANÇA INTERJUTGES: És fa una heteroavaluació. S’utilitza a altres persones que actuen com a instrument de mesura. Si els avaluadors estan
COEFICIENT DE FIABILITAT: Valors entre 0 i 1. És l’associació entre la puntuació observada X i X’ (quocient entre la variància vertadera entre la variància de l’error). entrenats haurien de proporcionar mesures molt similars. Hem de tenir en compte: Grau d’entrenament avaluadors i si avaluadors comparteixen
Indicarà la proporció de variància observada (X) que és la variància vertadera (V). És la correlació entre les puntuacions obtingudes per els subjectes en dos formes criteris.
paral·leles d’un test (X i Xi). ESTRATÈGIA DE CONSISTÈNCIA INTERTNA: Indicadors múltiples
Índex de fiabilitat: Valor de la correlació entre les puntuacions vertaderes i les puntuacions observades en el test. És l’arrel quadrada del coeficient de fiabilitat (x % Es basa en una única administració del test on es mira el grau de concordança entre les puntuacions dels avaluats en diferents parts del test mitjançant
coeficient de fiabilitat = x % de la variància empírica és la variància vertadera. la consistència interna d’un ítem amb la resta. Avaluem la coherència interna de la mesura: Alfa de Cronbach i Omega. // Es pot associar les puntuacions
Augmentar la fiabilitat: Augmentar el nombre d’ítems. Eliminar ítems problemàtics. Homogeneïtzar al màxim les condicions d’aplicació per tal que no incrementi la d’ítems parells amb els parells i els senars amb els senars (Dues meitats).
variabilitat d’error de les puntuacions. // Factors que afecten al coeficient de fiabilitat: Característiques de la mostra. Variabilitat de l’atribut de mesura. Fonts d’error Sensible a l’especificitat de les mesures i als factors aleatoris. Domini específic presenta major consistència.
a què és sensible l’estratègia emprada. Situació d’aplicació. Aspectes a tenir presents: Cal haver recodificat els ítems inversos. Cal tenir en compte el grau de covariació (correlació) entre els ítems. Nombre d’ítems.
INTERPRETACIÓ DE LES PUNTUACIONS Kappa de Cohen: Permet estudiar el nivell de concordança entre dos jutges en variables nominals o ordinals. Calcula el grau OMEGA: Estimador de la fiabilitat de la consistència interna. El seu càlcul es fa a partir dels resultats
Puntuacions crues: No es poden interpretar directament, ja que són la suma de d’acord entre dues avaluacions, cadascuna de les quals es realitza sobre k categories. Pot oscil·lar entre -1 i 1 (Si l’acord és d’AFE o d’AFC. Té en compte tots els factors comuns presents en la sèrie d’ítems pel que no es limita al
les puntuacions obtingudes a cada ítem i depenen de molts factors. S’ha de tenir perfecte: Kappa = 1). Consisteix en obtenir la proporció de concordances després de corregir l’estimació de la proporció de factor que explica la major part de la variància comú. // Coeficient de concordança: Serveix per l’acord
en compte: Conceptes que estem quantificant. Algorisme (conjunt concordances per atzar. // INCONVENIENT: El valor pot estar influït per la diferent prevalença d’una determinada categoria absolut interjutges en el cas de les variables continues. // Coeficient de correlació intraclasse: Permet
d’instruccions o passos que serveixen per executar una tasca). Correcció per part respecte la resta. estimar l’acord sobre variables quantitatives interjutges. Es basa en un model ANOVA. La idea és
de tercers. // La forma d’interpretació ha de ser adequada: Llenguatge simple. Proposta de Landis i Koch: 0,80 a 1: molt bona / 0,60 a 0,80: bona / 0,40 a 0,60: moderada / 0,20 a 0,40: feble / > 0,20: pobre. descompondre la variabilitat de les dades en diversos components. Els valors oscil·len entre 0 i 1.
Les editorials que publiquen el test haurien d’especificar els procediments que Alfa de Cronbach: És un indicador de la consistència interna: Concordança entre les puntuacions de les persones avaluades en SPEARMAN BROWN: És una eina d’utilitat per a calcular la fiabilitat d’un hipotètic instrument d’una
s’han de fer servir per interpretar-los i quines han de ser les mostres... distintes parts del test. La fiabilitat es pot quantificar avaluant el grau en que diferents subconjunts d’ítems d’un test covarien determinada mida, en funció de la informació coneguda sobre la fiabilitat d’un instrument que té la mida
GRUP NORMATIU: La mostra ha de ser representativa de la població, o correlacionen entre sí. Pot prendre qualsevol valor comprès entre 0 (absència de consistència) i 1 (consistència total). diferent. Augmentant el nombre d’ítems s’augmenta la fiabilitat.
suficientment gran i que s’utilitzi per a calcular barems. Una mostra Depèn de: el grau de covariància entre els ítems (tindrà un valor més gran quan major sigui el promig entre les covariàncies) i Preveure la fiabilitat de les puntuacions d’un test format per nh elements equivalents als nc elements d’un
representativa proporciona més credibilitat al barem al que permet la el nombre d’ítems (a major nombre d’ítems, major consistència). Es requereix assumir que tots els ítems són paral·lels. No és test inicial. Nh: suma dels ítems del test inicial i dels que es volen afegir.
generalització a altres persones de la mateixa població. S’assegura mitjançant: sensible a l’efecte dels errors deguts a factors transitoris. Interpretació problemàtica si el test no és unidimensional. Comparar la fiabilitat de dues mesures de diferent longitud: S’ha de calcular quin seria el coeficient de
Una definició operativa de la població diana amb les característiques que la Interpretació de Nunnally i Bernstein: a > 0,90: excel·lent / 0,90 a 0,80: bona / 0,80 a 0,70: acceptable / 0,70 a 0,60: qüestionable fiabilitat de les puntuacions de la primera prova si aquesta tingués el mateix nombre d’ítems que l’altre.
defineixen i la selecció de les persones participants mitjançant tècniques de / 0,60 a 0,50: dolenta. Valors crítics de l’alfa de Cronbach: Fases primerenques de la creació de l’instrument (a > 0,70) / Extrapolar el nombre d’ítems necessari per assolir un determinat coeficient de fiabilitat: Obtenim el valor
mostratge adients: aleatorització, conglomerats... *Una mostra gran Instrument ja creat: investigació bàsica i comparació entre grups (a > 0,80) i interpretacions individuals i diagnòstic (a > 0,90). de la K amb l’equació aïllada de la pH. Aïllem la nh de l’equació de la K simplificada per obtenir el seu
proporciona més credibilitat (millora la precisió) al barem. valor. Nh ens dona ... i restem nc per veure el nombre d’ítems a afegir.
INTERPRETACIÓ NORMATIVA: Ens dóna la posició d’una persona PUNTUACIÓ ESTANDARDITZADA... Puntuació Z: Indica el nombre de desviacions típiques INTERPRETACIÓ CRITERIAL: Ens dona la posició respecte al contingut o als valors possibles del test. Sempre es basa en judicis d’especialistes i es fa
respecte el seu grup. La puntuació s’haurà de comparar amb la del que s’allunya de la mitjana la corresponent puntuació directa X. servir una metodologia qualitativa / mixta: Seleccionar les persones especialistes, entrenar-les a fer servir el mètode (descripcions, Angoff, Nedelsky),
grup normatiu a través de normes i barems. El grup normatiu és una PUNTUACIÓ ESTANDARDITZADA DERIVADA... Puntuació T: 50 + 10 · Z (valors de 10,90). recollir les avaluacions d’especialistes, discutir-les i preparar un esborrany, discutir fins a obtenir consens. // GRUP D’ESPECIALISTES: Participació de
mostra de persones a la qual s’ha aplicat el test per a obtenir barems. Puntuació D: 50 + 20 · Z (valors de 0,100). *Si derivem les puntuacions estandarditzades grups de persones variades i discussió profunda (contrastació d’opinions, ús de tècniques d’entrevista grupals, grups focals o Tècnica Delphi).
Els barems assignen a cada puntuació directa un valor numèric que obtenim les puntuacions derivades. // Si derivem la puntuació normalitzada obtenim la Punts de referència: Posició respecte al contingut o als valors possibles del test. ABSOLUTS: Tenint en compte el mínim possible, el punt mig i el màxim
informa de la seva posició en relació a les puntuacions del seu grup. puntuació normalitzada derivada. possible. Busquem els punts de referència absoluts de cadascuna de les escales i interpretem la puntuació obtinguda mitjançant aquest punts.
PUNTUACIÓ NORMALITZADA: Quan es comprova que les PUNTUACIONS CENTILS: S’assignen a cada puntuació del test el seu rang centil que indica el Mapa d’ítems: Descriure el que s’espera que sàpiga o sàpiga fer qui ha obtingut cada puntuació. Un cop triada l’escala en la qual assignar les
puntuacions d’un grup normatiu segueixen Distribució percentatge de persones del grup normatiu que obtenen puntuacions inferiors a aquesta puntuació. puntuacions, es busquen elements característics d’algunes puntuacions. El procediment requereix que es mostri un ítem representatiu d’algunes de
Normal, un rang centil dividit per 100 indica l’àrea de la Variable discreta: El rang centil de cada puntuació és el valor de la columna Percentatge acumular de les puntuacions del test que indiqui que és capaç de fer qui obté la corresponent puntuació.
corba normal que queda per sota del centil corresponent. Z, la taula, que és la puntuació anterior. (Arrodonir el percentatge acumulat de l’anterior puntuació). Descripció de nivells: S’estableixen, mitjançant experts, els nivells d’acompliment associats a determinades puntuacions en el test, per informar del
N (0,1) ; P (Z < Zn) = K/100. *La puntuació típica serà més Variable contínua: Les persones que obtenen cada puntuació estan homogèniament repartides en el nivell de competència als interessats.
similar a les típiques normalitzades quan més s’assembli la seu interval. *Dues puntuacions directes similars tenen el mateix eneatipus degut a l’arrodoniment. Punts de tall: Venen determinats per coneixements, destreses i capacitats requerides per les qualificacions. Quan els ítems tenen opció múltiple:
distribució normal a la distribució de la puntuació en el test Mètode Angoff, quan són de resposta construïda: Mètode holístic “Body of Work”. *També n’hi ha per normatius, però no són útils per a l’acreditació
del grup normatiu. de l’avaluat, perquè es valora la posició de la persona en relació als altres, i no el seu nivell de competència en termes absoluts.
EQUITAT: Últim concepte que han incorporat els Durant el procés d’avaluació (1): L’objectiu és maximitzar les oportunitats que té la persona avaluada per demostrar el seu nivell en el constructe avaluat. Garantir l’accessibilitat a la prova de qualsevol persona MINIMITZAR LES BARRERES A L’EQUITAT
Standards a l’any 2014. Un test ben construït no hauria avaluada, independentment de les característiques irrellevants pel constructe mesurat. // Identificar i, en la mesura del possible, eliminar barreres. // L’estandardització es tan necessària com la seva flexibilització. Disseny universal: Minimitzar allò que no
de penalitzar o donar menor puntuació a certes persones Absència de biaix (2): Algunes característiques del test que no estan relacionades amb el constructe poden tenir diferents significats per diferents subgrups. Alguns aspectes rellevants a avaluar poder ser biaix per és pertinent i que podria dificultar la
o grups de persones per raons alienes a l’atribut que algunes persones (aspectes que poden causar sensibilitat en certes persones): Contingut de la prova té una càrrega cultural. // BIAIX: Injustícia derivada de l’existència d’alguna característica de l’ítem o del context resposta subgrups.
pretén mesurar. d’aplicació del test que és irrellevant per a l’atribut mesurat per l’ítem: motius externs. // DIF: Quan grups igualment capaços presenten una probabilitat diferent de respondre’l amb èxit o en una determinada Acomodació: Intent d’eliminació de
Una prova equitativa ha de reflectir el mateix constructe direcció en funció del grup al que pertanyen. // IMPACTE: Diferencies entre els grups en la variable latent que mesura el test: diferència real. // Un ítem és esbiaixat quan presenta funcionament diferencial que barreres. S’ha de poder verificar la igualtat
per a totes les persones que contesten la prova. Les seves no s’explica per un possible impacte. en els resultats.
puntuacions han de poder tenir el mateix significat per Accessibilitat a la tècnica d’avaluació o al constructe que es vol mesurar (3): Hauria de ser el mateix constructe a tot arreu on s’aplica el test. A vegades aspectes externs constitueixen barreres per demostrar el Modificació: Canvi de la prova. S’han de
a totes les persones de la població objectiu. nivell en el constructe. poder verificar totes les propietats
La falta d’equitat afecta a la validesa de les inferències Validesa de la interpretació i inferència de les puntuacions individuals (4): Característiques individuals que fan que no puguis realitzar el test de la mateixa manera. Poden construir barreres (irrellevants) per a psicomètriques.
associades a les puntuacions. la mesura, si no es prenen mesures (adaptacions, modificacions o acomodacions) la mesura no serà equitativa i afectarà a les inferències que sobre el constructe avaluat es puguin fer de les puntuacions individuals.

You might also like