Professional Documents
Culture Documents
Informe Final Libro Upla Version 2f
Informe Final Libro Upla Version 2f
VICERRECTORADO DE INVESTIGACIÓN
UNIDAD DE INVESTIGACIÓN DE LA
FACULTAD DE CIENCIAS DE LA SALUD
ESCUELA PROFESIONAL DE PSICOLOGIA
Directora de la Unidad
Ph.D. Mohamed Mehdi
de Investigación de la
Facultadde Ciencias de la Mohamed
Salud
Vicerrector de Investigación
1
Aprobado por Vicerrectorado de Investigación OFICIO N.º 0091-VRINV.UPLA-2022
1
2
Al gran Yo Soy, fuente de
sabiduría, conocimiento e
inteligencia.
A mi amada familia.
3
AGRADECIMIENTOS
A los Maestros en Psicometría que tuvieron a bien orientar los contenidos del
presente Texto.
4
CONTENIDO
Caratula 2
Dedicatoria 3
Agradecimientos 4
Contenido 5
Introducción 8
Desarrollo temático
Objetivos 10
Contenidos 10
Indagando saberes previos 11
Desarrollo temático
Autoevaluación 45
Actividades para el estudio independiente 46
Bibliografía complementaria 46
5
Capitulo II: PROCESO DE CONSTRUCCION DEL TEST PSICOLÓGICO 47
Objetivos 47
Contenido 47
Indagando saberes previos 48
Desarrollo temático:
2.1. Definición. 49
2.2. El método científico y la construcción del test psicológico 49
2.3. Etapas de la construcción del test psicológico: 51
2.4. Fuentes de sesgo en la construcción del test 60
Autoevaluación 61
Actividades para el estudio independiente 62
Bibliografía complementaria 62
Objetivos 63
Contenido 63
Indagando saberes previos 64
Desarrollo temático:
3.1. Confiabilidad 65
3.1.1. Definición. El concepto de confiabilidad en la TCT 65
3.1.2. Factores que afectan la fiabilidad. 66
3.1.3. Dimensiones de la confiabilidad 67
3.1.4. Métodos para verificar la confiabilidad 68
o a. Test retest. 69
o b. Formas equivalentes 69
o c. División en mitades 69
o d. De covarianza de ítems: 71
– d.1.Kuder-Richardson 71
– d.2Coeficiente Alfa 72
o e. Confiabilidad entre examinadores 73
3.2. Validez 75
3.2.1. Definición 75
3.2.2. Factores que afectan la validez. 76
3.2.3. Métodos para evidenciar la validez 77
o a. Evidencias de validez basadas en el contenido 78
o b. Evidencias de validez basadas en el proceso de respuesta 79
o c. Evidencias de validez basadas en la estructura del test 80
o d. Evidencias de validez basadas en la relación con otras variables 81
o e. Evidencias de validez basadas en las consecuencias de la aplicación 83
6
3.3.1. Definición 84
3.3.2. Tipos de normas 85
Autoevaluación 90
Actividades para el estudio independiente 91
Bibliografía complementaria 91
Objetivos 92
Contenido 92
Indagando saberes previos 93
Desarrollo temático:
Autoevaluación 120
Actividades para el estudio independiente 121
Bibliografía complementaria 121
Referencias 122
Anexos
7
INTRODUCCIÓN
Los Tests psicológicos son las herramientas que contribuyen a la eficacia de las
(2008), solo el 23% de los tests psicológicos para la evaluación de la salud mental que
preocupante en la medida que 77% de estas pruebas que provienen del extranjero están
siendo usadas mermando la objetividad de las evaluaciones. Por otro lado, Livia y Ortiz
(2014) expresaron que el psicólogo con mucha frecuencia suele aplicar pruebas
corresponden a nuestra realidad. Son enfáticos al señalar que “Como balance del
realidad, además de carecer de una política de control que norme su uso adecuado y
coherentes con nuestra realidad sociocultural, la adaptación es una buena opción, pero
8
En ese sentido el Texto propuesto es un aporte para la comprensión de los
psicológicos, reúne la información clásica y actualizada sobre este proceso, con una
de las pautas para la publicación científica del test construido. Las que se
desarrollan a continuación.
9
CAPITULO I
TEORIA DE LA MEDICION Y LOS TESTS PSICOLÓGICOS
Objetivo :
Contenidos:
10
Indagando saberes previos:
2. Los Test psicológicos deben cumplir con ciertos requisitos, elija estos
requisitos:
( ) Validez ( ) Confiabilidad ( ) Originalidad ( ) Estandarización
11
Desarrollo temático:
1.1.Medición psicológica.
1.1.1. Antecedentes.-
Para Ramos (2018) muchos fueron los proyectos psicométricos que se desarrollaron en
respuestas a estas preguntas contribuyendo así al desarrollo de la Psicología como ciencia y
como práctica. Desde el interés por identificar las diferencias individuales; el estudio de los
procesos psíquicos en el laboratorio como lo hacía Wundt (1879); el establecimiento de
tipologías antropométricas, la introducción del concepto de test mental de Cattell (1890), la
evaluación de las funciones psíquicas superiores a través de la escala Binet-Simon y los aportes
matemáticos de Pearson y Spearman hasta el desarrollo de las técnicas proyectivas para el
estudio de la personalidad, inspiradas por las teorías freudianas. Estas y otras investigaciones
marcaron el auge y el desarrollo de los dos modelos de evaluación psicológica, el modelo
proyectivo y el modelo psicométrico. El modelo psicométrico toma su más fuerte impulso con
el precedente de la prueba de inteligencia de A. Binet, y ante los requerimientos para clasificar
y seleccionar a los soldados con las mejores habilidades para el contexto de la Primera Guerra
Mundial (1914-1918), encuentra sentido la pregunta: ¿qué es lo que se debe medir?, si bien los
soldados ya se estaban seleccionando desde criterios de resistencia y salud física, pero esto no
era suficiente para garantizar su óptimo desempeño. Una vez aclarado el qué medir, se hizo
necesario formular procedimientos de cómo medir, y por supuesto con qué ejecutar este
procedimiento.
¿Qué se mide?, según Muñiz (2018) se mide constructos teóricos, entendido como
“sistema de proposiciones que se relacionan entre si formalmente y se relacionan con los
fenómenos observables por medio de reglas de correspondencia entre la teoría y la conducta”
12
Ejemplos de ellos son: ansiedad, aptitud matemática, inteligencia, personalidad, Etc .En
adelante, los constructos teóricos serían el objeto de estudio de la psicometría y se abordarían
desde las teorías de la medición: la Teoría Clásica, la Teoría Operacional y la Teoría
Representacional
13
Swerdlik, 2001) la medición es el acto de asignar números o símbolos a características de los
objetos (personas, eventos, u otro) de acuerdo con reglas. Las reglas usadas al asignar números
son lineamientos para representar la magnitud (o alguna otra característica ) del objeto que se
está midiendo.
Las mediciones no son uniformes, algunas conllevan procesos simples otras suelen ser
complejas, pues van a depender de la naturaleza de los hechos, si consideramos que cada ciencia
tiene su propia clase de objetos, se hace evidente las diferencias en las mediciones, no es lo
mismo medir el peso de un niño de 6 años que su capacidad para la lectura y aprendizaje, por
eso es que se suele hablar de mediciones directas e indirectas. En el caso de la Psicología, la
mayoría de nuestras mediciones suelen ser indirectas, sabemos que el atributo o característica
psicológica existe pero la única forma de medirla es infiriendo a través de sus efectos ante
estímulos diversos.(Alarcón, 1991, Fuentes 2001)
14
operacionalización de estos atributos es un tema sensible para la medición psicológica, por citar
un caso; nos hemos encontrado con múltiples definiciones acerca de la inteligencia, no existe
indicadores estandarizados para este rasgo pues en cada espacio o contexto en el que se mida,
vemos que los indicadores suelen variar, algunas otorgan más peso a un indicador o incluso
obvian algunos otros. (Alarcón, 1991). Por parte de los instrumentos, pues si no podemos
minimizar el hecho de que algunos de ellos reúnen serias deficiencias en cuanto a sus procesos
de construcción. Sin embargo, hay que rescatar los esfuerzos que los científicos de la psicología
y los psicometristas en particular vienen haciendo por minimizar los sesgos de la medición
psicológica, aun cuando no serán perfectas y exactas se han ido generando técnicas que
otorguen a nuestras mediciones la validez y consistencia necesaria.
c. Son más bien relativas que absolutas.- Según Brown (1980) este principio asume dos
acepciones.
En primer lugar, es oportuno precisar que la psicología de la personalidad ayudó
mucho al señalar que los rasgos psicológicos del ser humano tienden a ser algunos
estables en el tiempo y otras son de carácter temporal, estacionario u ocasional. Que
algunos rasgos van acompañar al ser humano desde el nacimiento hasta su vejez, en
tanto otros son de vigencia temporal y que las personas lo presentarán debido a la
influencia de situaciones biológicas o ambientales no previstas, que estos rasgos suelen
estar presentes por un tiempo limitado (Engler, 1996). Es por eso que es común escuchar
decir a algunos psicólogos, que una adolescente está atravesando por un estado de
ansiedad no siendo esto un rasgo de su personalidad, y que este estado se debe a una
experiencia de un asalto en el bus y que en cuanto termine su proceso terapéutico, la
adolescente mostrará bajos niveles de ansiedad. Por todo lo dicho, se puede concluir que
nuestras mediciones psicológicas no tendrían el carácter de ser eternos. Muchos
atributos psicológicos pueden aparecer, mejorar o deteriorarse durante el proceso
evolutivo o por la influencia de factores ambientales. Esto nos compromete a que las
mediciones psicológicas individuales o grupales deben ser actualizadas siempre que se
puedan. Brown (1980).
El hecho de que los resultados de las personas evaluadas deben ser comparadas
con el desempeño de otras personas (propio de la Teoría clásica de los tests), nos lleva
a la segunda acepción de este principio. Que debemos ser muy cautelosos en este
proceso de comparación, el principio de las diferencias individuales permite entender
que no existe un estándar único de desempeño esperado, que cada grupo a partir de cual
se genera las normas estadísticas de comparación son únicos y no podrían ser
considerados de carácter universal. Aun cuando las mediciones físicas tienen
16
instrumentos y unidades de media universal, suelen tener excepciones, por ejemplo,
medir la gravedad no es lo mismo medirlo cerca de la línea del ecuador que medirlo en
el polo norte. Esto significa que hay que contextualizar los procedimientos de
comparación y la clasificación. Para una madre que vive en contextos de pobreza no es
agradable que diagnostiquemos el nivel intelectual de su hijo comparándolo con los
niveles intelectuales de niños de una Escuela de Canadá, donde por cierto los niños no
vienen de hogares con limitaciones económicas alimentarias. Brown (1980).
Estos principios están asociados al respeto pleno que se merecen quienes son
expuestos por muchas razones a procesos de medición psicológica. Esto significa que
es inevitable pensar que cada vez que medimos conociendo la naturaleza de nuestras
mediciones nos permitamos en todo sentido preservar por sobre todas las cosas el
bienestar emocional de los evaluados y estos principios nos ayudarán a esforzarnos
porque estas mediciones sean los más exigentes, exactos y objetivos posibles, pero
también lo más respetuosos.
17
La primera ventaja, es la objetividad entendida como la capacidad de efectuar
mediciones libres de los intereses, prejuicios, supuestos o meras opiniones personales.
La objetividad nos va a permitir medir y respetar los resultados tales cuan son, va a
minimizar cualquier intención de favorecimientos individuales o grupales, asimismo va
a permitir que los resultados sean contrastados por otros evaluadores y sin lugar a dudas
contribuye a que el método inductivo pueda reunir las evidencias para emitir
conclusiones de carácter general.
19
supone que son exactos. La medición puede clasificarse además con respecto a la
cantidad y tipo de información cuantitativa que posee el numero asignado Se distinguen
cuatro niveles de medida. Las escalas de medición son el resultado de la aplicación de
un modelo a un proceso de medida. Fuentes, J. (2001)
Stevens (1946) citado por Fuentes (2001) según las propiedades comunes dentro
de la escala numérica, distinguió cuatro tipos de escalas de medición: nominal, ordinal,
intervalo y razón. La clasificación se basa en las diferentes reglas usadas para asignar
numerales a los objetos. Para Alarcón (1991) cada escala corresponde a un nivel de
medida diferente; asimismo, a las mediciones realizadas con cada tipo de escala son
aplicables determinadas operaciones estadísticas.
20
ordena un conjunto de objetos o personas de mayor a menor con respecto a un
atributo. No hay indicación en sentido absoluto de cuánto de ese atributo posee
cualquiera de los objetos. No hay indicación de cuán alejados están los objetos del
atributo.
Permiten la clasificación, pero también un ordenamiento en rangos de alguna
característica, estas escalas permiten expresiones de tipo “mayor que” o “menor que”,
además de la relación de equivalencia, se pueden clasificar los objetos en función de
posición respecto de los demás. Los datos obtenidos mediante la aplicación de las
características de esta escala no aportan nada sobre el cuanto del atributo que posee cada
objeto, ni tampoco sobre la diferencia que existe entre ellos. (fuente, 2001). Los
estadísticos que pueden utilizarse son Mediana, Percentiles, Correlación de Spearman,
Correlación de Kendall.
22
Figura 1
Resumen de las características de las escalas de medición
23
1.2. Los Tests Psicológicos:
1.2.1. Definición.
Los tests psicológicos son una de las herramientas que junto a la entrevista y
observación, los psicólogos disponen para acompañar sus procesos de evaluación con
distintos propósitos. (Gonzáles, 2007 y Aragón, 2011)
El término Test fue introducido por el psicólogo inglés McKeen Catell en 1980;
significa prueba, reactivo, ensayo, comprobación (Aragón 2011), desde entonces se han
propuesto una variedad de definiciones como la de Yela, 1980, Brown, 1980, Cohen y
Swerdlick (1996); Anastasi, y Urbina, 1998; Gregory, 2001; Hogan, 2004, Fernández et
al, 2016; pero todas ellas tienden a coincidir en que un test psicológico es un
procedimiento sistemático que permite medir de manera objetiva una muestra de
conducta para compararla con un grupo normativo.
1.2.2. Características.
Según Anastasi y Urbina (1998) los tests psicológicos deben cumplir éstas
24
característica: estandarización, objetividad, validez y confiabilidad, pues en ellas dan
evidencias de su rigor científico garantizando su calidad. Estas características son
tomadas en cuenta por quien construye la prueba, por los editores, por las empresas que
los comercializan y por la comunidad psicológica.
25
errores de medición aun cuando no es posible controlarlos en su total magnitud, al
menos son mínimos.
Para Cohen y Swerdlik (2001), estos supuestos ayudan a entender que los tests
y evaluación psicológica son conceptos dinámicos que van a estar susceptibles a
constantes discusiones, abiertos a nuevas explicaciones, por lo que no son temas
cerrados. Pero que resultan valiosos en la medida en que, así como pueden ser referentes
en el uso de los tests y en los procesos de evaluación psicológica también son temas que
interesan a la comunidad psicométrica en particular y son motivos de investigaciones
psicométricas.
Figura 3
Flujograma del proceso de medición con los tests psicológicos
En esta figura, se aprecia algunos requisitos mínimos que debe cumplir quienes harán
uso de cualquier test psicológico. Así, conocer el test psicológico en lo referente a sus
antecedentes, finalidad, características, bases teóricas-conceptuales, tipos e índices de validez,
confiabilidad, así como los materiales. Asimismo, se debe conocer las características
27
psicosocioculturales y variables del examinado que puedan afectar sus resultados. También,
anticipar las condiciones físico-ambientales donde se recogerá la muestra de conducta.
Obviamente, el examinado debe demostrar competencias para la observación, análisis y
síntesis; relaciones interpersonales, demostrando actitud objetiva comprensiva y de respeto
absoluto, por las personas a evaluar. (Arias-Barahona y Jesús, 1996)
Usar un test psicológico implica tres momentos claves: administración, calificación y
clasificación e interpretación de los resultados, cada una de estos momentos, comprenden
procedimientos que podemos apreciar en la Figura y las que a continuación los describimos:
1.2.5. Clasificación
a. Según el propósito:
- Usos Teóricos vs. Aplicados: Los tests psicológicos pueden usarse para desarrollar
teorías psicológicas. Pues son las herramientas más objetivas que permite a los
investigadores recabar datos para la contratación de hipótesis científicas. Sabemos que
la construcción de una teoría se sostiene en constantes mediciones sensibles a la
verificación, y efectivamente los tests contribuyen a estas exigencias y es reconocido su
uso con fines de actualizar, corregir o profundizar algunos conocimientos teóricos.
Brown (1980)
Por otro lado, los tests psicológicos son reconocidos por su apoyo permanente a la toma
de decisiones de carácter individual o grupal, en distintos contextos: llámese educativo,
29
clínico, empresarial, social, judicial, deportivo, etc. Su uso aplicativo se evidencia más
en el uso que los psicólogos hacen de ellos en su práctica profesional, los van a requerir
para apoyar sus diagnósticos, para medir efectos de sus terapias o efectos de programas
preventivos por ejemplo. Nada más que es importante señalar que los tests por si solos
nunca serán suficientes para entender la complejidad del comportamiento humano,
desde esa perspectiva sólo son un buen medio auxiliar y de apoyo para situaciones
aplicativas. Brown (1980)
- Usos Predictivos vs. Descriptivos: En algunas situaciones, se utilizan las pruebas para
proporcionar descripciones de un individuo o grupo humanos. Por ejemplo, suelen
usarse para describir rasgos de personalidad, capacidades o habilidades cognitivas,
interés vocacionales y profesionales, perfil de desarrollo motor, etc. Estas descripciones
pueden ser a modo de tamizaje como a modo de análisis de varios rasgos, permiten tener
la caracterización de los atributos a nivel individual o grupal para poder conocer y
comprender su dinámica, teniendo como dice Brown (1980) una utilidad limitada. Sin
embargo, los tests pueden ayudar a anticipar la ocurrencia de un atributo psicológico,
por ejemplo predecir las aptitudes para ciertos aprendizajes o el riesgo de desarrollar
adicciones, por lo que ayudaría a ejecutar acciones de fortalecimiento o de prevención.
- Ejecución Máxima vs. Típica: Brown (1980) los tests de ejecución máxima, tienen el
propósito de medir la capacidad de rendimiento máximo posible de una persona, todas
las pruebas de rendimiento, aptitudes y habilidades pertenecen a este grupo. En
contraste, las medidas de ejecución típica suelen evaluar las reacciones y conductas
habituales de una persona, en este grupo se encuentran las pruebas de personalidad,
intereses y actitudes, una distinción común que suele ocurrir desde esta perspectiva
son las pruebas de inteligencia y las pruebas de personalidad.
b. Según el contenido
Referido al área de la psicología a la que pertenecen los fenómenos psicológicos que se
pretende medir. En términos generales pueden agruparse en tests orientados a la
evaluación de las habilidades cognitivas, la personalidad y las actitudes. (Anastasi y
Urbina, 1998; Meneses et al, 2013)
30
c. Según el formato
Teniendo en cuenta los materiales utilizados es frecuente distinguir los tests de lápiz y
papel, cuando se presentan los ítems en papel y se requiere que la persona dé su
respuesta escrita. Los tests computarizados, a pesar de que no usan el papel podrían ser
incluidos en esta categoría en cuanto que exigen respuesta escrita, pero por medio
electrónicos, los tests de manipulación, aquellos que presentan una serie de objetos,
imágenes o rompecabezas que las personas los resuelven para demostrar su habilidad y
los tests de medidas fisiológicas, en las que se utilizan sensores de distinto tipo para
registrar las reacciones de las personas ante los estímulos físicos presentados. (Anastasi
y Urbina, 1998; Meneses et al, 2013)
Figura 4
Áreas de acción de la Psicometría
33
A continuación, se desarrolla los lineamientos más significativos de la Teoría de
los tests, toda vez que está referido a la construcción de los mismos y es importante
conocer los Modelos que históricamente subyacen a esta área de la Psicometría, nos
referimos a la Teoría Clásica de los Tests (TCT) y a la Teoría de respuesta a los ítems
(TRI)
Puede ser de ayuda precisar que en este Modelo se definen tres conceptos
fundamentales: puntuación verdadera, puntuación empírica y el error de medida
(Meneses et al, 2013). El objetivo central de este modelo es “la estimación de los
posibles errores cometidos cuando se utilizan los tests para medir variables
psicológicas” (Muñiz,1996, 2018). Esto alude al hecho de que cada vez que
34
medimos variables o atributos psicológicos haciendo uso de los tests no tenemos la
certeza de si el puntaje obtenido por la persona evaluada se corresponde con su
puntuación real y cuanto de ese puntaje ha sido influenciado por variables extrañas,
a las que se les nomina errores de medición. Considerando que todo puntaje o valor
empírico suele mezclarse con los errores de medición, se necesita un modelo para
estimar los errores de medida tanto en la Psicología como en las otras ciencias,
teniendo claro que los errores no son observables directamente cuando se utiliza un
instrumento de medida.
Tabla 1
Formulación del modelo lineal clásico
Modelo X=V+e
Supuestos V = E(X).
p (v,e) = 0
p (ej, ek) = 0
Definición Dos tests, j y k, se denominan
paralelos so la varianza de errores es
la misma en ambos y también lo son
las puntuaciones verdaderas de los
sujetos.
Fuente. Muñiz (1996,2018)
El modelo establece que la puntuación que una persona obtiene en un test, que
denominamos su puntuación empírica, y que suele designarse con la letra X, es igual a
la suma de dos componentes, por un lado, la puntuación verdadera de esa persona en
ese test (V) y el error de medida(e) cometido en la medición (Muñiz, 1996,2018). Esta
situación ya se había explicado, primero porque las mediciones en psicología son
indirectas y por ello se hacen susceptibles de estas variaciones (Meneses et al, 2013) y
luego, porque ninguna medición psicológica es perfecta y libre de sesgos, señalamos
también que estos sesgos provienen de distintas fuentes de error, por lo que es
importante asegurar las puntuaciones tanto de la medición empírica como de los errores.
35
Supuesto 1.
Supuesto 2
Supuesto 3
Los errores de medida de las personas en un test no correlacionan con los errores
de medida en otro test distinto: p (ej, ek) = 0. (Muñiz, 1996, 2018). Significaría que, si
aplicamos correctamente dos tests a la misma persona, los errores de medición para cada
aplicación serán aleatorios y no tendrían por qué estar relacionados.
36
Estas asunciones parecen razonables y sensatas, pero no se pueden comprobar
empíricamente de forma directa, serán las deducciones que luego se hagan a partir de
ellas las que permitan confirmarlas o falsearlas (Muñiz, 1996, 2018).
Tabla 2
Deducciones inmediatas del Modelo lineal clásico
Tras cien años formuladas y con muchos resultados empíricos detrás, bien
37
podemos decir hoy que las ideas de Spearman han sido de gran utilidad para la
psicología. Además del modelo y de estos tres supuestos, se formula una definición de
lo que son Tests Paralelos, entendiendo por ello aquellos tests que miden lo mismo
exactamente, pero con distintos ítems. Las puntuaciones verdaderas de las personas en
los tests paralelos serían las mismas, y también serían iguales las varianzas de los errores
de medida. Pues bien, el modelo lineal, junto con los tres supuestos enunciados, y la
definición de tests paralelos propuesta, constituyen el cogollo central de la Teoría
Clásica de los Tests. Se han generado procedimientos que permiten estimar el grado de
error que contienen las puntuaciones de los tests, y se denomina fiabilidad de los Tests.
Si bien la gran mayoría de tests psicológicos han sido creados y analizados desde
la TCT y se constituyen en una buena alternativa para estimar el valor de las
puntuaciones verdaderas a partir de las puntuaciones empíricas, presentan limitaciones
que no las ha podido resolver desde el modelo lineal clásico,
39
a. Curva característica de los ítems
Los modelos TRI asumen que “existe una relación funcional entre los valores de
la variable que miden los ítems y la probabilidad de acertar éstos, denominando a dicha
función curva característica de los ítems” (Muñiz, 1990). Esto significa que la
probabilidad de acertar un ítem sólo va a depender de los valores de la variable medida
por el ítem, por tanto, las personas con distinta puntuación en la variable medida tendrán
distintas probabilidades para superar determinado ítem.
La forma concreta de la CCI viene determinada por el valor que tomen tres
parámetros: a, b y c. Siendo a el índice de discriminación del ítem, b la dificultad del
ítem y c la probabilidad que hay de acertar el ítem al azar. (Muñiz, 2018). Según los
parámetros tomen unos valores u otros se generan distintas formas de curvas, como se
puede ver en siguiente gráfico (Muñiz, 1990)
Figura 6
Parámetros de la curva característica del ítem
40
b. Unidimensionalidad e independencia local
Desde la TRI se postula que “si el modelo es correcto, la probabilidad de
acertar un ítem únicamente dependerá de un factor (de θ), en otras palabras, la TRI asume
implícitamente en su formulación que los ítems destinados a medir la variable θ constituyen
una sola dimensión, son unidimensionales” (Muñiz, 2018)
Modelos
Con los supuestos señalados, según se elija para la Curva Característica de los
Items (CCI) una función matemática u otra y según se tengan en cuenta, uno, dos o tres
de los parámetros de los ítems descritos, se generarán diferentes modelos. (Muñiz,
1990), las funciones matemáticas mayormente elegidas han sido la función logística y
la curva normal acumulada, los que han dado lugar a numerosos modelos, pero se
describirán los que han recibido mayor atención.
41
viene dada por la función logística y contempla dos parámetros de los ítems, el
índice de dificultad b y el índice de discriminación a” (Muñiz, 2018).
En la siguiente Tabla se sintetizan las diferencias y similitudes entre las dos teorías de
los tests, es de apoyo para precisar sus peculiaridades así como las ventajas o desventajas
de cada uno de ellos. La idea es no verlos como Teorías opuestas, después de todo el
constructor de test es el que decide con cuál de los modelos orientara su trabajo,
independientemente de la Teoría creemos que el test es válido, siempre que cumpla con
los otros criterios que demanda este proceso riguroso.
Tabla 3
Diferencias entre la TCT y la TRI
42
Fuente: Muñiz (1997a
Fernández et al (2010) señala que “los que promueven la construcción de tests lo hacen
debido a que se está adaptando estos sin tener en cuenta las numerosas diferencias culturales
existentes entre ambas culturas, siendo la más importante el sesgo de constructo”. Si
asumimos que un test se construye y estandariza para un espacio social con sus peculiares
idiosincrasias y tenemos en cuenta que los rasgos psicológicos tienden a diferenciarnos de una
cultura a otra, pues la adaptación significaría que en mi espacio social un atributo psicológico
se define tal como se define en la cultura de origen del test. Lo que no siempre es real, sino
43
previamente no hay evidencias de que esto puede ser así. Por ejemplo, la asertividad no tiene
la misma concepción en un país democrático que en otro de régimen autoritario.
Autoevaluación:
4. Sobre la teoría de los tests complete a que teoría se refiere los siguientes enunciados:
Trabaja con un modelo no lineal, que se caracteriza por la invarianza de las mediciones así
como de las propiedades de las puntuaciones (_____________________________ ).
Esta teoría se caracteriza por poner énfasis en el test en general y no en los ítems, se centra en
calcular los índices de dificultad y discriminación, trabaja con el modelo lineal, la escala de
puntuación es entre cero y la puntuación máxima (_______________)
5. Argumente por qué es mejor construir un tests psicológico antes que adaptarlo.
____________________________________________________________________
_____________________________________________________________________
___________________________________________________________________
..............................................................................................................
.............................................................................................................
..............................................................................................................
46
.............................................................................................................
..............................................................................................................
.............................................................................................................
..............................................................................................................
.............................................................................................................
..............................................................................................................
.............................................................................................................
Bibliografía Complementaria.
Cohen, R., Swerdlik, M. (2001). Pruebas y evaluación psicológicas: Introducción a las pruebas
y a la medición (4ª ed.). México.
CAPITULO II
PROCESO DE CONSTRUCCIÓN DEL TEST PSICOLÓGICO
Objetivo:
47
Comprende los procedimientos metodológicos establecidos
para el proceso deconstrucción de un test psicológico.
Contenidos:
2.1. Definición
Desarrollo temático:
2.1. Definición.
El capítulo precedente seguramente nos ha permitido comprender la
responsabilidad de los psicólogos cuando usamos los tests para una evaluación, pues
es indiscutible que los resultados del test llevan a tomar decisiones. Ello nos lleva a
pensar, que en todo lo posible debemos seleccionar tests de calidad y un tests será
de calidad desde el momento en que se planifica, se construye y se estandariza para
su uso profesional. (Muñiz y Fonseca, 2019).
49
Cohen y Swerdlick (2001) advierten que “no todas las pruebas se crean igual.
La creación de une buena prueba no es una cuestión fortuita; es el producto de una
aplicación meditada y sólida de principios establecidos de elaboración de pruebas”.
Enfatizando entonces, en que el proceso de construcción de un tests se acompaña de
fundamentos teóricos (de la variable a medir como de las teorías de la medición) así
como las diversas técnicas de análisis matemáticos, que obviamente el futuro
constructor debe conocerlos de manera exhaustiva (Fernández, et al, 2016).
Hasta aquí podemos apreciar que los autores reflexionan sobre el significado
e implicancias de la construcción de tests psicológicos. Tomando como referencia
estas reflexiones podemos postular la siguiente definición:
Figura 7
Etapas del método científico
50
Las publicaciones sobre construcción de Tests dan cuenta de lo dicho anteriormente.
Para ello nos apoyaremos como ejemplo en la revisión de la Tesis de Robles (2020)
sobre la Construcción de una escala de ansiedad social (EANS) y verificar que se cumplió
51
2.3. Etapas del proceso de construcción de un test
Para este texto tomamos como referencia los procedimientos señalados por
la Comisión Internacional de Tests Psicológicos, la misma que fue traducida por
Muñiz (2019).
Tabla 4
Fases del proceso de construcción de un test
52
Fuente: Tomado de Muñiz (2019). Introducción a la psicometría. P.266.
El mismo Muñiz (2019) advierte que estos pasos no son de carácter universal pero
que si son de ayuda para llevar óptimamente cada procedimiento de este complejo
proceso.
Definición de
la variable
Las vinculaciones de estos tres tipos de definición con las técnicas de validez
son trascendentales, por ello deben ser cuidadosamente definidos.
La definición operacional de la variable va a facilitar su medición empírica,
para ello se requiere el soporte de las teorías acerca de la variable y consulta a
expertos, para poder delimitar que es y que no es, identificar con claridad los
comportamientos más representativos, así como identificar sus posibles
dimensiones, del cuidado que se tenga en la definición operacional la redacción de
los ítems serán pertinentes. (Meneses et al., 2013, Muñiz, 2019).
Los ítems pueden ser originales, creados por el constructor, que es lo ideal;
pero también pueden ser tomados de otros tests ya existentes en otras culturas, en
ambos casos deben ceñirse a las directrices de la International Test Commission
(2017). La construcción de tests se rigen por los principios de representatividad,
relevancia, diversidad, claridad, sencillez y comprensibilidad (Muñiz et al., 2005).
55
Los ítems deben ser redactados en la cantidad oportuna acorde a la definición
operacional de la variable, deben ser heterogéneos y variados, evitando los
tecnicismo, dobles negaciones y ambigüedades y comprensibles para la población en
la que se aplicará, para ello el lenguaje ha de ser inclusivo, no ofensivo ni
discriminatorio, se sugiere que para garantiza la comprensión de los ítems, se realice
un estudio piloto. Sobre la cantidad de ítems la sugerencia e que sean e doble de lo
proyectado por la tendencia a que muchos de ellos serán desechados reya sea por el
criterio de expertos, comprensión de los usuarios o indicadores psicométricos.
(Meneses et al., 2013, Muñiz, 2019).
5° Fase: Edición
Para esta fase el constructor debe diseñar e imprimir la primera del test, como
también construir la base de datos con las claves de corrección. Se debe cuidar la
calidad de la presentación del test y sus materiales como el cuadernillo de preguntas
y el protocolo de respuesta, cuidando los criterios de sencillez, elegancia e interés, de
modo que el test sea un factor de motivación para el examinado. Con respecto a la
base de datos, es recomendable tenerlos preparados con las normas de corrección y
puntuación general y/o específica, de modo que facilite la tabulación estadística de
carácter psicométricos como cálculos de coeficientes de validez, confiabilidad,
normas de interpretación, etc. (Meneses et al., 2013, Muñiz, 2019).
6° Estudio piloto
56
Todo estudio piloto o de ensayo, tiene como propósito evaluar el
funcionamiento de un objeto que puede ser un medicamento, un artefacto, un
programa terapéutico, etc., con fines de mejora o prevención de riesgos.
En la fase dos, se hizo mención a que el constructor tenía que generar una
57
definición sintáctica de la variable a medir, que le permita identificar con qué otras
variables podrían estar relacionada la variable de su test. Por lo que, en esta fase,
corresponde a que al autor debe seleccionar aquellos instrumentos que le permitan
evaluar esas otras variables identificadas para aplicarlos a la muestra y poder recoger
evidencias de validez de relación con variables externas, permitiendo así la
construcción de una red nomológica. Los instrumentos seleccionados deben ser los
que reúnan los más altos indicadores de calidad científica como que se encuentren
validados para la población objetivo y den evidencias de las propiedades
psicométricas de sus puntuaciones, que sean sencillos y de rápida administración y
tengan coherencia para insertarse dentro de su red nomológica. (Meneses et al., 2013,
Muñiz, 2019).
En esta fase el constructor del test deberá seleccionar la muestra, aplicar el test
a muestra seleccionada y efectuar el control de calidad y seguridad a la base de datos.
La aplicación del test, para que no sea una fuente de sesgos u errores debe
tener definido el ambiente con buenas condiciones físicas y asegure la comodidad y
privacidad de los participantes, asimismo debe asegurar que el administrador tenga
las competencias personales y procedimentales para aplicar el test. (Meneses et al.,
2013, Muñiz, 2019).
Con los datos obtenidos de la aplicación del Test que se está construyendo,
procede a realizar el estudio de las propiedades psicométricas de las puntuaciones
tales como el análisis de ítems, estimación de la consistencia de las puntuaciones,
obtención de las evidencias de validez y construcción de baremos, los que se efectúan
con altos niveles de rigor metodológico. La finalidad del análisis psicométrico de los
ítems es maximizar o potenciar las propiedades métricas del instrumento de medida
En esta fase, se elabora la versión definitiva del test, se informa a las partes
implicadas en el proceso de evaluación y se redacta el manual del test.
Muñiz (2019) alcanza dos recomendaciones, primero no dar por terminado el proceso
de validación del test en esta fase, se debe promover estudios de revisión de
propiedades psicométricas sea con la misma población u otras de otros contextos, de
modo que permita valorar la vigencia del test. En segundo lugar, recomienda que se
efectúe una evaluación rigurosa y sistemática del test construido utilizando el Modelo
de Evaluación de Test elaborado por la European Federation of Porfessional
Psychologist Associations (EFPA) adaptado a España por Hernández et al (2016),
este Cuestionario será desarrollado en el cuarto capítulo del presente texto.
No se ha accedido a una publicación en estricto que de cuenta de las fuentes de sesgo que
afectan a la construcción de un test psicológico, por lo que teniendo como referencia los diez
pasos propuestos por Muñiz (2019) para la construcción de un instrumento de medición
podemos señalar que las fuentes serían:
60
Tabla 5
Principales fuentes de sesgo en la construcción de tests
Autoevaluación:
Ficha Resumen
Título:
CONSTRUCCION Y VALIDACIÓN DE UNA ESCALA DE AUTOEFICACIA PERCIBIDAESPECIFICA
DE SITUACIONES ACADÉMICAS.
URL file:///C:/Users/Equipo/Downloads/Dialnet-
ConstruccionYValidacionDeUnaEscalaDeAutoeficaciaPe-
7101317%20(1).pdfn
Autor David Palenzuela
Nombre del Escala de Autoeficacia Percibida Especifica de Situaciones Académicas
instrumento (EAPESA)
Proceso de 1. Elaboración de ítems
construcción 2. Tipo y formato de puntuación
3. Aplicación y sujetos
4. Evaluación y selección de ítems
4.1. Evaluación de ítems por su frecuencia de afirmación
4.2. Evaluación de los ítems por su saturación de contenido convergente y
discriminativo
4.3. Evaluación de la deseabilidad social: El índice de fiabilidad diferencial
4.4. Evaluación de la Fiabilidad, Consistencia interna y homogeneidad.
4.5. Evaluación de la validez factorial
5. Validez empírica de la Escala construida
5.1. Validez concurrente o inspectiva
5.2. Validez predictiva o prospectiva
5.3. Estudio de laboratorio
5.4. Validez retrospectiva
62
Propiedades psicométricas de la escala de autoeficacia percibida específica de
situaciones académicas en adolescentes peruanos
Jhonatan S. NAVARRO-LOLI y Sergio DOMINGUEZ-LARA (2019)
https://reader.elsevier.com/reader/sd/pii/S1575181320301595?token=5BEFB
D78CF9406FAE37DE2E31680BA1FA6D0E0DC71A9490E1A061B5A0488
40F8785D7E6AEFED96FB8F7615A278D08701&originRegion=us-east-
1&originCreation=20210505033518
Bibliografía Complementaria.
Cohen, R., Swerdlik, M. (2001). Pruebas y evaluación psicológicas: Introducción a las
pruebas y a la medición (4ª ed.). México.
63
CAPITULO III
PROPIEDADES PSICOMÉTRICAS DEL TEST
CONSTRUIDO
Objetivo:
Contenidos:
3.1 Confiabilidad
3.2. Validez
PROPIEDADES
PSICOMETRICAS
3.3. Normas de tipificación
64
Indagando saberes previos:
65
Desarrollo temático:
3.1. Confiabilidad
En el capítulo anterior se señaló que las mediciones psicológicas deben ser fiables, libres
de errores de media, que de por si es una exigencia de la ciencia; por lo que los instrumentos
que se utilizan para estas mediciones tendrían que ser fiables también, es decir que las
mediciones que se hacen con ellos carezcan de errores de medida, que sean consistentes. Pero
también se había señalado que a diferencias de las ciencias naturales en psicología nuestras
variables no son fáciles de medir debido a su naturaleza y dinámica, lo que dificulta identificar
si la inestabilidad en la medición se debe al instrumento o a la variable per se o a otros
factores. Un test no sería fiable si cada día generase mediciones diversas de una variable que
se supone estable, frente a esta situación es tarea del psicólogo indagar por las posibles fuentes
de error en las mediciones (Muñiz, 2018) y lo puede hacer desde la Teoría clásica de los tests
o Teoría de respuesta a los ítems. Nosotros lo haremos desde la TCT, que es el modelo más
utilizado no solo en la construcción de tests sino en la verificación de sus propiedades
psicométricas.
Se había señalado que el objetivo central del modelo lineal clásico es la estimación de
los posibles errores cometidos cuando se utilizan los tests para medir las variables
psicológicas (Muñiz,2018), pues estos errores influyen en los puntajes de las personas y no
olvidemos que son estos puntajes los que nos llevan luego a tomar decisiones, por eso el
interés de asegurar la confiabilidad de los mismos.
66
de la TCT se expresa como: Oi = Vi + Ei (Muñiz, 2018, Tornimbemi, 2014)
En la teoría clásica de los tests, “la confiabilidad puede expresarse como la proporción
de varianza observada de las puntuaciones de tests que se debe a la varianza verdadera (la
variabilidad de la puntuación verdadera), es decir, a la varianza del rasgo que se está
evaluando y no a otros factores” (Cohen y Swerdlik, 2001). Entre mayor es la varianza total
atribuida a la varianza verdadera, la prueba es más confiable, debido a que se supone que las
diferencias verdaderas son estables, se presume que producen puntuaciones consistentes en
aplicaciones repetidas de la mismas pruebas al igual que en formas equivalentes de las
pruebas. Debido a que la varianza de error puede incrementar o disminuir una puntuación de
prueba en cantidades variables, se vería afectada la consistencia de la puntuación, y por tanto
la confiabilidad (Tornimbemi, 2014).
Según la APA (1999) citado por Tornimbeni, (2014) la confiabilidad como la validez
so son características del test per sé, sino una propiedad de las puntuaciones del test cuando
éste se administra a una muestra específica y bajo condiciones particulares, esto acorde a la
Teoría clásica de los tests.
67
está estandarizado en todos sus procedimientos, es inevitable la ocurrencia de este tipo de
errores.
68
estables. Si, en cambio, se evalúan estados de ánimo o tiempos de reacción, no resulta
relevante atender a la estabilidad temporal de la prueba, ya que teóricamente se espera una
modificación de los resultados al aplicarla en distintas ocasiones. Los procedimientos
indicados para evaluar la estabilidad temporal de una prueba son el método test-retest y el
método de formas equivalentes, cuando ambas formas del test son aplicadas con un intervalo
de tiempo (APA, 1999).
Todos los métodos disponibles para valorar la confiabilidad de un test tienen como
objetivo informar sobre el grado de consistencia de los puntajes y son expresados en función
de un coeficiente de correlación cuyo valor varía entre -1 y 1, donde 0 representa la ausencia
total de correlación entre los puntajes, indicando además si la correlación es positiva o
negativa perfecta o inversa, el coeficiente más utilizado es el de correlación Momento-
producto de Pearson, sin embargo hay que señalar que la elección del coeficiente dependerá
del nivel de medición de la variable (Anastasi y Urbina, 1998).
69
A continuación se describen los principales métodos.
a. Test-retest:
b. Formas equivalentes:
70
pueden ser evaluadas con una forma en la primera ocasión y con otra equivalente en
la segunda. La correlación entre las puntuaciones de las dos formas representa el
coeficiente de confiabilidad de la prueba, que no solo mide la estabilidad temporal,
sino también la consistencia de las respuestas a diferentes muestras de reactivos
(Anastasi y Urbina, 1998). Una ventaja primordial de usar una forma alternativa o
paralela esque se minimiza el efecto de la memoria para el contenido de una forma de
prueba aplicada con anterioridad. (Cohen y Swerdlik (2001),
Este método requiere la aplicación del test una sola vez por lo que la
confiabilidad se basa en la consistencia de las puntuaciones a todos los reactivos de la
prueba. Anastasi y Urbina (1998) señalan que “esta consistencia entre reactivos está
influida por dos fuentes de varianza de error: (1) el muestreo de contenido (…) y (2) la
heterogeneidad del área de la conducta muestreada. Entre más homogénea sea el área
mayor será la consistencia entre reactivos”.
Efectivamente, esta es una peculiaridad entre los tests psicológicos, tenemos
tests que miden una sola variable como una sola dimensión en tanto otras miden una
variable con múltiples dimensiones o facetas, por lo que deduce que este método sería
más pertinente con aquellos que evalúan ítems homogéneos correspondientes a una sola
dimensión. Y que éstos ítems sean de carácter dicotómicos, que sean calificados como
correctos o equivocados, como si o no, verdadero o falso. (Cohen y Swerdlik, 2001)
72
La fórmula de Kuder Richardson (KR-20), es:
73
obtener indicadores de la consistencia interna muy semejantes al coeficiente α. Aun
cuando el propio resultado del análisis factorial constituye un excelente indicador de
la consistencia interna de los ítems, analizando la matriz de correlaciones, el número
de factores obtenidos y la varianza explicad por cada uno de ellos. Sin embargo, es
aportativo la obtención de algún índice único que sintetice de forma razonable toda
esta información, contando para ello los índices theta (Ɵ) de Carmines y la omega
(Ω) de Heise y Bohrnstedt (1970).
Para finalizar, presentamos una tabla que resume los métodos y estadísticos
para evidenciar la confiabilidad, considerando sus diversas dimensiones:
75
3.2. Validez
3.2.1. Definición
“el test no se valida sino las inferencias que se hacen a partir de sus puntuaciones
sobre determinados aspectos de la conducta de las personas. Por tanto, el resultado final
de un proceso de validación no es llegar a decir de forma simplista que tal test es válido;
76
las que son o no válida son las inferencias hechas a partir del test”.
77
Tabla 6
Principales factores que afectan la validez de los tests
La Tabla 6, detalla que los factores que podrían atentar contra la validez del test mayormente
son de tipo estadístico, esto significaría que el constructor del tests como los que se dedican a
realizar estudios de las propiedades psicométricas del instrumento, deberían conocer y
comprender no solo los modelos matemáticos sino las técnicas y herramientas estadísticas que
procesan los datos para evidenciar los índices de validez y confiabilidad. Incluso, contar con
procedimiento que aseguren la calidad de los puntajes que se van a procesar cuantitativamente.
78
Tabla 7
Evolución histórica de los métodos de validación
Los ítems son elementos cruciales de todo test, y es importante asegurar que sean los
más pertinentes, relevantes y representativos de la variable que se pretende medir. Para la
validación de contenido puntualmente se requiere dos condiciones, una sólida definición
teórica y operacional del constructo y su correcta representación en el test, a través de la
calidad de los ítems. (Lozano y Turbany, 2013; Muñiz, 2018), de que la muestra de ítems
incluida en el test cubra, efectivamente , todos los aspectos o dimensiones relevantes de la
variable en estudio o a ser medida (Fernández, 2016).
79
análisis estadístico, pues éste no es capaz de ponderar el real significado del ítem en cuanto a
su significado, comprensión, percepción y pertinencia.
Es interesante también considerar lo que señala Abad (2011) precisando que por
contenido del test no solo debemos referirnos únicamente a los ítems que lo componen sino
también a las instrucciones para su administración y las rúbricas o criterios para su corrección
y puntuación.
La validación por juicio de expertos, es una de las técnicas más utilizadas sobre todo
en procesos de construcción de tests, pues ellos se constituyen en los garantes de que cada
ítem del tests son coherentes con las definiciones operacionales, semánticas y sintácticas del
constructo, pues son los expertos teóricos en el constructor, de ahí que se debe realizar una
cuidadosa selección de ellos. La literatura nos presenta muchas técnicas para este tipo de
validación siendo la más popular en nuestro medio el coeficiente de validez V de Aiken
(Escurra, 1988).
La información que se puede obtener sobre los procesos que los evaluados describen
para justificar su respuesta son un excelente apoyo en el proceso de validación de la prueba,
y las estrategias que se pueden utilizar para aportar datos sobre los procesos subyacentes a las
respuestas de las personas según Muñiz (2018) van desde preguntar a las mismas acerca de
su proceder y observar los pasos sucesivos (siempre que sea posible) que les conducen al
resultado final hasta utilizar observadores externos o incluso, analizar en laboratorios los
procesos básicos y componentes implicados en la respuesta de cada ítem. En esa línea, Lozano
80
y Turbany (2013) proponen la entrevista, las técnicas de pensamiento en voz alta y entrevistas
cognitivas y advierten que se debe vigilar algunos factores que pueden afectar al proceso de
las respuestas como los relacionados con los ítems (contenido, redacción y validez aparente),
los relacionados con la respuesta a los ítems (número de alternativas e instrucciones) y los
relacionados a las características personales de los que responden al test.
Para Muñiz (2018) “los datos sobre la estructura interna del test pretenden evaluar en
qué medida el test constituye un constructo coherente y riguroso y no se trata simplemente de
un conjunto espurio de ítems”. Dicho de otra forma, se evalúa hasta qué punto los ítems
contribuyen a un solo factor (unidimensionalidad) o a varios factores (multidimensionalidad) y
la técnica estadística que ayudará para este tipo de estudios es el análisis factorial. (Lozano y
Turbany, 2013) que examinan si las relaciones entre los ítems se corresponden con las
hipotetizadas.
El funcionamiento diferencial de los ítems (DIF) es también otra alternativa para evaluar
la estructura interna del test. Estos análisis tratan de asegurar que los ítems funcionan de forma
similar para diferentes grupos socioculturales, independientemente de su edad, sexo, raza,
idioma, etc. no favoreciendo o perjudicando a unos frente a otros. Los datos del DIF se tornan
81
claves para apoyar conclusiones sobre la validez y universalidad de una prueba. (Abad et al.;
2011 y Muñiz, 2018).
Las estrategias para la obtención de datos desarrolladas hasta este momento se centran
en aspectos internos del test; el análisis de su contenido, los procesos implicados en sus
respuestas a los ítems o la estructura interna del test. De aquí en adelante se desarrollan nuevas
estrategias para obtener evidencias, y están referidas a la conexión del test con distintas
variables externas a él.
Aportar datos sobre el grado en el que un test converge con otras mediciones del
mismo constructo, o diverge con aquellas de constructos diferentes, sigue siendo
fundamental en su proceso de validación. Las evidencias de validez convergente y
discriminante pueden obtenerse a partir de los datos proporcionados por la llamada
82
matriz multirrasgo-multimétodo. (Lozano y Turbany, 2013)
Dícese haber validez convergente si las correlaciones entre las medidas de un
rasgo por distintos métodos son elevadas, es decir, las medidas de un mismo rasgo
convergen, aunque se haya hecho por diferente método. La validez discriminante, se
refiere a que las correlaciones anteriores entre las medidas del mismo rasgo por distintos
métodos han de ser claramente superiores a las correlaciones entre las medidas de
distintos rasgos por el mismo método.
Los tests son de gran ayuda para los psicólogos por su capacidad de predecir
aspectos claves del comportamiento humano, la base de estas predicciones descansa en
las correlaciones entre el test y la variable a predecir, el criterio. La correlación entre el
puntaje del test y el criterio se denomina coeficiente de validez. (Muñiz, 2018)
83
d.3. Generalización de la validez
Lozano y Turbany (2013) nos recuerdan que en toda aplicación de tests existen
acciones que se derivan de esa aplicación, para ellos tests deben usarse cuando se
maximicen las consecuencias positivas (beneficios) y se minimicen las negativas (costes)
derivadas de su aplicación. Los tests se aplican entonces esperando que de la información
obtenida se extraiga algún tipo de beneficio. Por lo que, uno de los propósitos de la
validación sería indicar en qué casos se puede obtener esos beneficios.
84
de incorporarlo como estrategia, pero otros señalan que es mejor incorporarlo para que le
valore como tal el buen uso de los tests considerándolo que las consecuencias de su buen
o mal uso afectarían a la validación.
3.3.1. Definición
85
La normalización de una prueba con una muestra representativa nacional puede
ser muy costosa, poresto, algunos manuales de prueba proporcionan lo que se conoce
como” normas de usuarios o normas de programa (APA, 1985)., las cuales consisten de
estadísticas descriptivas basadas en un grupo de personas que responden una prueba en un
periodo determinado en lugar de normas obtenidas con métodos de muestreo formales.
(Nelson, 1994)
3.3.2.Tipos de normas
86
asimétricos. En la distribución normal, la frecuencia más alta de las puntuaciones
ocurre en medio.
87
respecto, en vista de que, para muchas pruebas, el valor de dichas normas es limitado
con unapoblación adulta.
88
3.4. Softwares para procesar propiedades psicométricas de los tests
psicológico.
Entre los más usados tenemos el:
SPSS es muy fácil de usar. Pero eso no significa que alguien con formación en análisis de
datos cero no tendrá dificultades para usarlo. Simplemente significa que es fácil de usar. Ya
sea que se esté preparando para realizar estadísticas descriptivas, regresión lineal, análisis
de factores o análisis de conglomerados, SPSS lo tiene cubierto.
https://www.youtube.com/watch?v=Ibyg6fc5xrE
https://www.youtube.com/watch?v=mZomeS0tLxY
89
c. Programa AMOS SPSS
90
Autoevaluación:
Caso práctico
1. Confiabilidad:
Tipos de confiabilidad
Coeficientes
2. Validez
Tipos de validación
Coeficientes
3. Comentarios
91
Actividades para el estudio independiente:
https://www.youtube.com/watch?v=J-843QVJYxk
92
CAPITULO IV
PUBLICACION DEL TEST PSICOLÓGICO CONSTRUIDO
Objetivo:
Contenidos
93
Indagando saberes previos:
94
Desarrollo temático:
95
Se aprecia en la Tabla que las diferencias son más de forma que de fondo, en ese
sentido consideramos que la propuesta planteada por Canués y Luna (2010)
contienen los rubros mínimos y necesarios que debe tener un Manual, siendo
éstas:
a. Portada o caratula.
Informa el título del test, el nombre del autor o autores, datos de identificación de
la Institución que avaló la investigación y el año de publicación. Canués y Luna
(2010)
96
b. El título
Debe consignarse de manera completa y si tiene siglas que la identifican, éstas se
ubican después del nombre completo de la prueba, ejemplo:
c. Características Generales
c.1. La ficha técnica:
En ella se describen el nombre original del test, nombre de la adaptación
(si la prueba es de otro país), autores, tipo de administración, tiempo aproximado
de aplicación, características de las personas para quiénes se aplicará el test,
significación, baremación y materiales. Canués y Luna (2010).
Ejemplo:
97
c.3. Elementos teóricos:
En este apartado el autor debe dar a conocer la conceptualización del atributo o rasgo
que mide la prueba así como el modelo teórico en que se fundamenta. Canués y Luna
(2010).
Ejemplo
Describe la cantidad de ítems que consta el test en general, y por cada factor o
dimensión, se recomienda que esta presentación sea en un formato tabla, pues ayuda a
comprender la estructura general y específica del test, incluso se informan con los
porcentajes relacionados con los factores de la prueba y el atributo que se pretende
medir. Canués y Luna (2010).
98
Ejemplos:
Se refiere a que en una Tabla se detalla el número de ítems por factor o dimensión.
Ejemplo:
Hace referencia a los tipos de respuesta del cuadernillo o protocolo del test,
pudiendo ser dicotómicos o respuestas de tipo escalar u de alternativas múltiples,
Ejemplo:
99
e. Instrucciones para la aplicación del test
Instrucciones generales:
Se describe de manera breve las indicaciones y condiciones para la aplicación
del test, tales como las características del lugar de la aplicación, así mismo
algunas instrucciones que debe tener en cuenta el examinador antes de aplicar
la prueba. (Canués y Luna, 2010).
Instrucciones específicas:
Se refiere a los datos que debe reportar el examinado en el cuadernillo de la
prueba y a las pautas de cómo debe responder a cada uno de los ítems, alude
también a las actividades que el examinador debe tener en cuenta durante y al
término de la aplicación del test. (Canués y Luna (2010).
Ejemplo:
100
f. Normas para la corrección y puntuación
Según Canués y Luna (2010), en esta sección se da las pautas para la corrección
del test, si esta se hace de forma manual o mecánica a través de un software por
ejemplo. Y si el tests comprender plantillas de corrección, debe darse las pautas de
cómo deben utilizarse, también debe dar indicaciones del valor que se asigna a cada
respuesta a lo ítems dependiendo de su naturaleza (dirección positiva o negativa),
asimismo dar cuenta en qué situaciones debería eliminarse el protocolo y, finalmente
la forma como se obtiene el puntaje general y puntajes específicos y sus respectivas
asignaciones de nivel del atributo medido.
Ejemplo:
101
g. Justificación estadística
Este espacio detalla las propiedades psicométricas del test, tales como
confiabilidad y validez. Se presentan las tablas que describen los procesos
estadísticos que se utilizaron para estimar los coeficientes de confiabilidad y
validez del test, dependiendo de la técnica utilizada (Canués y Luna, 2010)
Ejemplo:
h. Normas interpretativas
102
se da las indicaciones para manejar los baremos de la prueba que pueden ser por
edades, sexo, grado de instrucción o tal vez sólo un baremo general.
No está de más informar en una tabla sobre los niveles a los que corresponden los
puntales obtenidos y la media y desviación estándar correspondientes. (Canués y
Luna, 2010).
Ejemplo:
103
i. Referencias
104
1.2.Evaluación de la calidad del Test psicológico
Tabla 9
Dimensiones del Cuestionario de Evaluación del Test (CET-R)
Fuente: Hernández, A., et al (2016). Revisión del modelo para evaluar la calidad de los tests
utilizados en España.
105
En la primera parte se aprecia los rubros que necesariamente suele evaluarse de un test
psicológico, rubros de identificación, autoría, características sociodemográficas, características
estadísticas e incluso económicas que deben ser tomados en cuenta por el constructor de la
prueba y por los usuarios para poder decidir su elección acorde a sus propósitos sean
profesionales o de investigación
En la segunda y tercera parte de la Tabla se enuncia los rubros que se valoran pero
desde el ámbito más especializado y técnico-psicométrico. En esta sección se valoran la calidad
del Manual del Test, los reportes y evidencias de la validez, confiabilidad, así como la de las
normas interpretativas (baremos). Y se termina permitiendo al evaluador emitir un juicio acerca
de la valoración global del test, señalando fortalezas, debilidades y recomendaciones de mejora.
Tabla 9
Continuación
106
Al término del proceso de evaluación la valoración del Test puede concluir con la siguiente escala:
Fuente: Hernández, A., et al (2016). Revisión del modelo para evaluar la calidad de los tests
utilizados en España
107
revistas psicológicas y la gran mayoría de editores se ciñen a las normas de publicación
de la American Psichologycal Association (2020) séptima edición, y que es la que
describiremos a continuación:
1. Primera hoja:
Según la Revista Liberabit (s/f). En la primera hoja se ha de consignar el título, los autores,
afiliación institucional, El resumen y abstract así como las palabras claves y en la parte
final se menciona el correo institucional del autor principal. Dependiendo del Estilo de
redacción de la Revista, los editores suelen precisar las características de cada uno, en el
caso que describiremos es según el estilo APA (2020).
Ejemplo:
108
El título, debe redactarse en español e inglés. En formato oración, en altas y bajas.(APA,)
Ejemplo:
109
Sobre los Autores, se consigna primero el nombre seguido por los apellidos. Si son varios
autores, van separados por comas. El autor corresponsal es identificado por un asterisco
(APA,2020)
Ejemplo:
La redacción del resumen y Abstract deben contener 150 a 180 palabras, se redacta en español
y en inglés. Describen los antecedentes, objetivos, métodos, resultados y
conclusiones.(APA,2020)
Ejemplo:
110
Las Palabras clave y keywords. Pueden ser entre 4 a 6 palabras. Se empieza con
minúscula, se separan por punto y coma (;) y termina en punto.
Ejemplo:
El editor de la revista Liberabit ( s/f) señala que el artículo ha de contener: Introducción (no
se considera como subtítulo), Método, Resultados, Discusión, Conflicto de intereses, Responsabilidad
ética, Referencias, Datos del (los) autor(es) y autor corresponsal y Anexos (opcional)
Según la APA (2020) en la Introducción el autor debe redactar el planteamiento del problema,
justificación, antecedentes, marco teórico y precisar los objetivos o las hipótesis de
investigación.
111
del test creado, sus características y las evidencias psicométricas de su validez y confiabilidad.
En los procedimientos, se describen las fases del proceso de construcción del instrumento en
tanto en el análisis de datos se reportan los estadísticos descriptivos e inferenciales que se
utilizaron para los análisis psicométricos y también mencionar el software que utilizó para el
procesamiento de datos. Liberabit (s/f ), APA (2020)
Los Resultados dan a conocer la descripción e interpretación de las propiedades psicométricas del
test construido (validez, confiabilidad, normas de interpretación), se presentan en tablas o figuras.
Liberabit (s/f ), APA (2020)
Ejemplo de la presentación de las tablas
112
Ejemplo de la presentación de Figuras
Figura 1.
Modelo final de 27 ítems y 4 factores y sus coeficientes estandarizados de regresión
113
La presentación de las Tablas y Figuras así como su respectiva descripción e interpretación se
ajustan a los lineamientos de las indicaciones del Manual de redacciones de la APA(2020).
1)
2)
1)
2)
114
La Discusión
En este rubro el autor del test argumenta sus hallazgos teóricos y psicométricos acerca del
test construido. Analiza la trascendencia de sus resultados asimismo comunica las
limitaciones y recomendaciones sobre sus hallazgos. (APA,2020)
Referencias
115
Parte final del artículo, se consigna acerca del autor o autores la siguiente información:
Nombre y apellidos, filiación, breve resumen del autor, ORCID, correo, indicando el autor con
quien se puede mantener correspondencia. En el formato de Notas el autor detallará información
complementaria referida al estudio como conflictos de interés y responsabilidad ética.
Ejemplo
116
Anexos
Es opcional, debe tener numeración correlativa y título. Todos los anexos deben estar referenciados
en el documento y se presenta al final del manuscrito.
Los tests constituyen una de las tecnologías más utilizadas por los psicólogos en
el ejercicio de la profesión como también en el quehacer investigativo. Sin embargo, no
están libres de algunas más prácticas en su uso, por lo que es importante dar a conocer
algunas pautas internacionales dadas por la Comisión internacional de Tests (ITC) para
el buen uso de los mismos.
Los tests deben estar apoyados por datos empíricos sobre su fiabilidad y validez
para medir los objetivos que se proponen, es necesario aportar datos que justifiquen las
inferencias que se hacen a partir de las puntuaciones de los tests, estos datos tendrían
que estar disponibles para os usuarios de los tests, así como para los profesionales e
investigadores.
117
fundamental para el uso pertinente de los tests. Los expertos suelen estar de acuerdo en
que la causa más importante del uso inapropiado de los tests es una formación deficiente
de los usuarios. Los conocimientos deberían ser sobre estas áreas: Teoría de los tests y
propiedades técnicas de los tests como fiabilidad, validez, estandarización, sesgo,
análisis de ítems. Conocimiento de los tests y principios de la medición para entender
adecuadamente los resultados. Conocimientos sobre la teoría, modelos y constructos
medidos que permita una elección pertinente de las pruebas e interpretación de los
resultados asimismo conocer el abanico de tests disponibles, así como los editores
correspondientes así como avances técnicos recientes, tales como los tests
informatizados, banco de ítems, etc.
Sobre el uso ético de los tests: Actuar de forma ética y profesional, asegurarse
de que son competentes para el uso de los tests, responsabilizarse del uso que hacen de
los tests, asegurarse de que los materiales del test están seguros, asegurarse de que los
resultados de los tests se tratan confidencialmente.
Sobre la utilización adecuada de los tests: Estimar la utilidad potencial de los
tests en una situación evaluativa, elegir tests técnicamente correcto y adecuados a cada
situación, prestar atención a los aspectos relacionados con el sesgo de los tests, hacer
los preparativos necesarios para la aplicación del test, aplicar los test adecuadamente,
puntuar y analizar los resultados de los tests con precisión, interpretar los resultados
adecuadamente, comunicar los resultados de forma clara y precisa. Revisión de la
adecuación del test y su uso.
118
c. Validez para las poblaciones pertinentes y su aplicabilidad para el uso
que se hace del test.
d. Ausencia de sesgo para los grupos con los que se utilizará
e. Aceptación por parte de quienes están implicados en su uso, incluyendo
la pertinencia y validez aparente percibidas
f. Aspectos prácticos, tales como tiempo requerido, coste, o recursos que
se necesitan
Evitar el uso de tests que tengan una documentación técnica inadecuada o poco clara
Utilizar tests sólo para aquellos objetivos para los cuales se dispone de una
validez empírica adecuada y pertinente
No aceptar un test basándose únicamente en su validez aparente,
recomendaciones de otros usuarios, o consejos de quienes tienen intereses comerciales
Responder a las preguntas de las personas implicadas (personas evaluadas,
padres, supervisores, representantes legales, etc), dándoles suficiente información para
que entiendan por qué se eligió el test.
Los tests son imparciales y adecuados para todos los grupos evaluados. Los
constructos que se están midiendo son relevantes para cada uno de los grupos evaluados.
Existen datos disponibles sobre las diferencias de rendimiento de los grupos en el test.
Hay datos disponibles sobre el funcionamiento diferencial de los ítems cuando ello es
pertinente. Hay datos sobre la validez que apoyan el uso del test en diferentes grupos.
Se minimizan los efectos de las diferencias grupales no relacionadas con el objetivo de
la medición. Las directrices sobre la imparcialidad de los tests se interpretan dentro del
marco de la legislación al respecto existente en cada país.
119
elaboradas utilizando una metodología rigurosa. Los constructores hayan sido sensibles
a los aspectos de contenido, culturales e idiomáticos. Quienes aplican los tests sean
capaces de comunicarse perfectamente en el idioma en el que se aplica el test. El
dominio de la lengua (en la que se aplicará el test) de las personas evaluadas sea
comprobado sistemáticamente, utilizándose la versión más adecuada, o una bilingüe si
fuese necesario
120
Autoevaluación:
1. El propósito del Manual técnico del test es, elija las opciones correctas:
( ) Proporcionar información sobre la teoría que respalda el test.
( ) Informar las propiedades psicométricas del tests
( ) Orientar sobre la administración, calificación y clasificación del futuro evaluado
( ) Informar las normas de tipificación
( ) Informar sobre la historia de la psicometría
2. Las normas para evaluar la calidad de los Tests psicológicos, han sido proporcionados
por:
( ) El Colegio de Psicólogos del Perú
( ) EL Ministerio de Educación del Perú
( ) The American Psychological Association
( ) The Comission Internacional Tests
3. ¿Cuáles son los rubros más importantes cuando se valore la calidad de un test?
____________________________________________________________
____________________________________________________________
_____________________________________________________________
_____________________________________________________________
4. ¿Cuándo el constructor de tests decide publicar en una revista científica, cuales son los
rubros que debe contener su artículo de investigación?
____________________________________________________________
____________________________________________________________
_____________________________________________________________
_____________________________________________________________
5. ¿Qué opina sobre el uso de los tests que hacen personas que no son psicólogos? ¿Qué deberíamos
hacer?
_____________________________________________________________
_____________________________________________________________
121
Actividades para el estudio independiente:
Bibliografía complementaria
- Camúes y Luna (2010). ¿Cómo hacer un manual para una prueba psicológica?. Universidad de
Nariño. https://psicologiaysalud.udenar.edu.co/wp-content/uploads/2016/02/MANUAL-
PARA-UNA-PRUEBA-PSICOL%c3%93GICA.pdf
- Hernández, A., Ponsoda, V., Muñiz, J., Prieto, G. y Elosua, P. (2016). Revisión del modelo
para evaluar la calidad de los tests utilizados en España. Papeles del Psicólogo, 37, 192-197
122
Referencias
Abad, F., Olea, J., Ponsoda,V., y García,C.(2011). Medición en ciencias sociales y de la salud.. Madrid
Alarcón, R. (1991) Métodos y diseños de investigación del comportamiento. UPCH.
Anastasi, A. y Urbina, S. (1998). Tests Psicológicos. México
Andrade, J. & Valentini, F. (2018). Diretrizes para a Construção de Testes Psicológicos: a
Resolução CFP n° 009/2018 em Destaque. Psicologia: Ciência e Profissão, 38(spe), 28-
39. https://doi.org/10.1590/1982-3703000208890
American Educational Research Association, American Psychological Association, & National
Council on Measurement in Education. (2014). Standards for educational and
psychological testing. Washington, DC: American Educational Research Association
American Psuchological Association ( 2020) Manual de publicaciones. Manual Moderno.
Cuarta edición.
Arias-Barahona, R. y Jesús, M. (1996). Pruebas psicométricas de inteligencia. Apuntes de
curso. Universidad San Martín de Porres-Lima
Ato, M., López, J. J., y Benavente, A. (2013). A classification system for research designs
in psychology. Anales de Psicología, 29(3), 1038–1059.
https://doi.org/10.6018/analesps.29.3.178511
Attorresi, H., Lozzia, G., Abal, J, y Galibert, M, & Aguerri, M. (2009). Teoría de Respuesta al
Ítem. Conceptos básicos y aplicaciones para la medición de constructos psicológicos.
Revista Argentina de Clínica Psicológica, XVIII(2),179-188.[fecha de Consulta 14 de
Abril de 2021]. ISSN: 0327-6716.
https://www.redalyc.org/articulo.oa?id=281921792007
Aiken, L. R. (2003). Tests psicológicos y evaluación (11a. ed.). Pearson Educación.
https://elibro.net/es/lc/upla/titulos/74085
Alarcón, R. (1991) Métodos y diseños de investigación del comportamiento. Lima:
Fondo Editorial de la Universidad Cayetano Heredia. (Biblioteca personal)
Aliaga T., J. (2006). Psicometría: tests psicométricos, confiabilidad y validez. En A. Quintana y
W. Montgomery (Eds.): Psicología: Tópicos de actualidad. Lima:UNMSM
Aragón, L. E. (2015). Evaluación psicológica: historia fundamentos teórico-conceptuales y
psicometría (2a. ed.). Editorial El Manual Moderno.
https://elibro.net/es/lc/upla/titulos/39719
Alvarado, J. (2012). La validez en la medición psicológica. UNED - Universidad Nacional de
Educación a Distancia. https://elibro.net/es/lc/upla/titulos/48544
Barbero, M.; Garcia, E.; Vila, E.; y Holgado, F. (2015) Psicometría: Problemas resueltos. Colección
UNED. Editorial Sanz y Torres. Madrid
Barrios, M.; Bonillo,A.; Cosculluela, A.; Lozano, M.; Turbany,J.; y Valero, S.
Beaver, A.S., Lounsbury, J.W., Richards, J.K., Huck, S.W., Skolits, G.J. y Esquivel, S.L. (2013).
Practical considerations for using exploratory factor analysis in educational research.
Practical Assessment, Research & Evaluation, 18 (6), 1-1
Brown, F. (1980). Principios de la medición en Psicología y Educación. México. Manual moderno
Bunge, M. (1972). La ciencia, su método y su filosofía. Buenos Aires: Siglo XX
123
Canués, D. y Luna, E. (2010). ¿Cómo hacer un manual para una prueba psicológica?. Universidad de
Nariño. Pasto.
Carretero-Dios y Pérez (2007). Normas para el desarrollo y revisión de estudios instrumentales:
consideraciones sobre la selección de tests en la investigación psicológica. International
Journal of Clinical and Health Psychology. Vol. 7, No. 3, pp. 863-882.
http://www.aepc.es/ijchp/NDREI07_es.pdf
Caycho-Rodríguez, Ventura-León y Barboza-Palomino. Diseno˜ y validación de una escala para
medir la preocupación por el contagio de la COVID-19 (PRE-COVID-19) . Enfermería Clínica
31 (2021) 175-183. https://doi.org/10.1016/j.enfcli.2020.10.034
Cerda, E. (1984). Psicometría General. Barcelona.
Cohen, R., Swerdlik, M. (2001). Pruebas y evaluación psicológicas: Introducción a las pruebas
y a la medición(4ª ed.). México: McGraw-Hill.
EcuRed (s/a). https://www.ecured.cu/EcuRed:Enciclopedia_cubana
Engler, B. (1996). Introducción a las teorías de la personalidad. McGraw-Hill. México D.F.
Escurra, M. (1988). Cuantificación de la validez de contenido por criterio de jueces.
Revista de Psicología de la PUCP, 4 (1- 2), 103-111.
Escurra, L. (2011) Análisis psicométrico del Cuestionario de Honey y Alonso de Estilos de Aprendizaje
(CHAEA) con los modelos de la Teoría Clásica de los Tests y de Rasch Persona, (14),71-109.
https://www.redalyc.org/articulo.oa?id=147122650003
Fernández, M.; Cayssials, A.; Pérez. M. (2016). Tercera reimpresión. Curso básico de Psicometría.
Teoría clásica. Lugar editorial. Buenos Aires.
Fernández-Ballesteros,R. (2013) Evaluación Psicológica. Conceptos, métodos y estudio de caso.
Pirámide. Madrid.
Fernández, A.; Pérez, E.; Alderete, A.; Richaud,MC., y Mercedes Fernández,M. ¿Construir o Adaptar
Tests Psicológicos? Diferentes respuestas a una cuestión controvertida . Evaluar, 10 (2010), 60
– 74. https://www.researchgate.net/profile/Alberto-Fernandez-8/publication/277009493
Fuentes, J. (2001) Fundamentos de psicometría. Amaru Ediciones. Salamanca.
Gonzáles, F. (2007). Instrumentos de evaluación psicológicas. Editorial Ciencias Médicas.
Ciudad de La Habana.
Gragory, R. (2012). Pruebas psicológicas: historia, principios y aplicaciones. Pearson
Educación.https://elibro.net/es/lc/upla/titulos/37877?as_all=pruebas psicol%C3%B3gicas,
&as_all_op=unaccent icontains,unaccent icontains&prev=as
Gonzáles Llaneza, Felicia ( 2007) . Instrumentos de evaluación psicológica. Editorial ciencias médicas.
Cuba
Hernández, R.; Fernández, C. y Baptista, P. (2010) Metodología de la investigación. Quinta edición.
México: McGrawHill.
Hernández, A., Ponsoda, V., Muñiz, J., Prieto, G. y Elosua, P. (2016). Revisión del modelo para
evaluar la calidad de los tests utilizados en España. Papeles del Psicólogo, 37, 192-197. https://
Hogan, T. (2015). Pruebas psicológicas: una introducción práctica. 2da. Edición;
Editorial El Manual Moderno. https://elibro.net/es/lc/upla/titulos/100395
Instituto Nacional de Salud Mental Honorio Delgado Hideyo Noguchi (2008). Base de Datos
de Instrumentos de evaluación de Salud Mental y Psiquiatría. Anales deSalud Mental,
19(1), 17-21. http://www.insm.gob.pe/investigacion/archivos/estudios/2008-ASM-
124
BDIESMP/files/res/downloads/book.pdf
Lagunes, R. (2017) Recomendaciones sobre los procedimientos de construcción y validación de
instrumentos y escalas de medición en la psicología de la salud. Psicología y Salud, Vol.
27, Núm. 1: 5-18, enero-junio de 2017
https://psicologiaysalud.uv.mx/index.php/psicysalud/article/view/2431/4279
Leyva Barajas, Yolanda Edith. (2011). Una reseña sobre la validez de constructo de pruebas
referidas a criterio. Perfiles educativos, 33(131), 131-154.
http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0185-
26982011000100009&lng=es&tlng=es
Liberabit (s/f ),Revista de Psicología de la Universidad de San Martín de Porres. URL
http://www.revistaliberabit.com/index.php/Liberabit/about/submissions
López-Pérez, B., Fernández-Pinto,I., y Abad,F. (2008) Tests de empatía cognitiva y afectiva.
TEA Ediciones; Madrid
Lloret S., S., Ferreres T., A., Hernández B., A. y Tomás M., I. (2014). El análisis factorial
exploratorio de los ítems: una guía práctica revisada y actualizada. Anales de Psicología,
30, 1151-1169.
Lozano, L. y Turbany, J. (2013). Validez. Meneses (Ed), En Psicometria. (141-200). Barcelona:
Editorial UOC.
Medrano, L.; Pérez, E.; Fernández, L.; Marta, M.; Alejandra, M.; Trógolo, M.; Moretti, L.;
Griffoulière, E. (2019) Manual de psicometría y evaluación psicológica. Editorial Brujas;
Buenos aires Argentina https://www.digitaliapublishing.com/a/59485/manual-de-psicometria-
y-evaluacion-psicologica Compiladores Medrano, L.; Pérez, E.;
Meneses, J. (2014). Psicometría. Editorial UOC. https://elibro.net/es/lc/upla/titulos/57600
Barrios, M., Bonillo,A., Cosculluela, A., Lozano, L., Turbany, J. Valero, S.
Meneses, J. (Coord) (2013). Psicometría. Editorial UOC. Barcelona
Moran, V., Olaz, F., Pérez, E., & Del Prette, Z. (2018). Desarrollo y validación del Test de Ansiedad Social para
estudiantes universitarios (TAS-U). Liberabit, 24(2), 195-212. https://doi.org/10.24265/
liberabit.2018.v24n2.03
Muñiz, J. (1990). Teoría de Respuesta a los Items: Un nuevo enfoque en la evolución psicológica y
educativa. Pirámide. Madrid.
Muñiz, J. (1994). Teoría clásica de los tests. Pirámide. Madrid. Primera edición
Muñiz, J. y Fonseca-Pedrero, E. Diez pasos para la construcción de un test. Psicothema
2019. Vol.31 (1). p. 7-16. Doi 10.7334/psicothema2018.291
Muñiz, J., Elosua, P. y Hambleton, R. K. (2013). Directrices para la traducción y
adaptación de los tests: segunda edición. Psicothema, 25, 151-157. doi:
10.7334/psicothema2013.24
Muñiz, J. (2010). Las teorías de los tests: teoría clásica y teoría de respuesta a los ítems. Papeles del
Psicólogo, 31(1), 57-66. http://www.papelesdelpsicologo.es/pdf/1796.pdf
Muñiz, J. (2018). Introducción a la Psicometría. Teoría clásica y TRI. Pirámide. España
Nunnally, J. (1987) Teoría psicométrica. Editorial Trillas. México??
Prieto, G. y Muñiz, J.(2000). Un modelo para evaluar la calidad de los tests utilizados en España
Papeles del Psicólogo, núm. 77, 2000, pp. 65-72 Consejo General de Colegios Oficiales de
Psicólogos. Madrid, España.URL http://www.redalyc.org/articulo.oa?id=77807709
Ramos, Z. (2018). Psicometría básica. Fundación universitaria del Área Andina. Bogotá.
Santisteban, C. (1990). Psicometría. Teoría y práctica en la construcción de tests. Ediciones Norma
125
Tornimbeni, S. Pérez, E. y Olaz,F. (2014). Introducción a la Psicometría. Buenos Aires.
Paidos.
Uribe, J. (2010) EDO. Escala de Desgaste Ocupacional (Burnout). Manual Moderno;
México D.F.
126