You are on page 1of 7

Evaluación Psicométrica

Validez de las pruebas

La validez responde a la pregunta ¿con qué fidelidad corresponde el universo o población al atributo que se va
a medir? la validez de un instrumento consiste en que mida lo que tiene que medir (autenticidad), algunos
procedimientos a emplear son: Know groups (preguntar a grupos conocidos), predictive validity (comprobar
comportamiento) y cross-checkquestions (contrastar datos previos). al estimar la validez es necesario saber a
ciencia cierta qué rasgos o características se desean estudiar. a este rasgo o característica se le denomina
variable criterio. al respecto, ruiz bolívar (2002) afirma que “…nos interesa saber qué tan bien corresponden
las posiciones de los individuos en la distribución de los puntajes obtenidos con respecto a sus posiciones en
el continuo que representa la variable criterio” (p. 74). existen tres tipos de validez:

Validez de Contenido: Juicio de Expertos. se refiere al grado en que un instrumento refleja un dominio
específico del contenido de lo que se quiere medir

por ejemplo, un cuestionario sobre la actitud de los alumnos ante la investigación no tendrá validez de
contenido si explora la opinión de los alumnos sobre las características de los docentes dentro de la cátedra
de estadística

Validez de Constructo: intenta responder la pregunta ¿hasta dónde el instrumento mide realmente un rasgo
determinado y con cuánta eficiencia lo hace? al respecto Gronlund (1976, citado por Ruiz Bolívar.) señala que
esta validez interesa cuando se quiere usar el desempeño de los sujetos con el instrumento para inferir la
posesión de ciertos rasgos. para estudiar este tipo de validez es necesario que exista una conceptualización
clara del rasgo estudiado basado en una teoría determinada.

Validez Predictiva o de Criterio Externo o Empírica: se asocia con la visión de futuro, determinar hasta dónde se
puede anticipar el desempeño futuro de una persona en una actividad determinada. la validez predictiva se
estudia comparando los puntajes de un instrumento con una o más variables externas denominadas variables
de criterio.

Confiabilidad de las pruebas

Antes de iniciar el trabajo de campo, es imprescindible probar el cuestionario sobre un pequeño grupo de
población. esta prueba piloto ha de garantizar las mismas condiciones de realización que el trabajo de campo
real. Se recomienda un pequeño grupo de sujetos que no pertenezcan a la muestra seleccionada pero sí a la
población o un grupo con características similares a la de la muestra del estudio, aproximadamente entre 14 y
30 personas. de esta manera se estimará la confiabilidad del cuestionario.

1
La confiabilidad responde a la pregunta ¿con cuánta exactitud los ítemes, reactivos o tareas representan al
universo de donde fueron seleccionados? el término confiabilidad “…designa la exactitud con que un conjunto
de puntajes de pruebas mide lo que tendrían que medir” (ebel, 1977, citado por Fuentes, op. cit., p. 103).
entre los métodos para estimar la confiabilidad, se tienen: Método Test-Retest, método común de división
por mitades o Hemitest.

Dependiendo del método se puede calcular el coeficiente alfa de cronbach cuando se trata de alternativas de
respuestas policotómicas, como las escalas tipo likert; la cual puede tomar valores entre 0 y 1, donde: 0
significa confiabilidad nula y 1 representa confiabilidad total.

Otro es el coeficiente de Correlación r de Pearson, Coeficiente de consistencia interna. puede ser usada en
cuestionarios de ítemes dicotómicos y cuando existen alternativas dicotómicas con respuestas

Interpretación del Coeficiente de Confiabilidad el coeficiente de confiabilidad

Es un coeficiente de correlación, teóricamente significa la correlación del test consigo mismo. Sus valores
oscilan entre 0 y 1. entre las escalas empleadas se tienen

0,70 a 1,00 muy fuerte, 0,50 a 0,69 Sustancial, 0,30 a 0,49 moderada, 0,10 a 0,29 baja. 0,01 a 0,09
despreciable.

Normalización de las pruebas

A decir de Coolican (2005, pág. 116), requiere de ser rigurosamente cuidadoso en los métodos de muestreo,
ya que permitirá la interpretación de lo que ocurre con la población, de tal forma que se debe especificar con
claridad las poblaciones para el establecimiento de normas de prueba, en sus diversas subcategorías de la
población general. El establecimiento de las normas depende del proceso de estandarización. De las formas
de establecer esta normalización, las más comunes son:

Puntuación z: “Expresa una puntuación en función del número de unidades de desviación estándar que la
puntuación cruda está por debajo o por encima de la media de la distribución” (Cohen & Swerdlik, 2001, pág.
118). Esta prueba permite la comparación de las puntuaciones crudas dentro y entre las pruebas. Hacer una
comparación significativa, requiere de semejanza entre los grupos de comparación de los que se calculan las
puntuaciones estándar.

Puntuación T: Es un tipo de puntuación estandarizada, que tiene una media de 50 y una desviación estándar
de 10. Este tipo de puntuaciones son comunes en las pruebas de personalidad (Gregory, 2001, pág. 80). El
sistema es el mismo que las calificaciones estándar (calificaciones z), con excepción de las variaciones en la
media y la desviación estándar (en calificaciones z es 0 y 1 respectivamente) (Kaplan & Saccuzzo, 2006, pág.
50).

2
Prueba de aptitudes diferenciales DAD-5.

El Test DAT-5, (Differential Aptitudes Test), es la última versión americana (año 1992) del Test de Aptitudes
Diferenciales creado en 1947 por G.K. Bennett, H.G. Seashore y A.G. Wesman.

El objetivo de la batería DAT-5 es la evaluación de un amplio rango de aptitudes: razonamiento verbal,


razonamiento numérico, razonamiento abstracto, rapidez y exactitud perceptiva, razonamiento mecánico,
relaciones espaciales y ortografía.
El Test DAT-5 tiene dos niveles:

- Nivel 1, aplicable a alumnos de la ESO (1º a 4º) y cursos formativos de grado medio.

- Nivel 2, aplicable desde 4º curso de la ESO, Bachillerato y cursos formativos de grado medio y superior.,
aunque es posible aplicarlo a adultos.

Para ello, el DAT-5 consta de estos siete subtests:

1- Razonamiento verbal: Evalúa la habilidad del sujeto para establecer analogías verbales.

2- Razonamiento numérico: Valora la aptitud de razonar con números.

3- Razonamiento abstracto: Mide la capacidad del sujeto para razonar con series de figuras o dibujos
geométricos.

4- Rapidez y exactitud perceptiva: Evalúa la capacidad para comparar y comprobar con precisión y rapidez
documentos escritos.

5- Razonamiento mecánico: Valora la capacidad de comprensión de principios mecánicos básicos (maquinaria,


herramientas y movimientos)

6- Relaciones espaciales: Mide la aptitud para representar mentalmente una figura tridimensional a partir de
su representación bidimensional, e imaginar cómo aparecería si sufriera una rotación espacial.

7- Ortografía: Valora el dominio de las reglas de ortografía del idioma español.

Las puntuaciones directas obtenidas en cada una de las escalas se transforman en puntuaciones centiles y,
después de trasladar éstas a un gráfico, se puede obtener un perfil aptitudinal del estudian

Prueba de intereses Kuder-C:

El inventario, actualmente, “se compone de 312 unidades, cada una de las cuales señala una preferencia por
determinada actividad. El total de unidades (312) se ordena en agrupaciones de tres, conformando 104
tríadas. El sujeto sometido a examen debe responder obligatoriamente cada una de estas tríadas,

3
estableciendo, de las tres actividades enunciadas, cual es la que más le agradaría realizar y cuál es la que
menos le gustaría llevar a cabo” (Retamal, 1983, p. 28).

A través de las respuestas del sujeto es posible obtener una medida de diez amplias áreas de intereses
profesionales: (Fernández y otros, 1979, p. 39)

Área 0 o Exterior: Agrupa actividades realizadas generalmente al aire libre, y que implican contacto con la
naturaleza.

Área 1 o Mecánica: Agrupa actividades que implican trabajo con máquinas, herramientas, objetos mecánicos,
aparatos eléctricos, etc.

Área 2 o De Cálculo: Agrupa actividades que implican trabajo con números y operación de cálculos
matemáticos.

Área 3 o Científica: Agrupa actividades que se relacionan con la ciencia, el empleo del método científico, y las
investigaciones tendientes al descubrimiento de nuevos hechos.

Área 4 o Persuasiva: Agrupa actividades que se relacionan con la persuasión, imposición de puntos de vista,
convencimiento de los demás, vender artículos, etc.

Área 5 o Artística: Agrupa actividades creativas y estéticas de tipo manual o plásticas, que usan combinaciones
de colores, formas y diseños en su construcción.

Área 6 o Literaria: Agrupa actividades que se relacionan con la lectura de obras literarias, o bien con la
expresión de las ideas en forma escrita.

Área 7 o Musical: Agrupa actividades que se relacionan estrechamente con la música, ya sea tocar
instrumentos, danzar, leer partituras, asistir a conciertos o interesarse por la vida de los grandes músicos, así
como componer obras musicales.

Área 8 o De Servicio Social: Agrupa actividades que tienen como denominador común el servir a los demás, en
especial a los necesitados, sean niños, ancianos o enfermos.

Área 9 o De Oficina: Agrupa actividades que se realizan en espacios cerrados, de escritorio, y que requieren
cierta precisión.

Cada respuesta equivale a un punto, sin importar si el ítem fue contestado en forma positiva o negativa.
Además, cada respuesta puede dar puntaje simultáneamente a más de un área. Se suman las respuestas que
puntúan por área y se obtiene el puntaje total de aquella.

4
Se ubica, entonces, el percentil en que cae el sujeto en cada una de las diez escalas “con el fin de confeccionar
un perfil de sus intereses en el cual se reflejarán las áreas predominantes, las de intereses «normales», y las
áreas bajas.” (Fernández y otros, 1979, p. 40).

Finalmente, el inventario ofrece un modelo de interpretación en base a listados de ocupaciones para cada
área de interés. Además de 45 correspondientes a combinaciones de áreas para los casos en que se obtenga
más de una escala con puntaje de intereses clasificables como “altos”.

En cuanto a las características psicométricas del test original, a partir de diversos estudios, “proporciona en su
manual técnico, fiabilidades para sus diez escalas que oscilan en torno a una mediana de 0.89 (fórmula de
Kuder-Richardson)” (Castaño y López-Mesa, 1983, p. 215).

Cabe mencionar que el modelo de interpretación que se utiliza es el mismo que el original, esto es, mediante
percentiles, ya que resulta más fácilmente comprensible y aceptada por los diferentes usuarios de las
pruebas, Además, los percentiles son de aplicación universal.

Personalidad 16PF:

El Cuestionario Factorial de Personalidad, 16PF-5, es un instrumento de medida de espectro amplio de


personalidad para adolescentes mayores de 16 años y adultos que tiene como finalidad la apreciación de
dieciséis rasgos de primer orden (o escalas primarias de personalidad) y cinco dimensiones globales de
personalidad (antes factores de segundo orden). Las dimensiones globales resumen la interrelación entre los
rasgos primarios y permiten una perspectiva de la personalidad más amplia. Las cinco dimensiones globales
de personalidad son: Extraversión (Ext), Ansiedad (Ans), Dureza (Dur), Independencia (Ind) y Autocontrol
(AuC), Incluye además tres medidas para evaluar estilos de respuesta para controlar los sesgos en las
respuestas: Manipulación de la imagen (MI), Infrecuencia (IN) y Aquiescencia (AQ). El instrumento consta de
185 ítems con tres alternativas de respuesta (¿dos extremos y una alternativa intermedia señalada siempre
con un interrogante”?”) con las que se obtienen las puntuaciones de las 16 escalas primarias, los tres índices
de estilos de respuesta y las dimensiones globales. La aplicación puede ser individual o colectiva con una
duración de entre 40 y 45 minutos.

RASGOS PRIMARIOS DESCRIPCIÓN

Afabilidad Se refiere a la tendencia que va desde ser una persona social e interpersonalmente reservada
hasta estar cálidamente implicada.

Razonamiento Capacidad del individuo para resolver problemas. Esta escala no es un rasgo de personalidad,
sin embargo, se conoce que el estilo cognitivo es una variable moduladora de las variables de personalidad.

Estabilidad Se refiere al estilo de afrontamiento de los problemas cotidianos de la vida y sus retos

5
Dominancia Se refiere a la tendencia a ejercer la voluntad de uno mismo sobre la de los demás

Animación Evalúa el grado de espontaneidad y sociabilidad del individuo frente a la seriedad y la


inhibición de la espontaneidad.

Atención a las normas La escala pretende medir el grado en que las normas culturales de lo
correcto/incorrecto se han interiorizado y se emplean para gobernar la conducta humana (Cattell, 1970).

Atrevimiento Evalúa el grado de atrevimiento, seguridad en las relaciones sociales y carácter emprendedor
del individuo frente a la timidez y retraimiento social.

Sensibilidad Evalúa el grado de empatía, sentimentalismo y gusto por lo estético

Vigilancia Evalúa el grado de suspicacia, escepticismo, desconfianza frente al polo contrario.

Abstracción Evalúa si el individuo está más orientado a los procesos mentales e ideas que a los aspectos
pragmáticos y realistas.

Privacidad En esta escala se pretende medir la tendencia a la naturalidad y apertura del individuo frente
a la tendencia a la privacidad de las emociones.

Aprensión Los ítems de la escala pretenden medir el grado de seguridad y despreocupación del individuo
frente a la inseguridad, preocupación y aprensión.

Apertura al cambio Los ítems de esta escala pretenden diferenciar a individuos tradicionales y apegados a
lo familiar frente a aquellos de mentalidad abierta y analítica, innovadores

Autosuficiencia Se refiere al mantenimiento del contacto o proximidad de los otros

frente al individualismo.

Perfeccionismo En esta escala se pretende medir la flexibilidad y tolerancia con el desorden y las faltas frente
a la organización y la disciplina.

Tensión Esta escala está asociada con la tensión nerviosa, impaciencia e intranquilidad.

Reporte de la Evaluación Psicológica

Es un producto acabado, un documento que se entrega comúnmente a otro profesional o a quien deba
tomar decisiones con base en el contenido del mismo, suele ser una comunicación unidireccional y escrita;
sin embargo, aunque el informe debiera ser suficiente para transmitir las ideas básicas sobre el caso, no hay
que descartar un enriquecimiento mutuo por medio del diálogo entre el psicólogo y el que demanda que, al
complementar lo escrito con lo verbal, permite el abordaje de otras áreas y el intercambio de opiniones.

6
Dentro de las cualidades que debe contener un informe, Sattler (2003), indica que éste debe de estar bien
organizado y tener fundamentos sólidos; para él un buen informe contempla los hechos, integra los
resultados de las observaciones conductuales, la información obtenida de las entrevistas y el material
pertinente de la historia clínica (que incluye los datos actuales y anteriores de naturaleza social, educativa,
psicológica, psiquiátrica y médica, y las recomendaciones e información previa a la canalización) y los
resultados de las pruebas aplicadas. Siempre bajo una óptica de respeto por parte del evaluador hacia la
individualidad de la persona evaluada y tomando en consideración el contexto, el motivo o propósito del
estudio.

El informe psicológico puede tener diferentes propósitos, entre otros:

 Proporcionar a la persona evaluada y a otras partes interesadas la información precisa relacionada


con la evaluación.
 Proporcionar información para confirmar las hipótesis clínicas.
 Desarrollar con la información obtenida un programa de intervención.
 Valorar programas de investigación.
 Proporcionar información significativa de línea base para valorar: progresos terapéuticos de la
persona evaluada. cambios que ocurren como resultado del tiempo.
 Documento legal.