PSICOMETRÍA

Diseñado por:
Germán Andrés Torres
Escobar

Hitos en la historia de la
psicometría
AÑO HITO O ACONTECIMIENTO
1115 a.C. En China se utilizan tests para acceder a puestos en el gobierno.
1869 d C. Francis Galton publica el libro Genio Hereditario (1869) donde plantea a través
de estudios estadísticos que la inteligencia se hereda.
1904 – 1910 d. C. Charles Spearman funda la Teoría Clásica de los tests o del modelo lineal
y publica su teoría de los factores de la inteligencia y las formulas de atenuación.
1905 d.C. Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para niños,
con el fin de establecer su edad mental y predecir su rendimiento académico.
1918 d.C. Se crean los tests de inteligencia Army Alpha y Beta para clasificar a los soldados
durante la Primera Guerra Mundial y Robert Woodworth elaboró el primer Personal
Data Sheet para detectar los soldados que pudieran tener crisis nerviosas.
1931 d.C. Thurstone publica su libro The reliability and validity of tests.
1939 d.C. Wechsler propone su escala de medida para la inteligencia.

1940 d.C. Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality
Inventory (MMPI).
1960 d.C. Cronbach propone su Teoría de la Generalización en la cual utiliza el análisis de
varianza para interpretar las fuentes de error en los puntajes.
1980 d.C. Rasch plantea la Teoría de la Respuesta al Ítem o del rasgo latente que permite
conocer la información de cada ítem para diseñar pruebas individualizadas.

La psicometría
 Es la rama de la
psicología que
desarrolla y estudia
las propiedades de
las pruebas
psicológicas o tests
para medir las
variables psicológicas
con la mayor
precisión posible.

Diferencia entre psicometría y
evaluación psicológica
Psicometría Evaluación
psicológica

Énfasis en la Énfasis en el
medición diagnóstico

Instrumentos y tests La persona

Historia de la psicometría  Antecedentes históricos.  Modelos de medición. .

. se utilizan comienzan a utilizar en China los primeros tests que buscan medir las capacidades de aspirantes para acceder a puestos del gobierno (primera medición de capacidades).  En 1869 Francis Galton publica el libro Genio Hereditario donde plantea a través de estudios estadísticos que la inteligencia se hereda y que es posible medirla (estudios estadísticos en psicología). Antecedentes históricos  Hacia el año 1115 a.C.

con el fin de establecer su edad mental y predecir su rendimiento académico (uno de los primeros tests psicológicos).  En 1905 Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para niños. . Entre 1904 y 1910 Charles Spearman funda la Teoría Clásica de los tests o del modelo lineal y publica su teoría de los factores de la inteligencia y las formulas de atenuación (Estrategias de medición y TCT).

Igualmente él desarrolló estrategias para la medición de la confiabilidad de un test. En 1960 Lee Cronbach propone su Teoría de la Generalización en la cual utiliza el análisis de varianza para interpretar las fuentes de error en los puntajes. .  En 1980 Rasch plantea la Teoría de la Respuesta al Ítem o del rasgo latente que permite conocer la información de cada ítem para diseñar pruebas individualizadas.

Modelos de medición Teoría Clásica de Teoría de la Respuesta los Tests (TCT) al Ítem (TRI) Análisis de la prueba Análisis de ítems completa individuales En una muestra En grandes muestras pequeña de sujetos (N de sujetos (N ≥ 500) < 500) .

Teoría clásica de los Tests  El modelo de puntuación verdadera se concreta en un primer supuesto: X=V+E que indica que la puntuación empírica directa de una persona en un test (X) está compuesta por la puntuación verdadera de la persona (V) y un error de medida (E) que se comete al medir el rasgo con el test.  El error de medida se establece como la diferencia entre la puntuación empírica y la verdadera: E=X-V .

la correlación entre ambas variables sería nula. porque se asume que puntuaciones verdaderas elevadas no tienen porqué tener asociados errores elevados: r VE =0 . La puntuación verdadera se obtiene con el promedio de las puntuaciones empíricas que obtiene la persona en un número elevado de aplicaciones del test: V = E[X]  Si en una población se conocen las puntuaciones V y E de los individuos.

ambas variables correlacionarían cero: ρE jVk = 0 . Si en una población conociéramos los errores de medida de cada individuo quien ha realizado dos tests diferentes (j y k). la correlación entre ambas variables también sería nula: ρE jEk = 0  Si en una población conociéramos las puntuaciones E en un test j y las puntuaciones V en un test k.

 La TCT supone que el error de medida es una propiedad del test y. por lo tanto. . independientemente de cual sea su puntuación. Limitaciones de la Teoría Clásica  Las características de los ítems (dificultad y discriminación) dependen del grupo de personas en el que se han aplicado. igual para todos los sujetos.  La puntuación que una persona obtenga será diferente si se le aplican dos tests que midan la misma característica pero cuyo nivel de dificultad sea diferente.

El supuesto de unidimensionalidad exige que todos y cada uno de los ítems del test midan una única dimensión. Teoría de la Respuesta al Ítem  Unidimensionalidad: todos los ítems que forman el test han de medir un mismo y único rasgo. .  No hay como tal puntuaciones verdaderas sino una probabilidad de acierto determinada por unos parámetros. ni por el orden de presentación de los ítems. las respuestas que ya se hayan dado.  Independencia local: entre los ítems de un test si la respuesta que una persona da a uno de ellos no depende de las respuestas que da a los otros. etc.

 Puede aplicarse en diferentes campos de la psicología.Un prueba psicológica o test  Es un instrumento en formato impreso o digital que consta de una serie de preguntas o reactivos que miden unas variables psicológicas especificas a través de un sistema de puntuación. selección de personal (psicología organizacional) o análisis de aptitudes vocacionales (psicología educativa). para fines diversos como diagnóstico clínico (psicología clínica) . .

Estructura general de un test impreso  Cuadernillo de instrucciones.  Cuadernillo de preguntas.  Plantilla de corrección. .  Hoja(s) de respuestas.  Tabla de puntuaciones y baremos.

. La(s) variable(s) que mide y sus objetivos. . . El cuadernillo de instrucciones  Es un documento donde se menciona: . sus autores y el año de publicación. El nombre de la prueba. . Los antecedentes (marco conceptual y teórico) de la prueba. Las instrucciones generales de aplicación (para los psicólogos).

El cuadernillo de preguntas  Es un documento que consta de: . . Las instrucciones de respuesta (para quien la va a responder).  No puede rayarse ni se puede escribir sobre este ya que se usa en diferentes aplicaciones. Los ítems o preguntas. .

 Una vez que la persona entrega la hoja de respuestas al psicólogo. la plantilla de corrección para ver en cuales acertó el sujeto y en cuales no. él o ella la califican poniendo encima de la hoja de respuestas. . La hoja de respuestas y plantilla de corrección  Es la hoja donde la persona anota las respuestas a de los ítems planteados en el cuadernillo de preguntas.

El sistema de puntuación Puntuación cruda o bruta ∑ Puntuación de los ítems – Errores Puntuación estándar o típica Centiles Puntuaciones T. S o Z Perfil del sujeto .

para obtener una puntuación estándar o típica del sujeto dentro de la población o muestra de sujetos que presentó la prueba (baremo). La tabla de puntuaciones y baremos  Una vez que se han obtenido los aciertos y errores de la persona con ayuda de la plantilla. que es especifica para ese sujeto.  Esa puntuación bruta se analiza en la tabla de puntuaciones estándar. . se obtiene una puntuación cruda o bruta.

 Por ejemplo. mujeres profesionales. . estudiantes de secundaria. mujeres. profesión o género. etc. para una misma prueba existen baremos para hombres. Los baremos  Son tablas de puntuaciones estándar que se clasifican por grupos poblacionales o muestrales según la edad. hombres profesionales.

Grupal .De velocidad .De poder .De capacidad mental .De personalidad .Autoaplicación -De desempeño . Tipos de pruebas o tests Clasificación de las pruebas Según Según la forma de Según la(s) variable(s) la aplicación medir la(s) variable(s) que miden .Individual .De conocimientos .

en un caso clínico.  Pruebas de aplicación grupal: son aquellas que el psicólogo pueden aplicar a varias personas al mismo tiempo. . Por ejemplo. Por ejemplo.  Pruebas de aplicación individual: son aquellas que el psicólogo administra a una sola persona. una prueba de aptitudes e intereses vocacionales. Clasificación de las pruebas por aplicación  Pruebas de autoaplicación: son tests que no requieren la aplicación por parte de un psicólogo sino que puede hacerlas la persona con ayuda de un computador. pero controlando que no conversen entre ellas.

.  Pruebas de poder: miden el nivel de destreza mental de un sujeto o su nivel de conocimiento.  Pruebas con referencia a la norma o al criterio : mide la variables psicológica según objetivos específicos. Clasificación de las pruebas según la forma de medir la(s) variable(s)  Pruebas de desempeño: miden el rendimiento máximo (individual) o el rendimiento normal o típico (de un grupo).  Pruebas de velocidad: miden cuantos ítems responde el sujeto en un tiempo especifico.

motivación.Clasificación de las pruebas según las variables que miden  Pruebas de capacidad mental (inteligencia).  Pruebas de actitudes.  Pruebas de personalidad.  Pruebas neuropsicológicas. aptitudes. .  Pruebas de aprovechamiento o conocimiento. intereses. opinión y valores.

.  Opciones de respuesta: incluyen una(s) respuestas(s) correcta(s) y un(os) distractor(es) o respuesta(s) falsa(s). Pueden ser abiertas (libre respuesta) o cerradas (opciones especificas). Estructura general de un ítem  Enunciado: menciona las instrucciones para contestar el ítem y plantea un contexto o situación a partir del cual se hace la pregunta.  Pregunta(s): son cuestionamientos que evalúan directamente la variable psicológica de forma implícita.

De opción binaria .De elección .De adjetivos .De categorías ordenadas . Clasificación del formato de respuestas Clasificación de los ítems En tests de En tests de rendimiento óptimo rendimiento típico .De emparejamiento .

 Elección múltiple: entre más de dos alternativas se elige la que se considera correcta.  Emparejamiento: consiste en encontrar las parejas entre dos conjuntos de conceptos. . Clasificación de las respuestas en tests de rendimiento óptimo  Elección binaria: de dos alternativas. se elige la que se considera correcta (Sí o No) o (verdadero-falso).

.  Adjetivos bipolares: este formato es típico de lo que se denomina "diferencial semántico". Clasificación de las respuestas en tests de rendimiento típico  Opción binaria: la persona debe manifestar si está de acuerdo o en desacuerdo con una afirmación. que permite a la persona matizar mejor su respuesta.  Categorías ordenadas: el formato establece un continuo ordinal de más de dos categorías.

. Confiabilidad  Es el grado en el cual las mediciones repetidas de un fenómeno relativamente estable son aproximadas entre sí o consistentes.  Permite predecir el desempeño de un grupo o de un sujeto e igualmente sirve para describirlo en ambos casos.

. Formas de medir la confiabilidad  Test-retest: consiste en aplicar un test dos veces a un mismo grupo en un intervalo de días o meses (no superior).  División por mitades: consiste en comparar los resultados de los ítems pares e impares en la aplicación grupal de un test.  Formas paralelas: consiste en aplicar un test homologo o equivalente a un mismo grupo pero en tiempos diferentes.

 Formas paralelas: coeficiente de equivalencia (r).  División por mitades: coeficiente de consistencia interna (r). . Coeficientes de confiabilidad  Test-retest: coeficiente de estabilidad (r).

Coeficientes más usados en división por mitades .

Una vez obtenido el número K se multiplica por el número de items inicial y luego se le resta a ese resultado el número de ítems inicial.7) se usa la formula: K = RXY * (1 – rXY) / rXY) * (1 – RXY) donde rX es la confiabilidad inicial. Formas de mejorar la confiabilidad de un test  Para calcular el número de ítems K para lograr una confiabilidad RXY deseada (superior a 0. .

 Para calcular la confiabilidad al quitar un número de ítems X con un total de ítems Y y con una confiabilidad conocida C se usa la siguiente formula: Y–X/Y El resultado obtenido con esta formula debe operarse con la formula 2: [resultado 1 * C] [1 + (resultado 1 – 1) * C] .

VALIDEZ
 Es el grado en el cual una prueba
mide lo que pretende medir.

 Conjunto de pruebas y datos que han
de recogerse para garantizar la
pertinencia predictiva de las
inferencias que hacen a partir de un
test.

Tipos de validez
 Validez del contenido.

 Validez con relación a criterio.

 Validez del constructo.

VALIDEZ DEL CONTENIDO
 Es la muestra adecuada y representativa de los
contenidos que se pretende evaluar con un test.

 Los ítems o preguntas se seleccionan según su:
- Coherencia: con las características y variables.
- Relevancia: de acuerdo con el indicador.
- Buena redacción: la gramática del ítem.
- Validez aparente: para el evaluado.

VALIDEZ CON RELACIÓN AL
CRITERIO
 Es la comparación del desempeño de
un grupo de sujetos en un test respecto
patrones de medida ya establecidos.

 Se clasifica en:
- Validez concurrente.
- Validez predictiva.

Validez concurrente  Es el análisis de variabilidad que efectúa al comparar el desempeño de dos grupos de distintos de sujetos en un mismo test.  También se le denomina validez cruzada o entre distintas muestras. .

60. . Validez predictiva  Es el grado de precisión con que las calificaciones de la prueba predicen las calificaciones del criterio. cuyo valor es igual o menor a 0.  Se obtiene mediante la correlación entre una variable de indicador y una variable criterio a partir de r (Pearson).

 La contaminación de los criterios : evidencias falsas que les restan validez. .Factores que afectan la validez con relación a los criterios  Las diferencias de grupo: sexo. edad y rasgos de personalidad.  El incremento de la validez: costo razonable del instrumento.  El índice de base (debe ser mayor de 50) : número de personas que poseen la variable medida.

VALIDEZ DEL CONSTRUCTO  Es el grado de exactitud con el que se mide un constructo o concepto psicológico particular. .  Depende de unas condiciones que son externas al evaluador y la persona que diseña la prueba.

 Estudio de las variables intervinientes en la calificación.  Análisis de la consistencia interna de la prueba. . Condiciones de la validez del constructo  Valoración por parte de jueces expertos de la correspondencia contenido- concepto.

 Análisis de las respuestas. .  Correlaciones bajas con las medidas de constructos diferentes (Validez discriminante).  Correlaciones altas con otras medidas o métodos para medir el mismo constructo (Validez convergente). Análisis factorial y correlación con otras pruebas.

CONSTRUCCIÓN DE LOS ÍTEMS .

Aplicación 4. Síntesis 6. La Taxonomía de Bloom  El dominio cognoscitivo comprende 6 categorías: 1. Análisis 5. Evaluación . Recuerdo 2. Comprensión 3.

Supone. La Taxonomía de Bloom Recuerdo: Incluye situaciones de examen que acentúan la importancia del recuerdo de datos. ideas. metodologías. 2003). ya sea como reconocimiento o evocación. el recuerdo o reconocimiento de: Datos específicos como terminologías o hechos. teorías y estructuras (Herrera. técnicas o procedimientos y. generalizaciones. . clasificaciones. materiales o fenómenos. universales y abstracciones en un campo determinado como principios. modos y medios para el tratamiento de datos específicos como convenciones.

La Taxonomía de Bloom Ejemplo 1: Pregunta que evalúa Recuerdo A continuación encontrará preguntas que constan de un enunciado y cuatro (4) o cinco (5) opciones de respuesta. aquella opción que considere correcta. se denomina modelo: A.. Usted debe marcar en su hoja de respuesta.de las organizaciones . El modelo de control social propuesto por Max Weber para las organizaciones....de los sistemas B.estructuralista D.burocrático C.

pasando por la ejemplificación. La Taxonomía de Bloom Comprensión: Implica la intelección y fraccionamiento de un mensaje. Operacionalmente se define como cualquier conducta que vaya desde la presentación de una proposición con palabras distintas de las del enunciado original. Se define en términos de tres operaciones: a) Traducción o capacidad para expresar un concepto o mensaje conocido en palabras diferentes o pasarlo de un sistema simbólico a otro. b) Interpretación o reordenamiento de ideas de una comunicación en una nueva configuración. hasta la aplicación de un principio en una situación nueva para el examinado. consecuencias o efectos de una comunicación dada (Herrera. colorarios. Incluye la habilidad para captar el contenido de una comunicación como un todo y distinguir entre conclusiones legítimas y contradictorias y c) Extrapolación o hacer explícitas algunas conclusiones. 2003). .

debería tener mas alta fiabilidad que validez ya que lo principal es la confianza en el instrumento C. debe tener un error ya que los dos coeficientes. La Taxonomía de Bloom Ejemplo 2: Pregunta que evalúa Comprensión Si un psicólogo afirma que una prueba que ha preparado para selección de personal tiene un coeficiente de validez predictiva mas alto que el de fiabilidad. concluiría que A. debe tener un error ya que la validez predictiva NO puede ser mayor al coeficiente de fiabilidad D. el de validez y el de fiabilidad deben tener igual valor E. no debería utilizar la prueba ya que debe tener mas alta fiabilidad que validez para el objeto propuesto . está bien. por cuanto lo mas importante para la selección es la validez de predicción B.

Es la habilidad para aplicar principios y generalizaciones a nuevos problemas y situaciones. La Taxonomía de Bloom Aplicación: Se refiere a la capacidad para aplicar teorías. predecir lo que sucederá en una situación nueva mediante el uso de principios y generalizaciones apropiadas. principios. métodos o ideas en la solución de un problema práctico. y d) determinar o justificar una decisión o acción en una situación usando principios o generalizaciones e indicar el razonamiento que apoya la utilización de los mismos ante un determinado problema (Herrera 2003). Comprende entonces tareas como a) identificar los principios o generalizaciones apropiados para resolver un problema o reformularlo para lograr tal identificación. . c) explicar nuevos fenómenos a partir de principios o generalizaciones conocidas. b) especificar los límites dentro de los cuales un principio o generalización es verdadero o relevante y reconocer las excepciones a los mismos y las razones para ello.

. . . La Taxonomía de Bloom Ejemplo 3: Pregunta que evalúa Aplicación Escoja la característica del pensamiento infantil que mejor se ajusta a la conducta descrita por Piaget: . Los hace.Y el dueño del almacén? Piénsalo un poco. .Cómo se hace para tener madera? Se cortan los troncos de los árboles.Y los granos? Se compran.Cuando vinieron los primeros hombres. había ya árboles? No. .De dónde venían estos granos? Del almacén. Sincretismo E. . . Animismo C.Qué se hace para tener árboles? Se siembran los granos. . A. Funcionalismo . Artificialismo D.Dónde? En los almacenes.Cómo han comenzado? Por los granos. Realismo B.Con qué? Con otros granos.

comprensión y aplicación. y c) análisis de principios de organización que es la habilidad para explicitar los principios organizadores que ha seguido un autor. hechos e hipótesis. suposiciones o condiciones implícitas en una comunicación. recuerdo. Aquí se incluyen tres subcategorías: a) análisis de elementos o habilidad para fraccionar una información en sus elementos. o bien. inferir los criterios. o entre las conclusiones y las evidencias. relaciones. b) análisis de relaciones o identificar la relaciones que existen entre los elementos de una comunicación. La Taxonomía de Bloom Análisis: Hace referencia a la habilidad para fraccionar una comunicación en sus elementos. entre las conclusiones y las hipótesis. Esta es un proceso complejo que implica las tres categorías anteriores. su actitud o su interpretación (Herrera 2003). . determinar las relaciones entre las hipótesis y las pruebas que la apoyan. como supuestos no explícitos. cualidades. de manera que aparezcan explícitas la jerarquía de las ideas y las relaciones existentes entre ellas. reducir su propósito. pero va mas allá de ellas. su punto de vista.

etc. En ningún caso los hermanos fueron separados. A mayor concordancia genética corresponde un mayor porcentaje de acuerdo B. Una vez aplicados los instrumentos de medida (cuestionarios. . encuestas. El bajo porcentaje registrado por el grupo C se debe a que es el grupo con el menor nivel de homogeneidad genética D. el grupo B por parejas de gemelos bivitelinos y el grupo C por parejas de hermanos naturales. La criminalidad depende del medio ambiente en un 23%. C. se encontraron los siguientes porcentajes de acuerdo en relación con la presencia de conductas criminales: GRUPOS A B C % DE ACUERDO 77 35 8 Escoja la interpretación que mejor se ajuste a los datos de la investigación A.. en este caso la criminalidad.). No se puede concluir en favor de la heredabilidad de las conductas criminales. La Taxonomía de Bloom Ejemplo 4: Pregunta que evalúa Análisis Considere los resultados del siguiente estudio: En una investigación sobre heredabilidad de rasgos psicosociales. se conformaron tres grupos de sujetos así: el grupo A por parejas de gemelos univitelinos.

. Es difícil construir preguntas estructuradas que evalúen esta categoría. Esto es. son mucho más frecuentes las preguntas abiertas de tipo ensayo (Herrera 2003). b) producción de un plan o conjunto de operaciones con un fin determinado y c) derivación de un conjunto de relaciones abstractas. explicaciones o hipótesis para dar cuenta de un fenómeno dado. la habilidad para combinar elementos con el fin de constituir una estructura o esquema que no estaba presente con claridad. La Taxonomía de Bloom Síntesis: Es la capacidad para reunir diferentes elementos o partes para formar un todo. La capacidad de síntesis incluye: a) producción de una comunicación única.

obras. métodos. con algún propósito determinado. consistencia de los razonamientos. Al igual que en la categoría anterior. La Taxonomía de Bloom Evaluación: Es la capacidad para emitir juicios sobre ideas. relaciones entre supuestos. Esta categoría incluye formulación de juicios: a) con base en pautas internas como exactitud. . precisión y cuidado con que ha sido elaborada una comunicación dada. materiales o soluciones. son más apropiadas las preguntas abiertas de tipo ensayo (Herrera 2003). es difícil construir preguntas estructuradas que evalúen esta categoría. evidencias y conclusiones y reconoci miento de los valores y puntos de vista utilizados en un juicio particular sobre una obra b) en términos de criterios externos como comparación de un trabajo u obra con otros. utilizando criterios o normas explícitas.

Puede múltiple o cinco opciones utilizarse para evaluar cualquier objetivo educativo especialmente con única de respuesta recuerdo. Tipos de Preguntas NOMBRE ELEMENTOS CARACTERISTICAS Elección Un enunciado y cuatro Sólo una de las opciones completa correctamente el enunciado. El suficiente relacionadas con el evaluado no debe resolver el problema. Excelente para evaluar aplicación. Excelente para evaluar análisis. tres o todas las opciones de respuesta pueden completar múltiple (4) opciones de correctamente el enunciado. Dos afirmaciones Tanto la afirmación como la razón pueden ser VERDADERAS o FALSAS. Adecuado para evaluar cualquier objetivo múltiple educativo. Excelente para s evaluar análisis. . Análisis de Una afirmación y dos Tanto la afirmación como los postulados son VERDADEROS. dos. comprensión y aplicación. Análisis de separadas por la El examinado evalúa tanto su valor de verdad como la relación lógica relaciones palabra PORQUE entre ellas. el examinado debe elegir una con respuesta combinación de ellas. respuesta Un problema y dos Una o las dos informaciones pueden ser necesarias y suficientes para Información informaciones resolver el problema o pueden ser necesarias pero no suficientes. sólo evaluar la información mismo disponible. El postulado postulados examinado evalúa la relación lógica entre ellos. respuesta Elección Un enunciado y cuatro Una.

C. Una sola de las opciones completa o responde correctamente el enunciado. Los ejemplos 1 a 4 son preguntas de elección múltiple con única respuesta. Están conformadas por un enunciado y cuatro (4) o cinco (5) opciones de respuesta. las opciones de respuesta aparecen identificadas con las letras A. El enunciado puede contener una frase incompleta. un texto o una gráfica. Elección Múltiple con Única Respuesta Es el tipo de pregunta más conocido y usado en las pruebas objetivas. B. D y E. una interrogación. Este tipo de pregunta es útil para evaluar cualquiera de las cuatro primeras categorías de la taxonomía de Bloom. .

Si más de una opción es correcta probablemente la pregunta quede mejor formulada con el formato de elección múltiple con múltiple respuesta. . Elección Múltiple con Única Respuesta Además de las consideraciones generales sobre construcción de preguntas. en este tipo de ítems es altamente recomendable evitar expresiones como TODAS LAS ANTERIORES o NINGUNA DE LAS ANTERIORES.

3 y 4. Este tipo de pregunta es útil para evaluar cualquiera de las categorías de objetivos educativos.Elección Múltiple con Múltiple Respuesta Este tipo de pregunta consta de un enunciado y cuatro (4) opciones de respuesta identificadas con los números 1. d) un principio que puede aplicarse a más de una situación o e) varias consideraciones que pueden conducir al mismo resultado. se usa frecuentemente para evaluar comprensión y aplicación utilizando: a) una situación en la que es necesario considerar varias consecuencias posibles. b) una situación en la que es necesario especificar una o más condiciones para definirla adecuadamente. Sin embargo. 2. Una o varias opciones de estas pueden completar correctamente el enunciado. . c) dos situaciones semejantes o disímiles con respecto a uno o más puntos de comparación.

Una o varias opciones pueden completar correctamente el enunciado. 2 y 3 son correctas Marque B si las opciones 1 y 3 son correctas Marque C si las opciones 2 y 4 son correctas Marque D si sólo la opción 4 es correcta Marque E si todas las opciones son correctas .Elección Múltiple con Múltiple Respuesta Las instrucciones que se dan al examinado son. generalmente de la siguiente forma: "A continuación encontrará preguntas que constan de un enunciado y cuatro (4) opciones de respuesta. Usted debe marcar su hoja de respuestas según el cuadro siguiente: Marque A si las opciones 1.

. tampoco debe incluir en las opciones de respuesta expresiones como TODAS LAS ANTERIORES o NINGUNA DE LAS ANTERIORES.Elección Múltiple con Múltiple Respuesta Este tipo de pregunta no debe incluir distractores mutuamente excluyentes por cuanto estarían anulando una o varias opciones de respuesta.

Las personas toman menos tiempo en el aprendizaje de un concepto cuando hay muchos atributos irrelevantes 2. En el aprendizaje de un concepto la velocidad de aprendizaje es una función directa del número de atributos 4. Las personas toman más tiempo en el aprendizaje de un concepto cuando hay muchos atributos relevantes . En el aprendizaje de un concepto son mejores los ejemplos negativos que los positivos 3. Elección Múltiple con Múltiple Respuesta Ejemplo: La investigación empírica ha encontrado que: 1.

sino que decida si las informaciones proporcionadas son necesarias y suficientes para resolverlo. . Este tipo de pregunta es muy útil para evaluar aplicación. No se requiere que el examinado resuelva el problema. Información Suficiente Estas preguntas constan de un problema y dos informaciones identificadas con los números I y II.

Usted debe decidir si las informaciones son necesarias y suficientes para solucionar el problema y marcar su hoja de respuestas según el cuadro siguiente: .. generalmente. Información Suficiente Las instrucciones son. las siguientes: "Las preguntas que encontrará a continuación constan de un problema y dos informaciones identificadas con los números I y II.. Marque A sí necesita y basta con las informaciones I y II Marque B si necesita y basta con la información I Marque C si necesita y basta con la información II Marque D si cualquiera de las dos informaciones sirve Marque E si no es suficiente con las dos informaciones .

. c) en las preguntas de clave B. el problema debe poder solucionarse con las dos informaciones sin requerir de otra. b) en las preguntas de clave A. C o D. para la construcción de este tipo de preguntas es necesario tener en cuenta: a) las informaciones NO deben ser contradictorias entre sí o mutuamente excluyentes. Información Suficiente Además de las normas generales. el problema planteado debe poder solucionarse con una sola información y d) en las preguntas de clave E las informaciones deben ser necesarias pero NO suficientes para resolver el problema.

Se toman muestran aleatorias de las poblaciones. la distribución del estadístico de prueba II. Información Suficiente Ejemplo 6: Pregunta de Información Suficiente Se quiere comparar el tiempo de reacción ante un estímulo en dos poblaciones. se requiere conocer: I. se recogen los datos y se elige un estadístico de prueba. la probabilidad de obtener un valor mayor que el observado en el estadístico de prueba . Para decidir si se acepta o rechaza una hipótesis de igualdad de medias con un nivel de significancia .

solo debe analizar la relación lógica existente entre afirmación y postulados. Es muy adecuado para evaluar análisis. Análisis de Postulados  Este tipo de pregunta consta de una afirmación y dos postulados identificados con los números I y II. Para responder este tipo de pregunta el examinado no necesita evaluar el valor de verdad de las afirmaciones. . Es un tipo de pregunta de difícil elaboración y requiere de cuidadoso análisis previo para que la respuesta sea inequívoca. todo se supone verdadero. Entre la afirmación y los postulados se encuentra la palabra POR CONSIGUIENTE.

.. generalmente. Usted debe decidir si los postulados se deducen lógicamente de la afirmación y contestar según el cuadro siguiente: .Análisis de Postulados Las instrucciones para responder este tipo de pregunta son. Marque A sí de la tesis se deducen los postulados I y II Marque B si de la tesis solo se deduce el postulado I Marque C si de la tesis solo se deduce el postulado II Marque D si ninguno de los postulados se deduce de la tesis . como se muestra a continuación "Las preguntas que encontrará a continuación constan de una afirmación VERDADERA y dos postulados también VERDADEROS identificados con los números I y II.

Un psicótico puede ser inimputable II. Un inimputable comete un hecho típico y antijurídico pero no culpable ni punible . Análisis de Postulados Ejemplo 7: Pregunta de Análisis de Postulados Es inimputable quien comete el delito bajo influencia determinante de un trastorno mental POR CONSIGUIENTE I.

para la construcción de este tipo de preguntas es necesario tener en cuenta: a) aun cuando la instrucción le indica al examinado que debe suponer todo verdadero. b) todas las afirmaciones deben ser gramaticalmente completas e independientes unas de otras. c) la construcción de la pregunta debe ser tal que la deducción lógica sea indiscutible. de manera que la respuesta correcta sea inequívoca y d) este tipo de pregunta es útil para poblaciones de alto nivel educativo. . por lo menos que no sean absurdos u obviamente falsos. Análisis de Postulados  Además de las normas generales. es recomendable que las afirmaciones lo sean en efecto o.

A diferencia de las preguntas de análisis de postulados. Análisis de Relaciones  Las preguntas de este tipo presentan dos afirmaciones unidas por la palabra PORQUE y la segunda afirmación se considera una RAZON verdadera o supuesta de la primera. Este tipo de preguntas es particularmente útil para evaluar análisis y presenta menos dificultades prácticas que la pregunta de análisis de postulados. . El examinado debe evaluar tanto el valor de verdad de las afirmaciones como la relación entre ellas. en éstas las afirmaciones pueden ser verdaderas o falsas.

y contestar en su hoja de respuestas según el cuadro siguiente: Marque A si ambas afirmaciones son verdadera y la segunda es una razón o explicación correcta de la primera Marque B si ambas afirmaciones son verdaderas pero la segunda NO es una razón o explicación correcta de la primera Marque C si la primera afirmación es verdadera pero la segunda es falsa Marque D si la primera afirmación es falsa pero la segunda es verdadera Marque E si ambas afirmaciones son falsas . Usted debe juzgar tanto el grado de verdad o falsedad de cada una de ellas como la relación existente entre las mismas. Análisis de Relaciones Las preguntas que encontrará a continuación constan de una afirmación y una razón unidas por la palabra PORQUE.

Análisis de Relaciones Las preguntas que encontrará a continuación constan de una afirmación y una razón unidas por la palabra PORQUE. Usted debe juzgar tanto el grado de verdad o falsedad de cada una de ellas como la relación existente entre las mismas. y contestar en su hoja de respuestas según el cuadro siguiente: Marque A si ambas afirmaciones son verdadera y la segunda es una razón o explicación correcta de la primera Marque B si ambas afirmaciones son verdaderas pero la segunda NO es una razón o explicación correcta de la primera Marque C si la primera afirmación es verdadera pero la segunda es falsa Marque D si la primera afirmación es falsa pero la segunda es verdadera Marque E si ambas afirmaciones son falsas .

es decir. b) las afirmaciones no deben ser contradictorias entre sí o mutuamente excluyentes y c) las afirmaciones deben estar construidas de manera que pueda juzgarse su verdad o falsedad independientemente. Análisis de Relaciones  Para la construcción de este tipo de preguntas es necesario tener en cuenta: a) las afirmaciones no deben ser obviamente falsas u obviamente verdaderas. deben ser frases gramaticalmente completas. .

es decir. b) las afirmaciones no deben ser contradictorias entre sí o mutuamente excluyentes y c) las afirmaciones deben estar construidas de manera que pueda juzgarse su verdad o falsedad independientemente. deben ser frases gramaticalmente completas. . Análisis de Relaciones  Para la construcción de este tipo de preguntas es necesario tener en cuenta: a) las afirmaciones no deben ser obviamente falsas u obviamente verdaderas.

Análisis de Relaciones Ejemplo 8: Pregunta de Análisis de Relaciones El hemisferio cerebral izquierdo regula las contracciones musculares del lado derecho del cuerpo PORQUE las fibras motoras y sensitivas se cruzan en el bulbo .

ANÁLISIS DE LOS ÍTEMS .

Estimación de la Dificultad del ítems Éxito en la estimación en contextos variados Propiedades del sujeto Propiedades de los ítems Halo Azar Covarianza con la prueba Juicios Subjetivos (Homogeneidad) Frecuencia de cada opción Calificación Dificultad Discriminación Administración Correlación con la prueba Rapport .

. 2. Las características del logro del grupo. 4. La complejidad de la habilidad medida.  Este índice de dificultad sirve para evaluar cuatro variables: 1. La comparación de distintos reactivos que miden la misma habilidad. La comparación de reactivos que miden la misma habilidad pero con una relación jerárquica. Es la media de éste 50% de sujetos analizados. INDICE DE DIFICULTAD  Indica la proporción de aciertos en la muestra de alumnos que estamos utilizando.  El término de dificultad se presta a equívocos: in índice mayor indica un pregunta mas fácil. 3.

5.100% .49% 50% .89% 90% . INDICE DE DIFICULTAD  Se fija un mínimo valor aceptable de p = 0.69% 70% . es mejor no usarlo porque podría ser que lo que está mal son las instrucciones. aunque no quiere decir que el reactivo no sirve. Muy difícil Optima Ligeramente fácil Muy fácil 0% . cualquier medida inferior a 0.5 para considerar el reactivo bueno.  Criterios para calificar la dificultad de los reactivos de acuerdo al valor del índice de dificultad de los reactivos p.

contribuye mas a situar a un sujeto entre los primeros o entre los últimos. el ítem es mas discriminante. INDICES DE DISCRIMINACION  Los índices de discriminación expresan en que medida cada pregunta o ítem diferencia a los que mas saben de los que menos saben.  A mayor diferencia.  Es el índice probablemente más utilizado. en numero de acertantes entre los grupos superior e inferior. establece diferencias. . Expresa hasta que punto la pregunta discrimina. contribuye a situar a un sujeto en el grupo superior e inferior.

tendremos que: ID= -1. pero eso no quiere decir necesariamente que sean malas preguntas.  Si todos y solos los del grupo superior responden correctamente. tendremos que: ID=1. no establecen diferencias. . Estas preguntas no contribuyen a la fiabilidad del test.  Si todos y solos los del grupo inferior responden correctamente. Las preguntas muy fáciles y muy difíciles no discriminan. pero no quien sabe mas y quien menos. nos dicen que todos saben o no saben una pregunta.

30 el ítem debe eliminarse porque no discrimina. Si el ID es menor de 0. A mayor valor. mayor poder discriminativo. aún cuando su nivel de dificultad sea óptimo.30 y su nivel de dificultad no es óptimo debe entonces corregirse y mejorarse ya que discrimina y puede considerarse como un ítem adecuado para la prueba. .  Si el ítem tiene un ID igual o superior a 0.

Nos interesan los puntajes extremos (27% de bajos) y (27% de altos) y los puntajes promedio no sirven para el análisis. Forma de calcular D y P  Procedimiento: 1. se ocultan. Ordenarlos de mayor a menor o al revés. si hay 100 datos el 27% serian 27 datos y si fueran 70 datos el 27% seria equivalente a 18 datos. Por ejemplo. . Hallar los puntajes totales por sujeto. 2.

4. Calcular el número de sujetos del grupo de los altos que responde correctamente bien cada ítem y calcular el número de sujetos del grupo de los bajos que responde bien cada ítem. .3. Identificar el índice de dificultad por la formula: P = nG(altos)A + nG(bajos)B G(total)A + G(total)B y el índice de dificultad con la formula: D = GA + GB G(total).