You are on page 1of 63

UNIDAD 1. Definición y alcances de la evaluación psicológica. Problemas terminológicos.

 Testificación, examen o exploración psicológica

El concepto de testificación aparece ligado a la denominación de test mentales. Estos términos


se utilizaron para definir los instrumentos que tenían como objeto la adopción de un “sistema
uniforme que permita comparar y combinar, en lugares y momentos diferentes, la medida de las
funciones mentales”. Por testificación se entiende la aplicación de test mentales.
Los conceptos de Examen o Exploración psicológica resultan sinónimos de testificación.
Aluden más bien al acto de testificar, en el sentido de examinar, explorar, es decir, inquirir o
averiguar las características psicológicas que se deseen investigar. En la actualidad es preferible
utilizar examen o exploración en lugar de testificación, ya que este alude exclusivamente a la
indagación en la se utilizan solamente tests.
El término Psicodiagnóstico se encuentra ligado al test de manchas de tintas, el
Psicodiagnóstico de Rorscharch (1927) destinado al diagnóstico psicológico, de carácter
individual. Es preferible entonces, circunscribir este término en referencia a esta prueba y hablar
de diagnóstico cuando se trate de diagnóstico particular de un sujeto con la inclusión o no de
diferentes pruebas.
 Consideraciones sobre el contexto científico histórico del desarrollo de los
instrumentos de evaluación y las modificaciones terminológicas.
Los trabajos de Binet y Simon sobre la medida de la inteligencia produjeron un amplio desarrollo
en materia de instrumentos de evaluación.
Durante las primeras décadas del s XX hubo una notable extensión de los test, de origen europeo
americano, particularmente en relación con los desarrollos teóricos de la Psicología y de sus
ámbitos de explicación y a las necesidades de contar con indicadores empíricos válidos y
confiables, respecto de sujeto de diversas edades y en diferentes situaciones. Se elaboraron
instrumentos que posibilitaron el diagnóstico, la orientación y selección de sujetos, en tal sentido
se inscriben los trabajos de Gessell y Amatruda, Wechsler, Raven, etc.
La 1º y 2º GM impulsaron la elaboración de instrumentos específicos, a partir de la necesidad de
conocer las características de miles de sujetos, que iban a desempeñar distintas actividades en el
frente de batalla.
En la década del 50 y 60 se ubica el apogeo de la testificación. El desarrollo de los test incluía la
medida de la inteligencia, de personalidad, de perturbaciones neurológicas, aplicados a campos
variados de psicología, educación y trabajo.
En esa época surge una corriente que comienza a formular interrogantes a propósito de la
testificación, su alcance y eficacia. Cohen & Swerdlik (1988) se preguntan ¿Los test
psicológicos violan uno de los derechos constitucionales a la privacidad? ¿Los test realmente
miden lo que se proponen medir? ¿Qué decisiones pueden y no pueden tomarse a partir de los
datos de un test? ¿Qué credenciales es necesario acreditar para administrar y evaluar los test
psicológicos?
En respuesta a estos interrogantes, en los 60 se examina la empresa de la testificación. En una
nueva perspectiva los test psicológicos fueron considerados no ya como instrumentos de

1
medida sino como instrumentos a ser utilizados por un examinador altamente calificado y
entrenado. El valor de un test particular estuvo ligado a la experticia del usuario del test.
 Testificación y Evaluación Psicológica

La palabra evaluación ha tenido un largo recorrido desde el s XVIII. Su dominio ha ido


extendiéndose a la vida universitaria para dar cuenta de indicadores de desempeño, que apreciar
calidad y beneficios de la investigación científica y tecnológica. Evaluación refiere a la estimación
del valor de esas actividades.
Durante la Segunda Guerra Mundial, comenzó a emerger una distinción semántica entre
“testificación” y “evaluación”. EEUU empleo diversos procedimientos e instrumentos de
medida con el propósito de seleccionar personal militar para posiciones altamente calificadas.
La intervención del psicólogo examinador o evaluador supuso una activa integración de los
puntajes de los test y de otros datos provenientes de otras fuentes. Se trató de algo más que el
simple proceso de aplicación y puntuación de un test. El resultado de ello ha sido que el término
EVALUACIÓN sea preferido al de testificación. Evaluación alude al hecho que el test representa
solo un tipo de instrumento utilizado por profesional evaluador, y el valor de un test está
íntimamente ligado con la experticia del evaluador.
En la evaluación psicológica se pueden utilizar diferentes instrumentos: entre ellos test
psicológicos. Por el contrario, la testificación psicológica se visualiza como de alcances más
limitados, referida únicamente al “proceso de administrar, puntuar e interpretar los test
psicológicos”
TESTIFICACIÓN EVALUACIÓN
Objetivo típico: medir la magnitud de algún El objetivo se extiende más allá de la
rasgo psicológico obtención de un número, puede apuntar a
reflejar las fortalezas y debilidades,
integrando los datos provenientes de los
resultados, con datos provenientes de otras
fuentes de información.
La testificación se ubicaría dentro de la evaluación psicológica. Es el proceso de evaluación el
que proporciona significado a los puntajes de los test, resultado de la testificación.
 La construcción y uso de los test psicológicos

En la actualidad existe un relativo consenso en la comunidad científica acerca de la


construcción, uso, interpretación y aplicación de los test:
 Establecimiento de estándares para la construcción de test.
 Normas para la traducción y adaptación de los test a contextos diferentes de su
elaboración original.
 Recomendaciones para la utilización y entrenamiento de los usuarios de tests.
 Normas deontológicas acerca del uso del test.

 Aproximaciones actuales a la delimitación de la Evaluación Psicológica

El termino EVALUACIÓN PSICOLÓGICA ha ganado consenso sobre los términos de testificación


o examen y se ha diferenciado del psicodiagnóstico.

2
En síntesis, la evaluación psicológica consiste en la reunión e integración de datos psicológicos,
realizada a través del uso de instrumentos tales como test, entrevistas, estudio de casos,
observación de la conducta, aparatos y procedimientos de medida especialmente diseñados.
La testificación psicológica en cambio, es el proceso de medir o examinar variables
psicológicas a través de mecanismos o procedimientos diseñados para obtener una muestra de
conducta.

“La EVALUACIÓN constituye una “orientación más comprehensiva, más globalizadora, que el
puro hecho de testar”
 Una propuesta de delimitación

En la actualidad, se concibe a la Evaluación Psicológica como una actividad compleja que


requiere el interjuego de conocimientos altamente especializados en psicología (teoría de los test)
y de la experticia en áreas de práctica profesional e investigativa.
La evaluación es un proceso conceptual de resolución de problemas que depende de la
recolección, análisis e interpretación de información relevantes sobre las unidades de análisis
bajo estudio que posibiliten tomar decisiones o hacer recomendaciones.
Las delimitaciones de sus alcances requieren considerar dos cuestiones de importancia:
1. Propósitos de la evaluación requiere al por qué y al para qué de la evaluación.
2. Ámbitos en los que se lleva a cabo, dónde se realiza la actividad y las relaciones que
guarda con el sistema de recursos sociales con los que se cuenta.
Se proponen las siguientes distinciones analíticas:
 En un sentido amplio por evaluación psicológica se entiende a la totalidad del proceso
que va desde la obtención de datos a la interpretación de los resultados y a la consecuente
toma de decisiones que se desprenden de sus alcances.
 En un sentido estricto corresponde solo al momento de estimar el valor de los resultados
obtenidos, a parir de procedimientos y técnicas diversas, es decir, en el momento de
analizar, elaborar e interpretar tales resultados y a formular las consideraciones que
pueden realizarse. Dicho de otro modo, evaluar es estimar el alcance y significación de los
resultados obtenidos, circunstancia que conduce a tomar decisiones respecto de ellos.
Este proceso involucra una serie de cuestiones:
Qué se va a examinar. La consideración de las unidades de análisis involucradas en la
evaluación psicológica. Se examinan tanto características individuales como las interacciones del
sujeto con el medio.
Cómo se va a examinar. Los procedimientos a ser utilizados pueden ser de diferente naturaleza,
como la observación, la entrevista, el uso de tests y técnicas psicológicas, etc.
Cuáles son los datos que se obtienen. Los datos constituyen indicadores empíricos de aquello
que se pretende examinar. Pueden ser cuantificables y no cuantificables.
Cuál es el significado de esos resultados. A partir de los datos obtenidos, se inicia la
evaluación propiamente dicha o evaluación en sentido estricto. Consiste en delimitar las
características de nuestra unidad de análisis seleccionada, incluyendo sus fortalezas y

3
debilidades. El propósito último de la evaluación es optimizar los puntos críticos encontrados, a
través de la toma de decisiones acerca de las intervenciones adecuadas o más útiles.
Cuando evaluamos un sujeto y realizamos un diagnostico psicológico, se integran e interpretan
datos procedentes de diversas fuentes (tanto características personales y tmb las vinculadas a los
contextos e interacciones altamente intervinientes y determinantes). Pero la evaluación puede
tener otros objetivos, no necesariamente que sea el diagnostico psicológico, x ej: descripción de
características psicológicas de un sujeto o un grupo de sujetos.
Cuáles son las decisiones que pueden tomarse a partir de esos resultados. Pueden surgir
recomendaciones acerca de las posibles intervenciones a realizar: orientación psicológica,
tratamiento psicológico o psicoterapia, selección del personal, optimización de las interacciones y
contextos, mejoramiento de las intervenciones, etc.

UNIDAD 2. La medida en el campo de la Psicología

LOS TEST. Introducción.


En el siglo XIX se ubican las primeras tentativas para medir las diferencias individuales. Aparecen
los primeros test mentales. El contexto científico-histórico de la época abarcaba:
- Psicología científica: mide las características elementales de los procesos mentales
- Teorías de Darwin: destacó el rol de las variaciones individuales en la evolución de las
especies.
LOS TESTS PSICOLÓGICOS
“Un test es un instrumento que permite medir (o examinar) de manera objetiva y tipificada una
muestra de conducta en una situación controlada” (Anastasi, 1975-1908)
Análisis de las definiciones:
 INSTRUMENTO: herramienta utilizada para medir o examinar la variable psicológica
seleccionada.
 MEDIDA OBJETIVA: todos los sujetos son sometidos a los mismos requerimientos y los
resultados que se obtienen se interpretan con independencia del juicio subjetivo del
examinador.
 MEDIDA TIPIFICADA (o estandarizada):
a). Porque existe uniformidad en los procedimientos de aplicación, puntuación e
interpretación para todos los sujetos examinados.
b). Porque se dispone de normas o baremos del test. Puntuaciones del grupo de
pertenencia con las que se comparar las puntuaciones del sujeto examinado.

Los resultados de los tests suelen expresarse en puntuaciones o puntajes. Reflejan la actuación
de un sujeto respecto de los sujetos de su misma edad y grupo de referencia.

Esas puntuaciones son el resultado de aplicar las propiedades del número a las propiedades de
las variables que se pretende examinar. Particularmente para las Cs. Soc. y Humanas, medir es
vincular conceptos abstractos con indicadores empíricos.
4
ASPECTOS QUE COMPONEN UN TEST:
 Manual del test: el autor informa sobre los propósitos y características de ese instrumento
en particular.
 Instrucciones para su administración y evaluación
 Material propiamente dicho (reactivos verbales, de ejecución, etc.)
 Protocolos (hojas de respuesta) en los que se vuelca el registro de la actuación del sujeto
examinado.
 Son instrumentos estandarizados. Poseen normas y baremos.
 Poseen propiedades: Validez y Confiabilidad.
NIVELES DE MEDICION:

 NOMINAL. Dos o más categorías. Sólo clasifican. Ejemplo: Niños y Adultos


 ORDINAL. Varias categorías ordenadas jerárquicamente. Ejemplo: 1) profesor titular 2)
profesor asociado 3) profesor adjunto
 POR INTERVALOS. Además de orden o jerarquía se establecen intervalos iguales entre
uno y otro nivel (las distancias entre uno y otro son iguales). Se asigna a una categoría el
valor 0 arbitrariamente. Ejemplo: Nota 7, Nota 8, Nota 9, Nota 10
 RAZONES. Posee las propiedades de todos los otros: clasifica, ordena según intervalos
iguales entre las categorías y además la categoría 0 es real (un punto de la escala donde
está ausente la propiedad medida). Ejemplo: de 0 a x días.
PUNTUACIONES O PUNTAJES:
Los resultados de los test suelen expresarse en puntuaciones o pjes. Refleja la actuación de un
sujeto respecto de los sujetos de su misma edad y grupo de referencia.
Existen distintos tipos de puntuaciones, cada uno de los cuales presenta ventajas y limitaciones
relativas. Se harán precisiones respecto de las puntuaciones que se expresan como Cociente
Intelectual de Proporción y Cociente Intelectual de Desviación.
1) Puntuaciones de edad
En algunos test de inteligencia como las Escalas Binet Simon, los elementos (pruebas que
componen el test) están ubicados en niveles de edad. Se seleccionan los elementos más
apropiados, para cada nivel de edad.
Se ordenan de acuerdo al grado de dificultad y se combinan, por ejemplo, en grupo de 6
elementos en un mismo nivel de dificultad. El número de elementos de un mismo nivel determina
la puntuación a asignar: así, por ejemplo, en el caso en que los niveles de edad se agrupen en
semestres, cada uno de los seis elementos recibirá una puntuación correspondiente a 1 mes.
En la práctica, la ejecución de un individuo en una determinada escala muestra cierta dispersión,
es decir que responde con éxitos a elementos que se ubican en diferentes niveles de edad. Por
ello se determinan:
 La edad base: mayor nivel en el que todas las pruebas son resueltas satisfactoriamente y
que supone la resolución correcta de las pruebas de los niveles anteriores.
 La edad tope: nivel de edad en el que se fracasa en todas las pruebas.
 La sumatoria de estas puntuaciones constituye la edad mental que obtiene el individuo. La
edad mental representa el nivel de éxito logrado por el promedio de sujetos de una
determinada edad cronológica (Terman y Merrill, 1972).
5
Características de la Edad Mental:

- El año de edad mental como unidad de medida no permanece constante. Decrece la


magnitud a medida que se avanza hacia edades cronológicamente mayores.
- La velocidad del “crecimiento mental” es mayor en los primeros periodos evolutivos que en
periodos posteriores.
- El límite del “crecimiento mental” se ubica alrededor de los 18 años de edad.

Por esta razón las Edades Mentales no resultan adecuadas para expresar normas adultas.

- Los años de atraso o adelanto que puede presentar un sujeto en términos de Edad Mental
respecto de su Edad Cronológica, no tiene la misma significación en diferentes periodos
evolutivos.
- Las diferencias entre ambas resultan más significativas en edades tempranas: un atraso de
un año es un atraso importante entre los tres y cuatro años y resulta prácticamente
irrelevante entre los trece y los catorce años.
- Las Edades Mentales no representan niveles absolutos de capacidad mental,
independientemente de la edad cronológica en las que son obtenidas, sino niveles
relativos.
Para solucionar estas limitaciones se utilizan en la práctica psicométrica distintos índices y
procedimientos que tienden a solucionarlas:
Cociente Intelectual (C.I.) de proporción o razón: su cálculo se efectúa dividiendo la Edad
Mental por la Edad Cronológica y multiplicando el resultado por 100, para evitar el uso de
decimales:
E. M
C . I .= x 100
E .C

*Ver ejemplos de limitaciones de las puntuaciones de edad


2) Las puntuaciones típicas (z)
Estas puntuaciones expresan la distancia de un puntaje respecto de la media, en función de la
desviación estándar de la distribución.
Tienen la ventaja de poder comparar las puntuaciones de dos individuos en un mismo test o las
puntuaciones de un mismo individuo en tests diferentes.
Para calcularse a través de transformaciones lineales, que retienen las relaciones numéricas
exactas de las puntuaciones directas originales, se halla la diferencia entre la puntuación directa
de un individuo y la media del grupo y se la divide por la desviación estándar del mismo grupo
X− M
z=
D.S

Muchos test, como las Escalas Wechsler, utilizan este tipo de puntuaciones. En ese Caso se los
llama Cocientes Intelectuales de Desviación, porque su cálculo no sigue el procedimiento de
proporción, sino que se igualan las puntuaciones obtenidas a través de la elección de una Media
arbitraria de 100 y un Desvío Estándar arbitrario de 15.
3) Los percentiles
Las puntuaciones percentiles constituyen medidas de posición que indican el porcentaje de grupo
6
normativo que queda por debajo y por encima de una puntuación directa determinada. Es decir
que un percentil indica la posición relativa de un individuo respecto de su grupo normativo
(Anastasi, 1982)
Ventajas: Son fáciles de calcular y comprender, son de aplicación universal, pueden ser
utilizados en cualquier tipo de test.
Desventajas: La desigualdad de sus unidades; en la distribución normal, los percentiles tienden a
agruparse alrededor de la mediana y se alejan de los extremos; no representa la diferencia de
puntuaciones entre dos personas.
Es de interés recordar los porcentajes de la población que se encuentran entre la Madia y las
Desviaciones Estándar para poder interpretar el alcance de las puntuaciones, así como poder
ubicarlas rápidamente:

- Para ubicar los CI en la Curva de Probabilidad se debe sumar o restar, según corresponda,
el valor del DS al valor de la Media.
- Para ubicar los Percentiles en la Curva de Probabilidad se debe sumar o restar, según
corresponda, el valor del porcentaje de la población incluida entre la M y 1 DS o al valor de
la mediana, y adicionar o restar sucesivamente los porcentajes ubicados entre +-1DS y +-
2DS y entre +-2DS y +-3DS
UTILIDAD DE LAS PUNTUACIONES
Todas son legítimas y la elección depende de los objetivos de la evaluación.
Toda vez que la exploración psicológica requiera conocer la posición de un sujeto respecto de su
grupo normativo (grupo de edad), y la distancia que separa una puntuación de otra, las
puntaciones típicas resultan más adecuadas.
Pero a los fines prácticos, por ejemplo, de orientación educativa, se trata en este caso de una
conclusión de alcances limitados, puesto que interesa además conocer a que nivel de edad
corresponden las puntuaciones, para poder ubicar el nivel de escolaridad que puede cursar con
éxito. Las puntuaciones de edad proporcionan información más adecuada.
En cuanto a las puntuaciones percentiles, son útiles en términos de la comparación de las
diferentes posiciones de los individuos en el grupo normativo. Pero adolecen además de las
limitaciones que fueron señaladas, tales como la Media y el Desvío Estándar.
Resulta posible, que cuando se satisfacen condiciones estadísticas se puede traducir cualquier
puntuación a otra.

UNIDAD 3: Instrumentos tipificados y no tipificados.

Entre los instrumentos no tipificados de evaluación psicológica se encuentra la OBSERVACIÓN,


la ENTREVISTA y la ENCUESTA.
No tipificados porque si bien en ellos se siguen determinados procedimientos de obtención y
registro de datos, NO se cuenta con normas o baremos para la comparación de los resultados
con la población normativa y no suelen contar con indicadores de validez y confiabilidad.

7
La observación y la entrevista psicológica se encuentran entre los instrumentos más antiguos de
evaluación psicológica. En el s XIX, aunque se han diseñado otros instrumentos de evaluación,
ambos siguen siendo importantes. Asimismo, ha aumentado el uso de encuestas.
Las tres técnicas requieren una elaboración e interpretación de acuerdo a las manifestaciones
de las unidades de análisis.
Cuando se utilizan estas técnicas se toma nota, generalmente por escrito, de los eventos que han
sido vistos o escuchados. Todas ellas son difíciles de precisar en ausencia de la teoría que las
orienta.
1) OBSERVACIÓN
Técnica a partir de la cual se obtienen datos perceptibles de la unidad de análisis: características
de los sujetos, tales como su forma de comportamientos verbales y no verbales en situaciones
diversas; de las interacciones entre sujetos, sean gestuales o verbales, de los contextos, con
referencia por ejemplo a las cualidades ambientales.
Criterios de clasificación de la técnica de observación:
Según su planificación:

 Controladas: se guían por un plan previo


 No controladas: refieren a circunstancias más fortuitas, no planificadas deliberadamente

Según se inscriban o no en el método científico:

 Observación científica: objetivo claro, definido y preciso: el investigador sabe qué es lo


que desea observar y para qué quiere hacerlo, lo cual implica que debe preparar
cuidadosamente la observación.
 Observación no científica: sin intención ni objetivo definido y, por tanto, sin preparación
previa.
Según el grado de participación del observador:

 Observación participante: el observador es parte de la situación observada, de modo tal


que la modifica en alguna medida.
 Observación no participante: situación relativamente neutra del observador. Este es
parte de la situación observada, de modo tal que la modifica en alguna medida. Los datos
obtenidos en tales circunstancias si bien no guardan la fidelidad que aparece bajo la
observación participante, gana en opinión de sus defensores, en poder provocar la
aparición de datos que no se captarían de otro modo.
Según se dirija a otros o a sí mismo:

 Autoobservación u observación de otros.

Para observar se debe conocer cuál es el propósito de la observación y qué se debe observar,
para poder hacer un análisis e interpretación correctos de los datos obtenidos. La teoría indica
qué debemos observar.
Observar, a diferencia de aquello que usualmente se sostiene, es una técnica difícil, que requiere
competencia y experiencia importantes de parte del evaluador, quien debe partir de objetivos o

8
hipótesis perfectamente explicitados, que den sentido a su actividad, que debe guardar
coherencia con la teoría de la que parte.
2) ENTREVISTA
Remite al intercambio verbal en el cual existen dos roles bien definidos: el del entrevistador y el
del entrevistado, donde primero intenta obtener información sobre el segundo. Se trata de un
proceso de interacción con un fin determinado.
Como técnica se inscribe en el proceso de evaluación psicológica y asume características y
estrategias de realización diferentes, las características dependen en primer lugar del marco
teórico que adopte, que permite seleccionar los objetivos que persigue.
Los objetivos a su vez se relacionan con el campo de aplicación de la evaluación
psicológica, que serán diferentes según se trate de entrevistas con fines diagnósticos,
terapéuticos, de orientación, de selección de personal, de sondeo de opinión, entre otras.
Se pueden delimitar a grandes rasgos, los tipos de información básica que se obtienen en la
entrevista:

 Observación del entrevistado durante la interacción que se mantiene con él.


 Obtención de datos, a través del intercambio verbal.

3) ENCUESTA/CUESTIONARIO
Destinada a obtener datos de personas que tienen alguna relación con el problema que es
materia de indagación.
Supone la utilización de un listado previo de preguntas (cuestionario propiamente dicho), que
puede proporcionarse en forma oral o escrita, para que los sujetos respondan y ser anónimo o no,
dependiendo de los objetivos que se persiguen.
Ventajas: Aplicación colectiva, y por lo tanto más económica.
Desventajas: Sesgo de deseabilidad social en las respuestas, insuficiencia de comprensión de
las preguntas, dificultades en diferenciar matrices en las respuestas, influencia del grado de
acuerdo con el tema indagado, empatía o falta de empatía con el encuestador.
INTRUMENTOS DE EVALUACIÓN TIPIFICADOS.
La clasificación de tales instrumentos obedece a criterios múltiples y refiere a diferentes
aspectos a ser considerados, tales como características, estructura, objetivos, contenidos, tipo de
administración, filiación teórica del instrumento, referencia a la norma o al criterio para su
evaluación, entre otros.
Para poder seleccionarlos y utilizarlos de manera adecuada, se obedece a las razones y
propósitos de la evaluación (por qué y para qué evaluar). Ello conlleva con claridad y precisión
respecto de la unidad de análisis a ser considerada, así como de las variables a ser incluidas.

UNIDAD DE ANÁLISIS VARIABLE


Sujetos Inteligencia
Rendimiento
Personalidad
Intereses
Contextos Características
9
Indicadores socioeconómicos
Interacciones Características de la interacción adulto-
niño en la lectura de cuentos dialógica
Intervenciones Evaluación de impacto de un modelo de
intervención

SNOW sostiene que “diferentes propósitos requieren diversos tipos de evaluación, y la base de
la evidencia que apoya el uso de una evaluación para un propósito puede no ser conveniente
para otra. A medida que las consecuencias de los resultados de la evaluación llegan a ser más
fuertes, la exactitud y la calidad de los instrumentos usados para proporcionar resultados debe
ser más segura”
La selección de instrumentos de evaluación debe reflejar los mayores niveles de evidencia en tres
dominios:

- Propiedades psicométricas de los instrumentos utilizados en el sistema de evaluación.


- Adecuación de los instrumentos de evaluación (según diferencias étnicas, raciales,
comunidad lingüística, estatus socioeconómico, categoría de edad, etc.)
- Dominios a los que está dirigido el foco de evaluación (unidad de análisis y variables a
ser consideradas)
A ello se suma dos requisitos externos a los instrumentos, pero indispensables para su aplicación:
Requisitos para la selección de las variables a examinar:

- Necesidad de entrenamiento intensivo de los evaluadores, no solo en relación a la


aplicación sino, además, respecto del análisis, interpretación e informe de los
resultados obtenidos.
- Consideraciones deontológicas de la comunidad científica, pautada en estándares
específicos.
Características de los instrumentos de evaluación
Una de las características de los instrumentos de evaluación es que están tipificados o
estandarizados. En razón de ello, todos los instrumentos comparten las siguientes
características:
1. Uniformidad del material de examen y de las consignas de administración.
Para preservar la uniformidad de los procedimientos de administración, que hacen
comparables las actuaciones de los sujetos examinados, en la medida que permanecen
idénticas las condiciones de examen.
2. Disponibilidad de información para la interpretación adecuada de los puntajes.
La interpretación de las puntuaciones puede hacerse de diferentes formas, en función de
los interrogantes que se formulen, y que han sido considerados en la elaboración del
instrumento.
Pueden distinguirse tipos de información necesarios:
- Interpretación referida a la norma: se pretende dar respuesta al interrogante acerca de
cómo se sitúa la actuación de un sujeto respecto de la población normativa, se requiere
contar con información respecto del grupo de referencia. Con las normas o baremos del
instrumento, obtenidas por la muestra de tipificación en el proceso de estandarización.
10
- Interpretación referida al criterio: la interpretación de los puntajes obedece al
interrogante de cómo se sitúa el sujeto en relación con criterio de logro u objetivo
previamente especificado. Se trata de contar con información precisa sobre el criterio de
logro u objetivo perseguido.
- Interpretación de la fuerza relativa de las puntuaciones. Se interpreta la información
respecto de los puntos fuertes y débiles, obtenidos a partir de puntuaciones en pruebas de
elección forzada, donde no pueden aceptarse o rechazarse al mismo tiempo las
alternativas propuestas.
3. Indicadores de validez y confiabilidad.
En la TCT (Teoría clásica de los test) se obtiene evidencia de la validez del instrumento,
información destinada a mostrar que mido o examina aquello para lo que fue diseñado.
También se obtienen indicadores de confiabilidad que se refieren a la consistencia o
estabilidad de las mediciones. Un instrumento válido y confiable examina la variable o
variables a las que está dirigido y sus estimaciones están relativamente libres de errores
de medida.
Criterios de clasificación de los instrumentos de evaluación
A. Criterio referido al tipo de desempeño y de ejecución o respuesta típica, de dominio
general o de dominio específico.
Tipo de desempeño del examinado que se desea evaluar:

- Ejecución máxima: si se trata de obtener el rendimiento mayor del que el sujeto es capaz
- Ejecución típica: si se trata de obtener información sobre las características que
habitualmente identifican al sujeto.
Es necesario complementarlo con otro criterio. Se trata de tomar en consideración la indagación
respecto:

- Dominio general: se pretende examinar características psicológicas aspectos globales.


- Dominio específico: se pretende examinar características específicas.

Ejecución EJECUCIÓN EJECUCIÓN TÍPICA


MÁXIMA
Dominio Aspectos salugénicos o
psicopatológicos

Inteligencia- PERSONALIDAD
Desarrollo-
Psicométricos Proyectivos
Rendimiento
DOMINIO Inventarios y Técnicas
Test de inteligencia
GENERAL cuestionamientos Proyectivas de
Escalas de de personalidad evaluación de la
desarrollo personalidad
psicológico,
pruebas de
rendimiento

Habilidades y Inventarios y Técnicas


cuestionamientos Proyectivas de
11
Conocimientos de intereses, evaluación de
actitudes, estilo de relaciones
DOMINIO Vocabulario,
afrontamiento, objetales, de
ESPECIFICO memoria,
estrategias de desarrollo libidinal,
percepción,
aprendizaje
Función Gestáltica
Visomotora

B. Criterios referidos a otras características de los instrumentos


1. Tests Psicométricos y Técnicas Proyectivas
Generalmente la diferencia entre ambas se adjudica a una variedad de criterios:
 Material de examen. características estructurales (grado de estructuración de los estímulos
utilizados).
Se atribuye a los test psicométricos una estructuración fuerte, y a las técnicas proyectivas
una estructuración débil. Esta consideración es un error.
Las diferencias se encuentran respecto de los test de rendimiento máximo cuyos
diferentes reactivos prevén una respuesta satisfactoria con distinto grado de exactitud,
justamente de tener que estimarse ese desempeño del sujeto respecto de su población
normativa.
Los estímulos de las técnicas proyectivas, no solicitan respuestas que puedan
considerarse correctas o incorrectas. Proporcionan elementos de juicio a ser considerado
como indicadores para interpretarse desde el marco teórico que las fundamenta o que
adopta el examinador.
En realidad, la diferencia entre ambos tipos de instrumentos se encuentra precisamente
en las respuestas a obtener a partir de determinado material y de una determinada
consigna.
Los test de ejecución máxima, organizan sus reactivos de modo tal de obtener una respuesta
correcta prevista, corrección que en muchos casos admite algunas variaciones. Las respuestas
reales pueden ajustarse en mayor o menor medida a la respuesta óptima. Ejemplo: Escalas
Wechsler.
Las pruebas de dominio general generalmente se utilizan para evaluar la inteligencia general, el
desarrollo psicológico y el rendimiento escolar, académico, laboral. Las de dominio específico
indagan aspectos particulares, como es el caso de la memoria, la atención, entre otras. En todos
los casos la finalidad de la evaluación es indagar los logros mayores de los que es capaz un
sujeto.
Cuando se trata de test psicométricos de ejecución típica los objetivos son otros. Se indagan
características habituales de los sujetos. En los de dominio general se trata de evaluar la
personalidad global (normal o patológica), como es el caso del MIPS, o MMPI Inventario
Multifasico de Minnesota. En los de dominio específico, de examinar aspectos particulares, como
intereses, motivaciones, estrategia de afrontamiento, estrategias de aprendizaje, estrategias
metacognitivas, entre otras.
Las técnicas proyectivas por el contrario presentan un material de manera tal que, al
organizarlo, interpretarlo o elaborarlo el sujeto proyecta sus contenidos psicológicos, que son
12
interpretados a la luz de la teoría de los fundamentos y de los criterios elaborados respecto de la
población de referencia.
 Características de las consignas.
Tanto en los psicométricos como en los proyectivos las instrucciones son precisas, es tan preciso
preguntar ¿Qué es una naranja?, cómo solicitar “Dibuje una persona”.
2. TEST TEORICOS Y EMPIRICOS
Los teóricos son instrumentos derivados de una teoría particular, que permite su elaboración a
partir de sus postulados. Tal es el caso de los tests de inteligencia basados en la teoría factorial,
ej.: Matrices Progresivas de Raven. La teoría factorial “trata de explicar las diferencias
individuales que se observan en las aptitudes o rasgos humanos mediante el menor número de
factores”
Los instrumentos empíricos por el contrario se apoyan en concepciones de los autores que los
construyen. Aparecen generalmente elementos tradicionalmente vinculados, de manera empírica
con el constructo que pretenden medir. Tal es el caso de las Escalas Binet y sus revisiones, o de
las Escalas Wechsler. Sin embargo, estas pruebas han incorporado a lo largo del tiempo el
caudal proporcionado por las diferentes teorías de la inteligencia, de modo tal que sus últimas
revisiones inducen a incluirlas entre las pruebas con fundamento teórico.
3. TEST VERBALES Y NO VERBALES
La distinción está referida al contenido de las pruebas y a las respuestas que demandan, es decir,
al tipo de material que utilizan y al tipo de respuestas que el examinador debe proporcionar.
Los test verbales plantean problemas y situaciones que se enuncian verbalmente, de manera
oral o escrita, debiendo los examinados responder de la misma forma. Ej.: BAIRES, Test de
Aptitud Verbal Buenos Aires (Cortada de Cohan, 2004).
Los test no verbales plantean problemas y situaciones que pueden enunciarse verbalmente, de
manera oral, escrita, o mímica. El material propiamente dicho no es verbal sino grafico o de
ejecución, es decir que el sujeto examinado debe realizar una tarea como dibujar, hacer
diagramas o esquemas, señalar una alternativa o bien manipular material concreto para resolver
una determinada cuestión. Ej.: Test de Matrices Progresivas de Raven (1993), el Test Gestáltico
Visomotor de Bender II (2003).
4. TEST INDIVIDUALES Y COLECTIVOS
Distinción que refiere a la cantidad de sujetos a ser examinados: Test Individuales, solo es
posible evaluar a un sujeto por vez, y Colectivos destinados a examinar simultáneamente a un
determinado grupo de sujetos.
5. OBJETIVOS DE LA EVALUACIÓN PSICOLÓGICA
Se pueden clasificar según los objetivos de evaluación que persiguen. Tales objetivos son
diversos y están en consonancia con las unidades de análisis que se seleccionan y con las
variables a ser consideradas. De este modo aparecen instrumentos destinados a la evaluación de
sujetos, contextos, interacciones e intervenciones. En cada unidad de análisis las variables a
incluir para identificar las características que se pretende evaluar son múltiples y responden a los

13
interrogantes acerca de cuáles son las razones y los propósitos del plan o programa de
evaluación que se persigue.
La validez y confiabilidad de los instrumentos de exploración psicológica.
Validez
La validez se refiere al grado en que un instrumento realmente mide la variable que pretende
medir. La validez es un concepto del cual pueden tenerse diferentes tipos de evidencia:
Evidencia relacionada con el contenido: validez de contenido. Se refiere al grado en el que un
instrumento muestrea un dominio específico del contenido de aquello que se mide. Por eso es
necesario especificar el contenido de lo que se mide. Un instrumento para poseer validez debe
contener representados todos los ítems del dominio de contenido de las variables a medir. En
otras palabras, se trata de la congruencia del contenido del test con la variable que se pretende
medir, especificada por el juicio de expertos sobre la pertinencia de los ítems incluidos.
Evidencia relacionada con el criterio: validez empírica o de criterio. Se comparan los
resultados del test con los resultados en una medición externa al test, denominada criterio. Por
ejemplo, un test de rendimiento académico puede tomar como criterio externo las notas de
rendimiento académico de los sujetos de la muestra. Si la comparación con el criterio externo se
hace en el presente (por ejemplo, con las notas académicas actuales), se habla de validez
concurrente; en cambio si la comparación con el criterio se hace en un tiempo futuro, se habla de
validez predictiva. Este tipo de validez se obtiene constatando la correlación que existe entre los
dos sistemas de puntuaciones. Un instrumento resultará válido si el coeficiente de correlación es
moderadamente alto.
Evidencia relacionada con el constructo: validez de constructo. Se refiere al grado en que una
medición se relaciona consistentemente (o sea, de manera estable) con otras mediciones de
acuerdo con hipótesis derivadas teóricamente y que conciernen a los conceptos (o constructos)
que están siendo medidos. Un constructo es una variable medida y que tiene lugar dentro de
una teoría o esquema teórico. Para afirmar la validez de constructo suelen correlacionarse un
número significativo de mediciones de variables que teóricamente y de acuerdo con estudios
precedentes están relacionadas. En otras palabras, la validez de constructo pretende examinar el
grado en que cada test refleja el constructo psicológico que pretende medir.
Cuanta mayor validez tenga un instrumento en los tres tipos descriptivos, mayor será su ajuste a
aquello que se propone medir.
Procedimientos para encontrar la validez.
Para obtener la validez de contenido, deben determinarse los alcances de la variable a medir
(definir qué se va a medir y con qué intensidad). Luego se debe realizar como ha sido
examinada la variable en la literatura especializada a partir de la cual poder elaborar un universo
exhaustivo de ítems posibles. Posteriormente se debe realizar una consulta con expertos en el
tema para corroborar si ese universo es exhaustivo. Finalmente se seleccionan los ítems.
La validez empírica o de criterio resulta más fácil estimar. El procedimiento es correlacionar las
puntuaciones del test con las puntuaciones que sirven como criterio o norma para juzgar la
validez de dicho test (por ejemplo, puntajes proporcionados por otros tests reconocidos que dicen
examinar la misma variable).

14
La estimación de la validez de constructo es muy compleja. Se relaciona con una verificación
experimental de las hipótesis que corresponden a los rasgos psicológicos o construcciones
teóricas que justifican la ejecución del test. Usualmente se utilizan para ello estudios factoriales,
que permiten establecer en qué medida el test mide una capacidad común en un grupo de
pruebas similares.
Confiabilidad
El propósito de los estudios de confiabilidad es estimar la magnitud de los errores cometidos al
medir las variables psicológicas. Existen diversos procedimientos para estimar la confiabilidad de
un instrumento de medición. Todos ellos utilizan fórmulas que utilizan el coeficiente de
confiabilidad, cuya magnitud (como en todo coeficiente de correlación) puede oscilar entre 0 y 1.
Un coeficiente de 0 indicaría una confiabilidad nula y uno de 1 una confiabilidad perfecta. Cuando
los valores que se obtenga estén más próximos a 1, más confiables serán los resultados del test.
Los procedimientos para obtener dos sistemas de puntuaciones cuya correlación pueda dar
cuenta de la confiabilidad de las mediciones son los siguientes:
1-Fiabilidad de las formas alternativas, paralelas o equivalentes: este procedimiento consiste
en correlacionar dos series de puntuaciones, cada una de las cuales corresponde a una de las
formas paralelas, alternativas o equivalentes del test. Se administran dos versiones del mismo
test a los sujetos de la muestra de tipificación y se halla la correlación entre ambos. Para que dos
formas de un mismo test se consideren equivalentes deben ser similares en contenido,
instrucciones, forma de registro, y en todas las otras características. Se considera que el
instrumento es confiable si esta correlación es significativamente positiva. El coeficiente de
confiabilidad obtenido se denomina coeficiente de equivalencia. Esta forma, en la práctica tiene el
inconveniente de obligar a construir dos formas paralelas. Esta construcción es costosa y difícil.
2-Fiabilidad del test-retest: se administra el mismo test a los sujetos de la muestra de tipificación
en dos oportunidades distintas y se hace a la correlación entre ambas series de puntuaciones. El
coeficiente obtenido se denomina coeficiente de estabilidad; indica en qué medida ambas
puntuaciones mantienen su estabilidad en las dos mediciones realizadas. Si bien este
procedimiento es más económico tienen la desventaja de tener que determinar el tiempo óptimo
que debe transcurrir entre una administración y la otra. Si el período es demasiado largo puede
potenciarse excesivamente el cambio en la variable examinada. Si el período es demasiado corto,
los sujetos examinados pueden recordar las respuestas proporcionadas en la primera ocasión.
3-Fiabilidad de la división en dos mitades: se divide a la prueba en dos mitades equivalentes
en el grado de dificultad. Para lograr esta equivalencia, dado que los ítems están graduados en
orden de dificultad creciente, la prueba se divide en ítems pares e impares. La administración se
realiza en una sola ocasión y se correlacionan los resultados obtenidos en ambas mitades. El
coeficiente obtenido se denomina coeficiente de consistencia interna, puesto que indica en qué
medida ambas puntuaciones son consistentes en las dos mediciones realizadas.
4-Equivalencia y homogeneidad entre los elementos del test: un cuarto método se basa en la
consistencia de las respuestas de los sujetos a todos los elementos del test. La administración se
realiza en una sola ocasión y se examinan los resultados obtenidos por los sujetos en todos los
ítems del test. Se considera que el instrumento es confiable y esa correlación es
significativamente positiva. Este tipo de confiabilidad proporciona una medida de equivalencia y
homogeneidad de los elementos. La confiabilidad se relaciona con el número de ítems incluidos
en la prueba: a mayor cantidad de ítems, mayor confiabilidad
15
5.Fiabilidad del puntuador o examinador: el grado de precisión en las instrucciones varía en
función de cada tipo de instrumento; en el caso de las pruebas colectivas las respuestas
accionadas por el sujeto o bien son positivas o negativas o bien de elección múltiple. Pero en el
caso de otros instrumentos, especialmente individuales y de aplicación clínica, el examinador
debe usar su juicio para ponderar las respuestas del sujeto. En estos casos, para examinar el
grado de confianza que merecen los examinadores se realizan estudios de confiabilidad de los
puntuadores. Estos estudios consisten en comparar las puntuaciones que otorgan dos
examinadores diferentes en los resultados de los mismos sujetos y observar si existen diferencias
significativas entre ellas. Las instrucciones del test deben estar suficientemente especificadas
para estrechar el margen de las decisiones que debe tomar el examinador. El entrenamiento de
los examinadores debe ser tan exhaustivo como lo requiere la complejidad del test en cuestión
Errores:
a. Sistemáticos, Sesgo
Relacionado a la validez. No es un error que sucede en un sujeto particular, sino que es un error
del diseño de la prueba. Impide la medición precisa; como, por ejemplo, cualquier influencia en la
aplicación de la prueba, por ello hay que cuidar los detalles. Hace que el test funcione de
diferentes maneras en diferentes grupos, entonces la probabilidad de éxito no es independiente
de del subgrupo de población de pertenencia. Ej.: en test clásicos de inteligencia chicos pobres
de hoy dan como retrasados, ya que no están relacionados con los contenidos que la prueba
plantea, si no conocen qué es un tv no podrán organizar la imagen.
La validez del concepto o del instrumento está limitada por el grado de universalidad del mismo.
Hay que tener en cuanta:
● Ético: constructos con características particulares, aquellos que han demostrado características
universales.
● Económico: constructos con características específicas de un grupo cultural.
A nivel conceptual, la distinción entre lo económico y lo ético implica que si hemos de usar un
constructo debemos de antemano asegurarnos de que el constructo tiene el mismo significado en
la nueva cultura que aquel que se encuentra en la cultura donde se propuso inicialmente.
b. Aleatorios, Error de medición
Relacionado a la confiabilidad. No es un error de construcción del test, sino que es aleatorio. Se
dan siempre, pero por efectos del azar. Siempre presentes, pero no deben ser pensados como
negativos. Hace que no se pueda medir la puntuación verdadera, siempre hay errores, la
puntuación se infiere.
Fuentes posibles:
a. Examinado: cansancio, mal humor
b. Examinador: por sus actitudes frente al sujeto se puede modificar el rendimiento de los mismos
c. Ambiente: no es lo mismo trabajar con molestias que sin ellas
Cuanto más cuiden las condiciones de la toma del test, el rapport, los tiempos más se reduce al
error de medición.
El error se puede estimar y están informados en los manuales de las técnicas:

16
Puntuación Verdadera = Puntuación Obtenida +/- Error

Ej.: En un Test de inteligencia con un error +/- 5, se obtuvo una puntuación de 100, entonces la
puntuación se estima en el caso individual: que estará entre 95 y 105.

SEGUNDA PARTE: LOS INSTRUMENTOS DE EXPLORACIÓN PSICOLÓGICA

Unidad 4. El sujeto como unidad de análisis. Test de rendimiento máximo de dominio general.
Evolución del Desarrollo Psicológico. Instrumentos que ilustran su evaluación.
(¡¡¡MI TEMA!!!! APARTE)
Evaluación del desarrollo en la primera infancia. Diagnóstico del desarrollo normal y
anormal del niño Arnold Gesell y C. Amatruda y otras escalas del desarrollo.
Año de origen de la Escala: 1941.
Material de la prueba a utilizar:
Manual y protocolo que figura en el manual. Sonajero, objeto brillante colgante, campanilla con
mango de madera, aro de 15 centímetros de diámetro, cordel, chupete, biberón, botellita o
recipiente de boca angosta y pastilla o cuenta pequeña o botón mediano, cubos de 2 ½ de lado,
taza de plástico con asa, cuchara, tablero excavado, papel, crayón, pañuelo grande no
transparente, libro con figuras de tapas duras, juguete móvil (autito, trencito), manta, colchoneta,
pelota, espejo de aproximadamente 30 x 30 centímetros.
Caracterización:
o Objetivo de la escala: evaluación del desarrollo psicológico.
o Estructura de la prueba: elementos heterogéneos, organizados por niveles de edad,
destinados a la exploración de distintas dimensiones del desarrollo (coordinaciones
adaptativas; lenguaje- expresivo y comprensivo; motricidad- fina y gruesa; sociabilidad e
interacción y afectividad). Los elementos están dispuestos en orden de dificultad creciente,
agrupados en edades clave del desarrollo: por meses hasta el año de edad y cada 3
meses desde el segundo hasta el tercer año de vida. En cada edad clave se examinan las
dimensiones mencionadas y se incluyen pruebas cuantificables y pruebas adicionales para
su evaluación cualitativa.
o Tipo de fundamento: empírico, aunque se nutren de diversas teorizaciones sobre el
desarrollo.
o Tipo de prueba: heterogénea. Se examinan distintas dimensiones del desarrollo.
o Tipo de respuesta que demanda: conductas de los niños a ser observadas en su actitud
espontanea o en respuesta a los reactivos que se presentan e informan que proporcionan
las madres o dadora de cuidados (sustitutas).
o Rango de edades: de 0 a 3 años.

Administración:
o Forma: individual en presencia de la madre o sustituta.
o Tiempo: 10 a 20 minutos.
o Evaluación: 15 a 20 minutos.

17
Tipificación: se tipificó en población institucionalizada y en la que concurría a consultorios
externos del Hospital N. Sbarra.
Normas o Baremos: se informa el número de niños (N=600) que permitieron caracterizar cada
una de las conductas a ser observadas.
Unidad de medida: Edad de Maduración y Cociente de desarrollo.
Validez y confiabilidad: los estudios de validez y confiabilidad fueron realizados sólo en algunas
de las escalas mencionadas.

Unidad 5. El sujeto como unidad de análisis. Test de rendimiento máximo de dominio específico.
La evaluación de aptitudes y rendimiento. Instrumentos que ilustran su evaluación.

MACARTHUR. LOS INVENTARIOS DE DESARROLLO COMUNCATIVO.


(Evaluación de la comprensión/producción del lenguaje)
Autor: Donna Jackson- Maldonado, Donna J. Thal, Larry Fenson, Virginia A. Marchman, Tyler
Newton, Bárbara Conboy
Área que evalúa: vocabulario y formas morfosintácticas específicas en niños.
Objetivo: arrojar información confiable respecto al curso del desarrollo lingüístico, comenzando
por los primeros indicios de comprensión del niño, pasando por sus primeras señales gestuales
no verbales y la expansión del vocabulario inicial hasta los comienzos de la gramática.
Fundamentos teóricos: Los conocimientos de los padres acerca de la evolución de lenguaje de
sus niños pequeños, pueden ayudar a los clínicos e investigadores a determinar los niveles de
desarrollo de lenguaje de los niños y así es posible conducir a evaluaciones con una mayor
validez ecológica.
Formas de aplicación: puede administrarse individual o grupalmente
Edad de aplicación: el inventario I, elaborado para niños de 8 meses a 18 meses. Inventario II,
elaborado para niños de 16 meses a 30 meses. Evalúa diversos aspectos de la adquisición de
vocabulario y gramática.
Tiempo de aplicación: no cronometrado
Materiales de aplicación: cuadernillo de aplicación, protocolo, baremos. Está compuesto por dos
inventarios, independientes, diseñados para los distintos rangos de edad.
Modo de respuesta: marcando alveolos según las palabras que el niño o niña comprende y dice,
aun si no la pronuncia de manera perfecta.
Puntuación: La calificación comprende cuatro pasos básicos:
1. Contar las respuestas de los reactivos en cada sección.
2. Sumar las secciones para obtener puntuaciones de resumen.
3. Buscar los valores normativos en las tablas de percentiles.
4. Registrar las respuestas de los reactivos, las puntuaciones de resumen (si existen) y los
percentiles en el informe del niño en las casillas adecuadas.

18
Las condiciones de administración y evaluación están adecuadamente aclaradas en el manual
correspondiente.
Característica de la muestra de tipificación: el método para la recolección de datos se
determinó con base en el nivel educativo de las madres de los niños; se reclutaron niños a través
de amigos, vecinos, familiares, conocidos, personal de guarderías, pediatras, personal de clínicas
comunitarias, trabajadores sociales, miembros del clero, calles y parques. El objetivo era tener
una muestra con un mínimo de 60 niños para cada uno de los 26 grupos de edad, y un mínimo de
30 niñas y 30 niños por grupo de edad, proveniente de una variedad socioeconómica.
Validez: se sustenta por la validez de contenido, aparentemente convergente, concurrente, y
predictiva; a pesar de que se ha demostrado el éxito de los inventarios como herramienta de
investigación y para clínica en una diversidad de estudios, también hay que reconocer que existen
varios factores que pueden afectar la validez de la información.
Confiabilidad: su confiabilidad es satisfactoria, comprobándose con la consistencia interna
(grado al cual los diferentes reactivos dentro de una misma categoría miden habilidades
similares); y confiabilidad test-retest (mide el grado al que las puntuaciones se mantienen
estables entre 2 o más sesiones de prueba)
DETECCION Y PRONOSTICO DE EVENTUALES RETRASOS EN EL LENGUAJE … ¿?
TEST DE SCREENING “¡PREPÁRATE A LEER!”
(Evaluación de las habilidades y conocimientos prelectores)
Desde los ‘70 se indagaron los dominios cognitivos que inciden en el aprendizaje de la lectura y la
escritura. La evidencia empírica demostró la importancia de las habilidades iniciales de:

- Procesamiento fonológico
- Amplitud del vocabulario
- Conocimientos sobre el lenguaje escrito

Para poder leer y escribir, 1ro se debe reflexionar sobre los aspectos formales del lenguaje, la
cual puede estar favorecida u obstaculizada por el desarrollo de conocimientos y habilidades
previas, que dependen de la interacción con los adultos que posibilita el contacto con el material
escrito. Además es necesario que los niños adquieran otros tipos de conocimientos sobre los
usos del lenguaje escrito, así como sobre su tipo de estilo particular, conocimientos que se
incrementan progresivamente a lo largo de toda la escolaridad.
Cuando los niños llegan a la escuela resultan críticas las diferencias entre aquellos que cuentan o
no con habilidades y conocimientos prelectores (aprenden a leer/escribir más rápidamente y lo
hacen mejor). Muchas veces niños de familias pobres se ven desfavorecidos. Por eso, estudios
relativamente recientes, centralizan su interés en las características prelectoras de los niños en
edad preescolar, según estrato social de pertenencia.
Tales características han recibido la denominación genérica de:
Alfabetización emergente: conjunto de habilidades y conocimientos que “emergen” a partir del
contacto del niño preescolar con un medio rico en experiencias de lectura y escritura.
Alfabetización temprana: denota a los esfuerzos parentales y del personal de servicios de
atención al preescolar por enseñar de manera explícita aspectos significativos relativos con la
alfabetización.

19
Los conocimientos y habilidades prelectoras se evalúan a través de diferentes tipos de
instrumentos. En este caso se ofrece ¡Prepárate a leer! Un manual de alfabetización temprana:
instrumento de screening, actividades y recursos. Está diseñado para:
 Explicar cómo los niños aprenden a leer
 Determinar la distancia que separa a los niños de 4 años del camino del aprendizaje de la
lectura.
 Promover información, actividades y recursos que los ayuden a convertirse en lectores
entusiastas y exitosas.
La prueba evalúa tres áreas específicas que se encuentran en la base del aprendizaje de la
lectura y la escritura:
Conocimiento de lo escrito: comprensión infantil sobre los libros, las letras impresas y las
palabras.
Escritura emergente: esfuerzo de los niños para utilizar lo impreso de manera significativa.
Conciencia fonológica: comprensión infantil sobre la escritura del lenguaje, sobre cómo trabaja
el lenguaje.
El screening muestra los conocimientos y habilidades (conocimiento del material impreso,
escritura emergente y conciencia lingüística), a partir de 20 ítems pictóricos. Se utiliza con niños
de 4-5 años.
Proporciona un puntaje que informa si:

- Las habilidades del niño son aún muy básicas: 0-5 respuestas correctas. NIVEL 1.
- Están comenzando a desarrollarse: 6-9 respuestas correctas. NIVEL 2.
- Están haciendo progresos: 10-11 respuestas correctas. NIVEL 3.
- Están casi preparados: 13-16 respuestas correctas. NIVEL 4.
- Están suficientemente preparados para aprender a leer y escribir: 17-20 respuestas
correctas. NIVEL 5.
Todos los niños, independientemente de su puntaje, necesitan continuar con el esfuerzo
necesario para construir las habilidades de alfabetización temprana, puesto que el camino hacia
el éxito en la lectura continúa durante los primeros años de la escolaridad.
Recomiendan que el niño se examine dos veces a los cuatro años de edad, con un intervalo de
tiempo: antes de comenzar y al finalizar el Jardín.
Al comienzo del Jardín, los niños idealmente están preparados para comenzar a leer y a escribir.
El screening puede revelar, sin embargo, que el niño debe todavía dominar algunas habilidades
básicas muy importantes. Se deben utilizar los resultados para ayudar a asegurar que el niño está
recibiendo soportes instruccionales apropiados para tener éxito a lo largo del año de transición
hacia la institución formal.
Para su aplicación se necesita:
1. Manual de aplicación del Screening.
2. El protocolo (hoja de registro).
3. Una lapicera o lápiz.

20
El puntaje obtenido no predice las habilidades de lectura y escritura. Informa dónde se encuentra
el niño en su cambio hacia al aprendizaje de la lectura, de modo tal de poder colaborar a
desarrollar su mayor potencial.
Adaptando las experiencias y actividades se puede llegar al nivel de desarrollo del niño. Se debe
comenzar por las habilidades actuales del niño y luego incrementar la complejidad cuando las
habilidades del niño aumenten. Es importante que se desarrolle en todas las áreas. El screening
no está diseñado para informar en cuál de las áreas se debe enfatizar la actividad.
La campaña ¡Prepárate a leer! Fue puesta en marcha por NCLD (Centro Nacional para las
Dificultades del Aprendizaje) en el 2001. Es una campaña nacional dirigida a los padres y a los
profesionales de la infancia temprana con el objetivo de brindarles información sobre las
habilidades y conocimientos que los niños de 4 años de edad necesitan para estar preparados
para el aprendizaje de la lectura y la escritura en el Jardín de Infantes.
CONFIABILIDAD Y VALIDEZ >>>>>>>>>>>>>>>
BAIRES: TEST DE APTITUD VERBAL BUENOS AIRES
Autora: Nuria Cortada de Kohan.
Área que evalúa: aptitud verbal de los individuos. Se centra en el aspecto semántico del lenguaje
(aspectos del significado).
Fundamentos teóricos: desarrollos del lenguaje desde la psicolingüística. Para explicar la
capacidad humana para aprender el lenguaje, retoma a Skinner, Chomsky, Piaget, pero la
posición que a la autora le parece más fundamentada es la que sostiene que el principal factor en
el aprendizaje del lenguaje es la interacción entre el niño y su madre. Vigotsky (1962)
consideraba que el niño desde el comienzo era un ser social y su actividad estaba guiada por
completo desde el comienzo hacia el trato con el adulto.
Vigotsky descubre que la palabra tiene dos aspectos:
1. La atribución de la palabra a un objeto que es una función idéntica en el niño y en el adulto.
2. Una función significativa que experimenta transformaciones durante el desarrollo del ser
humano.
Para Vigotsky una palabra carente de significado no es una palabra. El significado es la propia
palabra vista desde su aspecto interno. El significado de la palabra es a la vez un fenómeno
verbal e intelectual.
Según la autora, este instrumento ha de ser de gran utilidad como complemento indispensable
cuando se usan test de inteligencia no verbal. El vocabulario no es solo el componente básico de
las aptitudes para la lectura y la escritura en los primeros años de vida, sino que es un requisito
esencial para muchas formas de emprendimiento intelectual y para lograr un buen rendimiento en
todo tipo de conocimientos y profesiones. A los autores les ha interesado el aspecto semántico
del desarrollo del lenguaje, que ya aun antes de que comiencen a hablar los niños comprenden el
significado de las palabras. Aunque la comprensión semántica es rápida, algunas palabras son
difíciles, pues exigen una sofisticación cognitiva muy elevada.
Edad de administración: 16 años en adelante.

21
Formas de aplicación: Puede aplicarse individual o grupalmente y en su versión de papel y lápiz
o de ordenador. Forma completa o abreviada.
Tiempo de aplicación: no cronometrado, generalmente 25 minutos.
Materiales de aplicación: manual descriptivo de aplicación y corrección, un cuadernillo de
estímulos, y una hoja de respuesta autocorregibles; son elementos homogéneos, compuesto de
dos subtests: sinónimos y definiciones.
Modo de respuesta: marca un X en la hoja de respuesta según la opción que considere.
98 ítems de opción múltiple con cuatro alternativas (sólo 1 correcta), siendo 50 elementos
definiciones y 48 sinónimos.
Las condiciones de administración y evaluación están adecuadamente aclaradas en el respectivo
manual de la técnica.
Puntuación: 1 acierto, 1 punto. Se deben sumar los aciertos en cada subtest. Se transforma el
resultado en Puntuación Típica y Puntuación Centil.
Características de la muestra de tipificación: muestra argentina de 298 jóvenes de entre 16 y
25 años, de ambos sexos, con educación formal de por lo menos 3er año de la Escuela
Secundaria, y muestras españolas.
Validez: diversos estudios de validez se han llevado a cabo para esta técnica: estudios de la
estructura factorial, los resultados mostraron una alta correlación entre la puntuación en
sinónimos y definiciones, lo que señala la existencia de un factor general de aptitud verbal común
a ambas tareas; análisis de validez convergente y divergente, donde se muestra un alto grado de
convergencia entre el BAIRES y otras pruebas analizadas, y una validez divergente al obtener
correlaciones bajas con otras tareas; estudio de validez criterial, se correlacionó las puntuaciones
del test con las calificaciones escolares promedio, obteniendo evidencia de la validez criterial de
la prueba.
Confiabilidad: las escalas de la prueba tienen adecuados valores de fiabilidad y muestran una
apropiada variabilidad alrededor de sus valores medios.

TEST GESTALTICO VISOMOTR DE L. BENDER. EL BG II. SISTEMA GLOBAL DE


PNTUACIÓN.
(Evaluación de la función gestáltica visomotra)
2003: Bender Visual Motor Test, Second Edition” de G.G. Branningan y S.L. Decker.
TEST GESTÁLTICO VISOMOTOR ORIGINAL
 Material del Test: Manual, Protocolo para las puntuaciones, Tarjetas con los modelos a
ser reproducidos, hojas en blanco, papel, lápiz, goma de borrar.
 Caracterización:
Objetivo de la Escala: Evaluación de la función gestáltica visomotora.
Estructura de la prueba: elementos homogéneos que consisten en 9 figuras geométricas
que deben ser copiadas en una hoja en blanco. Presentan niveles de dificultad diferente,
aunque no están graduadas por orden de dificultad.

22
Tipo de fundamento: Teórico. Se basa en la teoría de la Gestalt.
Tipo de prueba: gráfica, de reproducción de figuras geométricas.
Tipo de respuesta que demanda: copia de dibujos.
Rango de edades que cubre: 3 a 11 años como prueba de madurez de la función
gestáltica visomotora. Por encima de esa edad puede administrarse, pero los objetivos del
examen son clínicos.
 Administración:
Forma: individual
Tiempo: 15 minutos aprox.
Evaluación: 20 minutos.
 Tipificación: estandarización realizada con 800 niños de 3 a 11 años que provienen de
una escuela suburbana de Pelham, de dos nurseries públicas de la ciudad de N. York,
salas de hospitales y consultorio extremo de la sección de Pediatría y Psiquiatría. No se
especifican características de esa población.
Otros autores, que han elaborado otros sistemas de puntuación ofrecen datos sobre las
muestras que las que se han basado. Los trabajos relativos a usos clínicos del test
realizado por la autora no proporciona datos normativos. Otros autores, como Koppitz y
Watkins, hacen especificaciones a ese respecto.
 Normas o baremos: consisten en la frecuencia de aparición de determinado tipo de
reproducciones a diferentes edades. Otros autores proporcionan normas relativas al nivel
de madurez y a la presencia de indicadores clínicos.
 Unidad de medida:
Puntajes directos y edades de maduración: los puntajes directos obtenidos, de acuerdo
al grado de fidelidad de las reproducciones se corresponden con edades características.
Puede obtenerse un indicador promedio a través de la mediana de las puntuaciones.
Confiabilidad: Bender no proporciona datos a este respecto. Watkins refiere datos de
confiabilidad por el procedimiento test-retest.
Validez: Bender no proporciona datos a este respecto. Watkins refiere a datos de validez,
que pueden interpretarse como de validez empírica o de criterio.
Este test está destinado al examen de la función gestáltica visomotora, entendida por la autora
cómo:
“aquella función del organismo integrado que responde a una constelación de estímulos con una
constelación, un patrón, una gestalt” Bender, 1977
La exploración se realiza a través de la presentación de 9 modelos de figuras geométricas que
deben ser copiadas por el sujeto en una hoja en blanco. Las figuras han sido extraídas de los
trabajos de Wertheimer (1923) en las investigaciones referidas a la percepción.
Las respuestas proporcionadas por los sujetos, dependen para la autora, no solo de las
características del estímulo sino de las características del sujeto:

- Patrón del desarrollo de cada individuo, que varía de edad en edad.


- Estado más o menos patológico o normal del sujeto.

Fundamentos teóricos. La Teoría de la Gestalt, en la que se basa el test, ha formalizado una


serie de características que guían la percepción.

23
Los estudios de la Escuela de la Forma, cuyos máximos exponentes son Wertheimer, Kohler y
Koffka, se oponen a todo sistema explicativo en Psicología que utilice la asociación de
elementos, especialmente en el campo de la percepción. El sujeto percipiente no puede ser
considerado como si fuera un espectador pasivo, ni el objeto, tal como es percibido, puede
asimilarse a una fotografía del objeto físico, idéntica para todos los sujetos.
Más bien sucede que los perceptos son construcciones realizadas a partir de un conjunto de
informaciones seleccionadas y estructuradas en función de una experiencia anterior del sujeto.
Denominan “Gestalt” (forma, configuración, estructura) para referirse a una organización que no
constituye una mera yuxtaposición de partes o elementos, que posee en sí misma una cualidad
que no se encuentra en ninguna de las partes constitutivas. De este modo la modificación de un
elemento puede cambiar la configuración de la totalidad.
La evaluación y la interpretación del test original.
El test según la autora permite establecer el nivel de maduración infantil de la función gestáltica
visomotora. Su interés reside en que constituye “una función fundamental asociada con la
capacidad del lenguaje, y estrechamente ligada a varias funciones de la inteligencia, entre las que
se encuentra la percepción visual, la habilidad motora manual, la memoria, los conceptos
temporales y espaciales y la capacidad de organización o representación”.
Encontró que:

- Los niños de 3 años y menores reproducen solo garabatos.


- A los 11 logran reproducir adecuadamente las figuras.
- En la edad adulta solo se agrega una cierta perfección motora, y absoluta fidelidad en lo
que respecta a los detalles, tamaños y distancias.
En razón a ello, la prueba posee validez para examinar la función gestáltica visomotora entre los
4 y 11 años de edad.

Sin embargo, la SEGUNDA EDICIÓN del año 2008, que consiste en una verdadera revisión de la
prueba, encontró la habilidad de integración visomotora incrementa desde los 4 a los 16 años de
edad, con una meseta gradual y luego con una declinación el grupo de mayor edad
El test es evaluado por la autora adjudicando un puntaje y una edad de maduración para la
función gestáltica visomotora a cada una de las figuras reproducidas.
Entre esos niveles de reproducción correcta de cada figura se alcanza a determinada edad por
encima de la cual ya no resulta discriminativa, es decir no pueden diferenciarse las
reproducciones características de una edad respecto de las edades sucesivas mayores. Ahora
bien, cada una de las figuras o grupos de ellas se alcanzan a edades diferentes: la Figura A a los
6 años, la Figura 2 a los 10 años, etc.
Aparece en consecuencia el problema de cómo evaluar cada reproducción de un niño en
particular, que esté por encima de la edad en la que se alcanza la reproducción de una figura, o
por debajo de ella.

24
La autora solo ofrece una serie de figuras, una para cada lámina, en las que se describen:

- Las formas de reproducción


- Los puntajes que les corresponden
- El número de sujetos que a cada edad reproduce los modelos según las descripciones
proporcionadas.
Finalmente, en la tabla resumen de doble entrada aparecen las edades de los niños y el tipo de
respuesta característico de cada una de ellas. En el ángulo superior se ofrece el % de sujetos que
proporciona esa respuesta bien que la supera.
Para la evaluación, se usa la tabla como “una escala para determinar el nivel de maduración”.
La prueba no es válida (como instrumento de evaluación de la madurez gestáltica visomotora)
para sujetos con una edad mental superior a 11 años, “a menos que se hallen afectados por
alguna enfermedad mental que tienda a distorsionar la función gestáltica visomotora”
Las instrucciones de administración y valoración resultan poco detalladas. En general
aparecen dificultades para evaluar cada reproducción de un niño en particular, puesto que sólo
aparecen los modos de reproducción típicos hasta la edad en la que se alcanza la reproducción
correcta de cada modelo.
Las dificultades señaladas aparecen subsanadas en el BGII, que entre otras ventajas ofrece un
Sistema Global de Puntuación preciso

EL TEST GESTALTICO VISOMOTOR SEGUNDA EDICIÓN (BG II)


El Test Gestáltico Visomotor de Bender, Segunda Edición mide las habilidades de integración
visomotora en niños y adultos. El objetivo principal de la revisión de la prueba fue su
actualización con criterios psicométricos actuales y el establecimiento de una base normativa
amplia, preservando la esencia del test y su larga historia en materia de investigación.
Se utilizan los 9 diseños originales del Test Gestáltico Visomotor de Bender y se adicionan 7
nuevos, para aumentar su utilidad en la evaluación. 4 de los nuevos diseños, de menor
complejidad, se utilizan exclusivamente en el rango inferior de edad (4 a 7 años), los otros 3, de
mayor complejidad, exclusivamente en el rango superior de edad (8 a 85 años y mayores).
El total de los 16 diseños se aplican diferencialmente en dos rangos de edades:

- Sujetos de 4 a 7 años 11 meses: se administra diseños 1 a 13


- Sujetos de 8 años en adelante: se administra diseños 5 a 16

Para ampliar el valor clínico del test, se administran dos fases:


 Una Fase Copia a través de procedimientos similares a los de la versión original.
 Una Fase Recuerdo a través de solicitar que se reproduzcan tantos diseños como se
recuerden, luego de completada la Fase Copia. Permite hacer estimaciones sobre la memoria.
Se adicionaron dos pruebas complementarias de sencilla aplicación:
 Test Motor: consiste en 4 ítems con 3 figuras cada uno y 1 ítem de ejemplo. El examinado
debe unir con una línea dos puntos ubicados en las figuras correspondientes. En todos los
25
casos disminuye el ancho de las figuras. Permite un puntaje directo total de 12 puntos. Ese
puntaje directo se transforma en Percentil.
 Test Perceptual: consiste en 10 ítems de figuras geométricas, ubicados en 5 hileras por
página y 5 columnas. El examinado debe circular o señalar el diseño de cada hilera que se
corresponda con el diseño que aparece en la celda de la columna izquierda. Permite un
Puntaje Directo de 10 puntos, que se transforma en Percentil.
Estos test proporcionan información acerca de la influencia de eventuales dificultades motoras o
perceptuales.
Una de las ventajas más importantes que aparece en esta versión es la detallada guía de
administración y puntuación que aparece en el Manual para el Examinador del Bender-Gestalt II,
el uso de un nuevo y fácil Sistema Global de Puntuación y las tablas normativas
correspondientes. El sistema define las siguientes características de las reproducciones, a las que
acompaña con ejemplos gráficos ilustrativos, de modo tal que mejora el sistema de puntuación
anterior:
0: Sin semejanza, dibujo aleatorio, garabato, falta de diseño
1: Leve, vaga semejanza
2: Alguna-moderada semejanza
3: Fuerte-estrecha semejanza
4: Cercano a la perfección
Cabe señalar que los autores proporcionan una síntesis sobre trabajos anteriores realizados con
el Bender Original.
La disponibilidad de esta nueva versión torna obsoleta la administración de la versión del año
1939, no sólo por su actualización, sino además por el tratamiento del proceso de tipificación, con
mejoras sustantivas, conforme a requerimientos imprescindibles en la materia.
Material del BG II: Manual, Protocolo de observación y valoración, 16 tarjetas con los modelos
geométricos a ser reproducidos, 10 hojas en blanco, papel, lápiz Nº2, goma de borrar.
Caracterización:
o Objetivo de la Escala: Evaluación de la función gestáltica visomotora. Se administra en
dos fases: de Copia y de Recuerdo de los modelos. Esta última permite examinar
aspectos referidos a la memoria. Además, se adicionan como test complementarios el Test
Motor y el Test Perceptual, que posibilitan apreciar si las dificultades en las
reproducciones pueden estar influenciadas por factores motores o perceptivos.
o Estructura de la prueba: elementos homogéneos que consisten en 16 figuras
geométricas que deben ser copiadas en una hoja en blanco. Presentan niveles de
dificultad diferente, aunque no están graduadas por orden de dificultad.
Los test complementarios también están constituidos por elementos homogéneos. En el
Test Motor (4 ítems con 12 figuras) aparecen figuras con forma de rectángulo, ángulo y
círculo, con puntos en los extremos que el sujeto debe unir con una línea. En el Test
Perceptual (10 ítems) debe identificar entre distintas opciones la figura geométrica que se
corresponde con la figura objetivo.
o Tipo de fundamento: Teórico. Se basa en la Teoría de la Gestalt
o Tipo de prueba: Gráfica, motora y perceptual.

26
o Tipo de respuesta que demanda: requiere la reproducción de figuras geométricas a
través de la copia y del recuerdo. En el Test Motor la unión de puntos con una línea, y en el
Test Perceptual la discriminación de figuras geométricas.
o Rango de edades que cubre: 4 a 85 años y mayores como prueba de madurez de la
función gestáltica visomotora.
Administración:
o Forma: Individual.
o Tiempo: 15 minutos
o Evaluación: 20 minutos

Tipificación: los autores de la Segunda Edición proporcionan una detallada información sobre el
cuidadoso diseño y estratificación de un plan de muestreo al ser correspondiente al censo de
EEUU del año 2000.
La muestra estandarizada consistió en 4000 sujetos entre 4 y 85 años de edad. Para la selección
de la muestra consideraron variables: Edad, Sexo, Raza/Etnia, Región geográfica y Nivel
Socioeconómico.
Se examinaron muestras adicionales seleccionadas para estudios de validez. Se incluyeron
sujetos con retraso mental, dificultadas de aprendizaje (lectura, escritura y matemáticas),
trastornos de atención, autismo, enfermedad de Alzheimer, también sujetos considerados
talentosos.
Los test complementarios se administraron a 400 sujetos de 4 a 70+ años de edad.
Normas o Baremos: baremos o normas por niveles de edad que permiten convertir los puntajes
directos totales en Puntuaciones Estándar, en Puntuaciones T y en Percentiles. Ofrecen
intervalos de confianza que pueden seleccionarse.
Unidad de Medida: Puntajes directos, Puntajes Estándar, Puntajes T y Percentiles: los autores
ofrecen un Sistema Global de Puntuación para las Fases de Copia y Recuerdo. Las
reproducciones se evalúan de 0 a 4 puntos de acuerdo al grado de fidelidad que guardan con los
modelos originales. Los puntajes directos se suman para obtener un Puntaje Directo Total, que se
transforma en Puntajes Estándar, Puntajes T y Percentiles de acuerdo a las edades de los
sujetos. Estas puntuaciones permiten categoría diagnostica.
Los test motor y perceptual se evalúan con un punto por ítem correcto. Su sumatoria se
transforma en percentiles.
Confiabilidad: en esta versión aparece información precisa sobre la estimación de la
consistencia interna y la estabilidad de las puntuaciones del test, así como sobre la
confiabilidad de los puntuadores.
 Consistencia interna: (examina la homogeneidad de los ítems del test). Para examinar la
consistencia interna del BG II, Fase Copia, se utilizó el método de la división en dos
mitades.
 Estabilidad: (estabilidad de las puntuaciones en dos oportunidades diferentes). Para
estimar la estabilidad del BGII Fase Copia y Fase Recuerdo se implementó el
procedimiento test-retest.
 Se calculó el error estándar de medida.
27
 Confiabilidad de los puntuadores: se calcularon las correlaciones entre las puntuaciones
proporcionadas por 10 examinadores expertos y un grupo sin entrenamiento previo exterior
a las instrucciones específicas correspondientes al Sistema Global de Puntuación.
En todos los casos la confiabilidad es satisfactoria.
Validez: los autores de la Segunda Edición proporcionan información sobre los estudios de
validez para referirse a las inferencias aceptables que pueden ser derivados de los resultados de
los test, basadas en la evidencia empírica y el fundamento teórico.
Se ha estimado la validez de constructo y la validez empírica o de criterio, correlacionando,
en este último caso los resultados del test con otras medidas visomotoras, así como con otras
habilidades académicas.
Se realizó un análisis factorial para determinar la dimensionalidad del constructo examinado
(cuál es el constructo subyacente). Los resultados encontrados en todos los grupos de edad
indican que en general, todos los ítems tienen cargar altas en un único factor, indicando que
todos miden un constructo subyacente singular.
Para explorar el grado en que la habilidad visomotora cambia con la edad, se construyó una
curva de desarrollo basada en los puntajes del BGII Fase Copia. Los resultados pusieron en
evidencia que la habilidad de integración visomotora incrementa desde los 4 a los 16 años, con
una meseta gradual y luego con una declinación el grupo de mayor edad.

Unidad 6. El sujeto como unidad de análisis. Test de rendimiento máximo de dominio general.
Los test de Inteligencia. Instrumentos que ilustran su evaluación
Referencia científico histórica a la aparición de los primeros test de Inteligencia.
Escalas Wechsler
La escala original data del año 1939 (escalas Wechsler-Bellevue), y su rango de edades era de 7
a 69 años.
Traducciones y adaptaciones al idioma español

1983. Escala Wechsler de inteligencia para niños en edad preescolar y primaria. WPPSI.
Buenos Aires.
Materiales de las diferentes escalas: Manual, Protocolo de registro, Cuadernos de examen, con
la impresión de pruebas gráficas, sets de láminas para pruebas de ejecución, material
manipulativo, papel y lápiz.
Caracterización:
o Objetivo de la Escala: Evaluación de la inteligencia general de sujetos de diferentes
edades
o Estructura de la prueba: Escala de puntuaciones típicas. Se componen de pruebas
verbales y de ejecución. Hasta la tercera revisión inclusive las pruebas estaban agrupadas
en una Escala Verbal y una de Ejecución. En la cuarta revisión este agrupamiento se
modifica, incluyéndose las pruebas según los factores detectados que conforman cuatro
Puntajes de Índice.
En general comprenden de 11 a 15 subtests, según la escala de la que se trate. Cada uno
de ellos explora diferentes aspectos del constructo inteligencia. Los elementos en cada uno
28
de ellos están ordenados por dificultad creciente. De este modo cada subtest tiene
elementos homogéneos en contenido (cada uno está destinado a examinar la misma
habilidad) y heterogéneos en grado de dificultad (en cada uno de los ítems están
ordenados por dificultad creciente)
o Tipo de fundamento: Empírico hasta las terceras revisiones. A partir de la tercera revisión
se han incorporado elementos teóricos.
o Tipo de prueba: Ómnibus (se examinan diferentes manifestaciones de la inteligencia).
o Rango de edades que cubren: de 2 años y medio a 90 años, dependiendo la forma de la
prueba.
Administración:
o Forma: Individual
o Tiempo: 40 minutos a 1 hora.
o Evaluación: 20 minutos

Algunos subtest pueden aplicarse colectivamente.


Tipificación: en los manuales se informa sobre las variables consideradas para la elección de las
muestras de tipificación para el rango de edades que cubren las diferentes versiones, en su país
de origen. Los sujetos incluidos varían de 1.700 a 2.200. En las versiones originales, se trata de
una muestra representativa de la población general de los Estados Unidos, excepto en la W-B
que la muestra correspondió más de 1.800 adultos de la ciudad de New York.
En las adaptaciones al español se especifican las características de las muestras de tipificación.
Normas o Baremos: se utilizan en general los baremos o normas de origen, sobre los que existe
evidencia empírica de adecuación a la población local. Existen tipificaciones realizadas en Capital
Federal Argentina, y una tipificación española correspondiente a los grupos de edad 15-19, 20-34
y 35-44. En el 2011 apareció la tipificación realizada en la Ciudad Autónoma de Buenos Aires y
del Gran Buenos Aires del WISC IV.
Unidad de medida: las puntuaciones directas se transforman en puntuaciones típicas, con una
Media de 10 y un Desvío Estándar 3. Estas puntuaciones pueden convertirse a su vez en C. I de
desviación, con una Media de 100 y un Desvío Estándar de 15.
Las Escalas destinadas a Niños permiten transformar las puntuaciones directas en edades
equivalentes del test (homologas a edades mentales).
Las revisiones WISC III, WAIS III y WPPSI R permiten obtener, a partir de los puntajes pesados o
transformados los Cocientes Intelectuales Total, de Ejecución y Verbal, cuatro Puntajes de
Índice basados en factores:
 Índice de Comprensión Verbal
 Índice de Organización Perceptiva
 Índice de Velocidad de Procesamiento
 Índice de Memoria de Trabajo (WISC lo denomina Índice de ausencia de distraibilidad)
En la WAIS IV y en la WISC IV se suprimen los CI Verbal y de Ejecución. En el WISC IV se
adicionan además un puntaje de procesamiento. En el caso de WPPSI III puede obtenerse el
Índice de Velocidad de Procesamiento y un Puntaje compuesto de Lenguaje General.

29
Confiabilidad: En los respectivos manuales y escritos posteriores del autor, se informan datos
sobre confiabilidad de ítems pares e impares (excepto para el test de Retención de Dígitos y
Claves, que fueron analizados por el procedimiento formas paralelas o equivalentes).
Validez: en los respectivos manuales y escritos posteriores del autor se informan datos sobre
validez de contenido, empírica o de criterio (rendimiento académico y resultados de ítems
correctos) y validez estructural.
Referencias Técnicas
Las Escalas Wechsler se encuentran entre los instrumentos de evaluación psicológica de mayor
prestigio y uso generalizado.
El objetivo de la primera escala presentada en el año 1939 fue proporcionar un test de inteligencia
apropiado para adultos, ya que el contenido de los que se disponía hasta esa fecha resultaban
poco apropiados, pues carecían de validez aparente.
El autor define a la inteligencia como la capacidad global y agregada de un individuo de actuar
deliberadamente, pensar racionalmente y relacionarse eficazmente con el medio.
Tal capacidad se pone en evidencia en las escalas verbales y de ejecución que componen la
versión original, así como las diferentes revisiones y extensiones a las que ha sido sometida.
Cada prueba está compuesta por elementos verbales y de ejecución, agrupados en un número
variable de subtests, cada uno de los cuales está integrado por un número diferente de ítems.
Cada ítem de cada Subtest merece una puntuación directa. La suma de las puntuaciones
directas de cada Subtest se transforma en una puntuación ponderada, que hace comparables
los resultados de cada una de ellos. No es posible hacerlo con las puntuaciones directas
(desigualdad de ítems de cada subtest).
A partir de las mismas es posible obtener diferentes tipos de puntajes compuestos, según la
prueba de la que se trate. Se trata en realidad de puntajes z, a los que Wechsler denominó
Cocientes Intelectuales de Desviación, que se obtiene a partir de un procedimiento diferente (z:
X – M / D.S) respecto de los Cocientes Intelectuales de Razones o Proporción que se
obtienen de una división (EM/EC X 100). Son varios los puntajes compuestos que pueden
obtenerse, pero no todos ellos pueden calcularse en todas las formas de las escalas.
El contenido de las diferentes escalas se adapta a las edades a las que están destinadas. Las
modificaciones más importantes refieren en general al cambio de contenidos obsoletos, a la
introducción de algunos subtests nuevos y a la modificación de otros.
Hay pruebas suplementarias y pruebas opcionales. Es recomendable su administración siempre
que sea posible, ya que proporcionan información complementaria sobre el rendimiento
intelectual.
Referencia a la cuarta edición de las Escalas Wechsler para la medida de la inteligencia del
adulto (WAIS IV)
Características: la versión actual de la prueba, el WAIS IV fue publicado en 2008. Se compone de
10 subtest principales y 5 subtest suplementarios. En esta revisión los CI Verbal y de Ejecución
fueron eliminados. Los puntajes que se obtienen en esta revisión corresponden al CI TOTAL, y
los Cuatro Puntajes Índice que representan los componentes más importantes de la inteligencia:
30
 Índice de Comprensión Verbal (ICV)
Pruebas: Semejanzas, Vocabulario, Información, Comprensión (suplementario)
 Índice de Razonamiento Perceptual (IRP)
Diseño con cubos, Matrices, Rompecabezas, Completar figuras (suplementario), Pesas,
(suplementario)
 Índice de Memoria de Trabajo (IMT)
Retención de dígitos, Aritmética, Letras y Números (suplementario)
 Índice de Velocidad de Procesamiento (IVP)
Búsqueda de Símbolos, Códigos o Claves, Cancelación (suplementación)
Pueden generarse dos puntajes totales, para resumir las habilidades intelectuales generales:

- El Cociente Intelectual Total (CIT) basado en la combinación del desempeño en las


puntuaciones correspondientes a los cuatro Puntajes de Índice
- El Índice General de Capacidad (ICG) que se obtiene a partir de las puntuaciones
obtenidas en el índice de comprensión verbal y el índice de razonamiento perceptual.
Estandarización
El WAIS-IV fue estandarizado sobre una muestra de 2.200 sujetos de EEUU, en edades
comprendidas entre los 16 y los 90 años.
La media de CI de la Escala Completa está ubicada en 100, con una desviación estándar de
15. En una distribución normal, a una desviación estándar positiva y a una negativa respecto de la
media, es decir, entre los C.I. 85 y 115, se ubicaría aproximadamente el 68% de todos los
adultos.
Rangos de edades
La escala es adecuada para las edades comprendidas entre los 16 años 11 meses y los 90 años.
La ampliación de los rangos de edad, para adultos (de 74 a 90 años), refleja la mayor esperanza
de vida promedio.
WISC IV
LA CUARTA EDICIÓN DE LAS ESCALAS WECHSLER PARA LA MEDIDA DE LA
INTELIGENCIA DE NIÑOS Y ADOLESCENTES
Esta cuarta revisión mantiene íntegramente la tradición de las Escala Wechsler, pero además
incorpora los enfoques contemporáneos de la Psicología Cognitiva y de la evaluación intelectual,
proporcionando de ese modo un instrumento poderoso y eficiente que apoya el desarrollo del
juicio clínico.
Todos los materiales han sido revisados y/o renovados y adaptados a las necesidades actuales, a
los últimos avances en la investigación, ampliando el ámbito de aplicación para abarcar niños con
capacidades muy bajas o altas y mejorando las normas de aplicación y puntuación.
En 2011 la Editorial Paidós dio a conocer la adaptación para la versión en español de la Escala y
la tipificación realizada en la Provincia de Buenos Aires, a cargo de Alejandra Taborda, Claribel
Barbenza y María Elena Brenlla.

31
La revisión contempla las mejoras en los fundamentos teóricos, en la utilidad clínica, en la
adecuación al curso del desarrollo, en las propiedades psicométricas y en la aplicación y
puntuación de la prueba.
Actualización de los fundamentos teóricos.
 Mejora la evaluación del Razonamiento Fluido, la Memoria Operativa y la Velocidad de
Procesamiento.
Intensifica la utilidad clínica
La validez clínica se ha mejorado a partir de dos estudios
 16 muestras clínicas especiales.
 Relaciones estadísticas con medidas de rendimiento.
Mejora en los procedimientos de administración para su administración al curso del
desarrollo
 Instrucciones para el sujeto examinado. Se facilitan y adecuan las instrucciones
 Elementos de aprendizaje, preguntas y sugerencias. Se incorporan ítems de aprendizaje y
preguntas adicionales para que se clarifiquen las respuestas cuya puntuación no es clara.

 Criterios de puntuación. Se realizó un estudio más intensivo para determinar los puntajes
apropiados para diferentes tipos de respuestas. Se incluyen más ejemplos.

 Tiempo de ejecución. Se reduce la importancia del tiempo de ejecución en los subtest que
no miden la velocidad de procesamiento. Se reduce la bonificación por tiempo, se
eliminaron subtest que demandaban mucho tiempo (ej. Rompecabezas)

 Materiales de los subtest. Se actualizó el diseño gráfico para que resulte más atractivo, se
eliminan ítems anticuados, se incorporaron ítems nuevos para reflejar ideas y situaciones
más actuales.
Mejora en las propiedades psicométricas
 Normas y baremos
Se demuestra que la muestra resulta representativa de la población actual de los niños en
EEUU. La muestra estuvo compuesta por 2.200 niños y adolescentes. Se realizó en base a
las siguientes variables demográficas: edad, sexo, reza/etnia, nivel educacional de los
padres y región geográfica.

 Evidencias de validez y procedimientos para el cálculo de la confiabilidad


Los datos de validez se obtuvieron sobre una amplia gama de medidas de validez
Se realizaron estudios de equivalencia dentro de la familia de las Escalas Wechsler.
La WISC IV también esta validada con medidas de rendimiento, memoria, comportamiento
adaptativo, inteligencia emocional y brillantez intelectual:
Validez empírica o de criterio: se obtuvieron datos de validez convergente y
discriminante respecto de la correlación de las puntuaciones de los resultados de la Escala
WISC IV con las puntuaciones de otras pruebas
32
Validez de constructo: Se obtuvo a través del análisis factorial exploratorio y
confirmatorio y de la comparación de las puntuaciones promedio en muestras clínicas y no
clínicas.
Confiabilidad: en el manual se informan los resultados de la consistencia interna, la
confiabilidad test-retest y datos correlacionales.

 Mejora el piso y el techo de todos los subtests.


Se adicionaron ítems más fáciles y más difíciles.

 Sesgo de los ítems


Se seleccionaron los ítems para evitar sesgos de contenido de modo de resultar
culturalmente adecuados.
Mejoras en la aplicación de la prueba
 Duración de la administración
 Procedimientos de administración
Se simplificaron los procedimientos de administración. Instrucciones más breves y fáciles
de comprender, similares para todos los subtest, cambio de orientación de las páginas del
cuaderno estímulos hacia el examinado para reducir la distancia.
 Subtests optativos: se incluyeron para obtener mayor información sobre el desempeño del
examinado en diferentes áreas y para sustituir algunos de los subtests principales
 Reorganización del Manual: Incluye dos manuales: Manual de Administración y
Puntuación, y Manual técnico y de Interpretación (información técnica y psicométrica)
Otras mejoras
Reducción del peso del material que lo integra.
El WISC IV proporciona algo más que los CI. Se trata de información esencial sobre el
funcionamiento cognitivo general de los examinados (CI TOTAL) y sobre su funcionamiento en
las principales áreas específicas de la inteligencia. Los CI Verbal y de Ejecución han sido
eliminados en esta revisión.
La Escala se compone de 15 tests, 1 principales y 5 optativos, que pueden reemplazar a otros o
bien pueden ser incluidos cuando se desee obtener información adicional, prestando en este caso
cuidadosa atención para el cálculo de los puntajes compuestos.
Los principales cambios en cuando a la estructura de la prueba (contenidos) se refieren a la
incorporación de subtests nuevos, a la eliminación de otros presentes en versiones anteriores, a
la modificación de algunos de los subtests retenidos o bien a su consideración como pruebas
opcionales.
CI TOTAL:
COMPRENSIÓN VERBAL:
Semejanzas
Vocabulario
Comprensión
Información (*)
Adivinanzas (*) (nuevo)
33
RAZONAMIENTO PERCEPTIVO:
Cubos
Conceptos (nuevo)
Matrices (nuevo)
Figuras Incompletas (*)
MEMORIA DE TRABAJO
Dígitos
Símbolos
Letras y Números
Aritmética (*)
VELOCIDAD DE PROCESAMIENTO
Claves
Búsqueda de Símbolos
Animales (*) (nuevo)
Subtests eliminados: Rompecabezas, Laberintos e Historietas
Subtests mantenidos: Construcción con cubos, Semejanzas, Retención de Dígitos, Claves,
Vocabulario, Comprensión, Búsqueda de Símbolos, Completamiento de Figuras, Información y
Aritmética. Se revisaron sus contenidos
Subtests nuevos: Adivinanzas, Matrices, Letras y Números, Animales y Conceptos.
Consideraciones Generales
o Administración: Papel, lápiz y materiales de la prueba
o Tiempo: 60-90 minutos
o Puntajes: CI Total, Puntajes de Índice, Puntajes transformados de los subtest.
o Opciones de puntuación: Asistencia de software para la puntuación y el informe escrito
o Calificación del nivel del test: Nivel “C”
o Publicación: EEUU: 2003, Buenos Aires: 2011
o Edades: 6.00-16.11
o Normas: Puntajes transformados por edad, Puntajes de Índice, CI Total, Edades de Edad.

Puntuación e informe
Para hacer una interpretación clínica más significativa, la estructura dual de los CI (verbal y de
ejecución) ha sido reemplazada por un sistema de 4 puntajes compuestos, los 4 puntajes índices
que ayuda a comprender mejor las necesidades de los niños en relación con las teorías
contemporáneas y la investigación cognitiva sobre procesamiento de la información.
Puntajes que se obtienen:
1. 10 Puntuaciones Escalares de los 10 subtests principales
2. 5 Puntajes Escalares de los 5 subtests optativos
3. 4 Puntajes de Índice
4. 1 CIT
5. 7 Puntajes de procesamiento: CCS, DD, DI, Aa, Ao.
DD DI no tienen puntuación escalar.

34
En Buenos Aires la Escala fue tipificada sobre 1458 sujetos de la Ciudad Autónoma de Buenos
Aires y del Gran Buenos Aires. La muestra comprende 11 grupos de edad. Cada año está dividido
en segmentos de 4 meses. Los materiales de esta versión se corresponden con los de la prueba
original.
Los criterios de puntuación
En esta revisión, existen dos criterios para evaluar las respuestas: exactitud (adecuación de la
respuesta y tiempo (rapidez con la se proporcionan respuestas correctas). Existen
combinaciones de estos criterios:

- Respuestas positivas o negativas sin corrección por límite de tiempo


- Respuestas que se evalúan con distintos puntajes según su corrección
- Respuestas correctas dentro de un límite de tiempo, con adicional por mayor rapidez
- Respuestas correctas dentro de un límite de tiempo, sin adicional por rapidez

Uso de la Hoja de Registro o Protocolo


Una de las mejores cosas del WISC IV es la modificación del Protocolo, para facilitar su uso.
En la hoja inicial del protocolo aparecen cinco espacios particulares:

- Cuadro A: datos de identificación.


- Cuadro B: fecha de examen, de nacimiento y la edad del sujeto examinado.
- Cuadro C: los 13 subtests, una columna para transcribir los puntajes brutos y otras
destinadas a encontrar los puntajes equivalentes. La parte inferior permite ubicar la suma
de las puntuaciones de cada una de las columnas, sumas que corresponden a las
puntuaciones de cada una de las Escalas (Verbal y de Ejecución) y a los Puntajes Índice;
la celda inferior está destinada a ubicar la puntuación total de la Escala Completa.
- Cuadro D: lista de los siete puntajes que se pueden obtener con la prueba (puntajes
equivalentes totales, Cocientes Intelectuales, Puntajes Índice correspondientes a esas
puntuaciones, percentiles e intervalos de confianza).
- Cuadro E: puntajes de los subtests (gráfico).
- Cuadro F: Puntajes de CI y Puntajes Índices (gráfico).

Procedimiento para la puntuación


I. Puntuaciones Directas que correspondan con las respuestas obtenidas
II. Convertir Puntuaciones Directas en Puntuaciones Escalares para compararlas
III. Convertir Puntuaciones Directas en Puntuaciones de Edad
IV. Suma de los Puntajes Escalares del Índice de Comprensión Verbal
V. Suma de los Puntajes Escalares del Índice de Razonamiento Perceptivo
VI. Suma de los Puntajes Escalares del Índice de Memoria Operativa
VII. Suma de los Puntajes Escalares del Índice de Velocidad de Procesamiento
VIII. Suma de los 10 subtests correspondientes al CI Total
Recordamos: un nivel de confianza de 0.90 significa que se tiene el 90% de probabilidad de que
el parámetro encontrado (en ese caso los CI y los PI), se localicen en el intervalo seleccionado y
un 10% de probabilidad de que el intervalo seleccionado sea erróneo.

35
Un nivel de confianza del 0.95 significa que se tiene el 95% de probabilidad de que el parámetro
encontrado se localice en el intervalo seleccionado y un 5% de probabilidad de que el intervalo
sea erróneo. Generalmente para esta evaluación el nivel de confianza del 0.90 es el adecuado.
Se trazan los Perfiles de Puntuaciones Escalares. Se los marcan en el cuadro y se unen de
izquierda a derecha. En el puntaje 10 aparece una zona sombreada, que corresponde con la
media de todos los subtests de la muestra de tipificación. Cada subtest tiene una media de 10 y
un desvío estándar de 3.
Se traza el Perfil de los Puntajes de CI y de los Puntajes Índice trasladando los puntajes en las
intersecciones y se las une. El puntaje 100 corresponde a la media de la muestra de tipificación
en toda la escala. La Escala tiene una media de 100 y un Desvío Estándar de 15 puntos.
Análisis de las puntuaciones obtenidas
Analizar si las diferencias mínimas requeridas (Valores críticos) entre las puntuaciones
encontradas entre distintas puntuaciones resultan estadísticamente significativas, es decir que no
se deben al azar.
Y, comparar las diferencias significativas encontradas con los valores obtenidos por el grupo
normativo (Tasa Base) para poder interpretarlas.
En NINGÚN caso los Puntajes Índices y los Puntajes Escalares de los subtest de cada sujeto
examinado son idénticos. Aparecen fluctuaciones, en los perfiles aparecen picos (puntuaciones
más altas) y valles (puntuaciones más bajas).
Para la comparación de los Puntajes de Índice:
1. Trasladar al cuadro los puntajes correspondientes
2. Calcular las diferencias entre ambos valores (restándolos)
3. Encontrar el valor crítico comparando la diferencia obtenida, en términos absolutos (sin
tener en cuenta el signo positivo o negativo) con las diferencias que se proporcionan en el
apéndice (manual) de Argentina de acuerdo a la edad del examinado, y eligiendo un nivel
de confianza.
4. Colocar S si la diferencia es significativa o N si no lo es. El valor de la diferencia
encontrada para que resulte significativa debe ser igual o mayor al valor critico de
comparación.
5. Comparar la diferencia encontrada con la Tasa Base. Esa tasa corresponde al % de la
muestra de tipificación que obtuvo la misma discrepancia o una discrepancia mayor entre
las Puntuaciones Índices o Puntajes Escalares de Subtests. Se debe seleccionar si se lo
hará respecto de la Muestra Total o respecto del Nivel de Habilidad (CI obtenido por el
examinado)
Comparación de los Puntajes Escalares
1. Trasladar los puntajes correspondientes al cuadro correspondiente
2. Encontrar el Valor Critico en la tabla del manual. Seleccione un nivel de confianza (85% o
95%)
3. Determinar si la diferencia resulta o no significativa marcando S en caso de afirmativo, o N
en caso negativo. Para ser una diferencia significativa, la diferencia encontrada debe ser

36
igual o mayor al Valor Critico. No será significativo cuando la diferencia encontrada es
mejor al Valor Critico
4. Comparar la diferencia encontrada con la Tasa Base

Fortalezas y debilidades
Análisis intraindividual de las fortalezas y debilidades del examinado para cada subtest. Los
Puntajes Escalares pueden compararse con:

- El Puntaje Promedio de todos los subtest. Se utiliza cuando NO hay discrepancia


significativa entre el ICV y el IRP
- El Puntaje Promedio del ICV y IRP. Cuando HAY discrepancia significativa entre ICV y
IRP
Pasos:
1. Calcular los Puntajes Promedio (Media) con el que va a comparar los Puntajes Escalares
2. Marcar el Promedio y el Nivel de Confianza seleccionados
3. Trasladar las Puntuaciones Escalares
4. Registrar la Puntuación Media en la columna correspondiente.
Los subtest que componen IMO y IVP solo pueden compararse con el puntaje
promedio total
5. Calcular la diferencia a la media restando a la Puntuación Escalar, la Puntuación Escalar
media. Registrar los datos en la columna “Distancia a la Media”.
6. Encontrar los Valores Críticos (valores mínimos requeridos para alcanzar significación
estadística a los niveles de confianza de 0.15 o 0.95). Transcribir el puntaje en el casillero
“Valor Critico”
Si la diferencia a la media encontrada (en valores absolutos) es igual o mayor que el Valor
Critico, la diferencia es estadísticamente significativa. Si la diferencia a la media
encontrada es menor que el Valor Critico, la diferencia no es estadísticamente
significativa.
Cuando la diferencia es estadísticamente significativa, puede tratarse de una Fortaleza o
una Debilidad. Si el signo es positivo, se trata de una Fortaleza, si es negativo, se trata de
una Debilidad.
7. Ahora se ubica la Tasa Base, las diferencias obtenidas por varios % de sujetos en la
muestra de tipificación. Esto permite conocer si la diferencia encontrada es compartida o
no por un % de la muestra. Puede que el valor de la diferencia no coincida con ningún
valor de la tabla, en ese caso se registra la Tasa Base en forma de rango, es decir entre
dos valores que se encuentre. Ej.: < 25%.
Análisis del Procesamiento
Los resultados obtenidos pueden dar lugar al cálculo de 7 puntuaciones de procesamiento, a
partir de los puntajes obtenidos en 3 subtest. Proporciona información más detallada sobre
habilidades cognitivas que contribuyen al desempeño en el subtest. Su análisis puede hacerse
respecto al grupo normativo, o una comparación intraindividual.
1. Conversión de Puntuaciones Directas en Escalares. Obtener las Puntuaciones Escalares
teniendo en cuenta la edad del examinado

37
2. Conversión de Puntuaciones Directas a Tasa Base.
Análisis de las Discrepancias. Comparación de las discrepancias entre las Puntuaciones
de Procesamiento

- Análisis de las Discrepancias DD+ y DI+


- Análisis de las Discrepancias. Entre Puntajes Escalares. Obtener las diferencias
(restando), obtener el Valor Critico de las diferencias que alcanzan significación
estadística. Obtener la Tasa Base.
Puntuaciones Adicionales: Puntuaciones de Edad
A pesar de las críticas de Wechsler sobre este tipo de puntuaciones, siempre interesa al
psicólogo que trabaja con niños contar con información sobre las edades que caracterizan sus
desempeños.
Proporciona indicadores acerca del funcionamiento en términos de la edad promedio a la que le
corresponde el desempeño del examinado, situación que favorece a la toma de decisiones en
torno a las estrategias de intervención. Obviamente sólo se trata de un indicador y el desempeño
de niños de diferentes edades cronológicas con una misma puntuación de edad (o edades
mentales) no proporciona evidencia acerca de idénticas capacidades cognitivas.
Es posible en el WISC IV obtener puntuaciones equivalentes de edad. Se obtienen transformando
las Puntuaciones Directas en Puntuaciones de Edad consultando una tabla del manual, que
muestra las Puntuaciones de Edad Mental que corresponden a las Puntuaciones Directas de
cada subtests y a las Puntuaciones directas de Procesamiento.
Hay que tener algunas consideraciones:
Si la Puntuación Directa Total del Subtest o de las Puntuaciones de procesamiento es
menor al puntaje inferior consignado de 6 años 2 meses, debe registrarse Edad Mental
inferior a los 6 años 2 meses.
Si la Puntuación Directa Total del subtest o de las Puntuaciones de procesamiento es
mayor al puntaje superior consignado de 16 años 10 meses debe registrarse Edad Mental
superior a 16 años 10 meses.
Las transformaciones en Edades Mentales de todos los subtest proporciona distintas Edades para
cada uno. Si se desea obtener una puntuación promedio deben sumarse todas las
Puntuaciones de Edad de los subtests incluidos en los Índices de CV, RP, CI Total y dividirse por
el número de subtest considerados.
Si se desea obtener la mediana de las puntuaciones de edad deben ordenarse las Edades
Mentales de todos los subtest por rango de edad y encontrar el valor central.
Finalmente, la última página de la Hoja de Registro permite, en la parte superior transcribir
algunos datos demográficos de los examinados.
Las “Observaciones de Comportamiento” están destinadas a registrar otros datos de interés para
la interpretación de los resultados.
En la parte inferior aparece el modelo de Curva de Probabilidad normal, en las que están
señalados los % de casos, las descripciones cualitativas, las puntuaciones compuestas y los
rangos de puntuaciones compuestas.
38
La interpretación de los resultados
En análisis de los resultados comprende 9 pasos.
1. Describir el CI Total
Descripción cualitativa o categoría diagnostica. El CI Total es la puntuación más global y confiable
del WISC IV. Se lo considera una de las puntuaciones más representativa del factor g o medida
de la capacidad intelectual general.
Se informa con el percentil correspondiente y los intervalos de confianza.
Se procede estableciendo la descripción cualitativa o categoría diagnostica que corresponde con
el desempeño del sujeto.
Para que el CI Total pueda ser un indicador valido y confiable del desempeño del sujeto, deben
cumplirse otras condiciones:
 No deben aparecer grandes diferencias entre los Puntajes Índice
 No deben aparecer grandes diferencias entre las puntuaciones de cada uno de los subtest.
 No debe inferirse que el bajo desempeño en algunos de los subtest pueda deberse a
cuestiones como fatiga, ansiedad, falta de oportunidades culturales u otro.
Se recomienda que la diferencia entre Puntajes Índices no debe ser superior a 23 puntos (1 y
medio desvío). Para calcularlo, se resta el valor del Puntaje Índice menor al Puntaje Índice mayor.
Y también que la diferencia entre las Puntuaciones Escalares no debe ser superior a 5 puntos (1
y medio desvío). Para calcularlo, se resta el valor del Puntaje Escalar menor al Puntaje Escalar
mayor.
Cuando las diferencias son mayores el CI Total no es un indicador global de la capacidad
intelectual del examinado. Entonces, se interpreta y describe los otros puntajes compuestos.
2. Descripción del ICV
El ICV examina la formación de conceptos, el razonamiento verbal y el conocimiento adquirido
por el individuo de su entorno. Los subtest que lo componen Semejanzas, Vocabulario,
Comprensión, Información y Adivinanzas (los últimos dos optativos)
Se debe informar el percentil que le corresponde y el intervalo de confianza seleccionado.
Las puntuaciones bajas en el ICV se han asociado a distintas condiciones clínicas y del entorno:
 Trastornos neurológicos que dificultan el procesamiento de información y se
manifiestan en capacidades deterioradas del lenguaje, o lesiones que pueden dificultar
la recuperación de la memoria largo plazo.
 Entornos sociales caóticos o deprivados, que proporcionan escasas oportunidades para
el desarrollo cultural.

3. Descripción del IRP


El IRP examina el razonamiento perceptivo y fluido, el procesamiento espacial y la integración
visomotora. Subtest que lo componen: Construcción con Cubos, Matrices, Conceptos y
Completamiento de figuras (opcional).

39
Se debe informar el percentil que le corresponde y el intervalo de confianza seleccionado.
Las puntuaciones bajas del IRP se han asociado a distintas condiciones, algunas clínicas y otras
del entorno:
 Variaciones normales del desarrollo de las habilidades asociadas respecto de otras
habilidades.
 Características del entorno
 Variedad de condiciones clínicas, ej.: dificultades de aprendizaje no verbal.

4. Descripción de IMO
El IMO examina las habilidades de memoria operativa. Estas habilidades refieren a la posibilidad
de retener información en la memoria de modo temporal, realizar alguna operación con esa
información y producir un resultado. Involucra la atención, la concentración, el control mental
(función ejecutiva) y el razonamiento. Construye un componente esencial de otros procesos
cognitivos de orden superior, se la relaciona con el rendimiento y el aprendizaje.
Los subtest que lo componen: Retención de Dígitos (orden directo, examina memoria corto plazo
e inverso examina memoria de trabajo), Letras y Números, Aritmética (optativo).
Debe informarse el percentil y el intervalo de confianza seleccionado.
Las puntuaciones bajas en el IMO se han asociado:
 Trastornos en la lectura
 Trastornos en el lenguaje oral
Las puntaciones bajas deben considerarse como un factor de riesgo que posiblemente requiera
una examinación más exhaustiva, ya que los procesos de memoria operativa facilitan el
aprendizaje.
5. Descripción del IVP
El IVP examina la habilidad para explorar, secuenciar o discriminar de manera rápida y correcta la
información visual simple, la memoria corto plazo, la atención y la coordinación visomotora.
No solo refiere al tiempo de reacción simple, o a la discriminación visual simple, sino que
involucran un componente de aprendizaje o una toma de decisión cognitiva.
Los subtest que los componen son: Claves, Búsqueda de Símbolos, Animales (optativo)
Debe informarse percentil que corresponda e intervalo de confianza seleccionado.
Las puntuaciones bajas se han asociado a distintas condiciones clínicas:
 Trastorno por Déficit de atención con hiperactividad
 Trastorno de aprendizaje
 Daño cerebral traumático
 Influencia de condiciones problemáticas en la coordinación psicomotora

6. Análisis de las comparaciones de las discrepancias entre los Índices

40
Las puntuaciones de los Índices son estimaciones generales del funcionamiento en un área de
contenido o dominio cognitivo particular que provienen de las puntuaciones escalares de distintos
subtests.
Las discrepancias entre las puntuaciones de los subtest muchas veces se asocian a condiciones
clínicas, pero también aparecen en poblaciones no clínicas, razón por la cual deben extremarse
las precauciones a la hora de su interpretación. Debe compararse con la Tasa Base de la
población normativa.
Pasos para comparar las discrepancias entre Índices:
a. Determinar si el valor absoluto de las diferencias alcanza significación estadística. Si dos
puntuaciones no son significativamente diferentes, las habilidades en esos dominios
indican el mismo nivel de desarrollo.
b. Si el valor absoluto de una diferencia entre dos puntuaciones es igual o superior al valor
crítico, se considera que se trata de una diferencia real y no un error de medición. Debe
determinarse si esa diferencia aparece o no en la muestra normativa.
No puede hacerse una estimación fija acerca de considerar inusual el nivel de ocurrencia. La
anormalidad de las discrepancias debe basarse además en el juicio clínico y en otros factores
provenientes de otras fuentes de información.
Satler considera que las diferencias que aparecen en menos del 10% o del 15% de la muestra
pueden considerarse inusuales.
7. Evaluación de las fortalezas y debilidades
NO sucede en ningún caso, que las personas funcionen en el mismo nivel en todas las
habilidades. Todos presentan puntos más fuertes (fortalezas) y otros más débiles (debilidades).
Una vez detectadas se las debe interpretar con precaución, siguiendo determinadas condiciones:

- Teniendo en cuenta el motivo de la consulta.


- Ir probando hipótesis que puedan dar fundamento a las discrepancias entre las
puntuaciones, a partir de información de la prueba y otras fuentes.
- Se debe tener en cuenta que todos los factores cognitivos pueden afectar el rendimiento
en un subtest.
- Cualquier interpretación debe fundamentarse a partir de la evidencia para corroborarla.

8. Evaluación de las comparaciones de las discrepancias entre subtests


Pueden existir razones para comparar las puntuaciones de dos subtests. El manual brinda
información sobre el % de la muestra que obtuvieron discrepancias entre los subtests.
9. Evaluación del patrón de puntuaciones dentro de cada subtest
Proporciona información adicional acerca de las características del examinado.
Las puntuaciones totales de cada subtest pueden provenir de aciertos en diferentes ítems. Los
ítems están graduados en orden de dificultad creciente. En algunos casos se trata de
dispersiones bajas, otras veces se trata de dispersiones amplias, cuando el examinado responde
a diferentes ítems no consecutivos.
Este análisis está destinado al procesamiento y no al producto (resultado de la prueba).
41
Procedimiento para el análisis del procesamiento
Recolecta información más específica respecto de los procesos cognitivos involucrados en las
respuestas a las tareas demandadas por los subtest en cuestión. Se trata del análisis de las
estrategias de resolución de problemas utilizadas por el examinado.
Puede realizarse en dos perspectivas:

- Interindividual: comparando los resultados del examinado con la población normativa


- Intraindividual: comparando los resultados de procesamiento de algunos subtest obtenidas
por el examinado.
Favorece la evaluación de los estilos específicos de procesamiento de la información, que pueden
resultar de importancia tanto para la toma de decisiones respecto del diagnóstico como de las
estrategias de intervenciones que pueden recomendarse.
Subtest: Construcción con Cubos, Retención de Dígitos, Animales
Reflexiones finales
Las Escalas Wechsler se encuentran entre las mejores medidas de Inteligencia. Es importante
contar con una tipificación realizada en el país, en las que se han adaptado los materiales
verbales y no verbales a las características de nuestra población y se han elaborado normas o
baremos locales.
Debe visualizarse al test como algo más que un instrumento de medida. Su validez no es solo
una propiedad inherente al test, sino que depende de la pertinencia de las inferencias realizadas
a partir de sus resultados, complementados con los datos provenientes de otras fuentes de
información.
Se trata de una actividad compleja que requiere el interjuego de conocimientos altamente
especializados en psicología, en teoría de los tests y de la experticia en áreas de la práctica
profesional e investigativa. Involucra un proceso conceptual, de resolución de problemas que
depende de la recolección, análisis e interpretación de información relevante sobre las unidades
de análisis bajo estudio.
WPPSI III
ESCALA WECHSLER PARA LA MEDIDA DE LA INTELIGENCIA DE NIÑOS PREESCOLARES
Y DE EDUCACIÓN PRIMARIA
Fue publicada por la editorial Pearson en 2002. Proporciona puntajes para los diferentes subtests
que la componen, verbales y de ejecución que reflejan el funcionamiento intelectual en dominios
verbales y no verbales. Pueden calcularse 3 CI: Verbal, de Ejecución y Total. El CI Total
representa la capacidad intelectual general del examinado.
Adicionalmente pueden calcularse otros dos puntajes compuestos:
 Cociente de Velocidad de Procesamiento para niños de 4 a 7 años 3 meses
 Puntaje Compuesto del Lenguaje General niños de 2 años y medio a 3 años 11 meses,
y 4 años a 7 años 3 meses.
A los niños de 2 años y medio a 3 años y 11 meses se le administran solo 5 subtest: Vocabulario
receptivo, Diseño con Cubos, Información, Rompecabezas y Nombrar Imágenes.
42
El CI y los puntajes compuestos tienen una M: 100, y un D.S: 15 puntos. Cada subtest tiene un
M:10 y un D.S: 3 puntos.
Algunos estudios demuestran que se trata de una prueba poco confiable, sus resultados pueden
variar ampliamente por diversos factores tales como la retestificación, la practica (familiarización),
el administrado, el tiempo y el lugar. Como todas las pruebas destinadas a niños de corta edad se
deben extremar las precauciones a la hora de interpretar resultados.
Está compuesto por 14 subtest: Diseño con Cubos, Información, Matrices, Vocabulario, Concepto
en imágenes, Búsqueda de Símbolos, Adivinanzas, Claves, Comprensión, Completar figuras,
Semejanzas, Vocabulario receptivo, Rompecabezas, Nombrar imágenes.
Características generales:
o Administración: papel y lápiz
o Tiempo de administración: edades 2 años y medio a 3 años 11 meses, 45 minutos. 4
años a 7 años 3 meses 45-60 minutos.
o Puntajes: Puntajes pesados o transformados y Cocientes Intelectuales
o Opciones de puntuación: Software Asistente de puntuación, Software del informe escrito
o puntuación del manual.
o Opciones del informe: al examinado, estadístico e interpretativo
o Nivel de clasificación: C

El WPPSI ha sido reformulado con el propósito de brindar una evaluación de mejor calidad. Las
mejoras son el resultado de la investigación, en consecuencia, cuenta con actividades más
cortas, más lúdicas. Las instrucciones y los procedimientos de puntuación más simplificados
mejoran la facilidad de administración para los examinadores.
Evaluación asistida por programa informativo de las Escalas Wechsler
Se cuenta en la actualidad con una medida confiable y valida de inteligencia para ser aplicada a
niños pequeños, que es apropiada para la edad y fácil de usar. Estas mejoras proporcionan
información clínicamente más útil para el diagnóstico y la planificación, haciendo de la WPPSI III
una herramienta más potente.
En el campo de la evaluación psicológica cada vez con mayor frecuencia se utilizan medios
informáticos que automatizan los procedimientos de puntuación, ello permite el ahorro del tiempo
empleado, así como una ganancia en la precisión.
En la actualidad existen para estas escalas dos soportes software destinados a los
procedimientos de puntuación e informe de los resultados:

- Asistente de puntuación (Scoring Asistant)


- Asistente para la elaboración del informe escrito (Report Writer software)

Ambos generan una puntuación concisa y un informe comprehensivo de manera automática


desde la PC personal. Para ellos simplemente se introducen las puntuaciones directas.
El uso de los soportes informáticos no sustituye el juicio del examinador, cuya competencia en el
manejo de los instrumentos y en la interpretación de los resultados requiere de conocimientos
acabados en psicología, particularmente de la psicología del desarrollo, de psicopatología y teoría

43
de los test, así como del ajuste de la evaluación a las consideraciones deontológicas que regulan
el accionar del profesional.
EDADES MENTALES EQUIVALENTES
Las puntuaciones de edad han demostrado su utilidad cuando se debe responder al interrogante
sobre a qué nivel de rendimiento promedio de un grupo de edad se asemeja el rendimiento de un
sujeto, cuando resulta insuficiente conocer cómo se ubica entre su grupo de pares.
En las extensiones de la Escala destinada a niños, se proporciona la posibilidad de transformar
las puntuaciones directas en puntuaciones de edad para cada uno de los subtests, y a partir de
allí obtener una suerte de Edad Mental.
Las edades equivalentes.
La conversión de los puntajes directos en puntajes de edad requiere un procedimiento sencillo.
Basta ubicar el puntaje bruto de uno cualquiera de los subtests en la columna encabezada por su
nombre e identificar la edad del test situada en la misma fila en la columna correspondiente,
encabezada como “edad del test”.
Muchas veces los puntajes brutos están por fuera de los límites considerados en las tablas. En
general debe procederse de la siguiente manera:
a. Si los puntajes brutos son inferiores a los límites considerados en la Tabla se debe
adjudicar una Edad del Test por debajo de 6 años en el caso del WISC III y por debajo de 4
años en el caso del WPPSI.
b. Si los puntajes brutos son superiores a los límites, se debe adjudicar una Edad del Test por
encima a 16 en el caso del WISC III y por encima de 6 años y medio en el caso del WPPSI.
En el caso del WPPSI puede suceder además que el mismo puntaje aparezca en dos o tres
edades. En estos casos se debe proceder así:
a. si el mismo puntaje bruto se aplica a dos edades sucesivas se debe adjudicar la edad
menor.
b. Si el mismo puntaje bruto se aplica a tres o más edades sucesivas se debe adjudicar la
edad intermedia.
Para obtener la Edad Mental se puede utilizar dos procedimientos:
1. Obtención a través de la media. Para obtener la Edad media del test simplemente se
suman los puntajes de edad y se divide esa sumatoria por el número de subtests
considerados.
2. Obtención de la mediana. Sencillamente se ordenan los Puntajes de Edad obtenidos en
cada subtest de mayor a menor y se halla el valor central.

Trazado del perfil en el WPPSI.


La planilla para el trazado del Perfil constituye una síntesis de la tabla de conversión de Puntajes
Directos de Puntajes de Edades Equivalentes. Para trazar el Perfil, una vez obtenidos los
puntajes directos:
1. Se redondea en la tabla correspondiente a cada subtest.

44
2. Se unen los puntos redondeados de arriba hacia abajo. Queda conformada una línea
quebrada que marca la dispersión de puntajes de edad.
3. Se trazan las verticales correspondientes a la Edad Cronológica y a la Edad Mental.
4. Estas verticales permiten comparar la dispersión del sujeto respecto de su edad
cronológica y de su Edad Mental.
El trazado del perfil permite observar globalmente el desempeño de un sujeto y comparar
intraindividualmente su rendimiento en diferentes áreas, a partir de las cuales es posible conocer
cuáles son los puntos débiles y fuertes de su estructura intelectual. Interesa en primer lugar
considerar las discrepancias entre edad cronológica y del test.

RAVEN
Fundamentación:
En 1904, inspirado por Galton e influido por Wundt, el Psicólogo inglés Charles Spearman inicia
sus investigaciones sobre la inteligencia.
Antecedentes (teorías):

- Monárquica: postula una inteligencia general


- Oligárquica: postula varias facultades diferenciadas
- Anárquica: postula múltiples aptitudes independientes

Postulando la teoría de los factores (teoría bifactorial), Spearman cree haber dado con la teoría
ecléctica que logra la conciliación armónica buscada entre la teoría monárquica de la inteligencia
general (factor g), la teoría oligárquica de las facultades (factores de grupo) y la teoría anárquica
de las aptitudes (factor e) Spearman considera que la inteligencia está determinada por un alto
número de factores especializados (uno para cada función), por un número limitado de factores
de grupo (que intervienen en cierto número de funciones) y por un factor general (común a todas
las funciones)
Teoría ecléctica de los dos factores: Todas las habilidades del hombre tienen un factor
común, general a todas ellas (Factor G) y un factor específico a cada una de ellas (Factor E)
FACTOR G: común y fundamental en todas las funciones cognitivas del mismo individuo.
Cualitativamente, se lo explica como la “energía mental” que subyace a todas las operaciones
psíquicas. Su magnitud es intraindividualmente constante, e interindividualmente variable.
FACTORES DE GRUPO y ESPECIFICOS: son variables tanto intra como
interindividualmente. Los factores de grupo son comunes a un conjunto de habilidades. Un
ejemplo de factor específico: habilidad verbal, habilidad numérica, es un factor cuantitativo propio
de cada habilidad particular y no depende ni se correlaciona con G ni con los otros E.
COMPONENETES DE G: Capacidad Eductiva. Permite dar sentido a la confusión, desarrollar
nuevas comprensiones, percibir más allá de lo obvio, dar forma a constructos no verbales, que
facilitan el manejo de problemas complejos.
La educción es un proceso de educir o extraer nuevas comprensiones e información partiendo de
lo que se percibe o ya es conocido

45
Las Matrices miden la capacidad para educir relaciones. Esto se debe a que las variables entre
las que deben verse relaciones no son en sí mismas obvias. Hay que discernir la relación para
conocer esas variables. Esto es lo que quiere decir Spearman cuando afirma que la percepción
de una variable tiende a evocar instantáneamente el conocimiento de una relación, y viceversa.
Capacidad reproductiva. Permite el dominio, el recuerdo, la reproducción de un acervo cultural
de conocimientos explícitos, verbalizados. Spearman afirmaba que las capacidades eductiva y
reproductiva tienen diferentes orígenes ambientales y genéticos.
Una formulación apropiada es que las Matrices miden la capacidad para desplegar constructos
de algún nivel que hagan más fácil pensar sobre situaciones y acontecimientos complejos.
Las controversias acerca de la naturaleza de la inteligencia humana, se han sucedido a lo largo
del tiempo. Una de las polémicas ha surgido a partir de la constatación del incremento del
cociente intelectual (IQ) en los países desarrollados a lo largo del siglo pasado, generación tras
generación, a razón de tres puntos por década.
Quien descubrió este sorprendente fenómeno, a principios de la década de 1980, fue James R.
Flynn, profesor Emérito de la Universidad de Otago (Nueva Zelanda), que ha alcanzado
notoriedad por este hallazgo, conocido como “Efecto Flynn”. En su opinión, la clave está en la
complejidad de la actual sociedad de la información, altamente tecnificada e impregnada de
ciencia. La capacidad humana no ha cambiado, lo que ha cambiado es el nivel de exigencia y el
foco de atención, orientado ahora a problemas más abstractos que concretos, que demandan
mayor pensamiento científico y crítico.
La queja sobre la falta de pensamiento científico y crítico, parece entonces infundada. Pero la
cuestión acerca de la mayor capacidad intelectual de las generaciones actuales respecto de las
precedentes, es una cuestión que sigue procavando discusiones. El llamado “Efecto Flynn”
introduce dudas sobre la naturaleza genética (heredada) del factor G.
A partir del uso generalizado de los tests de inteligencia, se ha observado que los puntajes
medios obtenidos aumentan regularmente y de manera notable con el correr del tiempo en todo el
mundo. James R. Flynn sintetiza los resultados de las investigaciones sobre el tema en el año
1984 y, a raíz de ello, se denomina “efecto Flynn” (Flynn, 1984) al aumento constante de los
valores absolutos en todos los tests de inteligencia, para todas las edades.
Esta constatación indica que, para la misma población, las normas para el cociente intelectual se
vuelven obsoletas conforme pasan los años.
Con respecto a la Argentina, un equipo (Neer y Lopetegui) realizó una primera constatación del
efecto Flynn en la ciudad de La Plata y alrededores al actualizar los baremos del Test de Matrices
Progresivas de Raven en el año 2000, y compararlos con la estandarización previa, del año 1964.
Esta comparación mostró un considerable aumento en los puntajes directos del test para todas
las edades.
Leyes Noegenéticas de Spearman

- Educción de relaciones: ante dos o más ítems toda persona tiende a establecer
relaciones entre ellas.
- Educción de correlaciones: ante un ítem y una relación, toda persona tiende a concebir
el ítem correlativo.

46
- Autoconciencia o introspección: toda persona tiende a conocerse de un modo inmediato
a sí misma y a los ítems de su propia experiencia.
Estas tres leyes psicológicas cualitativas indican el sentido genético del conocimiento y su
proceso: la educción de correlatos supone el saber de las relaciones y de los fundamentos (y éste
el de la autoconciencia); la educción de las relaciones supone el saber de los fundamentos y
éstos a su vez la autoconciencia.
Los problemas de educción de relaciones y correlaciones de Raven están seriados en orden de
dificultad progresiva: las primeras series plantean variados problemas de educción de relaciones
(si bien la tarea de percepción estructurada es en las dos primeras lo fundamental), y las últimas
series, problemas de educción de los correlatos.
El Test de Raven se construyó sobre la hipótesis de base “de que, si los principios de neogénesis
de Spearman eran correctos, podría disponerse de un test útil para comparar la gente con
respecto a sus inmediatas capacidades de observación y de pensamiento claro”.
ESCALA RAVEN
Nombre de la Escala: Progressive Matrices (1938)
Autor: J.C. Raven
Material de la Revisión: Manual, Protocolo de registro, Cuadernos de examen para la Escala
General; la Escala Especial (Coloreada) y la Escala Avanzada, Series I y II, Tableros Excavados
para la Escala Especial Forma Tablero, Grillas o Parrillas de Corrección y Carpetas con normas o
baremos.
El test de Raven busca medir el factor general. Suministra información directa de la magnitud
individual de ciertas funciones cognoscitivas (observación y razonamiento) y una cierta evaluación
de casi todas ellas. Esto ha llevado a la errónea conclusión de que el test consiste en una prueba
de inteligencia general.
Debe advertirse que el factor “g” solo mide un factor común a todas las operaciones, y no la
operación entera, o sea que la determinación de G no implica una mensuración completa de
ninguna operación intelectual particular, pues faltará medir el factor E. Para un conocimiento
completo de las habilidades de un individuo debe complementarse la averiguación de “G” con la
averiguación de “E” mediante los test factoriales correspondientes.
Caracterización:
o Objetivo de la Escala: Evaluación de la inteligencia general.
o Estructura de la prueba: Elementos homogéneos compuestos de matrices que consisten
en figuras geométricas abstractas que presentan “lagunas” a ser completadas. Los
elementos están ordenados en series en orden de dificultad creciente. Cada una de las
series resulta a su vez de mayor dificultad que la precedente. El número de series varía en
cada una de las escalas
o Tipo de fundamento: Teórico. Se basa en la Teoría Factorial de la Inteligencia.
o Tipo de prueba: Homogénea. Examina factor “g”. Para ello pone en juego procesos de
educción de relaciones y correlaciones sobre un material en el que las variables a
considerar no son obvias, es decir que se deben extraer nuevas comprensiones a partir de
la información dada.
47
o Tipo de respuesta que demanda: de selección múltiple. El sujeto debe elegir la respuesta
correcta entre 6 u 8 alternativas.
o Rango de edades que cubre:
Escala General: 6 a 65 años.
Escala Especial Forma Cuadernillo: 5 a 11 años.
Escala Especial Forma Tablero: 5 a 6 años y a sujetos débiles mentales, sordos o que
desconozcan el idioma del examinador.
Escalas Avanzadas Series I y II: principalmente adultos o niños mayores y adolescentes
talentosos
Administración:
Forma: Individual o colectiva
Tiempo: 40 minutos a 1 hora.
Evaluación: 20 minutos.
Tipificación: en los Manuales se informa sobre sucesivas estandarizaciones. No se precisan las
variables consideradas para la obtención de las muestras. Se ofrecen en cambio normas para
sujetos de diferente edad.
Normas o Baremos: se ofrecen los baremos o normas de origen y de distintas regiones del país
obtenidos por diferentes investigadores
Unidad de Medida: Percentiles: los puntajes directos obtenidos, uno por cada respuesta
correcta, se transforman en percentiles. Los percentiles se categorizan en Rangos de capacidad
intelectual. La zona de normalidad está delimitada por los percentiles 16 y 84 a +-1DS.
(VER RANGOS)
Confiabilidad: en los respectivos Manuales se informan datos sobre confiabilidad de división en
dos mitades (consistencia interna), y de test-retest, para todas las escalas.
Validez: en los respectivos Manuales se informan datos sobre validez de contenido, empírica o
de criterio (resultados en otros tests y rendimiento académico como criterio) y validez estructural.
Referencia Técnica
El Test de Matrices Progresivas original, tuvo como propósito evaluar la inteligencia en todos los
niveles de rendimiento, “a partir del momento en que un niño es capaz de aprehender la idea de
descubrir una pieza ausente para completar un dibujo” (Raven, 1938).
Se trata de la Escala General, que se divide en cinco series, A, B, C, D y E, de doce problemas
cada una, ordenados por dificultad creciente, pero de modo tal que el último problema de una
serie resulta más difícil que el primero de la serie inmediata posterior. Esta organización permite a
los sujetos mantener las expectativas de su desempeño al mismo tiempo que desarrollar un
programa de entrenamiento para encontrar las respuestas correctas.
Las dos primeras series del test, involucran problemas de educción de relatos y las tres últimas
de correlatos. Asimismo, se ha encontrado que las dos primeras series, son “fuertemente
gestálticos”, es decir que plantean problemas de percepción de totalidades. En cambio, las 36
últimas requieren para su resolución de operaciones analíticas de educción de correlaciones del
tipo de problemas de serie (progresión de adición cuantitativa, espacial, de movimiento,

48
progresión numérica, de alternancia, de simetría); problemas de analogías (simples, complejas o
combinación de varios principios).
Ulteriormente la prueba fue revisada en sucesivas oportunidades, generalmente con el fin de
obtener normas o baremos adecuados a diferentes poblaciones.
El mismo autor construyó posteriormente la Escala Especial, destinada al examen más preciso
de niños pequeños, retrasados mentales y ancianos. Consta de tres series en lugar de cinco,
puesto que su grado de dificultad es menor, A, Ab y B. Las series A y B son las mismas que las
de la Escala General. La serie Ab es nueva. Se ha interpolado entre las otras dos porque
comporta problemas de dificultad intermedia entre ambas. Se les ha adicionado color con el
propósito de hacer más atractiva la tarea. Sin embargo, las tres últimas matrices aparecen en
blanco y negro, es decir que son idénticas a las de la Escala general. Esto posibilita continuar el
examen de niños que han resuelto satisfactoriamente todas o casi todas las matrices de la serie B
de la Escala Coloreada, con la serie C de la Escala General, para poder determinar su
rendimiento máximo.
La Escala Coloreada se presenta en dos formas, Cuadernillo, similar a la Escala General y
Tablero, en el que las opciones de respuestas son móviles y se encastran en la laguna de la
matriz. Esta última está destinada a niños de 5/6 años, deficientes mentales, sordomudos y
sujetos que hablan un idioma diferente al utilizado por el examinador y/o el lugar de residencia.
Finalmente, la Escala Avanzada, Series I y II, consta de 12 problemas en el primer caso y de 36
en el último. Están destinadas a examinar la capacidad eductiva de alto nivel, ampliar la
distribución de los puntajes del 25% superior de la población y evaluar con más exactitud la
velocidad para el trabajo intelectual.
Las normas o baremos del test, elaboradas en percentiles, corresponden a diferentes grupos
nacionales y regionales. Entre ellos algunos a la población del país. Las normas obtenidas en la
ciudad de La Plata en investigaciones realizadas en la U.N.L.P. (Rossi Casé, Neer, & Lopetegui,
2000, 2001 y 2003) dan cuenta de modificaciones significativas en los puntajes directos que
corresponden a determinado percentil, extraídos de poblaciones que pertenecen a generaciones
diferentes.
Este aumento en las puntuaciones de poblaciones correspondientes a períodos sucesivos se
conoce con el nombre de “Efecto Flynn”, en relación con el autor que describió ese fenómeno.
Pasos a seguir en la evaluación
Los puntajes que se obtienen con las Escalas Raven, son percentiles, es decir medidas de
posición que permiten conocer a qué porcentaje de la muestra de tipificación sobrepasa un
individuo y por qué porcentaje es sobrepasado. Los límites de la normalidad se encuentran, a
grandes rasgos, entre el percentil 16 y el percentil 84 (ubicados a 1 DS negativa y a 1 DS positiva
de la media), considerando los criterios de la Organización Mundial de la Salud. No obstante,
debe destacarse que los autores hacen discriminaciones más finas. Por debajo se encuentran los
niveles intelectuales subnormales y por encima los superiores a la normalidad.
Pasos a seguir:

49
1. Evaluar las respuestas como positivas o negativas, de acuerdo con la grilla de corrección.
(El número de ítems varía según la forma de tests, Escala General: 60, Escala Coloreada:
36, Serie Avanzada I: 12, Serie Avanzada II: 36.
2. Sumar los puntajes positivos que constituye el Puntaje Total
3. Corroborar la consistencia del puntaje de acuerdo a la tabla correspondientes que figura en
el Manual, Composición del puntaje normal, los aciertos que se esperan dado un
puntaje total, para cada una de las series. Es consistente cuando cada discrepancia no
excede los valores de +2 y -2.
4. Se convierte el Puntaje Total obtenido en percentil. En el baremo correspondiente de
acuerdo a los siguientes criterios:
- Para los percentiles 75, 90 o 95, el puntaje directo total del sujeto debe ser igual
o superior al que figura en el baremo para esos percentiles, de acuerdo a la edad
considerada.
- Para el percentil 50, el puntaje directo total del sujeto debe ser igual, superior o
inferior al que figura en el baremo para ese percentil, de acuerdo a la edad
considerada.
- Para los percentiles 25, 10 y 5 el puntaje directo total del sujeto debe ser igual o
inferior al que figura en el baremo para esos percentiles, de acuerdo a la edad
considerada.
Consiste en un test de “observación y pensamiento claro”. Explora la capacidad para hacer
comparaciones y razonar por analogías.
¿Por qué Matrices Progresivas? Cada problema es la madre, molde o fuente de un sistema de
pensamiento. La dificultad progresiva del orden de presentación del material, permite elaborar
paulatinamente el tipo de relaciones y correlaciones a establecer.
Confiabilidad: división en dos mitades (consistencia interna), y de test-retest, para todas las
escalas.
Validez: Validez de Contenido, Empírica o de Criterio (resultado en otros test y rendimiento
académico como criterio), y Validez Estructural

Unidad 7. El sujeto como unidad de análisis. Los test de desempeño típico de dominio general
y específico. La evaluación de la personalidad o de otras dimensiones no cognitivas y
metacognitivas.

Algunas consideraciones y propuestas sobre el análisis cualitativo de indicadores recurrentes y


convergentes en técnicas proyectivas, Beatriz Cattaneo
Las técnicas proyectivas han ocupado el lugar privilegiado de la escena psicodiagnóstico, siendo
utilizadas como elección rutinaria. Son instrumentos valiosos para obtener información sobre
segmentos de conducta: pensamiento, lenguaje, percepción, motricidad, aspectos madurativos,
emocionales, vinculares, etc.
Cada persona se comporta como una totalidad integrada por distintos subsistemas en
permanente interacción: subsistema biológico, psicológico, social, cultural.

50
El psicólogo evaluador deberá incluirse en ese campo social interactivo con el entrevistado. No
hay observación pura, ni observador totalmente objetivo. El profesional deberá incluirse como
variable interviniente de esa situación.
Con el método indiciario se analizan huellas, indicadores o señales minúsculas pero que
constituyen claves para acceder a una realidad más profunda, inaccesible por otros métodos.
Percibir esas marcas, permite un tipo de razonamiento por abducción (adoptar provisionalmente
inferencias con el objetivo de verificarlas) revelador de fenómenos subyacentes.
Se utilizan diferentes procedimientos metodológicos para aproximarnos a interpretaciones y
conclusiones más certeras, entre ellos el método de recurrencias y convergencias para la
lectura de los materiales.
El formato de la respuesta proyectiva (grafica, verbal, lúdica, mixta) otorga al sujeto amplia
libertad para su elaboración a diferencia de las técnicas psicométricas que restringen la selección
de las respuestas.
Recurrencia se define como la reiteración de un mismo indicador en varias zonas de un mismo
grafico o en gráficos diversos. Puede haber recurrencia respecto de la presión del trazo, el
tamaño o la ubicación en la hoja, etc. Convergencia se define como la reiteración de una
secuencia dinámica expresada a través de indicadores disimiles y en algunos casos hasta
opuestos.
El evaluador se acercará a la lectura de todas las producciones desde un marco teórico para
recortar observables, en este caso pautas formales y de contenido.
Una vez identificadas las distintas pautas se ira armando una red de recurrencias y
convergencias que a la manera de un holograma se complementan entre sí. De las recurrencias
solo se indican que detalles las formas (nivel descriptivo), en cambio las convergencias van
acompañadas de hipótesis (nivel interpretativo).
El análisis de pautas formales y de contenido a través del método de recurrencias y
convergencias, facilitan una lectura de procesos intrapsíquicos e interpersonales del examinado:
fantasías, deseos, áreas de conflicto, conductas adaptativas, según los referentes teóricos que
guían la tarea interpretativa.
La multideterminación de las respuestas proyectivas nos invita a ser cautelosos en su
interpretación. La valoración se complementa con otros factores tales como: contextos
socioculturales del consultante, su historia personal y familiar, las verbalizaciones que acompañan
las respuestas, el sentido de esa experiencia y el vínculo interpersonal con el examinador.
El material psicodiagnóstico está abierto a nuevas lecturas y reelaboraciones de significado
realizadas tanto por el mismo evaluador como por otros.
LOS INSTRUMENTOS PSICOLOGICOS DE EVALUACIÓN DE LA PERSONALIDAD
La evaluación de la “personalidad” refiere a instrumentos que examinan las características
estables de una persona. Se ubican entre los instrumentos de desempeño típico.
Su definición varía según la perspectiva teórica a partir de la cual se la concibe. El termino
personalidad proviene de diferentes orígenes, de la designación griega de máscara, alrededor del
cuerpo, cabeza o rostro, una o completa a sí misma, sonar a través de (latín)

51
La personalidad puede definirse como el conjunto de características psicológicas de un sujeto,
que persisten a lo largo del tiempo y que permiten distinguir su singularidad. Distinción y
persistencia serían los rasgos característicos de este constructo.
El conjunto de esos rasgos determina la forma de sentir, pensar, sentir, comportarse, interpretar
la realidad y afrontar las vicisitudes de la vida, circunstancias responsables de las
manifestaciones que se ponen en evidencia en la forma de ser a través del tiempo.
Desde la perspectiva de la evaluación, se han diseñado instrumentos, se trata de cuestionarios
(lista de preguntas) o inventarios (listas de cuestiones) de personalidad y de técnicas
proyectivas.
Los cuestionarios o inventarios de Personalidad
Forman parte de la tradición psicométrica. Comportan una concepción integradora, basada
muchas veces en el análisis factorial.
Entre los múltiples modelos de estos cuestionarios, uno de los más reconocidos es el
denominado Modelo de los Cinco Grandes, según el cual los factores que subyacen la
personalidad son 5. Estos factores fueron encontrados experimentalmente, constituyen un modelo
explicativo de la personalidad:
1. FACTOR O (Apertura): búsqueda de nuevas experiencias. Es lo opuesto a cerrazón.
2. FACTOR C (Responsabilidad): cuidado y atención en lo que se hace o se decide. Es lo
opuesto a irresponsabilidad.
3. FACTOR E (Extraversión): salir fuera de sí. Lo opuesto es la introversión (la reserva, la
preferencia por lo conocido y habitual, tendencia a la soledad)
4. FACTOR A (Amabilidad): cualidad de afable. Lo opuesto es descortesía.
5. FACTOR N (Neurotismo): inestabilidad emocional. Lo opuesto es la estabilidad
emocional.
Las 5 letras iniciales (en inglés) forman “OCEAN”. Los psicólogos han desarrollado diversas
teorías para dar cuenta de los Cinco Grandes. De ellas se han derivado test de personalidad
basados en este modelo, que dan puntuación a lo largo de estas 5 dimensiones.
Ejemplo: BFQ Cuestionario “Big Five”. La confiabilidad de estas pruebas no siempre es
satisfactoria, razón por la cual los resultados deben interpretarse con precauciones.
MIPS (Inventario Millon de Estilos de Personalidad)
Autor: Theodore Millon
Área que evalúa: Personalidad
Fundamentos teóricos: existen diferentes modelos y enfoques que estudian la personalidad.
Para el planeamiento de las diferentes teorías, Millon propone diferenciar los enfoques
monotaxonómicos y polixonómicos, los que a su vez pueden ser empíricos y teóricos.
Los enfoques monotaxonómicos pueden estar orientados hacia el tratamiento de pocas unidades
de análisis, sean estas categorías, dimensiones o prototipos. Están limitados a áreas
circunscriptas y no pretenden explicar todo el campo de la personalidad, sino que están
interesados en determinadas áreas o procesos. Los enfoques politaxonómicos están
preocupados por la búsqueda de algún edificio estructural que provea una explicación del domino
personológico. El intento de este enfoque es explicar las múltiples variaciones observadas en las
52
conductas, las emociones y los pensamientos de las personas mediante un número menor de
variables o principios teóricos explicativos.
La teoría de Millon es politaxonómicos. Este tipo de enfoque está basado en la construcción de un
edificio taxonómico teórico que permita clasificar los diferentes tipos o estilos de personalidad y
sus desordenes en una misma teoría que provea una explicación acabada del fenómeno objeto
de estudio
Adaptaciones y revisiones:
El Inventario Millon de Estilos de Personalidad fue traducido al español en 1995 y publicado en
1997.
Materiales de aplicación: Cuestionario de 180 ítems, Manual Inventario, Hoja de Respuestas de
Inventario, Manual Estilos de Personalidad, Corrección Inventario (MIPS), Cuadernillo Inventario
(MIPS)
Tiempo de aplicación: aproximadamente 25 minutos
Edad de aplicación: desde 18 años en adelante hasta los 65 años
Formas de aplicación: individual, autoadministración, grupal
Modos de respuesta: verdadero/falso
Puntuación: Cada ítem si la persona responde positivo se darán tres puntos a la escala
Concordancia, y dos puntos a la denominada Conformismo. Si responde falso, se aporta un punto
a la escala Innovación y otro a la escala Control.
Se obtienen 28 puntajes brutos o directos, de los cuales 3 corresponden a las denominadas
escalas de validez 24 a las escalas de Estilos de Personalidad, y 1 al llamado Índice de Ajuste.
En el MIPS se transforman el puntaje bruto en puntaje de Prevalencia: PP. A través de este se
hace una simple clasificación en grupos por rasgos. Luego se hace una estimación más refinada
de la posición que ocupa el sujeto en relación con otros miembros de ese grupo (grupo poseedor
o no poseedor).
Las Técnicas Proyectivas
Se originan en una perspectiva teórica diferente, habitualmente ligada al Psicoanálisis. Se han
desarrollado distintas técnicas proyectivas, cuyos materiales son diversos, se cuenta con técnicas
graficas (dibujo de una persona), verbales (temático-narración a partir de ilustraciones), de
asociación de palabras, completamiento de frases, pictóricas (respuestas frente a manchas de
tintas).
Entre las más difundidas se encuentra Test de Apercepción Temática (TAT) de Murray (1975) y
el Psicodiagnóstico de Rorscharch (1921).
El TAT consiste en 30 láminas temáticas, 20 con ilustraciones de escenas en blanco y negro, y 1
lamina en blanco. Se administran solo 20 (19 ilustradas y la lámina en blanco), de acuerdo a la
edad y sexo de los examinados.
A partir de las respuestas, se interpretan las necesidades, deseos y conflictos del examinado,
proyectados en las narraciones que proporcionan. Se tienen en cuenta las normas perceptivas y
cliché. Existen adaptaciones destinadas a niños y a personas mayores.

53
El Rorscharch comprende 10 láminas compuestas por manchas de tinta simétrica, algunas en
blanco y negro, y otras policromáticas, sobre un fondo blanco. Estas laminas poseen una
morfología vaga por lo que resultan especialmente sugerentes. Se pregunta que se ve en las
manchas y cómo y dónde manifiesta lo observado. El análisis del test está basado en las
respuestas que da el individuo.
Se administra individualmente presentando las tarjetas en orden sucesivo y se le solicita al sujeto
que informe lo que ve en la mancha. El procedimiento más difundido y aceptado para su
evaluación es el propuesto por John Exner, denominado “Sistema Comprehensivo”, se califican
las respuestas se acuerdo a diferentes categorías.
Estos instrumentos solo constituyen ejemplos de aquellos destinados a examinar el desempeño
típico o habitual de dominio general.
También se cuenta con instrumentos de desempeño típico de dominio específico. Es el caso
de cuestionarios o inventarios, ligados a la tradición psicométrica, se encuentra por ejemplo el
Inventario de Estrategias Metacognitivas (2002).
En el caso de las técnicas proyectivas, encontramos un ejemplo en el Test de Relaciones
Objetales de Phillipson (2006). El TRO fue diseñado para analizar y valorar las actitudes hacia
las relaciones objetales, y según el autor, aislar las principales variables dinámicas en los
conflictos psicológicos. Se nutre de conceptos de Melanie Klein.
Tanto los cuestionarios como las técnicas proyectivas han sido sometidos a criticas diversas, no
siempre la validez y la confiabilidad resultan totalmente satisfactorias.
En el caso de las técnicas proyectivas se reprocha su falta de validez y confiabilidad. Los
procedimientos para calcularlas no son los mismos que en el caso de instrumentos proyectivos. Al
tratarse de la interpretación de las respuestas proporcionadas, de análisis de la recurrencia de
indicadores (aparición de indicadores semejantes en los diversos tipos de respuestas que elicitan)
resulta de importancia fundamental el marco teórico a partir del cual puede hacérselo y el dominio
experto del psicólogo.
Más allá de estas consideraciones, este tipo de instrumento es de uso común en la esfera
profesional. Su uso eficaz refiere no solo a sus bondades específicas, sino además a la experticia
del evaluador y a su actuación conforme los consensos deontológicos disciplinares.
Cuando se señala las limitaciones de los instrumentos utilizados, se pierde la perspectiva según
la cual la evaluación psicológica no es el resultado de la aplicación de un test. El uso adecuado
cobra sentido cuando están integradas dentro del complejo proceso de evaluación, nutrido a partir
de diversas fuentes de información.
EVALUACIÓN DE LAS ESTRATEGIAS METACOGNITIVAS
Hay un énfasis creciente en el rol de la conciencia metacognitiva en los procesos motivacionales
y cognitivos mientras se lee. Los investigadores acuerdan que la conciencia y monitoreo de los
propios procesos de comprensión son aspectos críticamente importantes de las habilidades de
lectura. Tales procesos de conciencia y monitoreo, a menudo aparecen como metacognición,
que puede ser pensada como el conocimiento cognitivo del lector acerca de los propios
mecanismos de autocontrol que ejercitan cuando monitorean y regulan la comprensión textual.

54
Riqueza de interrogar más allá del constructo, lo cual provee el fundamento para el desarrollo de
un instrumento válido y confiable que ayude a examinar la conciencia metacognitiva de los
lectores y a controlar el proceso estratégico involucrado mientras leen.
Se acuerda que la metacognición refiere al conocimiento acerca de los estados y habilidades
cognitivas que pueden ser compartidas entre individuos mientras al mismo tiempo expanden el
constructo para incluir características afectivas y motivacionales del pensamiento.
Flavell (1979) describe el proceso de monitoreo cognitivo como el que ocurre entre acciones e
interacciones de 4 tipos de fenómenos: conocimiento metacognitivo, experiencia metacognitiva,
objetivos (o tareas) y acciones (o estrategias).
Los investigadores han indagado el monitoreo de la comprensión lectora entre lectores hábiles y
no hábiles, reconociendo la importancia de la conciencia metacognitiva en la comprensión lectora
porque discrimina entre unos y otros. Los lectores hábiles muestran actividades deliberadas que
requieren planificación del pensamiento, estrategias flexibles, auto monitoreo periódico. Los
lectores principiantes o inhábiles no cuentan en su repertorio ni usan tales estrategias. Los
lectores hábiles comprenden adecuadamente. Los no hábiles están más limitados en su
conocimiento metacognitivo de la lectura, realizan un monitoreo relativamente escaso de su
memoria, comprensión y de otras actividades metacognitivas y tienden a focalizar la lectura como
un proceso de decodificación más que como un proceso de preparación del significado, parece
que no detectan aquello que no comprenden.
El rol central de la metacognición y monitoreo se refleja en el incremento gradual del interés en
investigar los procesos de monitoreo de la comprensión. Se sostiene que la metacognición puede
promover el aprendizaje académico y la motivación. El “incremento de conciencia” tiene dos
beneficios, transfiere la responsabilidad para monitorear el aprendizaje del profesor al alumno
mismo, y promueve autopercepciones, afectos y motivaciones positivas entre los estudiantes. La
metacognición proporciona un insight (comprensión) personal sobre el propio pensamiento y
promueve el aprendizaje independiente.
Los investigadores concuerdan que las estrategias de lectura pueden ser enseñadas a los
estudiantes que lo necesitan a través de técnicas cuidadosamente planificadas. Sin embargo, la
metacognición no debe ser visualizada como un objetivo final del aprendizaje. Sino, como una
oportunidad para proveer a los estudiantes con el conocimiento y la confianza en sí mismos para
dirigir su propio aprendizaje y enriquecerse para ser más inquisitivos e infatigables en sus
propósitos.
Las estrategias de lectura pueden y deben ser aprendidas hasta el punto de automatizarlas,
después de lo cual se convierten en habilidades y los aprendices pueden conocer no solo qué
estrategias utilizar sino también cuándo, dónde y cómo usarlas.
Los esfuerzos para desarrollar inventarios de conciencia metacognitivos han sido bien
intencionados, pero generalmente no satisfactorios desde la perspectiva de la medida. Los pocos
instrumentos disponibles han sido muy útiles para ayudar a determinar la conciencia
metacognitiva y el uso de estrategias de lectura entre los estudiantes de la escuela elemental. La
mayoría tiene el defecto de que su uso está limitado a los estudiantes de niveles medios o
superiores.

55
Las criticas tienen que ver sobre todo por las propiedades psicométricas, la validez y
confiabilidad, o con una caracterización incierta del constructo de metacognición, en particular y
sobre la lectura en general.
EVALUACÍON DE LAS ESTRATEGIAS METACOGNITIVAS
Koudier Mokhtari & Carla A. Reichard, Oklahoma State University
El Inventario de Conciencia Metacognitiva de Estrategias de Lectura (MARSI), fue diseñado para
evaluar la conciencia y percepción del uso de estrategias de lectura en alumnos de 6to a 12to
grado, mientras leen material de lectura académico.
El propósito principal fue contar con un instrumento que permitiera evaluar el grado en el cual los
estudiantes tienen o no conciencia de los varios procesos involucrados en la lectura y hacer
posible aprender acerca de los fines e intenciones que tienen cuando deben enfrentarse con
actividades académicas de lectura.
Muestra de tipificación. Muestra amplia de estudiantes (N:825) de 6to a 12to grado provenientes
de 10 establecimientos urbanos, suburbanos y rurales, ubicados en los estados del medio oeste.
De los legajos escolares se extrajo información de cada uno de los distritos, acerca de la
homogeneidad de la población de estudiantes en los aspectos lingüístico, cultural y
socioeconómico.
No se identificó a ningún estudiante con problemas de aprendizaje específicos o alguna condición
de discapacidad.
Los datos psicométricos han demostrado que el instrumento es confiable y valido como medida
para evaluar la conciencia metacognitiva de los estudiantes mientras leen con propósitos
académicos.
El Inventario se compone de 3 subescalas de estrategias:

- Estrategias Globales de Lectura: propósito de lectura, activación del conocimiento


previo, predicción del contenido del texto, confirmación de las predicciones, anticipación
del contenido.
- Estrategias de Resolución de Problemas: leer lenta y cuidadosamente, ajustar la
velocidad de lectura, poner atención a lo que se lee, hacer pausas para reflexionar sobre lo
que se lee, releer, visualizar información, leer el texto críticamente.
- Estrategias de Soporte: tomar notas mientras se lee, parafrasear una información del
texto, revisar la información previa, hacer preguntas, usar materiales de referencia como
ayuda, subrayar información del texto, discutir la lectura con otro, escribir resúmenes de lo
que se lee.
Estrategias Globales de Lectura: contiene 13 ítems y representa un conjunto de estrategias
orientadas hacia el análisis global del texto. Pueden ser enseñadas como estrategias
generalizadas e intenciones que ayudan a los propósitos de la lectura.
Estrategias de Resolución de Problemas: contiene 8 ítems que están orientados hacia las
estrategias para resolver problemas cuando el texto se torna difícil de leer. Proporcionan a los
planes de acción a seguir para transitar el texto de manera hábil y completa. Se focalizan en la
resolución de problemas o en la modificación de las estrategias utilizadas cuando aparece un

56
problema de comprensión en la información textual (ej.: chequear la propia comprensión frente a
información conflictiva o releer para comprender mejor).
Estrategias de Soporte: contiene 9 ítems que primariamente involucran el uso de materiales de
referencia externos, tomar notas y otras estrategias parciales que pueden describirse como de
soporte o apoyo. Proveen de mecanismos de soporte que ayudan a incrementar las respuestas
frente a la lectura (ej.: uso de materiales de referencia tales como diccionarios y otros tipos de
sistemas de soporte).
Administración, Puntuación e Interpretación
El MARSI puede ser administrado individual o grupalmente a estudiantes adolescentes y adultos
con un nivel escolar equivalente a 5to grado o superior a través de la escolaridad secundaria. La
administración promedio demanda entre 10 y 12 minutos. Se evalúa con una Escala Likert de 5
puntos.
Es importante recordar a los estudiantes que las respuestas deben referirse a las actividades de
lectura relacionadas con material académico.
Puntuación:
a. Transferir los puntajes obtenidos en cada una de las oraciones que figuran en el protocolo
a la parte de resumen de los puntajes.
b. Sumar los puntajes parciales en la columna correspondiente para obtener el puntaje parcial
de cada estrategia.
c. Dividir el puntaje por el número de ítems de la estrategia considerada para encontrar el
promedio correspondiente a esa estrategia.
d. Sumar los puntajes parciales de cada una de las estrategias y encontrar el puntaje total y
el puntaje promedio total
e. Esos Puntajes se interpretan de acuerdo al siguiente criterio:
Altos: promedio de 3,5 o mayor
Medio: promedio de 2,5 a 3,4
Bajo: 2,4 o menor
Puntaje bajo: algunas estrategias pueden ser aprendidas y considerar su utilización cuando se
lee. Recordar que el uso de estrategias depende en gran medida, de la edad de los estudiantes,
de su habilidad lectora, de las dificultades del texto, del tipo de material leído y de otros factores
relacionados.
Interpretación de los Puntajes

 El puntaje general indica la frecuencia con la que se utilizan estrategias de lectura cuando
se leen materiales académicos
 El promedio de cada escala del inventario muestra qué grupo de estrategias (globales, de
resolución de problemas o de ayuda o soporte) se utilizan mayoritariamente cuando lee.
 Con esta información se puede reconocer si los puntajes son muy altos o muy bajos en
algunas de las estrategias seleccionadas.
 Sin embargo, el menor uso posible de estrategias depende de la habilidad de lectura, del
tipo de material que se lee y de los propósitos de la lectura.
 Un puntaje bajo en alguna de las subescalas o partes del inventario inda que puede haber
algunas estrategias que se puede aprender y considerar su aplicación cuando lee.
57
Unidad 8. Otras unidades de análisis La evaluación de los contextos y las interacciones.
Referencias a la evaluación de las intervenciones. Instrumentos que ilustran la evaluación.

EVALUACIÓN DEL CONTEXTO ALFABETIZADOR


El Contexto Alfabetizador cobra relevancia por su incidencia en los conocimientos y habilidades
infantiles previos a la alfabetización formal. El C.A es el conjunto de experiencias previas a la
iniciación escolar, que favorecen el desarrollo de conocimientos y habilidades relativos al lenguaje
escrito.
Las actividades limitadas de alfabetización en el hogar pueden tener efectos significativos en el
desarrollo del lenguaje y posteriormente en el rendimiento en lectura de los niños que provienen
de familias de la pobreza.
Contexto alfabetizador activo y pasivo
El Contexto Alfabetizador pasivo comprende los recursos del hogar y las actividades que incluyen
el uso del lenguaje escrito por parte de los adultos del entorno. Ej. El nivel educacional de padres,
disponibilidad de material relacionado con la alfabetización (libros, papeles, computadoras) y los
hábitos lectores de los padres). De esto, los niños observarían a sus progenitores en actividades
cotidianas de lectura y escritura. El papel que juega el contexto es el rol de aprendizaje indirecto a
través de modelos.
El Contexto Alfabetizador activo, comprende los esfuerzos parentales en que el niño realice
actividades diseñadas para promover la alfabetización (lecturas compartidas, enseñanza de
letras, palabras) un niño es capaz de alcanzar un nivel de desarrollo más alto bajo la guía de un
adulto.
Los instrumentos de evaluación
Se diseñó un instrumento específico para la evaluación del contexto alfabetizador, el cual se trata
de una entrevista semiestructurada y precodificada que permite indagar las siguientes
dimensiones: Características de los hogares, de los padres, antecedentes de dificultades
escolares de los hijos, características del niño según el informante.
La administración está dirigida a la madre o cuidador ppal del niño. En c/u de sus partes se
aclaran las consignas.
Registro y valoración
Las rtas están precodificadas en distintas opciones, frente a las que el examinado debe responder
cual es la que se acerca más a su opinión, práctica o situación.
En la entrevista aparecen a la derecha una serie de celdas (cuadrados) que permiten al
examinador trasladar para identificar rápidamente la opción elegida por el sujeto, a los fines de su
archivo en una base de datos, con el propósito de realizar análisis ulteriores, por ej. con paquetes
estadísticos del tipo de SPSS.
Los estudios realizados hasta la fecha, extrajeron características significativas del conjunto de
variables indagadas, las cuales se denominaron como dimensiones relevantes del contexto
alfabetizador: Nivel educacional de los padres, hábitos lectores de los padres, disponibilidad de

58
material que favorece la alfabetización, practicas alfabetizadores, información de los padres sobre
motivación y producciones infantiles en tareas de dibujo, lectura y escritura.

EVALUACION DE LAS INTERACCIONES Y LAS INTERVENSIONES. La lectura interactiva de


cuentos. Su evaluación
Una de las unidades de análisis que ha cobrado relevancia en el campo de la evaluación
psicológica corresponde a las interacciones. Entre ellas, la importancia de la lectura interactiva
durante los primeros años respecto de sus beneficios en la escolaridad posterior.
La lectura interactiva puede ser definida como la lectura en voz alta que incluye conversaciones,
que implican dar lugar a diferentes turnos en el dialogo y que involucran activamente a los niños
en ese proceso.
Comprende factores instrumentales que promueven habilidades de lectura y factores
motivacionales necesarios para convertirse en un lector efectivo.
La lectura interactiva ocurre en una variedad de contextos. Puede ser entre padres/cuidadores y
niños, entre abuelos/abuelas y nietos, entre maestros y alumnos preescolares.
El Inventario de Lectura Interactiva – ACIRI
El Inventario de lectura interactiva adulto-niño (DeBruin-Parecki, 2007) a diferencia de los
anteriores permite simultáneamente la observación de la conducta del adulto y del niño durante la
interacción. Sus objetivos fundamentales son proporcionar un medio de evaluación de la diada
interactiva y actuar como pre y post examen en la evaluación de programas.
Esto permite capacitar a los padres para el desarrollo de sus hijos pequeños en las habilidades de
alfabetización y entrenar a los maestros y tutores.
El Inventario comprende 3 categorías relacionadas con la interacción durante la lectura:
o Categoría I. Dirigir la atención hacía el texto. Representa la investigación sobre las
áreas de apego, habilidades de manipulación de libros y motivación e interés.
o Categoría II. Promover la lectura interactiva y apoya la comprensión. Refiera al campo
de la interrogación y la comprensión. La interacción maximiza la experiencia al promover y
sostener la comprensión de aquello que se lee.
o Categoría III. Utilizar estrategias de alfabetización. Alude a la investigación sobre la
identificación y la comprensión. Refiere a la predicción, re narración y elaboración.
Materiales, condiciones de evaluación y actividades a realizar
Libros de lectura seleccionados de acuerdo a la edad de los niños y según las características de
los padres/adultos (nivel de alfabetización). El ambiente debe ser adecuado para la observación,
la cual se registra en un Protocolo, donde se relatan las conductas del adulto y el niño.
Administración. Demanda entre 15 y 20 minutos.
Registro y observación de las conductas. Se registra la conducta del adulto y del niño, se
señala la frecuencia de aparición de esas conductas.
Puntuación: es numérica, de una escala de 0-3 puntos:
- 0: ausencia de la conducta observada

59
- 1: poco frecuente
- 2: frecuencia intermedia
- 3: muy frecuente
Evaluación: se obtiene un Puntaje promedio para cada categoría y una Puntuación Promedio
total
- Suma de los puntajes de los 4 ítems y se divide esa suma x 4.
- Suma de las 3 puntuaciones medias y se las divide x 3.
Interpretación: Las puntuaciones indican ausencia o escasa frecuencia de las conductas
observables (0-1) se utilizan para identificar las que necesitan estrategias de intervención
destinadas a mejorar el tipo de interacción que el adulto mantiene con el niño.
Las puntuaciones pre y post test se pueden comparar para verificar procesos.
Ventajas: está destinado a observar de manera conjunta a padres e hijos o adultos y niños;
permite conocer qué es lo que ocurre durante la lectura entre los dos participantes, su validez y
confiabilidad están probados.
Conclusiones. La lectura interactiva promueve el desarrollo de los conocimientos y habilidades
necesarios para la futura escolarización, debe ser un objeto de estudio cuidadoso, a través de
instrumentos que lo posibiliten, con el propósito de capacitar a los padres para que desarrollen
estrategias que resultan de mayor interés.
Esto es especialmente sensible en el caso de poblaciones vulnerables, en las que se verifican
mayores problemas en el proceso de alfabetización.

TERCERA PARTE. Objetivos y resultados de la Evaluación Psicológica. Consideraciones


deontológicas.

Unidad 9. La expresión de los resultados.

EL INFORME PSICOLÓGICO. Consideraciones sobre el modelo de las comunicaciones


científicas
La Evaluación Psicológica constituye la intervención de un profesional psicólogo tendiente a
develar las problemáticas o dimensiones psicológicas implicadas en el motivo por el cual se
acude o se es traído a la consulta especializada o se solicita el esclarecimiento experto en un
tema determinado.

El Informe Psicológico corresponde al aspecto comunicable de la Evaluación Psicológica


realizada, cuyos objetivos son los de comunicar información relevante, con finalidades variadas,
de acuerdo a las siguientes consideraciones.
o Las razones que llevaron a la Evaluación Psicológica (por qué se evalúa).
o Los propósitos de la Evaluación (para qué se evalúa).
o El destinario a quien va dirigido.

60
Es un texto cuya función primordialmente es informativa, su desarrollo comprende las 3 partes
constitutivas de este tipo de textos: Introducción, Desarrollo y Conclusión. Su redacción se
caracteriza por el uso del modo indicativo, con preferencia de la enunciación en 3ra persona.
Su planificación puede realizarse de manera similar a una comunicación científica, pues se
trata de comunicar la indagación sobre un caso particular (sobre el que se realiza un diagnostico
psicológico) o acerca de los resultados obtenidos sobre grupos de sujetos (evaluación grupal de
características particulares) o sobre otras unidades de análisis.
Su redacción debe tomar en consideración los elementos que aseguren su comprensión, razón
por la cual se recomienda tener en cuenta los siguientes aspectos, para proceder a una
jerarquización adecuada de la distribución de la información a proporcionar, asegurando su
“comprensibilidad” de parte del destinario. Debe evitarse la terminología excesivamente técnica o
en su defecto acompañarla de las aclaraciones necesarias.
La organización del examen y del informe pude constar de los siguientes rubros:
 Título: Informe Psicológico
 Profesional: Datos del Evaluador
 Datos de Identificación del sujeto o grupo examinado
 Motivo de consulta de la evaluación: se explicitan las razones que llevaron a la
Evaluación Psicológica, ej. Características de la consulta, demanda, derivación o
investigación. Se detalla el motivo por el cual el sujeto concurre o es enviado a la consulta
psicológica.
Cuando se trata del estudio de grupos, ej. en el campo educacional, deben explicitarse las
razones que lo impulsaron.
Este apartado corresponde con las razones (por qué) y propósitos de la evaluación
(para qué) se va a evaluar, lo que lleva a formular los primeros interrogantes acerca de
qué se va a examinar.

 Historia de vida detallar los aspectos significativos de la historia de vida de un sujeto que
condujeron a la situación actual, que motiva la consulta o el estudio grupal, para extraer
indicadores significativos que pueden articularse con aquellos que se obtengan en la
evaluación psicológica.
 Hipótesis diagnostica y objetivos. A partir de los interrogantes que se suscitan del
motivo de consulta y de la historia de vida, se permite identificar, al menos
provisoriamente, el problema que se intenta clarificar.
 Metodología de la evaluación. Cómo se realizará el examen psicológico y cuáles será los
instrumentos a seleccionar y los procedimientos a seguir, a partir de las hipótesis
diagnosticas planteadas o de los objetivos perseguidos.
 Resultados. Cuáles son los resultados obtenidos y cuál es su significación. Se deben
describir, analizar e interpretar los datos proporcionados por todas las fuentes de
información de las que se dispone, ej. historia de vida, historia escolar, laboral, etc., y de
los indicadores de las técnicas e instrumentos de exploración psicológica utilizadas.
 Conclusiones y recomendaciones. Los resultados obtenidos deben integrarse para
precisar las características que presenta él o los sujetos examinados. Se arriba a
conclusiones y a las recomendaciones que emanan de ellas. Se toman decisiones
respecto de los resultados.

61
CONSIDERACIONES SOBRE LAS COMUNICACIONES CIENTÍFICAS
Una Comunicación Científica en sentido amplio corresponde a todo tipo de informe que un
investigador o grupo de investigadores produce de una manera pública acerca de un determinado
problema que ha sido o está siendo investigado. El contenido puede ser muy variado.
En un sentido estricto se considera a todo informe que incluya novedades, es decir, nuevos
conocimientos empíricos, o teóricos, dignos de ser comunicados de manera pública, lo cual
presupone un detallado análisis del estado del arte o de la cuestión, todo conocimiento existente
sobre un determinado dominio.
En el caso del Informe Psicológico, las novedades que se incluyen conciernen a los interrogantes
que han sido respondidos o a los que se ha intentado responder en la evaluación realizada, así
como a las recomendaciones a las que dan lugar.
Otro presupuesto de las comunicaciones científicas radica en la existencia de comunidades de
pares a las que se está destinada, las cuales comparten matrices disciplinares.
Cuando se trata de Informe Psicológico, más allá de ciertas características comunes, aparecen
aspectos peculiares según el ámbito de aplicación de la Psicología. La evaluación de su calidad
es asimismo diferente por cuanto corresponde a la eficacia de las respuestas que proporciona.
TEXTOS ACADÉMICOS
Las comunicaciones científicas forman parte de los denominados textos académicos, que
constituyen una clase particular de textos, que corresponden a la comunidad de discurso
científico-académico, que se organizan conforme determinados consensos y se inscriben en un
estilo particular. Dicho de otro modo, están sujetos a determinados requisitos, que los diferencian
de otros escritos.

Pautas mínimas para el uso de los test

1. Evitar errores al puntuar y registrar los resultados


2. Abstenerse de etiquetar a las personas con términos despectivos basándose en
puntaciones de los tests.
3. Mantener la seguridad e integridad del material
4. Asegurarse que todos los evaluados comprenden las instrucciones
5. Aplicar los tests en condiciones que permitan un rendimiento óptimo, a los evaluados
6. Abstenerse de entrenar a las personas en los ítems del test
7. Estar dispuesto a interpretar las puntuaciones y dar una explicación a los evaluados en
sesiones diseñadas para ello
8. No hacer fotocopia del material de evaluación
9. Abstenerse de utilizar hojas de respuesta caseras que pueden no ajustarse con precisión
al material para ello editado.
10. Establecer una buena relación con los evaluados
11. Abstenerse de responder a preguntas de los evaluados con mayor detalle que lo permitido
por el manual de test
12. No asumir que una norma para un trabajo vale de igual manera, para otro diferente, y no
sumir que las normas válidas para un grupo son automáticamente aplicables a otro distinto

CODIGO DE ETICA DEL PSICODIAGNOSTICADOR

62
1. Evaluación, diagnostico e intervención en un contexto profesional.
2. Competencia y uso apropiado de evaluaciones e intervenciones.
3. Secreto profesional: guardar en secreto info confiada.
4. Construcción de test: procedimiento científico adecuado y conocimientos profesionales
actualizados.
5. Uso de la evaluación en general y con poblaciones especiales: conocer la fiabilidad y validez
del instrumento, su uso y aplicación adecuada.
6. Interpretación de los resultados de la evaluación: abstenerse de emitir juicios de valor.
7. Personas no calificadas: Personas no habilitadas por su título universitario no aplicaran
técnicas de evaluación psicológica.
8. Vigencia de los test: baremos actualizados en los últimos 10 años y adaptados a la región.
9. Servicios de puntuación e interpretación: validez del programa y de los procedimientos.
10. Mantenimiento de la seguridad de los test: Deben quedar bajo la custodia del psicólogo.
11. Comunicación de los resultados de la evaluación: Se deben comunicar utilizando lenguaje
claro.
12. Difusión: No difundir falsos beneficios de un instrumento, deberá ajustarse a los alcances
científicamente probados.

63

You might also like