Lectura 1

EL PROCESO DE EVALUACIÓN
Irving B. Weiner1
La psicología de la evaluación es un campo en la ciencia del comportamiento que se

relaciona con métodos para identificar similitudes y diferencias entre personas en
sus características y capacidades personales. Como tal, la evaluación psicológica
comprende una variedad de procedimientos que son empleados de diversas
maneras para alcanzar numerosos propósitos. Algunas veces la evaluación ha sido
comparada con las pruebas, pero el proceso de evaluación va más allá de
meramente aplicar pruebas. La evaluación psicológica implica el integrar
información obtenida no solo de protocolos de pruebas, sino también de respuestas
de entrevistas, observaciones de comportamientos, reportes colaterales y
documentos históricos. Los Estándares para Pruebas Educacionales y Psicológicas
(Asociación Americana de Investigación Educacional (AERA), Asociación Americana
de Psicología, y el Consejo Nacional de Medidas en Educación, 1999) especifican en
relación con esto que:
El uso de tests provee un método de recolectar información dentro de un marco

mayor de trabajo de una evaluación psicológica de un individuo. Una evaluación
psicológica es un examen comprensivo que se realiza para responder preguntas
específicas sobre el funcionamiento psicológico del cliente durante un intervalo de
tiempo particular o para predecir el funcionamiento psicológico de un cliente en el
futuro. (p. 119)
Las diversas maneras en que los procedimientos de evaluación son empleados

incluyen muchos enfoques alternativos para obtener y combinar información de
diferentes fuentes, y los numerosos propósitos a los que sirve esa evaluación
surgen en respuesta a un amplio rango de preguntas de referencia basadas en
campos relacionados tales como la psicología clínica, educacional, de la salud,
forense, e industrial/organizacional. Capítulos subsiguientes en este volumen
elaboran la diversidad de los procedimientos de evaluación, la naturaleza de las
preguntas de la evaluación que surgen en varias locaciones, y los tipos de métodos
de evaluación comúnmente empleados para realizar estas preguntas.
Este capítulo introductorio establece el escenario para lo que sigue, al conceptuar la

evaluación como un proceso de tres etapas que comprende una fase inicial de
absorción de información, una fase siguiente de evaluación de información, y una
fase final de producción de información. La absorción de información implica el
recolectar datos de evaluación de tipos apropiados y en cantidades suficientes par
hacer preguntas de referencia de manera útil y con sentido. La evaluación de
información consiste en interpretar los datos de evaluación de manera que provea
descripciones exactas de las características psicológicas y tendencias de
comportamiento de los entrevistados. La producción de información llama a utilizar
descripciones de los entrevistados para formular conclusiones y recomendaciones
que ayuden a responder las preguntas de referencia. Cada una de estas fases del
proceso de evaluación requiere evaluadores para realizar tareas distintivas, y cada
uno implica escogencias y decisiones que tocan asuntos críticos al conducir las
evaluaciones psicológicas.
1
Traducción realizada y cedida por los estudiantes de la Maestría en Psicología Forense de la UNIBE
para el curso de Evaluación Psicológica de la Personalidad, impartido por M.Sc. Carlos Saborío Valverde
en el año 2005.
RECOLECTANDO INFORMACIÓN DE EVALUACIÓN
El proceso de recolectar información de evaluación comienza con una formulación

de propósitos que la evaluación pretende servir. Una claro sentido de por qué una
evaluación está siendo conducida ayuda a los examinadores a seleccionar los tests
y otras fuentes de información que proveerán una base adecuada para llegar a
conclusiones y recomendaciones útiles. Adicionalmente, útil para planear el proceso
de recolección de datos, es la atención a varios asuntos como el examinador,
examinado y manejo de datos que influencian la naturaleza y utilidad de
cualesquiera descubrimientos que son obtenidos.
Formulando Objetivos
Las evaluaciones psicológicas son movidas por referencias que plantean preguntas
sobre aspectos del funcionamiento psicológico de una persona o probable
comportamiento futuro. Cuando es establecido claramente y se considera
psicológicamente relevante, las preguntas de referencia guían a los psicólogos para
determinar qué tipos de datos de evaluación recolectar, qué consideraciones tener
al examinar esos datos, y qué implicaciones de sus descubrimientos enfatizar en
sus reportes. Si las preguntas de referencias están faltas de claridad o relevancia
psicológica, alguna reformulación es necesaria para dar dirección al proceso de
evaluación. Por ejemplo, una referencia en una ubicación clínica que pregunta
vagamente por evaluación de personalidad o diagnóstico diferencial necesita ser
especificada en consulta con la persona de referencia para identificar por qué una
evaluación de personalidad se está solicitando o qué posibilidades de diagnóstico
están en cuestión. La evaluación en ausencia de una pregunta de referencia
específica puede resultar en un ejercicio estéril en el cual ni el proceso de
recolección de datos ni las inferencias del psicólogo pueden estar enfocados de
manera significativa.
Aún cuando adecuadamente especificado, las preguntas de referencia no son

siempre de naturaleza psicológica. Los evaluadores que hacen trabajo forense son
frecuentemente solicitados a evaluar si los acusados criminales estaban dementes
al momento de su supuesta ofensa. La cordura es un término legal, sin embargo,
no uno psicológico. No hay métodos de evaluación diseñados para identificar
cordura, ni hay estudios de investigación en los cuales estar demente ha sido usado
como una variable independiente. En instancias de este tipo, para ayudar a los
evaluadores a planear sus procedimientos y cuadrar sus reportes, la referencia
debe ser traducida a términos psicológicos, como definir locura como la inhabilidad
para distinguir realidad de fantasía.
Como un reto mayor al formular objetivos de evaluación, a preguntas de referencia

específicas y psicológicamente planteadas les puede faltar todavía claridad como
una consecuencia de referirse a patrones de comportamiento complejos y
multideterminados. Al emplear evaluaciones, por ejemplo, una persona de
referencia puede querer saber cuáles tres individuos lo hará mejor en una posición
de liderazgo o responsabilidad ejecutiva. Para referirse a este tipo de preguntas
efectivamente, los evaluadores deben primero poder identificar las características
psicológicas que probablemente harán la diferencia en las circunstancias
particulares, como procediendo en este ejemplo, en la creencia de que ser
enérgico, decisivo, asertivo, con confianza en sí mismo, y razonablemente imbatible
contribuyen a mostrar un liderazgo efectivo y responsable. Entonces el proceso de
recolección de datos puede ser planeado para medir estas características, y el
eventual reporte puede estar enfocado en usarlas como una base para recomendar
una decisión de contratación.
Seleccionando Tests
Las múltiples fuentes de información de evaluación previamente notadas incluyen
los resultados de pruebas psicológicas formales con instrumentos estandarizados;
respuestas a preguntas hechas en entrevistas estructuradas y no estructuradas,
observaciones de comportamientos en varios tipos de situaciones hipotéticas y
locaciones naturales; reportes de parientes, amigos, empleadores y otras personas
colaterales relacionadas con la historia de vida previa del individuo y características
y tendencias de comportamiento actuales; y documentos como registros médicos,
registros escolares y reportes escritos de evaluaciones anteriores. Las evaluaciones
individuales varían considerablemente en la disponibilidad y utilidad de estas
diversas fuentes de información. Las evaluaciones pueden a veces estar basadas
totalmente en revisiones de registros y reportes colaterales, por que el examinado
no está dispuesto a verse directamente con el examinador o si por alguna razón no
se pueden ver. Algunos examinados están muy dispuestas a ser entrevistadas pero
no quieren que se les administren pruebas; a otras les resulta difícil hablar de sí
mismas pero responden bien a las pruebas; y aún en otros casos, en los cuales
ambos entrevista y prueba son amplios, puede haber escasez de otras fuentes de
información sobre las cuales trabajar.
Hay pocas maneras de saber con anterioridad en hecho de cuales fuentes de

información probarán ser más críticas o valiosas en un proceso de evaluación. Qué
dicen informantes colaterales sobre una persona en una instancia particular, puede
ser más revelador y confiable que lo que la persona diga de sí misma, y en algunas
instancias documentos históricos prueban ser más informativos y confiables que los
reportes. Las observaciones de comportamiento y datos de entrevista pueden
algunas veces contribuir más a una adecuada evaluación que las pruebas
estandarizadas, e incluso pueden hacer a las pruebas superfluas; mientras que en
otras instancias las pruebas psicológicas formales pueden revelar información
diagnóstica vital que de otra manera no podría ser descubierta.
El hecho de que la evaluación psicológica puede proceder efectivamente sin

pruebas psicológicas ayuda a distinguir entre estas dos actividades. Los términos
evaluación psicológica y pruebas psicológicas son a veces usadas como sinónimos,
como se notó antes, pero las pruebas psicológicas son solo una de muchas fuentes
de información que pueden ser utilizadas para conducir una evaluación psicológica.
Mientras que prueba se refiere a la administración de instrumentos de medida
estandarizados, evaluación implica múltiples procedimientos de recolección de
datos que llevan a la integración de información de diversas fuentes. De este modo
los procedimientos de recolección de datos empleados en las pruebas contribuyen
solo una porción de la información que es típicamente utilizada en el complejo
proceso de toma de decisiones que constituye una evaluación. Esta distinción entre
evaluación y prueba ha sido elaborada previamente por Fernández-Ballesteros
(1997), Maloney y Ward (1976, capítulo 3), y Matarazzo (1990) entre otros.
No obstante, la prueba psicológica se distingue entre los procedimientos de

recolección de datos empleados en la evaluación psicológica como uno de los más
altamente especializados, diversos y en necesidad de una cuidadosa regulación. La
prueba psicológica trae numerosos asuntos al proceso de evaluación, comenzando
por la selección de una batería de pruebas apropiada de entre un extenso grupo de
instrumentos de medida disponibles (ver Conoley & Impara, 1995; y Fischer y
Corcoran, 1994; también capítulos 18-24 del presente volumen). Las
consideraciones principales que deben determinar la composición de una batería de
pruebas es la adecuación psicométrica de las medidas que son consideradas; la
relevancia de estas medidas a las preguntas de referencia que se están haciendo;
La probabilidad de que esas medidas contribuirán a la validez incremental del
proceso de toma de decisiones; y las funciones aditivas, confirmatorias y
complementarias que las medidas individuales tengan cuando se usen
conjuntamente.
Adecuación Psicométrica
Tal y como es planteado por Anastasi y Urbina (1997), en los Estándares para
Pruebas Educacionales y Psicológicas (AERA, y otros, 1999, capítulos 1, 2 & 5), y en
el capítulo por Wasserman y Bracken en este volumen, la adecuación psicométrica
de un instrumento de evaluación consiste en el grado hasta el cual implica que
materiales de prueba estandarizados y procedimientos de administración, pueden
ser codificados con razonablemente buen acuerdo entre calificadores, demuestra
aceptable confiabilidad, ha generado datos normativos relevantes, y muestra
corolarios válidos que sirven para los propósitos que fue creado. Los psicólogos de
evaluación pueden a veces escoger usar pruebas con propiedades psicométricas
inciertas, quizás para propósitos exploratorios o para comparación con una
examinación previa que usó esas pruebas. Generalmente hablando, sin embargo,
las pruebas formales como parte de una evaluación psicológica deberían estar
limitadas a instrumentos estandarizados, confiables y válidos para los cuales hay
datos normativos adecuados.
Relevancia
Las pruebas seleccionadas para inclusión en una batería de evaluación deberían
proveer información relevante para responder a las preguntas que han sido hechas
sobre el examinado. Preguntas que se relacionan con funciones de personalidad
(Qué tipo de enfoque en psicoterapia es probable de ayudar a esta persona?) llama
a las pruebas de personalidad. Las preguntas que se relacionan con asuntos
educacionales (Tiene este estudiante una discapacidad para aprender?) llaman a
medidas de habilidades intelectuales y aptitudes académicas y logros. Preguntas
que se relacionan con funciones neuropsicológicas (Hay indicaciones de pérdida de
memoria?) llaman a medidas de funcionamiento cognitivo, con énfasis especial en
medidas de capacidades para aprendizaje y memoria.
Estos ejemplos de relevancia pueden parecer demasiado obvios para ser

mencionados. Sin embargo, ellos reflejan un importante, aunque algunas veces
descuidado, principio guía de que la selección de pruebas debe ser justificable para
cada medida incluida en una batería de evaluación. Insuficiente atención para
justificar el uso de pruebas particulares en instancias específicas puede resultar en
prácticas de evaluación no recomendadas: (a) conducir examinaciones con una
batería de pruebas fija y sin variaciones sin importar cuáles preguntas están siendo
hechas en el caso individual, y (b) usar instrumentos favoritos en cada oportunidad
aún cuando puedan no servir a ningún propósito central o único en una evaluación
particular. La administración de tests mínimamente útiles que tienen poca
relevancia con la pregunta de referencia es un procedimiento perdido que puede
resultar en la crítica segura de psicólogos de evaluación y el proceso de evaluación.
De este modo, el hecho de cobrar por procedimientos innecesarios puede ser
cuestionado por personas que reciban o paguen por tales servicios, y la
competencia de evaluadores que administran pruebas que hacen pocas
contribuciones a responder las preguntas hechas, puede ser criticado en foros
públicos tales como salas de juicio (ver Weiner, 2002).
Validez Incremental
La validez incremental en la evaluación psicológica se refiere a la extensión hasta la
cual nueva información incrementa la exactitud de una clasificación o predicción
sobre y más allá de la exactitud obtenida por información ya disponible. Los
evaluadores ponen adecuada atención a la validez incremental al recolectar la
cantidad y tipos de información que necesitan para contestar la pregunta de
referencia, pero no más que eso. En teoría, entonces, la familiaridad con la validez
incremental de varias medidas cuando es usada para ciertos propósitos, combinada
con la selección de pruebas basada en esta información, minimiza la redundancia
de la evaluación psicológica y satisface los requerimientos profesionales y científicos
por una justificable selección de pruebas.
En la práctica, sin embargo, una estricta adherencia a las guías de validez

incremental con frecuencia prueba ser difícil e incluso poco ventajoso de
implementar. Como ya se notó, es difícil anticipar cuales fuentes de información
probarán ser más útiles. Similarmente, con respecto a cuales instrumentos incluir
en una batería de pruebas, no hay manera de saber si las pruebas administradas
han producido datos suficientes, y cuáles pruebas han contribuido más a entender
al examinado, hasta después de que los datos han sido recolectados y analizados.
En la mayoría de prácticas, es razonable conducir una entrevista y revisión de
registros previos como base para decidir si una prueba formal ayudará a contestar
la pregunta de referencia – esto es, si mostrará validez incremental suficiente como
para garantizar el costo en tiempo y dinero. De este modo, el revisar un grupo de
datos de prueba puede proveer la base para determinar qué tipo de pruebas
adicionales pueden valer la pena. Sin embargo, es raramente apropiado administrar
solo una prueba, y programar una sesión posterior de pruebas para cada
administración de prueba adicional. Por esta razón, una evaluación psicológica
responsable usualmente consiste en una o dos sesiones de pruebas que
comprenden una batería de pruebas seleccionadas para servir a funciones aditivas,
confirmatorias y complementarias específicas.
Funciones de Pruebas Aditivas, Confirmatorias y Complementarias
Algunas preguntas de referencia requieren la selección de múltiples pruebas para

identificar aspectos relativamente distintos e independientes del funcionamiento
psicológico de una persona. Por ejemplo, estudiantes que reciben calificaciones
bajas pueden ser referidos para una evaluación que ayude a determinar si su pobre
desempeño académico se debe primariamente a inteligencia limitada o a
características de personalidad que están nutriendo actitudes negativas hacia la
escuela. Una batería apropiada de pruebas en tal caso incluiría alguna medida de
inteligencia y alguna medida de funcionamiento de personalidad. Estas dos medidas
entonces serían usadas de una manera aditiva para proveer piezas de información
separada, que contribuirían a contestar la pregunta de referencia. Como lo ilustra
este ejemplo, el uso aditivo de pruebas sirve generalmente a ampliar la
comprensión del examinado.
Otras situaciones de evaluación pueden crear la necesidad de evidencia

confirmatoria para apoyar las conclusiones basadas en los descubrimientos de las
pruebas, en cuyo caso dos o más medidas de la misma función psicológica pueden
tener un lugar en la batería de pruebas. Los evaluadores que conducen una
examinación neuropsicológica para encontrar un posible principio de a enfermedad
de Alzheimer, por ejemplo, ordinariamente administran varias pruebas de memoria.
En caso de que cada una de ellas identifique una discapacidad de memoria
consistente con el Alzheimer, entonces desde un punto de vista técnico, solo una de
ellas habría sido necesaria y las otras no habrían mostrado validez incremental. En
términos prácticos, sin embargo, las medidas múltiples de memoria tomadas juntas
proveen evidencia confirmatoria de pérdida de memoria. Tal uso confirmatorio de
las pruebas refuerza la comprensión y ayuda a los evaluadores a presentar
conclusiones con seguridad.
La función confirmatoria de una batería multi-pruebas es especialmente útil cuando

las pruebas de la misma función psicológica se miden de diferentes maneras. Las
ventajas de una evaluación de variables multimétodo ha sido largamente
reconocida en psicología, comenzando con el trabajo de Campbell y Fiske (1959) y
continuó con reportes contemporáneos del Grupo de Trabajo de Evaluación
Psicológica de la Asociación Americana de Psicología (APA’s), que enfatiza la validez
mejorada que resulta cuando los fenómenos son medidos desde una variedad de
perspectivas (Kubiszyn y otros, 2000; Meyer y otros, 2001):
La metodología óptima para ampliar la validez de constructo de la investigación

nomotética consiste en combinar datos de múltiples métodos y múltiples
definiciones operacionales ... Igual de efectiva la investigación nomotética reconoce
cómo la validez es maximizada cuando variables son medidas por múltiples
métodos, particularmente cuando los métodos producen discrepancias significativas
... la calidad de la evaluación ideográfica puede ser ampliada por los clínicos que
integran los datos desde múltiples métodos de evaluación. (Meyer y otros, p. 150)
Tal prueba confirmatoria es ejemplificada en aplicaciones del Inventario de

Personalidad Multifásica Minnesota (MMPI, MMPI-2) y el Test de Manchas de Tinta
de Rorschach (RIM), que son dos de los instrumentos de evaluación de
personalidad más ampliamente investigados y frecuentemente usados (Ackerman y
Ackerman, 1997; Butcher y Rouse, 1996; Camara, Nathan y Puente, 200; Watkins,
Campbell, Nieberding y Hallmark, 1995). Como se discutió luego en este capítulo y
en los capítulos por Viglione y Rivera y por Ben-Porath en este volumen, el MMPI-2
es un inventario de auto-reporte estructurado, mientras que el RIM es una medida
de procesos preceptúales-cognitivos y de asociación relativamente poco
estructurada (ver también Exner, 2003; Graham, 200; Green, 2000; Weiner,
1998). Debido a diferencias en su formato, el MMPI-2 y el RIM miden características
normales y anormales de diferentes maneras y a diferentes niveles de la habilidad
de una persona y su complacencia en reconocerlas y reportarlas directamente. En
caso de que una persona muestre algún tipo de funcionamiento similar en el MMPI
y el RIM, este descubrimiento confirmatorio se hace más poderoso y convincente
que tener esa información de uno de los instrumentos y de otro no, aún cuando
técnicamente en esta instancia no se deriva validez incremental del segundo
instrumento.
Evidencia confirmatoria de este tipo con frecuencia prueba ser útil en la práctica
profesional, especialmente en el trabajo forense. Como descrito por Blau (1998),
Heilbrun (2001), Shapiro (1991) y otros, múltiples fuentes de información
apuntando en la misma dirección apoyan el testimonio en la corte, mientras que
conclusiones basadas en solo una medida de alguna característica puede resultar en
una crítica al asesor por fallar en conducir una examinación completa.
En caso de que múltiples medidas de las mismas características psicológicas
resulten en resultados diferentes más que confirmatorios, estos resultados pueden
usualmente servir como valiosos funciones complementarias en el proceso
interpretativo. Algunas veces, una aparente falta de acuerdo entre dos medidas de
la misma característica ha sido tomado para indicar que una de las medidas está
falta de validez convergente. Esta visión negativa de los descubrimientos de
pruebas divergentes falla en tomar adecuado reconocimiento de la complejidad de
la información provista por una evaluación multimétodo y puede resultar en
conclusiones erróneas. Para continuar con el ejemplo de juntar el MMPI-2 y el RIM,
suponga que las respuestas de una persona muestra una elevación en los índices
de depresión en una de estas medidas pero no en la otra. Considerando como los
índices en ambas medidas han demostrado alguna validez en detectar rasgos de
depresión, la pregunta clave a hacer no es cuál medida está mala en esta instancia,
sino más bien por qué las medidas son divergentes.
Quizás, como una posible explicación, el examinado tiene algunas preocupaciones

depresivas subyacentes que no reconoce o prefiere no admitir a otros, en cuyo caso
los rasgos depresivos pueden ser menos probables de emerger en respuesta a una
metodología MMPI-2 de auto-reporte que al RIM. O quizás la persona generalmente
se siente más relajada e inclinada a estar más disponible en situaciones
relativamente estructuradas más que en no estructuradas, y entonces el MMPI-2 es
más probable que el RIM de revelar si la persona está deprimida.
Como lo muestran estos ejemplos, múltiples medidas de la misma característica

psicológica pueden complementarse cuando son divergentes, con una medida a
veces notando la presencia de una característica (verdadero positivo) que es fallada
por la otra (falso negativo). Posibles razones para ese falso negativo pueden
contribuir con información valiosas sobre las actitudes en la toma de pruebas del
examinado y la probabilidad de comportarse diferente en situaciones que difieren
en la cantidad de estructura que proveen. La traducción de tal divergencia entre los
descubrimientos del MMPI-2 y el RIM en inferencias diagnósticas clínicamente útiles
y planeamiento de tratamiento individual es elaborada por Finn (1996) y Ganellen
(1996). Con cualesquiera medidas implícitas en el peso de las implicaciones de
descubrimientos divergentes, este uso complementario de los descubrimientos de
pruebas frecuentemente sirve para profundizar en el entendimiento que se rebusca
en el proceso de evaluación.
Asuntos del Examinador

La cantidad y tipo de datos recolectados en las evaluaciones psicológicas depende
en parte de dos asuntos relacionados con el examinador que conduce estas
evaluaciones. El primer asunto implica las calificaciones y competencia de los
examinadores para utilizar los procedimientos que emplean, y el segundo tiene que
ver con las maneras en que las cualidades personales del examinador pueden
influenciar cómo los diferentes tipos de personas responden a ellos.
Calificaciones y Competencia
Hay un consenso general de que las personas que conducen evaluaciones
psicológicas deberían estar calificadas por educación y entrenamiento para hacerlo.
Los Principios Eticos y Código de Conducta promulgado por la APA (1992) ofrece la
siguiente guía general al respecto: “Los psicólogos proveen servicios, enseñan y
conducen investigación solamente dentro de los límites de su competencia, basados
en su educación, entrenamiento, experiencia supervisada, o experiencia profesional
apropiada” (Código Ético, 1.04ª). Tipos particulares de conocimiento y pericia que
son necesarios para los usuarios de pruebas para conducir evaluaciones adecuadas
son especificados en las Calificaciones del Usuario de Pruebas endosado por la APA
(2001). Finalmente de nota con respecto a usar pruebas en evaluaciones
psicológicas, los Estándares para Pruebas Educacionales y Psicológicas (AERA y
otros, 1999) identifica quien es responsable por el uso apropiado de las pruebas:
“La responsabilidad última para el uso apropiado de pruebas y su interpretación
recae predominantemente en el usuario de la prueba. Al asumir esta
responsabilidad, el usuario debe conocer sobre los usos apropiados de la prueba y
las poblaciones para las cuales funciona” (p. 112)
A pesar de la claridad de estas declaraciones y el considerable detalle provisto en

las Calificaciones del Usuario de Pruebas, dos asuntos persistentes en la práctica
contemporánea de evaluación permanecen sin resolver. Primero, las calificaciones
de pruebas psicológicas adecuadas son típicamente inferidas por cualquier
examinador que tenga un grado en psicología, sea licenciado en su estado, y
presentándose como competente para la práctica de evaluaciones psicológicas.
Hasta ese momento, como los criterios propuestos en las Calificaciones del Usuario
de Pruebas, ser incorporado a procedimientos de acreditación formal, la calificación
como un evaluador continuará siendo conferida automáticamente a psicólogos
licenciados. Desdichadamente, ser calificado con una licencia en el uso de pruebas
psicológicas no asegura ser competente al usarlas. Ser competente en pruebas
psicológicas requiere familiaridad con la más reciente revisión de cualesquiera
instrumentos que un asesor esté usando, con investigación actual y los datos
normativos más recientes relacionados con estos instrumentos, y con las muchas
complejidades interpretativas que probablemente implican. La competencia de
evaluación también requiere apreciación de una variedad de asuntos psicométricos,
interpersonales, socioculturales y contextuales que afectan no solo la recolección
sino también la interpretación y utilización de la información de evaluación (ver
Sandoval, Frisby, Geisinger y Scheuneman, 1990). Los capítulos que siguen en este
volumen son testigos del amplio rango de estos asuntos y a la estable producción
de medidas nuevas o revisadas, descubrimientos de investigación y guías de
práctica que hacen de la psicología de evaluación un campo dinámico y
rápidamente cambiante con una larga y floreciente literatura. Solo manteniéndose
razonablemente al día con estos desarrollos pueden los evaluadores hacerse y
permanecer competentes, y solo permaneciendo competentes pueden cumplir sus
responsabilidades éticas (Kitchener, 2000, capítulo 9; Koocher y Keith-Spiegel,
1998; Weiner, 1989).
El segundo asunto persistente concierne a la evaluación por personas que no son

psicólogos y por lo tanto no están apegados a los principios éticos de la profesión o
sus guías para la práctica. Evaluadores no psicólogos que pueden obtener pruebas
psicológicas son libres de usarlas en quien quieran. Cuando medidas fácilmente
administradas producen puntajes de prueba que parecen transparentemente
interpretables, como en el caso de una elevada escala Borderline en el Inventario
Clínico Multiaxial Millon-III (MCMI-III; Choca, Shanley y Van Denberg, 1997) o una
elevada escala de Aquiescencia en el Inventario de Preferencia Vocacional de
Holland (VPI; Holland, 1985), examinadores no calificados poden sacar
conclusiones superficiales que toman en cuenta inadecuadamente, la complejidad
de estos instrumentos, las interacciones entre sus escalas y los límites de su
aplicabilidad. Atañe a los psicólogos de evaluación no solo mantener su propia
competencia, sino también llamar la atención en circunstancias inapropiadas de
prácticas de evaluación que caen fuera de razonables estándares de competencia.
Influencia Personal
Los evaluadores pueden influenciar la información que recolectan en virtud de sus
cualidades personales y por la manera en la cual conducen la examinación
psicológica. En el caso de medidas auto-administradas tales como encuestas de
interés o cuestionarios de personalidad, la influencia del examinador puede ser
mínima. Entrevistas y procedimientos de prueba interactivos, por otros lado, crean
amplia oportunidad para la edad, sexo, etnicidad u otras características del
examinador, para hacer que los examinados se sientan más o menos cómodos y
más o menos inclinados a estar dispuestos. Los examinadores necesitan estar
alertas a instancias en las cuales las cualidades personales pueden influenciar la
naturaleza y cantidad de datos que están recolectando.
La influencia personal más importante que los examinadores no pueden modificar

u ocultar es su facilidad de lenguaje. Los procedimientos de evaluación psicológica
son extensivamente basados en lenguaje, sea en su contenido o en las
instrucciones que introducen tareas no verbales, y una comunicación exacta es por
lo tanto esencial para obtener información de evaluación confiable. Es ampliamente
acordado que examinadores y examinados deben comunicarse sea en su lenguaje
nativo o en un segundo lenguaje que ambos conozcan bien (AERA y otros, 1999,
capítulo 9). El uso de intérpretes para evitar barreras de lenguaje en el proceso de
evaluación, raramente provee una solución satisfactoria a este problema. A menos
que el intérprete sea totalmente versado con expresiones idiomáticas y referencias
culturales en ambos idiomas, esté familiarizado con procedimientos estándar en
evaluación psicológica, y sea extraño al examinado (no puede ser amigo, pariente,
o miembro de la misma comunidad sub-cultural), los resultados obtenidos pueden
tener cuestionable validez. Similarmente, en el caso de medidas auto-
administradas, las instrucciones e ítems de la prueba deben estar escritos en un
lenguaje que el examinado entienda completamente. Las traducciones de pruebas
requieren una cercana atención a los caprichos idiomáticos de cada nuevo lenguaje
y a contenidos de los items de prueba individuales específicos de cada cultura, para
asegurar la equivalencia de medidas en las aplicaciones de pruebas en culturas
cruzadas (Allen y Walsh, 2000; Danz, 2000ª).
A diferencia de cualidades fijas, la manera en que los examinadores conducen el

proceso de evaluación está dentro de su control, y la inadecuada influencia del
examinador puede ser minimizada con los esfuerzos apropiados para promover una
respuesta completa y abierta a los procedimientos de evaluación. Para alcanzar
este fin, una evaluación típicamente comienza con una revisión de sus propósitos,
una descripción de los procedimientos que seguirán, y esfuerzos por establecer una
confianza que ayudará al examinado a sentirse cómodo y querer cooperar con el
proceso de evaluación. Variaciones en el comportamiento del examinador al
introducir o conducir evaluaciones psicológicas puede influenciar sustancialmente
cómo los examinados perciben la situación de evaluación – por ejemplo, si ellos lo
ven un proceso investigativo autoritario que pretende señalar defectos y
debilidades, o como una interacción mutualmente respetuosa que pretende proveer
entendimiento y ayuda. Aún siguiendo las guías de cerca para una entrevista
estructurada y apegándose fielmente a los procedimientos estandarizados para
administrar varias pruebas, el examinador necesita reconocer que su manera, tono
de voz, y aparente actitud probablemente afecte las percepciones y nivel de
comodidad de la persona que está siendo examinada y, consecuentemente, la
cantidad y tipo de información que esa persona provee (ver Anastasi y Urbina,
1977; Masling, 1966, 1998).
Asuntos del Examinado
La influencia del examinador en el proceso de evaluación inevitablemente
interactúa con las actitudes e inclinaciones del examinado. Algunos examinados
pueden sentirse más cómodos siendo examinados por una persona mayor que una
más joven, por ejemplo, o por un varón más que una mujer. Entre miembros de un
grupo minoritario, algunos prefieren ser examinados por una persona con un
pasado cultural o étnico similar al suyo, mientras que otros se preocupan menos
por el pasado del examinador y más por su competencia. Similarmente, con
respecto al estilo del examinador, una persona pasiva, tímida y dependiente puede
sentirse segura con un enfoque cálido, amistoso y comprensivo de un examinador,
más que con una persona fría, distante y desconfiada que lo hará sentirse inseguro;
por el contrario, una persona interpersonalmente cautelosa y distante puede
sentirse segura cuando es examinada de manera impersonal y metódica que podría
trastornar y hacer sentir ansioso a un examinado dependiente y en necesidad de
contacto personal. Con tales posibilidades en mente, los examinadores
experimentados usualmente varían su estilo de comportamiento para conducir
evaluaciones de manera que se maximice el nivel de comodidad y cooperación de
cada individuo.
Dos otros asuntos del examinado que influencian el proceso de recolección de

datos concierne al derecho de la persona de dar su consentimiento para ser
evaluado y sus actitudes hacia ser examinado. Con respecto al consentimiento, la
fase introductoria de conducir una evaluación debe incluir ordinariamente no solo la
explicación de los propósitos y procedimientos mencionados anteriormente, que
informan al examinado, sino también un acuerdo explícito por el examinado o
personas legalmente responsables por él, para realizar la evaluación. Como
elaborado por los Estándares Para Pruebas Educacionales y Psicológicas (AERA y
otros, 1999), el consentimiento puede ser obviado solamente cuando una
evaluación ha sido obligada por ley (evaluación ordenada por la corte) {NO
APLICA EN EL CASO DE COSTA RICA} o cuando es implícito, como cuando una
persona aplica para una posición u oportunidad para la cual ser evaluado es un
requisito (un trabajo para el cual todos los aplicantes están siendo evaluados
psicológicamente, ver también Kitchener, 2000, y los capítulos por Geisinger y por
Koocher y Rey-Casserly en este volumen). Habiendo dado su consentimiento para
ser evaluados, los examinados pueden revocarlo en cualquier momento durante el
proceso de evaluación. Así, La posibilidad de obtener datos de evaluación
adecuados dependen no solo de si los examinados pueden ser ayudados o sentirse
cómodos, sino más básicamente en si ellos consienten en primer lugar ser
evaluados y permanecen con la voluntad de serlo durante el curso de la evaluación.
Asuntos relacionados con actitudes específicas del examinado hacia ser examinado
típicamente suponen la cuestión de si la evaluación está siendo conducida para
propósitos clínicos o administrativos. Cuando las evaluaciones están siendo
conducidas para propósitos clínicos, el examinador es responsable del examinado,
el examinado busca algún tipo de asistencia, y la examinación se supone como una
ayuda para esta persona y que responderá a sus necesidades. Como ejemplos
comunes en las evaluaciones clínicas, la gente preocupada por su bienestar
psicológico puede buscar una evaluación para saber si necesitan cuidado en salud
mental, y la gente incierta sobre sus planes vocacionales o educativos podría
querer buscar ayuda para determinar lo que sus habilidades e intereses los inclinan
a hacer. En evaluaciones administrativas, por contraste, los examinadores no son
responsables por los examinados, pero más bien por una tercera persona que
solicitó la evaluación para ayudarla a llegar a un juicio sobre la persona. Los
examinadores en una evaluación administrativa son éticamente responsables por
tratar al examinado justamente y con respeto, pero la evaluación está siendo
conducida para el beneficio de quien la solicitó, y los resultados pueden o no
ajustarse a las necesidades o mejores intereses del examinado. La evaluación para
fines administrativos ocurre comúnmente en contextos forenses, educacionales y
organizacionales donde las evaluaciones son solicitadas para ayudar a decidir
asuntos como si un interno en prisión debería ser liberado bajo palabra, si un
estudiante debería ser admitido en un programa especial, o si un aplicante a un
empleo debería ser contratado (ver Monahan, 1980).
En cuanto a sus actitudes, los examinados que son evaluados para propósitos
clínicos son relativamente probables de ser motivados a revelarse honestamente,
en cambio, los examinados para propósitos administrativos, son relativamente
probables de intentar distorsionar su presentación. Los examinados que intentan
manejar la impresión que dan, es probable que pretendan mostrarse diferentes a
como son, más bien como ellos creen que el examinador los creería favorables.
Típicamente tales esfuerzos toman la forma de negación de las limitaciones de uno,
minimizando los defectos, intentando verse lo mejor posible, y disimulando lo que
se pueda ver negativo. Sin embargo, algunas excepciones son comunes. Mientras
que las personas entrevistadas con fines administrativos quieren dar la mejor
impresión, algunos pueden estar motivados en la otra dirección. Por ejemplo, un
acusado afirmando daño cerebral en una demanda de daño personal, podría ver
como beneficioso el dar la peor impresión en una examinación neuropsicológica.
Algunas personas en evaluaciones clínicas, a pesar de estar de acuerdo con la
examinación y saber que es por su propio beneficio, pueden estar nerviosos o
avergonzados de revelar sus dificultades totalmente. Cualquier tipo de impresión
que los examinados quieran mostrar, las actitudes hacia ser examinados que traen
con ellos a la situación de evaluación pueden esperarse que influencien la cantidad
y tipo de datos que producen. Estas actitudes que también afectan la interpretación
de los datos de evaluación, y las implicaciones del manejo de impresiones por fingir
y ser defensivos, son discutidas luego en este capítulo.
Asuntos de Manejo de Datos

Un grupo final de consideraciones al recolectar información de evaluación
concierne las maneras apropiadas de manejar los datos que son obtenidos. Los
examinadores deben estar atentos en particular a los asuntos que conciernen el uso
de computadores en la recolección de datos; la responsabilidad que tienen de
salvaguardar la seguridad de sus medidas; y su obligación, dentro de los límites, de
mantener la confidencialidad de lo que los examinados reportan o revelan.
Recolección Computarizada de Datos

Programas de software están disponibles para facilitar el proceso de recolección de
datos para los métodos de evaluación más ampliamente usados. Programas
diseñados para su uso con cuestionarios auto-reportados típicamente proveen
administración en línea de ítems de prueba, codificación automática de respuestas
de ítems para producir escalas de puntajes, y manipulación cuantitativa de esas
escalas para producir puntajes e índices resumidos. Para instrumentos que
requieren administración y codificación (prueba de inteligencia de Wechsler),
programas de software aceptan que los puntajes de pruebas sean digitados por el
examinador y traducidos en índices cuantitativos de pruebas (puntajes índices y IQ
de Wechsler). Muchos de estos programas guardan los resultados de las pruebas en
archivos que pueden ser accesados y exportados luego, y algunos incluso proveen
paquetes computacionales que pueden generar estadísticas descriptivas para
grupos de registros de pruebas guardadas.
Estas características del manejo computarizado de datos trae varios beneficios al

proceso de recolección de información. La administración y codificación de
respuestas en línea ayuda a los examinados a evitar errores mecánicos al llenar
formularios a mano, y eliminan errores que los examinadores algunas veces hacen
al calificar las respuestas (ver Allard y Faust, 2000). Para medidas que requieren
codificación y digitación de datos por el examinador, la utilidad de los resultados
depende de la codificación y entrada exacta, pero una vez que los datos están
digitados, los programas eliminan los errores al calcular puntajes sumarios e
índices. El almacenamiento de datos de muchos programas de computo facilitan la
investigación de evaluación, particularmente para los investigadores que buscan
combinar bases de datos de diferentes fuentes, y también ayudan a los
examinadores a llenar los requerimientos de la mayoría de los estados y agencias
de mantener la información de evaluación en un archivo por cierto período de
tiempo. Por tales razones, la vasta mayoría de los psicólogos de evaluación
reportan que usan software para puntuaciones de pruebas y se sienten cómodos
haciéndolo (McMinn, Ellens y Soref, 1999).
La recolección computarizada de información tiene algunas desventajas potenciales

también. Cuando las medidas de evaluación son administradas en línea, primero
que todo, la confiabilidad de los datos recolectados puede ser comprometida por
una falta de equivalencia entre un procedimiento de prueba automatizado y la
versión no computarizada en la cual está basado. Como elaborado por Butcher,
Perry y Atlis (2000), Honaker y Fowler (1990) y Zinder (2000) y discutido en el
capítulo por Butcher en el presente volumen, la extensión hasta la cual tal
equivalencia es actualmente un asunto sin resolver. Los datos disponibles sugieren
confiabilidad bastante buena para las administraciones computarizadas basadas en
cuestionarios en papel y lápiz, especialmente para aquellas usadas en evaluaciones
de personalidad. Con respecto al MMPI, por ejemplo, un meta-análisis por Finger y
Ones (1999) de toda la investigación disponible que compara el instrumento
computarizado con folletos han mostrado ser psicométricamente equivalentes. Por
otro lado, una buena congruencia con las medidas originales todavía debe ser
demostrada para las versiones computarizadas de entrevistas clínicas estructuradas
y para muchas medidas de funcionamiento visual-espacial usadas en evaluación
neuropsicológica. Entre los programas de cómputo disponibles para administración
de pruebas, muy pocos han sido sistemáticamente evaluados con respecto a si
obtienen exactamente la misma información que emergería en una administración
estándar de la medida en la que están basados.
Una segunda desventaja potencial de la recolección de datos computarizados deriva

de la facilidad con que pueden ser empleados. Aunque frecuentemente útiles a los
profesionales de evaluación conocedores y de este modo a los examinados, los
procedimientos automáticos también simplifican las pruebas psicológicas a las
personas no entrenadas o calificadas quienes no tienen las habilidades de
evaluación y no podrían recolectar datos de prueba sin la ayuda de una
computadora. La disponibilidad de programas de cómputo de este modelo, crea
algún potencial para métodos de evaluación mal usados y examinados mal
servidos. Tales resultados no escapan de los procedimientos de evaluación
computarizados, sin embargo. Ellos constituyen un abuso de la tecnología por
personas mal informadas e irresponsables.
Seguridad de la Prueba
La seguridad de la prueba se refiere a restringir la disponibilidad pública de los
materiales de prueba y respuestas a los ítems. Tales restricciones se refieren a dos
importantes consideraciones en evaluación psicológica. Primero, información
circulada públicamente sobre las pruebas puede minar su validez, particularmente
en el caso de medidas que comprenden ítems con respuestas de bueno o malo o
más o menos preferiblemente.
Exposición previa a pruebas de este tipo e información sobre preguntas como las
anteriores pueden afectar cómo las personas responden a ellas y prevenir al
examinador de recoger un protocolo válido. La validez de los descubrimientos de
pruebas es especialmente cuestionable cuando la exposición previa de un
examinado ha incluido adiestramiento específico para contestar ciertas preguntas.
En cuanto a procedimientos de evaluación relativamente no estructurados que no
tienen respuestas de este tipo, aún en esas medidas varios tipos de respuesta
llevan tipos particulares de significado interpretativo. Así, la posibilidad existe en
medidas relativamente no estructuradas así como personas que tratan de dar cierta
impresión pueden ser ayudadas al darles instrucciones sobre lo que significan
ciertos tipos de preguntas. Sin embargo, la extensión hasta la cual la diseminación
pública de información sobre el significado inferido de las respuestas que
compromete la validez de medidas relativamente no estructuradas todavía no ha
sido examinada empíricamente y es sujeto de más investigación. Segundo, junto
con ayudar a preservar la validez de los resultados obtenidos, el mantener las
medidas de evaluación seguras protege a los publicantes de pruebas de que
infrinjan sus derechos pirateando o plagiando copias de sus productos. Los
evaluadores éticos respetan los derechos de autor al no hacer ni distribuir copias de
pruebas publicadas, y toman los pasos apropiados para prevenir formularios de
pruebas, manuales de pruebas y programas de evaluación de caer en manos de
personas no calificadas para usarlas apropiadamente o que no se sienten en la
obligación de mantenerlas seguras. Tanto los Principios Éticos y Código de
Conducta (APA, 1992, Sección 2.10) como los Estándares para Pruebas
Educacionales y en Psicología (AERA y otros, 1999, p. 117) se refieren a las
responsabilidades profesionales en términos claros.
Estas consideraciones en salvaguardar la seguridad de las pruebas también tienen

implicaciones por el contexto en el cual los datos de evaluación psicológica son
recolectados. Los datos de evaluación se han hecho más probables en años
recientes de ser aplicados en ubicaciones forenses, y preocupaciones litigiosas a
veces resultan en solicitudes de que la examinación psicológica sea grabada en
video u observada por un tercero. Estas intrusiones en los procedimientos de
examinación tradicional son una amenaza a la validez de los datos obtenidos en dos
aspectos. Primero, no hay manera de juzgar o medir el impacto de grabar en video
o del observador en lo que el examinado escoge decir o hacer. Segundo, los
estándares normativos que guían la interpretación de pruebas son derivados de
datos obtenidos por examinaciones entre dos personas, y no hay datos de
comparación disponibles para examinaciones conducidas en la presencia de una
cámara o un observador. Aparte de la validez, la exposición de los ítems de prueba
a un observador o mediante un video pone la misma amenaza a la seguridad de
prueba al distribuir formularios o manuales de prueba a personas que no están en
la obligación de mantenerlas confidenciales. Los evaluadores psicológicos pueden a
veces decidir para su propia protección grabar las evaluaciones cuando anticipan
cuestiones legales a la entrega de sus reportes. También pueden usar grabaciones
como una alternativa a escribir un protocolo literal largo y complejo. Para
propósitos de seguridad de prueba, sin embargo, los registros hechos para que otra
gente los escuche o vea, como terceros observadores, deberían ser evitados.
Confidencialidad
Un tercer aspecto y relacionado, del manejo apropiado de datos es mantener la
confidencialidad de la información de evaluación de un examinado. Como ciertos
aspectos de salvaguarda de seguridad de las pruebas, la confidencialidad es un
asunto ético en la evaluación psicológica, no uno sustantivo. Las consideraciones
clave para mantener la confidencialidad de la información de evaluación, como
especificado en los Principios Éticos y Código de Conducta (APA, 1992, Sección 5) y
elaborado por Kitchener (2000, capítulo 6) implica (a) clarificar la naturaleza y
límites de confidencialidad con clientes y pacientes antes de tomar una evaluación;
(b) comunicar información sobre personas que están siendo evaluadas solo para
propósitos científicos o profesionales y solo hasta lo que es relevante para los
propósitos para los cuales la evaluación está siendo conducida; (c) revelar
información solo a personas designadas por el examinado u otras personas o
entidades autorizadas, excepto cuando de otra manera sea permitido o requerido
por ley; y (d) guardar y preservar los registros de los examinados de manera
segura. Como los asuntos del consentimiento informado discutido previamente, la
confidencialidad es elaborada como un asunto ético en el capítulo de Koocher y
Rey-Casserly en este volumen.
Interpretando la Información de Evaluación
Siguiendo la recolección de datos relevantes suficientes, el proceso de evaluación

psicológica continúa con una fase de evaluación en la cual esos datos son
interpretados. La interpretación de los datos de evaluación consiste en hacer
inferencias y formar impresiones en relación con los descubrimientos
revelados sobre las características psicológicas del examinado.
Interpretaciones exactas y adecuadamente enfocadas resultan en descripciones
resumidas del funcionamiento psicológico que pueden ser utilizados en la fase final
del proceso de evaluación como la base para formular conclusiones y
recomendaciones que respondan las preguntas de referencia. El alcanzar esta fase
de producción requiere consideración durante la fase de evaluación de la base sobre
las cuales estas inferencias e impresiones son hechas y formadas, los posibles
efectos sobre los descubrimientos fingirse enfermo o defensivo, y formas efectivas
de integrar los datos de diversas fuentes.
Bases de Inferencias e Impresiones

La interpretación de datos de evaluación implica cuatro grupos de alternativas con
respecto a cómo los evaluadores hacen inferencias y forman impresiones sobre lo
que esos datos indican. Las interpretaciones pueden estar basadas en enfoques
empíricos o conceptuales para la toma de decisiones: pueden ser guiados por reglas
de decisión basadas estadísticamente o por juicio clínico; pueden enfatizar sea
características nomotéticas o ideográficas de los examinados; y pueden incluir
menos o más confianza en declaraciones interpretativas generadas por
computadores. La evaluación efectiva implica usualmente la selección informada
entre estas alternativas y la modificación del énfasis dado a cada una de ellas para
calzar en el contexto particular de la situación de evaluación individual.
Guías Empíricas y Conceptuales

La interpretación de información de evaluación puede ser enfocada de varias
maneras. En lo que puede ser llamado un enfoque intuitivo, decisiones de
evaluación provienen de impresiones que no tienen base identificable en los datos.
Así, las interpretaciones son justificadas por declaraciones como “es solo un
sentimiento que tengo sobre ella”, o “No sé decirle de donde viene, solo sé que él
es así”. En lo que puede ser llamado un enfoque autoritario, las interpretaciones
están basadas en los pronunciamientos de psicólogos de evaluación bien conocidos
o respetados, como al decir, “estos datos significan lo que significan por que es la
manera en que el Dr. Experto dice que significan”. La intuición de evaluadores
inusualmente empáticos y la confiabilidad en la autoridad de practicante estudiados
que escogen a sus expertos puede en ocasiones resultar en impresiones exactas y
útiles. Ambos enfoques tienen serios defectos. A menos que evaluadores intuitivos
puedan identificar rasgos específicos de los datos que los ayudan a llegar a
conclusiones, su sensibilidad diagnóstica no puede ser enseñada a otros
profesionales o traducida en procedimientos científicamente verificables. A menos
que evaluadores autoritarios puedan explicar en sus propias palabras la base sobre
la cual los expertos han alcanzado las conclusiones citadas, ellos probablemente no
impresionarán a otros como conocedores profesionales o como que saben qué
pensar en ausencia de alguien que les diga como pensar.
Aún más, ni los enfoques intuitivo o autoritario para interpretar la información de

evaluación son probables de ser consistentemente confiables como los enfoques
basados en guías empíricas y conceptuales. Las Guías Empíricas para toma de
decisiones derivan de resultados replicados de investigaciones metodológicamente
seguras. Cuando un descubrimiento de evaluación específico ha sido encontrado
repetidamente como altamente correlacionado con la presencia de una
característica psicológica particular, es empíricamente seguro inferir la presencia de
esa característica en un examinado que muestra el mismo descubrimiento de
evaluación. Las guías conceptuales para toma de decisiones consisten en
construcciones psicológicas que proveen un puente lógico entre los descubrimientos
de evaluación y las inferencias hechas de ellos. Si una angustia subjetivamente
sentida contribuye a que una persona permanezca o se beneficie de la psicoterapia
(para lo cual hay considerable evidencia; ver Garfield, 1994; Greencavage y
Norcros, 1990; Mohr, 1995), y si una prueba incluye un índice de validez de
angustia subjetivamente sentida (lo que hacen muchas pruebas), entonces es
razonable esperar que un descubrimiento positivo sobre este índice de prueba
incrementará la probabilidad predictiva de un resultado favorable en psicoterapia.
Ambas guías de interpretación traen distintos beneficios al proceso de evaluación.

Las perspectivas empíricas son valiosas porque proveen una base para alcanzar
certeza en la toma de decisiones. La suficiencia de la evaluación psicológica es
ampliada por datos cuantitativos relacionados concernientes a la distribución
normativa y otras propiedades psicométricas de medidas que reflejan dimensiones
de funcionamiento psicológico. La falta de tales datos limita la confianza con la cual
los evaluadores sacan conclusiones sobre las implicaciones de sus descubrimientos.
Sin poder comparar las respuestas de prueba de un individuo con expectativas
normativas, por ejemplo, sin una base para estimar posibilidades de falsos positivos
y falsos negativos en las medidas que han usado, los evaluadores pueden solo
especular al darle significado interpretativo a sus descubrimientos. Similarmente, la
ausencia de cortes de puntaje externamente validados detracta considerablemente
la certeza con la que los evaluadores pueden traducir los puntajes en distinciones
cualitativas, tales como si una persona está leve, moderada o severamente
deprimida.
Las perspectivas conceptuales son valiosas en el proceso de evaluación porque
proveen alguna explicación sobre por qué ciertos descubrimientos son probables de
identificar ciertos tipos de características psicológicas o predecir ciertos tipos de
comportamiento. El tener tales explicaciones a mano ofrece a los evaluadores el
placer de entender no solo cómo sus medidas trabajan sino también por qué
trabajan así; ayudan a los evaluadores a enfocar su atención en aspectos de sus
datos que son relevantes a la pregunta de referencia que están respondiendo; y
facilitan la comunicación de resultados en términos que se refieren a las
características del examinado y no meramente a los datos obtenidos. Como un
beneficio adicional de formulaciones conceptuales de descubrimientos de
evaluación, ellos nutren las hipótesis concernientes con uniones no conocidas o
exploradas entre los descubrimientos y las dimensiones del funcionamiento
psicológico y por lo tanto ayudan a extender las fronteras del conocimiento.
Las guías empíricas son necesarias para las bases científicas de la psicología de
evaluación, como una base para la certeza en la toma de decisiones, pero no son
suficientes para darle a esta evaluación potencial completo. Las guías conceptuales
no proveen en sí mismas una base confiable para sacar conclusiones con certeza.
Sin embargo, al enriquecer el proceso de evaluación con hipótesis explicativas,
apuntan el camino a avances en el conocimiento.
Para los propósitos de cada una, las guías tienen un lugar importante en la
interpretación de información. A veces, preocupaciones sobre preservar la
respetabilidad científica de la evaluación han llevado a aserciones que solo las guías
empíricas constituyen una base aceptable para la toma de decisiones e invalidaban
las guías conceptuales en el sentido de que no tienen lugar en la psicología
científica. MacFall y Treta (1999), por ejemplo, mantienen que “el blanco de la
evaluación clínica es recolectar datos que nos permitan reducir la incertidumbre de
probabilidad de eventos” (p. 215). Desde su perspectiva, el valor de información de
los datos reside en valores numéricos escalados y probabilidades condicionales.
Como un punto de vista alternativo, observe que el río del descubrimiento científico
puede fluir en saltos inferenciales o razonamiento deductivo que sugiere verdades
mucho antes de ser confirmadas por descubrimientos de investigación replicados.
Newton llegó al razonamiento de que las manzanas caen de los árboles mucho
antes de que experimentos probaran las leyes de la gravedad. Einstein concibió su
teoría de la relatividad con toda confianza de que los descubrimientos empíricos
eventualmente lo probaría correcto, y ninguno ha sufrido ningún reto en sus
credenciales como científico. Aunque las guías empíricas son, en promedio, más
probables de producir conclusiones confiables más que las formulaciones
conceptuales, como ya se notó, el razonamiento lógico concerniente a las
implicaciones de conceptos claramente formulados puede también generar
conclusiones que sirvan a útiles propósitos y resistan al tiempo.
De acuerdo con eso, el proceso de llegar a conclusiones en evaluación de un caso

individual puede implicar aspectos creativos y confirmativos del pensamiento
científico, y la utilización de evaluación para generar hipótesis y completa
especulación puede, en el curso de un empeño científico, incrementar más que
disminuir la incertidumbre en el proceso de identificar nuevas posibilidades
alternativas que alcanzar. Esta perspectiva es echa eco por Debruyn (1992) en el
siguiente comentario: “La toma de decisiones científicas en general, y la toma de
decisiones diagnósticas en particular, tiene un lado repetitivo, que consiste en
procedimientos de fórmulas y algoritmos, y un lado constructivo, que consiste en
generar hipótesis y teorías para explicar cosas o basar descubrimientos no
esperados” (p. 192).
Reglas Estadísticas y Juicio Clínico

Las guías empíricas para toma de decisiones han sido operacionalizadas de
costumbre usando reglas estadísticas para llegar a conclusiones concernientes a
qué significan los datos de evaluación. Las reglas estadísticas para esta
interpretación de datos comprenden formulas derivadas empíricamente y
algoritmos, que proveen una base actuarial objetiva para decidir lo que estos datos
indican. Cuando las reglas estadísticas son aplicadas a los resultados de una
evaluación psicológica, la fórmula toma de decisión concerniente a si ciertas
características psicológicas están presentes (como decidir si un examinado tiene un
rasgo o desorden particular) o si ciertos tipos de acciones son probables de suceder
(como predecir la probabilidad de un examinado de comportarse violentamente o
realizar bien un trabajo). Las reglas estadísticas tienen la ventaja de asegurar que
los examinadores aplicando una fórmula correctamente al mismo grupo de datos
siempre llegarán a la misma conclusión sobre qué significan esos datos. Como una
desventaja, sin embargo, el alcance de las conclusiones puede, al ser basadas en
reglas estadísticas y su relevancia con las preguntas de referencia, estar limitados
por la composición de la base de datos de las cuales han sido derivadas.
Por ejemplo, reglas estadísticas pueden probar ser útiles al determinar si un

estudiante tiene una discapacidad para aprender, pero no dicen nada sobre la
naturaleza de la discapacidad de este estudiante; pueden predecir la probabilidad
de un acusado criminal de comportarse violentamente, pero no ofrecen pistas de
los tipos de situaciones que pueden evocar violencia en este acusado en particular;
o pueden ayudar a identificar la conveniencia de una persona para un tipo de
posición en una organización, pero no decir nada sobre la conveniencia de esa
persona en algún otro puesto de tal organización. En cada una de estas instancias,
una regla estadística derivada de un grupo de personas con ciertas características
demográficas (edad, sexo, estatus socio económico, historia cultural) y habiendo
sido evaluados en una situación particular, puede faltarle validez de generalización
a personas con diferentes características demográficas evaluados en algún otro tipo
de contexto. Garb (2000) ha notado similarmente en este aspecto que “las reglas
de predicción estadística son de limitado valor porque típicamente han sido basadas
en información limitada que no ha mostrado ser óptima o casi nunca se ha
mostrado poderosa (p. 31). En otras palabras entonces, la extensión de reglas
estadísticas está restringida a descubrimientos pertenecientes a los tipos
particulares de personas, características psicológicas y circunstancias que fueron
anticipadas al construirlas. Para los muchos variados tipos de gente que se ven en
la práctica real, y para muchas de las preguntas de referencias complejas y
específicamente enfocadas que se hacen sobre estas personas, entonces las reglas
estadísticas, que por sí mismas proveen respuestas adecuadas, pueden ser poco
útiles.
Como una limitación más de las reglas estadísticas, ellas comparten con todas las
escalas de evaluación cuantificada, alguna artificialidad inevitable que acompaña la
traducción de puntajes numéricos a categorías descriptivas cualitativas. En el
Inventario de Depresión Beck (BDI; Beck, Speer, y Garbin, 1998) por ejemplo, un
puntaje de 14 a 19 es indicativo de depresión leve y un puntaje de 20 a 28 indica
depresión moderada. De este modo dos personas que tienen puntajes BDI casi
idénticos, una con uno de 19 y la otra con uno de 20, serán descritas muy
diferentemente por la regla estadística, una como levemente deprimida y otra como
moderadamente deprimida. De este modo, al medir inteligencia con la Escala de
Inteligencia de Adultos Wechsler-III (WAIS-III; Kaufman, 1990) un puntaje IQ de
escala completa de 109 describe la inteligencia de una persona como promedio,
mientras que una persona con casi el mismo nivel de inteligencia y una escala
completa IQ de 110 cae en el rango promedio alto. De acuerdo a las formulas
WAIS-III, una persona con una escala completa IQ de 91 y una persona con escala
IQ completa de 119 también serían llamadas respectivamente, como promedio y
promedio alto. Algunos evaluadores minimizan este problema añadiendo alguna
especificidad a las categorías WAIS-III, llamando a 109 IQ como el final alto de un
rango promedio y a 110 IQ como el inicio bajo de un rango promedio. Aunque
descripciones categóricas adicionales para rangos de puntaje finamente definidos
pueden reducir la artificialidad en el uso de reglas estadísticas, hay límites a cómo
muchos puntos de datos cuantitativos en una escala pueden ser asignados una
designación cualitativa distintiva. Las guías conceptuales para toma de decisiones
han sido operacionalizadas en términos de juicio clínico, el cual consiste de
conocimiento acumulativo que los practicantes adquieren de su experiencia. Las
guías clínicas pueden representar las creencias compartidas de un gran número de
practicantes pero emergen inicialmente como impresiones formadas por
practicantes individuales. En contraste con el objetivo y rasgos cuantitativos de las
reglas estadísticas, los juicios clínicos constituyen una base subjetiva y cualitativa
para llegar a conclusiones. Cuando el juicio clínico es aplicado a la evaluación de
datos, las decisiones son hechas por el practicante, no por la fórmula. Los juicios
clínicos concernientes al significado interpretativo de un grupo de datos de
evaluación, son consistentemente menos uniformes que decisiones actuariales y
menos probables de estar basados en hechos establecidos.
Por otro lado, la aplicabilidad de juicios clínicos es infinita, y su extensión y

relevancia no están limitados por ninguna base de datos, sino solamente por la
capacidad del practicante para razonar lógicamente posibles relaciones entre
características psicológicas identificadas por los datos de evaluación y
características psicológicas relevantes a las preguntas de referencia, cual sea su
complejidad y especificidad.
El relativo mérito de las reglas estadísticas y el juicio clínico en el proceso de

evaluación ha sido el sujeto de considerable debate desde que su distinción fue
formulada por Meehl (1954) en su libro Predicción Clínica versus Estadística.
Publicaciones subsecuentes de temáticas relacionadas con este importante asunto
incluyen artículos de Grove y Meehl (1996), Grove, Zald, Lebow, Snitz, y Nelson
(2000), Holt (1958, 1986), Karon (2000), Meehl (1986), y Swets, Dawes, y
Monahan (2000), y un libro por Garb (1998) titulado Estudiando al Clínico. Mucha
de la literatura sobre este tópico ha consistido de aserciones y refutaciones sobre si
métodos estadísticos generalmente producen resultados de evaluación más exactos
que los métodos clínicos. A la luz de las fortalezas y debilidades inherentes a la
predicción estadística y el juicio clínico, como elaborado en el capítulo de Garb en
este volumen, tal debate sirve poco y es lamentable cuando lleva al menosprecio de
cualquier enfoque para interpretar datos de evaluación.
Como testimonio de la utilidad de ambos enfoques, es importante notar que la

creación de buenas reglas estadísticas para la toma de decisiones de evaluación,
típicamente comienza con la selección clínicamente informada de (a) ítems de
prueba, preguntas de entrevista estructurada, y otros componentes de medida a
ser usados como variables de predicción, y (b) condiciones psicológicas, tendencias
de comportamiento, y otras variables de criterio para las cuales las variables de
predicción se suponen relacionadas. Los métodos empíricos de construcción de
escalas y validación cruzada son entonces empleados para dar forma a estas
variables clínicamente relevantes en medidas actuariales válidas de esas variables
de criterio clínicamente relevantes. Así, las buenas reglas estadísticas deberían casi
siempre producir resultados más exactos que el juicio clínico, porque ellas
incorporan el conocimiento clínico más el mejoramiento de ese conocimiento por
descubrimientos de investigación replicados. Métodos clínicos de evaluación en su
mejor modo dependen de impresiones y juicios de practicantes individuales,
mientras que métodos estadísticos en su mejor modo constituyen un hecho
establecido que ha sido construido sobre un hecho clínico. Confiar solo en un juicio
clínico en situaciones de toma de decisiones para los cuales las guías actuariales
están disponibles es equivalente a jugar cartas con medio mazo. Aún cuando el
mejor juicio del mejor practicante puede a veces ser nublado por una desviación
inadvertida, conocimiento insuficiente de tasas base, y otras fuentes de influencia
discutidas en la sección final de este capítulo y elaboradas en el capitulo de
Reynolds y Ramsay en este volumen. Cuando a uno se le da una escogencia
razonable, las decisiones de evaluación son basadas preferiblemente en hechos
establecidos que en juicios clínicos.
Por otro lado, la diversidad de gente previamente notada y de circunstancias que

llevan a ser referido para evaluación significan que para las preguntas de
evaluación hechas no hay reglas estadísticas disponibles, y los patrones de datos de
evaluación con frecuencia parecen pero no igualan los parámetros para los cuales la
investigación replicada ha mostrado ciertos correlatos. Cuando las reglas
estadísticas no pueden contestar totalmente las preguntas hechas, qué hacen los
evaluadores en ausencia de datos de validación completos? Las decisiones podrían
ser aplazadas, basados en que faltan suficientes bases de hecho para una decisión,
y una recomendación podría ser aplazada, pendiente de mayor certeza sobre qué
recomendación hacer. Alternativamente, evaluadores en una situación de
incertidumbre pueden suplir cualesquiera guías empíricas que tengan a su
disposición con razonamiento lógico y conocimiento clínico acumulativo para llegar
a conclusiones y recomendaciones que son más sensibles y un poco más útiles que
no decir nada.
Como lo indican estas observaciones, las reglas estadísticas y juicio clínico pueden
ser vistas como componentes complementarios de una efectiva toma de decisiones,
más que como alternativas competitivas y mutuamente excluyentes. Cada una trae
valor a la psicología de evaluación y tiene un lugar respetable en ella. Geisinger y
Carlson (2000) comentan en este respecto que ha llegado el momento “para
moverse más allá de lo puramente juicioso en la interpretación especulativa de
resultados de prueba tanto como extrapolaciones de la población general a casos
específicos que no se parecen al resto de la población (p. 254).
La practica de evaluación debería estar sujeta e influenciada por estudios de

investigación, para que facilite la búsqueda del conocimiento y la entrega de un
servicio profesional responsable. Concurrentemente, la falta de documentación
inequívoca no debería impedir a los psicólogos de evaluación emplear
procedimientos y alcanzar conclusiones que en su juicio los ayudarán a llenar las
necesidades de aquellos que buscan su ayuda. Comentando el uso balanceado de
contribuciones objetivas y subjetivas a la toma de decisiones de evaluación, Swets
y otros (2000) similarmente notan que “el papel apropiado del STR Regla de
Predicción Estadística, cara a cara con el diagnosticador variará de un contexto a
otro “ y que los papeles más apropiados de cada uno “pueden ser determinados por
cada locación diagnóstica de acuerdo con la evidencia acumulada sobre lo que sirve
mejor (p. 5). Poniendo el asunto en términos más simples, Kleinmuntz (1990)
observó que “la razón por la que aún usamos nuestras cabezas, aunque sea feo, en
vez de fórmulas, es por que para muchas decisiones, escogencias y problemas,
todavía no hay fórmulas disponibles (303).
Énfasis Nomotético e Ideográfico

Las guías empíricas y reglas estadísticas constituyen un enfoque básicamente
nomotético a la interpretación de información de evaluación, mientras que las guías
conceptuales y el juicio clínico son base de un enfoque básicamente ideográfico.
Las interpretaciones nomotéticas se refieren a maneras en las cuales la gente se

parece a otros tipos de gente y comparten varias características psicológicas con
muchas de ellas. Así, estas interpretaciones implican comparaciones entre los
descubrimientos de evaluación para el examinado y descubrimientos de evaluación
típicamente obtenidos de grupos de gente con ciertas características conocidas,
concluyendo que “las respuestas de esta persona muestran un patrón con
frecuencia visto en gente que no se siente cómoda en situaciones sociales y se
inclinan a alejarse de ellas.” La manera en la cual las interpretaciones nomotéticas
son derivadas y expresadas es primariamente cuantitativa en naturaleza y puede
incluso especificar la frecuencia precisa en la cual el descubrimiento de evaluación
ocurre en grupos particulares de personas.
Las interpretaciones ideográficas, por contraste, se refieren a maneras en que la

personas difiere de la mayoría de personas y muestra características psicológicas
que son únicas de ellos y sus circunstancias particulares. Estas interpretaciones
típicamente comprenden declaraciones que atribuyen a las personas un significado
específico a la información de evaluación basado en nociones generales de los
procesos psicológicos, como cuando se dice que “esta persona da muchas
indicaciones de ser un individuo pasivo y dependiente que está más cómodo siendo
un seguidor que un líder y probablemente tendrá dificultades en funcionar
efectivamente en una posición ejecutiva.” El derivar y expresar interpretaciones
ideográficas es de este modo, un procedimiento fundamentalmente cualitativo en el
cual los examinadores son guiados por impresiones informadas más que por
comparaciones empíricas cuantitativas.
En el área de la evaluación de personalidad, los enfoques nomotéticos e

ideográficos de interpretación tienen una larga y distinguida tradición. Las
perspectivas nomotéticas derivan del trabajo de Cattell (1946) de quien la esencia
de la personalidad reside en rasgos de dimensiones de funcionamiento que toda la
gente comparte en algún grado y sobre los cuales pueden ser comparados entre
ellos. Las perspectivas ideográficas en la teoría de la personalidad fueron
claramente articuladas primeramente por Allport (1937), quien concibió la esencia
de la personalidad como residente en la individualidad de cada persona,
independientemente de comparaciones con otras personas. A lo largo de los años,
los psicólogos de evaluación han expresado a veces diferentes convicciones sobre
cual de estas dos tradiciones debería ser enfatizada al formular interpretaciones.
Los practicantes típicamente concurren con Groth-Marnat (1997) en que las
descripciones de la gente orientadas en los datos raramente se refieren a los
problemas únicos que una persona puede tener y que la esencia de la evaluación
psicológica es un intento “para evaluar un individuo en una situación problema para
que la información derivada de la evaluación pueda ayudar con el problema” (p.
32). Escribiendo desde una perspectiva investigativa, sin embargo, McFall y
Townsend (1998) indican que los practicantes deben por necesidad, proveer
soluciones ideográficas a los problemas de la gente, pero mantienen que “el
conocimiento nomotético es un prerrequisito a las soluciones ideográficas” (p. 325).
En su opinión, solo las variables nomotéticas tienen un lugar propio en la ciencia
clínica de la evaluación.
Para temperar estos puntos de vista a la luz de lo que ya se ha dicho sobre

predicción estadística y clínica, no hay razón para que los clínicos que buscan
soluciones a problemas ideográficos no puedan o no deban redactar cualesquiera
guías nomotéticas que los ayuden a encuadrar interpretaciones exactas y útiles. De
este modo, no hay razón para que la ideografía no sea manejada de manera
científica, ni tampoco es una distinción nomotética-ideográfica entre la ciencia
clínica y la práctica clínica probable de ser constructivas a largo plazo. Stricker
(1997) discute al contrario, que la ciencia incorpora una actitud y un grupo de
valores que pueden caracterizar a los practicante de oficina así como a los
investigadores de laboratorio, y que “la misma matriz teórica debe generar
actividades de ciencia y práctica” (p. 442).
Asuntos de definición aparte, parece haber poco que ganar al debatir si la gente
puede ser descrita mejor en términos de cómo difieren de otros o cómo se parecen
a otros. En la práctica, una descripción optimísticamente informativa y útil de las
características y funcionamiento psicológico de un individuo regulará el parecido y
diferencia entre las personas en circunstancias similares sobre quienes se han
hecho preguntas de referencia similares. Las perspectivas nomotética e ideográfica
se complementan y un énfasis balanceado en ambas promueve el mayor
entendimiento posible del examinado.
Declaraciones Interpretativas Generadas por Computadora

La mayoría de pruebas publicadas incluyen programas de cómputo que no solo
asisten en la recolección de datos de evaluación, sino también generan
declaraciones interpretativas que describen los descubrimientos y presentan
inferencias basadas en ellos. Como la recolección de datos computarizados, la
interpretación de datos vía computadora (CBTI) da distintas ventajas al proceso de
evaluación. Por esta automatización, la CBTI garantiza un escaneo completo de los
datos de prueba y elimina errores humanos que resultan de items no observados
en un protocolo de prueba. La CBTI similarmente asegura que un patrón de datos
siempre generará la misma declaración interpretativa, uniforme y confiablemente,
eliminando la variabilidad del examinador y la desviación como posibles fuentes de
error. La CBTI también puede facilitar la enseñanza y aprendizaje de métodos de
evaluación. Al usar narrativas generadas por computadora como un ejercicio que
requiere que el aprendiz identifique variables de prueba probablemente generaría
declaraciones particulares. Los beneficios potenciales de las interpretaciones de
prueba computarizadas, son elaborados en el capítulo de Butcher en este volumen
(ver también Butcher, 2002). Cuatro limitaciones para las CBTI se refieren a si los
examinadores debería confiar en tales declaraciones al formular y expresar sus
impresiones.
Primero, aunque un programa de cómputo genera declaraciones interpretativas por

medio de fórmulas algorítmicas cuantitativas, estos programas de cómputo no
están del todo empíricamente basados. En cambio, ellos típicamente combinan
correlatos empíricamente validados de puntajes de prueba con juicios clínicos sobre
qué significan patrones de puntajes varios, y muchos algoritmos implican creencias
así como hechos establecidos sobre lo que esos patrones significan. Diferentes
programas de cómputo, y aún diferentes programas para la misma prueba, varían
en cuanto a en qué están basadas sus declaraciones interpretativas. Aunque la
CBTI generalmente incrementa la validez y utilidad de las interpretaciones de
prueba, investigación considerable todavía debe ser hecha para poner la
interpretación computarizada como una sólida base empírica (ver Garb, 2000). Por
el momento, las interpretaciones generadas por computadora envolverán al menos
algunas fortalezas y debilidades de los métodos estadísticos y clínicos de toma de
decisiones.
Segundo, la limitación previamente notada de reglas estadísticas con respecto a

designar rangos de puntaje cuantitativos con descriptores cualitativos lleva a los
algoritmos de la CBTI. Un corte de puntos debe ser establecido, debajo del cual un
tipo o grado de declaración descriptiva es codificado y sobre la cual un diferente
tipo o grado de declaración será generado. Como consecuencia, dos personas que
muestran puntajes muy similares en algún índice o escala pueden ser descritos por
una narrativa computarizada en términos muy diferentes con respecto a
características psicológicas medidas por este índice o escala.
Tercero, a pesar de referirse con frecuencia específicamente a la persona que tomó

la prueba (usando los términos él, ella, o esta persona) y por lo tanto dando la
apariencia de ser ideográfica, las interpretaciones describen los protocolos de
prueba, y el sentido que ellas indican lo que los descubrimientos de investigación o
conocimiento clínico dicen sobre la gente en general que muestran los tipos de
puntajes de prueba y patrones que aparecen en el protocolo que está siendo
escaneado. De este modo las narrativas computarizadas son básicamente
nomotéticas, y la mayoría de ellas describen al menos algunas declaraciones
interpretativas en términos de comparaciones normativas e incluso, frecuencias
específicas con las cuales los patrones de prueba del examinado ocurren en ciertos
grupos de personas. Sin embargo, ya que dos personas no son exactamente iguales
y ninguna persona se ajusta perfectamente a un grupo de comparación, algunas
declaraciones interpretativas generadas por computadora pueden no describir a un
examinado con exactitud. Por esta razón, programas de computo de narrativas de
prueba bien desarrollados incluyen una advertencia indicando (a) las declaraciones
interpretativas a continuación, describen grupos de gente, no necesariamente al
examinado que tomó la prueba; (b) declaraciones erróneas y confusas pueden
ocurrir como una reflexión de características psicológicas o circunstancias
ambientales únicas al examinado y no ampliamente compartidas por cualquier
grupo normativo; y (c) otras fuentes de información y el juicio del asesor son
necesarias para determinar cual de las declaraciones en una narrativa interpretativa
aplica al examinado y cuales no.
Cuarto, la disponibilidad de las declaraciones interpretativas generadas por

computadora propone cuestiones sobre la utilización apropiada de tales en la
preparación de un reporte de evaluación. Idealmente, los evaluadores se deben
basar en ellas para asistencia, como por ejemplo, para estar seguros de haber
tomado en cuenta datos importantes, para revisar discrepancias entre sus propias
impresiones y las inferencias presentadas por la máquina, y quizás para obtener
alguna guía en cómo organizarse mejor y qué enfatizar en su reporte. Menos ideal
es usar las CBTI no meramente para apoyo sino como un reemplazo de los
evaluadores en su generación de interpretaciones de medidas que están usando.
La mayoría de los psicólogos de evaluación respondiendo a la encuesta mencionada
antes de McMinn y otros (1999) reportaron que nunca usan las CBTI como fuente
primaria de formulación de casos y cuestionarían éticamente el hacerlo.
Aún entre evaluadores éticos, las CBTI pueden presentar tentaciones, porque
muchas narrativas presentan oraciones cuidadosamente elaboradas y párrafos que
comunican claramente y se prestan para ser copiados literalmente en un reporte
psicológico. La integridad profesional sugeriría que los evaluadores que usan estos
medios expresen sus conclusiones con sus propias palabras o, si están copiando
literalmente lo hagan como una cita e indicando su fuente. Más allá de ética e
integridad, desafortunadamente, la accesibilidad de este tipo de programas permite
a personas no entrenadas a recolectar y calificar protocolos de pruebas y también
imprimir las interpretaciones narrativas y reproducirlas total o parcialmente en un
reporte, pasándolas como propias sin indicar la fuente. Aparte de ser cuestionable
en el ámbito ético, la inclusión literal de estas interpretaciones en reportes de
evaluación podría ser fuente de error y confusión, por el hecho de estar basados
normativamente más que ideográficamente e incluir con frecuencia declaraciones
que no son aplicables al examinado.
Fingimiento y Defensividad
Consisten en intentos conscientes y deliberados de los examinados de falsificar la
información dada por ellos y confundir al examinador. El fingimiento implica
presentarse como psicológicamente peor de lo que se está y se le llama
comúnmente fingirse mal. La defensividad implica dar la impresión de estar mejor
de lo que se está y se le llama comúnmente fingirse bien. Ambos pueden tener
grados de ligeramente exagerado en problemas y preocupaciones o de recursos y
capacidades, a la fabricación total de dificultades nunca experimentadas o logros
nunca alcanzados. Estos dos tipos de esfuerzo para confundir a los examinadores
usualmente son detectados por patrones de inconsistencia que aparecen en los
datos a menos que los examinados sean adiestrados para evitarlos.
Identificando Motivaciones para Fingir

La gente que finge estar mal en una evaluación psicológica está usualmente
motivada por alguna razón específica de querer parecer peor de lo que están. En
contextos clínicas, pacientes que desean recibir más ayuda o atención de la que
reciben exageran o fabrican síntomas para convencer al profesional en salud mental
que necesitan psicoterapia, o citas más seguidas o ser admitidos como pacientes,
etc. En contextos forenses, demandantes buscando el pago de perjuicios o daños
personales pueden fingir sus discapacidades neuropsicológicas o psicológicas para
incrementar el monto a recibir, y acusados penales pueden fingir o exagerar sus
disturbios para minimizar la pena recibida. En contextos laborales, los empleados
pueden fingir discapacidades para seguir recibiendo pagos de discapacidad o seguro
de desempleo.
La gente que finge bien durante las evaluaciones psicológicas, en un esfuerzo por
parecer más capaz o mejor de lo que son, muestra varios motivos en el contexto
donde están siendo evaluados. Los pacientes defensivos en el ámbito clínico pueden
esconder sus dificultades para ser dados de alta del hospital donde no quieren
estar, o cuando quieren oír que sus problemas o discapacidades no son tan grandes
como para necesitar tratamiento. En el campo forense, dar la mejor impresión
puede observarse en padres divorciados buscando custodia de los hijos y entre
presos solicitando libertad condicional. En contextos de personal, aplicantes para
posiciones, promociones y reinstalaciones luego de estar discapacitados tiene
buenas razones para fingirse bien en una evaluación psicológica inclusive
exagerando recursos y minimizando limitaciones.
Detectando Fingimiento y Defensividad

Los intentos por confundir a los evaluadores usualmente resultan en patrones de
inconsistencia que proveen pistas confiables hacia el fingimiento y la defensividad.
En el caso de fingirse mal, las inconsistencias aparecen de tres formas. Primero los
que fingen producen datos inconsistentes en las medidas de evaluación
individuales. Usualmente se le llama dispersión entre pruebas, lo que implica fallar
items de inteligencia y habilidad demasiado sencillos y aprobando otros mucho más
difíciles del mismo tipo, o responder de manera normal algunas porciones de la
prueba y extremadamente desviado en otras porciones de la misma prueba.
Una segunda forma de inconsistencia frecuentemente encontrada ocurre entre

resultados de pruebas y observaciones del examinador sobre comportamiento. En
algunas instancias, la gente que parece calmada y relajada en una entrevista, habla
clara y sensiblemente de varios asuntos y se conducen apropiadamente, luego
producen protocolos de pruebas similares a personas extremadamente ansiosas y
molestas, incapaces de pensar lógicamente alejadas de la realidad e incapaces de
participar de relaciones interpersonales. Tales discrepancias sugieren fuertemente
el uso de tales tácticas para crear una falsa impresión de disturbio.
La tercera forma de inconsistencia consiste en una discrepancia entre la entrevista

y los datos de prueba recolectados por el examinador y las circunstancias pasadas y
presentes del examinado reportadas por fuentes colaterales o registradas en
documentos formales. En estas instancias la persona puede actuar o hablar
extrañamente en una entrevista y dar respuestas que sugieren gran disturbio
psicológico, pero nunca haber visitado antes un profesional en salud mental, o
recibir tratamiento o psicoterapia, haber sido prescrita drogas psicotrópicas o ser
considerada por parientes, amigos y otros como con problemas emocionales. Tales
contrastes de discapacidades o limitaciones vistas en exámenes y entrevistas
proveen buena razón para sospechar fingimiento.
En cuanto a la defensividad igualmente mostrará resultados de inconsistencias en

los datos de evaluación. Lo más común es ver protocolos de pruebas y respuestas
de entrevistas informativas que están lejos de reflejar una historia documentada de
desorden psicológico o problemas de comportamiento. Aunque guardarse y callarse
puede ayudar a ocultar dificultades, también alerta al examinador de que el
examinado no está siendo tan sincero y los datos no reflejan los verdaderos
problemas y limitaciones de la persona. Como otra posibilidad, los examinados que
se fingen bien, más bien hablan demasiado para tratar de impresionar al
examinador de sus cualidades y capacidades. En cuyo caso la información de
evaluación se hace notable por que dicen tener conocimiento, habilidades virtudes y
logros que exceden una razonable probabilidad. Estas y otras guías para la
detección clínica de esfuerzos por confundir a los evaluadores son elaboradas por
Berry, Wetter, y Baer (2002), McCann (1998, capítulos 3-4), y Rogers (1997ª).
La mayoría de los inventarios de auto-reporte incluyen escalas de validez que están

basadas en respuestas inconsistentes o difíciles de creer que pueden ayudar a
identificar el fingimiento y la defensividad. (Greene, 1997; ver también el capítulo
de Nagliery y Graham en este volumen). Una variedad de medidas de entrevistas,
auto-reportes y de habilidad también ha sido desarrollada para ayudar a identificar
fingimiento, incluyendo la Entrevista Estructurada de Síntomas Reportados (SIRS;
Rogers, Gillis, Dickens y Bagby, 1991; ver también Rogers, 1997b), la prueba M
para detectar esfuerzos por fingir esquizofrenia (Beaber, Marston, Michelli y Mills,
1985; ver también Smith, 1997), y la Prueba de Fingimiento de Memoria (TOMM;
Tombaugh, 1997; ver también Pankratz y Binder, 1997). Otras medidas proyectivas
y expresivas comúnmente usadas no incluyen escalas de validez formal, pero son
muy sensibles a inconsistencias en su desempeño que sugieren fingimiento o
defensividad (Schretlen, 1997; ver también el capítulo de Ben-Porath en el
presente volumen). Aún más, debido a que medidas expresivas relativamente no
estructuradas tienen mucho menos sentido para los examinados que los
cuestionarios de auto-reporte en cuanto a lo que significan sus respuestas, hay
razón para creer que pueden ser menos susceptibles al manejo de impresión o
incluso que el fingimiento de un instrumento de evaluación está directamente
relacionado con su validez facial (Bornstein, Rossner, Hill y Stepanian, 1994). Esto
no significa que las medidas no estructuradas como el Método Mancha de Tinta de
Rorschach y la Prueba de Apercepción Temática son impenetrables a fingimiento y
defensividad, por que no lo son, pero solo esos esfuerzos para confundir pueden ser
más obvios y menos probables de transmitir la impresión deseada en estas medidas
que en medidas relativamente estructuradas.
Entrenamiento
Un asunto relacionado a la facilidad o dificultad para fingir medidas de evaluación
es que los examinados pueden ser enseñados a engañar a los examinadores con
una actuación buena o mala según el caso. Los descubrimientos de investigación
indican que incluso participantes psicológicamente inocentes a quienes se les da
cierta información sobre la naturaleza de la gente con ciertos desórdenes o
características, pueden formar su comportamiento para parecerse al grupo objetivo,
de lo que lo harían sin instrucción. Resultados confusos son más probables de
ocurrir cuando los examinados han sido entrenados en cómo responder
específicamente a ciertos tipos de preguntas y evitar escalas de validez elevadas
(Ben-Porath, 1994; Rogers, Gillis, Bagby y Monteiro, 1991; Storm y Graham,
2000). Los descubrimientos de grupo en estos estudios de investigación no han
indicado si un examinado generalmente instruido o específicamente entrenado
puede confundir totalmente a un experimentado examinador en la práctica real, sin
generar ninguna sospecha de que los resultados obtenidos pueden no ser válidos, y
esto puede ser sujeto de más investigación.
Con respecto a las evaluaciones individuales en la práctica real, hay reportes en la

literatura de instancias en las cuales abogados que han entrenado a sus clientes
sobre cómo contestar las preguntas de inventarios de auto-reportes (Lees-Haley,
1997; Wetter y Corrigan, 1995; Youngjohn, 1995) y un sitio de web disponible en
la Internet dicen supuestamente dar una lista de respuestas buenas y malas para
cada mancha de tinta Rorschach. Como se mencionó antes al discutir la seguridad
de las pruebas, el conocimiento previo de las preguntas y respuestas de prueba
pueden restarse de la utilidad práctica de los métodos de evaluación psicológica
que son de respuesta correcta e incorrecta. El efecto de confusión por saber la
información antes de la prueba o medida no estructurada, para las cuales las
respuestas correctas o preferidas son difíciles de especificar fuera de contexto,
puede ser mínimo, pero la susceptibilidad de tales medidas a una exitosa mentira
es otro tópico de futuras investigaciones. Menos incierta es la ética cuestionable de
los que entrenan a los examinados, frenando los verdaderos propósitos para la
toma de pruebas.
Integrando Fuentes de Datos
Como se notó al inicio de este capítulo, la información de evaluación psicológica
puede ser derivada de la administración de pruebas, entrevistas, observación de
comportamiento, hablar con personas colaterales, y revisar documentos históricos.
La efectiva integración de datos obtenidos de múltiples fuentes llama a
procedimientos basados en las funciones aditivas, confirmatorias y
complementarios descritas antes ejecutadas por una batería de pruebas
multimétodos. En algunas instancias, por ejemplo, un examinado puede reportar un
problema para el que no hay un índice de prueba válido (ser abusado
sexualmente), y puede demostrar en la prueba un problema que no es medido
ordinariamente por datos de entrevista (pobre coordinación perceptual-motora).
Estas dos fuentes de datos pueden ser usadas aditivamente para encontrar que la
persona tiene un desorden de uso de sustancias y una discapacidad
neuropsicológica. En otra instancia, una persona que se describe en una entrevista
como brillante y bien educado con habilidades de liderazgo y fuerte trabajo ético, y
luego produce documentos confiables que comprueban esas mismas características,
ofrece a los evaluadores una oportunidad del uso confirmatorio de estas diferentes
fuentes de datos para dar certeza a un positivo reporte del personal.
Un tercero y más complicado grupo de circunstancias implica a un examinado que

se comporta agradablemente y con deferencia hacia el asesor, reporta ser una
persona amable y con buen humor, y produce respuestas de prueba limitadas y casi
convencionales que caen en el rango normal. Al mismo tiempo es descrito por los
amigos y parientes como furioso y abusivo, y reportes de policía muestran registros
de arrestos por asalto y violencia doméstica. Familiar a los psicólogos forenses, este
patrón de discrepancia de datos puede ser explicado al usarlos de manera
complementaria para inferir defensividad y un enfoque de fingirse bien en
situaciones de entrevista y prueba. Otro ejemplo en contextos educativos, un
estudiante con grados bajos sugiere limitada inteligencia pero su desempeño en la
prueba indica considerable inteligencia da a los evaluadores la base para creer
complementariamente que los datos divergentes infieren la probabilidad de estar
psicológicamente determinado a estar por debajo de sus logros.
Por el incrementado entendimiento de lo que la gente puede obtener de la

integración de múltiples fuentes de información, la evaluación psicológica completa
utiliza todos los datos disponibles durante la fase de interpretación del proceso de
evaluación. La consideración de conducir evaluaciones psicológicas toca la cuestión
de cuántos datos se deben recolectar. Teóricamente, nunca hay demasiada
información en una evaluación. Puede haber información redundante que sirve
como evidencia confirmatoria, y puede haber información irrelevante que no sirve
para contestar las preguntas de referencia, pero los examinadores pueden escoger
desechar la primera e ignorar la segunda. Aún más, todos los datos recolectados
reflejan las características psicológicas del examinado mostrando su
comportamiento y por lo tanto puede ser útiles para conocer al examinado.
Por otro lado, hay límites prácticos de cuanta información recolectar para guiar la
formulación de interpretaciones. Sobre todo, los evaluadores psicológicos son
responsables por conducir evaluaciones de manera efectiva en costo que provee
respuestas adecuadas a las preguntas de referencia con el menor desperdicio de
tiempo y dinero. Como se dijo antes, los practicantes que proveen y cobran por
servicios que saben no harán la diferencia están explotando a los examinados y
poniendo en juego su respetabilidad profesional. Los psicólogos de evaluación
pueden diferir en cuanto a cuánto es suficiente para conducir una evaluación
adecuada, pero generalmente reconocen sus obligaciones éticas de evitar ir más
allá de lo que creen será útil.
En cuanto a proveer respuesta a las preguntas de referencia, dos guías adicionales

pueden ayudar a los psicólogos de evaluación a construir la evaluación de datos a
su disposición. Primero, tomando en cuenta las indicaciones de las fortalezas y
debilidades psicológicas en los examinados, los evaluadores pueden presentar una
descripción balanceada de sus activos y pasivos. La evaluación psicológica
primordialmente muestra lo que está mal en una persona y no toma en cuenta sus
capacidades de adaptación, posibles potenciales, y cualidades admirables. Para
mantener las tendencias actuales de la psicología de mostrar el bienestar, felicidad,
optimismo y otros posibles rasgos de la condición humana (ver Seligman y
Csikszentmilhalyi, 2000), la psicología de evaluación cumple mejor sus propósitos
cuando el proceso interpretativo da medida completa de capacidades y limitaciones
del funcionamiento.
Segundo, al reconocer que las inferencias e impresiones derivadas de los datos son
probables de variar en fortaleza de la evidencia que las apoya, los examinadores
pueden hacer sus declaraciones interpretativas en un lenguaje que transmita su
confianza en lo que tienen que decir. La mayoría de los examinados da evidencia
clara y convincente de alguna característica psicológica, que el examinador puede
reportar en lo que se llama lenguaje de certeza. Este establece en términos directos
qué le gusta a la gente y cómo se conducen, como por ejemplo “este estudiante
tiene una marcada discapacidad de lectura” o “el señor M parece ser una persona
impulsiva con limitado auto-control”. Para otras características del examinado, la
evidencia puede ser fragmentada o sugestiva más que impuesta y conclusiva, en
cuyo caso las impresiones son apropiadamente reportadas en lo que se llama
lenguaje de conjetura. Este sugiere o especula sobre los posibles rasgos de la
naturaleza y comportamiento de una persona, por ejemplo “Hay alguna evidencia
que sugiere que este niño puede tener una deficiencia de proceso de audición” o
“ella ocasionalmente muestra tendencias de ser inflexible en su enfoque de los
problemas, lo que puede limitar su creatividad como ejecutivo en toma de
decisiones”.
UTILIZANDO LA INFORMACIÓN DE EVALUACIÓN

El proceso de evaluación culmina con la utilización de descripciones de
características psicológicas y de comportamiento como base para formular
conclusiones y recomendaciones. Información de interpretaciones o evaluación
ahora son traducidas en sus implicaciones para varias decisiones, y el propósito
general y eventual objetivo de la evaluación puede ser concebido como una forma
de facilitar la toma de decisiones sobre clasificación, selección, colocación,
diagnóstico, y tratamiento del examinado. En esta fase de producción, se debe
tomar en cuenta que los datos de evaluación y descripciones que se dan pueden
tener diferentes implicaciones para diferentes tipos de personas en diferentes
circunstancias. Lo más importante de esto son las posibles fuentes de desviación,
tasas base aplicables, juicios de valor que llaman a ajustes de corte de puntajes, y
la historia cultural y contexto social del examinado. Buenas decisiones de
evaluación dependen de reconocer estas consideraciones y prevenirlas de ejercer
influencias en las conclusiones y recomendaciones.
Desviación y Tasas Base

Como elaborado por el capítulo de Reynolds y Ramsay en el presente volumen, la
desviación ocurre en la utilización de información cuando los examinadores
permiten que nociones preconcebidas y creencias influencien su visión de las
implicaciones de sus datos. La desviación se puede dar sin advertirla, de actitudes
que los examinadores no saben que las tienen o son inconscientes de su parte. Sea
advertidamente o no, la desviación toma forma de expectativas que afecta el
significado de sus descubrimientos, y se originan en creencias demográficas,
impresiones del ambiente, y nociones epidemiológicas.
Como ejemplo de creencia demográfica, un asesor que piensa que los ancianos y
varones en general se desempeñan mejor que los jóvenes y las mujeres pueden
asesorar la contratación de un hombre de 45 años más no la de una mujer de 30
para una posición de jefatura, aún cuando la información de evaluación psicológica
de ambos sea comparable o incluso favorable para la mujer. Similarmente, un
asesor que tiene la convicción de que los afro americanos son menos probables de
responder a psicoterapia que los caucásicos puede no recomendar psicoterapia a los
primeros y no a los segundos, aún cuando ambos muestren accesibilidad al
tratamiento.
Las impresiones ambientales como una fuente de expectativas desviadas se refiere

a los casos donde los evaluadores conducen una evaluación. Los psicólogos que
trabajan en instituciones de internos donde un gran porcentaje de los pacientes
están psicóticamente perturbados puede esperar que la mayoría de sus examinados
sea psicótico o inclinados a la psicosis de datos que no lo hubiera llevado a tal
conclusión en otra institución en donde los disturbios psicóticos son vistos
raramente. Similarmente, los psicólogos evaluando presos, entre quienes el
desorden de personalidad antisocial es comúnmente encontrado, puede ser más
probable de esperar tal diagnóstico de lo que sería en un centro de consejería
universitaria.
En cuanto a las nociones epidemiológicas, los examinadores pueden estar

influenciados sabiéndolo o no, en sus conclusiones o visión de naturaleza e
incidencia de varias condiciones. Los que creen que el desorden de personalidad
borderline es muy frecuente probablemente diagnosticará tal desorden más
frecuentemente que otros que piensan que a esta categoría diagnóstica le falta
precisión y que es usada demasiado frecuentemente. Los que creen que el
desorden de atención y déficit/hiperactividad (ADHD) ocurre principalmente en
varones y la anorexia en mujeres, probablemente no lo diagnosticará al revés.
En todas esas instancias de posible influencia derivadas de expectativas

demográficas, ambientales y epidemiológicas, el reto de los psicólogos es reconocer
sus desviaciones personales y prevenir tanto como puedan de ejercer influencia en
sus conclusiones y recomendaciones derivadas de datos de evaluación. Por otro
lado, los ejemplos previos fueron escogidos para indicar que las expectativas
epidemiológicas y ambientales pueden tener alguna base de hecho. Hay más
pacientes psicóticos en hospitales que en poblaciones clínicas, hay mas individuos
antisociales en las cárceles que en las universidades, hay más diferencias de sexo
en la incidencia de la anorexia y el ADHD. Desde un punto de vista estrictamente
actuarial, estar hospitalizado incrementa la probabilidad de ser psicótico, estar en la
cárcel aumenta la probabilidad de ser antisocial y ser mujer incrementa la
probabilidad de ser anoréxica. Tomar en cuenta tales ubicaciones y diferencias de
grupo, implica estar alerta a la información de tasas base que puede estar
disponible en el caso individual.
La información de tasa base se refiere a la frecuencia esperada de una
característica o comportamiento en personas o circunstancias particulares. La
atención a ella provee una manera de estimar la utilidad de los procedimientos de
evaluación, particularmente con respecto a su eficiencia en evaluar eventos raros.
Como primeramente identificadas por Meehl y Rosen (1955) las tasas base pueden
ser problemáticas para medir instrumentos cuando su frecuencia esperada de
evento cae a menos de 50%. Una ubicación clínica en donde el 10% de los
pacientes son suicidas, una prueba válida de suicidio que tiene una tasa de 60%
(identifica correctamente el 60% del tiempo a gente suicida o no suicida en
general) es técnicamente menos eficiente que simplemente llamar a todos los
pacientes no suicida, lo que sería correcto el 90% del tiempo.
Aunque técnicamente correcta desde una perspectiva psicométrica, este tipo de

énfasis de tasa base en la eficiencia no siempre satisface las prioridades en la
práctica. Métodos de evaluación que son ineficientes en evaluar suicidio, dada su
baja tasa base aún en la mayoría de poblaciones de pacientes, pueden sin embargo
identificar correctamente un subgrupo de pacientes en los cuales dicho
comportamiento es probable de ocurrir. Un examinador puede recomendar
precauciones de suicidio lo que sería preferible a obviar tal potencial del grupo de
alto riesgo al ejercer una opción más eficiente de llamar a todos los pacientes no
suicidas.
El problema de la tasa base también puede ser minimizado al enfocar los esfuerzos
de evaluación en poblaciones restringidas en las cuales la frecuencia de la
característica es menos rara que en la población general. Kamphuis y Finn (2002)
nota que entre más cerca de 50% esté la tasa base, mejores prospectos tiene una
medida válida de mejorar la eficiencia de concluir que todos o nadie tiene cierta
característica o tendencia de comportamiento. Como un ejemplo de incrementar la
tasa base restringiendo la población, la predicción eficiente de comportamiento
violento entre la población en general es difícil de alcanzar, debido a que la mayoría
de gente no es violenta. En una población de ofensores criminales, sin embargo,
muchos de los que tienen una historia de violencia, una medida válida de violencia
potencial puede ser bastante eficiente en identificar a los que están en mayor
riesgo de un comportamiento violento en el futuro.
Juicios de Valor y Corte de Puntajes

Los juicios de valor en el presente contexto se refieren a los propósitos para los
cuales la persona está siendo examinada en relación con resultados de falsas
positivas y falsas negativas que la variable de evaluación probablemente producirá.
Los resultados falsos positivos resultan en decisiones basadas en asumir que la
gente tiene ciertas condiciones y comportamiento que en realidad no tienen,
mientras que las falsas negativas resultan de suponer que a la gente le faltan
condiciones o comportamientos que en realidad tienen o los caracterizan. Cuando
las evaluaciones se hacen para tomar decisiones sobre características psicológicas y
sus consecuencias que la mayoría de la gente vería como no deseable, como ser
suicida u homicida, las falsas positivas preocupan más que las falsas negativas. Una
falsa positiva relacionada con peligrosidad puede resultar en una persona siendo
innecesariamente vigilada o incluso restringida, lo que es un resultado lastimoso
pero no fatal. Por el otro lado una falsa negativa, al no identificar la peligrosidad de
alguien puede resultan en la pérdida de una vida.
Opuestamente, las falsas positivas pueden ser más problemáticas cuando las
preguntas de referencia conciernen a características y consecuencias deseables,
como si dar a una persona una beca, un trabajo, un ascenso, o una libertad
condicional. Las falsas negativas de este topo de situación de evaluación pueden
resultar en negarle a alguien oportunidades que merecen o por las que califica, lo
que es desventajoso e injusto como individuos. Sin embargo. Cuando las falsas
positivas resulta en la promoción de persona cuyas habilidades no son suficientes
para el puesto, o la libertad condiciona para una persona altamente peligros,
entonces otros aparte del individuo pueden sufrir graves consecuencias.
En relación con tales juicios de valor, un set de datos de evaluación puede tener
diferentes implicaciones en diferentes circunstancias de evaluación y por lo tanto
hacer que los evaluadores seleccionen cuidadosamente los cortes de puntaje que
utilizan para formular conclusiones y recomendaciones. Para dimensiones
cuantificables de evaluación que correlaciona positivamente con la presencia de una
característica o tendencia de comportamiento, el mover la escala numérica hacia
arriba produce una disminución progresiva del porcentaje de falsas positivas, y
moverla hacia abajo produce una disminución progresiva de las falsas negativas;
pasará lo mismo con dimensiones de evaluación que están inversamente
correlacionadas con lo que miden. Como manera de decidir las implicaciones de los
descubrimientos de evaluación en una circunstancia particular, los cortes de
puntaje pueden ser seleccionados para minimizar la probabilidad de resultados
falsos positivos en consecuencias deseables y los falsos negativos en las
consecuencias indeseables.
Cultura y Contexto
Así como la información de evaluación tiene diferentes implicaciones para los
examinados en diferentes ubicaciones y para diferentes propósitos, también varían
en significado para los examinados de diferentes culturas o contextos sociales.
Entonces, la fase de utilización del proceso de evaluación debe siempre tomar en
cuenta cómo las características de los individuos identificadas en la fase
interpretativa podrán afectar su funcionamiento psicológico en sus circunstancias
particulares. La atención a influencias de cultura cruzada tiene una larga historia en
la psicología de evaluación (ver Hallowell, 1951; Lindzey, 1961) y ha visto una
resurgencia de interés, como la descrita en el capítulo de Geisinger en este
volumen y las contribuciones de Dana (1993, 2000b), Kazarian y Evans (1998),
Suzuki, Ponterotto, y Meller (2000), y Williams, Satterwhite y Saiz (1998).
La distinción hecha en este panorama del proceso de evaluación entre interpretar y

utilizar la información de evaluación provee algunas guías útiles para un proceso de
dos pasos al tomar en cuenta la historia y diferentes situaciones entre los
examinados. La fase interpretativa provee el primer paso, que consiste en llegar a
declaraciones descriptivas como existen, independientemente del contexto y
circunstancias culturales. Tener inteligencia superior, ser ordenado y compulsivo,
experimentar pérdida de memoria, ser emocionalmente reservado, tender a ser
asertivo y competitivo, y ser propenso a ansiedad aguda en lugares no conocidos,
son ejemplos de características que definen la naturaleza del individuo. Como
revelado por los datos de evaluación, tales características estarán presentes en la
gente sin importar donde vivan, de donde vienen, y en qué están implicados. La
fase de utilización del proceso provee el segundo paso, que implica ser
suficientemente sensible a los contextos culturales y de experiencia para estimar
con exactitud las implicaciones de sus características psicológicas en sus
circunstancias de vida en particular. Especialmente importante es determinar si sus
características psicológicas son probablemente adaptativas o maladaptativas en su
mundo diario y qué tipos de adaptación (exitosa o no) puede resultar de esas
características en sus circunstancias particulares.
Los descubrimientos de investigación documentan que las diferencias culturales

pueden llevar a variaciones de cultura cruzada en características psicológicas
modales, y que las demandas y expectativas que la gente enfrenta con frecuencia
determinan las implicaciones y consecuencias de características particulares,
especialmente en cuanto a cuán adaptativas son (ver Kazarian y Evans, 1998). Por
ejemplo una persona generalmente pasiva, dependiente, agradable y conforme
puede ser propensa a dificultades de ajuste en un contexto cultura que valora la
autonomía, auto-confianza, asertividad, y competitividad. Contrariamente, una
persona ferozmente independiente y altamente competitiva puede sentirse cómoda
y florecer psicológicamente en una subcultura que valora la asertividad, pero
sentirse alienada y pobremente adaptada en una sociedad que subordina las
necesidades y preferencias individuales a los deseos y bienestar del grupo, en
donde la otra persona (pasiva y conforme) se sentiría bien.
Estas influencias contextuales sobre las implicaciones de las características

psicológicas tienden a ampliar los contextos socioculturales. Un modesto nivel de
inteligencia puede ser fuente de comodidad y éxito para gente joven cuyas
expectativas personales y familiares son simplemente que se graduaron del colegio,
pero una fuente de fallo y desaliento para aquellos para los que una graduación de
un prestigioso colegio es una expectativa mínima. Similarmente, una persona con
buenas habilidades para adaptarse a situaciones que lleva una pesada carga de
responsabilidades y confronta numerosos obstáculos para sobrellevarlas puede ser
susceptible de ansiedad, irritabilidad y otras consecuencias de la carga de estrés,
mientras que una persona sin habilidades para adaptarse que lleva una vida fácil y
sin muchas demandas puede mantener un cómodo equilibrio psicológico y
experimentar poco estrés. Igualmente, una persona contemplativa que valora ser
cuidadosa de completar tareas y llegar a conclusiones puede llevar mejor una
situación de trabajo que llama a la exactitud y complexión e implica poca presión
de tiempo, pero puede desempeñarse mal en una posición con límites de tiempo o
toma de decisiones rápidas, en las cuales una persona más decisiva y orientada a la
acción funcionaría más efectivamente.
Como se ilustra en el ejemplo final y los precedentes, la evaluación psicológica es

un proceso complejo. Se necesita muchas perspectivas y atención a variables
interactivas para expandir conocimiento y guiar su aplicación práctica, y poco se
puede ganar de pronunciamientos doctrinarios de enfoque unidimensionales. Para
recolectar, interpretar y utilizar datos efectivamente, debemos dar a cada asunto
identificado de este proceso, su justo derecho, y los 24 capítulos que siguen están
diseñados para ese propósito.

Lectura 1

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Lectura 1

Uploaded by

Copyright:

Available Formats

EL PROCESO DE EVALUACIÓN

La psicología de la evaluación es un campo en la ciencia del comportamiento que se

El uso de tests provee un método de recolectar información dentro de un marco

Las diversas maneras en que los procedimientos de evaluación son empleados

Este capítulo introductorio establece el escenario para lo que sigue, al conceptuar la

El proceso de recolectar información de evaluación comienza con una formulación

Aún cuando adecuadamente especificado, las preguntas de referencia no son

Como un reto mayor al formular objetivos de evaluación, a preguntas de referencia

Hay pocas maneras de saber con anterioridad en hecho de cuales fuentes de

El hecho de que la evaluación psicológica puede proceder efectivamente sin

No obstante, la prueba psicológica se distingue entre los procedimientos de

Estos ejemplos de relevancia pueden parecer demasiado obvios para ser

En la práctica, sin embargo, una estricta adherencia a las guías de validez

Funciones de Pruebas Aditivas, Confirmatorias y Complementarias

Algunas preguntas de referencia requieren la selección de múltiples pruebas para

Otras situaciones de evaluación pueden crear la necesidad de evidencia

La función confirmatoria de una batería multi-pruebas es especialmente útil cuando

La metodología óptima para ampliar la validez de constructo de la investigación

Tal prueba confirmatoria es ejemplificada en aplicaciones del Inventario de

Quizás, como una posible explicación, el examinado tiene algunas preocupaciones

Como lo muestran estos ejemplos, múltiples medidas de la misma característica

Asuntos del Examinador

A pesar de la claridad de estas declaraciones y el considerable detalle provisto en

El segundo asunto persistente concierne a la evaluación por personas que no son

La influencia personal más importante que los examinadores no pueden modificar

A diferencia de cualidades fijas, la manera en que los examinadores conducen el

Dos otros asuntos del examinado que influencian el proceso de recolección de

Asuntos de Manejo de Datos

Recolección Computarizada de Datos

Estas características del manejo computarizado de datos trae varios beneficios al

La recolección computarizada de información tiene algunas desventajas potenciales

Una segunda desventaja potencial de la recolección de datos computarizados deriva

Estas consideraciones en salvaguardar la seguridad de las pruebas también tienen

Interpretando la Información de Evaluación

Siguiendo la recolección de datos relevantes suficientes, el proceso de evaluación

Bases de Inferencias e Impresiones

Guías Empíricas y Conceptuales

Aún más, ni los enfoques intuitivo o autoritario para interpretar la información de

Ambas guías de interpretación traen distintos beneficios al proceso de evaluación.

De acuerdo con eso, el proceso de llegar a conclusiones en evaluación de un caso

Reglas Estadísticas y Juicio Clínico

Por ejemplo, reglas estadísticas pueden probar ser útiles al determinar si un

Por otro lado, la aplicabilidad de juicios clínicos es infinita, y su extensión y

El relativo mérito de las reglas estadísticas y el juicio clínico en el proceso de

Como testimonio de la utilidad de ambos enfoques, es importante notar que la

Por otro lado, la diversidad de gente previamente notada y de circunstancias que

La practica de evaluación debería estar sujeta e influenciada por estudios de

Énfasis Nomotético e Ideográfico

Las interpretaciones nomotéticas se refieren a maneras en las cuales la gente se

Las interpretaciones ideográficas, por contraste, se refieren a maneras en que la

En el área de la evaluación de personalidad, los enfoques nomotéticos e

Para temperar estos puntos de vista a la luz de lo que ya se ha dicho sobre

Declaraciones Interpretativas Generadas por Computadora

Primero, aunque un programa de cómputo genera declaraciones interpretativas por

Segundo, la limitación previamente notada de reglas estadísticas con respecto a

Tercero, a pesar de referirse con frecuencia específicamente a la persona que tomó

Cuarto, la disponibilidad de las declaraciones interpretativas generadas por

Identificando Motivaciones para Fingir

Detectando Fingimiento y Defensividad

Una segunda forma de inconsistencia frecuentemente encontrada ocurre entre

La tercera forma de inconsistencia consiste en una discrepancia entre la entrevista

En cuanto a la defensividad igualmente mostrará resultados de inconsistencias en

La mayoría de los inventarios de auto-reporte incluyen escalas de validez que están

Con respecto a las evaluaciones individuales en la práctica real, hay reportes en la