You are on page 1of 44

MASTER INTERVENCIÓN EN

LA ANSIEDAD Y EL ESTRÉS

Universidad Complutense de Madrid

CUESTIONARIOS, INVENTARIOS Y ESCALAS

Juan José MIGUEL-TOBAL

INDICE

1. Introducción

2. Los Autoinformes

2.1. Sobre la fiabilidad y la validez

2.2. Dificultades de la medición a través de autoinforme

2.2.1. Las distorsiones de respuesta

2.3. Tipos de autoinforme

3. Cuestionarios, inventarios y escalas

3.1. Estrategias de construcción

3.2. Tipos de Cuestionarios

4. La utilización de cuestionarios y otras técnicas de autoinforme en Terapia y


Modificación de Conducta

3.3.1. Áreas de evaluación preferente

3.3.2. Revisión del empleo de autoinformes en la Terapia de Conducta.

4. Algunos cuestionarios de utilización clínica

4.1. Cuestionarios de evaluación de la ansiedad

4.1.1. Fear Survey Schedule III - FSS III. "Escala de Reconocimiento de


Miedos"

4.1.2. Inventario de Situaciones y Respuestas de Ansiedad -ISRA

4.2. Cuestionarios de evaluación de la depresión

43
4.2.1. Beck Depression Inventory -BDI. "Inventario de Depresión de
Beck"

5. Lecturas recomendadas

6. Autoevaluación

7. Bibliografía

44
CUESTIONARIOS, INVENTARIOS Y ESCALAS

Juan José MIGUEL TOBAL

1. INTRODUCCION
Bajo el término de autoinforme se incluye un conjunto bastante heterogéneo de
técnicas e instrumentos, de amplia utilización en la historia de la evaluación
psicológica. Desde los trabajos pioneros del siglo XIX, en que estructuralistas y
funcionalistas emplearon el autoinforme, -basado en la introspección- como elemento
primario para la comprensión del funcionamiento psicológico (Bellack y Hersen, 1977);
hasta nuestros días, -con el predominio de las orientaciones cognitiva y cognitivo-
conductual-, los autoinformes han sido los instrumentos más importantes en la
evaluación psicológica.

Como recientemente señalaba Fernández-Ballesteros (1991, p.263) "podemos


afirmar que una nada despreciable parte de la metodología utilizada tanto en "settings"
básicos como aplicados, se está realizando por medio de las informaciones verbales
que los sujetos dan sobre sí mismos". Ello incluye a gran parte de la investigación
sobre las funciones y procesos psicológicos (desde la emoción hasta la memoria y la
resolución de problemas), buen número de los estudios de psicología de la
personalidad y de psicología social, y a las distintas áreas aplicadas (como la
psicología clínica y de la salud, la psicología de la educación y la psicología del trabajo
y las organizaciones, entre las más relevantes).

Sin embargo, desde el ámbito conductual, los autoinformes han sufrido


tradicionalmente un cierto rechazo, aunque es de señalar que éste ha sido en buena
medida de carácter reactivo y más teórico que real, como veremos con detalle más
adelante.

Cuando hablamos de rechazo reactivo nos referimos fundamentalmente a dos


hechos. Por un lado, el psicoanálisis ha utilizado como fuente primaria de obtención de
datos los autoinformes retrospectivos y los basados en la libre asociación; por otro, la
psicología de los rasgos a empleado con profusión los autoinformes en busca de
constructos estable de carácter interno que expliquen la conducta. En el primero de los
casos, John B. Watson puso de relieve las limitaciones de la introspección como
técnica válida para la investigación científica. En el segundo, Mischel (1968) cuestionó
de manera certera la validez externa de los autoinformes tradicionales, los cuales
consideraban el comportamiento humano de forma holística y consistente a través de
las situaciones.

Sin embargo, como señala Fernández-Ballesteros (1991), la crítica de Watson


iba dirigida a la introspección analítica y no a los autoinformes, ya que el mismo
consideraba de utilidad hacer pensar a los sujetos en voz alta en relación con sus
problemas específicos (Watson, 1920), convirtiéndose así en pionero de la técnica de
1
pensamientos en voz alta. En cuanto a la crítica a la validez externa de los
cuestionarios de rasgos, realizada por Mischel y referida a la baja predicción de
respuestas específicas, Bellack y Hersen (1977) apuntan que la escasa correlación
entre autoinforme y conducta manifiesta puede deberse más a la premisa de
generalidad de la conducta de la que parten, que al método en sí mismo.

Skinner (1953, 1987) y el conductismo radical admitían los autoinformes como


un tipo de conducta manifiesta (conducta verbal) que sigue los mismos principios que
otros tipos de conducta, pero señalando que son producto de la experiencia subjetiva y
ésta es un epifenómeno; sin embargo esta posición ha variado notablemente con el
tiempo, considerándose actualmente que los autoinformes constituyen la única vía
directa de acceso a muchos de los eventos internos y son útiles para la predicción y
control de la conducta.

2. Los autoinformes
El autoinforme puede ser considerado como una derivación de la auto-
observación (Fernández-Ballesteros, 1980) y se refiere a la información verbal que un
individuo proporciona sobre sí mismo, o sobre su comportamiento.

Su amplia utilización se debe fundamentalmente a razones de tipo práctico, ya


que la observación y el registro psicofisiológico implican un alto coste -en tiempo,
esfuerzo, personal especializado, etc.- y presentan importantes limitaciones en cuanto
a su aplicabilidad. Así la observación solamente puede ser empleada para la
evaluación de respuestas motoras o expresivas y el registro psicofisiológico para
respuestas de carácter fisiológico; mientras que, el autoinforme es mucho más sencillo
en su empleo y permite valorar los tres sistemas de respuesta: cognitivo, fisiológico y
motor.
Es necesario matizar que el sujeto puede informar sobre sus respuestas
motoras; tales como, temblores, consumo de alcohol o conductas de evitación; y
hacerlo además asociando estas respuestas a situaciones concretas. También puede
informar sobre respuestas de carácter fisiológico; como taquicardia, dolor de cabeza o
sequedad de boca en distintas situaciones; si bien en este caso existen notables
limitaciones, ya que no es posible informar de respuestas psicofisiológicas no
percibidas (por ejemplo, cambios en la presión sanguínea o en la conductancia
eléctrica de la piel, entre otras). Además puede suministrar información sobre su
experiencia subjetiva y sobre respuestas de tipo cognitivo, tales como inseguridad,
preocupación o sentimientos depresivos; así como sobre sus atribuciones, creencias,
expectativas, etc.

La información sobre respuestas motoras y fisiológicas puede ser contrastada


por otros métodos, la observación y los registros fisiológicos, siendo por tanto, el
autoinforme un método indirecto para la medida de estas respuestas, aunque
sumamente útil para la recogida de una primera información.

2
La información sobre las respuestas cognitivas y la experiencia subjetiva no
puede, sin embargo, ser contratada mediante ningún otro método, por lo que el
autoinforme es, al menos actualmente, el único método directo de recogida de
información sobre estas respuestas. Sobre este punto Fernández-Ballesteros (1992)
señala que el autoinforme puede ser considerado el método prioritario y directo por
excelencia a la hora de explorar los contenidos mentales del ser humano.

En resumen, el autoinforme permite la evaluación de los tres sistemas de


respuesta, siendo el método directo de medida -y además el único- del sistema
cognitivo-subjetivo, e indirecto de los sistemas fisiológico y motor. El método de
autoinforme posibilita también recabar información sobre las situaciones en que tiene
lugar la conducta, aspecto este descuidado por los teóricos del rasgo, siendo así la
información mucho más exacta, completa e integrable para su utilización en el análisis
funcional.

Las ventajas prácticas, aunque importantes, no son la única razón que explica el
actual auge del autoinforme. La evolución conceptual de la psicología ha traído
consigo un mayor interés por las variables de tipo cognitivo. Sin entrar aquí en
mayores detalles sobre las aportaciones de otras escuelas u orientaciones teóricas, a
partir de los años 60 se produjeron desde dentro del conductismo una serie de
cambios que hacían imprescindible tener en cuenta, además de los factores
ambientales (estímulos o situaciones), la forma en que el individuo conceptualiza e
interpreta el medio y sus propias acciones, sus valores, expectativas, etc.; siendo
necesario, por tanto, acceder a su experiencia subjetiva. Estos cambios se debieron
fundamentalmente a:

1. El desarrollo del aprendizaje social, que supone la intervención de procesos


cognitivos y variables sociales (Bandura y Walters, 1963; Bandura, 1969, 1977).

2. La importancia progresiva atribuida a los efectos informativos; por ejemplo, la


reconsideración del condicionamiento clásico de Rescorla, donde el estímulo
condicionado dependería de la cantidad de información que pueda suministrar el
estímulo incondicionado (Rescorla y Solomon, 1967; Rescorla y Wagner, 1972;
Rescorla, 1980).

3. El condicionamiento encubierto de Cautela (1967, 1973, 1978), junto con las


aportaciones terapéuticas de Mahoney (1974) y Meichembaum (1977), que rompían en
la clínica, con las limitaciones mecanicistas de posturas más tradicionales.

4. La consideración de límites biológicos y factores de predisposición más


individualizados; tales como, los efectos de preparación y contrapreparación
(Seligman, 1971; Herrnstein, 1977).

3
5. El desarrollo de teorías como la de la Expectativa para explicar la respuesta
de orientación (Bolles, 1972, 1979), o la de Levine (1975) que considera el aprendizaje
como un proceso de comprobación de hipótesis.

Coincidiendo con esta época de cambios en el conductismo, o de crisis para


muchos autores, y muy ligado a ellos, surge en la década de los 60 el cognitivismo.
Este enfoque ha ido tomando progresivamente cuerpo hasta llegar a dominar, junto
con las nuevas formulaciones conductistas o neoconductistas, la escena de la
psicología actual.

En nuestra opinión, este énfasis por los factores cognitivo-subjetivos no debe ir


en detrimento de los factores ambientales, sino que debe proporcionar una visión más
amplia e integradora del comportamiento humano, ya que, en último extremo, es la
forma en que el sujeto atiende, percibe e interpreta su contexto, proporcionándole
significado, lo que dota de relevancia a los distintos elementos situacionales. Como
señalan Vizcarro y García (1981, p. 234) "el informe del sujeto puede no ser objetivo
(en el sentido de no ser contrastable con otros métodos), pero en cualquier caso es útil
mientras refleje la visión que el sujeto tiene de su conducta o su entorno. Esta
distorsión, en sí, puede ser origen de determinados problemas y, por tanto, objeto de
modificación".

2.1. Sobre la fiabilidad y la validez


Con frecuencia las aproximaciones psicométrica y conductual han sido vistas
como antagónicas. Ello explica que los criterios psicométricos de calidad o bondad
derivados de la "teoría de tests", núcleo de la aproximación psicométrica, hayan sido
tradicionalmente asumidos sólo de forma muy parcial por la evaluación conductual. Sin
embargo, es importante recordar que los criterios de bondad tienen la función de
asegurar la calidad de la información recogida mediante los distintos instrumentos
empleados en la evaluación, sean estos del tipo que sean. De esta forma conceptos
como fiabilidad, validez y el concepto psicométrico de utilidad pueden, y deben, ser
tenidos en cuenta en la evaluación conductual, con vistas a lograr la deseada mejora
en la exactitud de la medida.

Somos, en este sentido, partidarios de la idea expuesta por Silva (1989), de


rescatar el aporte psicométrico para la aproximación conductual, buscando así la
integración de ambas vertientes. No es nuestro propósito en estas páginas profundizar
sobre estos temas, por lo que remitimos al lector interesado a la obra de Silva (1989)
donde se analizan de forma ampliamente documentada.

En todo caso, creemos conveniente señalar que esta integración ha sido una
característica diferencial de la evaluación conductual y la modificación de conducta
europea frente a la norteamericana. Buen ejemplo de ello son los trabajos de
Brengelmann en Alemania y de Eysenck en Inglaterra, donde se funden ambas

4
orientaciones, a diferencia del conductismo norteamericano, más influenciado por el
modelo skinneriano y su desconfianza por los métodos psicométricos.

La fiabilidad de un instrumento de medida se refiere a la precisión con la que


mide. En el caso de los autoinformes, los estudios de fiabilidad suelen centrarse en el
cálculo de su consistencia interna y su estabilidad temporal. Una medida consistente
es aquella en la que los diferentes elementos que la constituyen convergen al medir
una misma cosa. Una medida es estable cuando no muestra variaciones o
fluctuaciones significativas a través del tiempo; es decir, de una medida estable se
espera que un individuo muestre valores similares en mediciones realizadas en
momentos distintos.

Estos conceptos de consistencia y estabilidad han sido habitualmente


rechazados desde el enfoque conductual, ya que asumir estos supuestos implicaría
asumir la consistencia y estabilidad de la conducta, lo que frecuentemente dista mucho
de ser cierto, como ya señaló Mischel (1968).

A pesar de ello, como apunta Silva (1989, p. 89) "Tampoco se trata, sin
embargo, de asumir la inconsistencia y la inestabilidad, como alguno ha querido
interpretar, sino considerar la consistencia o inconsistencia observadas, la estabilidad
o inestabilidad observadas, como hechos empíricos que requieren explicación. La
inconsistencia o la inestabilidad de las puntuaciones pueden ser buen reflejo de una
conducta inconsistente o inestable. No es correcto, pues, considerar a priori de calidad
deficiente una medición, si no se logran índices altos de consistencia y estabilidad".

De la misma manera, no se podría considerar como poco fiable un instrumento


que detecte cambios entre la evaluación pre y la post cuando ha mediado la aplicación
de un tratamiento, o cuando entre ambas mediciones hayan influido factores (por
ejemplo, un acontecimiento traumático) que modifiquen la conducta objeto de
evaluación.

No parece, por tanto, correcto asumir una interpretación psicométrica clásica de


la fiabilidad desde la evaluación conductual. Aunque bien es cierto que desde la propia
psicometría se han criticado, y cada vez de forma más notoria, estos supuestos de
consistencia y estabilidad como base de la fiabilidad.

Una propuesta interesante para liberar al concepto de fiabilidad de su carga


psicométrica clásica es la realizada por Cronbach et al. (1963, 1972) en su teoría de la
generalizabilidad, que considera a la consistencia y a la estabilidad dentro de un
conjunto de generalizabilidad, en el que se encontraría también la validez. A ello
podríamos añadir el enfoque jerárquico, propuesto por Silva (1984, 1989), en el que
consistencia y estabilidad están subordinadas a la validez dentro de un continuo de
generalización creciente.

5
Una vía diferente es la seguida por diversos autores de la línea conductual con
el concepto de exactitud (accuracy), que ha cobrado importancia en evaluación
conductual en el ámbito de la fiabilidad. Se refiere, según Kazdin (1977), al grado en
que los registros de un observador se adecuan a un criterio predeterminado sobre los
mismos datos; mientras que para Cone (1987) tiene que ver con el grado en que una
medida representa las características topográficas objetivas de la conducta estudiada,
de manera fiel. Para Cone la exactitud se diferenciaría de la fiabilidad y la validez,
pudiéndose producir distintas combinaciones, de forma que una medición puede ser
fiable pero no exacta, pero no puede ser exacta sin ser fiable. También puede ser
válida pero no exacta y viceversa; pudiendo darse mediciones fiables y válidas aunque
no exactas.

Sin embargo, este concepto de exactitud ha recibido severas críticas,


presentando serios problemas epistemológicos (Silva, 1989), por lo que la exactitud
puede entenderse mejor desde los conceptos de fiabilidad y validez. La teoría de la
generalizabilidad merece una valoración diferente; ya que, desde una perspectiva
unificadora puede ser de gran utilidad a la evaluación conductual.

La validez se ha convertido en el concepto central de los criterios de calidad


métrica. Hace referencia a la comprobación empírica de que un instrumento mide lo
que pretende medir.

Aunque el concepto de validez es esencialmente unitario, se suele dividir en


tres tipos o clases: validez de contenido, validez criterial o predictiva y validez de
constructo.

La validez de contenido hace referencia al grado en que los elementos


constitutivos de un instrumento de medida se adecuan a lo que pretende medir dicho
instrumento y hasta qué punto estos elementos constituyen una muestra representativa
de lo que se desea evaluar. En el caso de los autoinformes la cuestión se centraría
principalmente en la selección de los ítems y en la representatividad de éstos.

El interés por garantizar una alta validez de contenido ha sido, y es,


característico de la evaluación conductual, siendo éste uno de los criterios
psicométricos de calidad que ha generado un mayor acuerdo.

La validez criterial o predictiva establece en que medida un instrumento puede


predecir un criterio independiente (García Merita, 1989). El concepto psicométrico de
validez criterial se refiere al grado en que las puntuaciones de una variable (predictor)
pueden inferir el rendimiento de otra variable (criterio), que es operacionalmente
independiente de la primera.

6
La expresión original, validez predictiva, ha sido sustituída paulatinamente por
validez criterial, para evitar el doble sentido, etimológico y metodológico, que el
concepto de *predicción+ conlleva.

La evaluación conductual ha mostrado habitualmente un marcado rechazo al


concepto de validez criterial, a la que con frecuencia se ha identificado con el
diagnóstico tradicional. Ello se debe fundamentalmente a que, como señala Silva
(1989), uno de los supuestos básicos que subyacen a la evaluación conductual es que
la muestra de conducta no mide nada más allá de si misma, no justificándose entonces
las medidas indirectas de conducta.

Sin embargo, siguiendo a Silva (1989), si se parte de una perspectiva que


considere las unidades de análisis de forma más amplia que el enfoque molecular del
conductismo radical, se pueden abrir nuevos cauces para la cuestión de la validez
criterial. Así, diversos autores, entre los que destacaría Staats, proponen abrir la teoría
de la conducta hacia la personalidad, entendida como repertorios básicos de
conductas que actuarían como co-causantes del comportamiento actual.

Pensamos que esta es una vía que permite una correcta justificación teórica al
empleo de medidas indirectas de conducta; como cuestionarios, inventarios, escalas,
tests estandarizados, etc.; puesto que la justificación práctica queda suficientemente
avalada por su utilidad y eficacia.

La validez de constructo se refiere al grado con el que una técnica o instrumento


mide un determinado constructo. Un constructo es, para Cronbach y Quirk (1979), una
categoría psicológica creada con el fin de organizar la experiencia en proposiciones
generales que tengan forma de leyes. Podemos entenderlo como una construcción
teórica a partir de referentes empíricos, aunque no reducida a ellos, que sirve para
explicar las pautas del comportamiento.

De esta forma, cuando clasificamos situaciones, respuestas o características


personales, estamos utilizando constructos. Así, conceptos como depresión, ansiedad,
fobia, o inhabilidad social, son igualmente constructos.

Actualmente la validez de constructo tiende a incluir a la validez de contenido y


a la validez criterial, convirtiéndose así en un concepto central y unificador.

Desde la perspectiva de la evaluación conductual ha existido, al menos


originalmente, un rechazo de los constructos y, por tanto, de la validación con ellos
relacionada. Sin embargo, la tendencia actual de la evaluación conductual implica una
mayor necesidad de este tipo de validez (Silva, 1989).

Por último, señalaremos que desde una perspectiva experimentalista se ha


tendido a distinguir entre validez interna y validez externa. La validez interna se refiere

7
a la validez mínima que requiere un instrumento sin la cual no se podría interpretar el
modelo (García Merita, 1989). La validez externa tiene que ver con la posibilidad de
generalización y engloba conceptos como validez de población, relativa al grado en
que una muestra es representativa de la población, y validez ecológica, referida al
grado en que las situaciones empleadas son representativas de la población de
situaciones.

Aunque la controversia sobre la validez y exactitud del autoinforme dista mucho


de estar zanjada, las investigaciones sobre este tópico parecen presentar cada vez
resultados más favorables. Desde el trabajo ya clásico de Walsh (1967), en el que de
los 39 estudios sobre autoinformes revisados aproximadamente la mitad mostraban la
validez de estos; hasta el más reciente de Shrauger y Osberg (1981), en el que se
analizaron 45 investigaciones para comparar la exactitud de los autoinformes con la
alcanzada por otros procedimientos; los resultados han mejorado sustancialmente. Así,
de las 45 investigaciones revisadas en este último estudio, 36 (80%) presentaban
resultados favorables a los autoinformes, indicando un mayor rigor y exactitud que
otros instrumentos. Seleccionando las investigaciones de mayor calidad, un total de
39, 29 (74%) mostraban resultados más favorables para los autoinformes que para
otras técnicas. Estos resultados ponen de manifiesto altos índices de validez en los
autoinformes, siendo en muchos casos mejores predictores que otros instrumentos.

Si bien es cierto que no todos los estudios realizados arrojan resultados tan
favorables, véase Schmith et al (1984), pensamos que las mejoras en la construcción
de instrumentos de autoinforme, tanto en su forma como en su contenido, y el actual
incremento de la investigación en este área, están dando lugar al aumento de su
calidad, convirtiéndolos en instrumentos de primer orden en la evaluación conductual.

2.2. Dificultades de la medición a través de autoinforme


Debido a la heterogeneidad de las técnicas e instrumentos de autoinforme es
difícil criticarlos o defenderlos de manera global, ya que junto a instrumentos altamente
fiables, válidos y útiles existen otros que no presentan ninguna de estas características
(Fernández-Ballesteros, 1983).

Con vistas a estudiar cuales son los elementos relevantes que facilitan o
dificultan la medición mediante autoinforme, aumentando o disminuyendo su calidad,
Fernández-Ballesteros (1991) sienta las bases de un sistema clasificatorio que
engloba las siguientes dimensiones o parámetros: la contrastabilidad del autoinforme
en cuestión, la accesibilidad a la información en él solicitada, la transformación
existente entre el evento ocurrido y la información sobre él, el tiempo transcurrido entre
la ocurrencia del evento y el momento en que se informa, la situación estimular a la
que se responde y las inferencias realizadas sobre el autoinforme.

Según esto, cuanto más contrastable y accesible sea la información solicitada y


cuanto menos tiempo transcurra desde lo informado, menos transformaciones u
8
operaciones cognitivas requiera y menores sean las inferencias realizadas sobre esta
información, mayor será la calidad del autoinforme.

En nuestra opinión, la consideración de estos aspectos, tanto en la construcción


de instrumentos de autoinforme como en su aplicación y valoración, puede traer
consigo un notable incremento de su calidad, evitando en buena medida, gran parte de
las controversias actuales sobre ellos. Para una información más detallada sobre estos
puntos, véase Fernández-Ballesteros (1991, 1992).

2.2.1. Las distorsiones de respuesta


Además de la influencia de las dimensiones comentadas, los autoinformes, de
cualquier clase o modalidad, van a estar sujetos a otras fuentes de error. Nos referimos
a las distorsiones de respuesta, también conocidas como sesgos de respuesta,
tendencias de respuesta o, desde una perspectiva más intrapsíquica, estilos de
respuesta.

Las distorsiones de respuesta afectan al resultado del autoinforme con


independencia de su contenido. Las más comunes son la simulación o falseamiento, la
deseabilidad social y las tendencias de respuesta.

Simulación o falseamiento. El sujeto, voluntariamente, pretende falsear sus


respuestas y con ello el resultado del autoinforme.

Es una de las fuentes de error más importantes, ya que los autoinformes son
fácilmente falseables. Para tratar de minimizar su efecto se han seguido principalmente
dos estrategias, el empleo de instrucciones que persuadan al sujeto sobre la
necesidad o conveniencia de no mentir o simular sus respuestas, apelando a su
colaboración, interés de los resultados, etc., y, por otro lado, la inclusión de escalas de
sinceridad (o de mentiras) que permitan detectar los casos en que se ha producido
falseamiento.

Estas escalas se emplean con frecuencia como parte integrante de los


cuestionarios de personalidad. Tal es el caso del MMPI, del EPI y el EPQ de Eysenck,
y entre nosotros del CEP de Pinillos. Se denominan escalas de sinceridad cuando el
resultado nos indica el grado de veracidad con que ha respondido el sujeto, y de
mentiras cuando la puntuación refleja el grado de falseamiento. La mayor parte de
ellas están formadas por ítems referidos a pequeñas transgresiones de normas o
ligeras faltas, que con frecuencia se dan en gran parte de la población, y cuya
respuesta, en sentido contrario al comportamiento habitual poblacional, es tomada
como índice de falseamiento.

Es frecuente en la práctica profesional observar como un mismo instrumento


empleado con alto índice de sinceridad en la práctica clínica privada, muestra valores

9
de sinceridad ligeramente más bajos en la clínica institucional y considerablemente
menores en, por ejemplo, la selección de personal.

Como norma general, podemos esperar un mayor grado de falseamiento en


aquellos contextos en que el individuo espere conseguir algo (por ejemplo, un empleo,
una mejor calificación, etc.), diferente del beneficio derivado de la propia exactitud del
resultado (por ejemplo, ayuda terapéutica, orientación, etc.).

Deseabilidad social. El sujeto, de forma involuntaria en muchos casos, da


respuestas sobre sí mismo consonantes con una imagen socialmente aceptable o
deseable.

La influencia de la deseabilidad social ha sido detectada tanto en los


autoinformes de personalidad clásicos (Edwards, 1957, 1962), como en los
conductuales (Fernández Ballesteros, Pérez Pareja y Macía, 1981), de forma que parte
de las respuestas puede verse afectada por ella. Aunque, como señala Fierro (1982),
la varianza explicada por la deseabilidad social es pequeña en comparación con la
explicada por los contenidos de la prueba.

Con el fin de evaluar y estudiar esta variable se han desarrollado escalas


específicas, como la de Crowne-Marlowe (1960) por mencionar alguna de las clásicas,
además de las ya mencionadas escalas de sinceridad, cuyo contenido refleja en gran
medida la deseabilidad social.

Tendencias de respuesta. El sujeto responde, de forma relativamente estable,


en función del tipo de respuesta exigido y no del contenido de los ítems, como sería
esperable.

Esta fuente de error afecta tanto a los autoinformes que implican una modalidad
de respuesta dicotómica (si/no, verdadero/falso) como a los que utilizan escalas de
tres o más alternativas. En el primer caso, la distorsión más frecuente es la
aquiescencia o asentimiento; en el segundo, los errores escalares.

a) La aquiescencia o asentimiento se refiere a la tendencia a responder "si" o


"verdadero" en los autoinformes de dos alternativas, sin tener en cuenta el contenido
de la pregunta.

Esta es la distorsión de respuesta más frecuente en los autoinformes de


respuesta dicotómica, aunque también, puede darse la tendencia contraria a responder
"no" o "falso". Como en el caso de la deseabilidad social, los datos disponibles hacen
pensar que su influencia explica un pequeño porcentaje de la varianza, lejos del
explicado por el contenido de los ítems (Fierro, 1982).

10
b) Los errores escalares, también denominados errores sistemáticos escalares,
son propios de los autoinformes que utilizan escalas discretas de tres o más
alternativas. Incluyen la tendencia a responder en el centro (tendencia central), o por
contra, la tendencia a responder en los extremos (severidad), con independencia del
contenido de los ítems, y de forma involuntaria.

Se han observado diversos procedimientos estadísticos para el análisis y control


de los errores escalares en los diseños de grupo. Sin embargo, la evaluación
conductual los ha tenido muy poco en cuenta a pesar del gran número de autoinformes
empleados que utilizan escalas como forma de respuesta.

Como señala Fernández-Ballesteros (1992), la justificación que se ha dado a


este hecho es que los autoinformes conductuales solamente se utilizan en diseños
intrasujetos, donde se supone que estos errores escalares actúan en la misma forma
antes y después del tratamiento, por lo que su efecto se anularía. Sin embargo, como
indica acertadamente esta autora, la justificación no parece convincente ya que, los
autoinformes conductuales se utilizan también en diseños de grupo y no sólo como
variable dependiente de un tratamiento, sino además como forma de operativizar y
especificar las conductas problema.

A esto añadiremos la posibilidad de que el propio tratamiento puede modificar,


aunque sea de forma indirecta, la tendencia de respuesta mostrada por el sujeto, con
lo que los errores escalares se harían sentir en la comparación de la evaluación post-
tratamiento con la pre-tratamiento, dando cuenta de parte de los cambios obtenidos y
atribuidos al tratamiento.

Tanto la simulación o falseamiento, como la deseabilidad social y las tendencias


de respuesta, han sido estudiadas no sólo como fuentes de error, sino también como
una característica, dimensión o rasgo de personalidad. Así, Canter (1971) señaló la
relación entre simulación y ajuste personal. Edwards (1955, 1957, 1962) realizó los
trabajos pioneros, entendiendo la deseabilidad social como una característica de
personalidad. La deseabilidad social ha generado un notable volumen de
investigaciones, entre las que señalaremos la realizada por Bardburn y Sudman (1979)
donde es considerada como un indicador de adaptación social del sujeto.

Entre las tendencias de respuesta, la aquiescencia fue originalmente estudiada


por Adorno et al. (1950), construyéndose para su medida escalas específicas, como la
Escala General de Acuerdo de Conch y Keniston (1960), donde esta variable es
estudiada como rasgo de personalidad. Sobre los errores escalares puede verse el
trabajo de Saal et al. (1980).

En ocasiones no es fácil delimitar conceptualmente estas distorsiones de


respuesta, especialmente la simulación, la deseabilidad social y la aquiescencia. Así,
refiriéndose a la escala k del MMPI, Fricke (1956) entiende que lo que se refleja es la

11
aquiescencia, mientras que para Fordyce (1956) recoge la tendencia a responder de
manera socialmente deseable, y Jackson (1957) señala que contiene varianza de
ambos tipos, aquiescencia y deseabilidad social (Fierro, 1982).

A estos sesgos propios de la evaluación mediante autoinforme habría que


añadir otros específicos para determinados campos de aplicación; tal es el caso del
estilo represivo de respuesta en relación con los autoinformes de ansiedad (véase a
este respecto Weinberger et al. 1979; Cano Vindel y Miguel-Tobal, 1992); y los sesgos
comunes a los distintos métodos de medición en Psicología (por ejemplo, el efecto
examinador, las expectativas de la demanda, etc.). Ello hace que sea sumamente
aconsejable el validar la información obtenida mediatne autoinfore con otras fuentes
que no provengan del sujeto y mediante el empleo de otros métodos de medida,
cuando ello sea posible.

Este cúmulo de fuentes de error que afectan a los autoinformes no debe


desanimarnos, ni servir para cuestionar su bondad de forma general, ya que ningún
método de medida en Psicología está libre de importantes sesgos. Por contra,
pensamos que deben servir como elemento de reflexión e incrementar la investigación
en busca de soluciones que nos proporcionen autoinformes cada vez más fiables,
válidos y útiles. En todo caso, tal como vimos en el trabajo de Shrauger y Osberg
(1981), a pesar de las fuentes de error señaladas, los autoinformes se muestran
actualmente como instrumentos de gran validez y alta capacidad de predicción.

2.3. Tipos de autoinforme


No existe un acuerdo general sobre la forma de clasificar los autoinformes. Así,
mientras gran parte de los autores incluyen bajo este rótulo todas aquellas técnicas e
instrumentos mediante los cuales el sujeto proporciona información sobre sí mismo;
esto es, la entrevista, el autorregistro, los cuestionarios, inventarios y escalas, y los
pensamientos en voz alta (véase Fernández-Ballesteros, 1992); otros excluyen el
autorregistro, como categoría diferente (véase Carrobles, 1985), y algunos utilizan
(véase el Diccionario de Técnicas de Evaluación Conductual de Hersen y Bellack,
1988), quizá en este caso por motivos prácticos, el término autoinforme (self-report)
para referirse únicamente a los cuestionarios, inventarios y escalas, diferenciándolo
así de la entrevista y del autorregistro (self-monitoring).

La primera opción nos parece más correcta al ser concordante con la propia
definición de autoinforme, no encontrando, por otro lado, razones de peso que
justifiquen la exclusión de alguna de las técnicas señaladas.

Tanto la entrevista como el autorregistro han sido ya extensamente tratados en


otros capítulos de esta obra, por lo que no insistiremos aquí sobre ello.

Las técnicas de pensamiento en voz alta engloban un conjunto de


procedimientos de recogida de información, fundamentalmente sobre conductas
12
cognitivas, que el sujeto proporciona en el momento en que estas tienen lugar. A pesar
de estar entre las técnicas más clásicas de recogida de datos en Psicología, durante
tiempo cayeron en desuso -al menos en el ámbito conductual, ya que no en otras
orientaciones, como la psicodinámica- siendo
rehabilitadas actualmente por la orientación cognitiva. Para una información más
detallada sobre estas técnicas pueden verse los trabajos de Brown (1978), Genest y
Turk (1981) y Fernández-Ballesteros (1992).

Cuestionarios, inventarios y escalas son términos referidos a autoinformes


estructurados presentados de forma impresa. Se ha señalado (Fernández Ballesteros,
1983) que los cuestionarios conllevan respuestas dicotómicas (si/no, verdadero/falso),
mientras que las escalas implican una forma de respuesta ordinal o de intervalo,
pudiendo presentar los inventarios ambas posibilidades de respuesta (nominal u
ordinal). Sin embargo, en la práctica la denominación de muchos instrumentos no
cumple con estos requisitos, siendo utilizados generalmente los tres términos como
sinónimos. En adelante utilizaremos el término cuestionario para referirnos de forma
genérica a las tres modalidades.

3. Cuestionarios, Inventarios y escalas


Son, junto con la entrevista, los instrumentos de evaluación psicológica más
utilizados por todos los enfoques teóricos, incluyendo el conductual (Miguel-Tobal,
1985), estando su empleo extendido a las más diversas áreas de evaluación.

3.1. Estrategias de construcción


Los cuestionarios, al igual que cualquier otra técnica de medida, han sido
construidos siguiendo tres estrategias diferentes: racional, empírica y factorial.

Los cuestionarios elaborados de forma racional están formados por elementos,


o ítems, seleccionados por el evaluador en función del interés de su contenido para
medir la variable deseada. Generalmente su selección obedece a un modelo teórico
como punto de partida.

Los cuestionarios construidos de forma empírica contienen elementos que han


mostrado su capacidad para discriminar entre distintos grupos de sujetos. De esta
manera los ítems elaborados para medir una determinada variable son sometidos a
pruebas de contraste entre distintos grupos que manifiestan esa variable en distintos
grados (por ejemplo, se comparan sujetos normales con depresivos para elaborar un
cuestionario que mida depresión).

En los cuestionarios construidos mediante una estrategia factorial, tras someter


los datos a un análisis factorial, se seleccionan los ítems o elementos que obtienen los
mejores pesos factoriales en los distintos factores encontrados, realizando así una
validación teórica del constructo estudiado.

13
La utilización de una estrategia de construcción de cuestionarios no implica la
no utilización de otros. Bien al contrario, la combinación de las distintas estrategias
puede dotar a los instrumentos resultantes de una mayor calidad, siendo esta la
tendencia que puede observarse en la construcción de cuestionarios de nueva
generación.

Generalmente se ha señalado la estrategia racional como más propia del


modelo conductual, frente a la empírica y factorial como características de los
cuestionarios de rasgo. Sin embargo, debido a las limitaciones del empleo único de la
estrategia racional y, en muchos casos, a la falta de calidad métrica de los
instrumentos así elaborados (ver Silva, 1989), la tendencia actual va dirigida al
fortalecimiento de dichos instrumentos mediante el empleo de estrategias empíricas y
factoriales. Buena prueba de ello son la cantidad de trabajos realizados en los últimos
años sobre las características psicométricas de cuestionarios conductuales clásicos,
construidos de forma racional.

3.2. Tipos de Cuestionarios


Desde el enfoque de rasgos, factores o dimensiones de personalidad, se han
empleado un gran número de cuestionarios que tiene como característica común el
evaluar una variable intrapsíquica y estable, o relativamente estable, que daría cuenta
del comportamiento individual. Los más conocidos, dentro de este contexto, son los
tests de personalidad.

Su construcción se lleva a cabo siguiendo procedimientos psicométricos y los


ítems se seleccionan a partir de estrategias racionales, empíricas y factoriales. Para
ello se emplean diseños intersujeto y los resultados se convierten en puntuaciones
normalizadas (puntuaciones típicas, centiles, etc.) que permiten situar a un individuo
en una posición relativa respecto al grupo normativo empleado.

Los ítems suelen estar formulados de manera general, sin atender a aspectos
situacionales, y la respuesta a ellos es interpretada como manifestación de una
estructura interna subyacente o rasgo. Se pretende así evaluar cual es la forma
habitual de comportamiento del sujeto y explicar esta en función de un rasgo o
disposición interna.

Han sido los más criticados desde el modelo conductual tanto por no tener en
cuenta el elemento situacional (Brengelmann, 1967; Mischel, 1968), como por el propio
concepto de rasgo en que se basan, especialmente en lo relativo a su estabilidad y su
capacidad de predecir conductas concretas (Mischel, 1968).

Desde el enfoque conductual, los cuestionarios han prestado mayor atención a


los aspectos situacionales. Su construcción ha seguido generalmente una estrategia

14
racional aunque, como ya señalamos anteriormente, cada vez es más habitual que se
combine esta con una estrategia empírica, e incluso con la estrategia factorial.

Los ítems incluyen situaciones o estímulos que el sujeto debe valorar señalando
en que medida le producen una determinada reacción o clase de respuesta (por
ejemplo, miedo o temor, en el caso de las Fear Surrey Scales-FSS); o bien, se mide la
frecuencia, o intensidad, con que el sujeto manifiesta determinadas conductas ante
una situación concreta (como sucede en las escalas de estado); o la frecuencia de
aparición de distintas conductas, relacionadas con un determinado problema o
trastorno de conducta, como ansiedad, depresión, etc. (tal es el caso de los repertorios
clínicos conductuales).

Las respuestas de los sujetos a los cuestionarios son entendidas como


muestras de conducta y no como signo de una disposición interna. Esto, que se
supone es el postulado básico de la evaluación conductual mediante autoinforme, con
frecuencia no se cumple. Así, no es extraño encontrar que se aconseje sumar las
puntuaciones en una FSS (lo que implica la suma de una misma respuesta ante
distintas situaciones o estímulos), o valorar la severidad de una patología sumando la
frecuencia de aparición de distintos síntomas (como sucede en los repertorios clínicos)
y comparar el resultado con los valores obtenidos por distintas muestras.

En nuestra opinión, existe una marcada divergencia entre los principios teóricos
que rigen la utilización de los cuestionarios conductuales y la utilización que se hace
de estos. Pensamos que un cierto nivel de inferencia a partir de los resultados puede
ser útil y deseable, aunque no se justifique totalmente desde un punto de vista teórico;
sin embargo inferencias de mayor grado pueden carecer de sentido desde la
perspectiva conductual. Por ejemplo, si agrupamos las respuestas de una FSS, en
función del contenido de los ítems, podemos valorar el nivel de temor ante las
situaciones interpersonales y sociales, los animales, etc; y esto puede ser
especialmente útil. Pero, )qué sentido tiene sumar todas las puntuaciones para valorar
una respuesta general de temor de forma no específica y transituacional?. Para ello es
preferible (más fácil, más rápido y más ajustado al modelo teórico subyacente) emplear
un cuestionario de rasgo que, curiosamente, mostrará un resultado similar. Quizá sea
imposible trabajar sin realizar inferencias, pero es aconsejable que éstas no sean
excesivamente amplias ya que saldrían del marco teórico, o quizá, sea necesario
ampliar ya el marco teórico de manera decidida.

Una apertura interesante del marco conductual clásico lo constituye el enfoque


interactivo, que surge como respuesta tanto al modelo de rasgos como al modelo
exclusivamente situacionista. Las teorías interactivas explican la conducta en función
de las condiciones de la situación, las características personales y, sobre todo de la
interacción persona x situación. Ningún factor personal, ni ninguna situación,
determinan la conducta de forma aislada, sino que esta viene determinada por la
interacción inseparable entre persona y situación.

15
Este enfoque supone la más clara integración entre las posturas intrapsíquica y
ambientalista al aportar un nuevo punto de vista en la clásica controversia sobre sí el
comportamiento está más determinado por las variables personales o por las
situacionales (sobre estos aspectos ver Miguel-Tobal, 1989). De hecho, a los pioneros
en este campo, tales como Endler, Magnusson y Bowers, se han ido uniendo autores
de procedencias tan diversas como Mischel y Spielberger, que actualmente trabajan
bajo el amplio marco del enfoque interactivo.

El enfoque interactivo utiliza generalmente cuestionarios S-R (situación-


respuesta), en los que los ítems describen una serie de situaciones y de respuestas,
debiendo valorar el sujeto la frecuencia o intensidad con que estas respuestas se
producen ante aquellas situaciones (Miguel-Tobal, 1990). Este método posibilitar una
evaluación de las respuestas, las situaciones y la interacción entre ambas.

Donde más claramente puede apreciarse esta integración es en los trabajos de


Endler sobre la ansiedad. Utilizando el S-R Inventory of General Trait Anxiousness
(Endler y okada, 1975), y mediante el empleo del análisis factorial, se constató la
existencia de áreas situacionales ligadas a diferencias individuales en cuanto a rasgo
de ansiedad (Endler y Okada, 1975; Endler, 1978; Flood y Endler, 1980). Estas son:
ansiedad interpersonal, ante situaciones de peligro físico, ante situaciones ambiguas o
novedosas, ante la rutina cotidiana y ante la evaluación social. Estas dimensiones
pueden ser entendidas como rasgos específicos de ansiedad que darían lugar a la
aparición de reacciones de ansiedad cuando se produjese una interacción, o existiese
congruencia, entre la situación y las características del individuo.

Por otro lado, estas dimensiones (áreas situacionales o rasgos específicos)


parecen poseer una buena estabilidad y consistencia al obtenerse resultados similares
en muestras de diferentes países. En nuestro caso desde 1984 hemos realizado
trabajos en esta línea, conducentes a la elaboración del Inventario de Situaciones y
Respuestas de Ansiedad -ISRA (Miguel-Tobal, 1985; Miguel-Tobal y Cano Vindel,
1984, 1985, 1986, 1988), encontrando cuatro dimensiones que, en gran medida,
coinciden con las señaladas por Endler. Estas son: ansiedad ante la evaluación,
interpersonal, fóbica y ante situaciones habituales o de la vida cotidiana.

Si tenemos en cuenta que dichos estudios se han realizado con una prueba el
ISRA, considerablemente diferente a la utilizada por Endler et al., y además con
muestras muy distintas -muestras españolas de sujetos "normales" y "clínicos" frente a
muestras "normales" de Canadá y Suecia-, la semejanza entre los resultados cobra
aún mayor significación. A esto debemos añadir que los trabajos que actualmente
realizamos para la adaptación del ISRA a Estados Unidos y varios países europeos e
hispanoamericanos parecen confirma los resultados obtenidos en España.

16
Esta concepción multidimensional del rasgo choca tanto con la concepción
clásica del rasgo general de ansiedad (asituacional) como con la postura estrictamente
ambientalista, que no considera la existencia de tendencias internas. Y, sin embargo,
las integra.

Fernández-Ballesteros (1981) señalaba, hace ya más de una década, que el


modelo interactivo suponía la solución a la controversia entre las teorías de rasgo y las
situacionistas. Por nuestra parte pensamos que, como ya se apuntó en otro lugar
(Miguel-Tobal, 1989, p.89), "quizá desde un punto de vista teórico no existan ya
demasiados elementos de discrepancia; sin embargo, la existencia de prejuicios de
escuela (que a veces llegan a cobrar carácter de cruzada) están retrasando el
entendimiento entre dos posiciones que, en buena lógica, tienden a integrarse".

En todo caso, lo que resulta evidente es que la información obtenida mediante


cuestionarios interactivos es de gran valor para el análisis funcional, al proveernos de
datos no sólo sobre el componente situacional y el de respuesta, sino también sobre la
interacción entre ambos.

Por último, señalaremos otro tipo de cuestionarios surgidos bajo el influjo


cognitivo y cognitivo-conductual. Nos referimos a los cuestionarios sobre repertorios,
procesos y estructuras cognitivas. Como señala Fernández-Ballesteros (1992), las
respuestas a estos autoinformes son consideradas tanto como muestras o correlatos
como indicadores de supuestos atributos o estructuras internas. En el primer caso,
como muestras, el interés se centra en la evaluación de conductas cognitivas en, o
durante, la situación problema. En el segundo, como atributo o estructura interna, los
instrumentos se encuentran en fase experimental y no presentan garantías para su
utilización en la práctica.

La misma autora considera útiles estos instrumentos cuando el problema que


presente el sujeto sea de índole cognitiva (por ejemplo, ideas irracionales), cuando los
repertorios cognitivos puedan explicar trastornos fisiológicos o motores, y cuando se
pretende valorar las estrategias cognitivas del sujeto con vistas a la intervención.

4. La utilización de cuestionarios y otras técnicas de autoinorme en terapia y


modificación de conducta
En el Dictionary of behavioral Assessment Techniques de Hersen y Bellack
(1988), la obra más completa en que se pasa revista a las distintas técnicas e
instrumentos de evaluación conductual, encontramos que de las 286 técnicas e
instrumentos revisados (dando lugar a 351 entrada en los apartados temáticos, ya que
un mismo instrumento puede tener más de un foco de evaluación), 206 pertenecen a la
categoría de autoinformes. De ellos, 184 se refieren a cuestionarios, inventarios y
escalas (en 21 casos combinados con otra técnica), 22 se refieren a entrevistas (en 5
casos combinados con cuestionarios) y 5 a autorregistros. Como puede observarse,

17
los cuestionarios ocupan un lugar prioritario, en cuanto a número de instrumentos
utilizados por la evaluación conductual.

Tomando como punto de referencia la obra citada (Hersen y Bellack, 1988),


hemos realizado un estudio sobre las áreas que han recibido una mayor atención
desde la evaluación conductual, y sobre el tipo de instrumentos utilizados para
evaluarlos.

4.1 Áreas de evaluación preferente


En primer lugar, y de forma destacada, aparece la evaluación de la Ansiedad y
conceptos asociados, como miedo, fobia, stress y arousal. En su conjunto se reseñan
58 técnicas, procedimientos e instrumentos diferentes (algo más del 20% del total),
entre los que se incluyen autoinformes, técnicas de registro fisiológico y técnicas de
observación.

Del total de estos, 41 (71%) son cuestionarios, inventarios y escalas. En dos


casos a la información obtenida mediante cuestionario se le añadía información
recogida mediante otro método. Así, en un caso al cuestionario se añadía información
procedente de observación y en el otro, de observación y registro fisiológico.

El total de autoinformes empleados es 43 (74%) ya que a los 41 cuestionarios


hay que añadir una entrevista estructurada y un autorregistro.

En la categoría de observación se incluyen 13 instrumentos o técnicas (22%).


En 9 casos se utiliza solamente observación y en 4 observación junto con otra técnica.

Respecto al registro fisiológico nos encontramos con 5 reseñas (9%), en 3


casos el registro fisiológico se utiliza sólo y en 2 se acompaña de otra técnica.

Señalaremos aquí que la suma de porcentajes supera el 100%, lo que no es de


extrañar si tenemos en cuenta que en algunos casos la técnica o procedimiento
descrito incluye instrumentos pertenecientes a más de una categoría.

Tras la observación de estos datos aparece de forma inmediata una primera


conclusión: no se corresponde en absoluto el énfasis teórico por la observación y el
registro fisiológico y la falta de interés (también teórico) por los autoinformes,
especialmente los cuestionarios, con lo que se ha venido haciendo en la evaluación
conductual.

Bien es cierto que aquí nos referimos únicamente al número de instrumentos


empleados y no a la frecuencia de su empleo, por lo que podría pensarse que un
número escaso de instrumentos, no pertenecientes a la categoría de autoinforme, han
sido muy utilizados. Nada más lejos de la realidad, como podremos observar más
adelante al tratar sobre la utilización de las distintas técnicas e instrumentos.

18
El segundo lugar, en cuanto a área preferente de evaluación, lo ocupa la
Depresión, con 25 reseñas (aproximadamente el 10% del total) referidas a técnicas e
instrumentos.

De estos 25, 23 (92%) pertenecen a la categoría de autoinforme, refiriéndose en


20 casos (80%) a cuestionarios, en un caso a entrevista semiestructurada, en un caso
a cuestionario más entrevista semiestructurada y, por último, en un caso a
autorregistro.

El método observacional está representado en un solo caso, y el instrumento


restante, hasta completar los 25, se refiere a una guía o manual para el entrevistador.

Como vemos, se repiten y se hacen aún más acusados los resultados


encontrados al referirnos a la ansiedad, lo que no es de extrañar si consideramos que
sería verdaderamente difícil, por no decir imposible, evaluar la depresión sin atender al
componente cognitivo, únicamente valorable mediante autoinforme.

El tercer foco de atención ha sido la Asertividad con 17 técnicas e instrumentos


reseñados, de los cuales 12 (70%) son cuestionarios y 5 (30%) pertenecen a la
categoría de observación.
Los siguientes campos de interés han sido las habilidades sociales, con 15
reseñas, los conflictos maritales y la obesidad, con 11 reseñas en cada caso.

Por supuesto, estos altos porcentajes de autoinformes (entre el 70% y el 92%),


o más concretamente de cuestionarios (entre el 70% y el 80%) no son extrapolables a
todas las áreas de evaluación, pero sí a las principales y, en buena medida, a la mayor
parte de ellas. Los datos no solamente avalan, de forma contundente, la importancia
de los autoinformes en la evaluación conductual, y por ende en la terapia y
modificación de conducta, sino que señalan, una vez más, la falta de concordancia
entre las posturas teóricas más clásicas u ortodoxas y la práctica.

4.1. Revisión del empleo de autoinformes en la terapia de conducta


Otra vía para estudiar el impacto de los autoinformes en la terapia y
modificación de conducta consiste en investigar sobre su empleo en la literatura clínica
conductual. Para ello hemos seleccionado el campo de los trastornos de ansiedd. Ello
obedece a dos importantes razones; la primera porque ha sido un área a la que la
terapia de conducta ha prestado especial atención; la segunda porque pueden ser
estudiados en sus tres componentes -cognitivo, fisiológico y motor- y empleando
distintos métodos de medida -autoinforme, registro fisiológico y observación-. En un
trabajo anterior (Miguel Tobal, 1985) realizamos una revisión sobre la forma en que se
habían evaluado los tres sistemas de respuesta en el ámbito de la modificación de
conducta de los trastornos de ansiedad. Se revisaron dos períodos: de 1957 a 1967 y
de 1968 a 1985. Se eligió este punto de corte debido a los importantes cambios
19
teóricos que en ese momento tenían lugar (véanse los trabajos de Lacey, 1967; y
Lang, 1968) y a su repercusión sobre la evaluación de las reacciones de ansiedad.

Es importante señalar aquí que no se ha contabilizado la entrevista como


técnica de autoinforme, ya que en ese caso el 100% de los estudios habrían empleado
autoinforme, ni la evaluación de respuestas fisiológicas y motoras mediante
autoinforme, por lo que en un sentido estricto esta revisión se refiere más a métodos
empleados que a sistemas evaluados.

Para el período 1957-1967, se partió de la revisión realizada por Yates (1970)


en la que se reseñaban 26 estudios sobre tratamiento de fobias. En cuanto a la
evaluación pretratamiento prácticamente no se aportaban datos, siendo la evaluación
postratamiento bastante imprecisa, pero suficiente para extraer los siguientes
resultados: en 13 estudios (50%) la evaluación consistió únicamente en el informe del
sujeto, en 4 estudios (14,4%) el informe del sujeto se completaba con otro del esposo/a
o de algún pariente cercano, en 6 estudios (30,8%) se llevó a cabo una evaluación en
vivo con el experimentador; por último, solamente un estudio (3,8%) combinó la
evaluación en vivo con la fisiológica (RPG).

Podemos observar que en este período la evaluación de la eficacia del


tratamiento era bastante grosera, basándose en un 50% de los casos sólo en el
informe del sujeto (autoinforme). El autoinforme se utilizó en el 65,4% de los casos y la
observación en situaciones en vivo en el 34,6%, siendo la evaluación fisiológica casi
inexistente (3,8%).

Esta pobreza en el empleo de métodos de evaluación, especialmente en su


utilización combinada, ha ido corrigiéndose, a lo largo del tiempo. En este período
comentado, los trabajos de Lang y Lazovick (1963) y Rachman (1966a, 1966b)
constituyen una excepción, ya que en ellos se realizó una evaluación pre y
postratamiento mucho más precisa.

Para el segundo período, 1968-1985, se partió de la revisión de Jacob y


Rapport (1984) sobre agorafobia, y de la realizada por Sturgis y Scott (1984) sobre
diversas fobias, completándose con otros estudios no incluidos en las revisiones
mencionadas. Se revisaron 64 estudios, de los cuales 3 no especificaban el tipo de
evaluación realizada. Los resultados que presentamos se refieren por tanto a los 61
estudios restantes.

20
Tabla 1

Métodos y combinación de métodos de evaluación utilizados en el período 1968-1985:


(N=61 estudios)
N %
Sólo autoinforme 17 27.9
Sólo observación 8 13.1
Sólo Regist fisiológico 0 0
Autoinf.+ Observación 29 47.5
Autoinf + R.Fisiol. 3 4.9
Observ. + R. Fisiológico 2 3.3
Autoinf + Observ + R. Fisiol 8 13.1
Total Autoinforme 57 85.2
Total Observación 47 77
Total Registro Fisiológico 13 21.3

De nuevo se observa una predominancia del empleo de autoinforme (85,2%,),


seguido de la observación (77%), y, en mucho menor grado, del registro fisiológico
(21,3%). La utilización de varios métodos de medida aumenta considerablemente
sobre el período anterior, destacando la combinación autoinforme (observación
(47,5%), seguida de lejos, a pesar de ser más deseable, por la combinación de los tres
métodos (13,1%).

Centrándonos en los autoinformes (para información detallada sobre técnicas


de observación y registro fisiológico (consultar Miguel-Tobal, 1985), destaca la gran
variedad de técnicas e instrumentos utilizados. Así, las puntuaciones subjetivas y el
termómetro de miedos se emplearon en el 69% de los casos, las escalas de
reconocimiento de miedos -FSS- en el 17,3%, las escalas de evaluación de síntomas
en el 15,3%, el diferencial de ansiedad en el 3,5%, los inventarios S-R en el 5,8%,
seguido de otros instrumentos empleados con menos frecuencia, como el EPI de
Eysenck.

En un trabajo posterior (Cano Vindel y Miguel-Tobal, 1989-1990) se analizaron


los 111 estudios revisados por Ost y Jansson (1987). Estos estudios, realizados entre
1966 y 1986, se centraban en distintos trastornos de ansiedad: fobias simples, fobia
social, agorafobia, ansiedad generalizada y trastornos obsesivo-compulsivos; habiendo
sido muchos de ellos incluidos en las revisiones anteriores.

21
Los resultados globales se muestran en la tabla 2.

Tabla 2
Métodos y combinación de métodos de evaluación utilizados en el período 1966-1986
(N=111 estudios)
N %
Sólo autoinforme 36 32.4
Sólo observación 1 0.9
Sólo R. Fisiológico 0 0
Autoinf.+ Observación 47 42.3
Autoinf + R.Fisiol 15 13.5
Observación + R. Fisiológico 0 0
Autoinf + Observ + R. Fisiol 12 10.8
Total Autoinforme 110 99
Total Observación 60 54
Total Registro Fisiológico 27 24

Los resultados muestran la misma dirección que los encontrados en la revisión


anterior por Miguel-Tobal (1985), existiendo un predominio del uso de autoinformes,
seguido de la observación y, en mucho menor grado, del registro fisiológico. Las
variaciones sobre la revisión anterior -aumento del porcentaje de autoinformes y
disminución de la observación- pueden explicarse por la inclusión aquí de los
trastornos obsesivo compulsivos, en los que es frecuente la utilización casi exclusiva
de instrumentos de autoinforme.

Con el fin de estudiar la evolución que ha tenido lugar en los 20 años revisados,
se dividió el período 1966-1986 en las dos décadas que lo conforman. Los resultados
se muestran en la tabla 3.
Tabla 3
Evolución del empleo de los métodos de evaluación
1966-1976 (N=34) 1977-1986 (N=77)
N % N %
Sólo autoinforme 9 26.5 27 35.1
Sólo observación 0 0 1 1.3
Sólo R. Fisiológico 0 0 0 0
Autoinf.+ Observación 20 58.8 27 35.1
Autoinf + R.Fisiol 5 14.7 10 14
Observ. + R. Fisiol. 0 0 0 0
Autoinf+Obs+R. Fisiol 0 0 12 15.6
Total Autoinforme 34 100 76 98.7
Total Observación 20 58.8 40 51.9
Total R. Fisiológico 5 14.7 22 28.6

22
Comparando ambos periodos se observa la estabilidad en la gran utilización del
autoinforme (cercano al 100%), un ligero descenso en la utilización de la observación
(del 58,8% al 51,9%), y un considerable aumento en la utilización del registro
fisiológico, que prácticamente se duplica (del 14,7% al 28,6%), aunque su empleo
sigue siendo minoritario.

Como método de empleo único sigue prevaleciendo el autoinforme, lo que no es


de extrañar al ser el único capaz de evaluar los tres sistemas de respuesta, mostrando
un ligero incremento la utilización del autoinforme sólo (del 26,5% al 35,1%), lo que no
consideramos aconsejable.

Respecto a la combinación de técnicas, el empleo de autoinforme + observación


desciende (del 58,8% al 35,1%), manteniéndose estables las combinaciones
Autoinforme registro fisiológico (alrededor del 14% en ambos períodos), y observación
registro fisiológico (nulo en los dos períodos). Afortunadamente se produce un
incremento en los estudios que realizan una triple evaluación (de 0 al 15,6%), lo que
supone una considerable mejora metodológica, si bien esta forma de proceder sigue
siendo aún escasa.

Estos datos ponen de manifiesto la extensa utilización de los autoinformes en la


investigación clínica, en el ámbito de la terapia y modificación de conducta, siendo, de
lejos, los instrumentos más empleados en todos los períodos estudiados. Sería
interesante poseer datos sobre su utilización en la práctica profesional, pero no nos
cabe ninguna duda de que las diferencias en porcentajes de utilización entre
autoinforme y otros métodos serían aún más abultadas.

Este resultado complementa y matiza el apuntado anteriormente al revisar los


distintos métodos, técnicas e instrumentos empleados en la evaluación conductual. Por
un lado, o por otro, la conclusión es la misma, el predominio del autoinforme en la
evaluación conductual.

5. Algunos cuestionarios de utilización clínica


No es nuestro propósito en este punto realizar una revisión de los distintos
cuestionarios, inventarios y escalas utilizados en la evaluación conductual, lo que
excedería de largo el cometido del presente trabajo. Para ello remitimos al lector a la
obra de Hersen y Bellack (1988), donde encontrará una información extensa, o a los
trabajos de Vizcarro y Arévalo (1990) y del Barrio (1992).

5.1. Cuestionarios de evaluación de la ansiedad


Los cuestionarios para la evaluación de la ansiedad son los más numerosos
entre los existentes en la evaluación psicológica. Desde la clásica Escala de Ansiedad
Manifiesta -MAS- de Taylor (1953) hasta nuestros días se han desarrollado un gran

23
número de cuestionarios que miden distintas facetas de la ansiedad. Entre ellos el más
extendido es el Inventario Estado-Rasgo de Ansiedad
(Spielberger, et al, 1970), traducido a más de 30 idiomas. Sin embargo, muchos de
ellos no aportan información específica para su empleo en la modificación de
conducta, al estar basados en el modelo de rasgos y no tener en cuenta el
componente situacional.

Dado que clásicamente se ha diferenciado entre ansiedad y miedo, entendiendo


la ansiedad como un subtipo de miedo ante estímulos que no son objetivamente
peligrosos o amenazantes, y a pesar de que esta diferenciación no se mantiene
actualmente; hemos preferido presentar aquí dos instrumentos, de características muy
distintas, que evalúan ambos conceptos.

5.1.1. Fear Survey Schedule III -FSS III. "Escala de Reconocimiento de Miedo"
(Wolpe y Lang, 1964)
Conocidos en nuestro país como Inventarios de Miedos, o Inventarios de
Temores, han sido los instrumentos más utilizados para la detección de fobias o
miedos irracionales. Existen distintos cuestionarios bajo la denominación general FSS;
el FSS I de Lang y Lazovik (1963), el FSS II de Geer (1965) y el FSS III de Wolpe y
Lang (1964). Además de los reseñados, que son los más divulgados
internacionalmente, en España se ha extendido el uso del FSS-122 de Wolpe, quizá
por su inclusión en la obra de Bartolomé et al. (1977), texto pionero en la modificación
de conducta en nuestro país.

El FSS III contiene 76 ítems que miden la intensidad del miedo irrracional ante
distintos estímulos pertenecientes a las siguientes categorías: animales, social le
interpersonal, lesiones o daño físico, enfermedad y muerte, ruidos, otras fobias
clásicas (como por ejemplo, los espacios abiertos, los ascensores, etc.) y diversos.

El sujeto debe indicar el miedo o malestar que le produce cada objeto o


situación mediante una escala de likert de 5 puntos, donde 0, sería nada en absoluto y
5, muchísimo).

Ammerman (1988) señala que el FSS III puede ser empleado para identificar
estímulos específicos o, por contra, obtener una puntuación total sumando la
puntuación de cada ítem. Como ya señalamos en el apartado 3.2., no creemos
recomendable este modo de proceder, al menos desde el modelo que sustenta los
FSS, ya que el resultado sería la valoración de una tendencia general y
transituacional. Sin embargo la detección aislada de miedos específicos, sin realizar
ninguna inferencia, proporciona una información difusa y poco utilizable en la práctica
clínica. Por ello aconsejamos la utilización de los FSS realizando agrupaciones de
contenido, que pueden ser similares a las categorías antes señaladas, o diferentes,
según las valoraciones del sujeto.

24
El principal propósito del FSS III es la identificación de estímulos y situaciones
específicos elicitadores de miedo o ansiedad, siendo de gran utilidad en la
construcción de jerarquías para la desensibilización sistemática. Aunque surge
originalmente como un instrumento clínico, ha sido ampliamente empleado en la
investigación sobre desordenes fóbicos y trastornos de ansiedad.

La construcción del FSS III se llevó a cabo de forma racional. Los autores
elaboraron los ítems basándose en su práctica clínica, seleccionando los estímulos y
situaciones asociados a las reacciones fóbicas, incluyendo los que aparecían más
frecuentemente o aquellos que daban lugar a comportamientos desadaptativos.

En cuanto a las características psicométricas, el FSS III muestra una gran


consistencia interna y una alta fiabilidad, según Hersen (1971). Sin embargo los
análisis factoriales realizados reflejan una estructura factorial poco estable, variando
en función del sexo y las poblaciones empleadas. Así, Merbaum y Stricker (1972)
encontraron 5 factores en una muestra de estudiantes varones y 7 en una muestra de
estudiantes mujeres; mientras que Bates (1971), en una muestra de pacientes varones,
identificó 17 factores de los cuales solamente 2 (daño o lesión e interpersonal) eran
capaces de explicar más de 5% de la varianza.

Como señala Ammerman (1988), la validez del FSS III es bastante baja. Sus
correlaciones con otras medidas de autoinforme de ansiedad son moderadas al igual
que con medidas basadas en la observación (por ejemplo, los tests de evitación
conductual -BAT); si bien esto último, como ya explicamos puede ser debido a la falta
de concordancia entre los distintos sistemas de respuesta (cognitivo, fisiológico y
motor) y/o a la baja correlación entre distintos los métodos de medida.

Por último, respecto a la utilización de los FSS (en conjunto) en nuestro país, se
deben evitar las palabras miedo y temor que habitualmente se incluyen en las
instrucciones, dado que muchos sujetos señalan que el estímulo u objeto que deben
valorar les produce intranquilidad, nerviosismo, asco (en el caso de los animales o las
heridas), etc, pero no miedo. Para evitar este problema, creemos más oportuno pedir
que valoren el grado en que dicho estímulo o situaciones les producen inquietud,
nerviosismo o tensión.

Sería interesante la realización de estudios de validación cross-cultural que


pudiesen esclarecer estos aspectos, pero dada su total inexistencia conviene adaptar
en lo posible las instrucciones a las características de nuestra lengua; y, posiblemente,
los términos miedo o temor no representan lo mismo para nuestra población que el
término original "fear" para las poblaciones de habla inglesa.

5.1.2. Inventario de Situaciones y Respuestas de Ansiedad -ISRA (Miguel-Tobal y


Cano Vindel, 1986,1988)

25
El ISRA trata de conjugar las aportaciones de dos modelos teóricos. Por un
lado, el modelo interactivo multidimensional de la ansiedad (Endler, 1978; Endler y
Magnusson, 1974,1976); por otro, el modelo tridimensional o de los tres sistemas
propuesto por Lang (1968).

Presenta un formato S-R y consta de 224 ítems, formados por la interacción de


22 situaciones y 24 respuestas representativas de los tres sistemas de respuesta.
Incluye, además, una situación abierta que puede ser descrita por el sujeto, de gran
utilidad en la práctica clínica.

Las situaciones se eligieron bajo el criterio de ser situaciones susceptibles de


generar ansiedad, sin que lleguen a ser acontecimientos extraordinarios que
provoquen esta reacción en la totalidad de los individuos, y representar un buen
muestreo de situaciones ansiógenas. Así, se incluyen situaciones tan diferentes como
"si tengo que hablar en público", "después de haber cometido algún error", "cuando
voy a una cita con una persona del otro sexo", "en medio de multitudes o espacios
cerrados", "al observar escenas violentas", o "a la hora de dormir".

Las respuestas describen conductas concretas y son representativas de los tres


sistemas (7 cognitivas, 10 fisiológicas y 7 motoras). Las cognitivas incluyen respuestas
como "me preocupo fácilmente", "me siento inseguro", o "me cuesta concentrarme".
Las fisiológicas, "siento molestias en el estómago", "mi cuerpo está en tensión", o
"tengo palpitaciones". Las motoras, "fumo, como o bebo demasiado", "me muevo o
hago cosas sin una finalidad concreta", o "trato de evitar o rehuir la situación".

El objetivo del ISRA es evaluar por separado la frecuencia de respuestas


cognitivas, fisiológicas y motoras ante distintas situaciones, posibilitando así la
obtención de un perfil de reactividad individual. En la segunda edición, realizada en
1988, se incluyó un nuevo perfil que permite valorar las reacciones de los sujetos ante
4 áreas situacionales diferentes que agrupan distintas situaciones concretas.

El sujeto debe responder a los ítems de acuerdo con una escala de frecuencia
de 5 puntos, donde 0 es "casi nunca" y 5 "casi siempre", indicando la frecuencia con
que aparece cada una de las respuestas ante cada situación. El tiempo de aplicación
del ISRA oscila entre 35 y 55 minutos, siendo especialmente compleja su utilización
con sujetos de muy bajo nivel cultural o que presenten un marcado deterioro.

El ISRA consta de las siguientes escalas:


- Sistemas de Respuesta
C: Reactividad Cognitiva (respuestas o manifestaciones cognitivas de
ansiedad).
F: Reactividad Fisiológica (respuestas o manifestaciones fisiológicas de
ansiedad).
M: Reactividad Motora (repuestas o manifestaciones motoras de ansiedad)

26
- Áreas situacionales o rasgos específicos
FI: Ansiedad ante la evaluación
FII: Ansiedad Interpersonal
FIII: Ansiedad Fóbica
FIV: Ansiedad ante situaciones habituales o de la vida cotidiana.
- T: Nivel general o rasgo general de ansiedad.

La corrección se realiza de la siguiente forma:

Sistemas de Respuesta. Se suman las puntuaciones dadas por el sujeto a cada


ítem de cada escala (C,F y M). La puntuación de la escala F se divide entre dos, ya
que posee el doble de ítems que C o M.

Áreas situacionales o rasgos específicos. Se suman las puntuaciones


correspondientes a las situaciones propias de cada área en las tres escalas (C, F y M).

Puntuación Total. Se suman C+F/2+M.

Las puntuaciones directas obtenidas en cada escala y el total pueden ser


transformadas en puntuaciones centiles, lo que permite conocer el nivel del individuo
en relación a la población de referencia. Para ello el manual provee de baremos para
varones y mujeres en muestras "normal" y "clínica". Es deseable en la práctica clínica
que, además de obtener las puntuaciones de cada escala, se lleve a cabo un análisis
pormenorizado de las distintas situaciones y respuestas, lo que permitirá seleccionar
las situaciones más problemáticas, las respuestas más frecuentes o alteradas, y la
interacción entre ambas. Esta forma de proceder proporciona una información
detallada y completa de gran utilidad en el análisis funcional.

En la construcción del ISRA se emplearon las tres estrategias descritas en el


apartado 3.1: racional, empírica y factorial. Para la selección de situaciones y
respuestas se siguió una estrategia racional. Tras revisar un amplio número,
concretamente 37, de cuestionarios de evaluación de ansiedad se seleccionaron 28
situaciones y 26 respuestas, generándose 553 ítems formados por la interacción entre
una situación y una respuesta. Siguiendo un criterio de doble ciego, mediante el
empleo de dos jueces independientes, se eliminaron aquellos ítems que no tenían
sentido o presentaban una mínima probabilidad de ocurrencia.

Esta primera versión se aplicó a distintas muestras de sujetos "normales" y con


trastornos psicofisiológicos. A partir de los datos obtenidos se calculó la capacidad de
discriminación de cada ítem y de cada una de las escalas C, F, M y Total, las
correlaciones entre escalas, y por último, se realizó un análisis factorial de las
respuestas.

27
A consecuencia de estos análisis se eliminaron las situaciones y respuestas que
menos cumplían con los criterios establecidos, dando lugar a la versión definitiva de
224 ítems. Esta versión definitiva se aplicó a nuevas muestras de sujetos "normales",
con trastornos psicofisiológicos, y con trastornos de ansiedad, realizándose nuevos
análisis a partir de los datos obtenidos. Estos análisis incluyeron el estudio de la
consistencia interna de la prueba, capacidad de discriminación de cada ítem y cada
escala, factorización de situaciones y de respuestas, y correlaciones con otros
cuestionarios de ansiedad (MAS y STAI). Además de los análisis señalados, dirigidos a
estudiar la validez del ISRA, se estudió su fiabilidad mediante el método test-retest.

En cuanto a las características psicométricas, el ISRA, muestra un alto nivel de


fiabilidad, calculada por el método test-retest con un intervalo de dos meses, en
distintas poblaciones (Miguel-Tobal, 1985). Los índices oscilan entre 0.75 y 0.86,
según las muestras, para el total del Inventario, entre 0.68 y 0.80 para la escala
cognitiva, entre 0.74 y 0.79 para la fisiológica, y entre 0.75 y 0.82 para la motora. Los
estudios de fiabilidad llevados a cabo con muestras norteamericanas (Williams et al.,
1991) indican así mismo una alta fiabilidad test-retests del ISRA, en este caso con un
intervalo de tres meses. Estos son los resultados: T=0.85, C=0.76, F=0.78, M=0.81, FI
(A. evaluación)= 0.86, FII (A. interpersonal)= 0.73, FIII (A. fóbica)= 0.79 y FIV (A.
cotidiana)= 0.79.

El análisis factorial de las respuestas ha mostrado tres factores que aplican el


52,5% de la varianza total (Miguel-Tobal, 1985). El primero, fisiológico, explica el
23,1%; el segundo, cognitivo, explica el 21,2%; y el tercero, motor, el 8,2%.

El análisis factorial de las situaciones ha mostrado cuatro factores que explican


el 51,62% de la varianza total. El primero, ansiedad ante la evaluación, explica el
25,07%; el segundo, ansiedad interpersonal, el 10%, el tercero, ansiedad fóbica, el
9%; y el cuarto, ansiedad ante situaciones habituales, el 7,5% (Miguel-Tobal, 1985).

Los estudios de validez convergente (Miguel-Tobal y Cano Vindel, 1986) han


mostrado correlaciones entre el total del ISRA y el MAS de Taylor que oscilan entre
0.56 y 0.61, según las muestras. Con el STAI de Spielberger estas correlaciones
oscilan entre 0.54 y 0.63. Los estudios norteamericanos de Williams et al. (1991)
señalan las siguientes correlaciones entre la escala de Rasgo del STAI y cada una de
las escalas del ISRA: C= 0.54; F= 0.61; M= 0.56; T= 0.65; FI= 0.62; FII= 0.71; FIII=
0.48; y FIV= 0.67.

El ISRA ha mostrado en diferentes estudios una buena capacidad de


discriminación entre distintos grupos y patologías, mostrándose altamente sensible
para el estudio de las diferencias.

Se ha trabajado con una amplia muestra de poblaciones clínicas, entre ellas


hipertensión y otros trastornos psicofisiológicos (Miguel-Tobal y Cano Vindel, 1990,

28
1991; Cano Vindel y Miguel-Tobal, 1990); síndrome premenstrual (Pérez-Pareja y
Borras, 1992); diversos trastornos de ansiedad, como agorafobia, fobias simples, fobia
social y ansiedad generalizada (Miguel-Tobal y Cano Vindel, 1992), mostrando en
todos los casos una alta capacidad de discriminación. Incluso en la controvertida
diferenciación entre ansiedad y depresión por medio de autoinformes, Sanz (1991, p.
170) señala que "en relación a la sané psicométrica entre ansiedad y depresión, las
subescalas de rasgos específicos de ansiedad del ISRA se configuran como
instrumentos de elección a la hora de discriminar entre sujetos ansiosos y depresivos
frente a las tan utilizadas medidas de rasgo general de ansiedad"; o lo que añade que
" de hecho, la inclusión de medidas de rasgo específico de ansiedad permite que la
depresión aparezca en los análisis factoriales como un constructo relativamente
independiente y discernible de la ansiedad".

En el ámbito clínico el ISRA puede ser de utilidad en la valoración de la eficacia


del tratamiento, ya que se ha mostrado altamente sensible en al detección de los
cambios entre evaluación pre y postratamiento. Así mismo, la obtención del perfil de
reactividad permite la selección del tratamiento concordante, y por tanto más idóneo,
con las características individuales (sobre este punto ver Cano Vindel y Miguel-Tobal,
1989; Miguel-Tobal y Cano Vindel, 1989; Miguel-Tobal, 1990); mientras que, el perfil
de áreas situacionales, o rasgos específicos, puede aportar información de interés
sobre el área, o áreas, en las que centrar el tratamiento y las relaciones entre ellas.
Por último, señalar de nuevo, que es aconsejable el estudio detallado de las
situaciones y respuestas que incluye el ISRA, ya que ello permite una valoración más
exhaustiva y concreta del caso individual.

5.2. Cuestionario de evaluación de la depresión


Como vimos en el apartado 3.3.1. la depresión ocupa el segundo lugar en
cuanto área preferente de evaluación. Recordaremos que de los distintos métodos
empleados; el autoinforme supone el 92% del total, y, dentro de él, el 80% son
cuestionarios, inventarios y escalas.

Entre los instrumentos más utilizados señalaremos las ya clásicas, Escala de


Depresión del MMPI-D de Hathaway y Mackinley (1942); la Escala de Depresión de
Hamilton (1960,1967) que aunque concebida originalmente como entrevista
estructurada es utilizada también como cuestionario; y la Escala de Depresión -SDS-
de Zung (1965). Pero, sin duda, el instrumento que más se emplea actualmente es el
Inventario de Depresión de Beck -BDI- (Beck et al, 1961, 1974), utilizado en más del
87% de la investigación, sobre depresión, según Fernández-Ballesteros (1992) citando
datos de Lewinshon (1975). Por ello hemos seleccionado el BDI como instrumento a
detallar en las siguientes páginas.

5.2.1. Beck Depression Inventory -BDI "Inventario de Depresión de Beck" (Beck et


al. 1961, 1974)

29
Debido, muy probablemente, al fuerte empuje del enfoque cognitivo y a la gran
expansión del modelo de Beck sobre la depresión, el BDI se ha convertido en el
instrumento más utilizado no solamente en la evaluación de las depresiones clínicas,
sino también en la evaluación de tendencias depresivas en la población general.

Como señalan Steer y Beck (1988), citando datos de los archivos del Center for
Cognitive Therapy de la Escuela Médica de la Universidad de Pensylvania, el BDI ha
sido utilizado en más de 1.500 estudios de investigación diferentes y traducido a más
de 30 idiomas.
Concebida originalmente como una escala heteroaplicada, para la utilización en
la entrevista, cuenta actualmente con varias versiones. A partir de la escala
heteroaplicada, que contenía 21 ítems que describen manifestaciones del
comportamiento depresivo, se desarrolló el Inventario de autoevaluación, convirtiendo
cada uno de los 21 elementos o ítems originales en 4 o 6 manifestaciones graduadas
en orden creciente de intensidad del síntoma.

En 1974 el propio autor desarrolló una versión abreviada de 13 ítems


seleccionados entre los 21 originales. Aunque estas son las formas más conocidas
existen otras como la desarrollada por Pichot, quién factorizó el inventario de 21 ítems
y añadió 10 más para cuantificar los síntomas de ansiedad.

En España estos instrumentos han sido traducidos por distintos autores, entre
ellos Conde y Franch (1984) y Vázquez y Sanz (1991), lo que ha dado lugar a que
proliferen distintas versiones con ligeros cambios.

El BDI surgió de las observaciones clínicas sobre los síntomas y actitudes que
presentan los pacientes depresivos. Estas observaciones se agruparon en 21 ítems
referidos a síntomas y actitudes que son valoradas de 0 a 3 en términos de intensidad.
Los ítems hacen referencia a contenidos tales como humor, pesimismo, deseos
suicidas, abandono social, indecisión y pérdida de peso, entre otros.

Aunque Steer y Beck (1988) afirman que el BDI no refleja un modelo teórico
concreto, Conde y Franch (1984) señalan que la construcción de este inventario se
llevó a cabo tras una aproximación clínica en el curso de la terapia psicoanalítica de
pacientes deprimidos. Con independencia del punto de partida, hoy en día es
considerado como un instrumento de orientación cognitiva o cognitivo-conductual. De
hecho, analizando el contenido de sus ítems aparece un predominio de los
componentes cognitivos sobre los fisiológicos o motores.

La puntuación total del BDI se obtiene sumando las puntuaciones obtenidas en


cada uno de los ítems. Existe una cierta polémica sobre cual sería el punto de corte
más correcto, ya que de los propuestos, como señala del Barrio (1992), utilizar una
puntuación de 13 como punto de corte daría lugar a muchos falsos positivos, mientras
que utilizar la puntuación 21 traería consigo la aparición de falsos negativos. El Center

30
for Cognitive Therapy establece las siguientes indicaciones para los puntos de corte
cuando se usa el BDI con pacientes no diagnosticados previamente: ninguna o mínima
depresión < 10; de depresión media a moderada entre 11 y 17; depresión moderada
entre 18 y 29; y depresión severa desde 30 hasta 63. Como señalan Steer y Beck
(1988) existe un cierto consenso sobre tomar las puntuaciones a partir de 18 como
indicativo de sintomatología depresiva.

Hemos de señalar que estos valores de corte se refieren a muestras


norteamericanas y no son, por tanto, extrapolables a muestras españolas, donde
probablemente los valores serían más altos. Sería de gran utilidad la realización de
estudios de adaptación del BDI a España, que nos permitiesen valorar las
puntuaciones aquí obtenidas de modo más correcto.

La construcción del BDI se llevó a cabo de manera racional a partir de las


observaciones clínicas, si bien han sido muchos los estudios psicométricos
desarrollados posteriormente sobre esta prueba.

En cuanto a sus características psicométricas, el BDI presenta una fiabilidad de


0.80 en los estudios test-retest y 0.87 utilizando el coeficiente alfa de Cronbach, según
Steer y Beck (1988). En el estudio de Vázquez y Sanz (1991) estos valores disminuyen
a 0.72 en el test-retest con un mes de intervalo, 0.65 con tres meses de intervalo, y el
coeficiente alfa se sitúa en 0.82. En todo caso, el BDI presenta unos buenos resultados
en cuanto a fiabilidad. Respecto a la validez concurrente, los estudios correlacionales
con la Escala de Hamilton, la Escala de Zung, la Escala de depresión del MMPI, y el
SCL-09R D, obtienen un valor medio de 0.60 en pacientes psiquiátricos.

Los estudios llevados a cabo mediante la utilización del análisis factorial


presentan resultados que varían de 3 a 7 factores en muestras psiquiátricas y de 1 a 5
en muestras no clínicas. A pesar de que los resultados varían considerablemente
dependiendo de las muestras empleadas, aparecen 3 factores como más
representativos: 1) actitudes negativas hacia sí mismo, 2) dificultades en el
rendimiento, 3) malestar somático (Steer y Beck, 1988).

En cuanto a su utilización clínica el BDI puede ser utilizado en sujetos mayores


de 13 años y con buen nivel educativo (estimado en 6 grado norteamericano). Es útil
en la cuantificación de la intensidad de la depresión, tanto en pacientes depresivos
como en sujetos normales, pero no es apropiado para diferenciar entre distintos tipos
de depresión. Debe actuarse con precaución a la hora de estimar la severidad de la
depresión en aquellos casos en que los síntomas pueden atribuirse a una causa
diferente a la depresión, como por ejemplo los alcohólicos.

Steer y Beck (1988) aconsejan su utilización en los programas terapéuticos


señalando su alta efectividad en la detección de cambios producidos por la
intervención terapéutica.

31
BIBLIOGRAFIA

ADORNO, T.W.; FRENKEL-BRUNSWIR, E.; LEVISON, D. y SANFORD, N. (1950):


The authoritarian personality. New York: Harper & Brothers.

AMMERMAN, R.T. (1988): Fear Survey Schedule III. En M. Hersen y A. S. Bellack


(eds): Dictionary of Behavioral Assessment Techniques. New York: Pergamon
Press.

BANDURA, A. (1969): Principles of Behaviour Modification. New York: Holt, Rinehart &
Winston.

BANDURA, A. (1977): Social learning theory. Englewood Cliffs: Prentice-Hall.

BANDURA, A. y WALTERS, R.H. (1963): Social learning and personality development.


New York: Holt, Rinehart & Winston.

BARDBURN, N.M. y SUDMAN, S. (1979): Inproving interview method and


Questionnaire design. San Francisco: Jossey Bass Pub.

del BARRIO, V. (1992): Evaluación de las características psicopatológicas. En R.


Fernández-Ballesteros (ed.): Introducción a la Evaluación Psicológica. vol. 2,
Madrid: Pirámide.

BARTOLOME, P.; CARROBLES, J.A.; COSTA, M. y del SER, T. (1979): La práctica de


la terapia de conducta. Madrid: Pablo del Rio Editor.

BATES, H.D. (1971): Factorial structure and MMPI correlates of a fear survey schedule
in a clinical population. Behavior Research and Therapy, 9, 355-360.

BECK, A.T. y BEAMESDERFER, A. (1974): Assessment of depression: The Depresion


Inventory. En P. Pichot (ed.): Modern problems in pharmacopsychiatry. Basilea:
S. Karger.

BECK, A.T.; WARD, C.H.; MENDELSONHN, M.; MOCK, J. y ERBAUGH, J. (1961): An


inventory for measuring depression. Archives of General Psychiatry, 4, 561-571.

BELLACK, A.S. y HERSEN, M. (1977): Self-Report inventories in behavioral


assessment. En J.D. Cone y R.P. Hawkins (eds): Behavioral Assessment: New
Directions in Clinical Psychology. New York: Brunner/Mazel.

BOLLES, R.C. (1972): Reinforcement, expectancy, and learning. Psychological


Review, 79, 394-409.

32
BOLLES, R.C. (1975): Learning, motivation and cognition. En K.E. Estes (ed.):
Handbook of learning and cognitive processes, vol. 1. New York: Harper and
Row.
BRENGELMANN, J.C. (1967): Bedingte reactionen. Lerntheorie und Psychiatrie. En
Gruhle et al. (eds): Psychiatrie der Gegenwart. Springer Verlag.

BROWN, A.L. (1978): Knowing When, where, and How to Remember. (Tech. Rep., n1
47). Urbana: Univ. of Illinois.

CANO VINDEL, A. y MIGUEL-TOBAL, J.J. (1989): Implications of the multidimensional


assessment of anxiety for the selection of treatment. 10th International
Conference of the Society for Stress and Anxiety Research -STAR. Amsterdam.

CANO VINDEL, A. y MIGUEL-TOBAL, J.J. (1989-1990): Revisión de la evaluación de


los tres sistemas de respuesta de ansiedad en las terapias cognitivo
conductuales. Terapia del Comportamiento (Giornale Italiano di Scienza e
Terapia del Comportamento), 24-25, 109-114.

CANO VINDEL, A. y MIGUEL-TOBAL, J.J. (1990): Diferencias entre sujetos normales y


psicosomáticos en el patrón de respuestas de ansiedad ante diferentes tipos de
situaciones ansiógenas. Libro de Comunicaciones del II Congreso del COP.
Área 7. Diagnóstico y Evaluación Psicológica. Madrid: COP.

CANO VINDEL, A. y MIGUEL-TOBAL, J.J. (1992): Anxiety, Control, and Represive


Style of response. XIII International Conference of the Society for Stress and
Anxiety Research, Lovaina.

CANTER, D. (1971): Simulación en el inventario psicológico de California y adaptación


del simulador. En E. Megargee (ed.): La métrica de la personalidad. México:
Trillas.

CARROBLES, J.A.I. (1985): Análisis y Modificación de conducta II. vol. 1. Madrid:


UNED.

CAUTELA, J.R. (1967): Cover sensitization. Psychological reports, 20, 459-468.

CAUTELA, J.R. (1973): Covert processes and behavior modification. Journal of


Nervous and Mental Disease, 5, 33-50.

CAUTELA, J.R. (1978): Covert conditioning: A learning theory perspective on imagery.


En J.L. Singer y K.S. Pope (eds): The power of human imagination. New York:
Plenum Press.

CONE, J.D. (1977): The relevance of reliability and validity for behavioral assessment.
Behavior Therapy, 8, 411-426.

33
CONDE LOPEZ, V. y FRANCH VALVERDE, J.I. (1984): Escalas de evaluación
comportamental para la cuantificación de la sintomatología psicopatológica en
los trastornos angustiosos y depresivos. Madrid: Laboratorios Upjohn.

COUCH, A. y KENISTON, K. (1960): Yeasayers and Naysayers: Agreeing response set


as a personality variable. Journal of Abnormal an Social Psychology, 151-174.

CRONBACH, L.J.; GLESER, G.; NANDA, H. y RAJARATNAM, N. (1972): The


dependability of behavioral measurements: theory of generalizability for scores
and profiles. New York: Wiley.

CRONBACH, L.J. y QUIRK, T.J. (1976): Test validity. International encyclopedia of


education. New York: McGraw-Hill.

CRONBACH, L.J.; RAJARATNAM, N. y GLESER, G. (1963): Theory of generalizability:


a liberalization of reliability theory. Brit. J. Stat. Psychol. 16, 137-163.

CROWNE, D.P. y MARLOWE, D.A. (1960): A new scale of social desirability


independent of psychopathology. Journal of Consulting Psychology, 24, 349-
354.

EDWARDS, A.L. (1955): Social desirability and Q sorts. Consult. Psychol., 19, 462-
463.

EDWARDS, A.L. (1957): The social desirability variable in personality assessment and
research. New York: Dryden.

EDWARDS, A.L. (1962): The social desirability hypotesis: Theoretical implications for
personality measurement. En S.Messick y J. Ross (eds): Measurement in
personality and cognition. New York: Wiley.

ENDLER, N.S. (1978): The interaction model of anxiety, some possible implications. En
O.M. LANDERS y R. W. CHRISTINA (eds.): Psychology of Motor Behaviors and
Sport. Champaign: Human Kinetics.

ENDLER, N.S. y MAGNUSSON, D. (1974): Interactionism, trait psychodinamics and


situationism. Report from the Psychological Laboratories. 418. University of
Stockholm.

ENDLER, N.S. y MAGNUSSON, D. (1976): Personality and person by situation


interaction. En N.S. Endler y D. Magnusson (eds.): Interactional Psycholgy and
Personality. Washington D.C.: Hemisphere.

ENDLER, N.S. y OKADA, M. (1975): A multidimensional measure of trait anxiety: The


S-R Inventory of General Trait Anxiousness, Journal of Consulting and Clincial
Psychology, 43, 319-329.

34
FERNANDEZ-BALLESTEROS, R. (1980): Psicodiagnostico. Concepto y Metodología.
Madrid: Cincel. Kapelusz.

FERNANDEZ-BALLESTEROS, R. (1983): Psicodiagnóstico. Madrid: UNED.

FERNANDEZ-BALLESTEROS, R. (1991): Anatomía de los autoinformes. Evaluación


Psicológica/Psychological Assessment. 3, 263-290.

FERNANDEZ-BALLESTEROS, R. (1992): Los Autoinformes. En R. Fernández-


Ballesteros (ed): Introducción a la Evaluación Psicológica. vol 1, Madrid:
Pirámide.

FERNANDEZ-BALLESTEROS, R.; PEREZ PAREJA, J. y MACIA, A. (1981):


Distorsiones de respuesta en autoinformes coductuales. En R. Fernández-
Ballesteros (ed): Nuevas aportaciones en evaluación conductual. Valencia:
Alfaplus.

FIERRO, A. (1982): Deseabilidad social y aquiescencia en la escala de ansiedad


manifiesta. Análisis y modificación de conducta. 17, 93-122.

FLOOD, M. y ENDLER, N.S. (1980): The interaction model of anxiety: an empirical test
in an athletic competition situation, Journal of Research in Personality, 14, 329-
339.

FORDYCE, W.E. (1956): Social desirability in the MMPI. Journal of Consulting


Psychology, 20, 171-175.

FRICKE, B.G. (1956): Response set as a suppressor variable. Journal of Consulting


Psychology, 20, 161-169.

GARCIA MERITA, M.L. (1989): El qué y el cómo de la evaluación de la personalidad.


En J. Mayor y J.L. Pinillos (eds.): Tratado de Psicología General, Tomo 9,
Personalidad. Madrid: Alhambra.

GEER, J.H. (1965): The development of a scale to measure fear. Behavior Research
and Therapy. 3, 45-53.

GENEST, M. y TURK, D. (1981): Think-alone approaches to cognitive assessment. En


C. Glass y M. Genest (eds.): Cognitive Assessment. New York: Guilford Press.

HAMILTON, M. (1960): A Rating Scale for Depression. Journal of Neurology,


Neurosurgery and Psychiatry, 23, 56-62.

HAMILTON, M. (1967): Development of a rating scale for primary depressive ilnness.


British Journal of Social and Clinical Psycholgy, 6, 278-296.

35
HATHAWAY, S.R. y McKINLEY, J.C. (1942): Minnesota Multiphasic Personality
Inventory. New York: Psychological Corporation.

HERRNSTEIN, R.J. (1977): The evolution of Behaviorism. American Psychologist, 32,


593-603.

HERSEN, M. (1971) : Fear scale norms for an in-patient population. Journal of Clinical
Psycholgy, 27, 375-378.

HERSEN, M. y BELLACK, A.S. (1988): Dictionary of Behavioral Assessment


Techniques. New York: Pergamon Press.

JACKSON, D.N. (1957): Response acquiescence in the California psychological


Inventory. American Psychologist, 12, 412-413.

KAZDIN, A.E. (1977): Artifact, bias, and complexity of assessment: the ABCS of
reliability. J. Appl. Behav. Anal., 10, 141-150.

LACEY, J.I. (1967): Somatic response patterrning and stress: some revisions of the
activacion theory. En M. H. Appley y R. Strumbull (eds.): Psychological stress.
New York: Appleton-Century Crofts.

LANG, P.J. (1968): Fear reduction and fear behavior: problems in treating a construct.
En J. M. Shlien (ed): Research in psychoterapy, vol. III. Washington: American
Psychological Association.

LANG, P.J. y LAZOVICK (1963): The experimental desensitization of an animal phobia.


Journal of Abnormal and Social Psycholgy, 66, 519-525.

LEVINE, M. (1975): A cognitive theory of learning: Research on hypothesis testing.


Hillsdale: Lawrence Erlbaum Associates.

LEWINSHON, P.M. (1975): Engagement in pleasant activities and depression level.


Journal of Psycholgy, 84, 729-731.

MAHONEY, M.J. (1974): Cognition and behavior modification. Cambridge: Ballinger.

MEICHENBAUM, D.H. (1977): Cognitive-behavior modification: an integrative


approach. New York: Plenum Press.

MERBAUM, M. y STRICKER, G. (1972): Factor analytic study of male and female


responses to the Fear Survey Schedule. Journal of Behavior Therapy and
Experimental Psychiatry, 3, 87-90.

MIGUEL-TOBAL, J.J. (1985): Evaluación de respuestas cognitivas, fisiológicas y


motoras de Ansiedad. Elaboración de un instrumento de medida -ISRA. Tesis
doctoral, publicada en 1987. Madrid: Editorial de la Universidad Complutense.

36
MIGUEL-TOBAL, J.J. (1989): Modelo psicométrico-factorial y conductismo. Dos
posiciones encontradas en camino del encuentro. Revista de Historia de la
Psicología, 1-4, 85-90.

MIGUEL-TOBAL, J.J. (1990): La ansiedad. En: J. MAYOR y J.L. PINILLOS (Eds.):


Tratado de psicología general. vol. 8. Motivación y emoción. Madrid: Alhambra.

MIGUEL-TOBAL, J.J. y CANO VINDEL, A. (1984): Desarrollo de un inventario de


situaciones y respuestas de ansiedad (ISRA). Libro de comunicaciones del I
Congreso del COP (Área 3). 253-256. Madrid: COP.

MIGUEL-TOBAL, J.J. y CANO VINDEL, A. (1985): Evaluación de respuestas


fisiológicas, cognitivas y motoras de ansiedad. Informes de Psicología, 4, 249-
259.

MIGUEL-TOBAL, J.J, y CANO VINDEL, A. (1986): Inventario de Situaciones y


Respuestas de Ansiedad (ISRA). Madrid: TEA.

MIGUEL-TOBAL, J.J. y CANO VINDEL, A. (1988): Inventario de Situaciones y


Respuestas de Ansiedad (ISRA), 2a ed. revisada con inclusión de rasgos
específicos. Madrid: TEA.

MIGUEL-TOBAL, J.J y CANO VINDEL, A. (1989): Avances en la evaluación de la


ansiedad y sus implicaciones en la elección del tratamiento. I Congresso
Internazionale di Terapia Cognitiva-Comportamentale "Latini Dies". Roma.

MIGUEL-TOBAL, J.J. y CANO VINDEL, A. (1990): Anxiety manifestations in normal


and psychophysiologically disordered subjects. 11th International Conference of
the Society for Stress and Anxiety Research. STAR. Berlin.

MIGUEL -TOBAL, J.J. y CANO VINDEL, A. (1991): Anxiety and problem solving in
normal and psychophysiolgically disordered subjects. II European Congress of
Psycholgy. Budapest.

MIGUEL-TOBAL, J.J y CANO VINDEL, A. (1992): Anxiety manifestations in different


anxiety disorders. XXV International Congress of Psychology. Bruselas.

MISCHEL, W. (1968): Personality and assessment. New York: Wiley.

OST, L.G. y JANSSON, L. (1987): Methodological issues in cognitive-behavioral


treatments of anxiety disorders. En L. Michelson y L.M. Ascher (Eds.): Anxiety
and stress disorders. Cognitive behavioral assessment and treatment. New
York: The Guilford.

37
PEREZ-PAREJA, J. y BORRAS, C. (1992): Relationship between general response
anxiety and PMS symptom appraisal. 13th International Conference of the
Society for Stress and Anxiety Research. STAR. Lovaina.

RACHMAN, S. (1966a): Studies in desensitization II: Flooding. Behaviour Research &


Terapy, 4, 1-6.

RACHMAN, S. (1966b): Studies in desensitization-III: Spead of generalization.


Behaviour Research & Therapy, 4, 7-15.

RESCORLA, R.A. (1980): Pavlovian second-order conditioning. Hillsdale: Lawrence


Erlbaum Associates.

RESCORLA, R.A. y SOLOMON, R.L. (1967): Two-proces learning theory: relations


between pavlovian conditioning and instrumental learning. Psychological
Review, 74, 151-182.

RESCORLA, R.A. y WAGNER, A.R. (1972): A theory of pavlovian conditioning.


Variations in the effectiveness of reinforcement and non reinforcement. En A.H.
Black y W.F. Prokasy (eds.): Clasical conditioning: current theory and research.
New York: Appleton Century Crofts.

SAAL, F.E.; DOWNEY, R.G. y LAHEY, M.A. (1980): Rating the ratings: assessing the
psychometric quality of rating data. Psychol. Bull., 88, 413-428.

SANZ, J. (1991): The specific traits of anxiety in the Anxiety Situations and Responses
Inventory (ISRA): construct validity and relationship to depression. Evaluación
Psicológica/Psychological Assessment, 2, 149-173.

SCHMITH, N.; GOODING, R.Z.; NOE, R.A. y KIRSH, M. (1984): Metaanalysy of validity
studies published between 1964-1982 and the investigation of study
characteristics. Personnel Psychology, 37, 407-423.

SELIGMAN, M.E. (1971): Phobias and preparedness. Behavior Therapy, 2, 307-320.

SHRAUGER, J. y OSBERG, T.M. (1981): The relative accuracy of self-predictions and


judgements by others in psychological assessment. Psychological Bulletin, 90,
322-351.

SILVA, F. (1984): Psicodiagnóstico: Teoría y aplicación. Valencia: CEPSU.

SILVA, F. (1989): Evalución conductual y criterios psicométricos. Madrid: Pirámide.

SKINNER, B.F. (1953): Science and Human Behavior. New York: MacMillan.

SKINNER, B.F. (1987): Whatever happened to Psychology as Science of Behavior.


American Psychologist, 42, 780-786.

38
SPIELBERGER, C.D.; GORSUCH, R.I. & LUSHENE, R. (1970): The State-Trait Anxiety
Inventory (self-evaluation Questionnaire). Palo Alto; California: Psychologists
Press.

STEER, R.A. y BECK, A.T. (1988): Beck Depression Inventory. En M. Hersen y A.S.
Bellack (eds.): Dictionary of Behavioral Assessment Techniques. New York:
Pergamon Press.

STURGIS, E.T. y SCOTT, R. (1984): Simple phobia. En S. M. Turner (Ed.): Behavioral


Theories and treatment of anxiety. New York: Plenum Press.

TAYLOR, J.A. (1953): A personality Scale of manifest anxiety. Journal of Abnormal and
Social Psycholgy, 48, 275-280.

VAZQUEZ, C. y SANZ, J. (1991): Fiabilidad y validez factorial de la versión española


del Inventario de Depresión de Beck. III Congreso de Evaluación Psicológica.
Barcelona.

VIZCARRO GUARCH, C. y AREVALO FERRERA, J. (1990): Evaluación en Psicología


y Psicopatología (II): Estrategias de recogida de información. En F. Fuentenebro
y C. Vázquez (Eds.). Psicología Médica, Psicopatología y Psiquiatría. vol I.
Madrid: Interamericana - McGraw-Hill.

VIZCARRO GUARCH, C. y GARCIA MARCOS, J.A. (1981): Los autoinformes. En R.


Fernández-Ballesteros Y J.A.I. Carrobles (eds): Evaluación Conductual. Madrid:
Pirámide.

WALSH, W.B. (1967): Validity of self-report. Journal of Counseling Psychology, 14, 18-
23.

WATSON, J.B. (1920): Is thinking merely the action of language mechanisms?. British
Journal of Psychology, 11, 87-104.

WEINBERGER, D.A.; SCHWARTZ, E. y DAVIDSON, R.J. (1979): Low-anxious, hig-


anxious, and repressive coping styles: Psychometric patterns and Behavioral
and Physiological responses to stress. Journal of Abnormal Psychology, 88,
369-380.

WILLIAMS, S.J.; PUENTE, A.E.; MIGUEL-TOBAL, J.J. y CANO VINDEL, A. (1991):


Validity and reliability of the Inventory of Situations and Responses of Anxiety.
Annual Meeting of the North Carolina Psychological Association. Atlantic Beach,
North Carolina.

WOLPE, J. y LANG, P.J. (1964): A fear survey schedule for use in behavior therapy.
Behavior Research and Therapy, 2, 27-30.

39
YATES, A. J. (1970): Behavior Therapy. New York: J. Wiley & Sons.

ZUNG, W.W.K. (1965): A self-rating depression scale. Archives of General Psychiatry,


12, 63-70.

40
5. Lecturas recomendadas

FERNANDEZ-BALLESTEROS, R. (1992): Los autoinformes. En R. Fernández-


Ballesteros (ed): Introducción a la Evaluación Psicológica. vol 1. Madrid:
Pirámide.

En este capítulo se recoge una amplia información, así como interesantes


consideraciones, sobre conceptos básicos, clases de variables y condiciones de los
autoinformes; prestando especial atención a los distintos tipos de autoinforme y a
cuestiones sobre su calidad.

HERSEN, M. y BELLACK, A.S. (1988): Dictionary of Behavioral Assessment


Techniques. New York: Pergamon Press.

En los pocos años transcurridos desde su publicación, este texto se ha


convertido en obra de obligada referencia. En él se lleva a cabo el estudio más
exhaustivo realizado hasta el momento sobre técnicas de evaluación conductual,
recogiendo un gran número de instrumentos que son presentados y comentados por
distintos autores, siguiendo un modelo de ficha común.

MIGUEL-TOBAL, J.J. y CANO VINDEL, A. (1988): Inventario de Situaciones y


Respuestas de Ansiedad -ISRA, (2 edición revisada con la inclusión de rasgos
específicos). Madrid: TEA.

El manual del ISRA proporciona información sobre cuestiones relativas a las


implicaciones de los modelos interactivo y tridimensional en la evaluación mediante
autoinforme, construcción de cuestionarios y utilización de los resultados de la
evaluación en la selección de tratamientos.

SILVA, F. (1989): Evaluación conductual y criterios psicométricos. Madrid: Pirámide.

Este libro ofrece una revisión crítica y detallada de muchos de los problemas
relevantes de la evaluación conductual.

Su visión sobre la evaluación conductual y el empleo de criterios psicométricos,


pasando revista a los conceptos de fiabilidad y validez, lo convierten en un libro
imprescindible en la evalución conductual contemporanea.

VIZCARRO GUARCH, C. y GARCIA MARCOS, J.A. (1981): Los autoinformes. En R.


Fernández-Ballesteros y J.A.I. Carrobles (eds): Evaluación Conductual. Madrid:
Pirámide.

41
Este capítulo ha sido durante más de una década punto de referencia común
para los interesados en el tema de los autoinformes en nuestro país. Se recoge en él
una documentada información sobre características generales de los autoinformes, así
como sobre algunos instrumentos específicos.

Además de estas obras reseñadas, recomendamos para una visión más global
de la evaluación conductual:

FERNANDEZ-BALLESTEROS, R. y CARROBLES, J.A.I. (eds) (1981): Evaluación


Conductual. Madrid: Pirámide.

FERNANDEZ-BALLESTEROS, R. (ed) (1992): Introducción a la Evaluación


Psicológica, vols. 1 y 2. Madrid: Pirámide.

El primero de estos manuales se ha convertido en un clásico de la evaluación


conductual en España, estando aún vigente gran parte de lo allí dicho. Con el
segundo, es muy probable que suceda lo mismo en los próximos años, ofreciéndose
en él una información abundante y actualizada.

42