You are on page 1of 14

Antecedentes histricos

de las pruebas actuales


a

Anastasi, A. y Urbina, S. (1998) Test


Psicolgicos. (7ma Edicin). Mxico:
Prentice Hall

na breve revisin de los antecedentes histricos y los orgenes de las pruebas


psicolgicas nos brindar un panorama til para comprender las pruebas actuales.' La direccin en que estas han avanzado, as como sus limitaciones y
entajas especiales, podrn entenderse mejor al considerarlas a la luz de sus prec u r s o z . ~ i s t ecaptulo nos concretaremos a la revisin de los antecedentes y el
desarrollo inicial del movimiento psicomtrico como un todo. En los captulos posteriores analizaremos los desarrollos ms recientes relacionados con algunos instrumentos especficos, como los tests de habilidad (capti~los8 a 12) o los de inters
(captulo 14), as como con las reas (educativa, industrial, clnica y de consejera)
en las que se utilizan tales instrumentos (captulo 17).
Las races de la aylicacih de prurbas se pierden en la Antigedad. Existen relatos del sistema de exmenes del servicio civil que prevaleci en el imperio chino
durante 2 000 aos (Bowman, 1989). Entre los antiguosgriegos, la aplicacin de
~.. educativo;
. .. - -las pruebas servan para. evaluar
. . ~.
el
exmenes formabaparte de! poceso
1974). Desde sus inicios en la
domit?ia de habilid~dgsfsicasq~ri~el~~~~l~s(Doyle,
Edad Media, las universidades europeas basaron los grados y honores en exmenes
farmales. Cori todo, no tenemos que ir ms all del siglo XIX para identificar los

'

Se encuentra una descripci6n mAs detallada d i Icn orgenes de las pniebas psicol6gicas e n E L. Gouiienough
(1949) y en J. Peterxm (1926). Vease tambin b r i n g (1950) y G. Murphy y Kovach (1972) para antecedentes
ms generales, DuBois (1970) y McReynolds (1975. 1986) para recuentos ms recientes de la hiscoria de las
pniebas psicol6gicas, y Anastasi (1965) para los antecedentes hist6ricos del estudio de las diferencias individiiales. En Acascasi (1993) hzv un repaso
de las cendericias actuales de la psicometra.

Antecedentes histricos de las pruebas actuales " 3 3

principales acontecimientos que f o r m a d a base de las pruebas contemporneas, y a


ellos dirigimos ahora nuestra atencin.

INTERS INICIAL EN LA C L A S I F I C A C I ~ N
Y L A CAPACITACIN
DE LAS PERSONAS
CON RETARDO M E N T A L
El siglo XIX atestigu el surgimiento del inters por el tratamiento humano de las
personas
"insanas" y las que sufran de retardo mental. Hasta ese momento, el desti.-.
.--- - -

lbas
ac5 Y
.>rey el
astetru ers
da)
elalino
1 de
ir el
n 1;
mes
. los
ough
entes
le las
idua-

no comn de tales individuos era el descuido, el ridculo e inclmo latorfuo. Con la


nueva pieocupacin por el cuidado adecuado de la gente con d roble mas mentales,
se hizo evidente la necesidad de contar con criterios uniformes para su identiticacin
y clas~ficacin,necesidad que se volvi verdaderamente urgente con la proliferacin de instituciones sociales dedicadas a estas perscnas en todo el mundo. Primero
era necesari~distinguirentre los individuos insanos y los que sufran de retardo mental. Los primeros manifestabari trastornos emocionales que podran o no estar acompaados por un deterioro intelectual a partir de un nivel normal; los segundos se
caracterizaban principalmente por una deficiencia intelectual que estaba presente
desde el nacimiento o la primera infancia. El primer informe explcito de esta distincin se encuentra quiz en un trabajo publicado en
por el medico frances
Esquirql. Se trata de dos volmenes en los que dedica ms de 100 p g m q u e
ahora se conoce como "retardo mental". Esquirol tambien seala que existen muchos grados de retardo, que varIan desde la normalidad hasta la "idiotez profunda".
En su esfuerzo por elaborar un sistema para clasificar los diversos grados y variedades
de retardo, Esquirol prob varios procedimientos y lleg a la conclusin de q u e 4
habla proporciona
.-el criterio ms-confiable del nivel intelectual del individuo.%
importante decir que los criterios actuales para d x r m i n a r el retardo mental tambin son principalmente lingsticos y que los tests actuales de inteligencia tienen
una fuerte carga de contenido verbal. En los captulos siguientes mostraremos la
importante funcin que cumple la habilidad verbal en nuestro concepto de inteligencia.
De espcciai significado son las contribuciones de otro mdico francs, S=&
quien fue pionero en la capacitacin de los rctardados. Luego de rechazar la idea dominante de que el retardo mental era incurable, Seguin (186611907) experiment
durante muchos aos con lo que llam el 3 d o fisiolgio-de capacitacin, y en
1817 estableci kprimera escuela dedicada a la educacin de los nios retardados. En
1848 emigr a los Estados Unidos, eQdonde sus ideas obtuvieron un amplio reconocimiento. Seg1si.n fue el creador de muchas de las tmicas.de-eritrenmientasensorial-1muscular que despus fueron adoptadas &; las instituciones de asistencia a los retrasados. Con esos mtodos, los nios con retardo profundo reciben ejercicio intensivo
en discriminacin sensorial y para el desarrollo del control motor. Algunos de los
procedimientos que estableci Segin con este propsito fueron luego incorpora-dos
a los tests de inteligencia no verbal o de ejecucin. U n ejemplo de lo anterior es el
P

Tablero de Formas* de Seguin (Seguin Form Board), en el que el individuo debe insertar bloques de distinta apariencia en los huecos correspondientes tan rpidamente
[como pueda3
Ms de medio siglo despues del trabajo de Esquirol y Seguin, el psiclogo francs
Alfred Binet recomendaba que los nios que no lograran responder a la educacin
normal herzn evaluados antes de expulsalos y que, de ser considerados educables,
fueran asignados a cursos de educacin especial (T. H. Wolf, 1973). Con sus compaeros de la Sociedad Fara el Estudio Psicolgico del Nio, Binet exhort al ministro
de Instruccin Pblica a emprender acciones para mejorar las condiciones de los nios retardados. Un resultado especial fue el establecimiento de una comisin ministerial a cargo de Binet para el estudio de estos infantes. Tal designacin fue un
acontecimiento trascendental en la historia de las pruebas psicolcgicas.

:I

i!

h! i l
!

En general, los primeros psiclogos experimentales del siglo xIX no estaban interesados en la medicin de las diferencias individuales. Su objetivo
la formulacin de descripciones generalizadas de la conducta humana, lo que supone que su
atencin se concentraba en las uniformidades ms que en las diferencias conductuales, y que, por lo tanto, las diferencias individuales eran ignoradas o aceptadas como
un mal necesario que limitaba la aplicabilidad de las generali&iones. As, el hecho
de que un' individuo reaccionara de manera diferente a otro en las mismas condiciones era considerado como un error, o variabilidad individual, que disminua la exactitud de las generalizaciones. sta era la actitud hacia las diferncias individuales que
prevaleca en laboratorios como el fundado por Wundt en Leipzig en 1879, donde se
formaron muchos de los primeros psiclogos experimentales.
Al elegir sus reas de estudio, como en muchas otras fases de su trabajo, los fundadores de la psicologa experimental evidenciaban la influencia de sus antecedentes en
la fisiologa y la fsica. Los problemas que estudiaban en sus laboratorios tenan que
ver principalmente con el tiempo de reaccin y con la sensibilidad a estmulos sensoriales como los visuales y los auditivos. Como veremos en otros captulos, este acento
en los fenmenos sensoriales refleja tambin la naturaleza de las primeras pruebas psicolgicas.
Otra influencia que la psicologa experimental del siglo XIX ejerci en el curso del
movimiento psicomtrico se manifiesta en sutnsistencia por ejercer un control riguroso de-lascondiciones en las que se realizan las observacionej; por ejemplo, la forma de
dar las instrucciones en un experimento de tiempo de reaccin puede aumentar o disminuir de modo notable la velocidad de la respuesta, y el brillo o el color del fondo
pueden alterar marcadamente la apariencia de un estmulo visual, lo que demuestra la
importancia de que todos los participantes del experimento sean observados en condiciones estandarizadas. Esta estandarizacin del procedimiento lleg a convertirse en
una de las seales distintivas de las pruebas psicolgicas.
*Tarnbi&nconocido corno T&ho de encajamienros. (N. del T.)

: ' Antecedentes histricos de las pruebas actuales

ie in- ;
lente
mces
acin
&les,
mpaiistro
>S ninisteie un

eresa>mu:ue su
ictuacomo
iecho
ficioiacti-S que
d e se
imdat e -en
n que
iensocento
as psiso del

, iguroma de
o dis;: fondo
i m a la
:zondirse en

,35

C O N T R I B U C I O N E S D E F R A N C I S GALTON
El bilogo ingls ~ r a n c i s e a l t o n e~ el ~ s p o n s a b l del
e inicio del movimiento psicommco. Un factor comn en las numerosas y variadas actividades de investigacin de Galton fue su inters por la herencia humana. En el curso de sus
investigaciones sobre esta materia, Galtor, se dio cuenta de Ir necesidad de medir las
caractersticas de personas que estaban y no emparentadas, ya que slo de esta manera
poda descubrir, por ejemplo, el grado exacto de parecido entre padres e hijoslhermanos y hermanas, primos o gemelos. Con este propsito, Galton convenci a diversas
instituciones educativas de que llevaran registros antropointricos sistemticos de sus
estudiantes. Tambin estableci un laboratorio antropomtrico en la Exposicin Internacional de 1884 donde, mediante el pago de tres peniques, se medan ciertos rasgos fsicos de los visitantes y se los someta a pruebas de agudeza visual y auditiva, fuerza
muscular, tiempo de reaccin y otras funciones sensoriomotors simples. Cuando la
exposicin cerr, Galton transfiri el laboratorio al Museo de South Kensington, en
Londres, donde trabaj durante seis aos. Con estos mtodos se acumul gradualmente el primer cuerpo sistemtico de datos sobre diferencias indi~~iduales
en los procesos
psicolgicos simples.
El propio Galton elabor varias de las pruebas aplicadas en su laboratorio, muchas
de las cuales siguen siendo conocidas, sea en su forma original o modificada. Entre los
ejemplos se encuentran la barra de Galton para la discriminacin visual de la longitud, el silbato que lleva tambin su nombre para determinar el mayor tono audible y
una serie graduada de pesos para medir la discriminacin cinestsica. Galton crez que
las pruebas de discriminacin sensorial podan servir para estimar el intelecto. A este
respecto, haba sido tambin la influencia de las teoras de Locke. As, Galton escribi: "La nica informacin concerniente a los acontecimientos externos que nos alcama parece pasar por la avenida de los sentidos, y entre ms perceptivos sean los
sentidos de Ias diferencias, mayor ser el campo sobre el que pueden actuar nuestro
juicio y nuestra inteligencia" (Galton, 1883, p. 27). Galton tambin se percat de que
las personas con retardo mental extremo tienden a mostrar defectos en su capacidad
para discriminar entre calor, fro y dolor, una observacin que posteriormente fortaleci su conviccin de que la capacidad de discriminacin sensorial, "en conjunto, sera
ms elevada entre los intelectualmente aptos" (Galton, 1883, p. 29).
Galton tambin fue pionero en la aplicacin de escalas de calificacin y cuestionarios, as como en el usa de la tcnica de asociacin libre que posteriormente fue utili.zada con diversos propsitos. Otra de sus muchas contribuciones se encuentra en la
formulacin de mtodos estadsticos para el anlisis de datos sobre las diferencias individuales. Galton tom y adapt algunas tcnicas matemticas de forma que pudieran
ser utilizadas por investigadores sin conocimientos en la nateria que desear- tratar
en forma cuzntitativa los resultados de sus pruebas. De esta manera extendi considerablemente la aplicaci6n de los proce'dimientos estadsticos al an!isis de datos de !as
pruebas. Esta fase del trabajo de Galton fue llevada adelante por muchos de sus estudiantes, de los cuales Karl Pearson2 fue el ms eminente.
Para una descripcian fascinanre de los primeros avances de los principales conceptos esradsricos y de las penonas responsables, vase Cowles (1989).

36

~unhonesy orgenes de pruebas, tests o instrumentos de medicin psicolgicos

CATTELL Y LOS P R I M E R O S TESTS MENTALES


El psiclogo estadounidense James McKeen Cattell ocupa una posicin prominente
en el adelanto de las pruebas psicolgicas. En su trabajo se combinan la recin establecida ciencia de la psicologa experimental y el todava ms reciente movimiento
psicomtrico. Para obtener su doctorado en Leipzig redact una tesis sobre el tiempo
de reaccin bajo la direccin de Wundt; y en 1888, mientras enseaba en Cambridge, su trato con Galton fortaleci su inters por la medicin de las diferencias individuales. A su regreso a los Estados Unidos, Cattell particip activamente en el
establecimiento de laboratorios de psicologa experimental y en la difusin del movimiento psicomtrico.
El trmino "test mental" apareci por primera vez en la bibliografa psicolgica
en un artculo escrito por Cattell en 1890, que describe un serie de pruebas que cada ao se aplicaban a los estudiantes universitarios para de rminar su nivel intelectual. Las pruebas, cuya aplicacin era individual, incluan mediciones de la fuerza
muscular, velocidad de movimiento, sensibilidad al dolor, agudeza visual y auditiva,
discriminacin de pesos, tiempo de reaccin, memoria y cosas similares. En su eleccin de las pruebas, Cattell comparta la opinin de Galton respecto a la posibilidad
de obtener una medida de las funciones intelectuales con el uso de instrumentos de
discriminacin sensorial y de tiempo de reaccin. La preferencia de Cattell por dichas herramientas tambin se sustent e n el hecho de que le permitan medir con
precisin y exactitud las funciones simples, mientras que la obtencin de mediciones objetiva? de funciones ms complejas en ese tiempo pareca una tarea inalcanzable. 1 ,,/ '
Las piebas de Cattell son caractersticas de los instrumentos desarrollados en la
ltima dcada del siglo XiX, que se aplicaban a escolares, universitarios y adultos. En
la Exposicin de Columbia realizada en Chicago durante 1893, Jastrow mont una
exhibicin en la que a los visitantes se los invitaba a realizar pruebas de procesos perceptuales, sensoriales y motores simples y a comparar su habilidad con las normas (J.
Peterson, 1926, Philippe, 1894). Los pocos intentos por evaluar estas primeras pruebas arrojaron resultados desalentadores. El desempeo de cada individuo mostraba
poca correspondencia de una prueba a otra (Sharp, 1898-1899; Wissler, 1901) y su
relacin con estimaciones independientes del nivel intelectual basadas en las calificaciones de los maestros (T. L. Bolton, 1891-1892;). A. Gilbert, 1894) o con las calificaciones acadmicas (Wissler, 1901) era poca o nula.
. Algunas pruebas elaboradas por psiclogos europeos de la poca tendan a cubrir
funciones algo ms complejas. Kraepelin (1895), que estaba interesado sobre todo en
la evaluacin clnica de pacientes psiquitricos, prepar una larga serie de pruebas para medir lo que consideraba factores bsicos en la caracterizacin del individuo. Las
pruebas, que empleaban principalmente operaciones aritmticas simples, estaban destinadas a medir lcs efectos de la prSctica, la memoria y la susceptibilidad a la fatiga y
la distraccin. Otro psiclogo alemn, Ebbinghaus (1897), aplic a escolares pruebas
de clculo aritmtico, memoria y completacin de oraciones; esta !tims, que era la
ms compleja, fue la nica que mostr una clara correspondencia con el desempeo
escolar.

.Antecedentes hi&ricos de las pruebas actuales

ente
estaento
:mpo
brid.divim el
novigica
le catelecfuerza
litiva,
; elecdidad
tos de
mr di.ir con
:dicio,alcanSSen

la
tos. En
,t una
;os permas
1s prueostraba
) l ) y su
S califi? 1% ca-

(J.

a cubrir
todo en
ebas paluo. Las
3an desfatiga y
pruebas
le era la
.empeo

37

En un artculo publicado en Francia en 1895, Biriet y Henri criticaron el hecho de


que casi todas las pmebas disponibles eran sensoriales y se concentraban indebidamente en habilidades especializadas simples. Adems, argumentaban que en la medicin de las funciones ms complejas no se req~lierede gran precisin, ya que, en tales
funciones, las diferencias individuales son mayores. Propusieron una amplia y variada
lista de tests que cubran funciones como la memoria, la imaginacin, la atencin, la
comprensin, la susceptibilidad a la sugestin, la apreciacin esttica y muchoj-otros,
en los que podemos reconocer las tendencias que a la postre condujeron al desarrollo
de las famosas escalas de inteligencia de Binet.

BINET Y EL SURGIMIENTO DE LOS TESTS


DE INTELIGENCIA
Binet y sus colaboradores dedicaron muchos aos a la investigacin activa e ingeniosa de las formas de medir la inteligencia. Probaron muchos metodos, incluyendo la
medicin de la forma del crneo, la cara y la mano, as como el anlisis de la escritura;
sin embargo, los resultados los llevaron a la conviccin de que la medicin directa,
aunque tosca, de las funciones intelectuales complejas era la ms promisoria. Entonces
una situacin en particular hizo fructificar los esfuerzos de Binet. En 1904, el Ministerio de Educacin lo comision para que estudiara procedimientos para la educacin
de nios retardados. Fue en relacin con los objetivos de esta comisin que Binet prepar, en colaboracin con Simon, la primera escala de Binet-Simon (Binet y Simon,
1905).
Fsta escala, conocida como la escala de 1905, constaba de 30 problemas o tests
arreglados en orden de dificultad creciente. El nivel de dificultad se estableci empricamente aplicndolos a 50 nios normales de tres a 11 aos y a algunos nios y aduitos rerardacios. Las pmebas fueron diseadas para cubrir una amplia variedad de
funciones, con nfasis especial en el juicio, la comprensin y el razonamiento, que Binet consideraba los componentes principales de la inteligencia. Aunque incluyeron
pruebas sensoriales y perceptuales, en esta escala se encuentra una proporcin de contenido verbal mayor que en la generalidad de las pruebas de la poca. Como la escala
de 1905 fue presentada como un instmmento preliminar y tentativo, no se formul un
m t d o objetivo preciso para obtener una puntuacin total.
Eii la segunda escala, la de 1908, aument el nmero de tests, se eliminaron algunos de la primera que resultaron insatisfactorios y todos fueron agrupados en niveles
de edad sobre la base del desempeo de alrededor de 300 nios normales de entre
tres y 13 aos. De este modo, en el nivel de tres aos se ubicaron todos los tests que
pasaban del 80 al 90 por ciento de los nios normales de tres aos; en el ivel de
cuatro aos, los que aprob el mismo porcentaje de nios normales de esa edad; y
as1 sucesivamente hasta los 13. La calificacin del nio en toda la p e b a podela entonces expresarse como el nivel mental correspondiente a la edad de los nios normales cuya ejecucin haba igualado. En las diversas traducciones y adaptaciones de
las escalas de Binet el trmino de "nivel mental" fue sustituido por el de "edad mental", cuya fcil comprensin indudablemente contribuy a popularizar los tests de

38

Funciones y orgenes de pruebas, tests o instrumentos de medicin psicogicos

inteligencia;3 sin embargo, el propio Binet evitaba el uso del termino por sus implicaciones no verificadas de desarrollo y prefera el ms neutral de "nivelomental" (T.
H. Wolf, 1973).
En 1911, ao en que Binet muri intempestivamente, aparecij la tercera revisin
de la &cala de Binet-Simon, que no presenta mayore modificaciones, salvo revisiones menores, cambios en la localizacin de algunos tests, la adicin de otros en varios
niveles de edad y la extensin de la escala al nivel adulto.
Incluso antes de la revisin de 1908, los tests de Binct-Simon atrajeron la atencin
de los psiclogos de todo el mundo. En muchos pases, aparecieron traducciones y
adaptaciones, pero la primera fue la de H. H. Goddard, en ese entonces psiclogo investigador en la Escuela de capacitacin de Vineland para nios con retardo mental.
La revisin de Goddard result clave para que la profesin m ca aceptara los tests
de inteligencia (Zenderland, 1987). Apareci en un momento propicio para satisfacer
la urgente necesidad de un instrumento estandarizado para diagnosticar y clasificar a
las personas con retardo mental. No obstante, como herramienta de evaluacin pronto h e dejada atrs por el Stanford-Binet, un instrumento ms extenso y psicomtricamente refinado, elaborado por L. M. Teman y sus colaboradores en la Universidad de
Stanford (Teman, 1916). Este instrumento utiliz por primera vez el cociente de inteligencia (CI) o razbn entre la edad mental y la cronolgica. ia ltima revisin se
emplea extensamente y la estudiaremos de manera ms completa en el captulo 8.
Tambin resulta de especial interbs la primera revisin Kuhlmann-Binet, que ampii6
la escala hasta la edad de tres meses (Kuhlmann, 1912) y representa uno de los primeros esfuerzos por elaborar tests de inteligencia para preescolares e infantes.

PRUEBAS COLECTIVAS
h s tests de Binet, as como todas sus revisiones, son escalar individuaks en el sentido
de que s61o pueden aplicarse a una persona y luego a otra. Muchos de los tests de esas
escalas requieren respuestas orales del examinado o la inanipulacin de materiales.
Algunos exigen tomar el tiempo de las respuestas de cada individuo. Por stas y otras
razones, las pruebas no pueden adaptarse a la aplicacin colectiva. Otra caracterstica de los tests de Binet es que requieren de un examinador muy capacitado, pues se
trata de instrumentos esencialmente clnicos adecuados para el estudio intensivo de
casos individuales.
L a i *bus
de grupo similares a la primera escala de Binet fueron elaboradas para
satisfacer una necesidad prctica. Cuando los Estados Unidos ingresaron en 1917 en
la Primera Guerra Mundial, la Asociacin Estadounidense de Psicologa form una
comisin para considerar cmo poda contribuir la psicologa a la conduccin de la

'

F. L. G d e n o u g h (1949. pp. 50-51) observque en 1887.21 aos antes de la aparicin de ia Escala Binet-SIrnon de 1908. S. E. Chaille public en el New Orkans M e d i d and Surgical Jounuil una serie~dcpruehas para infantes, arregladas de acuerdo con la edad en que solan ser pasadas. Debido en pane a la limitada circulaci6n de
la revista y quiz tambin a que la comunidad cientifica no estaba preparada. en esa e p c a pas inadvertido el
significado del concepto de escala de edad. La propia escala de Biner recibi la influencia del trabajo de algunos
de sus conremprAnevs. principalmente Blin y Damaye. que prepararon un conjunto de pregunta: orales de las
que ohreiian uiia sola calificaci61iglobal para cad.1 nio (T. H. Wnlf. 1973).

..
;Antecedentes histricos de las pruebas actuales

npli!" (T.
isin
visiorarios
icin
nes y
:o inmtal.
. tests
sfacer
icar a
pronStricalad de
de inin se
u10 8.
impli
3rime-

.entido
de esas
eriales.
y otras
terstipues se
jivo de
as para
917 en
n una
n de la

,39

guerra. La comisin, dirigida por Robert M. Yerkes, reconoci la necesidad de la rpida clasificacin del nivel intelectual general del milln y medio de reclutas. Esta informacin era importante para tomar muchas decisiones administrativas, incluyendo
el rechazo o la dispensa del servicio militar, la asignacin a diferentes servicios o la admisin zi campos de enxenamienco de oficiales. En este ambiente se formul el primer
test colectivo de inteligencia. Para realizar la tarea, los psiclogos acudieran a todos
los materiales disponibles, especialmente a un test colectivo de inteligencia nojublicado, preparado por Arthur S. Otis, que cedi al ejrcito. Una contribucin importante de este instrumento, elaborado por Otis cuando era estudiante en uno de los
cursos de grado de Teman, fue la introduccin de preguntas de opcin mltiple y
otros reactivos "objetivos".
Las pruebas que finalmente desarrollaron los psiclogos del ejrcito podan aplicarse a grupos grandes y llegaron a conocerse como Army Alpha y Army Beta (pruebas
Alfa y Beta). La primera se ocupaba de las pruebas generales de rutina, mientras que la
segunda era una escala no lingstica utilizada con reclutas iletrados o procedentes de
pases cuyo idioma no era el ingis.
Poco despuQ de terminar la Primera Guerra Mundial, las pruebas del ejrcito fueron
liberadas para que se aplicaran a civiles; adems de pasar por muchas revisiones, las
pruebas Alfa y Beta sirvieron como modelo para la mayor parte de los tests colectivos
de inteligencia, lo que contribuy al notable crecimiento del movimiento psicomtrico. Muy pronto-se prepararon tests colectivos de inteligencia para todas las edades y
personas, desde preescolares hasta universitarios. Los programas de evaluacin a gran
escala, otrora imposibles, se emprendieron con gran entusiasmo. Como las pruebas
colectivas fueron diseadas como instrumentos de evaluacin masiva, no s61o pennitieron la medicin simultnea de grandes grupos, sino que tambikn simplificaron las
instrucciones y los procedimientos de aplicacin, con lo que disminuy la capacitacin requerida del aplicador. Los maestros empezaron a aplicar en sus grupos los tests
de inteligencia y los estudiantes universitarios eran evaluados de rutina antes de su ingreso; se iniciaron amplios estudios de grupos especiales de adultos, como los prisioneros, y muy pronto el pblico general cobr conciencia del C1.
La aplicacin de esos tests colectivos excedi a su mejoramiento tcnico. En la prisa por obtener puntuaciones y sacar conclusiones prcticas de los resultados, a menudo se olvidaba que las pruebas an eran tknicamente imperfectas, de modo que
cuando no lograban cumplir las injustificadas expectativas, se generaba escepticismo y
hostilidad hacia todas las pruebas. De este m d o , ei auge psicomtrico de los aos
veinte, basado en el uso indiscriminado de los instrumentos, puede haber demorado el
progreso de las pruebas psicolgicas.

TESTS 'DE APTITU D


Binet-SIpara inilacin de
venido el
ie algunos
des de las

8s

Aunque al principio los tests de inteligencia fueron diseados para cubrir una amplia
variedad de funciones que permitieran estimar el nivel general de inteligencia del individuo, pronto se hizo evidente que su alcance era muy limitado. No todas las funciones
importantes estaban representadas. De hecho, la mayor parte de los tests de inteligencia eran principalmente mediciones de la habilidad verbal y, en menor grado. de la

::

40

Funciones y orgenes de pruebas, tests o instrumentos de medicin psicolgicos

habilidad para manejar relaciones numricas y otras relaciones abstractas y simblicas. Gradualmente, los psiclogos .reconocieron que el termino "test de inteligencia"
era un nombre inadecuado, ya que slo medan ciertos aspectos de sta.
Fara que resultaran seguros, los instrumentos tocaban habilidades que son de gran
importancia en la cultura para la qiie fueron disefados, perc pronto se reconoci la
conveniencia de contar con designaciones ms precbas en trminos de la informacin
que podan ofrecer; por ejemplo, ahora se conoce como tests de aptitud escolar a algu- nos instmmentos que en los veinte habran sido llamados de inteligencia. Este cambio
en la terminologa procede del hecho de que muchos de los llamados tests de inteligencia miden la combinacin de habilidades requeridas y fomentadas por el trabajo
universitario.
Incluso antes de la Primera Guerra Mundial, los psiclogos efnpezaban a admitir la
necesidad de contar con tests de aptitudes especiales que complgnentaran los de inteligencia global. En especial, se prepararon pruebas de aptitudes especiales para uso en la
orientacin vocacional y en la seleccin y clasificacin de personal industrial y militar. Entre las ms empleadas estn los tests de aptitud mecnicz, profesiona!, musical y
artstica.
La evaluacin crtica de las pruebas de inteligencia que sigui al uso indiscriminado durante los veinte tambin revel el hecho notable de que el desempeo del
individuo a menudo mostraba una marcada variacin en diferentes partes de la prueba. Esto result6 en especial evidente en las pruebas colectivas, en las que los reactivos
suelen separarse en subpruebas de contenido reiativamente homogneo; por ejemplo,
una persona po& obtener una puntuacin ms bien alta en la subpmeba verbal y un
pobre resultado en la numrica o viceversa. Dicha variabilidad interna es hasta cierto
grado discemible en un test como el Stanford-Binet en el que, por ejemplo, todos los
reactivos que incluyen palabras pueden resultar difciles para cierto individuo, mientras que los que emplean imgenes o diagramas geomtricos pueden resultarle ventajosos.
Los usuarios, y sobre todo los clnicos, a menudo se valan de esas comparaciones
internas para obtener un conocimiento ms profundo de la estructura psicolgica del
individuo. De este modo, al evaluar un caso individual no slo se examinaba el CI o
algn otro resultado global, sino tambin el desempeo en grupos de reactivos o subtests; sin embargo, en general no se recomienda esta prctica, porque los tests de inteligencia no fueron diseados con el propsito de realizar un analisis diferencial de las
aptitudes. Con frecuencia, los subtests comparados contienen muy pocos reactivos para prducir ur.a estimacin estable o confiable de determinada habilidad. Entonces, la
diferencia de las puntuaciones de los subtests se puede revertir si vuelve a examinarse
al individuo otro da o con otra forma del mismo instrumento. Para realizar esas comparaciones en el mismo sujeto, es necesario disear las pruebas con el objeto de que
revclen diferencias de ejecucin en diversas funciones.
Al mismo tiempo que la aplicacin prctica demostraba la necesidad de contar con
mltiples tests de aptitud, un desarrollo paralelo en el estudio de la organizacin de los
rasgos iba proporcionando los medios para elaborarlos. Los estudios estadsticos sobre
la naturaleza de la inteligencia haban explorado las re!aciones entre las puntuaciones
obtenidas por muchas personas en una gran variedad de pruebas. El p&clogo ingls

.'
~ntecedenteshistricos de las pruebas actuales
12"

m
la
in
uio
lijo
la
:e. la
iliJY
nide l
ueVOS

40,
un
TtO
los
.en7ta-

mes
del
21 o
subntee las
5 paS, la
larse
:om: que

con
le los
sobre
lones
ng1i.s

41

"

Charles Spearman (1904, 1927) inici estas investigaciones durante la primera dcada del siglo XX. Los desarrollos metodolgicos subsecuentes, basados en el trabajo de
estudiosos ingleses y estadounidenses, como T. L. Kelley (1928) y L. L. Thurstone
(1938, 1947b), llegaron a conocerse como anlisis factorial.
En el captulo 11 examinaremos de manera exhaustiva las contribuciones de los
mtodos del anlisis factorial en la elaboracin de pruebas. Por ahora basta con destacar que los datos ~btenidoscon estos procedimientos seaiaron la presencia de diversos factores o rasgos relativamente independientes, algunos representados en diversas
proporciones en los tests tradicionales de inteligencia, como, por ejemplo, la comprensin verba! y el razonamiento n~imrico;otros, como la aptitud espacial, perceptual y mecnica, se encuentran ms a menudo en los instrumentos para la medicin
de aptitudes especiales que en los de inteligencia.
Uno de los principales resultados prcticos del anlisis factorial fue el desarrollo de
las baterzs de aptitudes mltiples, diseadas para proporcionar una medida de la posicin del individuo en un&serie de rasgos. En lugar de una puntuacin total, o CI, estos instrumentos obtienen una puntuacin aparte para rasgos como la comprensin
verbal, la aptitud numrica, la visualizacin espacial, el razonamiento aritmtico y la
rapidez perceptual, lo que permite realizar el anlisis intrasujeto o diagnstico diferencial en el mismo sujeto que los usuarios trataron de obtener por muchos aos con los
resultados crudos y a menudo errneos de los tests de inteligencia. Ademh, dado que
cubren algunos de los rasgos que generalmente no se incluan en ese tipo de instrumentos tambikn incorporaron en un programa amplio y sistemtico de evaluacin
gran parte de la informacin que antes se obtena de las pruebas de aptitud especial.
Las bateras de aptitudes mltiples representan un desarrollo relativamente tardo
en el campo de las pruebas, ya que casi todas aparecieron a partir de 1945. A este respecto es de destacar el trabajo de los psiclogos militares durante la Segunda Guerra
Mundial. Gran parte de la investigacin conducida en las fuerzas armadas se bas en
el anlisis de factores y se orient a la preparacin de bateras de aptitudes mltiples;
por ejemplo, en la fuerza area se construyeron bateras especiales para pilotos, bombarderos, operadores de radio, rastreadores y muchos otros especialistas. El informe de
las bateras que elabor la fuerza area ocupa al menos nueve de los 19 voimenes dedicados al programa psicolgico de la aviacin durante la Segunda Guerra Mundial
(Awny Air Fmces, 1947-1948). La investigacin en esas lneas an sigue en progreso
con el patrocinio de varias ramas de las fuerzas armadas. Tambin se han realizado bateras para uso civil y se aplican lo mismo en la orientacin vocacional y educativa
que en la seleccin y clasificacin de personal. En los captulos 10 y 17 presentaremos
algunos ejemplos.
Un adelanto ms reciente, surgido a finales de los ochenta y comienzos de los noventa, permite la integracin de dos metodos al principio contradictorios de medicin
mental representados por los tesri tradiciondles de inteligencia y :zs bateras de aptitudes mltiples (Anastasi, 1994). En la actualidad, se reconoce que la habilidad del
ser humano puede ser evaluada de manera adecuada a diferentes niveles de profundidad,
desde las aptitudes muy definidas de las pruebas especficas (o incluso de reactivos),
pasando por el nivel de los rasgos hasta una puntuacin global como el tradicional
CI. Para cada propsito de evaiuacin hay un nivel apropiado de profundidad. Fn

.. -

correspondencia, los tests de inteligencia que se han desarrollado recientemente, como


las Escalas de Habilidad Diferencial o las revisiones recientes de tests mteriores, como la
cuarta edicin del Stanford-Binet (que explicaremos en el capftulo 8),combinan la amplia cobertura de diversas aptitudes con calificaciones flexibles de niveles mltiples para propsitos concretos de evaluacin. Aunque se trata de dos ejemplos de tests de
inteligencia de aplicacin individual: el mismo mtodo amplio y flexible de preparacin y uso de los instrumentos ha tenido un impacto en las bateras de aplicacin colectiva, como !as que veremos en el capitulo 10. En el captulo 11 estudiaremos la base
terica y las implicaciones prcticas de esta combinacin de tests de habilidad en relacin con los adelantos recientes, relativos a la naturaleza de la inteligencia.

PRUEBAS ESTANDARIZADAS DE APROVECHAMIENTO


.1

Mientras los psiclogos se ocupaban de los tests de inteligencia &de aptitud, los exmenes escolares tradicionales experimentaban avances tcnicos (0.W. Caldwell y
Courtis, 1923; Ebel y Damrin, 1960). Un paso importante en esta direccin lo dieron
las escuelas pblicas de Boston en 1845 cuando los exmenes escritos sustituyeron al
interrogatorio oral de los estudiantes por examinadores visitantes. Enne los argumentos ofrecidos en apoyo de esta innovacin estaba que los exmenes escritos ponan a
los estudiantes en una situacin uniforme, permitan una cobertura ms amplia del
contenido, reducan el elemento azaroso en la eleccin de reactivos y eliminaban la
posibilidad de favoritismo por parte del examinador. Todos estos argumentos tienen
un sonido familiar: fueron utilizados mucho despus para justificar la sustitucin de los
reactivos de ensayo por los reactivos objetivos de opcin mltiple.
A la vuelta del siglo empezaron a aparecer las primeras pmebas estandarizadas para
medir los resultados de la instruccin escolar. Encabezadas por el trabajo de E. L.
Thomdike, las pruebas empleaban principios de medicin tomados del laboratorio
psicolgico. Entre los ejemplos se incluyen escalas para calificar la calidad de la escritura y la redaccin, asi como pruebas de ortografia, aritmtica, dlculo y razonamiento
aritmtico. Despuds llegaron las baterias de aprovechamiento, iniciadas con la publicacin de la primera edicin de la Prueba de Aprovechamiento de Stanford (Stanford
Achievement Test) en 1923. Sus autores fueron tres lderes en la elaboracin de pruebas: Tiuman L. Kelley, Giles M. Ruch y Lewis M. Teman. Presagiando muchas caracteristicas de la psicometra inodema, esta batera proporcion medidas comparables
de ejecucin en diferentes materas escolares, evaluadas en trminos de un solo grupo
normativo.
Al mismo tiempo se acumulaban evidencias de la falta de acuerdo entre los niaestros al calificar las pruebas de ensayo. Para 1930 era ampliamente reconocido que las
pruebas de ensayo no slo requeran ms tiempo para los examinadores y examinados, sino que tambin arrojaban resultados menos confiables que el "nuevo tipo" de
. ~ la medida en que estos ltimos llevaron al uso creciente de
reactivos o b j e t i ~ o sEn
las pruebas estandarizadas de aprovechamiento, hubo un niasis mayor en el diseo

'b investigacidn relacionada con la relativa ehcacia de los reactivos de ensayo y objetivos se trata en el capltulo
17, e n la parte que aborda la utilizacin educativa de las pmebas

..

ntecedentes histricos de las pruebas $chales

a,ade
ra:oase
:la-

x!1 y
ron
1 al
entn a
del
n la
nen
e los

corio
xriento
ubli-

nfmd
pruearacabies
,pp
siaesue las
nina%O"de
ite de
liseo

i
E.

43'

de reactivos para probar ia comprensin y la aplicacin del conocimiento y otros objetivos educativos ms amplios. La dcada de los treinta tambien presenci la introduccin de las mquinas para calificar exmenes a las cuales podan adaptarse
fcilmente las nuevas pruebas objetivas.
Otro desarrollo digno de mencin fue el estahlecimientc en los Estados Unidos de
programas estatales, regionales y nacionales de evaluacin. Probablemente el ms conocido sea el de la Junta Universitaria de Exmenes de Admisin a la Universidad (ColleRe Entrame E-nation
Board, CEEB). Establecido a principios de siglo para reducir la
duplicacin de los exmenes de admisin presentados por los estudiantes de reciente
ingreso a la universidad, el programa ha experimentado cambios profundos en sus prccedimientos de evaluacin y en el nmero y la naturaleza de las universidades participantes, cambios que reflejan los adelantos tanto en la aplicacin de pruebas como en la
educacin. En 1947, las funciones de evaluacin del CEEB se combinaron con las de
la Corporacin Camegie y las del Consejo Estadounidense de Educacin para formar el
Servicio de Pruebas Educativas (Edtccational Testing Sewice, ETS). En los aos posteriores, el ETS asumi la responsabilidad de un nmero creciente de programas de evaluacin al servicio de universidades, escuelas profesionales, dependencias gubernamentales
y otras instituciones. Debe hacerse mencin del Programa de Evaluacin de Universidades Estadounidenses (Amerium Coiiege Tesring Program), establecido en 1959 para seleccionar a los aspirantes a las universidades no incluidas en el programa CEEB y de varios
programas nacionales de evaluacin para premiar a los estudiantes talentosos.
Las pruebas de aprovechamiento no s61o se utilizan con propsitos educativos, sino
tambien en la seleccin de solicitantes de empleos en la industria y el gobierno. Ya citamos el uso sistemtico en el servicio civil de exmenes en el imperio chino desde
aproximadamente el ao 150 a.c. (Bowman, 1989). En los tiempos modernos, la seleccin de empleados gubernamentales por medio de exmenes fue introducida en los
pases europeos a finales del siglo XWIIy comienzos del XIX.En 1883, la Comisin del
Servicio Civil de los Estados Unidos (U.S. Civil Seruice Commission) estableci el uso de
exmenes competitivos como procedimiento regular (Kavruck, 1956). Las tcnicas
de elaboracin de pruebas creadas durante y antes de la Primera Guerra Mundial fueron introducidas en el programa de evaluacin del Servicio Civil de los Estados Unidos con el nombramiento de L. J. O'Rourke como director de la recin establecida
divisin de inllestigacin en 1922. En la actualidad, este trabajo lo realiza un boisticado equipo de investigacin de la Oficina de Administracin de Personal de los Estados Unidos (U.S. Ofice of Personnel Management).
En la medida en que creca la participacin de psiclogos con preparacin en psicometra en la formulacin de pruebas estandarizadasde aprovechamiento aumentaba
la semejanza de sus aspectos tcnicos con el de los tests de inteligencia y de aptitud. Los
procedimientos para la elaboracin y evaluacin de todas esas nuevas pruebas tenan
muchc en comn. Los crecientes esfuerzos por preparar
de aprovecham:.ento
que midieran la consecucin de amplias metas educativas, en contraste con el recuerdo de hechos triviales, tambin hizo que el contenido de las pruebas de aprovechamiento se asemejara al de los tests de inteligencia. En la actualidad, la diferencia entre
los dos instrumentos corresponde principalmente al grado de especihcidad del conte,
nido y el grado en que el instrumento presupone una iristruccin previa.

44

Funciones y orgenes de pruebas, tests o instrumentos de medicin psicolgicos

Otra rea de inters de las pruebas psicolgicas son los aspectos afectivos o no intelectuales de la conducta, los que revisaremos del captulo 13 al 16. Los instnimentos diseaclos con este propsito suelen conocerse como tests de personalidad, aunque
muchos psiclogos prefieren emp!ear el trmino "fiersonalidad en un sentido ms
amplio para referirse al individuo en su totalidad. De acuerdo con esto, tanto los rasgos intelectuales como los no intelectuales deberan agruparse bajo dicho rubro; sin
embargo, en la terminologa psicomtrica es ms comn el uso de la expresin "test de
personalidad" para referirse a la medicin de caractersticas como los estados emocionales, las relaciones interpersonales, la motivacin, los intereses y las actitudes.
El uso que hizo Kraepelin de la prueba de asociacin libre con pacientes psiquitricos
es un antecedente de los tests de personalidad. En esta prueba, se bresentan al examinado palabras estmulo especialmente seleccionadas y se le pide que responda a cada una.
con la primera palabra que le venya a la mente. Kraepelin (1892) tambin utiliz esta
tcnica para estudiar los efectos psicolgicos de la fatiga, el hambre y las drogas, y concluy que todos esos agentes incrementan la frecuencia relativa de asociaciones superficiales. Sommer (1894), que tambin trabaj en la ltima dcada del siglo XIX, sugiri
que la prueba de asociacin libre podra utilizarse para diferenciar formas de trastorno
mental. Despus, la tcnica ha sido utilizada con distintos prop6sitos de evaluacin y
an sigue emplendose. Debe mencionarse el trabajo de Galton, Pearson y Cattell en la
preparacin de cuestionarios estandarizados y escalas de calificacin. Aunque originalmente estaban destinados a otros propsitos, estos procedimientos fueron utilizados para elaborar algunos de los tests de personalidad que hoy son ms comunes.
El prototipo dc cuestionario de personalidad, o inuentan'o autodescriptivo (captulo
13), es la Hoja de Datos Personales (Personal Data Sheet) creada por Woodworth durante la Primera Guerra Mundial (DuBois, 1970; Franz, 1919, pp. 171-176; L. R.
Goldberg, 1971; Symonds, 1931, captulo 5). El cuestionario fue disenado como una
herramienta de seleccin para identificar a los individuos gravemente pertiirhiiclos que
deberan ser excluidos del servicio militar. El cuestionario constaha dc tina serie de
preguntas que versaban sobre sntomas psicopatolgicos comunes y en las que los individuos respondan sobre s mismos. Se obtena una puntuacin toral, contando el
de sritomas indicados. Este instrumenco no se termin y no pudo emplearse a
tiempo, antes de que terminara la guerra, pero inmediatainente despus se prepiiraron
formas para uso civil, incluyendo una forma especial para aplicar a nifios. Ms an, la
Hoja de Datos Personales de Woodworth sirvi como modelo para la mayor parte de
los inventarios de ajuste emocional. En algunos de estos cuestionarios se haca un iiitento por subdividir el ajuste emocional en formas ms especficas, como el ajuste al
hogar, el escolar y el vocacional. Otros instrumentos se concentraban en un rea ms
estrecha de conducta o en respuestas ms claramente sociales, ccmo las de dominancia-sumisin en cl trato personal. El ltimo avance fue la elaboraci6n de 1nstruinen:os
para cuantificar la expresin de actitudes e intereses (captulo 14), qiic tarnhiii se basaban principalniente en las tcnicas de cuestionario.
Otro mtodo de medicin de la personalidad se encuentra en la aplicacin de tests
situacionales y de ejecucin (captulo 16), en las que el examinado debe rer 1izar una
CI

Antecedentes histricos de los pruebas actuales

itelectos diunque
o ms
OS rasro; sin
test de
nocioitricos
iminada unas
7 6 esta
y conuperhsugiri
istorno
ci6n y
11en la
iginaldos paaptulo
rth du; L. R.
no una
los que
erie de
los inindo el
earse a
,araron
an, la
arte de
un iniuste al
ea ms
ninanmentos
i se bade tescs
:ar una

45

tarea cuyo propsito a menudo est encubierto. La mayor parte simula con mucho
realismo situaciones de la vida cotidiana. La primera aplicacin extensa de las tcnicas est e n las pruebas elaboradas por Hartshome, May y colabradores a finales de
los veinte y principios de los treinta (1928, 1923, 1930). Esta serie, estandarizada
para escolares, se interesaba eF conductas tales como copiar, mentir, robar,-cooperar
y persistir. Era posible obtener puntuaciones cuantitativas objetivas e n numerosos
instrumentos especficos. Orro ejemplo, estepara los adulms, se encuentra e n la serie de tests situacionales preparados durante la Segunda Guerra Mundial por el Programa de Evaluacin de la Oficina de Servicios Estratgicos (Offce of Snategic
Seruices, OSS, 1948). Esos tests se interesaban en la conducta emocional y social
sutil y relativamente compleja y su aplicacin requera de condiciones ms bien elaboradas y de personal capacitado, adems de que la interpretacin de las respuestas
era relativamente subjetiva.
Las tcnicas proyectivas (captulo 15) representan el tercer mtodc de estudio de la
personalidad que ha mostrado un crecimiento notable, en especie1 entre los clnicos.
Estos instrumentos presentan al cliente un estmulo no muy estructurado, lo que permite una considerable libertad en su solucin La suposicin que fundamenta este metodo
es que el individuo proyectar mediante el estmulo su estilo caracterstico de respuesta. Como e n los tests situacionales o de ejecucin, el propsito de las tcnicas proyectivas est ms o menos encubierto, lo que reduce la posibilidad de que el individuo
cree deliberadamente una impresin deseable. La prueba de asociacin libre, que ya
citamos, es una de las primeras tcnicas proyectivas. Los tests de frases incompletas
tambin se han utilizado de esta manera. Otras tareas que aparecen e n las tcnicas
proyectivas incluyen el dibujo, el arreglo de juguetes para crear una escena, la dramatizacin extempornea y la interpretacih de manchas de tinta.
Todos los tests de personalidad disponibles presentan ciertas dificultades prcticas y
tericas: Cada mtodo tiene sus propias ventajas y desventajas. En conjunto, los tests
de persona!idad han quedado detrs de los de habilidad encuanto a logros prcticos,
pero esa falta de progreso no puede atribuirse a un esfuerzo insuficiente. La investigaciGn sobre la niedicin de la personalidad ha alcanzado proporciones impresionantes
desde 1950, y muchos instrumentos ingeniosos y mejoras tcnicas estn en investigacin. Lo que explica el lento avance en el 5rea son ms hien las dificultades especficas
que se encuentran en la medicin de la personalidad.
A partir de la investigacin actual c m los tests de personalidad estn surgier.do dos
tendencias unificadoras importantes (vase Anastasi, 1985b, 1992a, 1993; Digman,
1990; L. R. Goldberg, 1993; Simon, 1994). Primera, cada vez hay ms evidencias de la
influencia recproca de los rasgos afectivos (de "personalidad") y cognoscitivos (de
"habilidad") tanto en el desempeo.de tareas como en el desarrollo conductual. Se ha
llegado a la conclusiii de que la distincin tradicional entre los dos rasgos ha sido impuesta artificialmente por razones de conveniencia en la descripcin y medicin de
diferentes aspectos de la conducta. Segunda, el anlisis terico de la naturaleza y composicin de la personalidad apoya la integracin de los rasgos cognoscitivos y afectivos en un modelo aiiiplio de :a actividad humana que incluye todas las formas de
conducta. Este modelo relaciona la investigacin bsics de los rasgos intelectuales
(capkulo 11) y los afectiv~b(capkulo 13).

You might also like