You are on page 1of 15

HISTORIA DE LA PSICOMETRÍA EN EL PERÚ

Psicometría

Bajo el rubro de psicometría se reúnen trabajos que tienen como tema la adaptación de tests extranjeros y con
ello la verificación de sus índices de validez y confiabilidad y el desarrollo de normas o baremos. Obviamente,
comprende también, la construcción de tests originales. Empezamos con la Psicometría por ser la línea de
investigación más antigua de la psicología peruana, al lado de los estudios de desarrollo. Se convirtió en las
décadas de los 40 y 50 en tema preferido de la investigación local; se hizo muy popular la estandarización de
tests, particularmente norteamericanos, ingleses y franceses. Por lo general, estos estudios estuvieron orientados
no sólo a la adaptación de pruebas foráneas, sino también a observar el desarrollo de variables cognitivas, por
ejemplo memoria, razonamiento, conceptualización, lenguaje, comprensión y juicio, construyéndose pruebas
para medir aquellas funciones. Al iniciarse la década de los años 60, la psicometría hacía sentir su presencia a
través de nuevas ediciones de los fascículos de la Serie de Estudios Pedagógicos, que Blumenfeld y sus asociados
habían compuesto años atrás. Eran leídos con provecho por los psicopedagogos que dirigían los Departamentos
Psicopedagógicos de las Grandes Unidades Escolares y Colegios Nacionales importantes. De esta manera, la
psicometría con su repertorio de tests de inteligencia, de personalidad y sus inventarios de intereses
vocacionales, fue un poderoso aliado de la naciente psicología educativa, o psicopedagogía como se le
denominaba por aquellos años.

La investigación psicométrica, en los primeros años de la década de los 60, adquiere renovado vigor, es impulsada
por algunos discípulos de Blumenfeld, desde el reorganizado Instituto Psicopedagógico Nacional y su órgano de
difusión el Boletín del instituto Psicopedagógico Nacional (BlPN), en su segunda época (1958-1962). La temática
de la investigación psicométrica no varió sustancialmente, siguió los lineamientos del periodo fundacional de lPN.
Se trabajó con pruebas de inteligencia, personalidad e intereses vocacionales. Se realizaron también,
investigaciones educativas, se desarrollaron tests de vocabulario, ortografía, aritmética y lectura; y se abordaron
problemas psicopedagógicos que escapan a la temática psicométrica.

Miguel A. Sardón (1960) publicó los resultados de una encuesta vocacional aplicada a 415 alumnos de educación
secundaria de Lima, en la que indagó las carreras preferidas, la edad y el grado escolar en que se produjeron las
elecciones vocacionales, los motivos que las determinan y las personas que influyeron en la decisión vocacional.
En 1962 dio a conocer una prueba de su propia creación, denominada Perfil de Rendimiento Diferencial,
destinado a ofrecer diagnósticos vocacionales. También realizó experiencias con el Intervalo de Intereses
Vocacionales de Thurstone, el cual adaptó al medio local. Sardón fue autor, además, de una guía para conducir
el proceso de orientación vocacional.

Rolando Chacón (1961), tradujo y adaptó la "Prueba de Personalidad de Cowan" (The Cowan Adolescent
Adjustment Analyzer) en 4414 escolares de educación secundaria, varones y mujeres. Los datos obtenidos le
permitieron determinar la validez de la prueba y desarrollar normas quintiles. En 1962 publicó los resultados
obtenidos de aplicar la "Prueba de Ajuste de la Personalidad de Rogers", a 1554 escolares de primaria. Estudió
problemas de inferioridad personal, desadaptación social, desadaptación familiar y fantaseo; desarrolló normas
para evaluar los niveles de desajustes.

Reynaldo Alarcón (1960), publicó la estandarización del "Test Colectivo de Inteligencia P.Y. de Th. Simon", basada
en 2295 escolares de primaria, de Lima, de estratos socioeconómicos bajo, medio y alto. El trabajo fue ampliado,
cubriendo una muestra de 5460 escolares de la costa, sierra y selva. En vista de las diferencias altamente
significativas entre los rendimientos de Lima y Provincias, que favorecían a los sujetos de la Capital, se
desarrollaron dos baremos de edades mentales, lU10 para Lima y otro para provincias. Los datos permitieron
hacer observaciones respecto a la influencia del nivel socio económico sobre el rendimiento intelectual.
Previamente, el Test P.Y. de Simon fue aplicado en forma experimental para determinar sus condiciones de
adaptabilidad a nuestro medio (Alarcón, 1951). Más adelante (Alarcón, 1961) traduce, modifica y estandariza la
"Prueba de Madurez Mental de California, Serie Intermedia, 1950-S", de E.T. Sullivan, W.W. Clark y E.W. Tiegs. El
test fue aplicado a 5916 escolares, varones y mujeres, de educación secundaria. Se derivaron normas de edad
mental y percentiles para la batería total. Se hicieron observaciones respecto al desarrollo de la inteligencia en
relación a la edad, encontrándose un significativo crecimiento hasta los 16 años, más allá de esta edad no se
registró un progreso estadísticamente significativo. Se encontró, también, que las medias de los CI, se
escalonaban según el estrato socioeconómico, que favorecían a las clases alta y media; estos resultados pusieron
de manifiesto la persistencia de la influencia de las desigualdades socioeconómicas sobre el rendimiento en
adolescentes. En 1962 dio cuenta de la adaptación del "Inventario de Ajuste de Personalidad" de H.M. Bell (The
Adjustrnent Inventory, Student Form), el cual fue administrado a 903 escolares de 4to. y 5to. años de secundaria
y 503 estudiantes universitarios. Se derivaron normas para evaluar los puntajes en cada área y para el Inventario
total y se hallaron coeficientes de consistencia interna de magnitud similar a los obtenidos por el autor en USA.
También se pudo observar un mayor número de problemas en las áreas de ajuste emocional y social, y mucho
menores los que se derivan de la adaptación al hogar y la salud. En el mismo año, 1962, publicó la traducción de
la "Escala de Inteligencia de Wecshsler para Niños" (Wechsler Intelligence Scale for Children, WISC), con breves
adaptaciones verbales. Esta traducción de uso experimental, llevaba la recomendación, para uso exclusivo de la
Cátedra de Pruebas Psicológicas, Curso I, de la Facultad de Letras de la Universidad de San Marcos, que por esos
años regentaba. En años posteriores, se hicieron varias ediciones mimeografiadas de esta famosa prueba, en una
época en que no se conocían traducciones al español. Asimismo, en 1963, tradujo la "Prueba de Madurez Mental
de California", Serie Pre-Primaria, de E.T. Sullivan, WW Clark y E.WTiegs. Este test fue impreso por el Ministerio
de Educación (Alarcón, 1963).

Después de los trabajos psicométricos del Instituto Psicopedagógico Nacional, de los primeros años del 60, se
advierte un largo intervalo que termina al iniciarse la década de los 70. Baldomero Cáceres (1970), analiza los
ítems de la Escala de Dogmatismo de Rokeach-40, y determina el grado de confiabilidad en una muestra de
estudiantes universitarios. Belén Salva tierra (1975) presenta la estandarización arequipeña de la Batería Factorial
de J.M. Mansione, que administró a 1840 escolares de 5to. año de secundaria; obtuvo baremos para cada uno
de los sub-tests de la prueba. José Infante & Irma Faura (1976), tipificaron el Test 0-48 de Pichot en 1252 escolares
de educación secundaria y superior. Determinaron la confiabilidad y validez de la prueba y desarrollaron normas
percentiles. José Anicama (1976) estandarizó el Inventario de Personalidad, Forma B, (EPI) de Eysenk, en una
muestra de 2000 sujetos. Verificó los índices de validez y confiabilidad y determinó normas para evaluar las
dimensiones de la personalidad. Américo Bibolini (1978) adaptó y derivó normas para el Inventario de
Preferencias de Edwards, en adolescentes varones de Lima. Reynaldo Alarcón (1979) estudió las características
psicométricas del Inventario de Ansiedad Rasgo-Estado (IDARE) de C.D. Spielberger y asociados, en 185 escolares
de 5Q año de secundaria, varones y mujeres. Estableció normas percentiles para evaluar la ansiedad en sus dos
dimensiones e hizo comparaciones con los resultados obtenidos en muestras latinoamericanas.

La investigación psicométrica es impulsada institucionalmente desde el INlDE, que empieza a publicar este género
de estudios desde mediados del 70 hasta 1986, una década más o menos. Los trabajos del INIDE estuvieron
orientados al mejoramiento de la educación, en el marco de esta política educativa, se efectuaron trabajos
psicométricos de validación y construcción de instrumentos de evaluación psicológica. Varios de estos trabajos
siguieron el enfoque piagetiano. En efecto, H. Cuya, E. Espinoza, B. Gutiérrez & N. Reátegui (1975) prepararon
pruebas operatorias para niños, destinadas a explorar estructuras y procesos cognitivos, como operaciones
lógicas, conservación, espacio topológico y causalidad. En procesos afectivos se consideraron pruebas de
cooperación, intencionalidad-realismo y reciprocidad. L. Palomino & C. Reyes (1976a, 1976b) investigaron las
operaciones intelectuales de niños de 5 a 8 años, con una batería de 17 pruebas piagetanas, elaboraron un perfil
de rendimiento y establecieron normas percentiles por edad para cada prueba. N. Reátegui, H. Cuya, F. Espinoza
& B. Gutiérrez (1977) construyeron una batería de pruebas operatorias, derivada de estudios sobre la formación
de estructuras básicas cognitivo-afectivas, en niños de niveles socioeconómicos alto y bajo y de ambientes urbano
y rural.

Estudios psicométricos no piagetanos, efectuados en el INIDE, corresponden a V. Salazar & M. Avila (1985),
quienes adaptaron, derivaron normas percentiles y establecieron índices de validez y confiabilidad para pruebas
de lectura. V. Salazar & A. Delgado (1985) adaptaron la Prueba de Desarrollo de Integración Motriz de K. E. Beery,
en 245 niños de 6 a 9 años de edad. H. Sánchez & V. Salazar (1985) elaboraron una prueba para evaluar el
aprestamiento para el aprendizaje en lenguaje, matemáticas. La prueba evalúa orientación espacial,
discriminación perceptiva, clasificación, seriación y razonamiento. Recoge ítems de tests bien conocidos y es
aplicable a niños de 5 años de educación inicial y primeros grados de primaria Los trabajos psicométricos del
lNIDE, a diferencia de los publicados por el Instituto Psicopedagógico Nacional, no tuvieron difusión internacional;
se publicaron en folletos mimeografiados, que sólo alcanzaron difusión nacional. Atendieron necesidades de la
educación nacional en una época de reforma educativa emprendida por el Gobierno Revolucionario de la Fuerza
Armada. Introducen el enfoque piagetano en el ámbito psicométrico, pues las ideas de Piaget fueron utilizadas
por los planificadores de la Reforma Educativa de 1972 (Muelle, 1981); más adelante fue abandonada esta única
orientación.

En la década de los 80 se advierte una progresiva ampliación de la temática de los estudios psicométricos, a los
clásicos temas de inteligencia y personalidad, se suman otras conductas. Esta apertura a medir nuevas variables,
p.e., de personalidad, cognitivas y actitudes, se prolonga hasta los recientes años de la década de los 90. Nelly
Ugarriza y Violeta Tapia (1983) construyeron una escala de actitudes de las madres hacia el hijo con retardo
mental. La escala, de tipo Lickert, está compuesta por 54 ítems estadísticamente significativos.

Fue aplicada a 60 madres de niños con retardo mental, presentando adecuados valores psicométricos. En el
mismo año (1983), Tapia desarrolló un test para medir la comprensión de lectura, la prueba fue aplicada a 1492
estudiantes varones y mujeres, de 14 a 20 años, que cursaban estudios en ESEP. El test presenta normas
percentiles por semestre escolar y para edades.

Aníbal Meza & Carmen Lazarte (1984) elaboraron una prueba para medir la asertividad, que recoge ítems del
inventario de Rathus y de otras pruebas similares. Dado el carácter preliminar del instrumento, los autores no
comunican valores psicométricos, aunque el fundamento teórico en que se basa es razonablemente importante.
Raúl González, interesado en problemas psicolingüísticos, junto con Rosario Quesada (1985), ha desarrollado un
breve test de bilingüismo quechua-español. La prueba fue administrada a un pequeño grupo de 30 niños, de 12
años de edad, de las escuelas rurales de Puno: determinaron índices de validez y confiabilidad de la prueba.
Cecilia Thorne y asociados (1985) administraron el Test de Dorninós a 396 varones y 370 mujeres, de 15 a 34
años. Derivaron normas percentiles para el grupo total, para edades y grados de instrucción. Más adelante,
Thornc y A. Narváez (1987), adaptaron y construyeron baremos percentiles para la Prueba de Conceptos Básicos
de Boehm, en una muestra de 308 niños de educación inicial y primer grado de primaria.

Ramón León, dedicado fundamentalmente a estudios sobre historia de la psicología, se ha interesado también
por temas psicométricos. Atraído por la investigación empírica del "resentimiento" construyó, en colaboración
de C. Romero, J. Nevara y E. Quesada (1988), una escala para medir esta conducta afectiva. La prueba fue
administrada a 142 sujetos, obteniéndose significativos índices de validez de constructo y de confiabilidad. Con
este inventario, León ha realizado varios estudios que más adelante se informa. León y asociados (1995) validaron
el Inventario de Autorreporte de Conducta tipo" A" de Blumenthal: después, junto con P. Tejada (1996),
tradujeron y estandarizaron la Escala de Ansiedad Social de M. R. Leary. Derivaron normas percentiles, para la
escala total y sub-escalas, en un grupo de 951 estudiantes universitarios. Los autores encontraron promedios de
ansiedad más elevados en mujeres que en varones.

Hugo Sánchez Carlessi (1991) se interesó por el estudio de la creatividad, elaboró un test compuesto por reactivos
de las pruebas de Wallach & Cohan, Torrance, y de Cuilford. Ha reportado valores de confiabilidad y normas
tentativas para niños de 9 a 12 años, de clase media y baja. Hugo Sánchez, Ernesto Oliver y Carlos Reyes (1993)
desarrollaron un extenso Inventario de Desajustes del Comportamiento Psicosocial, integrado por 160 ítems,
agrupados en 16 escalas, que exploran variados desajustes de la personalidad, sociales, familiares y sexuales. Han
determinado la validez de contenido y de confiabilidad del instrumento. Posteriormente, Reyes & Sánchez (1995)
ha elaborado una escala similar para niños, integrada por 80 reactivos y 10 escalas; el inventario es aplicable a
niños a partir de los 9 años.
Jorge Luna (1990) elaboró una prueba de comprensión de metáforas, la misma que aplicó a una muestra
probabilística de 160 estudiantes; ha determinado normas percentiles para interpretar los puntajes naturales.
Federico León y asociados (1991) han construido un test de conocimientos de planificación familiar para
promotoras comunitarias; reporta índices de consistencia interna, validez de contenido y de confiabilidad. César
Bocanegra (1991) aplicó el Inventario de Creencias Irracionales de Ellis, a 50 consumidores de drogas y a un grupo
similar de no-consumidores. Estableció la validez de contenido del instrumento, mediante el criterio de jueces, y
la confiabilidad por la Fórmula de Kuder Richardson. Luis Escurra (1992) adaptó el Inventario de Estilos de
Aprendizaje de Kolb en 250 estudiantes universitarios. Ha estudiado, junto con Delgado y Aparcana (1993), las
características psicométricas de una forma breve del test de Beery, encontró que dicha prueba de 12 ítems no se
adecúa al modelo de Rasch. Cecilia Salgado (1996) ha construido una escala para medir las actitudes hacia la
identidad nacional, según el Diferencial Semántico de Osgood. La validez de contenido del instrumento presenta
una alta significación estadística, que fue determinada mediante el coeficiente V de Aiken.

Irma Altez (1997) ha estandarizado la Escala 2, Forma A, de los tests de inteligencia, libres de cultura, de R.B.
Cattell. Derivó un baremo para convertir las puntuaciones naturales en cocientes de inteligencia. Ha tipificado,
también, el Test de Aptitudes Cognoscitivas, Primaria, Forma A. de Thorndike, Hagen y Lorge, en 600 niños de 5
a 7 años. Desarrolló baremos de cocientes de inteligencia por edades, junto con L. Cano, D. Peláez & J. Zarnbrano
(1997) elaboraron normas para Escala 1, Forma Abreviada, de los tests de inteligencia de Cattell. César Ruíz y
asociados (1997) tipificaron el Test de Aptitudes Escolares, niveles 1 y 2, en 5980 escolares de primaria y
secundaria; comunican una escala para evaluar los CI y normas percentiles. Más adelante, Ruiz (1998) ha
estandarizado el Cuestionario de Estudio y Trabajo Intelectual, construido por C. Yuste.

Más allá de la tipificación de pruebas psicológicas, varios autores han abordado problemas psicométricos de
relevante interés. Federico León (1983) revisó la literatura referente a la respuesta "popular" del Psicodiagnóstico
de Rorschach, sugiere tratar dicha respuesta como constructo cognitivo; asimismo, propone realizar un nuevo
enfoque de los procesos subyacentes. Luis Escurra (1988) ha discutido las formas de cuantificar la validez de
contenido y señala la conveniencia de utilizar el Coeficiente V de Aiken cuando la validez se evalúa por criterio de
jueces. Matilde Ráez (1998) ha presentado el estado actual del Rorschach y de las pruebas proyectivas en el Perú.
Encuentra que, en la actualidad, en el uso de Rorschach predomina el Sistema Comprensivo de Exner, introducido
en J990 por la autora en la Universidad Católica. Anota que, el mencionado sistema, presenta elevadas
propiedades psicométricas de con fiabilidad y validez. Entre los test proyectivos más utilizados señala el Test de
Apercepción Temática, el CAT para niños y el CAT-H, para niños muy pequeños. Siguen siendo muy utilizados la
Figura Humana de Machover, la Prueba de la Persona, el Test del Árbol y dibujos Libres. De paso indica que los
tests de personalidad objetivos que gozan de popularidad son el MMPI, el Inventario de Personalidad de Eysenck,
el inventario de Edwards, el16 PF de Cattell y el Inventario de Personalidad de California.

En otros aspectos, R. Alarcón (1974) discutió los problemas culturales inmersos en la adaptación de tests
psicológicos en América Latina; señaló que la validez y la confiabilidad se ven afectadas, cuando una prueba
construida en una cultura es utilizada en un medio cultural distinto. Cecilia Thorne, Matilde Ráez y asociados
(1988) emprendieron una revisión de la bibliografía de estudios socioculturales con el WISC-R y concluyen que es
necesario introducir cambios en los ítems y desarrollar normas para culturas diferentes. Posteriormente, Thorne
(1993) ha enfatizado el uso apropiado de los tests psicológicos, buscando comprender al individuo en su ecología
presente. Alarcón (1998) ha revisado la teoría clásica de los tests y señalado sus logros y limitaciones, en vista de
la moderna "teoría de respuesta a los ítems".