You are on page 1of 27
Valider: Conceptos basics Tests Psicolégicos ANNE ANASTASL SUSANA UREINA a validez de los instrumentos de medicién tiene que ver con lo que miden y con qué tan bien lo hacen; nos indican qué se puede inferir a partir de sus resultados. A este respecto, debe tenerse el cuidado de no aceptar el nombre de la prueba o el test como indicador de lo que mide, pues aunque son titulos cortos, conve- nientes para propésitos de identificacién, casi todos son demasiado generales y vagos para indicar el érea de conducta que cubren; no obstante, cada vez son mayores los es- fuerzos por utilizar nombres més especificos y que puedan definirse de manera empiri- a. El rasgo medido por determinada prueba s6lo puede definirse mediante el examen de las fuentes objetivas de informacién y las operaciones empiricas utilizadas para es- tablecer su validez. Més atin, la validez no puede expresarse en términos generales, 0 es posible decir en abstracto que es “alta” o “baja”, sino que hay que teferirse al uso particular para el que se planea utilizar el instrumento. En principio, todos los procedimientos utilizados para determinar la validez se inte- resan en las relaciones entre la ejecuci6n en las pruebas y otros factores observados in- dependientemente de las caracteristicas de a conditcta considerada. Para investigar estas relaciones se han empleado distintos métodos, cuyos nombres tradicionalmente se han concentrado en aspectos de la validez que son importantes para distintos usos de la prueba. En la medida en que se han desarrollado y expandido las aplicaciones de los instrumentos, también se han modificado los conceptos de validez (Anastasi, 1986a; Messick, 1988, 1989). 13 114 Principios técnicos y metodolégicos EVOLUCION DE LOS CONCEPTOS DE VALIDEZ DE LAS PRUEBAS Uno de los primeros usos de las pruebas fue la evaluacién de lo que los individuos ha- bfan aprendido en determinadas 4teas de contenido. En la actualidad, se aplican a los ‘eximenes escolares de fin de cursos y las pruebas presentadas para obtener la licencia de manejo o para desempefiar ciertas ocupaciones. En general, para evaluar esta cate- gorfa de pruebas se compara su contenido con el del rea que pretenden probar. La aproximacién descriptiva sigue siendo importante en la validacién de los instrumen- tos para algunas aplicaciones, la veremos en otra seccién de este capitulo. ‘Cuando la examinacién pasé a su segunda etapa, el énfasis cambi6 a la prediccién, jc6mo responderén diferentes personas a una situacion dada, ahora o en algin momen- to futuro?, ;c6mo reaccionard este individuo en diferentes situaciones especificas? Se designé como criterio al desempefio en la situaci6n para la cual se pretende predecit la conducta. En este caso, la validez del instrumento generalmente se informa como el coeficiente de correlacién entre los resultados del test y una medida de criterio directa ¢ independiente. Este procedimiento es en especial apropiado para el uso de las prue- bas en la seleccién o colocacién de individuos en programas educativos, empleos 0 programas particulares de tratamiento. De este modo, para una prueba de aptitud m ‘nica el criterio puede ser el desempefio laboral como maquinista; para una de apti- tud académica, las calificaciones escolares, y pata una prueba de neuroticismo, las valoraciones de los compafieros o alguna otra informacién disponible sobre el com- portamiento del individuo en diversas situaciones. La corriente actual en la historia de la evaluaci6n refleja dos tendencias principales: (1) un fortalecimiento de la orientacién teérica, y (2) una estrecha vinculaci6n entre la teoria y Ja verificacin psicolégicas mediante la comprobacién empfrica y experimental de las hipétesis. Estas tendencias son tan evidentes en la elaboracién y la validacién de Jos instrumentos como en el conjunto de las otras Sreas de la psicologia (Anastasi, 1992a, 1992b, 1995). Un resultado de estas corrientes es el reconocimiento creciente del valor de los constructos para describir y comprender la conducta humana. Los cons- tructos son categorfas amplias que se derivan de los rasgos comunes que comparten las variables conductuales observables directamente; pero se trata de entidades teéricas que por su parte no pueden ser observadas de manera directa. El interés en los constructos lev6 a la introduccién de lo que al principio se considers la tercera categoria de validez, a saber, la validez de constructo (AERA, APA, NCME, 1985; APA, AERA, NCME, 1974; Cronbach y Meehl, 1955). A la larga y en la medida en que especifica lo que la prueba mide, la validez de constructo Ileg6 a reconocerse como la validez fundamental ¢ incluyente de concepto. Los procedimientos de validacién predictiva y de contenido se encuentran entre las muchas fuentes de informacién que contribuyen a la definicién y a comprensién de los constructos evaluados por la prueba. Al mismo tiempo, propor- cionan informacién que es valiosa por derecho propio y destacan en la evaluacién de las pruebas para determinados usos. De alt que los conceptos (y términes) hayan sobrevivi- do a pesar de su integraci6n en el concepto mas amplio de validez de constructo. PROCEDIMIENTOS DE LA DESCRIPCION DEL CONTENIDO Naturaleza. Los procedimientos de validacién por la descripcién del contenido comprenden principalmente el examen sistemdtico del contenido de la prueba para Validez: Conceptos basicos 115 determinar si cubre una muestra representativa del érea de conducta que debe medir- se. Esta forma de validacién se utiliza sobre todo en los instrumentos disefiados para medir qué tan bien ha dominado el individuo una habilidad o un curso de estudio. Puede parecer que basta con la simple inspeccién del contenido de la prueba para establecer su validez para dicho propésito; por ejemplo, una prueba de multiplicacién, ortograffa o contabilidad pareceria valida por definicién si est4 constituida por reacti- vos de multiplicacién, ortografta o contabilidad. Pero la solucién no es tan sencilla. Un. problema es el muestreo adecuado del universo de reactivos. El érea de conducta por examinar debe analizarse sistematicamente para garantizar que los reactivos cubran to- dos los aspectos importantes y en la proporci6n correcta. Es facil cargar en exceso las pruebas con los aspectos del campo que mas se prestan para la preparacién de reactivos objetivos. Por ello, resulta conveniente describir de antemano toda el drea considerada cen lugar de hacerlo después de que la prueba esté lista; por ejemplo, un examen educa- tivo bien formulado debe cubrir los objetivos de la instruccién y no sdlo su temario. En. consecuencia, hay que definir el contenido de manera amplia para que, ademas del co- nocimiento real, incluya objetivos importantes como la aplicacién de principios y la interpretacién de datos. Més atin, la validez depende mas de la relevancia que las res- puestas del individuo tengan para el érea conductual considerada que la importancia aparente del contenido del reactivo. La simple inspeccién de la prueba no siempre bas- ta para revelar los pracesos empleados por los examinados al presentarla. En relacién con el érea muestreada por la prueba, es importante prevenir cualquier tendencia a la sobregeneralizaci6n; por ejemplo, una prueba de ortografia compuesta ppor reactivos de opcién miiltiple puede medir la habilidad para reconocer las palabras escritas correcta e incorrectamente, pero no puede suponerse que también mida la ha- bilidad para tomar un dictado, la frecuencia de los errores ortogrdficos en un trabajo de redaccién y otros aspectos de la habilidad ortogréfica (Ahlstrém, 1964; Knoell y Harris, 1952). Otro problema procede de la posible inclusién de factores irrelevantes en los resultados; asi, la habilidad para comprender insteucciones verbales o la rapidez para ejecutar tareas rutinarias sencillas pueden afectar indebidamente una prueba di- sefiada para medir el aprovechamiento en mateméticas o mecénica. Procedimientos especificos. La validez de contenido se introduce desde el inicio en la prueba mediante la eleccién de reactivos apropiados. Para las pruebas educacio- nales, la preparacin de los reactivos es precedida por una revisién cuidadosa y siste- matica de textos y resimenes importantes para el curso y por la consulta con expertos en la materia. Sobre la base de la informacién recabada se establecen las especificacio- nes de la prueba que deben seguir los redactores de los reactivos y en las que tienen que precisar las dreas o temas del contenido, los objetivas o procesos educativos que han de probarse y la importancia relativa de temas y procesos individuales. Las especifica- ciones finales deben indicar el ntimero de reactivos de cada clase que hay que preparar para cada tema; por ejemplo, la evaluacién de la habilidad de lectura puede incluir la comprensién del vocabulario en el contexto, la comprensién literal del contenido y la extraccién de inferencias correctas de la informacién proporcionada. También puede muestrear material de diversas fuentes, como ensayos, poemas, articulos periodisticos 0 instructivos para manejar equipo. Una prueba de mateméticas puede cubrir habilidades

You might also like