UNIVERSIDAD PARTICULAR DE CHICLAYO

FACULTAD DE CIENCIAS DE LA SALUD
ESCUELA PROFESIONAL DE PSICOLOGÍA

NOMBRE CROSBY VASQUEZ, Diana Jemima. DELGADO CARRASCO, Cynthia. MELENDEZ CARRANZA, Meliza.

TEMA VALIDEZ Y CONFIABILIDAD.

CURSO Seminario de Tesis II.

PROFESOR Lic. Regina Reque Neciosup.

CICLO X.

CHICLAYO 2013.

se abordarán los enfoques cuantitativo. como el peso. ella se asocia a cuán seguro está el evaluador al calificar o cualificar el aprendizaje que se alcanza sobre determinado conocimiento y si se corresponde con la realidad en la cual se desarrolló ese aprendizaje. de cómo se aborde la validez y la confiabilidad. En el caso de la evaluación del aprendizaje.VALIDEZ En el campo de la metrología. El rigor y la calidad para evaluar el aprendizaje dependen. Tanto la fiabilidad como la validez son dos propiedades psicométricas que deben cumplir las interpretaciones e inferencias que se hagan de los resultados obtenidos por los . Pero en el caso de variables psicológicas es necesario probar de forma empírica que el instrumento es válido para aquello que dice evaluar. Validez Cuantitativa y Cualitativa La concepción de validez está referida a la firmeza o seguridad de algún acto y las condiciones necesarias para su permanencia. cualitativo y hermenéutico. de manera individual y compartida. la validez es un concepto que hace referencia a la capacidad de un instrumento de medición para cuantificar de forma significativa y adecuada el rasgo para cuya medición ha sido diseñado. De esta forma. la estatura o el volumen. más que el test en sí mismo. por el evaluador. Tanto la validez como la confiabilidad se conjugan para coadyuvar al evaluador a ser objetivo en el proceso de describir la realidad derivada de un aprendizaje específico. La validez y la confiabilidad se abordan desde diferentes perspectivas. CONSIDERACIONES GENERALES La constatación de la validez de un instrumento de medida no ofrece mayores problemas cuando se trata de cuantificar variables objetivas. dependiendo de la aproximación epistemológica considerada. siendo el último el que mejor explica y fortalece la concepción de una evaluación centrada en el aprendiz. lo que se somete a validación son las posibles inferencias que se vayan a realizar a partir de los resultados obtenidos. el cual está inmerso en un discurso privado y que pretende ser público a través de la comunicación. cualidades esenciales que deben estar presentes en el desarrollo del proceso de recoger y analizar la información conducente a garantizar una mayor confianza sobre las conclusiones emitidas. No obstante. psicometría y estadística. vigencia y autenticidad. un instrumento de medida es válido en la medida en que las evidencias empíricas legitiman la interpretación de las puntuaciones arrojadas por el test. fundamentalmente. Para el presente trabajo.

Es importante señalar que un instrumento de medición no tiene un coeficiente fijo de validez que vaya a servir para cualquier propósito o para cualquier grupo de individuos. la validez es la proporción de la varianza verdadera que es relevante para los fines de la prueba. sino de las generalizaciones y usos específicos de las medidas que el test proporciona. no debe ser una característica propia del test. La validez. que es atribuible a la variable. permiten emitir un juicio valorativo que afirme la pertinencia y la suficiencia de las interpretaciones basadas en los resultados de una prueba. Desde el punto de vista psicométrico. para Messick (1984. Así. pues. «la validez unificada integra consideraciones de contenido. en suma. TIPOS DE VALIDEZ VALIDEZ DE CONTENIDO Se dice que una prueba o test cumple con las condiciones de validez de contenido si constituye una muestra adecuada y representativa de los contenidos y alcance del constructo o dimensión a evaluar. Los tipos de validez mantienen una relación de influencia recíproca y conforman las diversas partes de un todo. Este juicio no depende únicamente de los ítemes de la prueba. características o dimensión que mide la prueba. criterio y consecuencias en un marco de referencia de constructo para la evaluación empírica de hipótesis racionales acerca del significado de las puntuaciones y de relaciones relevantes desde el punto de vista teórico. DEFINICIONES DE VALIDEZ Desde el punto de vista estadístico. En los casos en los que la materia objeto de . 741). pero estas subdivisiones no constituyen conceptos que deban ser asumidos como independientes entre sí. sino también de la muestra sobre la que se efectúe el test. sino que siempre dependerá de la correcta elección del criterio a valorar (variable criterio) y la muestra seleccionada. la validez es el resultado de un proceso de recopilación de evidencias empíricas sustentado en supuestos teóricos que. Existen diversos tipos de validez. que es lo que conocemos de forma genérica como "validez". es decir.tests psicológicos. y del contexto de aplicación. pp. incluyendo las de naturaleza científica y aplicada».

Así pues. Existen distintos diseños experimentales que permiten determinar esta correlación. VALIDEZ PREDICTIVA También conocida como «validez criterial». la operacionalización del concepto se realiza a partir del denominado coeficiente de validez. No obstante. «validez relativa al criterio» o «validez de pronóstico». La validez de contenido es esencial a la hora de realizar inferencias o generalizaciones a partir de los resultados del test. en el campo de la psicología no siempre es posible disponer de poblaciones de contenidos bien definidas (por ejemplo. que pueden mostrar una actitud negativa ante la prueba si no perciben que ésta tenga el sentido que se le supone. A mayor correlación. mayor capacidad predictiva del test. Es frecuente que en los procesos de selección de personal se utilicen instrumentos que pretendan determinar o predecir el rendimiento futuro de los candidatos al puesto de trabajo basándose en las respuestas obtenidas. Puede utilizarse para validar un nuevo test por comparación con otro ya validado previamente. . En estos casos suele recurrirse a un análisis racional de ítems. si se pretenden medir variables psicológicas clásicas. Es un tipo peculiar de validez de contenido. la población de contenidos que se pretende evaluar está bien definida. Un caso particular de la validez de contenido es la denominada «validez aparente». que es la correlación entre el test y el criterio. Para ello es necesario que se haya obtenido una evidencia empírica de que los resultados obtenidos en la prueba correlacionen efectivamente con el rendimiento futuro en el puesto de trabajo.medición se puede precisar con facilidad. se refiere al grado de eficacia con que se puede predecir o pronosticar una variable de interés (criterio) a partir de las puntuaciones en un test. consistente en la evaluación de los contenidos del test por parte de un grupo de expertos en el área a tratar. la inteligencia o el liderazgo). pudiéndose recurrir a métodos estadísticos de muestreo aleatorio para obtener una muestra representativa de ítems. Una prueba posee una validez aparente adecuada cuando produce en los sujetos a los que se aplica la impresión de que efectivamente es una prueba adecuada. pero que tiene su parte de importancia al poder influir sobre la motivación de los participantes. La elección de un diseño u otro dependerá de las necesidades y circunstancias específicas de cada caso: VALIDEZ CONCURRENTE O SIMULTÁNEA: El test y el criterio se miden al mismo tiempo (concurrentemente). por lo que la selección de los ítems del test no ofrece mayores dificultades. como la extraversión.

pero no ocurre lo mismo en el caso de variables psicológicas como el neuroticismo o la introversión. Útil cuando se pretende dilucidar mediante una prueba algún aspecto del pasado que actualmente no es accesible. Cronbach (1984. Es el tipo más habitual en los procesos de selección de personal. muchos de los conceptos manejados en el ámbito de la psicología no son directamente observables.7 3 La fórmula general del coeficiente de validez es: Donde "x" hace referencia a las puntuaciones obtenidas en el test.1015) «la validez de constructo es el concepto unificador que integra las consideraciones de validez de contenido y de criterio en un marco común para probar hipótesis acerca de relaciones teóricamente relevantes». VALIDEZ RETROSPECTIVA: El test se aplica un tiempo después del criterio que se pretende evaluar. . esto nos lleva a considerar que toda validación es validación de constructo». Asimismo. p. p. e "y" hace referencia a las puntuaciones obtenidas en la variable criterio. La validez de constructo. VALIDEZ DE CONSTRUCTO A diferencia de lo que ocurre en otros campos. hace referencia a la recogida de evidencias empíricas que garanticen la existencia de un constructo psicológico en las condiciones exigibles a cualquier otro modelo o teoría científica. Por todo ello. y por tanto. pues. Estos conceptos precisan del acuerdo o consenso sobre sus significados para poder ser catalogados como útiles y válidos desde un punto de vista científico. Para Messick (1980.126) refiere que «la meta final de la validación es la explicación y comprensión. la validez de constructo se presenta como una condición indispensable a la hora de valorar la eficacia de un instrumento de evaluación sobre una variable psicológica determinada. Los conceptos de peso o volumen son suficientemente tangibles como para no resultar susceptibles de interpretaciones subjetivas al respecto de su significado. por lo que requieren del apoyo de medidas indirectas.VALIDEZ DE PRONÓSTICO: El criterio se mide pasado un periodo de tiempo tras la aplicación del test. en los que se pretende predecir el rendimiento futuro de los sujetos.

podremos hablar de validez factorial de un constructo en aquellos casos en los que todas las medidas que se hayan diseñado para evaluarlo arrojen resultados similares al ser sometidas a un análisis factorial. Ambos sistemas son indicadores respectivos de las denominadas "validez factorial" y "validez convergente-discriminante" VALIDEZ FACTORIAL El análisis factorial es una técnica del análisis multivariado que permite realizar una estimación de los factores que dan cuenta de una serie de variables. Se trata de una técnica de reducción de datos que permite encontrar grupos homogéneos de variables a partir de un grupo de variables mucho más numeroso. Este análisis puede ser evaluatorio. . sistematizado por Campbell y Fiske en 1959). siendo independientes entre sí.multimétodo (diseño MRMM. De este modo podemos encontrarnos con varios resultados.Los procedimientos metodológicos más utilizados para la obtención de datos referentes a la validez de constructos psicológicos han sido el análisis factorial y la matriz multirrasgo . Es decir. si se realiza con la intención de descubrir la posible estructura subyacente factorial de un conjunto de datos cualesquiera. VALIDEZ CONVERGENTE-DISCRIMINANTE Este tipo de validez se determina a partir de los resultados arrojados por la matriz multirrasgo .multimétodo. señal de que los rasgos son independientes entre sí. las medidas convergen. si se realiza con base en unas expectativas y teorías previas al respecto de esa estructura. El hecho de que un mismo rasgo sea detectado por igual con varias metodologías diferentes. VALIDEZ DISCRIMINANTE: se refiere al grado de diferenciación entre distintos constructos a partir de un único sistema de medición. es un indicador fiable de la existencia real de ese rasgo. y cumplan el requisito de ser independientes. VALIDEZ CONVERGENTE: existe validez convergente cuando las mediciones del mismo rasgo realizadas con distintos métodos correlacionan entre sí. o confirmatorio. Así. Es decir. las medidas de distintos rasgos por el mismo método muestran una baja correlación en comparación con la que muestran las medidas del mismo rasgo con diferentes métodos. e independientes al sistema de medición empleado. Se dice que en este caso. muestren un índice de correlación elevado. formarán un grupo aquellas variables que. Los criterios de formación de grupos se basan en la necesidad de que las variables a agrupar correlacionen entre sí. El sistema consiste en realizar mediciones de varios rasgos con distintos métodos de medición.

1896). añade: El fondo del asunto es que los que validan tienen la obligación de revisar cuándo una práctica tiene consecuencias apropiadas para los individuos y las instituciones. Validez de criterio: eficacia de la prueba para comparar un rasgo en cuestión con alguna o algunas variables externas. coincidiendo. validez predictiva.) pudiera excluir la reflexión sobre las consecuencias a partir de los significados de la palabra validación. Basada en la integración de cualquier evidencia que fundamenta la interpretación o significado de las puntuaciones de la prueba o test. Validez de contenido: juicio lógico sobre la correspondencia que existe entre el rasgo del aprendizaje del evaluado y lo que se incluye en la prueba. validez de criterio. y especialmente prevenir las consecuencias adversas. midiéndola a través de análisis correlacional o de regresión entre las puntuaciones obtenidas en la prueba y en otras basadas en el criterio. Usted (…. referidas a pruebas o tests. validez concurrente y validez de constructor). Este tipo de evaluación presenta diferentes interpretaciones de validez. En esa perspectiva. (b) predecir algún rasgo del aprendizaje adicional a lo que se pretende medir. recurriendo a expertos para valorar la adecuación de cada ítem al rasgo a evaluar. como aprendizaje a través de pruebas o tests. con Anastasi en 1982 y con Cronbach en 1984. la validez asociada a la evaluación del aprendizaje se concibe en términos de: (a) precisar el rasgo del aprendizaje del evaluado que se pretende medir. 1985): a. bajo la perspectiva de la teoría positivista. establecidas en los Estándares para Tests y Manuales para Educación y Psicología (American Psychological Association –APA-. pero no puede negar la obligación de hacerlo. medida a través del análisis correlacional y de covarianza interítem. desde este punto vista. apuntando hacia la concepción única de validez. con la idea de que el argumento debe unir la evidencia de los conceptos. establecidas por la APA. significado y utilidad de las inferencias específicas derivadas de las pruebas o tests.VALIDEZ CUANTITATIVA La validez cuantitativa. Estas categorías. y (c) medir lo que se dice medir de cierto rasgo (Comte. supuestos desarrollados a partir de las teorías planteadas por el filósofo francés Auguste Comte (1798-1857). las consecuencias sociales y personales. y los valores. . Cronbach (1988). b. fueron resumidas en 1985 a partir de cinco tipos de validez señalados por esta misma Asociación en 1954 (validez de contenido. se orienta fundamentalmente hacia las técnicas e instrumentos de medición elaborados por el evaluador. referida a la pertinencia.

Cronbach (1988) señala que "los argumentos para usar la prueba deben estar claros para extender. y la consistencia de la respuesta empírica. (b) componente estructural (conjugación de la fidelidad del modelo para calificar las características estructurales de las manifestaciones del constructor y el grado de la estructura interítem). sin embargo. Por su parte. La validez de constructor. la información susceptible de ser medida limita su existencia. el significado y la utilidad de las inferencias específicas derivadas de las pruebas o tests. uno para valorar el grado con el cual las implicaciones del constructor se evidencian con las relaciones . de la administración y desarrollo de la prueba. 1989: 20).Ahora. la construcción de la realidad y el peso valorativo implícito. o ambos. dejando afuera otros aspectos que pudieran ser de significativa importancia para validar el juicio. estableciendo así un proceso de búsqueda amplia y minuciosa. Al respecto Messick (1989) señala lo siguiente: … los tests no sólo son imprecisos o falibles en virtud de los errores muéstrales de medida sino también inevitablemente imperfectos como ideales del constructor que se proponen valorar. la validez de constructor estaría conformada por tres componentes: (a) componente sustantivo (confrontación entre la relevancia del juicio de contenido y la representatividad. necesaria para justificar la interpretación de la prueba. Esto último indica que hay dos tipos de evidencias necesarias para validar el constructor. al tomar en consideración la pertinencia. se pudiera pensar más bien en unificar las tres categorías de validez en una sola: la de constructor. y los valores. por el otro). De esta manera. y sus aplicaciones". social o cultural referidos al evaluado y. al no considerar otros aspectos de tipo humano. y (c) componente externo (grado de la relación empírica entre la prueba o test con otras pruebas que reflejen las esperadas relaciones implícitas en la teoría del constructor que se evalúa). conjuntamente con las consecuencias sociales y personales. Para recoger información de la validez de constructor. para continuar con aquéllos obtenidos más allá del análisis de las puntuaciones. debe tomar en consideración el uso contextual de la prueba o test y cómo se generan las puntuaciones de la misma. además. Los tests son medidas imperfectas de constructor porque no consideran aspectos que pudieran incluir de acuerdo a la teoría del constructor o incluyen aspectos que pudieran quedar fuera. por un lado. debido a que las otras dos categorías también contribuyen al significado de las puntuaciones de la prueba o reconociéndolas así como aspectos de la validez de constructor (Messick. de manera persuasiva y posible. los datos deben surgir. las puntuaciones de la prueba pudieran llevar a emitir juicios erróneos del evaluador sobre el evaluado. inicialmente.

(e) la mortalidad (diferencia en la pérdida de evaluadores). a. ella es una forma de estimar el grado de correspondencia entre el aprendizaje susceptible de ser evaluado y el proceso de evaluar ese aprendizaje atribuido al evaluado. (b) el efecto de interacción (sesgo de selección de técnicas e instrumentos de evaluación y el tipo específico de aprendizaje). Validez Cualitativa La validez. Los factores que amenazan esta validez son: (a) el efecto reactivo o de interacción de las pruebas o tests (aumento o disminución de la sensibilidad o la calidad de la reacción del evaluado al estímulo de un aprendizaje). desinterés. (c) la administración de tests (influjo que la administración de una prueba o test ejerce sobre los resultados de otro posterior). está condicionada a la estrecha relación del evaluador con el evaluado y con el contexto sociocultural donde se realiza la evaluación. y (d) las interferencias de las evaluaciones múltiples (efectos que se producen cuando al evaluado le aplican evaluaciones múltiples y sucesivas. b. 1994: 80). Campbell y Stanley (1972) distinguen dos tipos de consideraciones para la validez cuantitativa asociada a la evaluación del aprendizaje: la validez interna y la externa. Validez interna: concebida como la mínima imprescindible sin la cual es imposible interpretar alguna evaluación. Validez externa: la cual plantea la interrogante sobre la posibilidad de generalización. (b) la maduración (procesos internos del evaluado como cansancio.empíricas de la puntuación y el otro para argumentar que estas relaciones no son atribuidas a otros constructores diferentes y alternos. Algunas variables externas que pueden generar efectos que se confundirían con el del estímulo del aprendizaje son: (a) la historia (acontecimientos específicos ocurridos entre mediciones sucesivas para evaluar el logro de un objetivo instruccional). desmotivación. . etcétera). asociada a la validez. (c) efectos reactivos de la evaluación (impedimentos para hacer extensiva las técnicas e instrumentos para evaluar un aprendizaje en otros aprendizajes). la credibilidad. Agregado a esto. En otras palabras. concierne a la exactitud con que las conclusiones representen efectivamente la realidad empírica y si los constructor diseñados representan categorías reales de la experiencia humana (Hansen. (d) la instrumentación (cambios en los instrumentos de medición o en los evaluadores que pueden producir variaciones en las mediciones que se obtengan). tomando en consideración sus características más relevantes. citado en Pérez. bajo el enfoque cualitativo. Por su parte. persistiendo aquéllos de procesos y resultados de evaluaciones anteriores).

ella consiste en reunir las pruebas y evidencias suficientes para garantizar la credibilidad de la evaluación. realizando comparaciones múltiples de una misma evaluación y combinando metodologías en su análisis. Goetz y LeCompte (1988). y desarrollando conjuntamente un proceso de intersubjetividad progresiva sobre el propio proceso de construcción. existen las siguientes estrategias para asegurar la validez en materia de evaluación: a. las siguientes modalidades: (a) triangulación de tiempo (información recogida en diferentes momentos para su contrastación). éste debe controlar . Las variables que amenazan esta validez serían las mismas descritas por Campbell y Stanley (1979). (c) niveles combinados de triangulación (análisis del nivel individual. organizacional. (d) triangulación teórica (empleo de diferentes perspectivas coincidentes en una misma evaluación). Validez respondente o negociación: se desarrolla contrastando los resultados obtenidos por el evaluador con los del evaluado. a su vez. utilizados sobre el evaluado). Tomando en consideración el enfoque cualitativo. En el caso de la historia y la maduración. según Denzin (1979: 140). de una actitud de aproximación de igual a igual. Saturación: Según Hopkins (1985). sólo que su tratamiento es diferente debido a que la evaluación se realiza en escenarios no sujetos a mediciones cuantitativas ni a esquemas rígidos preestablecidos. el evaluador debe determinar la información que se mantiene estable en el tiempo así como la mutable. plantean dos tipos de validez asociados a la evaluación del aprendizaje: a. c. (e) triangulación del evaluador (verificación intersubjetiva entre varios evaluadores. Para conocer los cambios. a través del contraste de la información). entre el evaluador y el evaluado. recurre a la replicación y comparación sistemática de la evaluación. y (f) triangulación metodológica (colección de técnicas o métodos diferentes. b. cultural o social). del nivel interactivo o grupal. pudiendo existir. lo cual se logra repitiendo la evaluación o revisando el proceso involucrado. Validez interna: consiste en conocer si el evaluador observa realmente lo que cree observar. y del nivel de colectividades. Sobre la influencia del evaluador.La validez depende. (b) triangulación de espacio (técnicas transculturales). Triangulación: consiste en recoger información desde diferentes puntos de vista. revisando permanentemente las conjeturas planteadas para que resulte en todos los casos. así como contrastando su interpretación. por su parte.

es un proceso posible en estos escenarios. b. “Tengo la confianza necesaria para derrotar al rival”. El efecto de escenario y de la historia. “¿Cómo te atreves a hablarme de esa forma? Nunca te di semejante confianza”. El efecto de selección se minimiza determinando el grado de ajuste entre las categorías diseñadas y la realidad del evaluador y la del evaluado. acontecimientos y escenarios. La selección y regresión las controla el evaluador a través de un inventario de subgrupos. disminuyen en la medida que la dinámica interactiva y las experiencias históricas se identifican con la mayor claridad onfiabilidad Cuantitativa y Cualitativa CONFIANZA En sociología y psicología social. la confianza es un hipótesis que se realiza sobre la conducta futura del prójimo. Para la psicología social y la sociología. en la medida en que este futuro depende de la acción de un otro. Para contrarrestar esto. ya tenemos bastante confianza”. La confianza es una hipótesis sobre la conducta futura del otro. Se trata de una creencia que estima que una persona será capaz de . Es una actitud que concierne el futuro. de tal manera que puedan ser comparadas con otras posteriores de tipo similar. en múltiples escenarios. Confianza se refiere. debida a la disminución en número de otros evaluadores. La mortalidad. Ella depende de la identificación y descripción de las características más importantes del evaluador y de las evaluaciones. como amenazas al efectuar interpretaciones intergrupales de constructor. La confianza se verá más o menos reforzada en función de las acciones. la confianza es la creencia en que una persona o grupo será capaz y deseará actuar de manera adecuada en una determinada situación y pensamientos. por otra parte. La confianza es la seguridad o esperanza firme que alguien tiene de otro individuo o de algo. sin prejuicios ni posturas preestablecidas. Es una especie de apuesta que consiste en no inquietarse del no-control del otro y del tiempo.los factores personales en el proceso de recoger la información. para lo cual quizás sea necesario conocer exhaustivamente sus atributos. la cual debe ser lo menos visible posible. es recomendable desarrollar la evaluación. perfeccionados o comprobados por el evaluador son aplicables a los del evaluado. si es posible. Validez externa: está referida a constatar si los constructos y postulados abstractos creados. a la familiaridad en el trato: “No hace falta que te peines cada vez que voy a tu casa. para lo cual el evaluador debe identificar sus efectos.

La confianza. El término se aplica a estadísticas (valores de confianza o índice de confianza) y también a medición y calibración de máquinas destinadas a medir una magnitud (grado de confianza de la medición). gracias a ella. la confianza puede reforzarse o debilitarse de acuerdo a las acciones de la otra persona. y funciona como correlato y contraste del poder. en la teoría estructuralfuncionalista. Bien el medio o la mala intención de la persona. La moderna concepción cuantitativa de la confiabilidad tuvo sus orígenes en la tecnología militar y espacial. si el padre ayuda a su hijo. corresponde a la orientación teórica de la mayoría de los autores que han abordado el tema. la confianza se considera por lo general la base de todas las instituciones. simplifica las relaciones sociales. de la incertidumbre respecto a las acciones de los demás. la confianza saldrá fortalecida. . típicamente funcionalista. Sin embargo. por lo tanto. El término confiabilidad es usado generalmente para expresar un cierto grado de seguridad de que un dispositivo o sistema opera exitosamente en un ambiente específico durante un cierto período.actuar de una cierta manera frente a una determina situación: “Voy a contarle todo a mi padre. lo más probable es que el hijo no actúe de la misma forma. Esta explicación. en el futuro. de lo contrario. La confianza supone una suspensión. la confianza se verá traicionada y. la competitividad en el mercado. Cuando se pierde la confianza. En el ejemplo anterior. tengo confianza en que me entienda y me ayude”. fomenta la incapacidad de cumplir con lo prometido de forma continuada en el tiempo. Cuando alguien confía en el otro. es por agotamiento emocional. se trata de una suspensión temporal de la situación básica de incertidumbre acerca de las acciones de los semejantes. y la creciente competencia por presupuesto y recurso han originado la expansión de la disciplina a muchas otras áreas. simplificando el funcionamiento de la sociedad. y se convierte en un parámetro del diseño de un sistema que compite contra otros parámetros tales como costo y funcionamiento. En este sentido. consistente en la capacidad de influir en la acción ajena para forzarla a ajustarse a las propias expectativas. el incremento en la complejidad de los sistemas. cree que puedepredecir sus acciones y comportamientos. analizada. es posible suponer un cierto grado de regularidad y predictibilidad en las acciones sociales. Cuando la confiabilidad se define cuantitativamente puede ser especificada. al menos temporal. De acuerdo a la mayoría de las teorías que la abordan.

Es relativa y depende totalmente del grado de superposición o apareamiento de sus características más sobresalientes. es un proceso empírico para verificar el grado de similitud entre el contexto del evaluador y el contexto del evaluado. y (c) división en mitades. cuando toda medida de confiabilidad indica qué proporción de la varianza total de las puntuaciones es varianza de error.La confiabilidad consiste en la esperanza firme que se tiene sobre algún acto. hace referencia a la estabilidad o consistencia interna en las técnicas e instrumentos. minuciosos y precisos. Confiabilidad Cuantitativa La concepción de confiabilidad de la evaluación del aprendizaje. (b) las formas paralelas. para lo cual es fundamental la descripción y composición de los acontecimientos sin tomar en cuenta su frecuencia. derivadas éstas del constructor elaborados por el evaluado sobre un aprendizaje. Confiabilidad interna: consiste en conocer la congruencia existente entre las inferencias relativas al aprendizaje. llegue a idénticos resultados. existen dos tipos de confiabilidad para la evaluación: a. Confiabilidad Cualitativa La confiabilidad. así como su presunción en eventos futuros. técnica similar a la anterior pero con pruebas no idénticas sino con ítems equivalentes. utilizando otros métodos y estrategias. es decir. incluyendo . Usualmente se utilizan las siguientes técnicas e instrumentos: (a) descriptores de bajo nivel inferencial (narraciones y relatos concretos. esta confiabilidad refiere al esfuerzo del evaluador para asegurar la pertinencia y permanencia tanto del procedimiento como de las estrategias y métodos utilizados para evaluar el aprendizaje. En el caso de la evaluación del aprendizaje. con el cual se calcula un coeficiente de consistencia interna. bajo el enfoque cuantitativo. bajo la perspectiva cualitativa. Existen tres tipos de confiabilidad en la evaluación cuantitativa: (a) la repetición de la prueba con tiempo suficiente para que el evaluado olvide los ítems. y reside en establecer la medida en que se puede replicar la evaluación: una exigencia al evaluador para que. La prueba y el test alcanzan un elevado coeficiente de confiabilidad si los errores de medida se minimizan. Según Goetz y LeCompte (1988). lugar y cultura donde ocurre la evaluación. calculando el coeficiente de correlación que permite conocer el grado de confiabilidad de dicha prueba. mediante la correlación entre las puntuaciones de ambas mitades. A su vez. depende enteramente de la descripción detallada que realice el evaluador sobre el tiempo. para poder así transferir juicios hacia otros evaluadores.

(c) revisión por otros evaluadores (corroboración de los hallazgos por parte de otros evaluadores). 1994). Un evaluador que se realiza hacia lo humano. audio.) b. fotografías. (d) premisas y constructor analíticos (especificación adecuada de los constructor. transferencia y evaluación). creativo y solidario. (c) situaciones y condiciones sociales (contexto físico. (b) selección de la evaluación (caracterización de las técnicas e instrumentos que permitan la replicabilidad de la evaluación). atención. compartido y desarrollado a través de la experiencia intersubjetiva asociada a los procesos inteligentes. etc. VALIDEZ Y CONFIABILIDAD HERMENÉUTICAS Bajo la óptica hermeneuta. social e interpersonal donde se recoge la información relativa a la evaluación). a nuevas formas de pensar y de hacer las cosas. y enmarcado por las interrelaciones existentes entre el conocimiento (declarativo. de pensamiento. la evaluación del aprendizaje es concebida como un proceso social e investigativo centrado en el aprendiz. con posiciones flexibles. no significando esto que los hallazgos sean replicables. y (d) datos registrados automáticamente (registros de video. conceptos y definiciones que caracterizan la evaluación). procedimental. estratégico y metacognitivo) y el aprendizaje (sensibilización. receptivo a otras perspectivas con interpretaciones diferentes sobre la evaluación. recuperación. que le permite relacionar estructuras o . construyendo su propia realidad en la experiencia estética y la subjetividad (Flórez. personalización. con historicidad y perfectamente ubicado en el tiempo y el espacio. un ser auténtico y comprensivo de su propia razón de ser en el mundo que le rodea. El enfoque hermenéutico lleva al evaluador de su propio aprendizaje a ser abierto a nuevos descubrimientos.datos discrepantes). adquisición. Los procesos de pensamiento hermenéutico del hombre estimulan una evaluación práctica. conscientes. (b) varios evaluadores (equipos de evaluadores abocados a la evaluación de un mismo aprendizaje). construido. El evaluador aumenta la confiabilidad externa de la evaluación dando respuesta a cuatro aspectos: (a) status del evaluado (rol social del evaluado frente al aprendizaje y su evaluación). debido a que el flujo de información depende del contexto sociocultural donde ocurre la evaluación. afectivos y emocionales. y (e) métodos y estrategias de recogida y análisis de información (presentación diáfana de la estrategia y metodología de evaluación). Confiabilidad externa: consiste en establecer condiciones empíricas en el proceso de evaluación que puedan ser replicadas por otros evaluadores.

conceptos. en los siguientes términos: a. Además. cuando se aborda desde una perspectiva diferente a las cuantitativa y cualitativa. deben ser confrontados e interpretados hasta lograr un entendimiento y consenso. que permite la reflexión. En la hermenéutica. Validez de contenido: toda estrategia o acción emprendida para auto y coevaluar el aprendizaje se produce como respuesta a una pregunta pertinente. la de los padres y demás personas que considere importante el aprendiz para compartir la evaluación de su aprendizaje Validez Hermenéutica Los argumentos esgrimidos por el aprendiz. en las cuales el evaluador es simplemente un administrador de técnicas e instrumentos de medición. de otros. se construye considerando la estructura semántica del aprendiz. y con el fin de garantizar la validez en la evaluación del aprendizaje. por lo que la evaluación. en consecuencia. surgiendo de manera natural la autoevaluación. la auto y coevaluación del aprendizaje se revisten de validez y confiabilidad a través del método hermenéutico de investigación. el pensamiento profundo y la toma de conciencia. la información construida debe documentar fehacientemente las relaciones particulares existentes entre el aprendizaje y la evaluación. precisa y oportuna. es situada y evolutiva. Esta evaluación conformándose en estaría socialmente condicionada y de significados que parten de sistemas aprendizajes individuales y colectivos. las características del contexto y la motivación compartida. la evaluación del aprendizaje centrado en el aprendiz debe dirigirse hacia la reflexión y la autocrítica al verse a sí mismo como evaluado. para posteriormente someterse a la evaluación de otros. para adquirir experiencia progresiva en la evaluación. En este sentido. respetando los diferentes puntos de vista y teorías. La conversación y el entendimiento del discurso conducen a construir e . establecer categorías y generalizaciones teóricas modificables en lo particular. responsabilidad asumida eminentemente por el docente. conlleva a conclusiones propias construidas mediante la interacción de esa realidad y la actividad mental. la adecuación de las actividades inherentes a la evaluación. la de los condiscípulos. expectativa e interés por autoevaluarse. la evaluación al ser un proceso más de aprendizaje. la coevaluación. la de otros profesores. Particularmente. la realidad observada por el evaluador e interpretación derivada de una disposición. al evaluarse. Por tal razón. como son la del profesor de determinada asignatura.

compartida a través del diálogo. c. Validez de interpretación: con la cual se hacen evidentes los acuerdos establecidos entre el evaluador y los coevaluadores al compartir los resultados de la evaluación del aprendizaje. La pluralidad de posibles interpretaciones pudiera permitir malentendidos. b. acordados y convenidos entre el evaluador y los coevaluadores. La auto y coevaluación. el contacto y el contexto. que tome. permitiendo conocer si todos los procesos que ocurren durante la construcción de la auto y coevaluación se están reflejando fiel y minuciosamente. con el habla y la escucha. d. ajustados a las condiciones y características específicas que se requieren en cuanto a las modalidades de auto y coevaluación. social y cultural referido al evaluador y los coevaluadores. ya que el mismo hace énfasis en el método para alcanzar acuerdos y convenimientos. la comprensión y la solidaridad tanto del evaluador como de los coevaluadores. e. pero la función contextual del discurso los reduce. permiten una dialéctica de acontecimiento y significado para aproximar las interpretaciones del aprendizaje. así como un ambiente óptimo para desarrollar en libertad plena esta construcción. tiempo. Validez de juicio: que considere aspectos de tipo afectivo. de pensamiento y reflexión. al evaluarse. La descripción de estos aspectos coadyuvan a darle validez a las opiniones emitidas por los evaluadores. expresadas oralmente. plazos y ponderación de jerarquías sobre los modelos explicativos. así mismo en consideración el ánimo. Esta validez es de suma importancia cuando se adopta un enfoque hermenéutico. La experiencia intersubjetiva del aprendiz. es privada. pero su significación y sentido se hace público a través de la comunicación dialógica. De esta manera surgen argumentos y acuerdos para la comprensión plena de la evaluación y un consenso del verdadero sentido alcanzado por el evaluador y los coevaluadores. sincero y transparente. que pudieran ser de significativa importancia para validar dicho juicio. cual es el de la hermenéutica. coadyuvada simultáneamente por la interlocución.interpretar mancomunadamente la evaluación del aprendizaje. cuando ellas son producto de la reflexión compartida desarrollada a través del diálogo cordial. los intereses. las motivaciones. Validez cognitiva: consistente en la viabilidad para evidenciar el esfuerzo del evaluador para desarrollar la capacidad creadora y los procesos subjetivos inteligentes. donde . Validez ecológica: que toma en consideración el uso contextual de la estrategia o acción seleccionadas. las emociones.

sino también la acción del aprendiz conducida por la relación y la interacción. Las relaciones lógicas derivadas sólo se asimilan. se relaciona con el aprendizaje. En este sentido.recordemos se abandona el objetivismo y la concepción de apropiarse solamente de opiniones transmitidas. se sustenta en la intuición. es insuficiente concebirlo sólo por sus características perceptivas. bajo el enfoque hermenéutico. La comprensión e interpretación tienen validez propia dentro del proceso intersubjetivo resistiendo. lo que equivale a decir . En toda circunstancia. enlazándose para desarrollar un proceso de construcción de la evaluación. La construcción de la autoevaluación debe considerar no sólo los aspectos variables del aprendizaje. un proceso de transformación del aprendizaje. interactúa con él y. en este caso el aprendiz. Lo observable nunca se alcanza en su totalidad. sin pretender inducir generalizaciones sino explicar lo particular. la interpretación y el entendimiento. cualquier intento para transformarlo en un método científico. como acotó Gadamer (1977). es fundamental para la validez de interpretación escribir los acuerdos y convenimientos. Por otro lado. concebida la deducción como premisa axiomática. superando lo observable y recurriendo a enlaces inferidos y . integrando los sucesivos estadios de construcción. los cuales pueden modificar los datos en un sentido de precisión suplementaria o de deformación. pues. acomodan y reacomodan a través de la identificación de la abstracción reflexiva y la equilibración de las estructuras cognoscitivas. Confiabilidad Hermenéutica La confiabilidad. Tampoco es un proceso deductivo. a través del lenguaje expone la evaluación correspondiente. a su vez. el evaluador. por medio de lo que el sujeto cree comprobar y no simplemente de lo que es comprobable". mediante actas o cualquier otro documento que patentice los resultados y conclusiones sobre la evaluación que se realice de algún aprendizaje. sino que consisten en esquemas preoperatorios u operatorios aplicados a la percepción actual. generando. Piaget (1990) propone "que hay que definirlo. explicar la evaluación supone emplear la investigación de la causalidad.que una comprobación nunca es independiente de los instrumentos de registro (y por tanto de asimilación) de lo que dispone el sujeto y que estos instrumentos no son puramente perceptivos.

La ventaja de este coeficiente reside en que requiere de una sola administración del instrumento de medición.: (Eys. Por tal razón se impone. Validez de contenido Se refiere a que tan representativas son las preguntas de una prueba con respecto al universo de preguntas que podrían hacerse sobre el tema. estrategias para desarrollar el diálogo y la conversación. La c. La v. se irán eliminando los que se marcan pocas veces. hay que agregar las respuestas de la evaluación alcanzadas por procesos de inferencia. los acuerdos y convenimientos.operatorios. Se debe disponer de un criterio confiable y valido con el que se puedan comparar las mediciones realizadas con el instrumento que se busca validar.: Se puede recurrir a además del instrumento. el describir cómo se alcanzaron la comprensión. Esta última está relacionada con la estabilidad o constancia. Una vez que se selecciona un criterio de comparación. señalando el espacio. con la coherencia o consistencia interna y la precisión de las medidas que se obtienen con el instrumento. Ej. se basa necesariamente en el criterio del investigador. Ej. la validez puede evaluarse correlacionando los puntajes del instrumento predictor con los de la variable de criterio. La confiabilidad se refiere a la confianza que se concede a los datos. para asegurar la confiabilidad hermenéutica. tiempo.)Del universo de ítems. su explicación causal permite comprender la epistemología hermenéutica asociada a ellas. de c. a través del coeficiente de correlación cuya magnitud establece una estimación directa de la validez del instrumento. Validez de criterio Aquí el aspecto crucial es si el instrumento se constituye un preditor útil de conductas o experiencias. pues no existen métodos que sean por completo objetivos para garantizar la adecuada cobertura del contenido de un instrumento. La validez se refiere al grado en que el instrumento mide lo que se pretende medir. la interpretación. mecanismos de concertación y cualquier otro elemento que permita tener una visión clara y diáfana del proceso de discusión y conclusión sobre la evaluación del aprendizaje. No significa esto considerar que las evaluaciones existen exteriormente al evaluador y que actúan unas sobre otras independientemente de ese evaluador. Si el auto y coevaluación son procesos. aunque siempre es posible recurrir a los expertos del área de contenido. a la evaluación . del instrumento se estima a través del coeficiente α de Cronbach. al ser susceptible de aproximaciones sucesivas existentes en un ambiente abierto de diálogo y comunicación para la convivencia y el desarrollo de una microsociedad de la evaluación.

org/wiki/Confianza .clínica. LINKOGRAFÍA • • http://es.org/wiki/Validez_(psicometr%C3%ADa) http://es. Madrid: Pirámide. BIBLIOGRAFÍA • Muñiz.wikipedia. «Validez». ISBN 843681262X. radica en su relación con la teoría y con la conceptualización teórica. La v. Teoría clásica de los tests (5ª edición). no busca los resultados que arroja el instrumento sino la claridad del constructo.wikipedia. Validez de constructo Está directamente relacionado con la teoría. Consultado el 16 de febrero de 2011. de c. José (1998).