Professional Documents
Culture Documents
ESTADISTICAS-aplicadas en Psicologia
ESTADISTICAS-aplicadas en Psicologia
APLICADAS EN
PSICOLOGÍA
Ciencias sociales y Educación
DICIEMBRE 2011
ESTADÍSTICAS APLICADAS EN
PSICOLOGÍA
Diciembre, 2011
TABLA DE CONTENIDO
DEDICATORIA
AGRADECIMIENTO
PRÓLOGO
INTRODUCCIÓN
CAPÍTULO 1 ESTADÍSTICAS Y PSICOLOGÍA ........................................................................................ 1
ESTADÍSTICAS E INVESTIGACIÓN ......................................................................................................... 2
Etapa 1 ....................................................................................................................................................... 3
Etapa 2 ....................................................................................................................................................... 3
Etapa 3 ....................................................................................................................................................... 5
CONCEPTOS IMPORTANTES .................................................................................................................... 7
CAPÍTULO 2 LA NATURALEZA DE LAS ESTADÍSTICAS .................................................................... 2
LAS POBLACIONES .................................................................................................................................... 4
MEDICIÓN DE LAS VARIABLES PSICOLÓGICAS ................................................................................. 5
ESCALAS DE MEDICIÓN ........................................................................................................................... 5
CONCEPTOS IMPORTANTES .................................................................................................................... 7
CAPÍTULO 3 ORGANIZACIÓN DE DATOS DISTRIBUCIONES DE FRECUENCIAS ..................... 8
CONCEPTOS IMPORTANTES .................................................................................................................. 13
EJERCICIOS PRÁCTICOS ......................................................................................................................... 14
Problema 1 ............................................................................................................................................... 14
Problema 2 ............................................................................................................................................... 14
Problema 3 ............................................................................................................................................... 14
CAPÍTULO 4 REPRESENTACIONES GRÁFICAS .................................................................................. 15
GRÁFICO DE BARRAS.............................................................................................................................. 16
HISTOGRAMA ........................................................................................................................................... 17
POLÍGONO DE FRECUENCIAS ............................................................................................................... 19
GRÁFICO DE FRECUENCIAS ACUMULADAS U OJIVA ...................................................................... 21
DIAGRAMA DE TALLO Y HOJAS ........................................................................................................... 22
LOS ORDENADORES Y LAS GRÁFICAS................................................................................................ 23
CONCEPTOS IMPORTANTES .................................................................................................................. 24
EJERCICIOS PRÁCTICOS ......................................................................................................................... 25
Problema 1 ............................................................................................................................................... 25
Problema 2 ............................................................................................................................................... 25
CAPÍTULO 5 MEDIDAS DE TENDENCIA CENTRAL ........................................................................... 26
LA MEDIA ARITMÉTICA ......................................................................................................................... 26
La media aritmética para distribuciones de frecuencias ......................................................................... 27
La media aritmética y los métodos abreviados ........................................................................................ 28
LOS PROMEDIOS DE POSICIÓN ............................................................................................................. 29
La mediana (mdn) .................................................................................................................................... 29
La moda ( ) .......................................................................................................................................... 32
COMPARACION DE LA MEDIA, LA MEDIANA Y LA MODA ............................................................. 34
CONCEPTOS IMPORTANTES .................................................................................................................. 35
EJERCICIOS PRÁCTICOS ......................................................................................................................... 36
Problema 1 ............................................................................................................................................... 36
CAPÍTULO 6 MEDIDAS DE VARIABILIDAD ......................................................................................... 37
MEDIDAS DE VARIABILIDAD QUE NO SE ASOCIAN CON LA MEDIA ARITMÉTICA .................. 37
La Fluctuación (Amplitud) ....................................................................................................................... 37
Los Percentiles ......................................................................................................................................... 38
MEDIDAS DE VARIABILIDAD QUE SE ASOCIAN CON LA MEDIA ARITMÉTICA ......................... 40
La Desviación Media ............................................................................................................................... 40
Desviación Estándar O Típica ................................................................................................................. 41
La Asimetría ............................................................................................................................................. 43
La Curtosis ............................................................................................................................................... 44
CONCEPTOS IMPORTANTES .................................................................................................................. 45
EJERCICIOS PRÁCTICOS ......................................................................................................................... 46
Problema 1 ............................................................................................................................................... 46
CAPÍTULO 7 MODELOS POBLACIONALES PROBABILÍSTICO ...................................................... 47
VARIABLES DISCRETAS ......................................................................................................................... 48
La Distribución Binomial ......................................................................................................................... 48
VARIABLES CONTÍNUAS ........................................................................................................................ 49
Puntuaciones estándar ............................................................................................................................. 49
La Distribución Normal ........................................................................................................................... 51
Aproximación Normal De La Distribución Binomial .............................................................................. 56
CONCEPTOS IMPORTANTES .................................................................................................................. 58
EJERCICIOS PRÁCTICOS ......................................................................................................................... 59
Problema 1 ............................................................................................................................................... 59
Binomial ................................................................................................................................................... 59
Aproximación Normal A La Binomial ...................................................................................................... 60
CAPÍTULO 8 CORRELACIÓN Y REGRESIÓN ...................................................................................... 61
CORRELACIÓN MÚLTIPLE ..................................................................................................................... 71
Como Interpretar El Coeficiente De Correlación. ................................................................................... 72
REGRESIÓN LINEAL SIMPLE. ................................................................................................................ 73
Error Típico De La Estimación ................................................................................................................ 75
CONCEPTOS IMPORTANTES .................................................................................................................. 77
EJERCICIOS PRÁCTICOS ......................................................................................................................... 78
Problema 1 ............................................................................................................................................... 78
CAPÍTULO 9 ESTADÍSTICA INFERENCIAL Y PROBABILIDADES ................................................. 79
TEORÍA DE LA PROBABILIDAD (TP)..................................................................................................... 80
El Experimento Aleatorio ......................................................................................................................... 81
Probabilidad ............................................................................................................................................ 83
Axiomas De Probabilidad ........................................................................................................................ 84
ASPECTOS BÁSICOS EN ELCÁLCULO DE PROBABILIDADES ......................................................... 85
CONCEPTOS IMPORTANTES .................................................................................................................. 89
EJERCICIOS PRÁCTICOS ......................................................................................................................... 90
CAPÍTULO 10 DE LA POBLACIÓN A LA MUESTRA ........................................................................... 92
¿QUÉ ES UNA VARIABLE ALEATORIA? ........................................................................................................... 92
¿QUÉ ES UNA DISTRIBUCIÓN MUESTRAL DE PROBABILIDADES? ................................................................... 94
ESTIMACIÓN ESTADÍSTICA ................................................................................................................... 97
Estimación Puntual: ................................................................................................................................. 97
Estimación Por Intervalos: ...................................................................................................................... 97
MÉTODOS DE MUESTREO ...................................................................................................................... 99
Muestreo No Aleatorio:.......................................................................................................................... 100
Muestreo Aleatorio: ............................................................................................................................... 100
DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA: N .................................................................... 103
Tamaño De Población Desconocido ...................................................................................................... 104
Tamaño De Población Conocido ........................................................................................................... 104
CONCEPTOS IMPORTANTES ................................................................................................................ 105
EJERCICIOS PRÁCTICOS ....................................................................................................................... 106
CAPÍTULO 11 INTRODUCCIÓN A LA PRUEBA DE HIPÓTESIS ..................................................... 109
LA PRUEBA DE HIPÓTESIS ................................................................................................................... 110
PASO 1: Hipótesis Estadística ............................................................................................................... 111
PASO II: Nivel De Significación ............................................................................................................ 112
PASO III: Estadístico De Prueba........................................................................................................... 116
PASO IV: Regla De Decisión ................................................................................................................. 117
PASO V: Aplicación de la Prueba Estadística ....................................................................................... 117
PASO VI: Decisión................................................................................................................................. 118
CONCEPTOS IMPORTANTES ................................................................................................................ 118
CAPÍTULO 12 PRINCIPALES TIPOS DE PRUEBA DE HIPÓTESIS ................................................. 119
PRUEBAS DE HIPÓTESIS PARA POBLACIONES O DATOS DISTRIBUIDOS NORMALMENTE. . 119
El Caso De Una Media Poblacional ...................................................................................................... 119
El Caso De Dos Medias Poblacionales ................................................................................................. 121
PRUEBA DE HIPÓTESIS PARA MUESTRAS PEQUEÑAS................................................................... 123
Grados De Libertad ............................................................................................................................... 123
La Prueba “t” de Student ...................................................................................................................... 125
Prueba “t” para el caso de una media poblacional .............................................................................. 126
Prueba “t” para el caso de dos medias independientes ........................................................................ 127
Prueba “t” para dos muestras correlacionadas .................................................................................... 129
Prueba “t” para correlaciones .............................................................................................................. 131
CONCEPTOS IMPORTANTES ................................................................................................................ 132
EJERCICIOS PRÁCTICOS ....................................................................................................................... 133
Muestras grandes: pruebas de hipótesis para medias ........................................................................... 133
Muestras pequeñas: pruebas de hipótesis para medias y correlaciones ............................................... 134
CAPÍTULO 13 ANÁLISIS DE LA VARIANZA ....................................................................................... 136
LA DISTRIBUCIÓN F ............................................................................................................................... 136
Principios del ANOVA ........................................................................................................................... 138
Anova Simple o en un solo sentido ......................................................................................................... 139
La Prueba de comparación de dos medias de Tukey. ............................................................................ 143
Anova Factorial (dos o más variables independientes) ......................................................................... 145
CONCEPTOS IMPORTANTES ................................................................................................................ 152
EJERCICIOS PRÁCTICOS ....................................................................................................................... 153
Análisis de la Varianza Simple o de Un Solo factor .............................................................................. 153
APÉNDICE 1 DISTRIBUCIÓN NORMAL ............................................................................................... 157
APÉNDICE 2 VALORES CRÍTICOS DE LA DISTRIBUCIÓN T DE STUDENT .............................. 158
APÉNDICE 3 VALORES CRÍTICOS DE LA DE DISTRIBUCIÓN F DE FISHER ............................ 159
APÉNDICE 4 PROBABILIDADES BINOMIALES ................................................................................. 163
APÉNDICE 5 DISTRIBUCIÓN T DE STUDENT: SIGNIFICANCIA DE CORRELACIONES DE
PEARSON ..................................................................................................................................................... 168
APÉNDICE 6 VALORES CRÍTICOS DEL ESTADÍSTICO DE Q ........................................................ 169
APÉNDICE 7 TABLA DE NÚMEROS AL AZAR ................................................................................... 170
BIBLIOGRAFÍA .......................................................................................................................................... 174
DEDICATORIA
la vida.
AGRADECIMIENTO
Esta obra no se hubiera podido haber completado, sin la colaboración permanente de la Psicóloga
Elsa I. Fajardo, Magister en Estadísticas Aplicadas, quien colaboró desde un principio con el
desarrollo de este trabajo a través de sus observaciones, críticas y evaluaciones técnicas, de manera
desinteresada, honrada y motivadora.
Es necesario extender este agradecimiento al Psicólogo Rubén Díaz, quien aportó en el desarrollo
de esta obra, además de sus conocimientos en el área, una dimensión técnica de presentación de
gráficos, cuadros y fórmulas, que me ayudaron a enriquecer el objetivo principal de esta obra:
llegar a mis estudiantes con la mayor claridad y objetividad posible.
Gerardo A. Valderrama M.
PRÓLOGO
El texto es de fácil manejo y con suficientes definiciones, demostraciones y prácticas para que el
estudiante logre aprehender su contenido. Por su amigable lenguaje y ejemplos aplicados, requiere
una preparación matemática básica.
Esta obra logra abordar temas extremadamente densos y complejos como las pruebas de hipótesis y
el análisis de varianza pero tomando de cada uno lo medular: concepto, aplicación, cálculo e
interpretación de manera inusualmente práctica y manejable. Sin perder, el rigor estadístico
requerido.
En resumen, esta obra académica constituye una alternativa de aproximación para la integración de
la teoría psicológica, la práctica y la investigación.
En la década de los 80, cuando la Escuela de Psicología de la Universidad de Panamá formaba parte
de la Facultad de Filosofía, Letras y Educación, confeccionamos un “folleto” que denominamos:
Estadística Descriptivas Aplicadas en Psicología,, con el cual intentamos aproximarnos
académicamente, a nuestros estudiantes, transmitiéndole nuestros conocimientos, inquietudes y
actitudes hacia esta asignatura, en un lenguaje más amistoso, y más propio de nuestra cultura y de
mi perspectiva personal de la materia. El folleto fue exitoso desde el momento en que muchos
estudiantes lo obtuvieron y lo utilizaron, ya sea como texto o como apoyo bibliográfico para
reforzar su proceso de aprendizaje.
Es importante destacar que siempre han existido excelentes textos de estadísticas al alcance de
nuestros estudiantes, inclusive haciendo énfasis en su aplicabilidad en las ciencias del
comportamiento. Más sin embargo, desde mi punto de vista, los mismos por lo general estaban
polarizados: por un lado, encontramos los cargados en matemáticas que eran un verdadero dolor de
cabeza para los estudiantes; y por otro, aquellos que consideraban a los estudiosos de la psicología,
sujetos incapaces de aproximarse exitosamente a los procesos de razonamiento numérico, y se
caracterizaban por su exagerada simplicidad, convirtiéndolos en textos con muy poco nivel
cuantitativo. El detalle estaba en lograr concebir un texto que, sin caer en exigencias matemáticas
innecesarias, pero respetando su pertinencia, tanto teórica como práctica, favoreciera el estudio
sistemático de las estadísticas y permitiera al estudiante su aplicación, con validez, sistematización
y sustento científico.
Este libro es muy sencillo en comparación con otros, es menos matemático en comparación con
otros, respeta la cuantificación y la importancia de las matemáticas en la actividad del psicólogo en
comparación con otros. Sin embargo está hecho con amor y respeto hacia los estudiantes y hacia
los conocimientos que intento representar. Pedimos disculpas por los errores que encuentren a lo
largo de la lectura y estamos totalmente anuentes a las observaciones que tengan a bien
hacernos……..Y no olviden: más conocimientos y mejor actitud hacia la investigación cuantitativa,
mayores probabilidades de éxito profesional, especialmente en las áreas referentes al
comportamiento humano.
CAPÍTULO 1
ESTADÍSTICAS Y PSICOLOGÍA
Al iniciar un curso de estadísticas para estudiantes de psicología, es frecuente que algunos de ellos,
intrigados, pregunten la razón por la cual en esta especialidad es necesario estudiar una asignatura
con un contenido cuantitativo importante. La concepción generalizada es que la psicología es una
especialidad teórico-práctica, cuyo objetivo principal es “atender” problemas de conducta, tanto
individuales como grupales, sin la participación de elementos cuantitativos; seamos más objetivos,
sin matemáticas.
Esta actitud de duda, y en algunas ocasiones de rechazo, está relacionada con la experiencia y
formación previa de muchos estudiantes en al área de las matemáticas, la cual con mucha frecuencia
ha sido dolorosa y de aporte limitado, en cuanto al desarrollo del conocimiento. Es común en los
estudiantes una actitud de temor y poco interés hacia esta área científica. La situación anteriormente
descrita no es exclusiva de los estudiantes, al observarse la misma en algunos profesionales del área
del comportamiento en cualquiera de sus especialidades, haciendo más difícil la transmisión del
conocimiento de los temas que involucran la cuantificación al momento de estudiarse el
comportamiento humano.
Las estadísticas aplicadas han resultado ser el conjunto de técnicas matemáticas de mayor eficiencia
en la investigación psicológica. Ya Lun Chou (1972) presentó una definición del término
estadística muy importante para los investigadores en general y en especial, para los psicólogos:
Esta definición cuenta con cuatro elementos fundamentales, a través de los cuales se justifica
plenamente la pertinencia de las estadísticas en la investigación psicológica: toma de decisiones,
incertidumbre, datos numéricos y riesgos; veamos su relación con la psicología.
La psicología es una ciencia muy especial. No cuenta con un cuerpo único y universal de teorías e
hipótesis; por el contrario, cuenta con un número plural de éstas, a través de los cuales se intenta
describir, explicar, analizar e interpretar la conducta del hombre; la psicología cuenta con muchas
corrientes o escuelas. Lo importante de esta situación es que todas funcionan a niveles teóricos y
que requieren, constantemente de comprobación y evaluación de sus postulados teóricos y
epistemológicos. En otras palabras, el psicólogo se enfrenta constantemente a la toma de
decisiones sin importar a que corriente psicológica pertenezca o en qué área de la psicología esté
laborando. Todo problema del comportamiento, ya sea individual o grupal, requiere de una toma de
decisión, y muchos de ellos necesitan la cuantificación de sus variables y el análisis estadístico
requerido para lograr una solución científicamente acertada.
Los problemas asociados con el comportamiento no son estáticos, muy por el contrario, son muy
dinámicos. Son universales pero pueden diferir de sujeto a sujeto, de sociedad a sociedad, de
población a población, de muestra a muestra; lo que es válido para un grupo no lo es para otros, lo
que se logró demostrar hoy, no se repite en las mismas condiciones mañana, y así sucesivamente. El
psicólogo se enfrenta a la incertidumbre propia de los fenómenos conductuales, la cual ha
encontrado en la teoría de la probabilidad un modelo de explicación, evaluación e investigación; la
conducta no es exacta en su medición y evaluación, sino aproximada. La conducta es
probabilística.
La psicología, a través de las escalas de medición, ha logrado asignarle valores numéricos a sus
constructos teóricos cuando éstos se han definido operacionalmente, favoreciendo de esta manera la
evaluación del comportamiento con niveles de objetividad muy satisfactorios. Partiendo de la
premisa de que la medición del comportamiento no es exacta sino aproximada, las estadísticas
aplicadas a la investigación del comportamiento han logrado incorporar el concepto de
probabilidad a la medición y evaluación comportamental. El análisis estadístico ha permitido
calcular los riesgos propios de esta actividad, favoreciendo la minimización de los errores y la
disminución de la incertidumbre al momento de la toma de decisiones.
Las estadísticas están estrechamente ligadas con la psicología, en la medida en que los estudiantes,
profesores y especialistas del comportamiento, en cualquiera de sus áreas e independientes de su
formación, le den relevancia a la investigación científica y consideren esta actividad, el método más
adecuado para conocer y comprender el comportamiento humano. En tal caso, las estadísticas serán
la mejor herramienta para la evaluación comportamental precisa., válida y confiable.
ESTADÍSTICAS E INVESTIGACIÓN
Etapa 1
Toda investigación nace a partir del planteamiento de un problema que requiere una solución. En el
caso de los estudiantes, y principalmente por falta de experiencia, el problema nace de la intuición,
de sus intereses personales o sencillamente porque se le ocurrió. Con mucha frecuencia, cuando los
problemas a investigar nacen de alguna de las formas anteriormente señaladas, se presentan
problemas de orden metodológico que dificultan el desarrollo del estudio.
Los problemas a investigar no se inventan, ellos existen; el detalle está en tener la habilidad para
detectarlo y definirlo con claridad y objetividad, evitando confusiones y tratando de hacerlo lo más
sencillo posible: el principio de la parsimonia. La observación, la lectura especializada, el estudio
constante y sistemático y la discusión científica objetiva y desapasionada, son fuentes inagotables
de ideas que pueden cristalizar en problemas de investigación genuinos.
2. Revisión Bibliográfica
Una vez planteado el problema, es necesaria una revisión exhaustiva de la información científica
recabada sobre el problema planteado: investigaciones previas, teorías, ensayos, conferencias,
entrevistas personales, y toda fuente de información que brinde información objetiva y científica. El
objetivo principal de esta revisión, es el de encontrar (descubrir) posibles soluciones, variables y sus
relaciones, explicaciones teóricas (modelos), que permitan al investigador desarrollar una
explicación coherente y científica de los factores que inciden en el problema planteado y que a la
vez favorezcan el desarrollo de un modelo teórico aplicable a dicho problema; a esta estructura se le
llama con frecuencia Fundamentación Teórica del Problema. A través de esta figura, el
investigador crea un modelo teórico que debe explicar de manera organizada la estructura dinámica
del problema (variables y relaciones) y debe plantear una posible solución al mismo. De aquí se
desprenden las hipótesis de investigación.
Etapa 2
Metodología
Las investigaciones deben definirse dentro de ciertos parámetros que permitan identificar con
claridad los elementos propios del problema y las condiciones requeridas para la solución del
mismo. Las investigaciones pueden clasificarse como básicas cuando tienen como objetivo crear o
alimentar las teorías ya existentes; también se les conoce como puras. Las investigaciones también
pueden ser definidas como aplicadas, cuando su objetivo es la solución de un problema dentro de
un contexto social. Atendiendo a las dos definiciones señaladas anteriormente, las investigaciones
que se desarrollan en nuestro contexto científico pueden ser básicas o aplicadas, siendo las más
frecuentes, éstas últimas.
2. Diseño de Investigación
3. Variables
Las variables corresponden a ciertas propiedades que se dan en los sujetos, tomando en
consideración, las diferencias individuales. Estas son susceptibles de ser manipuladas por el
investigador. Las tres variables identificadas como las más importantes en todo proceso de
investigación son: la independiente, la dependiente y las extrañas. De acuerdo a Aroldo
Rodríguez (1977), estas variables se pueden definir de la siguiente manera:
Variables extrañas son aquellas que pueden influir en los resultados del experimento sin que
en el modelo su efecto esté considerado. Las variables extrañas compiten con la variable
independiente y por lo general son las que el investigador intenta controlar en su diseño.
5
4. Muestras
5. Técnicas de Medición
En psicología, los resultados obtenidos en una investigación son recabados a través de instrumentos
de medición especiales denominados, por lo general, test psicológicos. Los psicólogos cuentan con
una pluralidad de organizaciones internacionales que se responsabilizan por la construcción de tests,
aplicables en casi todas las situaciones de medición y evaluación del comportamiento. Estos tests
son construidos siguiendo teorías y métodos muy especializados, lo que permite que dichos
instrumentos sean objetivos, válidos y confiables. Sin embargo, los psicólogos deben estar
preparados para hacerle frente a situaciones en las cuales los instrumentos utilizados no satisfacen
plenamente los criterios científicos de construcción de pruebas pero sus resultados deben ser
utilizados a pesar de estas deficiencias. En otras ocasiones, los psicólogos deben construir los
instrumentos de medición requeridos para sus estudios.
En cualquiera de estos casos, los psicólogos deben estar en capacidad de construir los instrumentos
de evaluación psicológica que requieran para sus estudios e investigaciones. Es una obligación del
psicólogo conocer con rigurosidad las teorías y técnicas propias de la medición psicológica, ya sea
para interpretar resultados provenientes de pruebas de calidad indiscutible, como para construir los
test que necesite en situaciones específicas. En el caso de la medición psicológica, la estadística es
una herramienta crucial en la elaboración de test.
6. Modelo Estadístico
Se refiere a los procedimientos de procesamiento y análisis estadístico de los datos que provienen
de las investigaciones. Incluye los supuestos, modelos, metodología y pruebas estadísticas
requeridas en la investigación. Los modelos estadísticos pueden ser paramétricos o no paramétricos
y los mismos están apoyados por supuestos de carácter probabilísticos.
Los modelos estadísticos que se utilizan en las investigaciones están previamente determinados por
el problema planteado, las hipótesis de investigación, el tipo y diseño de investigación, el tipo de
medición de las variables involucradas y los instrumentos o test psicológicos aplicados en el estudio
Etapa 3
1. Análisis Estadístico
Una vez recogida la data proveniente de las mediciones psicológicas, el paso siguiente sería la
organización y análisis estadístico de los resultados obtenidos, utilizando los modelos, metodología
y procedimientos estadísticos previamente señalados. Básicamente se desarrollan dos tipos de
análisis: descriptivos y/o inferenciales.
6
2. Discusión
Concluido los análisis estadísticos, los resultados deben ser discutidos y analizados a la luz de los
objetivos del estudio y/o las hipótesis planteadas. En esta sección, el investigador no se circunscribe
únicamente a verificar sus objetivos y/o hipótesis, sino que observa el comportamiento de los datos
y analiza elementos adicionales y complementarios, que permiten enriquecer y profundizar en la
información obtenida, en muchas ocasiones, más allá de sus objetivos e hipótesis originales.
3. Conclusiones y recomendaciones
Las tres Etapas presentadas anteriormente, son un esbozo general de los principales pasos que se
siguen en el desarrollo de una investigación. El objetivo principal de la presentación de las mismas
ha sido el de establecer, con la mayor claridad posible, en qué momento de la investigación las
estadísticas son pertinentes. Como se observó, el modelo estadístico es el último punto de la Etapa 2
y el análisis estadístico es el primero de la Etapa 3. Esto debe ser así, porque las estadísticas están
condicionadas a los fundamentos teóricos del problema y a los aspectos metodológicos inherentes al
mismo. Para ser más específico, en una investigación, las estadísticas están determinadas por las
siguientes condiciones:
Las estadísticas aplicadas en una investigación no deben ser una improvisación de última hora,
como se observa frecuentemente en algunos trabajos de graduación. El modelo estadístico debe ser
planificado al momento de diseñarse la investigación. Es común observar a estudiantes e inclusive a
profesionales de la psicología solicitar asesoría estadística después de haber desarrollado la
investigación (recogido la data) casi en su totalidad. Cuando esto sucede, se corre el riesgo de que la
estructura metodológica del estudio no coincida con los objetivos e inclusive, las hipótesis del
estudio. En muchos casos, las investigaciones no se pueden concluir tal y como fueron diseñadas y
los investigadores deben hacer profundas modificaciones a las mismas o, inclusive, desistir del
estudio.
7
CONCEPTOS IMPORTANTES
Desarrolle cada uno de los conceptos presentados en la columna anterior. Intente establecer el
significado técnico de cada uno de ellos e interrelacionarlos en la actividad de la investigación
psicológica. Es importante que trate de alcanzar un nivel de comprensión importante para cada uno
de ellos. Como verá posteriormente, son básicos para el diseño de investigaciones psicológicas.
Estadística Población
Incertidumbre Muestra
Riesgos Test psicológico
Parsimonia Medición psicológica
Metodología Modelo estadístico
Diseño Estadística descriptiva
Variables Estadística inferencial
2
CAPÍTULO 2
LA NATURALEZA DE LAS ESTADÍSTICAS
La estadística se puede definir como el conjunto de métodos que se emplean para la toma de
decisiones. Los problemas psicológicos que se tratan de resolver a través de la investigación
científica, en especial aquellos en los que el análisis estadístico es pertinente, están afectados por la
“incertidumbre”, la cual proviene de la capacidad que tienen los datos numéricos de reflejar, con
cierta precisión, los fenómenos comportamentales que se analizan para determinada población.
RIESGO ERROR
FIGURA 2—1
Como el interés está centrado en tomar una decisión sobre una población a partir de una muestra
que está afectada de errores, los investigadores están en la obligación de analizar los errores de las
muestras para tomar una decisión con relación a la población partiendo de los datos de la muestra
(ver Figura 2—1).
Para que las decisiones estadísticas sean lo más acertadas posibles, los errores cometidos se
analizan a través de teorías y métodos estadísticos que permiten establecer hasta qué punto los
errores son significativos o no; en otras palabras, lo que se trata de establecer es si la muestra, a
pesar de los errores que presenta en comparación con la población, es lo suficientemente
representativa de la misma como para considerarse que sus resultados son “semejantes” a los que se
hubieran obtenido en la población de haberse analizado estadísticamente esta última.
Para llegar a este nivel de precisión estadística, se debe hacer uso de la Teoría de la Probabilidad,
que analiza y evalúa las diferencias entre muestras y poblaciones en términos de probabilidad (ver
Figura 2—2)
3
ERRORES
TEORÍAS Y DECISIONES
MÉTODOS ACERTADAS
ESTADÍSTICOS
Riesgos
calculados
Probabilidad
FIGURA 2—2
TABLA 2-1:
Experimento denominado lanzamiento de un dado de seis caras
Eventos 1 2 3 4 5 6
Probabilidad 1/6 1/6 1/6 1/6 1/6 1/6
Al lanzarse un dado común, sabemos de antemano qué eventos se pueden producir e inclusive
conocemos las probabilidades de cada uno de ellos; la incertidumbre nace del desconocimiento de
cuál será el evento que se presentará en un acto específico, dado que todos tienen las mismas
probabilidades. Nosotros conocemos el estado natural del dado y por lo tanto podemos hipotetizar
sobre los posibles resultados a obtener. Veamos otro ejemplo.
TABLA 2-2:
Experimento denominado lanzamiento de dos dados de seis caras
Evento 2 3 4 5 6 7 8 9 10 11 12
Probabilidad 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Al lanzarse los dos dados, independientemente de las veces que sean lanzados, la suma de los
puntos de las caras superiores daría resultados entre 2 y 12. Se observa, además, que las
probabilidades varían para cada uno de estos posibles resultados: el 2 tiene 1/36 de ocurrir, el 5
tiene 4/36, el 7 tiene 6/36, etc. Esto significa que al arrojarse los dos dados, potencialmente
conocemos los eventos que pueden suceder, e inclusive, las probabilidades para cada uno de ellos.
4
En este caso, la incertidumbre nace de las distintas probabilidades asignadas a cada evento: hay
eventos con más probabilidades y otros con menos.
En los dos experimentos anteriormente analizados, se conoce el estado natural de cada fenómeno y
sus probabilidades, siendo esto último la fuente de la incertidumbre.
El problema para los psicólogos radica en que no se conoce, con tanta facilidad, el estado natural de
los fenómenos comportamentales, ni tampoco las probabilidades asignadas a cada uno de ellos. Este
desconocimiento a priori de los hechos y sus probabilidades, es la fuente de incertidumbre para el
investigador del comportamiento.
Veamos un ejemplo. Supongamos que estamos interesados en investigar las actitudes de los
estudiantes universitarios hacia la apertura del denominado Tapón del Darién. Supongamos además,
que esta actitud va a ser evaluada en una escala de 1 a 5, en la que 1 significa totalmente en
desacuerdo y 5 significa totalmente de acuerdo. Al aplicarse el instrumento de medición, sabemos
de antemano que los resultados numéricos para cada encuestado puede ser numéricamente entre 1 y
5, pero no sabemos a priori, el estado natural de cada uno de estos eventos en la población de
estudiantes; no sabemos cuáles son sus probabilidades, tal y como sucede con los dados. Esto
significa que en psicología, la fuente principal de incertidumbre es el desconocimiento del estado
natural de los fenómenos conductuales en las poblaciones. Solamente se logra disminuir esta
condición de incertidumbre, desarrollando observaciones empíricas en las poblaciones
(investigaciones), analizando los resultados obtenidos y estableciendo de manera a posteriori, cuales
son los eventos que se dan y las probabilidades de cada uno de ellos.
LAS POBLACIONES
Una población se puede definir como un conjunto completo de elementos individuales, definidos
dentro de un problema específico. Por lo general, las poblaciones se definen como un conjunto de
cosas o sujetos, que se manifiestan, por lo general, en grandes cantidades. La cantidad no es lo
importante en este momento, porque hay poblaciones constituidas por pequeñas cantidades de
unidades individuales como también las hay constituidas por grandes cantidades. Lo importante es
tener claro que para la investigación, una población existe a la luz de un problema específico y que
contiene la totalidad de unidades que se desean investigar.
Sobre cada una de estas unidades individuales se hacen observaciones directas que son las que en
última instancia ofrecen la información cuantitativa referente al problema psicológico a investigar.
Por ejemplo, si estamos interesados en investigar las aptitudes numéricas de los aspirantes a
ingresar a Psicología, las puntuaciones obtenidas por cada uno de ellos en la prueba de aptitud es
considerada como una observación, y todas las observaciones (puntuaciones) obtenidas de la
totalidad de aspirantes constituye la población.
El número de sujetos que conforman una población también permite definir a las mismas como:
infinitas si el número de sujetos es muy grande y finitas si el número es pequeño. En la
investigación psicológica, por lo general las poblaciones a investigar se consideran finitas.
5
“Los científicos designan de manera un tanto vaga con el término de variable a las
construcciones hipotéticas o propiedades que estudian. Podemos afirmar que una
variable es una propiedad que adquiere distintos valores; diremos que una variable es
algo que varía”
Las variables pueden ser continuas o discretas. Una variable continua es aquella que puede asumir
cualquier valor dentro de un intervalo; puede asumir valores fraccionales. Una variable discreta es
aquella en la que las mediciones no pueden asumir valores fraccionales tales como el sexo, número
de hijos, correcto-incorrecto, etc. Chou (1972) hace algunos señalamientos al respecto de variables
continuas y discretas:
“Una serie continua es una variable que puede asumir cualquier valor numérico dentro
de un recorrido específico. Por otro lado, la naturaleza de cierto tipo de datos es tal que
la unidad de medida se puede definir solamente en términos enteros; una serie en la que
las medidas no pueden darse entre las unidades de escala se llama serie discreta”
ESCALAS DE MEDICIÓN
Hasta este punto de la lectura se puede observar que hay un aspecto importante en lo referente a la
aplicación de las estadísticas en la investigación científica: la medición de los fenómenos
naturales, en nuestro caso, de los fenómenos comportamentales. Por esta razón, es necesario
discutir cuáles son las alternativas con las que se enfrenta un investigador al momento de definir o
decidirse por una escala de medición para sus observaciones.
Las mediciones se pueden dar en uno de cuatro niveles y cada uno de ellos corresponde a una escala
de medición determinada: nominal, ordinal, de intervalos y de razones. Además, es necesario
destacar que cada escala satisface ciertas condiciones que favorecen la realización de ciertas
operaciones matemáticas. Estas condiciones están satisfechas por una serie de postulados básicos de
la medición, los cuales presentamos a continuación.
1. Escala Nominal
2. Escala Ordinal
Tiene sus propias características, pero además posee las de la escala nominal y la ordinal. Su
característica principal es que las unidades de medición son iguales, situación ésta que le permite
una manipulación algebraica mucho más amplia que los casos anteriores. Las escalas de
temperatura, el tiempo, las escalas de medición psicológicas, etc., son ejemplos de esta situación.
Presentamos un ejemplo:
a b c d e
1 2 3 4 5
La escala que se presenta con anterioridad, supuestamente mide una propiedad (X) en cinco
posibles alternativas. Se supone que las unidades de medición entre cada alternativa son iguales
y por lo tanto también representan distancias iguales con respecto a la propiedad investigada. La
diferencia entre e – d, o sea, 5 – 4 = 1, es la misma diferencia que hay entre b – a, 2 – 1 =1.
7
Ambas representan las mismas distancias con respecto a la propiedad evaluada. Otra ventaja es
que se pueden combinar procesos matemáticos diferentes, como por ejemplo:
( ) ( ), donde,
( ) ( ), donde,
( ) ( )
Corresponde al más alto nivel de medición; posee todas las características de las escalas
discutidas anteriormente, pero a diferencia de ellas, es la única que posee un cero natural. El cero
representa ausencia absoluta de la propiedad en mención y esto permite aplicar operaciones
matemáticas que no se podían aplicar en las escalas anteriores (multiplicación y división). Se
considera que en esta escala, una medición que representa numéricamente el doble que otra,
también representa el doble de la propiedad medida.
CONCEPTOS IMPORTANTES
Incertidumbre
Variable continua
Probabilidad
Acto o Prueba
Experimento
Variable discreta
Escala de medición
Nominal
Ordinal
Intervalos
De razón o proporción
8
CAPÍTULO 3
ORGANIZACIÓN DE DATOS
DISTRIBUCIONES DE FRECUENCIAS
Los análisis estadísticos comienzan, por lo general, en el momento en que se recogen los datos.
Estos datos son los resultados de mediciones y/o evaluaciones realizadas con instrumentos
psicológicos muy específicos y que por lo general dan información cuantitativa (o cualitativa) sobre
ciertos aspectos del comportamiento que son objeto de investigación en momentos determinados. A
continuación presentamos un ejemplo:
TABLA 3-1:
Resultados de la medición de las aptitudes en una muestra de
70 estudiantes de los cursos de capacitación en una universidad.
TABLA 3-2:
Distribución de frecuencias simples de los promedios de las aptitudes de
70 estudiantes de los cursos de capacitación
X f X f X f X f
67 1 81 3 95 1 109 0
68 1 82 1 96 0 110 1
69 0 83 2 97 2 111 2
70 0 84 3 98 0 112 1
71 0 85 0 99 2 113 0
72 0 86 1 100 2 114 0
73 1 87 2 101 2 115 0
74 0 88 1 102 1 116 0
75 0 89 4 103 2 117 3
76 1 90 2 104 1 118 1
77 1 91 4 105 2 119 1
78 1 92 2 106 1 120 1
79 1 93 2 107 2 121 0
80 0 94 7 108 0 122 1
La tabla anterior representa un gran adelanto en comparación con la Tabla 3-1, en vista que presenta
la información mejor organizada y sistematizada: los puntajes se ordenaron de menor a mayor
(podría haber sido a la inversa), cada puntaje tiene asignada una frecuencia, o sea, el número de
sujetos que obtuvieron dicha puntuación. Se observa un primer indicio de agrupamiento hacia los
puntajes centrales en comparación con los valores extremos.
Una segunda forma de organizar los resultados, especialmente si la muestra es grande, es la Tabla
de Frecuencia por intervalos. Bajo este método, se logra que los puntajes se presenten de manera
más compacta en la distribución, lo cual facilita la observación clara de las principales
características estadísticas de los puntajes de la muestra. Este método se caracteriza por la creación
de intervalos, distancias entre puntajes, que facilita la distribución de todos los puntajes de la
muestra en dichos intervalos. Para el uso de este tipo de distribución, el investigador debe tener
claro algunos aspectos que pasamos a discutir:
Los pasos para construir una distribución de frecuencias por intervalos son los siguientes:
.
2. Divida la amplitud entre el número de intervalos que se han considerado adecuados, recordando
que preferiblemente deben ser entre 10 y 20. Se recomienda que se utilice un número de
intervalos tal, que al dividir la amplitud entre el número de intervalos, el número resultante sea
un valor impar, el cual va a representar el tamaño de cada uno de los intervalos; este tamaño es
constante para todos. Para nuestro ejemplo, hemos decidido que sean 12 intervalos; para
calcular el tamaño del intervalo se lleva a cabo la siguiente operación:
Amplitud = 56
No. de intervalos estimado (No.i) = 12; con esta información se calcula el
tamaño del intervalo (Ti):
, que redondeado al entero más próximo corresponde
a 5.
3. A partir de estos datos, se construye la Tabla de frecuencias por intervalos que para este caso
será de menor a mayor. En el primer intervalo debe quedar incluido el valor más pequeño de la
distribución y en el último se incluirá el valor más grande. La estructura de cada intervalo se
caracteriza por las siguientes condiciones:
Los intervalos tendrán un puntaje inferior que se denominará límite inferior, y
un puntaje superior que se denominará límite superior; el recorrido entre ambos
extremos debe ser igual al Ti, incluidos estos dos valores. Por ejemplo:
65 ----------------------- 69
Límite inferior Límite superior
Para escoger el límite inferior del primer intervalo, debe utilizarse la siguiente
regla: “debe corresponder al número más cercano al puntaje más pequeño
de la distribución, y que a su vez sea un múltiplo del tamaño del
intervalo”. Para efectos de este ejemplo, el límite inferior del primer intervalo
corresponde a 65 y el mayor a 69.
11
4. A partir de esta información, construya la Tabla de frecuencias partiendo del intervalo 65 – 69,
en el cual está incluido el puntaje más bajo que es 67, hasta llegar al último intervalo que debe
incluir el puntaje más alto: 122. Todos los intervalos deben ser de tamaño 5 para efectos de este
problema.
65 – 69 // 2
6. Se procede de esta manera con todos los intervalos hasta obtener toda la información
correspondiente a las frecuencias simples. Se completa la tabla con el resto de las columnas que
contendrán la información requerida para adelantar los primeros análisis estadísticos. Las otras
columnas más frecuentes son: tabulación (tab), frecuencias (f), frecuencias acumuladas (fa),
puntos medios (Pm), proporciones (p), y porcentajes (%).
TABLA 3-3:
Distribución de frecuencias por intervalos
correspondientes a las aptitudes de una muestra de 70 estudiantes
i f fa Pm p %
65-69 2 2 67 0.03 2.86
70-74 1 3 72 0.01 1.43
75-79 4 7 77 0.06 5.71
80-84 9 16 82 0.13 12.86
85-89 8 24 87 0.11 11.43
90-94 17 41 92 0.24 24.29
95-99 5 46 97 0.07 7.14
100-104 8 54 102 0.11 11.43
105-109 5 59 107 0.07 7.14
110-114 4 63 112 0.06 5.71
115-119 5 68 117 0.07 7.14
120-124 2 70 122 0.03 2.86
∑ 0 ∑ 0.99a ∑ 00.00
a La sumatoria de p es <1.00 por efectos de redondeo
12
Frecuencias acumuladas (fa): a partir de la frecuencia del intervalo más pequeño, se van
sumando de manera acumulativa las frecuencias de los intervalos posteriores y se van indicando
en la Tabla. Para verificar, debe observarse que en el primer intervalo está acumulada la
frecuencia de este intervalo y que en el último intervalo debe estar acumulada la totalidad de las
frecuencias de la muestra. Ejemplo: (ver Tabla 3-3)
Primer intervalo = 65 – 69 Frecuencia = 2
Último intervalo = 120 – 124 Frecuencia = 70
Punto medio (Pm): se refiere al puntaje que se ubica en la mitad de cada intervalo y se calcula
a través de la siguiente operación:
( )
o , en donde, Li representa al límite inferior del intervalo y Ls, al límite
superior.
( )
o Para efectos del primer intervalo, el Pm sería igual a: , tal y como se
puede verificar en la Tabla 3-3.
o Esta operación se debe desarrollar para todos los intervalos de la distribución y señalar
el resultado en su correspondiente columna.
Otro procedimiento para construir una Tabla de Frecuencias es La Regla de Sturges. En el mismo
se aplica una regla (fórmula) especial, a través de la cual se puede determinar (K), que representa el
número aproximado de intervalos en la distribución: ( ), en donde:
Si aplicamos dicha regla a los datos de nuestra muestra, los resultados serían los siguientes:
( )( 0) 0
Tamaño de intervalos ( )
13
TABLA 3-4:
Distribución de frecuencias por intervalos correspondientes
a las aptitudes de una muestra de 70 estudiantes.
i f fa Pm p %
63 - 69 2 2 67 0.03 2.86
70 - 76 2 4 72 0.03 2.86
77 - 83 9 13 77 0.13 12.86
84 - 90 13 26 82 0.19 18.57
91 - 97 18 44 87 0.26 25.71
98- 104 10 54 92 0.14 14.29
105 - 111 8 62 97 0.11 11.43
112 - 118 5 67 102 0.07 7.14
119 - 125 3 70 107 0.04 4.29
∑ 0 ∑ .00 ∑ 00.01a
a La sumatoria de % es >100.00 por efectos de redondeo
Como se puede observar, la distribución de frecuencias por intervalos generada a través de la Regla
de Sturges, tiende a producir distribuciones más compactas que en el primer caso, por el hecho de
que genera menor número de intervalos pero con un tamaño mayor, lo cual hace que dentro de los
mismos haya un mayor número de sujetos. Ahora, no existe ninguna regla que señale que Sturges
produce resultados superiores que el primer método estudiado. Nada supera el buen juicio del
investigador para determinar cuál es la distribución más conveniente.
CONCEPTOS IMPORTANTES
Distribución de frecuencias
Simples
Por Intervalos
Intervalos
Amplitud o Rango
Límites de intervalos
Frecuencias simples
Frecuencias acumuladas
Proporciones
Porcentajes
14
EJERCICIOS PRÁCTICOS
Problema 1
Los datos anteriores corresponden a los puntajes obtenidos en una prueba de admisión universitaria,
por una muestra de estudiantes graduados de escuela secundaria. Organice los datos en una Tabla de
Frecuencias por intervalos, satisfaciendo los siguientes requisitos:
Problema 2
Con los mismos datos, del problema construya una Tabla de Frecuencias utilizando un tamaño de
intervalo igual a 4. Repita el mismo procedimiento que en el problema anterior. Observe, analice y
discuta las diferencias entre una distribución y la otra.
Problema 3
Elimine de forma aleatoria (por azar) un dato de cada columna del problema 1; esto creará una
nueva distribución de datos. Para la misma, construya dos Tablas de frecuencias utilizando las
recomendaciones brindadas en este Texto. Una de las tablas debe tener un tamaño de intervalo
impar y la otra, un tamaño par. Complete ambas tablas con los elementos solicitados anteriormente;
analice y discuta los resultados obtenidos.
Si desea practicar más, puede eliminar columnas de la distribución de datos y desarrollar sus
correspondientes tablas. También puede revisar los textos señalados en la bibliografía y hacer otros
problemas.
15
CAPÍTULO 4
REPRESENTACIONES GRÁFICAS
Existen diferentes tipos de representaciones gráficas utilizadas para diferentes objetivos. Para
efectos de este capítulo, se analizarán tres tipos de gráficas, las cuales son básicas para el análisis
científico de la data proveniente de la medición comportamental: el gráfico de barra (histogramas),
el polígono de frecuencias y la ojiva. Pero antes de iniciar este estudio formalmente, es necesario
señalar algunos detalles importantes en la construcción de las mismas y que son comunes en todas
ellas. Los gráficos serán construidos en el cuadrante cartesiano en que los ejes X e Y son positivos.
Al eje X se le denominará abscisa y al Y ordenada.
Y
X e Y son positivos
FIGURA 4—1
En el eje de las ordenadas (Y) se colocan las frecuencias, porcentajes, etc, mientras que en el
eje de las abscisas (X) se colocarán los puntajes, los cuales pueden estar representados por los
valores correspondientes a los puntos medios, los límites de los intervalos ya sean los superiores
o los inferiores; no se deben combinar estos en un mismo gráfico. También se considera que en
el eje de X se coloca la variable independiente y en el de la Y la variable dependiente.
Cuando los gráficos se construyen manualmente, se sugiere la regla de los tres cuartos, la
cual se caracteriza por lo siguiente: “en la representación gráfica de las frecuencias,
el eje vertical debe hacerse de tal forma que la altura del punto máximo (que
representa el resultado asociado con la frecuencia más alta) debe ser
aproximadamente igual a tres cuartos de la longitud del eje horizontal”.
16
En la práctica, esta es una condición difícil de cumplir, por lo cual se sugiere que tanto
X como Y sean más o menos proporcionales. Este problema ha sido superado con la
utilización de ordenadores para la construcción de los gráficos.
GRÁFICO DE BARRAS
Se refiere a un gráfico diseñado para variables medidas en escalas nominales y ordinales; o sea, que
los datos no están relacionados numéricamente entre ellos. Cada categoría o intervalo se representa
por una barra y la frecuencia determina la altura de la misma; además, las barras son independientes
una de otras. Para la construcción de un gráfico de este tipo, se sugieren los siguientes pasos:
TABLA 4-1:
Frecuencias De Las Carreras A Las Que Aplican 70 Aspirantes A La Universidad
Facultad f
Admón de Empresas 8
Arquitectura 9
Ciencias Agropecuarias 8
Ciencias de la Educación 4
Ciencias Exactas y Tecnología 4
Comunicación Social 8
Derecho y Ciencias Políticas 6
Economía 2
Enfermería 2
Humanidades 6
Medicina 1
Odontología 6
Psicología 6
∑ 0
17
GRÁFICO 4-1
7
6
5
4
3
2
1
0
Como se puede observar, el gráfico representa cada intervalo con su correspondiente altura
(frecuencia), la cual está identificada por la barra. Este tipo de gráfico también puede representarse
de manera horizontal, tal y como se demuestra a continuación.
GRÁFICO 4-2
0 1 2 3 4 5 6 7 8 9 10
Frecuencia
HISTOGRAMA
El histograma también es un gráfico de barras, pero a diferencia del anterior, se utiliza en el caso en
que las distribuciones de frecuencias corresponden, por lo menos a una escala de intervalos. Desde
el punto de vista estadístico, las barras comparten información en vista de que se construyen con los
18
límites reales de cada una de ellas. El límite superior de cada barra se convierte en el límite inferior
de la siguiente, apoyados en el concepto de continuidad de la variable. A continuación se presenta
un ejemplo.
TABLA 4-2:
Distribución De Frecuencias Por Intervalos
Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes
i f
65-69 2
70-74 1
75-79 4
80-84 9
85-89 8
90-94 17
95-99 5
100-104 8
105-109 5
110-114 4
115-119 5
120-124 2
∑ 0
GRÁFICO 4-3
10
8
6
4
2
0
Aptitudes
19
POLÍGONO DE FRECUENCIAS
TABLA 4-3:
Distribución De Frecuencias Por Intervalos
Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes
i f
65-69 2
70-74 1
75-79 4
80-84 9
85-89 8
90-94 17
95-99 5
100-104 8
105-109 5
110-114 4
115-119 5
120-124 2
∑ 0
GRÁFICO 4-4
18
16
14
Frecuencias
12
10
8
6
4
2
0
20
El polígono anterior utiliza como representativo de los datos, cada uno de los intervalos. Sin
embargo, por lo general, se utilizan los puntos medios de los intervalos, lo cual facilita la
descripción de los datos. A continuación presentamos un ejemplo.
TABLA 4-4:
Distribución De Frecuencias Por Intervalos
Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes
pm f
67 2
72 1
77 4
82 9
87 8
92 17
97 5
102 8
107 5
112 4
117 5
122 2
∑ 0
GRÁFICO 4-5
10
8
6
4
2
0
67 72 77 82 87 92 97 102 107 112 117 122
Puntos medios
2. Señale en el cuadrante los pares ordenados para cada X e Y con un punto. En otras palabras, la
intersección de cada valor X con su correspondiente Y, se marca con un punto. Repita esta
acción para cada intervalo y una vez terminado, una los puntos con rectas hasta que se dibuje la
figura del polígono.
3. Los extremos del polígono quedan suspendidos (no se unen con el eje de X). En tal caso, únalos
con segmentos de recta que deben estar ubicados a medio intervalo por debajo y por encima de
los dos valores extremos (Gráfico 4-4 y Gráfico 4-5).
4. La utilización de los puntos medios está plenamente justificado teóricamente, en vista de que
los mismos representan cada uno de los intervalos, lo cual quedará demostrado al momento de
calcularse ciertos estadísticos básicos para los análisis.
Hay ocasiones en las que el investigador necesita que los datos se ordenen acumulativamente. Ya
observamos en la Tabla 3-4 que es posible resumir las frecuencias de los intervalos de manera
acumulada. Para tales casos, los datos acumulados pueden representarse gráficamente a través de
una ojiva o curva acumulativa de frecuencias; a continuación se presenta un ejemplo.
TABLA 4-5:
Distribución De Frecuencias Por Intervalos Correspondientes
A Las Aptitudes De Una Muestra De 70 Estudiantes.
i f fa Pm
63 - 69 2 2 67
70 - 76 2 4 72
77 - 83 9 13 77
84 - 90 13 26 82
91 - 97 18 44 87
98- 104 10 54 92
105 - 111 8 62 97
112 - 118 5 67 102
119 - 125 3 70 107
∑ 0
22
GRÁFICO 4-6
70
Frecuencias acumuladas
60
50
40
30
20
10
0
67 72 77 82 87 92 97 102 107
Los pasos a seguir para confeccionar una gráfica de frecuencias acumuladas (OJIVA) son los
siguientes:
A través de éste gráfico se puede calcular algunas medidas de posición importantes tales como los
percentiles, los rangos percentiles, la mediana, etc.
Es una alternativa muy sencilla de describir los datos de una muestra, especialmente cuando la
misma no es muy grande (n ≤ 100). Cada dato se va a dividir en dos partes: el primer dígito (y el
segundo, en algunas ocasiones), corresponde al tallo y el segundo a la hoja. Veamos un ejemplo con
el dato X = 46. Para este caso:
Tallo = 4, Hoja = 6.
Este procedimiento se seguiría con todos los puntajes de la distribución, pero el diagrama tiene una
estructura especial, la cual pasamos a presentar a continuación. Para tal efecto utilizaremos los datos
resumidos en la Tabla 3-2.
23
GRÁFICO 4-7
TALLO HOJA
6 7 8
7 3 6 7 8 9
8 1 1 1 2 3 3 4 4 4 4 6 7 7 8 9 9 9 9
9 0 0 1 1 1 1 2 2 3 3 4 4 4 4 4 4 4 5 7 7 9 9
10 0 0 1 1 2 3 3 4 5 5 6 7 7
11 0 1 1 2 7 7 7 8 9
12 0 2
En el ejemplo anterior se observa que el puntaje más bajo corresponde al número 67, por esta razón
el diagrama se inicia en el tallo 6. Las hojas correspondientes a este tallo son el 7 y el 8 porque
únicamente en esta decena están el número 67 y 68. A continuación vendría la decena del 70, cuyo
tallo sería el 7; las hojas en este tallo serían 3, 6, 7, 8 y 9, porque corresponderían a los números 73,
76, 77, 78 y 79. De esta manera se desarrollarían los restantes tallos con sus correspondientes hojas.
El desarrollo y crecimiento de la informática, tanto en lo que respecta a los ordenadores como a los
programas, han facilitado la presentación de gráficos y han enriquecido este aspecto tan importante
de las estadísticas. A continuación presentamos algunos ejemplos de presentaciones gráficas que se
pueden desarrollar gracias al avance de la tecnología.
24
18
16
14
12
10
8
6
4
2
0
65- 75- 85- 95- 105- 115
69 79 89 99 109 -119
CONCEPTOS IMPORTANTES
Gráfico
Cuadrante cartesiano
Ordenada
Gráfico de barras
Histograma
Polígono de frecuencias
Pares ordenados
Ojiva
Diagrama Tallo – Hoja
25
EJERCICIOS PRÁCTICOS
Problema 1
Los datos presentados son los mismos que se dieron para el ejercicio del Capítulo III, para los
cuales usted ya ha generado varias tablas de frecuencias por intervalos. Utilizando la Tabla de
intervalos de tamaño 5, construya los siguientes gráficos:
1. Polígono de frecuencias usando los puntos medios. También lo debe hacer utilizando uno de los
límites del intervalo.
2. Gráfico de barras
3. Histograma
4. Ojiva
5. Diagrama de tallo y hojas
Problema 2
Construya estos gráficos, utilizando las diferentes distribuciones de frecuencias que construyó en el
Capítulo III. Observe, analice y discuta las diferencias encontradas entre los gráficos construidos.
26
CAPÍTULO 5
MEDIDAS DE TENDENCIA CENTRAL
Hasta este momento, el proceso de sistematización y organización de los datos que hemos seguido,
ha permitido reducir la información inicial (datos originales) correspondientes a las aptitudes de 70
aspirantes a ingresar a la Universidad, a partir de tablas y gráficos descriptivos. A pesar de esta
reducción, la calidad de la información mejoró tanto cuantitativa como cualitativamente, en vista de
que se logró identificar características especiales de la muestra que no resaltaban en su forma
original de presentación: datos brutos.
Estas características particulares de las muestras, favorecen un análisis más profundo y dinámico de
la información cuantitativa resumida en las tablas y gráficos, a tal punto, que logran resumir, en
muy pocos valores cuantitativos, las características de las variables analizadas y como consecuencia
directa, las características de las muestras que están siendo objeto de análisis. Esta nueva
información se identifica como medidas estadísticas y se pueden definir desde dos perspectivas
particulares pero complementarias: las medidas de tendencia central y las medidas de
variabilidad. A continuación pasaremos a analizar y discutir lo que significan las medidas de
tendencia central y su importancia en el análisis descriptivo de los datos.
Las muestras de datos, con mucha frecuencia, tienden a comportarse de manera muy particular, lo
cual tiende a dramatizarse con mucho detalle en las tablas y los gráficos correspondientes. Por lo
general, hay uno o varios puntajes que al analizarlos en las tablas y gráficos, presentan una mayor
frecuencia de ocurrencia que los otros; en muchas ocasiones, es un solo valor de la distribución el
que se destaca por esta cualidad.
Si observamos los resultados resumidos en la Tabla 3-3 y en la Tabla 3-4, la mayor frecuencia de
datos se observa en el intervalo 90-94 (frecuencia 17) y en el intervalo 91-97 (frecuencia 18),
respectivamente. Es evidente que un número importante de datos tiende a agruparse alrededor de
ciertos valores centrales (intervalos), y consecuentemente, el resto se distribuye por encima y por
debajo de estos intervalos de mayor frecuencia. A partir de este comportamiento, se determina que
en las distribuciones muestrales hay un valor que es el más frecuente y alrededor del cual se agrupa
el resto de los valores; este puntaje se considera representativo de toda la distribución. A estos
valores, que representan la tendencia de una distribución se les denomina: medidas de tendencia
central. A continuación pasaremos a analizar las más importantes en el análisis estadístico de los
resultados obtenidos en una investigación del comportamiento.
LA MEDIA ARITMÉTICA
Una definición simple y adecuada de la media aritmética es: la suma de todos los datos
correspondientes a una muestra, dividida entre el total de los datos. Definida de manera estadística
sería:
La fórmula anterior se conoce como la fórmula general de la media aritmética y se aplica cuando
se utiliza la totalidad de las observaciones, tanto de las muestras como las poblaciones. Es el
procedimiento que usan los programas estadísticos tanto de las calculadoras manuales como los
ordenadores.
1. Por ser el promedio de todas las observaciones está afectada por todos los valores, lo cual
determina que la media sea muy sensible a las puntuaciones extremas de las distribuciones.
∑
2. A partir de la fórmula general, si dos de los componentes son conocidos, se puede
conocer el tercero.
3. La suma de las desviaciones de cada puntaje con relación a la media es igual a cero: ∑ 0.
4. La media representa un punto de equilibrio o centro de gravedad de la distribución, a partir de
los puntajes extremos de la misma.
Cuando las muestras están organizadas en Tablas de Frecuencias, la media aritmética se calcula a
partir de algunos de los componentes de la misma, tal y como se demuestra a continuación. Es
importante que la tabla resumen contenga la información necesaria para que se puedan aplicar las
fórmulas requeridas para el cálculo de la media aritmética siguiendo este procedimiento.
28
TABLA 5-1:
Cálculo de la media aritmética para datos agrupados
i f Pm f * Pm
65-69 2 67 134
70-74 1 72 72
75-79 4 77 308
80-84 9 82 738
85-89 8 87 696
90-94 17 92 1564
95-99 5 97 485
100-104 8 102 816
105-109 5 107 535
110-114 4 112 448
115-119 5 117 585
120-124 2 122 244
∑ 0 ∑
∑( )
0
El resultado obtenido indica que la media aritmética de las aptitudes de los 70 aspirantes a ingresar
a la Universidad fue igual a 94.64. Si se observa la Tabla 5-1, se puede verificar la cercanía de este
resultado con el intervalo de mayor frecuencia. Es evidente que la correcta construcción de la Tabla
y de sus componentes, son una garantía para la obtención de resultados precisos en el cálculo de
estadísticos como la media aritmética.
La media aritmética puede ser calculada a través de los denominados métodos abreviados.
Aprovechando la propiedad de que la ∑ 0, se han desarrollado dos métodos alternativos para el
cálculo de este estadístico. En ambos se determina una media supuesta, que puede corresponder a
cualquier puntaje de la distribución, ya sea que esté por encima o por debajo de la media real. A
partir de este valor se calcula un corrector, que se va a agregar algebraicamente a la media
supuesta:
Si la media supuesta es mayor que la media verdadera, el corrector será restado de la primera,
corrigiendo el exceso. De esta manera, el resultado final corresponde a la media real.
Si la media supuesta es menor que la media verdadera, el corrector será sumado a la primera
corrigiendo el defecto; el resultado corresponderá a la media verdadera.
∑
1. , en donde:
∑( )
2. ( ) , en donde:
A es la media supuesta
∑( ) corresponde a la sumatoria del producto de las frecuencias de cada intervalo
con su correspondiente diferencia
∑( )
es el factor de corrección
i es el tamaño del intervalo
Cualquiera de los dos métodos abreviados tendrá como resultado la misma media: la verdadera.
Otros promedios, diferentes que la media aritmética, permiten estimar el valor representativo de la
distribución. A estos promedios se les denomina promedios de posición, en vista de que los mismos
corresponden a un lugar en la distribución. Para calcularlos, se deben satisfacer las siguientes
condiciones:
Los promedios de posición más importantes son: la mediana y la moda, los cuales pasaremos a
analizar a continuación.
La mediana (mdn)
Se considera la medida de tendencia central que divide la distribución de datos en dos partes
iguales, dejando por encima y por debajo de ella igual cantidad de observaciones. Para el cálculo de
la mediana, es necesario que los datos estén ordenados de menor a mayor atendiendo a sus
magnitudes. A continuación presentamos un ejemplo para datos no organizados en tablas de
frecuencias:
30
Puntuación (ficticios)
1
2
3
4
5 mediana
6
7
8
9
La mediana de los datos anteriores es 5, porque es el valor que en la distribución ordenada deja por
encima y por debajo igual número de puntajes. Cuando el número de observaciones es impar, la
mediana coincide con uno de los valores de la distribución; cuando el número es par, la mediana
será una fracción y estará ubicada entre los dos valores centrales de la distribución, y habrá
necesidad de promediar los mismos, tal y como se presenta a continuación:
X
1
2
3
4 mediana:
5
6
7
8
Como se puede observar, la mediana sólo se puede calcular en una distribución ordenada
previamente y no está afectada por los dos valores más extremos (1 y 8).
Cuando los datos están agrupados en tablas de frecuencias, la mediana se calcula utilizando un
procedimiento de interpolación, siendo su fórmula de cálculo la siguiente:
( )
( )
TABLA 5-2:
Cálculo de la mediana en una distribución de frecuencias
i f fa
65-69 2 2
70-74 1 3
75-79 4 7
80-84 9 16
85-89 8 24
90-94 17 41
95-99 5 46
100-104 8 54
105-109 5 59
110-114 4 63
115-119 5 68
120-124 2 70
∑ 0
1. Se calcula
2. 35 se ubica en las frecuencias acumuladas en el intervalo 90 – 94. A este intervalo se le
denomina la clase mediana.
3. Se determina fa que corresponde a la frecuencia acumulada anterior a la clase mediana; en este
caso es igual a 24
4. De igual manera se señala el valor de fmdn , o sea, la frecuencia simple dentro de la clase
mediana, que resultó ser igual a 17
5. El tamaño del intervalo, i, para este problema es de (5)
6. Finalmente se sustituye en la fórmula de la mediana:
( )
( )
El valor de la mediana para estos datos es de 92.73 y se considera que deja por encima y por debajo
de él al 50% de los datos de la distribución. Como se puede observar, el valor de la mediana es
ligeramente inferior al de la media aritmética, situación que se presentará siempre que se analicen
datos muestrales. Sin embargo, siempre aspiraremos a que la diferencia entre estos dos estadísticos
sea la menor posible, lo cual indicaría lo que se denominará posteriormente asimetría.
32
La moda ( )
La definición más simple y frecuente de la moda es: el valor o puntaje que más se repite en una
distribución. A continuación se presenta un ejemplo, cuando las puntuaciones no están afectadas
por intervalos:
Puntajes (ficticios)
1
2
3
4
……moda
4
5
6
7
8
Para el ejemplo anterior, la moda es 4 porque es el puntaje que más se repite. El cálculo de este
estadístico en distribuciones simples es sencillo, presentándose dificultades si en la distribución hay
más de un puntaje con la mayor frecuencia; en estas condiciones, estamos ante la presencia de
varias modas en una sola distribución, situación que no es la más adecuada para el análisis de la
tendencia central de las observaciones.
Existen varios procedimientos para el cálculo de la moda en datos agrupados en distribuciones por
intervalos: el método de interpolación algebraica y el método empírico. A continuación
analizaremos cada uno de ellos.
33
TABLA 5-3:
Cálculo de la moda por interpolación algebraica
i f
65-69 2
70-74 1
75-79 4
80-84 9
85-89 8
90-94 17
95-99 5
100-104 8
105-109 5
110-114 4
115-119 5
120-124 2
∑ 0
( )
: límite inferior real del intervalo donde cae la moda (clase modal), o sea, el que tiene
mayor frecuencia
: Delta 1, que se refiere a la diferencia entre la frecuencia de la clase modal y la
frecuencia de la clase pre modal (despréciense los signos).
: Delta 2, que se refiere a la diferencia entre la frecuencia de la clase modal y la
frecuencia de la post modal (despréciense los signos).
i : tamaño del intervalo.
Al igual que en la mediana, los datos están organizados de menor a mayor y se requiere determinar
previamente el lugar (intervalo) en que debe caer el valor de la moda. A continuación se presenta un
ejemplo a partir de los datos de la Tabla 5-3.
( )
( ) ( )
El valor de la moda calculada a través del método de interpolación algebraica es de 91.64, que es un
valor ligeramente diferente al de la media y la mediana, calculadas para el mismo conjunto de datos.
34
Otro método a través del cual también se puede calcular la moda es el método empírico, el cual se
utiliza preferiblemente cuando la distribución es moderadamente asimétrica, o sea, cuando la media
y la mediana difieren ligeramente. En este caso se requiere que la media y mediana hayan sido
calculadas previamente y la fórmula general es la siguiente:
( )
Como ya se tienen los valores de la media y la mediana calculados, 94.64 y 92.73 respectivamente,
se hacen las correspondientes sustituciones en la fórmula:
( )
En este caso, la moda alcanzó un valor de 88.91, menor que el obtenido en el método de
interpolación algebraica. La diferencia entre ambos valores calculados no debe inquietar al
estudiante si los procedimientos han sido correctamente ejecutados; estos procedimientos no llevan
a resultados iguales. Sin embargo, el buen juicio del investigador debe prevalecer en situaciones
como ésta antes de escoger el método más conveniente. Para este caso, sería prudente evaluar el
coeficiente de asimetría para verificar que la diferencia entre la media y la mediana es
estadísticamente aceptable.
Es importante destacar que de las tres medidas de tendencia central, la media presenta
características estadísticas que la hacen poseer un mayor nivel de utilidad; es la más importante. Sus
propiedades favorecen su utilización en cálculos estadístico más avanzados, especialmente en las
estadísticas inferenciales y el muestreo. Se le considera la más estable y confiable entre las medidas
de tendencia central, lo cual significa que si tomáramos varias muestras, la media aritmética
presentaría menor fluctuación que la mediana y la moda.
Hay ocasiones en que se prefiere utilizar la mediana, especialmente cuando queremos hacer ciertas
descripciones.
La media, mediana y moda pueden relacionarse a través de ciertas condiciones que pasaremos a
señalar:
CONCEPTOS IMPORTANTES
EJERCICIOS PRÁCTICOS
Problema 1
Los datos anteriores son los mismos para los cuales ha creado distribuciones de frecuencias y
gráficos. En esta ocasión, utilizando la tabla de Frecuencias con intervalos de tamaño 5, determine:
1. La media aritmética
2. La mediana
3. La moda (por el método de interpolación u por el método empírico)
Como usted ha construido para estos datos, distintos tipos de tablas de frecuencias, calcule las
medidas de tendencia central identificadas anteriormente. Trate de desarrollar estas prácticas que
serán de gran beneficio para su proceso de aprendizaje.
37
CAPÍTULO 6
MEDIDAS DE VARIABILIDAD
En la misma forma en que la tendencia central fue analizada a través de varios estadísticos
denominados medidas de tendencia central, las variaciones observadas entre los puntajes pueden ser
descritas a través de estadísticos denominados medidas de variabilidad o dispersión, las cuales
permiten analizar las condiciones de variación que se dan entre los puntajes de la muestra y las
medidas de tendencia central.
Las medidas de variabilidad que se analizarán a lo largo de este capítulo son: la fluctuación, los
percentiles, la varianza y la desviación estándar. Las dos primeras, la fluctuación y los
percentiles, son medidas de variabilidad que no están asociadas con ninguna medida de tendencia
central, mientras que la desviación media, la varianza y la desviación estándar, son medidas de
variabilidad asociadas con la media aritmética.
Las medidas de variabilidad anteriormente presentadas no son las únicas medidas de de este tipo
existentes, pero para efectos de nuestros estudios y posteriores aplicaciones, se considerarán las más
importantes.
La Fluctuación (Amplitud)
= fluctuación
= puntuación mayor
= puntuación menor
1 : corrector por continuidad
38
Si nos referimos a los datos de la muestra No.1, Capítulo 3 (ver Tabla 3-1), el puntaje mayor fue
122 y el menor 67, lo que implica que su fluctuación es de:
Como puede observarse, la fluctuación está afectada por los puntajes extremos de la distribución, y
esta situación establece la probabilidad de que valores inusuales pueden estar afectándola. Además,
la fluctuación no está relacionada con ninguna medida de tendencia central, lo cual le resta poder en
los análisis estadísticos.
Es importante destacar, que la fluctuación es muy sensible al tamaño de la muestra, lo que significa
que está muy afectada por las modificaciones en el tamaño de las mismas. Ante este conjunto de
condiciones desfavorables, es claro que la utilidad de la fluctuación es bastante limitada en
comparación con otras medidas de variabilidad que analizaremos posteriormente. Sin embargo, ya
vimos que la misma es importante para la construcción de las tablas de frecuencias por intervalos.
Los Percentiles
Se conoce como percentil, al puntaje de una distribución que deja por debajo de él un cierto
porcentaje de los casos de dicha distribución. Por ejemplo, el percentil 50, o sea, P50 en notación
estadística, es aquel que deja por debajo de sí al 50% de la totalidad de los casos; el percentil 32,
P32, es aquel que deja por debajo de sí al 32%, y así sucesivamente. Para el cálculo de los
percentiles, es necesario que los datos estén organizados en una Tabla de Frecuencias ordenada de
menor a mayor. El procedimiento de cálculo de un percentil es idéntico al de la mediana y se le
considera un estadístico de posición. Para el cálculo de los percentiles en una tabla de frecuencias se
recurre a la siguiente fórmula:
( )
( ), donde:
TABLA 6-1:
Cálculo del P40 en una muestra de 78 sujetos
I F Fa
5-9 3 3
10-14 8 11
15-19 16 27
20-24 17 44 Intervalo en que cae 31.2
25-29 12 56
30-34 7 63
35-39 5 68
40-44 4 72
45-49 2 74
50-54 2 76
55-59 1 77
60-64 1 78
∑
( ) 0
De acuerdo con el resultado obtenido, el puntaje 20.74 deja por debajo de él al 40% de la
distribución. Es necesario destacar que los percentiles también pueden ser identificados con otras
denominaciones, la cuales están asociadas con los porcentajes de puntajes que dejen por debajo de
si:
Deciles (D): se refieren al 10%. En este caso, se les denominaría: decil 1 al primer 10% (D 1),
decil 2 al 20% (D2), decil 3 al 30% (D3) y así sucesivamente hasta el decil 10 que dejaría por
debajo de sí al 100%.
Quartil (Q) : se refieren a intervalos de 25%. El cuartil 1 (Q1) deja por debajo al 25%, el Q2 se
refiere al que deja por debajo al 50% (observe que este caso es igual a la mediana), el Q3 que
deja por debajo el 75% y el Q4 que corresponde al 100%.
40
Observe que el D5, el Q2 y la mediana, corresponden al mismo dato: el que deja por debajo de si
al 50% de la distribución.
La Desviación Media
A partir de la “desviación media”, nuestro interés se centra en las medidas de variabilidad que
parten de algún tipo de promedio, ya sea la mediana o en especial la media. La desviación media se
define como el promedio de las desviaciones absolutas alrededor de la media. La fórmula para el
cálculo de dicho estadístico para datos no organizados por intervalos es:
∑| | ∑| |
X |d|
2 3.5
3 2.5
Diferencia
4 1.5 entre el
puntaje y la
5 0.5 media
aritmética,
6 0.5 sin
considerar
7 1.5 el signo
8 2.5
9__ 3.5__
∑ 16.0
Como se puede observar, cada puntaje se resta de la media (d) pero no se toma en consideración el
signo (diferencias absolutas), se suman y dividen entre n, obteniéndose una estimación de la
variabilidad la cual tiene la restricción de que no da información sobre la ubicación del puntaje con
relación a la media.
41
Para datos organizados en tablas de frecuencias, los puntos medios de cada intervalo se restan de la
media aritmética, sin tomar en consideración los signos (| |). Luego se multiplican las frecuencias
de cada intervalo por sus respectivas desviaciones, f(d), se suman los resultados de esta columna y
se dividen entre la n muestral. La fórmula para calcular de DM en datos agrupados es la siguiente:
∑( | |) ∑( | |)
TABLA 6-2:
Cálculo de la DM para una muestra de 70 estudiantes aspirantes a ingresar a la universidad.
I F Pm |d| f(|d|)
65-69 2 67 27.64 55.28
70-74 1 72 22.64 22.64
75-79 4 77 17.64 70.56
80-84 9 82 12.64 113.76
85-89 8 87 7.64 61.12
90-94 17 92 2.64 44.88
95-99 5 97 2.36 11.8
100-104 8 102 7.36 58.88
105-109 5 107 12.36 61.8
110-114 4 112 17.36 69.44
115-119 5 117 22.36 111.8
120-124 2 122 27.36 54.72
∑ = 70 ∑= 736.68
Es la más importante de las medidas de variabilidad. Está afectada por todos los valores de la
distribución y mide la dispersión de los puntajes a partir de la media aritmética, con la característica
fundamental de que considera los signos + y – de cada diferencia. Esta situación la coloca en una
posición superior, matemáticamente, con respecto de las otras medidas de variabilidad
42
En distribuciones de frecuencias simples (no afectadas por intervalos), la fórmula para calcular la
desviación estándar es a siguiente:
∑( )
√
A partir de los datos organizados en la Tabla 6-3, se sustituye en la fórmula, y se obtiene el valor de
la s:
√ ( ) √ √ 0
0 0
TABLA 6-3:
Cálculo de la desviación estándar para una muestra de 70 aspirantes a ingresar a la universidad
I f Pm fpm fpm2
65-69 2 67 134 8978
70-74 1 72 72 5184
75-79 4 77 308 23716
80-84 9 82 738 60516
85-89 8 87 696 60552
90-94 17 92 1564 143888
95-99 5 97 485 47045
100-104 8 102 816 83232
105-109 5 107 535 57245
110-114 4 112 448 50176
115-119 5 117 585 68445
120-124 2 122 244 29768
Total ∑ 0 6625 638745
La s es la medida de variabilidad más confiable y se puede definir como la raíz cuadrada del
promedio de las desviaciones cuadráticas alrededor de la media, siendo ésta su propiedad
matemática más importante. A partir de estas propiedades, la s es de gran utilidad en análisis
estadístico más avanzados tales como: muestreo, prueba de hipótesis, Análisis de la Varianza, teoría
de regresión y correlación, etc.
La Asimetría
Se entiende por simetría el grado de equilibrio que presentan las observaciones a ambos lados de su
tendencia central. Por lo tanto, la asimetría es la ausencia de equilibrio entre dichas puntuaciones.
Estadísticamente, la simetría se refiere a que las tres medidas de tendencia central son iguales; como
esta situación es poco probable que suceda en las muestras, las mismas son asimétricas en vista de
que dichas medidas tienden a ser diferentes por efecto de los errores de muestreo. En el fondo, los
investigadores aspiramos a obtener muestras con bajos niveles de asimetría y tratamos de verificar
esta situación calculando el índice de asimetría.
La condición de asimetría de una muestra se puede verificar, inicialmente, a través del polígono de
frecuencias, en el cual se puede observar las distintas formas de asimetría o sesgo, como también se
le denomina. Veamos algunos ejemplos.
44
FIGURA 6—1
Si la cola izquierda del polígono es más alargada que la derecha, estamos ante un caso de asimetría
negativa. Esto significa que por debajo de la media se encuentran los puntajes más extremos y la
media aritmética ha tenido que correrse en esta dirección, para mantener los pesos positivos y
negativos equilibrados. Si la cola de la derecha está más alargada, significa que estamos ante un
caso de asimetría positiva. Es decir, los puntajes más extremos están por encima de la media
aritmética y ella ha tenido que correrse en dicha dirección. En la distribución ubicada en el centro
de la Figura 6—1, ambos lados de la curva están equilibrados y esto indica que sus medidas de
tendencia central tienden a ser más o menos iguales.
( )
Cuando el coeficiente de asimetría es ≤ 1, se considera que el mismo está dentro de los límites
aceptables de sesgo; mucho mejor a medida que tiende a cero (0).
La Curtosis
Se define como el grado de apuntalamiento (alargamiento vertical) que tiene una distribución y que
se refleja con claridad en los gráficos estudiados anteriormente. Cuando el apuntalamiento es poco
marcado (bajo), se considera que la distribución es platicúrtica. Cuando el apuntalamiento es muy
marcado, la distribución se considera leptocúrtica. Y cuando el apuntalamiento es mesurado, se
considera mesocúrtica, siendo esta última la que mejor nos aproxima al modelo de la curva normal.
45
FIGURA 6—2
Al igual que en la asimetría, hay diversos métodos para calcular la curtosis. A continuación
presentamos uno de ellos: K = coeficiente de curtosis percentílico, cuya fórmula es la siguiente:
CONCEPTOS IMPORTANTES
Variabilidad o dispersion
Fluctuación
Percentil
Variable
Varianza
Desviación estándar (típica)
Decil
Quartil
Desviación media
Asimetría
Curtósis
46
EJERCICIOS PRÁCTICOS
Problema 1
Para los datos presentados, los cuales están debidamente organizados en Tablas y gráficos, y para
los cuales se han calculado las principales medidas de tendencia central, determine, utilizando la
tabla con intervalos de tamaño 5:
Calcule los estadísticos de variabilidad anteriormente señalados, para todas las tablas de práctica
que ha desarrollado utilizando los datos presentados.
47
CAPÍTULO 7
MODELOS POBLACIONALES PROBABILÍSTICO
A lo largo de los capítulos anteriores, se ha hecho énfasis en la relación existente entre las medidas
de tendencia central y las de variabilidad, especialmente entre la media aritmética y la desviación
estándar. Es incuestionable que una medida pierde mucha significatividad si no va acompañada de
la otra, dado que ambas conjugan las dos características más importantes que se pueden observar en
una distribución de puntajes.
La media y la desviación estándar son las dos medidas descriptivas más poderosas y más
importantes en los análisis estadísticos aplicados en la investigación del comportamiento. Bajo
ciertos supuestos teóricos, las muestras analizadas estadísticamente se aproximan a un modelo
poblacional teórico denominado curva normal; esto es posible a partir de la información
proporcionada por la media y la desviación estándar.
Para comprender mejor lo anteriormente señalado, es necesario tener claro el significado del
concepto modelo poblacional o probabilístico. Un modelo poblacional (o probabilístico) es una
expresión matemática deducida de un conjunto de supuestos con el propósito de:
En los casos en que la(s) variable(s) de estudio se considere discreta, o sea, que está
representada por categorías, las cuales reflejan la cantidad de sujetos, objetos o fenómenos que
comparten dicha categoría, hay un conjunto de modelos poblacionales probabilísticos que
permitirán llevar adelante estudios e investigaciones con dichas variables, independientemente
del área científica en la que se desarrolla el estudio. Lo importante es que la variable, además de
ser discreta y no poseer valores fraccionales, satisfaga las restricciones que el modelo
probabilístico exige. Algunos ejemplos de estos modelos serían: Bernoulli, Binomial,
Multinomial, Hipergeométrico, Poisson, y otros. Para el caso de este libro, analizaremos el
modelo Binomial, en vista de que el mismo se aplica a diversas experiencias, situaciones e
investigaciones propias de los estudios del comportamiento, en especial en el área de la
psicometría y construcción de pruebas.
48
En los casos en que la(s) variable(s) de estudio se considere continua, o sea, que puede asumir
valores fraccionales dentro de intervalos y que por lo tanto indica la cantidad que cada sujeto
posee del atributo, los resultados serán aproximados a modelos de probabilidad continuos, tales
como la Distribución Normal para muestras grandes (>) de 30 sujetos, la “t” de student y la “F”
de Fisher para muestras ≤ de 30sujetos.
VARIABLES DISCRETAS
La Distribución Binomial
La Distribución Binomial es útil en aquellos casos en los cuales la variable de estudio es discreta en
el sentido de que puede asumir únicamente dos posibles valores y se satisfacen las siguientes
restricciones:
1. El experimento o investigación está compuesto por n casos, para cada uno de los cuales hay n
cantidad de pruebas o actos, con dos posibles alternativas cada una.
2. Cada una de las pruebas se debe desarrollar en las mismas condiciones
3. Los resultados obtenidos en cada prueba se clasifican en una de dos posibles categorías que son
mutuamente excluyentes denominadas éxitos o fracasos.
4. La probabilidad de éxito se identifica por “p” y la de fracaso por “q”, las cuales son
mutuamente excluyentes.
5. En cada acto, la probabilidad de éxito no varía, y por lo tanto, la probabilidad de “q” sería igual
a1–p
6. El objetivo del experimento es determinar para cada acto o prueba, si el evento venturoso o
esperado, se presentó o no.
Cuando se desarrollan investigaciones de esta índole, las mismas se consideran de carácter binomial
y tienen n + 1 resultados posibles. El 1 representa la posibilidad de que el evento esperado no se
dé. Veamos algunas situaciones relacionadas con este tipo de estudio.
Se lanza una moneda 5 veces. El evento de interés es la aparición de caras y por lo tanto la
misma podría aparecer: 1, 2, 3, 4 y 5 veces, pero también puede suceder que no aparezca
ninguna vez. Por lo tanto, cara tiene 5 + 1 formas diferentes de aparecer (n + 1), lo cual incluye
que no aparezca. Su representación correcta sería: 0, 1, 2, 3, 4, 5.
El modelo binomial es útil en casos en los cuales estamos interesados en determinar la probabilidad
de ocurrencia de un número X de éxitos, cuando se han desarrollado n pruebas o actos, y la
probabilidad p de éxitos se ha mantenido constante a lo largo de las n pruebas. Por ejemplo:
¿Cuál es la probabilidad de obtener exactamente tres caras al lanzar una moneda 5 veces?
49
Para responder a estas preguntas, se debe aplicar la fórmula de la función probabilística binomial, la
cual detallamos a continuación:
( ) ( )
Ejemplo 1
¿Cuál es la probabilidad de obtener exactamente tres caras al lanzar una moneda 5 veces?
Ejemplo 2
VARIABLES CONTÍNUAS
Puntuaciones estándar
TABLA 7-1:
Desviaciones con respecto a la media
(d)
Dato Límite real Media
Desviación
75 74.5 94.64 -20.14
90 89.5 94.64 -5.14
99 99.5 94.64 +4.86
112 112.5 94.64 +17.86
Los ejemplos anteriores demuestran que los puntajes de las distribuciones se desvían por encima y
por debajo de su media aritmética; si recordamos una propiedad de la media sabemos que ∑ 0.
Otro aspecto a destacar en el cuadro anterior es que para calcular la desviación (d), se utilizan los
límites reales de cada dato, atendiendo a la posición que ocupe con relación a la media: si es menor
que la media, la desviación se haría desde el límite inferior real del dato (75 y 90); si es mayor que
la media, se utilizaría el límite superior real del dato (99 y 112). Estos ejemplos permiten aclarar el
concepto de desviación con respecto a la media, desde el punto de vista de que las desviaciones
alrededor de la media pueden ser negativas (-) para los casos de X menores que la media, y
positivas (+) para los casos de X mayores que la media.
Para la muestra de datos de la Tabla 5-1, la desviación estándar (s) fue de 12.97, lo cual representa
el promedio de las desviaciones alrededor de la media. Si cada desviación de los puntajes
observados en la Tabla 7-1, fuera dividida entre la desviación estándar (12.97), se obtendrían las
desviaciones de los puntajes expresados en unidades de desviación estándar, tal y como se presenta
en la siguiente Tabla.
TABLA 7-2:
Desviación estandarizada de los puntajes originales a partir de la relación d/s
d
x Desviación
(Desviación ⁄
(Puntajes) estandarizada
original)
75 -20.14 0 ⁄ -1.55
90 -5.14 ⁄ -0.40
99 +4.86 ⁄ +0.37
112 +17.86 ⁄ +1.38
Si observamos la Tabla anterior, las “d” han sido transformadas a unidades de desviación estándar.
Esta nueva situación se interpreta de la siguiente manera:
Como se puede observar, las “d” con la media aritmética son relativas en función de la desviación
estándar; la interpretación ahora es la siguiente: cuántas unidades de desviación estándar se
desvía cada puntaje de su media aritmética.
Una puntuación estándar, identificada a partir de este momento por “z”, se refiere a la
transformación de la diferencia de un puntaje con respecto a su media aritmética en unidades de
desviación estándar. La regla (fórmula) para calcular esta medida es la siguiente:
| | | | | | |
-3s -2s -1s 𝑥 1s 2s 3s
-3z -2z -1z 0 1z 2z 3z
FIGURA 7—1
En una distribución de puntajes, los mismos estarán definidos entre -3z y +3z.
Esto significa que el puntaje menor de la distribución estará muy cerca de -3z pero nunca más
allá de este valor
De igual manera, el puntaje mayor de la distribución estará muy cerca de +3z, pero nunca será
mayor a éste.
La media de las puntuaciones z será igual a cero y la desviación estándar será igual a uno.
La Distribución Normal
La Distribución Normal es un modelo poblacional, teórico, que permite analizar las observaciones
correspondientes a ciertas muestras en términos de probabilidades. La Distribución normal se
identifica por una curva perfecta en forma de campana, que satisface las siguientes propiedades:
6. Está definida totalmente a partir de la media, por 3 desviaciones a la derecha (por encima de )
y 3 desviaciones a la izquierda (por debajo de ), lo que significa que la totalidad de los casos
de la muestra están definidos dentro de este intervalo. (Ver la Figura 7—2)
34.13% 34.13%
13.59% 13.59%
2.15% 2.15%
-3 -2 -1 0 1 2 3
FIGURA 7—2
Entre cada desviación estándar se describe la probabilidad de los datos bajo la curva, tal y como se
observa en la Figura 7—2. Esta probabilidad también se expresa en % para facilitar su
interpretación. A continuación se detalla la distribución de probabilidades bajo la curva:
Entre la media y una desviación estándar positiva se encuentra el 0.3413 de probabilidad que
corresponde al 34.13%. Por identidad, se dan los mismos valores a una desviación negativa.
Entre dos desviaciones y tres desviaciones positivas se observa el 0.0215; de igual manera
sucede en el lado izquierdo. Esto corresponde al 2.15% de la probabilidad total.
La probabilidad total bajo la curva, o sea, entre -3z y + 3z es igual a 0.9974, que corresponde a
un 99.74% de la totalidad del área bajo la curva. La Curva Normal no tiene un 100% de
probabilidades bajo ella, por su condición asintótica; la curva normal va al infinito tanto en la
cola derecha como en la izquierda.
53
Así como las probabilidades bajo la curva son infinitas, de igual manera lo son las puntuaciones
z. Sin embargo, cuando se aproximan muestras a la curva normal, las probabilidades se
determinan entre +3z y – 3z.
Para cada valor z hay una probabilidad asignada, la cual se determina a través de una Tabla
especialmente confeccionada para estos fines (Ver Apéndice)
Aplicación
Una de las aplicaciones al trabajar con la distribución normal mediante las puntuaciones z es el
cálculo de la probabilidad de ocurrencia de una determinada puntuación.
P de Z
P de Z
0.5000
P de Z
0.5000
P de Z
P de Z2
P de Z1
P de Z1 P de Z2
Ej emplos
55
1. Se aplicó una prueba de aptitudes generales a una muestra de 250 estudiantes de primer ingreso
a la universidad. La media fue de 65 y la desviación estándar de 8.25. Determine la “p” de
obtener una puntuación mayor de 68 puntos
Se calcula el valor “z” correspondiente al puntaje 68. En vista de que ese
puntaje es mayor que la media aritmética, se utiliza el límite superior real del
mismo.
2. Con los mismos datos del problema, determine la probabilidad de obtener una puntuación
menor o igual a 71 puntos.
Se calcula el valor “z” correspondiente al puntaje 71; por ser el mismo mayor
que la media aritmética, se utiliza el límite superior real.
3. Con los mismos datos, indique la probabilidad de obtener una puntuación entre 60 y 71.
Por el problema anterior ya se conoce la probabilidad del puntaje 71, que fue
igual a 0.2852
Se determina el valor Z del puntaje 60, que por ser inferior a la media
aritmética, requerirá que se utilice el límite inferior real de dicho puntaje.
Como se pudo observar, este valor es negativo por ser 60 inferior a la media de
65.
Se determina el área o probabilidad de Z = -0.67 utilizando la Tabla; el
resultado fue de 0.2486
Finalmente se suman las dos áreas y se determina la probabilidad de obtener un
puntaje ente 60 y 71, tal y como se presenta a continuación:
0 0 0 , que representa la respuesta correcta.
56
Hay ocasiones en que el problema se debe desarrollar íntegramente en una mitad de la curva. Por
ejemplo, si se busca un área en la mitad superior de la media o en la mitad inferior de la media
aritmética.
1. Ubique el puntaje más alejado de la media aritmética, el cual sería, en este caso 53, y
determine su valor Z, utilizando su límite real inferior.
0 0
4. Determine el área o probabilidad correspondiente a esta Z, que es 0.1179
5. Teniendo el área del límite inferior del puntaje más lejano (53) y el área del límite superior del
puntaje más cercano (62), se restan ambas probabilidades, tal y como se presenta a
continuación: 0 0 0 , que es la respuesta correcta al problema.
N debe ser grande. Para efectos prácticos estadísticos, np debe ser > 5.
p y q no deben estar próximos a cero; mientras más se aproximen a su límite, 0.50, mejor.
( 0)(0 0) 0
0
√ √( 0)(0 0)(0 0)
A partir del cálculo de Z, el resto del procedimiento se hace tal y como se estudió en el capítulo de
la Distribución Normal.
58
CONCEPTOS IMPORTANTES
Curva Normal
Área o probabilidad
Desviación
Distribución binomial
Modelo poblacional
Límites reales
Puntuación estándar
Puntuación Z
59
EJERCICIOS PRÁCTICOS
Problema 1
Para los datos presentados, usted ya ha desarrollado en los capítulos anteriores, todo un modelo de
análisis descriptivo que incluye: tablas de frecuencias, gráficos, medidas de tendencia central y de
variabilidad. En estas dos últimas, ha calculado la media aritmética y la desviación estándar. Como
ya es de su conocimiento, estos dos estadísticos se consideran los estimadores requeridos para
ajustar los datos a la distribución normal o curva normal. Desarrolle los problemas que le
presentamos, a continuación:
Binomial
12. En un “test” psicológico de relaciones espaciales, se tiene una probabilidad de 0.40 de acertar
en cada una de las pruebas. Si un sujeto realiza 5 pruebas, ¿cuál es la probabilidad de obtener:
un éxito?
tres éxitos?
hasta cuatro éxitos?
Ningún éxito?
13. El 30% de los hogares de cierta ciudad, tiene por lo menos una persona desempleada. Un
investigador visita 6 hogares. ¿Cuál es la probabilidad de que encuentre:
Un hogar en estas condiciones?
Entre 0 y 3 hogares en estas condiciones?
Todos los hogares en estas condiciones?
No menos de 2 hogares en estas condiciones?
14. La probabilidad de que un niño tenga Déficit de Atención (DA) en una escuela elemental es de
0.20. Se seleccionan 7 niños de dicha escuela. ¿Cuál es la probabilidad de que:
por lo menos 4 niños sufran de DA?
2 niños sufran de DA?
A lo máximo 3 niños sufran de DA?
Entre uno y 4 niños sufran de DA?
15. Una prueba de aptitudes cuyas preguntas son de 4 alternativas cada una, consta de 50 reactivos.
¿Cuál es la probabilidad de obtener:
entre 20 y 38 respuestas correctas
entre 30 y 42 correctas
más de 26 correctas
menos de 20 correctas
16. En un centro de rehabilitación de menores el 40% ingresó por consumo de drogas. Se
selecciona una muestra de 60 menores. ¿Cuál es la probabilidad de obtener:
entre 20 y 29 menores consumidores?
menos de 30 menores consumidores?
15 o más menores consumidores?
Entre 12 y 22 menores consumidores?
61
CAPÍTULO 8
CORRELACIÓN Y REGRESIÓN
En los capítulos anteriores nos hemos dedicado a analizar los resultados correspondientes a la
medición de una sola variable. Pero en muchas ocasiones, los psicólogos se interesan por las
relaciones que existen entre dos o más variables, asumiendo que las mismas no funcionan
independientemente, sino que una afecta o se relaciona con la otra.
Por lo general, las teorías psicológicas que tratan de explicar la conducta del hombre, analizan la
misma a través de modelos teóricos multivariantes, que exploran el comportamiento desde dos
perspectivas: la teórica y la operacional; en ambos casos, el enfoque principal se centra en
considerar el comportamiento como el efecto combinado de dos o más variables. El análisis
operacional de las relaciones entre variables se lleva a cabo utilizando una herramienta de las
estadísticas denominada correlación. El análisis de las correlaciones permite explicar, en términos
estadísticos, el tipo de relación entre las variables y la magnitud (cantidad) de la relación entre las
mismas.
Las correlaciones favorecen la interpretación del comportamiento desde diferentes puntos de vista:
La predicción: no es otra cosa que la posibilidad que tienen los especialistas de la conducta de
pronosticar, dentro de ciertos márgenes de error, el comportamiento de una o más variables, a
través del análisis del comportamiento de otras variables diferentes. Suponga que yo considero
que dos variables comportamentales X y Y se relacionan de alguna manera. Si logro comprobar
dicha relación, desde una perspectiva estadística, puedo estar en capacidad de pronosticar que
sucederá en el futuro con una de ellas, a partir del conocimiento del comportamiento de la otra.
Por ejemplo:
1. Relación lineal, que se refiere al caso en que dicha relación puede ser representada con mayor
precisión, a través de una línea recta.
2. Relación no lineal, que se refiere al caso en que la misma no se aproxima a una línea recta.
Para el desarrollo de nuestro tema nos referiremos, tanto en teoría como en la práctica, al modelo de
relación lineal.
TABLA 8-1
Puntajes obtenidos en habilidad general y en habilidad verbal por 10 estudiantes preuniversitarios
H. General H. Verbal
Sujetos
X Y
1 10 10
2 12 15
3 20 17
4 25 25
5 27 32
6 35 37
7 43 40
8 40 38
9 32 30
10 47 49
Los puntajes resumidos en la Tabla 8-1 indican, de forma descriptiva, los resultados que obtuvieron
cada uno de los diez sujetos de la investigación, en la medición de las variables contempladas en el
estudio. Para determinar la correlación se sugiere que, como primer paso, se determine el
63
Diagrama de Dispersión correspondiente a dichos datos, el cual nos brindará información gráfica
de la relación entre ambas variables.
GRÁFICO 8-1
50
Y (Habilidad verbal)
40
30
20
10
0
0 5 10 15 20 25 30 35 40 45 50
X (Habilidad general)
1. Si la nube de puntos tiende a una línea recta, estamos ante una relación lineal.
2. Si la nube de puntos tiende a algún tipo de curva, la relación es no lineal.
Para nuestro ejemplo, la nube de puntos tiende a una línea recta, lo cual es indicativo que estamos
ante una relación lineal.
La nube de puntos además de aproximar los datos a una línea recta, puede presentar una de dos
direcciones dentro del diagrama:
64
1. Una dirección positiva, que es aquella en que la nube de puntos va de izquierda a derecha del
diagrama de dispersión.
X
2. Una dirección negativa, cuando la nube de puntos va de derecha a izquierda del diagrama de
dispersión.
Además, el Diagrama permite pronosticar que la relación será positiva (+) o negativa (-)
atendiendo a la dirección de la nube de puntos.
Otro aspecto importante que se puede deducir de la inspección del Diagrama de Dispersión es la
estimación de la magnitud (cantidad) de la relación entre ambas variables, lo cual se podrá
determinar observando si los puntos tienen poca variabilidad o mucha variabilidad; en otras
palabras, si los puntos al trazarse una línea recta tienden a caer sobre la misma, o si los puntos
tienden a caer fuera de la línea, ya sea por encima o por debajo de ella. La siguiente figura presenta
las principales alternativas.
65
FIGURA 8—1
En la Figura 8—1 se presenta con mucha claridad la información que se puede extraer de un
Diagrama de Dispersión.
Los tres primeros diagramas horizontales nos indican que corresponden a relaciones positivas,
por la dirección de la nube de puntos. Además se observa que la magnitud de las correlaciones
(información que está sobre recta de regresión) varía en cada uno de los Diagramas. En el
primero de observa que r = 1.00; en el segundo r = 0.91; en el tercero r = 0.56. Si observamos
con detalle cada diagrama resalta el hecho de que en cada uno de ellos, los puntos que
constituyen la nube se dispersan de manera diferente en cada ejemplo: en el primero, todos los
puntos caen sobre la línea recta; en el segundo, los puntos no caen en su totalidad sobre la línea
y se dispersan por arriba y por debajo de la misma, pero no están muy alejados de ella; en el
tercero, los puntos no caen sobre la línea y se dispersan de la misma en un mayor grado que en
los dos ejemplos anteriores. De esto podemos extraer como conclusión de que a menor
dispersión, mayor magnitud de la correlación. De los tres ejemplos se desprende que, la mayor
relación corresponde al primero (r=1.00), en segundo lugar está el ejemplo número dos (r =
0.91) y finalmente, el ejemplo número tres (r=0.56). Se ha introducido un elemento nuevo a
nuestra discusión: r, que se lee coeficiente de correlación y es el indicador matemático de la
cantidad de relación entre las variables. Más adelante, vamos a discutir ampliamente este
concepto.
66
Los tres diagramas que están en la segunda línea de la Figura No.1 indican que, por la dirección
de la nube de puntos, o no hay relación (primer diagrama) o la relación es negativa (segundo y
tercer diagrama), lo cual se observa en los valores de r para cada uno de ellos: para el primero
r = 0 y los puntajes no se aproximan a una línea recta; en el segundo caso, la nube si se
aproxima a una línea recta pero a la inversa, además de que los mismos no caen exactamente
sobre la recta (r = - 0.66); y en el tercer caso, la nube se ajusta totalmente a una recta y el valor
de r = - 1.00.
El Diagrama de Dispersión es una herramienta que permite hacer una estimación cualitativa de
la relación entre dos variables. Esta relación se debe establecer cuantitativamente a través del
denominado coeficiente de correlación, el cual se representa por r. Los valores de r
presentados para cada uno de los seis ejemplos anteriores, no se calculan a través del diagrama
de dispersión; han sido presentados en los mismos con la intención de hacer más clara la
explicación de la importancia de dicha figura en el establecimiento de la relación entre dos
variables. El cálculo de r se presentará a continuación.
Por otro lado, cuando el valor de r es igual a -1, estamos ante una correlación perfecta negativa y
corresponde al valor de r más alto con este signo. Esto nos indica que el sujeto más alto en X es el
más bajo en Y, el segundo sujeto más alto en X es, a su vez, el segundo sujeto más bajo en Y, y así
sucesivamente. Si esta relación inversamente proporcional no se cumple sistemáticamente, el valor
de r va a disminuir y se aproximará a cero en la medida que las diferencias de posición en ambas
variables sean mayores.
/ / /
La correlación se centra en dos aspectos de la relación: la dirección que puede ser positiva o
negativa, y el grado, fuerza o magnitud, que se refiere al valor cuantitativo de la relación. Cuando la
relación es perfecta (+1 ó -1), la predicción de una variable hacia la otra es exacta; cuando la
correlación es imperfecta (< 1 ó > -1), la predicción es aproximada y se debe establecer el margen
de error, siendo ésta la situación más común cuando se trabaja con muestras. Cuando no hay
correlación (r = 0), no se puede hacer predicción.
El coeficiente de correlación, que a partir de este momento representaremos por rxy se denomina
Coeficiente de Correlación de Pearson, y el mismo es aplicable al cálculo de relaciones lineales.
Para determinar el rxy, es necesario que ambas variables estén medidas en la misma escala y se
pueden utilizar dos métodos para calcular el mismo:
1. El método normalizado, en el cual se aproximan los datos a la curva normal, y cuya fórmula
es:
∑( )
(∑ )(∑ )
∑
(∑ ) (∑ )
√[∑ ] [∑ ]
A continuación se presenta el cálculo de rxy para los datos de la Tabla 8-1, utilizando ambos
métodos: el normalizado y el de datos originales. Con ambos métodos los resultados deben ser
iguales aunque, en la situación de laboratorios o talleres, puede suceder que se observen diferencias
de +/- 0.01; en estos casos, por la situación del redondeo, las diferencias pueden ser aceptadas.
TABLA 8-2:
Cálculo de rxy para las variables habilidad general y habilidad verbal (n = 10)
H. General H. Verbal
Sujetos Z de X Z de Y (ZxZy)
X Y
1 10 10 -1.51 -1.55 2,34
2 12 15 -1.35 -1.15 1,55
3 20 17 -0.72 -0.99 0.71
4 25 25 -0.32 -0.35 0.11
5 27 32 -0.17 0.22 -0.04
6 35 37 0.47 0.62 0.29
7 43 40 1.10 0.86 0.95
8 40 38 0.86 0.70 0.60
9 32 30 0.23 0.06 0.01
10 47 49 1.42 1.58 2.24
∑
68
La Tabla 8-2 presenta el resumen del procedimiento para calcular el coeficiente de correlación r xy
para dos variables, utilizando el procedimiento de los datos normalizados z. A continuación
presentamos los pasos requeridos. En primera instancia, organice los datos en una matriz o Tabla
que contenga las siguientes columnas: Sujetos, X, Y, Zx, Zy, ZxZy
∑( )
0 0
0
El resultado obtenido de 0.97 indica, que entre las variables Habilidad General y Habilidad
Numérica se observa una relación positiva y alta. Esto implica que, en general, los sujetos con
puntuaciones altas en X, también obtuvieron puntuaciones alta en la variable Y; los que obtuvieron
puntuaciones medias en X, también las obtuvieron en Y, y de igual manera sucedió con los de
puntajes bajos.
El método de las puntuaciones originales es una forma alternativa para calcular el coeficiente de
correlación lineal de Pearson. Tal y como su nombre lo indica, se utilizan las puntuaciones
originales para calcular la rxy. A continuación se desarrolla el procedimiento, utilizando los datos de
la Tabla anterior
TABLA 8-3:
Cálculo de rxy para las variables habilidad general y habilidad verbal (n = 10)
H. General H. Verbal
Sujetos X2 Y2 XY
X Y
1 10 10 100 100 100
2 12 15 144 225 180
3 20 17 400 289 340
4 25 25 625 625 625
5 27 32 729 1024 864
6 35 37 1225 1369 1295
7 43 40 1849 1600 1720
8 40 38 1600 1444 1520
9 32 30 1024 900 960
10 47 49 2209 2401 2303
∑ 291 293 9905 9977 9907
69
(∑ )(∑ )
∑
(∑ ) (∑ )
√[∑ ] [∑ ]
( )( )
0 0
√[ 0 0 ][ 0 ]
0 0
√[ 0 00 0][ 0]
0 0 0
0
√( 0)( )
Los pasos a seguir para calcular rxy utilizando el método de las puntuaciones originales son los
siguientes:
1. Cree una tabla en la que deben aparecer las columnas de X y Y. Sume las puntuaciones de cada
columna.
2. Incorpore a la Tabla las columnas de X2 y Y2; sume las puntuaciones de dichas columnas.
3. Incluya en la Tabla la columna de XY, o sea, que para cada sujeto se multiplica el puntaje X por
el puntaje Y; sume los puntajes de la misma.
4. Sustituya en la fórmula los datos obtenidos en la Tabla y obtendrá el coeficiente de correlación
para datos originales.
Los métodos analizados anteriormente están dirigidos a variables que han sido medidas por lo
menos en una escala de intervalos. Para estos casos, el Coeficiente de Correlación de Pearson, ya
sea en su forma normal (Z) o en la de puntuaciones originales, es el adecuado para establecer la
magnitud y el sentido de la relación entre las dos variables.
Sin embargo, hay ocasiones en las cuales las variables no satisfacen la condición de medición
intervalar, sino que ambas o una de ellas está medida en una escala ordinal. En estos casos, el
Coeficiente de Correlación de Rangos de Spearman (rho) es el método más eficiente para
determinar la relación entre estas variables; es una aplicación del coeficiente lineal de Pearson para
datos medidos en escala ordinal. Es importante destacar que los datos originales no necesariamente
deben estar medidos en escala ordinal, pero si el investigador considera que los daos no satisfacen
los requisitos exigidos para la aplicación del método de Pearson, puede transformarlos a una escala
ordinal y aplicar el coeficiente Rho. La fórmula para el cálculo de rho es la siguiente:
TABLA 8-4:
Cálculo del coeficiente de correlación rho de Spearman para una muestra de 5 sujetos
D
D
Sujetos X Y R(X) R(y) (Rx-
(Rx-Ry)
Ry)2
1 5 6 1 2 -1 1
2 6 9 2 5 -3 9
3 8 4 3 1 2 4
4 9 8 4 4 0 0
5 11 7 5 3 2 4
18
( )
0 0
El coeficiente rho del problema anterior es de 0.10, el cual es positivo y bajo, en vista de que se
aproxima a cero. Como se puede observar, la interpretación del Coeficiente rho es exactamente
igual a la de Pearson. Los pasos para calcular el Coeficiente rho son los siguientes:
1. Organice los datos X y Y en una matriz, tal y como se presenta en la Tabla 8-4:
2. Se crea la columna R(X), rangos de X, para la cual se asigna a cada puntaje X un rango de
menor a mayor. Para nuestro ejemplo X = 5 es el de menor valor, se le asigna el rango 1, a
continuación sigue el puntaje 6 al que corresponde el rango 2, y así sucesivamente.
3. Se crea la columna R(Y), rangos de Y, para la cual se asigna a cada puntaje Y un rango de
menor a mayor. Para nuestro ejemplo, Y = 4 es el de menor valor y se le asigna el rango 1,
luego sigue el puntaje 6 al que corresponde el rango 2, y así sucesivamente.
4. Se crea la columna D, que corresponde a la diferencia de cada par de rangos X y Y, tomando en
consideración los signos.
5. Se desarrolla la columna D2 que corresponde a elevar al cuadrado cada diferencia entre los
pares de rangos. Estas diferencias al cuadrado se suman.
6. Se desarrolla la fórmula correspondiente a Rho y se obtiene el coeficiente de correlación.
Hay ocasionas en que en una variable se repite el mismo valor varias veces. A esta situación se le
denomina ligas, y las mismas son resueltas promediando los rangos que se le hubieran adjudicado
originalmente. A continuación se presenta un ejemplo.
71
TABLA 8-5:
Cálculo del coeficiente de correlación de spearman para una muestra de 10 sujetos (método de ligas)
H. General H. Verbal
Sujetos R(X) R(Y) D D2
X Y
1 10 10 1 1 0 0
2 12 15 2.5 2 0.5 0.25
3 12 17 2.5 3 -0.5 0.25
4 25 25 4 4.5 -0.5 0.25
5 27 25 5 4.5 0.5 0.25
6 35 37 7 7 0.0 0.00
7 40 40 8.5 9 -0.5 0.25
8 40 38 8.5 8 0.5 0.25
9 32 30 6 6 0.0 0.00
10 47 49 10 10 0.0 0.00
∑
( )
00
0 0 0
Como puede observarse, el coeficiente de correlación Rho es muy alto (0.99), casi perfecto y
positivo. En este ejemplo se observa cómo se tratan las ligas. En la variable X, el puntaje menor es
10 y se le asignó el rango 1, a continuación los siguientes puntajes son 12 y 12, como son iguales, al
primero se le asigna el rango 2 y al segundo el rango 3, se promedia la suma de estos dos rangos
que es 2.5, y se les asigna a los dos valores 12, el rango 2.5. Esto se repite en cada ocasión en que
aparezcan ligas. Las ligas pueden corresponder a 2, 3 ó más sujetos a quienes se les asigna el mismo
puntaje; en cada caso, se promedian los rangos que originalmente se les asignaría.
CORRELACIÓN MÚLTIPLE
Hasta este momento, los análisis de correlaciones discutidos en esta obra se han referido a la
relación lineal entre dos variables. Sin embargo, se dan circunstancias en las cuales estamos
interesados en la relación que hay entre tres o más variables, o específicamente, en la relación de
una variable con una combinación lineal de otras variables. A este análisis de correlaciones se le
denomina correlación múltiple, la cual vamos a presentar en su forma más simple: la relación entre
una variable y la combinación lineal de otras dos variables.
Suponga que una muestra de estudiantes ha sido evaluada en tres factores psicoeducativos que se
consideran relacionados:
Estamos interesados en analizar la relación que hay entre el rendimiento académico (F1) y los
efectos combinados de la aptitud general (F2) y la aptitud verbal (F3): F1 VS F2+F3. La regla
general (fórmula) para el cálculo de dicha relación es la siguiente:
72
( )
1. Calcule las relaciones simples entre las combinaciones de pares de variables r 12, r13 y r23. Para
efecto de nuestro ejemplo, dichas correlaciones fueron las siguientes:
r12 = 0.52
r13 = 0.45
r23 = 0.60
2. Sustituya estos valores en la fórmula de correlación múltiple, tal y como se presenta a
continuación:
Sin embargo, hay ocasiones en que los coeficiente de correlación que son bajos se consideran lo
suficientemente saludables como para utilizarlos de manera efectiva. Por ejemplo, en la
construcción de pruebas es muy frecuente que los coeficientes de correlación no alcanzan valores
altos, y observamos en estos casos coeficientes efectivos desde 0.35 hasta 0.60, en el mejor de los
casos.
A pesar de los casos especiales citados anteriormente, algunos autores sugieren que para facilitar la
interpretación de los coeficientes de correlación, se tome en consideración la siguiente escala:
Esto se puede aplicar tanto en el caso de las correlaciones positivas, > 0, como en las negativas, - 0.
Sin embargo no olvide que el buen juicio del psicólogo investigador, es la principal herramienta
73
para el análisis de los coeficientes de correlación, porque también se dan casos de coeficientes de
correlación relativamente altos, pero ineficaces.
A través del estudio de la correlaciones se logró analizar la asociación que existe entre dos o más
variables. Se logró establecer que la magnitud de estas relaciones se podían determinar
cuantitativamente a través del coeficiente de correlación, además de establecerse el sentido de las
mismas: positivo, negativo o ausencia de correlación.
Pero, la relación de variables nos permite obtener información que va mas allá de lo anteriormente
señalado. También permite alcanzar uno de los objetivos más apreciados en la investigación del
comportamiento: la predicción.
Para comprender en qué forma el análisis de la asociación de variables nos permite hacer
predicciones, es necesario recordar algunos aspectos básicos de la teoría de la correlación.
Haremos énfasis en los diagramas de dispersión cuya nube de puntos está aproximada por una línea
recta, dado que éste es el tipo de dispersión más común al estudiarse las relaciones de variables
psicológicas. Por lo tanto, vamos a considerar a la línea recta como la que mejor aproxima los datos
de la nube de puntos. A esta línea recta se le denomina Recta de Mínimos Cuadrados, en vista de
que tiene la propiedad de que la suma de las diferencias cuadráticas de los puntos del diagrama con
relación a su valor teórico sobre la curva, es mínimo. O sea: ∑D2 es mínimo, tal y como se presenta
en el siguiente gráfico:
74
GRÁFICO 8-2
La figura incluye otra línea recta, de color oscuro que también cruza el diagrama pero en otro
sentido. En este caso, que no corresponde a la recta de mínimos cuadrados, la ∑D2 no sería la
mínima, como si lo es para el otro caso (línea clara).
( )
La cual corresponde a la ecuación de la línea recta. Esta ecuación se utiliza para pronosticar Y a
partir de un valor conocido de X. En dicha ecuación se identifican dos constantes:
(∑ )(∑ ) (∑ )(∑ )
∑ (∑ )
(∑ ) (∑ )(∑ )
∑ (∑ )
En los casos en que se requiera estimar X a partir de Y, las ecuaciones serían las siguientes:
75
( )
Para la cual:
(∑ )(∑ ) (∑ )(∑ )
∑ (∑ )
(∑ ) (∑ )(∑ )
∑ (∑ )
La recta de regresión representa el centro de gravedad de la nube de puntos, siendo evidente que
alrededor de la misma se dispersan los puntos del diagrama. En tales circunstancias, se puede
calcular una medida de la dispersión de los valores a través de las siguientes expresiones:
∑( )
|
√
∑( )
|
√
A partir del error típico de la estimación, se puede estimar (pronosticar), para cualquiera de los
valores X, su correspondiente valor esperado Y, al igual que para cualquier valor de Y, se puede
estimar su correspondiente valor esperado X. A continuación presentamos un ejemplo de
estimación estadística.
TABLA 8-6
H. General H. Verbal
Sujetos X2 Y2 XY
X Y
1 10 10 100 100 100
2 12 15 144 225 180
3 20 17 400 289 340
4 25 25 625 625 625
5 27 32 729 1024 864
6 35 37 1225 1369 1295
7 43 40 1849 1600 1720
8 40 38 1600 1444 1520
9 32 30 1024 900 960
10 47 49 2209 2401 2303
∑ 291 293 9905 9977 9907
76
( )( 0 ) ( )( 0 )
( 0)( 0 ) ( )
0( 0 ) ( )( ) 0
0
0( 0 ) ( )
Una vez determinadas las constantes de regresión, se desarrolla la ecuación de mínimos cuadrados,
tal y como se presenta a continuación:
TABLA 8-7
H. General H. Verbal
Sujetos Y’ (Y-Y’)2
X Y
1 10 10 10.94 0.88
2 12 15 12.86 4.58
3 20 17 20.54 12.53
4 25 25 25.34 0.12
5 27 32 27.26 22.47
6 35 37 34.94 4.24
7 43 40 42.62 6.86
8 40 38 39.74 3.03
9 32 30 32.06 4.24
10 47 49 46.46 6.45
65.40
Como se puede observar, para cada valor de X se estimó un posible valor de Y, el cual corresponde
al punto en que cae dicha estimación sobre la recta de regresión; en el fondo, la recta de regresión es
el conjunto de todos los valores estimados para cada uno de los valores de X. Además, la Y
estimada es el promedio de todos los posibles valores esperados para cada una de las X. Esto
significa que para cada valor de X, la Y estimada sería el pronóstico promedio, aunque algunos
valores de Y estarán por encima y otros por debajo de dicha estimación.
77
Tal y como señalamos anteriormente, de todas las estimaciones de Y se puede determinar una
desviación estándar de las mismas, la que se denomina error típico de la estimación. Los datos
requeridos para este cálculo están descritos en la última columna de la Tabla anterior (Y – Y’)2 y
con los mismos resolvemos la ecuación del error típico:
0
| √
0
Esto significa que, en promedio, las Y estimadas varían en 2.56 unidades, información que favorece
el análisis de la estimación a la luz de la Distribución Normal, siempre y cuando los datos se ajusten
a dicha distribución. Este mismo procedimiento se puede desarrollar para estimar X a partir de Y,
siempre y cuando se utilice la ecuación de estimación correspondiente.
CONCEPTOS IMPORTANTES
Relación lineal
Correlación simple
Correlación múltiple
Predicción
Relación causa-efecto
Confiabilidad
Diagrama de dispersión
Nube de Puntos
Ecuación de mínimos cuadrados
Regresión lineal simple
Constantes de regresión
Error típico de estimación
Y estimada
X estimada
78
EJERCICIOS PRÁCTICOS
Problema 1
E 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
X 52 49 26 28 63 44 70 32 49 51 64 28 49 43 30 65 35 60 49 66
Y 49 49 17 34 52 41 45 32 29 49 53 17 40 41 15 50 28 55 37 50
1. Las medias de X y de Y.
2. Las desviaciones estándar de X y de Y
3. Confeccione el Diagrama de Dispersión correspondiente
4. Calcule el coeficiente de correlación Producto Momento de Pearson (rxy) a partir del:
Método de puntuaciones estandarizadas; analice y discuta el resultado
Método de puntuaciones originales: analice y discuta el resultado
5. Calcule el coeficiente de determinación r2 para ambos casos. Analice y discuta los resultados.
6. Calcule los valores de las constantes a0 y a1 y presente la ecuación de regresión (predicción) de
Y a partir de X.
7. Escoja cinco pares de valores de la tabla de datos originales y construya la recta de regresión
sobre el diagrama de dispersión. Analice y discuta los resultados.
8. Calcule el error estándar de la estimación de Y a partir de X.
9. Desarrolle los pasos 6, 7 y 8, para la estimación de X a partir de Y.
10. Con los datos de la Tabla, determine el Coeficiente de Correlación por Rangos (Rho). Analice y
discuta los mismos; compare los resultados con los obtenidos por el método de Producto
Momento de Pearson.
11. Suponga que está interesado(a) en determinar la correlación entre el rendimiento académico (1)
y las variables aptitud verbal (2) y razonamiento lógico (3). Las intercorrelaciones obtenidas
entre estas tres variables fueron: r12 = 0.64, r13 = 0.50 y r23 = 0.41. Calcule el coeficiente de
correlación múltiple entre el rendimiento académico y las variables aptitud verbal y
razonamiento lógico. Analice y discuta los resultados.
79
CAPÍTULO 9
ESTADÍSTICA INFERENCIAL Y PROBABILIDADES
Ya hemos analizado los principios de la estadística descriptiva, los cuales hacen énfasis en la
organización, presentación y descripción de los datos obtenidos en las investigaciones
comportamentales, de una manera, objetiva, coherente y eficiente. Para tal efecto, se discutieron
conceptos tales como: organización de datos, medidas de tendencia central y variabilidad, la curva
normal y los principios de la correlación y regresión simple.
Probabilidad
Población Muestra
Error
Muestra
Generalización aleatoria
FIGURA 9—1
Como se puede observar en la Figura 9—1, la muestra es un segmento de la población, una parte de
la población que ha sido segregada de la misma con fines de investigación. Al trabajar con
segmentos de la población, es evidente que algunas características de ésta no estarán presentes en la
muestra, porque los tamaños muestrales son muy inferiores a los poblacionales: n < N. Esta
situación trae como consecuencia, que entre la información proveniente de la muestra y la existente
en la población real, se produzcan diferencias a la cuales denominaremos errores de muestreo.
80
(1) la estimación de parámetros, que se refiere a establecer con la mayor precisión posible,
cuáles son los valores correspondientes a los principales indicadores o parámetros que hay en la
población y que están siendo utilizados en las investigaciones muestrales. Como debe recordar,
esto se realiza a partir de la información de la muestra y no de la población, y (2) el desarrollo de
la prueba de hipótesis, en el cual el investigador intenta demostrar si las hipótesis que han
presentado sobre diversos aspectos comportamentales que él espera que se estén manifestando
en la población, se pueden o no demostrar a través del análisis de las muestras.
Otro aspecto relevante que se observa en al diagrama antes mencionado lo son las dos categorías de
muestreo que pueden ser utilizadas en una investigación: el muestreo aleatorio, por un lado, que
permite seleccionar los sujetos de la población a partir de la condición de que todos tengan igual
probabilidad de ser seleccionados al momento de constituirse la muestra. Es evidente que, para
efectos de representar a la población, este tipo de muestreo es el más indicado. Por otro lado, está el
muestreo no aleatorio, en el cual no hay garantías de que todos los sujetos de la población hayan
tenido la misma probabilidad de ser seleccionados al momento de constituir la muestra, y por lo
tanto, sus resultados son dudosos en cuanto a representar a la población.
Se considera que el muestreo aleatorizado es más eficiente para generalizar sus resultados hacia la
población por las siguientes razones:
La explicación teórica sobre la relación matemática entre las observaciones poblacionales y las
muestrales la ofrece la Teoría de la Probabilidad. Sería ostentoso concebir que en este libro se
pueda hacer una presentación efectiva de dicha teoría; tampoco es uno de los objetivos que se tratan
de alcanzar con esta obra. Sin embargo, es necesario plantear algunos principios de la probabilidad,
que permitirán un mayor nivel de comprensión de los aspectos básicos de la inferencia estadística.
En la TP, hay algunos conceptos que deben ser comprendidos con claridad, especialmente por los
que no somos especialistas en las matemáticas, con el fin de que los mismos puedan ser utilizados
81
de la manera más correcta al momento de aplicar la TP. A continuación, detallaremos los más
importantes y los más utilizados en la investigación del comportamiento.
El Experimento Aleatorio
Siempre que se desarrolle una investigación, y que el método (actos o pruebas) para obtener los
resultados se desarrolle en las mismas condiciones, estamos ante un experimento aleatorio. Por
ejemplo, en el juego de la lotería oficial nacional, siempre se repite el mismo acto: las bolas
numeradas están en una urna que se hace girar para que las mismas se revuelvan y así se evite
cualquier picardía. Se detiene la urna, se abre, un niño selecciona una de las bolas, se la pasa a la
autoridad, ésta la abre y dentro de la misma se encuentra un número entre el 0 y el 9. Este acto se
repite tantas veces como sea necesario, sin que se observen cambios de ninguna clase en la
metodología. Por esta razón, la lotería es un experimento aleatorio, en vista de que en cada acto,
cualquier número entre 0 y 9, tiene la misma probabilidad de aparecer.
Veamos ahora, una actividad que no se refiere a un juego de azar, sino a una medición educativa. El
profesor confecciona un examen de 30 preguntas, todas de selección múltiple con cuatro
alternativas, con las mismas instrucciones, con el mismo procedimiento para responder a las
preguntas y para corregirlas. Esta metodología será la misma para todos los estudiantes que reciban
la prueba, al igual que la metodología que se exigió para extraer una bola de la urna de la lotería.
Como la prueba tiene cuatro alternativas, todos los estudiantes tienen la misma probabilidad de
escoger cualquiera de las cuatro alternativas, y si el examen vale 30 puntos, y los puntajes finales
pueden ser entre 0 y 30, todos los estudiantes tendrán la misma probabilidad de obtener cualquiera
de estos puntajes totales al corregirse su examen. Esto significa que la medición educativa se regula
por las mismas reglas que regulan el juego de azar de la lotería; por lo tanto, para la ciencia, la
medición científica también es un experimento aleatorio.
Cada acto que se desarrolla en un experimento aleatorio genera un resultado que se denomina punto
muestral. En el examen que pusimos de ejemplo, si un estudiante gana 6 puntos, esto es un punto
muestral, al igual que lo es los 30 puntos que gana el que obtuvo todas las respuestas correctas. Bajo
esta perspectiva, un experimento aleatorio genera un espacio muestral (S), que no es otra cosa, que
todos los posibles resultados que se pueden obtener al desarrollar el experimento. Veamos a
continuación algunos ejemplos de espacios muestrales:
Dado
1 2 3 4 5 6
Cara C1 C2 C3 C4 C5 C6
Sello S1 S2 S3 S4 S5 S6
Los resultados de un examen como el del ejemplo de los 30 reactivos: S (31 puntos muestrales,
porque se incluye el cero (0)
Éxito: 1 punto
Fracaso: 0 puntos
Resultados exitosos: espacio muestral, desde 0 hasta 30.
El juego de la lotería es un buen ejemplo de lo que son los juegos de azar. Los controles
metodológicos que se aplican en el mismo, han dado suficiente confianza a la
población como para asegurar que en el mismo no hay picardía, aunque muchas
personas digan lo contrario. Este juego se caracteriza porque se cumple la condición
de que todas las bolas tienen la misma probabilidad de ser seleccionadas, y el
espacio muestral que se genera es el siguiente S: (0, 1, 2, 3, 4, 5, 6, 7, 8 y 9). Los
eventos del S se combinan de acuerdo con el tipo de jugada que el cliente haya
comprado: chances o billetes, y a medida que el juego se desarrolla (experimento
aleatorio), siempre hay la certeza de que su número está en la urna y que tiene la
misma probabilidad de ocurrencia que cualquier otro número.
Es evidente que el proceso de selección aleatoria es muy importante para el estudio de las
inferencias estadísticas, en vista de que a través del mismo se cumple el requisito estadístico de que
cada evento posible de un espacio muestral, debe tener la misma probabilidad de ser seleccionado.
En un experimento aleatorio, la selección de una unidad del total se denomina acto o prueba. Cada
acto o prueba produce un resultado que debe corresponder a algunos de los posibles eventos del
espacio muestral (S). En el espacio muestral (S), los posibles resultados o eventos se denominan
puntos muestrales.
83
Probabilidad
Por lo general, la probabilidad de un evento P(x), se define como el cociente entre el número de
veces que se da un evento en el espacio muestral y la totalidad de posibles eventos del espacio
muestral; o, el número de veces que se da un evento entre el número de pruebas en un experimento
o investigación. Como se puede observar, se han presentado dos definiciones de probabilidad,
aunque ambas comparten el concepto de que la probabilidad es un cociente y se presenta como un
valor que tiene un rango entre 0.00 hasta 1.00, siendo el primero ausencia total de probabilidad y el
último probabilidad máxima de un evento. Sin embargo, para efectos descriptivos, la probabilidad
se puede expresar en porcentajes: P(A) = 0.60, es equivalente al 60%. Para aclarar esta situación, es
necesario estudiar la probabilidad desde el punto de vista de dos teorías o escuelas, que pasaremos a
discutir a continuación.
También se conoce como la Escuela a Priori, en vista de que las probabilidades pueden ser
determinadas por la razón. Esto es factible en vista de que los espacios muestrales son conocidos
antes de desarrollarse los experimentos, tal y como sucede con algunos juegos de azar tales
como: las barajas, los dados, la lotería, etc. La regla básica (fórmula) para el cálculo de las
probabilidades en estos casos es:
( )
( )
( )
Ejemplos:
( ) 0
( ) 00
En este caso del cálculo de las probabilidades, se requiere de la recolección previa de la data; o
sea, se requiere de una muestra sobre la cual se hace una medición; no se conoce previamente y
con exactitud, el espacio muestral del experimento. La regla básica (fórmula) para el cálculo de
probabilidades es la siguiente:
84
( )
( )
( )
Ejemplos:
En una muestra de 250 sujetos, 130 son estudiantes sin educación secundaria.
¿Cuál es la probabilidad de seleccionar a un estudiante sin educación
secundaria?
0
( ) 0
0
Mientras mayor sea el número de pruebas que se desarrollen en el experimento, mejor será la
aproximación de la probabilidad a su valor teórico. Esto es muy importante porque indica que,
mientras más sujetos de una población se seleccionen, las probabilidades obtenidas de dicha
muestra estarán más próximas a las probabilidades reales de dichos eventos en la población.
Axiomas De Probabilidad
La probabilidad está condicionada por una serie de axiomas que favorecen el desarrollo de los
modelos y procedimientos requeridos para el cálculo de la misma.
A continuación se presentan los tres axiomas básicos asociados con el cálculo de las probabilidades.
Este axioma señala que la probabilidad de un evento no puede ser negativa; la probabilidad es
igual a cero (0) o mayor que cero (0). P(A) ≥ 0.
2. Axioma de la certidumbre:
Este axioma se aplica especialmente en el caso de los eventos compuestos. Los eventos
compuestos son aquellos que están constituidos por eventos simples:
P(EC) = p(e1) + P(e2)+…+P(ek).
Por ejemplo: ¿Cuál es la probabilidad de un número par al lanzar un dado? Un número par en un
dado serían: 2, 4 y 6; cada uno de ellos tiene en el espacio muestral una . Aplicando la
regla: ( ) ( ) ( ) ( ) 0 0
85
1. Un evento que tiene una P(X) = 1, es seguro que ocurrirá en cada una de las pruebas que se
registren en el experimento. Un evento con P(X) = 0, es seguro que no ocurrirá en ninguno de
los actos del experimento.
2. La probabilidad de un evento, P(E), se expresa como una fracción, en vista de que los límites de
sus posibles valores están entre 0 y 1. Se acostumbra expresar la probabilidad como un valor
decimal: 0.55, 0.83, 0.19, etc.
3. Las probabilidades también pueden expresarse en base a 100, o sea, porcentajes, como por
ejemplo: P = 0.05 se puede expresar descriptivamente como 5%; P= 0.28, es semejante a 28%,
y así sucesivamente.
4. Las probabilidades pueden expresarse a favor o en contra de un evento, tal y como se explica a
continuación:
La P de que suceda un evento es de 3 a 1 (3/4), o sea, que tiene una
P = 0.75.
También se puede expresar en contra: la P de que el evento anterior no suceda
es de 1 a 3 (1/4), o sea, que tiene una probabilidad P= 0.25.
El cálculo de probabilidades puede ser muy complejo. Para efectos de este curso, tomaremos en
consideración algunas reglas básicas aplicadas a eventos particulares, que se consideran
fundamentales para el cálculo de probabilidades en las investigaciones comportamentales.
1. Se lanza una moneda una sola vez; o sale cara o sale sello, pero no ambas en el mismo acto.
2. Se extrae una carta de un mazo de 52 cartas, o es roja o es negra, pero no puede ser ambas en un
solo acto.
3. Se desarrolla un reactivo de selección múltiple con cuatro alternativas de las cuales una es la
correcta y las otras tres restantes, son incorrectas. En este caso, el reactivo se tiene como bueno
o como malo, pero no ambos en una sola respuesta.
( ) ( ) ( )
Por ejemplo:
( ) ( ) ( ) 0
( ) ( ) ( ) 0 0
Dos eventos son solapados o también se conocen como unidos, si tienen puntos muestrales en
común. La regla o fórmula para el cálculo de estas probabilidades es:
( ) ( ) ( ) ( )
Ejemplo:
( ) ( ) ( ) ( ) 0
1 2 3 4 5 6
( ) 0
Cara X X X X X X
Sello X X X X X X
3. Eventos Independientes :
( ) ( ) ( )
Ejemplo:
( ) ( ) ( ) ( )( ) 0
Observación:
4. Eventos dependientes:
Los eventos dependientes también están referidos a eventos compuestos, o sea, que pueden
suceder al unísono o en consecuencia. En este caso, dos eventos son dependientes, si la
ocurrencia de uno, afecta la probabilidad de ocurrencia del otro. La regla o fórmula para el
cálculo de sus probabilidades es:
( ) ( ) ( )⁄
Ejemplo:
88
( ) ( ) ( ) ( ) ( )( ) (0 0)(0 ) 0
5. Eventos Complementarios:
Dos eventos son complementarios, E1 y E2, si el segundo de ellos contiene todos los elementos
del espacio muestral que no están en el primero. La suma de las probabilidades de los eventos
complementarios debe ser igual a 1. La regla para el cálculo de estas probabilidades es:
( ) ( ) ( ) ( )
Ejemplo:
Se tienen 500 bolas rojas y blancas en una urna. Si 300 son rojas, ¿cuál es la
probabilidad de extraer una bola blanca?
00
( ) ( ) 0 0 0 0
00
6. Eventos Condicionados:
Los eventos condicionados son aquellos que se manifiestan como un sub conjunto del espacio
muestral. Por ejemplo: en un mazo de 52 cartas, los eventos que son iguales o mayores que 10:
10, J, Q y K, se consideran un sub conjunto dentro del espacio muestral de las 52 cartas. Si
estuviera interesado en saber cuál es la probabilidad de un evento, dentro de este sub conjunto de
eventos, tendría que aplicar la regla correspondiente:
( )
( | ) ( ) ( )
( )
ESPACIO MUESTRAL
Dado
1 2 3 4 5 6
Cara C1 C2 C3 C4 C5 C6
Sello S1 S2 S3 S4 S5 S6
89
1. Únicamente se toman en consideración los eventos correspondientes a cara. Estos son C1, C2,
C3, C4, C5, C6
2. En los eventos Cara, se dan tres eventos pares: C2, C4 y C6, los cuales corresponden al 50% de
los eventos asociados con cara (en negrita)
3. En tal caso, la P pedida en el problema es igual a 3/6 = 0.50.
4. Este procedimiento es válido cuando usted conoce todo el espacio muestral.
( ) ⁄
( | ) ( )( ) 0 0
( ) ⁄
Observación: Las probabilidades dentro de los sub conjuntos, son mayores que las
probabilidades dentro de todo el espacio muestral.
CONCEPTOS IMPORTANTES
Estimación de parámetros
Teoría de la probabilidad
Experimento aleatorio
Espacio muestral
Eventos
Acto o Prueba
Eventos mutuamente excluyentes
Eventos solapados
Eventos independientes
Eventos dependientes
Eventos complementarios
Eventos condicionados
90
EJERCICIOS PRÁCTICOS
15. Se lanzan dos dados. ¿Cuál es la probabilidad de que uno resulte impar, si el otro muestra un 6?
16. En una universidad hay 200 estudiantes distribuidos de la siguiente forma: bachilleres en
ciencias, letras y humanidades, hombres y mujeres. Atendiendo a estas condiciones se sabe que:
20 son bachilleres en ciencias y hombres
88 son mujeres y bachilleres en letras
87 son hombres
140 son bachilleres en letras
30 son bachilleres en ciencias
Construya el espacio muestral de todos los eventos.
A partir del espacio muestral determine:
La “p” de seleccionar un bachiller en ciencias
La “p” de seleccionar un bachiller en ciencias hombre
La “p” de seleccionar una mujer
L “p” de seleccionar un bachiller en letras si fue hombre
La “p” de no seleccionar una mujer
La “p” de seleccionar un hombre de ciencias o una mujer de letras
La probabilidad de seleccionar una mujer de letras, si fue mujer
La “p” de seleccionar un hombre de letras y una mujer de
Humanidades.
17. En un vuelo de cierta línea aérea viajan 18 muchachos, 178 adultos hombres, 10 mexicanos del
sexo masculino, dos muchachos mexicanos, 26 personas de nacionalidad mexicana y 14
muchachas extranjeras, sin contar la tripulación. Desarrolle el espacio muestral correspondiente,
y calcule sus probabilidades.
92
CAPÍTULO 10
DE LA POBLACIÓN A LA MUESTRA
Una variable aleatoria es aquella que se genera tras un proceso de selección aleatoria. Si recordamos
los temas anteriormente discutidos, para que un experimento sea aleatorio, todos los miembros de la
población deben tener la misma probabilidad de ser seleccionados. Si la variable que se estudia en
la población puede asumir X posibles valores, entonces los sujetos seleccionados aleatoriamente
pueden asumir cualquiera de estos X valores, y si además, cada uno de estos valores tiene una
probabilidad en la población, entonces una definición más acertada de variable aleatoria sería:
aquella que puede tomar cualquier valor de un número total de valores, teniendo cada uno de ellos
una probabilidad asignada. Veamos los siguientes ejemplos:
1. Se lanzan un dado, identifique los posibles valores (Xi) que puede asumir cada lanzamiento y
determine sus probabilidades.
TABLA 10-1
POSIBLES RESULTADOS
Resultado 1 2 3 4 5 6
Probabilidad 1/6 1/6 1/6 1/6 1/6 1/6
Como se puede observar, del lanzamiento del dado se puede obtener uno de 6 posibles
resultados y cada uno de ellos tiene una probabilidad asignada. Por lo tanto, el resultado del
lanzamiento de un dado es una variable aleatoria porque combina ambas condiciones: un
resultado y su probabilidad de ocurrencia.
93
2. En una población escolar hay 300 estudiantes de los cuales 175 son mujeres y 125 son hombres.
Se selecciona aleatoriamente un estudiante. Demuestre que el sexo es una variable aleatoria.
TABLA 10-2
Masculino Femenino Total
Total 125 175 300
Probabilidad 0.42 0.58 1.00
En este ejemplo, sexo es una variable aleatoria en vista de que puede asumir uno de dos valores
(masculino o femenino) y cada uno de ellos tiene una probabilidad de ocurrencia.
De acuerdo a Chou (1974), podemos presentar los siguientes conceptos asociados con una variable
aleatoria:
Una variable aleatoria es aquella cuyo valor es un número determinado por el resultado de un
experimento aleatorio.
Si X es una variable aleatoria que puede asumir distintos valores (xi), y si cada uno de estos
valores está asociado a una probabilidad (p), entonces la combinación de cada valor de X con su
probabilidad, X(p), se denomina Función de Probabilidad o Distribución de Probabilidad. Por
lo tanto, los resultados organizados en la Tabla 10-1 y en la Tabla 10-2, son ejemplos de
Distribuciones de Probabilidad.
Al momento de hacerse una medición en una muestra, los resultados deben corresponder a una de
las dos posibles alternativas de variables aleatorias: discretas o continuas. Es importante que el
investigador determine con claridad a cuál de estas categorías pertenece la medición de la variable
estudiada; también puede suceder que en una misma investigación se combinen ambas categorías de
variables. A continuación discutiremos el significado de cada una de ellas.
94
Es evidente que los resultados obtenidos en las mediciones psicológicas corresponden a una de estas
dos categorías de variables, y que los mismos deben reflejar, hasta donde la muestra lo permita, el
espacio muestral de los resultados de la investigación y sus posibles probabilidades. En otras
palabras, deben corresponder a una distribución muestral de probabilidades
Se puede definir una a una distribución muestral como una descripción matemática de todos los
posibles resultados de los eventos muestrales y de sus probabilidades. Este concepto se aplica a
todas las muestras de un mismo tamaño que se pueden seleccionar de una población y a los
estadísticos calculados en las mismas. Específicamente, una distribución muestral se refiere a la
distribución de cualquier estadístico calculado sobre todas las posibles muestras de un mismo
tamaño, seleccionadas de una población. Este concepto estadístico se cumple con mayor certeza,
cuando la población es grande y genera muestras lo suficientemente grandes como para que se
cumplan algunos criterios que pasaremos a analizar a continuación; el ejemplo no es el más válido
porque la población es pequeña, pero se cumplen con claridad los principios básicos de las
distribuciones muestrales.
Supongamos que tenemos una población de tamaño N de la cual se seleccionan todas las posibles
muestras de tamaño n. Si para cada muestra es factible calcular la media, la varianza y la desviación
95
estándar, entonces es factible generar la distribución muestral de cada uno de estos estadísticos, las
cuales se denominarían: distribución muestral de medias, distribución muestral de varianzas y
distribución muestral de desviaciones estándares; esto es posible para cualquier estadístico
muestral. El siguiente ejemplo nos ayudará a comprender mejor el concepto:
2 4 6 8 10
2 2,2 2,4 2,6 2,8 2,10
4 4,2 4,4 4,6 4,8 4,10
6 6,2 6,4 6,6 6,8 6,10
8 8,2 8,4 8,6 8,8 8,10
10 10,2 10,4 10,6 10,8 10,10
Se ha podido demostrar que la media de la población original de los cinco datos (6.00) es igual a
la media de todas las 25 medias de tamaño 2 (6.00). Las 25 medias constituyen lo que se
denomina la distribución muestral de las medias, lo cual es una importantísima propiedad
estadística en la cual se fundamenta el proceso de muestreo. Esta propiedad es cierta para
cualquiera distribución de muestras del mismo tamaño. A partir de esta propiedad, podemos
llegar a las siguientes conclusiones:
96
Es evidente que al seleccionar muestras aleatorias, las medias aritméticas resultantes de ellas serán
diferentes y esta diferencia se considera aleatoria, o sea, independiente del proceso de selección; es
inevitable. Es también lógico esperar que entre la media real de la población y la media de la
muestra seleccionada exista una diferencia; esta diferencia se denomina error de muestreo.
El primer paso para conocer el grado de aproximación que hay entre la media muestral y la
poblacional, es el cálculo de un estadístico denominado error estándar de la media. A través de
este indicador, el investigador se ahorra el largo proceso de determinar la distribución muestral de
las medias de cada muestra y calcular el promedio de las mismas para conocer el valor de la media
poblacional, o en última instancia, calcular la media poblacional sobre la totalidad de sujetos de la
población. Veremos algunos ejemplos:
Para evitar estas situaciones complicadas, partiendo de la premisa de que la distribución muestral de
las medias se aproxima una curva normal, se calcula un estimador de la desviación estándar de la
distribución muestral de medias denominado: error estándar de la media, a partir de los datos
recogidos en una sola muestra. La fórmula para alcanzar este valor es:
97
Veamos un ejemplo: Una muestra de 75 entrevistados determinó una media de 46 con una
desviación estándar de 4.8. ¿Cuál sería el error estándar de la media aritmética?
A partir del valor del error estándar, estamos en capacidad de poder desarrollar una metodología
que nos permitirá aproximar la media aritmética conocida de la muestra, a la media poblacional
desconocida. A este procedimiento se le denomina ESTIMACIÓN, y es el primer objetivo de la
inferencia estadística.
ESTIMACIÓN ESTADÍSTICA
la estimación puntual, y,
Estimación Puntual:
Se refiere al procedimiento a través del cual se estima, probabilísticamente, que a partir de los datos
muestrales, el parámetro poblacional se encuentre dentro de un intervalo bajo la curva normal. Esto
98
es posible porque al determinar que la distribución muestral de las medias se aproxima a la curva
normal y que es factible determinar la desviación estándar de las distribución muestral de las
medias, éstas quedan definidas por los límites de la curva normal, que están entre -3z y + 3z a partir
de la media aritmética muestral. En otras palabras, se puede inferir probabilísticamente que la media
poblacional está ubicada dentro de un intervalo bajo la curva normal. Esta es la estimación más
precisa que se puede hacer de la media poblacional desconocida, a partir de la información obtenida
a través de una muestra aleatoria.
Para tal efecto se define lo que se denomina un intervalo de confianza, que es una zona de
probabilidad bajo la curva normal y que toma a la media muestral como estimadora de la media
poblacional. De esta manera, las puntuaciones Z se ubicarán por encima y por debajo de la media
muestral hasta -3z y + 3z, asociándose esta zona con un valor probabilístico. Si recordamos las
probabilidades bajo la curva, tenemos que:
Para tener claro el concepto, volvamos al ejemplo de la muestra de 75 entrevistados que obtuvo una
S = 4.8, y un error estándar de estimación de 0.55. ¿Cuál es el intervalo de confianza en el que se
espera que se encuentre la media poblacional desconocida?
Para responder a este cuestionamiento, debemos decidir dentro de cuál nivel de probabilidad
queremos hacer la estimación. Por lo general, se calculan los intervalos de confianza en los niveles
de probabilidad del 95% o el 99%. Para el 95%, el valor de Z es de 1.96, mientras que para el 99%,
el valor de Z será de 2.58. Para estos casos, Z se identificará como Zc (Z crítica)
Supongamos que para el problema planteado queremos calcular el intervalo de confianza al 95%.
Como no se conoce el tamaño de la población, se utiliza la fórmula de poblaciones infinitas:
( )( ) ( )( ) 0
√
Límite superior: 46 + 0.55 = 46.55
Límite inferior: 46 – 0.55 = 45.45
99
Suponga que, para el mismo problema se conoce el tamaño de la población, N = 500. ¿cuál sería el
intervalo de confianza al 95%? En este caso se utiliza el método de las poblaciones finitas.
00
0 √
00
0 √ (0 )(0 ) 0
Es evidente que la estimación estadística determina, en gran parte, la utilidad que se le podrá dar a
la muestra de estudio. A continuación introduciremos las técnicas de muestreo más efectivas, con la
intención de tener un panorama amplio de la relación que debe existir entre la muestra y su
correspondiente población.
MÉTODOS DE MUESTREO
Básicamente hay dos tipos de muestreo que pueden ser utilizados en el proceso de organización de
una muestra: el muestreo aleatorio que se caracteriza porque todos los sujetos de la población
tienen la misma probabilidad de ser seleccionados para conformar la muestra, y el muestreo no
aleatorio, en el cual cada miembro de la población no tiene la misma probabilidad de ser
seleccionado. A continuación analizaremos cada una de estas alternativas.
100
Muestreo No Aleatorio:
También se le conoce como muestreo no probabilístico, en vista de que la selección de cada unidad
(sujeto) no está determinada por su probabilidad en la población, ni está sustentada por un
procedimiento que asegure que dicha probabilidad poblacional ha sido considerada al momento de
hacer la selección. Algunos ejemplos de muestreo no aleatorio son.
1. Muestreo dirigido:
Se caracteriza porque los ítems (sujetos) son seleccionados con base en el juicio del encuestador;
en otras palabras, se escogen de la población aquellas unidades, que de acuerdo al investigador,
son representativos de la misma. En tales casos, La Probabilidad de selección del ítem (sujeto) es
desconocida. En estos casos, no se pueden establecer intervalos de confianza y la estimación es
de tipo puntual únicamente. A pesar de esta limitación, es un tipo de muestreo que se utiliza con
relativa frecuencia en estudios económicos y comerciales (Chou, 1974)
3. Muestreo deliberado:
Muestreo Aleatorio:
Se caracteriza porque todos los miembros de la población tienen igual oportunidad de ser
seleccionados para la muestra. Esta situación determina que cada uno de los miembros de la
población debe ser identificado previamente, tal y como sucedería, por ejemplo, con los estudiantes
de una escuela, los miembros de una empresa, los habitantes de un corregimiento, etc. La población
y cada una de sus unidades participantes del muestreo, deben ser conocidas previamente y se debe
desarrollar una metodología para su correcta identificación al momento de la selección. Es evidente
que la definición de la población y la identificación de cada uno de sus miembros, es una de las
101
dificultades más importantes a la que se deben enfrentar los investigadores. Los principales tipos de
muestreo aleatorio son los siguientes:
En teoría, para que se cumpla la aleatoriedad, los sujetos seleccionados deben ser devueltos a la
población original, manteniendo los eventos y sus probabilidades invariantes. Pero en la práctica
esto no es necesario, porque por lo general, el tamaño de la población es muy grande en
comparación con el de la muestra y el error cometido por la no sustitución no tiene importancia
práctica. Sin embargo, si la población es muy grande, en ocasiones se hace difícil numerar a
cada uno de los miembros de la población para poder identificarlos. En la actualidad, este
inconveniente está superado con el desarrollo de la informática que agiliza estos procedimientos
de manera significativa.
El proceso de selección de la muestra, una vez identificados de manera adecuada todos los
sujetos de la población, se lleva a cabo utilizando una Tabla de Números Aleatorios, que no es
otra cosa que una serie de números generados electrónicamente sin ningún patrón u orden pre
establecido. A continuación presentamos una parte de una Tabla de Números Aleatorios, tomada
de Pagano, 2006.
TABLA 10-3:
Tabla de números aleatorios (PAGANO, 2006)
1 2 3 4 5 6 7 8
1 32942 95416 42339 59045 26693 49057 87596 20624
2 07410 99859 83828 21409 29094 65114 36701 25762
3 59981 68155 45673 76210 58219 45738 29550 24736
4 46251 25437 69654 99716 11563 08803 86027 51867
5 65558 51904 93123 27887 53138 21488 09095 78777
6 99187 19258 86421 16401 19397 83297 40111 49326
7 35641 00301 16096 34775 21562 97983 45040 19200
Como se puede observar, una Tabla de Números Aleatorios no es otra cosa que una matriz
(combinación de filas y columnas) constituida por celdillas, dentro de las cuales se observan
series numéricas en desorden, generadas a través de ordenadores. Para nuestro ejemplo, las
celdillas están constituidas por series de cinco números, pero cada celdilla puede generar
cualquier conjunto de números, desde 1 hasta k; lo importante es que los mismos no representen
ningún orden predeterminado. Como en la población cada sujeto estará identificado por un
número o combinación de números, se entra a la Tabla de manera aleatoria y se va
102
seleccionando a los sujetos de acuerdo la aparición del número que corresponde a los mismos.
En los Laboratorios se estudiará el método para utilizar la Tabla en la selección aleatoria de
sujetos.
Se trata de una forma de muestreo aleatorio simple, en la cual no es necesario utilizar la Tabla de
Números Aleatorios a lo largo del muestreo; se utiliza para hacer la primera selección
únicamente. El resto del muestreo se hará sistemáticamente, o sea, a través de intervalos fijos
previamente establecidos por el investigador. A los intervalos fijos los llamaremos K, y los
mismos serán definidos a través de la siguiente regla: ⁄ . Por ejemplo, si se tiene una
población de N=1000 sujetos y se desea seleccionar una muestra de 100 sujetos, se divide el
tamaño de la población entre el tamaño de la muestra, obteniéndose K o intervalo de selección
aleatoria. Para nuestro ejemplo sería 000⁄ 00 0. Esto significa que a partir del primer
sujeto seleccionado aleatoriamente utilizando la Tabla, el resto de los sujetos de la muestra se
seleccionarán en intervalos de tamaño 10, directamente de la población hasta obtener los 100
sujetos que conforman la muestra. Como el primer sujeto fue seleccionado aleatoriamente, el
resto de las selecciones que se hagan utilizando el intervalo de tamaño 10 también se consideran
aleatorias. Este procedimiento es más rápido y por lo tanto más económico que el muestreo
aleatorio simple, manteniéndose el concepto de aleatoriedad a lo largo del proceso.
Se trata de una aplicación del método aleatorio simple, que permite desarrollar un muestreo más
eficiente y completo. Este caso requiere que la población esté dividida en estratos o categorías
homogéneos internamente pero heterogéneos entre ellos. Este sería el caso de poblaciones
estratificadas por género, por nivel académico, por nivel socioeconómico, por género y tipo de
organización familiar, etc. Para estos casos, una vez determinado el tamaño muestral a utilizar,
se selecciona de cada estrato una sub muestra utilizando uno de los métodos aleatorios
anteriormente explicados, de tal manera que en la muestra estarán representados los estratos
originales de la población.
Para ingresar a una carrera universitaria hay un total de 450 aspirantes, los
cuales pertenecen a los siguientes bachilleratos:
Estrato N p
Ciencias 250 0.50
Letras 100 0.20
Comercio 150 0.30
Total 500 1.00
103
Estrato n!(p) n
Ciencias 75(0.50) 37.5
Letras 75(0.50) 15.0
Comercio 75(0.50) 22.5
∑ 0
Como se observa en el ejemplo anterior, los 75 estudiantes seleccionados están conformados por
los tres bachilleratos, pero el número de estudiantes de cada bachillerato es proporcional a la
cantidad de estudiantes que originalmente constituían el estrato en la población. Este
procedimiento permite seleccionar una muestra que representa al universo con relación a la
proporción de cada estrato de la población. Sin embargo, es prudente utilizar este procedimiento
en aquellos casos en los que no hay gran diferencia en la dispersión entre los estratos.
Una vez asignada la cuota de muestreo a cada uno de los estratos, se les trata como si fueran una
población y se selecciona la cuota asignada a cada uno de ellos, utilizando cualquiera de los
métodos de muestreo aleatorio anteriormente analizados: simple o sistemático.
Este capítulo sobre poblaciones y muestras no podía darse por concluido, si no se abordaba el
problema del tamaño de la muestra. A continuación discutiremos los aspectos básicos que deben ser
tomados en consideración, para determinar el tamaño mínimo que debe tener una muestra al
momento de desarrollarse un estudio. Es importante destacar que el concepto de la aleatoriedad se
mantiene como un aspecto básico en el desarrollo del tema. Además, los principios que se
presentarán a continuación se refieren específicamente a la determinación de n, para la estimación
de la media de la población, por ser éste el parámetro que más se utiliza en investigaciones del
comportamiento.
Para determinar “n”, es importante tomar en consideración los siguientes aspectos estadísticos
básicos:
3. La diferencia que espera entre los límites del intervalo y el valor de la media verdadera: d
4. La σ2 de la población
En el caso de la σ2, en pocas ocasiones el investigador cuenta con este dato; por lo general se
requiere que el mismo sea estimado de la población, para lo cual se sugiere una de las siguientes
alternativas:
El investigador saca de la población una muestra piloto, por lo general pequeña, y hace una
estimación de la σ2.
Se investigan estudios previos en los cuales se han tocado temas similares a los que le interesan
al investigador. Si los temas, objetivos y contenidos de dichos estudios son lo suficientemente
similares, puede hacer uso de las varianzas muestrales obtenidas y considerarlas estimadoras de
la σ2.
( )
z2: cuadrado de la puntuación z correspondiente al 95% (1.96) o al 99% (2.58)
σ2 : varianza de la población o un estimador de ella
d2: diferencia esperada entre la media de la muestra y la de la población
N : tamaño de la población
105
CONCEPTOS IMPORTANTES
Variables aleatorias
Variable aleatoria contínua
Variable aleatoria nominal (discreta)
Distribución muestral
Error de muestreo
Error típico de la media
Estimación estadística
Intervalo de confianza
106
EJERCICIOS PRÁCTICOS
DISEÑO DE MUESTREO
TABLA 1
POBLACIÓN
HOMBRES MUJERES
01 17 33 49 65
02 18 34 50 66
03 19 35 51 67
04 20 36 52 68
05 21 37 53 69
06 22 38 54 71
07 23 39 55 71
08 24 40 56 72
09 25 41 57 73
10 26 42 58 74
11 27 43 58 75
12 28 44 60 76
13 29 45 61 77
14 30 46 62 78
15 31 47 63 79
16 32 48 64 80
1. Selecciones una muestra aleatoria de tamaño n = 30, utilizando el método de muestreo aleatorio
simple.
2. Seleccione una muestra aleatoria de tamaño n= 30, utilizando el método sistemático
3. Seleccione una muestra aleatoria de tamaño n=30, utilizando el método de muestreo
estratificado proporcional.
107
DISEÑO DE MUESTREO
SEGUNDA PARTE
TABLA 2
POBLACIÓN
HOMBRES MUJERES
60 75 72 92 85
72 64 75 49 94
55 88 64 79 68
45 73 85 83 71
82 68 71 69 65
84 77 87 64 55
93 67 83 82 62
63 89 81 72 73
94 82 57 75 77
85 78 62 70 72
90 81 91 66 67
76 68 73 85 87
78 70 78 98 61
69 81 79 72 76
56 71 72 78 82
73 78 93 76 90
Suponga que a los sujetos de la población de la Tabla 1, se les aplicó una prueba de Conocimientos
Generales y los resultados están descritos en la Tabla 2 de este laboratorio. Como usted seleccionó
muestras de tamaño 30, acredite a cada sujeto de las muestras seleccionadas el puntaje que obtuvo
en la prueba y desarrolle el laboratorio que presentamos a continuación. Recuerde: la Tabla 1
identifica a los sujetos de la población; la Tabla 2 identifica los puntajes que obtuvo cada uno de
ellos en la prueba.
CAPÍTULO 11
INTRODUCCIÓN A LA PRUEBA DE HIPÓTESIS
Uno de los objetivos de la inferencia estadística es la prueba de hipótesis. Para tener una idea más
clara de su real significado, es necesario discutir el concepto hipótesis estadística. En el plano de la
investigación psicológica, una hipótesis es una afirmación referente al comportamiento esperado de
una o más variables y de las posibles relaciones que pueden existir entre las mismas. Las hipótesis
de investigación se plantean, por lo general, desde una perspectiva conceptual, y se fundamentan en
modelos teóricos, evidencia empírica obtenida a través de otras investigaciones, e inclusive, la
intuición, experiencia o sentido común del investigador. Las hipótesis de investigación requieren ser
verificadas empíricamente, lo cual permitirá decidir sobre la veracidad o no de la afirmación
efectuada. La verificación de las hipótesis de investigación se realiza a través de una herramienta de
la estadística inferencial denominada hipótesis estadísticas.
Problemas
Teorías Hipótesis
estadísticas
Hipótesis de
investigación
FIGURA 11—1
Un psicólogo cree poseer evidencias como para considerar que el razonamiento analógico está
relacionado con el rendimiento en las matemáticas. Para ser más específico, conjetura que la
relación entre ambas variables es directamente proporcional, o sea que, incrementos en una, van
acompañados de incrementos en la otra. Para solucionar esta sospecha, el primer paso que debe
satisfacer el investigador es el de determinar si estas variables pueden ser definidas
operacionalmente, o sea, que puedan ser medidas. Descubrió que el razonamiento analógico se
puede medir a través de la Prueba del WISC mientras que el rendimiento en las matemáticas lo
110
mide a través de las notas obtenidas en el colegio; bajo estas perspectivas, ambas variables
pueden ser transformadas de conceptos a datos o valores cuantitativos. De cada sujeto
investigado se puede obtener información que permita determinar: si poseen los atributos y la
magnitud (cantidad) de los mismos. A partir de la cuantificación, el investigador está en
capacidad de verificar si su hipótesis es acertada o no, sobre la base de la aplicación de las
estadísticas inferenciales, específicamente a través de una prueba de hipótesis.
LA PRUEBA DE HIPÓTESIS
FIGURA 11—2
La Prueba de Hipótesis es un procedimiento que consta de seis pasos que deben ser cumplidos con
la mayor objetividad posible. A continuación se desarrolla cada uno de ellos. El estudiante debe
comprender, analizar y sintetizar el contenido, de tal manera que al momento de llevar a la práctica
el procedimiento, el mismo esté correctamente sustentado.
111
FIGURA 11—3
Una hipótesis estadística es una que hace el investigador acerca del comportamiento de uno o más
parámetros poblacionales, de acuerdo a la hipótesis de investigación planteada en el estudio. La
hipótesis estadística se hace sobre valores cuantitativos que deben representar la misma relación
planteada en la hipótesis de investigación. Para tal efecto, la Prueba de Hipótesis está constituida
por dos hipótesis que deben ser rivales y mutuamente excluyentes: la Hipótesis nula (H0) y la
Hipótesis alterna (H1).
0
0
112
Como se puede observar, la H1 coincide con la hipótesis de investigación que decía que la relación
esperada debía ser directamente proporcional entre ambas variables, situación que se corrobora
cuando el coeficiente rxy es mayor que cero (0). Lo importante en el ejemplo es observar que si se
rechaza la H0, automáticamente se considera confirmada la H1; de no ser rechazada la H0, no se
podría confirmar o aceptar la H1. Este es un ejemplo, y más adelante, explicaremos los diversos
estadísticos que se utilizan al plantear las hipótesis.
00
00
2. El índice académico de las estudiantes de psicología del sexo femenino es mayor que el de los
estudiantes del sexo masculino
Como se puede observar en los ejemplos, la Hi se puede plantear en una dirección (> ó <) al igual
que en dos direcciones ( ≠ ). Cuando se plantea en una dirección, la prueba es de una cola a la
derecha y el operador utilizado es >, o de una cola a la izquierda y el operador corresponde a <. En
el caso de una cola a la derecha se indica que el resultado esperado debe ser positivo y se ubicará a
la derecha de la distribución de probabilidad que se esté utilizando. Por el contrario, si la prueba es
de una cola a la izquierda se indica que el resultado esperado debe ser negativo y debe ubicarse a la
izquierda de la distribución de probabilidad correspondiente. En el caso de dos colas se indica que
no hay certeza por parte de investigador con relación a la dirección en que se darán los resultados, o
sea, que pueden darse a la derecha y ser positivos, o pueden darse a la izquierda y ser negativos. Es
importante volver a destacar que la hipótesis alterna debe ser semejante a la hipótesis de
investigación, lo que significa que la dirección de la prueba de hipótesis debe corresponder a lo
planteado en la hipótesis de investigación.
1. α = 0.05.
113
2. α = 0.01
Como se puede observar, los alfas tienen tamaños diferentes y esta situación es importante al
momento de diseñar y desarrollar la prueba de hipótesis. Cuando se establece un alfa de 0.05, se
comete lo que se denomina el error de tipo I. Este error se refiere a la probabilidad de rechazar la
Ho y confirmar la Hi cuando la primera no debió de haberse rechazado. O sea, que el rechazo se
debe principalmente a que alfa tiene un tamaño grande y de esa manera aumenta la probabilidad de
que los resultados caigan en esta zona. Esta situación nos lleva a concluir que cada vez que
decidimos tomar un alfa más grande, se aumenta la probabilidad de cometer el error de tipo I, o sea,
verificar su hipótesis alterna, cuando no debió ser verificada. Cuando se establece un alfa de 0.01,
se comete lo que se denomina el error de tipo II, que se refiere a la probabilidad de no rechazar la
Ho y por lo tanto, no confirmar su Hi, cuando la primera debió haberse rechazado. En este caso,
como alfa es tan pequeña, se ubica muy al extremo de la distribución de probabilidad haciendo
difícil que resultados muy importantes sean considerados como tales en vista de que no caen en
dicha zona de probabilidades. A continuación se presentan algunas figuras que favorecen la
comprensión del tema.
114
Error de tipo I:
α grande
FIGURA 11—4
La figura anterior presenta la situación típica de una prueba de hipótesis en la que se ha definido
alfa. Como se puede observar, la distribución ha sido dividida en dos áreas: la del extremo derecho,
la más pequeña, representa a alfa, la cual puede ser de 0.05 ó de 0.01 de acuerdo a las necesidades
del investigador. Este es el caso típico de una prueba de una cola a la derecha, porque se está
indicando que la zona de alfa está en el extremo derecho. Si por el contrario, la prueba hubiese sido
de una cola hacia la izquierda, entonces la zona de alfa se hubiese ubicado en la cola de la izquierda
de la distribución.
Tal y como hemos observado, al definirse alfa, se divide la distribución en dos partes: una para alfa
que es la más pequeña y otra mayor que se denomina beta y se identifica por el símbolo β. Beta
representa la probabilidad asociada con la H0, es complementaria con alfa y ambas son mutuamente
115
excluyentes. Por lo tanto, la prueba de hipótesis puede caer en alguna de las dos áreas: si cae en alfa
se rechaza la H0 y se confirma la Hi; si cae en beta, no se rechaza la H0 y no se ha podido confirmar
la Hi.
En el caso de que la prueba de hipótesis sea de dos colas, entonces alfa se divide entre dos (α / 2) y
se asignan las correspondientes probabilidades a cada extremo de la curva; o sea, que hay dos zonas
de rechazo probables para la H0. El área central que queda entre las dos zonas de alfa corresponde a
beta.
Β = 0.95 ó 0.99
FIGURA 11—5
Una vez definidas las hipótesis y establecido el nivel de significación, se debe establecer el
procedimiento estadístico a través del cual se va a desarrollar la prueba de hipótesis. El
procedimiento estadístico seleccionado debe tomar en consideración varios aspectos críticos:
El nivel de medición de la(s) variable(s): se debe considerar si la(s) variable(s) han sido
medidas como continuas o discretas, y si corresponden al nivel nominal, ordinal, de intervalo o
de proporción.
El tipo de parámetro poblacional que está bajo estudio a través de la evidencia muestral
Bajo estas consideraciones, los estadísticos de prueba que se utilizarán para el estudio de las
pruebas de hipótesis son:
1. El estadístico z para las pruebas de hipótesis de dos medias o dos proporciones provenientes de
muestras grandes y que supongan que las variables son continuas, se distribuyen normalmente
y la σ es conocida.
2. El estadístico “t” de Student, para las pruebas de hipótesis de dos medias aritméticas,
desarrolladas en muestras pequeñas (o grandes) y que se asume que las variables son continuas
y la σ es desconocida por lo que se utiliza la S muestral.
3. El estadístico “F” de Fisher para las pruebas de hipótesis de medias aritméticas, muestras
pequeñas y variables continuas, cuando se comparan dos o medias aritméticas.
4. La prueba Chi Cuadrado para muestras pequeñas, variables discretas medidas en escala
nominal. La prueba de proporción y asociación de Chi Cuadrado requiere de muestras grandes.
Recuerde que si la frecuencia esperada es menor a 5 no aplica; para el caso de muestras
pequeñas y tablas sólo 2x2, la prueba sería la Exacta de Fisher.
Para el caso de pruebas de hipótesis para medias aritméticas, a continuación presentamos una tabla
en la que se resumen los valores críticos de Z, a diferentes niveles α, a una o a dos colas.
TABLA 11-1:
Valores críticos de z para diferentes niveles de α, a una o a dos colas
Alfa 0.05 0.01
Una cola 1.96 ó -1.64 2.33 ó -2.33
Dos colas 1.96 ó -1.96 2.58 ó - 2.58
117
Para cada uno de los estadísticos señalados, se ha definido una regla (fórmula) para calcular su
valor exacto, las cuales serán presentadas a medida que se vayan desarrollando los diferentes tipos
de pruebas de hipótesis.
La regla de decisión identifica los hechos estadísticos que permitirán determinar si la H 0 se rechaza
o no se rechaza. Al momento de determinarse alfa, la distribución de probabilidad utilizada se
divide en dos partes: la zona de aceptación y la de rechazo. El punto en que se divide la distribución
debe ser representado por un valor crítico proveniente de la Tabla de Probabilidades
correspondiente a la distribución de probabilidad utilizada para el estudio, el alfa de la prueba y el
tipo de cola de la hipótesis alterna. Esto significa que se determinarán valores críticos para z, t, F y
Chi Cuadrado, y que los mismos serán los criterios contra lo que vamos a comparar los resultados
obtenidos al aplicar las pruebas estadísticas. La regla de decisión establecerá que se rechazará la H 0,
si el estadístico obtenido de los datos de la investigación, supera el valor crítico obtenido en la tabla.
Por ejemplo, si está haciendo una prueba de hipótesis para una media poblacional, con alfa de 0.05,
una cola a la derecha y una muestra grande, el valor crítico que separa alfa de beta se obtiene de la
Tabla de la Curva Normal y el mismo es igual a Zc = 1.64. Quiere decir que para rechazar la H0, la
z que obtenga de los datos de la investigación (Zo) debe ser superior al valor crítico de 1.64. Si esto
sucede, la z de los datos cae en la zona de alfa y por lo tanto se rechaza la Ho confirmándose la
alterna; de lo contrario, no se puede rechazar la H0. Esto debe estar debidamente explicado en la
prueba de hipótesis, más o menos en los siguientes términos:
Región
de
rechazo
Región de aceptación
0 Z = 1.64
Probabilidad 0.95
Probabilidad
0.05
FIGURA 11—6
Se refiere al procesamiento estadístico de los datos provenientes de la(s) muestra(s) de estudio y del
desarrollo de la prueba estadística seleccionada. Como ya hemos dicho anteriormente, se utilizarán
118
las pruebas z, t, F y Chi Cuadrado de acuerdo a las necesidades. Los resultados obtenidos serán
comparados con los correspondientes valores críticos provenientes de las Tablas y se determinará si
los valores observados superan o no a los críticos lo cual permitirá tomar una decisión final.
CONCEPTOS IMPORTANTES
Hipótesis estadística
Prueba de hipótesis
Hipótesis nula
Hipótesis alterna
Nivel de significación
Alfa y Beta
Errores Tipo I y Tipo II
Prueba de una cola
Prueba de dos colas
119
CAPÍTULO 12
PRINCIPALES TIPOS DE PRUEBA DE HIPÓTESIS
Al iniciar el capítulo de “Poblaciones y Muestras” señalamos que se haría énfasis en los estudios
relacionados con la media aritmética, en vista de que este estadístico es posiblemente el más
importante, junto con la desviación estándar, para los análisis de resultados provenientes de
investigaciones comportamentales. Por tal razón, las pruebas de hipótesis que a continuación se
discutirán, se dirigen en particular hacia este estadístico.
Cuando se presume que los datos están distribuidos normalmente, ya sea porque la muestra es
grande o porque se tiene suficiente evidencia como para aseverar la distribución normal, se puede
estudiar la significancia de las puntuaciones correspondientes a la(s) media(s), utilizando el
estadístico estandarizado “z”. Para tal efecto se deben satisfacer ciertas condiciones:
Los datos han sido medidos por lo menos en una escala de intervalos
La µ poblacional es conocida
La σ2 poblacional es conocida
Si las condiciones anteriores son satisfechas, se pueden desarrollar dos tipos de pruebas de hipótesis
para la media: a) el caso de una media poblacional y, b) el caso de dos medias poblacionales. A
continuación presentaremos las principales características de ambos procedimientos.
En muchas ocasiones, los investigadores están interesados en evaluar si una media poblacional
conocida ha variado o se mantiene igual. En estos casos, una vez verificadas las propiedades
anteriormente señaladas, se extrae una muestra aleatoria de la población y se calcula la media
aritmética de la misma. El estadístico de análisis es:
⁄
√
A continuación presentamos un ejemplo de una prueba de hipótesis para el caso de una media
poblacional.
120
1. Hipótesis estadísticas
2. Ni vel de si gnificación
00
3. Estadístico de prueba
⁄
√
4. Regla de decisión
5. Resultados
0
0
√
6. Decisión:
En vista de que zo > zc, hay evidencias estadísticas para rechazar la Ho y confirmar la H1;
la media de la muestra actual es mayor que la de la población de los últimos 10 años.
En este problema, la información correspondiente a la σ2 poblacional formaba parte de los datos del
mismo. Sin embargo, en la mayoría de los casos, este dato se desconoce y el error estándar de la
media no es posible determinarlo, por lo que el investigador debe echar mano de otros recursos que
la estadística inferencial pone a su disposición, los cuales analizaremos a continuación.
121
Si el tamaño de la muestra es grande (se considera una muestra grande la que es de al menos 30
sujetos), es factible hacer una estimación de la σ poblacional, y a partir de ella calcular el error
estándar de la media aritmética. Esto es factible por el poder de los números grandes (muestras
grandes) combinados con el Teorema Central del Límite.
Los datos han sido medidos por lo menos en una escala de intervalos
Las σ2 poblacionales pueden ser conocidas como también desconocidas; por lo general son
desconocidas.
1. Hipótesis estadísticas
122
2. Ni vel de si gnificación
00
( )
3. Estadístico de prueba
, en donde, σ √ ,
4. Regla de decisión
5. Resultados
( ) ( )
√ 0
0 0
0 0
0
6. Decisión:
En vista de que Zo = 1.32 es menor que la Zc = 1.64, no hay evidencias estadísticas para
rechazar Ho y considerar confirmada la hipótesis alterna. No hay diferencias
estadísticamente significativas entre las medias de la ansiedad de las estudiantes femeninas
y la de los estudiantes masculinos.
Como se pudo observar, ambos grupos satisfacen los requerimientos exigidos para desarrollar
pruebas de hipótesis para muestras grandes, o sea, que la aproximación normal es favorable: los
tamaños son mayores de 30, la variable de interés es continua porque la medición de la misma
refleja magnitud, y dicha variable ha sido medida en una escala de intervalos; se asume la
aleatoriedad.
123
¿Pero qué sucede si la normalidad no se puede asumir, principalmente porque las muestras son
pequeñas, o sea n < 30? En tales casos, las propiedades de la normal no se satisfacen y se requiere
tomar en consideración la teoría estadística de las muestras pequeñas, la cual discutiremos, de
manera sencilla, a continuación.
Grados De Libertad
La introducción a la prueba de hipótesis para muestras pequeñas, nos obliga a analizar el concepto
de grados de libertad, que a partir de este momento se indicará por gl. Este concepto es aplicable
tanto en las muestras pequeñas como en las grandes, aunque su importancia fundamental radica en
las muestras pequeñas.
∑( )
o sea, que corrige el sesgo y permite la utilización de la varianza de la muestra como un estimador
eficiente de la varianza muestral.
124
Veamos un ejemplo: suponga que a cinco sujetos se les ha hecho una medición sobre un atributo
psicológico X, y que la media obtenida por los cinco sujetos fue de 25 puntos. ¿Cuántos puntos
ganó cada uno de los sujetos?
Los cuatro primeros sujetos pudieron obtener cualquier puntaje dentro del rango establecido por
la escala de medición utilizada. Pero el sujeto número 5, sólo tenía una opción: su puntaje debía
ser aquel que asegurara que al sumarse los 5 datos y dividirse entre n = 5, la media aritmética
sería igual a 25, tal y como se observa a continuación.
Sujeto X
1 15
2 16
3 29
4 30
5 35
∑
Sujeto X D
1 15 15-25=-10
2 16 16-25=-9
3 29 29-25=4
4 30 30-25=5
5 35 35-25=10
∑ ∑0
Como se puede observar, siempre que se estime un parámetro a partir de un valor muestral, podrán
variar libremente n – 1 de los valores muestrales; el último, corresponde al valor requerido para
calcular el estadístico muestral. Por esta razón, en las muestras pequeñas, al estimar el valor de la
varianza o la desviación estándar, es necesario que se utilicen los grados de libertad, con el fin de
que dichas medidas de variabilidad sean consideradas estimadoras eficientes de sus
correspondientes parámetros poblacionales. Recuerde que la variabilidad es fundamental en la
prueba de hipótesis, especialmente para determinar el error estándar de la estimación.
A partir de los conceptos presentados anteriormente, daremos inicio al estudio de las principales
pruebas de hipótesis para muestras pequeñas: la prueba “t” de student para una y dos medias, y la
prueba “F” para tres o más medias.
La prueba “t” está respaldada por la distribución muestral del mismo nombre, en la cual las
variables se consideran normales, estandarizadas e independientes. Es una distribución continua y
se aplica tanto en muestras pequeñas como en las grandes. Varía entre -∞ hasta +∞, es simétrica con
una media igual a cero. En realidad es una familia de distribuciones, asociadas cada una de ellas a
su correspondiente grado de libertad; de acuerdo al tamaño de la muestra sus “s” varían. En
comparación con la normal, “t” es menos aguda en el centro que la normal y es más extendida. A
medida que n aumenta, la curva de “t” se aproxima a la curva normal. Sus valores estandarizados se
denominan “t” y tiene una Tabla asociada con las probabilidades de cada uno de estos valores.
Para desarrollar pruebas de hipótesis con “t”, es necesario tener evidencias de que las varianzas
muestrales no son estadísticamente diferentes. A esta condición se le denomina homogeneidad de
las varianzas, y debe ser comprobada en cada prueba; más sin embargo, en la mayoría de las
ocasiones los investigadores suponen que dicha condición está presente siempre y cuando las
muestras comparadas estén formadas por la misma cantidad de sujetos (n).
Además, debe conocerse la media de la(s) muestra(s), aunque la σ es desconocida. La misma será
estimada a partir de la “S” de la muestra tomando en consideración los grados de libertad (gl).
126
Es importante señalar que la Distribución “t” de Student cuenta con una Tabla de valores “t”
críticos, definida por los grados de libertad y el nivel de significación, tanto para una como para dos
colas. La comparación de los valores t observados y críticos, determinará si se rechaza o no la Ho.
(∑ )
, en donde ∑ ; y
√ ( )
Hay ocasiones en que se sospecha que una media poblacional conocida ha sufrido cambios: ya sea a
favor o en contra de los valores conocidos sobre la misma. En estos casos, se sigue el procedimiento
de los 5 pasos estudiados en las muestras grandes, tal y como lo presentamos en el siguiente
ejemplo a continuación.
Una investigadora sospecha que el peso corporal de una población de adolescentes infractoras
internadas en un Centro de Observación, ha sufrido cambios recientemente. La última medición
desarrollada hace tres años, señalaba un promedio 61 kilos y no se tenía información sobre la
desviación estándar del pesos corporal. La investigadora toma una muestra aleatoria de 8
menores y mide sus pesos corporales, obteniendo los siguientes resultados: 63, 60, 59, 65, 67,
66, 59 y 65. Con estos datos desarrolla una prueba de hipótesis con alfa (α) = 0.01. ¿A qué
conclusión llegó la investigadora?
Para desarrollar la prueba de hipótesis, es recomendable que resuma los datos que va a requerir y
con los mismos desarrolle la prueba.
DATOS
( )
( )
0
1. Hipótesis estadísticas
2. Ni vel de si gnificación
00
0
127
3. Estadístico de prueba
(∑ )
, en donde ∑
√ ( )
4. Regla de decisión
5. Resultados
( 0 )
√
( )
6. Decisión:
En vista de que “to” = 1.74 es < que tc = 3.50, no hay evidencias estadísticas para rechazar
la Ho. La µ poblacional del peso no es diferente que 61, por lo tanto, la sospecha de la
investigadora no se ha demostrado
Como se pudo observar, se trató de una prueba de hipótesis de una media poblacional de dos colas.
El procedimiento es semejante al seguido para muestras grandes.
Este caso se refiere a la situación en la que el investigador desea determinar si dos medias
muestrales difieren en alguna medida entre ellas, y si esa diferencia es significativa, o sea, que va
más allá de una simple fluctuación muestral. Está claro que las dos medias provienen de dos
muestras independientes las que presentan los efectos de dos condiciones diferentes; el interés
radica en determinar, de acuerdo a la hipótesis planteada, si ambas medias son estadísticamente
diferentes.
Para estos casos se sugiere que se presenten las siguientes condiciones previas:
Un Psicólogo Escolar considera que el nivel de ansiedad de los hombres es mayor que el de las
mujeres, antes de desarrollar un examen. Para demostrar esta sospecha, aplica una prueba de
ansiedad antes de un examen de física a una muestra de 10 estudiantes varones y 10 estudiantes
128
Con los resultados anteriores, se desarrolló una prueba de hipótesis con un alfa α de 0.05. ¿A
qué conclusión llegó el Psicólogo?
Se recomienda que resuma los datos que necesitará para desarrollar su prueba de hipótesis.
Hombres Mujeres
0 0
1. Hipótesis estadísticas
2. Ni vel de si gnificación
00
0 0
3. Estadístico de prueba
(∑ )
, en donde √( )( ); y ∑
4. Regla de decisión
5. Resultados
( ) ( )
√( )( ) 0 0
0 0
129
0 0
6. Decisión:
En vista de que to = 4.12 es > que tc = 1.73, se rechaza Ho y se confirma H1: la media de
la ansiedad de los hombres es > que la media de la ansiedad de las mujeres.
Se considera que dos muestras están correlacionadas, si los resultados obtenidos en una de ellas
afectan los resultados obtenidos en la otra. Esto es característico de las situaciones siguientes:
Un mismo grupo es medido dos veces y se intenta determinar las diferencias observadas entre
las medias de ambos. Tal es el caso de las investigaciones de carácter experimental o cuasi
experimental, en las cuales la condición de antes-después es característica.
Cuando se organizan dos grupos “apareados” y se intenta establecer las diferencias existentes
entre ambos. Apareados debe ser interpretado como la situación en que se intenta que parejas de
sujetos que pertenecen a grupos diferentes, mantengan las mismas características que rivalizan
con la variable independiente (por ejemplo, CI, género, edad, aptitudes, etc.). En estos casos, la
aleatoriedad no fue el factor que distribuyó a los sujetos de manera semejante en cada muestra,
sino la acción del investigador: el apareamiento.
A continuación presentamos un problema en el cual, una muestra de sujetos se mide antes y después
de aplicada una intervención o tratamiento. Ambas mediciones se desarrollan en el mismo grupo de
sujetos, lo que hace de las mismas mediciones correlacionadas.
A fin de motivar a los ciudadanos al ahorro en el consumo de luz , una ONG estudia la idea de
emprender una campaña nacional a favor del ahorro de la misma. Sin embargo, antes de
emprender dicha campaña, la organización decide realizar un experimento que le permita
evaluar la eficiencia de la campaña. Para el experimento, realiza la campaña de ahorro de luz
en un área geográfica representativa. Doce (12) familias de esa área son elegidas al azar y se
determina el costo (en balboas) del consumo durante el mes anterior al lanzamiento de la
campaña de publicidad; al mes siguiente de la campaña de publicidad, nuevamente se
determina el costo del consumo. La idea de los investigadores es la de determinar si hubo o no
diferencias entre el consumo de luz, antes y después de la campaña publicitaria, y de esta forma,
evaluar la capacidad de dicha campaña para modificar los hábitos de consumo. Como se puede
observar, se trata de 12 personas medidas dos veces, antes y después, caso típico de muestras
correlacionadas. A continuación se presenta un ejemplo de la prueba de hipótesis
correspondiente
130
1. Hipótesis estadísticas
0
0
2. Ni vel de si gnificación
00
3. Estadístico de prueba
(∑ )
en donde √ ; y ∑
( )
4. Regla de decisión
5. Resultados
( )
131
√ 00
( )
0
00
6. Decisión:
Las correlaciones son uno de los procedimientos más utilizados en el análisis de resultados
obtenidos en investigaciones del comportamiento. Siendo el comportamiento humano un factor
afectado por un número plural de variables, es evidente que las mismas interactúan mutuamente y
se afectan unas a otras, asociándose de diversas maneras. La correlación es una técnica estadística
que permite estudiar el nivel de asociación de dos o más variables. Para efectos de este curso de
prueba de hipótesis, vamos a estudiar si el coeficiente de correlación obtenido entre dos variables es
estadísticamente diferente que cero y por lo tanto, si la asociación de estas variables es válida.
A una muestra de 20 estudiantes universitarios se les aplicó una prueba de razonamiento verbal,
con el fin de determinar si esta variable se asocia positivamente con los puntajes
correspondientes al índice académico de los dos primeros semestres de una carrera
universitaria. El coeficiente de correlación obtenido fue de 0.38. ¿Es esta correlación
estadísticamente significativa, o sea, es verdaderamente positiva? Sea alfa igual a 0.05.
1. Hipótesis estadísticas
0
0
132
2. Ni vel de si gnificación
00
0 0
3. Estadístico de prueba
4. Regla de decisión
5. Resultados
0 0
(0 ) 0
√
0
6. Decisión:
En vista de que to = 1.810 es < que tc = 2.101, no hay evidencias para rechazar la H0; la
correlación entre estas variables no es diferente que cero.
Como se ha podido observar, en el caso de una correlación es posible determinar si la relación entre
las variables es estadísticamente significativa o es simplemente una fluctuación de la muestra, como
lo fue el caso anterior. De esta misma manera, pero con su estadístico correspondiente, se puede
determinar la significancia de otros valores correlacionales (comparación de dos correlaciones) y de
parámetros de regresión (a0 y a1), los cuales no serán tratados en este libro.
CONCEPTOS IMPORTANTES
Muestras grandes
Muestras pequeñas
Sesgo muestral
“t” de Student
Homogeneidad de varianzas
133
EJERCICIOS PRÁCTICOS
2. Los aspirantes a ingresar al servicio de Guardia Costera de los últimos 10 años obtuvieron un
promedio de ansiedad de 26 puntos con una desviación típica de 4 puntos. Se seleccionó una
muestra de 45 sujetos que aspiraron en el presente año, los cuales obtuvieron una media de 29
puntos. De acuerdo a estos resultados se puede considerar que los niveles de ansiedad de los
aspirantes han aumentado en comparación con los años anteriores? Utilice alfa de 0.05 y 0.01.
3. Un estudio desarrollado en 75 personas que residen en una comunidad sub urbana indicó que el
promedio de ingreso familiar fue de B/235.00 mensuales, con una desviación típica de 25.00.
Verifique la hipótesis de que el promedio salarial en ésta comunidad es menor a B/250.00. Sea
alfa = 0.05.
6. Se desarrolla una investigación para determinar si las horas dedicadas diariamente al estudio
afectan el rendimiento académico de los estudiantes. Se distribuyeron aleatoriamente en dos
grupos a 30 estudiantes, del mismo nivel académico y que tenían al mismo profesor: 15 en el
Grupo A y 15 en el Grupo B. El Grupo A dedicó 5 horas diarias al estudio, mientras que el
grupo B dedicó 3.5 horas diarias a la misma actividad. Al terminar el año académico se evaluó
el rendimiento promedio de cada grupo, los cuales se presentan a continuación:
Grupo Promedio Desviación
A 3.97 0.56
B 3.77 0.87
Con alfa de 0.05, determiné si el promedio del grupo A fue mayor que el grupo B.
Plan T 75 72 73 76 78 72 80 74 76 75
Plan N 80 83 84 78 79 81 84 85 78 56
Los salarios por hora para ambos grupos eran iguales; la diferencia la hacía el plan de
incentivos. ¿Se puede concluir que el nuevo plan de incentivos es más eficiente y
productivo que el tradicional? Sea alfa = 0.05
Con alfa de 0.01, determine si hay diferencias entre los promedios de intentos entre los
dos grupos.
135
10. Un Psicólogo Clínico desarrolla un estudio del autoconcepto familiar en dos grupos de sujetos
adultos con problemas de adicción: un grupo masculino (A) y otro femenino (B) Los resultados
obtenidos con la Escala de Autoconcepto Tennessee fueron los siguientes:
A 72 83 57 71 72 68 70 68 77 67
B 36 52 41 44 39 51 47 41 55 46
Con alfa de 0.05, determine si hay diferencias en las medias del autoconcepto familiar
entre ambos grupos.
11. En un estudio dirigido para determinar la efectividad de una nueva dieta, una compañía de
seguros seleccionó una muestra de 10 sujetos con sobrepeso entre las edades de 40 y 50 años.
Se les midió el peso al iniciar el tratamiento (A) y se volvió a medir 60 días después (D). Los
resultados fueron los siguientes:
A 202 237 173 161 185 210 209 191 200 189
D 180 221 175 158 180 197 205 196 185 187
Con alfa de 0.05, determine si la nueva dieta produjo los resultados esperados.
12. Una muestra de 10 niños fueron diagnosticados inicialmente con el trastorno de Déficit de
Atención tipo Hiperactivo-Impulsivo. Se kles aplicó un tratamiento co0n el fin de disminuir los
síntomas de éste trastorno. A continuación se presentan los puntajes obtenidos en la Escala de
Conners antes y después del tratamiento.
Antes 80 75 78 82 71 79 73 86 79 84
Después 70 71 70 71 71 73 74 78 74 79
Con alfa de 0.05, determine si el tratamiento logró disminuir los puntajes obtenidos en la
prueba.
13. Dos investigadores del comportamiento desarrollaron un estudio para determinar si existe una
correlación significativa entre ansiedad y razonamiento lógico. Seleccionaron una muestra de
28 sujetos, obtuvieron mediciones de estas variables y correlacionaron las mismas,
obteniéndose u coeficiente de correlación r=0.30. Determine la significancia de esta
correlación, con alfa de 0.05.
14. Una muestra de 45 estudiantes fue evaluada en los factores depresión y rendimiento en
matemáticas. Los resultados obtenidos obtuvieron un coeficiente de correlación r= 0.29. Es ésta
correlación significativa, a un nivel alfa de 0.05?
136
CAPÍTULO 13
ANÁLISIS DE LA VARIANZA
Las pruebas de hipótesis analizadas en los capítulos anteriores, hacían énfasis en la comparación de
la media aritmética de una muestra con una media poblacional, o se comparaban dos medias
aritméticas provenientes de dos muestras. Estas situaciones se analizaron tanto para el caso de
muestras grandes (n>30 sujetos), en los cuales se utilizaba el estadístico “z” y la curva normal como
modelo de probabilidades, al igual que para las muestras pequeñas (n≤ 30) casos en los que se
utilizaba la prueba “t de student”, respaldada por el modelo de probabilidades denominado t de
student. En ambos casos, el número máximo de medias aritméticas que se podían comparar era de
dos; pero si hay tres o más medias, ninguno de los dos modelos probabilísticos anteriormente
discutidos, sería el adecuado para la comparación de dicho número de medias. En estos casos, el
procedimiento adecuado se denomina ANOVA o Análisis de la Varianza, que utiliza como modelo
de probabilidades una distribución denominada F de Fisher y la Prueba F como procedimiento de
análisis estadístico.
LA DISTRIBUCIÓN F
1. : que es la estimación de la varianza que proviene de los efectos observados en las muestras
que se están analizando, los cuales son independientes entre sí,
2. : que es la estimación de los errores aleatorios dentro de cada una de las muestras analizadas.
El resultado obtenido a través de este cociente, Fo, se compara con la F crítica (Fc) obtenida de la
tabla correspondiente, de acuerdo al nivel alfa establecido y los grados de libertad correspondientes
al problema. Esto significa que, al igual que como sucede con la normal y la “t”, existe una
distribución muestral resumida en una tabla, en la cual se asocian los valores teóricos de F con sus
correspondientes probabilidades, dando como resultado los valores Fc que son los que separan la
zona de rechazo de Ho con la zona de no rechazo de dicha hipótesis.
Por ser la Prueba F un procedimiento aplicado en muestras pequeñas, los valores de Fc variarán de
acuerdo con los grados de libertad, que para efectos de esta distribución, se deben tomar en cuenta
dos valores: los gl para el numerador (efectos de cada muestra) que son iguales a n 1-1 y los gl para
el denominador (efectos aleatorios dentro de cada muestra) que son iguales a n-1.
137
Para la prueba F existe una familia de curvas, tal y como sucede con la “t”, aunque en este caso, hay
un valor de F para cada combinación de S2 en el numerador y en el denominador, lo cual está
debidamente contemplado en las tablas de valores críticos de F. Para determinar si se rechaza o no
la Ho, se compara el valor Fo que proviene de los datos experimentales, con la Fc de la tabla; si Fo
> Fc, se rechaza Ho y se considera confirmada la H1, lo cual significa que por lo menos una de las
medias es estadísticamente diferente al resto.
gl gl entre (numerador)
dentro(denominador)
1 2 3 4 5 …..∞…
Para utilizar la Tabla de F, se combinan los grados de libertad entre, con los grados de libertad
dentro. Por ejemplo, si un experimento presenta glentre=3 y gldentro= 5, con alfa de 0.05, la F(c) =
5.41. Debe recordar que los valores críticos se presentan en pares: el primero corresponde a 0.05 y
el segundo a 0.01 (negrita).
Otro aspecto a destacar es que la Prueba F se utiliza para evaluar los efectos de una variable
independiente a varios niveles, al igual que en los casos en que hay más de una variable
independiente también a varios niveles. Para ambos casos, los efectos de la(s) variable(s)
independiente(s) se asocian con una sola variable dependiente; si hay más de una variable
dependiente, tendríamos que analizar dichos efectos a través de modelos multivariados, los cuales
escapan a los objetivos de este libro.
Tal y como se mencionó anteriormente, el ANOVA es una técnica estadística que permite evaluar
experimentos en los que intervienen tres o más grupos. El objetivo final es el de establecer si las
medias aritméticas de dichos grupos difieren o las mismas son estadísticamente iguales. Si nos
refiriéramos a tratamientos psicológicos, estaríamos interesados en determinar a través de las
medias aritméticas, si los tratamientos ejercen efectos diferentes sobre las muestras o si todos ellos
139
producen efectos semejantes. Existen diversos tipos de ANOVA que se aplican para situaciones
experimentales en las cuales hay tres o más muestras. En primera instancia, presentaremos y
discutiremos el modelo denominado ANOVA SIMPLE O EN UN SOLO SENTIDO,
Esta técnica de análisis estadístico se caracteriza porque se refiere a una sola fuente de variación, o
sea, una variable independiente a distintos niveles, tal y como se puede observar en el siguiente
ejemplo.
Para que ANOVA pueda aplicarse de manera válida, es necesario que se cumplan algunos
requisitos de carácter metodológico y estadístico:
Las muestras deben estar constituidas preferiblemente por igual número de sujetos,
Los sujetos deben ser elegidos aleatoriamente para cada muestra y los tratamientos deben ser
asignados de la misma forma para cada una de ellas,
Se supone o demuestra estadísticamente, que las varianzas de los grupos son iguales; a esto, se
le denomina homogeneidad de las varianzas
Los grupos se suponen independientes entre sí, o sea, que cada grupo recibe un nivel de la
variable independiente diferente al recibido por cualquiera de los otros grupos.
SCentre S2entre
Fobt= S2entre
SC total
S2dentro
SCdentro S2dentro
Para determinar la variabilidad proveniente de cada una de las fuentes, SCentre, SCdentro y SCtotal, se
utilizan las siguientes fórmulas:
(∑ ) (∑ )
[∑ ]
(∑ )
∑ [∑ ]
141
Una vez desarrollada la partición de la varianza, que no es otra cosa que determinar cuánto de la
varianza total proviene de las dos fuentes principales: tratamientos y error, se organizan estos datos
en un cuadro resumen que permite la integración de todos los elementos requeridos para rechazar o
no la hipótesis nula, o sea: verificar o no la hipótesis alterna. El cuadro resumen está constituido por
los siguientes elementos:
Dentro de grupos (∑ )
∑ [∑ ]
Total
La Fo se compara con la F de la Tabla de Fisher, la cual se denomina Fcrítica (Fc): si la Fo es > que la
Fc, se rechaza la Ho que dice que todas las medias son iguales: Ho: µ1=µ2=…….=µk, y se considera
confirmada la H1 que dice que por lo menos una de las medias es diferente; µ1≠µ2….≠µk. En este
caso, los resultados indican que hay medias que son diferentes, pero no da información sobre cuál o
cuáles medias lo son. Para determinar esta(s) diferencia(s), se requiere la aplicación de pruebas
especializadas que permitirán obtener dicha información. Para efectos de este texto, presentaremos
la Prueba de Tukey como un ejemplo de pruebas especiales para determinar cuáles medias son las
diferentes. Si la Fo no fuese significativa, o sea, que la misma es igual o menor que la F c, se ha
determinado que las medias son iguales estadísticamente y el ANOVA finalizaría con este
indicador.
A continuación presentamos los resultados del experimento de la ansiedad, al que nos referimos con
anterioridad, y el desarrollo estadístico del Anova Simple correspondiente:
142
Tres psicólogos clínicos han desarrollado, de manera independiente, tres tratamientos para
reducir la ansiedad en estudiantes que aspiran a ingresar a la Escuela de Psicología. Los
tratamientos se aplican a tres muestras aleatorias de aspirantes, y posteriormente se les evalúa
su nivel de ansiedad, con el fin de evaluar si los tratamientos ejercen distintos efectos sobre los
grupos. A continuación se presentan los resultados obtenidos.
A partir de las puntuaciones originales obtenidas por cada sujeto en cada tratamiento, determine los
estadísticos básicos para el cálculo de ANOVA, tal y como se muestra en la Tabla anterior. Estos
estadísticos permitirán la partición de la varianza y el desarrollo del cuadro resumen, anteriormente
explicados.
1. Hipótesis estadísticas
2. Ni vel de si gnificación
00
0
143
3. Estadístico de prueba
4. Regla de decisión
5. Resultados
( )
[ ] ( ) ( 0 ) 0
0
( )
6. Decisión:
En vista de que Fo = 84.98 > Fc = 3.40, se rechaza la H0 y se confirma la H1: por lo menos
una de las medias es estadísticamente significativa.
De esta manera se ha concluido con esta etapa del ANOVA, y en vista de que los resultados son
significativos, es necesario determinar estadísticamente cuál o cuáles medias han resultado
diferentes. Este objetivo se alcanza desarrollando pruebas de significación que permiten comparar
las medias entre sí, tales como: la Prueba de Tukey, la Prueba de Newman-Keuls, la Prueba “t” si la
comparación es planeada previamente, la prueba de Scheffe, etc. En este caso, desarrollaremos la
prueba de Tukey para dos medias, por ser la misma de fácil desarrollo y comprensión.
La prueba de Tukey ha sido diseñada para comparar todos los pares de medias aritméticas
provenientes de un experimento; además, requiere que los tamaños muestrales sean iguales para
144
todas las muestras que participan del experimento. El estadístico de prueba es Qobtenida (Qo), cuya
fórmula es la siguiente
La prueba Q se utiliza para comparar las medias tomadas de dos en dos y su valor será siempre
positivo en vista de que en el numerador, la primera media será siempre la mayor y la segunda será
la media menor. Además, para estimar el error estándar en el denominador, se utiliza la varianza
dentro de los grupos (S2d) que ya fue determinada en el cuadro resumen.
7. Prueba Q
00
( )
1. Comparación
00
0
√
Decisión: en vista de que Qo = 7.84 > Qc = 3.53, se rechaza Ho y se confirma H1. La media
del tratamiento 2 es mayor que la del tratamiento 1. El tratamiento 1 presentó un promedio
de ansiedad menor que el tratamiento 2. Dicho tratamiento es más efectivo en la reducción
de la ansiedad.
2. Comparación
0
√
un promedio de ansiedad menor que el del tratamiento 2. Este tratamiento es más efectivo
en la reducción de la ansiedad.
3. Comparación
0
0
√
A continuación presentaremos los fundamentos del Anova Factorial, que es una aplicación de
dicha técnica pero para el caso en que hay más de una variable independiente afectando a una
variable dependiente. Se hará énfasis en el caso de dos variables independientes a distintos niveles
cada una, pero queda claro que el modelo se puede generalizar a más de dos variables
independientes.
La población original de la cual se extraen las muestras tiene una distribución normal
Los tamaños muestrales deben ser iguales, de tal manera que se minimicen las violaciones a
algunos supuestos.
Un psicólogo investigador está interesado en evaluar los efectos que tienen dos tratamientos
experimentales en la reducción de la ansiedad en aspirantes a ingresar a la Escuela de
Psicología. Además considera que la ansiedad también estará afectada al momento del
experimento por la situación laboral de los sujetos, la cual ha dividido en dos categorías:
trabaja y no trabaja.
146
Como se puede observar, la variable dependiente (ansiedad) estará afectada por dos variables
independientes: en primer lugar está la variable tratamiento a la que denominaremos (A), que
se presenta a dos niveles: el tratamiento 1 (A1) y el tratamiento 2 (A2); en segundo lugar, está la
variable situación laboral a la que denominaremos B y que se presenta también a dos niveles
trabaja (B1), no trabaja (B2).
DISEÑO FACTORIAL 2 X 2
Situación Tratamientos(A)
Laboral(B) A1 A2
B1 A 1B 1 A 2B 2
B2 A 1B 2 A 2B 1
La variable A está colocada de manera vertical y sub dividida en dos categorías, las cuales
corresponden a los dos tratamientos. La variable B, está colocada horizontalmente y corresponde
a la situación laboral en los niveles trabaja y no trabaja. El modelo se denomina de acuerdo al
número de variables participantes. En este caso, son 2 variables a 2 niveles, que generan un 2x2.
Si hubiese una variable a 3 niveles y otra a dos, el modelo se denominaría 2x3 ó 3x2, y así
sucesivamente. La colocación de las variables (columnas o filas) es una decisión que no afecta el
resultado del ANOVA.
En las celdillas A1B1…..hasta A2B2, se deben presentar, los puntajes de ansiedad de cada sujeto,
dependiendo del tratamiento recibido más su condición laboral. Es evidente que para cada
celdilla habrá una muestra de sujetos, preferiblemente asignados aleatoriamente y con igual
número de sujetos
El modelo de Anova Factorial determina que la variable dependiente, en este caso la ansiedad,
está afectada por cuatro fuentes principales de variabilidad:
1. Las diferencias en la ansiedad por recibir el tratamiento A1 en comparación con haber recibido
el tratamiento A2; En este caso, los efectos observados en A son independientes de los efectos
de la variable B.
2. Las diferencias en la ansiedad por pertenecer a una de las dos condiciones laborales: trabaja
(B1) o no trabaja (B2), son independientes de los efectos de la variable A.
3. Las diferencias en la ansiedad por haber recibido la combinación de las dos variables A y B, en
sus diferentes niveles, a lo cual se le denomina, interacción
4. Las diferencias en la ansiedad que provienen de la variabilidad aleatoria dentro de cada grupo,
la cual se considera que no es aditiva con ninguna de las fuentes anteriormente señaladas.
147
Al igual que en el ANOVA Simple, se estima la variación total proveniente de todas las fuentes,
y luego se hace una partición de la misma para evaluar cuánto aporta cada uno de los factores
participantes, tal y como se presenta a continuación:
Suma de Estimación de
Grados de
cuadrados la varianza Valor Fo
libertad (gl)
(SC) (σ2)
Número de
filas – 1
Número de
columnas - 1
Suma de
Cuadrados
total
(SCT) Total de
sujetos – celdas
A continuación se presentan las fórmulas y los gl requeridos para desarrollar la partición de los
cuadrados correspondientes al Anova Factorial.
(∑ ) (∑ ) (∑ )
1. ⌊ ⌋
1.1.
(∑ ) (∑ ) (∑ )
2. ⌊ ⌋
2.1.
(∑ ) (∑ ) (∑ ) (∑ ) (∑ )
3. [ ]
1.1.
(∑ ) (∑ ) (∑ ) (∑ )
4. ∑ [ ]
1.1.
5.
DATOS GENERALES
DISEÑO FACTORIAL 2 X 2
Situación Tratamientos(A)
Laboral(B) Totales
A1 A2
12 16
10 15 ∑X
9 12 ∑X2= 1517
B1 11 13 n = 10
9 14 Media= 12.1
∑ ∑ 0
Media: 10.2 Media: 14
17 20
15 21
14 18 ∑X 167
B2 15 16 ∑X2= 2837
16 15 n = 10
∑ ∑ 0 Media=16.7
Media: 15.4 Media: 18
∑X ∑X 0 ∑Xt
Totales ∑X2= 1718 ∑X2= 2636 ∑X2t= 4354
n = 10 n = 10
Media= 12.8 Media= 16
1. Hipótesis estadísticas
2. Ni vel de si gnificación
00
0
( )
149
3. Estadístico de prueba
4. Regla de decisión
Rechazar Ho si Fo > Fc = 4.49 para las tres principales fuentes de variación: filas, columnas
e interacción.
5. Resultados
Partición de cuadrados
( ) ( ) ( )
⌊ ⌋ 0
0 0
( ) ( 0) ( )
⌊ ⌋
0 0
( ) ( 0) ( ) ( 0) ( )
[ ] 0
0
( ) ( 0) ( ) ( 0)
[ ] 0
0 0
Dentro 48 16 3.0
Total 206.8 16
* Fo > Fc: estadísticamente significativa
6. Decisión:
De acuerdo a los resultados obtenidos, se rechaza la Ho para las filas y las columnas, pero
no se rechaza para la interacción. Estos resultados indican que:
150
a. Las medias de ansiedad son diferentes atendiendo a la condición laboral. Los que laboran
presentaron un promedio de ansiedad inferior a los que no laboran.
b. Las medias de ansiedad son diferentes atendiendo al tipo de tratamiento recibido. Los que
recibieron el tratamiento A1 presentaron un promedio de ansiedad inferior a los que
recibieron el tratamiento A2.
c. No hay diferencias significativas entre los promedios por la interacción de ambas variables
observados en cada una de las celdillas
Como se puede observar, la interacción (AxB) no resultó significativa, o sea, que los niveles de
ansiedad no son diferentes por la combinación de las dos variables independientes. En estos
casos, el análisis de la interacción finaliza al señalarse la ausencia de significatividad estadística.
Cuando la interacción es significativa, debe confeccionarse un Gráfico que refleje las diferencias
observadas entre las celdillas, específicamente entre las medias de las mismas; de no ser así, este
gráfico no es necesario confeccionarlo. Sin embargo, con el fin de que se observe como se
refleja la no significatividad en este ejemplo, presentaremos el gráfico de estos resultados.
INTERACCIÓN
20
A 18 A2, 18
N 16
A1, 15
S 14 A2, 14
I 12
E 10 A1, 10
D 8
A 6
4
D
2
0
B1 B2
LABORAL
Como se puede observar en la figura anterior, la línea azul representa las medias aritméticas
correspondientes al efecto combinado del tratamiento A1 con las dos condiciones laborales,
observándose que la ansiedad es más baja en los sujetos que trabajan en comparación con los
que no trabajan. Si se observa la línea rosada, representa los efectos combinados del tratamiento
A2 con las condiciones laborales: también en este caso, la condición de trabajo al combinarse
con dicho tratamiento, produce un nivel de ansiedad más bajo que con la condición de no
trabajar. En ambos casos el comportamiento es el mismo, lo que indica que no hay diferencias en
la ansiedad cuando se combinan ambos factores. Por esta razón, la interacción fue no
significativa.
¿Pero, qué sucede cuando los resultados indican efectos diferentes por interacción? A
continuación utilizaremos el mismo ejemplo de la ansiedad, pero cambiaremos las medias de
manera premeditada, para observar los efectos producidos. Suponga que las medias fueron las
siguientes:
151
A1B1 = 18
A1B2 = 10
A2B1 = 11
A2B1 = 16
INTERACCIÓN
20
B1, 18
18
A B2, 16
16
N
14
S
I 12 B1
B1, 11
E 10
B2, 10
D 8 B2
A 6
D 4
2
0
A1 A2
TRATAMIENTOS
Al inspeccionar este gráfico se observa, a diferencia del anterior, que las dos rectas se cortan, lo
cual es una evidencia inequívoca de que existe interacción entre las variables. Cuando A1 se
combina con B1, el promedio de la ansiedad es más elevado que cuando se combina con B2.
Sucede lo contrario con el tratamiento A2, que al combinarse con B1, el promedio de la ansiedad
es menor que cuando se combina con B2. Si esta combinación de valores se hubiese sometido al
ANOVA, la Fo hubiese resultado significativa, lo cual obliga a la confección del gráfico y a su
debida explicación.
Recapitulamos:
Si la Fo para la interacción resulta no significativa, no se rechaza la Ho, lo que significa que las
medias dentro de las celdas no son estadísticamente significativas; las combinaciones de
variables no producen efectos diferentes. En estos casos, no hay necesidad de desarrollar el
gráfico.
152
CONCEPTOS IMPORTANTES
Anova
F obtenida (Fo)
F crítica (Fc)
Anova simple
Suma de cuadrados (SC)
Partición de la varianza
Prueba de Tukey
Anova Factorial
Niveles de tratamiento
Interacción
153
EJERCICIOS PRÁCTICOS
C1 C2 C3 C4
51 56 51 71
50 60 65 80
56 66 76 66
60 55 55 70
45 71 61 76
55 65 65 60
Con alfa de 0.05, determine si hay diferencias significativas entre los tratamientos. De
ser así, determine las mismas.
3. Un psicólogo escolar está interesado en establecer si la ansiedad en los exámenes está afectada
por. A. el sexo (masculino y femenino) y B. situación laboral (trabaja tiempo completo, trabaja
parcialmente y no trabaja. Se Seleccionan 24 estudiantes universitarios de una misma carrera y
nivel académico, 12 hombres y 12 mujeres, y se distribuyen aleatoriamente en las condiciones
experimentales. Además, se les aplica una prueba de ansiedad una hora antes del desarrollo de
una prueba de matemáticas. Los resultados son los siguientes:
154
A
A1 A2
10 5
8 4
B1
10 6
10 5
6 8
8 6
B B2
7 6
5 6
4 8
5 7
B3
5 7
4 6
Con los datos resumidos en el cuadro anterior, desarrolle el ANOVA en dos sentidos
correspondiente. Debe determinar:
Efectos de fila
Efectos de columna
Efectos de interacción
En los casos en que se encuentren diferencias estadísticamente significativas,
debe aplicar la Prueba de Tukey.
Ansiedad inducida
Trabajo Alta Baja
9 3
7 5
Individual
5 5
8 3
12 7
10 5
Grupal
11 7
10 5
Con los datos resumidos en el cuadro anterior, desarrolle el ANOVA en dos sentidos
correspondiente. Debe determinar:
Efectos de fila
155
Efectos de columna
Efectos de interacción
En los casos en que se encuentren diferencias estadísticamente significativas,
debe aplicar la Prueba de Tukey.
APÉNDICE
157
APÉNDICE 1
Distribución normal
⁄
√
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
158
APÉNDICE 2
Valores críticos de la Distribución t de Student 𝛼⁄
-t 0 t
APÉNDICE 3
Valores críticos de la de Distribución F de Fisher
APÉNDICE 4
Probabilidades binomiales
p
n k
0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
1 0 0.9500 0.9000 0.8500 0.8000 0.7500 0.7000 0.6500 0.6000 0.5500 0.5000
1 1 0.0500 0.1000 0.1500 0.2000 0.2500 0.3000 0.3500 0.4000 0.4500 0.5000
2 0 0.9025 0.8100 0.7225 0.6400 0.5625 0.4900 0.4225 0.3600 0.3025 0.2500
2 1 0.0950 0.1800 0.2550 0.3200 0.3750 0.4200 0.4550 0.4800 0.4950 0.5000
2 2 0.0025 0.0100 0.0225 0.0400 0.0625 0.0900 0.1225 0.1600 0.2025 0.2500
3 0 0.8574 0.7290 0.6141 0.5120 0.4219 0.3430 0.2746 0.2160 0.1664 0.1250
3 1 0.1354 0.2430 0.3251 0.3840 0.4219 0.4410 0.4436 0.4320 0.4084 0.3750
3 2 0.0071 0.0270 0.0574 0.0960 0.1406 0.1890 0.2389 0.2880 0.3341 0.3750
3 3 0.0001 0.0010 0.0034 0.0080 0.0156 0.0270 0.0429 0.0640 0.0911 0.1250
4 0 0.8145 0.6561 0.5220 0.4096 0.3164 0.2401 0.1785 0.1296 0.0915 0.0625
4 1 0.1715 0.2916 0.3685 0.4096 0.4219 0.4116 0.3845 0.3456 0.2995 0.2500
4 2 0.0135 0.0486 0.0975 0.1536 0.2109 0.2646 0.3105 0.3456 0.3675 0.3750
4 3 0.0005 0.0036 0.0115 0.0256 0.0469 0.0756 0.1115 0.1536 0.2005 0.2500
4 4 0.0000 0.0001 0.0005 0.0016 0.0039 0.0081 0.0150 0.0256 0.0410 0.0625
5 0 0.7738 0.5905 0.4437 0.3277 0.2373 0.1681 0.1160 0.0778 0.0503 0.0313
5 1 0.2036 0.3281 0.3915 0.4096 0.3955 0.3602 0.3124 0.2592 0.2059 0.1563
5 2 0.0214 0.0729 0.1382 0.2048 0.2637 0.3087 0.3364 0.3456 0.3369 0.3125
5 3 0.0011 0.0081 0.0244 0.0512 0.0879 0.1323 0.1811 0.2304 0.2757 0.3125
5 4 0.0000 0.0005 0.0022 0.0064 0.0146 0.0284 0.0488 0.0768 0.1128 0.1563
5 5 0.0000 0.0000 0.0001 0.0003 0.0010 0.0024 0.0053 0.0102 0.0185 0.0313
6 0 0.7351 0.5314 0.3771 0.2621 0.1780 0.1176 0.0754 0.0467 0.0277 0.0156
6 1 0.2321 0.3543 0.3993 0.3932 0.3560 0.3025 0.2437 0.1866 0.1359 0.0938
6 2 0.0305 0.0984 0.1762 0.2458 0.2966 0.3241 0.3280 0.3110 0.2780 0.2344
6 3 0.0021 0.0146 0.0415 0.0819 0.1318 0.1852 0.2355 0.2765 0.3032 0.3125
6 4 0.0001 0.0012 0.0055 0.0154 0.0330 0.0595 0.0951 0.1382 0.1861 0.2344
6 5 0.0000 0.0001 0.0004 0.0015 0.0044 0.0102 0.0205 0.0369 0.0609 0.0938
6 6 0.0000 0.0000 0.0000 0.0001 0.0002 0.0007 0.0018 0.0041 0.0083 0.0156
7 0 0.6983 0.4783 0.3206 0.2097 0.1335 0.0824 0.0490 0.0280 0.0152 0.0078
7 1 0.2573 0.3720 0.3960 0.3670 0.3115 0.2471 0.1848 0.1306 0.0872 0.0547
7 2 0.0406 0.1240 0.2097 0.2753 0.3115 0.3177 0.2985 0.2613 0.2140 0.1641
7 3 0.0036 0.0230 0.0617 0.1147 0.1730 0.2269 0.2679 0.2903 0.2918 0.2734
7 4 0.0002 0.0026 0.0109 0.0287 0.0577 0.0972 0.1442 0.1935 0.2388 0.2734
7 5 0.0000 0.0002 0.0012 0.0043 0.0115 0.0250 0.0466 0.0774 0.1172 0.1641
7 6 0.0000 0.0000 0.0001 0.0004 0.0013 0.0036 0.0084 0.0172 0.0320 0.0547
7 7 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0016 0.0037 0.0078
8 0 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168 0.0084 0.0039
8 1 0.2793 0.3826 0.3847 0.3355 0.2670 0.1977 0.1373 0.0896 0.0548 0.0313
8 2 0.0515 0.1488 0.2376 0.2936 0.3115 0.2965 0.2587 0.2090 0.1569 0.1094
8 3 0.0054 0.0331 0.0839 0.1468 0.2076 0.2541 0.2786 0.2787 0.2568 0.2188
8 4 0.0004 0.0046 0.0185 0.0459 0.0865 0.1361 0.1875 0.2322 0.2627 0.2734
8 5 0.0000 0.0004 0.0026 0.0092 0.0231 0.0467 0.0808 0.1239 0.1719 0.2188
8 6 0.0000 0.0000 0.0002 0.0011 0.0038 0.0100 0.0217 0.0413 0.0703 0.1094
8 7 0.0000 0.0000 0.0000 0.0001 0.0004 0.0012 0.0033 0.0079 0.0164 0.0313
8 8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0007 0.0017 0.0039
9 0 0.6302 0.3874 0.2316 0.1342 0.0751 0.0404 0.0207 0.0101 0.0046 0.0020
9 1 0.2985 0.3874 0.3679 0.3020 0.2253 0.1556 0.1004 0.0605 0.0339 0.0176
164
p
n k
0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
9 2 0.0629 0.1722 0.2597 0.3020 0.3003 0.2668 0.2162 0.1612 0.1110 0.0703
9 3 0.0077 0.0446 0.1069 0.1762 0.2336 0.2668 0.2716 0.2508 0.2119 0.1641
9 4 0.0006 0.0074 0.0283 0.0661 0.1168 0.1715 0.2194 0.2508 0.2600 0.2461
9 5 0.0000 0.0008 0.0050 0.0165 0.0389 0.0735 0.1181 0.1672 0.2128 0.2461
9 6 0.0000 0.0001 0.0006 0.0028 0.0087 0.0210 0.0424 0.0743 0.1160 0.1641
9 7 0.0000 0.0000 0.0000 0.0003 0.0012 0.0039 0.0098 0.0212 0.0407 0.0703
9 8 0.0000 0.0000 0.0000 0.0000 0.0001 0.0004 0.0013 0.0035 0.0083 0.0176
9 9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0008 0.0020
10 0 0.5987 0.3487 0.1969 0.1074 0.0563 0.0282 0.0135 0.0060 0.0025 0.0010
10 1 0.3151 0.3874 0.3474 0.2684 0.1877 0.1211 0.0725 0.0403 0.0207 0.0098
10 2 0.0746 0.1937 0.2759 0.3020 0.2816 0.2335 0.1757 0.1209 0.0763 0.0439
10 3 0.0105 0.0574 0.1298 0.2013 0.2503 0.2668 0.2522 0.2150 0.1665 0.1172
10 4 0.0010 0.0112 0.0401 0.0881 0.1460 0.2001 0.2377 0.2508 0.2384 0.2051
10 5 0.0001 0.0015 0.0085 0.0264 0.0584 0.1029 0.1536 0.2007 0.2340 0.2461
10 6 0.0000 0.0001 0.0012 0.0055 0.0162 0.0368 0.0689 0.1115 0.1596 0.2051
10 7 0.0000 0.0000 0.0001 0.0008 0.0031 0.0090 0.0212 0.0425 0.0746 0.1172
10 8 0.0000 0.0000 0.0000 0.0001 0.0004 0.0014 0.0043 0.0106 0.0229 0.0439
10 9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0016 0.0042 0.0098
10 10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010
11 0 0.5688 0.3138 0.1673 0.0859 0.0422 0.0198 0.0088 0.0036 0.0014 0.0005
11 1 0.3293 0.3835 0.3248 0.2362 0.1549 0.0932 0.0518 0.0266 0.0125 0.0054
11 2 0.0867 0.2131 0.2866 0.2953 0.2581 0.1998 0.1395 0.0887 0.0513 0.0269
11 3 0.0137 0.0710 0.1517 0.2215 0.2581 0.2568 0.2254 0.1774 0.1259 0.0806
11 4 0.0014 0.0158 0.0536 0.1107 0.1721 0.2201 0.2428 0.2365 0.2060 0.1611
11 5 0.0001 0.0025 0.0132 0.0388 0.0803 0.1321 0.1830 0.2207 0.2360 0.2256
11 6 0.0000 0.0003 0.0023 0.0097 0.0268 0.0566 0.0985 0.1471 0.1931 0.2256
11 7 0.0000 0.0000 0.0003 0.0017 0.0064 0.0173 0.0379 0.0701 0.1128 0.1611
11 8 0.0000 0.0000 0.0000 0.0002 0.0011 0.0037 0.0102 0.0234 0.0462 0.0806
11 9 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0018 0.0052 0.0126 0.0269
11 10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0007 0.0021 0.0054
11 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0005
12 0 0.5404 0.2824 0.1422 0.0687 0.0317 0.0138 0.0057 0.0022 0.0008 0.0002
12 1 0.3413 0.3766 0.3012 0.2062 0.1267 0.0712 0.0368 0.0174 0.0075 0.0029
12 2 0.0988 0.2301 0.2924 0.2835 0.2323 0.1678 0.1088 0.0639 0.0339 0.0161
12 3 0.0173 0.0852 0.1720 0.2362 0.2581 0.2397 0.1954 0.1419 0.0923 0.0537
12 4 0.0021 0.0213 0.0683 0.1329 0.1936 0.2311 0.2367 0.2128 0.1700 0.1208
12 5 0.0002 0.0038 0.0193 0.0532 0.1032 0.1585 0.2039 0.2270 0.2225 0.1934
12 6 0.0000 0.0005 0.0040 0.0155 0.0401 0.0792 0.1281 0.1766 0.2124 0.2256
12 7 0.0000 0.0000 0.0006 0.0033 0.0115 0.0291 0.0591 0.1009 0.1489 0.1934
12 8 0.0000 0.0000 0.0001 0.0005 0.0024 0.0078 0.0199 0.0420 0.0762 0.1208
12 9 0.0000 0.0000 0.0000 0.0001 0.0004 0.0015 0.0048 0.0125 0.0277 0.0537
12 10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0008 0.0025 0.0068 0.0161
12 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010 0.0029
12 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002
13 0 0.5133 0.2542 0.1209 0.0550 0.0238 0.0097 0.0037 0.0013 0.0004 0.0001
13 1 0.3512 0.3672 0.2774 0.1787 0.1029 0.0540 0.0259 0.0113 0.0045 0.0016
13 2 0.1109 0.2448 0.2937 0.2680 0.2059 0.1388 0.0836 0.0453 0.0220 0.0095
13 3 0.0214 0.0997 0.1900 0.2457 0.2517 0.2181 0.1651 0.1107 0.0660 0.0349
13 4 0.0028 0.0277 0.0838 0.1535 0.2097 0.2337 0.2222 0.1845 0.1350 0.0873
13 5 0.0003 0.0055 0.0266 0.0691 0.1258 0.1803 0.2154 0.2214 0.1989 0.1571
13 6 0.0000 0.0008 0.0063 0.0230 0.0559 0.1030 0.1546 0.1968 0.2169 0.2095
13 7 0.0000 0.0001 0.0011 0.0058 0.0186 0.0442 0.0833 0.1312 0.1775 0.2095
13 8 0.0000 0.0000 0.0001 0.0011 0.0047 0.0142 0.0336 0.0656 0.1089 0.1571
165
p
n k
0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
13 9 0.0000 0.0000 0.0000 0.0001 0.0009 0.0034 0.0101 0.0243 0.0495 0.0873
13 10 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0022 0.0065 0.0162 0.0349
13 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0012 0.0036 0.0095
13 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0016
13 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
14 0 0.4877 0.2288 0.1028 0.0440 0.0178 0.0068 0.0024 0.0008 0.0002 0.0001
14 1 0.3593 0.3559 0.2539 0.1539 0.0832 0.0407 0.0181 0.0073 0.0027 0.0009
14 2 0.1229 0.2570 0.2912 0.2501 0.1802 0.1134 0.0634 0.0317 0.0141 0.0056
14 3 0.0259 0.1142 0.2056 0.2501 0.2402 0.1943 0.1366 0.0845 0.0462 0.0222
14 4 0.0037 0.0349 0.0998 0.1720 0.2202 0.2290 0.2022 0.1549 0.1040 0.0611
14 5 0.0004 0.0078 0.0352 0.0860 0.1468 0.1963 0.2178 0.2066 0.1701 0.1222
14 6 0.0000 0.0013 0.0093 0.0322 0.0734 0.1262 0.1759 0.2066 0.2088 0.1833
14 7 0.0000 0.0002 0.0019 0.0092 0.0280 0.0618 0.1082 0.1574 0.1952 0.2095
14 8 0.0000 0.0000 0.0003 0.0020 0.0082 0.0232 0.0510 0.0918 0.1398 0.1833
14 9 0.0000 0.0000 0.0000 0.0003 0.0018 0.0066 0.0183 0.0408 0.0762 0.1222
14 10 0.0000 0.0000 0.0000 0.0000 0.0003 0.0014 0.0049 0.0136 0.0312 0.0611
14 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0010 0.0033 0.0093 0.0222
14 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0019 0.0056
14 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0009
14 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
15 0 0.4633 0.2059 0.0874 0.0352 0.0134 0.0047 0.0016 0.0005 0.0001 0.0000
15 1 0.3658 0.3432 0.2312 0.1319 0.0668 0.0305 0.0126 0.0047 0.0016 0.0005
15 2 0.1348 0.2669 0.2856 0.2309 0.1559 0.0916 0.0476 0.0219 0.0090 0.0032
15 3 0.0307 0.1285 0.2184 0.2501 0.2252 0.1700 0.1110 0.0634 0.0318 0.0139
15 4 0.0049 0.0428 0.1156 0.1876 0.2252 0.2186 0.1792 0.1268 0.0780 0.0417
15 5 0.0006 0.0105 0.0449 0.1032 0.1651 0.2061 0.2123 0.1859 0.1404 0.0916
15 6 0.0000 0.0019 0.0132 0.0430 0.0917 0.1472 0.1906 0.2066 0.1914 0.1527
15 7 0.0000 0.0003 0.0030 0.0138 0.0393 0.0811 0.1319 0.1771 0.2013 0.1964
15 8 0.0000 0.0000 0.0005 0.0035 0.0131 0.0348 0.0710 0.1181 0.1647 0.1964
15 9 0.0000 0.0000 0.0001 0.0007 0.0034 0.0116 0.0298 0.0612 0.1048 0.1527
15 10 0.0000 0.0000 0.0000 0.0001 0.0007 0.0030 0.0096 0.0245 0.0515 0.0916
15 11 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0024 0.0074 0.0191 0.0417
15 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0004 0.0016 0.0052 0.0139
15 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010 0.0032
15 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005
15 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
16 0 0.4401 0.1853 0.0743 0.0281 0.0100 0.0033 0.0010 0.0003 0.0001 0.0000
16 1 0.3706 0.3294 0.2097 0.1126 0.0535 0.0228 0.0087 0.0030 0.0009 0.0002
16 2 0.1463 0.2745 0.2775 0.2111 0.1336 0.0732 0.0353 0.0150 0.0056 0.0018
16 3 0.0359 0.1423 0.2285 0.2463 0.2079 0.1465 0.0888 0.0468 0.0215 0.0085
16 4 0.0061 0.0514 0.1311 0.2001 0.2252 0.2040 0.1553 0.1014 0.0572 0.0278
16 5 0.0008 0.0137 0.0555 0.1201 0.1802 0.2099 0.2008 0.1623 0.1123 0.0667
16 6 0.0001 0.0028 0.0180 0.0550 0.1101 0.1649 0.1982 0.1983 0.1684 0.1222
16 7 0.0000 0.0004 0.0045 0.0197 0.0524 0.1010 0.1524 0.1889 0.1969 0.1746
16 8 0.0000 0.0001 0.0009 0.0055 0.0197 0.0487 0.0923 0.1417 0.1812 0.1964
16 9 0.0000 0.0000 0.0001 0.0012 0.0058 0.0185 0.0442 0.0840 0.1318 0.1746
16 10 0.0000 0.0000 0.0000 0.0002 0.0014 0.0056 0.0167 0.0392 0.0755 0.1222
16 11 0.0000 0.0000 0.0000 0.0000 0.0002 0.0013 0.0049 0.0142 0.0337 0.0667
16 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0011 0.0040 0.0115 0.0278
16 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0008 0.0029 0.0085
16 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0018
16 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002
16 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
166
p
n k
0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
17 0 0.4181 0.1668 0.0631 0.0225 0.0075 0.0023 0.0007 0.0002 0.0000 0.0000
17 1 0.3741 0.3150 0.1893 0.0957 0.0426 0.0169 0.0060 0.0019 0.0005 0.0001
17 2 0.1575 0.2800 0.2673 0.1914 0.1136 0.0581 0.0260 0.0102 0.0035 0.0010
17 3 0.0415 0.1556 0.2359 0.2393 0.1893 0.1245 0.0701 0.0341 0.0144 0.0052
17 4 0.0076 0.0605 0.1457 0.2093 0.2209 0.1868 0.1320 0.0796 0.0411 0.0182
17 5 0.0010 0.0175 0.0668 0.1361 0.1914 0.2081 0.1849 0.1379 0.0875 0.0472
17 6 0.0001 0.0039 0.0236 0.0680 0.1276 0.1784 0.1991 0.1839 0.1432 0.0944
17 7 0.0000 0.0007 0.0065 0.0267 0.0668 0.1201 0.1685 0.1927 0.1841 0.1484
17 8 0.0000 0.0001 0.0014 0.0084 0.0279 0.0644 0.1134 0.1606 0.1883 0.1855
17 9 0.0000 0.0000 0.0003 0.0021 0.0093 0.0276 0.0611 0.1070 0.1540 0.1855
17 10 0.0000 0.0000 0.0000 0.0004 0.0025 0.0095 0.0263 0.0571 0.1008 0.1484
17 11 0.0000 0.0000 0.0000 0.0001 0.0005 0.0026 0.0090 0.0242 0.0525 0.0944
17 12 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0024 0.0081 0.0215 0.0472
17 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0021 0.0068 0.0182
17 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0004 0.0016 0.0052
17 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010
17 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
17 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
18 0 0.3972 0.1501 0.0536 0.0180 0.0056 0.0016 0.0004 0.0001 0.0000 0.0000
18 1 0.3763 0.3002 0.1704 0.0811 0.0338 0.0126 0.0042 0.0012 0.0003 0.0001
18 2 0.1683 0.2835 0.2556 0.1723 0.0958 0.0458 0.0190 0.0069 0.0022 0.0006
18 3 0.0473 0.1680 0.2406 0.2297 0.1704 0.1046 0.0547 0.0246 0.0095 0.0031
18 4 0.0093 0.0700 0.1592 0.2153 0.2130 0.1681 0.1104 0.0614 0.0291 0.0117
18 5 0.0014 0.0218 0.0787 0.1507 0.1988 0.2017 0.1664 0.1146 0.0666 0.0327
18 6 0.0002 0.0052 0.0301 0.0816 0.1436 0.1873 0.1941 0.1655 0.1181 0.0708
18 7 0.0000 0.0010 0.0091 0.0350 0.0820 0.1376 0.1792 0.1892 0.1657 0.1214
18 8 0.0000 0.0002 0.0022 0.0120 0.0376 0.0811 0.1327 0.1734 0.1864 0.1669
18 9 0.0000 0.0000 0.0004 0.0033 0.0139 0.0386 0.0794 0.1284 0.1694 0.1855
18 10 0.0000 0.0000 0.0001 0.0008 0.0042 0.0149 0.0385 0.0771 0.1248 0.1669
18 11 0.0000 0.0000 0.0000 0.0001 0.0010 0.0046 0.0151 0.0374 0.0742 0.1214
18 12 0.0000 0.0000 0.0000 0.0000 0.0002 0.0012 0.0047 0.0145 0.0354 0.0708
18 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0012 0.0045 0.0134 0.0327
18 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0011 0.0039 0.0117
18 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0009 0.0031
18 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006
18 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
18 18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
19 0 0.3774 0.1351 0.0456 0.0144 0.0042 0.0011 0.0003 0.0001 0.0000 0.0000
19 1 0.3774 0.2852 0.1529 0.0685 0.0268 0.0093 0.0029 0.0008 0.0002 0.0000
19 2 0.1787 0.2852 0.2428 0.1540 0.0803 0.0358 0.0138 0.0046 0.0013 0.0003
19 3 0.0533 0.1796 0.2428 0.2182 0.1517 0.0869 0.0422 0.0175 0.0062 0.0018
19 4 0.0112 0.0798 0.1714 0.2182 0.2023 0.1491 0.0909 0.0467 0.0203 0.0074
19 5 0.0018 0.0266 0.0907 0.1636 0.2023 0.1916 0.1468 0.0933 0.0497 0.0222
19 6 0.0002 0.0069 0.0374 0.0955 0.1574 0.1916 0.1844 0.1451 0.0949 0.0518
19 7 0.0000 0.0014 0.0122 0.0443 0.0974 0.1525 0.1844 0.1797 0.1443 0.0961
19 8 0.0000 0.0002 0.0032 0.0166 0.0487 0.0981 0.1489 0.1797 0.1771 0.1442
19 9 0.0000 0.0000 0.0007 0.0051 0.0198 0.0514 0.0980 0.1464 0.1771 0.1762
19 10 0.0000 0.0000 0.0001 0.0013 0.0066 0.0220 0.0528 0.0976 0.1449 0.1762
19 11 0.0000 0.0000 0.0000 0.0003 0.0018 0.0077 0.0233 0.0532 0.0970 0.1442
19 12 0.0000 0.0000 0.0000 0.0000 0.0004 0.0022 0.0083 0.0237 0.0529 0.0961
19 13 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0024 0.0085 0.0233 0.0518
19 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0024 0.0082 0.0222
167
p
n k
0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
19 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0022 0.0074
19 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0018
19 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003
19 18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
19 19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
20 0 0.3585 0.1216 0.0388 0.0115 0.0032 0.0008 0.0002 0.0000 0.0000 0.0000
20 1 0.3774 0.2702 0.1368 0.0576 0.0211 0.0068 0.0020 0.0005 0.0001 0.0000
20 2 0.1887 0.2852 0.2293 0.1369 0.0669 0.0278 0.0100 0.0031 0.0008 0.0002
20 3 0.0596 0.1901 0.2428 0.2054 0.1339 0.0716 0.0323 0.0123 0.0040 0.0011
20 4 0.0133 0.0898 0.1821 0.2182 0.1897 0.1304 0.0738 0.0350 0.0139 0.0046
20 5 0.0022 0.0319 0.1028 0.1746 0.2023 0.1789 0.1272 0.0746 0.0365 0.0148
20 6 0.0003 0.0089 0.0454 0.1091 0.1686 0.1916 0.1712 0.1244 0.0746 0.0370
20 7 0.0000 0.0020 0.0160 0.0545 0.1124 0.1643 0.1844 0.1659 0.1221 0.0739
20 8 0.0000 0.0004 0.0046 0.0222 0.0609 0.1144 0.1614 0.1797 0.1623 0.1201
20 9 0.0000 0.0001 0.0011 0.0074 0.0271 0.0654 0.1158 0.1597 0.1771 0.1602
20 10 0.0000 0.0000 0.0002 0.0020 0.0099 0.0308 0.0686 0.1171 0.1593 0.1762
20 11 0.0000 0.0000 0.0000 0.0005 0.0030 0.0120 0.0336 0.0710 0.1185 0.1602
20 12 0.0000 0.0000 0.0000 0.0001 0.0008 0.0039 0.0136 0.0355 0.0727 0.1201
20 13 0.0000 0.0000 0.0000 0.0000 0.0002 0.0010 0.0045 0.0146 0.0366 0.0739
20 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0012 0.0049 0.0150 0.0370
20 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0003 0.0013 0.0049 0.0148
20 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0003 0.0013 0.0046
20 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0011
20 18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002
20 19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
20 20 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
168
APÉNDICE 5
Distribución t de Student:
Significancia de correlaciones de Pearson
APÉNDICE 6
Valores críticos del estadístico de Q
α 00 ( r a ) y α 0 0 ( e r tas)
Gl K niveles de K
(N – K)
2 3 4 5 6 7 8 9 10
3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99
5 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24
3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49
6 5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10
3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16
7 4.95 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8.37
3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92
8 4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68 7.86
3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74
9 4.60 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49
3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60
10 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 7.21
3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49
11 4.39 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99
3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.39
12 4.32 5.05 5.50 5.84 6.10 6.32 6.51 6.67 6.81
3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32
13 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53 6.67
3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25
14 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6.41 6.54
3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20
15 4.17 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44
3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15
16 4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22 6.35
2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11
17 4.10 4.74 5.14 5.43 5.66 5.85 6.01 6.15 6.27
2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07
18 4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20
2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04
19 4.05 4.67 5.05 5.33 5.55 5.73 5.89 6.02 6.14
2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01
20 4.02 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09
2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92
24 3.96 4.55 4.91 5.17 5.37 5.54 5.69 5.81 5.92
2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82
30 3.89 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76
2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73
40 3.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60
2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65
60 3.76 4.28 4.59 4.82 4.99 5.13 5.25 5.36 5.45
2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56
120 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30
2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47
∞ 3.64 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16
170
APÉNDICE 7
Tabla de números al azar
Primera serie
1-4 5-8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40
1 20 77 81 43 63 92 68 61 70 79 88 81 05 47 63 07 13 10 46 19
2 09 42 70 58 14 76 27 02 29 73 87 66 47 73 31 59 02 96 41 07
3 93 04 55 07 83 92 26 76 50 57 05 97 12 85 01 30 82 45 52 08
4 95 99 93 67 54 96 35 98 84 64 80 88 29 39 07 00 97 95 59 24
5 40 82 40 08 05 80 60 50 33 93 68 58 83 62 06 09 20 56 91 36
6 78 11 44 01 19 42 06 02 32 19 99 23 94 02 29 27 29 38 17 82
7 56 41 30 34 77 26 83 55 26 08 69 53 66 16 19 43 77 69 70 77
8 76 42 48 52 69 11 70 01 23 21 99 22 30 75 42 61 99 20 91 90
9 41 14 93 39 41 11 56 76 60 04 24 75 18 06 14 42 91 25 31 92
10 17 42 51 18 60 28 10 87 61 25 88 92 04 30 90 80 32 26 91 22
11 96 66 80 87 48 97 22 47 84 24 58 51 41 10 54 26 93 19 90 20
12 24 81 91 42 70 40 96 75 48 30 48 66 21 54 20 98 12 00 86 61
13 78 65 68 07 07 95 15 50 67 10 01 62 36 75 93 76 40 54 97 68
14 29 27 78 63 25 00 14 51 15 18 18 14 03 96 63 08 85 49 16 14
15 34 16 38 45 71 04 00 72 44 03 63 46 49 56 50 76 57 32 84 43
16 82 76 24 97 43 39 05 39 93 69 61 80 25 47 90 15 70 06 74 13
17 18 93 50 05 65 07 39 37 51 99 78 42 52 78 82 86 81 17 69 09
18 46 84 90 64 55 19 12 20 32 11 56 30 00 54 75 95 54 22 80 38
19 59 52 94 41 54 33 08 80 51 39 35 64 22 90 59 82 79 76 23 22
20 38 12 76 09 53 32 80 07 19 34 18 55 60 86 33 22 36 15 79 85
21 14 72 18 71 55 19 09 25 27 36 10 35 60 87 96 55 74 86 08 54
22 44 29 94 19 34 91 62 94 56 81 35 00 79 15 62 92 66 16 67 29
23 50 10 67 79 43 27 66 85 52 00 97 65 07 58 31 74 90 09 24 75
24 11 19 88 34 80 11 94 03 56 28 53 52 86 83 51 38 97 02 50 20
25 12 16 81 62 90 38 45 23 13 08 18 57 67 45 15 75 86 07 77 57
171
Segunda serie
1-4 5-8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40
1 83 79 21 68 54 51 23 50 78 17 73 51 94 71 91 31 29 97 13 16
2 27 98 04 97 52 48 19 33 82 16 00 34 30 67 58 00 80 80 92 26
3 75 57 42 55 59 91 72 75 66 75 39 70 55 24 09 19 70 22 42 10
4 60 73 07 27 71 94 68 70 48 81 40 91 16 24 45 24 54 03 18 03
5 27 42 15 67 94 44 48 62 37 53 83 15 90 90 60 19 78 62 44 70
6 57 27 77 75 38 18 24 32 91 53 78 91 33 38 31 95 85 11 33 87
7 22 79 42 39 32 65 83 60 74 63 56 77 47 21 88 36 43 10 19 41
8 61 94 32 42 83 81 92 40 99 00 05 66 33 61 32 10 43 15 49 25
9 24 28 53 76 13 61 73 22 50 51 75 08 10 90 71 58 22 42 46 83
10 06 75 46 13 77 68 97 05 56 73 34 86 42 22 37 75 94 87 57 72
11 83 81 98 41 67 38 97 30 12 31 87 76 81 07 32 88 42 29 94 58
12 33 66 09 91 21 26 52 57 47 14 27 75 07 84 50 96 95 12 25 01
13 63 14 10 59 10 68 27 91 00 17 36 79 01 79 65 43 13 98 52 21
14 84 43 66 38 65 72 14 55 93 78 24 57 38 10 54 53 92 41 82 56
15 36 75 92 36 76 77 89 27 06 57 37 70 36 09 99 90 66 44 91 89
16 17 23 20 39 81 03 49 79 68 20 94 45 95 92 63 06 55 29 20 82
17 57 09 57 60 40 64 00 77 31 05 83 44 96 62 56 42 42 68 46 42
18 33 49 47 96 50 21 75 68 28 12 46 25 72 64 50 72 75 16 67 00
19 80 52 82 00 02 12 67 61 43 23 14 53 10 66 16 29 06 60 23 20
20 45 29 44 64 44 70 22 10 70 26 43 49 28 51 69 52 85 95 98 58
21 16 04 54 67 60 53 51 60 82 45 56 26 08 89 42 25 93 76 69 73
22 81 09 97 91 19 60 91 96 53 66 45 33 75 09 67 42 59 02 18 97
23 20 61 83 96 58 12 64 99 78 24 94 36 99 60 07 70 27 40 97 15
24 43 17 00 05 86 39 95 58 12 35 84 31 97 75 50 52 06 88 27 79
25 27 84 00 90 41 44 05 43 36 93 01 37 91 93 24 78 00 12 04 12
172
Tercera serie
1-4 5-8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40
1 35 87 68 11 29 27 78 34 74 92 86 13 33 22 34 75 59 44 61 63
2 16 58 21 36 34 35 92 56 72 85 03 91 31 33 26 62 08 30 95 09
3 44 20 51 20 95 87 87 37 37 05 06 43 61 75 51 99 52 03 23 29
4 36 04 26 10 46 13 47 92 34 02 53 54 97 57 24 18 37 62 98 35
5 92 15 17 81 81 67 17 00 76 64 77 34 20 18 88 01 88 31 18 40
6 29 12 08 74 26 94 48 03 85 60 23 69 65 52 53 18 26 72 47 62
7 19 37 78 71 07 12 90 53 13 34 19 49 81 36 85 96 19 81 68 65
8 14 92 75 64 31 51 00 20 86 47 07 04 40 26 57 62 34 95 57 17
9 02 19 07 98 20 98 21 10 69 15 39 55 80 23 80 26 63 33 81 26
10 31 18 25 46 66 31 15 27 09 80 13 44 72 58 42 93 71 72 69 17
11 51 96 70 26 99 94 81 55 72 29 57 37 29 36 99 55 35 99 22 79
12 11 78 29 90 66 21 63 60 39 87 77 34 55 26 56 94 74 43 71 04
13 93 10 34 79 41 18 07 79 30 84 77 27 07 40 54 24 90 96 43 63
14 19 32 42 52 58 31 29 38 39 31 00 68 71 25 28 05 27 55 56 18
15 26 84 50 36 62 73 35 95 56 00 76 61 16 40 08 80 71 87 20 48
16 05 50 36 40 59 22 90 33 76 82 58 66 30 65 68 23 38 98 39 92
17 45 14 18 03 19 34 32 93 93 37 97 11 37 04 64 62 60 53 86 33
18 71 44 13 65 14 74 67 80 11 11 01 90 47 58 36 86 13 68 85 64
19 47 46 52 39 25 41 96 96 98 22 11 51 90 91 82 16 96 43 11 05
20 33 95 58 94 59 65 09 99 47 45 70 06 60 66 75 22 43 93 79 62
21 28 74 81 01 28 31 47 96 55 75 26 61 48 51 10 20 50 43 83 28
22 33 68 25 37 96 38 70 64 36 19 60 48 71 41 05 53 77 56 81 78
23 85 38 32 52 85 14 64 87 82 11 85 11 19 29 80 35 09 99 54 23
24 04 29 07 21 28 33 85 69 93 51 57 30 02 14 58 12 84 34 30 71
25 47 20 21 03 47 88 47 25 51 49 70 21 07 71 07 03 08 69 69 35
173
Cuarta serie
1-4 5-8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40
1 72 43 49 72 61 99 36 48 80 20 10 31 66 31 84 83 87 39 93 25
2 34 71 89 58 13 15 56 47 41 24 57 70 96 69 59 17 28 25 55 05
3 94 75 59 95 98 99 88 03 83 67 75 75 92 73 56 60 91 80 59 53
4 28 97 88 17 22 80 49 80 81 22 07 83 41 63 15 27 25 72 00 01
5 75 89 87 84 83 13 56 59 46 28 26 11 62 28 81 61 42 86 35 50
6 77 44 16 92 59 93 41 27 08 86 09 45 47 43 35 19 66 71 81 08
7 46 06 66 76 61 89 59 75 61 68 68 50 47 98 47 21 84 05 52 95
8 53 46 28 21 43 74 40 07 15 60 52 15 39 94 67 29 90 83 08 61
9 55 23 44 40 08 34 48 33 12 12 28 12 69 81 14 58 25 01 00 13
10 38 44 74 56 06 24 85 13 22 04 07 70 00 18 43 99 03 53 77 98
11 08 12 50 56 81 86 61 59 77 00 11 71 00 47 29 62 68 87 25 30
12 34 27 77 14 64 22 20 77 22 41 50 92 51 67 70 54 14 26 54 47
13 19 98 90 19 27 12 80 34 87 97 73 09 98 80 66 74 77 59 11 54
14 39 05 72 32 69 87 95 50 82 76 50 79 82 18 72 77 88 60 92 11
15 38 96 83 88 05 76 23 20 09 33 08 02 10 74 93 22 09 75 83 23
16 72 94 21 37 57 90 48 48 43 96 66 75 33 08 09 65 62 00 94 38
17 86 61 52 23 80 46 97 81 15 83 88 88 71 98 73 73 43 63 93 74
18 14 78 87 24 89 77 62 94 19 26 16 08 78 08 97 24 19 03 47 46
19 24 17 92 19 81 85 71 91 02 41 45 08 44 99 72 36 84 23 59 51
20 92 52 08 30 47 44 31 36 80 12 73 65 98 06 15 69 59 18 38 58
21 94 47 16 55 89 88 64 29 02 59 48 90 06 90 57 14 65 55 75 97
22 47 21 92 90 36 20 85 34 96 73 11 69 71 36 65 16 49 89 41 78
23 76 89 16 29 20 24 00 47 33 89 74 11 59 62 84 53 03 14 74 77
24 90 93 86 13 61 32 15 62 99 30 63 47 88 87 86 12 59 30 69 44
25 44 93 41 83 33 43 31 74 85 47 44 45 91 36 40 48 56 84 10 09
174
BIBLIOGRAFÍA
1. Aron, A., Aron E. (2001). Estadística para Psicología. Buenos Aires: Pearson Education, S.A.
3. Chow, Ya-Lun (1977). Análisis Estadístico. México: Nueva Editorial Interamericana, S.A.
4. Daniel, Wayne (1995). Estadísticas con Aplicaciones a las Ciencias Sociales y a la Educación.
5. Hopkins K., Hopkins, B.R., Glass, Gene (1997). Estadísticas Básica par a las Ciencias
7. Pagano, Robert (2006). Estadísticas para las Ciencias del Comportamiento. 7ª. Edición.
9. Pérez, César (2002). Estadística aplicada a través de Excel. México: Pearson Education, S.A.
10. Ritchey, Ferris (2008). Estadísticas para las Ciencias Sociales. 2ª. Edición. México: McGraw-
11. Triola, Mario (2004). Estadística. 9ª. Edición. México: Pearson Education.