You are on page 1of 29

STATGRAPHICS – Rev.

4/d/yyyy

Comparación de Varias Muestras
Resumen
El procedimiento de Comparación de Varias Muestras está diseñado para comparar dos o más
muestras independientes de datos variables. Se hacen pruebas para determinar si hay o no
diferencias significativas entre las medias, varianzas y/o medianas de las poblaciones de las que
se tomaron las muestras. Además, se pueden desplegar los datos gráficamente de varias maneras,
incluyendo una gráfica de dispersión múltiple, una gráfica ANOM y una gráfica de medias.
Los resultados de este procedimiento son idénticos al los del procedimiento ANOVA de una vía.

StatFolio Muestra: multiple samples.sgp
Datos de Muestra:
El archivo pulse rates.sf6 contiene los resultados de un experimento reportado por Milliken y
Johnson (1992) en el que 78 trabajadores fueron asignados en seis grupos al azar. A cada grupo
se le dio una tarea a realizar y se midieron las tasas de pulsación luego de que cada individuo
trabajó por una hora en su tarea asignada. Luego de que varios individuos abandonaron el
estudio, los datos finales fueron:
Task 1
(Tarea 1)
27
31
26
32
39
37
38
39
30
28
27
27
34

Task 2
(Tarea 2)
29
28
37
24
35
40
40
31
30
25
29
25

Task 3
(Tarea 3)
34
36
34
41
30
44
44
32
32
31

Task 4
(Tarea 4)
34
34
43
44
40
47
34
31
45
28

Task 5
(Tarea 5)
28
28
26
35
31
30
34
34
26
20
41
21

Task 6
(Tarea 6)
28
26
29
25
35
34
37
28
21
28
26

Las n = 68 mediciones finales han sido arregladas en q = 6 columnas, una para cada grupo de
sujetos.
Alternativamente, los datos pudieron ser arreglados en una tabla con las tasas de pulsación en
una sola columna junto con una columna identificando qué tarea se le dio al sujeto. Una porción
de tal archivo se muestra abajo:

© 2006 por StatPoint, Inc.

Comparación de Varias Muestras - 1

STATGRAPHICS – Rev. 4/d/yyyy
Subject
(Sujeto)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

Pulse Rate
(Tasa de Pulsación)
27
31
26
32
39
37
38
39
30
28
27
27
34
29
28
37
24
35
40
40
31
30
25
29
25
34

Task
(Tarea)
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
3

Cualquier estructura de datos puede ser analizada por el procedimiento Análisis Multimuestral.
Si los mismos datos se usarán en otros procedimientos tales como el procedimiento de Modelos
Lineales Generales, estos deben ser estructurados de la segunda manera. Como parte de la
opción Guardar Resultados en este procedimiento, puede tomar un conjunto de datos que esté
estructurado en el formato de múltiples columnas y rearreglarlo como columnas de datos
cifrados.

Datos de Entrada
Cuando el procedimiento Comparación de Datos Múltiples se selecciona en el menú principal, el
primer cuadro de diálogo desplegado le pide especificar el formato en el que los datos serán
ingresados:

© 2006 por StatPoint, Inc.

Comparación de Varias Muestras - 2

4/d/yyyy • Múltiples Columnas de Datos: indica que cada muestra se ha colocado en una columna separada. las medias muestrales. • Estadísticos Muestrales: indica que las observaciones originales no están disponibles. • Columnas de Códigos y Datos: indica que todas las observaciones se han colocado en una sola columna. una columna para cada muestra. En este caso. Comparación de Varias Muestras . Sin embargo. se deben ingresar los nombres de las columnas en el siguiente cuadro de diálogo. • Muestras: dos o más columnas numéricas que contienen las observaciones.STATGRAPHICS – Rev. y las desviaciones estándar muestrales se han colocado en 3 columnas de la hoja de datos. algunas opciones no estarán disponibles. © 2006 por StatPoint.3 . con una segunda columna indicando a qué muestra pertenece cada observación. los tamaños de muestra. Inc. Múltiples Columnas de Datos Si los datos se han colocado en columnas separadas para cada muestra.

8000 38. • Seleccionar: subconjunto a seleccionar. pero se conocen la media y la desviación estándar de cada muestra. 4/d/yyyy • Seleccionar: subconjunto a seleccionar.9231 31.59966 6.00757 4.0833 35. • Códigos de Nivel: columnas numéricas o no numéricas que contienen un identificador para la muestra correspondiente a cada dato.66422 5.95751 5.8182 Desviación Estándar 4.0000 29.75012 Luego complete el segundo cuadro de diálogo como se muestra a continuación.STATGRAPHICS – Rev. Estadísticos de Muestra Si las observaciones originales no están disponibles.30827 6.5000 28. ingrese los estadísticos muestrales en la hoja de datos en columnas separadas. © 2006 por StatPoint. • Datos: columna numérica que contiene observaciones de todas las muestras. Comparación de Varias Muestras . Columnas Datos y Código Si los datos de todas las muestras se han colocado en una sola columna. Inc.4 . Tarea 1 2 3 4 5 6 Tamaño 13 12 10 10 12 11 Media 31. entonces ingrese el nombre de esa columna y de la columna que contiene los identificadores de grupo.

5 .0 a 41. Comparación de Varias Muestras Muestra 1: tarea 1 Muestra 2: tarea 2 Muestra 3: tarea 3 Muestra 4: tarea 4 Muestra 5: tarea 5 Muestra 6: tarea 6 Muestra 1: 13 valores en el rango de 26.0 a 37.0 a 40. Inc.0 También se despliegan los valores más alto y más bajo.0 Muestra 3: 10 valores en el rango de 30.0 a 47. • Tamaños de muestra: columna numérica que contiene los tamaños de cada muestra. © 2006 por StatPoint.0 Muestra 4: 10 valores en el rango de 28. • Etiquetas de la muestra: columna opcional que contiene etiquetas para cada muestra.0 Muestra 2: 12 valores en el rango de 24.0 Muestra 6: 11 valores en el rango de 21. • Desviaciones estándar muestrales: columna numérica que contiene las desviaciones estándar de cada muestra. Comparación de Varias Muestras .0 a 44. • Seleccionar: subconjunto a seleccionar. 4/d/yyyy • Medias muestrales: columna numérica que contiene las medias de cada muestra.0 Muestra 5: 12 valores en el rango de 20.0 a 39. Resumen del Análisis El Resumen del Análisis muestra el número de observaciones en cada muestra.STATGRAPHICS – Rev.

Esto fija cada punto al azar en dirección horizontal de tal modo que valores idénticos no se encimen: © 2006 por StatPoint. presionando el botón Separar de la barra de herramientas de análisis.STATGRAPHICS – Rev.6 . Inc. Comparación de Varias Muestras . 4/d/yyyy Gráfico de Dispersión El panel Gráfico de Dispersión grafica datos de cada grupo. tal vez deseé añadir una pequeña cantidad despacio horizontal a la gráfica. Dispersión según Muestra 50 respuesta 45 40 35 30 25 20 Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 Si hay muchos valores comunes.

Inc.0 16.30827 6.00757 4.0 Rango 13.0 30. medidas de dispersión – estadísticos que miden la dispersión de los datos. Comparación de Varias Muestras .5296% 18.7 .0833 35.0 44.0 Máximo 39.0 37.0 21.0 27. medidas de tendencia central – estadísticos que caracterizan el “centro” de los datos.9231 31.8 38.0 28.0 La mayoría de los estadísticos pertenecen a una de las siguientes categorías: 1.STATGRAPHICS – Rev. Nota: Agregar espacio a la gráfica de dispersión no tiene efecto en ningún cálculo.3675% 20.0 16.0 20.24203 Coeficiente de Variación 15.8276% 17.75012 6.0 41.0 40.2227% 14.0 24.3088 Desviación Estándar 4.59966 6.4831% 19.0 47. 2.0 47.0 21.66422 5. Estadísticos de Resumen El panel Estadísticos de Resumen calcula diferentes estadísticos que son usados comúnmente para resumir una muestra de datos variables: Resumen Estadístico Recuento Tarea 1 13 Tarea 2 12 Tarea 3 10 Tarea 4 10 Tarea 5 12 Tarea 6 11 Total 68 Promedio 31. 4/d/yyyy Dispersión según Muestra 50 respuesta 45 40 35 30 25 20 Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 La gráfica de arriba parece sugerir que las tasas de pulsación son de alguna manera más altas en aquellos que realizaron las tareas 3 y 4.0 19.95751 5.5 28.0 29.3646% 16.8182 32.0 14. © 2006 por StatPoint.0 20.3199% Mínimo 26.

Para una descripción detallada de cada estadístico. Los estadísticos incluidos por defecto en la tabla son controlados por las opciones del panel Estadísticos del cuadro de diálogo Preferencias. Panel de Opciones Seleccione los estadísticos deseados. Desviaciones estándar muestrales s j : las desviaciones estándar de cada grupo. la tasa promedio fue más alta para el grupo 4.STATGRAPHICS – Rev. Comparación de Varias Muestras . Inc. Son de interés particular: 1. 4/d/yyyy 3. © 2006 por StatPoint. Gráfico de Caja y Bigotes Este panel despliega una gráfica de caja y bigotes para cada muestra. Para las tasas de pulsación. Simetrías y kurtosis estandarizadas: Estos estadísticos deben estar entre –2 y +2 si los datos vienen de distribuciones normales. 2. 3. la selección puede cambiarse usando el Panel de Opciones. vea la documentación Análisis de una Variable. medidas de forma – estadísticos que miden la forma de los datos con respecto a una distribución normal.8 . Todos los estadísticos de simetría y de kurtosis están en el rango esperado para datos que vienen de distribuciones normales. Medias muestrales Y j : la tasa de pulsación promedio de sujetos de cada una de las 6 tareas. Con este procedimiento. así como la desviación estándar.

Los puntos exteriores. Comparación de Varias Muestras . En los datos muestrales. la variabilidad parece ser similar en cada muestra. a menos que haya valores inusualmente lejos de la caja (los que Tukey llama aberrantes). 4/d/yyyy Gráfico Caja y Bigotes Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 20 25 30 35 respuesta 40 45 50 Las gráficas de caja y bigotes se construyen de la siguiente manera: • Se dibuja una caja que va del cuartil inferior de la muestra hasta el cuartil superior.STATGRAPHICS – Rev. No hay puntos exteriores. Este es el intervalo cubierto por 50% de los datos cuando se ordenan de menor a mayor. aunque las locaciones muestran algunas diferencias. se coloca un signo de más en el lugar de la media muestral. • Se dibuja una línea vertical en la mediana (valor medio). Inc. se indican con símbolos de punto. los bigotes se dibujan hacia los valores más grande y más pequeño que no sean puntos exteriores. que son puntos abajo o arriba de la caja más de 1. • Si se requiere. Panel de Opciones © 2006 por StatPoint. Cualquier punto que esté abajo o arriba de la caja más de tres veces el rango intercuartil se llama aberrante lejano.5 veces el rango intercuartil. Si hay puntos exteriores.9 . y se indican por símbolos de punto con signos de suma superimpuestos encima de ellos. • Se dibujan bigotes desde los bordes de la caja hasta los valores más pequeño y más alto.

25( IQR j ) ⎛ 1 ⎞ ~ xj ± α /2 ⎜1 + ⎟ 2 1. correspondiente a la dirección de los bigotes. muestra la ubicación de la media muestral así como la mediana. Ejemplo – Gráfica de caja y bigotes cortada. • Mostrar Media: si se selecciona. • Muesca sobre la Mediana: Si se selecciona. se agrega un corte a la gráfica mostrando el error de estimación asociado a cada mediana. • Mostrar aberrantes: si se selecciona.10 . indica la ubicación de los aberrantes. z 1.STATGRAPHICS – Rev.35 n j ⎝ 2⎠ © 2006 por StatPoint. las dos medianas son significativamente diferentes en el nivel de confianza por defecto del sistema (establecido en la pestaña General del cuadro de diálogo Preferencias en el menú Edición). Gráfico Caja y Bigotes 50 respuesta 45 40 35 30 25 20 Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 Cada corte cubre el intervalo. para muestras de igual tamaño. si no se traslapan. 4/d/yyyy • Dirección: la orientación de la gráfica. Los cortes se escalan de tal forma que. (1) Comparación de Varias Muestras . Inc. La siguiente gráfica agrega grietas de mediana a un nivel de confianza del 95%.

los cortes para las tareas 4 y 6 no se traslapan. 4/d/yyyy ~ donde x j es la mediana de la j-ésima muestra. Comparación de Varias Muestras . Inc. IQRj es el rango intercuartil de muestra.STATGRAPHICS – Rev. Como las muestras varían en tamaño. la regla de traslape no funcionará a la perfección. nj es el tamaño de muestra. En aquellos casos en los que el tamaño de muestra es pequeño. © 2006 por StatPoint. Sin embargo. el corte puede extenderse más allá de la caja. resultando una apariencia de doblado. y zα/2 es el valor crítico superior (α/2)% de una distribución normal estándar.11 . lo que típicamente indicaría una diferencia significativa entre esas dos medianas a un nivel de significancia del 5%.

. como en este ejemplo. puede realizarse un análisis de varianza de una vía.51 Gl 5 62 67 Cuadrado Medio 138. Comparación de Varias Muestras .0015 La tabla divide la variabilidad total de las n mediciones en dos componentes: 1. Simplemente implica que no todas las medias son la misma.49 Valor-P 0.12 .) Suma de Cuadrados 694.. que mide la variabilidad entre tasas de pulsación de individuos a los que se les asignó la misma tarea. como se discute abajo. Los resultados se despliegan en la tabla ANOVA: Tabla ANOVA Fuente Entre grupos Intra grupos Total (Corr.888 30. la hipótesis nula se rechaza La importancia estadística del F-radio se juzga más fácilmente por su P-valor. 2. prueba la hipótesis nula H0: μ1 = μ2 = . Un componente “intragrupal”. 4/d/yyyy Tabla ANOVA Para determinar si las medias de los q grupos son significativamente diferentes entre sí o no.439 1916. el cual prueba la hipótesis de que la respuesta media para todas las muestras es la misma. © 2006 por StatPoint. Formalmente.08 2610.05. Si el P-valor es menor que 0. que mide la variabilidad entre tasas de pulsación de individuos con diferentes tareas. Un componente “intergrupal”. Esto no implica que cada media sea significativamente diferente que las otras. El F-radio es de particular importancia.STATGRAPHICS – Rev. Determinar cuáles medias son significativamente diferentes de cuáles otras requiere pruebas adicionales. = μq contra la hipótesis alternativa HA: no todos los μj iguales Si F es suficientemente grande. Inc. la hipótesis nula de medias iguales se rechaza a un nivel de significancia del 5%.9045 Razón-F 4.

© 2006 por StatPoint. Comparando la variabilidad entre los efectos en la gráfica de arriba con la de los residuales. ν R ni νT n (2) donde νR es los grados de libertad residuales. Esto escala los efectos de tal manera que la varianza natural de los puntos en el diagrama es comparable a la de los residuales. es una técnica para desplegar gráficamente la importancia de las diferencias entre las muestras. Cada efecto es multiplicado por un factor escalador. Comparación de Varias Muestras .STATGRAPHICS – Rev. ni es igual al número de observaciones en el i-ésimo nivel del grupo. y n es el número promedio de observaciones en todos los grupos. Es una gráfica de los efectos escalados. desarrollado por Hunter (2005). 4/d/yyyy ANOVA Gráfico El ANOVA Gráfico. Inc. Dependiendo de la localización relativa de los efectos.13 .0015 Residuos -13 -3 7 17 27 Al lado derecho del display está el P-valor para las diferencias dentro del grupo. tomado de la tabla ANOVA. La gráfica para los datos de muestra se muestra abajo: ANOVA Gráfico para Task 1 Grupos Task 6 Task 5 Task 2 Task 1 Task 3 Task 4 P = 0. podría también ser posible en algunos casos identificar visualmente cuáles muestras son significativamente diferentes de cuáles otras. donde el “efecto” es igual a la diferencia entre una media muestral y la gran media estimada. lo cual es hecho formalmente por las Pruebas de Rangos Múltiples descritas abajo. νT es los grados de libertad entre las diferencias grupales. es fácil ver que las diferencias son de una mayor magnitud que las que podrían explicarse solamente por el error experimental. los cuales se despliegan en la parte baja de la gráfica.

26515 -2.Tarea 4 Tarea 3 .Tarea 6 Tarea 2 .STATGRAPHICS – Rev.1049 -4.75816 4.9231 Tarea 3 10 35.42308 3.63869 4.55256 4.67423 4.71667 -6.Tarea 5 Tarea 4 .91667 1.0 porcentaje LSD Casos Media Tarea 6 11 28.85547 4.Tarea 5 Tarea 3 .63869 * indica una diferencia significativa.Tarea 6 Tarea 5 .75816 4.98182 8.Tarea 5 Tarea 1 .Tarea 2 Tarea 1 .839744 -3.0833 Tarea 1 13 31.96973 4.58333 2.8 Tarea 4 10 38.5 9.Límites 4.14 .Tarea 4 Tarea 1 .75816 4.Tarea 6 Tarea 4 .53672 4.Tarea 3 Tarea 2 .44862 4.Tarea 6 Sig.2 6.87692 -6. pueden realizarse Pruebas de Rangos Múltiples: Pruebas de Rangos Múltiples Método: 95.Tarea 3 Tarea 1 .18182 0.Tarea 4 Tarea 2 . • Media – la media muestral estimada Yj .0 Contraste Tarea 1 . Muestra: • Casos – el número de observaciones nj.Tarea 5 Tarea 2 .44862 4. 4/d/yyyy Pruebas de Rangos Múltiples Para determinar cuáles medias son significativamente diferentes de cuáles otras. Comparación de Varias Muestras . Inc. © 2006 por StatPoint.681818 +/.8182 Tarea 5 12 29. La mitad de arriba de la tabla muestra cada una de las medias muestrales estimadas en un orden de magnitud creciente.5 Tarea 2 12 31.3 6.Tarea 6 Tarea 3 .85547 4. * * * * * * Grupos Homogéneos X X XX XX XX X Diferencia 0.75816 4.07692 2.67423 4.

Tarea 3 es significativamente mayor que Tareas 5 y 6. Inc. 2. Para los datos de tasa de pulsación. – Se pone un asterisco junto a cualquier diferencia que sea estadísticamente significativamente diferente de 0 al nivel de significancia seleccionado. i.15 . 4/d/yyyy Grupos Homogéneos – una ilustración gráfica de cuáles medias son significativamente diferentes de cuáles otras. Además. Diferencia – la diferencia entre las dos medias muestrales. y 6. basada en los contrastes desplegados en la segunda mitad de la tabla. © 2006 por StatPoint.un intervalo estimado de la diferencia.. Asimismo. como tampoco lo hacen las tareas 3 y 4. tal como las tareas 4 y 6. Tarea 4 tiene una tasa de pulsación media significativamente mayor que cualquier tarea excepto Tarea 3. Δ$ j1 j2 = Y j1 − Y j2 • (3) Limites . ⎛ 1 1 ⎞ ⎟⎟ Δ$ j1 j2 ± M MS within ⎜⎜ + ⎝ n j1 n j2 ⎠ (4) donde M es una constante que depende del procedimiento seleccionado.• • STATGRAPHICS – Rev.e. Comparación de Varias Muestras . • Sig. Cualesquiera dos tareas que no tengan una X en la misma columna son significativamente diferentes entre sí. la primera columna de la tabla de arriba contiene X para las tareas 1. Cada columna de X’s indica un grupo de medias en las que no hay diferencias significativas estadísticamente. cualquier intervalo que no contenga al 0. 2 y 3 no muestran diferencias significativas. Por ejemplo. Panel de Opciones • Método: el método usado para hacer comparaciones múltiples. indicando que no hay diferencias significativas entre esas cuatro medias. usando el procedimiento de comparaciones múltiples seleccionado recientemente. las tareas 1. 5.

Los métodos disponibles son: • LSD . ya que la magnitud de los límites indica la diferencia más pequeña entre cualesquiera dos medias que puedan ser declaradas para representar una diferencia estadísticamente significativa. • Scheffe – diseñado para permitir la estimación de todos los posibles contrastes entre las medias muestrales (no solo en comparaciones por pares).STATGRAPHICS – Rev.q grados de libertad dejando un área de α/2 en la cola superior de la curva. Si todas las medias son iguales. La t de Tukey es igual a 1 / 2 veces el rango de la distribución Studentizada.q. Usa una múltiple relacionada con la distribución F. • Tukey HSD – ensancha los intervalos para permitir comparaciones múltiples entre todos los pares de medias. (1996). es probable que el procedimiento sea muy conservador. pues hace más difícil declarar cualquier par particular de medias como significativamente diferentes. Esto sólo debe usarse cuando la F-prueba en la tabla ANOVA indique diferencias significativas entre las medias muestrales. 4/d/yyyy • Nivel de Confianza: el nivel de confianza usado para la comparación múltiple seleccionada. M = (q − 1)Fα . La probabilidad de hacer un error Tipo I α aplica a cada par de medias de manera separada. Comparación de Varias Muestras . que es tabulada en algunos libros como en Neter et al. En este caso.forma un intervalo de confianza para cada par de medias al nivel de confianza seleccionado usando: M = tα / 2 . Este procedimiento se debe a Fisher y es llamado el procedimiento de la Diferencia Menos Significativa.n-q ( ) que usa la t de Tukey en vez de la t de Student. Tukey llamó a su procedimiento el de Diferencia Honestamente Significativa ya que controla la tasa de error experimental a α.q −1. Inc.16 . • Bonferroni – diseñado para permitir la estimación de cualquier número preseleccionado de contrastes.n−q (7) En esta instancia. El procedimiento de Tukey es más conservador que el procedimiento LSD de Fisher. Si se hace más de una comparación. usa una múltiple igual a © 2006 por StatPoint. la probabilidad total de llamar al menos a un par de medias significativamente diferentes cuando no lo son puede ser considerablemente mayor que α.n − q (5) donde t representa el valor de la distribución t de Student con n . usando (6) M = Tα/2. la probabilidad de declarar a cualquiera de los pares como significativamente diferentes en todo el experimento es igual a α. pues sólo se están estimando pares.

0 1. las medias se separan en grupos homogéneos en los que no hay diferencias significativas.9231 1.75797 35. Límite Superior 34.5151 Panel Tarea 5de Opciones 12 29.54184 29. tal vez uno no quiera ser tan conservador como cuando ya se han hecho las verificaciones finales.6048 27.815 El tipo de intervalo desplegado depende del Panel Tarea 3 10 35.2849 40.5 1.1874 Comparación de Varias Muestras . 4/d/yyyy M = tα /( q ( q −1)).4849 31.17 .7684 31.1024 de33.0833 1. Una discusión detallada de los procedimientos de Duncan y de Student-Newman-Keuls la dan Milliken y Johnson (1992). Eventualmente. La elección entre un procedimiento LCD y uno de múltiples comparaciones como el HSD de Tukey debe depender del costo relativo de hacer un error Tipo I (llamar diferentes a un par de medias que realmente no lo son) contra el costo de hacer un error Tipo II (no llamar diferentes a un par de medias que sí lo sean).2316 Tarea 6 11 28. ordena las medias en orden creciente y luego comienza a separarlas en grupos de acuerdo a valores del rango distribución Studentizada.75797 33.8182 1.3517 Opciones. En vez de eso.n − q (8) pues q(q-1)/2 se están estimando diferencias por pares. excepto que usa un valor crítico distinto al rango de la distribución Studentizada al definir los grupos homogéneos. Inc.STATGRAPHICS – Rev. Casos Media (s agrupada) Límite Inferior Tarea 1 13 31.7437 Tarea 2 12 31.3088 © 2006 por StatPoint.3151 Tarea 4 10 38.67616 26. éste no crea intervalos para las diferencias por pares.449 Total 68 32. • Student-Newman-Keuls – A diferencia de los métodos previos. En las primeras etapas de una investigación. 38.8 1. Tabla de Medias Esta tabla despliega cada media muestral junto a un intervalo de incertidumbre: Tabla de Medias con intervalos de confianza del 95.6048 28. • Duncan –similar al procedimiento Student-Newman-Keuls. Estos límites son usualmente más anchos que los de Tukey cuando se hacen todas las comparaciones por pares.0% Error Est.

STATGRAPHICS – Rev. n − q • (9) Errores Estándar (S individual) . Inc. • Nivel de Confianza: el nivel de confianza asociado a cada intervalo.despliega intervalos de confianza para el grupo Medias usando la desviación estándar de cada grupo separadamente: © 2006 por StatPoint.18 . 4/d/yyyy • Intervalos: el método usado para construir los intervalos. Los tipos de intervalos que pueden seleccionarse son: • Ninguno – no se despliega ningún intervalo. Comparación de Varias Muestras . • Errores Estándar (S agrupada) – despliega los errores estándar usando la desviación estándar intramuestral acumulada: Yj ± • sj2 (10) nj Intervalos de Confianza (S agrupada) – despliega intervalos de confianza para el grupo Medias usando la desviación estándar intramuestral acumulada: Y j ± tα / 2 .despliega los errores estándar usando la desviación estándar de cada muestra separadamente: Yj ± • MS within nj MS within nj (11) Intervalos de Confianza (S individual) .

19 . Si todos los tamaños de muestra son los mismos (o cercanos).STATGRAPHICS – Rev. Los intervalos están dados por: Yj ± 2M 2 MS within nj (13) donde M se define como en las Pruebas de Rango Múltiple.diseñados para comparar un número seleccionado de contrastes. el analista puede determinar cuáles medias son significativamente diferentes de cuáles otras usando los procedimientos LSD. Los intervalos de Tukey son usualmente más ajustados.0% de Fisher LSD 41 Media 38 35 32 29 26 Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 Los tipos de intervalos que pueden usarse son los mismos que en la Tabla de Medias arriba.n j −1 • sj 2 nj (12) Intervalos LSD . Gráfica de Medias Las medias muestrales pueden ser graficadas junto a los intervalos de incertidumbre: Medias y 95. • Intervalos Bonferroni . Inc. Scheffe o Bonferroni simplemente viendo si un par de intervalos se traslapan en dirección vertical o no. Esta fórmula también aplica para las tres selecciones de abajo. 4/d/yyyy Y j ± tα / 2. Un par de intervalos que no se traslapan indica una diferencia estadísticamente © 2006 por StatPoint. Tukey.diseñados para comparar todos los contrastes. • Intervalos Tukey HSD . Comparación de Varias Muestras .diseñados para comparar todos los pares de medias.diseñados para comparar cualquier para de medias con el nivel de confianza establecido. No son muy relevantes aquí. El intervalo de confianza establecido aplica para toda la familia de comparaciones por pares: • Intervalos Scheffe .

indicando que es significativamente diferente de todas las demás tareas. Verificación de Varianza Prueba Valor-P Levene's 0. En este caso. Verificación de Varianza. La prueba es apropiada tanto para grupos del mismo tamaño como para grupos de tamaño distinto. Un P-valor menor que 0. Prueba de Bartlett: compara un promedio ponderado de las varianzas dentro de la muestra con su media geométrica.20 . 4/d/yyyy significativa entre las medias al nivel de confianza seleccionado. como la © 2006 por StatPoint. Prueba de Cochran: compara la varianza máxima dentro de la muestra con la varianza muestra promedio. note que el intervalo de la tarea 4 se traslapa solo con el de la tarea 3. Prueba de Hartley: calcula el cociente entre la varianza muestral más grande y la más pequeña. Este estadístico debe compararse con una tabla de valores críticos.05 indica una diferencia significativa entre las desviaciones estándar dentro de la muestra a un nivel de significancia del 5%. Un P-valor menor que 0.05 indica una diferencia significativa entre las desviaciones estándar dentro de la muestra a un nivel de significancia del 5%.641611 0.: no todas las σj son iguales Las cuatro pruebas son: 1. Inc. 2. Una de las suposiciones que respaldan el análisis de varianza es que las varianzas de las poblaciones de donde se tomaron las muestras son las mismas. El panel Verificación de Varianza realiza alguna de varias pruebas para verificar esta suposición.668799 La hipótesis a probarse será: Hipótesis Nula: todas las σj son iguales Hipótesis Alt. Comparación de Varias Muestras . La prueba es apropiada sólo si todos los grupos son del mismo tamaño. 3.STATGRAPHICS – Rev.

Cualquier diferencia aparente entre las desviaciones estándar muestrales no es estadísticamente significativa a un nivel de significancia del 5%. H se hubiera excedido aproximadamente 2. Z ij = y ij − y j (14) El estadístico tabulado es el F estadístico de la tabla ANOVA. Prueba de Levene: realiza un análisis de varianza de una vía en las variables. 2. Inc. contra número de observación.. 3. 4. El procedimiento Comparación de Muestras Múltiple crea 3 gráficas de residuales: 1. los residuales se definen por: eij = y ij − y j (15) i. Residuales contra Muestras Esta gráfica es de ayuda para visualizar cualquier diferencia en la variabilidad de las muestras. ya que los P-valores son mayores que 0.05. no hay razón para rechazar la suposición de que las desviaciones estándar son las mismas para todos los grupos.1 para ser estadísticamente significativo a un nivel de significancia del 5%. Comparación de Varias Muestras . Gráficas de Residuales Como en todo modelo estadístico.e. contra valor predicho.STATGRAPHICS – Rev. Nota: esta prueba sólo es apropiada si el número de observaciones entre cada nivel de tratamiento es el mismo. es una buena costumbre examinar los residuales. © 2006 por StatPoint. Para 6 muestras y 62 grados de libertad para error experimental.21 . En un análisis de varianza de una vía. Para los datos de tasa de pulsación. (1996). los residuales son las diferencias entre los valores de datos observados y sus respectivas medias grupales. contra indicador muestral. 4/d/yyyy contenida en Neter et al.

Inc. y puede necesitarse transformar los datos antes de realizar el ANOVA. Usualmente es evidenciado por un patrón de forma de embudo en la gráfica de residuales.STATGRAPHICS – Rev. Gráfico de Residuos 12 residuos 8 4 0 -4 -8 -12 28 30 32 34 valor predicho 36 38 La heteroescedasticidad ocurre cuando la variabilidad de los datos cambia como lo hace la media. Residuales contra Predicho Esta gráfica es de ayuda para detectar cualquier heteroescedasticidad en los datos. Comparación de Varias Muestras .22 . Residuales contra Observación Esta gráfica muestra los residuales contra el número de fila en la hoja de datos: © 2006 por StatPoint. 4/d/yyyy Gráfico de Residuos 12 residuos 8 4 0 -4 -8 -12 Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 muestra El residual promedio en cada grupo es igual a 0.

La línea central se localiza en el promedio de todas las observaciones Y .23 . donde cada media muestral se grafica junto a una línea central y los límites de decisión superiores e inferiores. 4/d/yyyy Gráfico de Residuos 12 residuos 8 4 0 -4 -8 -12 0 20 40 observación 60 80 Si los datos se arreglan en orden cronológico. se presenta una aproximación de alguna manera distinta a la comparación de medias: Gráfico ANOM Con 95% Límites de Decisión Media 39 LDS=36.31 35 LDI=28.STATGRAPHICS – Rev.24 33 31 29 27 Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 Esta gráfica construye una tabla similar a un cuadro de control. ⎛ q −1⎞ ⎜⎜ ⎟⎟ q ⎝ ⎠ (16) Comparación de Varias Muestras . No es evidente ningún patrón así en la gráfica de arriba. cualquier patrón de los datos puede indicar una influencia exterior.38 37 LC=32.1−α MS within nj © 2006 por StatPoint. en la Gráfica de Análisis de Medias o Gráfica ANOM. Inc. Los límites de decisión se localizan en Y ± hn − q . Gráfica de Análisis de Medias (ANOM) Si el número de muestras está entre 3 y 20.

asignando rango de 1 al más pequeño y de n al mayor. La prueba es conducida por: 1. Es fácil ver a partir del cuadro de arriba que la tarea 4 tiene una tasa de pulsación significativamente mayor que el promedio. Pruebas de Wruskal-Wallis y Friedman Una alternativa para el análisis estándar de varianzas que compara medianas de grupo en lugar de medias es la Prueba Kruskal-Wallis. Hipótesis Alt. La ventaja de la gráfica ANOM es que muestra de un vistazo qué medias son significativamente diferentes que el promedio de todas las muestras. Ésta prueba las hipótesis: Hipótesis Nula: todas las medianas de grupo son iguales. El cuadro prueba la hipótesis nula de que todas las medias muestrales son iguales que la media. Inc. Comparación de Varias Muestras . Si dos observaciones cualesquiera son exactamente iguales. Cualquier media que caiga fuera de los límites de decisión indica que la media correspondiente difiere significativamente de la media total. Panel de Opciones • Nivel de Confianza: nivel usado para posicionar los límites de decisión. mientras que todas las demás medias caen dentro de los límites de decisión.STATGRAPHICS – Rev. © 2006 por StatPoint. Ordenar todos los n valores del más pequeño al más grande y clasificarlos. • Número de Decimales para Límites: número de decimales mostrados al desplegar los límites de decisión.24 .: no todas las medianas de grupo son iguales. El procedimiento es exacto si todos los tamaños de muestra son iguales y es aproximado si no difieren mucho. a las observaciones empatadas se les da el mismo rango que al promedio de las posiciones a las que ocurre el empate. 4/d/yyyy donde h es un valor crítico obtenido de una tabla de la distribución t multivariada. También lo hace usando un tipo de cuadro con el que muchos ingenieros y operadores están familiarizados. Esta prueba es mucho menos sensible a la presencia de puntos lejanos que lo que es una ANOVA de una vía y debe usarse cada vez que la suposición de normalidad dentro de las muestras no sea razonable.

e.25 . El resultado de la prueba Friedman es interpretada de la misma manera que el de la prueba Kruskal-Wallis. cuando los datos de cada fila corresponden a la misma unidad o bloque experimental. en el que cada fila de la hoja de datos representa una condición o bloque particular. i. 3. El resultado se muestra abajo: Prueba Kruskal-Wallis Tamaño de Muestra Rango Promedio Tarea 1 13 = 15.9995 P-Valor=33. En este ejemplo. Kruskal-Wallis es apropiado al comparar q muestras independientes.STATGRAPHICS – Rev. como en el ejemplo de arriba.05 si se opera a un nivel de significancia del 5%) indica Tarea 4 10 50. Inc. 4. Comparación de Varias Muestras .3846 Estadístico 0..5833 Tarea 3 10 46. © 2006 por StatPoint. Calcular los rangos promedio de las observaciones dentro de cada grupo R j . Friedman es apropiado al analizar un experimento en bloques. La prueba Friedman es apropiada para un diseño aleatorio de bloques.00684551 Tarea 2 12 30. 4/d/yyyy 2. esto aplicaría si los mismos 13 sujetos hubiesen realizado cada una de las 6 tareas.4 P-valores pequeños (menores que 0. Calcular un P-valor para probar las hipótesis.7083 entre las medianas de grupo. Tarea 5 12 Tarea 6 11 23. Calcular un estadístico de prueba para comparar las diferencias entre los rangos promedio. en lugar de diferentes sujetos para cada tarea.3636 que Panel de Opciones • Método: procedimiento a usar para comparar las medianas.35 hay diferencias significativas26.

© 2006 por StatPoint. P-Valores pequeños (menores que 0.6056 39.0 25. como en este ejemplo. Es menos sensible a puntos lejanos que la de Kruskal-Wallace. Mediana: la mediana muestral.9733 21. Panel de Opciones • Nivel de Confianza: nivel usado para los límites de confianza. n<=: de las observaciones en la muestra.5 34. Tamaño de Muestra: El número de observaciones en la muestra nj. Para cada muestra la tabla muestra: 1. cuántas son menores o iguales que la mediana total. pero también es menos poderosa cuando los datos vienen de distribuciones como la normal. 2. Tratando los n<= y las n> columnas como columnas de una tabla de contingencia de dos vías.0 29.0% 38.3244 28. 4/d/yyyy Prueba de la Medianas de Mood La Prueba de la Mediana de Mood es otro método de determinar si las medianas de todos los q grupos son iguales o no.0 37.0 30.8509 LC superior 95. cuántas son mayores o iguales que la mediana total.6809 44. Prueba de la Mediana de Mood Total n = 68 Gran mediana = 31.0 46. El resultado se muestra abajo. se calcula un estadístico de prueba ji-cuadrada.168 P-Valor= 0.3511 34. Abajo de la pantalla se muestra un estadístico de prueba y un P-Valor.26 . 3.0% 27.0 Muestra Tarea 1 Tarea 2 Tarea 3 Tarea 4 Tarea 5 Tarea 6 Tamaño de Muestra 13 12 10 10 12 11 n<= 7 8 2 2 8 8 n> 6 4 8 8 4 3 Mediana 31.5745 Estadístico = 12.05 operando a un nivel de significancia del 5%) llevan a la conclusión de que no todas las medianas son iguales.0325567 Arriba de la tabla se despliega el número total de observaciones n y la mediana total.0 28.STATGRAPHICS – Rev.5318 23. Inc.0 LC inferior 95. 4.0 29. CL: los límites de confianza superior e inferior para la mediana de la población de donde vino la muestra. 5. Comparación de Varias Muestras .8936 35. n>: de las observaciones en la muestra.

3. 2. Gráfico de Medianas con Intervalos del 95. Medianas – las q medianas muestrales. Etiquetas – una etiqueta para cada muestra. Guardar Resultados Los siguientes resultados pueden guardarse en la hoja de datos: 1. 9.STATGRAPHICS – Rev. Comparación de Varias Muestras . 8. 6. Errores Estándar – los errores estándar de cada media muestral. MS within / n j .27 . Desviaciones Estándar – las q desviaciones estándar muestrales 5. Inc. Columna Códigos – n códigos que identifican la muestra correspondiente a cada observación en la Columna de Datos.0% de Confianza 51 respuesta 46 41 36 31 26 21 Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 Panel de Opciones • Nivel de Confianza: nivel usado para los límites de confianza. Recuentos – los q tamaños de muestra nj. Medias – las q medias muestrales. Columna de Datos – las n observaciones arregladas en una sola columna. © 2006 por StatPoint. 4. 10. 7. 4/d/yyyy Gráfico de Medianas El Gráfico de Medianas despliega los intervalos de confianza para las medianas desplegadas por el panel Prueba de la Mediana de Mood. Residuales – los n residuales. Rangos – los q rangos muestrales.

Inc.STATGRAPHICS – Rev. ⎛ A ⎞ C = ( q − 1)⎜ ⎟ ⎝ 1 − A⎠ (18) es comparada con una F distribución con (n/q . Prueba de Bartlett El estadístico desplegado se calcula por q ⎤ 1⎡ B = ⎢( dfe) ln( MSE ) − ∑ (n j − 1) ln s 2j ⎥ C⎣ j =1 ⎦ ( ) (19) donde © 2006 por StatPoint.1)(q . Comparación de Varias Muestras .F. 4/d/yyyy Cálculos Análisis de Varianza Fuente Intergrupa l Intragrupa l Suma de Cuadrados q ( SS between = ∑ n j Y j − Y j =1 q nj ( SS within = ∑ ∑ Yij − Y j j =1 i = 1 q nj ( SS total = ∑ ∑ Yij − Y Total j =1 i =1 D.1) y (n/q .28 .1) grados de libertad. ) 2 ) 2 ) Media cuadrática df between = q − 1 q ( ) df within = ∑ n j − 1 j =1 MSbetween = SSbetween df between MS within = SS within df within F-Radio F= MSbetween MSwithin 2 n-1 Prueba de Cochran El estadístico desplegado se calcula por A= ( ) max s 2j q ∑s j =1 (17) 2 j Para probar significancia estadística.

29 . Prueba de Hartley H= ( ) min (s ) max s 2j 2 j (23) Límites de Confianza de Medianas Los límites desplegados son una interpolación no lineal de intervalos de confianza a los niveles de confianza superior e inferior más cercanos que el nivel requiera. el intervalo que va de la d-ésima observación más pequeña en la muestra a la désima observación más grande forma un intervalo de confianza para la mediana con un nivel de confianza 1 – 2 PB(d-1). Inc. Comparación de Varias Muestras . © 2006 por StatPoint. 4/d/yyyy C = 1+ ⎡⎛ q ⎢⎜ ∑ n j − 1 3( q − 1) ⎢⎣⎝ j =1 MSE = 1 q ∑ n − 1 s 2j dfe j =1 j ( 1 q ( ( ) −1 ⎞ 1 ⎤ ⎟− ⎥ ⎠ dfe ⎥⎦ (20) ) (21) ) dfe = ∑ n j − 1 j =1 (22) B es comparada con una distribución ji-cuadrada con (q-1) grados de libertad. Luego de ordenar las observaciones. donde PB representa la distribución binomial con p = 0.STATGRAPHICS – Rev.5 y n = nj.