ANALISIS DE VARIANZA

Mgr. Sonia Urquidi B.

Objetivos
• a) Explicar el análisis de la varianza • b) Describir las características de la distribución F • c) Organizar datos en una tabla ANOVA

Contenido
• • • • • 1. Introducción 2. Análisis de varianza en un sentido 3. Distribución F 4.Suma total de cuadrados 5. Tabla de análisis de varianza

1. Introducción
• En los temas anteriores: • Contrastación de hipótesis de dos medias poblacionales
• Y qué pasa si hay más de dos poblaciones, como ocurre normalmente?

1
• Ejemplo: • ¿Existen diferencias significativas en el rendimiento de tres grupos de operarios de una empresa según el método de adiestramiento empleado en cada uno de esos tres grupos?

Las preguntas que nos formulamos son: a) ¿Difieren las ventas por tipo de producto? b) ¿Difieren según el establecimiento? c) ¿Interaccionan el tipo y el establecimiento sobre las ventas? .1 • Ejemplo: Una cadena de electrodomésticos dispone de las cifras de ventas clasificadas por tipo de producto y establecimiento.

1 PARA RESPONDERNOS INTERROGANTES: A ESTAS UTILIZAMOS EL ANALISIS DE VARIANZA (ANOVA) .

(ANOVA) 1 Es un tipo de prueba que puede utilizarse para: Verificar diferencias entre las medias de dos o mas muestras Verificar un relación entre una escala nominal y una escala de intervalo Verificar relación entre una escala de intervalo o dos o mas escalas nominales .

Medias? 1 Examen de varianzas muestrales ANOVA .

TIPOS 1 Análisis en un sentido Análisis sentidos en dos .

el análisis de la varianza en un sentido consiste en analizar el comportamiento de la variable dependiente en las K subpoblaciones o grupos establecidos por los valores de la independiente.2. . ANALISIS DE VARIANZA EN UN SENTIDO O ANALISIS SIMPLE DE VARIANZA Dadas una variable dependiente cuantitativa y una variable independiente cualitativa. o factor.

C) y se quiere comprobar si estos diferentes métodos tienen efectos diferentes entre las notas. las cuales se miden sobre 10 puntos . Ejemplo: Supongamos que se emplean tres métodos diferentes para enseñar estadística a tres grandes grupos de estudiantes (A.B.2.

2. c: número de grupos. estratos o conglomerados o subpoblaciones k=3 .

.• Supuestos 2. Sobre la población: Las varianzas de todas las poblaciones son idénticas (hipótesis de homoscedasticidad). y cada una de las poblaciones tiene una distribución normal Sobre el proceso de obtención de la muestra: Se supone que se ha obtenido una muestra aleatoria independiente de cada una de las K poblaciones.

• Supuestos Hipotesis Nula:  Las medias de las poblaciones son iguales Ho :    1 2 2..   k .  .

Debe realizarse una comparación entre la variación dentro las muestras y la variación entre las muestras . El análisis consiste en establecer si existe o no diferencias significativas entre las medias.2.

2. La variación dentro de muestras depende de:  La habilidad innata de estudiantes al estudio  La motivación personal El esfuerzo individual El factor suerte Otros las los .

El esfuerzo individual. Otros Influencia adicional que pueden tener los tratamientos diferentes.La variación entre las muestras depende de:  Mismos factores que producen variación dentro una muestra : La habilidad innata de los estudiantes al estudio. La motivación personal. . El factor suerte.

El análisis de varianza es una relación de la variación entre muestras con la variación dentro las muestras. Para medir esta relación se utiliza la distribución F F es el cociente de la variación entre grupos y la variación dentro esos grupos .

estratos o conglomerados i x k .Varianza entre grupos i 1 DISTRIBUCION F  ( xi  x ) ni 2 k x k 1 Tamaño de la muestra i Media de la muestra del grupo i Media de toda la muestra Número de grupos.

Varianza dentro los grupos i 1 j 1 3   ( xij  xi ) nk c ni 2 x ij x i J ésimo valor de la variable en el grupo i Media de la muestra del grupo i Muestra total: n1+n2+…+ni n .

(n-k) grados de libertad .Por lo tanto se tiene 3 i 1  ( xi  x ) ni 2 c F k 1 i 1 j 1   ( xij  xi ) nk c ni 2 Con (k -1) .

Si todas las medias son iguales: x x x i j •F = 0 • Si F es un valor relativamente pequeño. no habrá diferencias significativas entre las medias .Conclusiones de la fórmula 3 • 1.

A mayor diferencia entre las medias: 3 x x i j • Existirá mayor varianza entre grupos. con relación a las varianzas dentro los grupos Por lo tanto F será mayor .Conclusiones de la fórmula • 2.

las cuales se miden sobre 10 puntos. si estos diferentes métodos tienen efectos diferentes entre las notas. Se toman muestras aleatorias de tamaño 5 de cada grupo con los siguientes resultados: .B.Ejemplo: 5 Supongamos que se emplean tres métodos diferentes para enseñar estadística a tres grandes grupos de estudiantes (A.C) y se quiere comprobar. a un nivel de confianza del 95%.

5 GRUPO A GRUPO B 3 6 5 4 7 4 7 7 4 8 GRUPO C 7 6 7 7 8 .

GRUPO A X11 3 GRUPO B 4 GRUPO C 7 6 5 X14 4 7 n1 X22 7 7 4 8 n2 6 7 X34 7 8 n3 .2.

05 . Elección del nivel de significación  = 0.1. Planteamiento de hipótesis H0 : Las medias de las poblaciones son iguales H1 : Las medias de las poblaciones no son iguales 2.

3. Descripción de la población y supuestos necesarios Muestras aleatorias independientes Poblaciones normales ( las notas en los grupos se distribuyen en forma normal) Las varianzas de las poblaciones son iguales .

4.12 . Selección del estadístico pertinente  (x  x) n K 2 i 1 i i F k 1   (x  x ) K ni i 1 j 1 ij i 2 nk Grados de libertad: 2.

5. Especificación de las zonas de rechazo y no rechazo 0.05 3.89 .

6. Recolección de datos y cálculo de estadísticos necesarios GRUPO A 3 6 5 GRUPO B 4 7 7 GRUPO C 7 6 7 4 7 4 8 7 8 x =5 1 x 2 =6 x 3 =7 .

Media general: x 5 * 5  6 * 5  7 * 5 / 15 x 6 .

Para el numerador o varianza entre grupos: x 5 x 6 x 7 1 2 3 x 6 2 k 3 i 1 2  ( xi  x ) ni k 1 2 2 c (5  6) * 5  (6  6) * 5  (7  6) * 5 2 10 / 2 .

Para el denominador o varianza dentro los grupos: GRUPO A k 3 x 5 n  15 K n 3 2   ( xij  xi ) 6 i 1 j 1 5 nk 4 (3  5)  (6  5)  (5  5)  (4  5)  (7  5) 7 (4)  (1)  (0)  (1)  (4)  10 1 i 2 2 2 2 2 .

Para el denominador o varianza dentro los grupos: GRUPO B x 6 1   (x  x ) K ni i 1 j 1 ij i 2 (4  6)  (7  6)  (7  6)  (4  6)  (8  6) 2 2 2 2 nk 2 (4)  (1)  (1)  (4)  (4)  14 4 7 7 4 8 .

Para el denominador o varianza dentro los grupos: GRUPO C x 7 1   (x  x ) K ni i 1 j 1 ij i 2 (7  7)  (6  7)  (7  7)  (7  7)  (8  7) 2 2 2 2 nk 2 (0)  (1)  (0)  (0)  (1)  2 6 6 7 7 8 .

3 26 12 .F 10 2  2 .

a un nivel de significación del 5% .3 es menor que el valor crítico de 3.7.89. Decisión Estadística Como 2. no se rechaza la hipótesis nula.

9. por lo tanto. los tres métodos no son significativamente diferentes . Conclusiones A un nivel de confianza del 95%. No existen diferencias significativas entre las tres muestras.

UTILIZANDO EXCEL A 3 6 5 4 7 B 4 7 7 4 8 C 7 6 7 7 8 Poner DATOS .

UTILIZANDO EXCEL DATOS ANALISIS DE DATOS Análisis de varianza de un factor No olvidarse Aceptar de alfa Rango de datos Aceptar .

5 30 6 3.31 Dentro de los grupos 26 122.RESUMEN Grupos Muestra Columna 1 5 Columna 2 5 Columna 3 5 Suma Promedio Varianza 25 5 2.5 ANÁLISIS DE VARIANZA Origen de las Promedio variacione Suma de Grados de de los s cuadrados libertad cuadrados F Entre grupos 10 2 52.5 35 7 0.89 .17 Total 36 14 Probabilid ad 0.14 Valor crítico para F 3.

depende de la variación del tratamiento y de la variación del error. cada una de ellas produce una suma de cuadrados: STC = SCTr + SCE STC es la variación de las observaciones alrededor de la media general STC =   (x  x) K ni i 1 j 1 ij 2 . Suma total de cuadrados 4 La variación total.4.

Suma de cuadrados de los 4 tratamientos Variación de la media de cada grupo en relación a la media El número de observaciones de general cada tratamiento Se multiplica por las diferencias al cuadrado entre la media de cada tratamiento o grupo y la media general y luego se suman SCTr = i ( xi  x ) 1 c 2 ni .

Las diferencias se elevan al cuadrado y se suman. se resta de cada observación en cada tratamiento. Esto se hace para todos los tratamientos y los resultados se suman. . variación de cada elemento en relación a su media La media de un tratamiento.Suma de cuadrados del error 4 SCE =   ( xij  xi ) 2 c ni i 1 j 1 Variación en cada estrato.

Cuadrados medios Para obtener la razón de varianza. después de obtener la suma de cuadrados. cada una se divide entre sus grados de libertad. Una suma de cuadrados dividida entre sus grados de libertad produce un cuadrado medio 4 .

M.Cuadrado medio total 4 C.M.T = STC/n-1 Cuadrado medio de los tratamientos C.E = SCE/n-k .M.Tr = SCTr/k-1 Cuadrado medio del error C.

4 Razón F para una prueba de medias es: CMTr F CME .

Fuente de variación 5. TABLA DE ANALISIS DE VARIANZA Suma de cuadrados Grados de libertad Media de cuadrados Valor 5 F Entre muestras (Tratamiento) SCTr SCE STC c-1 n-c n-1 SCTr/c-1 CMTr/CME Dentro muestras (error) Variación total SCE/n-c .

Sign up to vote on this title
UsefulNot useful