You are on page 1of 40

Análisis de Varianza – ANOVA

ORLANDO VALENCIA RODRÍGUEZ

2018

1
CONCEPTO DE ANOVA

ANOVA
(Analysis of Variance)

Comparación de tres
o más medias
poblacionales

Tamaño de
Varianzas Diferencia de medias
muestras

INFERENCIA

2
ORIGEN DE LA ANOVA

Ronald Aylmer Fisher (1890 – 1962),


matemático, estadístico y genetista Inglés.

También se conoce como "Anova de


Fisher« o "análisis de varianza de Fisher",
debido al uso de la distribución F de Fisher.
www.wikimedia.org/wiki/File:R._A._Fischer.jpg

3
APLICACIONES

• Comparación de métodos de aprendizaje


• Comparación de métodos de cualquier tipo
• Volumen de ventas por estrato.
• Facturación por EPS.
• Eficiencia de tratamientos de cualquier índole.
• Preferencia de candidatos por municipios.
• Producción según métodos.

4
FINALIDAD DE LA ANOVA

El análisis de varianza lo vamos a utilizar para


verificar si hay diferencias
estadísticamente significativas entre medias cuando
tenemos más de dos muestras o
grupos en el mismo planteamiento.

5
FINALIDAD DE LA ANOVA

n _ 2 N 2

 ( Xi  X )  ( Xi   )
S2  i 1
 
2 i 1
n 1 n 1 N

varianza

varianzas parciales

Aislar fuentes de variación

¿De dónde vienen las diferencias?

El análisis de varianza no constituye un método o procedimiento único…


análisis de varianza para varias muestras independientes,
6
ANOVA vs t de Student

¿No podríamos comparar todos los grupos de dos en dos con la t de Student?

Aumenta la probabilidad de Variación en las medias que


que algunas diferencias podemos encontrar en diversas
resulten significativas por azar muestras (Agrupados)

Procedimiento más práctico

7
ENTENDIENDO EL ANOVA – MEDIAS Y VARIANZAS
«Lo que directamente comprobamos en el análisis de varianza es si entre dos o más
varianzas existen diferencias estadísticamente significativas, pero lo que realmente
deseamos comprobar es si hay diferencias entre una serie de medias.»

Ejemplo 1:

8
ENTENDIENDO EL ANOVA – MEDIAS Y VARIANZAS
¿De dónde vienen las diferencias en este grupo total formado por las muestras A y B?
¿los sujetos son muy distintos entre sí dentro de cada grupo?

9
ENTENDIENDO EL ANOVA – MEDIAS Y VARIANZAS
Las medias son distintas: las medias de los grupos difieren entre sí más que los sujetos
entre sí dentro de cada grupo.

varianza = 1

Dentro de cada uno


de los dos grupos

varianza = 6,25
Entre Grupos

10
ENTENDIENDO EL ANOVA – MEDIAS Y VARIANZAS
Las medias son distintas: las medias de los grupos difieren entre sí más que los sujetos
entre sí dentro de cada grupo.

Ejemplo 2:

11
ENTENDIENDO EL ANOVA – DIFERENCIA DE MEDIAS
Comparación gráfica

12
DESCOMPOSICION DE LA VARIANZA

13
DESCOMPOSICION DE LA VARIANZA

Suma de cuadrados de
tratamiento
Suma de
Cuadrados Total
Suma de Cuadrados
del error

14
DESCOMPOSICION DE LA VARIANZA
Grupo (𝑻𝒊. ) Observaciones Totales No. Obs. Medias
1 𝒚𝟏𝟏 𝒚𝟏𝟐 … 𝒚𝟏𝒏 𝑻𝟏. 𝒏𝟏 𝒚𝟏.
2 𝒚𝟐𝟏 𝒚𝟐𝟐 … 𝒚𝟐𝒏 𝑻𝟐. 𝒏𝟐 𝒚𝟐.
3 𝒚𝟑𝟏 𝒚𝟑𝟐 … 𝒚𝟑𝒏 𝑻𝟑. 𝒏𝟑 𝒚𝟑.
. . . . . . . .
. . . . . . . .
. . . . . . . .
i 𝒚𝒊𝟏 𝒚𝒊𝟐 … 𝒚𝒊𝒏 𝑻𝒊. 𝒏𝒊 𝒚𝒊.
. . . . . . .
. . . . . . .
. . . . . . .
K 𝒚𝒌𝟏 𝒚𝒌𝟐 … 𝒚𝒌𝒏 𝑻𝒌. 𝒏𝒌 𝒚𝒌.
𝑻.. 𝑵 𝒚..

Para una observación:


𝒚𝒊𝒋 − 𝒚.. = 𝒚𝒊. − 𝒚.. + 𝒚𝒊𝒋 − 𝒚𝒊.

Para un tratamiento:
𝒏𝒊 𝒏𝒊 𝒏𝒊

(𝒚𝒊𝒋 − 𝒚..)𝟐 = 𝒚𝒊. − 𝒚.. 𝟐


+ (𝒚𝒊𝒋 − 𝒚𝒊. )𝟐
𝒋=𝟏 𝒋=𝟏 𝒋=𝟏
Para K tratamientos:
𝒌 𝒏𝒊 𝒌 𝒏𝒊 𝒌 𝒏𝒊

(𝒚𝒊𝒋 − 𝒚.. )𝟐 = 𝒚𝒊. − 𝒚.. 𝟐


+ (𝒚𝒊𝒋 − 𝒚𝒊. )𝟐
𝒊=𝟏 𝒋=𝟏 𝒊=𝟏 𝒋=𝟏 𝒊=𝟏 𝒋=𝟏 15
TABLA ANOVA

Fuente de Suma de
g.l. Cuadrados Medios Estadístico F
Variación Cuadrados
𝒌
Entre 𝒌 𝟐
𝒌−𝟏 𝟐 𝒊=𝟏 𝒏 𝒚𝒊. − 𝒚..
𝒏 𝒚𝒊. − 𝒚..
tratamientos 𝒌−𝟏
𝒊=𝟏
𝒌 𝒏𝒊 𝒌 𝟐
𝟐 𝒊=𝟏 𝒏 𝒚𝒊. − 𝒚..
𝒚𝒊𝒋 𝒌 𝒏𝒊
Dentro de los 𝒊=𝟏 𝒋=𝟏 𝒚𝒊𝒋 − 𝒚𝒊. 𝑭𝒌−𝟏,𝑵−𝒌 = 𝒌−𝟏
𝑵−𝒌 𝒏𝒊 𝟐
Tratamientos 𝒊=𝟏 𝒋=𝟏
𝑵−𝒌
𝒌
𝒚𝒊𝒋 − 𝒚𝒊.
𝟐 𝒊=𝟏 𝒋=𝟏
− 𝒚𝒊. 𝑵−𝒌
𝒌 𝒏𝒊
𝒌 𝒏𝒊
(𝒚𝒊𝒋 𝒊=𝟏 𝒋=𝟏(𝒚𝒊𝒋 − 𝒚.. )𝟐
Totales 𝑵−𝟏
𝒊=𝟏 𝒋=𝟏 𝑵−𝟏
− 𝒚.. )𝟐

16
ANOVA – La distribución “F de Snedecor”
La distribución de F: Para estimar cualquier cociente de Varianzas.

Al igual que la T es una familia de Curvas cuya curva exacta a usar


esta determinada por dos grados de libertad.

g.l. del numerador, g.l. del denominador

, sí F>1, hay diferencias significativas.

La varianza que colocamos en el numerador es la que nos interesa


comparar con la que consideramos normal o aleatoria.
17
ANOVA – La distribución “F de Snedecor”

18
SUPUESTOS PARA EL ANALSIS ANOVA

ANOVA
Supuestos

Normalidad Homocedasticidad Independencia

Kolmogorov-Smirnov, Levene, Bartlett, prueba de rachas


Lilliefor, Gráfico de Hartley, Cochran.
probabilidad normal.

19
MODELOS DE ANALSIS ANOVA

ANOVA
(Analysis of Variance)

ANOVA a una ANOVA a Análisis Diseño en


vía dos vías Factorial cuadrado Latino

20
FASES DEL ANALISIS DE VARIANZA – UN FACTOR

Identificar las variables

Selección de factor y niveles

Selección del diseño experimental

Realización del experimento

Análisis de datos

Conclusiones y Recomendaciones

21
ANALISIS DE VARIANZA UNA VIA - CONCEPTOS RELACIONADOS

FACTOR
(Variable cualitativa)

OPERARIO
NIVELES DEL
OPERARIO A OPERARIO B OPERARIO C FACTOR
7,5 6,5 7,2
6,4 6,1 7,3
6,2 6,8 7,7
7,2 6,6 7,4

UNIDAD
EXPERIMENTAL

22
ANOVA – RESUMEN DEL PROCEDIMIENTO

1. HIPOTESIS

Ho: Todos los promedios son iguales.


Ha: Al menos un promedio difiere de los demás.

2. ESTADISTICO DE PRUEBA. F=MCTR/MCE.

3. REGLA DE DECISIÓN Si el valor p (Sig) es menor que el


valor de alfa definido, se rechaza Ho.

23
ANOVA – EJEMPLO 1
Tenemos las puntuaciones de estudiantes clasificados por grupos.

24
ANOVA – VALIDACION DE SUPUESTOS

25
ANOVA – VALIDACION DE SUPUESTOS

26
ANOVA – EJEMPLO

27
ANOVA – EJEMPLO

28
ANOVA – EJEMPLO

CONCLUSION: No se acepta Ho, por lo tanto podemos por lo tanto


concluir que entre las medias existen diferencias significativas
29
ANOVA – EJEMPLO

30
ANOVA – EJEMPLO

31
ANOVA – EJEMPLO

Se supone que el tratamiento (después del moldeo) de un plástico que


se usa para lentes ópticos, mejora su visibilidad. Deben probarse
cuatro tratamientos. Para determinar si existe una diferencia en la
visibilidad media entre los tratamientos, se moldearon 28 piezas a
partir de una sola formulación y se asignaron aleatoriamente siete
piezas a cada tratamiento. Se determinó la visibilidad midiendo el
aumento en “Empañamiento” después de 200 ciclos de abrasión (los
aumentos menores indican mayor visibilidad). Los resultados se
presentan en la siguiente tabla. (Bello P., León D )

32
ANOVA - EJEMPLO

33
ANOVA - EJEMPLO
Validación de supuestos

34
ANOVA - EJEMPLO
Validación de supuestos

35
ANOVA - EJEMPLO

36
ANOVA - EJEMPLO

37
ANOVA - EJEMPLO

38
ANOVA - EJEMPLO

39
ANOVA - EJEMPLO

40