You are on page 1of 18

ANALISIS DE VARIANZA

El análisis de la varianza (ANOVA, ANalysis Of VAriance, según terminología


inglesa) es una colección de modelos estadísticos y sus procedimientos asociados, en
el cual la varianza está particionada en ciertos componentes debidos a diferentes
variables explicativas.

Las técnicas iniciales del análisis de varianza fueron desarrolladas por el estadístico
y genetista R. A. Fisher en los años 1920 y 1930 y es algunas veces conocido como
"Anova de Fisher" o "análisis de varianza de Fisher", debido al uso de la
distribución F de Fisher como parte del contraste de hipótesis.

El análisis de varianza se sigue para facilitar una prueba de hipótesis, mediante la


cual la variación total presente en un conjunto de datos se particiona en varias
componentes, algunas se atribuyen a variables explicativas o factores y otra al azar
(error inmerso en el modelo) de modo que en el análisis es posible averiguar la
magnitud de las contribuciones de cada una de las fuentes a la variación total.

El análisis de varianza tiene su aplicación más amplia en análisis de los datos


obtenidos a partir de experimentos.

El análisis de varianza se utiliza en dos fines:

 Estimar y probar la hipótesis acerca de las varianzas de las poblaciones. 


 Estimar y probar la hipótesis acerca de las medias de las poblaciones. 
 El


análisis de varianza para los diversos diseños, sigue el siguiente
procedimiento: 


1°. Modelo. - El modelo insistirá de una representación simbólica de un valor típico


tomado de los datos que se están analizando.

2°. Suposiciones. - Especificaciones que fundamentan el modelo.


3°. Hipótesis. - Se indicarán las hipótesis que puedan probarse de acuerdo 


al modelo se formulará H0 y H1 .

4°. Cálculos. - Se aplicarán los cálculos aritméticos apropiados.
 5°. TABLA


ANVA. - Los resultados de los cálculos, se resumirán en una

tabla que permitirá una estimación rápida y conveniente de los resultados. 6°.
Decisión. - Se tomará una decisión estadística para rechazar o no H0 .
I. DISEÑO COMPLETAMENTE ALEATORIZADO (DCA)
Un diseño completamente aleatorizado (DCA), es el diseño en el cual las unidades
son asignadas completamente al azar a los tratamientos, o viceversa. Esto es un
diseño que no supone restricciones tales como bloqueo en la distribución de los
tratamientos a las unidades experimentales.

Este diseño debe limitarse su uso a casos en los cuales se dispone de unidades
experimentales homogéneas. Si no pueden obtenerse tales unidades, debe utilizarse
algún bloqueo para incrementar la eficiencia del diseño.

MODELO.

 Suponga que se tiene K niveles de un solo factor que se desean comparar. 


 La respuesta observada a partir de cada uno de los K niveles o tratamientos es


una variable aleatoria. Los datos aparecen en la tabla. Yij representa la
i_ésima 
 observación tomada bajo el tratamiento “j”.
 


Es posible describir las observaciones de la tabla mediante el modelo estadístico


lineal.


 Yij = u + tj + Ɛi j ;
i = 1, 2, ... , n


 j = 1, 2, ... , k ; modelo efectos fijos 


Donde: Yi j : ij-ésima observación.



μ : efecto medio verdadero; parámetro común a todos TT0S.

tj : efecto del j-ésimo tratamiento.



 Ɛi j : incluye los efectos de todos los otros factores extraños 

Representación simbólica de los datos en un D.C.A 


4. Suposiciones

El modelo a efectos fijos implica que se está interesado solo en “k” poblaciones
representados por los datos de la muestra. Cualquier inferencia que pueda hacerse se
aplica solo a estas poblaciones.

Suposiciones para el modelo de efectos fijos:

a) Los k conjuntos de datos observados constituyen “k” muestras aleatorias


independientes de las poblaciones respectivas.
b) Cada una de las poblaciones de las cuales proviene las muestras está
distribuida normalmente con media j y varianza j2.

c) Las k poblaciones tienen la misma varianza: .


d) los

HIPOTESIS.


Puede probarse la hipótesis:

H0 : 1= 2= . . . = k
 H1 : No todas las u j son iguales

Si las medias de las poblaciones son iguales, cada efecto del tratamiento es igual a
cero, de modo que alternativamente la hipótesis puede enunciarse como:

H0 :μj = 0; J=1, 2, . . . k
 H1 : no todas las μj =0
 Se elige el nivel de significación α :

Si H0 es verdadero y si σ21 = σ22 = . . . = σ2k y las poblaciones tienen una distribución


normal; la situación se observa como fig. 1

Si H0 es falso pueda serlo debido a que una de las medias de las poblaciones difiere
del resto que son iguales entre si, o bien puede ocurrir que todas las medias
poblacionales sean diferentes. Es

decir al menos una de las μj para cualquier valor de j=1,...,k ; sea diferente del resto

4. CALCULOS.

Se Desarrollará el análisis de varianza para el modelo de efectos fijos, clasificación


en un sentido, aquí:
k

  0
j
Partición de la suma de cuadrados:
6. DECISION.
 La decisión de realizar o no H0 se toma definiendo la región crítica
(RC)
EJEMPLO:

Un ingeniero desea mejorar la resistencia a la compresión del concreto. Sospecha


que la resistencia es una función de la concentración de un aditivo. Decide investigar
con distintas concentraciones: 5, 10, 15, 20 y 25 %. Han de tomarse cinco
observaciones para cada concentración de aditivo, empleando una planta piloto. Las
25 observaciones necesarias se realizan en forma aleatoria, y los datos obtenidos se
muestran en la tabla.

Tabla 1.1: Resistencia a la compresión del concreto (PSI = lib/pulg2 )

Donde: Totales = T = ΣTi

Numero de observaciones = n

Ŷ = T/ n

¿Qué conclusiones se puede extraer con α = 0,05?


1. Modelo: yij = μ + tj + Ɛij (modelo a efectos fijos o de clasificación en un solo
sentido)
2. Suposiciones:

 Se tiene 5 muestras independientes 


 Cada provisión N(μj , σ j). 



2

2 2 2 2
Poblaciones con variaciones homogéneas: 
 σ1 = σ2 = ... = σ5 = σ

 ΣΣƬj=0 y Ɛij DNI(O,σ2) 


3.Hipótesis:
 H0 :μ1 =μ2=...=μ5
 H1 : No todas las 5 μ son iguales 


4.Nivel de significación: α= 0.05 


5.Prueba estadística: usamos la siguiente estadística de prueba. 


6. Regla de decisión:


Si Fc > Fα,(k - 1),(n - k) H0 se rechaza a un nivel de α

Si Fc ≤ Fα,(k - 1),(n - k) H0 no se rechaza.

7. Cálculos: se realizan los cálculos para obtener las estimaciones en la tabla


ANOVA; es decir: El ANOVA resultante se muestra en la siguiente tabla:

Tabla: análisis de resistencia para los datos de resistencia a la tensión.


De la tabla se deduce que


F0.05,4,20 = 2.86 y F0 = 14.76


Entonces H0 se rechaza al nivel de 0.05

Se concluye que la concentración del aditivo influye de manera significativa en la


resistencia a la compresión del concreto.

II. DISEÑO DE BLOQUES COMPLETOS ALEATORIOS

Además de probar el efecto de los Bloques


Tabla 1: Análisis de varianza de un diseño de Bloques completos Aleatorios

Fuente de Suma de Grados de Cuadrado Medio F0


Variación Cuadrados Libertad

EJEMPLO:
III. DISEÑO CUADRADO LATINO
El agrupamiento de las unidades experimentales en dos direcciones (filas y
columnas) y la asignación de los tratamientos al azar en las unidades, de tal forma
que en cada fila y en cada columna se encuentren todos los tratamientos constituye
un diseño cuadrado latino.

Características:

1. Las unidades experimentales se distribuyen en grupos, bajo dos criterios de


homogeneidad dentro de la fila y dentro de la columna y heterogeneidad en
otra forma.
2. En cada fila y en cada columna, el número de unidades es igual al número de
tratamientos.
3. Los tratamientos son asignados al azar en las unidades experimentales dentro
de cada fila y dentro de cada columna.
4. El número de filas = número de columnas = número de tratamientos.

5. Los análisis estadísticos T-student, Duncan, Tuckey y en pruebas de contraste
se procede
6. como el diseño completo al azar y el diseño de bloques. La desviación
estándar de la diferencia de promedios y la desviación estándar del promedio,
están en función del cuadrado medio del error experimental.

Modelo estadístico.

Cada observación del experimento es expresada como una relación lineal de los
efectos involucrados (tratamiento, fila y columna), así:

EJEMPLO:

se tiene un experimento para observar el rendimiento de 5 variedades de garbanzo


(A,B,C,D,E). Las filas fueron definidas como niveles de riego. Cm3/parcela. Las
columnas fueron definidas como gradientes de fertilidad del suelo.
IV. DISEÑO CUADRADO GRECOLATINO
Modelo estadístico: Cada observación del experimento es expresado como una
relación lineal de los efectos involucrados (tratamiento, fila y columna), así:

EJEMPLO:
Un experimentador opina que las líneas de ensamble son fuentes de variación al momento
de reproducir la fórmula para la elaboración de dinamita. Para comprobarlo diseña un
arreglo de cuadrado Grecolatino el cual se muestra a continuación: