You are on page 1of 6

ANLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)

El anlisis de la varianza permite contrastar la hiptesis nula de que las medias de K poblaciones (K >2)
son iguales, frente a la hiptesis alternativa de que por lo menos una de las poblaciones difiere de las
dems en cuanto a su valor esperado. Este contraste es fundamental en el anlisis de resultados
experimentales, en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto
a la variable dependiente o de inters.

El Anova requiere el cumplimiento los siguientes supuestos:
Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a
cada factor) son normales.
Las K muestras sobre las que se aplican los tratamientos son independientes.
Las poblaciones tienen todas igual varianza (homoscedasticidad).
El ANOVA se basa en la descomposicin de la variacin total de los datos con respecto a la media global
(SCT), que bajo el supuesto de que H0 es cierta es una estimacin de obtenida a partir de toda la
informacin muestral, en dos partes:
Variacin dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersin de los valores
de cada muestra con respecto a sus correspondientes medias.
Variacin entre muestras (SCE) o Inter-grupos, cuantifica la dispersin de las medias de las
muestras con respecto a la media global.
Las expresiones para el clculo de los elementos que intervienen en el Anova son las siguientes:
Media Global:
Variacin Total:
Variacin Intra-grupos:
Variacin Inter-grupos:
Siendo xij el i-simo valor de la muestra j-sima; nj el tamao de dicha muestra y su media.
Cuando la hiptesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores insesgados de la varianza
poblacional y el cociente entre ambos se distribuye segn una F de Snedecor con K-1 grados de libertad
en el numerador y N-K grados de libertad en el denominador. Por lo tanto, si H0 es cierta es de esperar
que el cociente entre ambas estimaciones ser aproximadamente igual a 1, de forma que se rechazar
H0 si dicho cociente difiere significativamente de 1.
La secuencia para realizar un ANOVA es:
Analizar
Comparar medias
ANOVA de un factor
Se abre el siguiente cuadro de dilogo:

Se selecciona la variable que se considera Dependiente y la variable Factor y con el botn Opciones se
activan EstadsticosDescriptivos y Homogeneidad de varianzas.

Al aceptar en el visor de resultados aparecen los siguientes cuadros:
Descriptivos. Recoge la media, la desviacin tpica, el intervalo de confianza del 95% (por
defecto) para la media correspondientes a la variable dependiente para cada uno de los grupos
definidos por el factor.
Prueba de homogeneidad de varianzas. Contiene el valor del estadstico de Levene del contraste
de la hiptesis de homoscedasticidad con el nivel de significacin crtico.
ANOVA. Contiene las sumas de cuadrados inter-grupos, intra-grupos y total, sus
correspondientes grados de libertad y el valor del estadstico de prueba F junto con el nivel de
significacin crtico.
Como complemento grfico de este anlisis, para obtener una primera aproximacin acerca de si es
razonable o no la hiptesis nula, se selecciona Grficos > Barras de error y se activa la opcin Simple.
Con el botn Definir se abre el siguiente cuadro de dilogo:

Se selecciona en Variable la variable dependiente del ANOVA y en el Eje de categoras la variable factor.
El intervalo de confianza
para la media se calcula por defecto al 95% de confianza. Al aceptar aparece en el visor de resultados
los puntos que respresentan a la media de cada grupo junto con los lmites del correspondiente intervalo
de confianza para la media poblacional. Si los puntos que representan las medias estn desigualmente
distribuidos en el grfico se tiene un indicio de que a nivel poblacional no puede sostenerse la hiptesis
de igualdad de medias; es decir, por lo menos uno de los niveles del factor influye significativamente
sobre la variable dependiente.
EJEMPLOS
Con los datos de la encuesta sobre transporte, Enctrans.sav, razonar si puede aceptarse que el tipo de
transporte utilizado, Trans, influye sobre la variable tiempo.
Con la opcin de men Grficos > Barras de error > Simple y con el botn Definir se selecciona
como Variable Tiempo y enEje de categoras la variable Trans; al aceptar se obtiene la siguiente
representacin grfica:

Como puede observarse, los puntos que representan a las medias de cada grupo aparecen dispersos a
diferentes niveles; sobre todo la media del grupo definido por el factor Tren. El intervalo de confianza
para la media correspondiente al grupo definido por el factor Metro est contenido dentro del intervalo
correspondiente al grupo definido por el factor Bus, as como, el intervalo correspondiente al factor
Coche est contenido dentro de los intervalos correspondientes definidos por los factores Metro y Otros.
El grfico, por tanto, parece sugerir no una nica poblacin sino tres poblaciones con distintas medias.
Para realizar el anlisis de la varianza propiamente dicho la secuencia es Analizar > Comparar medias >
ANOVA de un factor. En el cuadro de dilogo se selecciona Tiempo como variable Dependiente y Trans
como Factor. Para contrastar la hiptesis de igualdad de varianzas se abre con el botn correspondiente
el cuadro de dilogo ANOVA de un factor: Opcionesy se activa Homogeneidad de varianzas. Si se desea
un anlisis descriptivo del comportamiento de la variable dependiente dentro de cada grupo se activa
tambin la opcin Descriptivos. Al aceptar se obtienen los siguientes cuadros de resultados:

Este cuadro contiene un anlisis descriptivo de la variable dependiente por grupos, as como, los lmites
superior e inferior para la media de cada grupo al 95% de confianza.

El estadstico de Levene toma un valor lo suficientemente pequeo para no rechazar la hiptesis de
homocesdaticidad a los niveles de significacin habituales.

En el cuadro de resultados del ANOVA, el valor del estadstico de prueba, F=6,450, es significativamente
distinto de 1 para cualquier nivel de significacin y, por lo tanto, se rechaza la hiptesis nula de igualdad
de medias y queda confirmada la primera impresin proporcionada por el grfico de barras de error.
SUPUESTOS PARAMTRICOS EN EL ANLISIS
DE LA VARIANZA
El anlisis de la varianza realizado mediante pruebas paramtricas requiere el
cumplimiento de una serie de supuestos:
1. Las muestras son aleatorias e independientes. Las muestras seleccionadas para el
estudio son elegidas al azar, es decir, todos los sujetos tienen las mismas probabilidades
de ser escogido para formar parte de la muestra. Adems, las muestras son
independientes, o lo que es igual, el hecho de que un sujeto sea escogido no determina la
inclusin de otro sujeto en alguna de las muestras.
2. Normalidad de las puntuaciones. La variable estudiada se distribuye normalmente en
todos los grupos considerados. En el caso del ejemplo anterior, en las subpoblaciones de
alumnos que siguieron el mtodo de lectura A, el mtodo B y el mtodo C, las
puntuaciones de la variable rendimiento habran de distribuirse siguiendo el modelo de la
curva normal.
Para comprobarlo, un modo fcil y rpido consistira en examinar el grfico
correspondiente a la distribucin de frecuencias para esa variable y determinar si en lneas
generales, tal distribucin se asemeja a la curva normal. Ms riguroso sera aplicar una
prueba de decisin estadstica para comprobar el supuesto de normalidad; la prueba de
Kolmogorof-Smimov, por ejemplo, permite hacer inferencias respecto a la normalidad de
las poblaciones a partir de una muestra extrada de ellas.
3. Homoscedasticidad de varianzas. Se da homogeneidad en las varianzas de todos los
grupos, es decir, la variable estudiada presenta niveles similares de dispersin en cada
una de las subpoblaciones consideradas.
Para comprobar si efectivamente se cumple este supuesto, bastara realizar la prueba F de
contraste de varianzas comparando las varianzas de aquellos dos grupos en los que stas
alcanzan valores ms distanciados. Es decir, utilizaramos como estadstico de contraste el
cociente entre las varianzas insesgadas mayor y menor
[D]
y compararamos su valor con el valor crtico correspondiente al nivel de significacin
considerado.

You might also like