You are on page 1of 3

ANOVA de un factor

El anlisis de varianza (ANOVA) sirve para comparar varios grupos en una variable
cuantitativa. Es una generalizacin de la Prueba T de Student para ms de dos muestras.
Variable independiente o factor: es la variable categrica (nominal u ordinal) que
define los grupos que queremos comparar
Variable dependiente: es la variable cuantitativa en la que deseamos comparar los
grupos.
Se contrasta la hiptesis de que las medias poblacionales para cada nivel de la variable
independiente son iguales. Si no se rechaza la hiptesis -> las medias no son distintas,
los grupos no se diferencian entre s, -> las variables son independientes.
Si se rechaza la hiptesis -> que existe diferencias entre las medias (al menos una)
Mtodo:
El estadstico F refleja el grado de parecido entre las medias.
F = varianza entre las medias de los grupos / varianzas dentro de cada grupo

Cuando la estimacin de la varianza a partir de las diferencias entre medias sea similar a
la estimacin de la varianza basada en los valores individuales. El cociente ser prximo
a 1. Si las diferencias entre medias son grandes el cociente ser mayor que 1.
Cuando las poblaciones son normales y sus varianzas iguales el estadstico F se
distribuye segn el modelo de probabilidad F de Fisher-Snedecor, donde los grados de
libertad del numerados es el nmero de grupos menos 1 y el del denominador el nmero
total de observaciones menos el nmero de grupos. El nivel crtico que proporciona el
programa, es la probabilidad de obtener un valor de F igual al obtenido o mayor. Si la
probabilidad es menor que 0,05 rechazamos la hiptesis de igualdad de medias.
Requisitos: normalidad e igualdad de varianzas (hocedasticidad):
La variable dependiente se distribuye de manera normal en cada unos de las poblaciones
muestreadas. Si el tamao de los grupos es grande el estadstico F se comporta bien aun
cuando no haya normalidad.
La homocedasticidad significa que la varianza entre los distintos grupos no es muy
diferente (no ms de 4 veces la mayor supera a la menor).
El ANOVA nos dice si existe o no diferencias entre las medias de los grupos pero no
entre cuales -> comparacin de medias.

OPCIONES
Descriptivos
Homogeneidad de varianza
Grfico de medias
Valores perdidos
Comparaciones pos hoc
Comparaciones planeadas o a priori (contrastes)
Anlisis de varianza factorial ->modelo lineal general (MLG o GLM).
Se plantea una hiptesis nula para cada factor y para cada posible combinacin de
factores (interaccin). La hiptesis nula afirma que las medias de las poblaciones
definidas por los niveles del factor son iguales, lo mismo para la interaccin.
Se requiere normalidad de cada una de las subpoblaciones, homocedasticidad e
independencia entre las observaciones.
Dos tipos de factores: fijos y aleatorios
Un factor fijo es aquel cuyos niveles los establece intencionadamente el investigador o
vienen dados por la naturaleza del factor (sexo). Los niveles concretos que toma un
factor de efectos fijos constituyen la poblacin de niveles sobre los que se hace
inferencia.
Un factor aleatorio es aquel cuyos niveles son seleccionados de forma aleatoria entre
todos los posibles del factor. Estos niveles concretos que toma el factor aleatorio son tan
slo una muestra de la poblacin de niveles sobre los que se hace infrencia.
Covariable: variable cuantitativa que posiblemente est relacionada con la variacin de
la variable independiente. Se utiliza como tcnica de control estadstico que permite
eliminar de la variable independiente del ANOVA el efecto atribuible a variables no
incluidas en el diseo como factores y, por tanto, no sometidas a control experimental.
Ponderacin MCP: El MLG asume que la varianza de la variable dependiente es la
misma en todas las poblaciones (tantas como combinaciones d elos niveles de los
factores). A veces no ocurre esto (la varianza suele ser mayor en los grupos de mayor
media) y el mtodo ordinario de mnimos cuadrados deja de proporcionar estimaciones
optimas. Una manera de compensar este problema es el mtodo de mnimos cuadrados
ponderados (MCP) que incorporar otra variable que refleje esta variabilidad dando ms
peso a las observaciones ms precisas.
Al incluir las covariables en el MLG, ste utiliza como variable dependiente, no los
valores originales sino los errores en los pronsticos resultantes al llevar a acabo el

anlisis de regresin lineal. La hiptesis nula para las covariables es que el coeficiente
de regresin es cero (son independientes).