You are on page 1of 3

ANLISIS DE LA VARIANZA (ANOVA)

El anlisis de varianza es uno de los mtodos estadsticos ms utilizados y ms elaborados


en la investigacin moderna, no obstante su denominacin se utiliza para probar hiptesis
preferentes a las medias de poblacin ms que a las varianzas de poblacin. Las tcnicas
ANOVA se han desarrollado para el anlisis de datos en diseos estadsticos muy
complicados.
Cuando hacemos comparaciones de datos cuantitativos entre ms de dos grupos se utiliza
el denominado Anlisis de la Varianza. El ANOVA evala la posible igualdad de medias de
una variable cuantitativa entre varias muestras sin aumentar la tasa de error tipo I (resuelve
el problema de las mltiples comparaciones). El funcionamiento de ANOVA se basa en la
descomposicin de la variabilidad total de una variable en sus diferentes partes, la debida a
las diferencias entre los grupos (efectos principales) y la debida a las diferencias entre los
individuos de cada grupo (residuales). Los estudios experimentales, aquellos en los que los
sujetos son asignados aleatoriamente a un grupo de tratamiento, son los que utilizan con
ms frecuencia ANOVA. Este diseo est muy ligado al mtodo experimental y es la base
del anlisis multivariante. Es posible analizar la informacin sobre medidas repetidas en los
mismos sujetos con ANOVA.
F de Fisher
A diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos
valores, el anlisis de varianza emplea la razn de las estimaciones, dividiendo la
estimacin intermediante entre la estimacin interna.
Esta razn F fue creada por Ronald Fisher (1890-1962), matemtico britnico, cuyas
teoras estadsticas hicieron mucho ms precisos los experimentos cientficos. Sus
proyectos estadsticos, primero utilizados en biologa, rpidamente cobraron importancia y
fueron aplicados a la experimentacin agrcola, mdica e industrial. Fisher tambin
contribuy a clarificar las funciones que desempean la mutacin y la seleccin natural en
la gentica, particularmente en la poblacin humana.
El valor estadstico de prueba resultante se debe comparar con un valor tabular de F, que
indicar el valor mximo del valor estadstico de prueba que ocurra si H0 fuera
verdadera, a un nivel de significacin seleccionado. Antes de proceder a efectuar este
clculo, se debe considerar las caractersticas de la distribucin F
Existe una distribucin F diferente para cada combinacin de tamao de muestra y
nmero de muestras. Por tanto, existe una distribucin F que se aplica cuando se toman
cinco muestras de seis observaciones cada una, al igual que una distribucin F diferente
para cinco muestras de siete observaciones cada una. A propsito de esto, el nmero
distribuciones de muestreo diferentes es tan grande que sera poco prctico hacer una
extensa tabulacin de distribuciones. Por tanto, como se hizo en el caso de la distribucin
t, solamente se tabulan los valores que ms comnmente se utilizan. En el caso de la
distribucin F, los valores crticos para los niveles 0.05 y 0.01 generalmente se
proporcionan para determinadas combinaciones de tamaos de muestra y nmero de
muestras.
La distribucin es continua respecto al intervalo de 0 a + . La razn ms pequea es 0.
La razn no puede ser negativa, ya que ambos trminos de la razn F estn elevados al

cuadrado. Por otra parte, grandes diferencias entre los valores medios de la muestra,
acompaadas de pequeas variancias muestrales pueden dar como resultado valores
extremadamente grandes de la razn F. La forma de cada distribucin de muestreo
terico F depende del nmero de grados de libertad que estn asociados a ella. Tanto el
numerador como el denominador tienen grados de libertad relacionados.
Los grados de libertad para el numerador y el denominador de la razn F se basan en los
clculos necesarios para derivar cada estimacin de la variancia de la poblacin. La
estimacin intermediante de variancia (numerador) comprende la divisin de la suma de
las diferencias elevadas al cuadrado entre el nmero de medias (muestras) menos uno, o
bien, k - 1. As, k - 1 es el nmero de grados de libertad para el numerador.
En forma semejante, el calcular cada variancia muestral, la suma de las diferencias elevadas
al cuadrado entre el valor medio de la muestra y cada valor de la misma se divide entre el
nmero de observaciones de la muestra menos uno, o bien, n - 1. Por tanto, el promedio de
las variancias muestrales se determina dividiendo la suma de las variancias de la muestra
entre el nmero de muestras, o k. Los grados de libertad para el denominador son entonces,
k(n -l).
Formulas para encontrar el valor F de la prueba de Fisher

Nmero total de datos.


ntot = ni
Suma de Cuadrados Total (SCtot)
SCtotal= X2tot (Xtotal)2/ ntotal
Suma de cuadrados entre grupos (SCintergrupos)
SCintergrupos = (X2/ni) -(Xtot)2/ ntot
Suma de cuadrados dentro de los grupos (SCintragrupos)
SCintragrupos = SCtotal - SCintergrupos
Media cuadrtica entregrupos (MCintergrupos)
MCintergrupos = SCintergrupos / g.l. intergrupos
Media Cuadrtica dentro de los grupos (MCintragrupos)
MCintragrupos = SCintragrupos / g. l. intragrupos
Valor de Fisher
F= MCintergrupos / MCintragrupos
Rechazar Ho si

Fc

Fc =Valor critico de Fisher, se obtiene de tablas.

Ejemplo:
1. Supngase que se emplean 4 mtodos diferentes para ensear matemticas a 4
grupos diferentes de estudiantes y se quiere comprobar si estos mtodos han tenido
algn efecto sobre las notas. Se toman muestras aleatorias de tamao 6 de cada
grupo. Los resultados se muestran en la siguiente tabla. Utilice la prueba de Fisher
para realizar el anlisis.
Grupo A
32
61
53
44
77
84

1024
3721
2809
1936
5929
7056

Grupo B
42
75
72
44
84
54

351

22475

371

Grupo C
1764
78
6084
5625
66
4356
5184
73
5329
1936
76
5776
7056
82
6724
2916
52
2704
sumatorias
24481
427
30973

Para calcular el valor F se realiza el siguiente procedimiento:


SCTotal = (22475+24481+30973+26447)-(351+371+427+389)2
24
SCTotal = 104,376-98560.16
SCTotal = 5815.84
SCinter =

- 98560.16

SCinter = 20533.5+22940.1+30388.1+25220.1-98560.16
SCinter= 99081.8-98560.16
SCinter= 521.64
SCintra= 5815.84-521.64
SCintra =5294.2
MCinter=

=173.88

MCintra =

=264.71

F=

=0.65

Rechazar Ho s 0.65 3.10; por lo tanto Ho no se rechaza.

Grupo D
52
63
45
87
78
64

2704
3969
2025
7569
6084
4096

389

26447