You are on page 1of 27

ANALISIS DE VARIANCIA

Definicin:
Es una tcnica estadstica en la que la variancia total de un conjunto de datos se divide en dos o ms componentes, y cada uno de ellos se asocia con una fuente especfica de variacin, de tal manera que el anlisis permite encontrar la magnitud con la que contribuye cada una de esas fuentes a la variacin total.

ANALISIS DE VARIANCIA
Aplicaciones:
El anlisis de variancia (ANOVA) tiene una amplia aplicacin en el anlisis de datos derivado de experimentos. Su principal aplicacin est orientada a cumplir dos objetivos:
a) Estimar y probar hiptesis acerca de las variancias de las poblaciones.

b) Estimar y probar hiptesis respecto a


las medias de las poblaciones.

ANALISIS DE VARIANCIA
Ejemplo de una aplicacin:
Estudio del efecto de varios tratamientos mdicos para disminuir las concentraciones sricas de colesterol en pacientes con hipercolesterolemia.
Supongamos que se ponen a prueba 3 medicamentos (tratamientos), que designamos como A, B, y C, que sern aplicados a tres grupos de pacientes.

ANALISIS DE VARIANCIA
T RATAM I E N T O S
A 25 30 36 38 31 Promedio D.E. 32 5.15 B 31 39 38 42 35 37 4.18 C 24 30 28 25 28 27 2.45 P. General = 32 D.E. General = 5.67

ANALISIS DE VARIANCIA
Variables que participan en este estudio:
a) Variable TRATAMIENTO.
En este estudio, corresponde a los medicamentos de prueba y se dice que tiene 3 categoras o niveles: A, B y C.

b) Variable RESPUESTA.
En este estudio, corresponde a la disminucin en el nivel de colesterol srico de los individuos

c) Variables EXTRAAS:
En este estudio, corresponde a otras variables que puedan ser responsables de la variacin, como edad, dieta, gentica de cada individuo, etc.

ANALISIS DE VARIANCIA
Ejemplo de una aplicacin:
Tiempo (en das) necesario para aprender a utilizar un aparato protsico por tres mtodos de enseanza.
Supongamos que se ponen a prueba 3 mtodos de enseanza (tratamientos), que designamos como A, B, y C, que sern aplicados a tres grupos de pacientes.

ANALISIS DE VARIANCIA
METODO DE ENSEANZA
Grupo Edad A Menor 20 20 a 29 30 a 39 40 a 49 50 y ms Promedio D.E. 7 8 9 10 11 9.0 1.58 B 9 9 9 9 12 9.6 1.34 C 10 10 12 12 14 11.6 1.67 Promedio 8.67 9.00 10.00 10.33 12.33 10.07 1.83

ANALISIS DE VARIANCIA
Variables que participan en este estudio:
a) Variable TRATAMIENTO.

En este estudio corresponde a los mtodos de enseanza y se dice que tiene 3 categoras o niveles: A, B y C. b) Variable RESPUESTA.
En este estudio corresponde al tiempo que necesita una persona (en das) para aprender a usar un aparato protsico. c) Bloques:

En este estudio corresponde al grupo de edad al que pertenece una persona y que se supone es una variable importante propia de cada sujeto que afecta en forma importante a la variable de respuesta.

ANALISIS DE VARIANCIA
Diseos de ANOVA:
a) Diseo de Anlisis de Variancia de un Solo Factor Completamente Aleatorizado.

b) Diseo de Anlisis de Varianza de un Solo Factor por Bloques Completos Aleatorizados.

ANALISIS DE VARIANCIA
Supuestos:
Se obtienen k muestras aleatorias simples de poblaciones respectivas. Cada una de las k poblaciones de las que se extraen las muestras sigue una distribucin normal con media j y variancia sj2. Cada una de las poblaciones tiene la misma variancia, es decir, s12 = s22 = s32 = ....... = sk2 = s2

ANALISIS DE VARIANCIA
Supuestos:
El efecto de los tratamientos est dado por la diferencia de la media de cada grupo con la media general y sta se distribuye con media de diferencias = 0 y variancia igual a la variancia total (s2) (Para el supuesto de que la Ho sea verdadera). Las diferencias de cada dato con su media se designan como trminos del error, esta distribucin tambin sigue una distribucin normal con media = 0 y variancia = a la variancia total (s2). (Igualmente, si Ho es verdadera).

ANALISIS DE VARIANCIA
Cuadro de ANOVA para diseo completamente aleatorizado:
F. de Suma de G. Cuadrados Variacin Cuadrados L. Medios F p

Entre Grupos
Dentro de Grupos Total

SCE
SCD SCT

k-1
N-k N-1

CME = CME SCE / (k-1) CMD


CMD = SCD / (N k)

ANALISIS DE VARIANCIA
Clculo de la suma de Cuadrados:
SCT = SUMA (Diferencia de cada observacin Media General) 2 SCT = (25-32)2 + (31-32)2 + ........... + (28-32)2 = 450 SCD = SUMA (Diferencia de cada observacin Media Grupal) 2 SCD = (25-32)2 + (30-32)2 + ... + (31-32)2 + (31-37)2 + (39-37)2 + ......... + (35-37)2 + (24-27)2 + (30-27)2 + ..... + (28-27)2 = 200 SCE = SUMA ( (ni) (Media Grupali Media General) 2 ) SCE = (5 (32-32)2 ) + (5 (37-32)2 ) + (5 (27-32)2 ) = 0 + 125 + 125 = 250

ANALISIS DE VARIANCIA
Cuadro de ANOVA para diseo completamente aleatorizado:
F. de Suma de G. Variacin Cuadrados L. Cuadrados Medios F p

Entre Grupos
Dentro de Grupos Total

250
200 450

2
12 14

CME= 250/2 = 125 7.5 P<0.01


CMD=200/12

=16.67

ANALISIS DE VARIANCIA
Cuadro de ANOVA para diseo completamente aleatorizado generado en SPSS:
ANOVA Disminucin de Colesterol (mg/dl) Sum of Squares 250.000 200.000 450.000 df 2 12 14 Mean Square 125.000 16.667 F 7.500 Sig. .008

Between Groups Within Groups Total

Multiple Comparisons Dependent Variable: Disminucin de Colesterol (mg/dl) Mean Difference (I-J) Std. Error -5.00 2.582 5.00 2.582 5.00 2.582 10.00* 2.582 -5.00 2.582 -10.00* 2.582

Tukey HSD

(I) Medicamento (J) Medicamento A B C B A C C A B

Sig. .171 .171 .171 .006 .171 .006

95% Confidence Interval Lower Bound Upper Bound -11.89 1.89 -1.89 11.89 -1.89 11.89 3.11 16.89 -11.89 1.89 -16.89 -3.11

*. The mean difference is significant at the .05 level.

Disminucin de Colesterol (mg/dl) Subset for alpha = .05 1 2 27.00 32.00 32.00 37.00 .171 .171 27.00 32.00 32.00 37.00

Tukey

a HSD

a Tukey B

Medicamento C A B Sig. C A B

N 5 5 5 5 5 5

Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 5.000.

ANALISIS DE VARIANCIA
Cuadro de ANOVA para un solo factor pro bloques completamente aleatorizado generado en SPSS:
Tests of Between-Subj ects Effects Dependent Variable: Dias de Aprendizaje Type III Sum Source of Squares Corrected Model 43.467a Intercept 1520.067 TRATAM 18.533 BLOQUE 24.933 Error 3.467 Total 1567.000 Corrected Total 46.933 df 6 1 2 4 8 15 14 Mean Square 7.244 1520.067 9.267 6.233 .433 F 16.718 3507.846 21.385 14.385 Sig. .000 .000 .001 .001

a. R Squared = .926 (Adjusted R Squared = .871)

Multiple Comparisons Dependent Variable: Dias de Aprendizaje Mean Difference (I-J) Std. Error -.60 .416 -2.60* .416 .60 .416 -2.00* .416 2.60* .416 2.00* .416

Tukey HSD

(I) Tratamiento (J) Tratamiento A B C B A C C A B

Sig. .367 .001 .367 .003 .001 .003

95% Confidence Interval Lower Bound Upper Bound -1.79 .59 -3.79 -1.41 -.59 1.79 -3.19 -.81 1.41 3.79 .81 3.19

Based on observed means. *. The mean difference is significant at the .05 level.
Dias de Aprendizaj e Subset T ukey
a,b HSD

T ukey

a,b B

T ratam iento A B C Si g. A B C

N 5 5 5 5 5 5

1 9.00 9.60 .367 9.00 9.60

11.60 1.000

11.60

M eans for groups i n hom ogeneous subsets are di spl ayed. Based on T ype III Sum of Squares T he error term i s M ean Square(Error) = .433. a. Uses Harm oni c M ean Sam ple Si ze = 5.000. b. Al pha = .05.

ANALISIS DE VARIANCIA
Anlisis de Varianza Multifactorial.
Estudio simultaneo del efecto de dos o mas factores sobre una variable cuantitativa continua. Se aplica a experimentos factoriales. Cada factor presenta diferentes categoras que se conocen como niveles. En este tipo de anlisis se estudia el efecto de los diferentes factores y si se efecta adecuadamente, se puede estudiar el efecto de las interacciones.

ANALISIS DE VARIANCIA
Interacciones en el Anlsis de Varianza Multifactorial. Factor A Dosis Baja Jvenes Viejos
30 25 20 15 10 5 0

Factor B Dosis Media =10 =15


Jvenes Viejos

Dosis Alta =20 =25

=5 =10

D. Baja

D. Media

D. Alta

ANALISIS DE VARIANCIA
Interacciones en el Anlsis de Varianza Multifactorial. Factor A Dosis Baja Jvenes Viejos
25 20 15 10 5 0

Factor B Dosis Media =10 =10


Jvenes Viejos

Dosis Alta =20 =5

=5 =15

D. Baja

D. Media

D. Alta

ANALISIS DE VARIANCIA
Cuadro de ANOVA para el Diseo Multifactorial.
Fuente de Variacin Factor A Factor B Suma de Grados de Cuadrados Libertad
SCA SCB SCAB SC-TRAT a-1 b-1 (a-1)(b-1) ab 1

Cuadrados Medios
SCA / (a-1) SCB / (b-1) SCAB/ (a-1)(b-1)

F
CMA/CMR CMB/CMR CMAB/ CMR

Interaccin AxB
(Explicada)

Residual (Error) Total

SCRESIDUAL
SC-TOTALES

ab(n-1)
abn 1

CMR=SCR/ ab(n-1)

ANALISIS DE VARIANCIA
R2 Coeficiente de Determinacin.
Una medida que nos da una idea de la cantidad de varianza explicada en relacin a la varianza total. Se conoce como R2 o Coeficiente de Determinacin. Este se calcula dividiendo la Suma de Cuadrados Explicada, es decir, la que es atribuible a los factores, entre la suma de cuadrados totales. El resultado de esta divisin es un valor que va de 0 a 1. Cero indicara una nula explicacin, mientras que uno indicara que los factores explican en su totalidad la variacin de los datos.

ANALISIS DE VARIANCIA
Pruebas Multicomparativas Post hoc .
En el caso de que un ANOVA resulte significativo para un factor, implica el rechazo de la hiptesis de igualdad de medias de la variable de respuesta entre los diferentes niveles del factor. La pregunta siguiente ser: Cul nivel o cuales niveles del factor son los que presentan diferente media para la variable de respuesta?
Para saber cuales medias difieren entre s es necesario aplicar pruebas conocidas como PRUEBAS MULTICOMPARATIVAS.

ANALISIS DE VARIANCIA
Pruebas Multicomparativas Post hoc .
A travs de los aos se han sugerido diversos procedimientos para efectuar comparaciones mltiples que conduzcan a esclarecer cuales son la medias que son diferentes. En general todos estos procedimientos hacen uso de la varianza del error (o cuadrado medio del error) global de todo el experimento el cual es multiplicado por un factor de confiabilidad tomando en cuenta diferentes estadsticos como el Rango corregido de Student y el tamao de las muestras de los pares involucrados en la comparacin. LSD, Bonferroni, Tukey, Tukey HSD, Sheff, Duncan, ... son algunas de las pruebas Post-hoc mas conocidas.

ANALISIS DE VARIANCIA
Anlsis de Variancia utilizando el SPSS.
-Diseo completamente aleatorizado.

-Diseo por bloques completos aleatorizados

-Diseo multifactorial.

ANALISIS DE VARIANCIA
Algunas notas y consejos en relacin al Anlisis de Variancia.
-Cuando se tengan mltiples comparaciones, una prueba adecuada es el ANOVA. -Cuando reporte los resultados de un ANOVA, no olvide mencionar las Medias y Desviaciones Estndar que puedan explicar la magnitud de los efectos. -Generalmente el uso de mltiples factores distribuir la varianza total entre cada uno de ellos, resultando en trminos de error mas pequeos y logrando una prueba con mayor potencia (o poder).