You are on page 1of 15

Cap tulo

9 An alisis de Covarianza
9.1. Introducci on.

Hemos visto que el dise no de bloques es usado para eliminar el efecto de los factores de ruido que no son controlables, dicho procedimiento es valido cuando los factores que ocasionan el ruido son variables cualitativas. El an alisis de la covarianza (ANCOVA) es un m etodo que se utiliza para eliminar el efecto de ruido cuando al menos una de las variables que causan tal ruido es cuantitativa, dicha variable es conocida como covariable o variable concomitante. Por lo tanto, el an alisis de covarianza es una t ecnica estad stica que permite conocer el efecto de una variable independiente categ orica sobre una variable dependiente cuantitativa (variable respuesta), eliminando el efecto que tiene sobre esta u ltima otra variable cuantitativa (variable concomitante). Seg un Montgomery (2008), el an alisis de covarianza implica ajustar la variable respuesta observada para el efecto de la variable concomitante. Si no se hace este ajuste, la variable concomitante podr a inar el cuadrado medio del error y hacer que sean m as dif ciles de detectar las verdaderas diferencias en las respuestas debidas a los tratamientos. Por lo tanto, el an alisis de covarianza es un m etodo de ajuste para los efectos de una variable cuantitativa perturbadora no 205

206

Captulo 9. Anlisis de Covarianza

controlable. El an alisis de la covarianza resulta ser una combinaci on entre el an alisis de varianza (ANOVA) y el an alisis de regresi on.

9.2.

Modelo unifactorial con una covariable

En esta secci on vamos a desarrollar el an alisis de covarianza m as simple, cuando la variable dependiente es funci on de un s olo factor y una covariable. Suponiendo una relaci on lineal entre la variable dependiente y la covariable, la variable dependiente se puede modelar como: i = 1, ..., a j = 1, ..., n

.. ) + ij yij = + j + (xij x

(9.1)

donde yij es la j - esima observaci on bajo el i- esimo nivel del tratamiento xij es la medida de la covariable que se hace para yij x .. es la media de los valores de xij es la media total. esimo del tratamiento i es el efecto del nivel i- es el coeciente de regresi on que relaciona yij con la covariable xij ij es el error aleatorio

9.2. Modelo unifactorial con una covariable n

207

Se asume que ij N (0; ) e independientes entre si, = 0, covariable x no est a afectada por los tratamientos.
i=1

i = 0 y que la

Note de la ecuaci on (9.2.1), que el modelo de an alisis de covarianza es una combinaci on de los modelos lineales empleados en el an alisis de regresi on y an alisis de varianza. Es decir, se tienen efectos de los tratamientos {i }, como en el an alisis de varianza de un s olo factor, y un coeciente de regresi on , como en una ecuaci on de regresi on. Para describir el an alisis se introduce la siguiente notaci on
a n 2 a n 2 yij 2 y.. an

Syy =
i=1 j =1 a n

(yij y .. ) = (xij x .. )2 =
i=1 j =1 a n i=1 j =1

(9.2) (9.3) xij yij (x.. )(y.. ) an (9.4) (9.5) (9.6) (x.. )(y.. ) an (9.7) (9.8) (9.9) (9.10)

Sxx =
i=1 j =1 a n

x2 ij
a

x2 .. an
n

Sxy =
i=1 j =1 a

(xij x .. )(yij y .. ) =
i=1 j =1

Tyy = n
i=1 a

( yi. y .. )2 = ( xi. x .. )2 =

1 n 1 n

a i=1 a i=1

2 yi.

2 y.. an

Txx = n
i=1 a

x2 i. 1 n

x2 .. an
a

Txy = n Eyy =

( xi. x .. )( yi. y .. ) =

(xi. )(yi. )
i=1

i=1 a n i=1 j =1 n a

(yij y i. )2 = Syy Tyy (xij x i. )2 = Sxx Txx (xij x i. )(yij y i. ) = Sxy Txy

Exx =
i=1 j =1 a n

Exy =
i=1 j =1

En general, S = T + E donde los s mbolos S, T y E son las sumas de cuadrados

208

Captulo 9. Anlisis de Covarianza

y los dobles productos para el total, los tratamientos y el error respectivamente. A continuaci on se indica la forma en que el an alisis de covarianza ajusta la variable respuesta para el efecto de la covariable. Los estimadores m nimos cuadrados de , i y para el modelo de la ecuaci on (9.2.1) son, respectivamente, =y .. ; i = y i. y .. = Exy Exx

La suma de cuadrados del error en este modelo es (Exy )2 Exx

SCE = Eyy

(9.11)

el cual tiene a(n 1) 1 grados de libertad. El estimador de la varianza del error experimental esta dado por CME = SCE a(n 1) 1 (9.12)

Ahora supongamos que no hay ningun efecto de los tratamientos, entonces para modelar la variable respuesta usamos el siguiente modelo i = 1, ..., a j = 1, ..., n

.. ) + ij yij = + (xij x

(9.13)

el cual es un modelo de regresi on lineal simple. Los estimadores de m nimos cuadrados de y para este modelo son, respectivamente, =y .. ; = Exy Exx

9.2. Modelo unifactorial con una covariable

209

La suma de cuadrada en este caso es (Sxy )2 Sxx

SCE = Syy

(9.14)
(Sxy )2 Sxx

el cual tiene an 2 grados de libertad. En la ecuaci on (9.14), la cantidad

es la

reducci on de la suma de cuadrados de y , obtenida por la regresi on lineal de y sobre x. on (9.2.1) incluye los par ametros Adem as, SCE < SCE ya que el modelo de la ecuaci adicionales {i }. Por lo tanto, la diferencia entre SCE y SCE , es decir,SCE SCE es una reducci on en la suma de cuadrados debida a los t erminos {i }, la cual tiene a 1 grados de libertad, dicha cantidad es usada para probar la hi otesis de que no hay ning un efecto de los tratamientos luego de anular el efecto de la covariable sobre stico de la respuesta. Es decir, para probar la hip otesis H0 : i = 0, se usa como estad prueba F0 =
SCE SCE a1 SCE a(n1)1

(9.15)

otesis nula es el cual, si la hip otesis nula es verdadera, se distribuye Fa1,a(n1)1 . La hip rechazada si F0 > F,a1,a(n1)1 . Todo este procedimiento se resume en la tabla (9.1), conocida como tabla de an alisis de covarianza de un solo factor y una covariable. Los resultados presentados en esta tabla son u tiles tambi en para el c alculo de las medias de los tratamientos ajustadas, las cuales est an dadas por ( y i.ajustada = y i. xi. x .. )

i = 1, 2, ..., a

(9.16)

Esta media de los tratamientos ajustada es el estimador de m nimos cuadrados de + i , i = 1, 2, ..., a, en el modelo (9.2.1). El error est andar de cualquier media ajustada

Captulo 9. Anlisis de Covarianza

Fuente de Variaci on GL Tratamiento a1 Txx Txy Tyy

Tabla 9.1: Anlisis de covarianza de un experimento de un solo factor con una covariable Sumas de Cuadrados Ajustados por la regresi on x xy y y GL CM

CME SCE = Eyy


(Exy )2 Exx

SCE a(n1)1

F0 = a(n 1) 1

SCE SCE a1

CME

Error

a(n 1)

Exx

Exy

Tyy

Total

an 1

Sxx

Sxy

Syy

SCE = Syy

(Sxy )2 Sxx

an 2

Tratamiento

SCE SCE

a1

SCE SCE a1

210

9.2. Modelo unifactorial con una covariable

211

de los tratamientos es xi. x .. )2 1 ( + n Exx


1/2

Sy i.ajustada = CME

(9.17)

Otra hip otesis de inter es a probar est a relacionada con el par ametro de regresi on, es decir, H0 : = 0. El no rechazo de dicha hip otesis indica que la covariable puede omitirse del estudio. E estad stico de prueba en este caso es (Exy )2 /Exx CME

F1 =

(9.18)

que bajo la hip otesis nula se distribuye F1,a(n1)1 . Por lo tanto, H0 : = 0 se rechaza si F0 > F,1,a(n1)1 . Ejemplo 9.2.1 (Montgomery) Considere un estudio realizado para determinar si existe diferencia en la resistencia de una bra de monolamento producida por tres m aquinas diferentes. Se sospecha que, la resistencia de la bra tambi en se afecta por su grosor; por consiguiente, una bra m as gruesa ser a por lo general m as resistente que una delgada. Los datos de este experimento se muestran en la tabla (9.2). Es evidente
Tabla 9.2: Datos de la resistencia a la ruptura

M aquina 1 y x

M aquina 2 y x

M aquina 3 y x

36 20 41 25 39 24 42 25 49 32 207 126

40 22 48 28 39 22 45 30 44 28 216 130

35 21 37 23 42 26 34 21 32 15 180 106

que para resolver el problema debemos realizar un an alisis de covarianza con el objeto

212

Captulo 9. Anlisis de Covarianza

de eliminar el efecto del grosor (x) sobre la resistencia (y ). Suponiendo que la relaci on lineal entre la resistencia a la ruptura y el di ametro es apropiada, el modelo es i = 1, ..., a j = 1, ..., n

yij = + j + (xij x .. ) + ij

Utilizando las ecuaciones (9.3) a (9.10), pueden calcularse


a n 2 yij 2 y.. (603)2 = 362 + 412 + ... + 322 = 346,40 an (3)(5)

Syy =
i=1 j =1 a n

Sxx =
i=1 j =1 a n

x2 ij

x2 (362)2 .. = 202 + 252 + ... + 152 = 261,73 an (3)(5) (x.. )(y.. ) = (20)(36) + (25)(41) + ... + (15)(32) an

Sxy =
i=1 j =1

xij yij

= Tyy 1 = n 1 n 1 n

(362)(603) = 282,60 (3)(5)


a i=1 a i=1 a i=1 2 yi. 2 1 y.. (603)2 = (2072 + 2162 + 1802 ) = 140,40 an 5 (3)(5)

Txx = Txy =

x2 i.

1 x2 (362)2 .. = (1262 + 1302 + 1062 ) = 66,13 an 5 (3)(5) 1 (x.. )(y.. ) = [(126)(207) + (130)(216) + (106)(184)] an 5

(xi. )(yi. )

(362)(603) = = 96,00 (3)(5) Eyy = Syy Tyy = 346,40 140,40 = 206,00 Exx = Sxx Txx = 261,73 66,13 = 195,60 Exy = Sxy Txy = 282,60 96,00 = 186,60

9.2. Modelo unifactorial con una covariable

213

Por la ecuaci on (9.14) se encuentra (Sxy )2 186,602 = 346,40 = 41,27 Sxx 261,73

SCE = Syy

con an 2 = (3)(5) 2 = 13 grados de libertad; y por la ecuaci on (9.11) SCE = Eyy (Exy )2 186,602 = 41,27 = 27,99 = 206,00 Exx 195,60

con a(n 1) 1 = 3(5 1) 1 = 11 grados de libertad. La suma de cuadrados para probar H0 : 1 = 2 = 3 = 0 es SCE SCE = 41,27 27,99 = 13,28 con a 1 = 3 1 = 2 grados de libertad. Estos datos se resumen en la tabla 9.3 Para
Tabla 9.3: Anlisis de covarianza de los datos de la resistencia a la ruptura

Fuente de Variaci on Tratamiento Error Total Tratamiento

GL 2 12 14

Sumas x 66.13 195.60 261.73

de Cuadrados xy y 96.00 140.40 186.60 206.00 282.60 346.40

Ajustados por la regresi on y GL CM 27.99 41.27 13.28 11 13 2 2.54 6.64

2.61

probar la hip otesis de que las m aquinas dieren en la resistencia a la ruptura de la bra producida, es decir, H0 : i = 0, por la ecuaci on (9.19) el estad stico de prueba se calcula como
SCE SCE a1 SCE a(n1)1

F0 = =

13,28/2 = 2,91 27,99/11

214

Captulo 9. Anlisis de Covarianza

Al comparar este valor con F0,10,2,11 = 2,86, se encuentra que no puede rechazarse la hip otesis nula. Por lo tanto, no hay evidencia s olida de que las bras producidas por las tres m aquinas dieran en la resistencia a la ruptura. La estimaci on del coeciente de regresi on se calcula con = Exy = 186,60 = 0,9540 Exx 195,60 on (9.18. El estad stico de La hip otesis H0 : = 0 puede probarse usando la ecuaci prueba es F1 = (Exy )2 /Exx (186,60)2 /195,60 = 70,08 = CME 2,54 (9.19)

y puesto que F0,01,1,11 = 9,65, se rechaza la hip otesis de que = 0. Por lo tanto, existe una relaci on lineal entre la resistencia a la ruptura y el di ametro, y el ajuste proporcionado por el an alisis de covarianza fue necesario. Las medias de los tratamientos ajustadas pueden calcularse con la ecuaci on (9.17). Estas medias ajustadas son ( y 1.ajustada = y 1. x1. x .. = 41,40 (0,9540)(25,20 24,13) = 40,38 ( y 2.ajustada = y 2. x2. x .. = 43,20 (0,9540)(26,00 24,13) = 41,42 ( y 3.ajustada = y 3. x3. x .. = 36,00 (0,9540)(21,20 24,13) = 38,80

Al comparar las medias ajustadas con las medias no ajustadas de los tratamientos (las y i. ), se observa que las medias ajustadas se encuentran mucho m as pr oximas entre s ,

9.2. Modelo unifactorial con una covariable

215

una indicaci on m as de que el an alisis de covarianza fue necesario.

Un supuesto b asico en el an alisis de covarianza es que los tratamientos no inuyen en la covariable x, ya que la t ecnica elimina el efecto de las variaciones en las x i. . Sin embargo, si la variabilidad en la x i. se debe en parte a los tratamientos, entonces el an alisis de covarianza elimina parte del efecto de los tratamientos. Por lo tanto, deber a tenerse una seguridad razonable de que los tratamientos no afectan los valores de xij . En algunos experimentos esto puede ser obvio a partir de la naturaleza de la covariable, mientras que en otros puede ser m as dudoso. En el ejemplo tratado aqu puede haber aquinas. En tales casos, una diferencia en el di ametro de la bra (xij ) entre las tres m Cochran y Cox sugieren la posible utilidad de un an alisis de varianza de los valores xij para determinar la validez de este supuesto. Para el problema tratado aqu , con este procedimiento se obtiene F0 = 66,13/2 = 2,03 195,60/12

on para creer que las m aquinas que es menor que F0,10,2,12 = 2,81, por lo que no hay raz producen bras con di ametros diferentes. Una manera alternativa de presentar el desarrollo del an alisis de covarianza se resume en la tabla (9.4). En ella el an alisis de covarianza se presenta como una an alisis de varianza ajustado. En la columna de la fuente de variaci on, la variabilidad total se mide por Syy , con an 1 grados de libertad. La fuente de variaci on regresi on tiene la suma de cuadrados
(Sxy )2 Sxx

con un grado de libertad. Si no hubiera ninguna variable

concomitante, se tendr a Sxy = Sxx = Exy = Exx = 0. Entonces la suma de cuadrados del error ser a simplemente Eyy y la suma de cuadrados de los tratamientos ser a Syy Eyy = Tyy . Sin embargo, debido a la presencia de la variable concomitante, Syy y Eyy deben ajustarse para la regresi on de y sobre x, como se muestra en la tabla

216

Captulo 9. Anlisis de Covarianza

(9.4). La suma de cuadrados del error ajustada tiene a(n 1) 1 grados de libertad en lugar de a(n 1) grados de libertad debido a que se ajusta un par ametro adicional (la pendiente ) a los datos.
Tabla 9.4: El Anlisis de covarianza como un anlisis de varianza ajustado

Fuente de Variaci on

Suma de Cuadrados

Grados de Libertad 1 a1 a(n 1) 1 an 1

Cuadrado Medio
SCE SCE a 1 SCE CME = a(n 1)1

Regresi on (Sxy )2 /Sxx Tratamientos SCE SCE Error SCE Total Syy

(SCE SCE )/(a1) CME

9.3.

Ejercicios

1. Un distribuidor de bebidas gaseosas est a estudiando la efectividad de los m etodos de descarga. Se han desarrollado tres tipos diferentes de carretillas, y se lleva a cabo un experimento en el laboratorio de ingenier a de m etodos de la compa n a. La variable de inter es es el tiempo de descarga en minutos (y ): sin embargo, el tiempo de descarga tambi en guarda una estrecha relaci on con el volumen de las cajas guardadas (x). Cada carretilla se us o cuatro veces y se obtuvieron los siguientes datos. Analizar estos datos y sacar las conclusiones apropiadas. Carretilla 1 y 27 44 31 41 x 24 40 34 40 Carretilla 2 y 25 35 46 26 x 26 32 42 25 Carretilla 3 y 40 22 53 18 x 38 26 50 20

9.3. Ejercicios

217

2. Calcular las medias ajustadas de los tratamientos y los errores est andar de estas para los datos del problema anterior. 3. A continuaci on se presentan las sumas de cuadrados y los productos de un an alisis de covarianza de un s olo factor. Terminar el an alisis y sacar las conclusiones apropiadas. Utilizar = 0,05. Fuente de Variaci on Tratamiento Error Total Grados de libertad 3 12 15 Sumas de cuadrados x xy 1500 1000 6000 1200 7500 2200 y productos y 650 550 1200

4. Se est an probando cuatro formulaciones diferentes de un adhesivo industrial. La resistencia a la tensi on del adhesivo cuando se aplica para unir piezas se relaciona con el espesor de la aplicaci on. Se obtienen cinco observaciones de la resistencia (y ) en libras y del espesor (x) en 0.01 pulgadas para cada formulaci on. Los datos se muestran en la siguiente tabla. Analizar estos datos y sacar las conclusiones apropiadas. Formulaci on del adhesivo 1 y 46.5 45.9 49.8 46.1 44.3 x 13 14 12 12 14 y 48.7 49.0 50.1 48.5 45.2 2 x 12 10 11 12 14 y 46.3 47.1 48.9 48.2 50.3 3 x 15 14 11 11 10 y 44.7 43.0 51.0 48.1 48.6 4 x 16 15 10 12 11

5. Calcular las medias ajustadas de los tratamientos y los errores est andar de estas para los datos del problema anterior.

218

Captulo 9. Anlisis de Covarianza

6. Un ingeniero estudia el efecto de la rapidez de corte sobre el ndice de metal eliminado en una operaci on de maquinado. Sin embargo, el ndice de metal eliminado se relaciona tambi en con la dureza del ejemplar de prueba. Se hacen cinco observaciones de cada rapide de corte. La cantidad de metal eliminado (y ) y la dureza del ejemplar (x) se muestran en la siguiente tabla. Analizar los datos usando un an alisis de covarianza. Utilizar = 0,05. Rapidez de corte (rpm) 1000 y 68 90 98 77 88 x 120 140 150 125 136 1200 y 112 94 65 74 85 x 165 140 120 125 133 1400 y 118 82 73 92 80 x 175 132 124 141 130

7. Demostrar que en un an alisis de covarianza de un solo factor con una sola covariable, un intervalo de conanza de 100(1 ) por ciento para la media ajustada del tratamiento i esimo es ( y i. xi. x .. ) t/2,a(n1)1 CME xi. x .. )2 1 ( + n Exx
1/2

Usando esta f ormula, calcular un intervalo de conanza de 95 % para la media ajustada para la rapidez de corte de 1000 del ejercicio anterior.

8. Demostrar que en un an alisis de covarianza de un solo factor con una sola covariable, el error est andar de la diferencia entre dos medias ajustadas de los

9.3. Ejercicios

219

tratamientos cualesquiera es xi. x j. )2 2 ( + n Exx


1/2

Sy i.ajustada y j.ajustada = CME

You might also like