Professional Documents
Culture Documents
6.2 Ventajas del diseo de bloques al azar. 1. Se obtienen resultados ms exactos que cuando se utiliza el diseo completamente aleatorio. 2. Pueden incluirse cualquier nmero de bloques y tratamientos. Si se desean bloques adicionales para algunos tratamientos, cada uno de estos puede aplicarse a dos unidades dentro de cada bloque. 3. El anlisis estadstico es fcil. Cuando se pierden algunas unidades experimentales, stas se pueden calcular por la tcnica de parcelas perdidas desarrollada por Yates. 4. Ningn otro diseo es utilizado tan frecuentemente en las reas de investigacin como el de bloques al azar. 6.3 Ejemplos de la instalacin de experimentos en bloques al azar. Ejemplo 1. Se van a comparar seis variedades de avena (A, B, C, D, E, F) con respecto a su rendimiento, disponindose de 30 parcelas experimentales y se observa evidencia que existe tendencia en la fertilidad de norte a sur. De acuerdo con esto parece razonable agrupar a las parcelas en cinco grupos de seis parcelas por bloque. As en el primer bloque estarn las seis parcelas ms frtiles y en el ltimo bloque las seis parcelas menos frtiles. Una vez hecho esto, las seis variedades se asignan de manera aleatoria en el primer bloque, posteriormente se aleatorizan en el segundo bloque y as sucesivamente en los dems bloques. Ejemplo 2. Se van a probar 10 raciones de alimento para la engorda de ganado, para la investigacin se dispone de 40 toros de la misma raza pero con diversos pesos, aqu es recomendable hacer 40 /10 = 4 grupos o bloques de 10 animales cada uno tomando en cuenta su peso. As los toretes ms pesados se agruparn en un bloque, los menos pesados en otro y as sucesivamente. Los 10 tratamientos (raciones) se asignan de manera aleatoria en el primer bloque, posteriormente en el segundo y as sucesivamente. Ejemplo 3. Se desea determinar si cuatro diferentes puntas (tratamientos) producen una diferencia en las lecturas de un equipo para medir la dureza. La mquina funciona presionando la punta sobre una lmina de metal y determinando la dureza de la punta a partir de la profundidad de la marca que se produce. Sabemos que las lminas son ligeramente diferentes en cuanto a dureza ya que provienen de diferentes lotes de produccin. Para la prueba se dispone de cuatro lminas, por lo que una lmina ser considerada como un bloque y en cada una de ellas el investigador debe probar cada una de las cuatro puntas de manera aleatoria, con lo que tendr 16 unidades experimentales.
Puede observarse en cada ejemplo que la variabilidad dentro de cada bloque es chica, mientras que la variabilidad entre bloques es grande, o sea que un bloque nos sirve como una unidad de control. 6.4 Anlisis estadstico. Suponga que se tiene t tratamientos (que deben ser comparados) y b bloques, donde se realiza una observacin por tratamiento en cada bloque y el orden en que los tratamientos son medidos en cada bloque se determina aleatoriamente. El modelo estadstico para este diseo es:
yij = + i + j + ij
i = 1, 2,..., t tratamientos
j = 1, 2,..., b bloques
Donde es una media general, i es el efecto del i-simo tratamiento , j es el efecto de j-simo bloque y ij es el error aleatorio atribuible a la medicin y ij . Por lo que un diseo de bloques al azar lo podemos representar por: Bloques: 2 y12
y 22 y32
Tratamientos 1 2 3 . . . t Total
1 y11
y 21 y31
. . .
. . .
. . .
b y1b
y2 b y3 b
Total
Promedio
Y1 Y2
Y3
. . .
y1 y 2
y 3
. . .
. . . yt 1
Y 1
. . . yt 2
Y2
. .
. .
. .
. . . ytb
Y b
Yt Y
yt y
S. C. Totales
y FC
i =1 j =1 2 ij
S. C. Tratamientos
Y
i =1
i.
b
S. C. Bloques =
FC
Y
j =1
2 .j
FC
Estas sumas de cuadrados se concentran en la siguiente tabla para su anlisis de varianza (ANOVA). Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio F
Y
i =1
2 i
Tratamientos
C .M .Trat . C.M .error
Y2 bt
S .C .Trat . G.L.Trat
t-1
Bloques
C .M .Bloq. C .M .error
Y
j =1
2 .j
Y2 bt
b-1
S .C.Bloq. G.L.bloq
(b -1) (t -1) bt - 1
S .C.error G.L.error
Y2 Y bt i =1 j =1
t b 2 ij
Si la probabilidad de tener una F igual a la del ANOVA es menor a 5% se rechaza la hiptesis H0: los tratamientos son iguales y se acepta la hiptesis H 1: al menos un tratamiento es diferente. Ejemplo. Se efectu un experimento para determinar el efecto de cuatro diferentes compuestos qumicos en la resistencia de una fibra. Estos compuestos se emplearon 4
como parte del proceso de acabado de planchado permanente. Se seleccionaron cinco muestras de fibra de diferentes lotes de produccin (bloques), y en cada muestra se probaron los cuatro compuestos qumicos en forma aleatoria, los resultados se presentan en libras por pulgada cuadrada (psi) en la siguiente tabla. Bloques 1 2 3 4 5 Tratamientos D 3.9 A 1.6 A 0.5 C 1.5 A 1.1
B C D D B
C D B B C
A B C A D
Lo primero que tenemos que hacer es organizar los datos como lo muestra el siguiente cuadro. RESISTENCIA DE LA FIBRA DE CUATRO COMPUESTOS QUMICOS Tratamientos A B C D Total
yj
Total 4 1.2 2.0 1.5 4.1 8.8 2.2 5 1.1 1.8 1.3 3.4 7.6 1.9 5.7 8.8 6.9 17.8 39.2
yi
1.14 1.76 1.38 3.56 1.96
Las sumas de cuadrados para el anlisis de varianza (ANOVA) se obtienen de la siguiente manera: Factor de correccin = S. C. Totales S. C. Tratamientos = =
Y 2 / bt
4 5 i =1 j =1
Y
i =1
2 i.
b
5
FC =
S. C. Bloques
Y
j =1
2 .j
FC =
S. C. Error
= 25.69 18.04 6.69 = 0.96 La tabla del anlisis de varianza se presenta a continuacin. ANOVA DE LA RESISTENCIA DE LA FIBRA Fuente de variacin Tratamientos Bloques Error Exptal. Total Suma de cuadrados 18.04 6.69 0.96 25.69 Grados de libertad 3 4 12 19 Cuadrado medio 6.01 1.67 0.08 F 75.13 20.87
Para decidir si existe diferencia significativa entre los compuestos obtiene la probabilidad de tener una F = 75.13 de la tabla F de probabilidad de tener una F igual a la de la muestra es menor al 5% hiptesis H0: los tratamientos son iguales y se acepta la hiptesis menos un tratamiento es diferente.
La manera como se busca la probabilidad en la tabla F es: localizar en la parte superior de la tabla los grados de libertad para el numerador de la razn F que se tienen en el ANOVA, en nuestro caso v 1 = 3; posteriormente se busca en la parte izquierda de la tabla los grados de libertad del denominador, en nuestro ejemplo v2 = 12. Donde se intercepten v 1 y v2 se localiza el valor de F esperada en el anlisis a cierto nivel de . En nuestro caso son: v1 = 3 v2 12 = 0.10 2.61 = 0.05 3.49 = 0.01 5.95
Se puede ver que el valor de F = 75.13 se encuentra a la derecha de 5.95 por lo que le corresponde una probabilidad menor a 0.01. Puesto que la probabilidad de que se hubiese obtenido por mero azar una F = 75.13 es menor al 5%, rechazamos la hiptesis nula (H0: 1 = 2 =. . . = ) y se acepta la hiptesis alterna (H1: i j para alguna i , j) , con lo que se puede concluir que existe diferencia altamente significativa en cuanto a resistencia en psi se refiere de los compuestos qumicos, o sea los tratamientos son diferentes. En el ANOVA se observa que la F calculada para bloques fue mayor que uno, en nuestro caso es de 20.87. Esto nos indica que al haber utilizado el diseo de bloques al azar para probar el efecto de los tratamientos, se logr ganar eficiencia ante el diseo completamente al azar, es decir, que se realiz un buen bloqueo. El error experimental lo construyen la interaccin entre bloques y tratamientos . Por lo que no debe existir interaccin entre estas dos fuentes de variacin. O lo que es lo mismo, si el tratamiento A es bueno en el bloque uno, as debe ser en los dems 6
bloques. Si se presenta interaccin, los datos deben ser analizados bajo otra mtrica (transformarlos). Los resultados de la prueba Duncan se muestran a continuacin, as como la agrupacin de los promedios de tratamientos. A 0 1 b c c C B 2 b 3 a a D 4
yi .
La clasificacin de los mejores tratamientos se presenta en la tabla siguiente. CLASIFICACIN DE TRATAMIENTOS SEGN PRUEBA DE DUNCAN Compuestos qumicos D B C A Resistencia promedio de la fibra en psi. 3.45 1.76 1.38 1.14 Significacin estadstica a b bc c
La prueba nos indica que el tratamiento D es superior estadsticamente a todos los dems, le siguen B y C que pueden considerarse equivalentes, pero C es semejante matemticamente a A. Para este caso el compuesto qumico a recomendar es el tratamiento D, por lograr dar mayor resistencia a la fibra. 6.5 Anlisis residual y verificacin del modelo. Los supuestos en que se basa el anlisis de varianza para dar al modelo como vlido son: a) b) c) d) Las varianzas de los tratamientos son iguales. Las varianzas de los bloques son iguales. No existe interaccin entre bloques y tratamientos. Los errores (residuos) son independientes, aleatorios con media igual a cero y varianza constante. e) La variable de salida se distribuyen de manera normal.
Con el fin de verificar los supuestos del ANOVA antes citados, iniciaremos por calcular los residuos as como los valores ajustados, con el fin de poder realizar las grficas correspondientes. Los residuos para el diseo de bloques al azar son justo la diferencia entre los valores ij ), y se define por: observados ( yij ) y los ajustados ( y
eij = yij y ij
As el residuo e11 que corresponde al tratamiento A del primer bloque, en el ejemplo de la comparacin de los cuatro compuestos qumicos es:
11 e11 = y11 y
11 = y1. + y.1 y.. =1.14 + 2.3 1.96 =1.48 y
Donde
RESIDUOS PARA LA RESISTENCIA DE LA FIBRA Compuesto qumico A B C D 1 -0.18 0.10 0.08 0.00 2 -0.11 0.07 -0.24 0.27 Bloques: 3 0.44 -0.27 0.30 -0.48 4 -0.18 0.00 -0.12 0.30 5 0.02 0.10 -0.02 -0.10
Si graficamos los residuos contra los tratamientos y bloques podemos observar que: En la grfica de residuos contra tratamientos se puede apreciar que no existe un patrn definido, es decir la amplitud de la dispersin de los puntos en cada tratamiento tiende a ser similar, por lo que podemos decir que el supuesto de igualdad de varianzas en los tratamientos se cumple . En igual forma se puede ver que los residuos son aleatorios y con promedio de cero. As mismo en esta grfica se observa que el tipo de compuesto D que proporciona la resistencia ms grande, presenta variabilidad un poco mayor en cuanto a resistencia. GRFICA DE RESIDUOS CONTRA TRATAMIENTOS
0,25 Residuo
0,00
-0,25
-0,50 1,0 1,5 2,0 2,5 3,0 TRATAMIEN TOS 3,5 4,0
1 = tratamiento A
2=B
3=C
4=D
En la grfica de rersiduos contra bloques se observa que los puntos se distribuyen de manera aleatoria en la banda horizontal (no existe tendencia o patrn definido), lo anterior nos indica que el supuesto de igualdad de varianzas en los bloques se cumple. Por el contrario si los residuos presentaran un patrn como un embudo, sera evidencia de que no se cumple el supuesto de varianzas constantes. GRFICA DE RESIDUOS CONTRA BLOQUES
0,25 Residuo
0,00
-0,25
-0,50 1 2 3 Bloques 4 5
En iguial forma en esta grfica se observa que la muestra de fibra (bloque 3) presenta mayor variabilidad en la resistencia cuando se trata con los cuatro componentes qumicos que las otras muestras.
Cuando aparece un patrn en alguna de las grficas, por lo general suele indicar la necesidad de una transformacin de los datos originales, esto es, analizar la variable de salida bajo una mtrica diferente.
ij (valores ajustados) para Es recomendable realizar una grfica de residuos contra y probar la interaccin de tratamientos y bloques. Si la grfica resultante presenta la forma de curva, esto nos sugiere que existe interaccin, si esto sucede, debe usarse alguna transformacin de los datos originales. y volver a realizar el ANOVA y las pruebas de rango, pero ahora con los nuevos valores.
El cuadro siguiente muestra los valores ajustados para cada uno de los tratamientos en los diferentes bloques. VALORES AJUSTADOS PARA LA RESISTENCIA DE LA FIBRA Compuesto qumico A B C D 1 1.48 2.10 1.72 3.90 2 1.71 2.33 1.95 4.13 Bloques: 3 0.06 0.68 0.30 2.48 4 1.38 2.00 1.62 3.80 5 1.08 1.70 1.32 3.50
Si relacionamos los valores de los residuos obtenidos con anterioridad en el eje y con los valores ajustados del cuadro anterior en el eje x, obtenemos la siguiente grfica:
ij GRFICA DE eij CONTRA y
vs. ajustes
(la respuesta es Respuesta) 0.50
0.25 Residuo
0.00
-0.25
Como los residuos se encuentran distribuidos de manera aleatoria en la lnea horizontal y no presentan la forma de curva, podemos concluir que no existe interaccin entre bloques y tratamientos.
10
La grfica que nos dice si la variable de salida se distribuye de manera normal, es la de probabilidad normal de los residuales, que se presenta a continuacin. GRFICA DE PROBABILIDAD NORMAL DE LOS RESIDUOS
99
95 90 80
Porcentaje
70 60 50 40 30 20 10 5
-0,50
-0,25
0,00 Residuo
0,25
0,50
Puede observarse que los residuos o puntos se encuentran alineado ms o menos en la lnea recta (no hay valores atpicos o aberrantes), por lo tanto el supuesto de normalidad de la variable de salida ( y ij ) podemos decir que se cumple. Otro indicador prctico que nos dice si la variable de salida se distribuyen de manera normal es el coeficiente de variacin, que se simboliza por:
CV = CME (100) / y
Donde CME es el cuadrado medio del error del anlisis de varianza de los datos. Un criterio prctico que indica normalidad en los datos, es cuando el coeficiente de variacin toma los siguientes valores: 0 a 10% muy confiable la normalidad. 10 a 20% confiable la normalidad. 20 a 30% poco confiable la normalidad. Ms de 30% no confiable la normalidad. En nuestro ejemplo el coeficiente de variacin es de 14.4%, lo que nos indica que la normalidad es confiable.
CV = 0.08 (100) / 1.96 =14.4%
11
Dado que no se presentaron anomalas al realizar el anlisis residual, concluimos de manera general, que en base a la evidencia experimental nuestro modelo utilizado para analizar la informacin es vlido. 6.6 Datos faltantes en un diseo de bloques al azar. Muchas veces despus de haber realizado un gran esfuerzo en la planeacin y la conduccin del experimento, nos encontramos con el problema de que se pierden parcelas experimentales. Esto es muy comn debido a: Un animal muere por causas ajenas al tratamiento, una parcela en el campo se inunda, nos destruyen la informacin de una unidad experimental, un tubo de ensayo se quiebra en el laboratorio, un roedor nos destruye una unidad experimental en la fbrica, etc. Donde todos estos acontecimientos son ajenos a los efectos de los tratamientos. Esto comnmente ocasiona un desbalanceo en el experimento. Si estamos en un diseo completamente al azar no hay problema ya que se trabaja como experimento desbalanceado, pero en un diseo bloques al azar, un dato faltante destruye usualmente el balance, ya que todos los tratamientos deben estar en cada bloque. Qu hacer cuando se desbalancea un experimento? 1. Falta un bloque completo. Cuando falta uno o ms bloques, el anlisis se procede de forma normal, siempre y cuando tengamos por lo menos dos bloques. 2. Falta totalmente un tratamiento. Nuevamente el anlisis se procede normalmente, siempre y cuando nos hayan quedado por lo menos dos tratamientos. 3. La situacin que ocurre comnmente es la falta de una unidad experimental. En este caso, existe un mtodo desarrollado por Yates para estimar un dato perdido mediante el algoritmo matemtico siguiente:
tT + bB G (b 1)(t 1)
yp =
Donde: t = nmero de tratamientos. b = nmero de bloques. T = total del tratamiento correspondiente al dato perdido. B = total del bloque correspondiente al dato perdido. G = suma de todas las observaciones reales. Para mayor precisin en la prueba de F, a la suma de cuadrado de tratamientos se le sustrae la cantidad.
12
[ B (t 1) y ] Z=
p
t (t 1)
Donde: B = total no corregido del bloque donde se present la observacin faltante. El valor estimado ( y p ) se reemplaza en el lugar correspondiente y el ANOVA se realiza en la forma usual, excepto que se sustrae un grado de libertad en el error y el total. Tomemos el ejemplo de los datos de diferentes compuestos qumicos en la resistencia de una fibra, suponiendo que se perdi el tratamiento A del bloque cuatro. Bloques: 3 0.5 0.4 0.6 2.0 3.5
Tratamientos A B C D Total
[ B (t 1) y ] Z=
p
t (t 1)
[ 7.6 (4 1)1.5] =
4( 4 1)
= 0.80
El valor obtenido de la parcela perdida de 1.5, es substituido en la tabla correspondiente del dato faltante y se realiza el anlisis de varianza de la manera acostumbrada, teniendo cuidado de restarle a la suma de cuadrados de tratamientos la correccin, que en nuestro caso es 0.80, as como restar un grado de libertad en el error y el total.
Tratamientos
Bloques: 3
Total 13
A B C D Total
Las sumas de cuadrados y grados de libertad se presentan a continuacin. S. C. Tratamientos S. C. Tratamientos corregida S. C. Bloques S. C. Error S. C. Total = = = = = 17.566 17.566 0.8 = 16.766, con 3 g. l. 6.86 con 4 g. l. 25.32 17.56 6.86 = 0.90 con 11 g. l. 25.32 con 18 g. l.
Observe que a la suma de cuadrados del error se le rest la suma de cuadrados de tratamientos sin corregir. El ANOVA correspondiente queda definido por: ANOVA DE LA RESISTENCIA DE LA FIBRA Fuente de variacin Tratamientos Bloques Error Exptal. Total Suma de cuadrados 16.77 6.86 0.90 25.32 Grados de libertad 3 4 11 18 Cuadrado medio 5.590 1.715 0.082 F 68.17 20.92
6.6.1 Cuando se tiene varios datos perdidos. Cuando en el experimento se presentan varios datos perdidos en diferentes bloques, el procedimiento para estimarlos se presenta a continuacin: 1. Se estiman todos los datos perdidos excepto uno de ellos. Una aproximacin razonable para ellos se puede obtener calculando
( y j + yi ) / 2 .
2. El dato restante se estima siguiendo el procedimiento de cuando existe solo un dato perdido. 3. Con esta aproximacin y los valores previamente asignados, se escoge otro de los datos y nuevamente se aproxima por la tcnica cuando existe solo un dato perdido , y as sucesivamente. 4. Despus de completar un ciclo, una segunda aproximacin se realiza para todos los valores en el orden dado previamente. Esto se contina hasta que no existen
14
diferencias esenciales a la aproximacin encontrada en el ciclo previo. Usualmente dos ciclos son suficientes. 5. Los valores estimados se introducen en la tabla junto con los valores observados y el ANOVA se efecta. Por cada dato perdido se sustrae un grado de libertad tanto al total como en el error. 6. Para mayor precisin en la prueba F, a la S. C. de tratamientos se le sustrae la cantidad:
[ B (t 1) y ] + [ B (t 1) y ] Z=
2 a b
t (t 1)
Donde: B = total sin corregir de todas las observaciones en el mismo bloque en que se present la 1a observacin faltante. B = total sin corregir de todas las observaciones en el mismo bloque en que se present la 2a observacin faltante. Ejemplo. Considere el siguiente experimento donde la variable evaluada fue el rendimiento, y en el experimento se perdieron dos unidades experimentales (tratamientos B bloque 1 y tratamientos D bloque 3). RENDIMIENTO... Tratamientos A B C D E F Total 1 4.4 ya 4.4 6.8 6.3 6.4 28.3 Bloques: 2 5.9 1.9 4.0 6.6 4.9 6.3 29.6 3 6.0 4.9 4.5 yb 5.9 7.7 29.0 4 4.1 7.1 3.1 6.4 7.1 7.7 35.5 Total 20.4 13.9 16.0 19.8 24.2 28.1 122.4
Los clculos para la obtencin de las parcelas perdidas son: 1. Iniciemos por calcular la primera parcela perdida y b.
15
yb =
(29 / 5) + (19.8 / 3) = 6 .2 2
2.
3.
4.
5.
Si nicamente tenemos dos observaciones faltantes (no en el mismo bloque ) la correccin necesaria para los sesgos en la suma de cuadrados de tratamientos es:
[ B (t 1) y ] + [ B (t 1) y ] Z=
2 a b
t (t 1)
Z=
[ 28.3 (6 1)4.47]
Tratamientos A B
1 4.4 4.47
3 6.0 4.9
4 4.1 7.1
C D E F Total
Las sumas de cuadrados para las fuentes de variacin son: S. C. Tratamientos S. C. Tratamientos corregida S. C. Bloques S. C. Total S. C. Error = = = = = 29.46 29.46 2.81 = 26.65 4.50 51.95 51.95 29.46 4.50 = 17.99
Los grados de libertad para las fuentes de variacin son: Fuente de variacin Tratamientos Bloques Error experimental Total Grados de libertad Normal corregido 5 5 3 3 15 13 23 21
El anlisis de varianza correspondiente para el experimento donde se perdieron dos datos se presenta a continuacin: Fuente de variacin Tratamientos Bloques Error Exptal. Total Suma de cuadrados 26.65 4.50 17.99 51.95 Grados de libertad 5 3 13 21 Cuadrado medio 5.33 1.50 1.38 F 3.86 1.09
Si faltan ms de dos observaciones, o si faltan dos observaciones en el mismo bloque, debe hacerse correccin por sesgos o tendencias en la suma de cuadrados de tratamientos. Apndice 6.1 Empleo del software Minitab en un diseo bloques al azar. Para ilustrar el empleo del software Minitab en la elaboracin del ANOVA y el anlisis residual, tomaremos el experimento para determinar el efecto de cuatro diferentes compuestos qumicos en la resistencia de una fibra. Los pasos a seguir pueden ser:
17
1. En la columna C1 de la hoja de clculo rotule Tratamientos, en C2 Bloques y en C3 Respuesta. 2. Para concentrar los tratamientos (A, B, C, D) sern utilizados nmeros en lugar de letras. La manera como son concentrados los tratamientos, los bloques y la variable de salida en la hoja de clculo, puede ser: Tratamientos 1 1 1 1 1 2 . . . . 4 Bloques 1 2 3 4 5 1 . . . . 5 Respuesta 1.3 1.6 0.5 1.2 1.1 2.2 . . . . 1.9
1 2 3 4 5 6 . . . . 20
3. Seleccione el men Estadsticas. 4. Seleccione ANOVA. 5. Hacer clic en Dos factores. 6. Cuando aparezca el cuadro de dilogo Anlisis de varianza de dos factores: Ingresar C3 en el cuadro de Respuestas. Ingresar C1 en el cuadro Factor de fila. Ingresar C2 en el cuadro Factor de la columna. Hacer clic en el cuadro Almacenar residuos. Hacer clic en el cuadro Almacenar ajustes. Hacer clic en Grficas. 7. Cuando aparezca el cuadro de dilogo Anlisis de varianza-de dos factoresGrficas: Hacer clic en el botn Grficas individuales. Hacer clic en el cuadro Grfica normal de residuos. Hacer clic en el cuadro Residuos vs ajustes. Hacer clic en el cuadro Residuos vs las variables. Ingresar C1 en el cuadro Residuos vs las variables. Ingresar C2 en el cuadro Residuos vs las variables. Hacer clic en Aceptar. Hacer clic en Aceptar. En los cuadros de dilogo, MINITAB tiene otras posibilidades ms que usted puede aprovechar seleccionando las opciones que desee. 18
19