You are on page 1of 14

5.2 Diseo en bloques completamente aleatorizados.

El modelo de diseo de experimentos con bloques ms sencillo es el diseo de bloques completamente aleatorizados, con este diseo se quiere estudiar la influencia de un factor tratamiento (T ) con I niveles en una variable de inters en presencia de una variable extraa, el factor bloque, B , que tiene J bloques. El motivo de la denominacin de este modelo es la siguiente: se ha agrupan las unidades experimentales en J bloques, en funcin de B ,aleatorizando la forma de asignar los tratamientos dentro de cada bloque y es un diseo completoy equilibrado porque cada tratamiento se utiliza exactamente una vez dentro de cada bloque. En este modelo, un bloque es un grupo de I unidades experimentales tan parecidas como sea posible con respecto a la variable B , asignndose aleatoriamente cada tratamiento a una unidad dentro de cada bloque. 5.2.1 Modelo matemtico. La formulacin matemtica del modelo de diseo en bloques completamente aleatorizados con un factor principal (factor tratamiento), T ,con I niveles y un factor secundario (factor bloque), B ,con J niveles o bloques es la siguiente: Para cada i = 1,...,I; j = 1,...,J,

(5.1)

siendo,
* Y ij el resultado del tratamiento i-simo,i = 1,2,...,I de T al bloque jsimo, j= 1,2,...,ni. * es la media de toda la poblacin. Mide el nivel medio de todos los

resultados. * i es el efecto del tratamiento i-simo deT ,i = 1,2,...,I. Mide el efecto incremental del tratamiento del nivel i de T sobre el efecto global. Se verifica que i = 1I i= 0, * j es el efecto del bloque j-simo,j = 1,2,...,J, mide el efecto incremental del tratamiento delfactor secundario (bloque) sobre el efecto global ( ). Se verifica que j = 1J i = 0, * ij es el error experimental o perturbacin, son variables aleatorias independientes idnticamentedistribuidas (i.i.d.) con distribucin N .

El nmero de observaciones es: n = IJ, El problema bsico que se plantea es contrastar la hiptesis nula de que el factor-tratamiento no influye, (5.2) frente a la alternativa de que s existen diferencias entre los valores medios de los distintos tratamientos. En el estudio de este modelo debe de tenerse en cuenta que no existe interaccin entre el factor-tratamiento y el factor-bloque y en el desarrollo el problema puede hacerse un segundo contraste acerca de si el factor-bloque es influyente o no. Este contraste es

(5.3) frente a la alternativa de que s existen diferencias entre los valores medios de los distintostratamientos del segundo factor. Sin embargo en el modelo tratamiento-bloque realizar estecontraste carece de inters salvo para saber si ha sido conveniente bloquear o no. Por ello en la prctica: Carece de inters plantearse la hiptesis nula de igualdad de los efectos bloque. El nico objetivo puede ser el de concluir si bloquear el experimento result o no beneficioso. En efecto, si la suma de cuadrados medios atribuibles a los bloques es considerablemente mayor que la suma de cuadrados medios residual, habr resultado til bloquear en el sentido de que tal accin deriv en una reduccin del tamao del error experimental. En otro caso, bloquear es contraproducente. 5.2.2 Estimacin de los parmetros. El nmero de parmetros que hay que estimar en modelo (5.1) es

utilizando n = IJ observaciones hay que estimar un nmero de parmetros

Se utiliza el mtodo de mnimos cuadrados que se basa en minimizar la suma de los cuadrados de los residuos

(5.4)

se obtienen los siguientes estimadores:

(5.5)

(5.6)

(5.7) Por tanto, la prediccin en la casilla es (5.8) y los residuos son

La suma de los residuos en cada fila y cada columna es cero, por tanto, hay I
+J -1 relaciones entre los IJ residuos y el nmero de grados de libertad es

Razonando como en el modelo de diseo completamente aleatorizado se obtiene que el estimador de la varianza es la varianza residual

(5.9)
Propiedades de los estimadores.

La distribucin de los estimadores anteriores es la siguiente,

(5.10)

(5.11)

(5.12)

(5.13) Por tanto, los estimadores definidos son centrados y eficientes. Utilizando las distribuciones anteriores(la ty la 2) se pueden calcular intervalos de confianza de los parmetros del modelo. Para calcular intervalos de confianza acerca de las medias de los niveles, las distribuciones de referencia son: Para las medias de los niveles del factor tratamiento T

(5.14)

Para las medias de los bloques

del factor bloque B (5.15)

5.2.3 Anlisis de la varianza.

Utilizando

se puede hacer la siguiente descomposicin de las diferencias para cada i = 1,...,I; j = 1,...,J,

(5.16)

elevando al cuadrado en (5.16) y teniendo en cuenta que los dobles productos se anulan, la suma de cuadrados global se puede descomponer de la forma:

esto es,

(5.13) escrito de otra forma

de donde se deduce la siguiente tabla ANOVA CUADRO DEL ANLISIS DE LA VARIANZA MODELO TRATAMIENTO-BLOQUE Fuente de Variacin Tratamientos J Suma de Cuadrados scT =
i
2

g.l. I-1

scm scmT =

Bloques

scB = I
j
2

scmT = J -1 (I 1)(J -1) IJ - 1 scmR =

Residual
i j

scR =
2

Global
i

scG =
j
2

scmG =

Rechazar H0(1): Rechazar H0(2):

= ...=

, segn p = P , segn p = P

= ...=

Tabla 5.1: Anlisis de la varianza para un diseo en bloques completamentealeatorizados. De esta tabla ANOVA se deducen dos contrastes: Si H0(
)

es cierto, el factor-tratamiento no influye, se verifica que

(5.14)

se rechaza H0( ) al nivel de significacin si 1= >F , Si H0( ) es cierto, el factor-bloque no influye, se verifica que

(5.15)

se rechaza H0(

al nivel de significacin si
,

= (scmB / scmR) > F


Comentarios.

La eficacia de este diseo depende de los efectos de los bloques. Sistos son pequeos, esms eficaz el diseo completamente aleatorio ya que el denominador en la comparacin detratamientos tiene menos grados de libertad. Sin embargo si los bloques influyen es muchomejor y ms eficaz este modelo, ya que disminuye la variabilidad no explicada. Por ello, esmejor estudiar primero el modelo de bloques aleatorizados y, si los bloques no influyen, sepasa fcilmente al modelo de un solo factor sumando en la tabla ANOVA la fila del factorbloque con la de la variabilidad residual. Se define el Coeficiente de Determinacin como:

siendo R2(T ) yR2(T ) loscoeficientes de determinacin parcialesasociados alfactor-tratamiento y al factor-bloque, respectivamente. Representan el tanto por uno de lavariabilidad total explicada por los tratamientos y los bloques. El tratamiento estadstico expuesto para el modelo de diseo de experimentoscompletamentealeatorizado con un factor tratamiento y un factor bloque es exactamente igual que el diseode experimentos con dos factores tratamiento sin interaccin. Si de la tabla ANOVA del modelo de diseo de experimentos completamente aleatorizado sededuce que existen diferencias entre los tratamientos, estas diferencias se estimanpor Se pueden obtener intervalos de confianza de ia partir de la distribucin

(5.16)

de forma anloga se puede hacer para las diferencias

La eficacia de este diseo depende de los efectos de los bloques. Si stos son pequeos, es ms eficaz el diseo completamente aleatorio ya que el denominador en la comparacin de tratamientos (ver (5. 13)) tiene menos grados de libertad. Sin embargo si los bloques influyen es mucho mejor y ms eficaz este modelo ya que disminuye la variabilidad no explicada. Por ello es mejor estudiar primero el modelo de bloques aleatorizados y, si los bloques no influyen, se pasa fcilmente al modelo de un solo factor sumando en la tabla ANOVA la fila del factor bloque con la de la variabilidad residual. Aunque existe una discusin acerca de si se puede pasar de un modelo a otro ya que una diferencia importante entre los dos modelos es que en un diseo completamente aleatorizado, los tratamientos y, equivalentemente, los niveles de los factores tratamiento son asignados aleatoriamente a las unidades experimentales. Por el contrario, en un diseo en bloques, aunque las observaciones son tambin tomadas sobre todas las combinaciones de tratamientos y bloques, slo los niveles del factor tratamiento son asignados aleatoriamente a las unidades experimentales. Hay que tener en cuenta que la divisin de las unidades experimentales para formar los bloques es determinista. Esto ha hecho que exista una fuerte controversia acerca de si es apropiado o no contrastar la igualdad de los efectos bloque. Al fin y al cabo, en el diseo que se est analizando los bloques representan fuentes de variacin nuisance, esto es, no existe inters alguno en la posible significacin del efecto bloque. Ms an, es poco probable que sea factible utilizar los mismos bloques en una hipottica rplica del experimento. Por todo ello, en la prctica Bloquear sin ser necesario conduce a pruebas de hiptesis menos potentes y a intervalos de confianza ms amplios que aquellos que se obtendran mediante un diseo completamente aleatorizado. Si se tiene un diseo de experimentos con dos factores tratamiento (T y T ) entre los que no existe interaccin, el tratamiento estadstico y desarrollo que se estudia en esta seccin es vlido para este modelo. En este caso el contraste de las dos hiptesis acerca de la influencia de los efectos de los niveles de los dos factores T y T dados en (5.2) y (5.3) son de gran inters, contrastes que se resuelven a partir de la tabla ANOVA utilizando (5.1 3) y (5.1 4). En cualquier caso, aunque el modelo de bloques completamente aleatorizado y el modelo de dos factores sin interacin tienen un desarrollo matemtico anlogo, su planteamiento y objetivos son diferentes. 5.2.4 Anlisis de residuos. Como en cualquier modelo estadstico hay que contrastar que se verifican las hiptesis del modelo. Esto se hace, bsicamente, por medio del anlisis de los residuos. Todo lo estudiado sobre este particular en el modelo de un solo factor

(diseo completamente aleatorizado) sigue siendo vlido para este modelo. Se contrastarn las hiptesis de:
Normalidad de los residuos. Homocedasticidad: la varianza en los diferentes niveles de cada uno de los dos

factores esconstante. Independencia de los residuos. Homogeneidad de los datos, todos provienen de la misma distribucin y no hay datosatpicos. No existe interaccin entre los dos factores. El concepto de interaccin se estudia con mayor detalle en la seccin siguiente. Intuitivamente y basndose en el ejemplo 5.1. que no exista interaccin entre el factor tratamiento T y el factor bloque B significa que la velocidad de impresin de una determinada impresora es mayor (o menor) de la media global independientemente de la foto que imprima (del bloque). Si existe interaccin entre T y B , el modelo de bloques completamente aleatorizado no es adecuado y hay que tratar el factor bloque como un factor tratamiento (T ). Se tiene entonces un diseo de experimentos con dos factores (tratamiento) y el modelo matemtico es (5.20) el parmetro ( )ij representa la interaccin del nivel i del factor T con el nivel j del factor T . Este modelo se estudia en la seccin 4 de este captulo. 5.2.5Anlisis de un caso. Se desarrolla el problema presentado en el Ejemplo 5.1. cuyo enunciado ms concreto es el siguiente, Ejemplo 5.1.b. Una empresa fotogrfica tiene que realizar una compra de impresoras de gran calidad que se van a utilizar en imprimir fotografas digitales. La empresa tiene ofertas de I = 5 marcas de impresoras de similares caractersticas y precio. Para la empresa fotogrfica es muy importante la velocidad de impresin y, por este motivo, est interesada en saber si las 5 impresoras ofertadas tienen la misma velocidad o hay una que es ms rpida. Para responder a esta pregunta decide hacer un experimento que consiste en elegir una nica muestra de J = 4 fotos e imprimirlas en las 5 impresoras. Los resultados del experimento se recogen en la tabla adjunta

Foto A Impresora 1 89 Impresora 2 84 Impresora 3 81 Impresora 4 87 Impresora 5 79 Solucin. Estimacin de los parmetros. 88 77 87 92 81

Foto B 97 92 87 89 80

Foto C 94 79 85 84 88

Foto D

Se obtienen las siguientes estimaciones Estimaciones Foto A Impresora 89 1 Impresora 84 2 Impresora 81 3 Impresora 87 4 Impresora 79 5
. j

Foto B 88 77 87 92 81 85 -1 97 92 87 89 80 89 3

Foto C 94 79 85 84 88 86 0

Foto D

. i

92 83 85 88 82

6 -3 -1 2 -4

84 -2

..

= 86

Las predicciones y residuos son : Predicciones F. A I.1 90 I.2 81 I.3 83 I.4 86 I.5 80 91 82 84 87 81 Residuos F. B 95 86 88 91 85 F. C 92 83 85 88 82 F. D

F. A I.1 I.2 I.3 I.4 I.5 La varianza residual es -1 3 -2 1 -1

F. B -3 -5 3 5 0

F. C 2 6 -1 -2 -5

F. D 2 -4 0 -4 6

Intervalos de confianza. Intervalos de confianza al 90% para los parmetros del modelo son: Para
2

Para (tiempo medio global)

Para

I3

= +

(tiempo medio de imprimir de la impresora 3)

Para

(el efecto de la impresora 3)

Para

31

I3

I1

(diferencia entre la impresora 3 y la 1)

Trabajando al 90% se obtienen los siguientes grupos homogneos de impresoras: Imp. 5 - Imp. 2 - Imp. 3 Imp. 2 - Imp. 3 - Imp. 4 Imp. 4 - Imp. 1 Tabla ANOVA. Fuentes de variacin scT scB scR scG Suma de cuadrados 264 70 226 560 Grados de libertad 4 3 7 12 19 Varianzas 66'00 23'33 47'71 18'83 29'47

scExplicada 334

A partir de esta tabla se obtienen los siguientes contrastes H0


1

= ...=

= 0 (el tipo de impresora no influye)

p-valor= 0'0407. Se rechaza H0 para = 0'05, pero el p-valor ofrece dudas acerca de la influencia del factor tipo de impresora. H0
1

= ...=

= 0 (el tipo de foto no influye)

p-valor= 0'3387. Se acepta H0 para cualquier razonable y el factor bloque tipo defoto no influye, por tanto, no convena bloquear. Coeficientes de determinacin. Los coeficientes de determinacin parciales son

el factor tipo de impresora explica el 47'14% de variabilidad.

el factor tipo de foto explica el 12'50% de variabilidad. El coeficiente de determinacin total es la suma de los parciales,

el modelo explica el 59'64% de variabilidad. Un modelo alternativo. En conclusin, parece razonable aceptar la influencia del factor-tratamiento tipo de impresora y la no influencia del factor bloque tipo de foto. Se puede pasar facilmente al modelo completamente aleatorizado, la tabla ANOVA con un solo factor que se obtiene de la anterior sumando las filas de scB y scR, obteniendo Tabla ANOVA Resultados con un solo factor Fuentes de Variacin scT scR scG Ahora el contraste H0
1

Suma de Cuadrados 264 296 560 =


2

Grados de libertad 4 15 19
5

Varianzas 66'00 19'73 29'47

= ...=

= 0 (el tipo de impresora no influye) es

p-valor= 0'038. Se rechaza H0 para > 0'038. Se tiene mayor seguridad acerca de la influencia del factor tipo de impresora que en el modelo anterior. [Siguiente] [Anterior] [Arriba]