You are on page 1of 32

DISEÑO FACTORIAL 𝟐𝟐

El primer diseño que se piensa abordar es el diseño que tiene dos factores, A y B; y cada
uno tiene dos niveles, alto (+) y bajo (-). Para los diseños de tipo factorial se acostumbra a
realizar n repeticiones por tratamiento, abarcando un mayor margen de información con
respecto a los diseños en bloque.

Cabe mencionar que el orden para realizar cada corrida experimental es completamente
aleatorio, lo que supone un trabajo más arduo a la hora de preparar la experimentación, ya
que a diferencia del diseño de bloque se podía elegir un orden en particular.

Es importante aclarar que para el análisis de estos diseños se suponen que

1. Los factores en todo tiempo son fijos.


2. Los diseños son completamente aleatorizados.
3. Se satisfacen los supuestos de normalidad usuales.
Una forma para ordenar la información en un diseño factorial 22 con 𝑛 replicas es la
siguiente:
Factor Combinación de Replica Total
A B tratamientos 1 2 ... n
𝑛
- - A bajo, B bajo (1)1 (1)2 ... (1)𝑛
∑(1)𝑘 = (1)
𝑘=1
𝑛
+ - A alto, B bajo 𝑎1 𝑎2 ... 𝑎𝑛
∑ 𝑎𝑘 = 𝑎
𝑘=1
𝑛
- + A bajo, B alto 𝑏1 𝑏2 ... 𝑏𝑛
∑ 𝑏𝑘 = 𝑏
𝑘=1
𝑛
+ + A alto, B alto 𝑎𝑏1 𝑎𝑏2 ... 𝑎𝑏𝑛
∑ 𝑎𝑏𝑘 = 𝑎𝑏
𝑘=1

de manera gráfica se puede observar de la siguiente manera:


Ejemplo 2.1 de diseño 𝟐𝟐

Un bacteriólogo está interesado en los efectos de dos medios de cultivo diferentes y dos
tiempos diferentes sobre el crecimiento de un virus particular. Se realizan seis réplicas de
un diseño 2^2, haciendo las corridas de manera aleatoria. Se requiere analizar los datos del
crecimiento viral que se presentan enseguida y sacar conclusiones apropiadas.

Medio de cultivo
Tiempo (hrs)
1 2
12 21 22 25 26
23 28 24 25
20 26 29 27
18 37 39 31 34
38 38 29 33
35 36 30 35

Ejemplo 2.2 de diseño 𝟐𝟐

Un ingeniero industrial empleado por una compañía refresquera está interesado en los
efectos de dos diferentes tipos de botellas de 32 onzas sobre el tiempo de entrega de cajas
de 12 botellas del producto. Los dos tipos de botellas son de vidrio y de plástico. Se usan
dos empleados para realizar una tarea que consiste en mover 40 cajas de producto 50 pies
en una plataforma de carga estándar y acomodarlas en un estante de venta. Se hacen cuatro
réplicas de un diseño factorial 22 y los tiempos observados se enlistan en la siguiente tabla.

Empleado
Tipo de botella
1 2
Vidrio 5.12 4.89 6.65 6.24
4.98 5.00 5.49 5.55
Plástico 4.95 4.95 5.28 4.91
4.27 4.25 4.75 4.71

Como observamos los experimentos del tipo factorial tienen características muy sencillas
en cuanto a la concepción, pero exigen una mayor demanda al momento de experimentar
por la cantidad de corridas experimentales que se pueden llegar a realizar y lo costoso que
puede resultar eso.

Efectos principales y de interacción.

Definimos el efecto de A en el nivel bajo de B como 𝐴− = [𝑎 − (1)]/𝑛.


Definimos el efecto de A en el nivel alto de B como 𝐴+ = [𝑎𝑏 − 𝑏]/𝑛.
Definimos el efecto de B en el nivel bajo de A como 𝐵 − = [𝑏 − (1)]/𝑛.
Definimos el efecto de B en el nivel alto de A como 𝐵 + = [𝑎𝑏 − 𝑎]/𝑛.
Donde observamos que una de estas definiciones es el promedio de las diferencias entre
los niveles al dejar fijo un nivel en el otro factor. Podemos asumir que mientras más grande
este número mayor es la diferencia entre los niveles.

El efecto principal de A se obtiene de la siguiente manera

𝐴 = [𝐴− + 𝐴+ ]/2

y el efecto principal de B se obtiene como

𝐵 = [𝐵 − + 𝐵 + ]/2
donde observamos que cada uno es el promedio entre las dos variaciones y nos da una
manera de medir que tanto varía en general pasar de un nivel a otro independientemente
del nivel de factor de el otro factor.
El efecto de la interacción AB se obtiene de la siguiente manera

𝐴𝐵 = [𝐴+ − 𝐴− ]/2 = [𝐵 + − 𝐵 − ]/2

Ejemplo 2.3

Un experimento es realizado para investigar la distorsión de los engranajes de transmisión


en automóviles. Se incluyeron dos factores para determinar los efectos, es decir, el tamaño
del engranaje (Y1) y la posición de la pieza (Y2). En la siguiente tabla se muestra un estudio
de ocho engranajes para cada combinación de tamaño de diente y posicionamiento de la
pieza.
Tamaño del engranaje Posición
Y2 (-) Y2 (+)
Y1(-) 18.0 13.5
16.5 8.5
26.0 11.5
22.5 16.0
21.5 -4.5
21.0 4.0
30.0 1.0
24.5 9.0
Y1(+) 27.5 17.5
19.5 11.5
31.0 10.0
27.0 1.0
17.0 14.5
14.0 3.5
18.0 7.5
17.5 6.5
Para dicho ejemplo calcularemos los efectos principales y de interacción, primero
llevaremos la información a otra forma de analizarlo:

Factor Combinación de Replica Total


Y1 Y2 tratamientos 1 2 3 4 5 6 7 8
- - Y1 bajo, Y2 bajo 18 16.5 26 22.5 21.5 21 30 24.5 (1) =180
+ - Y1 alto, Y2 bajo 27.5 19.5 31 27 17 14 18 17.5 𝑎 =171.5
- + Y1 bajo, Y2 alto 13.5 8.5 11.5 16 -4.5 4 1 9 𝑏 = 59
+ + Y1 alto, Y2 alto 17.5 11.5 10 1 14.5 3.5 7.5 6.5 𝑎𝑏= 72

luego
𝐴− = −1.0625
𝐴+ = 1.625
𝐵− = −15.125
𝐵+ = −12.4375
𝐴 = 0.281
𝐵 = −13.781
𝐴𝐵 = 1.3437

Representación gráfica de los efectos principales e interacción.

Para hacer una representación gráfica de los efectos principales de un diseño 22 se empieza
por establecer en el eje horizontal los dos niveles de factor y en el eje vertical la media de
la respuesta observada en los correspondientes niveles como se observa en el siguiente
gráfico:

COMO LO EXPLICO PORQUE PULIDO NO EXPLICA BIEN

Representación gráfica del ejemplo

NECESITO PREGUNTARTE COMO HACER ESTO

ANOVA E HIPÓTESIS EN EL DISEÑO FACTORIAL 22

Representación geométrica de la notación de Yates.

La notación de Yates [(1), a, b, ab] tiene un significado diferente a las demás: con ella se
representa el total o la suma de las observaciones en cada tratamiento. La lógica de la
notación de Yates es la siguiente: si una letra minúscula está presente, entonces el factor
correspondiente se encuentra en su nivel alto; si está ausente,
el factor está en su nivel bajo. De esta forma los datos se verían
gráficamente como se muestra en la figura.

El área limitada por este cuadrado se conoce como región


experimental y las conclusiones que se obtengan del
experimento sólo tienen validez sobre esta región.

En el ejemplo2.3 la representación geométrica de la notación Yates se ve como:

Experimentación factorial vs mover un factor a la vez


a- b +
Supongamos que se tienen dos factores digamos, A y B, _ Factor B +
con dos niveles cada uno; a-, a+ y b-, b+. Si hiciéramos variar
un factor a la vez obtendríamos la información que se a- b - a+ b -
muestra en la figura.
- Factor A +

El efecto de variar el factor A es: a+ b- - a- b- y el efecto de variar el factor B es: a- b+ - a- b-.


Para reducir el error experimental es deseable realizar dos repeticiones, y los efectos de los
factores se estimarían con las respuestas promedio. Pero para esto se necesita un total de
seis observaciones.

En cambio, si se hace mediante la experimentación factorial, se tendría adicionalmente el


registro a+ b+. Con estas cuatro observaciones se obtienen dos estimaciones del efecto del
factor A: a+ b- - a- b- y a+ b+ - a- b+. Y dos estimaciones del efecto del factor B: a- b+ - a- b- y
a+b+ - a+ b-. Y así obtener las estimaciones promedio de los efectos con la misma precisión
que las estimaciones del experimento de un solo factor, con menos observaciones en total.

Ahora supongamos que está presente una interacción. Si en el diseño de un factor a la vez
indicara que a- b+ y a+ b- dieron mejores respuestas que a- b-, esto nos podría llevar a concluir
que a+ b+ sería todavía mejor. Lo cual no necesariamente es cierto si hay interacción entre
los factores.
Así, el diseño factorial reduce el error sin tener que hacer más observaciones esto resulta
económico en el material experimental al obtener información sobre varios factores sin
aumentar el tamaño del experimento. Se obtiene más información que en un experimento
de un solo factor pues permite el estudio de la interacción y esto ayuda a dar mejores
conclusiones del experimento.

Ventajas de realizar un diseño factorial

Permiten estudiar el efecto individual y de interacción de los distintos factores.


Se pueden aumentar para formar diseños compuestos.
Se pueden correr fracciones de diseños factoriales, las cuales son de gran utilidad en las
primeras etapas de una investigación que involucra a muchos factores.
Pueden utilizarse en combinación con diseños de bloques.
La interpretación y el cálculo de los efectos en los experimentos factoriales se puede hacer
con aritmética elemental, en particular cuando cada factor se prueba en dos niveles.

Modelo matemático

Supongamos que se tienen los factores A y B, con dos niveles cada uno. Supongamos
también que se hicieron n repeticiones. El orden en que se hacen las 2*2*n observaciones
se selecciona al azar, por lo que es un diseño completamente aleatorizado

El modelo estadístico de efectos está dado por:

𝑖 = 1, 2
𝑌𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + (𝛼𝛽)𝑖𝑗 + 𝜖𝑖𝑗𝑘 { 𝑗 = 1, 2
𝑘 = 1, … , 𝑛

donde μ es la media global, αi es el efecto debido al i-ésimo nivel del factor A, βi es el efecto
debido al j-ésimo nivel del factor B, (αβ)ij representa al efecto de interacción de A y B en la
combinación ij y εijk es el error aleatorio.

Condiciones del modelo

❖ 𝜖𝑖𝑗𝑘 ~ 𝑁(0, 𝜎 2 ) independientes entre sí y con varianza constante.


❖ ∑2𝑖=1 𝛼𝑖 = 0
❖ ∑2𝑗=1 𝛽𝑗 = 0
❖ ∑2𝑗=1 ∑2𝑖=1 𝛼𝑖 𝛽𝑗 = 0
Hipótesis

𝐻0 ∶ 𝛼1 = 𝛼2 = 0 𝐻0 ∶ 𝛽1 = 𝛽2 = 0 𝐻0 ∶ (𝛼𝛽)𝑖𝑗 = 0 para todo 𝑖𝑗


𝐻𝐴 ∶ 𝛼𝑖 ≠ 0 para algún 𝑖 𝐻𝐴 ∶ 𝛽𝑗 ≠ 0 para algún 𝑗 𝐻𝐴 ∶ (𝛼𝛽)𝑖𝑗 ≠ 0 para algún 𝑖𝑗

Análisis de varianza

NOTACIÓN:
2 2 𝑛
𝑌…
𝑌 … = ∑ ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅ … =
𝑖=1 𝑗=1 𝑘=1
4𝑛

2 𝑛
𝑌𝑖 . .
𝑌𝑖 . . = ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅𝑖 . . = 𝑖 = 1, 2
2𝑛
𝑗=1 𝑘=1

2 𝑛
𝑌.𝑗 .
𝑌.𝑗 . = ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅.𝑗 . = 𝑗 = 1, 2
2𝑛
𝑖=1 𝑘=1

𝑛
𝑌𝑖𝑗 .
𝑌𝑖𝑗 . = ∑ 𝑌𝑖𝑗𝑘 𝑌̅𝑖𝑗 . =
𝑛
𝑘=1

Tabla ANOVA
Fuente de Suma de Cuadrados G.L. CM F0 Valor p
Variación
Efecto A 2 1 𝐶𝑀𝐴 𝐶𝑀𝐴
𝑌2𝑖 . . 𝑌2 …
𝑆𝐶𝐴 = ∑ − 𝐶𝑀𝐸
2𝑛 4𝑛
𝑖=1

Efecto B 2
𝑌 2 .𝑗 . 𝑌 2 … 1 𝐶𝑀𝐵 𝐶𝑀𝐵
𝑆𝐶𝐵 = ∑ − 𝐶𝑀𝐸
2𝑛 4𝑛
𝑗=1

Efecto AB 2 2
𝑌 2 𝑖𝑗 . 𝑌 2 … 1 𝐶𝑀𝐴𝐵 𝐶𝑀𝐴𝐵
𝑆𝐶𝐴𝐵 = ∑ ∑ − − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 𝐶𝑀𝐸
𝑛 4𝑛
𝑖=1 𝑗=1

Error 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 − 𝑆𝐶𝐴𝐵 4(n-1) 𝐶𝑀𝐸

Total 2 2 𝑛 4n-1
𝑌2 …
𝑆𝐶𝑇 = ∑ ∑ ∑ 𝑌 2 𝑖𝑗𝑘 −
4𝑛
𝑖=1 𝑗=1 𝑘=1
Los Cuadrados Medios es la división de su Suma de Cuadrados entre sus respectivos
grados de libertad. Recordemos que F0 ~ 𝐹(1 − 𝛼, 𝑔. 𝑙., 4(𝑛 − 1) ). Notemos que los
grados de libertad de la suma de cuadrados del error son 4(n-1), por lo cual se necesitan al
menos dos repeticiones para poder construir la tabla ANOVA.

Si el valor-p es menor al nivel de significancia α prefijado, se rechaza la hipótesis nula y se


concluye que el correspondiente efecto influye en la variable respuesta.

MODELO DE REGRESIÓN Y VERIFICACIÓN DE SUPUESTO DE DISEÑOS


FACTORIALES 𝟐𝟐

Supuestos del diseño 𝟐𝟐

Los supuestos del modelo de un diseño 22 son los siguientes:

• Los errores siguen una distribución normal.


• La varianza de cada tratamiento es constante.
• Los datos son independientes entre sí.
La verificación de los supuestos se puede hacer mediante el software estadístico de R
mediante las pruebas de hipótesis convencionales.

Supuesto Prueba
Normalidad Kolmogorov o Shapiro-Wilk
Homocedasticidad Levene o Barlett
Independencia Durbin-Watson

Verificación de los supuestos para el ejemplo 1

El primer paso para verificar los supuestos del ejemplo 1 es establecer una forma de como
introducir los datos a R. A continuación, se muestra el formato que se le puede dar al
ejemplo 1:

Tamaño Posición Distorsión


Y1bajo Y2bajo 18
Y1bajo Y2bajo 16.5
Y1bajo Y2bajo 26
Y1bajo Y2bajo 22.5
Y1bajo Y2bajo 21.5
Y1bajo Y2bajo 21
Y1bajo Y2bajo 30
Y1bajo Y2bajo 24.5
Y1alto Y2bajo 27.5
Y1alto Y2bajo 19.5
Y1alto Y2bajo 31
Y1alto Y2bajo 27
Y1alto Y2bajo 17
Y1alto Y2bajo 14
Y1alto Y2bajo 18
Y1alto Y2bajo 17.5
Y1bajo Y2alto 13.5
Y1bajo Y2alto 8.5
Y1bajo Y2alto 11.5
Y1bajo Y2alto 16
Y1bajo Y2alto -4.5
Y1bajo Y2alto 4
Y1bajo Y2alto 1
Y1bajo Y2alto 9
Y1alto Y2alto 17.5
Y1alto Y2alto 11.5
Y1alto Y2alto 10
Y1alto Y2alto 1
Y1alto Y2alto 14.5
Y1alto Y2alto 3.5
Y1alto Y2alto 7.5
Y1alto Y2alto 6.5

La anterior tabla se puede convertir desde Excel a un documento de texto delimitado por
tabulaciones y ser leído así en R.

Una vez leído en el formato correcto en R la forma de ingresar los datos para considerar la
interacción es con la siguiente línea de código

resultados<-aov(Distorcion~Tamaño+Posicion+Tamaño:Posicion, data=datos)
tabla.anova<-anova(resultados)
tabla.anova

Una vez calculado esto podemos hacer el análisis de residuales y poder aplicar la prueba
Shapiro-Wilk.

residuos=resid(resultados)
shapiro.test(residuos)
De la cual obtenemos el siguiente valor p = 0.7045, por lo que se cumple el supuesto de
normalidad.

Podemos calcular homocedasticidad mediante la prueba de Levene con la siguiente línea


de código

leveneTest(Distorcion~Tamaño*Posicion, data=datos)

haciendo énfasis en que solo se considera la interacción “Tamaño*Posicion” dentro de la


línea de código. Una vez esto obtuvimos un valor p = 0.7549. Por lo tanto se cumple el
supuesto de homocedasticidad.

También podemos calcular la independencia mediante la prueba de Durbin-Watson


considerando la siguiente línea de códico

durbinWatsonTest(lm(Distorcion~Tamaño*Posicion, data=datos))

Obteniendo un valor p = 0.366 por lo que el supuesto de homocedasticidad se cumple y


por lo tantos se cumplen todos los supuestos del modelo.

Definición de contraste y cómo calcularlos.

Una combinación lineal que satisface ∑𝑛𝑖=1 𝑐𝑖 𝑌𝑖 , con ∑ 𝑐𝑖 = 0 se llama contraste. Dentro del
contexto del diseño factorial 22 se pueden definir tres contrastes correspondientes a los
tres efectos 𝐴,𝐵 y 𝐴𝐵, que están definidos como:

𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒𝐴 = [𝑎 + 𝑎𝑏 − 𝑏 − (1)]

𝐶𝑜𝑛𝑠𝑡𝑟𝑎𝑠𝑡𝑒𝐵 = [𝑏 + 𝑎𝑏 − 𝑎 − (1)]

𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒𝐴𝐵 = [𝑎𝑏 + (1) − 𝑎 − 𝑏]

Observamos que son contrastes porque son combinaciones lineales donde los coeficientes
suman cero (1 +1 -1 -1 = 0). Notemos que los contrastes se pueden expresar en términos de
los efectos principales y de interacción como:

𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒𝐴 = 𝐴 ∗ 2𝑛

𝐶𝑜𝑛𝑠𝑡𝑟𝑎𝑠𝑡𝑒𝐵 = 𝐵 ∗ 2𝑛

𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒𝐴𝐵 = 𝐴𝐵 ∗ 2𝑛

La utilidad de calcular los contrastes yace en que se necesita calcular la suma de


cuadrados de cada uno de los efectos y así poder llegar a la tabla ANOVA y poder concluir
algo sobre el modelo.
Una vez calculados los efectos podemos investigar cuales son significativos y probar las
siguientes hipótesis:

𝐻0 : 𝐴 = 0
𝐻𝑎 : 𝐴 ≠ 0

𝐻0 : 𝐵 = 0
𝐻𝑎 : 𝐵 ≠ 0

𝐻0 : 𝐴𝐵 = 0
𝐻𝑎 : 𝐴𝐵 ≠ 0

Para obtener la suma de cuadrados de cada efecto se siguen las siguientes expresiones:

𝑆𝐶𝐴 = A2 × n

𝑆𝐶𝐵 = B 2 × n

𝑆𝐶𝐴𝐵 = AB 2 × n

donde cada uno tiene un solo grado de libertad, debido a que cada factor tiene únicamente
dos niveles. La suma de cuadrados totales se calcula con la expresión:
2 2 𝑛
2 𝑌…2
𝑆𝐶𝑇 = ∑ ∑ ∑ 𝑌𝑖𝑗𝑘 −
𝑛22
𝑖=1 𝑗=1 𝑙=1

y tiene 𝑛22−1 grados de libertad. La suma de cuadrados del error se calcula como la
diferencia:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 − 𝑆𝐶𝐴𝐵

y tiene 4(𝑛 − 1) grados de libertad.

La tabla ANOVA del diseño factorial 22 con 𝑛 replicas se presenta a continuación.

Fuente de Suma de Grados de Cuadrados Estadístico F


variabilidad cuadrados libertad Medios
A 𝑆𝐶𝐴 1 𝐶𝑀𝐴 𝐶𝑀𝐴 /𝐶𝑀𝐸
B 𝑆𝐶𝐵 1 𝐶𝑀𝐵 𝐶𝑀𝐵 /𝐶𝑀𝐸
AB 𝑆𝐶𝐴𝐵 1 𝐶𝑀𝐴𝐵 𝐶𝑀𝐴𝐵 /𝐶𝑀𝐸
Error 𝑆𝐶𝐸 4(𝑛 − 1) 𝐶𝑀𝐸
Total 𝑆𝐶𝑇 𝑛22 − 1

Donde recordemos que los cuadrados medios son la suma de cuadrado entre los grados de
libertad.
Aplicando las fórmulas mencionadas pasaremos a calcular la tabla ANOVA para el ejemplo
1 remitiéndonos a la información de la tabla #.

𝑆𝐶𝐴 = 0.2812 × 8 = 0.63

𝑆𝐶𝐵 = (−13.781)2 × 8 = 1519.38

𝑆𝐶𝐴𝐵 = 1.34372 × 8 = 14.45

482.52
𝑆𝐶𝑇 = 9745.25 − = 2470.06
8 × 22

𝑆𝐶𝐸 = 2470.06 − 0.63 − 1519.38 − 14.45 = 935.59

Consideremos un nivel de significancia del 95%. Luego la tabla ANOVA del ejemplo 1 es la
siguiente:

Fuente de Suma de Grados de Cuadrados Estadístico F Resultado de


variabilidad cuadrados libertad Medios la prueba de
hipótesis
(F<4.20)
Y1 0.63 1 0.63 0.0189 Se acepta la
hipótesis nula
Y2 1519.38 1 1519.38 45.4714 Se rechaza la
hipótesis nula
Y1:Y2 14.45 1 14.45 0.4323 Se acepta la
hipótesis nula
Error 935.59 28 33.41
Total 2470.05 31

De la tabla anterior vemos que, dadas las hipótesis

𝐻0 : 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑌1 = 0
𝐻𝑎 : 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑌1 ≠ 0

𝐻0 : 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑌2 = 0
𝐻𝑎 : 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑌2 ≠ 0

𝐻0 : 𝐿𝑎 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑌1 𝑦 𝑌2 = 0
𝐻𝑎 : 𝐿𝑎 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑌1 𝑦 𝑌2 ≠ 0

se tiene que el efecto de Y2 es diferente de 0, mientras que el efecto de Y1 es igual a cero


al igual que el de la interacción.

Por otro lado, si consideramos el modelo de regresión asociado a este ejemplo como:
𝑖 = 1, 2
𝑌𝑖𝑗𝑘 = 𝜇 + 𝑌1𝑖 + 𝑌2𝑗 + (𝑌1𝑌2)𝑖𝑗 + 𝜖𝑖𝑗𝑘 { 𝑗 = 1, 2
𝑘 = 1, … ,8

Luego, por los resultados obtenidos en la tabla ANOVA pasamos a quitar el factor Y1 del
modelo, tanto el de la interacción, reduciendo el modelo de regresión asociado a:

𝑖 = 1, 2
𝑌𝑖𝑗𝑘 = 𝜇 + 𝑌2𝑗 + 𝜖𝑖𝑗𝑘 { 𝑗 = 1, 2
𝑘 = 1, … ,8

Revisar el final

¿Qué son los diseños factoriales 𝟐𝟑 ?

Los diseños factoriales 23 consideran tres factores, cada uno de ellos con dos niveles. En un
diseño factorial 23 se pueden realizar 𝑛 repeticiones por tratamiento, teniendo al final 𝑛23
corridas experimentales, lo cual hace que este tipo de experimentos sean más complicados
de realizar.

Ejemplos de diseños factoriales 𝟐𝟑

Ejemplo 3.1

Un ingeniero está interesado en los efectos de la velocidad de corte (A), la geometría de la


herramienta (B) y el ángulo de corte (C) sobre la vida (en horas) de una máquina
herramienta. Se eligen dos niveles de cada factor y se corren 3 réplicas de un diseño
factorial 23. Los resultados fueron los siguientes.

A B C Combinación de tratamientos Réplica


I II III
- - - (1) 22 31 25
+ - - a 32 43 29
- + - b 35 34 50
+ + - ab 55 47 46
- - + c 44 45 38
+ - + ac 40 37 36
- + + bc 60 50 54
+ + + abc 39 41 47

Ejemplo 3.2

Un ingeniero quiere medir la exquisitez de un brownie y para ello quiere identificar las
variables que producen el brownie más exquisito. Para ello considera tres factores:
material del molde, marca de harina para brownies y el método de batido. Los niveles de
los factores fueron los siguientes:

Factor Bajo (-) Alto (+)


A = material del molde Vidrio Aluminio
B = método de batido Cuchara Batidora
C = Marca de harina Cara Barata

La variable respuesta fue la exquisitez, una medida subjetiva derivada de un cuestionario


aplicado a los sujetos que hicieron el muestreo de cada lote de brownies. Un panel
integrado por ocho personas hizo el muestro de cada lote y llenó el cuestionario. La matriz
de diseño y los datos de la respuesta se presentan a continuación:

Lote de Resultados del panel de prueba


brownies A B C 1 2 3 4 5 6 7 8
1 - - - 11 9 10 10 11 10 8 9
2 + - - 15 10 16 14 12 9 6 15
3 - + - 9 12 11 11 11 11 11 12
4 + + - 16 17 15 12 13 13 11 11
5 - - + 10 11 15 8 6 8 9 14
6 + - + 12 13 14 13 9 13 14 9
7 - + + 10 12 13 10 7 7 17 13
8 + + + 15 12 15 9 12 12 9 14

DISEÑOS FACTORIALES 23 Y DISEÑOS 2K


Para un diseño 23 se tienen tres factores; A, B y C, cada uno con dos niveles, alto + y bajo -.
Existen tres formas para ordenar la información, (recordando que la notación de Etiquetas
representa el total de las n observaciones de una combinación de tratamientos particular.):

Combinación A B C Etiquetas A B C
1 - - - (1) 0 0 0
2 + - - a 1 0 0
3 - + - b 0 1 0
4 + + - ab 1 1 0
5 - - + c 0 0 1
6 + - + ac 1 0 1
7 - + + bc 0 1 1
8 + + + abc 1 1 1
La representación geométrica de las ocho combinaciones se ve en la figura siguiente:

bc abc
c
+ ac
Factor C b ab
+
_ Factor B
(1) a -

- Factor A +

Modelo estadístico

𝑌 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥3 + 𝛽12 𝑥1 𝑥2 + 𝛽13 𝑥1 𝑥3 + 𝛽23 𝑥2 𝑥3 + 𝛽123 𝑥1 𝑥2 𝑥3 + 𝜖𝑖𝑗𝑙

𝑖, 𝑗, 𝑙 ∈ {1, 2}

Condiciones del modelo

Hipótesis

Estas hipótesis son para probar formalmente la significancia de los efectos principales y de
interacciones:
𝐻0 ∶ 𝛽1 = 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴 𝑛𝑜 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)
𝐻𝐴 ∶ 𝛽1 ≠ 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)

𝐻0 ∶ 𝛽12 = 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴𝐵 𝑛𝑜 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)


𝐻𝐴 ∶ 𝛽12 ≠ 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴𝐵 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)

𝐻0 ∶ 𝛽123 = 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴𝐵𝐶 𝑛𝑜 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)


𝐻𝐴 ∶ 𝛽123 ≠ 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴𝐵𝐶 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)

Efectos principales y de interacción


Calculemos el efecto principal de A:
Efecto de A cuando B y C están en el nivel bajo; 𝐴−− = [𝑎 − (1)]/𝑛
Efecto de A cuando B está en el nivel alto y C está en el nivel bajo; 𝐴+− = [𝑎𝑏 − 𝑏]/𝑛
Efecto de A cuando B está en el nivel bajo y C está en el nivel alto; 𝐴− + = [𝑎𝑐 − 𝑐]/𝑛
Efecto de A cuando B y C están en el nivel alto; 𝐴++ = [𝑎𝑏𝑐 − 𝑏𝑐]/𝑛
Por lo tanto, el efecto de A es el promedio de estos cuatro efectos:

𝐴 = [𝐴−− + 𝐴± + 𝐴∓ + 𝐴++ ]/4


= [𝑎 − (1) + 𝑎𝑏 − 𝑏 + 𝑎𝑐 − 𝑐 + 𝑎𝑏𝑐 − 𝑏𝑐]/4𝑛

De esta última igualdad observamos que el efecto de A se puede obtener con los contrastes.

De manera similar obtenemos el efecto principal de B:


𝐵 = [𝑏 + 𝑎𝑏 + 𝑏𝑐 + 𝑎𝑏𝑐 − (1) − 𝑎 − 𝑐 − 𝑎𝑐]/4𝑛
Y el efecto principal de C:
𝐶 = [𝑐 + 𝑎𝑐 + 𝑏𝑐 + 𝑎𝑏𝑐 − (1) − 𝑎 − 𝑏 − 𝑎𝑏]/4𝑛

Para los efectos de interacción necesitamos:

Contraste 𝐴𝐵 = [(1) − 𝑎 − 𝑏 + 𝑎𝑏 + 𝑐 − 𝑎𝑐 − 𝑏𝑐 + 𝑎𝑏𝑐]


Contraste 𝐴𝐶 = [(1) − 𝑎 + 𝑏 − 𝑎𝑏 − 𝑐 + 𝑎𝑐 − 𝑏𝑐 + 𝑎𝑏𝑐]
Contraste 𝐵𝐶 = [(1) + 𝑎 − 𝑏 − 𝑎𝑏 − 𝑐 − 𝑎𝑐 + 𝑏𝑐 + 𝑎𝑏𝑐]
Contraste 𝐴𝐵𝐶 = [𝑎𝑏𝑐 − (1) + 𝑎 + 𝑏 + 𝑐 − 𝑎𝑏 − 𝑎𝑐 − 𝑏𝑐]
Y los efectos de interacción son las divisiones de su respectivo contraste entre 4𝑛.

Suma de cuadrados

(Contrasteefecto )2
𝑆𝐶𝑒𝑓𝑒𝑐𝑡𝑜 =
8𝑛
2 2 2 𝑛
𝑌2 … .
𝑆𝐶𝑇 = ∑ ∑ ∑ ∑ 𝑌 2 𝑖𝑗𝑙𝑚 −
8𝑛
𝑖=1 𝑗=1 𝑙=1 𝑚=1

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 − 𝑆𝐶𝐶 − 𝑆𝐶𝐴𝐵 − 𝑆𝐶𝐴𝐶 − 𝑆𝐶𝐵𝐶 − 𝑆𝐶𝐴𝐵𝐶

Tabla ANOVA
Fuente de Suma de
G.L. CM F0 Valor p
Variación Cuadrados
A 𝑆𝐶𝐴 1 𝐶𝑀𝐴 𝐶𝑀𝐴 ⁄𝐶𝑀𝐸
B 𝑆𝐶𝐵 1 𝐶𝑀𝐵 𝐶𝑀𝐵 ⁄𝐶𝑀𝐸
C 𝑆𝐶𝐶 1 𝐶𝑀𝐶 𝐶𝑀𝐶 ⁄𝐶𝑀𝐸
AB 𝑆𝐶𝐴𝐵 1 𝐶𝑀𝐴𝐵 𝐶𝑀𝐴𝐵 ⁄𝐶𝑀𝐸
AC 𝑆𝐶𝐴𝐶 1 𝐶𝑀𝐴𝐶 𝐶𝑀𝐴𝐶 /𝐶𝑀𝐸
BC 𝑆𝐶𝐵𝐶 1 𝐶𝑀𝐵𝐶 𝐶𝑀𝐵𝐶 /𝐶𝑀𝐸
ABC 𝑆𝐶𝐴𝐵𝐶 1 𝐶𝑀𝐴𝐵𝐶 𝐶𝑀𝐴𝐵𝐶 /𝐶𝑀𝐸
Error 𝑆𝐶𝐸 8(n-1) 𝐶𝑀𝐸
Total 𝑆𝐶𝑇 8n-1
Recordemos que F0 ~ 𝐹(1 − 𝛼, 𝑔. 𝑙., 8(𝑛 − 1) ). Y notemos que los grados de libertad de
la suma de cuadrados del error son 4(n-1), por lo cual se necesitan al menos dos
repeticiones para poder construir la tabla ANOVA.

Si el valor-p es menor al nivel de significancia α prefijado, se rechaza la hipótesis nula y se


concluye que el correspondiente efecto influye en la variable respuesta.

Ejemplo 2

En una fábrica de dientes se tiene problemas con la calidad de porosidad (burbujas de aire
dentro de los dientes). Manchas blancas, dientes sucios, dientes quebrados. En los intentos
por resolver los problemas han hecho cambios en algunos factores del proceso. En
particular se analizaron los factores de temperatura (90º y 130º C), tiempo de prensado (8
y 15 minutos) y tamaño de partícula (sin tamizar y con tamizador); la variable respuesta fue
el porcentaje de diente bueno en cada corrida. Se realizaron 2 repeticiones por cada
tratamiento. Los datos son los siguientes:

Temperatura Tiempo Tipo de partícula Porcentaje de diente Total


(A) (B) (C) bueno
T90 M8 Sin tamizar 76.4 76.9 (1) = 153.3
T130 M8 Sin tamizar 76.3 76.9 a = 153.2
T90 M15 Sin tamizar 80.4 81 b = 161.4
T130 M15 Sin tamizar 77.9 79.6 ab = 157.5
T90 M8 Con tamizar 84.4 84.6 c = 169
T130 M8 Con tamizar 84.7 84.5 ac = 169.2
T90 M15 Con tamizar 82.7 83.2 bc = 165.9
T130 M15 Con tamizar 85 87 abc = 172

Estimación de los efectos, utilizando las fórmulas de los contrastes con n=2:

Efecto Contraste Estimación


A 2.3 0.2875
B 12.1 1.5125
C 50.7 6.3375
AB 2.1 0.2625
AC -12.7 -1.5875
BC 10.3 1.2875
ABC 9.7 1.2125

Tabla ANOVA con ayuda de R:


Tabla ANOVA
Fuente de Suma de
G.L. CM F0 Valor p
Variación Cuadrados
A 0.330625 1 0.331 0.6459 0.444801
B 9.150625 1 9.151 17.8767 0.002884
C 160.655625 1 160.656 313.8571 1.054e-07
AB 0.275625 1 0.276 0.5385 0.484019
BC 10.080625 1 6.631 12.9536 0.006991
AC 6.630625 1 10.081 19.6935 0.002174
ABC 5.880625 1 5.881 11.4884 0.009508
Error 4.095 8 0.512
Total 197.099375 15

Supuestos

Supuesto Hipótesis Valor p Conclusión


Normalidad 𝐻0 : Los datos se distribuyen normal 0.5637 Se cumple
(Shapiro-Wilk) 𝐻𝑎: Los datos no se distribuyen normal
Homocedasticidad 𝐻0 : La varianza es constante 0.4782 Se cumple
(Bartlett) 𝐻𝑎: La varianza no es constante
Independencia 𝐻0 : Los datos son independientes. 0.518 Se cumple
(Durbin-Watson) 𝐻𝑎: Los datos no son independientes.

¿QUÉ SON LOS DISEÑOS FACTORIALES 2K?

Los diseños factoriales 2k son diseños en los que hay k factores con dos niveles cada uno. El
modelo para este diseño incluiría k efectos principales, (𝑘2) interacciones de dos factores,
(𝑘3) interacciones de tres factores, …, y una interacción de k factores. Entonces el modelo
completo contendría 2k -1 efectos. Los modelos que vimos; 22 y 23, son casos particulares
del diseño factorial 2k.

Condiciones del modelo

Checar p.p. 6

http://wpd.ugr.es/~bioestad/wp-content/uploads/Factorial-tres-factores.pdf

Hipótesis
Las hipótesis son para probar formalmente la significancia de los efectos principales y de
interacciones:
𝐻0 ∶ 𝛽1 = 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴 𝑛𝑜 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)
𝐻𝐴 ∶ 𝛽1 ≠ 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)

𝐻0 ∶ 𝛽12 = 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴𝐵 𝑛𝑜 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)


𝐻𝐴 ∶ 𝛽12 ≠ 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴𝐵 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)

𝐻0 ∶ 𝛽123…𝑘 = 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖ó𝑛 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑓𝑎𝑐𝑡𝑜𝑟𝑒𝑠 𝑛𝑜 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)


𝐻𝐴 ∶ 𝛽123…𝑘 ≠ 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖ó𝑛 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑓𝑎𝑐𝑡𝑜𝑟𝑒𝑠 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)

EJEMPLO DE UN DISEÑO 𝟐𝟐
Un ingeniero industrial empleado por una compañía refresquera está interesado en los efectos de
dos diferentes tipos de botellas de 32 onzas sobre el tiempo de entrega de cajas de 12 botellas del
producto. Los dos tipos de botellas son de vidrio y de plástico. Se usan dos empleados para realizar
una tarea que consiste en mover 40 cajas de producto 50 pies en una plataforma de carga estándar
y acomodarlas en un estante de venta. Se hacen cuatro réplicas de un diseño factorial 22 y los
tiempos observados se enlistan en la siguiente tabla.

Tipo de botella Empleado


1 2
Vidrio 5.12 4.89 6.65 6.24
4.98 5.00 5.49 5.55
Plástico 4.95 4.95 5.28 4.91
4.27 4.25 4.75 4.71

Solución

a) Unidad experimental: Empleados.


b) Variable respuesta: Tiempo de entrega (segundos).
c) Factor controlable: Tipo de botella, Empleados.
d) Factores de ruido: Cansancio, Experiencia.
e) Niveles de factor: Tipo de botella (Plástico, Vidrio), Empleado (Empleado 1, Empleado 2).
f) Número de tratamientos: 4.
g) Número de repeticiones: 4.
h) Número de corridas experimentales: 16.
Diagrama del diseño experimental:

Para resolver este diseño optaremos primero por expresar la información de la siguiente manera:

Factor Combinación de Repetición


Botella Empleado tratamientos 1 2 3 4
- - Vidrio, E1 5.12 4.89 4.98 5.00
+ - Plástico, E1 4.95 4.95 4.27 4.25
- + Vidrio, E2 6.65 6.24 5.49 5.55
+ + Plástico, E2 5.28 4.91 4.75 4.71
Ahora revisaremos los supuestos del modelo mediante el uso del software estadístico R y a un nivel
de significancia del 95%.

Supuesto Prueba Hipótesis Valor p Resultado


Normalidad Shapiro- 𝐻0 : Los errores se 0.7331 Se acepta la
Wilk distribuyen normal. hipótesis
𝐻𝑎: Los errores no se nula.
distribuyen normal.
Homocedasticidad Levene 𝐻0 : La varianza de cada 0.006827 Se rechaza la
tratamiento son iguales. hipótesis
𝐻𝑎: Existe por lo menos nula.
una varianza diferente.
Independencia Durbin- 𝐻0 : Los datos son 0.344 Se acepta la
Watson independientes. hipótesis
𝐻𝑎: Los datos no son nula.
independientes.

Para tratar de componer el supuesto de homocedasticidad trataremos de hacer una transformación


box-cox con lambda igual a -1 y analizamos los supuestos del modelo transformado

Supuesto Prueba Hipótesis Valor p Resultado


Normalidad Shapiro- 𝐻0 : Los errores se 0.7331 Se acepta la
Wilk distribuyen normal. hipótesis
𝐻𝑎: Los errores no se nula.
distribuyen normal.
Homocedasticidad Levene 𝐻0 : La varianza de cada 0.003664 Se rechaza la
tratamiento son iguales. hipótesis
𝐻𝑎: Existe por lo menos nula.
una varianza diferente.
Independencia Durbin- 𝐻0 : Los datos son 0.344 Se acepta la
Watson independientes. hipótesis
𝐻𝑎: Los datos no son nula.
independientes.

La transformación box-cox no ayudo a tratar de componer la varianza. Si observamos el boxplot del


modelo original notaremos que efectivamente la varianza es diferente para cada tratamiento y no
podemos concluir el modelo.

EJEMPLO DE UN DISEÑO 𝟐𝟐
Un ingeniero quiere medir la exquisitez de un brownie y para ello quiere identificar las variables
que producen el brownie más exquisito. Para ello considera tres factores: material del molde,
marca de harina para brownies y el método de batido. Los niveles de los factores fueron los
siguientes:

Factor Bajo (-) Alto (+)


A = material del molde Vidrio Aluminio
B = método de batido Cuchara Batidora
C = Marca de harina Cara Barata

La variable respuesta fue la exquisitez, una medida subjetiva derivada de un cuestionario aplicado
a los sujetos que hicieron el muestreo de cada lote de brownies. Un panel integrado por ocho
personas hizo el muestro de cada lote y llenó el cuestionario. La matriz de diseño y los datos de la
respuesta se presentan a continuación:

Lote de Resultados del panel de prueba


brownies A B C 1 2 3 4 5 6 7 8
1 - - - 11 9 10 10 11 10 8 9
2 + - - 15 10 16 14 12 9 6 15
3 - + - 9 12 11 11 11 11 11 12
4 + + - 16 17 15 12 13 13 11 11
5 - - + 10 11 15 8 6 8 9 14
6 + - + 12 13 14 13 9 13 14 9
7 - + + 10 12 13 10 7 7 17 13
8 + + + 15 12 15 9 12 12 9 14
Solución

a) Unidad experimental: Personas.


b) Variable respuesta: Exquisitez (calificación).
c) Factor controlable: Material del molde, Método de batido, Marca de harina.
d) Factores de ruido: Gustos personales, percepción del sabor.
e) Niveles de factor: Material del molde (Vidrio, Aluminio), Método de batido (Cuchara,
Batidora), Marca de harina (Cara, Barata)
f) Número de tratamientos: 8.
g) Número de repeticiones: 8.
h) Número de corridas experimentales: 64.

Diagrama del diseño experimental:

Ahora revisaremos los supuestos del modelo mediante el uso del software estadístico R y a un nivel
de significancia del 99%.

Supuesto Prueba Hipótesis Valor p Resultado


Normalidad Shapiro- 𝐻0 : Los errores se 0.9279 Se acepta la
Wilk distribuyen normal. hipótesis
𝐻𝑎: Los errores no se nula.
distribuyen normal.
Homocedasticidad Levene 𝐻0 : La varianza de cada 0.02701 Se acepta la
tratamiento son iguales. hipótesis
𝐻𝑎: Existe por lo menos nula.
una varianza diferente.
Independencia Durbin- 𝐻0 : Los datos son 0.23 Se acepta la
Watson independientes. hipótesis
𝐻𝑎: Los datos no son nula.
independientes.
Por lo tanto, se cumplen todos los supuestos del modelo y podemos concluir con la tabla ANOVA.

Tabla ANOVA
Fuente de Suma de
G.L. CM F0 Valor p
Variación Cuadrados
A 64 1 64 10.2254 0.00228
B 14.06 1 14.062 2.2468 0.13951
C 0.56 1 0.563 0.0899 0.76545
AB 0.56 1 0.562 0.0899 0.76545
BC 3.06 1 3.062 0.4893 0.48713
AC 2.25 1 2.250 0.3595 0.55121
ABC 1 1 1 0.1598 0.69089
Error 350.5 56 6.259
Total 197.099375 63
Observamos de la tabla ANOVA que la única fuente de variación a considerar es la del tratamiento
A, que corresponde a el material del molde.

Al realizar la prueba de LSD obtuvimos la siguiente información

Respuesta Grupos
A+ 12.5 a
A- 10.5 b
Donde A+ corresponde a realizar el brownie en aluminio y A- a realizar el brownie en vidrio.
Observamos que es mejor realizar el brownie en aluminio ya que produjo una exquisitez por
encima de dos que al haberlo elaborado en vidrio.

DISEÑOS FACTORIALES 𝑎×𝑏

Los diseños factoriales axb son diseños con dos factores; factor A con a niveles y factor B
con b niveles, y supongamos que se hicieron n repeticiones. Sea 𝑦𝑖𝑗𝑘 la respuesta observada
cuando el factor A tiene el i-ésimo nivel, B tiene el j-ésimo nivel y en la k-ésima repetición.
Las abn observaciones se seleccionan al azar, por lo que este es un diseño completamente
aleatorizado. Una manera de escribir la matriz de diseño seria:

Factor B

Factor A 1 … b
1 𝑦111 , 𝑦112 , 𝑦1𝑏1 , 𝑦1𝑏2 ,
… , 𝑦11𝑛 … , 𝑦1𝑏𝑛

a 𝑦𝑎11 , 𝑦𝑎12 , 𝑦𝑎𝑏1 , 𝑦𝑎𝑏2 ,
… , 𝑦𝑎1𝑛 … , 𝑦𝑎𝑏𝑛
Modelo

El modelo estadístico de efectos está dado por:

𝑖 = 1, … , 𝑎
𝑌𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + (𝛼𝛽)𝑖𝑗 + 𝜖𝑖𝑗𝑘 { 𝑗 = 1, … , 𝑏
𝑘 = 1, … , 𝑛

donde μ es la media global, αi es el efecto debido al i-ésimo nivel del factor A, βi es el efecto
debido al j-ésimo nivel del factor B, (αβ)ij representa al efecto de interacción de A y B en la
combinación ij y εijk es el error aleatorio.

Condiciones del modelo

❖ 𝜖𝑖𝑗𝑘 ~ 𝑁(0, 𝜎 2 ) independientes entre sí y con varianza constante.


❖ ∑𝑎𝑖=1 𝛼𝑖 = 0
❖ ∑𝑏𝑗=1 𝛽𝑗 = 0
❖ ∑𝑏𝑗=1 ∑𝑎𝑖=1 𝛼𝑖 𝛽𝑗 = 0

Hipótesis

𝐻0 ∶ 𝛼1 = 𝛼2 = ⋯ = 𝛼𝑎 = 0
𝐻𝐴 ∶ 𝛼𝑖 ≠ 0 para algún 𝑖

𝐻0 ∶ 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑏 = 0
𝐻𝐴 ∶ 𝛽𝑗 ≠ 0 para algún 𝑗

𝐻0 ∶ (𝛼𝛽)𝑖𝑗 = 0 para todo 𝑖𝑗


𝐻𝐴 ∶ (𝛼𝛽)𝑖𝑗 ≠ 0 para algún 𝑖𝑗

Notación

𝑎 𝑏 𝑛
𝑌…
𝑌 … = ∑ ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅ … =
𝑎𝑏𝑛
𝑖=1 𝑗=1 𝑘=1
𝑏 𝑛
𝑌𝑖 . .
𝑌𝑖 . . = ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅𝑖 . . = 𝑖 = 1, … , 𝑎
𝑏𝑛
𝑗=1 𝑘=1
𝑎 𝑛
𝑌.𝑗 .
𝑌.𝑗 . = ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅.𝑗 . = 𝑗 = 1, … , 𝑏
𝑎𝑛
𝑖=1 𝑘=1
𝑛
𝑌𝑖𝑗 .
𝑌𝑖𝑗 . = ∑ 𝑌𝑖𝑗𝑘 𝑌̅𝑖𝑗 . =
𝑛
𝑘=1

Análisis de varianza

Sea N=abn

Tabla ANOVA
Fuente de
Suma de Cuadrados G.L. CM F0 Valor p
Variación
𝑎 𝐶𝑀𝐴
Efecto A 𝑌2 𝑖 . . 𝑌2 … a-1 𝐶𝑀𝐴
𝑆𝐶𝐴 = ∑ − 𝐶𝑀𝐸
𝑏𝑛 𝑁
𝑖=1
Efecto B 𝑏 b-1 𝐶𝑀𝐵 𝐶𝑀𝐵
𝑌 2 .𝑗 . 𝑌 2 …
𝑆𝐶𝐵 = ∑ − 𝐶𝑀𝐸
𝑎𝑛 𝑁
𝑗=1
Efecto AB 𝑎 𝑏 (a-1)(b-1) 𝐶𝑀𝐴𝐵 𝐶𝑀𝐴𝐵
𝑌 2 𝑖𝑗 . 𝑌 2 …
𝑆𝐶𝐴𝐵 = ∑∑ − − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 𝐶𝑀𝐸
𝑛 𝑁
𝑖=1 𝑗=1
Error 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 − 𝑆𝐶𝐴𝐵 ab(n-1) 𝐶𝑀𝐸
Total 𝑎 𝑏 𝑛 abn-1
2
𝑌 …
𝑆𝐶𝑇 = ∑ ∑ ∑ 𝑌 2 𝑖𝑗𝑘 −
𝑁
𝑖=1 𝑗=1 𝑘=1
Donde los cuadrados medios es la división de su suma de cuadrados entre sus respectivos
grados de libertad. Recordemos que F0 ~ 𝐹(1 − 𝛼, 𝑔. 𝑙., 𝑎𝑏(𝑛 − 1) ). Y notemos que los
grados de libertad de la suma de cuadrados del error son ab(n-1), por lo cual se necesitan
al menos dos repeticiones para poder construir la tabla ANOVA.

Ejemplo 7.4

Se estudia el rendimiento de un proceso químico. Se piensa que las dos variables más
importantes son la presión y la temperatura. Se seleccionan tres niveles de cada factor y
se lleva a cabo un experimento factorial con dos repeticiones. Los datos del rendimiento
son:

B: Presión (psig)
A: Temperatura 200 215 230
(°C)
150 90.4 90.7 90.2
90.2 90.6 90.4
160 90.1 90.5 89.9
90.3 90.6 90.1
170 90.5 90.8 90.4
90.7 90.9 90.1

Este es un diseño 3x3 con 2 repeticiones, entonces el modelo estadístico está dado por:

𝑖 = 1,2,3
𝑌𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + (𝛼𝛽)𝑖𝑗 + 𝜖𝑖𝑗𝑘 { 𝑗 = 1,2,3
𝑘 = 1,2

Y las hipótesis son:

𝐻0 ∶ 𝛼1 = 𝛼2 = 𝛼3 = 0
𝐻𝐴 ∶ 𝛼𝑖 ≠ 0 para algún 𝑖

𝐻0 ∶ 𝛽1 = 𝛽2 = 𝛽3 = 0
𝐻𝐴 ∶ 𝛽𝑗 ≠ 0 para algún 𝑗

𝐻0 ∶ (𝛼𝛽)𝑖𝑗 = 0 para todo 𝑖𝑗


𝐻𝐴 ∶ (𝛼𝛽)𝑖𝑗 ≠ 0 para algún 𝑖𝑗

Verificación de los supuestos con un nivel de confianza del 95%

Supuesto Hipótesis Valor p Conclusión


Normalidad 𝐻0 : Los datos se distribuyen normal 0.4327 Se cumple
(Kolmogorov-Smirnov) 𝐻𝑎: Los datos no se distribuyen normal
Homocedasticidad 𝐻0 : La varianza es constante 0.9895 Se cumple
(Bartlett) 𝐻𝑎: La varianza no es constante
Independencia 𝐻0 : Los datos son independientes. 0.652 Se cumple
(Durbin-Watson) 𝐻𝑎: Los datos no son independientes.

Los supuestos se cumplen, entonces podemos concluir con la tabla ANOVA:

Tabla ANOVA
Fuente de
Suma de Cuadrados G.L. CM F0 Valor p
Variación
Efecto A 0.30111 2 0.15056 8.4687 0.0085392
Efecto B 0.76778 2 0.38389 21.5937 0.0003673
Efecto AB 0.06889 4 0.01722 0.9687 0.4700058
Error 0.16000 9 0.01778
Total 1.29778 17

Vemos que el valor p del efecto AB es mayor que 0.05 por lo que no hay evidencia
estadística para rechazar H0. Entonces el efecto de la interacción AB no es significativo, así
que procedemos a quitarlo del modelo:

Tabla ANOVA
Fuente de
Suma de Cuadrados G.L. CM F0 Valor p
Variación
Efecto A 0.30111 2 0.15056 8.4687 0.004264
Efecto B 0.76778 2 0.38389 21.803 7.03e-05
Error 0.22889 13 0.01778
Total 1.29778 17

Concluimos que los efectos que los efectos A y B son significativos.

Veamos qué tratamiento es mejor; comparando los niveles de factor mediante Tukey con
ayuda de R:
Hipótesis Valor p Conclusión
𝐻0 : 𝜇 𝑇150 = 𝜇 𝑇160
0.1131230 Iguales
𝐻𝑎: 𝜇 𝑇150 ≠ 𝜇 𝑇160
𝐻0 : 𝜇 𝑇150 = 𝜇 𝑇170
0.1621386 Iguales
𝐻𝑎: 𝜇 𝑇150 ≠ 𝜇 𝑇170
𝐻0 : 𝜇 𝑇170 = 𝜇 𝑇160
0.0031390 Diferentes
𝐻𝑎: 𝜇 𝑇170 ≠ 𝜇 𝑇160
𝐻0 : 𝜇𝑃215 = 𝜇𝑃200
0.0031390 Diferentes
𝐻𝑎: 𝜇𝑃215 ≠ 𝜇𝑃200
𝐻0 : 𝜇𝑃230 = 𝜇𝑃200
0.0777138 Iguales
𝐻𝑎: 𝜇𝑃230 ≠ 𝜇𝑃200
𝐻0 : 𝜇𝑃215 = 𝜇𝑃230
0.0000534 Diferentes
𝐻𝑎: 𝜇𝑃215 ≠ 𝜇𝑃230

En el diagrama de caja y brazo se observa que el tratamiento que da un mayor rendimiento


es cuando la temperatura está a 170°C y la presión a 215 psig. O bien; cuando la
temperatura está a 150°C y la presión a 215 psig. Pues estadísticamente 𝜇 𝑇150 = 𝜇 𝑇170 .
90.8
90.6
90.4
90.2
90.0

T150.P200 T160.P200 T170.P200 T150.P215 T160.P215 T170.P215 T150.P230 T160.P230 T170.P230

DISEÑOS FACTORIALES 𝑎×𝑏×c

Los diseños factoriales 𝑎 × 𝑏 × 𝑐 son diseño que consideran tres factores; el factor A con 𝑎 niveles;
el factor B con 𝑏 niveles y el factor C con 𝑐 niveles. Por lo tanto, se tienen 𝑎𝑏𝑐 tratamientos, de
donde se pueden hacer 𝑛 repeticiones de cada tratamiento. Existe particularidades dentro de este
tipo de arreglos como por ejemplo los diseños 22 y los diseños 33 .

En un diseño factorial 𝑎 × 𝑏 × 𝑐 se supone que el comportamiento de la variable respuesta 𝑌 se


puede modelar mediante el modelo de efectos dado por:

𝑌𝑖𝑗𝑘𝑙 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + γk + (𝛼𝛽)𝑖𝑗 + (αγ)𝑖𝑘 + (βγ)𝑗𝑘 + (αβγ)𝑖𝑗𝑘 + 𝜖𝑖𝑗𝑘𝑙

Con 𝑖 = 1, … , 𝑎; 𝑗 = 1, … , 𝑏; 𝑘 = 1, … , 𝑐 ; 𝑙 = 1, … , 𝑛. Donde μ es la media general, αi


es el efecto debido al i-ésimo nivel del factor A; βi es el efecto debido al j-ésimo nivel del
factor B; γ𝑘 es el efecto debido al k-ésimo nivel del factor C; (𝛼𝛽)𝑖𝑗 , (αγ)𝑖𝑘 , (βγ)𝑗𝑘 representan
los efectos de interacción dobles en los niveles 𝑖𝑗; y (αβγ)𝑖𝑗𝑘 es el efecto de interacción triple
en la combinación 𝑖𝑗𝑘. 𝜖𝑖𝑗𝑘𝑙 representa el error aleatorio en la combinación 𝑖𝑗𝑘𝑙 y 𝑙 son las réplicas
del experimento.

Condiciones del modelo

❖ 𝜖𝑖𝑗𝑘 ~ 𝑁(0, 𝜎 2 ) independientes entre sí y con varianza constante.


❖ ∑𝑎𝑖=1 𝛼𝑖 = 0
❖ ∑𝑏𝑗=1 𝛽𝑗 = 0
❖ ∑𝑐𝑘=1 γ𝑘 = 0
❖ ∑𝑏𝑗=1 ∑𝑎𝑖=1 𝛼𝑖 𝛽𝑗 = 0
❖ ∑𝑎𝑖=1 ∑𝑐𝑘=1 α𝑖 γ𝑘 = 0
❖ ∑𝑏𝑗=1 ∑𝑐𝑘=1 β𝑗 γ𝑘 = 0
❖ ∑𝑎𝑖=1 ∑𝑏𝑗=1 ∑𝑐𝑘=1 α𝑖 β𝑗 γ𝑘 = 0

Hipótesis

𝐻0 ∶ 𝛼1 = 𝛼2 = ⋯ = 𝛼𝑎 = 0
𝐻𝐴 ∶ 𝛼𝑖 ≠ 0 para algún 𝑖

𝐻0 ∶ 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑏 = 0
𝐻𝐴 ∶ 𝛽𝑗 ≠ 0 para algún 𝑗

𝐻0 : γ1 = γ2 = ⋯ = γ𝑐 = 0
𝐻𝐴 : γ𝑘 ≠ 0 para algún

𝐻0 ∶ (𝛼𝛽)𝑖𝑗 = 0 para todo 𝑖𝑗


𝐻𝐴 ∶ (𝛼𝛽)𝑖𝑗 ≠ 0 para algún 𝑖𝑗

𝐻0 : (αγ)𝑖𝑘 = 0 para todo 𝑖𝑘


𝐻𝐴 : (αγ)𝑖𝑘 ≠ 0para algún 𝑖𝑘

𝐻0 : (βγ)𝑗𝑘 = 0 para todo𝑗𝑘


𝐻𝐴 : (βγ)𝑗𝑘 ≠ 0 para algún 𝑗𝑘

𝐻0 : (αβγ)𝑖𝑗𝑘 = 0 para todo i𝑗𝑘


𝐻𝐴 : (αβγ)𝑖𝑗𝑘 ≠ 0 para algún i𝑗𝑘

Notación

𝑎 𝑏 𝑐 𝑛
2
𝑌….2
𝑆𝐶𝑇 = ∑ ∑ ∑ ∑ 𝑌𝑖𝑗𝑘𝑙 −
𝑁
𝑖=1 𝑗=1 𝑘=1 𝑙=1

Donde 𝑁 = 𝑎𝑏𝑐𝑛 es el total de observaciones en el experimento. Las sumas de cuadrados


de efectos son
𝑎
2
𝑌𝑖… 𝑌….2
𝑆𝐶𝐴 = ∑ −
𝑏𝑐𝑛 𝑁
𝑖=1
2𝑏
𝑌.𝑗.. 𝑌….2
𝑆𝐶𝐵 = ∑ −
𝑎𝑐𝑛 𝑁
𝑗=1

2𝑐
𝑌..𝑘 𝑌….2
𝑆𝐶𝐶 = ∑ −
𝑎𝑏𝑛 𝑁
𝑘=1

𝑎 𝑏
𝑌𝑖𝑗.. 𝑌….2
𝑆𝐶𝐴𝐵 = ∑ ∑ − − 𝑆𝐶𝐴 − 𝑆𝐶𝐵
𝑐𝑛 𝑁
𝑖=1 𝑗=1

𝑎 𝑐
𝑌𝑖.𝑘. 𝑌….2
𝑆𝐶𝐴𝐶 = ∑ ∑ − − 𝑆𝐶𝐴 − 𝑆𝐶𝐶
𝑏𝑛 𝑁
𝑖=1 𝑘=1

𝑏 𝑐
𝑌.𝑗𝑘. 𝑌….2
𝑆𝐶𝐵𝐶 = ∑ ∑ − − 𝑆𝐶𝐵 − 𝑆𝐶𝐶
𝑎𝑛 𝑁
𝑗=1 𝑘=1

𝑎 𝑏 2 𝑐
𝑌𝑖𝑗𝑘. 𝑌….2
𝑆𝐶𝐴𝐵𝐶 = ∑∑∑ − − 𝑆𝐶𝐴𝐵 − 𝑆𝐶𝐴𝐶 − 𝑆𝐶𝐵𝐶
𝑛 𝑁
𝑖=1 𝑗=1 𝑘=1

Luego

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 − 𝑆𝐶𝐶 − 𝑆𝐶𝐴𝐵 − 𝑆𝐶𝐴𝐶 − 𝑆𝐶𝐵𝐶 − 𝑆𝐶𝐴𝐵𝐶

Análisis de varianza

Fuente de Suma de G. L C. M 𝐹0
variación cuadrados
Efecto A 𝑆𝐶𝐴 𝑎−1 𝐶𝑀𝐴 𝐶𝑀𝐴
𝐶𝑀𝐸
Efecto B 𝑆𝐶𝐵 𝑏−1 𝐶𝑀𝐵 𝐶𝑀𝐵
𝐶𝑀𝐸
Efecto C 𝑆𝐶𝐶 𝑐−1 𝐶𝑀𝐶 𝐶𝑀𝐶
𝐶𝑀𝐸
Efecto AB 𝑆𝐶𝐴𝐵 (𝑎 − 1)(𝑏 − 1) 𝐶𝑀𝐴𝐵 𝐶𝑀𝐴𝐵
𝐶𝑀𝐸
Efecto AC 𝑆𝐶𝐴𝐶 (𝑎 − 1)(𝑐 − 1) 𝐶𝑀𝐴𝐶 𝐶𝑀𝐴𝐶
𝐶𝑀𝐸
Efecto BC 𝑆𝐶𝐵𝐶 (𝑏 − 1)(𝑐 − 1) 𝐶𝑀𝐵𝐶 𝐶𝑀𝐵𝐶
𝐶𝑀𝐸
Efecto ABC 𝑆𝐶𝐴𝐵𝐶 (𝑎 − 1)(𝑏 − 1)(𝑐 − 1) 𝐶𝑀𝐴𝐵𝐶 𝐶𝑀𝐴𝐵𝐶
𝐶𝑀𝐸
Error 𝑆𝐶𝐸 𝑎𝑏𝑐(𝑛 − 1) 𝐶𝑀𝐸
Total 𝑆𝐶𝑇 𝑎𝑏𝑐𝑛 − 1

Donde los cuadrados medios es la división de su suma de cuadrados entre sus respectivos
grados de libertad.

Los supuestos del modelo de un diseño 𝑎 × 𝑏 × 𝑐 son los siguientes:

• Los errores siguen una distribución normal.


• La varianza de cada tratamiento es constante.
• Los datos son independientes entre sí.

Ejemplo

El porcentaje de la concentración de madera dura en la pulpa bruta, la presión de la cuba y el


tiempo de cocción de la pulpa se investigan en cuanto a sus efectos sobre la resistencia del papel.
Se seleccionan tres niveles de la concentración de madera dura, tres niveles de la presión y dos
tiempos de cocción. Se lleva a cabo un experimento factorial con dos réplicas obteniéndose los
siguientes datos

Porcentaje de Tiempo de cocción 3 horas Tiempo de cocción 4 horas


la Presión Presión
concentración 400 500 650 400 500 650
de madera
dura
2 196.6 197.7 198.8 198.4 199.6 200.6
196.6 196 199.4 198.6 200.4 200.9
4 198.5 196 198.4 197.5 198.7 199.6
197.2 196.9 197.4 198.1 198.0 199.0
8 197.5 195.6 197.4 197.6 197.0 198.5
196.6 196.2 198.1 498.4 197.8 199.8

Los niveles de factor fueron los siguientes:

Factor 1 2 3
A = Tiempo 3 horas 4 horas
B = Presión 400 500 650
C = Porcentaje 2 4 8

Ahora revisaremos los supuestos del modelo mediante el uso del software estadístico R y a un nivel
de significancia del 99%.

Supuesto Prueba Hipótesis Valor p Resultado


Normalidad Kolmogorov 𝐻0 : Los errores se 0.2363 Se acepta la
distribuyen normal. hipótesis
𝐻𝑎: Los errores no se nula.
distribuyen normal.
Homocedasticidad Bartlett 𝐻0 : La varianza de cada 0.996 Se acepta la
tratamiento son iguales. hipótesis
𝐻𝑎: Existe por lo menos nula.
una varianza diferente.
Independencia Durbin- 𝐻0 : Los datos son 0.608 Se acepta la
Watson independientes. hipótesis
𝐻𝑎: Los datos no son nula.
independientes.

Por lo tanto, se cumplen todos los supuestos del modelo y podemos concluir con la tabla ANOVA.

Tabla ANOVA
Fuente de Suma de
G.L. CM F0 Valor p
Variación Cuadrados
A 20.25 1 20.25 55.3951 0
B 19.3739 2 9.6869 26.4992 0
C 7.7639 2 3.8819 10.6193 0
AB 2.1950 2 1.0975 3.0023 0.07
BC 2.0817 2 1.0408 2.8473 0,08
AC 6.0911 4 1.5228 4.1657 0.014
ABC 1.9733 4 0.4933 1.3495 0.29
Error 6.58 18 0.3656
Total 197.099375 35

Observamos de la tabla ANOVA que las únicas fuentes de variación a considerar son las de A, B y C,
tanto como el de la interacción de AC. Por lo tanto, son los únicos que consideramos en el modelo.