You are on page 1of 68

Curso sobre diseño estadístico de

experimentos

Dr. C.Q. Juan Diego Sierra M.


Consultor TIP
2013
Introducción al diseño de
experimentos
Guías para el diseño de experimentos
 Diseño de experimentos:
͞WƌƵĞďĂŽƐĞƌŝĞĚĞƉƌƵĞďĂƐĞŶůĂƐĐƵĂůĞƐƐĞŝŶĚƵĐĞŶĐĂŵďŝŽƐĚĞůŝďĞƌĂĚŽƐĞŶůĂƐǀĂƌŝĂďůĞƐĚĞ
entrada de un proceso o sistema, de manera que es posible observar e identificar las causas de
ůŽƐĐĂŵďŝŽƐĞŶůĂƌĞƐƉƵĞƐƚĂĚĞƐĂůŝĚĂ͘͘͘͟DŽŶƚŐŽŵĞƌLJ
 Objetivos de un diseño de experimentos:
Determinar cuáles variables tiene mayor influencia en las respuestas
Determinar el mejor valor de las x que permite lograr un valor de y cercano a un valor nominal
deseado
Determinar el mejor valor de las x, de modo que la variabilidad de y sea pequeña
Encontrar un modelo predictivo de las respuestas en función de los factores

Variables
Deben ser variables w1 w2 ͙͘ wm
controlables
controlables
x y1
Variables de 1 y2 Variables de
entrada x2 Proceso salida
...

...
(factores) (Respuestas)
xp yn
Conocidas o
z1 z2 ͙͘ zq Variables desconocidas
incontrolables
Estrategias para la experimentación
 Diseño estadístico de experimentos:
͞WƌŽĐĞƐŽĚĞƉůĂŶĞĂƌƵŶĞdžƉĞƌŝŵĞŶƚŽƉĂƌĂŽďƚĞŶĞƌĚĂƚŽƐĂƉƌŽƉŝĂĚŽƐ͕ƋƵĞƉƵĞĚĞŶƐĞƌĂŶĂůŝnjĂĚŽƐ
ŵĞĚŝĂŶƚĞŵĠƚŽĚŽƐĞƐƚĂĚşƐƚŝĐŽƐ͕ĐŽŶĞůŽďũĞƚŽĚĞƉƌŽĚƵĐŝƌĐŽŶĐůƵƐŝŽŶĞƐǀĄůŝĚĂƐLJŽďũĞƚŝǀĂƐ͘͘͘͟
Montgomery
 Principios básicos del diseño estadístico de experimentos:
Obtención de réplicas (repetición del experimento)
Aleatorización
Análisis por bloques
 Guías para el diseño estadístico de experimentos:
Compresión y planteamiento del problema
Elección de factores y niveles
Selección de variables de respuesta
Elección de diseño experimental
Realización del experimento
Análisis de datos
Conclusiones y recomendaciones
Definiciones importantes

 Medidas de tendencia central: n


 Mediana: observación central cuando los datos
se organizan ascendentemente
 Xi
i 1

 Moda: la observación con máxima frecuencia n
 Media: definida por la ecuación

 Medidas de dispersión alrededor de la tendencia n


central:
 Xi   2
 Rango: Diferencia entre la observación máxima i 1
y mínima 
n 1
 Desviación estándar: Definida por la ecuación

5
Distribución de Probabilidades

3 2    2 3

 Existen varias distribuciones de probabilidad posibles:


 Distribución Normal
 Distribución t - Student
 Distribución Chi-cuadrado
 Distribución F

6
Distribución normal

 Distribución Normal: se ha encontrado que la mayoría en los procesos las


magnitudes se comportan como variables aleatorias continuas siguiendo la
distribución normal.
 x   2 x 
 x   2
 1

1 F( x )  2 2
f ( x)  e 2 2 e dx
 2  2
 La distribución normal ocupa un papel muy importante en la estadística ya que
coincide con las distribuciones de frecuencia observadas en mediciones naturales y
de propiedades físicas.
 Características:
 En forma de campana (simétrica con relación a la media)
 Teóricamente se extiende al infinito por ambos lados
 Área total bajo la curva es 1 ó 100%
 Alrededor de ±1s de la media hay una probabilidad del 68.26%
 Alrededor de ±2s de la media hay una probabilidad del 95.46%
 Alrededor de ±3s de la media hay una probabilidad del 99.72%
7
Distribuciones Muestrales

 En ocasiones resulta imposible conocer el verdadero valor de la media y la


desviación de la población (en teoría se debería tomar infinito número de
observaciones).
 Se suelen inferir los valores la media y la desviación estandar de la población a
través de muestra de n datos (media muestral y la desviación estándar muestral).
n 2
 _ 
 Xi
n
_
i 1
  Xi  X 
X s  i 1
n n 1
 Se ha encontrado que cualquiera que sea la forma de la distribución de la
población, la distribución muestral de promedios es aproximadamente la
distribución normal.
 El promedio muestral se aproxima al de la población, en tanto que la
desviación estándar muestral se aproxima a 
s
n
 Cuando n es muy grande (mayor de 30) la desviación estándar se hace
independiente del número de datos.
8
Distribución t-student

 A manera de información existe una distribución que se ajusta mejor a los datos
experimentales de pequeñas muestras (n < 30 datos) conocida como distribución t-
student.
 Características:
 En forma de campana y
simétrica
 teóricamente se extiende al
infinito por ambos lados
 Área total bajo la curva es 1 ó
100%
 Es más extendida y menos
puntiaguda que la normal
 Realmente es una familia de
curvas que se hacen cada vez
mas parecidas a la distribución
normal para número de datos
grande.
9
Distribución Chi cuadrado

 Esta distribución se utiliza para evaluar la distribución de las varianza muestral y


para realizar pruebas de hipótesis sobre la varianza (desviación estándar) de dos
distribuciones
 Distribución de la varianza muestral:
 La variable (n-1)S2/2 es una distribución Chi cuadrado
 n-1 por definición son los grados de libertad

10
Distribución F

 Esta distribución se utiliza para comparar la variabilidad de dos procesos


 Distribución de la razón de dos varianzas muestrales:
 La variable: n x  1S 2x
2
F x
n y  1S 2y
2
y

 Es una distribución F con nx-1 y ny-1 grados de libertad

11
Pruebas de hipótesis con varianza conocida
Pruebas de hipótesis con variancia desconocida
Pruebas de hipótesis sobre la varianza de
distribuciones
Selección del nivel de confianza (p o alfa)

 Cuando se efectúa una prueba de hipótesis se comenten dos tipos de error:


 Error tipo I: La hipótesis nula es rechazada siendo verdadera. P(rechazar H0/H0 es verdadera). La
probabilidad de error tipo I se denota por alfa o por p.
 Error tipo II: La hipótesis nula no es rechazada cuando es falsa. P(no rechazar H0/H0 es falsa). La
probabilidad de error tipo II se denota por beta. Puede ser más conveniente trabajar (1- beta), que
se denomina el poder de la prueba y expresa P(rechazar H0/H0 es falsa).
 La curva de operación es una función que relación el error tipo I con el poder de la prueba o el
error tipo II.
 Se debe diseñar la prueba de hipótesis con un valor de alfa o p (probabilidad de error tipo I), que
garantice un valor bajo del error tipo II (bajo valor de beta); controlando el tamaño de la muestra
o considerando un valor de alfa o p bajo (pero no excesivamente bajo), típicamente 2.5% o 5%.

LEGAL ANALOGY:
Null Hypothesis : Innocent
Alternative Hypothesis: Guilty
Type I error: You are convicted and found guilty
even though you are innocent.
Type II error: The jury finds you innocent even
though you are guilty of the crime.
Diseños factoriales
Diseños factoriales
 En muchas situaciones experimentales resulta de interés estudiar los efectos producidos por dos o
más factores simultáneamente; esto se logra con la ayuda de los Diseños Factoriales.
 En general los Diseños Factoriales producen experimentos más eficientes, ya que cada observación
proporciona información sobre todos los factores, y es posible ver las respuestas de un factor en
diferentes niveles de otro factor en el mismo experimento.
 Se entiende por Diseño Factorial a aquel diseño en el cual se pueden estudiar los efectos de dos o
más factores de variación a la vez; es decir, que se puede investigar todas las posibles
combinaciones de los niveles de los factores en cada ensayo completo o réplica del
experimento.
Ventajas de usar un diseño Factorial:
 Ahorro y economía del recurso experimental; ya que cada unidad experimental provee
información acerca de dos o más factores, lo que no sucede cuando se realiza con una serie de
experimentos simples.
 Da información respecto a las interacciones entre los diversos factores en estudio.
 Permite realizar estimaciones de las interacciones de los factores, además de los efectos simples.
 Permite estimar los efectos de un factor en diversos niveles de los otros factores,
produciendo conclusiones que son válidas sobre toda la extensión de las condiciones
experimentales.
Desventajas de usar un diseño Factorial:
 Si el número de niveles de algunos de los factores o el número de factores es demasiado grande,
entonces el número de todas las combinaciones posibles de tratamientos de factores llega a ser un
número grande, en consecuencia la variabilidad en el experimento podría ser grande.
 Estas dos situaciones, pueden hacer difícil detectar los efectos significativos en el experimento.
Diseños factoriales
Los diseños de experimentos de
comparación simple pueden no conducir
al óptimo (como se ilustra si se varía
primero la temperatura y luego el
tiempo)

Los diseños factoriales permiten llegar al


óptimo (EVOP)
Diseño Bifactorial
Análisis de Varianza ANOVA ara un modelo de efectos fijos bifactorial con a y b factores y n
repeticiones

Fuente Suma de cuadrados Grados de Media de F0


variación libertad cuadrados

Tratamientos A SSA  
a
Yi.. 2  Y... 2 a-1 MS A 
SS A
F0 
MS A
i 1 bn abn a 1 MSE

SSB  
b Y   Y  2 2
SSB MSB
MSB  F0 
. j. ...
Tratamientos B b-1
j an abn b 1 MSE

a
SSAB  
b Y   Y  2 2
 SSA  SSB
SSAB F0 
MS AB
MSAB 
ij . ...
Interacción (a-1)(b-1)
i 1 j 1 n abn a 1b 1 MSE

Error
SSE  SST  SSA  SSB  SSAB SSE
(dentro de ab(n-1) MSE 
tratamientos) abn  1

SST   Yijk  


a
Y... 
b 2 n
2
Total abn abn-1
i 1 j 1 k 1

𝑦𝑖𝑗𝑘 = 𝜇 + 𝜏𝑖 + 𝛽𝑖 + 𝜏𝛽 𝑖𝑗 + 𝜀𝑖𝑗𝑘
Diseño Bifactorial
Modelo de efectos fijos para un diseño bifactorial:

𝑦𝑖𝑗𝑘 = 𝜇 + 𝜏𝑖 + 𝛽𝑗 + 𝜏𝛽 𝑖𝑗 + 𝜀𝑖𝑗𝑘
Donde:
 es el efecto medio
𝒊es el efecto del i-esimo nivel del factor A ( 𝒊=0)
𝐣es el efecto del i-esimo nivel del factor B (𝐣=0)
𝒊𝐣es el efecto de la interacción entre A y B ( 𝒊𝐣 =0)
ijkcomponente del error aleatorio (variable aleatoria con media 0 y desviación estándar )
i=1,2,͙,a (niveles del factor A)
j=1,2,͙,b (niveles del factor B)
i=1,2,͙,n (número de réplicas)
Diseño Bifactorial
 Ejemplo 7.1 (D.C. Montgomery):
Un ingeniero diseña una batería que será sometida a ciertas variaciones de temperatura. El
ingeniero prueba tres materiales distintos y evalúa la batería a tres niveles de temperatura. Qué
efecto tiene el tipo de material y la temperatura sobre la duración de la batería (horas)?
Temperatura (°F)
Tipo de 15 70 125
material 1 2 3 4 1 2 3 4 1 2 3 4
1 130 155 74 180 34 40 80 75 20 70 82 58
2 150 188 159 126 136 122 106 115 25 70 58 45
3 138 110 168 160 174 120 150 139 96 104 82 60

ANOVA para un modelo de efectos fijos bifactorial (Calculado por el usuario)


Suma de Grados de Promedio de los Valor crítico
Origen de las variaciones cuadrados libertad cuadrados F Probabilidad para F
Factor A 10684 2 5342 7.911372269 0.001976083 3.354130829
Factor B 39119 2 19559 28.96769195 1.9086E-07 3.354130829
Interacción AB 9614 4 2403 3.5595354 0.018611168 2.727765306
Error 18231 27 675
Total 77647 35

Nivel de confianza 5%
Diseño Bifactorial
 Ejemplo 7.1 (D.C. Montgomery): Solución por Excel.
Factores T
T1 T2 T3
M1 130 34 20
M1 155 40 70
M1 74 80 82
M1 180 75 58
M2 150 136 25
M2 188 122 70
Factores M
M2 159 106 58
M2 126 115 45
M3 138 174 96
M3 110 120 104
M3 168 150 82
M3 160 139 60

ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los Valor crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Muestra 10683.72222 2 5341.861111 7.911372269 0.001976083 3.354130829
Columnas 39118.72222 2 19559.36111 28.96769195 1.9086E-07 3.354130829
Interacción 9613.777778 4 2403.444444 3.5595354 0.018611168 2.727765306
Dentro del grupo 18230.75 27 675.212963
Total 77646.97222 35
Diseño factorial 22
Método alternativo para calcular el ANOVA en un diseño 22

n es el número de réplicas
Diseño factorial 22 con tres réplicas
 Ejemplo factorial 2^2 con tres réplicas (D.C. Montgomery): Se estudió el efecto de la
concentración de un reactivo y de la presencia de un catalizador sobre el tiempo de reacción.
La concentración del reactivo es el factor A y tiene dos niveles 15 y 20%. El catalizador es el
factor B y tiene un nivel alto y un nivel bajo.
Catalizador Tiempo (h)
Experimento Concentración A
B Réplica 1 Réplica 2 Réplica 3
1 -1 -1 28 25 27
2 1 -1 36 32 32
3 -1 1 18 19 23
4 1 1 31 30 29
Suma
Experimento A B AB Réplica 1 Réplica 2 Réplica 3 Total
Cuad
(1) -1 -1 1 28 25 27 80 2138
a -1 1 -1 36 32 32 100 3344
b 1 -1 -1 18 19 23 60 1214
ab 1 1 1 31 30 29 90 2702
Efectos 8.3 -5.0 1.7 Total 9398
Promedio 9075
SST 323
ANOVA para un factorial 2^2 con 5 repeticiones centrales
Suma de Grados de Promedio de los Valor crítico
Origen de las variaciones cuadrados libertad cuadrados F Probabilidad para F
A (concentración) 208.3 1 208.3 53.2 8.44372E-05 5.317655072
B (catalizador) 75.0 1 75.0 19.1 0.002361571 5.317655072
AB 8.3 1 8.3 2.1 0.182776481 5.317655072
Error 31.3 8 3.9
Total 323.0 11

Nivel de confianza 5%
Diseño factorial 22 con repeticiones del punto central
 Ejemplo 9.5 (D.C. Montgomery): Una ingeniera química se encuentra estudiando el
rendimiento de un proceso, en función de tiempo y la temperatura. Por lo que decide
realizar un diseño factorial 22 con cinco puntos centrales.

160 1 40.0 41.5

curvatura
40.3
40.5
155 0 40.7 nc es el número de repeticiones centrales
40.2 nF es el número de puntos en el diseño factorial
40.6
YF promedio de los puntos factoriales
YC promedio de los puntos factoriales
150 -1
39.3 40.9
-1 0 1

30 35 40
Diseño factorial 22 con repeticiones del punto central
 Ejemplo 9.5 (D.C. Montgomery): Una ingeniera química se encuentra estudiando el
rendimiento de un proceso, en función de tiempo y la temperatura. Por lo que decide
realizar un diseño factorial 22 con cinco puntos centrales.
Tiempo Temperatura
Experimento Rendimiento
(min) (°C)
(1) -1 -1 39.3
b -1 1 40.0
a 1 -1 40.9
ab 1 1 41.5 Scuad
o1 0 0 40.3 0.0256
o2 0 0 40.5 0.0016
o3 0 0 40.7 0.0576
o4 0 0 40.2 0.0676
o5 0 0 40.6 0.0196
nc 5 0.172
nf 4
YF 40.425
YC 40.460 Significativos
ANOVA para un factorial 2^2 con 5 repeticiones centrales
Suma de Grados de Promedio de los Valor crítico
Origen de las variaciones cuadrados libertad cuadrados F Probabilidad para F
A (Tiempo) 2.4025 1 2.4025 55.87209302 0.001712537 7.708647421
B (presión) 0.4225 1 0.4225 9.825581395 0.035030253 7.708647421
AB 0.0025 1 0.0025 0.058139535 0.821316445 7.708647421
Curvatura 0.0027 1 0.0027 0.063307494 0.813740849 7.708647421
Error 0.1720 4 0.0430
Total 3.0022 8

Nivel de confianza 5%
Diseños factoriales

R1 – Sabor
A - Marca (Cálculo del efecto)
42 32

71 80
Time

81 77
er
Effect  y    y 
  y 
ow

74 75 n n
P

Brand

75  80  77  32 74  71 81 42
y A    1
4 4
Diseño factorial 23
Análisis de Varianza ANOVA ara un diseño factorial 23

Fuente Suma de cuadrados Grados de Media de cuadrados F0


libertad

SS A  
a
Yi... 2  Y.... 2 SS A MS A
A a-1 MS A  F0 
i 1 bcn abcn a 1 MSE

SSB  
b Y   Y 
. j ..
2
....
2 SS
MSB  B F0 
MSB
B
acn abcn
b-1
b 1 MSE
j 1

SSC  
c
Y..k . 2  Y.... 2 MSC 
SSC
F0 
MSC
C
abn abcn
c-1
c 1 MSE
k 1

SSAB  
a b Y   Y  2 2
 SSA  SSB MSAB 
SSAB
F0 
MS AB
a 1b 1
ij .. ....
AB (a-1)(b-1)
cn abcn MSE
i 1 j 1

SS AC  
a c
Yi.k . 2  Y.... 2  SS  SSC MSAC 
SSAC F0 
MS AC
AC
i 1 k 1 bn abcn
A
(a-1)(c-1)
a 1c 1 MSE

SSBC  
b c Y   Y  2 2
 SSB  SSC MSBC 
SSBC
F0 
MSBC
b 1c 1
. jk . ....
BC (b-1)(c-1)
an abcn MSE
j 1 k 1
a
SSABC  
b c Y   Y  2 2
SS MS
a 1b 1c 1 F0  MS
ABC
ijk . ....
 SSA  SSB  SSC  SSAB  SSAC  SSBC (a-1)(b-1)(c-1) MS ABC  ABC ABC

i 1 j 1 k 1 n abcn E

Error SSE
SSE  SST  SSA  SSB  SSC  SSAB  SSAC  SSBC MSE 
abc(n-1)
abcn  1

SST   Yijkl  


a
Y.... 
2 b c n
2
Total abcn-1
i 1 j 1 k 1 l 1 abcn
Diseño factorial 23
Modelo de efectos fijos para un diseño factorial 23:

𝑦𝑖𝑗𝑘𝑙 = 𝜇 + 𝜏𝑖 + 𝛽𝑗 + 𝛾𝑘 + 𝜏𝛽 𝑖𝑗 + 𝜏𝛾 𝑖𝑘 + 𝛽𝛾 𝑗𝑘 + 𝜏𝛽𝛾 𝑖𝑗𝑘 + 𝜀𝑖𝑗𝑘𝑙


Donde:
 es el efecto medio
𝒊es el efecto del i-esimo nivel del factor A ( 𝒊=0)
𝐣es el efecto del i-esimo nivel del factor B (𝐣=0)
𝐤es el efecto del i-esimo nivel del factor C (𝐤 =0)
𝒊𝐣es el efecto de la interacción entre A y B ( 𝒊 =0)
𝒊𝐤es el efecto de la interacción entre A y C ( 𝒊𝐤 =0)
𝐣𝐤es el efecto de la interacción entre B y C ( jk=0)
𝐢𝐣𝐤es el efecto de la interacción entre A, B y C ( 𝐢𝐣𝐤 =0)
ijkLcomponente del error aleatorio (variable aleatoria con media 0 y desviación estándar )
i=1,2,͙,a (niveles del factor A)
j=1,2,͙,b (niveles del factor B)
k=1,2,͙,c (niveles del factor C)
i=1,2,͙,n (número de réplicas)
Diseño factorial 23
Ejemplo diseño factorial 23: Panel de degustación de un torta, donde se varió la cantidad de
harina (factor A), de mantequilla (factor B) y de huevos (factor C). La respuesta fue el sabor
(entre 1 y 7, siendo 1 ͞ŚŽƌƌŝďůĞ͟ y 7 ͞ĚĞůŝĐŝŽƐĂ͟Ϳ
Replicas
A B C AB AC BC ABC 1 2 3 4 5 Sum Promedio
-1 -1 -1 1 1 1 -1 3.1 1.1 5.7 6.4 1.3 17.6 3.5
1 -1 -1 -1 -1 1 1 3.2 3.8 4.9 4.3 1.3 17.5 3.5
-1 1 -1 -1 1 -1 1 5.3 3.7 5.1 6.7 2.9 23.7 4.7
1 1 -1 1 -1 -1 -1 4.1 4.5 6.4 5.8 5.2 26.0 5.2
-1 -1 1 1 -1 -1 1 5.9 4.2 6.8 6.5 3.5 26.9 5.4
1 -1 1 -1 1 -1 -1 6.9 5.0 6.0 5.9 5.7 29.5 5.9
-1 1 1 -1 -1 1 -1 3.0 3.1 6.3 6.4 3.0 21.8 4.4
1 1 1 1 1 1 1 4.5 3.9 5.5 5.0 5.4 24.3 4.9

4.50 4.58 4.24 4.63 4.61 5.31 4.75


4.87 4.79 5.13 4.74 4.76 4.06 4.62
0.36 0.22 0.89 0.12 0.15 -1.25 -0.13

Fuentes SS df MS F F tablas Signif? a MODELO DE REGRESIÓN


A 1.33 1 1.33 0.62 4.15 ns 0.05
B 0.46 1 0.46 0.21 4.15 ns Intercept0 4.68
C 7.83 1 7.83 3.62 4.15 ns Coeficiente A 0
AB 0.13 1 0.13 0.06 4.15 ns Coeficiente C 0.1075
AC 0.21 1 0.21 0.10 4.15 ns Coeficiente B 0.4425
Coeficiente AB 0
BC 15.50 1 15.50 7.17 4.15 *
Coeficiente AC 0
ABC 0.16 1 0.16 0.07 4.15 ns
Coeficiente BC -0.623
Error 69.19 32 2.16 Coeficiente ABC 0
Total 94.82 39
Diseño factorial 23
Ejemplo diseño factorial 23: Panel de degustación de un torta, donde se varió la cantidad de
harina (factor A), de mantequilla (factor B) y de huevos (factor C). La respuesta fue el sabor
(entre 1 y 7, siendo 1 ͞ŚŽƌƌŝďůĞ͟ y 7 ͞ĚĞůŝĐŝŽƐĂ͟Ϳ

R² = 0.9321
Cummulative normal probability

0.99

0.90

0.50
-2 -1 0 1 2
0.10

0.001

0.99
Cummulative normal probability
0.90

0.50
-3 -2 -1 0 1 2 3

0.10

R² = 0.9754
0.001
Diseño factorial 23
Método alternativo para calcular el ANOVA en un diseño 23

n es el número de réplicas
Diseño factorial 23
Ejemplo 9.1 (D.C. Montgomery): Efecto del % de carbonatación (A), la presión (B) y la
velocidad de la línea (C), en la desviación del volumen de envasado de una bebida gaseosa. Se
utilizó un diseño 23 con dos réplicas

Presión (B)
Rapidez de la línea ( C ) Rapidez de la línea ( C )
%Carbonatación 200 250 200 250
-3 -1 -1 1
10 -1 0 0 1
-4 =(1) -1 =c -1 =b 2 = bc
0 2 2 6
12 1 1 3 5
1 =a 3 = ac 5 = ab 11 = abc
Diseño factorial 23
Ejemplo 9.1 (D.C. Montgomery): Efecto del % de carbonatación (A), la presión (B) y la
velocidad de la línea (C), en la desviación del volumen de envasado de una bebida gaseosa. Se
utilizó un diseño 23 con dos réplicas
Diseño factorial 23
Ejemplo 9.1 (D.C. Montgomery): Efecto del % de carbonatación (A), la presión (B) y la
velocidad de la línea (C), en la desviación del volumen de envasado de una bebida gaseosa. Se
utilizó un diseño 23 con dos réplicas
Diseños factoriales por
bloques
Diseños factoriales por bloques
 Existen problemas en los que es muy complejo realizar una réplica completa de un diseño factorial,
usando un solo bloque (un día, un lote de materia prima, un laboratorio, etc.).
 La técnica de confusión es una técnica de diseño de experimentos utilizada para acomodar un
experimento factorial completo en bloques, donde el tamaño y bloque es menor que el número de
tratamientos en una réplica.
 Al usar esta técnica, la información sobre ciertos efectos (generalmente las interacciones de mayor orden),
no se puede distinguir y se confunde con los bloques.
 Consideraremos la construcción y análisis del diseño factorial 2k en 2p bloques incompletos, siendo p<k.
Estos diseños pueden correrse en dos bloques, cuatro bloques, ocho bloques, etc.

Combinación de Efecto Factorial


tratamientos I A B AB
[1] + - - +
a + + - -
b + - + -
ab + + + +

Diseño 22 en dos bloques: (a) representación geométrica, Debido a que la interacción AB con signo
(b) asignación de las ocho corridas en dos bloques positivo quedó en el bloque 1 y la
interacción AB con signo negativo quedó
en el bloque 2, el efecto de la interacción
queda confundido (con el bloque)
Diseños factoriales por bloques

Diseño 23 en dos bloques: (a) representación geométrica, (b) asignación de las


ocho corridas en dos bloques

Diseño 23-1 tabla de signos y bloques de experimentos


Diseños factoriales por bloques
Estructura de aliados para varios diseños de experimentos por bloques
Diseños factoriales por bloques
Estructura de aliados para varios diseños de experimentos por bloques
Diseños factoriales por bloques
Estructura de aliados para varios diseños de experimentos por bloques
Diseños factoriales por bloques
Estructura de aliados para varios diseños de experimentos por bloques
Diseños factoriales por bloques
Estructura de aliados para varios diseños de experimentos por bloques
Diseños factoriales por bloques
Estructura de aliados para varios diseños de experimentos por bloques
Diseños factoriales por bloques
 Ejemplo 10.1 (D.C. Montgomery): Se está experimentando en un reactor a presión para evaluar el efecto
de la temperatura (A), la presión (B), la concentración de los reactivos (C) y la velocidad de mezclado (D),
sobre la rapidez de filtrado. Cada factor está en dos niveles. Supóngase que no se puede efectuar el diseño
de experimentos 24, sino que se va efectuar el diseño en dos bloques (24-1). Diseñar el experimento
confundiendo la interacción de mayor orden (ABCD) con los bloques.
 Solución:
 Se debe buscar la estructura de aliados para un experimento 2^4 con un fracción de la mitad (2^3-1)
Diseños factoriales por bloques
 Ejemplo 10.1 (D.C. Montgomery):
 Solución:
 Generación de la tabla de signos (se colocan todas las combinaciones de A, B y C, los signos de D y las
demás interacciones se sacan por multiplicación de los signos de A, B y C)
Factor
Tratamiento A=BCD B=ACD C=ABD D=ABC AB=CD AC=BD AD=BC
1 -1 -1 -1 -1 1 1 1
6 -1 -1 1 1 1 -1 -1
2 -1 1 -1 1 -1 1 -1
4 -1 1 1 -1 -1 -1 1
7 1 -1 -1 1 -1 -1 1
5 1 -1 1 -1 -1 1 -1
3 1 1 -1 -1 1 -1 -1
8 1 1 1 1 1 1 1

 Supongamos que luego de realizar la experimentación en un orden aleatorio se obtuvieron las respuestas
que aparecen a continuación
Factor Respuesta
(rapidez
Tratamiento A=BCD B=ACD C=ABD D=ABC AB=CD AC=BD AD=BC filtrado)
1 -1 -1 -1 -1 1 1 1 45
6 -1 -1 1 1 1 -1 -1 75
2 -1 1 -1 1 -1 1 -1 45
4 -1 1 1 -1 -1 -1 1 80
7 1 -1 -1 1 -1 -1 1 100
5 1 -1 1 -1 -1 1 -1 60
3 1 1 -1 -1 1 -1 -1 65
8 1 1 1 1 1 1 1 96
Diseños factoriales por bloques
 Ejemplo 10.1 (D.C. Montgomery):
 En la tabla siguiente se muestra el cálculo de los efectos
Factor Respuesta
(rapidez
Tratamiento A=BCD B=ACD C=ABD D=ABC AB=CD AC=BD AD=BC filtrado)
1 -1 -1 -1 -1 1 1 1 45
6 -1 -1 1 1 1 -1 -1 75
2 -1 1 -1 1 -1 1 -1 45
4 -1 1 1 -1 -1 -1 1 80
7 1 -1 -1 1 -1 -1 1 100
5 1 -1 1 -1 -1 1 -1 60
3 1 1 -1 -1 1 -1 -1 65
8 1 1 1 1 1 1 1 96
Ave- 61.25 70.00 63.75 62.50 71.25 80.00 61.25
Ave+ 80.25 71.50 77.75 79.00 70.25 61.50 80.25
Efecto 19.00 1.50 14.00 16.50 -1.00 -18.50 19.00

0.99 Aparentemente el efecto B


Cummulative normal probability

0.90
(Presión) y sus interacciones no
son significativas. Podría
0.50
convertirse el diseño de un 24 a
-20 -15 -10 -5 0 5 10 15 20 uno 23 (eliminando B)
0.10

0.001
Diseños factoriales por bloques
 Ejemplo 10.1 (D.C. Montgomery):
 Conversión en un diseño completo 23 (descartando la presión, factor B)
Factor Respuesta
(rapidez
Tratamiento A C D AC AD CD ACD filtrado)
1 -1 -1 -1 1 1 1 -1 45
2 -1 -1 1 1 -1 -1 1 45
4 -1 1 -1 -1 1 -1 1 80
6 -1 1 1 -1 -1 1 -1 75
3 1 -1 -1 -1 -1 1 1 65
7 1 -1 1 -1 1 -1 -1 100
5 1 1 -1 1 -1 -1 -1 60
8 1 1 1 1 1 1 1 96
Ave- 61.25 63.75 62.50 80.00 61.25 71.25 70.00
Ave+ 80.25 77.75 79.00 61.50 80.25 70.25 71.50
Efecto 19.00 14.00 16.50 -18.50 19.00 -1.00 1.50

 Aparentemente los factores A, C y D son significativos, así como las interacciones de AC y AD. Para estimar
mejor la significancia de los efectos sería necesario efectuar una réplica o repetir un experimento central
varias veces.
Diseños de superficies de
respuesta
Diseños de superficies de respuesta
 Conjunto de técnicas estadísticas que permiten modelar y analizar problemas en los cuales una respuesta
de interés es influenciada por varias variables y el objetivo es optimizar esta respuesta.
 Nombres: MSR ó RSM Response surface methodology 

Superficie de respuesta Ejemplo: determinar las


condiciones de presión y
temperatura que maximizan el
Rendimiento esperado E(y) = 

rendimiento de una reacción


química

𝑦 = 𝑓 𝑥1 , 𝑥2 + 𝜀
Condiciones Diagrama de contorno de una
actuales de superficie de respuesta
operación
E 𝑦 = 𝑓 𝑥1 , 𝑥2 = η
y0 = máximo
Diagrama de contorno es el conjunto de
valores de x1 y x2 que cumplen la
condición de tener un mismo valor de
esperado de la respuesta (corresponden
a una altura específica de la superficie de
x2 = Presión (psi) respuesta)
x1 = Temperatura (°C)
Diseños de superficies de respuesta
 Por lo general, la relación entre la respuesta y las variables independientes se desconoce y se debe buscar
una aproximación
 Función lineal (primera opción):

𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘 + 𝜀
 Función cuadrática (segunda opción): cuando se sospecha de curvatura
𝑘 𝑘 𝑘 𝑘

𝑦 = 𝛽0 + 𝛽𝑖 𝑥𝑖 + 𝛽𝑖𝑖 𝑥𝑖 2 + ⋯ + 𝛽𝑖𝑗 𝑥𝑖 𝑥𝑗 + 𝜀
𝑖=1 𝑖=1 𝑖=1 𝑗=1

 Se suele utilizar una aproximación secuencial, primero utilizar un polinomio lineal y cuando se tiene
certeza de la posición del óptimo, utilizar un polinomio de segundo orden.
 Aunque es poco probable que la relación entre la respuesta y las variables independientes sea un
polinomio, sin embargo en intervalos pequeños de las variables independientes es una aproximación
razonable.
 Los diseños de experimentos apropiados para ajustar estas superficies de respuestas se denominan
diseños de superficies de respuesta.
Diseños de superficies de respuesta
 Método de la máxima pendiente en ascenso:
 Procedimiento para recorrer secuencialmente a lo largo de una trayectoria de la máxima pendiente
(dirección de máximo incremento de la respuesta)
 Se usa generalmente un modelo lineal ajustado: 𝑘

𝑦 = 𝛽0 + 𝛽𝑖 𝑥𝑖
𝑖=1

Camino de max. ascenso Los incrementos a lo largo de la trayectoria son


Región de RSM
ajustada proporcionales a los coeficientes i. Los
experimentos se realizan a lo largo de la
trayectoria de máximo ascenso hasta que deje
de observarse un incremento en la respuesta
Diseños de superficies de respuesta
 Ejemplo 16.1 (D.C. Montgomery) Método de la máxima pendiente en ascenso:
 Una ingeniera química esta interesada en determinar las condiciones óptimas de rendimiento de una
reacción química, controlando el tiempo y la temperatura de reacción. En las condiciones actuales opera a
35 min y 155°F, lo que produce un rendimiento de 40%. Para encontrar el óptimo se utilizará un modelo de
primer orden y se aplicará el método de la máxima pendiente de ascenso.
 La región de exploración seleccionada es:
 Tiempo: 30 a 40 min
 Temperatura: 150 a 160°F
 Codificación de las variables en el intervalo (-1,1): para hacer más fácil los cálculos:

Variables naturales Vbles codificadas Respuesta


Diseño factorial 2^2 con
𝜉1 − 35 E1 E2 x1 x2 y
𝑥1 = cinco replicas centrales
5 30 150 -1 -1 39,3 (estimación del error
30 160 -1 1 40,0 experimental)
𝜉2 − 155 40 150 1 -1 40,9
𝑥2 = 40 160 1 1 41,5
5
35 155 0 0 40,3
35 155 0 0 40,5
35 155 0 0 40,7
35 155 0 0 40,2
35 155 0 0 40,6
Diseños de superficies de respuesta
 Ejemplo 16.1 (D.C. Montgomery) Método de la máxima pendiente en ascenso:
 Estimación coeficientes del modelo lineal

𝑦 = 40.44 + 0.775𝑥1 + 0.325𝑥2


E1 E2 x1 x2 x1x2 y
30 150 -1 -1 1 39,3
30 160 -1 1 -1 40,0
Evaluación de idoneidad del modelo de
40 150 1 -1 -1 40,9 regresión lineal:
40 160 1 1 1 41,5  Estimación del error experimental
Efectos 1,55 0,65 -0,05  Verificar interacción de x1 y x2
Coef. 0,775 0,325 -0,025
Cuadrados
 Verificar curvatura
35 155 0 0 40,3 0,0256
35 155 0 0 40,5 0,0016
35 155 0 0 40,7 0,0576
35 155 0 0 40,2 0,0676
35 155 0 0 40,6 0,0196
nc 5,0 0,1720
nf 4,0
yf 40,43
yc 40,46
Sigma error 0,043

Promedio 40,44
Diseños de superficies de respuesta
 Ejemplo 16.1 (D.C. Montgomery) Método de la máxima pendiente en ascenso:
 Estimación del error experimental:
 El error experimental se calculó con las réplicas centrales como se indicó en el ejemplo 9.5
 Análisis significancia de la interacción entre x1 y x2:
 Se efectuó un análisis de varianza como se indicó en el ejemplo 9.5
 La interacción no es significativa
 Análisis curvatura:
 Se efectuó un análisis de varianza como se indicó en el ejemplo 9.5
 La curvatura no es significativa
 Conclusión: el modelo lineal es idóneo!!!!
ANOVA para un factorial 2^2 con 5 repeticiones centrales
Promedio
Suma de Grados de de los Valor crítico
Origen de las variaciones cuadrados libertad cuadrados F Probabilidad para F
A (Ti empo) 2,4025 1 2,4025 55,872093 0,001712537 7,70864742
B (pres i ón) 0,4225 1 0,4225 9,8255814 0,035030253 7,70864742
AB 0,0025 1 0,0025 0,0581395 0,821316445 7,70864742
Curva tura 0,0027 1 0,0027 0,0633075 0,813740849 7,70864742
Error 0,1720 4 0,0430
Total 3,0022 8

Nivel de confianza 5%
Diseños de superficies de respuesta
 Ejemplo 16.1 (D.C. Montgomery) Método de la máxima pendiente en ascenso:
 De acuerdo con los coeficientes del modelo lineal, habría que desplazarse 0.775 unidades en dirección de
x1 por cada 0.325 unidades en dirección de x2, para alejarse del centro del diseño:

𝑦 = 40.44 + 0.775𝑥1 + 0.325𝑥2


 Dicha trayectoria es la de máxima pendiente de ascenso.
 La ingeniera decide usar un incremento de 5 min en el tiempo de reacción (nótese que es un incremento
de x1 igual a 1).
 El incremento en la trayectoria de la máxima pendiente de ascenso será:
∆ 𝑥1 = 1.00 0.325∆ 𝑥1
∆ 𝑥2 = = 0.42
0.775
Diseños de superficies de respuesta
 Ejemplo 16.1 (D.C. Montgomery) Método de la máxima pendiente en ascenso:
 La ingeniera efectúa experimentos a lo largo de esta trayectoria y obtiene los rendimientos que se
muestran en la tabla:

 En las cercanías de 1 = 85 y 2 = 176, se encuentra el


Respuesta óptimo
Incrementos Delta x1 x2 E1 E2 y
 Conviene ajustar otro modelo de primer orden
Origen 0 0,00 35 155,0
alrededor del punto donde se detecta el óptimo
Delta 1 0,42 5 2,1
Origen+Delta 1 1 0,42 40 157,1 41,0
Origen+2Delta 2 2 0,84 45 159,2 42,9
Origen+3Delta 3 3 1,26 50 161,3 47,1
Origen+4Delta 4 4 1,68 55 163,4 49,7
Origen+5Delta 5 5 2,10 60 165,5 53,8
Origen+6Delta 6 6 2,52 65 167,6 59,9
Origen+7Delta 7 7 2,94 70 169,7 65,0
Origen+8Delta 8 8 3,36 75 171,8 70,4
Origen+9Delta 9 9 3,78 80 173,9 77,6
Origen+10Delta 10 10 4,20 85 176,0 80,3
Origen+11Delta 11 11 4,62 90 178,1 76,2
Origen+12Delta 12 12 5,04 95 180,2 75,1
Diseños de superficies de respuesta
 Ejemplo 16.1 (D.C. Montgomery) Método de la máxima pendiente en ascenso:
 Se ajusta un nuevo modelo de primer orden alrededor de 1 = 85 y 2 = 176.
 La región de exploración seleccionada es:
 Tiempo: 80 a 90 min
 Temperatura: 170 a 180°F
 Codificación de las variables en el intervalo (-1,1): para hacer más fácil los cálculos:

Variables naturales Vbles codificadas Respuesta


E1 E2 x1 x2 y
80 170 -1 -1 76,5 Diseño factorial 2^2 con
𝜉1 − 85 80 180 -1 1 77,0
𝑥1 = cinco replicas centrales
5 90 170 1 -1 78,0 (estimación del error
90 180 1 1 79,5 experimental)
𝜉2 − 175 85 175 0 0 79,9
𝑥2 = 85 175 0 0 80,3
5
85 175 0 0 80,0
85 175 0 0 79,7
85 175 0 0 79,8
Diseños de superficies de respuesta
 Ejemplo 16.1 (D.C. Montgomery) Método de la máxima pendiente en ascenso:
 Se ajusta un nuevo modelo de primer orden alrededor de 1 = 85 y 2 = 176.

𝑦 = 78.97 + 1.00𝑥1 + 0.50𝑥2


E1 E2 x1 x2 x1x2 y
80 170 -1 -1 1 76,5
80 180 -1 1 -1 77,0 Evaluación de idoneidad del modelo de
90 170 1 -1 -1 78,0 regresión lineal:
90 180 1 1 1 79,5  Estimación del error experimental
Efectos 2,00 1,00 0,50
Coef. 1,000 0,500 0,250  Verificar interacción de x1 y x2
Cuadrados  Verificar curvatura
85 175 0 0 79,9 0,0016
85 175 0 0 80,3 0,1296
85 175 0 0 80,0 0,0036
85 175 0 0 79,7 0,0576
85 175 0 0 79,8 0,0196
nc 5,0 0,2120
nf 4,0
yf 77,8
yc 79,94
Sigma error 0,053

Promedio 78,97
Diseños de superficies de respuesta
 Ejemplo 16.1 (D.C. Montgomery) Método de la máxima pendiente en ascenso:
 Análisis significancia de la interacción entre x1 y x2:
 Se efectuó un análisis de varianza como se indicó en el ejemplo 9.5
 La interacción no es significativa
 Análisis curvatura:
 Se efectuó un análisis de varianza como se indicó en el ejemplo 9.5
 La curvatura es significativa
 Conclusión: el modelo lineal no es idóneo!!!! Para mayor precisión utilizar un modelo cuadrático

Promedio Valor
Suma de Grados de de los crítico para
Origen de las variaciones cuadrados libertad cuadrados F Probabilidad F
A (Ti empo) 4,0000 1 4,0000 75,471698 0,000966411 7,7086474
B (pres i ón) 1,0000 1 1,0000 18,867925 0,012217153 7,7086474
AB 0,2500 1 0,2500 4,7169811 0,095610781 7,7086474
Curva tura 10,6580 1 10,6580 201,09434 0,000143578 7,7086474
Error 0,2120 4 0,0530
Total 16,1200 8

Nivel de confianza 5%
Diseños para ajustar superficies de respuesta
 El ajuste y análisis de superficies de respuesta se facilita con la elección apropiada de un diseño
experimental.
 Características deseables de un diseño de experimentos para ajustar superficies de respuesta:
 Debe proporcionar una distribución razonable de los puntos en toda la región de interés
 Permitir investigar la idoneidad del modelo
 Permitir la realización de experimentos en bloques
 Permitir la construcción secuencial de diseños de orden superior
 Proporcionar estimación del error experimental
 No requerir un número muy grande de tratamientos
 No requerir un número grande de niveles de los factores
 Simplicidad en los cálculos

• Diseño central compuesto


• Diseños ortogonales
Diseños para ajustar superficies de respuesta
 Diseño central compuesto:
 Para ajustar un modelo de segundo orden debe tenerse por lo menos tres niveles de cada factor
 Selección de alfa es importante para el análisis (la mejor elección de alfa es a=nf^1/4), por ejemplo
para un diseño 2^2 el valor de a=(2^2)^1/4=4^1/4=2=1.414
 Puede crecerse a partir de un diseño factorial 2^k
 Pueden controlarse con repeticiones centrales

Diseño central
Diseño central compuesto 2^3
compuesto 2^2

Diseño central
compuesto centrado
en las caras Diseño de Box-
Behnken
Diseños para ajustar superficies de respuesta
 Caracterización de la superficie de respuesta:

Máximo Mínimo

Punto de silla
Diseños para ajustar superficies de respuesta
 Ejemplo 16.2 (D.C. Montgomery) Diseño central compuesto 2^2:
 Continuando con el ejemplo 16.1, se decide ajustar a un modelo de segundo orden (cuadrático). En este
caso el uso de un diseño central compuesto es ventajoso.

Variables naturales Vbles codificadas Respuesta


E1 E2 x1 x2 y
80 170 -1 -1 76,5
80 180 -1 1 77,0
90 170 1 -1 78,0
90 180 1 1 79,5
85 175 0 0 79,9
85 175 0 0 80,3
85 175 0 0 80,0
85 175 0 0 79,7
85 175 0 0 79,8
92,07 175 1,414 0 78,4
77,93 175 -1,414 0 75,6
85 182,07 0 1,414 78,5
85 167,93 0 -1,414 77,0
Diseños para ajustar superficies de respuesta
 Ejemplo 16.2 (D.C. Montgomery) Diseño central compuesto 2^2:
 Obtención del modelo de segundo orden (técnica de mínimos cuadrados):

1 x11  x1 x11  x2 . . . x1k  xk 


1 x  x x22  x2 . . . x2 k  xk 
 21 1
. . . . . . . 
X  
. . . . . . . 
. . . . . . . 
 
1 xn1  x1 xn 2  x2 . . . xnk  xk 
Diseños para ajustar superficies de respuesta
 Ejemplo 16.2 (D.C. Montgomery) Diseño central compuesto 2^2:
 Obtención del modelo de segundo orden (técnica de mínimos cuadrados):
X= 1 -1.000 -1.000 1.000 1.000 1.000
1 -1.000 1.000 1.000 1.000 -1.000
1 1.000 -1.000 1.000 1.000 -1.000
1 1.000 1.000 1.000 1.000 1.000
1 0.000 0.000 0.000 0.000 0.000
1 0.000 0.000 0.000 0.000 0.000
1 0.000 0.000 0.000 0.000 0.000
1 0.000 0.000 0.000 0.000 0.000
1 0.000 0.000 0.000 0.000 0.000
1 1.414 0.000 1.999 0.000 0.000
1 -1.414 0.000 1.999 0.000 0.000
1 0.000 1.414 0.000 1.999 0.000
1 0.000 -1.414 0.000 1.999 0.000

X´ = 1 1 1 1 1 1 1 1 1 1 1 1 1
-1.000 -1.000 1.000 1.000 0.000 0.000 0.000 0.000 0.000 1.414 -1.414 0.000 0.000
-1.000 1.000 -1.000 1.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 1.414 -1.414
1.000 1.000 1.000 1.000 0.000 0.000 0.000 0.000 0.000 1.999 1.999 0.000 0.000
1.000 1.000 1.000 1.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 1.999 1.999
1.000 -1.000 -1.000 1.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

X´X = 13.000 0.000 0.000 7.999 7.999 0.000 (X´X)-1 = 0.200 0.000 0.000 -0.100 -0.100 0.000
0.000 7.999 0.000 0.000 0.000 0.000 0.000 0.125 0.000 0.000 0.000 0.000
0.000 0.000 7.999 0.000 0.000 0.000 0.000 0.000 0.125 0.000 0.000 0.000
7.999 0.000 0.000 11.995 4.000 0.000 -0.100 0.000 0.000 0.144 0.019 0.000
7.999 0.000 0.000 4.000 11.995 0.000 -0.100 0.000 0.000 0.019 0.144 0.000
0.000 0.000 0.000 0.000 0.000 4.000 0.000 0.000 0.000 0.000 0.000 0.250
Diseños para ajustar superficies de respuesta
 Ejemplo 16.2 (D.C. Montgomery) Diseño central compuesto 2^2:
 Obtención del modelo de segundo orden (técnica de mínimos cuadrados):

y= 76.5 X´y = 1020.200


77.0 7.959 (X´X)-1X´y = 79.940 0
78.0
79.5
4.121
0.995 1
618.907
79.9
80.3
621.906
0.515 2
1.000
80.0
79.7
-1.376 3
79.8 -1.001 4
78.4
75.6 0.250 5
78.5
77.0

yˆ  0  1 x1  2 x2  3 x1   4 x2  5 x1 x2
2 2

yˆ  79.940  0.995x1  0.515x2  1.376x1  1.001x2  0.25x1 x2


2 2
Gracias por su atención

You might also like