You are on page 1of 61

Diseo y anlisis de

experimentos

Estadstica para la Calidad y


Productividad
1

Experimentos diseados

Un experimento diseado es una


prueba o serie de pruebas en las
cuales
se
inducen
cambios
deliberados en algunas variables de
entrada del sistema mientras otras
se mantienen fijas, de manera de
identificar las fuentes de los cambios
en las variables de salida.
2

Definiciones bsicas
Unidad experimental es el sujeto u
objeto sobre el cual se toma una
medicin de la variable de respuesta.

Un punto del diseo es una


combinacin de valores de las variables
explicativas para las cuales se toma una
medicin de la variable de respuesta.
En otras palabras, estamos hablando de
una condicin experimental
3

Definiciones bsicas (cont)


Los tratamientos son las variables
explicativas cuyo efecto sobre la
respuesta nos interesa estudiar.
Las variables explicativas cuya
influencia sobre la respuesta no
interesa
al
experimentador
se
denominan variables de ruido.
Cuando las variables explicativas son
categricas se les llama factores.
4

Definiciones bsicas (cont)

Ejemplo: Se est interesado en


estudiar la influencia de la presin y
la temperatura de moldeo de un
nuevo tipo de plstico sobre su
dureza, para lo cual se decide tomar
muestras de 2 m2 (cada una de las
cuales
representa
una
unidad
experimental) producidas a 200,
300 y 400 psi de presin y 200 y 300
F de temperatura.
5

Definiciones bsicas (cont)


En este caso la temperatura y la
presin representan los tratamientos
del experimento y los mismos son
factores
El diseo comprende seis puntos:
(200psi,200F), (300psi,200F), (400psi,200F),
(200psi,300F), (300psi,300F) y (400psi,300F).

No hemos identificado ninguna


variable de ruido para este problema.

Ventajas de los
experimentos diseados

Elegir los puntos del diseo tiene


mltiples ventajas:
Se pueden controlar variables de ruido:
Las variables de ruido que se conocen pueden
incluirse en el estudio en forma de bloques y
covariables, o manteniendo su valor durante a
lo largo de las distintas corridas.
Para reducir la influencia de las variables de
ruido cuya presencia se desconoce, la
asignacin de los tratamientos a las unidades
experimentales se debe hacer en forma
aleatoria.

Ventajas de los
experimentos diseados

300

350

400

450

500

550

Con datos histricos el rango de los


tratamientos puede ser muy reducido,
con lo que el ruido puede enmascarar
los cambios en la respuesta.

Densidad

200

220

240

260

Temperatura

280

Ventajas de los
experimentos diseados

Se puede reducir el tamao muestral,


simplificar el anlisis y obtener mejor
informacin:

Se puede lograr que los estimadores del modelo


tengan propiedades atractivas (como por ejemplo
la ortogonalidad).
Esto hace que se logren
estimaciones ms eficientes con menos datos.
Se pueden elegir que factores o interacciones han
de despreciarse, en caso que esto sea necesario.
En los datos histricos es posible que el efecto de
algunas variables sea indistinguible (confusin de
efectos).
9

Etapas de un experimento
Identificacin del problema

Objetivo (Hiptesis/Pregunta).
Escoger variables de respuesta.
Identificar variables explicativas.
Vnculo entre VE y VR (modelo)

Anlisis de resultados
(respuesta a la
pregunta)

Diseo del
experimento
(dnde medir?)

Recoleccin de la muestra
(medicin)

El diseo del experimento est influenciado


por el modelo para analizar los datos.
10

Modelaje de sistemas
En los cursos bsicos de estadstica se
estudiaron los modelos lineales (los
cuales incluyen a los modelos de
regresin y de anlisis de varianza como
casos particulares) y se disearon
herramientas para estimarlos y probar
hiptesis sobre ellos. Vamos ahora a
utilizar este mismo tipo de modelos para
analizar los datos provenientes de
experimentos diseados.
11

Modelos asociados
Por ser un conjunto de datos con
tratamientos categricos, el modelo
lgico a utilizar es un modelo de
anlisis de varianza con k vias que
incluya todas las interacciones entre
factores.
Tambin puede utilizarse un modelo
de regresin lineal con variables
codificadas,
el
cual
resulta
equivalente al modelo ANOVA.
12

Definicin de efecto

En el mbito de los diseos 2k se


denomina efecto de una variable (o
de una interaccin) a la diferencia
entre la respuesta esperada que se
obtiene en el nivel alto de la variable
y la respuesta esperada que se
obtiene en el nivel bajo de la misma.

13

ab

(1)

-1

Llamaremos A y B a las
variables explicativas,
as como a sus efectos.
La interaccin entre
ambos factores y el
efecto correspondiente
la denotaremos AB.
Las condiciones
experimentales pueden
ubicarse en un cuadro.

Diseos 22

-1

1
A

14

Nomenclatura de diseos 22

Para
denotar
los
puntos
experimentales
se
utiliza
una
palabra compuesta por las letras
minsculas correspondientes a los
factores que deban colocarse a nivel
alto. El punto que corresponde a
todas las variables en nivel bajo se
denota (1).
15

Nomenclatura de diseos 22
(cont)
As, los puntos en orden estndar son:
(1)
a
b
ab

A
-1
+1
-1
+1

B
-1
-1
+1
+1

En algunos casos se usa la misma


nomenclatura para el valor de la
variable de respuesta obtenida en ese
punto, pero esto puede inducir a
errores.
16

Estimacin en diseos 22
La forma ms sencilla de estimar los
efectos en este diseo es usar un
modelo
de
regresin
con
la
estructura:
yi x1i x2i ( ) x1i x2i i
donde
1 si A en bajo
x1i

1 si A en alto

1 si B en bajo
x2 i
1 si B en alto
17

Estimacin en diseos 22
(cont)
As se obtienen como estimadores
ya. yab. y(1). yb.

22 R
yb. yab. y(1). ya.

22 R
y(1). yab. ya. yb.

2
2
donde el punto indica laR suma sobre todas
las rplicas obtenidas en el mismo punto.
18

Estimacin en diseos 22
(cont)
Este modelo de regresin es
equivalente a ajustar un modelo de
anlisis de varianza de 2 vas:
yijk i* *j ( )*ij ijk i, j 1,2 k 1,R
donde se utilizan las restricciones
*
*
*
*

i
j
ij
ij 0
i

cumplindose as las relaciones


*
*
*
1
1 11
19

Estimacin en diseos 22
(cont)
Recordemos que en este modelo
representa la media general de
todas las observaciones y los dems
coeficientes la diferencia respecto de
esta media general que se produce
en la respuesta para cada nivel de la
variable
Efecto(correspondiente.
A) ( ) ( ) 2As:

Efecto( B ) ( ) ( ) 2
Efecto( AB) ( ) ( ) 2( )
20

Estimacin en diseos 22
(cont)
El estimador del efecto de A que
obtuvimos
anteriormente
puede
escribirse
ya. yab. y(1). yb.

Efecto( A)

2R
2R

Es decir, el promedio de todas las


observaciones a nivel alto de A menos
el promedio de todas las observaciones
a nivel bajo de A. Esto est en lnea con
21
nuestra definicin de efecto.

Estimacin en diseos 22
(cont)
El mismo efecto tambin puede
escribirse
ya. y(1). yab. yb.

R
R

Efecto( A)
2
El primer parntesis representa el cambio
de respuesta que produce la variable A
cuando B est en nivel bajo y la segunda
el mismo cambio cuando B esta en alto.
22

Diseos factoriales 2k
El ms importante de los casos especiales
de los diseos factoriales es el que tiene k
factores cada uno a dos niveles. Estos
niveles pueden ser cuantitativos, valores de
temperatura o presin, o pueden ser
cualitativos, tales como 2 mquinas o dos
operadores, o tal vez pueda ser la presencia
o ausencia de un factor.
Una rplica completa de tal diseo requiere
2 2 2 2 = 2k observaciones y se
conoce como un diseo factorial 2k.
23

Diseos 2k
El espacio de condiciones experimentales
puede representarse mediante un cubo
(para k = 3) o pares de cubos (para k > 3).
k=3

k=4

C
B
A

B
A

B
A
24

Nomenclatura de diseos 2k
La forma de denotar los puntos es la
misma que el diseo 22. En cuanto
al orden estndar de un diseo 2k,
este puede hallarse duplicando el
orden estndar de un 2k-1, uno para
el nivel bajo de la nueva variable
seguido del otro para el nivel alto de
la nueva variable.
25

Nomenclatura de diseos 2k
Por ejemplo, para k = 3 y k = 4.
A

(1)

-1

-1

-1

(1)

-1

-1

-1

-1

+1

-1

-1

+1

-1

-1

-1

-1

+1

-1

-1

+1

-1

-1

ab

+1

+1

-1

ab

+1

+1

-1

-1

-1

-1

+1

-1

-1

+1

-1

ac

+1

-1

+1

ac

+1

-1

+1

-1

bc

-1

+1

+1

bc

-1

+1

+1

-1

abc

+1

+1

+1

abc

+1

+1

+1

-1

-1

-1

-1

+1

ad

+1

-1

-1

+1

bd

-1

+1

-1

+1

abd

+1

+1

-1

+1

cd

-1

-1

+1

+1

acd

+1

-1

+1

+1

bcd

-1

+1

+1

+1

abcd

+1

+1

+1

+1

26

Estimacin en diseos 2k

Un modelo de regresin con k


variables de la forma
1 si j - esimo factor en bajo
xj
1 si j - esimo factor en alto

puede utilizarse para estimacin en


este problema.
27

Algoritmo de los signos


Podemos usar la ortogonalidad del
diseo para simplificar la frmula de
los estimadores mnimo cuadrticos.
De hecho es fcil probar que estos
se pueden escribir como un mltiplo
del producto escalar de dos vectores:
columna del factor vector de observaciones
Efecto
2 k 1
28

Algoritmo de los signos


(cont)

Por ejemplo, en un diseo 2 3, el


estimador del efecto de la interaccin
ABC viene dado por:
Efecto( ABC )

(1, 1, 1, 1, 1, 1, 1, 1) ( y(1) ,ya ,yb ,yab ,yc ,yac ,ybc ,yabc )


22
y(1) ya yb yab yc yac ybc yabc
4

La columna ABC se obtiene


multiplicando las columnas de A, B y
C.
29

Anlisis de diseos 2k (cont)

30

Anlisis de diseos 2k (cont)


A y A y A
B yB yB
C yC yC
1
AB ab (1) abc c b a bc ac
4n
1
AC ac (1) abc b a c ab bc
4n
1
BC bc (1) abc a b c ab ac
4n
1
ABC abc bc a c ab b a (1)
4n

31

Anlisis de diseos 2k

Si se toma ms de una rplica


entonces se utiliza una tabla de
anlisis de varianza de k vas para
determinar
cuales
efectos
son
significativos. La suma de cuadrados
de cada variable tiene 1 grado de
libertad y puede obtenerse a partir
2
del efecto mediante
la
frmula:
( Efecto)

SS

n2

K
32

Anlisis de diseos 2k (cont)


Ejemplo diseo factorial 23
Una empresa embotelladora de refrescos est
interesada en obtener alturas de llenado ms
uniformes en las botellas que se fabrican en
su proceso de manufactura. Tericamente, la
mquina de llenado llena cada botella a la
altura objetivo correcta, pero en la prctica,
existe variacin en torno a este objetivo, y a
la embotelladora le gustara entender mejor
las fuentes de variabilidad y, en ltima
instancia, reducirla.
33

Anlisis de diseos 2k (cont)


El ingeniero del proceso puede controlar tres
variables durante el proceso de llenado: el
porcentaje de carbonatacin (A), la presin de
operacin en el llenador (B) y las botellas
producidas por minuto o rapidez de lnea (C).
Para los fines del experimento, el ingeniero
puede controlar la carbonatacin en dos
niveles: 10 y12 por ciento. Elige dos niveles
para la presin (25 y 30 psi) y dos niveles para
la rapidez de lnea (200 y 250 bpm). El
ingeniero decide correr dos rplicas de un
diseo factorial con 23, haciendo 24 corridas de
manera aleatoria.
34

Anlisis de diseos 2k (cont)


La variable de respuesta observada es la desviacin
promedio de la altura del llenado objetivo que se
observa en una corrida de produccin de botellas con
cada conjunto de condiciones

35

Anlisis de diseos 2k (cont)


Factor B
Factor A

25 psi (-)

30 psi (+)

Factor C

Factor C

200 (-)
10 (-)
12 (+)
Totales
y.j..
y

-3
-1
0
1

250 (+)

-4

-1
0

2
1

-3

2
-1

200 (-)

-1

-1
0

2
3

250 (+)

yi..

-1

1
1

-4

6
5

11

20

13
17

-3 + 2 + 4 + 13 = 16

36

Anlisis de diseos 2k (cont)


El estimador y la suma de
cuadrados para cada efecto
pueden
calcularse con el
algoritmo de signos.
El efecto de la interaccin no
parece tener un impacto tan
grande sobre la desviacin de
la altura de llenado como los
efectos principales.
Los efectos principales
dominan en realidad este
proceso explicando ms del
87% de la variabilidad total,
mientras que la interaccin AB
explica menos de 3%

Factor Efecto

SS

36

46,15

2,25

20,25

25,96

1,75

12,25

15,70

AB

0,75

2,25

2,88

AC

0,25

0,25

0,32

BC

0,50

1,28

ABC

0,50

1,28

Error

6,41

Total

78

37

Anlisis de diseos 2k (cont)


Analysis of Variance Table
Response: desviacion
Df Sum Sq
Mean Sq F value Pr(>F)
A
1
36.000
36.000
57.6
6.368e-05 ***
B
1
20.250
20.250
32.4
0.0004585 ***
C
1
12.250
12.250
19.6
0.0022053 **
A:B
1
2.250
2.250
3.6
0.0943498 .
A:C
1
0.250
0.250
0.4
0.5447373
B:C
1
1.000
1.000
1.6 0.2415040
A:B:C
1
1.000
1.000
1.6 0.2415040
Residuals 8
5.000
0.625
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se puede confirmar la
magnitud de los
efectos principales,
son
altamente
significativos (todos
con valores p muy
pequeos).
La interaccin AB es
significativa con un
nivel del 10%, existe
una ligera interaccin
entre
la
carbonatacin y la
presin
38

Anlisis de diseos 2k (cont)

Los responsables del proceso


decidieron correrlo con presin baja
y velocidad de lnea alta, y reducir la
variabilidad de la carbonatacin
controlando con mayor precisin la
temperatura. Se consigui as una
reduccin sustancial en la desviacin
de la altura de llenado del valor
objetivo.
39

Anlisis de diseos 2k (cont)


Si se dispone de solo una rplica del
experimento entonces la suma de
cuadrados del error es nula y no es
posible utilizar una tabla de anlisis
de varianza para determinar cuales
efectos son significativos.

40

Anlisis de diseos 2k (cont)

Si se supone que no hay ningn


efecto significativo y que los errores
cometidos en cada medicin siguen
una distribucin normal con media 0
y varianza 2, entonces para todos
los efectos:
2


Efecto ~ N 0, k 2
2

41

Anlisis de diseos 2k (cont)

Esto sugiere dos posibilidades para


realizar el anlisis:
Utilizar un grfico cuantil cuantil de efectos
contra la districin normal y considerar
significativos los que no esten sobre la lnea.
Utilizar un estimador de 2 (o bien externo, o
bien obtenido a partir de los datos en forma
robusta) para calcular intervalos de
confianza.

Ambas tcnicas suponen pocos efectos


significativos.
42

Modelo de regresin

43

Modelo de regresin
$

x
x
x
xx
y
0
1 1
2 2
3 3
4 1 2
3
2.25

1.75
0.75
1.0 x1
x2
x3

x1 x2
2
2

2
2

Donde las variables codificadas x1, x2 y x3


representan a A, B y C, respectivamente. El
trmino x1x2 es la interaccin AB.
Los residuos pueden obtenerse como la
diferencia entre las desviaciones de la altura
de llenado observada y predicha.
44

Introduccin a la metodologa
de superficie de respuesta

Cada contorno corresponde a una


altura particular de la superficie de
respuesta. Es til para estudiar los
niveles x1, x2 que producen cambios
en la forma de la altura de la
superficie de respuesta. El objetivo en
este caso es llevar al experimentador
de manera rpida y eficiente a la
vecindad general del ptimo.
45

Superficie de respuesta y
Grfica de contorno
Superficie de respuesta

0.0
-0.5
-1.0

Presin

0.5

1.0

Grfica de contorno

-1.0

-0.5

0.0

0.5

1.0

Carbonatacion

46

Superficie de respuesta y
Grfica de contorno

Se muestran la superficie de
respuesta y la grfica de contorno
para la desviacin de la altura de
llenado obtenida en el modelo de
regresin,
suponiendo
que
la
velocidad de lnea est en el nivel alto
(x3= 1). Observe que como el modelo
contiene la interaccin, las lneas de
contorno de la desviacin de las
alturas constantes son curvas (o la
47

Superficie de respuesta y
Grfica de contorno

En la superficie de respuesta se
grafica el valor predicho de la
desviacin del llenado en trminos de
las dos variables del proceso (x1 y x2 ).

La grfica de contorno bidimensional


se obtiene al mirar desde arriba la
grfica de superficie de respuesta y al
unir los puntos que tienen una
desviacin del llenado (respuesta)
48
constante en el plano x1 - x2

Superficie de respuesta y
Grfica de contorno
La grfica de contorno indica que si la
velocidad de lnea est en el nivel alto,
entonces hay varias combinaciones de
los niveles de carbonatacin y la presin
que satisfarn que la desviacin del
llenado est tan cerca de cero como sea
posible.
Por ejemplo si se quiere minimizar la
desviacin del llenado, se necesita correr
x1 y x2 en sus niveles bajos (o cerca de
49
ellos)

Intervalos de confianza y R2

50

Proyeccin de diseos 2k
Gracias a su ortogonalidad, un
diseo 2k en el cul n factores (n < k)
son no significativos corresponde a 2n
rplicas de un diseo en el cul
participan solo k - n factores.
bc

abc

ac

C no significativo

ab
abc

ab

B
(1)

b
bc

(1)
c

a
ac

B
51

Proyeccin de diseos 2k
(cont)
Ejemplo 3 (continuacin ): usando
el grfico cuantil cuantil vimos que
la concentracin (B) parece no tener
efecto sobre el rendimiento.
Podramos pensar entonces que
nuestros resultados provienen de un
diseo 23 con dos rplicas en los
factores A, C y D, tal y como se
muestra en la siguiente tabla.
52

Proyeccin de diseos 2k
(cont)
Punto

Orden
Real

Rendi
mient
o

(1)

12

18

13

ab

12

16

ac

Rendimiento
Punto

Replica
I

Replica
II

17

(1)

12

13

15

18

16

bc

14

20

17

20

abc

15

ac

15

15

10

10

13

ad

11

25

ad

25

24

bd

13

cd

19

17

abd

15

24

acd

21

23

cd

19

acd

16

21

bcd

10

17

abcd

12

23

53

Proyeccin de diseos 2k
(cont)
Podemos ahora construir una tabla de
anlisis de varianza para estos 3
factores.
Facto gl
SS
MS
F
r
A

81,00

81,00

40,500

16,00

16,00

8,000

42,25

42,25

21,125

AC

72,25

72,25

36,125

AD

64,00

64,00

32,000

CD

0,00

0,00

0,000

ACD

0,25

0,25

0,125

Error

16,00

2,00

Total

1
5

291,75
54

Proyeccin de diseos 2k
(cont)
Esta tabla confirma los resultados
obtenidos mediante el grfico cuantil
cuantil: tanto la interaccin ACD
como la interaccin CD son no
significativas, pero el resto de los
coeficientes del modelo si lo son.

55

Ventajas y desventajas de
los diseos 2k (cont)
Los diseos 2k son preferibles a los
experimentos donde se inducen
cambios en un factor a la vez:
En estos ltimos no es posible estudiar la
interaccin.
Estos ltimos tienen una eficiencia
menor, ya que se requieren ms
observaciones para lograr la misma
precisin en la estimacin.
56

P
re
s
io
n

20

5
4
0

Por ejemplo, se desea


estudiar la influencia de
la presin y la
temperatura sobre la
viscosidad de un
producto. Bajo el
esquema un factor a la
vez, estudiaramos
primero la temperatura:

5
9
0

Ventajas y desventajas de
los diseos 2k (cont)

30

220

250
Temperatura

57

Ventajas y desventajas de
los diseos 2k (cont)

P
re
s
io
n

5
9
0

40

30

5
4
0

Ahora, estudiaramos
la presin partiendo
del mejor punto
encontrado en el
experimento anterior.
As, la condicin
ptima sera (250,
590) y cada
estimacin del efecto
estara basada en dos
observaciones.

220

250
Temperatura

58

50

40

20

30

P
re
s
io
n
5
4
0

Si usamos un diseo 2k
podramos advertir
que la interaccin es
importante y por tanto
el ptimo estara en
(220,590) y cada
estimacin del efecto
sera calculada usando
cuatro observaciones.

5
9
0

Ventajas y desventajas de
los diseos 2k (cont)

220

250
Temperatura

59

Ventajas y desventajas de
los diseos 2k
La principal ventaja es que son
experimentos pequeos y baratos, ya
que tienen la menor cantidad de puntos
necesarios para estimar interacciones
entre variables.
La desventaja es que no proveen
suficiente informacin para estudiar en
profundidad la curvatura de la superficie.
60

Ventajas y desventajas de
los diseos 2k (cont)
Los experimentos factoriales a dos
niveles se encuentran ampliamente
difundidos y suelen usarse en las
primeras etapas de la experimentacin
para reducir el nmero de variables
explicativas a considerar.
Sin embargo, los resultados que se
obtienen con ellos suelen
complementarse posteriormente.
61