You are on page 1of 32

DISEÑO Y ANÁLISIS DE EXPERIMENTOS

Diseños Anidados

PROF. Grabiela Montes Q.


Diseños Anidados

 Diseño anidado en dos etapas.


 Diseño anidado general en m etapas.
 Diseño con factores anidados y factoriales.
Como hemos visto anteriormente en el diseño
factorial se prueban todos los tratamientos,
donde cada nivel de un factor se combinan con
todos los niveles de los otros factores.
En el diseño anidado los niveles de un factor
no se prueban en todos los niveles de los otros
factores.
Diseño anidado en dos
etapas.
 La presencia de un nivel de B depende de
cierto nivel de A; en este caso, el factor B
está anidado en el factor A, y con j(i), el j-
ésimo nivel de B corresponde al i-ésimo de A.
 Modelo equilibrado: Un factor anidado con el
mismo número de observaciones por celda.
 Modelo no-equilibrado: Un factor anidado con
distinto número de observaciones por celda.
Diseño anidado en dos
etapas.
 Modelo:
Yijk =  + αi + j(i) + (ij)k

: la media global
αi: el efecto del nivel i-ésimo del factor A; (i = 1, 2, …, a)
j(i): el efecto producido por el nivel j-ésimo del factor B dentro del nivel
i-ésimo del factor A, (j = 1, 2, …, bi)
k = 1, 2, …, n, donde n es el número de réplicas.
(ij)k : es el error experimental, independiente y con N(0,σ2)
N : número de observaciones, donde: N = n x  bi
Nota:
NO HAY INTERACCIÓN, ya que cada nivel de B no aparece en cada nivel
de A.
Descomposición de las sumas de cuadrados:
Esperanzas de cuadrados medios:

A fijo A fijo A aleatorio


B fijo B aleatorio B aleatorio

E(CMA) σ +
2 
bn αi2
σ 2
+ nσ β2(α ) +
bn α 2
i σ 2 + nσ β2(α ) + bnσ 2α
a −1 a −1
E(CMB(A))
σ +
2
n  β2j(i ) σ 2 + nσ β2(α ) σ 2 + nσ β2(α )
a(b − 1)
E(CME)
σ2 2 2
 Las hipótesis a plantear dependen del tipo de efecto de
los factores, por ejemplo, si el factor A es de efectos
fijos y el factor B es de efectos aleatorios tenemos:
Estimación de los parámetros
Si los factores A y B son de efectos
fijos, los estimadores son:
Ejemplo 1:
Supóngase que la vicepresidencia de Relaciones
Industriales de una compañía está interesada en
medir el clima laboral a nivel empleados. La
compañía tiene 3 fábricas (1, 2, 3) y cada una de
estas, tiene 8 departamentos que agrupan todas las
actividades.
El experimento se va a realizar en las 3 fábricas,
pero no en todos los departamentos, sólo se va a
escoger de manera aleatoria a 3 de cada fábrica.
La variable respuesta medida es el resultado de la
combinación de varias medidas expresada en una
escala de intervalos de 0 a 100, donde 100 indica el
nivel más alto de satisfacción por el ambiente de
trabajo y cero lo contrario.
La selección de empleados también fue aleatoria.
Los datos se muestran en la siguiente tabla:

FÁBRICA (Factor A)
1 2 3
Depart. (Factor B) Depart. (Factor B) Depart. (Factor B)
1 2 3 1 2 3 1 2 3
75 82 81 83 87 92 81 78 72
79 80 90 89 78 87 84 80 78
76 78 86 82 76 84 75 72 81
80 77 85 86 84 92 80 76 73
73 76 87 91 75 88 82 74 70
383 393 429 431 400 443 402 380 374
 El modelo indicado es:
Calculando las sumas de cuadrados
abn = 3x3x5 = 45
SCTm = 295097-293627.22 = 1469.78
 Tabla Anova

F. de V. gl SC CM F0
A 2 468.58 234.29 2.71
B(A) 6 518 86.33 6.43
Error 36 483.2 13.42
Total 44 1469.78

 Como F(2,6,0.95)= 5.14 y F(6,36,0.95)= 2.3, concluimos


que no hay diferencia entre las fábricas respecto al
nivel de satisfacción, pero si existe diferencia entre los
departamentos.
Ejemplo 2:
Una entidad bancaria tiene siete sucursales en tres
ciudades, distinguiéndose éstas por su distinto carácter
económico. En la central del banco están interesados en
saber si la diferente captación de clientes, medida por el
volumen de las cuentas corrientes, entre unas sucursales y
otras, así mismo entre ciudades, se debe al hecho de ser las
ciudades diferentes económicamente, a la labor de los
directores de las sucursales, o a ambas cosas a la vez. Para
contrastar estas posibles fuentes de variabilidad, se decide
utilizar un diseño factorial jerárquico (los niveles del factor
sucursales no pueden combinarse con todos y cada uno de
los niveles del factor ciudades) y se toma una muestra de
tres cuentas corrientes en cada sucursal, en miles de soles.
Modelo jerárquico con un factor anidado: las
sucursales están jerarquizadas según las
ciudades.
Sintaxis en R
ciudad<-c(rep(1,6), rep(2,9),rep(3,6))
sucursal<-c(rep(1,3), rep(2,3),
rep(1,3),rep(2,3),rep(3,3),
rep(1,3),rep(2,3))
ciudad<-as.factor(ciudad)
sucursal<-as.factor(sucursal)

cuentas<-c(1150,1157,1148,1120,1119,1125,1060,1050,1056,1043,
1048,1052,1020,1010,1030,800,860,827,835,810,870)
dato<-data.frame(ciudad,sucursal,cuentas)

dato.aov<-aov(cuentas~sucursal%in%ciudad+ciudad,data=dato)
summary(dato.aov)
Diseño Anidado
Df Sum Sq Mean Sq F value Pr(>F)
Ciudad 2 291204 145602 512.254 8.09e-14 ***
Sucursal:Ciudad 4 3583 896 3.152 0.0482 *
Residuals 14 3979 284
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01
‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Diferencias entre Ciudades
model.tables(dato.aov,"means")
Tables of means datoc.aov<-aov(cuentas~ciudad,data=dato)
Grand mean prueba.ciudad<-TukeyHSD(datoc.aov)
prueba.ciudad
1009.048 Tukey multiple comparisons of means
95% family-wise confidence level
ciudad
1 2 3 Fit: aov(formula = cuentas ~ ciudad, data
1136 1041 833.7 = dato)
rep 6 9 6.0
$ciudad
sucursal:ciudad diff lwr upr p adj
ciudad 2-1 -95.5000 -123.0717 -67.92832 2e-07
sucursal 1 2 3 3-1 -302.8333 -333.0366 -272.63007 0e+00
1 1151.7 1055.3 829.0 3-2 -207.3333 -234.9050 -179.76166 0e+00
rep 3.0 3.0 3.0
2 1121.3 1047.7 838.3
rep 3.0 3.0 3.0
3 1020.0
rep 0.0 3.0 0.0
Diferencias entre Sucursales dentro de las Ciudades

dato1<-subset(dato,ciudad==1)
dato2<-subset(dato,ciudad==2)
dato3<-subset(dato,ciudad==3)

dato1.aov<-aov(cuentas~sucursal,data=dato1)
prueba1.sucursal<-TukeyHSD(dato1.aov)
prueba1.sucursal
Tukey multiple comparisons of means
95% family-wise confidence level

Fit: aov(formula = cuentas ~ sucursal, data = dato1)

$sucursal
diff lwr upr p adj
2-1 -30.33333 -39.49517 -21.17149 0.0007802
Diferencias entre Sucursales dentro de las Ciudades

dato2.aov<-aov(cuentas~sucursal,data=dato2)
prueba2.sucursal<-TukeyHSD(dato2.aov)
prueba2.sucursal

Tukey multiple comparisons of means


95% family-wise confidence level

Fit: aov(formula = cuentas ~ sucursal, data = dato2)

$sucursal
diff lwr upr p adj
2-1 -7.666667 -25.12360 9.79027 0.4227111
3-1 -35.333333 -52.79027 -17.87640 0.0019524
3-2 -27.666667 -45.12360 -10.20973 0.0067324
Diferencias entre Sucursales dentro de las Ciudades

dato3.aov<-aov(cuentas~sucursal,data=dato3)
prueba3.sucursal<-TukeyHSD(dato3.aov)
prueba3.sucursal
Tukey multiple comparisons of means
95% family-wise confidence level

Fit: aov(formula = cuentas ~ sucursal, data = dato3)

$sucursal
diff lwr upr p adj
2-1 9.333333 -58.88947 77.55613 0.7233723
Diseño anidado general en
m etapas.
Si un diseño presenta m factores completamente
anidados, a este se le llama diseño anidado de m
etapas.
 Modelo:
Yijkl =  + i + j(i) + k(ij) + (ijk)l

Ejemplo de un diseño general de tres etapas:


ANOVA
Diseño con factores
anidados y factoriales.
 Modelo:
Yijkl =  + i + j + k(j) + ()ij + ()ik(j) + (ijk)l
: la media global
i: el efecto del nivel i-ésimo del factor A; (i = 1, 2, …, a)
 j: el efecto del nivel j-ésimo del factor B; (i = 1, 2, …, b)
k(j): el efecto producido por el nivel k-ésimo del factor C dentro del nivel j-ésimo
del factor B, (j = 1, 2, …, c)
()ij: el efecto producido por la interacción A x B
()ik(j): el efecto producido por la interacción del factor A x C dentro del factor B
l = 1, 2, …, n, donde n es el número de réplicas.
(ijk)l : es el error experimental, independiente y con N(0,σ2)
N : número de observaciones, donde: N = a x b x c x n
Nota: Como C está anidado en B, entonces no existen las interacciones B x C ni A x
B x C. A está cruzado con B y C, entonces puede existir interacción entre A x B y A x
SCE
ANOVA

CME

CME
SCE abc(n-1) CME
abcn – 1
Ejemplo 3:
En un experimento se trata de mejorar la rapidez de
ensamblaje en una línea de producción, para ello se estudia
la intersección manual de componentes electrónicos en
circuitos impresos. Se diseñan tres aparatos para ensamblar
y dos distribuciones del lugar de trabajo. Se requiere que los
operadores realicen el ensamblaje y se decide seleccionar a
cuatro para cada combinación aparato distribución.
Sin embargo, no se pueden probar a los mismos cuatro
operadores en cada distribución de lugar de trabajo debido a
que los lugares de trabajo están en diferentes localidades
dentro de la planta. Por lo tanto, los cuatro operadores de la
distribución 1 son diferentes a los de la distribución 2. Se
obtienen aleatoriamente dos réplicas de cada combinación
de tratamientos de este diseño.
Los tiempos de ensamblaje se muestran en la siguiente tabla:
Sintaxis en R
aparato<-c(rep(1,16), rep(2,16),rep(3,16))
distribucion<-rep(c(rep(1,8),rep(2,8)),3)
operario<-rep(c(rep(1,2),rep(2,2),rep(3,2),rep(4,2)),6)
replica<-rep(c(1,2),24)

tiempo<-c(22,24,23,24,28,29,25,23,26,28,27,25,28,25,24,23,
30,27,29,28,30,32,27,25,29,28,30,27,24,23,28,30,
25,21,24,22,27,25,26,23,27,25,26,24,24,27,28,27)

aparato<-as.factor(aparato)
distribucion<-as.factor(distribucion)
operario<-as.factor(operario)
dato<-data.frame(aparato,distribucion,operario,tiempo)

dato.aov<-aov(tiempo~(operario+aparato*operario)%in%distribucion +
(aparato + distribucion)^2,data=dato)
Df Sum Sq Mean Sq F value Pr(>F)
aparato 2 82.79 41.40 17.741 1.86e-05 ***
distribucion 1 4.08 4.08 1.750 0.19834
operario:distribucion 6 71.92 11.99 5.137 0.00161 **
aparato:distribucion 2 19.04 9.52 4.080 0.02983 *
operario:aparato:distribucion 12 65.83 5.49 2.351 0.03604 *
Residuals 24 56.00 2.33
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

You might also like