You are on page 1of 16

Diseño,

Planificación, Análisis
organización y estadístico
ejecución
(productos: datos)

Modelo causal
Diseño completo al azar con un solo
factor, ANOVA de una vía

Factor (X) Y

Error

Modelo causal
Diseño factorial, ANOVA de dos vías

Factor A

Factor B Y

Error
Análisis de varianza de dos factores

Bibliografía
 Montgomery, D. y Runger, G. (2005) Probabilidad y estadística aplicadas a la ingeniería. México, D.F.:
Limusa Wiley. Capítulo 13. Sección 13.1 y 13.4
 Triola, M. (2013). Estadística. 11va. Edición. Pearson Educación, México, D.F. Capítulo 12. Sección 12.3 y
12.4.

El análisis de varianza (ANOVA) de dos factores es una técnica estadística utilizada para analizar la influencia
de dos factores en una variable de interés. Los dos factores pueden ser cualquier cosa que se desee
investigar, como tratamientos diferentes, temperaturas, grupo de edad, ciudad de residencia, etc.

El ANOVA de dos factores permite examinar el efecto de cada factor individualmente, así como el efecto de
la interacción entre los dos factores. La interacción entre los factores se refiere a si el efecto de un factor
varía según el nivel del otro factor.

Hipótesis inicial en un diseño factorial

H 0 ≔ No existe interacción entre los niveles de los factores sobre la variable respuesta
H 1 ≔ Existe interacción entre los niveles de los factores sobre la variable respuesta
Para obtener el valor del estadístico de prueba, se debe elaborar la tabla del ANOVA.

Fuente de Grados de Suma de Cuadrado


Fcal
variación libertad cuadrados medio
SC ( A) CM ( A)
A a−1 SC( A) CM(A)=
a−1 CME
SC (B) CM ( B)
B b−1 SC(B) CM(B)=
b−1 CME
SC( AB) CM ( AB)
AB (a−1)(b−1) SC( AB ) CM(AB)=
( a−1 )( b−1 ) CME
SCE
Error ab (n – 1) SCE CME=
ab ( n−1 )
Total abn−1 SCT

Fuente de Grados de Cuadrado


Suma de cuadrados Fcalculado Fcrítico
variación libertad medio
a 2
1 y SC ( A) CM ( A)
Factor A a–1 ∑
bn i=1
y 2i ..− …
abn a−1 CME
F α ; a−1; ab (n−1)

b 2
1 y… SC ( B) CM ( B)
Factor B b–1 ∑
an j=1
2
y . j .−
abn b−1 CME
F α ; b−1; ab (n−1)

a b 2
1 y
Interacción
(a – 1)(b – 1) ∑ ∑
n i=1 j=1
y 2ij . − …
abn
SC( AB ) CM ( AB)
F α ; (a−1) ( b−1) ;ab (n−1)
AxB ( a−1 )( b−1 ) CME
SC(Subtotales) – SCA −SCB

SCE
Error ab (n – 1) SCT – SC ( A) – SC( B)– SC ( AB)
ab ( n−1 )
a b n 2
y
Total abn – 1 ∑ ∑ ∑ y 2ijk− abn…
i=1 j=1 k=1
Ejercicios

1. La pregunta de investigación es: ¿Qué factores influyen en la mayor conservación del queso?

a. A partir de revisar el siguiente video sobre la conservación de queso: Trucos para conservar quesos

b. Discuta con sus compañeros e indique al menos dos factores que puede incluirse en la hipótesis de
investigación.

c. Complete los elementos del diseño experimental.

Factor A Tipo de queso

Niveles del factor A Fresco (F), Tierno (T) y Curado (C)

Factor B Modo de conservación


M1: Nevera, recipiente y papel toalla
Niveles M2: Nevera y papel aluminio
M3: Papel horno y sitio fresco con poca luz
Tratamientos FM1, FM2, FM3, TM1, TM2, TM3, CM1, CM2, CM3,
Número de a=3, b=3
tratamientos axb= 3x3= 9 tratamientos
Duración hasta que muestre el primer signo de conservación
Variable respuesta
Tiempo de vida del queso
Unidad experimental Trozo de queso

Modelo matemático

Hipótesis estadística

H1: Existe interacción entre los niveles del queso y los niveles del modo de
H1:
conservación que impactan en el tiempo de vida del queso
2. Un ingeniero sospecha que el tipo de pintura tapa poros y el método de
aplicación afectan el tiempo de duración de la pintura de las piezas de
las aeronaves. Él está interesado en determinar si algún tipo de pintura
con algún nivel del método de aplicación influyen en el tiempo de
duración de la pintura de las piezas de las aeronaves . Idea dos
experimentos, obteniendo las siguientes gráficas.

¿En cuál de las gráficas se logra apreciar el interés del ingeniero?

Se puede presentar cualesquiera de las dos situaciones siguientes:

Sin interacción Con interacción

Hipótesis inicial en un diseño factorial

H 0 : No existe interacción entre los niveles de los factores sobre la variable respuesta
H 1 : Existe interacción entre los niveles de los factores sobre la variable respuesta
Ejemplo 1
Se lleva a cabo un experimento para estudiar el efecto de la temperatura y tipo de horno sobre la vida de un
componente. En el experimento se utiliza cuatro tipos de horno y tres niveles de temperatura. Se asignaron
de forma aleatoria 36 de estos componentes, tres a cada combinación de tratamiento y se registró los
siguientes resultados.

Temperatura (grados) H1 H2 H3 H4
227 214 225 260
500 221 259 236 229
225 265 230 258
187 181 232 246
550 208 179 198 273
198 195 200 285
174 198 178 206
600 202 194 213 219
201 195 212 210

Analice los datos a un nivel de 5% de significación.

Solución
El modelo aditivo es:

Y ijk =μ+τ i + β j + ( τβ )ij +ε ijk

Analizando los supuestos del modelo

Supuesto 1: Normalidad de errores

H 0: Los errores sí provienen de una población normal


H 1: Los errores no provienen de una población normal

α =0,05
Del resultado de Minitab, se tiene que:

Prueba Anderson Darling => AD= 0.448

valor p = 0.264

Criterio de rechazo y no rechazo


Si el valor p ≤ α ; entonces, se rechaza H 0
Si el valor p > α ; entonces, no se rechaza H 0

Decisión
Como el valor p = 0.264 es mayor al nivel de significancia α =0,05 ; entonces, no se rechaza H 0

Conclusión
Con 5 % de nivel de significación, la evidencia muestral es insuficiente para descartar que los errores
provienen de una población normal. Por lo tanto, se asume que se cumple el supuesto.

Supuesto 2: Homogeneidad de varianzas

H 0: Los errores tienen la misma varianza en cada una de las poblaciones (es sinónimo “tratamientos”)
H 1: Al menos una varianza es diferente

α =0,05
Pruebas
Estadística
Método de prueba Valor p
Bartlett 16.22 0.133

Del resultado de Minitab, se tiene que:

Prueba de Barlett = 16.22,

Valor p = 0.133

Criterio de rechazo y no rechazo


Si el valor p ≤ α ; entonces, se rechaza H 0
Si el valor p > α ; entonces, no se rechaza H 0

Decisión
Como el valor p = 0.133 es mayor al nivel de significancia α =0,05 ; entonces, no se rechaza H 0

Conclusión
Con 5 % de nivel de significación, la evidencia muestral es insuficiente para descartar que las varianzas de los
errores en cada población son las mismas. Por lo tanto, se asume que se cumple el supuesto.

Analizando la interacción

H 0: La interacción de los niveles de temperatura en cada tipo de horno no impacta en la vida útil
H 1: La interacción de los niveles de temperatura en cada tipo de horno sí impacta en la vida útil

α =0,05

CMAB
F cal= F(6,24) / H 0 cierto
CME

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Temperatura 2 8431 4215.3 18.29 0.000
Horno 3 8050 2683.3 11.65 0.000
Temperatura*Horno 6 5984 997.4 4.33 0.004
Error 24 5530 230.4
Total 35 27995

De la tabla de análisis de varianza tenemos que:

F cal=4.33

valor p=0.004

Criterio de rechazo y no rechazo


Si el valor p ≤ α ; entonces, se rechaza H 0
Si el valor p > α ; entonces, no se rechaza H 0

Decisión
Como el valor p = 0.004 es menor al nivel de significancia α =0,05 ; entonces, se rechaza H 0

Conclusión
Con 5 % de nivel de significación, la evidencia muestral es suficiente para afirmar que La interacción de los
niveles de temperatura en cada tipo de horno sí impacta en la vida útil de dicho componente.

Comparando los tratamientos en pares

Agrupar información utilizando el método de Tukey y una confianza de 95%


Temperatura*Horno N Media Agrupación
550 H4 3 268.000 A
500 H4 3 249.000 A B
500 H2 3 246.000 A B
500 H3 3 230.333 A B C
500 H1 3 224.333 A B C D
600 H4 3 211.667 B C D
550 H3 3 210.000 B C D
600 H3 3 201.000 C D
550 H1 3 197.667 C D
600 H2 3 195.667 C D
600 H1 3 192.333 C D
550 H2 3 185.000 D

Las medias que no comparten una letra son significativamente diferentes.

La mejor combinación es el tratamiento temperatura 550 grados y horno 4, en cuyo caso, la vida media estos
componentes es superior (268.000) al resto de combinaciones y está sola en la agrupación A.
Ejercicios

3. Tecno Gas S.A. es una empresa que fabrica y comercializa termas a gas para uso doméstico e industrial.
La terma a gas es un artefacto calentador de agua que funciona de forma continua mediante la
combustión de gas.

Su planta de producción está ubicada en la ciudad del Callao y sus productos se comercializan a través de
sus locales de venta y centros comerciales ubicados en Lima y provincias. Constantemente está
mejorando su tecnología para producir termas a gas a un precio competitivo y de primerísima calidad,
reduciendo al mínimo las fallas y reclamos de los clientes.
El jefe del departamento de ingeniería está interesado en determinar si hay influencia del turno de
producción y la capacidad de las termas en el porcentaje de termas con defecto.
Para esto diseñó un experimento factorial con tres niveles del turno de producción y tres niveles de la
capacidad de las termas, obteniendo la siguiente información:

Capacidad
Turno de producción
10 litros 14 litros 18 litros
3.8 5.5 4.5
Mañana (M) 4.0 5.0 4.0
4.2 4.8 4.2
4.5 5.0 3.8
Tarde (T) 4.2 5.3 4.0
4.8 5.8 3.5
5.0 6.0 3.8
Noche (N) 4.5 5.8 4.0
5.2 5.5 4.1

¿Qué capacidad de terma o turno de producción debe elegir jefe de departamento de ingeniería, para
obtener menor porcentaje de termas con defectos? Realice el análisis con un nivel de significación del
5%.

a. Complete los siguientes elementos del experimento.

Objetivo: Determinar cuál combinación de capacidad de la y turno de producción debe elegir el


jefe de departamento de ingeniería obtener un menor porcentaje de termas con defectos.
Entonces se diseña, planifica, organiza un experimento de dos factores:

Variable respuesta, Y Porcentaje de termas con defectos


Factor A Turno de producción
Niveles del Factor A M, T, N
Factor B Capacidad de la terma
Niveles del Factor B 10L, 14L, 18L
Tratamientos M10L, M14L, M18L, T10L, T14L, T18L, N10L, N14L, N18L
Unidad experimental Una muestra de termas
Número de réplicas por tratamiento 3
Y ijk =μ+τ i + β j + ( τβ )ij +ε ijk
Modelo
i=1, 2, 3; j=1, 2,3; k=1,2,3
Hipótesis alterna, H1 Existe interacción entre el turno de producción y la
capacidad de la terma que impacta en el porcentaje de
termas defectuosas

El proceso de análisis implica lo siguiente:

Comprobación de supuestos, antes se corre el modelo y se estima los errores:

b. Prueba de supuestos.

Prueba Anderson Darling Prueba de Barlett EP = 2,34


AD = 0,327 Valor – p = 0,969
Valor – p = 0,505
Generando las salidas para la prueba de normalidad

… y para la homogeneidad de varianzas


Tests
Test
Method Statistic P-Value
Bartlett 2.34 0.969

Supuesto1: Normalidad de errores


Ho: Los errores sí provienen de una población normal
H1: Los errores no provienen de una población normal
=0.05
Prueba Anderson Darling => AD= 0.327, Valor p = 0.505

Criterio de rechazo y no rechazo


Si valor p ≤ 0.05  Se rechaza H0
Si valor p > 0.05  No se rechaza H0
Decisión: Como valor p=0.505 > 0.05  No se rechaza Ho
Conclusión: Con 5 % de nivel de significación, la evidencia muestral es insuficiente para descartar que los
errores provienen de una población normal. Por lo tanto, se asume que se cumple el supuesto.

Supuesto2: Homogeneidad de varianzas


Ho: Los errores tienen la misma varianza en cada una de las poblaciones (es sinónimo “tratamientos”)
H1: Al menos una varianza es diferente
Otra forma de expresar lo mismo es:
H0: 
H1: Al menos un i≠jpara todo i≠j
=0.05
Prueba de Barlett= 2.34, Valor p=0.969

Criterio de rechazo y no rechazo


Si valor p ≤ 0.05  Se rechaza H0
Si valor p > 0.05  No se rechaza H0
Decisión: Como valor p=0.969 > 0.05 No se rechaza Ho
Conclusión: Con 5 % de nivel de significación, la evidencia muestral es insuficiente para descartar que las
varianzas de los errores en cada población son las mismas. Por lo tanto, se asume que se cumple el
supuesto.

El siguiente paso es evaluar la hipótesis de interacción de los factores turno y


capacidad de la terma.

c. Complete la siguiente tabla de análisis de varianza.


Las hipótesis de interacción son:

Ho: No existe interacción entre el turno de producción y la capacidad de la terma que impacta en el
porcentaje de termas defectuosas
H1: Sí existe interacción entre el turno de producción y la capacidad de la terma que impacta en el
porcentaje de termas defectuosas
=0.05
CMAB
F cal= F(4,18) / H 0 cierto
CME

Se sabe que a=3, b=3, n=3

Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Turno 2 0.9267 0.46333 5.44 0.014
Capacidad 2 9.4289 4.71444 55.34 0.000
Turno*Capacidad 4 1.2978 0.32444 3.81 0.021
Error 18 1.5333 0.08519
Total 26 13.1867

Fuentes de
Gl SC CM Fcal Ftab
variación
A 2 0.9267 0.4633 5.44 3.55
B 2 9.4289 4.7144 55.34 3.55
AB 4 1.2978 0.3244 3.81 2.93
Error 18 1.5333 0.0852
Total 26 13.1867

d. Complete la siguiente la siguiente gráfica e indique la decisión.

α =0,05

2.93 Fcal=3.81
Los criterios de rechazo y no rechazo son:
Si Fcal ≤ 2.93  No se rechaza Ho
Si Fcal > 2.93  Sí se rechaza Ho

Como el valor del estadístico de prueba Fcal =3.81 > el valor crítico Fcrítico = 2.93  se rechaza Ho

Conclusión
Con 5% de nivel de significación, la evidencia muestral es suficiente para afirmar Sí existe
interacción entre el turno de producción y la capacidad de la terma que impacta en el
porcentaje de termas defectuosas

La pregunta final era: ¿Qué capacidad de terma o turno de producción debe elegir jefe de
departamento de ingeniería, para obtener menor porcentaje de termas con defectos?

Como se ha demostrado que la interacción es significativa entonces se debe correr la prueba de


comparaciones múltiples de Tukey para la interacción
El siguiente reporte proviene del programa Minitab:

Agrupar información utilizando el método de Tukey y una confianza de 95%

Turno*Capacidad N Media Agrupación


Noche 14 L 3 5.76667 A
Tarde 14 L 3 5.36667 A B
Mañana 14 L 3 5.10000 A B C
Noche 10 L 3 4.90000 B C D
Tarde 10 L 3 4.50000 C D E
Mañana 18 L 3 4.23333 D E
Mañana 10 L 3 4.00000 E
Noche 18 L 3 3.96667 E
Tarde 18 L 3 3.76667 E
Las medias que no comparten una letra son significativamente diferentes.

Conclusión de la gráfica
Lo que busca es minimizar el porcentaje de termas defectuosas
Observando la tabla anterior, se aprecia que el bloque de tratamientos E son los que brindan un menor
porcentaje promedio de termas defectuosas.
Seleccionando a los tratamientos del bloque E que no tienen traslape con otro bloque, nos quedamos con los
tratamientos M1OL, N18L o T18L.

Tukey Simultaneous Tests for Differences of Means


Difference of Difference SE of Simultaneous 95% Adjusted
Turno*Capacidad Levels of Means Difference CI T-Value P-Value
(M 14L) - (M 10L) 1.100 0.238 (0.264, 1.936) 4.62 0.005
(M 18L) - (M 10L) 0.233 0.238 (-0.602, 1.069) 0.98 0.983
(N 10L) - (M 10L) 0.900 0.238 (0.064, 1.736) 3.78 0.029
(N 14L) - (M 10L) 1.767 0.238 (0.931, 2.602) 7.41 0.000
(N 18L) - (M 10L) -0.033 0.238 (-0.869, 0.802) -0.14 1.000
(T 10L) - (M 10L) 0.500 0.238 (-0.336, 1.336) 2.10 0.503
(T 14L) - (M 10L) 1.367 0.238 (0.531, 2.202) 5.73 0.001
(T 18L) - (M 10L) -0.233 0.238 (-1.069, 0.602) -0.98 0.983
(M 18L) - (M 14L) -0.867 0.238 (-1.702, -0.031) -3.64 0.039
(N 10L) - (M 14L) -0.200 0.238 (-1.036, 0.636) -0.84 0.994
(N 14L) - (M 14L) 0.667 0.238 (-0.169, 1.502) 2.80 0.183
(N 18L) - (M 14L) -1.133 0.238 (-1.969, -0.298) -4.76 0.004
(T 10L) - (M 14L) -0.600 0.238 (-1.436, 0.236) -2.52 0.286
(T 14L) - (M 14L) 0.267 0.238 (-0.569, 1.102) 1.12 0.963
(T 18L) - (M 14L) -1.333 0.238 (-2.169, -0.498) -5.60 0.001
(N 10L) - (M 18L) 0.667 0.238 (-0.169, 1.502) 2.80 0.183
(N 14L) - (M 18L) 1.533 0.238 (0.698, 2.369) 6.43 0.000
(N 18L) - (M 18L) -0.267 0.238 (-1.102, 0.569) -1.12 0.963
(T 10L) - (M 18L) 0.267 0.238 (-0.569, 1.102) 1.12 0.963
(T 14L) - (M 18L) 1.133 0.238 (0.298, 1.969) 4.76 0.004
(T 18L) - (M 18L) -0.467 0.238 (-1.302, 0.369) -1.96 0.587
(N 14L) - (N 10L) 0.867 0.238 (0.031, 1.702) 3.64 0.039
(N 18L) - (N 10L) -0.933 0.238 (-1.769, -0.098) -3.92 0.022
(T 10L) - (N 10L) -0.400 0.238 (-1.236, 0.436) -1.68 0.751
(T 14L) - (N 10L) 0.467 0.238 (-0.369, 1.302) 1.96 0.587
(T 18L) - (N 10L) -1.133 0.238 (-1.969, -0.298) -4.76 0.004
(N 18L) - (N 14L) -1.800 0.238 (-2.636, -0.964) -7.55 0.000
(T 10L) - (N 14L) -1.267 0.238 (-2.102, -0.431) -5.32 0.001
(T 14L) - (N 14L) -0.400 0.238 (-1.236, 0.436) -1.68 0.751
(T 18L) - (N 14L) -2.000 0.238 (-2.836, -1.164) -8.39 0.000
(T 10L) - (N 18L) 0.533 0.238 (-0.302, 1.369) 2.24 0.424
(T 14L) - (N 18L) 1.400 0.238 (0.564, 2.236) 5.87 0.000
(T 18L) - (N 18L) -0.200 0.238 (-1.036, 0.636) -0.84 0.994
(T 14L) - (T 10L) 0.867 0.238 (0.031, 1.702) 3.64 0.039
(T 18L) - (T 10L) -0.733 0.238 (-1.569, 0.102) -3.08 0.112
(T 18L) - (T 14L) -1.600 0.238 (-2.436, -0.764) -6.71 0.000

Individual confidence level = 99.75%

Otra situación diferente:


Si hubiera salido el siguiente reporte como resultado del caso anterior: ¿Qué capacidad de terma o
turno de producción debe elegir jefe de departamento de ingeniería, para obtener menor porcentaje
de termas con defectos?

Agrupar información utilizando el método de Tukey y una confianza de 95%

Turno*Capacidad N Media Agrupación


Noche 14 L 3 5.76667 A
Tarde 14 L 3 5.36667 A B
Mañana 14 L 3 5.10000 A B C
Noche 10 L 3 4.90000 B C D
Tarde 10 L 3 4.50000 C D
Mañana 18 L 3 4.23333 D
Mañana 10 L 3 4.00000 D
Noche 18 L 3 3.76667 E
Tarde 18 L 3 3.56667 E
Las medias que no comparten una letra son significativamente diferentes.

4. Al pesar un reactivo en un laboratorio aparecen diferencias debidas a las balanzas usadas y a la habilidad
del personal que realizan las mediciones. Se elige tres balanzas y tres técnicos de laboratorio, los
resultados de las mediciones, en gramos, se muestran a continuación.

Personal
Balanza 1 2 3
1.81 2.04 2.03
1 1.91 1.97 1.98
1.91 1.99 1.94
1.94 2.08 2.03
2 1.90 2.14 1.98
1.99 2.08 2.00
1.83 1.98 1.91
3 1.92 2.05 2.06
1.96 2.03 2.04

a. ¿Puede asegurarse al nivel de significación α =0,05 que hay habilidad homogénea de todos los
técnicos del laboratorio?
b. ¿Existe interacción entre los factores? Use α =0,05 .
c. Analice los supuestos del modelo. Use α =0,05 .
d. Encuentre el(los) mejor(es) procedimiento(s).

You might also like