You are on page 1of 16

ESTADISTICA III

RICK VEGA ACOSTA

UNIVERSIDAD DEL MAGDALENA
FACULTAD DE INGENIERÍA
PROGRAMA DE INGENIERÍA INDUSTRIAL
SANTA MARTA (D.T.C.H)
2017

o la presencia o ausencia de alguna sustancia? . -Permiten estudiar el efecto individual y de interacción de los distintos factores. c) Ejemplifique y explique en qué consiste la estrategia de modificar o mover un factor a la vez. lo que significa que no es el mejor tratamiento f) ¿Todos los factores deben ser de tipo cuantitativo o es posible involucrar factores cualitativos. para obtener así la condición óptima. lo que se busca es estudiar la relación entre los factores y la respuesta. por ejemplo dos tipos de máquinas. con la finalidad de conocer mejor cómo es esta relación y generar conocimiento que permita tomar acciones y decisiones que mejoren el desempeño del proceso. b) ¿Cuál es el objetivo de un diseño factorial? El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre una o varias respuestas o características de calidad. realizar las corridas que quiera con ambos niveles. -Se pueden correr fracciones de diseños factoriales. e) ¿Qué significa que un factor tenga un efecto significativo? ¿Sobre quién es el efecto? Significa que en interacción con otro factor su significancia es negativa y esto recae en la variable de respuesta. En un diseño factorial 2𝑘 los factores simbolizan el exponente k y corresponden a los valores estudiados o controlados por el experimentador para analizar su efecto en la variable de respuesta. de índole general. es decir. -Pueden utilizarse en combinación con diseño de bloques en situaciones en las que no puede correrse todo el diseño factorial bajo las mismas condiciones. con respecto a los diseños factoriales: a) Explique qué son los factores y qué es la(s) variable(s) de respuesta. Consiste en elegir el primer factor. TALLER 3 ESTADISTICA III ING. Preguntas 1. quien a su vez es la variable de interés de la cual se desea conocer la variación cuando se realicen ciertas variaciones en los factores. Conteste las siguientes preguntas. las cuales son de gran utilidad cuando se involucran muchos factores para descartar de manera económica los que no son importantes. d) Señale y argumente qué ventajas tienen los experimentos factoriales sobre la estrategia de mover un factor a la vez. RICK ACOSTA VEGA TEMA: DISEÑO 2K I. que es propia de la experimentación empírica.

) . . . B 20 7 + + + AB c) Represente en forma geométrica al diseño y resalte la región de experimentación.). 8 8. 4 0 4 8 12 16 20 d) Explique cómo piensa que fue el proceso para seleccionar esos factores y esos niveles. + . o de tipo cuantitativo (temperatura. operador. 7 20. humedad. 7 4 8. los factores en estos diseños pueden ser de tipo cualitativo (máquinas. A 8 7 . Si es posible. 2. La variable de respuesta es rendimiento. etc. + 1 20 4 + . la presencia o ausencia de una operación previa. 7). cuyos factores y niveles son: temperatura (8. velocidad. Los factores se eligen porque su comportamiento se considera clave en el proceso y estos niveles son críticos. etc. . 4 20. 20) y velocidad (4. Suponga un diseño factorial 22 . Utilice diferentes tipos de códigos. e) Defina qué son los efectos principales y cuál el efecto de interacción. TEMPERATURA VELOCIDAD A B AB CODIGO 8 4 . b) Anote los diferentes tratamientos que forman este diseño. presión. Conteste las siguientes preguntas: a) ¿Por qué este diseño recibe tal nombre? El diseño recibe el nombre porque tiene dos factores y dos niveles. tipos de material.

-La factorización del diseño. Matemáticamente el efecto principal de un factor es la diferencia entre la respuesta media observada cuando tal factor estuvo en su nivel más alto y la respuesta media observada cuando el factor estuvo en su nivel más bajo. en este caso. Por otro lado. Ejercicios 1. Se ha tenido el problema de que la máquina falla en sus intentos por tomar el . -Aleatorizar “Aleatorizar todos los factores no controlados por el experimentador en el diseño experimental y que pueden influir en los resultados serán asignados al azar a las unidades experimentales”. II. “Un diseño factorial es una estrategia experimental que consiste en cruzar los niveles de todos los factores tratamiento en todas las combinaciones posibles”. A diferencia de lo que ocurre con los factores tratamiento. EJERCICIO En una empresa de electrónica una máquina toma componentes que le proporciona un alimentador. para montarlos o depositarlos en una tarjeta.El efecto de un factor se define como el cambio observado en la variable respuesta debido a un cambio de nivel de tal factor. -Bloquear “Se deben dividir las unidades experimentales en grupos llamados bloques de modo que las observaciones realizadas en cada bloque se realicen bajo condiciones experimentales lo más parecidas posibles. se dice que dos factores interactúan entre sí o que tienen un efecto de interacción sobre la variable respuesta. Esto se logra con las siguientes ecuaciones: 𝑪𝑶𝑵𝑻𝑹𝑨𝑺𝑻𝑬 𝑨 𝑬𝑭𝑬𝑪𝑻𝑶 𝑨 = 𝒏𝟐𝒌−𝟏 g) Describa en qué consiste la aplicación de los tres principios básicos del diseño de experimentos (capítulo 1). cuando el efecto de un factor depende del nivel en que se encuentra el otro. son los cambios en la media de la variable respuesta debido a la acción individual de cada factor. el experimentador no está interesado en investigar las posibles diferencias de la respuesta entre los niveles de los factores bloque”. En este ejercicio se pueden analizar los efectos principales que son la temperatura y la velocidad y la interacción entre ambos. f) Señale los diferentes efectos que se pueden estudiar con este diseño y la forma en que se calcula cada uno. En particular los efectos principales.

componente. alta). alguien muy “práctico” decidiría poner la máquina a operar bajo estas condiciones. lo cual causa paros de la máquina que detienen el proceso hasta que el operador se da cuenta y reinicia el proceso. cada una de las corridas experimentales consistió en colocar 500 componentes. D) Alimentador (1. 2). c) Obtenga el mejor ANOVA. 100%). por ello. –1. en el que se tienen los siguientes factores y niveles (–. Para diagnosticar mejor la situación. Se consideró que esto se lograba con suficiente confianza con 500 componentes. +1. y olvidarse del análisis estadístico. Como el proceso es muy rápido. De proceder así. explique qué información se perdería. b) Investigue qué efectos influyen de manera significativa sobre Y1 (apóyese en Pareto y ANOVA). como por ejemplo el (–1. +). C) Orden o secuencia de colocación (continua. Es evidente que se quiere minimizar ambas variables. +1). B) Velocidad de mesa (media. . y se midieron dos variables de respuesta: Y1 = número de errores (o intentos fallidos). a) Al observar los datos obtenidos se deduce que hay algunos tratamientos que tienen pocos o ningún componente caídos. y Y2 = tiempo real (en segundos) para tomar y “colocar” los 500 componentes. variable). Los datos obtenidos se muestran en la siguiente tabla. se decide correr un diseño de experimentos 24 con n = 2 réplicas. es necesario dejarlo operar en cada condición experimental el tiempo suficiente para reproducir el problema. respectivamente: A) Velocidad de cam (70%.

0 1 8.0 1 2.0001 Error total 11372.9766 AC 666. analice con detalle la más importante e interprete en términos físicos. Esta afirmación la podemos comparar con diagrama de Pareto el cual ordena los factores de menor a mayor magnitud en valor absoluto lo que indica que el factor alimentador y el factor orden son los más significativos.0414 D:ALIMENTADOR 3042. No existe ninguna interacción significativa.7367 bloques 13122.59 0.0 1 338.125 1 66.01 0.08 0.5 31 Esta tabla muestra que el valor-P para el alimentador y el orden de colocación son menores que el valor de significancia α= 0.5 0.13 1 2701.1388 B:VELOCIDAD DE MESA 338.7587 BD 2. c) Si en el análisis anterior encuentra alguna interacción significativa.0 23.0 2.0 0.00 0. por lo cual estos factores influyen significativamente en la variable de respuesta de estudio que en este caso es el número de errores en la máquina.0 1 1352.05.0 0.9533 CD 66.13 4.4497 C:ORDEN 2701.35 0.0 1 3042.75 0.2920 AD 8.17 0.125 0.12 0.El mejor ANOVA se construyó de orden 2 y queda de la siguiente forma: Análisis de Varianza para NUMERO DE ERRORES Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P A:VELOCIDAD DE CAM 1352.125 1 55.0315 AB 0.00 0.125 1 666.9068 BC 55.0 0.625 Total (corr.5 20 568.0 5.125 0. .125 1.5 1 0.0 1 13122.) 32725.38 0.10 0.

5977 BC 3.6 Total (corr. la velocidad de mesa en nivel bajo.0 1.0 0. el orden en nivel alto y el alimentador en nivel alto. e) Ahora investigue qué efectos influyen de manera relevante sobre Y2. .125 0.0 1.6396 BCD 18.82 0.0 15 832.0 12.125 1 3.0312 AB 480.) 33939.125 0.0 VELOCIDAD DE MESA -1.80 0. Se tomó un diseño máximo de 4 Análisis de Varianza para TIEMPO REAL Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P A:VELOCIDAD DE CAM 1176.0027 Error total 12489.7273 CD 45. por lo cual este factor influyen significativamente en la variable de respuesta de estudio que en este caso es el tiempo real.9520 ABD 378.45 0.125 1 3.00 0.1977 AD 242.0 -1.125 0.0 ORDEN -1.0 1 1568.13 0.1901 D:ALIMENTADOR 4704.8851 ABCD 2.9 31 Esta tabla muestra que el valor-P para el alimentador es menor que el valor de significancia α= 0.5106 ACD 190.0 1.8191 ABC 3.02 0.0 Para minimizar el número de errores de debe trabajar la velocidad de cam en nivel bajo.125 0.125 1 105.0 0.9616 bloques 10658.13 1.5 1. d) ¿Qué tratamiento minimiza Y1? Optimizar Respuesta Meta: minimizar NUMERO DE ERRORES Valor óptimo = 37.0 0.0 ALIMENTADOR -1.125 0.125 1 378.4592 AC 1512.05 0.5 1 4704.41 0.0 Factor Bajo Alto Óptimo VELOCIDAD DE CAM -1.0 1.125 0.88 0.0 1 10658.5 1 364.23 0.2531 B:VELOCIDAD DE MESA 364.0 1 18.5 1 480.13 1 1176.44 0.0 1 242.0 1.0 1 2.5 0.5 5.00 0.5 1 1512.125 1 45.0 -1.5 0.9520 BD 105. Esta afirmación la podemos comparar con diagrama de Pareto el cual ordena los factores de menor a mayor magnitud en valor absoluto lo que indica que el factor alimentador es el más significativo.29 0.0 1.0 1.05.58 0.5182 C:ORDEN 1568.65 0.00 0.125 1 190.

2488% PARA EL TIEMPO REAL 𝑅 2 = 63. como se observa la variable número de errores posee mayor variación.0 1.0 1.0 Factor Bajo Alto Óptimo VELOCIDAD DE CAM -1.0 1. ¿Qué concluye de ello? i) PARA EL NUMERO DE ERRORES 𝑅 2 = 65.0 -1.0 1.0 1. f) ¿Qué tratamiento minimiza Y2? Optimizar Respuesta Meta: minimizar TIEMPO REAL Valor óptimo = 39.0 ALIMENTADOR -1. el orden en nivel alto y el alimentador en nivel alto. esto quiere decir que cualquier cambio en los factores influye de mayor manera en ella que en el tiempo real .0 Para minimizar el número de errores de debe trabajar la velocidad de cam en nivel alto.0 ORDEN -1.0 1.2026% El valor 𝑅 2 muestra el porcentaje de variación de la variable de respuesta respecto a la relación con otras variables que en este caso serían los factores. g) Encuentre una condición satisfactoria tanto para minimizar Y1 como Y2.0 1. No es posible encontrar una condición satisfactoria para minimizar ambas variables.0 VELOCIDAD DE MESA -1. la velocidad de mesa en nivel bajo. h) De los análisis de varianza para Y1 y Y2 observe el coeficiente R2.

00 1.3 Total (Corr.) 12489.81899E-12 1 1.0000 Intra grupos 12489.00 1. Tabla ANOVA para C.RESIDUOS por VELOCIDAD DE CAM Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Entre grupos 1.00 1.3 Total (Corr.0 30 416.81899E-12 1 1.j) Verifique residuos. por lo tanto.3 Total (Corr.895559 Debido a que Valor-P es mayor a α= 0.0 30 416.RESIDUOS por ALIMENTADOR Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Entre grupos 1.0 31 Debido a que Valor-P es mayor a α= 0.) 12489. por lo tanto.05 se acepta la hipótesis nula.81899E-12 1 1.81899E-12 0.0 30 416.81899E-12 0. se asume que los residuos por velocidad de cam.) 12489.00 1.81899E-12 0.0000 Intra grupos 12489. Tabla ANOVA para C.0000 Intra grupos 12489. se asume que los residuos por velocidad de mesa tienen igual varianza.RESIDUOS Prueba Estadístico Valor-P Estadístico W de Shapiro-Wilk 0.0 31 Debido a que Valor-P es mayor a α= 0. VERIFICACCION DE SUPUESTOS PARA NUMERO DE ERRORES Ho: Los datos provienen de una distribución normal Ha: Los datos no provienen de una distribución normal Pruebas de Normalidad para C.982716 0. se asume que los residuos por orden tienen igual varianza.RESIDUOS por ORDEN Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Entre grupos 0 1 0 0.05 se acepta la hipótesis nula y asumimos que se cumple el supuesto de normalidad IGUALDAD DE VARIANZA Ho: Los tratamientos tienen igual varianza Ha: Los tratamientos no tienen igual varianza Tabla ANOVA para C.0 31 Debido a que Valor-P es mayor a α= 0.05 se acepta la hipótesis nula. tienen igual varianza.0000 .RESIDUOS por VELOCIDAD DE MESA Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Entre grupos 1. Tabla ANOVA para C.05 se acepta la hipótesis nula. por lo tanto.

2 EJERCICIO En el área de SMT se busca reducir los defectos ocasionados por impresiones de soldadura en pasta inadecuada. se asume que los residuos para el alimentador tienen igual varianza.05 por lo tanto se acepta la hipótesis nula. entonces se recomienda obtener más de un producto en cada condición experimental. por lo tanto. Por ello se decidió que cada prueba experimental debería de consistir en dejar que el proceso se estabilizara y a partir de ahí imprimir 10 tarjetas de manera consecutiva.0 31 Debido a que Valor-P es mayor a α= 0.9425 Valor-P = 0.539096 Valor-P = 0. INDEPENDECIA Ho: Los residuos son independientes entre si Ha: Los residuos no son independientes entre si Prueba de Aleatoriedad de C. y se asume que los residuos son independientes entre sí. para así analizar el efecto de los factores sobre ambas.Intra grupos 12489.3 Total (Corr.589817 (2) Corridas arriba y abajo Número de corridas arriba y abajo = 26 Número esperado de corridas = 21.0 Estadístico z para muestras grandes = 0.62044 Valor-P = 0. Con estos 10 datos se calculó la media y la desviación estándar.0 Número de corridas arriba o abajo de la mediana = 19 Número esperado de corridas = 17. velocidad de impresión (C) y presión de las escobillas (D).) 12489. velocidad de separación (B). a cada tarjeta se le midió la altura. Se corre un diseño 24 con dos réplicas y dos puntos centrales por réplica. La variable de respuesta es la altura de la impresión de soldadura en pasta. Los factores son: altura de la mesa (A). pero como el proceso es muy rápido (la impresión de una tarjeta tarda menos de un minuto).0 30 416.RESIDUOS (1) Corridas arriba o abajo de la mediana Mediana = 0.568464 Luego de realizar las tres pruebas de independencia se determinó que las tres pruebas arrojaron un Valor-P mayor a α= 0. Una vez que se corre en orden aleatorio la primera réplica de todos los .0520767 (3) Prueba Box-Pierce Prueba basada en las primeras 10 autocorrelaciones Estadístico de prueba para muestras grandes = 8.05 se acepta la hipótesis nula. El experimento se corrió en planta.0 Estadístico z para muestras grandes = 1.

tratamientos. no se puede modelar el efecto de esa curvatura en otro lugar que no sea el punto central. El mejor ANOVA se construyó de orden 4 y queda de la siguiente forma: . b) Investigue qué efectos influyen de manera significativa sobre la altura promedio de la pasta (apóyese en Pareto y ANOVA). se deja de experimentar y al día siguiente se hace de manera similar la segunda réplica. Los datos se muestran a continuación: a) ¿Con qué finalidad se utilizan los puntos centrales? Los puntos centrales se usan para evaluar si existe una curvatura en la superficie de respuesta. Sin embargo.

Al analizar la anova obtenida del experimento y el grafico de Pareto los efectos que influyen de manera significativa sobre la altura promedio de la pasta son: Factor A: Altura de la mesa Factor C: Velocidad de impresión Factor D: Presión de las escobillas Interacción AC Interacción AD .

analice a detalle la más importante.0 en la altura de impresión de la pasta el factor de altura de la mesa y la velocidad de impresión deben trabajar en nivel alto. y por el contrario la velocidad de separación y la presión de escobillas deberán trabajar en nivel bajo.0042 lo que nos quiere decir que la altura de la mesa y la velocidad de impresión tienen efectos significativos con respecto a la altura de impresión de soldadura en pasta. d) Si se quiere un valor de 6.0 para la altura de la pasta. Se encontró que la interacción AC presenta una significancia relativa con un P-value de 0. c) Si en el análisis anterior encuentra alguna interacción significativa. e) Ahora investigue qué efectos influyen de manera relevante sobre la variabilidad de la altura de la pasta. ¿cuáles son las condiciones para lograrlo? Si se quiere obtener un valor de 6. .

05 por lo tanto no existe significancia. Factor D: Presión de las escobillas. No existe una condición satisfactoria para minimizar ambas variables. Respuesta: Prueba de normalidad.05 se acepta la hipótesis nula y asumimos que se cumple el supuesto de normalidad Igualdad de varianza .987088 0. Ho: Los datos provienen de una distribución normal Ha: Los datos no provienen de una distribución normal Pruebas de Normalidad para RESIDUOS Prueba Estadístico Valor-P Estadístico W de Shapiro-Wilk 0. h) ¿Hay evidencia de curvatura? No hay evidencias de curvatura debido a que Valor-P es de 0.En la tabla nos muestra que los factores con más relevancia en la variabilidad de la altura de impresión son Factor A: Altura de la mesa. Factor C: Velocidad de impresión.3313% El valor 𝑅 2 muestra el porcentaje de variación de la variable de respuesta respecto a la relación con otras variables que en este caso serían los factores. esto quiere decir que cualquier cambio en los factores influye de mayor manera en ella que en la desviación estandar. ¿Qué concluye de ello? R2 varianza para la media = 93.959378 Debido a que Valor-P es mayor a α= 0. debido a que su P-Value es mucho menor a α= 0.9586 lo cual es mayor que α= 0.9281% R2 varianza para la desviación estándar = 81. i) Verifique residuos. g) De los análisis de varianza para la media y la desviación estándar vea el coeficiente 𝑅 2 .05 f) Encuentre una condición satisfactoria tanto para la altura como para minimizar la variabilidad. como se observa la variable de varianza para las medias posee mayor variación.

55556 Total (Corr. . Tabla ANOVA para PRESION DE ESCOBILLAS por RESIDUOS Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Entre grupos 28.0 35 Debido a que Valor-P es mayor a α= 0.21739 3. por lo tanto.0 35 Debido a que Valor-P es mayor a α= 0.65 0.05 no se acepta la hipótesis nula.0 12 0.6667 12 1.) 32.0153 Intra grupos 2.5897 23 0.3432 Intra grupos 9.0 35 Debido a que Valor-P es mayor a α= 0. por lo tanto.62 0. se asume que los residuos para la velocidad de impresión tienen igual varianza.8459 Intra grupos 14.0 23 1.) 17.3333 23 0.0 35 Debido a que Valor-P es menor a α= 0.22222 Total (Corr. se asume que los residuos por altura de la mesa tienen igual varianza.Ho: Los tratamientos tienen igual varianza Ha: Los tratamientos no tienen igual varianza Tabla ANOVA para ALTURA DE IMPRESION por RESIDUOS Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Entre grupos 15.3333 23 0.985507 1.27 0.777778 Total (Corr. se asume que los residuos para la presión de escobillas no tienen igual varianza.57971 0.753623 0.6667 23 0. por lo tanto.43 0.197778 Total (Corr. Tabla ANOVA para ALTURA DE LA MESA por RESIDUOS Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Entre grupos 22.05 se acepta la hipótesis nula.0118 Intra grupos 4.37 0.) 32.05 se acepta la hipótesis nula. Tabla ANOVA para VELOCIDAD DE IMPRESION por RESIDUOS Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Entre grupos 17.) 32.677814 3. por lo tanto.9631 35 Debido a que Valor-P es menor a α= 0. por lo tanto. Tabla ANOVA para VELOCIDAD DE SEPARACION por RESIDUOS Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Entre grupos 13. se asume que los residuos para la velocidad de separación tienen igual varianza.6667 12 1.33333 12 0. se asume que los residuos por altura de impresión no tienen igual varianza.37333 12 0.333333 Total (Corr.9797 Intra grupos 18.05 se acepta la hipótesis nula.) 32.05 se rechaza la hipótesis nula.

Independencia Ho: Los residuos son independientes entre si Ha: Los residuos no son independientes entre si Prueba de Aleatoriedad de RESIDUOS (1) Corridas arriba o abajo de la mediana Mediana = -0.1837 Valor-P = 0.236531 (2) Corridas arriba y abajo Número de corridas arriba y abajo = 24 Número esperado de corridas = 23. .0 (3) Prueba Box-Pierce Prueba basada en las primeras 12 autocorrelaciones Estadístico de prueba para muestras grandes = 6.0676046 Valor-P = 1.2224 Valor-P = 0.0 Estadístico z para muestras grandes = 1.05 por lo tanto se acepta la hipótesis nula. y se asume que los residuos son independientes entre sí.904459 Luego de realizar las tres pruebas de independencia se determinó que las tres pruebas arrojaron un Valor-P mayor a α= 0.00486113 Número de corridas arriba o abajo de la mediana = 23 Número esperado de corridas = 19.6667 Estadístico z para muestras grandes = -0.