You are on page 1of 14

Ejercicios Diseños de Experimentos (Anova y Regresión Lineal

)
Ejercicio 1
La Dra. Báslavi es una investigadora que intenta aislar el virus del SIDA. Planea realizar un experimento usando cuatro catalizadores (C1, C2, C3 y C4) durante la producción de una sustancia química para ver sus efectos en las células de un paciente infectado con el virus. Durante el desarrollo de la investigación la Dra. Báslavi decide estudiar el efecto de cada uno de estos catalizadores en tres niveles de temperaturas diferentes (T1, T2 y T3). Los datos recogidos en porcentaje de concentración se muestran en la siguiente tabla.

1

Replicación I C1 73 T1 T2 T3 71 72 79 81 76 83 84 82 C2 68 C3 74

II C4 C1 81 67 71 76 C2 73 79 78 C3 76 82 81 C4 84 85 84

III C1 75 74 76 C2 77 78 83 C3 79 76 85 C4 81 84 81

Realice un análisis de varianza para este experimento. Solución Deberemos probar las siguientes hipótesis: Para los tratamientos(tipos de Catalizador): H0: No hay diferencia significativa entre el catalizador y la concentración H1: Si hay diferencia significativa entre el catalizador y la concentración Para los bloques(Niveles de Temperatura): H0: No hay diferencia significativa en la concentración por niveles de temperatura H0: Si hay diferencia significativa en la concentración por niveles de temperatura Para las interacciones entre Catalizador y Temperatura(interacciones) H0: No hay ninguna relación entre los catalizadores y los niveles de temperaturas

2 Cat. rk(l-1)] gdos. T2 y T3).rk(l-1)] grados de libertad Las filas constituyen los bloques (r = 3) con [(r-1. Ingrese los datos de acuerdo a la siguiente hoja: Temp. 1 1 1 1 1 1 1 1 1 2 2 2 2 . C2. 1 Cat. C3 y C4) y como fila o bloques a los tres niveles de temperaturas: (T1. rk(l-1)] grados de libertad Las interacciones (l=3) entre Tratamiento y Bloque tiene [(k-1)(r-1). lib. Cat. 3 Cat.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) H0: Si hay ninguna relación entre los catalizadores y los niveles de temperaturas Hagamos algunas transformaciones con este cuadro: Vamos a colocar como columna a los cuatro catalizadores: (C1. 4 T1 T1 T1 T2 T2 T2 T3 T3 T3 73 67 75 71 71 74 72 76 76 68 73 77 79 79 78 81 78 83 74 76 79 76 82 76 83 81 85 81 84 81 84 85 84 82 84 81 Concent. T1 T1 T1 T2 T2 T2 T3 T3 T3 T1 T1 T1 T2 Cataliz. 73 67 75 71 71 74 72 76 76 68 73 77 79 Temperat. El resultado es el siguiente: C1 T1 T1 T1 T2 T2 T2 T3 T3 T3 73 67 75 71 71 74 72 76 76 C2 68 73 77 79 79 78 81 78 83 C3 74 76 79 76 82 76 83 81 85 C4 81 84 81 84 85 84 82 84 81 2 Las columnas constituyen los tratamientos (k = 4) con [(k-1.

< ANOVA > .¶ o la columna C8 En < Column factor > ingresamos µCataliz.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) 79 78 81 78 83 74 76 79 76 82 76 83 81 85 81 84 81 84 85 84 82 84 81 Al usar la secuencia de comandos: < Stat > .< Two ± Way > En < Response > ingresamos µConcent.¶ o la columna C7 En < Row factor > ingresamos µTemperat.¶ o la columna C9 Los resultados son los siguientes: Two-way Analysis of Variance T2 T2 T3 T3 T3 T1 T1 T1 T2 T2 T2 T3 T3 T3 T1 T1 T1 T2 T2 T2 T3 T3 T3 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 3 .

00 MS 61.17 76.00 82. .> del Análisis de Varianza.000 0. 1 2 3 4 Mean --------+---------+---------+---------+--72.109 4 ----------+---------+---------+---------+- Individual 95% CI Cataliz.72 F 9.78 77.27 6. del comando < Stat > del Minitab.97 Individual 95% CI Temperat T1 T2 T3 Mean ----------+---------+---------+---------+75.10 23.00 (------*-------) (------*-------) (-------*-------) 80. lo que implica que no se rechaza la hipótesis nula.61 161.00 --------+---------+---------+---------+--- De acuerdo al valor del p-value se puede comprobar que las dos hipótesis nulas serán rechazadas.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) Analysis of Variance for Concent.50 84.67 78.33 79.25 80. la interacción entre los niveles de temperatura y los catalizadores es insignificante.33 838.39 475. que nada tiene de particular respecto a los anteriores. es decir.59 1.11 82. Interaction Error Total 3 6 24 35 DF 2 SS 122.19 158.97 P 0.89 73.001 0. ANOVA.00 (----*----) (----*----) (----*----) (----*----) 80. hay diferencia en el porcentaje de la concentración tanto debido al uso de los catalizadores como el sometimiento a una determinada temperatura. será resuelto utilizando la opción < Balanced ANOVA. Ejercicio 2 El siguiente problema.00 78.64 79.55 13.. Source Temperat Cataliz.50 77.. sin embargo.

los empleados deben ser tomados como factores.9 E 2. C4 Particip.0 4.8 8.8 5.1 3.8 3.6 E 2.1 Hay diferencia en los tiempos promedio de cálculo entre el tipo de problema y la forma de resolverlo? Solución Sin duda este tipo de problema nos sugiere que los tiempos de cálculo deben ser la variable de respuesta (Response).5 5. Rpta. C2.5 Manuel F 3.5 7. Los problemas a resolver eran de dos tipos: Financieros (F) y Estadísticos (E). Empleados de la financiera 5 Carlos F Excel Calculadora E Pablo F 3.8 E 2.6 7.8 E 2.4 Luis F 3.5 5. Tpo.8 Estad Estad Matem Matem Estad Nuevo Antiguo Nuevo Antiguo Nuevo .5 5.4 7.0 7.4 4.1 7. Los datos deben ser ingresados a la hoja de trabajo según se indica.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) Se realizó un experimento que consistía en tomar el tiempo que tardaban 6 empleados de una financiera para resolver un determinado problema mediante la hoja de cálculo Excel y una calculadora.1 E 2.5 2. Los tiempos obtenidos se muestran en el siguiente cuadro. así como el tipo de cálculo y la forma de resolverlo. Tipo prob.7 5.1 2. C3.9 Lucas F 3.3 6. Por ello este es un caso especial del ANOVA que es posible resolverlo por la opción antes mencionada.3 José F 3. en C1. Modelo Carlos Carlos Carlos Carlos Pablo 3.

1 2.0 7.7 5.6 2.< Balanced ANOVA .4 Luis Luis Luis Luis 3.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) Pablo Pablo Pablo Jose Jose Jose Jose Lucas Lucas Lucas Lucas Manuel 3.3 Manuel 6.9 Manuel 2.< ANOVA > .8 8... . Rpta.5 Manuel 5.4 7.8 5. En la siguiente ventana En < Response > ingresar Tpo.9 3.8 2.6 7.5 Estad Estad Matem Matem Estad Estad Matem Matem Estad Matem Matem Estad Estad Matem Matem Estad Estad Matem Matem Nuevo Antiguo Nuevo Antiguo Nuevo Antiguo Nuevo Antiguo Antiguo Nuevo Antiguo Nuevo Antiguo Nuevo Antiguo Nuevo Antiguo Nuevo Antiguo 6 Usando la secuencia de comandos: < Stat > .8 2. > .0 4.3 3.4 4.

000 72.619 16. así como tampoco por el modelo de cálculo usado .' 'Tipo prob.053 16.667 56.107 4.000 0.293 Por el valor del p value podemos decir que sí hay diferencia en el tiempo de respuesta debido a los participantes.107 245.692 94. Rpt Source Particip Tipo pro Modelo Error Total DF 5 1 1 16 23 SS 1.91 0.518 MS F P 0.211 0. mientras que los tiempos de respuesta promedio no difieren por el tipo de problema.84 0.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) En < Model > ingresar 'Particip.667 72.72 0. ' Modelo Los resultados se muestran a continuación: Analysis of Variance (Balanced Designs) 7 Factor Type Levels Values Particip random 6 Carlos Jose Lucas Luis Manuel Pablo Tipo pro fixed 2 Estad Matem Modelo fixed 2 Antiguo Nuevo Analysis of Variance for Tpo.

93 0.85 0.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) Ejercicio 3 En The Wall Street Journal Almanac 1998 aparecieron datos sobre el desempeño de las aerolíneas estadounidenses.2 71.5 % de Quejas 0.22 1. cuadrática o cúbica para el diagrama de dispersión de estos datos.2 70. 8 Aerolíneas Southwest Continental NorthWest US Airways United American Delta America West TWA % de puntualidad 81.7 73. . A continuación vemos los datos sobre el porcentaje de vuelos que llegan puntuales y la cantidad de quejas por 10.58 0.72 1.8 68.25 Ajuste una relación lineal.8 72.74 0. Indique la variable dependiente y la independiente.000 pasajeros.8 76.6 75.6 76.21 0.68 0.

<ScatterPlot> Como variable X: Puntualidad y variable Y: % de quejas. El modelo es entonces 9 Queja = F (Puntualidad) + E Que debe ser estimada mediante la ecuación Hagamos uso del programa Minitab para seleccionar una adecuada estimación de estos parámetros.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) Solución Sin duda las quejas dependerán de cuán puntuales fueron las aerolíneas. Antes de ajustar el problema a un modelo lineal. Por ello la variable Quejas ser la variable dependiente y la variable Puntualidad será la independiente. convendría disponer del diagrama de dispersión para ver si la hipótesis de formular un modelo lineal se adecua. El siguiente es el gráfico . Trace un diagrama de dispersión usando <Graph> .

Paso 1: Ingresamos los datos de la tabla en las columnas C1. C2 y C3 de una hoja de trabajo del Minitab. . aunque habría que medir la relación entre las dos variables pues parece que el porcentaje de dependencia es algo conservador. Paso 2: Tratemos de ajustar los datos a una línea de ploteo usando la secuencia: < Stat > . En la ventana que se obtenga ingresar C3 como variable endógena(dependiente) y C2 como variable predictora o independiente( % de Puntualidad). Seleccionemos primero la opción < Linear > y con el mismo procedimiento seleccione después la opción < Cubic >.< Fitted line Plot >.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) 10 Creemos que un modelo lineal puede ser un ajuste adecuado para estos datos.< Regression > .

16.638119 24. la ecuación de estimación obtenida es Y = 414.819156 Mientras que al usar la opción < Cubic >.0.1 % Con un diagrama de dispersión y µrecta de ajuste¶ dada en la siguiente figura Con sólo observar el r² podemos afirmar que los datos se ajustan mejor a una función cúbica y no a una lineal.07041 % de puntualidad S = 0.181037 0.437 .Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) Los resultados obtenidos son Regression Analysis: % de Quejas versus % de puntualidad The regression equation is % de Quejas = 6. Para mayor detalle veamos qué sucede con la varianza de los errores. .67E-04X**3 R-Sq = 81. lo que lo conseguiremos tomando en cuenta los residuales.018 .638119 0.002 7 0.7% 11 Analysis of Variance Source Error Total DF SS MS F P Regression 1 0.9% R-Sq(adj) = 74.025862 8 0.9.160818 R-Sq = 77.4312X + 0.218026X**2 .67 0.

Ahora vamos a realizar el análisis de regresión correspondiente al problema.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) Para ello es suficiente hacer clic en la opción < Storage> de la ventana anterior y activar < Resduals > (se puede almacenar también los valores ajustados <Fits> que los almacenaremos en la columnas C4 y C5. Ingresando por <Options> active < Durbin Watson > .. cuyos residuales y fits los almacenaremos en las columnas C6 y C7. Puesto que queremos comparar las varianzas de los residuales con ambos modelos (lineal y cúbico) hagamos lo mismo con el modelo cúbico. Obtendremos la siguiente ventana: En ella ingresemos en < Response > la variable dependiente C3 y en < Predictors > se ingresará todas las variables predictoras o independientes. > .. Allí encontramos que las columnas C8 y C9 contienen el cuadrado de los residuales y las celdas de las columnas C10 y C11 contienen las varianzas y las desviaciones estándares para los dos modelos. en este caso. Para ello usemos la siguiente secuencia: < Stat > . Se puede apreciar que el modelo cúbico tiene menor dispersión que el modelo lineal.< Regression .< Regression >. 12 Los datos y resultados de este ejemplo lo encontramos en el archivo Regre02. C2.mtw.

63812 0.72 -4.18104 MS F P 24.07401.0.02 . b) El coeficiente de regresión F = .0704 % de puntualidad Predictor Constant % de pun S = 0. es decir.002 13 R-Sq = 77. En muchos casos esta constante no es lógicamente significativa.018 -0.0.81916 Durbin-Watson statistic = 2.7% Analysis of Variance Source Regression Total 8 DF 1 SS 0. representa el valor inicial de Y.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) Los resultados que se obtienen son los que se muestra a continuación: Regression Analysis The regression equation is % de Quejas = 6.97 P 0.02% de quejas se recibiría si ninguna aerolínea fuera puntual.9% R-Sq(adj) = 74.67 0.001 0.052 0.01418 T 5.02.002 0. representa el cambio que experimentaría la variable Y (% .526987 Interpretación de estos resultados: a) El término independiente llamado también intercepto E = 6.1608 Coef 6.63812 0. el 6.02586 Residual Error 7 0.07041 StDev 1.

La gráfica anterior fue obtenida con el MS Excel. como es lógico. a mayor puntualidad el porcentaje de quejas disminuye. Se puede apreciar en ambos casos que.Ejercicios Diseños de Experimentos (Anova y Regresión Lineal) de quejas) por cada unidad de cambio en la variable X ( % de puntualidad). el porcentaje de quejas se reducirá. Si se incrementa la puntualidad. Tomando en cuenta la ecuación resultante de los modelos lineal y cúbico se han obtenido estimaciones para porcentajes de puntualidad de 0 a 20. 14 .