You are on page 1of 15
MEIER CHEM Clitliyz. INTRODUCCION estudiar los métodos de analisis de datos cuantitativos, primero se trataron pro- blemas que implican una sola muestra de nimeros y luego se abordé el analisis com- parativo de dos muestras diferentes. En problemas de una muestra, los datos se mponian de observaciones sobre respuestas de individuos u objetos experimenta- es seleccionados de una sola poblacién. En problemas de dos muestras, las dos luestras se tomaron de dos poblaciones diferentes y los parémetros de interés fue- las medias de la poblacion o bien se aplicaron dos tratamientos distintos a unida- ‘experimentales (individuos u objetos) seleccionados de una sola poblacién; en el timo caso, los parémetros de interés fueron las medias de tratamiento verdaderas. El analisis de la varianza, o més brevemente, ANOVA, se refiere en general a in conjunto de situaciones experimentales y procedimientos estadisticos para el and- is de respuestas cuantitativas de unidades experimentales. £1 problema ANOVA 1s simple se conoce indistintamente como unifactorial, de clasificacién unica 0 OVA unidireccional e implica el andlisis de datos muestreados de més de dos po- blaciones (distribuciones) numéricas o de datos de experimentos en los cuales se uti- ron mas de dos tratamientos. La caracteristica que diferencia los tratamientos 0 poblaciones una de otra se llama factor en estudio y los distintos tratamientos 0 po- blaciones se conocen como niveles del factor. Ejemplos de tales situaciones incluyen siguientes: |. Un experimento para estudiar los efectos de cinco marcas diferentes de gasolina con respecto a la eficiencia de operacién de un motor automotriz (mpg). . Un experimento para estudiar los efectos de la presencia de cuatro soluciones azucaradas diferentes (glucosa, sucrosa, fructosa y una mezcla de las tres) en cuanto a crecimiento de bacterias. 369 370 ‘CAPITULO 10. Andlsis dela varanza 3. Un experimento para investigar si la concentracién de madera dura en la pulpa (%) afecta la resistencia a la tensién de bolsas hechas de la pulpa. 4, Un experimento para decidir si la densidad de color de un espécimen de tela depen- de de la cantidad de tinte utilizado. En 1) el factor de interés es la marca de la gasolina y existen cinco niveles diferen- tes del factor. En 2) el factor es el azticar con cuatro niveles (0 cinco, sise utiliza una so- luci6n de control que no contenga azticar). Tanto en 1) como en 2), el factor es de naturaleza cualitativa y los niveles corresponden a posibles categorias del factor. En 3) 4), los factores son concentracion de madera dura y cantidad de tinte, respectivamen- te; estos dos factores son de naturaleza cuantitativa, por lo que los niveles identifican diferentes ajustes del factor. Cuando el factor de interés es cuantitativo, también se pueden utilizar técnicas estadisticas de andlisis de regresiOn (discutido en los capitulos 12 y 13) para analizar los datos. Este capitulo se enfoca en el ANOVA unifactorial. La seccién 10.1 presenta la prueba F para probar la hipotesis nula de que las medias de la poblacién o tratamien- to son idénticas. La seccién 10.2 considera un andlisis adicional de los datos cuando Hy ha sido rechazada, La seccién 10.3 se ocupa de algunos otros aspectos del ANOVA uni- factorial. El capitulo 11 introduce experimentos ANOVA que implican mas de un factor. | 10. ANOVA unifactorial Ejemplo 10.1 EL ANOVA unifactorial se enfoca en la comparacién de més de dos medias de poblacién 0 tratamiento, Sean 1 = el ndimero de poblaciones o tratamientos que se estén comparando. la media de la poblacidn 1 0 la respuesta promedio verdadera cuando se aplica el tratamiento 1 4, = la media de la poblacién [0 la respuesta promedio verdadera cuando se aplica et tratamiento 1 Las hip6tesis pertinentes son Hy ay My contra Hz por lo menos dos de las 41, son diferentes. Si J = 4, Hy es verdadera s6lo si las cuatro 1; son idénticas. H, serfa verdadera, por ejem- plo, Si oy = Hy # Hy = Abs Si by = Ay = Hy * Hy, 0 Si las cuatro 4, differen una de otra, Una prueba de estas hip6tesis requiere que se tenga disponible una muestra aleatoria de cada poblacisn o tratamiento, El articulo “Compression of Single-Wall Corrugated Shipping Containers Using Fixed and Floating Test Platens” (J. Testing and Evaluation, 1992: 318-320) describe un experimen- to en el cual se compararon varios tipos diferentes de cajas con respecto a resistencia a la 10.1 ANOVA unifactoril 371 compresi6n (Ib). La tabla 10.1 presenta los resultados de un experimento ANOVA unifacto- rial que implica / = 4 tipos de cajas (las medias y desviaciones estindar muestrales con- cuerdan con los valores dados en el articulo).. Tabla 10.1 Datos y cantidades resumidas para el ejemplo 10.1 Tipo de caja la compresién (Ib) Media muestral DE muestral 1 655.5 788.3 734.3 7214 679.1 6994 713.00 4655 2 789.2 7725 786.9 686.1 732.1 7748 756.93 4034 3 737.1 639.0 6963 671.7 117.2 727.1 698.07 37.20 4 535.1 628.7 542.4 559.0 586.9 5200 562.02 30.87 50 Gran media 68 Con j1, denotando Ia resistencia a la compresién promedio verdadera de las cajas de tipo i (= 1,2,3.4) la ipotesis mula es Hy: shy = 4 La figura 10.1a) muestra una sgrafica de caja comparativa para las cuatro muestras. Existe una cantidad sustancial de tras- Tape entre las observaciones de los primeros tres tipos de cajas, pero las resistencias a la compresign del cuarto tipo parecen considerablemente ms pequefias que para los demés ti pos. Esto sugiere que H, no es verdadera, La grfica de caja que aparece en el figura 10.1b) est basada en agregar 120 a cada observacién en la cuarta muestra (y asf se obtiene una me- dia de 682.02 y la misma desviacién esténdar) y las demas observaciones no cambian. Ya ‘no es obvio si Hy es verdadera o falsa. En situaciones como éta, se requiere un procedimien- to de prueba formal 350 oo 650 700 750 3 4 a 630 60 0 720 750) 780 » Figura 10.1. Graficas de caja para el ejemplo 10.1: a) datos originales; b) datos modificados, ml an. CAPITULO 10 Analisis de la vaianza SUPOSICIONES Notaci6n y suposiciones En problemas de dos muestras se utilizaron las letras X y ¥ para diferenciar las observacio- nes en una muestra de aquellas en la otra. Como esto es engorroso con tres 0 mas muestras, se acostumbra utilizar una sola letra con dos subindices. El primero identifica el niimero de Ja muestra, correspondiente a la poblacién o tratamiento que se esti muestreando y el se- ‘gundo denota la posicién de la observacidn dentro de dicha muestra, Sean Ja variable aleatoria (va) que denota la medicién j-ésimatomada en la poblacién i-ésima o la mediciOn tomada en la unidad experimental j-ésima que recibe el tratamiento i-ésimo. x, = el valor observado de X,, cuando se realiza el experimento, Los datos observados normalmente se muestran en una tabla rectangular, tal como la tabla 10.1, En ella las muestras de las diferentes poblaciones aparecen en filas distintas de la tabla y.x,, es el mimero j-ésimo en la fila i-ésima, Por ejemplo x, = 786.9 (la tercera ob- servacién de la segunda poblacién) y x4, = 535.1. Cuando no hay ambigiiedad, se escribiré x, en lugar de x, (p. €, si se realizaron 15 observaciones en cada uno de los 12 tratamentos, “jp podria significar x, 0.x),3). Se supone que las X;, dentro de cualquier muestra particular son independientes, una muestra aleatoria de la distribucién de poblacién o tratamiento i-ésima, y que las diferentes muestras son independientes entre i En algunos experimentos, diferentes muestras contienen distintos mimeros de obser- vaciones. Aqui se abordari el caso de tamafios de muestra iguales; la generalizacién en cuanto a tamaiios de muestra desiguales aparece en ta seccién 10.3. Sea Jel niimero de ob- servaciones en cada muestra (J = 6 en el ejemplo 10.1). El conjunto de datos se compone de IJ observaciones. Las medias de muestra individual serdn denotadas por X,..Xz1-...%). Es decir, EI punto en lugar del segundo subsndice significa que se sumaron todos tos valores de cho subsndice al mismo tiempo que se mantuvo fijo el valor del otro subsndice y la raya ho- izontal indica divisidn entre J para obtener un promedio. Asimismo, el promedio de todas las observaciones /J, llamada gran media, es 156.93, X,, = 698.07, « $} las varianzas muestrales: =1,2, 2166.90, y asf suc La poblacién o tratamiento J son normales con la misma varianza X, esti normalmente distribuida con BX,

You might also like