MEIER CHEM Clitliyz.
INTRODUCCION
estudiar los métodos de analisis de datos cuantitativos, primero se trataron pro-
blemas que implican una sola muestra de nimeros y luego se abordé el analisis com-
parativo de dos muestras diferentes. En problemas de una muestra, los datos se
mponian de observaciones sobre respuestas de individuos u objetos experimenta-
es seleccionados de una sola poblacién. En problemas de dos muestras, las dos
luestras se tomaron de dos poblaciones diferentes y los parémetros de interés fue-
las medias de la poblacion o bien se aplicaron dos tratamientos distintos a unida-
‘experimentales (individuos u objetos) seleccionados de una sola poblacién; en el
timo caso, los parémetros de interés fueron las medias de tratamiento verdaderas.
El analisis de la varianza, o més brevemente, ANOVA, se refiere en general a
in conjunto de situaciones experimentales y procedimientos estadisticos para el and-
is de respuestas cuantitativas de unidades experimentales. £1 problema ANOVA
1s simple se conoce indistintamente como unifactorial, de clasificacién unica 0
OVA unidireccional e implica el andlisis de datos muestreados de més de dos po-
blaciones (distribuciones) numéricas o de datos de experimentos en los cuales se uti-
ron mas de dos tratamientos. La caracteristica que diferencia los tratamientos 0
poblaciones una de otra se llama factor en estudio y los distintos tratamientos 0 po-
blaciones se conocen como niveles del factor. Ejemplos de tales situaciones incluyen
siguientes:
|. Un experimento para estudiar los efectos de cinco marcas diferentes de gasolina
con respecto a la eficiencia de operacién de un motor automotriz (mpg).
. Un experimento para estudiar los efectos de la presencia de cuatro soluciones
azucaradas diferentes (glucosa, sucrosa, fructosa y una mezcla de las tres) en
cuanto a crecimiento de bacterias.
369370
‘CAPITULO 10. Andlsis dela varanza
3. Un experimento para investigar si la concentracién de madera dura en la pulpa (%)
afecta la resistencia a la tensién de bolsas hechas de la pulpa.
4, Un experimento para decidir si la densidad de color de un espécimen de tela depen-
de de la cantidad de tinte utilizado.
En 1) el factor de interés es la marca de la gasolina y existen cinco niveles diferen-
tes del factor. En 2) el factor es el azticar con cuatro niveles (0 cinco, sise utiliza una so-
luci6n de control que no contenga azticar). Tanto en 1) como en 2), el factor es de
naturaleza cualitativa y los niveles corresponden a posibles categorias del factor. En 3)
4), los factores son concentracion de madera dura y cantidad de tinte, respectivamen-
te; estos dos factores son de naturaleza cuantitativa, por lo que los niveles identifican
diferentes ajustes del factor. Cuando el factor de interés es cuantitativo, también se
pueden utilizar técnicas estadisticas de andlisis de regresiOn (discutido en los capitulos
12 y 13) para analizar los datos.
Este capitulo se enfoca en el ANOVA unifactorial. La seccién 10.1 presenta la
prueba F para probar la hipotesis nula de que las medias de la poblacién o tratamien-
to son idénticas. La seccién 10.2 considera un andlisis adicional de los datos cuando Hy
ha sido rechazada, La seccién 10.3 se ocupa de algunos otros aspectos del ANOVA uni-
factorial. El capitulo 11 introduce experimentos ANOVA que implican mas de un factor.
| 10.
ANOVA unifactorial
Ejemplo 10.1
EL ANOVA unifactorial se enfoca en la comparacién de més de dos medias de poblacién 0
tratamiento, Sean
1 = el ndimero de poblaciones o tratamientos que se estén comparando.
la media de la poblacidn 1 0 la respuesta promedio verdadera cuando se aplica
el tratamiento 1
4, = la media de la poblacién [0 la respuesta promedio verdadera cuando se aplica et
tratamiento 1
Las hip6tesis pertinentes son
Hy ay
My
contra
Hz por lo menos dos de las 41, son diferentes.
Si J = 4, Hy es verdadera s6lo si las cuatro 1; son idénticas. H, serfa verdadera, por ejem-
plo, Si oy = Hy # Hy = Abs Si by = Ay = Hy * Hy, 0 Si las cuatro 4, differen una de otra,
Una prueba de estas hip6tesis requiere que se tenga disponible una muestra aleatoria
de cada poblacisn o tratamiento,
El articulo “Compression of Single-Wall Corrugated Shipping Containers Using Fixed and
Floating Test Platens” (J. Testing and Evaluation, 1992: 318-320) describe un experimen-
to en el cual se compararon varios tipos diferentes de cajas con respecto a resistencia a la10.1 ANOVA unifactoril 371
compresi6n (Ib). La tabla 10.1 presenta los resultados de un experimento ANOVA unifacto-
rial que implica / = 4 tipos de cajas (las medias y desviaciones estindar muestrales con-
cuerdan con los valores dados en el articulo)..
Tabla 10.1 Datos y cantidades resumidas para el ejemplo 10.1
Tipo de caja la compresién (Ib) Media muestral DE muestral
1 655.5 788.3 734.3 7214 679.1 6994 713.00 4655
2 789.2 7725 786.9 686.1 732.1 7748 756.93 4034
3 737.1 639.0 6963 671.7 117.2 727.1 698.07 37.20
4 535.1 628.7 542.4 559.0 586.9 5200 562.02 30.87
50
Gran media 68
Con j1, denotando Ia resistencia a la compresién promedio verdadera de las cajas de tipo
i (= 1,2,3.4) la ipotesis mula es Hy: shy = 4 La figura 10.1a) muestra una
sgrafica de caja comparativa para las cuatro muestras. Existe una cantidad sustancial de tras-
Tape entre las observaciones de los primeros tres tipos de cajas, pero las resistencias a la
compresign del cuarto tipo parecen considerablemente ms pequefias que para los demés ti
pos. Esto sugiere que H, no es verdadera, La grfica de caja que aparece en el figura 10.1b)
est basada en agregar 120 a cada observacién en la cuarta muestra (y asf se obtiene una me-
dia de 682.02 y la misma desviacién esténdar) y las demas observaciones no cambian. Ya
‘no es obvio si Hy es verdadera o falsa. En situaciones como éta, se requiere un procedimien-
to de prueba formal
350 oo 650 700 750
3
4
a
630 60 0 720 750) 780
»
Figura 10.1. Graficas de caja para el ejemplo 10.1: a) datos originales; b) datos modificados, mlan.
CAPITULO 10 Analisis de la vaianza
SUPOSICIONES
Notaci6n y suposiciones
En problemas de dos muestras se utilizaron las letras X y ¥ para diferenciar las observacio-
nes en una muestra de aquellas en la otra. Como esto es engorroso con tres 0 mas muestras,
se acostumbra utilizar una sola letra con dos subindices. El primero identifica el niimero de
Ja muestra, correspondiente a la poblacién o tratamiento que se esti muestreando y el se-
‘gundo denota la posicién de la observacidn dentro de dicha muestra, Sean
Ja variable aleatoria (va) que denota la medicién j-ésimatomada en la poblacién
i-ésima o la mediciOn tomada en la unidad experimental j-ésima que recibe el
tratamiento i-ésimo.
x, = el valor observado de X,, cuando se realiza el experimento,
Los datos observados normalmente se muestran en una tabla rectangular, tal como la
tabla 10.1, En ella las muestras de las diferentes poblaciones aparecen en filas distintas de
la tabla y.x,, es el mimero j-ésimo en la fila i-ésima, Por ejemplo x, = 786.9 (la tercera ob-
servacién de la segunda poblacién) y x4, = 535.1. Cuando no hay ambigiiedad, se escribiré
x, en lugar de x, (p. €, si se realizaron 15 observaciones en cada uno de los 12 tratamentos,
“jp podria significar x, 0.x),3). Se supone que las X;, dentro de cualquier muestra particular
son independientes, una muestra aleatoria de la distribucién de poblacién o tratamiento
i-ésima, y que las diferentes muestras son independientes entre i
En algunos experimentos, diferentes muestras contienen distintos mimeros de obser-
vaciones. Aqui se abordari el caso de tamafios de muestra iguales; la generalizacién en
cuanto a tamaiios de muestra desiguales aparece en ta seccién 10.3. Sea Jel niimero de ob-
servaciones en cada muestra (J = 6 en el ejemplo 10.1). El conjunto de datos se compone
de IJ observaciones. Las medias de muestra individual serdn denotadas por X,..Xz1-...%).
Es decir,
EI punto en lugar del segundo subsndice significa que se sumaron todos tos valores de
cho subsndice al mismo tiempo que se mantuvo fijo el valor del otro subsndice y la raya ho-
izontal indica divisidn entre J para obtener un promedio. Asimismo, el promedio de todas
las observaciones /J, llamada gran media, es
156.93, X,, = 698.07,
« $} las varianzas muestrales:
=1,2,
2166.90, y asf suc
La poblacién o tratamiento J son normales con la misma varianza
X, esti normalmente distribuida con
BX,