You are on page 1of 9
66 CAPITULOS EXPERIMENTOS CON UN SOLO FACTOR: EL ANALISIS DE VARIANZA, i Es decir, los efectos del tratamiento o factor pueden considerarse como desviaciones delamediaglobal? de Por consiguiente, una forma equivalente de escribir las hiptesis anteriores ¢s cn términos de los efectos los de los tratamientos 1;, por ejemplo. dio Hyit,=1, =..t.=0 i cit Hy, #0 para almenosunai i Por Jo tanto, se habla de probar la igualdad de las medias de los tratamientos o de probar que los efectos. | dor eos tratamientos (Jas) son cero, El procedimiento apropiado para probar la igualdad de las medias de nie los a tratamientos es el anilisis de varianza. Hay i tor 33.1 [Descomposicién de la suma de cuadrados total fe El nombre andlisis de varianza se deriva de la particién de la variabilidad total en sus partes componen- pari tes, La suma de cuadrados total corregida ' = DD Or DY : se usa como una medida de la variabilidad global de los datos. Intuitivamente, esto es razonable porque, i siSS;tuviera que dividirse por el nimero apropiado de grados de libertad (en este caso, an—1=N-1),se fl obtendria la varianza muestral de lasy. La varianza muestral es, desde luego, una medida estndardeva- aa riabilidad f Observe que la suma de cuadrados total corregida SS; se puede escribir como ' 2+) -JOF oy : ° Ane é. ae t cion SS o-98 =e o.-v yA DE Ove? i aE & am 6s) YM — I.) yD o.- Por trati (3-6) ta fmt La ecuacién 3-6 establece qie puede hacerse la particién de la variabilidad total de los datos, medida por Jasuma de cuadrados total corregida, en una suma de cuadrados de las diferencias entre los promedios de Jos tratamientos y el gran promedio, mas una suma de cuadrados de las diferencias de las observaciones dentro de los tratamientos y el promedio de los tratamientos, Entonces, la diferencia entre los promedios {Para mis informadin sobre ete tema, referns al material suplementaro del texto del capitulo 3 os ape ialensciee 3.3 ANALISIS DEL MODELO CONEFECTOSFIOS 67 ia gobal? de los tratamientos observados y cl gran promedio es una medida de las diferencias entre las medias de Hos efectos Jos tratamientos, mientras que las diferencias dc las observaciones dentro de un tratamiento y el prome- io del tratamiento, pueden deberse dnicamente al error aleatorio. Por lo tanto, la ecuacién 3-6 puede es- cribirse simbélicamente como 55; =SSsneminaes +55 donde a SStsnins S¢ le llama la suma de cuadrados debida a los tratamientos (es decir, entre los trata- mientos),y SS, se le llama la suma de cuadrados debida al error (es decir, dentro de los tratamientos), Hay an = N observaciones en total; por lo tanto, SS; tiene N ~ 1 grados de libertad. Hay a niveles del fac. tor (y medias dea tratamientos), de donde SSpymenos tiene a~1 grados de libertad, Por iltimo, dentro de cualquier tratamiento hay n réplicas que proporcionan n ~ 1 grados de libertad con los cuales estimar el «error experimental. Puesto que hay a tratamientos, se tienen a(n — 1) = an~a = N—a grados de libertad para el error. 5 Es itil examinar explicitamente los dos términos del lado derecho de la identidad fundamental del anilisis de varianza (ecuaci6n 3-6). Considere la suma de cuadrados del error 55,- 3 o,-n7 = S [s Os-h | ae mt La Enesta forma es facil ver que el término entre corchetes, sise divide porn — 1, es la varianza muestral del tratamiento i-ésimo, 0 oy ni y oi 4B nil ‘Ahora pueden combinarse a varianzas muestrales para obtener una sola estimacién de la varianza poble- cional comin de la siguiente manera: (n- 82 + (2-18? + + (n= DS: (n= D1) FFD Set _s. “ (W=a) Porto tanto, S5,(N a) es una estimacién combinada de la varianza comin dentro de cada uno de los @ tratamientos. De manera similar, sino hubiera diferencias entre las medias de los atratamientos, podria usarse la variaci6n de os promedios de los tratamientosy el gran promedio para estimaro®.Fspecifcamente medida poe ; ics romediosde 2 S OurBy sservaions = s promos = G4) a-1 es uma estimacién deo” si las medias de los tratamientos son iguales. La razén de esto puede verse de ma- nera intuitiva de la siguiente manera, La cantidad 3 (a=) estima o*in, la varianza de los pro- 68 —CAPITULO3_EXPERIMENTOS CON UN SOLO FACTOR: EL ANALISISDE VARIANZA, medios de los tratamientos, de donde nB.,(j, -7 )(@~ 1) debe estimar o” si no hay diferencias en las x medias de los tratamientos. Se observa que la dentidad del andlisis de varianza (ecuacién 3-6) nos proporciona dos estimaciones deo una basada en la variabilidad inherente dentro de los tratamientos y una basada en la variabilidad entre los tratamientos. Sino hay diferencias en las medias de los tratamientos, estas dos estimaciones de~ ‘berdn ser muy similares, y sino lo son, se sospecha que la diferencia observada puede ser causada por di- ferencias en las medias de los tratamientos. Aun cuando se ka usado un razonamiento intutivo para ea desarrollar este resultado, puede adoptarse un enfoque un tanto més formal. bes A las cantidades bi me ee, = Ses aeecie Sani ae! rac y SS, N-a a se les lama euadrados medios. Se examinardn ahora los valores esperados de estos cuadrados medios. Se Considere agp 0.3 dia) ADS o- 37 ny aR nor de 3s vi-as.ss2) ter FEE n-mS nen a “ass atZ a que atrit f Teor t Al sustituir el modelo (ecuaciéa a en esta ecuacién se obtiene Sea \ - a 7] i EMS.) yay “45s (u44, 4% -2 >, (s wer, +e) | E ak als : Entonces, al clever al cuadrado y tomar el valor esperade dgiatantided entre corchetes, se observa que fos iu Jos términos que incluyen ae} ye son reemplazados por oy no, respectivamente debido aque E(e;)= 0, Ademés, todos los productos cruzados que incluyen a ¢, tienen valor esperado cero. Por lo tanto, des- pués de elevar al cuadrado y tomar el valor esperado, la dtima ecuacién se convierte en 1 EUMS,} [ne onl Penie —ny? nS etc] E(MS,)= 07 Thee asen las raciones abilidad ones de- apor ivo para imedios, serva que cE) = nto, des- digi oain hinder tie ttn 33 ANALISIS DEL MODELO CON EFECTOS FOS 69 Aplicando un enfoque similar puede demostrarse también que? : FMS rrexseaio ) Por lo tanto, como se argumenté heurfsticamente, MS, = SS_i(N—a) estima? y, sino hay diferencias en Jas medias de los tratamientos (lo cual implica que t, = 0), MS pain = SSmuansam/(@~ 1) también est ‘ma0*, Sin embargo, observe que silas medias de los tratamientos difieren, el valor esperado del cuadrado ‘medio de los tratamientos es mayor que 0. Parece claro que es posible realizar una prueba dela hi de los tratamientos comparando MS aanuaies¥ MS. racién, ipStesis de que no hay diferencias en las medias Se considera ahora cémo puede hacerse esta compa- 3 2 Anilisis estadistico Se investiga shora como puede llevarse a cabo una prueba formal de la hipétesis de que no hay diferen- cias en las medias de los tratamientos (Hy = sa =-~ = 4,0 de manera equivalente, Hr, 4 0), Puesto que se ha supuesto que los errores e, siguen una distribucién normal e independiente con mne- dia ceroy varienza ola obscrvacioncsy, tienen una dstribucién normal e independiente con media. + ty varianza o°, Por lo tanto, SS es una sumsa de cuadrados de variables aleatorias con una distribucion normal; por consiguiente, puede demostrarse que SSyo" tiene una distribuci6n i-cuadrada con N=1 gra- dos de libertad. Ademés, puede demostrarse que SS," es una variable j-cuadrada con Na grados deli bertady que SSraneino/o” €s una variable j-cuadrada con a~ 1 grados de libertad sila hipotesisnula Hc = Des verdadera, Sin embargo, las tres sumas de euadrados no son necesariamente independientes, ya que la suma de SSrusneansY SSz €8 SSp El siguiente teorema, que es una forma especial de un teoretna atribuido a Wiliam Cochran, es atil para establecer la independencia de SSz y SSruese-, TEOREMA 3-1 +10 +++ ‘Teorema de Cochran. Sea Z, igual a NID(0, 1) para i = LB aw DV z=040,4 +0, dondes = v,y O, tiene v, grados de libertad (i = 1,2, ... 8). Entonces Q,, 0,» .. Q, on variables aleatorias ji-cuadrada independientes con vv, ..,¥, grados de libertad, respectivamente, si y slo si tub ty, Puesto que los grados de libertad de SSrseisceY SS Suman N~ 1, el niimero total de grados de liber- ‘ad, el teorema de Cochran implica qUe SStamnmu/0* y SSsi0* son variables aleatorias ji-cuadrada con * Reterrse al material aplementaria del tet del api 70 CAPITULO3_EXPERIMENTOS CON UNSOLO FACTOR: EL ANALISIS DE VARIANZA ‘Tabla 3-3_ Tabla de anlisis de varianza para el modelo con un solo factory efectos fos ‘Suma de Grados de Cuadrado Rucnte de variniGn euadrados libereat medio fo S 2 WS Entre los tratamientos — SSraniame “7D, (Fi.-9.F ot MScumiam f= Error (deatro de los tratamientos) SSq = SS, -SSrmnninncs N-a MS, Total 55, = DY Oe-9F we-t tuna distribuci6n independiente. Por lo tanto, sila hipdtesis nula de que no hay diferencias en las medias de los tratamientos es verdadera, el cociente $s, MS. rasan / remit mn Aa SS (N=) MS G7 se distribuye como F cona - 1 y N~a grados de libertad. La ecuacién 3-7 es el estadistico de prueba para la hipétesis de que no hay diferencias en las medias de los tratamientos. Por los cuadirados medios esperados se observa que, en general, MS, es un estimador insesgado deo” Asimismo, bajo a hipotesis nula, MSpazaia,€5n estimador insesgado de o*, Sin embargo, sila hipétesis nla es falsa el valor esperado de MSrarnion 5 MAYOT UE C?, Por lo tanto, bajo la hipétesis alternativa, el ‘valor esperado del numerador del estadistico de prueba (ecuacion 3-7) es mayor que el valor esperado del denominador, y H, deberd rechazarse para valores del estadistico de prueba que son muy grandes. Esto {implica una regi6n critica de una sola cola superior. Por lo tanto, H, deberé rechazarse y concluirse que hay diferencias en las medias de los tratamientos si Fy> Foie donde F, se calcula con la ecuacién 3-7. De manera alternative, podria usarse el enfoque del valor P para ‘tomar una decisién. Es posible obtener formulas para calcular estas sumas de cuadrados reescribiendo y simplificando las, definiciones de SStarniea ¥ SSy €n la ecuacién 3-6. Se obtiene asi 85, = os) y trae 6 Srna = EH oo) La summa de cuadrados del error se obtiene por sustraceiéa como SS_ = SSy- SSsnmncre (G-10) El procedimiento de prueba se resume en la tabla 3-3. Se le conoce como tabla del anslisis de varianza. EJEMPLO 3-1 - El experimento de la resistencia a la tensién Para ilustrar el anélisis de varianza, se retoma al ejemplo que empez6 a comentarse en la secci6n 3-1. Re- euerde que al ingeniero de desarrollo de productos le interesa determinar si el peso porcentual del algo- don \ a8 Bys Ger cap as medias G7) nueba para ado deo*, ahipétesis mativa, el erado del. ades. Esto Inirse que dor P para icando las G8) oe) G10) rianza, n3-.Re- del algo- i i 32 ANALISSDEL MODELO CON EFECTOS MOS 7] dén en una Abra sintética afecta ta resistencia a la tensiGn, y ba Hlevado a eabo un experimento completamente aleatorizado con cinco niveles del peso porcential del algodny cineo, éplicas. Por con. veniencia, a continuacién se repiten los datos de la tabla 3-1 - eo Resistencia a la tension observada porcentual _ —__{ibvpulg?) tales Promedios : me del algodén 1 2 3 4 3 yi J 1s 7 7 15 iW 9 oa 98 20 2 17 2 18 18 7 154 25 4 18 18 19 19 88 176 30 9 25 2 cc a 108 15 35 i 10 u 5 nl 54 108 y =376 J= 1808 Se usar el anilisis de varianza para probar Hu Hs l= ls contra la hip6tesis alternativa Hyalgunas medias son diferentes, Les sumas de cuadrados Tequeridas se calculan como sigue: 5=>> y% =O + +57 + 4057 401) -D* -gag9g 1 (376) 3l(49)? + +054)? ]- = 475.76 161.20 Generalimente estos céleulos se reatizarian en una computadora,utilzando paquets de software con la capacidad de analizar datos de experimentos disefiados. Enla tabla 3-4 se resume el andliss de varianza, Observe que el cuadrado medio entn tos (118.94) es varias veces mayor que el cuadrado ‘el crror (8.06), Esto indica que no es posible que las medias de los tratamientos sewn iguales. En térmi- os més formales, puede calcularse el cociente FF, = 118,948.06 = 14.76, y compararestevalor ones punta Dorcentual apropiado de la cola superior de la distribucion F, x Suponga que el experimenteder ha seleecionado a = 0.05. En la tabla TV del apéndice se encuentra que Fa, og = 287, Prove que Fy 1476 > 2.87, se techaza Hyy se concluye que las medias de ls tratamientos deren; es decir, el peso por- ental del algodén cn la fibra afecta de manera significatva la resistencia ala tension media megs ‘Tabla 3-4 Analisis de varianca de los datos de la resistencia a a tensién fe Sumade Grados de Cuadrado Fuente de variacion cuadrados libertad ‘medio Peso poreentual del algodéa 415.76 4 11894 Fe. : Error 161.20 2» 805, 9,0 aa ae 2 Ee eOeiero ata rh WE 2 inte 72 CAPITULO 3. EXPERIMENTOS CON UN SOLO FACTOR: EL ANALISIS DE VARIANZA Danelded de probated 7 Foon Fo mater Frosaie igura 33. La distrbuci6n de referencia (Fy ) para el estaditico de riche Fen el ejemplo 3 podria calcularse un valor P para este estadistico de prueba. En la figura 3-3 se muestra la distribucion de referencia (F, =) para el estadistico de prueba F), Evidentemente, el valor Pes muy pequefio en este caso. Puesto que Fyoy.4 = 443 F; > 4.43, puede concluirse que un limite superior del valor P es 0.01; es decir, P < 0.01 (el valor P exacto es P = 9.11 x 10°) Cilculos manuales Posiblemente el lector haya notado que la suma de cuadrados se defini6 en términos de promedios; es de- cit, por la ecuaciGn 3-6, \ Ss, n> O.-5) pero las formulas de cdlculo se desarrollaron utilizando los totales. Por ejemplo, para calcular SSpusiems se usaria la ecuacién 3-9: La razén principal de esto es por convenieneia; ademés, os totalesy, yy. estin menos sujetos al ertor de redondeo que los promedios 7, ¥ 5. En general, no debera prestarse demasia@a atencin alos célcillos, ya que se cuenta con una amplia variedad de programas de computadora para realizarios: Estos programas de computadora son también tiles para realizar muchos otros andlisis asociados con el disefio experimental (como cl andlisis residual y la yerificaciOn de la adecuacién del modelo). En muchos casos, estos programas también ayudaraa al ex- perimentador a establecer el disefi. Cuando es necesario realizar los célculos manualmente, en ocasiones es ttl codificar las observacio- nes. Esto se ilustra en el ejemplo siguiente. EJEMPLO 3-2 +++++++ Codificacién de observaciones Los célculos del andlsis de varianza pueden hacerse con frecuencia de manera més precisa o simplificada codificando las observaciones. Por ejemplo, considere los datos de la resistencia a la tensién del ejemplo \ 1 4 = - i i i & & i : & Bbla pore dela BLS senci Alco tar w elem la sup cocies Por I Pruet Enel aleatc sible j ponge igualc 35 ANALISIS DEL MODELO CON EFECTOS FIJOS 73 ‘abla 3-5_Datos codificados de la resistencia a la tension del ejemplo 3-2 Fes Observacones scent ee ie Salgodon 1 2 3 4 5 7 5 = = 0 = 5 = 2B 3 2 3 3 3 2 : 3 4 3 3 4 4 5 : 2 + 0 7 4 8 3 35 3 3 4 0 a a 3-1, Suponga que se resta 15 de cada observaci6n. Los datos codificados se muestran en la tabla 3-5. Es sencillo verificar que 55, = (BP HEH +44)? “2 = 636.96 Snaps = 2E HO HCN?" preg Z hoon 5 25 acién de £ y stecaso.f esdecit, SS, =161.20 t Alcomparar estas sumas de cuadrados von las que se obtuvicron en el ejemplo 3-1, se observa que al res- ae z tar una constante de los datos originales las sumas de cuadrados no se modifican. 4 Suponga ahora que cada una de las observaciones del ejemplo 3-1 se multiplica por 2. Es sencillo veri- Nit aap oe ficar que las sumas de cuadrados de los datos transformados son SS, = 2547.84, SSpaurseune = 1903.04 ; § ‘SS_ = 644.80. Estas sumas de cuadrados parecen difcrir considerablemente de las que se obtuvieron en el € ejemplo 3-1. Sin embargo, sise dividen por 4 (es decir, 2), los resultados son idénticos. Por ejemplo, para £ {a suma de cuadrados de los tratamicntos, 1903.04/4 = 475.76, Asimismo, para los datos codificados, el z cociente F es = (1903.04/4)/(644.80/20) = 14.76, que es idéntico al cociente F de los datos originales, nome Por lo tanto, los andlisis de varianza son equivalentes. Pruebas de aleatorizacién y andlisis de varianza . £ En el desarrollo del andlisis de varianza con la prueba F, se ha utilizado el supuesto de que los exrores srrorde = aleatorios , son variables aleatorias que siguen una dstribucién normale independiente. También es po. © sible justificar la prueba F como la aproximacin de una prueba de aleatorizacion. Para ilustrar esto, su- tamplia F —_ponga que se tienen cinco observaciones de cada uno de dex tttamientos y qae quiere rrobore la ambién & igualdad de las medias de los tratamientos. Los datos aparecerian ast: sidualy Tratamieio 1 Tratamiento 2 An al ex- a —_—_—A aes ' Ya Ya foot ” ve Ye Ys Ja Ja tose a “ “hificada Podria usarse el andlisis de varianza con la prueba F para probar Hit, = st; De manera alternativa, po- sjemiplo drfa recurrirse a un enfoque un tanto diferente. Suponga que se consideran todas las formas posibles de 74 CAITULO3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANALISIS DE VARIANZA asignar los 10 mimeros de la muestra anterior alos dos tratamientos. Hay 101/515! = 252 arreglos posibles de las 10 observaciones. Si no hay ninguna diferencia en las medias de los tratamientos, tos 252 arreglos son igualmente posibles. Para cada uno de los 252 arreglos, se calcula el valor del estadistico F usando la ecuaci6n 3-7. A la distribucién de estos valores F se le llama distribucién de aleatorizaci6n, y un valor grande de F indica que los datos no son consistentes con la hipétesis yt, = u,, Por ejemplo, si el valor de ‘Fequese observé realmente fue excedido s6lo por 5 de los valores de la distribuci6n de aleatorizaci6n, esto corresponderia con el rechazo de Hi, = st, con un nivel de significacion de a = 5/252 = 0.0198 (0 1.98%). Observe que no es necesario ningin supuesto de normalidad en este enfoque. La dificultad con este enfoque es que, incluso en problemas relativamente pequetios, los célculos re- queridos hacen inviable la enumeraci6n de ta distribucién de aleatorizaci6n exacta. Sin embargo, nume- rosos estudios han demostrado que la distribucién F comin de la teoria normal es una buena aproximacién de la distribucién de aleatorizacién exacta, Por lo tanto, incluso sin el supuesto de normali- dad, la prueba F puede considerarse como una aproximacién de la prucba de alcatorizacién. Para més de- talles sobre las pruebas de aleatorizacién en el andlisis de varianza, ver Box, Hunter y Hunter (18). 3-3.3, Estimacién de los parémetros del modelo Se presentan ahora los estimadores de los parémetros del modelo con un solo factor y= ute te, ylos intervalos de confianza para las medias de los tratamientos. Més adelante sc demostraré que estima- dores razonabies de la media global y de los efectos de los tratamientos estén dados por oe: 31 “3, TEA Qova ae 7 Estos estimadores poseen un considerable atractivo intuitivo; observe que la media global se estima con el gran promedio de las observacionesy que el efecto de cualquier tratamiento no es sino la diferencia en- tre el promedio del tratamiento y el gran promedi Es posible determinar con facilidad una estimacién del intervalo de confianza de la media del trata- miento -ésimo, La media del tratamiento /-€simo es, B= att, Unestimador puntual de seria Ahora bien, sise supone que los exrores siguen u tribucisn normal, cada, es ena NID(j, oi), Por lo tanto, sic? fuera conocida, podria usase la distrib ci6n normal para definir el intervalo de confianza. Al utilizar MS; como estimador de 0”, el intervalo de confianza se basaria en la distribucién t. Por lo tanto, un intervalo de confianza de 100(1 ~a) por ciento para la media 4, del tratamiento i-ésimo es (12) Un intervalo de confianza de 100(1 - a) por ciento para la diferencia en las medias de dos tratamientos cualesquiera, por ejemplo 14, ~ 1, seria (13) ee EJED Utili tos ¢ Uni ecua

You might also like