You are on page 1of 16
Analisis de Vayianza (AWoUh ) Para comenzar, ampliaremos el trabajo de as secciones 11.8 y 11.9 consideraremos problemas en que debemos decisirsilas diferencias observadas enize mas de dos me- dias se pueden atrbuiralazar asi existen diferencias reales ene las medias de las po- Dlaciones de ias que se efectia el muestreo. Por ejempln, tal vez querramos decidir con base en datos muestraies sien realidad exste alguna diferencia en la electvigad de "res métodos de ensefianza de una lengua extrenjera, quizé deseemos comparar a produccién promedio por acre de distintas variedades digo, es probable que querra- ‘mos ver si realmente existe alguna diferencia en ei rendimiento promedio obtenido con cvatro clases de gasolin o sien realidad hay una diferencia en la durabildad de cinco clases de allombra y asi sucesivamente, El método que presentaremos para este pro. p6sito es un instrument estadistico poderoso conocido como el andlisis de varianza, ANOVA, pera resumir Sin embargo, estono es ldo. En relacion con el primero de los cuatro ejemplos an teriores podriamos ir un paso mas alld y preguntar si una diferencia observada en la electividad de ios métodos de ensehanza en realidad se debe a estos métodos yno a los profesores que tos usan aia calidad de os textos que se usan 0, digamos, a Iain leligencia de los estudiantes a quienes se ensefa. Asi mismo, por lo que respectaa las diferentes variedades de igo, podriamos preguniarsilas diferencias observadas en su rendimiento realmente son consecuencia de su calidad y no del uso de distintos fet zante, las diferencias dela calidad del suelo o,digamos. as diferencias de la cantidad de irigacion que se aplica ai suelo. Como dice el rein, las preguntas como éstas tie- rien un mar de posibildades, ya que pueden llevar 3 vasto tema det diseo experi- mental 9 diseo de experimentos: es decir al problema de la planificacién de expe- rimentos de tal modo que se puedan hacer pregunias signficativas y sometérseles @ prueba Después de' un ejemplo introductorio en a seccion 14.1 presentaremos el analisis de la varianza de un sentido en ia seccién 14.3, el andlisis de fa varianza de dos sen- tidos ena seccién 14.5 y una generalizacion en la seccion 14.7, Enas secciones 14.2, 4144, 146 y 148 estudiamos varios temas relacionados con el diserio experimental 141+ ‘ : DIFERENCIAS ENTRE & MEDIAS: UN EJEMPLO Presentemos la clase de problema que tenemos aguf por medio de un ejemplo, Supon- iba, por ejemplo, que queremos comparar la aecisn de limpieza de tres detergentes con base en las siguientes lecturas de blancura hechas de quince prendas blancs, que pri ‘mero se mancharon con tinta y luego se lavaron en una méquina lavadora de agitaciéin ‘con los detergentes respectivos: Detergeme A: 77 81 11 76 80 Detergente B: 72.58 74 66 70 Detergente C- 76 85 82 $0.77 aber si las diferencias Reet Las medias de estas tres muestras son 77, 68 y 80 y querriamos centre éstas son significativas o i se pueden atribuir al azar SHO N10 IGRI NCASENTREA MEDIAS UN DIEO 985) 388 En muchos problemas como éste, si j1, Ha. ¥ ps Son las medias de k poblaciones de las que se efectita el muestreo, queremos probar la hip6tesis mula Wye contra la hipétesis alteriativa de gile no todas estas y°s son diferentes.’ Se respaldaria esta hipétesis nula si las diferencias entre las medias muestrales son pequefias y s¢ res- aldarfa la hipétesis alternativa si por lo menos algunas de las diferencias entre las me~ dias de las muestras son grandes, Asi, necesitamos una medids precisa de las discrepan- cias entre lar y una regia que nos indique cuéndo son tan grandes las discrepancias que se deberfa rechazar la hipétesis nula. ‘Alternativas posibles para dicha medida son la desviacién estindar de las Z0sy va~ rianza, Para determinar ésta iltine para auestro ejemplo sobre las lectras de blancura ‘obtenidas para las prendas lavadas con los tres detergentes, primero calculamos Ia me- dia de las ¥, obteniendo 77 + 68 + 80 : 8 Entonees, sustituyende en fa formula que define la varianza de la muestta, obienemos sgn (11S) 4108 ~ 157 + (80 759° : se =39 donde se usa el subindice ¥ para expresar que ésta es lavarianza de las medias muestra- les. Ahora hagamos dos suposiciones que som criticas para ef método con el que ania fizaremos nuestro problema: Las poblaciones de Jas que efectuamos el muestreo tienen distribu ciones aproximadamente normales. 2. Todas estas poblaciones tienen la misma desviacién esténday 0, En telacién con nuestse ejemplo, esto implica que debemos suponer que las lecturas de blancura, para cada detergente, son valores de una variable aleatoria que tiene por lo "En reac cone trabajo poseior Se ese captulo, es deseabe ques xpresen esas medias como My ea, BRN F y Donde seconoce comoa media general y las a's, cuyasumaes cer (véate el eleticiy 14,18 dela pina 399), se ‘conocen como ls efectos de Io tratamientos. Ea ela noticién probamoslahiptsis mula ay = 9. © 4 #0 conta la aherativa de que no los ars eon cero, (CAPA ANALISIS DE VARIANZA ‘menos aproximadamente und distribucidn rorsat y estas ves variables aleatorias te fon la misma desviaci6n esténdar 0. Con estas suposiciones y si la hipétesis nula py = Hs = Hy es verdadera, considers: ‘mos las tes muestras como si provinieran de una y In misma poblacién (par lo menos aproximadamente normal) v, por tanto, pademos considerar 32, fa varianza de sus te ias, como una estimacivin de 7. cheuadeade del error estindar dela media, Abora, yi 2: "para muestras aleatorias de tamafo 1 de pobfactones infinitas, pode- considerar «2 como ena estimaciin de ¥¥ Por tango, podemos considera 1 plo, entonces tenemos, ‘vomo una estimacién de o,f varianza camiin de tas tres poblackones de las que eee tuamos ef mucstteo Nétese queesigextimacign se basa.en a varigcign cnt las es medias muestrales.. Si conociéramos 0°, comparariamos 1+42 con 6" y rechazariamos la hipStesis mula de que todas las medias de Ia poblacié son iguals si este vofor es muctio més grande que 6, Empero, en la mayoria de fos problemas pricticos, nase conace 0” y nse tiene mis alternativa que estimaela con bese en los datos de la muesira. Habiendo supuesto, de acuerdo con la bipotesis mula, gue estas tres muestras, de hecho, se derivan de poblacio- nes idéntioas, podriamos usar cualquiera de sus varianaas. sfv3§. 0 33. como.una se- gqunda estimacién deo" y también podriamas usar su media. Entances, promediando 0 dando peso a fas res varianzas mueserales de nuestro ejemplo, obtenemos un aatos> ‘MTB > oxros> MTB > oxros> rp > consusTo C1 77 81 21 76 ae congunto ¢2 72 58 76 66 70 consunro C3 76 85 82 88 77 novo ci-c3 ANALISIS DE VARIANZA . PUENTE ERROR TOTAL neve. a a 3 DESVIACION ESTANDAR PESADA = 4.88 INDIVIDUAL 95 PCT CY’ s PARA LA MEDIA CON BASE EN LA OESUIACION ESTANDAR PESAOA 5 77.00 3.948 5 68lea 6132 5 3167 | Férmulas de edleulo para as sumas de ‘cuadrados (tamaitos muesiroles diferentes) FIGURA 142 _Impresin por computadora para el anilisis dela varianza de un sentido. comparaciones adicionales entre las medias de la poblacién. Aqui no profundizaren: al respecto. Algunos programas de computacién de estadistica también dan la prob:~ bilidad de cola, es decir, a probabilidad de obtener un valor mayara menor que el valor cobservado de cuando la hipotesis nula es verdadera. Para nuestro ejemplo, ésta es apraximadamente 0.005, | método que hemos discutido aqut se aplica s6}o euanda todos los tamaiios de la ‘muestra son iguales, pero ligeras modificaciones lo hacen plicable también cuando n0 todos los tamafios de la muestra son iguales, Sila **"* muestra es de tamalio m, Ins f6r- ‘mulas de célculo para las sumas de cuadrados se eonvierten en donde N= +n +... + m4, El nica cambio adicional es que el numero fora) de grads de libertad es N= 1 y que los grados de libertad para los tratamientos y el error son k-VyN-& EJEMPLO Un leboratorista quiere comparar la fuerza de ruptura de tres clases de cuerda y origi ‘nalmente habia planificado repetir cada determinacidn seis veces. No vbstante, al 20 AANALISIS DE VARIANZA contar con tiempo suficiente, debe basar su anslisis en los resultados siguientes (en onzas) Cuerda I: 18.0 16.4 15.7 19.6 16.5 182 Cuerda 2: 21.1 17.8 18.6 20.8 17.9 190 Cuerda 3: 16.5 178 16.1 Efectic un andlisis de varianza para probar, en el nivel de significancia 0.05, si las di- ferencias entre las medias muestrales son significativas, Solucion 1. Hes w= p= ps Hq. no todas tas 4s son iguales. + 2 q@=005 , 3. Serecha i hipstesis nilasiF' 3.89 donde Fse debe determina por medio de un anliss de vvianaay 389 excl valorde Fos par k= =3—1= 29 N= k= 153212 graosde liberal deciro modoseacept lahipstesisnulao sereserva _ 4. Suttuyendo m =6,m =6,m)=3,N=15, T= 1044, Ty = 1152, 7), = 504, 7 70.0 £22= 4897 a6 enlas frmulas de culo para las suas decuadras, cttenemos sor = 489746 rao) = 346 eee pec 1 sacri = 108 152? 27007 an ain y SSE = 37.46 — 151 Ya que los grados de libertad son k— entonces obtenemos scr) = BP y todos estos resultados se resumen en Ia siguiente tabla del andlisis de varianza: Fuente de Grados | Sumade | Medias de variacién | deliberted | euadrados |euadrados| °F Tratamientes 2 wiz 756 | 406 Error 2 ne | 186 Towal 4 3746 SFC. | ANALISIS DEVARIANZA EN CNSENTIDO 397 otras 5. Dado que F palabras, podesnos coneluir que hay una diferencia en clases de cuert 06 28 mayor que 3.89, se debe rechazar ts hipsitesis nula: resistencia ste las tees Este ejemplo también podria utilizarel valor de p. Los tres pasos Finales serian Estos: 3°. Blestadisticn es _MS(T*) ‘MSE Encventre 7.56 406 Perk Ya que P= 4.06 cae entre 3.8 y 6.93, los valores de Fin Fou par? y 12 gra dos de litertad, enconirames que 0.1 < p= 0.05. 5 Dado que el nivel de imporancia so espeifvs co 05, concluimos, Jgual que antes, que se debe revhaear la hipétesis mule. Sino se hubiers espe catlo el nvel de significancia,simplemenie pita haber expresado que 0 01

9 8 (2 617s 6 R19 Lubricante 2: 0 Pruebe en el nivel (01 de sigificancia si se pueden ati Lovin al uzur las diferencias entre las tes medias de la 14.17 Pargestudiar el endimientode una lancha de motor dise- Fada ecientemente, se cronometré un recoreido en varias condiciones de viento y agua: Use losdatos siguientes (en minutos) para probar, en el nivel de significancia 0.08, si son significaivas las diferencias entre las tres medias Je Ja muestea: Condiciones de calma: 26 19 16 22 Condiciones moderadas: 28 27-28 20 18 23 Condiciones varigbles: 23-28 8 M26 14.18 En elacin eon I notaal pie de a pagina 394, veriique que la suma de los efectos de ls tratamientas.tas as, aul le aver, 14.19 Verifique que k= 1, laexpresién para el total de grades de libertad de a tabla dela pigina 402, equivale a fa sma dek= Ly 4(s~1), estos, lasuma de los grados de liber« tad para os tratamientos y el exer. 1420. Verifique que ta cantidad conocida eam Ia DESVIA= CIONESTANDAR PESADA dela figura 14.2es lariz ‘euadrada del valor obtenido para {{s} + sf +93) de la gin 387, #1421 Verifique simbsticamente que para un andlisis de varian 2a de un sentido « sus SUC15). J ANALISISE-VARIANZA KAUN SENTIDO 989 See D gay Se donde stavros dela 1422 Cuando k=2y estamos prodando la hipétesis nula yx = 1 contra la hipétesisaltermativa ty = 42, et andlisis de varianza de un serido esate aa prueba dela de os 144 esas de a seccidn 11.9, De hecho, se puede demos tear que F debe ser igual que ’, donde F'y #30m tos esta Alisticos sobre los cuales se busin las pruebas respectivas ‘feet un andisis de varianza para los datos del eer cio 11,106 de la pagina 320 y demuesire que el valor vb tenide para F equivale al cuadrado Jel valor gbtenido para renel ejercicia C106. EL DISENO DE EXPERIMENTOS: BLOQUEQ Para presentar otro importante concepto de! disefto de experimentos. suponga jus se aplica un examen de leavira de comnprension que los resultados son Escuela A Boeuela Excusta Excuela D. a mvesiras aleaterias de euatra escralas ¥ 37 70 92 4375: 56 1% 66 3 67 83 70 Lasmedias de estas Cuatro muestra son 83,5862 17 y dado que tis diereneins emre étas son muy altas, parecera zonable concur que existenalgunss diferencias reales cena compcensin de leeraraptomedio de los estudiantes de octavo grado de las ato cexcuelas. No obstante, esto nose deriva de un anlisis de varanzs de un seatide, Teneo Fuente de Tranamienos Y¥ pesto que F = 2.9 ¢s menor que 4 C7, ei yalor de sis ayia de gue todas 1 tno se puede rechaac ahi Brae time PS = — ‘Suma de i T edi de 7 vadrados \cwadrades) F_ | aarare mf Grados de ibersod Fane pa Sy 2 grados debit, se tapablacisn 8 re les) en ef nivel de significancia 9.08. DD CAM Ie) ANALISIS DE VARIANA

You might also like