You are on page 1of 19

GENERALIDADES Este es un diseo compuesto por una combinacin de factores.

Un factor puede se entendido como cada variable o tratamiento que se desea estudiar. En general, cada factor presentar diferentes niveles siendo estos los que producen los distintos tratamientos en un ensayo. El nmero de factores y niveles que pueden ser comparados en una experiencia est limitado slo por consideraciones prcticas. Como se estudian dos o ms variables se genera un nuevo efecto llamado INTERACCION que puede ser definida como la variacin debida a la combinacin de factores, no debida a ellos por separado sino al que acten en forma conjunta sobre la variable. Por lo general, las letras maysculas son usadas para sealar los factores como A, B, C,....,etc., en donde A puede ser Estrato socioeconmico, B Tramo de ingresos,....,etc. Las letras minsculas como a, b, c,....,etc, pueden ser utilizadas para indicar el nmero de niveles de cada factor. Por ejemplo: a = 4 Estrato socioeconmico es usado en 4 niveles B = 3 Tramo de ingreso es usado en 3 niveles Como nomenclatura podemos generar, por ejemplo, 4x5 Factorial Primer factor a 4 niveles Segundo factor a 5 niveles Primer factor a 2 niveles Segundo factor a 4 niveles Tercer factor a 6 niveles Cuarto factor a 6 niveles

2x4x62

Factorial

Dado la simpleza de su exposicin y que el estudio de l permite acceder al total de conceptos e ideas que por lo general estn implcitas en este diseo, en esta oportunidad slo se analizara el modelo de dos factores.

MODELO DE DOS FACTORES (O FACTORIAL DE DOS POR DOS) POBLACION Poblacin finita en la que se estudia el comportamiento de una variable Y cuya respuesta se supone que es funcin lineal de dos variables fijas ( no aleatorias ), mas un tercer efecto generado por la accin conjunta de ambas y una componente de error e denominada Error Experimental. MODELO POBLACIONAL A B r Niveles c Niveles ( r del Ingls row que significa fila ) ( c del Ingls column que significa columna )

En este diseo se debe considerar dos o ms observaciones para cada combinacin de niveles de factores. Adems Asumimos que los efectos de los dos factores en conjunto son posiblemente dependientes actuando del mismo modo, unos sobre otros. As las cosas, el efecto de interaccin es un tipo de efecto producido por los factores A y B en conjunto. La expresin funcional de este modelo es:

yijk = + i + j + ( ) ij + eijk

i = 1, 2, ..., r

j = 1, 2, ..., c

k = 1, 2, ..., n

yijk: Observacin de la k-sima respuesta en el nivel i del Factor A y nivel j del Factor B . : Media global ( de la poblacin ) o efecto comn presente en todas las observaciones i: Efecto Factor A en su nivel i j: Efecto Factor B en su nivel j eijk: Error experimental k-sima observacin nivel i Factor A y nivel j Factor B. Supuestos Las observaciones en cada una de las rc celdas constituyen una muestra aleatoria independiente de tamao n extrada de la poblacin definida por la combinacin particular de los niveles de los dos factores. eijk siguen un modelo de probabilidad normal con media 0 y varianza comn 2 . Los dos factores son de efectos fijos asumindose interaccin entre ellos. NOTA Si k = 1 ( modelo sin replica ), la varianza del modelo no ser estimable y no hay forma de contrastar la significatividad de los parmetros. En los diseos factoriales nicamente se tiene residuos no nulos y por tanto la posibilidad de contrastar el modelo cuando: Suponemos que las interacciones son nula Replicamos el experimento, tomando varias observaciones para cada combinacin de factores

DISPOSICION DE LOS DATOS En este diseo el tratamiento de las formulas implcitas se har en base a la siguiente organizacin de los datos donde las filas representan el Factor A y la columnas el Factor B.

COMPONENTES DE LA VARIANZA El modelo

yijk = + i + j + ( ) ij + eijk
se puede re-escribir como,

yijk

= i + j + ( ) ij + eijk

Aqu, se puede demostrar que la variacin total - VT - del modelo ( definida de base por la expresin Yijk - y conocida como Variacin Total Corregida del modelo ) se puede generar como la suma de dos componentes de variacin parciales que se encuentran implcitos en el modelo segn sigue: VF: Variacin debido al efecto del factor Fila o A VC: Variacin debido al efecto del factor Columna o B. VI: Variacin debido al efecto de la Interaccin de ambos factores ( Fila y Columna juntos o AB) VE: Variacin debido al efecto de la componente de error del modelo ( variable e ) As las cosas,

INFERENCIA CLASICA SOBRE EL MODELO DOCIMAS DE HIPOTESIS Hiptesis Para la Interaccin ( AB )

Para factor Fila ( A )

Para factor Columna ( B )

Pivotes Empricos (Estadstica de prueba) Basados en una muestra aleatoria se procede a estimar los componentes de la varianza segn:

Donde,

De esta forma, la descomposicin de la variacin total en la muestra viene dada por,

As las cosas los pivotes empricos quedan definidos segn sigue:

Para Interaccin ( AB )

Para Factor Fila ( A )

Para Factor Columna ( B )

Reglas de Decisin Se determina un riesgo fijo y se procede como sigue:

Para Interaccin ( AB ) Fijo el riesgo , entonces: Pivote Terico

Decisin Procedemos a RECHAZAR Ho si,

Para Factor Fila ( A )

Fijo el riesgo , entonces: Pivote Terico

Decisin Procedemos a RECHAZAR Ho si,

Para Factor Columna ( B ) Fijo el riesgo , entonces: Pivote Terico

Decisin Procedemos a RECHAZAR Ho si,

NOTAS La dcima ms importante se refiere a la existencia de interacciones ( )ij. Si no las hay, el modelo es aditivo y las inferencias respecto a i ( j ) son vlidas para todos los niveles de A ( B ). La interaccin es imposible de evaluar si slo tenemos 1 observacin por celda. El nivel de significacin ( riesgo ) no presenta problemas si slo se prueba una de las tres hiptesis. Cuando se prueban las tres hiptesis, la situacin se complica ya que las tres son independientes e un sentido probabilstico. Si se fija como y los el nivel de significacin total de la prueba y se definen como , niveles asociados a las hiptesis, se puede demostrar que,

< 1 - ( 1 - )( 1 - )( 1 - )

Luego, si = = = 0.05, entonces, < 1 0.953 < 0.143

Vale decir, si se ha seleccionado un nivel de significacin de 0.05 y todas son verdaderas, entonces la probabilidad de rechazar una o ms de las tres hiptesis es menos que 0.143

Tabla de Anlisis de la Varianza (Anova )

ALGUNAS VENTAJAS Y DESVENTAJAS VENTAJAS Se puede estudiar el efecto interaccin Se hace uso ms eficiente de los recursos experimentales ya que cada unidad experimental es utilizada simultneamente para obtener la respuesta de muchos factores

DESVENTAJAS La principal es que es necesaria para su clculo la presencia de todas las posibles combinaciones. A medida que aumenta el nmero de factores o los niveles, el nmero de todas las posibles combinaciones se hace tan grande que lo torna impracticable.

COMPARACIONES MULTIPLES PRUEBAS TUKEY Factor A

WA = q[ , rc(n 1)] CME


Factor B

n*r

WB = q[ , rc(n 1)] CME

n*c

n*: Nmero de observaciones ( repeticiones ) en las parcelas

EJEMPLO Los siguientes datos corresponden a Porcentaje de hogares en pobreza extrema por Pas ( 5 pases ) y Area ( Urbano, Rural ).

El modelo de diseo para este problema viene dado segn sigue.

SOLUCION VIA CALCULO DIRECTO

EFECTUE EL ANALISIS DE LA VARIANZA Y CONCLUYA Clculos primarios Aqu la descomposicin de la varianza viene dada por: SCT Donde, = SCF + SCC + SCI + SCE

As las cosas, la tabla ANOVA es,

Interaccin

As,

Area

As,

Pas

Conclusiones El modelo no debe considerar la interaccin entre Area y Pas. Podemos ver que pasa con la comparacin mltiple de las medias por Pas ( Queda de ejercicio ). Podramos re-plantear el modelo como un diseo en bloques considerando como tal a las Areas ( urbano, Rural ). Finalmente, el aceptar la hiptesis de Interaccin nula lleva implcito que el modelo es estadsticamente aditivo todo esto, claro est, asumiendo los riesgos respectivos.

SOLUCION VIA USO SOFTWARE

PROGRAMA DE CONTROL DEL SOFTWARE R

ppobreza<c(12.31,9.06,7.02,5.33,12.80,18.96,16.81,22.45,12.61,14.01,11.92,13.89,8.43,8.75,7.58,7.93,7. 96,5.54,6.62,5.76) pais<-as.factor(c(1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5)) area<-as.factor(c(1,1,2,2,1,1,2,2,1,1,2,2,1,1,2,2,1,1,2,2)) factor.data <- data.frame(ppobreza, pais, area) fit<-aov(ppobreza ~ pais + area + pais*area,data=factor.data) # crea objeto fit con ANOVA factorial summary(fit,data=factor.data) # muestra resumen ANOVA error<-resid(fit) # obtiene residuales del modelo ajustado factor.data2 <- data.frame(ppobreza, error, pais, area) TukeyHSD(fit, data= factor.data) # Tukey test comparaciones multiples

SALIDA DEL SOFTWARE R

> ppobreza<c(12.31,9.06,7.02,5.33,12.80,18.96,16.81,22.45,12.61,14.01,11.92,13. 89,8.43,8.75,7.58,7.93,7.96,5.54,6.62,5.76) > pais<-as.factor(c(1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5)) > area<-as.factor(c(1,1,2,2,1,1,2,2,1,1,2,2,1,1,2,2,1,1,2,2)) > factor.data <- data.frame(ppobreza, pais, area) > fit<-aov(ppobreza ~ pais + area + pais*area,data=factor.data) # crea objeto fit con ANOVA > factorial function (x) gamma(x + 1) <bytecode: 0x00000000144da270> <environment: namespace:base> > summary(fit,data=factor.data) # muestra resumen ANOVA Df Sum Sq Mean Sq F value Pr(>F) pais 4 339.9 84.97 17.731 0.000155 *** area 1 1.3 1.31 0.274 0.612361 pais:area 4 34.3 8.57 1.788 0.207851 Residuals 10 47.9 4.79 --Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 > error<-resid(fit) # obtiene residuales del modelo ajustado > factor.data2 <- data.frame(ppobreza, error, pais, area) > TukeyHSD(fit, data= factor.data) # Tukey test comparaciones multiples Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = ppobreza ~ pais + area + pais * area, data = factor.data) $pais diff lwr upr p adj 2-1 9.3250 4.2308449 14.4191551 0.0009369 3-1 4.6775 -0.4166551 9.7716551 0.0758285 4-1 -0.2575 -5.3516551 4.8366551 0.9997955 5-1 -1.9600 -7.0541551 3.1341551 0.7159266 3-2 -4.6475 -9.7416551 0.4466551 0.0781238 4-2 -9.5825 -14.6766551 -4.4883449 0.0007556 5-2 -11.2850 -16.3791551 -6.1908449 0.0001978 4-3 -4.9350 -10.0291551 0.1591551 0.0586440 5-3 -6.6375 -11.7316551 -1.5433449 0.0107917 5-4 -1.7025 -6.7966551 3.3916551 0.8030132 $area diff lwr upr p adj 2-1 -0.512 -2.693251 1.669251 0.6123611

$`pais:area` diff 2:1-1:1 5.195 3:1-1:1 2.625 4:1-1:1 -2.095 5:1-1:1 -3.935 1:2-1:1 -4.510 2:2-1:1 8.945 3:2-1:1 2.220 4:2-1:1 -2.930 5:2-1:1 -4.495 3:1-2:1 -2.570 4:1-2:1 -7.290 5:1-2:1 -9.130 1:2-2:1 -9.705 2:2-2:1 3.750 3:2-2:1 -2.975 4:2-2:1 -8.125 5:2-2:1 -9.690 4:1-3:1 -4.720 5:1-3:1 -6.560 1:2-3:1 -7.135 2:2-3:1 6.320 3:2-3:1 -0.405 4:2-3:1 -5.555 5:2-3:1 -7.120 5:1-4:1 -1.840 1:2-4:1 -2.415 2:2-4:1 11.040 3:2-4:1 4.315 4:2-4:1 -0.835 5:2-4:1 -2.400 1:2-5:1 -0.575 2:2-5:1 12.880 3:2-5:1 6.155 4:2-5:1 1.005 5:2-5:1 -0.560 2:2-1:2 13.455 3:2-1:2 6.730 4:2-1:2 1.580 5:2-1:2 0.015 3:2-2:2 -6.725 4:2-2:2 -11.875 5:2-2:2 -13.440 4:2-3:2 -5.150 5:2-3:2 -6.715 5:2-4:2 -1.565

lwr -3.4705536 -6.0405536 -10.7605536 -12.6005536 -13.1755536 0.2794464 -6.4455536 -11.5955536 -13.1605536 -11.2355536 -15.9555536 -17.7955536 -18.3705536 -4.9155536 -11.6405536 -16.7905536 -18.3555536 -13.3855536 -15.2255536 -15.8005536 -2.3455536 -9.0705536 -14.2205536 -15.7855536 -10.5055536 -11.0805536 2.3744464 -4.3505536 -9.5005536 -11.0655536 -9.2405536 4.2144464 -2.5105536 -7.6605536 -9.2255536 4.7894464 -1.9355536 -7.0855536 -8.6505536 -15.3905536 -20.5405536 -22.1055536 -13.8155536 -15.3805536 -10.2305536

upr 13.8605536 11.2905536 6.5705536 4.7305536 4.1555536 17.6105536 10.8855536 5.7355536 4.1705536 6.0955536 1.3755536 -0.4644464 -1.0394464 12.4155536 5.6905536 0.5405536 -1.0244464 3.9455536 2.1055536 1.5305536 14.9855536 8.2605536 3.1105536 1.5455536 6.8255536 6.2505536 19.7055536 12.9805536 7.8305536 6.2655536 8.0905536 21.5455536 14.8205536 9.6705536 8.1055536 22.1205536 15.3955536 10.2455536 8.6805536 1.9405536 -3.2094464 -4.7744464 3.5155536 1.9505536 7.1005536

p adj 0.4230225 0.9563148 0.9889406 0.7255230 0.5837047 0.0416323 0.9839323 0.9216102 0.5874168 0.9612312 0.1225287 0.0368854 0.0253635 0.7688529 0.9153981 0.0712576 0.0256114 0.5323130 0.1940657 0.1352959 0.2246427 1.0000000 0.3494900 0.1365951 0.9954210 0.9730261 0.0108157 0.6321596 0.9999913 0.9740135 0.9999997 0.0035330 0.2479578 0.9999584 0.9999997 0.0025285 0.1746674 0.9984826 1.0000000 0.1752124 0.0064520 0.0025504 0.4328316 0.1763070 0.9985871

You might also like