Professional Documents
Culture Documents
MODELOS ESPECIALES
Diseño de Experimentos
Rafael Chacolla Huaringa A00807654
Mariana Elizondo García A00795431
Roberto Portillo Lara A00806031
Noviembre 2010
1. Diseños anidados
1.1 Introducción
Donde, existen a niveles para el factor A, b niveles para el factor B anidado debajo de
cada nivel A, y n replicas. El subíndice j(i)indica que el nivel j del factor B se encuentra
anidado debajo del nivel i del factor A. Es adecuado considerar a las réplicas como
anidadas dentro de las combinaciones de los niveles A y B; de esta forma, el subíndice
(ij)k se utiliza para el término del error. Este es un diseño anidado balanceado debido
a que existe un igual número de niveles de B dentro de cada nivel de A y un igual
número de réplicas. Debido a que no todos los niveles del factor B aparecen dentro de
cada nivel del factor A, no puede existir ninguna interacción entre A y B. La suma de
cuadrados total puede escribirse como:
Esto debido a que los tres términos de productos cruzados son cero. La ecuación
anterior indica que el total de la suma de cuadrados puede ser particionada en una
suma de cuadrados debido al factor A, una suma de cuadrados debido al factor B
debajo de los niveles de A y una suma de cuadrados debido al error. Simbólicamente,
esto equivale a:
Se tienen grados de libertad para , grados de libertad para ,
grados de libertad para y grados de libertad para el error.
Nótese que . Si los errores son ,
se puede dividir cada suma de cuadrados a la derecha de la ecuación anterior entre
sus grados de libertad para obtener cuadrados medios independientemente
distribuidos de forma que el ratio de cualquier par de cuadrados medios se distribuya
como una F.
El análisis estadístico apropiado para probar los efectos del factor A y B depende de si
A y B son factores fijos o aleatorios. Si los factores A y B son fijos, asumimos que
y . Esto es que los A efectos de los
tratamientos suman cero y que los B efectos de los tratamientos suman cero dentro de
cada nivel de A. Alternativamente, si A y B son aleatorios, asumimos que es
y es . Modelos mezclados con A fijos y B aleatorios también
con ampliamente utilizados. Los cuadrados medios esperados pueden ser
determinados de la siguiente forma:
E(MSA)
E(MSB(A))
E(MSE)
A MSA
B dentro de A MSB(A)
Error MSE
Total
(2.9)
Esto expresa la idea de que SSB(A) es la suma de cuadrados entre los niveles de B por
cada nivel de A, sumados a través de todos los niveles de A.
Otro ejemplo sobre la aplicación de este tipo de diseño viene del campo de la
proteómica. La proteómica es el estudio de la totalidad del complemento proteico
expresado por un genoma en una determinada célula o tejido. En la actualidad, el
desarrollo de esta tecnología conlleva numerosas dificultades tanto experimentales
como analíticas. En particular parece existir un cierto nivel de confusión en la
comunidad científica acerca de la naturaleza de la replicación. Las réplicas en este tipo
de experimentos pueden ser de dos tipos. Réplicas técnicas que son medidas repetidas
de la misma muestra biológica y réplicas biológicas que son diferentes muestras
provenientes de un grupo con el mismo tratamiento. El tipo de réplica utilizado afecta
el tipo de análisis estadístico que puede ser llevado a cabo y las conclusiones que se
pueden obtener.
Karp y colaboradores (2005) elaboraron un estudio sobre los tipos de réplicas que
provee además algunas guías para el análisis de datos de proteómica. En este caso, las
pruebas estadísticas dependen de la suposición de que cada medida corresponde a
una muestra independiente. Sin embargo, las réplicas técnicas provienen de la misma
muestra biológica, por lo tanto no son independientes y tienden a arrojar medidas
similares. En este trabajo se propone una prueba estadística alternativa basada en el
análisis de varianza y se demuestra que la utilización del método incorrecto de
análisis conlleva a la sobrevaloración de los niveles de significancia obtenidos. Una
alternativa apropiada al ANOVA de una sola vía usado tradicionalmente es un ANOVA
del tipo anidado.
Figura 1.2Estructura de las réplicas para los dos tipos de ANOVA utilizados
En este tipo de diseño se puede emplear una serie de réplicas técnicas y biológicas.
Esta prueba puede tomar en consideración la relación que existe entre las réplicas
técnicas obtenidas a partir de la misma muestra biológica al buscar cambios
significativos.
La figura 3.2 provee una representación gráfica de la jerarquía considerada en el
ANOVA de una sola vía versus el ANOVA anidado. Los resultados de este estudio
demuestran que el ANOVA de una sola vía sobreestima el significado de la mayoría de
las muestras procesadas dado que resultó en valores p menores. Entonces, el ANOVA
de una sola vía sobreestima el nivel de significancia de las diferencias entre los
grupos. La diferencia en los valores p observados depende de la diferencia en la
varianza técnica y biológica. Mientras más similar sea la varianza biológica de la
técnica, menor será la diferencia en los valores p. Este estudio demuestra que mezclar
tipos de réplicas sin el análisis apropiado conlleva usualmente a la obtención de
resultados falsos positivos.
2. Diseños Split Plot
2.1 Introducción
Bloque 1 Bloque 2
A3 A1 A2 A4 A4 A2 A1 A3
B3 B2 B1 B1 B1 B1 B2 B3
B2 B1 B2 B3 B3 B2 B1 B2
B1 B3 B3 B2 B2 B3 B3 B1
Cuando uno de los factores, por su naturaleza, exige parcelas relativamente grandes,
por ejemplo, sistemas de labranza, de irrigación, distancias entre surcos, niveles de luz
o de temperatura; mientras que el otro factor permite su aplicación sobre unidades
experimentales más pequeñas como variedades, distancia entre plantas, dosis de
fertilizantes, etc.
Cuando en un experimento se toman varias mediciones sobre la misma unidad
experimental a través del tiempo y tales mediciones son independientes, puede
considerarse el conjunto de las mediciones realizadas sobre una misma unidad
experimental como la Unidad Principal, y cada una de las lecturas realizadas en el
tiempo como las subunidades. El análisis es análogo al de un diseño Parcelas
Divididas (en el espacio), por lo que se le designa a este diseño como Parcelas
Divididas en el Tiempo.
Si luego de iniciado el experimento se desea incluir otro factor —y su naturaleza lo
permite—, pueden dividirse las unidades experimentales y realizar la aleatorización
de los niveles del segundo factor en las subunidades resultantes.
2.3 Modelo matemático y análisis Estadístico
Como el análisis estadístico debe tomar en cuenta la presencia de dos tipos o tamaños
diferentes de unidades experimentales en el experimento, los efectos del factor A se
estiman a partir de las parcelas completas, mientras que los efectos del factor B y de
la interacción AB se estiman a partir de las sub-parcelas para el factor B. Como las
parcelas completas y sub-parcelas son unidades experimentales de distintos tamaños
o tipos, tienen diferente precisión, lo que debe considerarse para hacer
comparaciones entre las medias de tratamiento. La consideración de dos errores
separados es consecuencia del hecho de que las observaciones de distintas
subparceles en la misma parcela pueden tener una correlación positiva. La
correlación refleja la naturaleza de las unidades experimentales que responden de
manera similar cuando son adyacentes, como las subparcelas vecinas, los estudiantes
en un salón de clase, los cultivos en una cámara de cultivo o las unidades del mismo
lote de materia prima en un experimento industrial.
Como consecuencia de estas diferencias en los errores asociados con las
comparaciones de parcelas completas y sub-parcelas de tratamientos, la partición de
la suma de cuadrados en el análisis de varianza se altera un poco con respecto a la
partición para el diseño factorial de dos factores. Las particiones para los efectos
del factor y los factores de bloque permanecen igual que los diseños factoriales
usuales, pero el error experimental se divide en dos componentes. Una
componente del error experimental se asocia con el factor de tratamiento de la
parcela completa y la otra con el factor de tratamiento de la sub-parcela y la
interacción.
Para diseñar parcelas divididas se usa una formulación de modelo mixto que refleje
las distintas varianzas del error experimental para las sub-parcelas y la parcela
completa, lo que incluye los efectos del error aleatorio por separado para ambas. Si el
factor de tratamiento de la parcela completa se coloca en un diseño de bloques
totalmente aleatorizado el modelo lineal es:
Simbólicamente
0 kg/ha (a0)
Fertilizante (a) 100 kg/ha (a1)
200 kg/ha (a 2)
38 días (b1)
Frecuencias de corte (b) 57 días (b2)
76 días (b3)
A1 B3 B1 B2 A0 B1 B2 B3 A2 B3 B2 B1
A2 B2 B3 B1 A1 B3 B2 B1 A0 B3 B1 B2
A0 B1 B2 B3 A2 B3 B1 B2 A1 B1 B2 B3
Tratamientos Bloques
I II III Yij.
a0 b 1 78.9 72.5 78.6 230.0
a0 b 2 68.1 66.1 69.3 203.5
a0 b 3 56.9 57.1 53.9 167.9
Y0.k 203.9 195.7 201.8 601.4
a1 b 1 84.3 99.3 72.9 256.5
a1 b 2 86.8 108.9 86.6 282.3
a1 b 3 73.1 73.4 61.7 208.2
Y1.k 244.2 281.6 221.2 747.0
a2 b 1 95.6 95.2 96.9 287.7
a2 b 2 97.8 108.1 99.2 305.1
a2 b 3 90.3 121.4 97.6 309.3
Y2.k 283.7 324.7 293.7 902.1
Y..k 731.8 802.0 716.7 Y…=2250.5
Con el fin de ilustrar el proceso de análisis, éste se desglosa en dos partes: el análisis
de las Parcelas Principales y el análisis de las Sub-parcelas. Se inicia con la parte
correspondiente a las Parcelas Principales.
Bloque I Bloque II Bloque
III
a1 a0 a2
a2 a1 a0
a0 a2 a1
Se hacen particiones tanto de las sumas de cuadrados como de los grados de libertad
correspondientes a las parcelas grandes, acorde con el esquema de aleatorización
usado para el factor principal.
I II II Yi..
a0 203.9 195.7 201.8 601.4
a1 244.2 281.6 221.2 747.0
a2 283.7 324.7 293.7 902.1
Y..k 731.8 802.0 716.7 2250.5
Las Parcelas Grandes están conformadas por las combinaciones Bloques*a (por las
combinaciones r*a, en un DCA)
TC= Término de
corrección
Antes de pasar al análisis de las sub-parcelas, es importante analizar el esquema
completo que ilustra la forma en que se particionan tanto las sumas de cuadrados
como los grados de libertad.
Bloques
(r-1)=2
Parcelas Grandes A
(a*r)-1=8 (a-1)=2
Error a
(r-1)(a-1)=4
Total Tratamientos
(a*b*r)-1=26 (a*b-1)=8
B
(b-1)=2
Sub-parcelas AB
a*r(b-1)=18 (a-1)(b-1)=4
Error b
a(r-1)(b-1)=12
b1 b2 b3
a0 230 203.5 167.9
a1 256.5 282.3 208.2
a2 287.7 305.1 309.3
Y.j. 774.2 790.9 685.4
A
Tratamientos B
AB
Tabla del Análisis de Varianza
El efecto principal del factor a (A) se evalúa con el Error a; mientras que el efecto
principal del factor b (B) y la interacción AB se evalúan con el Error b.
En caso de tener más de dos factores, las interacciones entre factores asignados a las
parcelas principales se evalúan con el Error a; las interacciones entre factores
asignados a las sub-parcelas o interacciones de éstos con algún factor asignado a las
parcelas principales se evalúan con el Error b.
f1 = a(b - l)(r - l), los grados de libertad para el error en la subparcela CME(2), y f 2 =
(ab - l)(r - l), los grados de libertad para el error experimental del bloque totalmente
aleatorizado.
Eficiencia de las comparaciones de parcelas completas
La eficiencia relativa de los diseños de parcelas divididas con respecto al diseño de
bloques totalmente aleatorizado para las parcelas completas es:
En los experimentos con mezclas, los factores son componentes o ingredientes de una
mezcla y, por consiguiente, sus niveles no son independientes. Por ejemplo, si x1, x2, …,
xp denota las proporciones de p componentes de una mezcla, entonces
Figura 3.1 Espacio de los factores restringidos para una mezcla con p=2 componentes.
Mezclas con tres componentes
Con tres componentes, el espacio de la mezcla es un triángulo con vértices que
corresponden a las formulaciones que son mezclas puras (mezclas que son 100%
de un solo componente) (Figura 2).
Figura 3.2Espacio de los factores restringidos para una mezcla con p= 3 componentes.
Las formas estándares de los modelos matemáticos para mezclas que se usan
ampliamente son:
Lineal
Cuadrático
Cúbico
completo
Cúbico
especial
En las ecuaciones anteriores, el parámetro representa la respuesta esperada
para la mezcla pura xi=1 y xj=0 cuando j ≠ i. A la porción
se le llama proporción de mezcla lineal. Cuando hay curvatura derivada de
una mezcla no lineal entre pares de componentes, los parámetros βij representan
una mezcla sinérgica o bien antagónica. Los términos de órdenes superiores suelen
ser necesarios en los modelos para mezclas porque:
1) Los fenómenos estudiados pueden ser complejos.
2) La región experimental con frecuencia es la región de operabilidad
completa y, en consecuencia, es grande y requiere un modelo elaborado.
3.5 Regiones restringidas
son muy comunes. Cuando sólo están presentes restricciones sobre la frontera
inferior, la región factible del diseño sigue siendo un diseño símplex, pero se
inscribe dentro de la región del símplex original (Figura 3.6). Esta situación puede
simplificarse mediante la introducción de pseudocomponentes, definidos como:
con . Entonces,
por lo regular no son diseños símplex o son símplex invertidos con respecto a la
región del símplex original (Figura 3.7).
En este caso también se utilizan pseudocomponentes, ahora definidos como:
con . Entonces,
Debido a que el símplex tiene una orientación inversa al símplex original, el signo
de los coeficientes lineales en el modelo matemático será opuesto.
3.6 Ejemplo
Mixed Culture Optimization for Marigold Flower Ensilage via Experimental Design
and Response Surface Methodology
Efecto simbiótico o antagonista. Diseño de cultivos mixtos.
Para explorar la existencia de una relación simbiótica o antagonista entre
diferentes microorganismos en lo que se refiere a su producción enzimática, los
autores de este artículo plantearon un diseño símplex de centroide. Ellos utilizaron
el extracto enzimático crudo (є) de tres microorganismos [Flavo bacteriumIIb (C1),
A. anitratus (C2) y R. nigricans (H1)], los cuales había mostrado tener una actividad
enzimática alta en estudios anteriores. En cada experimento evaluaron la actividad
como el cambio en la viscosidad a una solución CMC, obteniendo los siguientes
resultados:
Figura 3.9 Diseño de experimentos para cultivos mixtos con el microorganismo de mayor actividad de
celulasa.
El análisis de los datos sugirió un modelo especial cúbico (el ajuste se realizó
utilizando mínimos cuadrados):
Figura 3.10 Contornos de la superficie de respuesta estimada para el modelo especial cúbico.