You are on page 1of 24

[Escribir el nombre de la compañía]

MODELOS ESPECIALES
Diseño de Experimentos
Rafael Chacolla Huaringa A00807654
Mariana Elizondo García A00795431
Roberto Portillo Lara A00806031

Noviembre 2010
1. Diseños anidados
1.1 Introducción

El diseño de experimentos se refiere a la forma en la que el experimento se llevará a


cabo, particularmente, la forma en la que los tratamientos serán administrados a los
sujetos. Estos tratamientos pueden ser vistos como niveles cualitativa o
cuantitativamente distintos dentro del ensayo. El tipo de análisis o prueba de
hipótesis utilizada dependo del diseño experimental que se empleé. A grandes rasgos,
existen dos principales tipos de diseño de experimentos: cruzado y anidado.
En un experimento cruzado, cada sujeto es expuesto a más de una condición o
tratamiento. La característica principal de este tipo de diseño es que cada sujeto
tendrá más de un puntaje correspondiente a los tratamientos. Los efectos observados,
si existen, ocurren dentro de cada individuo. Si bien este tipo de diseño ofrece muchas
ventajas, como el hecho de requerir menos sujetos de experimentación debido a que
cada uno es usado más de una vez en el ensayo, también presenta desventajas como la
influencia de efectos acumulados.En un experimento de tipo jerarquizado o “anidado”,
cada sujeto recibe un solo nivel de la condición experimental. A su vez, la principal
característica de este tipo de diseño es que cada sujeto presenta un solo puntaje que
corresponde a un solo tratamiento. Los efectos observados nuevamente, si existen,
ocurren entre los sujetos. Las ventajas y desventajas de este diseño son opuestas a los
del diseño cruzado. Por una parte la acumulación de efectos no es un factor a
considerar, sin embargo, se requiere un número mayor de sujetos de
experimentación. En resumen, un factor cruzado contiene niveles que presentan una
propiedad física o fundamental que es la misma para todos los niveles de los demás
factores incluidos en el experimento.
Frecuentemente distintas situaciones experimentales requieren que niveles únicos de
un factor ocurran dentro de cada nivel de un segundo factor. Esta jerarquización de
factores puede surgir también cuando un procedimiento experimental restringe la
aleatorización de combinaciones factor-nivel. Considere un experimento que será
conducido utilizando tres muestras de material obtenidas de dos proveedores. En este
escenario no existe ninguna relación física o fundamental entre las muestras
marcadas 1, 2 y 3 de cada vendedor. En terminología de diseño experimental se dice
que el factor “muestras” se encuentra anidado dentro del factor “proveedor”. Este es
un diseño anidado de dos factores. Experimentos llevados a cabo para diagnosticar
fuentes de variabilidad en procesos de manufactura o en métodos de laboratorio
utilizan a menudo diseños anidados.
Los diseños anidados jerárquicos son apropiados cuando cada uno de los factores en
un experimentos esta progresivamente anidado dentro del factor precedente. La
construcción de este tipo de diseños se puede resumir de la siguiente manera:
1. Listar los factores a incluir en el experimento.
2. Determinar la jerarquía de los factores.
3. Seleccionar, aleatoriamente si es posible, un número igual de niveles para cada
factor dentro de los niveles del factor precedente.
4. Aleatorizar el orden de los ensayos o la asignación de las combinaciones factor-
nivel a las unidades experimentales.

1.2 Análisis Estadístico

El modelo estadístico linear para un diseño anidado de dos factores es el siguiente:

Donde, existen a niveles para el factor A, b niveles para el factor B anidado debajo de
cada nivel A, y n replicas. El subíndice j(i)indica que el nivel j del factor B se encuentra
anidado debajo del nivel i del factor A. Es adecuado considerar a las réplicas como
anidadas dentro de las combinaciones de los niveles A y B; de esta forma, el subíndice
(ij)k se utiliza para el término del error. Este es un diseño anidado balanceado debido
a que existe un igual número de niveles de B dentro de cada nivel de A y un igual
número de réplicas. Debido a que no todos los niveles del factor B aparecen dentro de
cada nivel del factor A, no puede existir ninguna interacción entre A y B. La suma de
cuadrados total puede escribirse como:

Expandiendo el lado derecho de la ecuación anterior se obtiene que:

Esto debido a que los tres términos de productos cruzados son cero. La ecuación
anterior indica que el total de la suma de cuadrados puede ser particionada en una
suma de cuadrados debido al factor A, una suma de cuadrados debido al factor B
debajo de los niveles de A y una suma de cuadrados debido al error. Simbólicamente,
esto equivale a:
Se tienen grados de libertad para , grados de libertad para ,
grados de libertad para y grados de libertad para el error.
Nótese que . Si los errores son ,
se puede dividir cada suma de cuadrados a la derecha de la ecuación anterior entre
sus grados de libertad para obtener cuadrados medios independientemente
distribuidos de forma que el ratio de cualquier par de cuadrados medios se distribuya
como una F.
El análisis estadístico apropiado para probar los efectos del factor A y B depende de si
A y B son factores fijos o aleatorios. Si los factores A y B son fijos, asumimos que
y . Esto es que los A efectos de los
tratamientos suman cero y que los B efectos de los tratamientos suman cero dentro de
cada nivel de A. Alternativamente, si A y B son aleatorios, asumimos que es
y es . Modelos mezclados con A fijos y B aleatorios también
con ampliamente utilizados. Los cuadrados medios esperados pueden ser
determinados de la siguiente forma:

E(MS) A Fijo A Fijo A Aleatorio


B Fijo B Aleatorio B Fijo

E(MSA)

E(MSB(A))

E(MSE)

En la tabla anterior se indica que si los niveles de A y B son fijos, se


demuestra mediante MSA/MSB y se demuestra mediante MSB(A)/MSE. Si A
es un factor fijo y B es aleatorio, entonces se demuestra mediante
MSA/MSB(A) y se demuestra mediante MSB(A)/MSE. Finalmente, si ambos
factores A y B son aleatorios, se demuestra que se demuestra mediante
MSA/MSB(A) y se demuestra mediante MSB(A)/MSE.
Las sumas de cuadrados pueden expresarse de la siguiente forma:
El procedimiento de la prueba esta resumido en la siguiente tabla de análisis de
varianza

Fuente de Suma de cuadrados Grados de Cuadrados


Variación libertad medios

A MSA

B dentro de A MSB(A)

Error MSE

Total

La ecuación para la SSB(A) puede ser escrita como:

(2.9)
Esto expresa la idea de que SSB(A) es la suma de cuadrados entre los niveles de B por
cada nivel de A, sumados a través de todos los niveles de A.

1.3 Aplicaciones y variaciones al modelo


Existen variaciones al modelo de factores anidados que modifican la forma en la que
los sujetos de experimentación se anidan en el factor precedente. Ocasionalmente en
un experimento multifactorial, algunos factores son organizados en una disposición
factorial y otros son anidados. Estos diseños son llamados diseños anidados-
factoriales.
Un potencial problema en la aplicación de diseños anidados es que algunas veces, para
obtener un número razonable de grados de libertad en el nivel más altos, se puede
terminar con demasiados grados de libertad en los niveles más bajos. Una forma de
evitar esto es utilizando un tipo particular de diseño anidado no balanceado llamado
diseño anidado escalonado. Este es un modelo parcialmente replicado que usualmente
resulta en un experimento más pequeño que el original, siempre y cuando se balanceé
la información adecuadamente.
En términos generales, un ANOVA anidado se utiliza cuando se tiene una variable de
medición y dos o más variables nominales. Las variables nominales se encuentran
anidadas, esto significa que cada valor de una variable nominal (los subgrupos) se
encuentra en combinación con un solo valor de la variable nominal precedente. La
variable superior nominal puede ser de dos tipos: modelo I o modelo II. El modelo II
es un ANOVA anidado de efectos aleatorios: todos los efectos en los distintos niveles
son aleatorios. El modelo I es un ANOVA mezclado, donde el primer nivel tiene efectos
mezclados, por ejemplo diferentes drogas o tratamientos. Todos los subgrupos,
subsubgrupos, etc., en un ANOVA anidado se basan en distinciones sin un interés
inherente, del tipo analizado en un ANOVA de una vía Modelo II. Los grupos en el nivel
superior también pueden carecer de un interés inherente, en este caso se trata de un
ANOVA anidado Modelo II puro. Esto se ve comúnmente en estudios de genética
cuantitativa. Si los niveles superiores son de interés para el estudio, del tipo analizado
en un ANOVA Modelo I de una vía, entonces se trata de un ANOVA anidado de modelo
mezclado.
Keon y Muir (2002) diseñaron un estudio mediante el cual pretendían determinar si el
tipo de hábitat afectaba la tasa de crecimiento del liquen UsneaLongissima. Los
trasplantes fueron pesados y ubicados en 12 sitios, los cuales consistieron de 3
réplicas para cuatro tipos distintos de hábitats en el estado de Oregon, EEUU. 90
trasplantes fueron colocados en cada hábitat (n=360). Un año después, se
recolectaron los líquenes, se pesaron de nuevo y se calculó el cambio en el peso. En
este experimento se manejaron dos variables nominales (tipo de hábitat y sitio del
trasplante). El factor “sitio” se encuentra anidado debajo de “tipo de hábitat”. El
crecimiento fue determinado como el cambio en la biomasa y la longitud después de
un año. Los resultados del ANOVA anidado de modelo mezclado indicaron que existe
una variación significativa entre los sitios dentro de los hábitats (F8, 200=8.11, P=1.8 x
10-9) y una variación significativa entre hábitats (F3, 8=8.29, P=0.008).En la figura1.1
se muestra un resumen de los resultados mencionados.

Figura 1.1Diferencia entre hábitats en la tasa de crecimiento utilizando un ANOVA anidado.

Otro ejemplo sobre la aplicación de este tipo de diseño viene del campo de la
proteómica. La proteómica es el estudio de la totalidad del complemento proteico
expresado por un genoma en una determinada célula o tejido. En la actualidad, el
desarrollo de esta tecnología conlleva numerosas dificultades tanto experimentales
como analíticas. En particular parece existir un cierto nivel de confusión en la
comunidad científica acerca de la naturaleza de la replicación. Las réplicas en este tipo
de experimentos pueden ser de dos tipos. Réplicas técnicas que son medidas repetidas
de la misma muestra biológica y réplicas biológicas que son diferentes muestras
provenientes de un grupo con el mismo tratamiento. El tipo de réplica utilizado afecta
el tipo de análisis estadístico que puede ser llevado a cabo y las conclusiones que se
pueden obtener.
Karp y colaboradores (2005) elaboraron un estudio sobre los tipos de réplicas que
provee además algunas guías para el análisis de datos de proteómica. En este caso, las
pruebas estadísticas dependen de la suposición de que cada medida corresponde a
una muestra independiente. Sin embargo, las réplicas técnicas provienen de la misma
muestra biológica, por lo tanto no son independientes y tienden a arrojar medidas
similares. En este trabajo se propone una prueba estadística alternativa basada en el
análisis de varianza y se demuestra que la utilización del método incorrecto de
análisis conlleva a la sobrevaloración de los niveles de significancia obtenidos. Una
alternativa apropiada al ANOVA de una sola vía usado tradicionalmente es un ANOVA
del tipo anidado.

Figura 1.2Estructura de las réplicas para los dos tipos de ANOVA utilizados

En este tipo de diseño se puede emplear una serie de réplicas técnicas y biológicas.
Esta prueba puede tomar en consideración la relación que existe entre las réplicas
técnicas obtenidas a partir de la misma muestra biológica al buscar cambios
significativos.
La figura 3.2 provee una representación gráfica de la jerarquía considerada en el
ANOVA de una sola vía versus el ANOVA anidado. Los resultados de este estudio
demuestran que el ANOVA de una sola vía sobreestima el significado de la mayoría de
las muestras procesadas dado que resultó en valores p menores. Entonces, el ANOVA
de una sola vía sobreestima el nivel de significancia de las diferencias entre los
grupos. La diferencia en los valores p observados depende de la diferencia en la
varianza técnica y biológica. Mientras más similar sea la varianza biológica de la
técnica, menor será la diferencia en los valores p. Este estudio demuestra que mezclar
tipos de réplicas sin el análisis apropiado conlleva usualmente a la obtención de
resultados falsos positivos.
2. Diseños Split Plot
2.1 Introducción

En los experimentos factoriales, a veces, un factor requiere más material


experimental para su evaluación que otro factor. En las pruebas de campo en
agronomía y horticultura, un factor como los métodos de cultivo puede requerir el
uso de algún tipo de equipo que es más adecuado en parcelas grandes; mientras que
otro factor, como nivel de fertilidad, se puede aplicar con facilidad a una parcela
mucho más pequeña. La parcela de tratamiento de métodos de cultivo más grande, la
parcela completa, se divide en sub-parcelas más pequeñas a las que se les aplican
distintos tratamientos de cultivo o fertilidad. Esto se conoce como diseño de parcelas
divididas y este ejemplo particular tiene dos unidades experimentales de diferente
tamaño.

Bloque 1 Bloque 2
A3 A1 A2 A4 A4 A2 A1 A3

B3 B2 B1 B1 B1 B1 B2 B3
B2 B1 B2 B3 B3 B2 B1 B2
B1 B3 B3 B2 B2 B3 B3 B1

2.2 Usos y aplicaciones

Cuando uno de los factores, por su naturaleza, exige parcelas relativamente grandes,
por ejemplo, sistemas de labranza, de irrigación, distancias entre surcos, niveles de luz
o de temperatura; mientras que el otro factor permite su aplicación sobre unidades
experimentales más pequeñas como variedades, distancia entre plantas, dosis de
fertilizantes, etc.
Cuando en un experimento se toman varias mediciones sobre la misma unidad
experimental a través del tiempo y tales mediciones son independientes, puede
considerarse el conjunto de las mediciones realizadas sobre una misma unidad
experimental como la Unidad Principal, y cada una de las lecturas realizadas en el
tiempo como las subunidades. El análisis es análogo al de un diseño Parcelas
Divididas (en el espacio), por lo que se le designa a este diseño como Parcelas
Divididas en el Tiempo.
Si luego de iniciado el experimento se desea incluir otro factor —y su naturaleza lo
permite—, pueden dividirse las unidades experimentales y realizar la aleatorización
de los niveles del segundo factor en las subunidades resultantes.
2.3 Modelo matemático y análisis Estadístico

Como el análisis estadístico debe tomar en cuenta la presencia de dos tipos o tamaños
diferentes de unidades experimentales en el experimento, los efectos del factor A se
estiman a partir de las parcelas completas, mientras que los efectos del factor B y de
la interacción AB se estiman a partir de las sub-parcelas para el factor B. Como las
parcelas completas y sub-parcelas son unidades experimentales de distintos tamaños
o tipos, tienen diferente precisión, lo que debe considerarse para hacer
comparaciones entre las medias de tratamiento. La consideración de dos errores
separados es consecuencia del hecho de que las observaciones de distintas
subparceles en la misma parcela pueden tener una correlación positiva. La
correlación refleja la naturaleza de las unidades experimentales que responden de
manera similar cuando son adyacentes, como las subparcelas vecinas, los estudiantes
en un salón de clase, los cultivos en una cámara de cultivo o las unidades del mismo
lote de materia prima en un experimento industrial.
Como consecuencia de estas diferencias en los errores asociados con las
comparaciones de parcelas completas y sub-parcelas de tratamientos, la partición de
la suma de cuadrados en el análisis de varianza se altera un poco con respecto a la
partición para el diseño factorial de dos factores. Las particiones para los efectos
del factor y los factores de bloque permanecen igual que los diseños factoriales
usuales, pero el error experimental se divide en dos componentes. Una
componente del error experimental se asocia con el factor de tratamiento de la
parcela completa y la otra con el factor de tratamiento de la sub-parcela y la
interacción.
Para diseñar parcelas divididas se usa una formulación de modelo mixto que refleje
las distintas varianzas del error experimental para las sub-parcelas y la parcela
completa, lo que incluye los efectos del error aleatorio por separado para ambas. Si el
factor de tratamiento de la parcela completa se coloca en un diseño de bloques
totalmente aleatorizado el modelo lineal es:

Parcela Completa Sub-parcela


“ Wholeplot “ “Split-plot “

Donde es la media general, i es el efecto del i-ésimo bloque, j es el efecto del j-


ésimo nivel del factor A, ij es el error aleatorio de la parcela completa, k es el
efecto del k-ésimo nivel del factor B, las interacciones entre los factores y ijk es el
error aleatorio de la sub-parcela.
Se supone que los errores de la parcela completa y la sub-parcela son errores
aleatorios independientes con distribución normal con media 0 y varianzas
respectivas. La asignación aleatoria de los tratamientos a las unidades experimentales
justifica la suposición de independencia para los dos errores aleatorios y la
correlación igual entre los errores de las unidades en la sub-parcelas dentro de una
misma parcela completa.
El analisis de varianza puede ser extendido a un diseño de bloques completamente
aleatorizado. El procedimiento usa una suma de cuadrados que se descompone en tres
componentes.

Simbólicamente

Los valores esperados de las medias de cuadrados son:

Finalmente para realizar el análisis usamos las siguientes formulas:


2.4 Ejemplo

Se estudió el rendimiento forrajero del ramio en función de diferentes frecuencias de


corte y niveles de fertilizante. Los niveles de fertilizante se asignaron a las parcelas
grandes con base en un diseño de bloques completos al azar (tipos de suelo) con 3
repeticiones; las frecuencias de corte se asignaron a las sub-parcelas.

0 kg/ha (a0)
Fertilizante (a) 100 kg/ha (a1)
200 kg/ha (a 2)

38 días (b1)
Frecuencias de corte (b) 57 días (b2)
76 días (b3)

A continuación se presenta un posible esquema de aleatorización:

Bloque 1 Bloque 2 Bloque 2

A1 B3 B1 B2 A0 B1 B2 B3 A2 B3 B2 B1
A2 B2 B3 B1 A1 B3 B2 B1 A0 B3 B1 B2
A0 B1 B2 B3 A2 B3 B1 B2 A1 B1 B2 B3

La siguiente tabla contiene el rendimiento en kilogramos de forraje verde por parcela,


registrado durante un ciclo de producción de 228 días.

Tratamientos Bloques
I II III Yij.
a0 b 1 78.9 72.5 78.6 230.0
a0 b 2 68.1 66.1 69.3 203.5
a0 b 3 56.9 57.1 53.9 167.9
Y0.k 203.9 195.7 201.8 601.4
a1 b 1 84.3 99.3 72.9 256.5
a1 b 2 86.8 108.9 86.6 282.3
a1 b 3 73.1 73.4 61.7 208.2
Y1.k 244.2 281.6 221.2 747.0
a2 b 1 95.6 95.2 96.9 287.7
a2 b 2 97.8 108.1 99.2 305.1
a2 b 3 90.3 121.4 97.6 309.3
Y2.k 283.7 324.7 293.7 902.1
Y..k 731.8 802.0 716.7 Y…=2250.5
Con el fin de ilustrar el proceso de análisis, éste se desglosa en dos partes: el análisis
de las Parcelas Principales y el análisis de las Sub-parcelas. Se inicia con la parte
correspondiente a las Parcelas Principales.
Bloque I Bloque II Bloque
III
a1 a0 a2
a2 a1 a0
a0 a2 a1
Se hacen particiones tanto de las sumas de cuadrados como de los grados de libertad
correspondientes a las parcelas grandes, acorde con el esquema de aleatorización
usado para el factor principal.

Es importante anotar que cuando el factor asignado a las Parcelas Principales se


distribuye con base en un Diseño Completamente al Azar, la suma de cuadrados y los
grados de libertad de las Parcelas Principales se particiona sólo entre el efecto
principal del factor a y el Error a.

Totales de las Parcelas Grandes (Combinaciones Bloques*a) (Yi.k)

I II II Yi..
a0 203.9 195.7 201.8 601.4
a1 244.2 281.6 221.2 747.0
a2 283.7 324.7 293.7 902.1
Y..k 731.8 802.0 716.7 2250.5

Las Parcelas Grandes están conformadas por las combinaciones Bloques*a (por las
combinaciones r*a, en un DCA)

SC (Combinaciones Bloques*a) SC (Parcelas Grandes)

TC= Término de
corrección
Antes de pasar al análisis de las sub-parcelas, es importante analizar el esquema
completo que ilustra la forma en que se particionan tanto las sumas de cuadrados
como los grados de libertad.
Bloques
(r-1)=2

Parcelas Grandes A
(a*r)-1=8 (a-1)=2

Error a
(r-1)(a-1)=4

Total Tratamientos
(a*b*r)-1=26 (a*b-1)=8
B
(b-1)=2

Sub-parcelas AB
a*r(b-1)=18 (a-1)(b-1)=4

Error b
a(r-1)(b-1)=12

Se inicia el análisis de las Sub-parcelas con la partición de las sumas de cuadrados de


los tratamientos.

Totales de las Combinaciones ab (tratamientos)(Yij.)

b1 b2 b3
a0 230 203.5 167.9
a1 256.5 282.3 208.2
a2 287.7 305.1 309.3
Y.j. 774.2 790.9 685.4

A
Tratamientos B
AB
Tabla del Análisis de Varianza

Fuentes de Variación DF Sumas de Cuadrados F F0.05(gln,


Cuadrados Medios gld)
Bloque 2 460.45 230.225 1.935
ParcelasPri
A 2 5025.03 2512.515 21.119 6.94
ncipales
Error a 4 475.86 118.965
B 2 714.62 357.310 9.268 3.88
Subparcela
AB 4 963.42 240.855 6.247 3.26
s
Error b 12 462.61 38.550
Total 26 8101.99

El efecto principal del factor a (A) se evalúa con el Error a; mientras que el efecto
principal del factor b (B) y la interacción AB se evalúan con el Error b.

En caso de tener más de dos factores, las interacciones entre factores asignados a las
parcelas principales se evalúan con el Error a; las interacciones entre factores
asignados a las sub-parcelas o interacciones de éstos con algún factor asignado a las
parcelas principales se evalúan con el Error b.

En este caso, puesto que la interacción resultó significativa el siguiente análisis


debería ser la evaluación de los efectos simples. No obstante, debido a que en este
diseño se generan errores estándar distintos para cada uno de los diferentes grupos
de comparaciones, se ilustran las diferentes posibilidades de comparación de medias.

2.5Ventajas y desventajas del modelo Split-plot

Ya se ha mencionado la ventaja principal de las parcelas divididas: cuando un


factor requiere una mayor cantidad de material experimental que otro factor, como en
los estudios de agronomía, o cuando existe la oportunidad de estudiar respuestas de
un segundo factor, mientras que se da un uso eficiente de los recursos, como en los
estudios en cámaras de cultivo.
Las principales desventajas del diseño de parcelas divididas incluyen la posible
pérdida en la precisión de las comparaciones de tratamientos y un incremento en la
complejidad del análisis estadístico. El análisis de varianza y la estimación de los
errores estándar para los distintos tipos de comparaciones de tratamientos requieren
de más cálculos.

Eficiencia relativa de las comparaciones de sub-parcelas y parcelas completas


Es común atribuir, la eficiencia relativa de un diseño de experimento a la eficiencia
como resultado del uso de bloques mediante algún factor y la de ignorar el factor de
bloque. Con los diseños de parcelas divididas, es revelador considerar la eficiencia
relativa al usarlos en lugar de diseñar el mismo experimento sin la característica de
las parcelas divididas. Por ejemplo, cuando el factor de tratamiento de la parcela
completa se arregla en un diseño de bloques totalmente aleatorizado, es posible
determinar cuál de los diseños es más eficiente en las comparaciones de tratamientos
de parcelas completas y de interacción. Existe una relación entre el incremento en la
precisión de las medias de tratamiento en las subparcelas y la disminución en la
precisión de las medias de tratamiento de las parcelas completas.
Eficiencia de las comparaciones en la sub-parcelas
Federer (1955) muestra que la eficiencia del diseño de parcelas divididas con
respecto al diseño de bloques totalmente aleatorizado para las comparaciones en las
subparcelas es:

f1 = a(b - l)(r - l), los grados de libertad para el error en la subparcela CME(2), y f 2 =
(ab - l)(r - l), los grados de libertad para el error experimental del bloque totalmente
aleatorizado.
Eficiencia de las comparaciones de parcelas completas
La eficiencia relativa de los diseños de parcelas divididas con respecto al diseño de
bloques totalmente aleatorizado para las parcelas completas es:

con f1 = (a - l)(r - 1) para el error de la parcela completa CME(1).


3. Diseños de mezclas
3.1 Introducción

En los experimentos con mezclas, los factores son componentes o ingredientes de una
mezcla y, por consiguiente, sus niveles no son independientes. Por ejemplo, si x1, x2, …,
xp denota las proporciones de p componentes de una mezcla, entonces

3.2 Usos y aplicaciones

Los experimentos con mezclas pueden ser utilizados en:


1) Mezclas de harina de pan consistentes en trigo y varios aditivos.
2) Fertilizantes consistentes en mezclas de químicos.
3) Vinos mezclados de diferentes tipos de uvas.
4) Pinturas y colorantes.
5) Aleaciones.
6) Fármacos.
7) Gasolina con aditivos que mejoran su rendimiento.

3.3 Región de experimentación


Mezclas con dos componentes
Para dos componentes, el espacio de los factores del diseño incluye todos los valores
de los dos componentes que están sobre el segmento de recta x1 + x2 = 1, con cada
componente siendo acotado por 0 y 1 (Figura 3.1).

Figura 3.1 Espacio de los factores restringidos para una mezcla con p=2 componentes.
Mezclas con tres componentes
Con tres componentes, el espacio de la mezcla es un triángulo con vértices que
corresponden a las formulaciones que son mezclas puras (mezclas que son 100%
de un solo componente) (Figura 2).

Figura 3.2Espacio de los factores restringidos para una mezcla con p= 3 componentes.

3.4 Diseño de experimentos con mezclas


Diseñosímplex reticular
Un diseño símplex reticular p, m (Figura 3.3) para p componentes consta de los
puntos definidos por los siguientes arreglos de las coordenadas: las proporciones
asumidas por cada componente toman los m + 1 valores que están separados por
una distancia igual de 0 a 1,

y se usan todas las combinaciones posibles (mezclas) de las proporciones de la


ecuación.
El número de puntos en un diseño símplex reticular p, m es:

El diseño símplex reticular solo proporciona suficientes puntos de diseño para un


arreglo exacto a un polinomio de orden m.
Figura 3.3Algunos ejemplos de símplex reticular p, m .

Diseño símplexde centroide


Una alternativa del diseño símplex reticular es el diseño símplex de
centroide(Figura 4). En un diseño símplex de centroide con p componentes, hay 2p-
1 puntos, que corresponden a las p permutacionesde , las
permutaciones de , las permutaciones de ,…, y
el centroide global .Estos puntos son los vértices y los centroides de los
símplex de dos dimensiones, tres dimensiones, …, p dimensiones encontrados en el
espacio de la mezcla original.

Figura 4 Diseños símplex de centroide con a) p = 3 componentes y b) p = 4 componentes.

Diseño símplex aumentado


Los diseños símplex reticular y símplex de centroide son diseños de punto frontera. Si el
experimentador quiere hacer predicciones acerca de las propiedades de mezclas
completas, es necesario contar con más corridas en el interior del símplex, por lo que se
recomienda aumentar los diseños símplex ordinarios con corridas axiales y el centroide
global (si el centroide no es ya un punto del diseño) (Figura 3.5).
Para posicionar los puntos axiales, se debe considerar que el eje del componente i es la
recta que une un vértice con el centroide de la cara opuesta y que la longitud del eje del
componente es una unidad.Los puntos axiales se sitúan sobre los ejes de los componentes
a una distancia Δ. El valor máximo de Δ es(p-1)/p.
Se recomienda que las corridas axiales se coloquen a la mitad entre el centroide del diseño
símplex y cada vértice para que Δ=(p-1)/2p. En ocasiones a estos puntos se les llama
mezclas de verificación axial, porque es una práctica común excluirlas cuando se ajusta el
modelo preliminar de la mezcla y usar después las respuestas en estos puntos axiales para
verificar la adecuación del ajuste del modelo preliminar.

Figura 3.5 Diseño símplex centroide aumentado con p=3 componentes.

3.4 Análisis Estadístico

Las formas estándares de los modelos matemáticos para mezclas que se usan
ampliamente son:

Lineal

Cuadrático

Cúbico
completo

Cúbico
especial
En las ecuaciones anteriores, el parámetro representa la respuesta esperada
para la mezcla pura xi=1 y xj=0 cuando j ≠ i. A la porción
se le llama proporción de mezcla lineal. Cuando hay curvatura derivada de
una mezcla no lineal entre pares de componentes, los parámetros βij representan
una mezcla sinérgica o bien antagónica. Los términos de órdenes superiores suelen
ser necesarios en los modelos para mezclas porque:
1) Los fenómenos estudiados pueden ser complejos.
2) La región experimental con frecuencia es la región de operabilidad
completa y, en consecuencia, es grande y requiere un modelo elaborado.
3.5 Regiones restringidas

En algunos experimentos con mezclas surgen restricciones sobre los componentes


individuales, como:

1) Restricciones sobre la frontera inferior.


2) Restricciones sobre la frontera superior.
3) Restricciones en ambas fronteras.

Restricciones sobre la frontera inferior


Las restricciones sobre la frontera inferior de la forma

son muy comunes. Cuando sólo están presentes restricciones sobre la frontera
inferior, la región factible del diseño sigue siendo un diseño símplex, pero se
inscribe dentro de la región del símplex original (Figura 3.6). Esta situación puede
simplificarse mediante la introducción de pseudocomponentes, definidos como:

con . Entonces,

por lo que el uso de pseudocomponentes permite utilizar diseños tipo símplex


cuando las fronteras inferiores forman parte de la situación experimental. Las
formulaciones especificadas por el diseño símplex para los pseudocomponentes se
transforma en formulaciones para los componentes originales invirtiendo la
transformación de la ecuación. Es decir, si xi’ es el valor asignado al
pseudocomponente i-ésimo en una de las corridas del experimento, el componente
i-ésimo de la mezcla original es:

Figura 3.6Ejemplo de un experimento con restricciones sobre la frontera superior.

Restricciones sobre la frontera superior


Las restricciones sobre la frontera superior de la forma

por lo regular no son diseños símplex o son símplex invertidos con respecto a la
región del símplex original (Figura 3.7).
En este caso también se utilizan pseudocomponentes, ahora definidos como:

con . Entonces,

Debido a que el símplex tiene una orientación inversa al símplex original, el signo
de los coeficientes lineales en el modelo matemático será opuesto.

Figura 3.7 Ejemplo de un experimento con restricciones sobre la frontera superior.

Restricciones en ambas fronteras


Cuando los componentes tienen restricciones tanto sobre la frontera superior
como la inferior, la región factible deja de ser un diseño símplex; será en cambio,
un politopo irregular (Figura 3.8). Puesto que la región experimental no tiene una
forma “estándar”, los diseños se hacen mediante vértices extremos y su análisis no
es símplex sino D-Optimal.

Figura 3.8Ejemplo de un experimento con restricciones sobre ambas fronteras.

3.6 Ejemplo

Mixed Culture Optimization for Marigold Flower Ensilage via Experimental Design
and Response Surface Methodology
Efecto simbiótico o antagonista. Diseño de cultivos mixtos.
Para explorar la existencia de una relación simbiótica o antagonista entre
diferentes microorganismos en lo que se refiere a su producción enzimática, los
autores de este artículo plantearon un diseño símplex de centroide. Ellos utilizaron
el extracto enzimático crudo (є) de tres microorganismos [Flavo bacteriumIIb (C1),
A. anitratus (C2) y R. nigricans (H1)], los cuales había mostrado tener una actividad
enzimática alta en estudios anteriores. En cada experimento evaluaron la actividad
como el cambio en la viscosidad a una solución CMC, obteniendo los siguientes
resultados:

Figura 3.9 Diseño de experimentos para cultivos mixtos con el microorganismo de mayor actividad de
celulasa.

El análisis de los datos sugirió un modelo especial cúbico (el ajuste se realizó
utilizando mínimos cuadrados):

En este modelo, el coeficiente para el extracto crudo de H 1 ( ) es significativamente


diferente que el de los otros términos, indicando que el extracto enzimático de este
microorganismo fue más efectivo en la degradación de celulosa. El coeficiente de los
términos no lineales que involucran C1C2 es positivo; por lo tanto, el extracto mixto tuvo
un efecto sinérgico.
En la Figura 3.10 se muestran los contornos de la viscosidad graficados, lo cual puede ser
de utilidad para interpretar los resultados. En las Figuras 3.9 y 3.10 que presentan los
autores, se observó que la mezcla de los extractos crudos de C 1 y C2 no redujo la viscosidad
como los extractos crudos de cada uno de los microorganismos. Los coeficientes no
lineares restantes en el modelo especial cúbico son negativos, lo cual indicó interacciones
antagónicas. A partir de estas Figuras también se concluyó que el extracto crudo de H 1
resultó tener la mayor reducción en la viscosidad de la solución CMC.

Figura 3.10 Contornos de la superficie de respuesta estimada para el modelo especial cúbico.

El modelo ajustado se representa gráficamente en la Figura 3.10. La localización


de los puntos óptimos fue calculada por medio de técnicas de optimización
estándar limitada basadas en el método de Newton-Raphson. Las limitaciones son
las siguientes.

La solución del sistema dio un extracto crudo óptimo con composición: ,


, . Un extracto con esta composición maximizará la actividad
de la celulasa, medida por medio de la reducción de la viscosidad de una solución
de referencia a CMC.
4. Conclusión
El diseño estándar factorial tiene dos características principales, cada nivel de cada factor
ocurre con todos los niveles de los demás factores y además es posible examinar la
interacción entre ellos. Esta característica evita la necesidad de la utilización de un
número grande de unidades experimentales. En el caso de los diseños anidados los niveles
de un factor son diferentes para los niveles del otro factor. Debido a esto los efectos de los
factores experimentales pueden ser observados con mayor claridad; sin embargo, esto
requiere la utilización de un mayor número de unidades experimentales, con respecto al
diseño factorial estándar. A diferencia de los diseños anidados y factoriales, en el diseño
Split-Plot uno de los factores experimentales (factor principal) es común en todos los
bloques. Debido a esto, este tipo de diseños son útiles en situaciones donde uno de los
factores experimentales es intrínsecamente difícil de modificar entre corridas. Otra
particularidad de los diseños Split-Plot es que debido a la utilización de dos clases de
unidades experimentales, existe la necesidad de calcular dos tipos de errores
experimentales. Particularmente, los diseños de mezclas están definidos para problemas
de mezclas físicas de componentes donde no existe total independencia entre los factores,
que en este caso son las proporciones de los ingredientes de una formulación dada.

Los diseños de experimentos de modelos especiales son ampliamente usados en diversos


campos de la investigación. La correcta implementación de este tipo de diseños permite
una reducción en los costos y recursos necesarios para realizar una investigación.
El diseño de experimentos es una herramienta importante en la planeación, organización y
desarrollo de la investigación científica. La implementación de un adecuado esquema
experimental permite la economización de materiales, tiempo, y capital. Debido a que la
minimización de recursos es primordial en áreas como la industria y la investigación
científica, el diseño de experimentos es indispensable para obtener resultados confiables
en escenarios restringidos.
5. Referencias
1. Keon Dylan B., Muir Patricia S. “Growth of Usnealongissima Across a Variety
of Habitats in the Oregon Coast Range”. The Bryologist. 105(2):233-242.
2002.
2. Mason Robert L., Gunst Richard F., Hess James L. Statistical Design and
Analysis of Experiments with Applications to Engineering and Science.
EEUU: Wiley. 1989.
3. Montgomery Douglas C. Design and analysis of experiments. EEUU: Wiley.
2005.
4. Stockburguer David. Introductory Statistics: Concepts, Models, and
Applications. EEUU: Atomic Dog Publishing. 2001.
5. Candolfi A., Massart D.L., Heuerding S. “Investigation of sources of variance
which contribute to NIR-spectroscopic measurement of pharmaceutical
formulations”. AnalyticaChimicaActa. 345: 185-196. 1997.
6. Karp Natasha A., Spencer Matthew, Lindsay Helen, O’Dell Kevin, Lilley
Kathrin S. “Impact of Replicate Types on Proteomic Expression Analysis”.
Journal of proteome research. 4: 1867-1871. 2005.
7. Casella, G. Statistical Design. En G. Casella (Ed), Split Plot Designs. New
York: Springer Texts in Statistics. 2008.
8. Kuehl, R. O. Diseño de experimentos: Principios estadísticos de diseño y
análisis de investigación. The University of Arizona: Thomson Learning.
2001.
9. Snedecor, G. W. y Cochran, W. G. Statistical Methods. En G. W. Snedecor y W.
G. Cochran (Eds), Factorial Experiments. EEUU: Blackwell Publishing. 1989.
10. Arnau, J., Blanco, A. y Losada, J. L. “Estimación de la precisión de un diseño
multivariable de medidas repetidas”. Anales de Psicología, Universidad de
Barcelona. 7(1): 85-104. 1991.
11. Box, George E. P.; Draper, Norman R. Response Surfaces, Mixtures, and
Ridge Analyses. Second Edition. EEUU: John Wiley & Sons. 2007.
12. Gozálvez J. M., García-Díaz J. C. “Mixture Design Experiments Applied to the
Formulation of Colorant Solutions”. Journal of Chemical Education. 83(4):
647-650. 2006.
13. Navarrete-Bolaños J. L., Jiménez-Islas H., Botello-Álvarez E., Rico-Martínez
R. “Mixed Culture Optimization for Marigold Flower Ensilage via
Experimental Design and Response Surface Methodology”. J. Agric. Food
Chem. 51:2206-2211. 2003.
14. Yang C. H., Li Y. J., Wen T. C. “Mixture Design Approach to PEG-PPG-PTMG
Ternary Polyol-Based Westernborne Polyurethanes”. Ind. Eng. Chem. Res.
36: 1614-1621. 1997.

You might also like