You are on page 1of 54

INTRODUCCIN

Muchos experimentos se llevan a cabo para estudiar los efectos producidos por
dos o ms factores. Ningn factor se considera extrao; todos tienen el mismo
inters. En el experimento factorial o arreglo factorial, se investigan todas las
posibles combinaciones de los niveles de los factores en cada ensayo completo o
rplica del experimento. El experimento factorial afecta al diseo de tratamientos,
que se refiere a la eleccin de los factores a estudiar, sus niveles y la combinacin
de ellos.
Razones para estudiar conjuntamente varios factores

1. Encontrar un modelo que describa el comportamiento general del fenmeno en


estudio.
2. Optimizar la respuesta o variable dependiente; es decir, encontrar la
combinacin de niveles que optimizan la variable dependiente.
La caracterstica general y esencial que hace necesario el estudio conjunto de
factores es que el efecto de un factor cambie segn sean los niveles de otros
factores o sea que exista interaccin.
Ventajas de los Experimentos Factoriales

1. Economa en el material experimental ya que se obtiene informacin sobre


varios factores sin incrementar el tamao del experimento.
2. Permitir el estudio de la interaccin, o sea determinar el grado y la forma en la
cual se modifica el efecto de un factor por los niveles de otro factor
Desventajas de los Experimentos Factoriales

Una desventaja de los experimentos factoriales es que requieren un gran nmero


de tratamientos. Este hecho tiene los siguientes efectos:
1. Si se desea usar bloques completos es difcil encontrar grupos de unidades
experimentales homogneas para aplicar todos los tratamientos.
2. Se aumenta el costo del experimento al tener muchas unidades experimentales.
Los experimentos factoriales se pueden ejecutar bajo cualquier tipo de diseo de
control de error o un Submuestreo o con covariables. En las siguientes secciones
slo se presenta el anlisis de un experimento factorial de dos factores bajo un
DCA.
Unidad II- DISEO DE EXPERIMENTOS DE UN FACTOR

EXPERIMENTOS CON UN SOLO FACTOR


En este tipo de diseo de experimento se considera un slo factor de inters y el
objetivo es comparar ms de dos tratamientos, con el fin de elegir la mejor
alternativa entre las varias que existen, o por lo menos para tener una mejor
comprensin del comportamiento de la variable de inters en cada uno de los
distintos tratamientos. En esta unidad se presentan los diseos experimentales
que se utilizan cuando el objetivo es comparar ms de dos tratamientos. Puede
ser de inters comparar tres o ms mquinas, varios proveedores, cuatro
procesos, tres materiales, cinco dosis de un frmaco, etc. Es obvio que, al hacer
tales comparaciones, existe un inters y un objetivo claro. Por ejemplo, una
comparacin de cuatro dietas de alimentacin en la que se utilizan ratas de
laboratorio, se hace con el fin de estudiar si alguna dieta que se propone es mejor
o igual que las que ya existentes; en este caso, la variable de inters es el peso
promedio alcanzado por cada grupo de animales despus de ser alimentado con
la dieta que le toco.
Por lo general, el inters del experimentador est centrado en comparar los
tratamientos en cuanto a sus medias poblacionales, sin olvidar que tambin es
importante compararlos con respecto a sus varianzas. As, desde el punto de vista
estadstico, la hiptesis fundamental a probar cuando se comparan varios
tratamientos es:

(2.1)
Con la cual se quiere decidir si los tratamientos son iguales estadsticamente en
cuanto a sus medias, frente a la alternativa de que al menos dos de ellos son
diferentes. La estrategia natural para resolver este problema es obtener una
muestra representativa de mediciones en cada uno de los tratamientos, y construir
un estadstico de prueba para decidir el resultado de dicha comparacin
Se podra pensar que una forma de probar la hiptesis nula de la expresin (2.1)
es mediante la prueba T de Student aplicadas a todos los posibles pares de
medias; sin embargo, esta manera de proceder incrementara de manera
considerable el error tipo I (rechazar H0 siendo verdadera).
El diseo estadstico de experimentos es precisamente la forma ms eficaz de
hacer pruebas. El diseo de experimentos consiste en determinar cules pruebas
se deben realizar y de qu manera, para obtener datos que, al ser analizados
estadsticamente, proporcionen evidencias objetivas que permitan responder las
interrogantes planteadas, y de esa manera clarificar los aspectos inciertos de un

proceso, resolver un problema o lograr mejoras. Algunos problemas tpicos que


pueden resolverse con el diseo y el anlisis de experimentos son los siguientes:
1. Comparar a dos o ms materiales con el fin de elegir al que mejor cumple
los requerimientos.
2. Comparar varios instrumentos de medicin para verificar si trabajan con la
misma precisin y exactitud.
3. Determinar los factores (las x vitales) de un proceso que tienen impacto
sobre una o ms caractersticas del producto final.
4. Encontrar las condiciones de operacin (temperatura, velocidad, humedad,
por ejemplo) donde se reduzcan los defectos o se logre un mejor
desempeo del proceso.
5. Reducir el tiempo de ciclo del proceso.
6. Hacer el proceso insensible o robusto a oscilaciones de variables
ambientales.
7. Apoyar el diseo o rediseo de nuevos productos o procesos
8. Ayudar a conocer y caracterizar nuevos materiales
En general, cuando se requiere mejorar un proceso existen dos maneras bsicas
de obtener la informacin necesaria para ello:

Observar o monitorear va herramientas estadsticas, hasta obtener seales


tiles que permitan mejorarlo; se dice que sta es una estrategia pasiva.
La otra manera consiste en experimentar, es decir, hacer cambios
estratgicos y deliberados al proceso para provocar dichas seales tiles.

Al analizar los resultados del experimento se obtienen las pautas a seguir, que
muchas veces se concretan en mejoras sustanciales del proceso. En este sentido,
experimentar es mejor que sentarse a esperar a que el proceso nos indique por s
solo cmo mejorarlo. El diseo de experimentos es un conjunto de tcnicas
activas, en el sentido de que no esperan que el proceso mande las seales tiles,
sino que ste se manipulan para que proporcione la informacin que se requiere
para su mejora.
El saber diseo de experimentos y otras tcnicas estadsticas, en combinacin
con conocimientos del proceso, sitan al responsable del mismo como un
observador perceptivo y proactivo que es capaz de proponer mejoras y de
observar algo interesante (oportunidades de mejora) en el proceso y en los datos
donde otra persona no ve nada.

2.1. FAMILIA DE DISEOS PARA COMPARAR TRATAMIENTOS.


Los diseos experimentales ms utilizados para comparar tratamientos son:
1. Diseo completamente al azar (DCA)
2. Diseo en bloque completamente al azar (DBCA)
3. Diseo en cuadro latino (DCL)
4. Diseo en cuadro grecolatino (DCGL)
La diferencia fundamental entre estos diseos es el nmero de factores de bloque
que incorporan o controlan de forma explcita durante el experimento. La
comparacin de los tratamientos en cuanto a la respuesta media que logran, en
cualquiera de estos diseos, se hace mediante la hiptesis

que
se prueba con
la
tcnica estadstica llamada Anlisis de Varianza (ANOVA)con uno, dos, tres o
cuatro criterios de clasificacin, dependiendo del nmero de factores de bloques
incorporados al diseo.

El modelo estadstico que describe el comportamiento de la variable observada Y


en cada diseo, incorpora un trmino adicional por cada factor de bloqueo
controlado. De acuerdo con los modelos dados en la tabla, para cada diseo
comparativo se tienen al menos dos fuentes de variabilidad: los tratamientos o
niveles del factor de inters y el error aleatorio. Se agrega una nueva fuente de
variabilidad porcada factor de bloque que se controla directamente. Se observa
que los diseos suponen que no hay efectos de interaccin entre los factores, lo
cual sera lo deseable que ocurra; de no ocurrir as, tal efecto se recarga al error y
el problema de comparacin no se resuelve con xito.
4

Un efecto de interaccin entre dos factores hace referencia a que el efecto de


cada factor depende del nivel en que se encuentra el otro.

4. Supuestos acerca del modelo estadstico


a. Aditividad: Los factores o componentes del modelo estadstico son aditivos,
es decir la variable respuesta es la suma de los efectos del modelo
estadstico.
b. Linealidad: La relacin existente entre los factores o componentes del
modelo estadstico es del tipo lineal.
c. Normalidad: Los valores resultados del experimento provienen de una
2
distribucin de probabilidad Normal con media y variancia.
d. Independencia: Los resultados observados de un experimento son
independientes entre s.
e. Variancias Homogneas (Homocedasticidad): Las diversas poblaciones
generadas por la aplicacin de dos o ms tratamientos tienen variancias
homogneas (variancia comn).
Los experimentos factoriales se emplean en todos los campos de la investigacin,
son muy tiles en investigaciones exploratorias en las que poco se sabe acerca de
muchos factores.
VENTAJAS:
1.- Permite estudiar los efectos principales, efectos de interaccin de factores,
efectos simples y efectos cruzados.
2.- Todas las unidades experimentales intervienen en la determinacin de los
efectos principales y de los efectos de interaccin de los factores, por lo que el
nmero de repeticiones es elevado para estos casos.
3.- El nmero de grados de libertad para el error experimental es alto,
comparndolo con los grados de libertad de los experimentos simples de los
mismos factores, lo que contribuye a disminuir la variancia del error experimental,
aumentando por este motivo la precisin del experimento.
DESVENTAJA:
1.- Se requiere un mayor nmero de unidades experimentales que los
experimentos simples y por lo tanto se tendr un mayor costo y trabajo en la
ejecucin del experimento.

2.- Como en los experimentos factoriales c/u de los niveles de un factor se


combinan con los niveles de los otros factores; a fin de que exista un balance en el
anlisis estadstico se tendr que algunas de las combinaciones no tiene inters
prctico pero deben incluirse para mantener el balance.
3.- El anlisis estadstico es ms complicado que en los experimentos simples y la
interpretacin de los resultados se hace ms difcil a medida de que aumenta el
nmero de factores y niveles por factor en el experimento.

Ejemplo de formacin de factoriales:


Sea los factores A y B con sus respectivos niveles:
Factor A: a0 a1 a2
Factor B: b0 b1
La combinacin de los niveles de los factores ser:
a0
b0 b1
a0 b0

a0 b1

a1

a2

b0 b1

b0 b1

a1 b0

a1 b1

a2b0

a2 b1 } tratamientos

Al combinar ambos factores (A y B) se tiene:


3 x 2 = 6 tratamientos para ser evaluados
Niveles de A x niveles de B
Si cada tratamiento se aplica a 4 unidades experimentales, se requiere 24
unidades experimentales, para realizar el experimento:
Repeticiones

a0 b0

a0 b1

a1 b0

a1 b1

a1b0

a2 b1

1
2
3
4
6

2.2 EL MODELO DE EFECTOS FIJOS


Caso de dos factores en un DCA
El modelo de efectos fijos se supone cuando el investigador est interesado
nicamente en los niveles del factor y en los niveles del factor , presentes
en el experimento. Los datos de este experimento factorial se pueden presentar en
un cuadro como el siguiente:
FACTOR B
FACTOR A

El modelo estadstico asociado a este experimento es dado por:

Donde

es la constante que representa el promedio global,

verdadero del

nivel del factor ,

nivel del factor ,

es efecto verdadero de la interaccin del

es el efecto

es el efecto verdadero del


nivel

del factor con el


nivel del factor y
es el error experimental
asociado con la
unidad experimental sujeta a la
combinacin de tratamiento. Se supone que es una constante y que las

variables aleatorias
varianza constante

estn distribuidas normal independiente con media cero y


.

Las restricciones del modelo son:

Estimacin de Parmetros
Al aplicar el mtodo de mnimos cuadrados se obtienen los estimadores de los
parmetros

Anlisis de Varianza
La tabla de ANOVA para este caso est dada por:
Tabla 1. ANOVA para un factorial de dos factores en un DCA
Causa de

Grados de

Suma

Cuadra

Cuadrado Medio
8

variacin

libertad

de
cuadrad
os

dos
medios

CM

C
M

esperado

C
M
B

CM

C
M
C
M

AB

CM

C
M
C
M

Error
experime
ntal

CM

Total

Para el factor A:
donde
y

es

la

media

poblacional

Como

del

y si

es la media global

nivel

es cierta

y como

entonces se tienen dos estimadores insesgados de


son
y
, por ello se utiliza como prueba
valores cercanos a uno estadsticamente.

que

el cual debe tomar

Para el factor B:
donde
media

poblacional

del

nivel

es

la

media

es la
global.

10

Como
como

si

es

cierta

entonces se tienen dos estimadores insesgados de

que son
y
, por ello se utiliza como prueba
para probar la
hiptesis. Esta estadstica de prueba debe tomar valores estadsticamente
cercanos a uno cuando
es cierta.
Para la interaccin de los factores

Escrita de una forma ms sencilla tendremos:

Como
cierta

si

es

razonando como en los casos anteriores se tiene que la

estadstica de prueba para esta hiptesis es


Cmo se aplican los mtodos de comparacin mltiple?

Si la hiptesis de interaccin es significativa (se rechaza la hiptesis nula), se


deben realizar comparaciones mltiples entre los niveles de un factor pero en cada
nivel del otro factor.
Si Si la hiptesis de interaccin es no significativa (no se rechaza la hiptesis
nula), y algn factor es significativo, se debe realizar comparaciones mltiples para
los niveles de este factor como si fuese un DCA sin estructura factorial.
Cmo probar los supuestos?

Primero se deben obtener los residuales, los cuales para el caso de dos factores
se determina de la siguiente manera:
1. El residual es dado por

11

2. La respuesta estimada

es

Y as el residual es determinado por

La prueba de los supuestos se hace de manera similar a un DCA sin estructura


factorial

2.3 DISEO COMPLETAMENTE ALEATORIO Y ANOVA


El diseo completamente al azar es el ms sencillo de los diseos de
experimentos que tratan de comparar dos o ms tratamientos, puesto que slo
considera dos fuentes de variabilidad: los tratamientos y el error aleatorio.
Para ilustrar el diseo, supongamos que queremos determinar si cuatro
dosificaciones de un hormign A, B, C y D presentan una misma resistencia
caracterstica a compresin. Para ello se han elaborado 5 probetas para cada tipo
de dosificacin y, a los 28 das, se han roto las probetas a compresin simple y los
resultados son los que hemos recogido en la tabla que sigue.
DOSIFICACIONES DE HORMIGN
A

42

45

64

56

39

46

61

55

45

50

62

39

55

59

43

58

60

Resistencia
caracterstica a 48
compresin fck
(Mpa)
43
44

12

Para este caso, la variable de respuesta es la resistencia caracterstica del


hormign a compresin (MPa), la unidad experimental es la probeta de hormign y
el factor es la dosificacin de hormign. En este caso se trata de un diseo
balanceado porque hemos realizado el mismo nmero de repeticiones (5) para
cada uno de los tratamientos (dosificaciones).
Este tipo de diseo se llama completamente al azar porque todas las repeticiones
experimentales se realizan en orden aleatorio completo, pues no se han tenido en
cuenta otros factores de inters. Si durante el estudio se hacen N pruebas, stas
se deben realizar al azar, de forma que los posibles efectos ambientales y
temporales se vayan repartiendo equitativamente entre los tratamientos.
El nmero de repeticiones a realizar en cada tratamiento depende de la
variabilidad que se espera observar en los datos, a la diferencia mnima que el
experimentador considera que es importante detectar y al nivel de confianza que
se desea tener en las conclusiones. Normalmente se recomiendan entre 10 y 30
mediciones en cada tratamiento. Con 10 mediciones se podran detectar
diferencias de medias mayores o iguales a 1,5 sigmas con una probabilidad alta,
y con 30 mediciones se podran detectar diferencias mayores o iguales a 0,7
sigmas.
Se utiliza el anlisis de la varianza (ANOVA) para comprobar si existen diferencias
en las medias. Fundamentalmente este anlisis consiste en separar la
contribucin de cada fuente de variacin en la variacin total observada. Sin
embargo, ste ANOVA est supeditado a los siguientes supuestos que deben
verificarse:

Normalidad

Varianza constante (igual varianza en los tratamientos)

Independencia

Para los que queris saber qu ha pasado con nuestro experimento con las
amasadas, os dir que que el ANOVA di como resultado el rechazo de la
igualdad de medias, es decir, que la resistencia media se ve afectada por la
dosificacin. Sin embargo, las cuatro dosificaciones no son igual de efectivas,
pues existen diferencias significativas entre las resistencias medias de cada una
de ellas. De hecho, las dosificaciones A y B no presentan diferencias significativas
entre s, tampoco entre la C y la D, sin embargo, entre ambos grupos s que hay
diferencias significativas. Asimismo, se ha podido comprobar que se cumplieron
los supuestos de normalidad, varianza constante e independencia.
DISEOS COMPLETAMENTE ALEATORIOS
Se supone que el experimentador cuenta con los resultados de k muestras
aleatorias independientes, cada una de tamao n, de k diferentes poblaciones
(datos relativos a k tratamientos, k grupos, k mtodos de produccin, etc.).
13

Interesa probar la hiptesis de que las medias de esas k poblaciones son todas
iguales.
Se denota a la j-sima observacin de la i-sima muestra por y ij. El esquema
general para un criterio de clasificacin es:
Medias
Muestra
1
Muestra
2
.
Muestra i
.
Muestra
k

y11

y12

y1j

y1n

y21

y22

y2j

y 2n

yi1

yi2


yij


yin

yk1

yk2


ykj


ykn

Bajo este esquema experimental, en referencia al ejemplo tratado, yij


(i=1,2,..,4; j=1,2,, 12) es la j-sima medicin del peso del revestimiento del
isimo laboratorio, e es la media global (o gran media) de las 48 observaciones.
Para pruebas de hiptesis (medias iguales) se supondr estar trabajando
con poblaciones normales de la misma 2.
Si i es la media de la poblacin i-sima y 2 es la varianza comn de las
k poblaciones, se puede expresar cada observacin y ij como i ms el valor del
componente aleatorio:
y i j = i + i j

para i=1,2,..,k; j=1,2,, n

i j es una variable aleatoria con distribucin normal, = 0 y 2 comn.


Para dar uniformidad a las ecuaciones, se reemplaza i por + i , donde
es la media de las i y i es el efecto del i-simo tratamiento, de aqu que:
k

i 1

Esto surge de:

14

i 1

i 1

1
k
k k

i 1

Luego, la expresin de yij queda:


y i j = i + i j

para i=1,2,..,k; j=1,2,, n

Por lo tanto, la Hiptesis Nula (las medias de las k poblaciones iguales) se


reemplaza por la Hiptesis Nula de que 1 = 2 = = k = 0. La Hiptesis
Alterna de que al menos dos de las medias son distintas equivale a que i < > 0
para alguna i.
Para probar la Hiptesis Nula, se comparan las estimaciones de 2 (una en
base a la observacin de las medias mustrales y la otra con la variacin dentro
de la muestra).
uatro laboratorios de un Ya que cada muestra viene de una poblacin con varianza 2, la varianza
ias obtenidas por cada
uno
se puede
estimar de cualquiera de las muestras:
na Tabla de anlisis de
2
si

n 1

y
ij
i

j 1

y entonces tambin por su media:

Cada una de las varianzas mustrales si2 est basada en (n-1) grados de libertad
y entonces
est basada en k.(n-1) grados de libertad.
Por otro lado, la varianza de las k medias mustrales est dada por:

Y si la hiptesis es verdadera, esta expresin da una estimacin de 2/n y as una


estimacin de 2 , pero basada en la diferencia entre las medias, est dada por:

15

Basada en (k-1) grados de libertad.


Si Ho es cierta, se puede demostrar que
independientes de 2 y por ello:
F=

son estimaciones

Es una variable aleatoria con distribucin F con = k-1 y = k.(n-1) grados de


libertad.
Cabe esperar que la varianza entre muestras,

, exceda la varianza

dentro de las muestras,


, cuando la Hiptesis Nula es falsa, por eso Ho
ser rechazada si F>F.
Con el argumento anterior se ha indicado cmo la prueba de las k medias
se puede fundamentar en la comparacin de dos estimaciones de varianzas.
Es notable el hecho de que las dos estimaciones en cuestin [excepto para
los divisores (k-1) y k.(n-1)] pueden obtenerse partiendo o analizando la varianza
total de las n.k observaciones en dos partes. La varianza muestral de las n.k
observaciones est dada por:

Se puede probar el siguiente teorema respecto del numerador, llamado Suma de


Cuadrados Total:

Demostracin:

16

i1 j 1
k

y y y y
ij
i
i
.

i 1 j1

i 1 j1

k
2
y y 2
ij

i 1

y y
i

y y
ij i
n

j1

2 y y y y

y y
ij

ij

i 1

y y
i
.

y y
i .

y como:
n

j1

y y
ij
i

Se verifica la relacin anterior:


Se acostumbra a denotar:
a) Suma de Cuadrados Total, SST:
k

SST

y
ij
.

i 1 j 1

b) Suma de Cuadrados de Error, SSE:

c) Suma de Cuadrados de Tratamiento SS(Tr):

Luego, F se puede escribir as:

SS ( Tr )
k 1
SSE
k ( n 1)

17

Los resultados obtenidos son resultados en la siguiente tabla:


Fuentes
de
Variacin
Tratamien
tos
Error
Total

Grado
s
de
Liberta
d
k-1

Suma
de
Cuadra
dos
SS(Tr)

k.(n-1)
n.k-1

SSE
SST

Media Cuadrada

MS(Tr)=SS(Tr)/
MS(Tr)/M
(k-1)
SE
MSE=SSE/k.(n-1)

Ejemplo: A fin de utilizar el Anlisis de Varianza para un criterio de clasificacin,


suponer el siguiente esquema de mediciones de cuatro laboratorios de un
parmetro determinado (revestimiento de estao de 12 discos) cuyos resultados
son:
Lab.
A
Lab.
B
Lab.
C
Lab.
D

.
2
5
.
1
8
.
1
9
.
2
3

.27 .22 .
3
0
.28 .21 .
2
3
.25 .27 .
2
4
.30 .28 .
2
8

.
2
7
.
2
5
.
1
8
.
2
4

.
2
8
.
2
0
.
2
6
.
3
4

.32 .
2
4
.27 .
1
9
.28 .
2
4
.20 .
1
8

.31 .26 .21 .28 3.21

.24 .22 .29 .16 2.72

.25 .20 .21 .19 2.76

.24 .28 .22 .21 3.00

Total

11.6
9

Del que se quiere probar que las medias obtenidas por cada uno de ellos es
significativamente igual (Hiptesis Nula) con =0.05. Construir una Tabla de
anlisis de varianza.
Para facilitar clculos, se utilizan las frmulas:
k

SST

i1 j1

yij

SS ( Tr)

Ti C

i 1

Demostracin:

18

y y
ij

Para Suma de Cuadrados jtotal


1
k

SST

i1 j 1
k

yij

i 1 j 1

1
2 y ( k n )

.
( k n )

( k n )

i 1 j 1
( k n )

2
y k n y

ij

i1 j 1

i1 j1

2
y

2
y

2
yij kn

i 1 j1

2
k n y

2
yij 2 yijy.

y y
ij
.

ij

1
k n

i1 j1

ij

2
yij C

SST

i1 j1

Para Suma de Cuadrados de Tratamientos:


k

i 1

SS( Tr)

i 1

SS( Tr)

i 1

j1

i1

yi y .

2
2
y ( n k) y

i 1
C

ij

1
n

yi

ij

j 1

2 y
.

2
y k y

i 1

2
Ti C

i 1

donde C (llamado Trmino de Correccin) y Ti es:

k n

i 1 j 1

yij

Ti

yij

j 1

Donde Ti es el nmero total de n observaciones de la i-esima muestra, Mientras


que T es el Gran Total de las k.n observaciones. Luego, SSE se obtiene de:
19

SSE = SST SS(Tr)


Para el ejemplo:
T = 11.69

C = T2/(k.n) = 11.692/(4.12) = 2.8470

SST= 0.252 + 0.272 ++0.212 - 2.8740 = 0.0809


SS(Tr) = (3.212 + 2.722 + 2.762 + 3.002 ) / 12 - 2.8740 = 0.0130
SSE = 0.809 0.0130 = 0.0679
La Tabla queda:
Fuentes
de
Variacin
Laborator
ios
Error
Total

Grado
s
de
Liberta
d
3

Suma
de
Cuadra
dos
0.0130

Media Cuadrada

0.0043

2.87

44
47

0.0679
0.0809

0.0015

Conforme a las tablas de la funcin F, se puede encontrar el valor


correspondiente de la abscisa que deja a la derecha un rea de 0.05 siendo
adems los grados de libertad para el numerador y denominador 3 y 44,
respectivamente, como lo indica el siguiente grfico

Ya que F (2.87) excede a F0.05= 2.82, se rechaza la Hiptesis Nula, luego los
laboratorios no estn logrando resultados consistentes.

20

2.4 COMPARACIONES O PRUEBAS DE RANGOS MULTIPLES


Cuando se rechaza la hiptesis nula de no diferencia de ms de dos medias
(H0: m 1 = m 2 = = m k) en un anlisis de varianza surge la pregunta acerca de
cules pares de medias son diferentes, puesto que el rechazo de una hiptesis
nula con cuatro tratamientos (H0: m 1 = m 2 = m 3 = m 4), podra deberse a uno o
varios de los seis pares de diferencias que se pueden tener, esto
es: m 1 m 2 o m 1 m 3 o m 1 m 4 om 2 m 3 o m 2 m 4 o m 3 m 4
Existen varios procedimientos para determinar cules son los pares de medias
que son diferentes. El primero de estos procedimientos, y el ms utilizado en el
pasado, es el de la Diferencia Significativa Mnima (DSM) de Fisher publicada en
1935 en su libro The Design of Experiments. Este procedimiento es una extensin
de la prueba t de Student para el caso de comparacin de dos medias con
varianza ponderada.
Otros procedimientos ms recientemente usados para el mismo propsito son: la
prueba de Student-Neuman-Keuls, la prueba de Diferencia Significativa Honesta
de Tukey (DSH), la prueba del Rango mltiple de Duncan, la prueba de Dunnett y
la prueba de Scheff, entre otras. Vase Steel and Torrie y Federer.
Para ilustrar mejor las diferentes pruebas se tomar el siguiente ejemplo:
Ejemplo 1: Una empresa tiene cuatro plantas y sabe que la planta A satisface los
requisitos impuestos por el gobierno para el control de desechos de fabricacin,
pero quisiera determinar cul es la situacin de las otras tres. Para el efecto se
toman cinco muestras de los lquidos residuales de cada una de las plantas y se
determina la cantidad de contaminantes. Los resultados del experimento aparecen
en la siguiente tabla.
Tabla 1 Cantidad de contaminantes para cuatro plantas de una empresa.
PLANTA CONTAMINANTES

NI

1.65

1.72

1.50

1.35

1.60

7.84

1.568

1.70

1.85

1.46

2.05

1.80

8.86

1.772

1.40

1.75

1.38

1.65

1.55

7.73

1.546
21

2.10

1.95

1.65

1.88

2.00

9.58

1.916

TOTAL: N = 20
Antes de realizar el anlisis de varianza se debe trazar el diagrama de cajas
mltiple para determinar si existen casos extraordinarios y si se cumple el
supuesto de varianzas iguales:

Figura 1 Diagrama de caja para los datos del ejemplo 1


Los clculos se muestran en la siguiente tabla de ANDEVA.
Tabla de ANDEVA para los datos de contaminacin.
Fuente

g.l.

Trat.

4- 1=3

Suma
cuadrados

de Cuadrados
medios

Fcalculada

Ftablas

"Planta
s"
Error
20- 4=1
6
20- 1=1
9

Total
22

Conclusin: Puesto que Fcalc > Fteor se rechaza H0, y se concluye que hay
diferencia significativa (al 5%) entre las cantidades medias de contaminantes para
las diferentes plantas.
PRUEBA DE DIFERENCIA SIGNIFICATIVA MNIMA (DSM).DE FISHER
Cuando el anlisis de varianza indica la existencia de una diferencia significativa
se desea conocer cul de los pares de medias causa la diferencia. Cuando las
muestras son de igual tamao la Diferencia Significativa Mnima (DSM) de Fisher
nos ayuda a localizar esta fuente.
La Diferencia Significativa Mnima (DSM) se define como la diferencia mnima que
podra existir entre dos medias de muestras significativamente diferentes. Para
obtener la frmula para la DSM, se usa la prueba t de Student para la diferencia
entre dos medias cuando las varianzas no son diferentes cuyo estadstico de
contraste es:

Adems, si se considera ni = nj = n, entonces


Si este valor calculado es mayor que el valor terico (de tablas) decimos que la
diferencia entre m 1 y m 2 es significativa. As, la DSM puede considerarse como la
menor de las diferencias

Donde

, es decir,

, por lo tanto, se tiene:

Ejemplo 2: Calcule la DSM de Fisher para los datos del ejemplo 1

Los valores absolutos de las diferencias entre


muestran en la siguiente tabla.
Tabla Valores absolutos de las diferencias entre
1

del ejemplo 1 se

del ejemplo

23

0.204

0.022

0.348

0.226

0.144

0.370

Como se puede observar, las diferencias que exceden (DSM) estn entre las
medias
de m 3.

, y

, por lo tanto, slo difieren las medias m 4 de m 1 y

Es importante tener presente que la prueba DSM slo se debe emplear cuando
el ANOVA ha conducido al rechazo de H0. Si las muestras no son del mismo
tamao no se debe usar DSM.

PRUEBA DE DIFERENCIA SIGNIFICATIVA HONESTA (DSH) DE TUKEY


La prueba de Diferencia Significativa Honesta (DSH) de Tukey, al igual que
la DSM, slo se debe usar despus que se ha rechazado la hiptesis nula en el
anlisis de varianza y cuando todos los tamaos de muestra son iguales; pero a
diferencia de la DSM emplea el valor
. En lugar de
. Este
valor q se obtiene de la tabla T-8, para el nivel de significancia a , el nmero de
tratamientos K y los grados de libertad del error, entonces:

[13.7]
Ejemplo 3: Para los datos del ejemplo 1 y a = 0.05,

Los valores absolutos de las diferencias entre


muestran en la siguiente tabla.
Valores absolutos de las diferencias entre

del ejemplo 1 se

del ejemplo 1

24

0.204

0.022

0.348

0.226

0.144

0.370

Como se puede observar, las diferencias que exceden (DSH) estn entre las
medias
de m 3.

, y

, por lo tanto, slo difieren las medias m 4 de m 1 y

Es importante tener presente que la prueba DSH slo se debe emplear cuando
el ANDEVA ha conducido al rechazo de H0. Si las muestras no son del mismo
tamao no se debe usar DSH.

PRUEBA DEL RANGO MLTIPLE DE DUNCAN


La Prueba del Rango mltiple Duncan es otra prueba para determinar la diferencia
entre pares de medias despus que se ha rechazado la hiptesis nula en el
anlisis de varianza.
Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios
"rangos" (Duncan los llama rangos significativos mnimos) dados por la frmula:

Donde p toma valores entre 2 y K (K es el nmero de tratamientos), d se obtiene


de la tabla T-9 y el CMError se obtiene de la tabla de ANDEVA respectiva.
Ejemplo 4: Se realiz un experimento para determinar la cantidad (en gramos) de
grasa absorbida por 48 donas (doughnuts) usando ocho tipos diferentes de grasas
(aceites y mantecas). Las medias para los ocho tratamientos se muestran a
continuacin:

25

Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio del
error de 141.6, los grados de libertad del error son 48 - 8 =40.
Seleccionando a = 0.05 para este ejemplo, los rangos de Duncan son:

Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan (T-9)


para a = 0.05, 2 p 8 y 40 grados de libertad.
El siguiente paso es ordenar las medias en orden creciente para establecer los
"rangos".

El rango entre las medias mxima y mnima se compara con D8, esto
es,
7.

, entonces existe diferencia significativa entre las grasas 4 y

El prximo paso es comparar subconjuntos de siete medias con el rango D7.


, entonces
, entonces
Como los dos exceden el rango D7 se subdividen estos dos subconjuntos en
conjuntos de seis medias.
, entonces
, entonces
26

, entonces
Nuevamente stos exceden D6, entonces stos se subdividen en subconjuntos de
cinco medias
, entonces
, entonces
, entonces
, entonces
Como las medias para las grasas 3, 2, 6 y 1 estn incluidos en el conjunto 43261
que fue no significativo, los rangos de las medias en el subconjunto 3261 no se
comparan con D4; solamente los rangos de las medias en el subconjunto 2615 se
comparan con D4; por lo tanto,
, entonces
Los otros subconjuntos de cuatro medias (3, 2, 6,1) y (6, 1, 5,3) no se comparan
con D4 porque ya fueron declarados no significativos en los conjuntos de cinco
medias. Por lo tanto, el proceso termina.
Los resultados se muestran grficamente en la siguiente figura, donde las medias
que estn debajo de una lnea no son significativamente diferentes.

El investigador puede concluir que las cantidades absorbidas usando las grasas 4
y 3 son significativamente mayores que las 5, 8 y 7, y que la 2 es
significativamente mayor que las 8 y 7 y las dems grasas no son
significativamente diferentes en relacin con la cantidad absorbida.
PRUEBA DE DUNNETT
En muchos experimentos uno de los tratamientos es el control, y el investigador
est interesado en comparar cada una de las otras K- 1 medias de los
tratamientos contra el control, por lo tanto, existen K- 1 comparaciones. Un
procedimiento para realizar estas comparaciones es la prueba de Dunnett
(desarrollada en 1964). Si se supone que el control es el tratamiento a, entonces
se desea probar las hiptesis
27

El procedimiento de Dunnett es una modificacin de la prueba t. Para cada


hiptesis se calcula el valor absoluto de la diferencia de medias observadas

El rechazo de la hiptesis nula se realiza con una probabilidad de error tipo I, a si

,
donde la constante
se busca en la tabla T-10. Observe que f es el nmero
de grados de libertad del error y a es el nivel de significacin asociado con todos
las K- 1 pruebas y utilizado en el anlisis de varianza.

Ejemplo 5: En el ejemplo 1, la compaa desea comparar todas las otras plantas


con la planta A que es la que cumple con los requisitos (control), por lo tanto, la
prueba de Dunnett sera ms adecuada que la de Fisher o la de Tukey para este
caso.

En consecuencia, la nica planta que difiere significativamente de la planta A es


la D.
PRUEBA DE SCHEFF

28

Esta prueba es similar a la prueba de Tukey, difiere de ella en que en vez de usar
la tabla T-8 para obtener valores "studentizados" q utiliza la tabla F de Fisher (T-7)
para obtener el factor
donde K es el nmero

de tratamientos y a el nivel de

significacin.
Este factor

se multiplica por el error estndar de la diferencia

entre dos medias

para obtener la cantidad:

que se comparar con las diferencias entre los


pares de medias de los tratamientos.

Ejemplo 6: Usando los datos del ejemplo 4, se tiene:

Si la diferencia entre cualquier par de medias excede este valor se dice que hay
diferencia significativa entre las medias comparadas. Las diferencias entre las
ocho medias se muestran en la siguiente tabla.
Tabla Valores absolutos de las diferencias entre

del ejemplo 4

13

20

23

24

10

17

20

21

13

16

17

29

11

14

15

10

11

En este ejemplo todas las diferencias entre los pares de medias son menores que
27.3, por lo que no hay diferencia significativa entre los pares de grasas.
NOTA: Todas las pruebas estudiadas para comparar pares de medias requieren
que todos los tratamientos tengan el mismo nmero de observaciones n. Algunos
autores, entre ellos Snedecor y Cochran, han recomendado usar la media
armnica nh entre los tamaos de muestra nj cuando el nmero de observaciones
no es el mismo. Aparentemente esta aproximacin no altera el error de Tipo I.

2.5 VERIFICACION DE LOS SUPUESTOS DEL MODELO


La validez de los resultados obtenidos en cualquier anlisis de varianza
queda supeditada a que los supuestos del modelo se cumplan.
Estos supuestos son:
A) Normalidad
B) Varianza constante (igual varianza de los tratamientos)
C) Independencia
Esto es, la respuesta (Y) se debe distribuir de manera normal, con la misma
varianza en cada tratamiento y las mediciones deben ser independientes.
30

Estos supuestos sobre Y se traducen en supuestos sobre el termino error


( ) en el modelo
IJ =
Y +Ti+ ij
Es una prctica comn utilizar la muestra de residuos para comprobar los
supuestos del modelo, ya que si los supuestos se cumplen, los residuos o
residuales se pueden ver como una muestra aleatoria de una distribucin
normal con media cero y varianza constante.
Los residuos, eij se definen como la diferencia entre la respuesta observada

(Yij ) y la respuesta predicha por el modelo ( Y ij ), lo cual permite hacer un


diagnstico ms directo de la calidad del modelo, ya que su magnitud
seala qu tan bien describe a los datos del modelo.

Veamos
Recordemos que el modelo que se espera describa los datos en el DCA
est dada por:
IJ =
Y +Ti+ ij
Donde:
Y IJ

:(i= 1,2,k;j= 1,2, , n) es el j- esimo dato en el tratamiento i

: es la media global
Ti: es el efecto del tratamiento i
ij: representa el error asociado con la observacin Yij
Cuando se realiza el ANOVA, y slo cuando ste resulta significativo,
entonces se procede a estimar el modelo ajustado o modelo de trabajo
dado por:

31

Para comprobar cada supuesto existen pruebas analticas y grficas que


veremos a continuacin. Por sencillez, muchas veces se prefieren las
pruebas grficas. stas tienen el inconveniente de que no son exactas,
pero aun as, en la mayora de las situaciones prcticas proporcionan la
evidencia suficiente en contra o a favor de los supuestos.
Normalidad
Un procedimiento grfico para verificar el cumplimiento del supuesto de
normalidad de los residuos consiste en graficar los residuos en papel o en
la grfica de probabilidad normal que se incluye casi en todos los paquetes
estadsticos. Esta grfica del tipo X-Y tiene las escalas de tal manera que si
los residuos siguen una distribucin normal, al graficarlos tienden a quedar
alineados en una lnea recta; por lo tanto, si claramente no se alinean se
concluye que el supuesto de normalidad no es correcto. Cabe enfatizar el
hecho de que el ajuste de los puntos a una recta no tiene que ser perfecto,
dado que el anlisis de varianza resiste pequeas y moderadas
desviaciones al supuesto de normalidad.

32

Figura 2.2 Grafica de normalidad para los cuatro tipos de cuero


Varianza constante
Una forma de verificar el supuesto de varianza constante (o que los tratamientos
tienen la misma varianza) es graficado los predichos contra residuos (Y ij vs. ei), por
lo general Yij va en el eje horizontal y los residuos en el eje vertical. Si los puntos
en esta grfica se distribuyen de manera aleatoria en una banda horizontal (sin
ningn patrn claro y contundente), entonces es seal de que se cumple el
supuesto de que los tratamientos tienen igual varianza. Por el contrario, si se
distribuyen con algn patrn claro y contundente, como por ejemplo una forma de
corneta o embudo, entonces es seal de que no se est cumpliendo el supuesto
de varianza constante.

Figura 2.3 Grafica de la varianza constante para los cuatro tipos de cuero

Independencia
La suposicin de independencia en los residuos puede verificarse si se grafica el
orden en que se colect un dato contra el residuo correspondiente. De esta
manera, si al graficar en el eje horizontal el tiempo (orden de corrida) y en el eje
vertical los residuos, se detecta una tendencia o patrn no aleatorio claramente
definido, esto es evidencia de que existe una correlacin entre los errores y, por lo
tanto, el supuesto de independencia no se cumple. Si el comportamiento de los
puntos es aleatorio dentro de una banda horizontal, el supuesto se est
cumpliendo. La violacin de este supuesto generalmente indica deficiencias en la
planeacin y ejecucin del experimento; asimismo, puede ser un indicador de que
no se aplic en forma correcta el principio de aleatorizacin, o de que conforme se
fueron realizando las pruebas experimentales aparecieron factores que afectaron
la respuesta observada. Por ello, en caso de tener problemas con este supuesto,
las conclusiones que se obtienen del anlisis son endebles y por ello es mejor
revisar lo hecho y tratar de investigar por qu no se cumpli con ese supuesto de
independencia, a fin de reconsiderar la situacin
33

Eleccin del tamao de la muestra


Una decisin importante en cualquier diseo de experimentos es decidir el nmero
de rplicas que se har por cada tratamiento (tamao de muestra). Por lo general,
si se esperan diferencias pequeas entre tratamientos ser necesario un mayor
tamao de muestra. Aunque existen varios mtodos para estimar el tamao
muestral, muchas veces tienen poca aplicabilidad porque requieren cierto
conocimiento previo sobre la varianza del error experimental. Si recurrimos a la
experiencia vemos que el nmero de rplicas en la mayora delas situaciones
experimentales en las que se involucra un factor vara entre cinco y diez; incluso,
en algn caso puede llegar hasta 30. La tendencia podra inclinarse por un
extremo de este rango e incluso salirse de ste, de acuerdo con las siguientes
consideraciones:

A menor diferencia que se espera en los tratamientos, mayor ser la


cantidad de rplicas si se quieren detectar diferencias significativas, y
viceversa, es decir, si se esperan grandes diferencias quiz con pocas
replicas sea suficiente
Si se espera mucha variacin dentro de cada tratamiento, debido a la
variacin de fuentes no controladas como mtodos de medicin, medio
ambiente, materia prima, etc., entonces se necesitarn ms rplicas
Si son varios tratamientos (cuatro o ms), entonces ste es un punto
favorable para reducir el nmero de rplicas.

Adems de lo anterior, es preciso considerar los costos y el tiempo global del


experimento. De aqu que si toman en cuenta las consideraciones antes
expuestas se podr establecer el tamao de muestra que permita responder en
una primera fase las preguntas ms importantes que se plantearon con el
experimento
Supongamos que el experimentador ya tiene el nmero de tratamientos que desea
probar K y que tomando en cuenta las consideraciones antes citadas tiene una
propuesta inicial del nmero de rplicas por tratamiento que va a utilizar, n 0.
Tambin tiene una idea aproximada del valor de (la desviacin estndar del
error aleatorio), as como una idea de la magnitud de las diferencias, d t , entre
tratamientos que le interesa detectar.
Por ejemplo, supongamos que en el caso de los tiempos promedio de los K= 4
mtodos de ensamble (del ejemplo 1), tiene idea realizar n 0 = 5 pruebas; en cuanto
a las diferencias, le interesa detectar 2 minutos, d t entre un mtodo y otro, y
espera que cada mtodo tenga una variabilidad intrnseca de = 1,5; esto
debido a factores no controlados (habilidad del operador, cansancio, variabilidad
de las partes a ensamblar, error de medicin del tiempo de ensamble, etctera).

34

La frmula que tentativamente debemos usar para la eleccin del tamao de


muestra es:

El valor de n arrojado por esta frmula dar una idea del nmero de rplicas por
tratamiento, de acuerdo con las consideraciones iniciales que se reflejan a travs
de (K,n0, , dt), y sobre todo por el nmero total de corridas experimentales, n,
que es lo que muchas veces interesa ms al experimentador debido a los costos y
tiempos. Si N est fuera del presupuesto se podrn revisar algunas
consideraciones y quiz pensar en un nmero menor de tratamientos. Al aplicar
esta expresin al caso de los cuatro mtodos del ensamble obtenemos con un
nivel se significancia del 0,05:
K= 4
n0= 5

= 1,5

dt= 2
= 0,05

Por lo tanto n=5 se debera utilizar como tamao de muestra (nmero de pruebas
por tratamiento).

35

2.6. USO DE UN SOFTWARE ESTADSTICO


Excel
a) En una hoja de Excel capturar primeramente la tabla de datos
b) En la misma hoja de clculo seleccionar del cintillo superior Datos, luego
Anlisis de datos
c) Seleccionar anlisis de varianza de un factor en la ventana despleg

d) En rango de entrada (en ventana de captura) seleccionar todos los grupos,


incluyendo su rtulo (sombrearlos con el mouse), automticamente se
incluyen
e) En el siguiente recuadro seleccionar si nuestros datos estn ordenados en
filia o columnas, adems indicar si tenemos rtulos en los encabezados, e
indicar que los resultados los arroje en una hoja nueva.

36

Nota: Si no aparece Anlisis de datos en la parte superior derecha de la hoja de


clculo, se deber de activar de la siguiente manera:

En el smbolo del sistema en la parte superior izquierda de los encabezados


dar clic.
En la ventana desplegada seleccionar opciones de Excel en la parte inferior
dando un clic.
De la ventana desplegada sealar en el men del lado izquierdo
complementos
De la ventana desplegada en el lado derecho, sealar en la parte inferior de
la misma ir con un clic.
De la ventana desplegada palomear el recuadro de herramientas para
anlisis, y aceptar
Nota: como no est instalada esta herramienta el sistema nos preguntara si
queremos instalarla a lo que indicaremos que s, y la instalara en un par de
minutos.

Minitab
En la hoja de clculo que despliega Minitab capturar nuestra tabla de
datos indicando sus correspondientes rtulos en la primera fila que no
est numerada.
En el cintillo superior indicar con el mouse Estadsticas.
Del men desplegado seleccionar ANOVA, en el men desplegado
seleccionar Un solo factor (Desapilado) y dar clic con el mouse.

37

En ventana de captura desplegada (Anlisis de varianza- Un solo


factor), en la parte izquierda aparecern automticamente los grupos de
tabla de datos.
En el cuadro superior derecho (Respuestas (en columnas separadas))
indicar separando por un espacio (sin comas) los nombres de las
columnas que generalmente son letras, esto tambin se logra dando
doble clic en cada letra del cuadro de la izquierda, automticamente son
capturadas.
En nivel de confianza por default es 95%
Sealar Aceptar y nos arrojara el resultado ANOVA en la parte superior
de la hoja de clculo.

Si queremos hacer comparaciones de rango mltiples, entonces


sealamos de la ventana anterior comparaciones dando un clic.
En la ventana desplegada sealaremos las comparaciones que
queramos, y en control nivel del grupo indicamos la A, y damos clic en
aceptar.

38

Si queremos las grficas del supuesto del modelo entonces, damos clic
a grficas (antepenltima ventana) y sealamos tres en uno y damos
clic en aceptar

39

EJEMPLOS ADICIONALES DE LOS DISTINTOS TEMAS


INVESTIGADOS
Modelo de efectos fijos
(Tomado de Montgomery)
Un ingeniero disea una bateria para su uso en un dispositivo que ser sometido a
ciertas variaciones extremas de temperatura. El nico parmetro de diseo que l
puede seleccionar en este punto es el material de al cubierta de la batera, y tiene
tres alternativas. Cuando el dispositivo se manufactura y se enva al campo, el
ingeniero no tiene control sobbre los extremos de las temperaturas a que ser
expuesto el dispositivo, y sabe por experiencia que es probabble que la
temperatura influye sobre la duracin de la batera.- Sin embargo, s es posible
controlar la temperatura en el laboratorio de desarrollo de productos para los fines
del ensayo.
El ingeniero decide probar los tres materiales de la cubierta a tres niveles de
temperaturas (15, 70 y 125
) consistentes en el entorno de su uso final del
producto. Se prueban cuatro bateras a cada combinacin del material de cubierta
y temperatura, y las 36 pruebas se ejecuta al azar. La siguiente tabla muestra los
datos resultantes de la duracin observada de las bateras.
Temperatura
15

70

130
74

155
180

34
80

40
75

20
82

70
58

150
159

188
126

126
106

122
115

25
58

70
45

138
168

110
160

174
150

120
139

96
82

104
60

Tipo de
material

125

Como auxiliar de la interpretacin de los resultados de este experimento resulta


til la construccin de una grfica de las respuestas promedios de cada
combinacin de tratamiento.

40

Figura 1. Grfica de lineas para los tipos de materiales en los niveles de


temperatura
De la grfica dse puede observar que la diferencia entre los promedios de los
materiales 1 y 2 no es la misma en los tres niveles, anlgogamente para los casos
de los materiales 1 y 3, y 2 y 3. De lo que se puede sospechar que los materiales
no se comportan de la misma manera en cada nivel de temperatura, por lo cual se
puede establecer que existe interaccin entre los tipos de materiales y los niveles
de temperatura.
Tabla 1. ANOVA para los datos del ejemplo 1
Causa de
variacin

Grado
s de
libertad

Suma de
cuadrados

Cuadrados
medios

Tipo
de 2
material
Temperatur 2
a
Interaccin 4

10633.167

Error
experimental

17980

5316,58333
3
19541,5833
3
2359,41666
7
665,953703
7

27

39083.167
9437.66

ValorP

Ftabla

0.0018884
8
1.6944E07
0.0189730
6

3.35

F
7.98
29.3
4
3.54

3.35
2.727
7

Total
37
77134.75
De la tabla de Anova se puede observar que al nivel de significacin de 0.05 todas
las causa de variacin resultan significativas, pero no se debe tener encuenta para
el anlisis los factores individuales sino la interaccin, ya que esta interaccin nos
41

dice que la repuesta se potencia cuando se combinan los niveles de los factores y
no cuando se aplican por separado. Por tanto lo que sigue en el anlisis es aplicar
los procedimiento de comparacin mltiple para los niveles de tipo de material en
cada nivel de temperatura.

Diseo de experimentos con un factor fijo


Un campus universitario tiene cuatro facultades. Se quiere estudiar la variable
tiempo que tarda un alumno en hacer una consulta en la base de datos de la
biblioteca de su facultad. Para ello se ha recogido una muestra aleatoria cuyos
resultados son los de la tabla adjunta. Analizar estos datos y estudiar la influencia
del factor facultad en la variable de inters.
Arquitectura I. Informtica

Derecho

I. Caminos

48

37

24

18

37

43

19

13

31

29

16

40

40

26

21

31

24

22

24

51

35

31

26

36

38

10

30

49

33

13

24

39

41

25

24

36

39

12

12

11

15

24

55

16

21

35

40

30

26
Solucin:
Se calcula la media y desviacin tpica de cada una de las facultades y del
total:
42

= 11 654 (cuasi-desviacin tpica muestral)

= 11 537 (desviacin tpica muestral)

'

'

Por tanto, la suma de cuadrados global es:

Razonando igual en cada grupo, se obtiene

El contraste de inters es el siguiente:

A la vista de los resultados del cuadro anterior se puede intuir que se va a


rechazar la hiptesis nula y que por tanto el factor facultad influye en la variable
de inters.
Se calcula la tabla ANOVA. Para ello, se tiene en cuenta que las predicciones
coinciden con las medias condicionadas:

Se calcula la suma de cuadrados explicada por el factor


43

scT

(facultad)
=
= 10

4
i=1

+ 12

+ 15

4
i=1

i
2

+ 13

+
2

= 4101 33
'

Finalmente, se obtiene la suma de cuadrados residual

La tabla ANOVA es

> 0'0001 y se concluye

Se rechaza la hiptesis nula para cualquier valor de


que el factor facultad es significativo.
La scR se calcula a partir de los residuos
scR

ij

eij2 =

ij

+ ... +

=
+

+ ... +

+ ... +

+ ... +

= 2553 47
'

Se calculan intervalos de confianza al 90% para los diferentes parmetros del


modelo:
Intervalo de confianza para la varianza:

31 44 =
'

46

<

46

<

46

= 62 83
'

44

40 64 =

<

'

<

= 81 22
'

Intervalo de confianza para

Intervalo de confianza para

n-I

- 1 68 = t
'

<

46

46

<t

= 1 68
'

46

35 4 2 36 . 1 68 = 35 4 3 96 =
'

'

'

'

'

De forma anloga se obtienen intervalos de confianza para las otras medias,


IC

IC

IC

Intervalo de confianza para la diferencia de medias. Se hace para

- 1 68 = t
'

46

<

n-I

46

<t

46

= 1 68
'

45

16 65 3 19 . 1 68 = 16 65 5 36 =
'

'

'

'

'

Puede considerarse que existe una diferencia significativa entre la media de


Arquitectura y la media de Informtica.
Haciendo todos los intervalos de confianza para la diferencias de medias se
obtienen dos grupos homogneos:
Grupo 1: Informtica y Caminos
Grupo 2: Arquitectura y Derecho.
En las siguientes figuras se representan grficas que ayudan a entender la
influencia del factor y que los residuos verifican las hiptesis estructurales.

Figura 4.27. Grfico de cajas mltiple para los datos del problema 2.8.

46

Figura 4.28. Grfico de medias condicionadas para los datos del problema 2.8.

Figura 4.29. Grfico de residuos frente a predicciones.

Diseo de experimentos con un factor aleatorio


En una empresa de montaje trabajan 135 operarios que realizan un
determinado trabajo (T). La direccin de la empresa est interesada en conocer si
influye el factor operario en la variable tiempo de realizacin del trabajo T. Para
ello se eligen cinco operarios al azar y se les controla el tiempo en minutos que
tardan en realizar el trabajo T en diez ocasiones.
Los resultados del experimento son los de la tabla adjunta. Qu conclusiones
se deducen de este experimento?

47

Oper.1.

Oper.2.

Oper.3.

Oper. 4.

Oper.5.

72

75

78

69

65

75

70

79

65

60

71

77

84

61

63

69

73

72

75

68

67

79

83

70

70

71

77

77

68

64

75

72

80

67

62

73

78

83

63

64

69

73

71

76

69

65

69

85

72

62

Solucin:

En este caso el diseo de experimentos tiene un factor, pero el factor


es aleatorio.
Se calculan las medias y cuasi-desviaciones tpicas en cada grupo (operador)

De donde

48

En este caso el modelo matemtico es

Siendo el objetivo la realizacin del contraste:

Teniendo en cuenta que las predicciones son las siguientes:

Se calcula la suma de cuadrados explicada por el factor

scT(operador)

5
i=1

4
i=1

= 10
= 1224 2.
'

Finalmente, se obtiene la

La tabla ANOVA es

Se rechaza la hiptesis nula para cualquier valor de

> 0 0001 y se concluye


'

que el factor operador es significativo, esto es, hay variabilidad entre los
diferentes operadores.
Se estiman las varianzas del modelo:

49

Al igual que en el problema anterior las siguientes grficas ayudan a


comprender e interpretar la resolucin del problema.

Figura 4.30. Grfico de cajas mltiple para los datos del problema 2.9.

Figura 4.31. Grfico de medias condicionadas.

50

Figura 4.32. Grfico de residuos frente a predicciones para los datos del
problema 2.9.
ELECCIN DE MUESTRA
En un lote de frascos para medicina, con una poblacin de 8000 unidades, se
desea estimar la media de la capacidad en centmetros cbicos de los mismos.
A travs de un premuestreo de tamao 35 se ha estimado que la desviacin
estndar es de 2 centmetros cbicos. Si queremos tener una precisin 0.25 cms3,
y un nivel de significancia del 5% . De que tamao debe de ser la muestra?
DATOS:
S = 2 cms3 ; N = 8000 ; d = 0.25 cms3 ; a = 0.05 (5%)
Za/2= 1.96

N Za/2S

8000(1.96)(2)

n = -------------- = --------------------------- = 238 frascos


Nd + Za/2S

8000(0.25) + (1.96)(2)

Solo faltara muestrear 203 frascos, pues los datos de los 35 frascos del
premuestreo siguen siendo vlidos.

Una cantidad, con frecuencia, de inters para una clnica es el porcentaje de


pacientes retrasados para su vacunacin. Algunas clnicas examinan cada registro
para determinar el porcentaje; Sin embargo, en una clnica grande, la realizacin
51

de un censo de los registros puede llevar mucho tiempo. Cullen (1994) realizo una
muestra de los 580 nios a los que da servicio una clnica familiar, en Auckland
para estimar la proporcin de inters.
Que tamao de muestra sera necesario con una muestra aleatoria simple (sin
reemplazo) para estimar la proporcin con el 95% de confianza y un margen de
error de 0.10 .
DATOS:
N = 580 Nios

En realidad, Cullen realizo una muestra aleatoria simple con reemplazo de tamao
120, de los cuales 27 resultaron como no retrasados para la vacuna. De un
intervalo de confianza al 95% para la proporcion de nios no retrasados.
Solucin:

En un estudio, se desea determinar en qu proporcin los nios de una regin


toman incaparina en el desayuno. Si se sabe que existen 1,500 nios y deseamos
tener una precisin del 10 por ciento, con un nivel de significancia del 5%. De qu
tamao debe de ser la muestra?
DATOS:
N = 1500; d = 10 % = 0.1; a = 5 %
p = 0.5 y q = 0.5 (asumiendo varianza mxima).
Za/2= 1.96
52

Za/2 pq
1500 (1.96)(0.5)(0.5)
n = ----------------- = ------------------------------d + Za/2 pq 1500(0.1) + (1.96)(0.5)(0.5)

91

Se deben de muestrear 91 nios.

BIBLIOGRAFA
53

http://www.virtual.unal.edu.co/cursos/ciencias/2000352/html/un5/cont_50583.html
ioestadistica Principios y Procedimientos. Steel and Torrie. 2Edicin. Mc
Graw Hill,1988. ..
Diseo y Anlisis de Experimentos. Douglas Montgomery. Grupo Editorial
Iberoamerica.1991.
Bioestadstica. William C. Schefler. Fondo Educativo Interamericano, S.A.,
1981.
http://victoryepes.blogs.upv.es/2013/04/27/diseno-completamente-al-azar-yanova/
http://colposfesz.galeon.com/disenos/teoria/cap13bmj/cap13bmj.htm

54