You are on page 1of 82

ANÁLISIS DE VARIANZA

1. Tres lotes pilotos de 5 cerdos cada uno escogió un ingeniero para


realizar durante tres meses de prueba de alimentación. El lote 1
recibió el método de alimentación A, el lote 2 el B y el lote 3 el C.
los rendimientos de los métodos de alimentación medidos como el
peso final (en kilogramos) de los cerdos se resumen en la siguiente
tabla de análisis de varianza

a) Describa la variable dependiente y el modelo de este ANOVA.


b) ¿existe evidencia de una diferencia significativa entre los tres tipos
de alimentación? Plantee las hipótesis nula y alternativa,
describa la estadística y la región de rechazo de la hipótesis
nula al nivel de significación α=0.05 y finalmente tome la decisión
completando previamente la tabla ANOVA

SOLUCIÓN

a) La viable dependiente = X es el rendimiento pues esta


depende del método de alimentación que les sea aplicado
b)

H:
₁µ =µ =µ
H : Una µₓ es diferente

₀ ₁ ₂ ₃


Fuente
de SC GL MC
Varianzas
Tipos de 377.733
 Alimentación
2 188.8665
10.4346133
Error 217.2 12 18.1
Total 594.933 14 206.9665

 Métodos de Alimentación: 3
 N° de Cerdos por métodos: 5
 N° de Cerdos totales: 15
Sabemos que: α=0.05

 Al calcular el Ft obtenemos: 3.89


 Además, Tenemos que:  10.435
Entonces al saber eso observamos que:  > 
Por lo tanto, al saber esto decimos que: Se rechaza la hipótesis
nula
2. La empresa P&C que maneja 15 merados quiere comparar la
efectividad de tres tipos e publicidad usados para sus mercados. Se
asignaron 5 de estos mercados al azar a cada uno de los tres tipos
distintos de publicidad con el propósito de estudiar el impacto de los
carteles en las ventas. Al cabo de un mes, el monto de las ventas
X (en miles de dólares) de cada uno de los cinco mercados
asignados a cada uno de los tipos de publicidad dieron los
siguientes resultados:


  ∗ 2  2 96,698
Ventas totales para cada tipo de publicidad:

. 2. .


= 400, = 425 y = 375
 Al nivel de significancia de 0.05, ¿proporcionan estos datos suficiente
evidencia para inferir que los promedios de ventas son iguales para
los tres tipos de carteles?
SOLUCIÓN
Planteamos la hipótesis:

: µ µ2 µ


Hacemos una tabla con los datos dados
MERCADOS TIPOS DE PUBLICIDAD TOTAL MEDIAS DE LOS BLOQUES
2
1 3
1
2
3
4
5 400-(a+b+c+d) 425-(e+f+g+h) 375-(i+j+k+l)
TOTAL 400 425 375 1200
MEDIAS 80 85 75 80

 = 80
∗∗

  = 80
1∗

 = 85
2∗

 = 75
3∗

∗∗ 
=

Sacamos el valor de c, el cuál será: C=96000
Sacamos los valores de SCT, SCE Y SCA

= =∑ 
∑∑ 2 ∗2   SCE = ECT - SCA

SCT 698

SCA 250 SCE 448

TABLA ANOVA
FUENTE DE SUMA DE GRADOS MEDIAS RAZÓN F
VARIACIÓN CUADRADOS DE CUADRATICAS CALCULADA
LIBERTAD
PUBLICIDAD 250 2 125 3.34821429
ERROR 448 12 37.33333333
TOTAL 698 14

RC = {F
(2,12)>3.89}
FCAL= 3.35
P=P [F (3,12)>3.35]
F (3,12) (5%)=3.89>3.35
RPTA: Al ver que cumple que el F de la tabla es mayor que
F(cal) podemos aceptar la hipótesis nula
Por lo tanto 

: µ µ2 µ


Se
cumple
SCA =
250 SCE
= 448
SCT =
698
P = P[F>3.35] = 0.07
3. Para comparar el rendimiento de una variedad de uva un Ingeniero
diseño un experimento con tres métodos de cultivo en una de las
viñas de San
 Antonio en San Martin. Se escogieron tres terrenos de siembra de
iguales características en las que se sembró el mismo número de
plantas por pacerla de la nueva variedad de uva. El lugar B de 6
parcelas no se abonó. El lugar A de 5 parcelas se abonó con abono
ecológico casero y el lugar C de 7 parcelas se abonó con abono
industrial comercial. La primera cosecha ha dado las siguientes
estadísticas e kilogramos de uva.

 X: Rendimiento en kilogramos

Modos de Tamaño de Total Medias


Cultivo Muestra
A 5 450 90
B 5 400 80
C 5 500 100
Desviación estándar de X, igual a 10.

a) Al nivel de significación 0. 0 5


 , ¿Se podría inferir que los
promedios de rendimiento por modos de cultivo de la uva son
significativamente
diferentes?
b) Si se concluye hay diferencias significativas en los promedios
de rendimiento por modos de cultivo. ¿Cuál modo de cultivo se
debería seguir? Aplique el método de comparaciones múltiples de
Benferroni para pares de medias con nivel de confianza de al
menos 95%.
SOLUCIÓN
a)

1) Hipótesis
Ho: 1 = 2 = 3
H1: Son d iferentes

2) De los datos tenemos:

A X^2 B X^2 C X^2


1 90 8100 80 6400 100 10000
2 90 8100 80 6400 100 10000
3 90 8100 80 6400 100 10000
4 90 8100 80 6400 100 10000
5 90 8100 80 6400 100 10000
Total 450 40500 400 32000 500 50000
Número Tamaño
Modos de de de Total Medias Suma de
cultivo Parcelas muestra Cuadrados
 A 5 5 450 90 40500
B 6 5 400 80 32000
C 7 5 500 100 50000
total 18 15 1350 270 122500

3) Aplicando las formulas hallamos SCT, SCI y SCE:

Donde:

SCT 1400.00
SCI 1000
SCE 400.00
J 3
J-1 2
N 15
N-J 12

4) Calculo de Medias Cuadráticas:

Donde:
MCI = SCI /( J-1) 500
SCE / (N- J)
MCE = 33.33

5) Estadístico de contraste:

F = 14.999
6) Regla de Decisión

Rechazar Ho, si  1    , ...5 ,


22 = 3.89

7) Decisión:
Puesto que el estadístico F cae en la zona critica, se rechaza Ho
con un nivel de confianza del 95%. Podemos concluir que las
medias del rendimiento no son iguales.

4. Un fabricante va adquirir una de cuatro marcas de componentes A, B,


C y D, disponibles en experimento de un factor completamente
aleatorio con cinco unidades de cada componente para cada una
de las marcas. En una prueba de laboratorio con simuladores
obtuvo las siguientes estadísticas de vida útil en días: el mercado,
para determinado sistema. El análisis estadístico encargado del
estudio, diseño un
 X: Vida útil

Marca de Tamaño de Total


Componentes Muestras
 A 5 454
B 5 397
C 5 506
D 5 450

Desviación estándar Sx = 8,2671


a) Al nivel de significación
0. 0 5
 , ¿se podrá inferir que la marca
de la componente es un efecto en el rendimiento de las
mismas?
b) ¿Qué marca de componente debería adquirir el fabricante?
Use el método de intervalos de pares de medias de Bonferroni
con nivel de confianza global de al menos 95%.
SOLUCIÓN
b)
I. Planteamos:
Ho: 1 = 2 = 3
H1: Son d iferentes

II. De los datos tenemos:

 A X^2 B X^2 C X^2 D X^2


90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
454 41223.2 397 31521.8 506 51207.2 450 40500
Tamaño
Marca de componentes Suma de Cuadrados
de Total Media
muestras
 A 5 454 90.8 41223.2
B 5 397 79.4 31521.8
C 5 506 101.2 51207.2
D 5 450 90 40500
total 20 1807 361.4 164452.2

III. Aplicando las formulas hallamos SCT, SCI y SCE:


Donde:
SCT 1298.55
SCI 1189.75
SCE 108.80
J 4
J-1 3
N 20
N-J 16

IV. Calculo de Medias Cuadráticas:

Donde:
SCI /( J-
MCI = 1)396.58
SCE / (N- J)
MCE = 6.80
V. Estadístico de contraste:

F = 58.322
VI. Regla de Decisión

Rechazar Ho, si  1    ,  ...5 3, = 3.252


Donde F = 58.322 >

3.252 VII. Decisión:


Puesto que el estadístico F cae en la zona critica, se rechaza
Ho con un nivel de confianza del 95%. Podemos concluir
que las medias del rendimiento no son iguales.

5. Un investigador médico realizó una evaluación a profesionales


que trabajan en forma dependiente en diferentes áreas para ver si
alguna de estas es más propensa a producir stress. Usó un
cuestionario de 20 preguntas de 4 opciones cada una en donde
pueden marcar de 1 a 5. Los puntajes obtenidos de 20(nivel bajo de
stress) a 100(nivel elevado de stress) se resumen en la siguiente
tabla:
Tamaño de Media Desviación
las muestras Estándar
Economistas 10 56.5 1.780
Ingenieros 10 45.6 1.897
Docentes 10 60.3 1.947
universitarios

a) ¿Se puede inferir que no existe diferencia significativa entre


los puntajes promedios de stress de los ingenieros y
docentes universitarios? Utilice la probabilidad de error tipo I
igual a 0.05.
b) Pruebe la hipótesis que afirma que no existe
diferencia significativa en el stress que ocasiona el t
rabajo de estas profesiones. Use nivel de
significación a=0.05.
c) Si existiera diferencia significativa entre los promedios, ¿cuál
de estas profesiones produce mayor stress?
SOLUCIÓN
a)
1) Formulación de Hipótesis

 2 


:
:

 2∝ 0.05 ˄   01118


2) Estadígrafo de

2 ..0.05,18
2 8.869
3) Toma de decisión:

b)
Las varianzas son iguales, entonces se rechaza .

1) Formulación de Hipótesis

  ∃  0  1,,3
:
:
2) Análisis de Varianza- tabla ANOVA

0  

̅ 2 2
Tamaño MediaDesviación
de las Estándar
muestras
Economistas 10 56.5 1.780 565 31954.184 5.601
10
Ingenieros Docentes universitarios 45.6 1.897 456 20829.586 72.818
10 60.3 1.947 603 36398.808 38.028

1624 89182.3578 116.447

∑  ∗
  56.5 ∗10565

2  45.6 ∗10456


  60.3 ∗10603
 ∑ 2  [2 +2] ∗
2 [1.7802 +56.52]∗1031954.184
22 [1.8972 +45.62]∗10089.586
2 [1.9472 +60.32]∗1036398.808
Resultados:
 16 8791.533
3)

3 0 5788791.533159.4667
8918.
4
10∗116.4471164.4667
 1  5 9 . 4 6 671164.466795
2 31301
 59 . 443.
6 6 4799
4)
30
Tabla ANOVA:
Fuentes de Suma de Grado de Medias Razón F
Varianzas Cuadrados Libertad Cuadráticas calculada
Tratamiento 1164.467 2 582.233 165.47678
Error 95 27 3.519
Total 1259.467 29

∝0.05 ˄
5) Nivel de significancia:

.  .  0.05,165.
,7 .
>165.4767 .4.767 165.4767,3,16
>165.4767 .
6) Región Critica:
R.C= [F (2,27)>3.35]
7) Toma de decisión: Se rechaza Ho.
c)
La que produce mayor estrés es la profesión de Docentes
Universitarios.

45.6<56.5<60.3
2 < < 
6. El proyecto académico de un ingeniero es el diseño de un
experimento a fin de determinar el rendimiento de 4 variedades de
papa sin tener en cuenta la influencia de la fertilidad de las tierras de
cultivo. Las 20 parcelas de igual fertilidad que le fueron asignadas
los dividió en 4 grupos de 5 parcelas cada una. A cada grupo de
parcelas le asignó una variedad distinta de papa escogida al azar,
resultando un diseño completamente aleatorizado. Los rendimientos
medidos en kilogramos de las cinco variedades por parcela se dan
en la tabla que sigue:
V1 V2 V3 V4
55 52 53 52
53 58 55 50
60 50 57 51
52 60 51 49
53 52 54 53
a) Defina la variable dependiente, los niveles del factor, el modelo
del diseño y los supuestos del modelo.
b) Compare descriptivamente las medias de los rendimientos
utilizando un método gráfico.
c) Estime el efecto que produce la variedad 3 en el valor medio
global del rendimiento.
d) Al nivel de significación del 5%, ¿se puede inferir que existen
diferencias significativas entre las producciones medias de las
4 variedades de papa?

SOLUCIÓN

  2   


1) Formulación de Hipótesis:

 ∃  
:
2) Análisis de Varianza – Tabla ANOVA:
3) Nivel de Significancia:

∝0.05 ˄ Fo1.55
F
INV.F.CD0.05,3,16
.  1. 5 5, 3 , 1 6
PFo>1.55 DIST.F.CD
> . .
4) Región Critica:
R.C= [F (3,16)>3.35]
5) Toma de decisión: Se acepta Ho.

7. Para comparar el tiempo empleado en realizar una tarea específica


bajo tres procedimientos, un investigador diseñó un experimento
seleccionado al azar tres muestras independientes de 10 operarios
cada una y asignó al azar un procedimiento a cada muestra. Los
tiempos registrados en segundos se dan en la tabla que sigue:
P1 P2 P3
13.45 22.81 18.92
19.1 20.69 21.32
20.73 24.4 25.93
23.6 26.86 19.07
13.45 22.37 20.98
23.29 19.98 26.4
14.93 20.98 28.04
17.07 24.08 23.44
13.65 18.35 18.47
18.79 17.22 25.42
 Además, la desviación estándar de la variable dependiente es
igual a 4.0072
a) Describa la variable dependiente, el factor y sus niveles. El modelo
del diseño y sus supuestos. Además, describa si hay indicios de
diferencias significativas entre los tres procedimientos.
b) ¿Existe diferencia significativa entre los promedios de tiempos
empleados por los procedimientos 2 y 3? Utilice el nivel de
confianza 0.95.
c) Realice una prueba de hipótesis global de los promedios de los tres
procedimientos, al nivel se significación α = 0.05.
d) ¿Cuál de los procedimientos empleados es óptimo? Aplique el
método de intervalos de pares de medias de Bonferroni con nivel
de confianza al menos 96% y el método de rangos de Duncan
con nivel se significación 0.05.
SOLUCIÓN
a)
- Variable independiente: X = Tiempo, en segundos, para
realizar una tarea específica.
- Variable dependiente o factor: A = Procedimientos
- Niveles o Tratamientos: Son los procedimientos P1, P2 y P3.
- El modelo de este ANOVA está dado por:

 - Supuestos:
 +  , i = 1,2,3 j = 1, 2, …,10.

+
b) C O M P A RA CIÓN POR BONFERRONI

Entonces: 2 
c)

 A = Procedimientos
P1 P2 P3
13.45 22.81 18.92
19.1 20.69 21.32
20.73 24.4 25.93
23.6 26.86 19.07
13.45 22.37 20.98
23.29 19.98 26.4
14.93 20.98 28.04
17.07 24.08 23.44
13.65 18.35 18.47
18.79 17.22 25.42

TOTALES  ∙ 178.06 217.74 227.99


 ∙∙  =

ni = r
10 10 10
 30

MEDIAS 
 
∙
17.806 21.774 22.799

 
∙∙
62.379
 =
De los datos se obtiene:
- SCT = 465.66123
- SCA = 139.08566
- SCE = 326.57557
Hipótesis:

-
Contra:
  2 
:

- : ∃  
Estadística y región critica:
Fuente de Suma de RazónGrados de
F Calculada Medias
Variación Cuadrados Libertad
5.750 Cuadráticas
Máquinas 139.08566 2 69.54283
Error 326.57557 27 12.09539148
Total 465.66123 29

- .;2;2 0.05139
DECISIÓN: Dado que
 5.75>0.05139 , se debería rechazar  con
probabilidad de error tipo I igual a 0.05, por lo tanto, el factor
procedimiento tiene efecto significativo sobre el tiempo necesario para
realizar una tarea específica.
d)
Utilizando el método de intervalos de pares de medias de
Bonferroni con nivel de confianza al menos 96%:

Entonces:  < 2 


Utilizando el método de rangos de Duncan con un nivel de
significación 0.05:

  <2 
- Ordenamos las medias de menor a mayor:

17.806<1.
 <774<.  799
2  ..3,,773.9.30495
- Se obtienen los rangos estudentizados:
     1.0190539 1.0998
- Calculamos los rangos mínimos significativos:

2 3.9.0394∗51∗1.0.09998833.3.98744
- Para
p=3   2 1.05<3.74
- Para
p=2

   1.77417.8063.968  son significativamente

 <2 
diferentes.
Entonces:
8. La empresa de transporte terrestre CARGA va adquirir una de 4
marcas de neumáticos que hay en el mercado. El ingeniero de
pruebas de la empresa diseñó un experimento escogiendo al azar
seis neumáticos de cada marca de características similares. En el
laboratorio de pruebas, con una carga específica simulada, observó la
duración de cada neumático hasta que se deteriore. Los datos
redondeados en miles de kilómetros se dan en la tabla que sigue:
N1 N2 N3 N4
55 63 48 59
53 67 50 68
50 55 59 57
60 62 50 66
55 70 47 71
65 75 61 73
 Al nivel de significación del 5%
¿Indican estos datos que las marcas de los neumáticos producen efectos
significativos en el rendimiento?
SOLUCIÓN
De los datos se obtiene:
- SCT = 37322.625
- SCA = 36553.125
- SCE = 729.5
Hipótesis:

-
Contra:
  2 
:

-  ∃  
:
Estadística y región critica:
Fuente de Suma de Grados de Medias Razón F
Variación Cuadrados Libertad Cuadráticas Calculada
Marca de
Neumáticos 36553.125 3 12184.375 316.683
Error 769.5 20 38.475
Total 37322.625 23

- .;;2 3.10
Decisión: Dado que
 
, se debería rechazar  con
probabilidad de error tipo I igual a 0.05, por lo tanto, el factor 
36018>3.10 
procedimiento tiene efecto significativo sobre el tiempo necesario para
realizar una tarea específica.

9. Un promotor inmobiliario está considerando invertir en su centro


comercial a construirse en el sector medio de una capital del
interior del país, Se evalúan 4 ciudades: Arequipa, Iquitos, Piura y
Trujillo, en donde es muy importante el nivel de los ingresos
mensuales de las familias. Con este fin se diseñó una prueba de
hipótesis de medias múltiples, seleccionando una muestra aleatoria
de ingresos familiares en cada una de las cuatro ciudades. Los
ingresos mensuales observados en dólares son los siguientes:
X:Ingresos mensuales
 Arequipa Iquitos Piura Trujillo
610 710 560 500
560 730 610 400
490 660 470 500
550 610 510 500
460 580 500
620 400
650

 Además, la desviación estándar de la variable dependiente es igual a 90.3193,


a) Describa el modelo de este diseño de experimento y sus supuestos.
b) Aplique la prueba (a priori) DMS (o LSD) al nivel de
significación 0.05, para determinar los pares de medias que
son significativamente diferentes.
c) Al nivel de significación del 5% ¿producen efectos significativos en
la variabilidad de los ingresos los niveles del factor ciudad?. Si
su respuesta es afirmativa use la prueba (a posteriori) de
rangos de Duncan para determinar la ciudad donde se debería
construir el centro comercial.

SOLUCIÓN
a)

grafica de ingresos promedio


700

600

500

400

300

200

100

1 2 3 4

La grafica nos muestra que las medias muestrales no difieren


mucho entre si y tampoco están muy alejadas de la media
general.
b)
1 1
ES   ∗  +    2,
  ± ∗
Intervalos de aceptación

 A continuación, se muestra las siguientes tablas obtenidas al usar


las formulas antes mencionadas:
X1 552.5
ES 44.67
X2 634
tₒ ni=4 2.101
X3 571.4
n j =7
X4  466.7
Medias muéstralesDiferenciaIC al 95%
límitelímite
Xi X j Xi-X j inferior superior
1 2 -81.5 -175.35 12.35
3 -18.9 -112.75 74.95
4 85.8 -8.05 132.57
2 3 62.6 -31.25 156.45
4 167.3 73.45 261.15
3 4 104.7 10.85 198.55

De donde:

µ1=µ2; µ1=µ3; µ1=µ4; µ2=µ3; µ2>µ4; µ3>µ4

c)  Análisis de varianza
Origen de Grados Promedio Valor
Suma de
s variaciones Entre grupos Dentro de los grupos
cuadrados
de de los F Probabilidad crítico
Total libertad cuadrados  para F
79895.04 3 26631.68 5.24 0.009 3.160

91414.05 18 5078.56
171309.09 21

De donde:
SCA=79895.04 SCT=171309.09 Fcal=
5.24
SCE=91414.05 MCE=5078.56
 Aplicando Duncan:

   =5.266
α=0.05 k=4 f=18

∑ 
n= 

  =  .2. =31.0548
r2 =2.97 r 3=3.12 r 4=3.21
R2= (2.97) * (31.0548)
=92.2327 R3= (3.12) *
(31.0548) =96.8909 R4=
(3.21) * (31.0548) =99.6859
Por lo tanto: µ4 =µ1 <µ3 =µ2
10. Un proceso de producción que consiste de 4 líneas está controlado si
las líneas utilizan el mismo tiempo promedio (en segundos) antes
que las unidades producidas caigan a una bandeja. Cada cierto
periodo un Ingeniero realiza el control de los tiempos de
producción por línea del producto, si una línea está fuera de control,
pasa a mantenimiento. En un reciente control de las líneas de
producción se escogió una muestra aleatoria de tiempos de
producción ( x)  por unidad en cada línea, observándose los datos
de la tabla que sigue:
 Al nivel de significación del 5%,

Muestras
Muestra Muestra Muestra Muestra
1 2 3 4
15 10 20 16
12 12 18 18
14 14 20 16
14 13 22 15
15 18 21
14 20 18
12 19
17 20
14
 Además, Sx=3.199. Se supone homocedasticidad.
a) ¿Cree usted que se debería realizar el mantenimiento a alguna de
las líneas de producción?
b) Si su respuesta en el inciso a) es afirmativa, ¿a cuál de las 4
líneas se debería realizar el mantenimiento? Aplique de rangos
de Duncan.
c) ¿Cree usted que se viola el supuesto de homecedasticidad? Utilice
un paquete de cómputo para resolver este inciso.

SOLUCIÓN
a)
Hₒ=µ1=µ2=µ3=µ4

 ⁆µ≠
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 6 84 14 1.2
Columna 2 9 130 14.44 10.53
Columna 3 8 158 19.75 1.93
Columna 4 4 65 16.25 1.58
 ANÁLISIS DE VARIANZA
Valor
Origen de Grados Promedio
Suma de crítico
las variaciones de de los cuadrados FProbabilidad
cuadrados libertad  para F
Entre grupos Dentro de los grupos 3.03
157.60 3 52.53 11.14 0.00

108.47 23 4.72

Total 266.07 26
De donde:
SCA=157.60 SCT=266.07
SCE=108.47 MCE= 4.72
Por lo tanto, si se debe realizar mantenimiento de las líneas de
producción.
b) Aplicando Duncan:

   =6.128
α=0.05 k=4 f=23


n= 

MCE=4.72

    =   . 2  =0.8776
  . 2 
Entonces:
µ1=µ2 <µ4<µ3
Por lo tanto, se debe hacer mantenimiento a la línea
3. c)
Prueba de homocedasticidad: 4.144
Grados de libertad: 3 y
23 Significancia =
0.017
11. El Decano del FACI desea estudiar el número de horas que los
alumnos que los alumnos de los ciclos: 5,6,7 y 8, utilizan los
terminales de computo de la universidad. Una muestra de usos por
ciclo ha dado los siguientes tiempos en hora mensuales:
CICLOS
C5 C6 C7 C8
35 43 28 39
33 47 30 48
30 35 39 37
40 30 46
35 27
42
a) Defina la variable dependiente y estime el efecto que produce el
séptimo ciclo.
b) Describa la regla de decisión para probar globalmente la hipótesis nula

0. 0 5
de igualdad de las cuatro medias. ¿Cuál es la decisión
estadística? Use
. ¿Cuánto es la probabilidad P de la prueba?
c) Si es adecuado, determine que ciclos difieren significativamente en el

0. 0 5
uso promedio de horas por ciclo de los terminales por computo. Use
Duncan con.

SOLUCIÓN
a)
i. LA VARIABLE DEPENDIENTE ES: X= número de horas

ii.  ∑ 
que los alumnos utilizan los terminales de computo.


  35+33+30+ 40+35+4  15
 6 35.83
2 43+38+30+39+30+7 6 1 4
7+35
39+48+ 15
 37+4641.618370
5
30. 3
 85 4  4 4.5
 35.83+41.

68 +30.8+4.5  150 .81 37.705
4 4
 
  30.837.705
b)
  2 
 :∃   
i.Hipótesis:

0 5
ii. Niv el de significancia:

0. .

. 1  26
De los datos se obtienen:

154 3 5
 . ∙2 15
. 
 
  .   170
664
 
2. 664218

4   4494.
 18
∑∑2 352 +332 +302 +⋯+ 372 +462 530
.

SCT= ∑∑()2 5304494.735.8


SCA= ∑∑     +  +  +  4494.376.5
 .   2  2     

SCE= 735. 8 376.


    . 18.83
5 349. 3
MCA=   
     . 4.95
MCE=   
   2  .  5.1635
F A=
  2  . 
 ⁄ ~3,14
iii. Estadística y Región

FUENTE
prueba es: :  > 
La estadística es,

GRADOS
. La región critica de la

DE SUMA DE MEDIAS RAZON F


DE
VARIACION CUADRADOS CUADRATICAS CALCULADA
LIBERTAD
HORAS 386.5 3 128.83
ERROR 349.3 14 24.95 F A=5.1635

 5.163>3.344
TOTAL 735.8 17
iv.

Decisión: Dado que , se debe rechazar la
, el factor horas influye en el uso de los terminales de
computo.
v.

La probabilidad P de la prueba es,

[3,14 >5.163] 
0.013
c) 3 451.863 63
.
I.
  2.8  2
  30.8  5
..
 4 4.5 4.5
 30.. 8<<35. .<83
<24. <1.68<.
II. 0.045,
  1 4
2 .  03
 .
3,14.3.4,184
3.7
 √  ⁄
III. Rangos mínimos significativos

4 
1 11 1547  5470
Para tamaños diferentes de muestras:
∑  

6 + 3 + 5 + 4 60
      440.⁄9557 .434
2 03 375
 3.7×.4347.959
IV. 3.18×.4347.740
Comparaciones múltiples de rangos de Duncan

 
.. 
<
 
2..<
30.8<35.83<41.68<4 
Significativa Duncan:
  
 

2   
.  . 10.88
 
  2. 
.  40
 0.8<
2. 57
. 4.
5.85
  2.  . 5.03
12. En EGC de la PUCP se va evaluar la efectividad de tres métodos
diferentes de enseñanza de Matemática I: El método grupal (A), el
tradicional (B) y el aprendizaje basado en problemas (ABP). Del
semestre anterior se ha escogido una muestra aleatoria de
calificaciones finales para cada método de enseñanza cuyos
resultados se dan en la tabla que sigue:
METODOS
 A B ABP
132 17 10
14 16 11
12 16 15
13 17 10
12 17 14
15 13 13
11 10
14 13
11
14
13

0. 0 5
10
a) Al nivel de significancia  ¿indican los datos obtenidos que
no existen diferencias significativas entre los tres métodos de
enseñanza?.

0. 0 5
b) Realice un ordenamiento de efectividad de los tres métodos
aplicando el método de rangos de Duncan al nivel de .

SOLUCIÓN
a)
  2
 :∃  
i.Hipótesis:

ii. Niv el de significancia:

0.0 5  8
.

 6
De los datos se obtienen:
.
  1 0
9
46
2
2.∙ 144  1
   .  34 4
  .  2 3 4 4 4551.3895
 6  2 6
∑∑2 132 +142 +12 +⋯+ 132 +102 4678
.

SCT= ∑∑()2 46784551. 3 8516. 6 15


SCA= ∑∑    +  +  2
.        

4551.38564.615

SCE= 16.61564.6156
   .  3.3075
MCA=   2
    2 .696
MCE=   2
      11.9835
  2.  
F A=
iii.

Estadística y Región Crítica

FUENTE SUMA
:  
La estadística es,
prueba es: > ⁄ ~,3
GRADOS
. La región critica de la

MEDIAS RAZON
CUADRATICAS
DE DE DE F
VARIACION CUADRADOS LIBERTAD CALCULADA
METODOS 64.615 2 32.3075
ERROR 62 23 2.696 F 
A=11.9835 TOTAL 126.615 25

iv. Decisión: Dado que


 11.98>3.4 , se debe rechazar la
, el factor método influye en la enseñanza de matemática
I.
v.
 La probabilidad P de la prueba es,

  [
  . 13 ,  3>11. 9 85 ] 0. 0 00
 8
1)
b)
2.
  .1
16 26 1
 1.<<13<. <16 2.
     ,
2)
   0 .303 5
2 .  7 7
 .  3,3 . 9 
 √  ⁄
3) Rangos mínimos significativos

3 
1 11  39 8
∑  
Para tamaños diferentes de muestras:

8 + 6 + 1 4
   .6896 0.58
  
2 7 7 0 6
 . 9 ×0.581.6 9 3
4) Comparaciones múltiples de rangos de Duncan

.
 
 
<
.
2. <
1<13<16
  2.  . 34> Significativa

 
2. . 2.  . 1<1
Significativa No Significativa

Duncan:

  <2
798
13. Dieciséis empleados nuevos del grupo “BANC” fueron distribuidos
aleatoriamente en 4 grupos distintos de cuatro empleados cada uno.
A cada grupo se le asignó aleatoriamente un tiempo de entrenamiento
antes de realizar cierta tarea. Los resultados de dicha tarea en
tiempos correspondientes se dan en la siguiente tabla:
ENTRENAMIENTO
Grupo 1: Grupo 2: 1.5 Grupo 3: Grupo 4:
1 hora 2 2.5
hora hora hora
25 14 7 8
19 26 10 7
22 17 9 9
20 15 11 4
86 72 37 28
4 4 4 4

a) Antes de saber los resultados de la prueba global de


comparaciones (ANOVA) realice una prueba de significación,
por partes e medias muéstrales, utilizando intervalos de
confianza al 95 % y prueba de hipótesis con  = 0.05 Asuma los
supuestos de este modelo de diseño de experimentos si fuera
necesario.
b) Al nivel de significación 0.001, ¿Se debería rechazar la hipótesis
nula que afirma que no son significativas las diferencias
observadas en los promedios de los cuatro grupos? En caso de
rechazar la hipótesis nula,
¿Qué grupo realizará el trabajo en tiempo óptimo? Utilice Duncan con
 = 0.01

SOLUCIÓN
a) Las hipótesis a probar son:

1) Con respecto a tratamientos (Número de Grupo)


   ⋯  
= = = = =   (El Número de Grupo NO influye de
manera significativa en el Tiempo de Entrenamiento)


  
= ≠  (Al menos un Número de Grupo influye de
significativa en la resistencia del material)

2) Con respecto a bloques (Tipo de Entrenamiento)


   ⋯ 
= = = = =  (El Tipo de Entrenamiento NO influye
de manera significativa en el Tiempo de Entrenamiento)


 
= ≠   (Al menos un Tipo de Entrenamiento influye de
manera significativa en el Tiempo de Entrenamiento)


3) Resultados:

4) Conclusiones:
 I) Como p valué para el Número de Grupo = 0.690 >
0.05, Se Acepta H0 y Se concluye que el Número de
Grupo NO influye de manera significativa en el Tiempo
de Entrenamiento.

 II) Como p valué para el Tipo de Entrenamiento= 0.001


< 0.05, Se Rechaza H0 y Se concluye que al menos un
Tipo de Entrenamiento, influye de manera significativa
en el Tiempo de Entrenamiento.
b)

Grupo 1: 1 Grupo ENTRENAMIENTO


2: 1.5 Grupo 3: Grupo 4: 2.5
hora hora 2 hora
hora
25 14 7 8
19 26 10 7
22 17 9 9
20 15 11 4
Totales Xi 86 72 37 28 223
ni=r 4 4 4 4 16
Medias X 21.5 18 9.25 7 13.94
1) ordenamos las medias de menor a mayor
X4 < X3 < X2 < X1

2) se obtienen los valores en la tabla de


Duncan Dato:  = 0.05
rp = r  (p,f)

r2  = r0 .05(2,12) =
3.08 r3  =
r0 .05(3,12) = 3.77
r4  = r0 .05(4,12) =
4.20
3) Se obtiene los rangos mínimos significativos:

Rp = rp  ×    


  
 6.3 964
= 1.26455
Dónde: =


× ×
×
R2 = r 2 1.26455= 3.08 1.26455=

×
3.8948 R3 = r 3 1.26455=

× ×
3.77 1.26455= 4.7673 R4 = r 4
1.26455= 4.20 1.26455= 5.3111
4) Se contrastan las diferencias entre pares de medias
muestrales comparando el rango de p medias
adyacentes.
 P = 4, rango de las 4 medias

adyacentes: X1 – X4 = 21.5 – 7 =


14.50
 P = 3, rango de las 3 medias adyacentes:

X1 – X3 = 21.5 – 9.25 =

12.25 X2 – X4 = 18 – 7 =

11.00

 P = 2, rango de las 2 medias

adyacentes: X1 – X2 = 21.5 – 18 =

3.50

X2 – X3 = 18 - 9.25 = 8.75

X3 – X4 = 9.25 – 7 = 2.25

5) Comparaciones múltiples de Duncan

X1 – X4 = > R4 = 5.3111 SIGNIFICATIVA


14.50
X1 – X3 = > R3 = 4.7673 SIGNIFICATIVA
12.25
X2 – X4 = > R3 = 4.7673 SIGNIFICATIVA
11.00
X1 – X2 = 3.50 < R2 = 3.8948 NO SIGNIFICATIVA

X2 – X3 = 8.75 > R2 = 3.8948 SIGNIFICATIVA

X3 – X4 = 2.25 < R2 = 3.8948 NO SIGNIFICATIVA


6) Análisis:
X4 X3 X2 X1
7 9.25 18 21.5

µ4 = µ3 < µ2 = µ1

Por lo tanto, los grupos que realizan el trabajo en


tiempos más óptimos son el grupo 4 y el grupo 3

14. Veinte personas que experimentaban fiebres de 38 grados o más


fueron divididos en grupos de 6 personas cada uno y a cada grupo
se le administró una marca de tableta distinta para aliviar el mal. El
número de horas contadas hasta bajar la fiebre luego de administrar
la tableta se da en la siguiente tabla:
TABLETAS
TABLETA 1 TABLETA 2 TABLETA 3 TABLETA 4
5 11 6 12
3 5 4 10
8 3 7 9
4 3 5 8
2 4 6 7
6 2 2 8

a) Pruebe al nivel de significación   = 0.05, la hipótesis de que el


promedio del número de horas hasta aliviar el mal es el mismo


para la cuatro marcas de tabletas. ¿cuál es la decisión con  = 0.01?

b) Sí rechaza la hipótesis de igual efectividad. ¿Cuál de las cuatro


tabletas es la más eficaz? Use el método de Rangos de Duncan al
5%
SOLUCIÓN
a) Las hipótesis a probar son:

1) Con respecto a tratamientos (Número de Grupo)


   ⋯  
= = = = =  (El Número de Grupo NO influye
de manera significativa en el Número de horas
hasta bajar la fiebre)


 
= ≠  (Al menos un Número de Grupo influye
de significativa en el Número de horas hasta


bajar la fiebre)
2) Con respecto a bloques (Tipo de Tableta)


   ⋯ 
= = = = =  (El Tipo de Tableta NO influye
de manera significativa en el Número de horas

 
hasta bajar la fiebre)

= ≠   (Al menos un Tipo de Tableta influye


de manera significativa en el Número de horas

3) 
hasta bajar la fiebre)
RESULTADOS

4) CONCLUSIONES
I) Como p valué para el Número de Grupo = 0.100
> 0.05, Se Acepta H0 y Se concluye que el
Número de Grupo NO influye de manera
significativa en el Número de horas hasta bajar
la f iebre.

II) Como p valué para el Tipo de Tableta = 0.005 <


0.05, Se Rechaza H0 y Se concluye que al
menos un Tipo de Tableta, influye de manera
significativa en el Número de horas hasta bajar
la fiebre.
b)
TABLETAS
TABLETA 1 TABLETA 2 TABLETA 3 TABLETA 4
5 11 6 12
3 5 4 10
8 3 7 9
4 3 5 8
2 4 6 7
6 2 2 8
Totales
28 28 30 54 140
Xi ni=r
Medias 6 6 6 6 24
X
4.67 4.67 5 9 5.83


X1 X2 < X3 < X4
1) Ordenamos las medias de
menor a mayor
2) Se obtienen los valores en la tabla de
Duncan Dato:   = 0.05
r p = r  (p,f)

r2  = r0 .05(2,20) =
2.95 r3  =
r0 .05(3,20) = 3.58
r4  = r0 .05(4,20) =
3.96
3) Se obtiene los rangos mínimos significativos:

Rp = rp  ×    


Dónde:      
  .  = = 1.24967

× ×
×
R2 = r2  1.24967= 2.95 1.24967=

×
3.6865 R3 = r3  1.24967=

× ×
3.58 1.24967= 4.4738 R4 = r4 
1.24967= 3.96 1.24967= 4.9487
4) Se contrastan las diferencias entre pares de
medias muestrales comparando el rango de p
medias adyacentes.

 P = 4, rango de las 4 medias


adyacentes: X4 – X1 = 9 – 4.67 = 4.33

 P = 3, rango de las 3 medias


adyacentes: X4 – X2 = 9 – 4.67= 4.33
X3 – X1 = 5 – 4.67 = 0.33

 P = 2, rango de las 2 medias


adyacentes: X4 – X3 = 9 – 5 = 4
X3 – X2= 5 - 4.67= 0.33
X2 – X1 = 4.67 – 4.67 = 0

5) Comparaciones múltiples de Duncan

X4 – X1 = 4.33< R4 = 4.9487 NO SIGNIFICATIVA

X4 – X2 = 4.33< R3 = 4.4738 NO SIGNIFICATIVA

X3 – X1 = 0.33 < R3 = 4.4738 NO SIGNIFICATIVA

X4 – X3 = 4 < R4 = 4.9487 NO SIGNIFICATIVA

X3 – X2= 0.33< R3 = 4.4738 NO SIGNIFICATIVA

X2 – X1 = 0 < R2 = 3.6865 NO SIGNIFICATIVA

6) Análisis
X2 X3 X4 X1
4.67 4.67 5 9

µ4 = µ3 = µ2 < µ1

Por lo tanto, la tableta más eficaz seria la tableta 1


15. la estructura financiera de una firma se refiere a la forma en que se
dividen los activos de la empresa por debe y haber, y el
apalancamiento financiero se refiere al porcentaje de activos
financiados por deuda. En un estudio financiero se firma que el
apalancamiento financiero puede utilizarse para aumentar la tasa de
rendimiento sobre la inversión, es decir que, los accionistas pueden
recibir rendimientos más altos con la misma cantidad de inversión
gracias a su uso. Los siguientes datos muestran las tasas de

 : 
rendimiento utilizando 3 diferentes niveles de apalancamiento
financiero
Niveles de rendimiento

Control Bajo Medio Alto


4.6 2 7 7.9
2 7.4 4.5 6.8
6.8 1.8 11.6 5.8
4.2 3.2 6 9.2
1.6 4 6.8 11
a) ¿Existen diferencias reales entre las medias de los cuatro
niveles de rendimiento al nivel de significación 1%, y al 5%?
b) ¿Son las tasas medias de rendimiento en los niveles de
apalancamiento financiero bajo, medio y alto más altas que la
de nivel de control?

SOLUCIÓN

a) Gráfica de las medias muestrales.

Interval Plot of rendimiento vs Niveles de rendimiento


99% CI for the Mean

12

    o108
     t
    n
     ei
     mi 6
     d
    n
    er
4

2
A B C M

Niveles de rendimiento

 :  
The pooled standard deviation was used to calculate t he intervals.
0

La variable dependiente es:

 Asociada a la variable dependiente o factor  nivel de rendimiento,


cuyos tratamientos son: control (C), Bajo (B), Medio (M) y Alto 
(A) Sea  las medias de los niveles de rendimiento
1.  1∶∶N o tod as2 las  son iguales
2.

 ..2  11

∑∑ 2  4.62 +2 +⋯+112 813.8


 ∑∑ 2 813.865.08 161.74
   . 2
  19.  2 +18.42 +35.92 +40.7

78.4  5
   161.7478.483.3
Grados
Fuente de Variación
Suma de Cuadrados Medias Razón FP-
de Libertad Cuadráticas Calculada Value

Nivel de rendimiento
Error Total 78.42 3 26.14 5.02 0.0012
83.32 16 5.2
161.74 19

La estadística de la prueba es:    ∼


 { 3,16 > 3.01 }
[
Dado que  >5. 0 ]0.01>  0.01 , se acepta la , y se 
concluye que las medias de los cuatro niveles de rendimiento son iguales.
Interval Plot of rendimiento vs Niveles de rendimiento
95% CI for the Mean

10

      o 7
    n
     ie 
    m6
     i
     d 
    n5
     r
4

A B C M

Niveles de rendimiento

The pooled standard deviation was used to calculate the intervals.

b)

1∶ ∶    
 No todas las son iguales

  2 11 4 .
  2    0 65.08
.   2
∑∑2  4.62 +2 +⋯+112 813.8
 2  813.865.08 161.74
   . 2
  19. 2 +18.42 +35.92 +40.7

78.4  5
   161.7478.483.3
Dado que [>5. 0 ] 0.01<  0.05
, se rechaza la , y se
concluye que no todas las medias de los cuatro niveles de

rendimiento son iguales.
16. La importadora “Drogasa” quiere compara la eficiencia de tres
medicinas para el tratamiento de la rinitis alérgica en adultos
mayores de 50 años. Para esto diseño un experimento
seleccionando 3 pacientes mayores de 50 años que sufren la
enfermedad. A cada paciente escogido se le suministro las tres
medicinas A, V y C en periodos distintos del ataque de la enfermedad
registrándose el número de días que tardaron en recuperarse. Los
datos se registraron en el siguiente diseño de un factor (medicina)
aleatorizado por bloques (pacientes).

Paciente 1 Paciente 2 Paciente 3


B18 C15 A16
A23 B25 C16
C17 A28 B22

a) Al nivel de significación 0.05 ¿es válido concluir que no


existen diferencias significativas en los tiempos promedios
de días de recuperación de los pacientes?
b) ¿Fue correcto incluir a los pacientes como una fuente de
variación en el diseño del experimento?
SOLUCIÓN

 :   í  ó   


a) La variable dependiente

El
ℬ
El factor  es pacientes
Losmodelo
bloquesde son
estelos tipos de
diseño demedicinas
experimento es:

   +  + +


  2 180
Cálculos de los datos

 ∗  3∗3
. 2
3600
 1 2 84.6368 2 17
1
   .   2  67  2 + 6 52 + 482
3600 7. 6 67
1 3
58 2 +  6 8  2 +  54 2
ℬ   .2  
=
3
360034.667
 =
   +ℬ 64.667
Las sumas de cuadrados, los grados de libertad, los cuadrados
medios y las F calculadas se resumen minitab

Sea
pacientes
 tiempos promedios de días de recuperación de los

- Hipótesis

1∶ ∶   2  
 No todas las son iguales
- Región de rechazo
Se rechazara Ho con un nivel de significancia
. ,2, 0. 0 5 
, si

>
 .5<.,2, 6.94 0. 0 5
- Decisión
Dado que , se debe aceptar la Ho y
concluir con probabilidad de error tipo I, , los
promedios de recuperación de los pacientes son iguales; es
decir:
tiempos
  2  
b)
-
 1∶ ∶        
Hipótesis

 N 
o to da s las s o n iguales

0. 0 5
- Región de rechazo
Se rechazara Ho con un nivel de significancia ,
siΒ
,   Β 1.07<.,2, 6.94
- Decisión
.,2que
Dado , se debe
aceptar la que
Ho y concluir confue correcto incluir
probabilidad de errora tipo
losI,pacientes
como una fuente de variación en el diseño del
experimentos los tiempos promedios de recuperación
de los pacientes son iguales. ,
17.
18.
19. La empresa agroindustrial ARROZSA, estudia el efecto de 4
clases de fertilizantes A, B, C y D en el rendimiento de la producción
de arroz. Para esto, diseño un experimento dividiendo el terreno
del cultivo en tres bloques 1, 2,3 con cuatro parcelas homogéneas de
cada uno, asignado aleatoriamente los fertilizantes de cada uno de los
bloques para conseguir aso un diseño de bloques completamente
aleatorizado. El rendimiento, medido en kilogramos por parcela, se
da en la siguiente tabla:
1 2 3
C D B
39.9 43.4 42.7
 A B D
40.1 42.9 42.9
B  A C
41.1 42.2 41.4
D C  A
42.1 42.3 41.9

a) Describa la variable dependiente y el modelo de este diseño


de experimento.
b) ¿proporcionan estos datos suficiente evidencia de alguna
diferencia significativa en la medida de los rendimientos de
los fertilizantes? ¿si es, así ¿cuál de los fertilizantes es el
mejor?
c) Si un analista opina que fue innecesario dividir los terrenos
en bloque considerarlos como fuente de variabilidad de la
producción. Solo bastaba con comparado con el efecto de los
fertilizantes sobre la producción aplicando un diseño o factor
completamente aleatorio. estaría de acuerdo usted con el
analista.
SOLUCIÓN
a) La variable dependiente es: X= efecto de fertilizantes A, B, C, D
 Asociada a variable dependiente o factor a= terreno del cultivo en

∝
tres bloques 1, 2,3 con cuatro parcelas homogéneas de cada uno.
El modelo de este ANOVA está dado por : Xij=µ+ i+ ij i=1, 2, 3,4

b)

Donde, i= µi -µ es el efecto de los fertilizantes
Tabla ANOVA los datos se obtienen:

Fertilizantes
 A
1
40.1
Tipos
2
42.2
3
41.9
Total Xi
124.2
n=r
3
Medias 
41.4
42.333333
B 41.4 42.9 42.7 127 3 3
C 39.9 42.3 41.4 123.6 3 41.2
D 42.1 43.4 42.9 128.4 3 42.8
TOTAL DE 167.73333
164.5 172.8 171.9 503.2 12 3
BLOQUE X
Cálculos:

 X.. 2 5032 1100.85333


 n 1
ΣΣxSCTΣΣx^i
2 ij1113.76
jC1.90666667
SCA ΣXri. 2 
C5.
SCBΣx.J^/kC516.571666
SCESCTSCB+SCA0.534666667
varianza1.173333333
Otra forma de obtener SCT

SCTn1Sx^1.90666667
La suma de los cuadrados de libertad, los cuadrados medios y las F calculadas
se resumen.
Grados de
Suma de cuadrados Medias cuadráticas
Fuente de
 A=fertilizante 5.2 3
libertad 1.73333333 RazónF A
F calculada
variación =19.4513716
Bloques 7.172 2 3.586 FB =
40.2418953
Error 0.53466667 6 0.08911111
Total 12.9066667 11

 Se quiere contrastar la hipótesis nula:


Ho: αi = 0, para todo i=1, 2,

3,4 H1: una de las αi no es


nulo
 La región de rechazo: Se rechazará Ho el nivel de significación
α=0.05, si F A>F0.95, 3,6

Decisión: Dado que Fa=19.451, P [F (3.6)>19.451]=0.002


c) Se tiene, además: FB= 40.241 con un nivel de significación =
0.00. Se establece que el diseño por bloques es el adecuado.

20. El gerente de ventas del grupo “Mercados” realizó un estudio


estadístico para comparar volumen de ventas dirás de sus cuatro
mercados. Para esto diseño un experimento considerando solo las
ventas de los días
 jueves, viernes, sábado y domingo de días de semana como una
posible fuente de variabilidad en el monto de las ventas. Los
mercados 1, 2, 3,4fueron asignados al azar a los 4 jueves, 4
viernes, a los 4 sábados y los 4 domingos consiguiendo así un
diseño aleatorio por bloque. Las ventas dirías EN MILES DE
SOLES SE DAN en la tabla que siguen
Días

Jueves viernes sábado Domingo


42(3) 55(1) 61(2) 40(4)
50(1) 52(3) 44(4) 60(2)
35(4) 59(2) 46(3) 52(1)
62(2) 38(4) 54(1) 50(3)

 A un nivel de significación α=0.05

a) ¿muestras estos datos que existe muestras significativas en los


volúmenes de las ventas promedios delas 4 sucursales? SI ES ASI
¿Cuál sucursal vende más?
b) ¿ha sido adecuado considerar a los días como una fuente de
variabilidad en monto de las ventas en las 4 sucursales?
c) Si los días no considerados no afectan a la variabilidad en el
monto de las ventas en las sucursales, rediseñe el experimento sin
considerar como fue la variabilidad alas días. Con este modelo,
¿cuál de las sucursales vende más? ¿use la prueba del rango de
Duncan?
SOLUCIÓN
Tabla ANOVA

Datos Días Medias


Total. n=r
MERCADOS Jueves viernes sábado Domingo Xi.
 A 126 55 122 160 463 4 115.75
B 50 156 176 120 502 4 125.5
C 140 118 138 52 448 4 112
D 124 152 54 150 480 4 120
TOTAL DE 440 481 490 482 1893 16 473.25
BLOQUE
X.j
Media
bloque 44 48.1 49
X.j 

Cálculos.

 X. .
C25  2
3889664.6853637
n 0765
 2 1080. 01
.^/958.48
1/.^41.50
+80. 03
Otra forma de obtener SCT: 1^1080.01
Las sumas de cuadrados los grados de libertad los cuadrados medios y las F
calculadas se resuman:
Fuente de Suma de Grados de medias Razón F
variación cuadrados libertad cuadráticas calculada
 A=fertilizante 958.48 3 95.848183 35.9298375
bloques 41.50 9 4.61117071 1.72855248
error 80.02946 15 2.66764867
total 1080.01183 27

 Se quiere contrastar la hipótesis nula:


Ho: αi = 0, para todo i=1, 2, 3,4 , j=1,2

H1: una de las αi no es nulo


La región de rechazo: Se rechazará Ho el nivel de significación
α=0.05, si Fa > F0.95, 3,047
Decisión: Dado que Fa=19.451, P [F (3.6)>19.451]=0.002
 Además: Fb= 31.56 con un nivel de significación = 0.00. con 5%
µ4<µ3<µ2<µ1.
21. El decano de estudios generales ciencias de la PUCP quiere saber si
son los niveles de evaluación de cursos y/o el conocimiento de los
alumnos que producen la variabilidad en las notas finales que
obtienen. Para esto, se diseñó un experimento de dos factores sin
réplicas, escogiendo 4 alumnos al azar del tercer nivel que cursaron
las materias: matemática (M), estadística (E), física (F) y lengua (L),
observando las calificaciones siguientes:
CURSOS
 Alumno M E F L
1 14 13 14 16
2 13 18 15 19
3 11 16 13 18
4 12 15 112 16

 A) ¿podemos concluir que los cursos presentan la misma dificultad? Si no


es así, ¿Cuál de estos cursos es más difícil? Use Bonferroni con
nivel de confianza al menos del 95% y Duncan 5%.
B) ¿son los alumnos un factor de variabilidad significativo de las notas
finales obtenidas? Utilice el método de la probabilidad P.

SOLUCIÓN
 Análisis de varianza de dos factores con una sola muestra por grupo

RESUMEN Cuenta Suma Promedio Varianza


1 4 57 14.25 1.583
2 4 65 16.25 7.583
3 4 58 14.5 9.667
4 4 55 13.75 4.250

M 4 50 12.5 1.667
E 4 62 15.5 4.333
F 4 54 13.5 1.667
L 4 69 17.25 2.250
 ANÁLISIS DE VARIANZA
Origen
Suma de
de las
cuadrados
variaciones libertad cuadrados  para F
Filas 14.188 3.000 4.729 2.735 0.106 3.863
Columnas 53.688 3.000 17.896 10.349 0.003 3.863
Error 15.563 9.000 1.729
Total 83.438 15.000
Grados Promedio Valor
de de los F Probabilidad crítico

Tenemos sacando la tabla de cuadrados:


SCA 53.688
SCB 14.188
SCE 15.563
SCT 83.438

a)

   0
:
Tenemos un rango de1-4

Según la tabla  10,349


 con grados de libertad 3,9,
Tenemos P [F (3,9)>10,349]=0.003
Como la probabilidad es menor que 0.05 entonces se rechaza.
 UTILIZAMOS EL METODO DE BONFERRINI
Calculamos los siguientes datos necesarios:
n= 6
a=  0.013

1-(a)/2 =  0.994

n-k = 12.000
2.934
error= 2.228
Tabla de diferencias de medias
   -  L.inf L.sup
12.5 15.5 -3 -5.228 -0.772 xe-xm
15.5 13.5 2 -0.228 4.228 x e-xf
13.5 17.25 -3.75 -5.978 -1.522 xf-xl
17.25 12.5 4.75 2.522 6.978 ul-xm
Del cuadro calculamos que:

  <, 2 ,  2 ,  <


con ,  con y con
, Duncan, subconjunto

b)

homogéneo
2 2
Tenemos una hipótesis :   0
El rango de trabajo es de 1-4

Según la tabla  .735


 con grados de libertad 3,9,
Tenemos P [F (3,9)>2.735]=0.106 entonces no se rechaza.
22. Cuatro operarios del grupo “construye” realizan la misma tarea de
construir paredes de ladrillo en tiempos iguales. El grupo quiere
determinar si hay alguna diferencia significativa en el metraje
promedio debido a la habilidad de los operarios y/o debido al
horario. Para esto diseñaron un análisis de varianza de dos factores
sin replicas, registrando los siguientes datos en metros cuadrado de
pared construida por cada operario en tres horas cualesquiera:
Operarios
Horas
10-11 am
2-3 pm

2
3.0
1.8
 3.5
2.1
3.2
2.0
3.3
1.9
4-5 pm 2.4 2.5 2.4 2.4

a) Plantea la hipótesis nula y alternativa para determinar si existen


diferencias significativas en el metraje construido debido a los
operarios.
b) Plantee la hipótesis nula y alternativa para determinar si existen
diferencias significativas en el metraje construido debido a los
horarios.
c) Si existen diferencia en alguno de los dos factores, ¿Qué pares de
niveles de este, producen las diferencias? Utilice el método de
Duncan.
Use un nivel de significancia =0.01 en todas las pruebas
SOLUCIÓN
Cálculo del análisis de datos
RESUMEN Cuenta Suma Promedio Varianza
10-11 am 4.0000 13.0000 3.2500 0.0433
2-3 pm 4.0000 7.8000 1.9500 0.0167
4-5 pm 4.0000 9.7000 2.4250 0.0025
3.0000 7.2000 2.4000 0.3600
3.0000 8.1000 2.7000 0.5200

3.0000 7.6000 2.5333 0.3733


3.0000 7.6000 2.5333 0.5033

 ANÁLISIS DE VARIANZA
Origen de Suma de Grados Promedio de Probabilidad Valor crítico
las cuadrados de los F para F
variaciones libertad cuadrados
Filas 3.46166667 2 1.73083333 201 3.1803E-06 5.14325285
Columnas 0.13583333 3 0.04527778 5.25806452 0.04074402 4.75706266
Error 0.05166667 6 0.00861111

Total 3.64916667 11

Resumen del cuadro

SCA 0.136
SCB 3.462
SCE SCT 0.052
3.649

a) Operarios(A),
Tenemos como hipótesis,  :   donde i va de 1-4

 5.58, 
  

De la tablacalculamos
También se ha calculado
P [F>5.258]=0.04,  por
y con
lo grados
cual sede libertad
acepta
b) Horas
Tenemos : y tiene un rango 1, 2,3

 10,
3,6
Según la tabla
Calculamos tenemos
P [F>210]=0.000  conse
por lo cual grado de libertad
rechaza . 
2 <  <
c) Duncan por
2,6
23. La firma confecciones quiere saber si las perdidas en porcentajes
de producción defectuosa producida, dependen de las líneas de
producción y/o de los tipos de materia prima de sus proveedores.
Para esto, el ingeniero a cargo del control, diseño un experimento de
dos factores sin replicas asignando a cada una de las 5 líneas de
producción L 1, L2, L3, L4 y L5 una de las 4 materias primas: M1,
M2, M3, M4 por   día. Los porcentajes de producción defectuosa
por día se dan en la tabla que sigue:
Líneas de producción

Materias
primas L1 L2 L3 L4 L5
M1 2.3 2.5 3.0 3.2 4
M2 2.8 2.7 3.5 3.8 4.2
M3 3.2 3.0 3.7 3.9 4.3
M4 3.6 3.8 4.0 4.3 4.5

a) Defina la variable dependiente y el modelo de ANOVA.


b) ¿Son significativamente diferentes los promedios de porcentajes
de producción defectuosa debido a las líneas de producción? Si es
así ¿cuál es la línea de mayor producción defectuosa? Use el método
de rangos de Duncan.
c) ¿Son significativamente diferente los promedios de porcentajes de
producción defectuosa debido a las materias primas? Si es así, ¿Cuál
es la materia prima optima? Use Duncan.

En todas las pruebas use el nivel de significación


SOLUCIÓN
0. 0 5
a)

 ANÁLISIS DE VARIANZA
Origen de Grados Promedio
las Suma de de de los Valor crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Filas SCB=2.8255 3 0.942 31.22 5.978E-06 3.490
Columnas SCA=4.718 4 1.180 39.10 8.606E-07 3.259
Error SCE=0.362 12 0.030
Total SCT=7.9055 19
b)

1. H0:  0 ,  1,,3,4,5


2. se calculan las medias y se proceden a ordenar de menor a mayor.
Líneas de producción Promedio

L1 2.98
L2 3
L3 3.55
L4 3.8
L5 4.25

3.

0. 0 5  , k=5, f= 12
R2=r0 .05 (2, 12) =3.08
R3=r0 .05 (3, 12)
=3.23 R4=r0 .05 (4,
12) =3.33
R5=r0 .05 (5, 12)
=3.36
Se calculan los rangos mínimos significativos:


 ∗   

 
       40 . 0 30
  0.0866
2 3.08∗ 0.08660.68
Las muestras adyacentes se tienen:

 3.3 0.08660.80
 3.33∗ 0.08660.88
 3.36∗ 0.08660.91
Se realiza una comparación entre las medias y los rangos mínimos:
5y4 0.45 > 0.29 significativa
medias
5y 3 0.7 > 0.29 significativa
comparación de rangos de Duncan
5y 2 1.25 > 0.29 significativa
5y1 1.28 > 0.29 significativa
4y3 0.25 < 0.29 no
significativa
4y2 0.8 > 0.29 significativa
4y1 0.83 > 0.29 significativa
3y2 0.55 > 0.28 significativa
3y1 0.58 > 0.28 significativa
2y1 0.02 < 0.268 no
significativa

Podemos afirmar que:


 39.1
[ >39. 1] 0
 2 <   < 
c) 1. H0:  0 , 1,,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor.
materias
primas Promedio
M1 3
M2 3.4
M3 3.62
M4 4.04

3.

0. 0 5 , k=4, f= 12


R2=r0 .05 (2, 12) =3.08
R3=r0 .05 (3, 12)
=3.23 R4=r0 .05 (4,
12) =3.33
R5=r0 .05 (5, 12)
=3.36
Se calculan los rangos mínimos significativos:

 ∗   


 
       5 0 . 0 30
  0.077
2 3.08∗ 0.0770.37
Las muestras adyacentes se tienen:

 3.3∗0.0770.49
 3.33∗ 0.0770.56
Se realiza una comparación entre las medias y los rangos mínimos:

medias comparación de rangos de Duncan


4y3 0.42 > 0.26 significativa
4y2 0.64 < 0.26 significativa
4y1 1.04 > 0.26 significativa
no
3y2
0.22 > 0.25significativa
3y1
0.62 > 0.25significativa 0.237significativa
2y1
0.40 >
Podemos afirmar que:
 31.
 [ >31. ] 0
24.
 < 2  <
Para evaluar 4 sistemas de administración de archivos de diseño un
experimento con 4 operadores de procesamiento de palabras a
quienes se les observo el tiempo X necesario, en minutos, para
aprender a usar cada uno de los siguientes sistemas de
administración de archivos. Los tiempos observados se dan en la
tabla que sigue:
sistemas de administración de archivo

operadores A1 A2 A3 A4
B1 390 402 392 385
B2 380 403 394 385
B3 377 411 399 380
B4 370 404 400 384
 Además, Sx= 11.5181
¿Existen alguna diferencia significativa en la media del
tiempo, a) ¿Debido a los sistemas de administración de
archivos?
b) ¿Debido a los operadores?
c) ¿Cuál de los sistemas es el más adecuado? Use el método de
rangos de Duncan.

En todas las pruebas use el nivel de significación


SOLUCIÓN
0. 0 5
Realizamos el cuadro ANOVA:
 ANÁLISIS DE VARIANZA
Origen de Grados Promedio Valor
las Suma de de de los crítico
variaciones cuadrados libertad cuadrados F Probabilidad  para F
Filas SCB= 18.5 3 6.167 0.185 0.904 3.863
SCA=
Columnas 1671.5 3 557.167 16.715 0.001 3.863
Error SCE= 300 9 33.333
Total SCT= 1990 15

 A) 1. H0:  0 , 1,,3,4


2. se calculan las medias y se proceden a ordenar de menor a mayor:
Sistemas de
administración Promedio
de archivos
 A1 379.25
 A2 383.5
 A3 396.25
 A4 405

3. 0. 0 5
 , k=4, f= 9
R2=r0 .05 (2, 9) =3.20
R3=r0 .05 (3, 9)
=3.34 R4=r0 .05 (4,
9) = 3.41
Se calculan los rangos mínimos significativos:

 ∗  
  3 3.3333
  
  3.33
2 3.0∗ 3.3310.66
Las muestras adyacentes se tienen:

 3.34∗3.3311.1 
 3.41∗ 3.3311.36
Se realiza una comparación entre las medias y los rangos mínimos:
Medias Comparación de rangos de Duncan
4y3 8.75 < 11.36 no
significativa
4y2 21.50 > 11.36 significativa
4y1 25.75 > 11.36 significativa
3y2 12.75 > 11.12 significativa
3y1 17.00 > 11.12 significativa
no
2y1
4.25 < 10.36 significativa

Podemos afirmar
que:  16.715
[>16.715] 0.001
  < 
2
 0 , 1,,3,4
 A) 1. H0:
2. se calculan las medias:

Sistemas de
Promedio
administración de archivos
 A1
 A2 379.25
 A3 405
 A4 396.25
383.5

3. 0. 0 5
 , k=4, f= 9
R2=r0 .05 (2, 9) =3.20
R3=r0 .05 (3, 9)
=3.34 R4=r0 .05 (4,
9) = 3.41
Se calculan los rangos mínimos significativos:

 ∗     
   3.3333
  
 3
  3.33
2 3.0∗ 3.3310.66
Las muestras adyacentes se tienen:

 3.34∗3.3311.1 
 3.41∗ 3.3311.36
Se realiza una comparación entre las medias y los rangos mínimos:
medias comparación de rangos de Duncan
4y3 8.75 < 11.36 nosignificativa
4y2 21.50 > 11.36 significativa
4y1 25.75 > 11.36 significativa
3y2 12.75 > 11.12 significativa
3y1 17.00 > 11.12 significativa
no
2y1
4.25 < 10.36 significativa
Podemos afirmar
que:  16.715
[>16.715] 0.001
  < 
2
a) 1. H0: 0 , 1,,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor:
Sistemas de
administración Promedio
de archivos
 A1 379.25
 A2 383.5
 A3 396.25
 A4 405

3. 0. 0 5
 , k=4, f= 9
R2=r0 .05 (2, 9) =3.20
R3=r0 .05 (3, 9)
=3.34 R4=r0 .05 (4,
9) = 3.41
Se calculan los rangos mínimos significativos:

 ∗     
   3.3333
  
 3
  3.33
2 3.0∗ 3.3310.66
Las muestras adyacentes se tienen:

 3.34∗3.3311.1 
 3.41∗ 3.3311.36
Se realiza una comparación entre las medias y los rangos mínimos:
medias comparación de rangos de Duncan
4y3 no
8.75 < 11.36 significativa
4y2 21.50 > 11.36 significativa
4y1 25.75 > 11.36 significativa
3y2 12.75 > 11.12 significativa
3y1 17.00 > 11.12 significativa
no
2y1
4.25 < 10.36significativa

Podemos afirmar
que:  16.715
[>16.715] 0.001
  < 
2
b) 1. H0: 0 , 1,,3,4
2. se calculan las medias:

Operadores ´Promedio

O1 389.5
O2 O3 O4 390.5
391.75
392.25

3. 0. 0 5
 , k=4, f= 9
R2=r0 .05 (2, 9) =3.20
R3=r0 .05 (3, 9)
=3.34 R4=r0 .05 (4,
9) = 3.41
Se calculan los rangos mínimos significativos:

 ∗  
  3 3.3333
  
  3.33
2 3.0∗ 3.3310.66
Las muestras adyacentes se tienen:

 3.34∗3.3311.1 
 3.41∗ 3.3311.36
Se realiza una comparación entre las medias y los rangos mínimos:
medias comparación de rangos de Duncan
4y3 no
0.50 < 11.36 significativa
no
4y2 1.75 < 11.36 significativa
no
4y1 2.75 < 11.36 significativa
no
3y2 1.25 < 11.12 significativa
no
3y1 2.25 < 11.12 significativa
2y1 no
1.00 < 10.36 significativa

Podemos afirmar
que:  0.185
[ >0.185] 0.904
 2  
c) El más adecuado sería el sistema A4.
25. La empresa de “Torneados metálicos” diseño un experimento de dos
factores con tres replicas para determinar si existen diferencias
significativas en la cantidad de piezas producidas debido a las
máquinas y debido a los operarios. Se emplearon dos operarios y
cada uno de ellos utilizo cada una de las tres máquinas para
procesar el producto en tres periodos iguales de tiempo.
Los valores promedios de las cantidades de piezas producidas para cada
combinación de los niveles de los factores se dan en la tabla que sigue:

MAQUINAS
OPERARIOS
M1 M2 M3
O1 102.33 130.00 114.33
O2 114.00 142.67 126.67

Y la tabla ANOVA resultante es:


Fuente de Sumas de Grados deMedias Estadísticas
variabilidad Maquinas
cuadradosOperario
Libertadcuadráticas
2392.33 Interacción Error F
Total 672.22
0.778

3190.000

a) Realice una grafica lineal de medias y analice descriptivamente la


existencia podría o no de interacción entre los dos factores
considerados.
b) ¿Es significativa la interacción entre los factores considerados?
¿Qué puede decir de los efectos de las máquinas y de los
operarios?
c) ¿Qué maquina y operario tienen mayor rendimiento? Utilice el método
de rangos de Duncan donde sea posible aplicar.
 Aplique el nivel de significación α=5% en todas las pruebas.
SOLUCIÓN
a) Gráfica lineal de medias para la interacción entre los dos
factores considerados.

Interacción de Medias
160
140
120
100
80
60
40
20
0

M1 M2 M3
MAQUINAS

O1 O2

Según la gráfica nos podemos dar cuenta de que


descriptivamente no existe ningún tipo de interacción entre los
operarios y sus máquinas correspondientes.
b)
 Antes de realizar el proceso para elaborar la tabla ANOVA,

.. 
describiremos los siguientes datos:

.#.
        
   ̂   
 #                
  #               
  
#   
#
Previo a pasar al desarrollo realizaremos la prueba de hipótesis
H0= No hay interacción entre los operarios con sus
respectivas máquinas.
H1= Existe interacción entre los operarios con sus respectivas
máquinas.
N= 18
n= 3
ni= 9
n j= 6
y..= 121,667

Donde:
N= # de datos * # de
réplicas n= # de réplicas
ni= # de réplicas * # de filas
n j=# de réplicas * # de columnas

 Ahora teniendo en cuenta la tabla de valores de las cantidades


producidas por los dos factores, procedemos a sacar los
promedios:
 _Para los operarios:
Promedio de O1
̂1.  115,553

̂
̂ . 
Promedio de O2 127,78

 _Para las máquinas:


Promedio de M1
.1
108,165

.
Promedio de M2 Promedio de M3136,335
120,5

.3
La tabla ANOVA cuenta con todas las sumas de cuadrados menos

+++  


con la del ERROR, entonces:

14.67
La tabla ANOVA quedaría de la siguiente manera:
Fuente de Sumas de Grados de Medias Estadísticas
variabilidad cuadrados Libertad cuadráticas F
Maquinas 2392,33 2 1196,165 115,1340
Operario 672,22 1 672,22 64,7029
Interacción 0,778 2 0,389 0,0374
Error 124,67 12 10,3893
Total 3190 17

Para realizar el contraste de hipótesis, para ello recurrimos a la tabla de


distribución F:

FcriticoF,,
Máquinas 3.89
Operario 4.75
Interacción 3.89

Como: Fmáquinas>Fcrítico, rechazamos la H0 Como: Foperario>Fcrítico, re

Después de haber realizado el contraste de la hipótesis concluimos


en que no existe interacción entre observadores y máquinas, a un
nivel de significancia del 5%
c)
Primero ordenamos de forma creciente las medias

   <  < 2


108.165<10.5<136.335
Con la tabla Duncan obtenemos:

,2  


 ,1 3,08


 ,3,
3,23
Los rangos mínimos y significativos:

 
  ∗ 6  
R2= 4,0529
R3= 4,2503

Contrastamos las diferencias entre pares de medias muéstrales comparando


el rango de medias adyacentes con el valor critico de mínimo
significación.
> 
 2  4,503

28,17

 2   
Para p=3
>2 4,0,59
15,835
12,335
  
Para p=2
>2 4,0,59
Entonces concluimos en
que:
 < <2
Completamos la información con el siguiente cuadro:

Rendimiento de las Máquinas


160
140
120
100
80
60
40
20
0

1 2 3

PROMEDIOM1
26. Para seleccionar la mejor semilla de maíz y el mejor fertilizante la
empresa “AGROSA” diseñó un experimento de dos factores con cuatro
réplicas en terrenos de igual fertilidad. El terreno se dividió en 24 pares
iguales. Cada combinación de tipo de semilla y tipo de fertilizante se
asignaron a cuatro pares iguales. Los rendimientos obtenidos en
kilogramos se dan en la tabla siguiente:

Semilla de Maíz

8 7 3 3 4
Fertilizante
 A1 A2 A3

B1 5 3
3 0 35 3 5 3 6 3 
13 
B2
3 403 349 3460 53 8
09
a) Realice una gráfica de medias y el análisis descriptivo de interacción.
b) ¿es significativa la interacción observada entre los tipos de maíz y
tipos de fertilizante? Utilice el método de la probabilidad P.
c)¿Se debería seguir analizando el efecto de los dos factores?

SOLUCIÓN
a) gráfica de medias y el análisis descriptivo de interacción

INTERACCION ENTRE MAIZ Y FERTILIZANTE


180
160
140
120
100
80
60
40
20
0

A1 A2 A3
Fertilizante Semilla d e M aíz

Series1 Series2 Series3 Series4

De la gráfica observamos claramente que si existe interacción


entre ambos factores
b)
Primero realizamos la prueba de hipótesis:
H0= No hay interacción entre los cultivos de fertilizante y maíz.
H1= Existe interacción entre los cultivos de fertilizante y maíz.
Proponemos un cuadro estadístico descriptivo para facilitarnos el
manejo de los datos:
FACTOR B FACTOR A TOTAL MEDIA N

 A1 B1 150 37,5 4


B2 122 30,5 4
Total 272 34 8
 A2 B1 146 36,5 4
B2 164 41 4
Total 310 38,75 8
 A3 B1 131 32,75 4
B2 149 37,25 4
Total 280 35 8
TOTAL B1 427 35,5833 12
B2 435 38,5833 12
Total 862 37,0833 24

Cuya desviación estándar va a ser igual a: 3,90001858


Con los datos obtenidos, comenzamos a realizar los cálculos para la tabla
 ANOVA:
 Primero para el SST:

1×2 349,833333

∙∙∙2 30960,1667

 Luego empezamos con las sumas de cuadrados para los factores:

1 

2  
100,3333

×∙∙
=
1  2,6667



× 2
∙∙
=  
 Lo mismo hacemos con la Interacción:

2 
2
∙  176,3333

++
=
=
 Para el error tenemos que la SSE es igual a:

+ 70,5

Con los datos anteriores ya podemos completar la tabla ANOVA para su


respectivo análisis:

Fuente de Sumas de Grados de Medias Estadísticas


variabilidad cuadrados Libertad cuadráticas F
S. MAIZ 100,3333 2 50,1667 12,8085
FERTILIZANTE 2,6667 1 2,6667 0,6809
INTERACCION 176,3333 2 88,1667 22,5106
ERROR 70,5 18 3,9167
TOTAL 349,8333 23

Para realizar el contraste de hipótesis, para ello recurrimos a la tabla de


distribución F:

FcriticoF,,
FS. Maíz 3.55
Ffertilizante 4.41
Finteracción 3.55
 Ahora ya podemos realizar el contraste de hipótesis:
S. MAIZ Como: Fmaiz>Fcrítico, entonces: Rechazamos Ho
FERTILIZANTE Como: Ffertilizante<Fcrítico, entonces: Aceptamos Ho
INTERACCIONComo: Fmaiz>Fcrítico, entonces: Rechazamos Ho
c)
Ya no sería necesario realizar un análisis de rango para la
comprobación del contraste de hipótesis, ya que tanto gráfica como
analíticamente se ha comprobado la validez de la hipótesis.
27. El grupo de mercados ¨P&C¨ quiere saber el efecto que la
publicidad y la promoción pueden ejercer sobre la venta de uno de
sus productos de consumo popular. Las ventas en miles de dólares
durante un mes, de 16 mercados escogidos al azar en un
experimento diseñado en dos factores con cuatro replicas se dan en
la tabla que sigue:
publicidad
Promoción Con propaganda Sin propaganda

Con 110.5 105.4 80.5 78.6


descuento 90.7 95.8 60.8 65.8
Sin 50.4 45.8 35.8 40.1
descuento 40.6 44.9 20.7 25.7

a) Realice una gráfica de medidas y el análisis de interacción.


b) ¿es significativa la interacción observada?
c) Si no existe interacción entre promoción y publicidad, pruebe
si existe efecto de los factores en forma independiente. Si
existe efecto alguno de los factores sobre las ventas, haga
un análisis de los mejores modos de venta.

SOLUCIÓN
a) Grafico:

Gráfica de medidas
120
100con propagandasin propaganda 80
60

40

20
0
012345

6
El grafico podemos observar que no existe una intersección
entre las líneas por lo tanto concluimos no hay indicios de
interacción

b) De la siguiente tabla obtenemos los datos

117.49
1938.01
80803
990.801
Interacción entre promoción y publicidad:

 :   ,    0
 : ∃   ,, ,  0
Efecto alguno de los factores sobre las ventas:

∗ 3.047
:8.7077
 Análisis de los mejores modos de venta.


 136.905
28. Con el fin de estudiar los efectos de tipo de carga y de las
empresas que las transportan sobre el tiempo de reparto terrestre
de cargas, la distribuidora ¨DOCASA¨ diseño un modelo de análisis
de varianza de dos
vías con réplicas. Cada una de las tres empresas terrestres: , 2
transporto una misma distancia cada uno de los tipos de carga  , 
  ,  
, repitiéndose el experimento tres veces. Se ,
2registraron los siguientes tiempos en minutos.

 Tipo de carga

   2
140 130

 145
135
135
128
132
125

2
TRANSPORTE 136 126
134 124
90 83
92 82

 88 84

 Asumiendo que los factores en estudio son de efectos fijos.


a) Realice una gráfica de medidas y el análisis descriptivo de
la interacción.
b) ¿Es significativa la interacción observada entre tipo de carga
y de transporte?
c) ¿son significativos los efectos de los tipos de carga? Si es así,
¿Cuál de los dos tipos de carga llega primero?
d) ¿son todos significativos los efectos de las empresas? Si fuera
así determine la empresa de transporte que utiliza el menor
tiempo promedio
SOLUCIÓN

a) Grafico:

Gráfica de medidas
tipo de carga A1 tipo de carga A2

160
140

120
100

80
60

40
20
0

0 1 2 3 4 5 6 7 8

El grafico podemos observar que no existe una intersección


entre las líneas por lo tanto concluimos no hay indicios de
interacción

b) De la siguiente tabla obtenemos los datos

8984.5
364.5
7
9
Interacción entre promoción y publicidad:

 , 
:∃:,, ,0 0
Efecto alguno de los factores sobre las ventas:

∗ 0.75
 Análisis de los mejores modos de venta.

: 0
 711.58

29.
60.75
La empresa "BATERIAS" estudia el diseño de una batería que
no sea sensible a la temperatura ambiente. Para esto aprueba 3
materias distintas A1, A2, A3, bajo tres niveles de temperatura
ambiente B1=Baja, B2=Media, B3=Alta, aplicando un diseño de
experimento de clasificación de dos factores con 6 réplicas. La
duración de las baterías, en niveles de horas, se da en la tabla
adjunta:

MATERIALES USADO EN LAS BATERIAS


NIVELES DE T°
 A1 A2 A3

1.1 0.9 1.2 1.3 1.1 0.9


B1 1.2 1.3 1.1 1.3 1.2 1.4
0.7 1 0.9 1.2 1.7 1.3
1.4 1.3 1.5 1.6 1.7 1.6
B2 1.5 1.2 1.4 1.3 1.2 1.5
1.3 1.4 1.3 1.5 1.7 1.4
0.9 1.2 1.1 0.9 0.7 1
B3 1.1 1 1.2 1.3 1.2 0.9
1.2 1.1 1 1.2 0.9 1.1

a) Defina la variable dependiente y el modelo de este


diseño de experimento
b) Realice el análisis descriptivo de la interacción.
c)¿Es significativa la interacción muestral observada entre los factores:
Materiales y Temperaturas
d) ¿Son significativos los efectos debido a los materiales utilizados en
las baterías?
SOLUCIÓN
a)
La variable dependiente es X=Diseño de una batería que no sea
sensible a la temperatura ambiente
El modelo del ANOVA de dos factores con replicas es:

  + + + +ԑ


Donde i=1,2,3, j=1,2,3, k=1,2,3,4,5,6
b)
FACTOR FACTOR
 A B TOTAL MEDIA DESV.ESTAND. N
B1 6.2 1.0333 0.21602469 6
 A1 B2 8.1 1.35 0.104880885 6
B3 6.5 1.0833 0.116904519 6
TOTAL 20.8 3.4667 0.437810094 18
B1 7 1.1667 0.150554531 6
 A2 B2 8.6 1.4333 0.121106014 6
B3 6.7 1.1167 0.147196014 6
TOTAL 22.3 3.7167 0.418856559 18
B1 7.6 1.2667 0.27325202 6
 A3 B2 9.1 1.5167 0.194079022 6
B3 5.8 0.9667 0.175119007 6
TOTAL 22.5 3.75 0.642450049 18
B1 20.8 3.4667 0.639831241 6
TOTAL B2 25.8 4.3 0.420065921 6
B3 19 3.1667 0.439219541 6
TOTAL 65.6 10.933 1.499116703 18

  SCA=0.096

  SCB=1.379

  SCI=0.226

  SCE=1.367

  SCT=3.068

 G. L=2,2,4,45,53
ANÁLISIS DE VARIANZA
Origen de las Suma de cuadrados Grados de libertad Promedio los cuadrados F Probabilidad Valor crítico para
variaciones de F 
Materiales 1.379259259 2 0.68962963 22.70731707 1.52023E-07 3.204317292
Niveles de temperatura 0.095925926 2 0.047962963 1.579268293 0.21733653 3.204317292
Interacción 0.226296296 4 0.056574074 1.862804878 0.133552632 2.578739184
Dentro d el g rupo 1.366666667 45 0.03037037

Total 3.068148148 53

c)
Interacción:
 0 ; 1,,3 1,,3
:  0 ; 1,,3
1,,3
∗ 1.863
;0.134
No hay interacción muestral entre los factores: Materiales y temperatura.
d)
MATERIALES (A):
: 0  ;
1.579
0.17
Se acepta Ho
30. Con el fin de estudiar los efectos de tipo de carga y los efectos
que puedan ocasionar las empresas que la transportan sobre el
tiempo de reparto terrestre de cargas se diseñó un modelo de
análisis de varianza con los tipo de cargas A1=Liquido ,A2= sólido y
tres empresas de transporte terrestre B1,B2,B3,.Cada empresa
transporto una misma distancia cada tipo de carga repitiéndose el
experimento tres veces .Se registraron los tiempos en minutos y se
procesaron obteniendo las siguientes estadísticas:
NÚMERO TIPO DE CARGA TRANSPORTE DATOS
DE
MEDIAS
 A1 B1 3 140
 A1 B2 3 135
 A1 B3 3 90
 A2 B1 3 130
 A2 B2 3 125
 A2 B3 3 83
Desviación estándar de la variable dependiente= 22.9891279

a) Defina el modelo estadístico de este problema de ANOVA


b) ¿Existe interacción significativa entre los factores considerados?
¿Qué puede decir de los efectos de tipos de carga y de las
empresas de transporte?

SOLUCIÓN
a) Tabla
ANOVA
F.DE SUMAS MEDIAS ESTADISTICA
VARIABILIDAD CUADRADOS G.L CUADRATICAS F
TIPO
364.5 1 364.5 60.75
DE CARGA
TRANSPORTE 8539 2 4269.5 711.5833333
INTERACCION 9 2 4.5 0.75
ERROR 72 12 6
TOTAL 8984.5 17

b)
HIPOTESIS
Se contrasta la hipótesis nula

:0 No existe interacción; para i=1,2 ;


:0 j=1,2,3 para algún i≠ j (si existe
interacción)

Estadística y región
critica:
F=MCAB/MCE= 0.75
RC= {F (2,12)>3.89}

∗
Decisión:
Dado =0.75<3.8 no deberíamos rechazar Ho al nivel de significación
que
9
α=0.05. Esto es la interacción observada no es significativa.

Por tanto, no existe interacción entre los factores CARGAS y EMPRESAS DE


TRANSPORTE TERRESTRE.
31.
32.
33. La industria P&C que utiliza para su producción tres máquinas de
marcas distintas 1, 2 y 3 y dos fuentes de materia prima A y B
quiere saber si el número de unidades defectuosas resultantes es la
misma para las tres máquinas y para las dos materias primas. P ara
esto, el ingeniero a cargo del control llevo a cabo un experimento de
la producción observando el número de unidades defectuosas, con
cada una de las máquinas y con cada tipo de materia prima durante
dos días y entre los resultados presentó el siguiente resumen
descriptivo.

Materia Máquinas Número De Media de unidades


Prima Datos defectuosas
 A 1 4 9.1
 A 2 4 11.3
 A 3 4 7.4
B 1 4 7.1
B 2 4 9.0
B 3 4 5.9

Desviación estándar de la variable dependiente= 1.8075

Tabla
ANOVA
Fuente De Suma De Grados De Medias Estadística
Variabilidad Cuadrados Libertad Cuadráticas F
Materia prima 22.427
Maquinas 49.480
Interacción
Error 2.580
total

a. Defina el modelo estadístico de este problema de ANOVA.


Haga un gráfico de líneas de los factores máquina y materia prima
e indique si, en forma descriptiva, se podría suponer o no
interacción entre los dos factores considerados.
b. ¿Es significativa la interacción entre los dos factores considerados?
¿Qué puede decir de los efectos de las materias primas y las
máquinas en la producción defectuosa? Use el nivel de
significación a=0.05
c. ¿Qué maquina produce menos unidades defectuosas? Con
probabilidad de error tipo I, igual a 0.05
SOLUCIÓN

 Es un modelo de clasificación doble con replica

Fuente De Suma De Grados De Medias Estadística


Variabilidad Cuadrados Libertad Cuadráticas F
Materia prima 22.427 1 22.43 156.47
Maquinas 49.48 2 24.74 172.60
Interacción 0.653 2 0.3265 2.28
Error 2.58 18 0.14
total 75.14 23 47.64

Se aprecia en el gráfico y los resultados que no hay interacción

Hipótesis
Se contrasta la hipótesis nula
HO: (ab)y =0 (no existe interacción), para i=1,2,3, j=1,2,3
Contra:

 
H1: (ab)y 0 para algún i  j(si existe interacción)
Estadística y región crítica

~
F=MCAB/MCE  F(2.28); RC={(F0.95(2.28)< 3.76}

Decisión:

Dado que FA*B=3.6<3.76, no rechazamos la hipótesis nula al nivel de


significación del 0.05 entonces se dice que no hay interacción.

 Análisis De Varianza De Dos Factores Con Varias Muestras Por


Grupo

RESUMEN 1 2 3 Total
 A
Cuenta 4 4 4 12
Suma 36.4 45.2 29.6 111.2
Promedio 9.1 11.3 7.4 9.27
Varianza 0.54 2.22 0.82 3.76

B
Cuenta 4 4 4 12
Suma 28.4 36 23.6 88
Promedio 7.1 9 5.9 7.33
Varianza 0.98 0.69 1.85 2.74

Total
Cuenta 8 8 8
Suma 64.8 81.2 53.2
Promedio 8.1 10.15 6.65
Varianza 1.79 2.76 1.79

 ANÁLISIS DE VARIANZA
O. De las S.
variaciones Cuadrados Gl P.cuadrados F Probabilidad Valor F
Muestra 22.43 1.00 22.43 18.95 0.00 4.41
Columnas 49.5 2.0 24.7 20.9 0.0 3.6
Interacción 0.7 2.0 0.3 0.3 0.8 3.6
Dentro del grupo 21.3 18.00 1.18

Total 93.86 23
De la tabla N° 2 se obtiene que:
µ3< µ1< µ2
Entonces la máquina que produce menos defectos es la
maquina número 3.
34. La empresa R&G realiza una investigación para determinar si
el rendimiento de sus empleados está influenciado por el nivel
capacitación y el turno de trabajo. Para realizar este estudio, se
diseñó un experimento de dos factores: el factor A: capacitación del
personal con tres niveles,
 A1= Buena, A2= Regular, A3= Ninguna, y el factor B: turno de trabajo
con tres niveles, B1= Mañana, B2=Tarde, B3= Noche. En cada
combinación de los niveles de capacitación y de turno, se midieron
el rendimiento de cuatro trabajadores. En la medición de los
rendimientos se utilizó un procedimiento cuyos resultados son
tiempos en minutos, indicando que a menor tiempo mayor rendimiento.
Los tiempos de rendimiento observados se dan en la tabla:

 A=Capacitación
B=Turnos
 A1 A2 A3
4 5 8 6 6 7
B1 5 6 5 6 7 6
6 7 7 5 8 7
B2 4 6 6 8 7 6
6 5 6 7 8 6
B3 5 6 6 6 7 7

a) Realice una gráfica de líneas de las medias muéstrales, ¿indica


la gráfica presencia de interacción los dos factores
considerados?
b) Al nivel de significancia de 0.05, ¿existe interacción entre el
factor de capacitación y el factor turno de trabajo?
SOLUCIÓN
a) La variable dependiente es X= Rendimiento de los empleados.
Los factores que posiblemente influyen en el rendimiento son:
 A: capacitación del personal: A1= Buena, A2= Regular, A3=
Ninguna B: turno de trabajo: B1= Mañana, B2=Tarde, B3=
Noche
El modelo del ANOVA de dos factores con replica

es: Xijk = µ + ai + b j + (ab)y + Eijk

Donde i=1, 2,3, j=1, 2,3, k=1, 2, 3, 4

Estadísticas descriptivas:

 Análisis de varianza de dos factores con varias muestras por grupo


RESUMEN A1 A2 A3 Total
B1
Cuenta 2.00 2.00 2.00 2.00 2.00 2.00 12.00
Suma 9.00 11.00 13.00 12.00 13.00 13.00 71.00
Promedio 4.50 5.50 6.50 6.00 6.50 6.50 5.92
Varianza 0.50 0.50 4.50 0.00 0.50 0.50 1.17

B2
Cuenta 2.00 2.00 2.00 2.00 2.00 2.00 12.00
Suma 10.00 13.00 13.00 13.00 15.00 13.00 77.00
Promedio 5.00 6.50 6.50 6.50 7.50 6.50 6.42
Varianza 2.00 0.50 0.50 4.50 0.50 0.50 1.36

B3
Cuenta 2 2 2 2 2 2 12
Suma 11 11 12 13 15 13 75
Promedio 5.5 5.5 6 6.5 7.5 6.5 6.25
Varianza 0.5 0.5 0 0.5 0.5 0.5 0.75

Total
Cuenta 6.00 6.00 6.00 6.00 6.00 6.00
Suma 30.00 35.00 38.00 38.00 43.00 39.00
Promedio 5.00 5.83 6.33 6.33 7.17 6.50
Varianza 0.80 0.57 1.07 1.07 0.57 0.30
ANALISIS DESCRIPTIVO DE LA INTERACCÍON
25

20

15

10

0
1 2 3

Series1 Series2 Series3

Indica que el rendimiento de los que no reciben capacitación es más


bajo de los que reciben una regular capacitación.

You might also like