1

Programa de certificación
de Black Belts ASQ
VI. Seis Sigma - Análisis


P. Reyes / Noviembre de 2007
2
Fase de Análisis
 Propósitos:
 Establecer hipótesis sobre las posibles Causas Raíz
 Refinar, rechazar, o confirmar la Causa Raíz
 Seleccionar las Causas Raíz más importantes:
 Las pocas Xs vitales

 Salidas:
 Causas raíz validadas
 Factores de variabilidad identificados
3
Diagrama de
Ishikawa
Diagrama de
relaciones
Diagrama
de Árbol
Análisis del Modo y Efecto de
Falla (AMEF)
QFD
Diagrama
Causa Efecto
CTQs = Ys
Operatividad
X's vitales
Diagrama
de Flujo
del
proceso
Pruebas
de
hipótesis
Causas raíz
validadas
¿Causa
Raíz?
Definición
Y=X1 + X2+. .Xn
X's
Causas
potenciales
Medición Y,
X1, X2, Xn
FASE DE ANÁLISIS
Si No
Llenar columnas del FMEA
Hasta sol. Propuesta y
comprobar causas con
Pruebas de Hipótesis
4
VI. Análisis
A. Medición y modelaje de relación entre
variables

B: Pruebas de hipótesis

C. Análisis del modo y efecto de falla (AMEF)

D. Métodos adicionales de análisis
5
A. Medición y modelaje de
relación entre variables
6
A. Medición y modelaje de relación
entre variables
1. Coeficiente de correlación

2. Regresión

3. Herramientas Multivariadas

4. Estudios Multivari

5. Análisis de datos por atributos
7
VI.A.1 Coeficiente de correlación
8
Definiciones
Correlación
Establece si existe una relación entre las variables y
responde a la pregunta, ”¿Qué tan evidente es esta
relación?"
Regresión
Describe con más detalle la relación entre las variables.

Construye modelos de predicción a partir de información
experimental u otra fuente disponible.

Regresión lineal simple
Regresión lineal múltiple
Regresión no lineal cuadrática o cúbica
9
Correlación
Propósito: Estudiar la posible relación
entre dos variables.
A
c
c
i
d
e
n
t
e
s

l
a
b
o
r
a
l
e
s

Numero de órdenes urgentes
Correlación
positiva,
posible

• •






















• •


El 1er. paso es realizar una gráfica de la información.
10
Coeficiente de correlación (r )
 Mide la fuerza de la relación lineal entre las variables
X y Y en una muestra.

 El coeficiente de correlación muestral de Pearson rx,y
con valores entre -1 y +1 es:

11
Correlación de la información (R ) de las X y las Y
Correlación Positiva
Evidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y

Correlación Negativa
Evidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y

Correlación
Positiva
0
5
10
15
20
25
0 5 10 15 20 25
X
Y

Correlación
Negativa
0
5
10
15
20
25
0 5 10 15 20 25
X
Y

Sin Correlación
10
15
20
25
5 10 15 20 25
X
Y

0
5
0
R=1
R=>-1
R=-1
R=0
R=>1
12
Coeficiente de correlación
 El coeficiente de correlación r asume el mismo signo
de la pendiente de la recta |1 siendo cero cuando
|1 =0

 Un valor positivo de r implica que la pendiente de la
línea es ascendente hacia la derecha
 Un valor negativo de r implica que la pendiente de la
línea es descendente hacia la derecha
 Si r=0 no hay correlación lineal, aunque puede haber
correlación curvilínea
13
Coeficiente de correlación
Coeficiente de
correlación
0.8 < r < 1.0
0.3 < r < 0.8
-0.3 < r < 0.3
-0.8 < r < -0.3
-1.0 < r < -0.8
Relación
Fuerte, positiva
Débil, positiva
No existe
Débil, negativa
Fuerte, negativa
Reglas empíricas
14
Tabla de Correlación mínima
Correlaciones (Pearson)
n 95% 99%
de confianza de confianza
3 1.00 1.00
4 0.95 0.99
5 0.88 0.96
6 0.81 0.92
7 0.75 0.87
8 0.71 0.83
9 0.67 0.80
10 0.63 0.76
11 0.60 0.73
12 0.58 0.71
13 0.53 0.68
14 0.53 0.66
n 95% 99%
de confianza de confianza
15 0.51 0.64
16 0.50 0.61
17 0.48 0.61
18 0.47 0.59
19 0.46 0.58
20 0.44 0.56
22 0.42 0.54
24 0.40 0.52
26 0.39 0.50
28 0.37 0.48
30 0.36 0.46
Para un 95% de confianza, con una muestra de 10,
el coeficiente (r) debe ser al menos .63
15
• La correlación puede usarse para información de
atributos, variables normales y variables no normales.


• La correlación puede usarse con un “predictor” o
más para una respuesta dada.


• La correlación es una prueba fácil y rápida para
eliminar factores que no influyen en la predicción, para
una respuesta dada.
Correlación
16
Para determinar que tanto se acercan los datos
predichos por el modelo a los datos observados
aplicando el coeficiente de correlación de Pearson (ver
tabla anterior para identificar la significancia)

Coeficiente de Correlación
r =
S(y
e
y
o
)
S(y
e
y
e
) S(y
o
y
o
)
S(y
e
y
e
) = Ey
ei
2
-
(Ey
ei
)
2
n
S(y
o
y
o
) = Ey
oi
2
-
(Ey
oi
)
2
n
S(y
e
y
o
) = Ey
ei

y
oi

-
(Ey
ei
)(Ey
oi
)

n
y
e
= Respuesta esperada
y
o
= Respuesta observada

r = Coeficiente de correlación

17
Otra forma para no consultar la tabla de coeficiente de
correlación de Pearson es la r ajustada
Coeficiente de Correlación ajustado
R
2
(Adj)
= 1 – (1 – r
2
)
(n-1)
(n-p)
Donde :
R
2
(Adj)
= Coeficiente de correlación ajustado

r = Coeficiente de correlación de Pearson

n = Número de datos

p = Núm. términos en el modelo
(Incluyendo la constante)
Criterios en función a la R
2
(Adj)
> 90% = Correlación Fuerte
80% - 90% = Buena correlación
60% - 80% = Correlación media
40% - 60% = Correlación débil
< 40% = No existe correlación
18
Coeficiente de Determinación (R2)
 El coeficiente de determinación es la proporción de la
variación total explicada por la regresión, R2 se
encuentra en el rango de valores de 0 a 1.
19
Correlación vs causación
 Tener cuidado de no tener variables colineales, por
ejemplo peso de un coche y peso de las personas
que transporta, o que no la relación no tenga
sentido, como si lavo mi coche, llueve.

20
VI.A.2 Regresión
21
El análisis de regresión es un método
estandarizado para localizar la correlación entre dos
grupos de datos, y, quizá más importante, crear un
modelo de predicción.

Puede ser usado para analizar las relaciones entre:
• Una sola “X” predictora y una sola “Y”

• Múltiples predictores “X” y una sola “Y”

• Varios predictores “X” entre sí
Análisis de Regresión
22
Supuestos de la regresión lineal
Los principales supuestos que se hacen en el análisis de regresión
lineal son los siguientes:
 La relación entre las variables Y y X es lineal, o al menos bien
aproximada por una línea recta.

 El término de error c tiene media cero.

 El término de error c tiene varianza constante o2.

 Los errores no están correlacionados.

 Los errores están normalmente distribuidos.
c | | + + = X y
1 0
23
Modelo de regresión lineal
 Se aume que para cualquier valor de X el valor observado de Y
varia en forma aleatoria y tiene una distribución de probabilidad
normal






 El modelo general es:
Y = Valor medio de Yi para Xi + error aleatorio

c | | + + = X y
1 0
La línea de regresión se calcula por el método de mínimos cuadrados.
Un residuo es la diferencia entre un punto de referencia en particular (x
i
,
y
i
) y el modelo de predicción ( y = a + bx ). El modelo se define de tal
manera que la suma de los cuadrados de los residuales es un mínimo. La
suma residual de los cuadrados es llamada con frecuencia la suma de los
cuadrados de los errores (SSE) acerca de la línea de regresión

• •





















• • •


e
i
x
i
y
i
SSE = Ee
i
2
= E(y
i
- y
i
)
2
y = b0 + b1x
Regresión Lineal Simple
a y b son
Estimados de
|0 y |1
Gráfica de la Línea de Ajuste
Recta de regresión
Y=-.600.858+5738.89X
R
2
= .895
Altura del muelle
R
e
t
e
n
c
i
ó
n

0.18
0.19
0.20
400
500
600
Regresión
95% Intervalo
de confianza
95% Intervalo
de predicción
26
Interpretación de los Resultados
El intervalo de predicción es el grado de certidumbre de la
difusión de la Y estimada para puntos individuales X. En general,
95% de los puntos individuales (provenientes de la población sobre
la que se basa la línea de regresión), se encontrarán dentro de la
banda [Líneas azules]

La ecuación de regresión (Y = -600.858 + 5738.89X) describe la
relación entre la variable predictora X y la respuesta de
predicción Y.
R
2
(coef. de determinación) es el porcentaje de variación
explicado por la ecuación de regresión respecto a la variación total
en el modelo
El intervalo de confianza es una banda con un 95% de
confianza de encontrar la Y media estimada para cada valor de
X [Líneas rojas]
Interpretación de los Resultados
• Los valores “p” de la constante (intersección en Y) y las variables
de predicción, se leen igual que en la prueba de hipótesis.
Ho: El factor no es significativo en la predicción de la respuesta.
Ha: El factor es significativo en la predicción de la respuesta.


• s es el “error estándar de la predicción” = desviación estándar del
error con respecto a la línea de regresión.

• R
2
(ajustada) es el porcentaje de variación explicado por la
regresión, ajustado por el número de términos en el modelo y por
el número de puntos de información.


• El valor “p” para la regresión se usa para ver si el modelo completo
de regresión es significativo.
Ho: El modelo no es significativo en la predicción de la respuesta.
Ha: El modelo es significativo en la predicción de la respuesta.
28
Errores residuales
 Los errores se denominan frecuentemente residuales.
Podemos observar en la gráfica de regresión los errores
indicados por segmentos verticales.


















29
Errores residuales
Los residuos pueden ser graficados para:

 Checar normalidad.
 Checar el efecto del tiempo si su orden es conocido en los
datos.
 Checar la constancia de la varianza y la posible necesidad de
transformar los datos en Y.
 Checar la curvatura de más alto orden que ajusta en las X’s.

A veces es preferible trabajar con residuos estandarizados o
estudentizados:
n i Y Y e i
i i
..., 3 , 2 , 1 ,
^
= ÷ =
n
MS
e
d
E
i
i
,....., 2 , 1 1 ,.... = =
,
) ( 1
1
2
(
¸
(

¸

|
|
.
|

\
| ÷
+ ÷
=
XX
i
i
i
S
X X
n
MSE
e
r
30
Errores residuales
 Análisis de los errores o residuales

¿Qué tan normales
son los residuales?
¿Residuales individuales -
tendencias; o separados?
Histograma -
¿curva de
campana?
Ignórese
para grupos
pequeños de
información
(<30)
¿Aleatorio
alrededor de
cero, sin
tendencias?
Buscar las inconsistencias
mayores
Buscar las inconsistencias
mayores
Diagnóstico del Modelo de Residuales
Gráfica Normal de Residuales Tabla de Residuales
Histograma de Residuales Residuales vs. Ajustes
Marcador Normal
Número de Observación
Ajuste
F
r
e
c
u
e
n
c
i a
15 10 5 0 -5 -10 -15 -20 -25
3
2
1
0
10 5 0
50
40
30
20
10
0
-10
-20
-30
-40
-50
X=0.000
3.0SL=43.26
-3.0SL=-43.26
550 500 450
20
10
0
-10
-20
2 1 0 -1 -2
20
10
0
-10
-20
15 10 5 0 -5 -10 -15 -20 -25
3
2
1
0
10 5 0
50
40
30
20
10
0
-10
-20
-30
-40
-50
X=0.000
3.0SL=43.26
-3.0SL=-43.26
550 500 450
20
10
0
-10
-20
2 1 0 -1 -2
20
10
0
-10
-20
R
e
s
i
d
u
a
l
R
e
s
i
d
u
a
l
R
e
s
i
d
u
a
l
31
Ejemplo
Considere el problema de predecir las ventas mensuales en
función del costo de publicidad. Calcular el coeficiente de
correlación, el de determinación y la recta.

MES Publicidad Ventas

1 1.2 101
2 0.8 92
3 1.0 110
4 1.3 120
5 0.7 90
6 0.8 82
7 1.0 93
8 0.6 75
9 0.9 91
10 1.1 105
32
Cálculo manual
Calcular columnas para Suma X, Suma Y, Xi
2,
XiYi y Yi
2

Xi Yi
MES Publicidad Ventas Xi
2
XiYi Yi
2

1 1.2 101 1.44 121.2 10201
2 0.8 92 0.64 73.6 8464
3 1.0 110 1.00 110.0 12100
4 1.3 120 1.69 156 14400
5 0.7 90 0.49 63.0 8100
6 0.8 82 0.64 65.6 6724
7 1.0 93 1.00 93.0 8649
8 0.6 75 0.36 45.0 5625
9 0.9 91 0.81 81.9 8281
10 1.1 105 1.21 115.5 11025

SUMA 9.4 959 9.28 924.8 93,569
33
Método de mínimos cuadrados
Donde:
Yest = Valor predicho de para un valor particular de x.
b0 = Estimador puntual de .(ordenada al origen)
b1= Estimador puntual de (pendiente)
Para el cálculo de b0 y b1 se utilizamos las siguientes fórmulas:

( )
¿
¿
÷ =
n
x
x SS
x
2
2

( )
¿
¿
÷ =
n
y
y SS
y
2
2

( )( )
¿
¿ ¿
÷ =
n
y x
xy SS
xy

x
xy
SS
SS
b =
1

x b y b
1 0
÷ =
34
Análisis de varianza en la regresión





La desviación estándar S corresponde a la raíz cuadrada del valor de MSE
o cuadrado medio residual.



Los residuos son:
2 2
1
2
÷
÷
=
÷
=
n
S b S
n
SS
S
XY YY E
n
Y
Y S
n
i
i
n
i
i YY
2
1
1
2
|
.
|

\
|
÷ =
¿
¿
=
=
n
Y X
Y X S
n
i
i
n
i
i
n
i
i i XY
¿ ¿
¿
= =
=
÷ =
1 1
1
i
i i
Y Y e
^
÷ =
) (
__ ^ __ ^
Y Y Y Y Y Y i
i
i
i
÷ ÷ ÷ = ÷

Tabla de Análisis de Varianza .

Fuente df SS MS = SS/df Fc
Regresión 1
XY
S b SSR
1
=
REG
MS MSreg/s
2


Residual n-2
XY YY
S b SS SSE
1
÷ = S
2

__________________________________________________________.
Total corregido n-1
YY
S
¿ ¿ ¿
÷ + ÷ = ÷
2
^
2
__ ^
2
__
) ( ) ( ) ( i
i
i
i
Y Y Y Y Y Y
35
Análisis de varianza en la regresión
Las conclusiones son como sigue:





Intervalos de confianza para Beta 0 y Beta 1
El estadístico F se calcula como F = MSE
REG
/ S
2
y se compara con la F de
tablas con (1, n-2) grados de libertad y área en 100(1-o)%, para determinar si
el parámetro |
1
es significativo que es el caso de F
calc
. > F
tablas
.
S
X X n
X
S
X
n
MSE b se
i
i
XX
2 / 1
2
__
2
2
__
0
) (
1
) (
(
(
(
¸
(

¸

÷
=
|
|
|
.
|

\
|
+ =
¿
¿
XX XX
S
S
S
MSE
b se = = ) (
1
S
X X n
X
n t b
i
i
2 / 1
2
__
2
0
) (
)
2
1
1 , 2 (
(
(
(
¸
(

¸

÷
÷ ÷ ±
¿
¿
o
¿
÷
÷ ÷
±
2
__
1
) (
).
2
1
1 , 2 (
X X
S n t
b
i
o
¿
÷
÷ ÷
±
2
__
1
) (
).
2
1
1 , 2 (
X X
S n t
b
i
o
36
Análisis de varianza en la regresión
El intervalo de confianza para la desviación estándar es:



Intervalos de confianza para la Y estimada promedio



Intervalo de predicción para un valor particular de Y estimado
¿
÷
÷ ÷
±
2
__
1
) (
).
2
1
1 , 2 (
X X
S n t
b
i
o
2
2 , 2 / 1
2
2
2 , 2 /
) 2 ( ) 2 (
÷ ÷ ÷
÷
s s
÷
n n
MSE n MSE n
o o
_
o
_
|
|
|
.
|

\
|
÷
+ ±
÷
XX
n a
S
X X
n
MSE t Y
2
__
0
2 , 2 /
^
0
) ( 1
(
(
¸
(

¸

÷
+ + + s s
(
(
¸
(

¸

÷
+ + ÷
÷ ÷
XX
n
XX
n
S
X X
n
MSE t Y Y
S
X X
n
MSE t Y
2
__
0
2 , 2 / 0 0
2
__
0
2 , 2 / 0
) ( 1
1
ˆ
) ( 1
1
ˆ
o o
37
Análisis de varianza en la regresión
Prueba de Hipótesis para Beta 1:
Ho: |1 = 0 contra H1:|1 = 0




Si el coeficiente Beta 1 es significativo

¿
÷
÷ ÷
±
2
__
1
) (
).
2
1
1 , 2 (
X X
S n t
b
i
o
XX
S
MSE
b
t
1
0
=
2 , 2 / 0 ÷
>
n
t t
o
38
Análisis de varianza en la regresión
Coeficiente de correlación r:




Coeficiente de determinación: r2
R2 mide la proporción de la variación total respecto a la media que
es explicada por la regresión. Se expresa en porcentaje.



¿
÷
÷ ÷
±
2
__
1
) (
).
2
1
1 , 2 (
X X
S n t
b
i
o
YY XX
XY
S S
S
r =
YY
i
S
SSE
Y Y
Y Y
media la para corregido SSTotal
b por regresión la de SS
R ÷ =
÷
÷
= =
¿
¿
1
) (
) (
) . . . . (
) . . . . . (
2
__
2
__ ^
0 2
39
Análisis de varianza en la regresión
Prueba de hipótesis para el Coeficiente de correlación r:
H0: µ = 0 contra H1: µ = 0




Si se rechaza la hipótesis Ho, indicando que existe una
correlación significativa



¿
÷
÷ ÷
±
2
__
1
) (
).
2
1
1 , 2 (
X X
S n t
b
i
o
2
0
1
2
r
n r
t
÷
÷
=
2 , 2 / 0 ÷
>
n
t t
o
40
Riesgos de la regresión
 Los modelos de regresión son válidos como ecuaciones de
interpolación sobre el rango de las variables utilizadas en el
modelo. No pueden ser válidas para extrapolación fuera de
este rango.

 Mientras que todos los puntos tienen igual peso en la
determinación de la recta, su pendiente está más influenciada
por los valores extremos de X.
1.
Y
*A


* *
* * * Sin A y B
* * * *


*B

X
41
Riesgos de la regresión
 Los outliers u observaciones aberrantes pueden distorsionar
seriamente el ajuste de mínimos cuadrados.








 Si se encuentra que dos variables están relacionadas
fuertemente, no implica que la relación sea casual, se debe
investigar la relación causa – efecto entre ellas. Por ejemplo el
número de enfermos mentales vs. número de licencias
recibidas.

Y
*A *
* * *
* *
* * *
** *
**
* * *
**
* *


X

42
Cálculo manual (cont..)
Cálculo de la recta de regresión lineal:

Sxx = 9.28 - (9.4)^2/10 = 0.444

Sxy = 924.8 - (9.4)(959) / 10 = 23.34

Ymedia = 959 / 10 = 95.9 Xmedia = 9.4 / 10 = 0.94

b1 = Sxy / Sxx = 23.34 / 0.444 = 52.57

b0 = Ymedia - b1*Xmedia = 95.9 - (52.5676)(0.94) = 46.49

Yest. = 46.49 + 52.57* X
43
Ejemplo (cont..)
Cálculo de S
2
estimador de o

S
2
= SSE / (n - 2) = Syy - (Sxy)^2/Sxx

Syy = 93,569 - (959)^2 / 10 = 1600.9

SSE = Syy - b1*Sxy = 1600.9 - (52.567)(23.34) = 373.97

S
2
= SSE / (n - 2) = 373.97 / 8 = 46.75

S = 6.84

El intervalo de confianza donde caerán el 95% de los puntos
es el rango de ±1.96S = 13.41 o sea a ± 13.41 de la línea.

44
Ejemplo (cont..)
Inferencias respecto a la pendiente de la línea b1:

Se usa el estadístico t = b1 / (S / \Sxx)

El término del denominador es el error estándar de la
pendiente.

Para probar la hipótesis nula Ho: |1 = 0

En este caso tc = 52.57 / (6.84 / ###BOT_TEXT###.444) = 5.12

El valor crítico tcrit. para alfa/2 = 0.025 con (n-2) = 8 grados
de libertad es 2.306.

Como tc > tcrítico se rechaza la hipótesis de que b1 = 0
existiendo la regresión.
45
Ejemplo (cont..)
Estableciendo un 95% de confianza para la pendiente de
la recta b1.

Usando la fórmula b1 ± t
0.025
(S / \Sxx) se tiene:

52.57 ± 2.306 * 6.84 / \ 0.444 = 52.57 ± 23.67.

Por tanto una unidad de incremento en publicidad, hará que
el volumen de ventas se encuentre entre $28.9 a $76.2.


46
Ejemplo (cont..)
Cálculo del coeficiente de Correlación:
________
r = Sxy / \(SxxSyy)
____________
r = 23.34 / ###BOT_TEXT###.444*1600.9 = 0.88

Como r es positivo, la pendiente de la recta apunta hacia
arriba y a la derecha.

El coeficiente de determinación r^2 = 1 - SSE/Syy

r^2 = ( Syy - SSE ) / Syy = 0.774

47
1. Teclear los datos para Xi y Yi

2. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o ANALISIS
DE DATOS, CORRELATION o CORRELACIÓN

3. Dar INPUT RANGE (rango de datos), OUTPUT RANGE (para los
resultados) y obtener los resultados

Column 1 Column 2
Column 1 1 0.875442
Column 2 0.875442 1

El coeficiente de correlación r = 0.875442
Análisis de Regresión
48
Cálculo con Excel)
4. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o
ANALISIS DE DATOS, REGRESION o REGRESIÓN

3. Dar INPUT RANGE Y (rango de datos Yi), INPUT RANGE X
(rango de datos Xi), CONFIDENCE INTERVAL 95%, OUTPUT
RANGE (para los resultados), RESIDUAL PLOTS o GRAFICAS DE
RESIDUALES y obtener una tabla de resultados como los que se
muestran en las páginas siguientes.

NOTAS:

a) La gráfica de probabilidad normal debe mostrar puntos
fácilmente aproximables por una línea recta, indicando normalidad.

B) La gráfica de residuos estandarizados se deben distribuir en
forma aleatoria alrededor de la línea media igual a cero.
Resultados de Excel
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.875442 R Square 0.766398
Adjusted R Square0.737198 Standard Error 6.83715
Observations 10

ANOVA
df SS MS F Significance F
Regression 1 1226.927 1226.927 26.24633 0.000904
Residual 8 373.973 46.74662
Total 9 1600.9
Confidence 95%
Coefficients Standard Error t Stat P-value Lower Upper

Intercept 46.48649 9.884566 4.702936 0.001536 23.69262 69.28035

X Variable1 52.56757 10.26086 5.123117 0.000904 28.90597 76.22916

La ecuación de la recta es Yest = 46.48649 + 52.56757 X
Como los valores p para los coeficientes son menores a 0.05,
ambos son significativos
50
Gráfica normal de Excel
Normal Probability Plot
0
20
40
60
80
100
120
140
0 20 40 60 80 100
Sample Percentile
Y
51
Gráfica de Residuos vs. X de Excel
X Variable 1 Residual Plot
-10
0
10
20
0 0.5 1 1.5
X Variable 1
R
e
s
i
d
u
a
l
s
52
Ejercicio
Calcular la recta de predicción con sus bandas de confianza,
la correlación y la determinación para la respuesta de un Taxi,
los datos se muestran a continuación:

Distancia Tiempo
0.8 200
2.2 400
1.0 160
0.6 120
1.0 360
1.4 280
2.2 560
0.6 320



53
Relaciones no Lineales
¿Qué pasa si existe una relación causal, no lineal?
El siguiente es un conjunto de datos
experimentales codificados, sobre
resistencia a la compresión de una
aleación especial:

Resistencia a
Concentración la Compresión
x y
10.0 25.2 27.3 28.7
15.0 29.8 31.1 27.8
20.0 31.2 32.6 29.7
25.0 31.7 30.1 32.3
30.0 29.4 30.8 32.8

(ref. Walpole & Myers, 1985)
¿Cómo describiría
esta relación?
54
Y = 19.0333 + 1.00857X - 2.04E-02X**2
R
2
= 0.614
Análisis de Variancia
FUENTE DF SS MS F p
Regresión 2 38.9371 19.4686 9.54490 3.31E-03
Error 12 24.4762 2.0397
Total 14 63.4133
FUENTE DF Seq SS F p
Lineal 1 28.0333 10.3005 6.84E-03
Cuadrática 1 10.9038 5.34584 3.93E-02
Resultados del Análisis de Regresión - Modelo Cuadrático
55
Regresión cuadrática
Obs X Y Fit SE Fit Residual St Resid
1 5.0 1.5820 1.3366 0.0519 0.2454 1.07
2 6.0 1.8220 1.5778 0.0473 0.2442 1.06
3 3.4 1.0570 0.9508 0.0703 0.1062 0.47
4 2.7 0.5000 0.7820 0.0806 -0.2820 -1.27
5 10.0 2.2360 2.5424 0.0875 -0.3064 -1.40
6 9.7 2.3860 2.4700 0.0828 -0.0840 -0.38
7 9.6 2.2940 2.4338 0.0804 -0.1398 -0.63
8 3.1 0.5580 0.8664 0.0753 -0.3084 -1.38
9 8.2 2.1660 2.0962 0.0609 0.0698 0.31
10 6.2 1.8660 1.6260 0.0472 0.2400 1.04
11 2.9 0.6530 0.8302 0.0776 -0.1772 -0.79
12 6.4 1.9300 1.6622 0.0474 0.2678 1.16
13 4.6 1.5620 1.2402 0.0555 0.3218 1.40
14 5.8 1.7370 1.5295 0.0476 0.2075 0.90
15 7.4 2.0880 1.9154 0.0530 0.1726 0.75
16 3.6 1.1370 0.9990 0.0675 0.1380 0.61
17 7.9 2.1790 2.0239 0.0574 0.1551 0.68
18 8.8 2.1120 2.2530 0.0694 -0.1410 -0.62
19 7.0 1.8000 1.8189 0.0500 -0.0189 -0.08
20 5.5 1.5010 1.4451 0.0490 0.0559 0.24
21 9.1 2.3030 2.3253 0.0737 -0.0223 -0.10
22 10.2 2.3100 2.5906 0.0907 -0.2806 -1.29
23 4.1 1.1940 1.1196 0.0611 0.0744 0.33
24 4.0 1.1440 1.0834 0.0629 0.0606 0.27
25 2.5 0.1230 0.7217 0.0845 -0.5987 -2.72R
56
Regresión cuadrática
Analysis of Variance
Source DF SS MS F P
Regression 1 8.9296 8.9296 160.26 0.000
Residual Error 23 1.2816 0.0557
Total 24 10.2112
57
Regresión cuadrática
Los residuos
No son normales
Se deben transformar
Las variables
Otros Patrones No Lineales
A veces es posible transformar una o ambas variables, para mostrar
mejor la relación entre ambas. La meta es identificar la relación
matemática entre las variables, para que con la variable transformada
se obtenga una línea más recta. Algunas transformaciones comunes
incluyen:
x’ = 1/x
x’ = Raíz cuadrada de (x)
x’ = log x
Funciones trigonométricas: x’ = Seno
de x
59
Trasformación de funciones








 Ejemplo: sea se transforma como
Funciones linealizables y su forma lineal
correspondiente.
Figura 3.13 Función Transformación Forma lineal
a,b
1
0
|
| X Y = X X Y Y log ' , log ' = = ' log '
1 0
X Y | | + =
c,d
X
e Y
1
0
|
| = Y Y log ' = X Y
1 0
ln ' | | + =
e,f X Y log
1 0
| | + = X X log ' = ' '
1 0
X Y | | + =
g,h
1 0
| | ÷
=
X
X
Y
X
X
Y
Y
1
' ,
1
' = = ' '
1 0
X Y | | ÷ =
c |
| X
e Y
1
0
=
c | | ln ln ln
1 0
+ + = X Y
' ' '
1 0
c | | + + = X Y
60
Transformación de variables del
ejemplo de regresión cuadrática
 Transformando la variable X’ = 1/X se tiene, utilizando Minitab
The regression equation is
Y = 2.98 - 6.93 1/X

Predictor Coef SE Coef T P
Constant 2.97886 0.04490 66.34 0.000
1/X -6.9345 0.2064 -33.59 0.000

S = 0.09417 R-Sq = 98.0% R-Sq(adj) = 97.9%


Obs 1/X Y Fit SE Fit Residual St Resid
1 0.200 1.5820 1.5920 0.0188 -0.0100 -0.11
2 0.167 1.8220 1.8231 0.0199 -0.0011 -0.01
3 0.294 1.0570 0.9393 0.0274 0.1177 1.31
4 0.370 0.5000 0.4105 0.0404 0.0895 1.05
5 0.100 2.2360 2.2854 0.0276 -0.0494 -0.55
6 0.103 2.3860 2.2640 0.0271 0.1220 1.35
61
Transformación de variables del
ejemplo de regresión cuadrática
 Transformando la variable X’ = 1/X se tiene, utilizando Minitab
62
Transformación de variables del
ejemplo de regresión cuadrática
 Los residuos ahora ya se muestran normales
63
Transformación para homoestacidad
de la varianza
 Algunas transformaciones para estabilizar la varianza









Relación de o
2
a E(Y) Transformación
Y Y constante = ÷ ÷ ' .......... .......... ..........
2
o o
Y Y Y E = ÷ ÷ ' .... .......... .......... )......... (
2
o o Datos de Poisson
| | Y sin Y Y E Y E
1 2
' ...... .......... ) ( 1 ) (
÷
= ÷ ÷ ÷o o Proporciones binomiales
| | ) ln( ' .......... .......... .......... ) (
2
2
Y Y Y E = ÷ ÷o o
| |
2 / 1
3
2
' ....... .......... .......... ) (
÷
= ÷ ÷ Y Y Y E o o
64
Transformación para homoestacidad
de la varianza
 Ejemplo: Se hizo un estudio entre la demanda (Y) y la energía
eléctrica utilizada (X) durante un cierto periodo de tiempo




Obs X Y Fit SE Fit Residual St Resid
1 679 0.790 1.649 0.351 -0.859 -0.61
2 292 0.440 0.308 0.490 0.132 0.10
3 1012 0.560 2.802 0.293 -2.242 -1.57
4 493 0.790 1.004 0.412 -0.214 -0.15
5 582 2.700 1.312 0.381 1.388 0.98
6 1156 3.640 3.301 0.297 0.339 0.24
7 997 4.730 2.750 0.294 1.980 1.38
8 2189 9.500 6.880 0.651 2.620 2.00R
9 1097 5.340 3.097 0.293 2.243 1.57
10 2078 6.850 6.495 0.600 0.355 0.27
11 1818 5.840 5.595 0.488 0.245 0.18
12 1700 5.210 5.186 0.441 0.024 0.02
13 747 3.250 1.884 0.333 1.366 0.96
14 2030 4.430 6.329 0.579 -1.899 -1.42
15 1643 3.160 4.988 0.420 -1.828 -1.31
16 414 0.500 0.730 0.441 -0.230 -0.17
17 354 0.170 0.523 0.465 -0.353 -0.25
18 1276 1.880 3.717 0.313 -1.837 -1.29
19 745 0.770 1.877 0.333 -1.107 -0.78
20 435 1.390 0.803 0.433 0.587 0.42
21 540 0.560 1.167 0.395 -0.607 -0.43
22 874 1.560 2.324 0.307 -0.764 -0.53
23 1543 5.280 4.642 0.384 0.638 0.45
24 1029 0.640 2.861 0.293 -2.221 -1.55
25 710 4.000 1.756 0.343 2.244 1.58
65
Transformación para homoestacidad
de la varianza
 Ejemplo: Se hizo un estudio entre la demanda (Y) y la energía
eléctrica utilizada (X) durante un cierto periodo de tiempo




The regression equation is
Y = - 0.704 + 0.00346 X
Predictor Coef SE Coef T P
Constant -0.7038 0.6170 -1.14 0.266
X 0.0034645 0.0005139 6.74 0.000
S = 1.462 R-Sq = 66.4% R-Sq(adj) = 64.9%
Analysis of Variance
Source DF SS MS F P
Regression 1 97.094 97.094 45.45 0.000
Residual Error 23 49.136 2.136
Total 24 146.231
66
Transformación para homoestacidad
de la varianza
 Se observa que la varianza se incrementa conforme aumenta X


67
Transformación para homoestacidad
de la varianza
 Se observa que la varianza se incrementa conforme aumenta X


68
Transformación para homoestacidad
de la varianza
 Transformando a X por su raíz cuadrada se tiene:


Obs X SQR-Y Fit SE Fit Residual St Resid
1 679 0.8888 1.1694 0.1092 -0.2805 -0.64
2 292 0.6633 0.7717 0.1524 -0.1084 -0.25
3 1012 0.7483 1.5115 0.0912 -0.7632 -1.71
4 493 0.8888 0.9783 0.1280 -0.0894 -0.21
5 582 1.6432 1.0697 0.1184 0.5735 1.31
6 1156 1.9079 1.6595 0.0922 0.2484 0.56
7 997 2.1749 1.4961 0.0914 0.6788 1.52
8 2189 3.0822 2.7208 0.2024 0.3614 0.89
9 1097 2.3108 1.5989 0.0911 0.7120 1.60
10 2078 2.6173 2.6068 0.1867 0.0105 0.03
11 1818 2.4166 2.3397 0.1518 0.0770 0.18
12 1700 2.2825 2.2184 0.1371 0.0641 0.15
13 747 1.8028 1.2392 0.1035 0.5635 1.27
14 2030 2.1048 2.5575 0.1800 -0.4527 -1.09
15 1643 1.7776 2.1598 0.1304 -0.3822 -0.88
16 414 0.7071 0.8971 0.1372 -0.1900 -0.44
17 354 0.4123 0.8354 0.1445 -0.4231 -0.98
18 1276 1.3711 1.7828 0.0974 -0.4116 -0.93
19 745 0.8775 1.2372 0.1037 -0.3597 -0.81
20 435 1.1790 0.9187 0.1347 0.2603 0.60
21 540 0.7483 1.0265 0.1228 -0.2782 -0.64
22 874 1.2490 1.3697 0.0955 -0.1207 -0.27
23 1543 2.2978 2.0571 0.1195 0.2407 0.55
24 1029 0.8000 1.5290 0.0910 -0.7290 -1.64
25 710 2.0000 1.2012 0.1065 0.7988 1.81
69
Transformación para homoestacidad
de la varianza
 Transformando a X por su raíz cuadrada se tiene:


Regression Analysis: SQR-Y versus X

The regression equation is
SQR-Y = 0.472 + 0.00103 X
Predictor Coef SE Coef T P
Constant 0.4717 0.1918 2.46 0.022
X 0.0010275 0.0001598 6.43 0.000
S = 0.4544 R-Sq = 64.3% R-Sq(adj) = 62.7%
70
Transformación para homoestacidad
de la varianza
 Transformando a X por su raíz cuadrada se tiene:


71
Regresión lineal múltiple
72
Regresión múltiple
 Cuando se usa más de una variable independiente para predecir
los valores de una variable dependiente, el proceso se llama
análisis de regresión múltiple, incluye el uso de ecuaciones
lineales.



Se asume que los errores cu tienen las características siguientes:
 Tienen media cero y varianza común o2.
 Son estadísticamente independientes.
 Están distribuidos en forma normal.
u uk k u u u
X X X Y c | | | | + + + + + = .......
2 2 1 1 0
73
Regresión múltiple
Estimación de los parámetros del modelo
 Se trata de minimizar los errores cuadráticos en:



El modelo de regresión múltiple en forma matricial es:
Y = X | + c = [1 : D] | + c
Y es un vector N x 1.
X es una matriz de orden N x (k + 1), donde la 1ª. columna es 1’s.
| es un vector de orden (k + 1) x 1.
c es un vector de orden N x 1.
D es la matriz de Xij con i = 1, 2, ..., N; j = 1, 2, ......, k
¿
=
÷ ÷ ÷ ÷ ÷ =
N
u
uk u u u k
X X Y R
1
2
2 2 1 1 0 1 0
) ..... ( ) ,..., , ( | | | | | | |
74
Regresión múltiple
Estimación de los parámetros del modelo:

b = (X’X)-1 X’Y
El vector de valores ajustados se puede expresar como:



La varianza del modelo se estima como:



Hy Y X X X X Xb Y = = =
÷
' ) ' (
ˆ
1
Xb Y =
ˆ
e e e Y Y SSE
n
i
i i
' )
ˆ
(
1
2 2
= = ÷ =
¿ ¿
=
Xb X b Y X b Y Y Xb X b Xb Y Y X b Y Y Xb Y Xb Y SSE ' ' ' ' 2 ' ' ' ' ' ' ' ) ( )' ( + ÷ = + ÷ ÷ = ÷ ÷ =
Y X b Y Y SSE ' ' ' ÷ =
p N
SSE
MSE s
÷
= =
2
75
Tamaño de muestra
 Tomar 5 observaciones para cada una de las
variables independientes, si esta razón es menor de5
a 1, se tiene el riesgo de “sobreajustar” el modelo

 Un mejor nivel deseable es tomar 15 a 20
observaciones por cada variable independiente
76
Ejemplo de regresión múltiple
 Un embotellador está analizando las rutas de servicio de
máquinas dispensadoras, está interesado en predecir la
cantidad de tiempo requerida por el chofer para surtir las
máquinas en el local (Y).

 La actividad de servicio incluye llenar la máquina con refrescos y
un mantenimiento menor.

 Se tienen como variables el número de envases con que llena la
máquina (X1) y la distancia que tiene que caminar (X2).
77
Ejemplo de regresión múltiple
X2-Dist X1-CAS Y-TENT Fit SE Fit Residual St Resid
Obs
16.68 7.0 16.680 21.708 1.040 -5.028 -1.63
1
11.50 3.0 11.500 10.354 0.867 1.146 0.36
2
12.03 3.0 12.030 12.080 1.024 -0.050 -0.02
3
14.88 4.0 14.880 9.956 0.952 4.924 1.58
4
13.75 6.0 13.750 14.194 0.893 -0.444 -0.14
5
18.11 7.0 18.110 18.400 0.675 -0.290 -0.09
6
08.00 2.0 8.000 7.155 0.932 0.845 0.27
7
17.83 7.0 17.830 16.673 0.823 1.157 0.37
8
79.24 30.0 79.240 71.820 2.301 7.420 3.21RX
9
21.50 5.0 21.500 19.124 1.444 2.376 0.81
10
40.33 16.0 40.330 38.093 0.957 2.237 0.72
11
21.00 10.0 21.000 21.593 1.099 -0.593 -0.19
12
13.50 4.0 13.500 12.473 0.806 1.027 0.33
13
19.75 6.0 19.750 18.682 0.912 1.068 0.34
14
24.00 9.0 24.000 23.329 0.661 0.671 0.21
15
29.00 10.0 29.000 29.663 1.328 -0.663 -0.22
16
15.35 6.0 15.350 14.914 0.795 0.436 0.14
17
19.00 7.0 19.000 15.551 1.011 3.449 1.11
18
09.50 3.0 9.500 7.707 1.012 1.793 0.58
19
35.10 17.0 35.100 40.888 1.039 -5.788 -1.87
20
17.90 10.0 17.900 20.514 1.325 -2.614 -0.88
21
52.32 26.0 52.320 56.007 2.040 -3.687 -1.45 22
18.75 9.0 18.750 23.358 0.662 -4.608 -1.44 23
19.83 8.0 19.830 24.403 1.132 -4.573 -1.50 24
10.75 4.0 10.750 10.963 0.841 -0.213 -0.07 25


R denotes an observation with a large standardized residual
X denotes an observation whose X value gives it large influence.

Durbin-Watson statistic = 1.17
78
Ejemplo de regresión múltiple
Solución matricial
Matrix M5 = X'
[ 1 1 1 1 1 1 1 1 1 1 1 1
1
7 3 3 4 6 7 2 7 30 5 16 10
4
560 220 340 80 150 330 110 210 1460 605 688 215
255

1 1 1 1 1 1 1 1 1 1 1 1
6 9 10 6 7 3 17 10 26 9 8 4
462 448 776 200 132 36 770 140 810 450 635 150 ]

Matrix M6 = X'Y

[ 25 219 10232
219 3055 133899
10232 133899 6725688 ]

Matrix M7 = X'Y

[ 560
7375
337072 ]

79
Ejemplo de regresión múltiple
Solución matricial
Matrix M8 = INV(X'X)

0.113215 -0.004449 -0.000084
-0.004449 0.002744 -0.000048
-0.000084 -0.000048 0.000001

Matrix M9 = INV(X'X) X'Y

2.34123
1.61591
0.01438

The regression equation is
Y-TENT = 2.34 + 1.62 X1-CAS + 0.0144 X2-DIST

Predictor Coef SE Coef T P
Constant 2.341 1.097 2.13 0.044
X1-CAS 1.6159 0.1707 9.46 0.000
X2-DIST 0.014385 0.003613 3.98 0.001

S = 3.259 R-Sq = 96.0% R-Sq(adj) = 95.6%

80
Ejemplo de regresión múltiple
Solución matricial
Cálculo de la estimación de la varianza:
Data Display

Matrix M10 = Y'

[ 16.68 11.50 12.03 14.88 13.75 18.11 8.00 17.83 79.24 21.50
40.33
21.00 13.50 19.75 24.00 29.00 15.35 19.00 9.50 35.10 17.90 52.32
18.75 19.83 10.75 ]

Matrix M11 = Y'Y = 18310.6

Matrix M12 = b' = [ 2.34123 1.61591 0.01438 ]

Matrix M13 = b'X'Y = 18076.9

Matrix M14 = SSe = Y'Y - b'X'Y = 233.732

624 . 10
3 25
732 . 233
2
=
÷
=
÷
=
p N
SS
S
E

81
Ejemplo de regresión múltiple
Solución matricial
 Intervalo de confianza para Beta 1





Por tanto el intervalo de confianza para el 95% es:
1.26181 s |1 s 1.97001
) ( ) (
1 22 , 025 . 1 1 1 22 , 025 . 1
b se t b b se t b + s s ÷ |
) 17073 . 0 )( 074 . 2 ( 6191 . 1 ) 00274378 . 0 )( 6239 . 10 ( ) 074 . 2 ( 61591 . 1
1
+ s s ÷ |
82
Ejemplo de regresión múltiple
Solución matricial
 El embotellador desea construir un intervalo de confianza sobre
el tiempo medio de entrega para un local requiriendo:

X1 = 8 envases y cuya distancia es X2 = 275 pies.




La varianza de la Y0 estimada es (tomando M8=inv(X’X) :

(
(
(
¸
(

¸

=
275
8
1
0
X
| | minutos b X Y 22 . 19
01438 . 0
61591 . 1
34123 . 2
275 , 8 , 1 '
ˆ
0 0
=
(
(
(
¸
(

¸

= =
| | 56794 . 0 ) 05346 . 0 ( 6239 . 10
275
8
1
8 275 , 8 , 1 6239 . 10 ) ' ( ' )
ˆ
(
0
1
0
2
0
= =
(
(
(
¸
(

¸

= =
÷
M X X X X S Y Var
83
Ejemplo de regresión múltiple
Solución matricial
 El intervalo de confianza sobre el tiempo medio de entrega para
un local requiriendo es para 95% de nivel de confianza:



 Que se reduce a: 17.66 s Y0 s 20.78


56794 . 0 074 . 2 22 . 19 56794 . 0 074 . 2 22 . 19
0
+ s s ÷ Y
84
Ejemplo de regresión múltiple
Solución matricial
 El análisis de varianza es:

Analysis of Variance
SST = 18,310.629 -
25
) 6 . 559 (
2
= 5784.5426
SSR = 18,076.930 -
25
) 6 . 559 (
2
= 5,550.8166
SSE = SST – SSR = 233.7260

24 . 261
6239 . 10
4083 . 2775
0
= = =
MSE
MSR
F

44 . 3
22 , 2 , 05 . 0
= F

Como la F calculada es mayor que la F de tablas, se
concluye que existe el modelo con alguno de sus
coeficientes diferente de cero
Con el paquete Minitab se obtuvo lo siguiente:
Source DF SS MS F P
Regression 2 5550.8 2775.4 261.24 0.000
Residual Error 22 233.7 10.6
Total 24 5784.5
85
Ejemplo de regresión múltiple
Solución matricial
 El comportamiento de los residuos es como sigue:

86
Multicolinealidad
 La multicolinealidad implica una dependencia cercana entre
regresores (columnas de la matriz X ), de tal forma que si hay
una dependencia lineal exacta hará que la matriz X’X sea
singular.

 La presencia de dependencias cercanamente lineales impactan
dramáticamente en la habilidad para estimar los coeficientes de
regresión.

 La varianza de los coeficientes de la regresión son inflados
debido a la multicolinealidad. Es evidente por los valores
diferentes de cero que no están en la diagonal principal de X’X.
Que son correlaciones simples entre los regresores.
87
Multicolinealidad
 Una prueba fácil de probar si hay multicolinealidad entre dos
variables es que su coeficiente de correlación sea mayor a 0.7

 Los elementos de la diagonal principal de la matriz X’X se
denominan Factores de inflación de varianza (VIFs) y se usan
como un diagnóstico importante de multicolinealidad. Para el
componente j – ésimo se tiene:



 Si es mayor a 10 implica que se tienen serios problemas de
multicolinealidad.
2
1
1
j
j
R
VIF
÷
=
88
Análisis de los residuos
 Los residuos graficados vs la Y estimada, pueden mostrar
diferentes patrones indicando adecuación o no adecuación del
modelo:

 Gráfica de residuos aleatorios cuya suma es cero (null plot)
indica modelo adecuado

 Gráfica de residuos mostrando una no linealidad curvilínea
indica necesidad de transformar las variables

 Si los residuos se van abriendo indica que la varianza muestra
heteroestacidad y se requiere transformar las variables. Se
puede probar con la prueba de Levene de homogeneidad de
varianzas
89
Escalamiento de residuos
 En algunos casos es difícil hacer comparaciones directas entre
los coeficientes de la regresión debido a que la magnitud de bj
refleja las unidades de medición del regresor Xj. Por ejemplo:




 Para facilitarla visualización de residuos ante grandes
diferencias en los coeficientes, se sugiere estandarizar o
estudentizar los residuos
2 1
1000 5
ˆ
X X Y + + =
90
Escalamiento de residuos
 Residuos estandarizados
 Se obtienen dividiendo cada residuo entre la desviación
estándar de los residuos



 Después de la estandarización, los residuos tienen una
media de 0 y desviación estándar de 1

 Con más de 50 datos siguen a la distribución t, de
manera que si exceden a 1.96 (límite para alfa 0.05)
indica significancia estadística y son “outliers”

,
MSE
e
d
i
i
=
91
Escalamiento de residuos
 Residuos estudentizados
 Son similares a los residuos donde se elimina una
observación y se predice su valor, pero además se elimina la
i-ésima observación en el cálculo de la desviación estándar
usada para estandarizar la í-ésima observación

 Puede identificar observaciones que tienen una gran
influencia pero que no son detectadas por los residuos
estandarizados

 H = X (X’X)-1X’ es la matriz sombrero o “hat matriz”.
,
) 1 (
ii
i
i
h MSE
e
r
÷
=
92
Escalamiento de residuos
 El estadístico PRESS (Prediction Error Sum of Squares) es una
medida similar a la R2 en la regresión. Difiere en que se estiman
n-1 modelos de regresión.

 En cada modelo se omite una observación en la estimación del
modelo de regresión y entonces se predice el valor de la
observación omitida con el modelo estimado. El residuo iésimo
será:


 El residuo PRESS es la suma al cuadrado de los residuos
individuales e indica una medida de la capacidad de predicción



) ( ) (
ˆ
i i i
Y Y e ÷ =
| |
¿ ¿
÷ = =
=
2
) (
1
2
) (
ˆ
i i
N
i
i
Y Y e PRESS
YY
edicción
S
PRESS
R ÷ =1
2
Pr
93
Gráficas parciales de regresión
 Para mostrar el impacto de casos individuales es más efectiva la
gráfica de regresión parcial. Un caso “outlier” impacta en la
pendiente de la ecuación de regresión (y su coeficiente).

 Una comparación visual de la gráfica de regresión parcial con y
sin la observación muestra la influencia de la observación

 El coeficiente de correlación parcial es la correlación de la
variable independiente Xi la variable dependiente Y cuando se
han eliminado de ambos Xi y Y

 La correlación semiparcial refleja la correlación entre las
variables independiente y dependiente removiendo el efecto Xi
94
Matriz sombrero
 Los puntos de influencia son observaciones substancialmente
diferentes de las observaciones remanentes en una o más
variables independientes

 Contiene valores (sombrero en su diagonal) para cada
observación que representa influencia. Representa los efectos
combinados de todos las variables independientes para cada
caso
95
Matriz sombrero
 Los valores en la diagonal de la matriz sombrero miden dos
aspectos:
 Para cada observación miden la distancia de la observación
al centro de la media de todas las observaciones de las
variables independientes

 Valores altos en la diagonal indica que la observación tiene
mucho peso para la predicción del valor de la variable
dependiente, minimizando su residuo
 El rango de valores es de 0 a 1, con media p/n, p es el
número de predictores y n es el tamaño de muestra. Valores
límite se encuentran en 2p/n y 3p/n

96
Distancia de Mahalanobis
 D
2
es una medida comparable a los valores sombrero (hat
values) que considera sólo la distancia de una observación del
valor medio de las variables independientes.

 Es otra forma de identificar “outliers”

 La significancia estadística de la distancia de Malahanobis se
puede hacer a partir de tablas del texto:
 Barnett, V., Outliers in Statistical Data, 2nd. Edition, Nueva
York, Wiley, 2984
97
Influencia en coeficientes
individuales
 El impacto de eliminar una observación simple en cada
uno de los coeficientes de la regresión múltiple se muestra
con la DFBETA y su versión estandarizada SDFBETA.

 Se sugiere aplicar como límites ±1.0 o ±2 para tamaños
de muestra pequeños y ±√n para muestras medias y
grandes

 La distancia de Cook (Di) captura el impacto de una
observación:
 La dimensión del cambio en los valores pronosticados
cuando se omite la observación y la distancia de las
otras observaciones, el límite es 1 o 4/(n-k-1)
Influencia en coeficientes
individuales
 La medida COVRATIO estima el efecto de la observación
en la eficiencia del proceso, en sus errores estándar de los
coeficientes de la regresión. Considera a todos los
coeficientes colectivamente.

 El límite puede ser establecido en 1 ±3p/n, los valores
mayores al límite hacen el proceso más eficiente y los
menores más ineficiente

 La medida SDFFIT es el grado en que cambian los
valores ajustados o pronosticados cuando el caso se
elimina. El valor límite es 2*raíz((k+1)/(n-k-1))
99
Ejemplo de regresión múltiple
Solución con Excel y Minitab
100
Ejemplo de Regresión Múltiple
Cat. (US News) GMAT Salario Inicial ($) % Aceptación
Stanford 1 711 82000 7.4
Harvard 2 670 80000 12.8
Penn (Wharton) 3 662 79000 14.7
MIT (Sloan) 4 650 78000 15.1
Chicago 5 680 65000 25.0
Northwestern 6 660 70000 16.0
Columbia 7 660 83000 14.8
Dartmouth 8 670 70000 12.6
Duke 9 646 67500 20.5
Berkeley 10 653 70000 13.3
Virginia 11 660 66000 18.9
Michigan 12 645 65000 28.0
NYU 13 646 70583 20.9
Carnegie Mellon 14 640 67200 30.8
Yale 15 675 65000 23.5
U.N.C. 16 630 60000 19.8
UCLA 17 651 65000 17.5
Texas-Austin 18 630 60000 27.3
Indiana 19 630 61500 44.7
Cornell 20 637 64000 25.4
Rochester 21 630 58500 36.0
Ohio State 22 611 61000 23.2
Emory 23 626 60000 33.0
Purdue 24 603 63700 20.7
Maryland 25 640 53000 18.9
Interpretación de Resultados de Excel- Regresión Multiple
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.8749313 R Square 0.76550478
Adjusted R Square 0.732005463 Standard Error 4050.855918 Observations 25

ANOVA
df SS MS F Significance F
Regression 3 1.12E+09 374977790.1 22.851355 8.17E-07
Residual 21 3.45E+08 16409433.67
Total 24 1.47E+09

Coefficients Standard t Stat P-value Lower 95% U pper 95%
Error
Intercept 122481.40 41473.13 2.953271081 0.007589 36233.29 208729.5

X Variable1 -926.873 198.8104 -4.662094325 0.0001336 -1340.32 -513.424

X Variable2 -59.9488 60.44875 -0.991730876 0.3326192 -185.659 65.76118

X Variable3 -191.7291 125.6138 -1.526337637 0.1418472 -452.957 69.49917


Resultados de Excel- Regresión sólo con sólo X1
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.855974
R Square 0.732691
Adjusted R Square 0.721069
Standard Error 4132.688
Observations 25

ANOVA
df SS MS F Significance F

Regression 1 1.08E+09 1.08E+09 63.04264 4.88E-08
Residual 23 3.93E+08 17079107
Total 24 1.47E+09

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 79230.32 1703.951 46.49801 2.98E-24 75705.43405 82755.20595
X Variable1 -910.077 114.6201 -7.93994 4.88E-08 -1147.186411 -672.9674353




Con sólo X1, el Modelo se simplifica enormemente
poca importancia práctica se pierde en R
2
(ajustada)
La ecuación de regresión es:
y = 79230 - 910 x

“Predictor” Coef Desv. Estándar T p
Constante 79230 1704 46.50 0.000
x -910.1 114.6 -7.94 0.000

S = 4133 R
2
= 73.3% R
2
(ajustada) = 72.1%

Análisis de Variancia

Fuente DF SS MS F p
Regresión 1 1076712008 1076712008 63.04 0.000
Error 23 392819470 17079107
Total 24 1469531477
Reducción del Modelo
Vuelva a correr la regresión usando la categoría
US News, como el único agente de predicción (“predictor”)
El Modelo se simplifica enormemente..…poca
importancia práctica se pierde en R
2
(ajustada)
104
Corrida en Minitab
 Se introducen los datos en varias columnas C1 a C5
incluyendo la respuesta Y (heatflux) y las variables
predictoras X’s (North, South, East)
HeatFlux Insolation East South North
271.8 783.35 33.53 40.55 16.66
264.0 748.45 36.50 36.19 16.46
238.8 684.45 34.66 37.31 17.66
230.7 827.80 33.13 32.52 17.50
251.6 860.45 35.75 33.71 16.40
257.9 875.15 34.46 34.14 16.28
105
Corrida en Minitab
 Utilzar el archivo de ejemplo Exh_regr.mtw
 Opción: Stat > Regression > Regression
 Para regresión lineal indicar la columna de respuesta
Y (Score2) y X (Score1)

 En Regresión lienal en opciones se puede poner un
valor Xo para predecir la respuesta e intervalos. Las
gráficas se obtienen Stat > Regression > Regression
> Fitted line Plots

 Para regresión múltiple Y (heatflux) y las columnas
de los predictores (north, south, east)

106
Resultados de la regresión lineal
The regression equation is
Score2 = 1.12 + 0.218 Score1
Predictor Coef SE Coef T P
Constant 1.1177 0.1093 10.23 0.000
Score1 0.21767 0.01740 12.51 0.000
S = 0.1274 R-Sq = 95.7% R-Sq(adj) = 95.1%
Analysis of Variance
Source DF SS MS F P
Regression 1 2.5419 2.5419 156.56 0.000
Residual Error 7 0.1136 0.0162
Total 8 2.6556
Predicted Values for New Observations
New Obs Fit SE Fit 95.0% CI 95.0% PI
1 2.6414 0.0474 ( 2.5292, 2.7536) ( 2.3197, 2.9631)
New Obs Score1
1 7.00
107
Resultados de la regresión lineal
9 8 7 6 5 4 3 2
3.5
2.5
1.5
Score1
S
c
o
r
e
2
S = 0.127419 R-Sq = 95.7 % R-Sq(adj) = 95.1 %
Score2 = 1.11771 + 0.217670 Score1
95% PI
95% CI
Regression
Regression Plot
108
Resultados de la regresión Múltiple
The regression equation is
HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East
Predictor Coef SE Coef T P
Constant 389.17 66.09 5.89 0.000
North -24.132 1.869 -12.92 0.000
South 5.3185 0.9629 5.52 0.000
East 2.125 1.214 1.75 0.092
S = 8.598 R-Sq = 87.4% R-Sq(adj) = 85.9%
Analysis of Variance
Source DF SS MS F P
Regression 3 12833.9 4278.0 57.87 0.000
Residual Error 25 1848.1 73.9
Total 28 14681.9
Source DF Seq SS
North 1 10578.7
South 1 2028.9
East 1 226.3
109
• La regresión sólo puede utilizarse con información de variables
continuas.

• Los residuos deben distribuirse normalmente con media cero.

• Importancia práctica: (R
2
). Importancia estadística: (valores p)

• La regresión puede usarse con un “predictor” X o más,
para una respuesta dada

• Reduzca el modelo de regresión cuando sea posible,
sin perder mucha importancia práctica
Resumen de la Regresión
110
VI.A.4 Herramientas
multivariadas
111
Herramientas multivariadas
1. Introducción

2. Análisis de componentes principales

3. Análisis factorial

4. Análisis discriminante

5. MANOVA
112
Introducción
 En el análisis multivariado se incluyen dos o más
variables dependientes Y1, Y2, etc. Consideradas
simultáneamente para las variables independientes
X1, X2, …., Xn

 Normalmente se resuelven con herramientas
computacionales tales como Minitab y SPSS.

 Entre las herramientas principales se encuentran:
 Componentes principales, análisis factorial, análisis
discriminante, análisis de conglomerados, análisis
canónico, MANOVA
113
Análisis de componentes principales
 El análisis (PCA) y el análisis factorial (FA) se usan
para encontrar patrones de correlación entre muchas
variables posibles y subconjuntos de datos

 Busca reducirlas a un menor número de
componentes o factores que representen la mayor
parte de la varianza.

 Normalmente se requieren al menos cinco
observaciones por variable

114
Análisis de componentes principales
 Pasos de análisis en Minitab
 Se usa una matriz de correlación para determinar la
relación entre componentes
 Las matrices definen cantidades como eigenvalores y
eigenvectores
 Se suman los eigenvalores y se calculan las
proporciones de cada componente
 Se identifican los PC1, PC2, … que explican la mayor
parte de la varianza
 Se puede hacer un diagrama de Pareto como apoyo

115
Ejemplo: Alimentos en Europa
País RMEAT WMEAT EGGS MILK FISH CERL STARCH NUTS FR-VEG
1 10.1 1.4 0.5 8.9 0.2 42.3 0.6 5.5 1.7
2 8.9 14 4.3 19.9 2.1 28 3.6 1.3 4.3
3 13.5 9.3 4.1 17.5 4.5 26.6 5.7 2.1 4
4 7.8 6 1.6 8.3 1.2 56.7 1.1 3.7 4.2
5 9.7 11.4 2.8 12.5 2 34.3 5 1.1 4
6 10.6 10.8 3.7 25 9.9 21.9 4.8 0.7 2.4
7 8.4 11.6 3.7 11.1 5.4 24.6 6.5 0.8 3.6
8 9.5 4.9 2.7 33.7 5.8 26.3 5.1 1 1.4
9 18 9.9 3.3 19.5 5.7 28.1 4.8 2.4 6.5
10 10.2 3 2.8 17.6 5.9 41.7 2.2 7.8 6.5
11 5.3 12.4 2.9 9.7 0.3 40.1 4 5.4 4.2
12 13.9 10 4.7 25.8 2.2 24 6.2 1.6 2.9
13 9 5.1 2.9 13.7 3.4 36.8 2.1 4.3 6.7
14 9.5 13.6 3.6 23.4 2.5 22.4 4.2 1.8 3.7
15 9.4 4.7 2.7 23.3 9.7 23 4.6 1.6 2.7
16 6.9 10.2 2.7 19.3 3 36.1 5.9 2 6.6
17 6.2 3.7 1.1 4.9 14.2 27 5.9 4.7 7.9
18 6.2 6.3 1.5 11.1 1 49.6 3.1 5.3 2.8
19 7.1 3.4 3.1 8.6 7 29.2 5.7 5.9 7.2
20 9.9 7.8 3.5 24.7 7.5 19.5 3.7 1.4 2
21 13.1 10.1 3.1 23.8 2.3 25.6 2.8 2.4 4.9
22 17.4 5.7 4.7 20.6 4.3 24.3 4.7 3.4 3.3
23 9.3 4.6 2.1 16.6 3 43.6 6.4 3.4 2.9
24 11.4 12.5 4.1 18.8 3.4 18.6 5.2 1.5 3.8
25 4.4 5 1.2 9.5 0.6 55.9 3 5.7 3.2

X1 X2 X3 X4 X5 X6 X7 X8 X9
116
Corrida en Minitab
2 Stat > Multivariate > Principal components
3 En Variables, X1, X2, X3, X4, X6, X7, X8, X9

4 En Number of factors to extract, 3. Seleccionar
Correlation Matrix
5 Click Graphs y seleccionar Scree Plot, Score plot for first
2 components Loading plot for first 2 components

8 Click Storage e indicar las columnas donde se guarden los
coeficientes y los valores Z (scores) Coef1 Coef 2 y Z1 Z2
9. Click OK en cada uno de los cuadros de diálogo
117
Ejemplo: Alimentos en Europa

Component Number
E
i
g
e
n
v
a
l
u
e
9 8 7 6 5 4 3 2 1
4
3
2
1
0
Scree Plot of RMEAT, ..., FR-VEG

First Component
S
e
c
o
n
d

C
o
m
p
o
n
e
n
t
0.4 0.3 0.2 0.1 0.0 -0.1 -0.2 -0.3 -0.4 -0.5
0.2
0.1
0.0
-0.1
-0.2
-0.3
-0.4
-0.5
-0.6
-0.7
FR-VEG
NUTS
STARCH
CERL
FISH
MILK
EGGS
WMEAT
RMEAT
Loading Plot of RMEAT, ..., FR-VEG
Dos componentes exceden
El eigenvalor de ref. de 1
118
Ejemplo: Alimentos en Europa

Se tiene la gráfica siguiente de países:
Europa occidental Europa oriental Balcanes
Z1
Z
2
4 3 2 1 0 -1 -2 -3
2
1
0
-1
-2
-3
-4
-5
25
24
23 22
21
20
19
18
17
16
15
14
13
12 11
10
9
8
7
6
5
4
3
2
1
Scatterplot of Z2 vs Z1

Península ibérica


119
Análisis factorial
 Es una técnica de reducción de variables para
identificar factores que expliquen la variación,
aunque se reiere un juicio subjetivo.

 Las variables de salida están relacionadas
linealmente con las variables de entrada.

 Las variables deben ser medibles y simétricas. Debe
haber cuatro o más factores de entrada para cada
variable independiente

120
Análisis factorial
 Se especifican un cierto número de factores comunes

 El análisis factorial se hace en dos etapas:
 Extracción de factores, para identificar los factores
principales para un estudio posterior
 Rotación de factores, para hacerlos más significativos

121
Corrida con Minitab
2 Stat > Multivariate > Factor Analysis.
3 En Variables, X1, X2, X3, X4, X6, X7, X8, X9
4 En Number of factors to extract, 4.
En Method of Extraction, seleccionar Principal components
6 En Type of Rotation, seleccionar Varimax.
7 Click Graphs y seleccionar Loading plot for first 2 factors
y Scree Plot.
Click Results y seleccionar Sort loadings.
Seleccionar Storage e indicar columnas para ponderaciones,
coeficientes, Z’s, eigenvalores, etc.
Click OK en cada uno de los cuadros de d
122
Ejemplo

First Factor
S
e
c
o
n
d

F
a
c
t
o
r
1.00 0.75 0.50 0.25 0.00 -0.25 -0.50
0.50
0.25
0.00
-0.25
-0.50
-0.75
-1.00
FR-VEG
NUTS
STARCH
CERL
FISH
MILK
EGGS
WMEAT
RMEAT
Loading Plot of RMEAT, ..., FR-VEG
Rotated Factor Loadings and Communalities
Varimax Rotation

Variable Factor1 Factor2 Factor3 Factor4 Communality
X1 RMEAT 0.051 -0.931 0.014 0.037 0.871
X2 WMEAT 0.943 -0.127 -0.100 0.050 0.918
X3 EGGS 0.628 -0.664 0.163 0.020 0.862
X4 MILK 0.197 -0.610 0.219 0.579 0.795
X5 FISH -0.226 -0.088 0.921 -0.104 0.919
X6 CERL -0.395 0.549 -0.624 -0.145 0.867
X7 STARCH 0.515 -0.004 0.683 -0.026 0.732
X8 NUTS -0.638 0.263 -0.326 -0.515 0.849
X9 FR-VEG -0.010 0.003 0.178 -0.937 0.910

Variance 2.2054 2.0749 1.9273 1.5165 7.7240
% Var 0.245 0.231 0.214 0.168 0.858
123
Ejemplo:

Z1
Z
2
2 1 0 -1 -2
2
1
0
-1
-2
Yugoslavia
Alemania Occ
Rusia
Reino Unido
Suiza
Suecia
España
Rumania
Portugal
Polonia
Noruega
Holanda
Italia
Irlanda
Hungría
Grecia
Francia
Finlandia
Alemania orien
Dinamarca
Checa
Bulgaria
Bélgica
Autria
Albania
Scatterplot of Z2 vs Z1

124
Análisis discriminante
 Si se tiene una muestra con grupos conocidos, el
análisis discriminante clasifica las observaciones o
atributos en dos o más grupos

 Puede utilizarse como herramienta predictiva o
descriptiva

 Las variables deben ser multivariadamente normales,
con la misma varianza y covarianza poblacional entre
variables dependientes, y las muestras exhiben
independencia
125
Ejemplo de actividades en países
No
Grupo
Ciudad Agr Min Man Ps Con Ser Fin Sps Tc
1
1
Bélgica 3.3 0.9 27.6 0.9 8.2 19.1 6.2 26.6 7.2
2
1
Dinamarca 9.2 0.1 21.8 0.6 8.3 14.6 6.5 32.2 7.1
3
1
Francia 10.8 0.8 27.5 0.9 8.9 16.8 6.0 22.6 5.7
4
1
Alemania Occ. 6.7 1.3 35.8 0.9 7.3 14.4 5.0 22.3 6.1
5
1
Irlanda 23.2 1.0 20.7 1.3 7.5 16.8 2.8 20.8 6.1
6
1
Italia 15.9 0.6 27.6 0.5 10.0 18.1 1.6 20.1 5.7
7
1
Luxenburgo 7.7 3.1 30.8 0.8 9.2 18.5 4.6 19.2 6.2
8
1
Holanda 6.3 0.1 22.5 1.0 9.9 18.0 6.8 28.5 6.8
9
1
Inglaterra 2.7 1.4 30.2 1.4 6.9 16.9 5.7 28.3 6.4
10
1
Austria 12.7 1.1 30.2 1.4 9.0 16.8 4.9 16.8 7.0
11
1
Finlandia 13.0 0.4 25.9 1.3 7.4 14.7 5.5 24.3 7.6
12
2
Grecia 41.4 0.6 17.6 0.6 8.1 11.5 2.4 11.0 6.7
13
1
Noruega 9.0 0.5 22.4 0.8 8.6 16.9 4.7 27.6 9.4
14
2
Portugal 27.8 0.3 24.5 0.6 8.4 13.3 2.7 16.7 5.7
15
2
España 22.9 0.8 28.5 0.7 11.5 9.7 8.5 11.8 5.5
16
1
Suecia 6.1 0.4 25.9 0.8 7.2 14.4 6.0 32.4 6.8
17
1
Suiza 7.7 0.2 37.8 0.8 9.5 17.5 5.3 15.4 5.7
18
2
Turquía 66.8 0.7 7.9 0.1 2.8 5.2 1.1 11.9 3.2
19
3
Bulgaria 23.6 1.9 32.3 0.6 7.9 8.0 0.7 18.2 6.7
20
3
Checa 16.5 2.9 35.5 1.2 8.7 9.2 0.9 17.9 7.0
21
3
Alemania Ori. 4.2 2.9 41.2 1.3 7.6 11.2 1.2 22.1 8.4
22
3
Hungría 21.7 3.1 29.6 1.9 8.2 9.4 0.9 17.2 8.0
23
3
Polonia 31.1 2.5 25.7 0.9 8.4 7.5 0.9 16.1 6.9
24
3
Rumania 34.7 2.1 30.1 0.6 8.7 5.9 1.3 11.7 5.0
25
3
Rusia 23.7 1.4 25.8 0.6 9.2 6.1 0.5 23.6 9.3
26
3
Yugoslavia 48.7 1.5 16.8 1.1 4.9 6.4 11.3 5.3 4.0

126
Corrida con Minitab
2 Stat > Multivariate > Discriminant Analysis.

3 En Groups, poner SalmonOrigin.

4 En Predictors, poner Freshwater Marine. Click OK.
127
Corrida con Minitab

Canonical Discri minant Functions
Function 1
6 4 2 0 -2 -4 -6
F
u
n
c
t
i
o
n

2
3
2
1
0
-1
-2
-3
-4
GRUPO
Group Centroids
3
2
1
3
2
1
128
Análisis de conglomerados
129
Análisis de conglomerados
 Se usa para determinar agrupaciones o
clasificaciones de un conjunto de datos

 Las personas se pueden agrupar por IQ, padres,
hábitos de estudio, etc.

 Se trata de dar sentido a grandes cantidades de
datos de cuestionarios, ecnuestas, etc.
130
Ejemplo
 Suponer que un estudio de
mercado trata de determinar
segmentos de mercado en
base a los patrones de
lealtad de marcas (V1) y
tiendas (V2), medidas del 0
al 10 en 7 personas (A-G).
Variables V1 V2
A 3 2
B 4 5
C 4 7
D 2 7
E 6 6
F 7 7
G 6 4
131
Corrida en Minitab
 Stat > Multivariate Análisis > Cluster Observations
 Distance Measured Euclidean Seleccionar Show
Dendogram OK

Observations
D
i
s
t
a
n
c
e
7 6 5 4 3 2 1
3.16
2.11
1.05
0.00
Dendrogram with Single Linkage and Euclidean Distance
132
Análisis de correlación canónico
 Prueba la hipótesis de que los efectos pueden tener
causas múltiples y de que las causas pueden tener
efectos múltiples (Hotelling 1935)

 Es como una regresión múltiple para determinar la
correlación entre dos conjuntos de combinaciones
lieneales, cada conjunto puede tener varias variables
relacionadas.
 La relación de un conjunto de variables dependientes
a un conjunto de variables independientes forma
combinaciones lineales
133
Análisis de correlación canónico
 Se usan los más altos valores de correlación para los
conjuntos. Los pares de combinaciones lineales se
denominan variates canónicas con correlaciones
canónicas (Rc con valor mayor a 0.3)

 Por ejemplo se quiere determinar si hay una
correlación entre las características de un ingeniero
industrial y las habilidades requeridas en la
descripción de puesto del mismo ingeniero.
134
MANOVA
(Análisis de varianza múltiple)
 Es un modelo para analizar la relación entre una o
más variables independientes y dos o más variables
dependientes

 Prueba si hay diferencias significativas en las medias
de grupos de una combinanción de respuestas Y.

 Los datos deben ser normales, con covarianza
homogenea y observaciones independientes
135
MANOVA
(Análisis de varianza múltiple)
136
Diferencias de ANOVA y MANOVA
137
Ejemplo:
Extrusión de película plástica
 Se realiza un estudio para determinar las condiciones
óptimas para extruir película plástica.

 Se miden tres respuestas – Tear, gloss y opacity –
cinco veces en cada combinación de dos factores –
tasa de extrusión y cantidad de aditivo – cada grupo
se pone en niveles bajos y altos.

 Se utiliza el MANOVA balanceado para probar la
igualdad de las medias.
138
Ejemplo:
Extrusión de película plástica
Tear Gloss Opacity Extrusión Additive
6.5 9.5 4.4 1 1
6.2 9.9 6.4 1 1
5.8 9.6 3 1 1
6.5 9.6 4.1 1 1
6.5 9.2 0.8 1 1
6.9 9.1 5.7 1 2
7.2 10 2 1 2
6.9 9.9 3.9 1 2
6.1 9.5 1.9 1 2
6.3 9.4 5.7 1 2
6.7 9.1 2.8 2 1
6.6 9.3 4.1 2 1
7.2 8.3 3.8 2 1
7.1 8.4 1.6 2 1
6.8 8.5 3.4 2 1
7.1 9.2 8.4 2 2
7 8.8 5.2 2 2
7.2 9.7 6.9 2 2
7.5 10.1 2.7 2 2
7.6 9.2 1.9 2 2

139
Ejemplo:
Extrusión de película plástica
1 Abrir el archivo EXH_MVAR.MTW.
2 Seleccionar Stat > ANOVA > Balanced
MANOVA.
3 En Responses, poner Tear Gloss Opacity.
4 En Model, poner Extrusion | Additive.
5 Click Results. En Display of Results, seleccionar
Matrices (hypothesis, error, partial
correlations) y Eigen analysis.
6 Click OK en cada cuadro de diálogo.
140
Ejemplo
Criterion Statistic F Num Denom P
Wilks' 0.38186 7.554 3 14 0.003
SSCP Matrix for Extrusion
Tear Gloss Opacity
Tear 1.740 -1.505 0.8555
Gloss -1.505 1.301 -0.7395
Opacity 0.855 -0.739 0.4205
SSCP Matrix for Error
Tear Gloss Opacity
Tear 1.764 0.0200 -3.070
Gloss 0.020 2.6280 -0.552
Opacity -3.070 -0.5520 64.924
Partial Correlations for the Error SSCP Matrix
Eigenvector 1 2 3
Tear 0.6541 0.4315 0.0604
Gloss -0.3385 0.5163 0.0012
Opacity 0.0359 0.0302 -0.1209
141
Ejemplo:
Extrusión de película plástica
Las matrices SSCP evalúan la contribución a la
variabilidad de manera similar a la suma de
cuadrados en la ANOVA univariada.

Las correlaciones parciales entre Tear y Gloss son
pequeñas. Como la estructura de las correlaciones es
débil, se pueden realizar análisis univariados de
ANOVA para cada una de las respuestas.
142
VI.A.4 Estudios Multivari
143
Estudios Multivari
 La carta multivari permite analizar la variación dentro
de la pieza, de pieza a pieza o de tiempo en tiempo

 Permite investigar la estabilidad de un proceso
consiste de líneas verticales u otro esquema en
función del tiempo. La longitud de la línea o del
esquema representa el rango de valores encontrados
en cada conjunto de muestras
144
Estudios Multivari
 La variación dentro de las muestras (cinco puntos en
cada línea). La variación de muestra a muestra como
posición vertical de las líneas.
E
S
P
E
S
O
R
Número de subgrupo
145
Estudios Multivari
 Ejemplo de parte metálica
Centro más grueso
146
Estudios Multivari
 Procedimiento de muestreo:
 Seleccionar el proceso y la característica a
investigar

 Seleccionar tamaño de muestra y frecuencia de
muestreo

 Registrar en una hoja la hora y valores para
conjunto de partes
147
Estudios Multivari
 Procedimiento de muestreo:
 Realizar la carta Multivari
 Unir los valores observados con una línea

 Analizar la carta para variación dentro de la parte,
de parte a parte y sobre el tiempo

 Puede ser necesario realizar estudios adicionales
alrededor del área de máxima variación aparente
 Después de la acción de mejora comprobar con
otro estudio Multivari
148
 Su propósito fundamental es reducir el gran número de
causas posibles de variación, a un conjunto pequeño de
causas que realmente influyen en la variabilidad.

 Sirven para identificar el patrón principal de variación de
entre tres patrones principales:

 Temporal: Variación de hora a hora; turno a
turno; día a día; semana a semana; etc.

 Cíclico: Variación entre unidades de un mismo
proceso; variación entre grupos de unidades;
variación de lote a lote.
Cartas Multivari
149
 Posicional:
 Variaciones dentro de una misma unidad (ejemplo:
porosidad en un molde de metal) o a través de una sola
unidad con múltiples partes (circuito impreso).

 Variaciones por la localización dentro de un proceso que
produce múltiples unidades al mismo tiempo. Por
ejemplo las diferentes cavidades de un molde

 Variaciones de máquina a máquina; operador a
operador; ó planta a planta
Cartas Multivari
150
 Ejemplo: Se toman 3 a 5 unidades consecutivas, repitiendo el
proceso tres o más veces a cierto intervalo de tiempo, hasta que al
menos el 80% de la variación en el proceso se ha capturado.



A


1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIÓN POSICIONAL DENTRO DE LA UNIDAD
Cartas Multivari
151
 Ejemplo: (cont...)


B


1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIÓN CÍCLICA DE UNIDAD A UNIDAD
Cartas Multivari
152
 Ejemplo: (cont...)


C


1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIÓN TEMPORAL DE TIEMPO A TIEMPO
Cartas Multivari
153
 Ejemplo: Un proceso produce flecha cilíndricas, con
un diámetro especificado de 0.0250” ± 0.001”.

 Sin embargo un estudio de capacidad muestra un Cp
= 0.8 y una dispersión natural de 0.0025” (6 o )
contra la permitida de 0.0002”.

 Se tiene pensado comprar un torno nuevo de
US$70,000 para tolerancia de ± 0.0008”, i.e. Cpk =
1.25. Se sugirió un estudio Multi Vari previo.
Cartas Multivari
154
 Se tomaron cuatro lecturas en cada flecha, dos a
cada lado. Estas muestran una disminución gradual
desde el lado izquierdo al lado derecho de las
flechas, además de excentricidad en cada lado de la
flecha.

 La variación cíclica, de una flecha a la siguiente, se
muestra mediante las líneas que concentran las
cuatro lecturas de cada flecha.

 También se muestra la variación temporal.

Cartas Multivari
155
.0.2510”


0.2500”


0.2490”
Cartas Multivari
Máximo
Mínimo
Izquierda
Derecha
8 AM 9 AM 10 AM 11 AM 12 AM
156
 Un análisis rápido revela que la mayor variación es temporal
con un cambio mayor entre las 10 AM y las 11 AM.

 A las 10 AM se para el equipo para el almuerzo y se arranca a
las 11 AM, con lecturas similares a las de las 8 AM. Conforme
pasa el tiempo las lecturas tienden a decrecer más y más, hasta
que se invierten a las 10 A.M. en forma drástica.

 Se investigó y se encontró que la temperatura tenía influencia
en la variación.

 La variación en temperatura era causada por que la cantidad de
refrigerante no era la adecuada, lo cual se notaba más cuando
se paraba el equipo y se volvía a arrancar. Se adicionó,
reduciendo la variación en 50% aproximadamente..

Cartas Multivari
157
 También se encontró que el acabado cónico era causado por
que la herramienta de corte estaba mal alineada. Se ajustó,
contribuyendo a otra reducción del 10% de la variabilidad.

 La excentricidad de las flechas se corrigió al cambiar un
rodamiento excéntrico por desgaste en el torno. Se instaló un
nuevo rodamiento eliminándose otro 30% de la variabilidad.

 La tabla siguiente muestra un resumen de los resultados.
Cartas Multivari
158
Tipo de % var. Causas de Acción % de variación
Variación Total Variación Correctiva Reducida
Temporal 50 Bajo nivel de Adicionar Casi 50
Tiempo a tiempo Refrigerante refrigerante
Dentro de 10 Ajuste no Ajuste de la Casi 10
la flecha no paralelo herramienta de
corte
Dentro de 30 Rodamiento Nuevo Casi 30
la flecha gastado rodamiento

Flecha a 5 -??? - -
flecha
Cartas Multivari
159
 Resultados:
 La variación total en la siguiente corrida de producción se
redujo de 0.0025” a 0.0004”

 El nuevo Cp fue de 0.002 / 0.0004 = 5.0

 Como beneficios se redujo a cero el desperdicio y no hubo
necesidad de adquirir una nueva máquina.

 Se observa que antes de cambiar equipo o máquinas, es
conveniente realizar un estudio de variabilidad para
identificar las fuentes de variación y tratar de eliminarlas.

Cartas Multivari
160
Variación de
sist. medición
Variación
de
proceso
Pieza a
pieza
Lote a lote
Dentro de
la pieza
Máquina a
máquina
Turno a
turno
Tiempo a
tiempo
Diámetro de Flecha
(0.150" +/- .002)
Programa Máquina
Accesorios
Operador a
operador
Ejemplo: Búsqueda de fuentes de variación con el diagrama sistemático.

Cartas Multivari
161
Ejemplo (cont..):
• Al realizar la prueba de homogeneidad de varianza F, se
encontró que había una diferencia significante entre los
operadores.

Se Rechaza Ho: o
2
Oper1
= o
2
Oper2
= o
2
Oper3
• Para probar si existe diferencia significativa entre
medias de operadores se hacen las siguientes
comparaciones
Ho: µ
Oper1
= µ
Oper2
Ho: µ
Oper1
= µ
Oper3
Ho: µ
Oper2
= µ
Oper3
Ha: µ
Oper1

Oper2
= µ
Oper3
Cartas Multivari
162
Corrida en Minitab
 Se introducen los datos en varias columnas C1 a C3
incluyendo la respuesta (strenght) y los factores
(time y Metal)
SinterTime MetalType Strength
0.5 15 23
0.5 15 20
0.5 15 21
0.5 18 22
0.5 18 19
0.5 18 20
0.5 21 19
0.5 21 18
163
Corrida en Minitab
 Utilizar el achivo de ejemplo Sinter.mtw

 Opción: Stat > Quality Tools > Multivari charts

 Indicar la columna de respuesta y las columnas de
los factores

 En opciones se puede poner un título y conectar las
líneas

164
Resultados
21 18 15
23.5
22.5
21.5
20.5
19.5
18.5
17.5
MetalType
S
t
r
e
n
g
t
h
0.5
1.0
2.0
Multi-Vari Chart for Strength by SinterTime - MetalType
SinterTime
165
VI.A.5 Análisis de datos
por atributos
166
Análisis de datos por atributos
 Si los CTQ’s son variables continuas, se usa la
regresión, dependiendo de la naturaleza de la
característica crítica para el cliente (CTS’s) como éste
la expresa:

CTS HERRAMIENTA
Nominal (Verde, Rojo, azul) Regresión Logística Nominal
Atributo (Pasa/No pasa) Regresión Logística Binaria
Ordinal (1, 2, 3, 4, 5) Regresión Logística Ordinal

167
Análisis de datos por atributos
 El análisis de datos por atributos se organiza en
valores, categorías o grupos dicotómicos

 Las decisiones incluyen: si / no, pasa / no pasa,
bueno / malo, pobre/justo/bueno/superior/excelente,
etc.

 Entre los modelos no lineales de regresión usados se
tienen: regresión logística, regresión logit y regresión
probit
168
Análisis de datos por atributos
 Regresión logística
 Relaciona variables independientes categóricas a una
variable dependiente (Y). Minitab incluye los modelos
binario, ordinal y nominal

 Regresión logit
 Es subconjunto del modelo log-lineal. Tiene solo una
variable dependiente, usa determinaciones de
probabilidad o tasa de probabilidad
169
Análisis de datos por atributos
 Regresión probit
 Es similar a la prueba de vida acelerada, la unidad se
somete a esfuerzo con la respuesta pasa/falla, bueno o
malo. Es una respuesta binaria en un tiempo de falla
futuro


170
Regresión logística o binaria
• En caso de información cualitativa es necesario
traducir las preferencias del cliente expresadas como
atributos a un intervalo de valores aceptables de
variables (Especificaciones).

171
Regresión logística o binaria
 Es similar a la regresión múltiple excepto que la
respuesta es binaria (si/no, bueno/malo, etc.) Sus
coeficientes se determinan por el método de máxima
verosimilitud

 Su función tiene forma de “S”, con valores máximos
de Cero y Uno.

Yi = 0, 1
172
Regresión logística o binaria
 La probabilidad de que el resultado esté en cierta
categoría es:



 El método de cálculo del coeficiente b es diferente
que en la regresión lineal

 Los coeficientes se determinan con la relación sig.:

n n
B
X B X B X B e
evento no P
evento P
+ + + + = ....
) (
) (
2 2 1 1
0
173
Regresión logística
 Condiciones:
 Hay solo dos resultados posibles
 Hay solo un resultado por evento
 Los resultados son independientes estadísticamente
 Todos los predictores relevantes están en el modelo
 Es mutuamente exclusivo y colectivamente exhaustivo
 Los tamaños de muestra son mayores que para la
regresión múltiple

 Los efectos positivos se obtienen con b1>1 y los
negativos con b1 e 0 a 1
174
Regresión logística

Relación con ajuste pobre





Relación con buen ajuste
175
Regresión logística - Procedimiento
 Definir el atributo a “traducir” (“y”)
 Definir la variable apropiada para el atributo (“x”)
 Definir el modelo matemático a probar
 Determinar los defectos que está dispuesto a
aceptar
 Recolecte información de “x” vs “y”. Asigne 1 si falla
y 0 si es aceptable.
 Analice la información mediante Regresión Logística
Binaria

176
Regresión logística- Procedimiento
177
Regresión logística - Procedimiento






 Observe el P-Value de “Deviance” en la Sesión, debe
de ser grande (P >0.10)
 Obtenga los coeficientes del modelo (De la Sesión)
Coeficientes del modelo
P-Value de Deviance
178
Regresión logística - Procedimiento
• Construya el modelo de regresión para la
probabilidad de falla estará dado por :




• Identifique el(los) valor(es) de “x” que le generarán
como máximo la cantidad de defectos que usted
está dispuesto a aceptar [4]


Donde :
b
0
, b
1
, ... = Coeficientes del modelo
P(Falla) =
b
0
+b
1
x
1
+....
e
1 + e
b
0
+b
1
x
1
+....
179
Ejemplo de riesgo de paro cardiaco
Logistic Regression Table
Odds 95% CI
Predictor Coef SE Coef Z P Ratio Lower Upper
Constant -1.98717 1.67930 -1.18 0.237
Fuma
Si -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90
Peso 0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05







 Para Fuma, el coeficiente negativo de -1.193 y la tasa de
posibilidades de 0.30, indica que quien fuma, tiende a tener una
tasa de pulso más alta que los sujetos que no fuman. Si los
sujetos tienen el mismo peso, las posibilidades de que los
fumadores tengan un pulso bajo sea sólo del 30% de las
posibilidades de que los no fumadores tengan un pulso bajo.

180
Regresión logística ordinal
• Cuando la respuesta ó CTS es de tipo ordinal (Varias
categorías de respuesta como “totalmente de
acuerdo”, “de acuerdo”, “en desacuerdo” y
“totalmente en desacuerdo”) y el Factor ó CTQ es de
naturaleza continua, entonces, para definir
Especificaciones, la herramienta a utilizar es la
Regresión Logística Ordinal.

181
Regresión logística ordinal -
Procedimiento
 Defina la variable de respuesta a “traducir” (“y” ó
CTS)
 Defina el CTQ (“x”) ó variable a relacionar con el
CTS
 Defina el modelo matemático a probar
 Determine los defectos que está dispuesto a aceptar
en la categoría de interés
 Recolecte información de “x” vs “y”
 Analice la información mediante Regresión Logística
Ordinal
182
Regresión logística ordinal -
Procedimiento
 Stat > Regression > Ordinal Logistic Regression
 Seleccione la respuesta (“y”)
 Seleccione los términos que estima tiene el modelo
[3]

Constantes y
Coeficientes
del modelo
183
Regresión logística ordinal -
Procedimiento
 Observe el P-Value de “Deviance” en la Sesión, debe
de ser grande (P >0.10)

 Obtenga las constantes y coeficientes del modelo
(De la Sesión)

 Construya los modelos de regresión para la
probabilidad acumulada por categoría
184
Regresión logística ordinal -
Procedimiento
e
1 + e
Donde :
K
i
= Constante de la categoría i
b
1
, b
2
, ... = Coeficientes del modelo
acumulada
hasta categoría
i
K
i
+b
1
x
1
+ b
2
x
2
....
K
i
+b
1
x
1
+ b
2
x
2
....
=
P
Constantes y
Coeficientes
del modelo
• Identifique el(los) valor(es) de “x” que le generarán como máximo la
cantidad de defectos que usted está dispuesto a aceptar en la
categoría de interés [4]
185
Regresión logística ordinal -
Procedimiento
 Una vez que se tienen establecidos los CTQs con los
que se medirá el desempeño del producto, es
necesario indicar las Especificaciones de los mismos
Producto
(General)
Usuarios
Finales
Clientes
E
x
p
e
c
t
a
t
i
v
a
s

(
C
T
S

s
)

T
i
p
o

I
m
p
o
r
t
a
n
.

Producto
(Específico)
P
a
r
á
m
e
t
r
o
s


d
e

D
i
s
e
ñ
o

(
D
P
s
)

M
a
t
r
i
z

d
e

D
i
s
e
ñ
o

C
T
Q
s

Especificaciones
LIE LSE Otra
186
Análisis Logit
 Usa razones para determinar que tanta posibilidad
tiene una observación de pernecer a un grupo que a
otro.
 Una posibilidad de 0.8 de estar en el grupo A se
puede expresar como una tasa de posibilidades de
4:1 ( que es p/(1-p)), cuyo logaritmo es el logit.


 La probabilidad para un valor L está dado por la
ecuación
187
Análisis Logit - ejemplo
50 estudiantes tomaron un examen, donde solo 27 pasaron.
¿Cuáles son las posibilidades de pasar?
Posibilidades = P/(1-P) = 0.54/0.46 = 1.17 o 1.71:1

Un estudiante que estudia 80 horas tiene un 54.5% de pasar,
¿cuáles son las posibilidades?
Posibilidades = 0.545/(1-0.545) = 1.198 o 1.198:1

Logit = ln(p/(1-p)) = ln(1.189) = 0.1809 y despejando al
Exp(b1) = exp(0.1082) = 1.11 que es la tasa de pasar a otro nivel

188
Análisis Probit
 Es similar a las pruebas de vida acelerada y análisis
de sobrevivencia. Un artículo sujeto a esfuerzo puede
fallar o sobrevivir. El modelo probit tiene un valor
esperado de 0 y una varianza de 1.

 Requiere tamaños de muestra muy grandes para
diferenciarse del modelo logit


 Los coeficientes b del modelo logit difieren del probit
en 1.814 con: bl = -1.1814 bp
189
VI.B Pruebas de hipótesis
190
VI.B Pruebas de hipótesis
1. Conceptos fundamentales
2. Estimación puntual y por intervalo
3. Pruebas para medias, varianzas y proporciones
4. Pruebas comparativas para varianzas, medias y prop.

5. Bondad de ajustes
6. Análisis de varianza (ANOVA)
7. Tablas de contingencia
8. Pruebas no paramétricas

191
VI.B.1 Conceptos
fundamentales
192
Análisis Estadístico
En CADA prueba estadística, se comparan algunos valores
observados a algunos esperados u otro valor observado
comparando estimaciones de parámetros (media, desviación
estándar, varianza)

Estas estimaciones de los VERDADEROS parámetros son obtenidos
usando una muestra de datos y calculando los ESTADÏSTICOS...

La capacidad para detectar un diferencia entre lo que es
observado y lo que es esperado depende del desarrollo de la
muestra de datos

Incrementando el tamaño de la muestra mejora la estimación y tu
confianza en las conclusiones estadísticas.
193
Conceptos fundamentales
 Hipótesis nula Ho
 Es la hipótesis o afirmación a ser probada
 Puede ser por ejemplo µ, µ, o, t= 5
 Sólo puede ser rechazada o no rechazada

 Hipótesis alterna Ha
 Es la hipótesis que se acepta como verdadera cuando se
rechaza Ho, es su complemento
 Puede ser por ejemplo µ = 5 para prueba de dos colas
 µ < 5 para prueba de cola izquierda
 µ > 5 para prueba de cola derecha
 Esta hipótesis se acepta cuando se rechaza Ho

194
Conceptos fundamentales
 Ejemplos:
 Se está investigando si una semilla modificada
proporciona una mayor rendimiento por hectárea, la
hipótesis nula de dos colas asumirá que los
rendimientos no cambian Ho: Ya = Yb

 Se trata de probar si el promedio del proceso A es
mayor que el promedio del proceso B. La hipótesis
nula de cola derecha establecerá que el proceso A es
<= Proceso B. O sea Ho: A <= B.
195
Conceptos fundamentales
 Estadístico de prueba
 Para probar la hipótesis nula se calcula un estadístico
de prueba con la información de la muestra el cual se
compara a un valor crítico apropiado. De esta forma se
toma una decisión sobre rechazar o no rechazar la Ho

 Error tipo I (alfa = nivel de significancia, normal=.05)
 Se comete al rechazar la Ho cuando en realidad es
verdadera. También se denomina riesgo del productor

 Error tipo II (beta )
 Se comete cuando no se rechaza la hipótesis nula
siendo en realidad falsa. Es el riesgo del consumidor

196
Conceptos fundamentales
 Tipos de errores
 Se asume que un valor pequeño para o es deseable, sin
embargo esto incrementa el riesgo |.
 Para un mismo tamaño de muestra n ambos varían
inversamente
 Incrementando el tamaño de muestra se pueden reducir ambos
riesgos.
Decisión realizada Ho en realidad es
Verdadera
Ho en realidad es
falsa
No hay evidencia para
rechazar Ho
p = 1-o
Decisión correcta
p = |
Error tipo II
Rechazar Ho p = o
Error tipo I
p = 1 - |
Decisión correcta
197
Conceptos fundamentales
 Pruebas de dos colas
 Si la Ho: µ, µ, o, t= cte. que un valor poblacional,
entonces el riesgo alfa se reparte en ambos extremos
de la distribución. Por ejemplo si Ho = 10 se tiene:
P(Z>= + Zexcel ) = alfa/2 P(Z<= - Zexcel ) = alfa/2
198
Conceptos fundamentales
 Pruebas de una cola
 Si la Ho: µ, µ, o, t >= Cte. que un valor poblacional,
entonces el riesgo alfa se coloca en la cola izquierda de
la distribución. Por ejemplo si Ho: µ>= 10 y Ha: µ< 10
se tiene una prueba de cola izquierda:
P(Z <= - Zexcel ) = alfa
199
Conceptos fundamentales
 Pruebas de una cola
 Si la Ho: µ, µ, o, t<= Cte. que un valor poblacional,
entonces el riesgo alfa se coloca en la cola derecha de
la distribución. Por ejemplo si Ho: µ<= 10 y Ha: µ >
10 se tiene una prueba de cola derecha:
P(Z>= + Zexcel ) = alfa
200
Conceptos fundamentales
 Tamaño de muestra requerido
 Normalmente se determina el error alfa y beta deseado
y después se calcula el tamaño de muestra necesario
para obtener el intervalo de confianza.

 El tamaño de muestra (n) necesario para la prueba
de hipótesis depende de:
 El riesgo deseado tipo I alfa y tipo II Beta
 El valor mínimo a ser detectado entre las medias de la
población (Mu – Mu0)
 La variación en la característica que se mide (S o
sigma)
201
Conceptos fundamentales
 El Tamaño de muestra requerido en función del error
máximo E o Delta P intervalo proporcional esperado
se determina como sigue:
2 2
/ 2
2
2
/ 2
2
( )(1 )
( )
Z
n
E
Z p p
n
p
o
o
o
=
÷
=
A
2
2
2 /
2
2 2
2 /
) (
) 1 )( (
) (
t
t t
µ
o
o
o
÷
÷
=
÷
=
p
Z
n
X
Z
n
202
Conceptos fundamentales
 Ejemplo:
 ¿Cuál es el tamaño de muestra mínimo que al 95% de
nivel de confianza (Z=1.96) confirma la significancia de
una corrida en la media mayor a 4 toneladas/hora (E),
si la desviación estándar (sigma) es de 20 toneladas?

n = (1.96^2)(20^2)/(4)^2 = 96

Obtener 96 valores de rendimiento por hora y determinar
el promedio, si se desvía por más de 4 toneladas, ya
ha ocurrido un cambio significativo al 95% de nivel de
confianza




203
Efecto del tamaño de muestra
204
Efecto del tamaño de muestra
205
Efecto del tamaño de muestra
206
Efecto del tamaño de muestra
207
Potencia de la prueba
 La potencia de una prueba estadística es su habilidad
para detectar una diferencia crítica



 Si Beta = 0.1 la potencia es del 90%

 Delta se puede normalizar dividiéndolo entre la
desviación estándar y se expresa en un cierto

número de o (1 o, 1.5 o )
| ÷ =1 Potencia
o
o
208
Potencia de la prueba
 La potencia de la prueba es la probabilidad de de
rechazar correctamente la hipótesis nula siendo que
en realidad es falsa.
 El análisis de potencia puede ayudar a contestar
preguntas como:

 ¿Cuántas muestras se deben tomar para el análisis?
 ¿Es suficiente el tamaño de muestra?
 ¿Qué tan grande es la diferencia que la prueba puede
detectar?
 ¿Son realmente valiosos los resultados de la prueba?

209
Potencia de la prueba
 Para estimar la potencia, Minitab requiere de dos de
los siguientes parámetros:

 Tamaños de muestra
 Diferencias - un corrimiento significativo de la media
que se desea detectar
 Valores de potencia - La probabilidad deseada de
rechazar Ho cuando es falsa

210
Considerando la potencia de prueba
211
VI.2 Significancia estadística
vs práctica
212
Estimación de riesgos
213
Pruebas de Minitab
 Permite hacer las siguientes pruebas:
 Prueba z de una muestra
 Prueba t de una muestra
 Prueba t de dos muestras
 Prueba de 1 proporción
 Prueba de 2 proporciones

 ANOVA
 Diseños factoriales de dos niveles
 Diseños de Packett Burman
214
Calculo manual
215
Calculo manual
216
VI.3 Tamaño de muestra
217
Calculo manual de tamaño de
muestra
218
Calculo manual de tamaño de
muestra – Pruebas de una cola
219
Calculo manual de tamaño de
muestra – Pruebas de una cola
220
Ejemplo con prueba de una media t
 Ejemplo: Se tiene una población normal con media de 365 y
límites de especificación de 360 y 370. Si la media se desplaza
2.5 gramos por arriba de la media, el número de defectos sería
inaceptable, la desviación estándar histórica es de 2.403:

C1
Y
-
D
a
t
a
375 370 365 360 355
0.18
0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02
0.00
Variable
Original
Corrida
LIE 360 LIE 370
Ho:
Meta
365
Ha: Corrida
367.5
CORRIDA DE 2.5 GRS. EN PROMEDIO
221
Ejemplo con prueba de una media t
Stat > Power and Sample Size > 1 - Sample t
Completar el diálogo como sigue:
222
Ejemplo con prueba de una media t
Los resultados se muestran a continuación:
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 2.403
Sample
Se tiene un 53.76% de Potencia para detectar
Difference Size Power
una diferencia de 2.5 si se usan 6 muestras
2.5 6 0.537662
O sea que hay una probabilidad del 46.24%
que no se rechaze Ho y se concluya que no
hay diferencia significativa.
¿cuántas muestras se requieren para tener un 80% de probabilidad de detectar
el corrimiento, y para 85%, 90% y 95%?
223
Ejemplo con prueba de una media t
Stat > Power and Sample Size > 1 - Sample t
Se cambia este parámetro
Los resultados se muestran a continuación:
Sample Target
Difference Size Power Actual Power
2.5 10 0.80 0.832695
2.5 11 0.85 0.873928
2.5 12 0.90 0.905836
2.5 15 0.95 0.962487
Si la potencia es demasiado alta por decir 99% se pueden detectar diferencias
que realmente no son significativas.
224
Ejemplo con prueba de 2 medias t
Ejemplo: La potencia de una prueba depende de la diferencia que se quiera detectar
respecto a la desviación estándar, para una sigma poner 1 en diferencia y desviación
estándar, con valores deseados de Potencia de 0.8 y 0.9.
Stat > Power and Sample Size > 2 - Sample t
Power and Sample Size 2-Sample t Test
Testing mean 1 = mean 2 (versus not =)
Calculating power for mean 1 = mean 2 + difference
Alpha = 0.05 Assumed standard deviation = 1
Sample Target
Difference Size Power Actual Power
1 17 0.8 0.807037
1 23 0.9 0.912498
Se requieren tamaños de muestra de entre 17 y 23
225
Ejemplo con prueba de 1 proporción
Para estimar la potencia, Minitab requiere de dos de los siguientes parámetros:
* Tamaños de muestra
* La proporción - una proporción que se desea detectar con alta probabilidad
* Valores de potencia - La probabilidad deseada de rechazar Ho cuando es falsa
Suponiendo que se desea detectar una proporción de 0.04 con el 0.8 y 0.9 de niveles
de Potencia:
Proporción que se desea detectar con alta
probabilidad (0.80, 0.90)
Es la proporción de la Hipótesis nula
226
Ejemplo con prueba de 1 proporción
Test for One Proportion
Testing proportion = 0.02 (versus > 0.02)
Alpha = 0.05
Alternative Sample Target
Proportion Size Power Actual Power
0.04 391 0.8 0.800388
0.04 580 0.9 0.900226
Si se desea saber la Potencia si se utiliza un tamaño de muestra de 500 se tiene:
Stat > Power and Sample Size > 2 - Sample t
Sample sizes = 500 Alternative values of p = 0.04
Options: Greater Than
Significance Level = 0.05
Test for One Proportion
Testing proportion = 0.02 (versus > 0.02)
Alpha = 0.05
Alternative Sample
Proportion Size Power
0.04 500 0.865861
Por tanto con un tamaño de muestra de 500, la potencia de la prueba para detectar
un corrimiento de 2% a 4% es del 86.6%
227
Ejercicios
Calcular los tamaños de muestra necesarios para los siguientes
escenarios (usar pruebas de dos colas):
a. 1-muestra Z à a=0.05, b=0.1 y 0.2, d = 1.5s
b. 1-muestra t à a=0.05, b=0.1 y 0.2, d = 1.5s
c. 1-muestra t à a=0.01, b=0.05, d = 0.5s y 1.0s
d. 2-muestras t à a=0.05, b=0.1, d = 1.5s y 2.0s
2. Calcular la potencia de la prueba para los siguientes escenarios
(usar pruebas de dos colas):
a. 1-muestra Z à a=0.05, d = 0.5s, n = 25, 35
b. 1-muestra t à a=0.05, d = 1.0s, n = 10, 20
c. 1-muestra t à a=0.01, d = 1.0s, n = 10, 25
d. 2-muestras t à a=0.05, d = 0.5s, n = 10, 25, 50, 75, 100
228
Ejercicios
Calcular el tamaño de muestra requerido para los siguientes
escenarios (usar pruebas de dos colas):
a. 1-proporción à a=0.05, b=0.1 & 0.2, P0 = 0.5, PA = 0.6
b. 1-proporción à a=0.01, b=0.1 & 0.2, P0 = 0.8, PA = 0.9
c. 2-proporción à a=0.05, b=0.1, P0 = 0.5, PA = 0.6, 0.8
d. 2-proporciones à a=0.01, b=0.1, P0 = 0.8, PA = 0.85, 0.95
2. Calcular la potencia de la prueba para los siguientes escenarios
(usar pruebas de dos colas):
a. 1-proporción à a=0.05, P0 = 0.5, PA = 0.6, n = 250, 350
b. 1-proporción à a=0.01, P0 = 0.9, PA = 0.95, n = 400, 500
c. 2-proporciones à a=0.05, P0 = 0.5, PA = 0.6, n = 250, 350
d. 2-proporciones à a=0.01, P0 = 0.9, PA = 0.95, n = =400, 500
229
230
231
VI.B.4 Estimación puntual
y por intervalo
232
Estimación puntual y por
intervalo
 Las medias o desviaciones estándar calculadas de una muestra
se denominan ESTADÍSTICOS, podrían ser consideradas como
un punto estimado de la media y desviación estándar real de
población o de los PARAMETROS.

 ¿Qué pasa si no deseamos una estimación puntual como media
basada en una muestra, qué otra cosa podríamos obtener como
margen, algún tipo de error?


“Un Intervalo de Confianza”

233
Intervalo de confianza
P(Z>= + Zexcel ) = alfa/2
P(Z<= - Zexcel ) = alfa/2
Intervalo de confianza donde
se encuentra el parámetro con
un NC =1-o
Error de estimación
234
Estimación puntual y por
intervalo
 ¿Cómo obtenemos un intervalo de confianza?

Estimación puntual + error de estimación

 ¿De dónde viene el error de estimación?

Desv. estándar X multiplicador de nivel de confianza deseado Zo/2

Por Ejemplo: Si la media de la muestra es 100 y la desviación
estándar es 10, el intervalo de confianza al 95% donde se
encuentra la media para una distribución normal es:

100 + (10) X 1.96 => (80.4, 119.6) 1.96 = Z
0.025

235
Estimación puntual y por
intervalo

95% de Nivel de Confianza significa que sólo tenemos un 5% de
oportunidad de obtener un punto fuera de ese intervalo.

Esto es el 5% total, o 2.5% mayor o menor. Si vamos a la tabla Z veremos
que para un área de 0.025, corresponde a una Z de 1.960.
C. I. Multiplicador Zo/2
99 2.576
95 1.960
90 1.645
85 1.439
80 1.282
Para tamaños de muestra >30, o o conocida usar la distribución Normal
Para muestras de menor tamaño, o o desconocida usar la distribución t
236
Estimación puntual y por
intervalo
. 30
2
. 30
2
2 2
2
2 2
, 1 1 , 1
2 2
2
( 1) ( 1)
(1 )
para n
para n
n n
X Z
n
X t
n
n s n s
p p
p Z
n
o
o
o o
o
o
µ
o
µ
o
_ _
t
>
<
÷ ÷ ÷
= ±
= ±
÷ ÷
s s
÷
= ±
; con n-1 gl.
237
Para n grande el IC es pequeño
238
Para n grande el IC es pequeño
239
Ejemplo
 Dadas las siguientes resistencias a la tensión: 28.7,
27.9, 29.2 y 26.5 psi

Estimar la media puntual
X media = 28.08 con S = 1.02

Estimar el intervalo de confianza para un nivel de
confianza del 95% (t = 3.182 con n-1=3 grados de
libertad)
Xmedia±3.182*S/√n = 28.08±3.182*1.02/2=(26.46, 29.70)
240
Ejemplos para la media con
Distribución normal Z
Z 1. El peso promedio de una muestra de 50 bultos de productos
Xmedia = 652.58 Kgs., con S = 217.43 Kgs. Determinar el intervalo
de confianza al NC del 95% y al 99% donde se encuentra la media
del proceso (poblacional). Alfa = 1 - NC

2. Un intervalo de confianza del 90% para estimar la ganancia
promedio del peso de ratones de laboratorio oscila entre 0.93 y
1.73 onzas. ¿Cuál es el valor de Z?.

3. 100 latas de 16 onzas de salsa de tomate tienen una media de
Xmedia = 15.2 onzas con una S = 0.96 onzas. ¿A un nivel de
confianza del 95%, las latas parecen estar llenas con 16 onzas?.

4. Una muestra de 16 soluciones tienen un peso promedio de 16.6
onzas con S = 3.63. Se rechaza la solución si el peso promedio de
todo el lote no excede las 18 onzas. ¿Cuál es la decisión a un 90%
de nivel de confianza?.


241
Ejemplos para la media y varianza
con Distribución t
t 5. 20 cajas de producto pesaron 102 grs. Con S = 8.5 grs. ¿Cuál
es el intervalo donde se encuentra la media y varianza del lote
para un 90% de nivel de confianza?. Grados libertad=20 -1 =19


6. Una muestra de 25 productos tienen un peso promedio de 23.87
grs. Con una S = 9.56. ¿Cuál es la estimación del intervalo de
confianza para la media y varianza a un nivel de confianza del
95 y del 98% del peso de productos del lote completo?.

7. Los pesos de 25 paquetes enviados a través de UPS tuvieron
una media de 3.7 libras y una desviación estándar de 1.2 libras.
Hallar el intervalo de confianza del 95% para estimar el peso
promedio y la varianza de todos los paquetes. Los pesos de los
paquetes se distribuyen normalmente.


242
Ejemplos para proporciones con
Distribución Z
Z 8. De 814 encuestados 562 contestaron en forma afirmativa.
¿Cuál es el intervalo de confianza para un 90% de nivel de
confianza?

9. En una encuesta a 673 tiendas, 521 reportaron problemas de
robo por los empleados ¿Se puede concluir con un 99% de nivel
de confianza que el 78% se encuentra en el intervalo de
confianza. ?

243
Instrucciones con Minitab
Intervalo de confianza para la media

Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

En Options:

Indicar el Confidence level -- 90, 95 o 99%

OK

244
Instrucciones con Minitab
Intervalo de confianza para proporción

Stat > Basic Statistics > 1-Proportion

Seleccionar Summarized Data
Number of trials = n tamaño de la muestra
Number of events = D éxitos encontrados en la muestra

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%

Seleccionar Use test and interval based in normal distribution

245
VI.B.5 Pruebas de hipótesis para
medias, varianzas y proporciones
246
Elementos de una
Prueba de Hipótesis
Prueba Estadística- Procedimiento para decidir no rechazar Ho
aceptando Ha o rechazar Ho.

Hipótesis Nula (Ho) - Usualmente es una afirmación representando
una situación “status quo”. Generalmente deseamos rechazar la
hipótesis nula.

Hipótesis Alterna (Ha) - Es lo que aceptamos si podemos rechazar
la hipótesis nula. Ha es lo que queremos probar.

247
Elementos de una
Prueba de Hipótesis
Estadístico de prueba: Calculado con datos de la muestra (Z, t, X
2

or F).

Región de Rechazo Indica los valores de la prueba estadística para
que podamos rechazar la Hipótesis nula (Ho). Esta región esta
basada en un riesgo o deseado, normalmente 0.05 o 5%.
248
Pasos en la Prueba de Hipótesis
1. Definir el Problema - Problema Práctico

2. Señalar los Objetivos - Problema Estadístico

3. Determinar tipo de datos - Atributo o Variable

4. Si son datos Variables - Prueba de Normalidad

249
Pasos en la Prueba de Hipótesis
5. Establecer las Hipótesis
- Hipótesis Nula (Ho) - Siempre tiene el signo =, s, >



- Hipótesis Alterna (Ha) – Tiene signos =, > o <.



El signo de la hipótesis alterna indica el tipo de prueba a usar
hipotesis la de parametro Ho > s = , , , , :
2
t o µ
hipotesis la de parametro Ha < > = , , , , :
2
t o µ
250
Elementos de una Prueba de Hipótesis
Pruebas de Hipótesis de dos colas:
Ho: a = b
Ha: a = b


Pruebas de Hipótesis de cola derecha:
Ho: a s b
Ha: a > b


Pruebas de Hipótesis cola izquierda:
Ho: a > b
Ha: a < b


Z
o/2 0
-Z
o/2
Región de
Rechazo
Región de
Rechazo
Z
o/2 0
Región de
Rechazo
Z
o/2 0
-Z
o/2
Región de
Rechazo
251
Pasos en la Prueba de Hipótesis
6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%) o el
nivel de confianza NC = 1 - alfa

7. Establecer el tamaño de la muestra, >= 10.

8.Desarrollar el Plan de Muestreo

9.Seleccionar Muestras y Obtener Datos

10. Decidir la prueba estadística apropiada y calcular el
estadístico de prueba (Z, t, X
2
or F) a partir de los datos.
252
Estadísticos para medias,
varianzas y proporciones
2
1
1 2
2
2
1 2
1 2
2 2
1 1 2 2
1
1 2
; . ; 30;
/
; . ; 30;
/
; 1, 1; . . var
; . ; ' . .
1 1
/
( 1) ( 1)
;
2
p
p
X
Z Una media n conocida
n
X
t Una media n desconocida
S n
S
F DF n n prueba dos ianzas
S
X X
t dos medias s desconocidas pero
S
n n
n s n s
S DF n
n n
µ
o
o
µ
o
o
÷
= > ÷
÷
= < ÷
= = ÷ ÷
÷
= ÷ =
+
÷ + ÷
= =
+ ÷
2
1 2
2 2
1 2
1 2
2
; . ; ' .
.
n
X X
t dos medias s desconocidas diferentes
s s
n n
DF formula especial
o
+ ÷
÷
= ÷
+
=
253
Estadísticos para medias,
varianzas y proporciones
 Para el caso de muestras pareadas se calculan las
diferencias d individuales como sigue:
2
2
2
2
2
; . . ; . . .
/
( 1)
; ( 1); . . ar
( )
; ( 1)( 1); .
i
d
d
t Pares de medias d para cada par
S n
n S
X DF n prueba una v ianza
O E
X DF r c bondad ajuste
E
o
=
÷
= = ÷
÷
= = ÷ ÷
¿
254
Pasos en la Prueba de Hipótesis
11. Obtener el estadístico correspondiente de tablas o Excel.

12.Determinar la probabilidad de que el estadístico de prueba
calculado ocurre al azar.

13.Comparar el estadístico calculado con el de tablas y ver si
cae en la región de rechazo o ver si la probabilidad es menor a
alfa, rechaze Ho y acepte Ha. En caso contrario no rechaze Ho.

14.Con los resultados interprete una conclusión estadística
para la solución práctica.
255
Prueba de Hipótesis
Pruebas de Hipótesis de dos colas:
Ho: a = b
Ha: a = b


Pruebas de Hipótesis de cola derecha:
Ho: a s b
Ha: a > b


Pruebas de Hipótesis cola izquierda:
Ho: a > b
Ha: a < b


Z
o/2 0
-Z
o/2
Región de
Rechazo
Región de
Rechazo
Z
o/2 0
Región de
Rechazo
Z
o/2 0
-Z
o/2
Región de
Rechazo
Estadístico
Calculado con
Datos de la muestra
256
Prueba de hipótesis para la varianza
 Las varianzas de la población se ditribuyen de
acuerdo a la distribución Chi Cuadrada. Por tanto las
inferencias acerca de la varianza poblacional se
basarán en este estadístico

 La distribución Chi Cuadrada se utiliza en:
Caso I. Comparación de varianzas cuando la varianza de
la población es conocida

Caso II. Comparando frecuencias observadas y
esperadas de resultados de pruebas cuando no hay
una varianza de la población definida (datos por
atributos)
257
Prueba de hipótesis para la varianza
 Las pruebas de hipótesis para comparar una varianza
poblacional a un cierto valor constante o0, si la
población sigue la distribución normal es:




 Con el estadístico Chi Cuadrada con n-1 grados de
libertad

258
Prueba de hipótesis para la varianza
Ejemplo: ¿El material muestra una variación (sigma) en la
resistencia a la tensión menor o igual a 15 psi con 95% de
confianza?. En una muestra de 8 piezas se obtuvo una S = 8psi.

X^2c =(7)(8)^2/(15)^2 = 1.99
Como La Chi calculada es menor a la Chi de Excel de 2.17 se debe
rechazar la hipótesis nula. Si hay decremento en la resistencia
2.17
259
Prueba de hipótesis para atributos
Ejemplo: Un supervisor quiere evaluar la habilidad de 3
inspectores para detectar radios en el equipaje en un
aeropuerto.
¿Hay diferencias significativas para un 95% de confianza?
Valores
observados O
Inspector
1
Inspector 2 Inspector 3 Total por
tratamiento
Radios
detectados
27 25 22 74
Radios no
detectados
3 5 8 16
Total de la
muestra
30 30 30 90
260
Prueba de hipótesis para atributos
Ho: p1 = p2 = p3
Ha: p1 = p2 = p3
Grados de libertad = (No. de columnas -1)*(No. renglones -1)
Las frecuencias esperadas son: (Total columna x Total renglón)
Valores
esperados E
Inspector
1
Inspector 2 Inspector 3 Total por
tratamiento
Radios
detectados
24.67 24.67 24.67 74
Radios no
detectados
5.33 5.33 5.33 16
Total de la
muestra
30 30 30 90
261
Prueba de hipótesis para atributos
El estadístico Chi Cuadrado en este caso es:








El estadístico Chi Cuadrada de alfa = 0.05 para 4 grados de
libertad es 5.99.
El estadístico Chi Cuadrada calculada es menor que Chi de alfa,
por lo que no se rechaza Ho y las habilidades son similares
5.99
262
Para una muestra grande (n>30)probar la hipótesis de una media u
1.) Ho: µ=µ
o
2.) Ha: µ=µ
o

3.) Calcular el estadístico de prueba
4.) Establecer la región de rechazo
Las regiones de rechazo para prueba de 2 colas: -Z
o/2 ¢
Z
o/2

µ÷µ
o
s
n
Z
calc
=
Si el valor del estadístico de prueba cae en la región de rechazo
rechazaremos Ho de otra manera no podemos rechazar Ho.
Zo/2
0
-Z
o/2
Región de
Rechazo
Región de
Rechazo
Ejemplo de Prueba de hipótesis para la media
263
Prueba de hipótesis de una población
para muestras grandes con Z

¿Parecería ser correcta la afirmación de que se mantiene el precio promedio de las computadoras en $2,100?
Probarlo a un 5% de nivel de significancia
Datos
Minoristas n 64 media mu = 2100
Precio prom. X 2251
Desv. Estándar s 812 (Alfa = 0.05
Paso 1. Establecimiento de hipótesis
Ho: uC = 2100 Se inicia con el planteamiento de la hipótesis nula
Ha: uC <> 2100 Por tanto se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Zc
151 = > Zc = 1.48768473
101.5 Error estándar
Como el valor de Zc es positivo se comparará contra de Zexcel (1-alfa/2) positivo
Paso 3. Determinar la Ze de Excel o de tablas para el valor de probabilidad (Alfa / 2):
Ze ( 0.025 ) = 1.95996398 DIST.NORM.STAND.INV.( -0.025 )
n
s
X
Z
NULA HIPOTESIS
c
.
µ ÷
=
264
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
Zexcel ( #¡REF! ) Zexcel ( -0.025 )
-1.95996398 1.959963985
Zc = 1.487684729
Como Zc es menor que Zexcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para RECHAZAR Ho
Se concluye que el precio promedio no es diferente de $2,100
O Como el valor P = 0.068 correspondiente a la Z calculada Zc es mayor
que el valor de Alfa / 2 = 0.025, también nos da el criterio
para NO RECHAZAR la Ho
Paso 5. El Intervalo de confianza para la media poblacional (1-Alfa = 0.95 Porciento)
al nivel de confianza 1-Alfa
Error estándar 101.5
Z alfa/2 1.95996398
Intervalo de confianza 2251 ± 198.936344
El intervalo de confianza incluye a la media de la hipótesis
por tanto no se rechaza la Ho. 2052.064 <= <= ### )
P(Z>= + Zexcel ) = alfa/2 P(Z<= - Zexcel ) = alfa/2
n
s
Z X estimar para IC
2
. . .
o
µ ± =
µ
265
Prueba de hipótesis de una población
para muestras pequeñas con t
Se piensa que las ventas promedio de $5,775 se han incrementado gracias a la campaña publicitaria
Probar esta afirmación a un nivel de significancia alfa de 1%
Se inicia con el planteamiento de la hipótesis Alterna
Datos
Semanas n 15 media mu = 5775
Ventas prom X 6012
Desv. Estándar s 977 (Alfa = 0.01 (1-Alfa = 0.99
(Alfa/2 = 0.005 (1-Alfa/2 = 0.995
Paso 1. Establecimiento de hipótesis
Ho: uC <= 5775
Ha: uV > 5775 Se trata de una prueba de cola derecha
Paso 2. Cálculo del estadístico de prueba tc
237 = > tc = 0.93950568
252.2603153 Error estándar
NOTA:En excel poner 2alfa
para obtener t de alfa
Como el valor de tc es positivo se comparará contra de t excel (1- alfa) positivo
Paso 3. Determinar la te de Excel o de tablas para Alfa 0.01
te ( 0.99 2.62449406 DIST.T.INV( 0.02 , gl. 14 )
n
s
X
t
NULA HIPOTESIS
c
.
µ ÷
=
Gl=14;
266
Paso 4. Comparando los valores tc calculado contra t excel se tiene
texcel ( 0.02 gl. 14)
2.62449406
tc = 0.939505684 Valor p para tc es igual a
P(tc) = 0.368130427
Como tc es menor que texcel, no cae en el área de rechazo, p > Alfa
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que la publicidad no ha tenido efecto en las ventas
O Como el valor de P para Zc es 0.368 mayor a Alfa = 0.05 no se rechaza Ho
Paso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 99 Porciento)
Error estándar 252.260315
Z alfa/2 2.62449406
Como el intervalo de confianza Intervalo de confianza 6012 ± 662.0557002
contiene a la media Hipótesis no se rechaza Ho 5349.94 <= <= 6674.06 )
P(t >= + t excel ) = alfa
n
s
t X estimar para IC
2
. . .
o
µ ± =
µ
267
Prueba de hipótesis
para una proporción con Z
El gerente de mercado considera que el 50% de sus clientes gasta menos de $10 en cada visita a la tienda.
¿Estás de acuerdo con esta afirmación a un nivel de significancia del 5%?
Se inicia con el planteamiento de la hipótesis nula
Datos
Clientes n 50 Proporción media = 0.5
30 gastaron p 0.6
menos de$10 (Alfa = 0.05 (1-Alfa = 0.95
(Alfa/2 = 0.025 (1-Alfa/2 = 0.975
Paso 1. Establecimiento de hipótesis
Se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Zc
0.1 = > Zc = 1.41421356
0.07071068 Error estándar
Como el valor de Zc es positivo se comparará contra de Zexcel (alfa/2) positivo
Paso 3. Determinar la Ze de Excel o de tablas para (1-Alfa/2 = 0.975
Ze ( (1-Alfa/2 = 1.95996398 DIST.NORM.STAND.INV.( 0.975 )
n
p
Z
NULA HIP NULA HIP
NULA HIPOTESIS
c
) 1 (
. .
.
t t
t
÷
÷
=
5 . 0 :
5 . 0 :
=
=
c
c
Ha
Ho
t
t
268
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
Zexcel ( 0.025 ) Zexcel ( 0.975 )
-1.95996398 1.95996398
Zc = 1.41421356 Valor p para Zc es igual a
P(-Zc) = 0.07926984
Como Zc es menor que Zexcel, no cae en el área de rechazo, p > Alfa /2
y por tanto no hay suficiente evidencia para rechazar Ho y se concluye
que el porcentaje que compra menos de $10 no difiere del 50% de clientes
O Como el valor P de Zc es 0.079 mayor a Alfa/2 no se rechaza Ho
Paso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 95 Porciento)
Error estándar 0.07071068
Z alfa/2 1.41421356
Intervalo de confianza 0.6 ± 0.1
Como la media de p = 0.6 se encuentra
dentro del intervalo, no se rechaza Ho ( 0.5 <= 0.7 )
P(Z <= - Zexcel ) = alfa/2
P(Z>= Zexcel ) = alfa/2
n
p p
Z p estimar para IC
) 1 (
. . .
2
÷
± =
o
t
<= t
269
Instrucciones con Minitab para la
prueba de hipótesis de una media
Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

Proporcionar la Media de la hipótesis Test Mean

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%

Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than
OK
270
Instrucciones con Minitab para la
prueba de hipótesis de una proporción
Stat > Basic Statistics > 1-Proportion

Seleccionar Summarized Data

Number of trials = n tamaño de la muestra
Number of events = D éxitos encontrados en la muestra

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la Test Proportion Proporción de la hipótesis
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than

Seleccionar Use test and interval based in normal distribution
OK
271
Pruebas de hipótesis para
comparación de varianzas, medias, y
proporciones
272
Prueba de Hipótesis
 Supongamos que tenemos muestras de dos reactores que
producen el mismo artículo. Se desea ver si hay diferencia
significativa en el rendimiento de “Reactor a Reactor”.
Reactor A Reactor B
89.7 84.7
81.4 86.1
84.5 83.2
84.8 91.9
87.3 86.3
79.7 79.3
85.1 82.6
81.7 89.1
83.7 83.7
84.5 88.5

Estadísticas Descriptivas

Variable Reactor N Media Desv.Std

Rendimiento A 10 84.24 2.90
B 10 85.54 3.65

273
Prueba de Hipótesis
Pregunta Práctica: Existe diferencia entre los reactores?
Pregunta estadística ¿La media del Reactor B (85.54) es significativamente
diferente de la media del Reactor A (84.24)? O, su diferencia se da por
casualidad en una variación de día a día.
Ho:
Ha:
a
a
µ µ
µ µ
=
=
b
b
 Ho: Hipótesis Estadística:
No existe diferencia entre los
Reactores
 Ha: Hipótesis Alterna: Las
medias de los Reactores son
diferentes.
Se busca demostrar que los valores observados al parecer no
corresponden al mismo proceso, se trata de rechazar Ho.
274
Prueba de Hipótesis
 Hipótesis Alterna: Cuando las
medias de Reactores son
diferentes. A esto se le llama
Hipótesis Alterna (Ha)
 Hipótesis Estadística: No
existe diferencia entre los
Reactores
 Esto se llama Hipótesis Nula
(Ho)
Debemos demostrar que los valores que observamos al parecer no
corresponden al mismo proceso, que la Ho debe estar equivocada
275
¿Qué representa esto?
Reactor A
Reactor B
80.0 82.5 85.0 87.5 90.0 92.5
A AA AAAA A A
B B B B B BB B B B

¿Representan los reactores un proceso básico?
¿Representan los reactores dos procesos diferentes?
276
Prueba F de dos varianzas
 Si se toman dos muestras de dos poblaciones normales con
varianzas iguales, la razón de sus varianzas crea una
distribución muestral F. Las hipótesis son las siguientes:




 El estadístico F se muestra a continuación donde S1 se
acostumbra tomar como la mayor

277
Prueba F de dos varianzas





 Sea S1 = 900 psi, n1 = 9, s2 = 300 psi, n2 = 7. A un 95% de nivel de
confianza se puede concluir que hay menor variación?

Ho: Varianza 1 <= Varianza 2 H1: Varianza 1 > Varianza 2
Grados de libertad para Var1 = 8 y para var 2 = 6

Falfa = F(0.05, 8, 6) = 4.15
Fcalculada = (900^2)/(300^2) = 9 >> Falfa, se rechaza Ho.
Hay evidencia suficiente para indicar que la variación ya se ha
reducido
278
Prueba de hipótesis de dos pob.
comparando varianzas con F
Se quiere comprobar si las varianzas de dos diferentes métodos de ensamble de CDs son diferentes en prod .
A un nivel de siginificancia del 5% ¿Qué se puede concluir?
Método 1 Método 2
No. De CDs n1 15 n2 17 Alfa/2 0.025
Desv. Estan. s1 5.4 X2 4.8
Varianza s1
2
29.16 s2
2
23.04
Paso 1. Establecimiento de hipótesis
Por tanto se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Fc
Grados de libertad
1.266 Numerador = n1 - 1 = 14
Denominador = n2 - 1 = 16
Tomamos a s1
2
como el mayor para comparar Fc contra Fexcel (1- Alfa/2)
Paso 3. Determinar la Fe de Excel o de tablas para Alfa/2 0.025
Fe (0.975) = 2.81701784 DIST.F.INV (0.025, 14,16)
2
2
2
1
2
2
2
1
:
:
o o
o o
=
=
Ha
Ho
2
2
2
1
s
s
Fc =
279
Paso 4. Comparando los valores Fc calculado contra Fexcel (0.025) se tiene
f(F)
Fe(0.025) = 2.81701784
Fc = 1.266 Valor p para Fc es igual a
P(Fc) = 0.32259599
Como Fc es menor que Fexcel, no cae en el área de rechazo, p > Alfa / 2
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que la varianza de los dos métodos de ensamble no difieren
significativamente
P(F>= + 2.81 ) = alfa/2
280
Prueba de hipótesis de dos pob.
Comparando dos medias con Z
Investigar si el ambiente libre de tensiones mejoran el engorde y la calidad de la carne de vacas
Las varianzas poblacionales son desconocidas
Determinar el intervalo de confianza al 90% donde se encuentra la media. Alfa = 0.10
Vacas vacaciones Vacas normales
Vacas n1 50 n2 50
Peso promedio X1 112 X2 105.7
Desv. Estándar s1 32.3 s2 28.7
Paso 1. Establecimiento de hipótesis
Como el planteamiento es que las vacas de vacaciones
ganan más peso, se inicia planeando la Ha
Paso 2. Cálculo del estadístico de prueba Zc
6.3 = > Zc = 1.03099301
6.110613717
Tomamos a X1 como el mayor para comparar Zc contra Ze positiva
Paso 3. Determinar la Ze de Excel o de tablas para una alfa de 0.1
Ze (0.90) = 1.28155157 DIST.NORM.STAND.INV (0.90)
2 1
3
2
2
1
2 1
n
s
n
s
X X
Z
c
+
÷
=
VN VV
VN VV
Ha
Ho
µ µ
µ µ
=
=
:
:
281
Paso 4. Comparando los valores Zc calculado contra Zexcel (0.90) se tiene
Ze (0.90)= 1.28
Zc = 1.03099301 Valor p para Zc es igual a
P(-Zc) = 0.149402368
p > Alfa
Como Zc es menor que Zexcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que no hay diferencia entre vacas de vacaciones y normales
Paso adicional. El Intervalo de confianza del 90% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:
= Error estándar 6.11061372
Z (alfa/2) = 1.64485363
= Intervalo de confianza
6.3 + - 10.05106514
La diferencia es del orden de cero,es decir ( -3.75107 < = u < = 16.3511 )
P(Z>= + 1.28) = 0.90
2 1
2
2
2
1
2 1
n
s
n
s
X X
+ =
÷
o
2 1 2 /
2 1 ) (
X X
s Z X X
÷
± ÷
o
282
Prueba de dos medias
muestras pequeñas
Sigmas descono-
cidas e iguales
Sigmas desconocidas
y desiguales
283
Prueba de hipótesis de dos pob.
Comparando dos medias con t
Investigar si hay diferencia en los promedios de las ventas diarias de dos tiendas
Las varianzas de las dos poblaciones son iguales pero desconocidas
Determinar el intervalo de confianza al 99% donde se encuentra la media (alfa = 0.01)
Tienda 1 Tienda 2
Semanas n1 12 n2 15
Ventas promedio X1 125.4 X2 117.2
Desv. Estandar s1 34.5 s2 21.5
Paso 1. Establecimiento de hipótesis
Por tanto se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba tc
19564.25 Sp
2
= 782.57
25
8.2 = > tc = 0.75684444
10.8344589
Tomamos a X1 como el mayor para comparar tc contra te positiva
Si se toma a X1 como la media menor se debe comparar Zc contra -Ze
Paso 3. Determinar la te de Excel o de tablas para una alfa de 0.01 que corresponde a alfa/2 = 0.005
Se tienen n1 + n2 - 2 grados de libertad o sean 25
te (0.01) = 2.78743581 DIST.T.INV (0.01, 25) Asi es para dos colas
2 2 1
) 1 2 ( ) 1 1 (
2
2
2
1 2
÷ +
÷ + ÷
=
n n
n s n s
s
p
2 1
3 2
2 1
n
s
n
s
X X
t
p p
c
+
÷
=
2
2
2
1
o o =
2 1
2 1
:
:
T T
T T
Ha
Ho
µ µ
µ µ
=
=
284
Paso 4. Comparando los valores tc calculado contra texcel (0.01) se tiene
te(0.01,25) = -2.787 te(0.01, 25) = 2.787
Valor p para tc es igual a
tc = 0.7568 P(tc) = 0.46025521
p > Alfa / 2
Como tc es menor que texcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que no hay diferencia sig. En las ventas de las dos tiendas
Paso adicional. El Intervalo de confianza del 99% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:
= Error estándar 10.8344589
= Intervalo de confianza (8.2 + - 2.787*10.83)
Se observa una diferencia positiva sin embargo el cero está incluido ( -21.98 <= u <= 38.38)
P(t>=2.787 ) = alfa/2 P(t<=-2.787 ) = alfa/2
2 1
) (
2 2
2 /
2 1
n
s
n
s
t X X
p p
+ ± ÷
o
2 1
2 2
n
s
n
s
p p
+
285
Prueba de hipótesis de dos pob.
Comparando datos pareados con t
Las muestras pareadas de tamaño 25 reportaron una diferencia media de 45.2 y una desviación
estándar de las diferencias de 21.6. Pruebe la igualdad de medias a un nivel del 5%.
Paso 1. Establecimiento de Hipótesis
No. Pares de muestras n = 25
Paso 2. Se calcula el estadístico tc: Diferencia media = 45.2
Desv. Estándar de difs. = 21.6
Alfa 0.05
gl = 24
= 10.462963
Paso 3. Se determina el valor crítico del estadístico t de Excel o tablas para Alfa / 2 0.025
t excel = 2.06389855 DISTR.T.INV(0.05, 24) Excel divide entre 2 colas
2 1
2 1
:
:
µ µ
µ µ
=
=
Ha
Ho
n
s
d
t
d
c
=
Grados de libertad = No. de pares - 1
286
Paso 4. Comparando el estadístico tcalculado contra t excel (0.025, 24) se tiene:
tc = 10.462963
te(0.025,24) = -2.063 te(0.025, 24) = 2.063
Valor p para tc es igual a
P(t > tc) = 0
p < Alfa / 2
Como tc es mayor que t excel, si cae en el área de rechazo,
y por tanto si hay suficiente evidencia para rechazar Ho y aceptar Ha
se concluye que si hay diferencia significativa entre las medias
Paso 5. El intervalo de confianza para las diferencias en medias pareadas es
t alfa/2 = 2.063
Error estándar = 0.864
Dif. Promedio = 45.2
45.2 + - 0.864
Se observa diferencia positiva significativa entre diferencia de medias 43.4176 <= dm < =46.9824
P(t>=2.063 ) = alfa/2
P(t<=-2.063 ) = alfa/2
n
s
t d para C I
d
d 2 /
. . .
o
µ ± =
287
Prueba de hipótesis de dos pob.
Comparando dos proporciones con Z
Investigar si tiene razon el analista sobre si los bonos convertibles se sobrevaloraron más que los
bonos de ingresos.
Probar la hipótesis a un 10% de nivel de significancia o error de equivocarse en rechazar Ho.
Convertibles Ingresos
Bonos n1 312 n2 205 Alfa 0.1
Sobrevalorad X1 202 X2 102 1-Alfa 0.9
7.8
p1 0.647 p2 0.498 Fracción de las muestras
Paso 1. Establecimiento de hipótesis
Por tanto se trata de una prueba de cola derecha
Paso 2. Cálculo del estadístico de prueba Zc
0.150 = > Zc = 3.393046759
0.04417119
Tomamos a p1 como el mayor para comparar Zc contra Ze positiva (1- Alfa)
Paso 3. Determinar la Ze de Excel o de tablas para 1-Alfa 0.9
Ze (0.9) = 1.28155157 DIST.NORM.STAND.INV (0.9)
2
) 1 (
1
) 1 (
2 2 1 1
2 1
n
p p
n
p p
p p
Z
c
÷
+
÷
÷
=
2 1 2 1
2 1 2 1
: ...... .......... .......... 0 :
: .... . .... 0 :
t t t t
t t t t
> > ÷
s s ÷
Ha Ha
Ho forma otra Ho
288
Paso 4. Comparando los valores Zc calculado contra Zexcel (0.9) se tiene
Zc = 3.39304676
Ze(0.9) = 1.281551566
Valor p para Zc es igual a
P(-Zc) = 0.00034946
p < Alfa
Como Zc es mayo que Zexcel, si cae en el área de rechazo,
y por tanto hay suficiente evidencia para rechazar Ho y aceptar Ha
Se concluye que la diferencia en conv. entre los bonos es significativa
Paso adicional. El Intervalo de confianza del 98% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:
= Error estándar 0.044171193
Zexcel (para alfa/2) 1.644853627
= Intervalo de confianza ( 0.150 ± 0.07265515
Se observa difererencia positiva entre proporciones ( 0.077 <= PI <= 0.223
el cero no está incluido en el intervalo
P(Z>= + 1.28 ) = Alfa
2
) 1 (
1
) 1 (
2 2 1 1
2 1
n
p p
n
p p
s
p p
÷
+
÷
=
÷
2 1 2 / 2 1
) (
p p
s Z p p
÷
± ÷
o
289
Robustez
 Los procedimientos estadísticos se basan en
supuestos acerca de su comportamiento teórico.
Cuando los estadísticos obtenidos no son afectados
por desviaciones moderadas de su expectativa
teórica, se dice que son robustos.
290
Resumen
291
Instrucciones con Minitab para la
comparación de dos varianzas
Stat > Basic Statistics > 2-variances

Seleccionar samples in different columns o Summarized data
First-- Indicar la columna de datos de la muestra 1
Second- Indicar la columna de datos de la muestra 2

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%


OK
292
Instrucciones con Minitab para la
comparación de dos medias
Stat > Basic Statistics > 2-Sample t

Seleccionar samples in different columns o Summarized data
First-- Indicar la columna de datos de la muestra 1
Second- Indicar la columna de datos de la muestra 2
Seleccionar o no seleccionar Assume equal variances de acuerdo a
los resultados de la prueba de igualdad de varianzas

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la diferencia a probar Test Difference (normalmente 0)
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK
293
Instrucciones con Minitab para la
comparación de dos medias pareadas
Stat > Basic Statistics > Paired t

Seleccionar samples in columns o Summarized data
First sample - Indicar la columna de datos de la muestra 1
Second sample - Indicar la columna de datos de la muestra 2

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la diferencia a probar Test Mean (normalmente 0)
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK
294
Instrucciones con Minitab para la
prueba de hipótesis de dos proporciones
Stat > Basic Statistics > 2-Proportions

Seleccionar Summarized Data
Trials: Events:
First: No. de elementos de la 1ª. Muestra y D1 éxitos encontrados
Second: No. de elementos de la 2ª. Muestra y D2 éxitos encontrados

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la Test Difference Normalmente 0
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than

Seleccionar Use pooled estimate of p for test
OK
295
VI.B.7 Pruebas de bondad de
ajuste
296
Bondad de ajuste
PRUEBAS DE BONDAD DE AJUSTE
Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma
de distribución particular planteada como hipótesis
Si el ajuste es razonablemente cercano, puede concluirse que sí exite la forma de distribución
planteada como hipótesis
Por ejemplo:
Ho: La distribución poblacional es uniforme
Ha: La distribución poblacional no es uniforme
Se usa el estadístico Chi-Cuadrado
Oi = Frecuencia de los eventos observados en los datos muestrales
Ei = Frecuencia de los eventos esperados si la hipótesis nula es correcta
Para que la prueba sea confiable Ei >= 5. De otra forma se combinan las categorias para
cumplir con este requisito.
K = Número de categorías o clases
¿
=
÷
=
K
i
Ei
Ei Oi
1
2
2
) (
_
297
Bondad de ajuste
Ejemplo:
Se venden n = 48 botes en 4 meses. Si la demanda es uniforme se esperaría que se vendieran
12 botes / mes. La cantidad real que se vendió fue:
Ventas (Oi) Ventas (Ei)
Tipo de bote observadas esperadas
A 15 12
B 11 12
C 10 12
D 12 12
DISTR.CHI
Entonces el estadístico Chi Cuadrado de la muestra es = 1.17 el valor P corresp.= 0.76020818
El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 3
Chi cuadrado de excel = 7.815
El estadístico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se acepta
la hipótesis nula
PRUEBA.CHI.INV
298
Prueba de Bondad de ajuste
para la distribución de Poisson
1. Plantear la hipótesis nula y alterna
Ho: La población tiene una distribución de prob. De Poisson
Ha: Caso contrario
2. Tomar una muestra aleatoria, anotar la frecuencia observada fi y
calcular la media de ocurrencias µ
3. Calcular la frecuencia esperada de ocurrencias ei. Multiplicar el
tamaño de muestra con la prob. de Poisson para cada valor de
la variable aleatoria. Si hay menos de 5 combinar las categorías

4. Calcular el estadístico de prueba

5. Rechazar Ho si o si p < alfa. Con gl=k-p-1 y alfa nivel de
significancia
¿
=
÷
=
n
i
i
i i
e
e f
1
2
2
) (
_
2 2
o
_ _ >
299
Ejemplo:
Distribución de Poisson µ=5
Ho: No. de clientes que llega en intervalos de 5 min. tiene una distribución
de Poisson Ha: No se sigue una distribución de Poisson
Clientes Frec. observada f(x) de Poisson 128*f(x) cantidad
esperada
0 2 0.0067 0.8576
1 8 0.0337 4.3136
2 10 0.0842 10.7776
3 12 0.1404 17.9712
4 18 0.1755 22.4640
5 22 0.1755 22.4640
6 22 0.1462 18.7136
7 16 0.1044 13.3662
8 12 0.0653 8.3584
9 6 0.0363 4.6464
10 o más 0.0318 4.0704
300
Ejemplo:
Distribución de Poisson µ=5
Combinando X=0,1 y X=9, 10 o más para que la frecuencia observada sea
mayor a 5 y se pueda aplicar la distribución Chi Cuadrada se tiene
Clientes Frec. Observada
(fi)
f(x) de Poisson 128*f(x)
frecuencia
esperada (ei)
0 o 1 10 0.0067+0.0337 5.1712
2 10 0.0842 10.7776
3 12 0.1404 17.9712
4 18 0.1755 22.4640
5 22 0.1755 22.4640
6 22 0.1462 18.7136
7 16 0.1044 13.3662
8 12 0.0653 8.3584
9 o más 6 0.0363+0.0318 8.7168
301
Estadístico y conclusión
Con los datos anteriores se calcula el estadístico Chi cuadrada que
se compara con Chi Cuadrada de alfa para k-p-1 grados de
libertad (K – categorías: 9, p – parámetros a estimar: 1 media).




Ho se rechaza si o si p es mayor que alfa.

El valor de Chi Cuadrada calculado es de 10.9766 y el valor Chi
Cuadrada de alfa 0.05 con 2 gl. Es de 14.07 no se rechaza Ho
En este caso p = 0.14 > 0.05 por tanto no se rechaza Ho y se
concluye que los datos siguen una distribución de Poisson
¿
=
÷
=
n
i
i
i i
e
e f
1
2
2
) (
_
2 2
o
_ _ >
302
Prueba de Bondad de ajuste
para la distribución Normal
1. Plantear la hipótesis nula y alterna
Ho: La población tiene una distribución de prob. Normal
Ha: Caso contrario

2. Tomar una muestra aleatoria, calcular la media µ y la desviación
estándar

3. Definir K intervalos de valores de forma que la frecuencia
esperada sea 5 cuando menos para cada uno (intervalos de
igual probabilidad). Anotar la frecuencia observada de los
valores de datos fi, en cada intervalo
303
Prueba de Bondad de ajuste
para la distribución Normal
4. Calcular el número de ocurrencias esperado ei, para cada
intervalo de valores. Multiplicar el tamaño de muestra por la
probabilidad de que una variable aleatoria esté en el intervalo.

5. Calcular el estadístico de prueba

6. Rechazar Ho si o si p < alfa. Con gl=k-p-1 y alfa nivel
de significancia


¿
=
÷
=
n
i
i
i i
e
e f
1
2
2
) (
_
2 2
o
_ _ >
304
Prueba de Bondad de ajuste
para la distribución Normal
 Ejemplo: datos de calificaciones: Media = 68.42; S = 10.41
Calificaciones
71 66 61 65 54 93
60 86 70 70 73 73
55 63 56 62 76 54
82 79 76 68 53 58
85 80 56 61 61 64
65 62 90 69 76 79
77 54 64 74 65 65
61 56 63 80 56 71
79 84
305
Prueba de Bondad de ajuste
para la distribución Normal
Ho: la población tiene una distribución normal con media 68.42 y
S=10.41 Ha: Caso contrario

Para una muestra de 50 con una frecuencia mínima esperada de 5
se tiene el 10% al menos por cada celda

La primera celda correspondiente al 10% está en Z = -1.28 con
X = (Media - Z*S) = 55.10

Para el área del 20%, Z = -0.84 y X = 59.68
y así sucesivamente


306
Prueba de Bondad de ajuste
para la distribución Normal
Intervalo Frecuencia
observada (fi)
Frecuencia
esperada (ei)
Menos de
55.10
5 5
55.10 a 59.68 5 5
59.68 a 63.01 9 5
63.01 a 65.82 6 5
65.82 a 68.42 2 5
68.42 a 71.02 5 5
71.02 a 73.83 2 5
73.83 a 77.16 5 5
77.16 a 81.74 5 5
81.74 o más 6 5
50 50
Se registran las
frecuencias de
los datos
tomados de las
calificaciones
307
Prueba de Bondad de ajuste
para la distribución Normal
 Se determina el estadístico Chi Cuadrado = 7.2




 El Valor de Chi Cuadrado de alfa = 0.10 para k – p – 1 grados
de libertad. K = 10 categorías, p = 2 parámetros. Gl = 7. Chi
Cuadrado es 12.017

 Como no se puede rechazar la hipótesis nula de
normalidad de las calificaciones
¿
=
÷
=
n
i
i
i i
e
e f
1
2
2
) (
_
2 2
o
_ _ s
308
Prueba de Bondad de ajuste
para la distribución Multinomial
1. Enunciar la hipótesis nula y alternativa
Ho: La población sigue una distribución de probabilidad
multinomial con probabilidades especificadas para cada una de
las K categorías Ha: Caso contrario

2. Tomar una muestra aleatoria y anotar las frecuencias
observadas fi para cada categoría

3. Suponiendo que Ho es cierta, determinar la frecuencia esperada
ei, en cada categoría multiplicando la probabilidad de la
categoría por el tamaño de muestra


309
Prueba de Bondad de ajuste
para la distribución Multinomial
4. Se determina el estadístico Chi Cuadrado de prueba




5. Regla de rechazo:

Si no se puede rechazar la hipótesis nula

Rechazar si el valor p es menor a alfa

Con alfa nivel de significancia y los grados de libertad son k-1
¿
=
÷
=
n
i
i
i i
e
e f
1
2
2
) (
_
2 2
o
_ _ >
310
Prueba de Bondad de ajuste
para la distribución Multinomial
Ejemplo: El año pasado la participación de mercado para la
empresa A fue del 30%, 50% para la empresa B y 20% para la
empresa C. La empresa C hace una prueba con un nuevo
producto para estimar su impacto en las preferencias del
mercado.

Se tomó una muestra de 200 clientes resultando preferencias de
compra de: 48 para A, 98 para B y 54 para C.

De acuerdo a las probabilidades esperadas, en los 200 clientes las
preferencias esperadas son: A=200*0.3=60, B=200*0.5=100,
C=200*0.2=40

311
Prueba de Bondad de ajuste
para la distribución Multinomial
Datos para calcular el estadístico de prueba Chi Cuadrado
Categoría Proporción
hipotética
Frecuencia
observada

Frecuencia
esperada
Empresa A 0.3 48 60
Empresa B 0.5 98 100
Empresa C 0.2 54 40
312
Prueba de Bondad de ajuste
para la distribución Multinomial
Chi Cuadrado calculado = 7.34

Chi cuadrado de alfa = 0.05 con k – 1 = 2 grados de libertad = 2
es de 5.99. El valor p correspondiente es de 0.025.

Como 7.34 es mayor a 5.99 o el valor p de 0.025 es menor a alfa
de 0.05 se rechaza la hipótesis nula Ho y se concluye que el
nuevo producto modificará las preferencias del mercado
actuales

La participación de la empresa C aumenta con el nuevo producto
313
Prueba de Bondad
de ajuste en Minitab
La columna C1 – Observadas contiene las frecuencias observadas
y la C2 – esperadas las frecuencias esperadas

Calc > Calculator > Store result in variable ChiCuadrada
Teclear en el cuadro de expresión sum((Observadas-
Esperadas)**2/Esperadas)

Calc > Probability distributions > Chi Square
Seleccionar Cummulative probability
Degrees of freedom 2
Input column ChiCuadrada; Optional Storage CumProb OK
Calc > Calculator > Store results in variable p
En el cuadro Expression teclear 1-CumProb
OK

314
Prueba de Bondad
de ajuste en Minitab
 Ejemplo: investigación de mercado
Observadas Esperadas ChiCuadrada CumProb p
48 60 7.34 0.974524 0.0254765
98 100
54 40
315
Prueba de Bondad
de ajuste en Excel
 Ejemplo: investigación de mercado

1. Calcular el estadístico Chi Cuadrada con =(A2-B2)^2/B2 y Suma
Chi cuadrada = 7.34
2. El valor P es =distr.chi(7.34, 2)

3. El estadístico Chi Cuadrada de alfa es:
=prueba.chi.inv(0.05,2) = 5.99

4. Como p es menor a alfa de 0.05 se rechaza la Ho


316
VI.B.6 ANOVA para un factor
principal y una o más variables de
bloqueo
317
Introducción
 Cuando es necesario comparar 2 o más medias poblacionales al
mismo tiempo, para lo cual se usa ANOVA.

 El método ANOVA tiene los siguientes supuestos:
 La varianza es la misma para todos los tratamientos del
factor en todos sus niveles
 Las mediciones indiviudales dentro de cada tratamiento se
distribuyen normalmente
 El término de error tiene un efecto distribuido normalmente
e independiente
318
Contenido
 ANOVA de un factor o dirección

 ANOVA de un factor y una variable de bloqueo

 ANOVA de un factor y dos variables de bloqueo –
CUADRADO LATINO

 ANOVA de un factor y tres variables de bloqueo –
CUADRADO GRECOLATINO
319
ANOVA de un factor
o dirección
320
Introducción
 Con el ANOVA las variaciones en la respuesta se dividen
en componentes que reflejan los efectos de una o más
variables independientes

 La variabilidad se representa como la suma de cuadrados
total que es la suma de cuadrados de las desviaciones de
mediciones individuales respecto a la gran media, se
divide en:
 Suma de cuadrados de las medias de los tratamientos
 Suma de cuadrados del residuo o error experimental
321
ANOVA – Prueba de hipótesis para
probar la igualdad de medias de
varias poblaciones para un factor
diferentes son s unas A Ha
Ho
a
. . ' . lg :
......... :
3 2 1
µ
µ µ µ µ = = = =
Se trata de probar si el efecto de un factor o
Tratamiento en la respuesta de un proceso o sistema es
Significativo, al realizar experimentos variando
Los niveles de ese factor (Temp. 1, Temp. 2, Temp.3, etc.)
322
ANOVA - Condiciones
 Todas las poblaciones son normales

 Todas las poblaciones tiene la misma varianza

 Los errores son independientes con distribución
normal de media cero

 La varianza se mantiene constante para todos los
niveles del factor

323
ANOVA – Ejemplo de datos
Niveles del Factor Peso % de algodón y Resistencia de tela
Peso porc. Respuesta
de algodón Resistencia de la tela
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
324
ANOVA – Suma de
cuadrados total
Xij
Xij
Gran media
2
1 1
) (
¿ ¿
= =
÷ =
b
j
a
i
X Xij SCT
325
ANOVA – Suma de cuadrados de
renglones (a)-tratamientos
Gran media
Media Trat. 1
Media Trat. a
Media trat. 2
a renglones
¿
=
÷ =
a
i
i
X X b SCTr
1
2
) (
326
ANOVA – Suma de cuadrados
del error
Media X1.
X1j
X3j
X2j
Media X2.
Media X3.
Muestra 1 Muestra 2 Muestra 3
2
1 1
) (
i
b
j
ij
a
i
X X SCE ÷ =
¿ ¿
= =
327
ANOVA – Suma de cuadrados
del error
Media X1.
X1j
X3j
X2j
Media X2.
Media X3.
Muestra 1 Muestra 2 Muestra 3
SCTr SCT SCE ÷ =
328
ANOVA – Grados de libertad:
Totales, Tratamientos, Error
a n a n SCE gl
a SCTr gl
n SCT gl
÷ = ÷ ÷ ÷ =
÷ =
÷ =
) 1 ( ) 1 ( .
1 .
1 .
329
ANOVA – Cuadrados medios:
Total, Tratamiento y Error
) /(
) 1 /(
) 1 /(
a n SCE MCE
a SCTr MCTr
n SCT MCT
÷ =
÷ =
÷ =
330
ANOVA – Cálculo del estadístico
Fc y Fexcel
SCE gl SCTr gl ALFA
FINV Fexcel
MCE
MCTr
Fc
. , . ,
=
=
331
Tabla final de ANOVA
TABLA DE ANOVA
FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO
Entre muestras (tratam.) SCTR a-1 CMTR CMTR/CME
Dentro de muestras (error) SCE n-a CME
Variación total SCT n-1 CMT
Regla: Rechazar Ho si la Fc de la muestra es mayor que la F de Excel para una cierta alfa
o si el valor p correspondiente a la Fc es menor al valor de alfa especificado
332
ANOVA – Toma de decisión
Fexcel
Fc
Alfa
Zona de rechazo
De Ho o aceptar Ha
Zona de no rechazo de Ho
O de no aceptar Ha
Distribución F
333
ANOVA – Toma de decisión
Si Fc es mayor que Fexcel se rechaza Ho
Aceptando Ha donde las medias son diferentes

O si el valor de p correspondiente a Fc es
menor de Alfa se rechaza Ho
334
ANOVA – Identificar las medias
diferentes por Prueba de Tukey T
Para diseños balanceado
(mismo número de columnas
en los tratamientos) el valor
de q se determina por medio
de la tabla en el libro de texto
b
CME
q T
a n a ÷
=
, , o
335
ANOVA – Identificar las medias
diferentes por Prueba de Tukey T
Se calcula la diferencia Di entre cada par de Medias Xi’s:

D1 = X1 – X2 D2 = X1 – X3 D3 = X2 – X3 etc.

Cada una de las diferencias Di se comparan con el
valor de T, si lo exceden entonces la diferencia es
Significativa de otra forma se considera que las medias
Son iguales
336
ANOVA – Identificar las medias
diferentes por Prueba de Diferencia
Mínima Significativa DMS
Para diseños balanceados (los tratamientos
tienen igual no. De columnas), se calcula un
factor DMS contra el que se comparan las
diferencias Xi – Xi’. Significativas si lo exceden
b
F CME
DMS
a n÷
=
, 1 ,
) ( 2
o
337
Prueba DMS para Diseños no
balanceados
a n a
k j
k j
F CME
b b
DMS
÷ ÷
(
(
¸
(

¸

+ =
, 1 , ,
) (
1 1
o
Para diseños no balanceados (los
tratamientos tienen diferente no. De
columnas), se calcula un factor DMS
Para cada una de las diferencias Xi – Xi’
338
Ejemplo:
 Considerar un experimento de un factor (máquina)
con tres niveles (máquinas A, B, C). Los datos se
muestran a continuación y debe verificarse si existe
diferencia significativa a un alfa = 0.05
Máquinas Datos
Su
ma
Prom.
339
Ejemplo:
Como el valor calculado de F(33.2) excede el valor crítico de F, se
rechaza la Hipótesis nula Ho
La tabla completa de ANOVA es la siguientes:
Fuentes
De variación
Máquinas
Cuadrado
medio
340
Ejemplo:
 Con Minitab: Stat>ANOVA>One way unstacked
 Responses (in separate columns) A B C
 Interpretar los resultados

A B C
5 2 1
7 0 0
6 1 -2
7 -2 -3
6 2 0
341
Ejemplo:
One-way ANOVA: A, B, C
Source DF SS MS F P
Factor 2 137.20 68.60 33.19 0.000 Rechazo Ho
Error 12 24.80 2.07
Total 14 162.00
S = 1.438 R-Sq = 84.69% R-Sq(adj) = 82.14%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev ---------+---------+---------+---------+
A 5 6.200 0.837 (-----*----)
B 5 0.600 1.673 (----*-----)
C 5 -0.800 1.643 (-----*----)
---------+---------+---------+---------+
0.0 2.5 5.0 7.5
Pooled StDev = 1.438
342
Corrida en Minitab
 Se introducen las respuestas en una columna C1
 Se introducen los subíndices de los renglones en una
columna C2



Durability Carpet
18.95 1
12.62 1
11.94 1
14.42 1
10.06 2
7.19 2
7.03 2
14.66 2
343
Corrida en Minitab
 Opción: stat>ANOVA – One Way (usar archivo
Exh_aov)
 En Response indicar la col. De Respuesta (Durability)

 En factors indicar la columna de subíndices (carpet)
 En comparisons (Tukey)

 Pedir gráfica de Box Plot of data y residuales Normal
Plot y vs fits y orden

 Si los datos estan en columnas pedir ANOVA – One
Way (unstacked)

344
Resultados

Results for: Exh_aov.MTW
One-way ANOVA: Durability versus Carpet
Analysis of Variance for Durabili
Source DF SS MS F P
Carpet 3 111.6 37.2 2.60 0.101
Error 12 172.0 14.3
Total 15 283.6
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ---------+---------+---------+-------
1 4 14.483 3.157 (-------*-------)
2 4 9.735 3.566 (-------*--------)
3 4 12.808 1.506 (--------*-------)
4 4 17.005 5.691 (-------*-------)
---------+---------+---------+-------
Pooled StDev = 3.786 10.0 15.0 20.0
Tukey's pairwise comparisons
Family error rate = 0.0500
Individual error rate = 0.0117
Critical value = 4.20
345
ANOVA de dos vías un factor
principal y una variable de
bloqueo
346
ANOVA de 2 vías
 Este es un procedimiento extensión de los patrones
del ANOVA de una vía con tres fuentes de variación:
Tratamiento del factor A (columnas), Tratamiento del
factor B (renglones) y Error experimental.





kij ij j i ijk
AxB Ef B Ef A Ef X c µ + + + + . . .
347
ANOVA – Prueba de hipótesis para
probar la igualdad de medias de
varias poblaciones con dos vías
Se trata de probar si el efecto de un factor o
Tratamiento en la respuesta de un proceso o sistema es
Significativo, al realizar experimentos variando
Los niveles de ese factor (Temp.1, Temp.2, etc.)
POR RENGLON
Y
Considerando los niveles de otro factor que se piensa
Que tiene influencia en la prueba – FACTOR DE BLOQUEO
POR COLUMNA
348
ANOVA – 2 vías
diferentes son s unas A Ha
Ho
a
. . ' . lg :
......... :
3 2 1
µ
µ µ µ µ = = = =
diferentes son s unas A Ha
Ho
a
. . ' . lg :
' ......... ' ' ' :
3 2 1
µ
µ µ µ µ = = = =
Para el tratamiento – en renglones
Para el factor de bloqueo – en columnas
349
ANOVA 2 vías - Ejemplo
Experiencia en años de los operadores
Maquinas 1 2 3 4 5
Maq 1 27 31 42 38 45
Maq 2 21 33 39 41 46
Maq 3 25 35 39 37 45
350
ANOVA – Dos vías o direcciones
 La SCT y SCTr (renlgones) se determina de la misma
forma que para la ANOVA de una dirección o factor

 En forma adicional se determina la suma de
cuadrados del factor de bloqueo (columnas) de forma
similar a la de los renglones

 La SCE = SCT – SCTr - SCBl

351
ANOVA de 2 vías
) 1 /(
1 .
) (
2
1
÷ =
÷ =
÷ =
¿
=
b SCBl CMBl
b SCBl gl
X X a SCBl
j
b
j
352
ANOVA de 2 vías
) )( /(
) )( ( .
b n a n SCBl CME
b n a n SCE gl
SCBl SCTr SCT SCE
÷ ÷ =
÷ ÷ =
÷ ÷ =
353
ANOVA –Estadístico Fc y Fexcel
SCE gl SCTr gl ALFA
FINV Fexcel
MCE
MCTr
Fc
. , . ,
=
=
354
ANOVA – Estadístico Fb
SCE gl SCBl gl ALFA
FINV Fexcel
MCE
MCBl
Fc
. , . ,
=
=
355
Tabla final ANOVA 2 vías
FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO
Entre muestras (tratam.) SCTR a-1 CMTR CMTR/CME
Entre Bloques (Factor Bl) SCBl b-1 CMBL CMBL/CME
Dentro de muestras (error) SCE (a-1)(b-1) CME
Variación total SCT n-1 CMT
Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
356
ANOVA – 2 vías: Toma de decisión
Fexcel
Fc
Tr o Bl
Alfa
Zona de rechazo
De Ho o aceptar Ha
Zona de no rechazo de Ho
O de no aceptar Ha
Distribución F
357
ANOVA – 2 vías: Toma de decisión
Si Fc (Tr o Bl) es mayor que Fexcel se rechaza
Ho Aceptando Ha donde las medias son
diferentes

O si el valor de p correspondiente a Fc (Tr o Bl)
es menor de Alfa se rechaza Ho
358
Cálculo de los residuales
.
.
*
ˆ
ˆ
. , , 05 . 0
.. . .
i
i
y MSE gl k k
y
ij ij ij
j i ij
s r R
b
MSE
s
y y e
y y y y
=
=
÷ =
÷ + =
Y estimada
Error o residuo
Error estándar
Factor de comparación
Si la diferencia de medias excede a Rk es significativa
359
Adecuación del modelo
 Los residuales deben seguir una recta en la gráfica
normal

 Deben mostrar patrones aleatorios en las gráficas de
los residuos contra el orden de las Yij, contra los
valores estimados y contra los valores reales Yij
360
Corrida en Minitab
 Se introducen las respuestas en una columna C3 y los
subíndices de renglones en columna C4 y de columnas en C5



Plantas Suplemento Lago
34 1 Rose
43 1 Rose
57 1 Dennison
40 1 Dennison
85 2 Rose
68 2 Rose
67 2 Dennison
53 2 Dennison
41 3 Rose
24 3 Rose
42 3 Dennison
52 3 Dennison
361
Corrida en Minitab
 Opción: stat>ANOVA – Two Way (usar archivo
Exh_aov)

 En Response indicar la col. De Respuesta (Plantas)

 En Row factor y Column Factor indicar las columnas
de subíndices de renglones y columnas (suplemento
y lago) y Display Means para ambos casos

 Pedir gráfica residuales Normal Plot y vs fits y orden

362
Resultados
Two-way ANOVA: Zooplankton versus Supplement, Lake
Analysis of Variance for Zooplank
Source DF SS MS F P
Suppleme 2 1919 959 9.25 0.015
Lake 1 21 21 0.21 0.666
Interaction 2 561 281 2.71 0.145
Error 6 622 104
Total 11 3123
Individual 95% CI
Suppleme Mean --+---------+---------+---------+---------
1 43.5 (-------*-------)
2 68.3 (--------*-------)
3 39.8 (--------*-------)
--+---------+---------+---------+---------
30.0 45.0 60.0 75.0
Individual 95% CI
Lake Mean ------+---------+---------+---------+-----
Dennison 51.8 (----------------*----------------)
Rose 49.2 (----------------*----------------)
------+---------+---------+---------+-----
42.0 48.0 54.0 60.0
363
ANOVA de un factor y dos o
tres variables de bloqueo
CUADRADO LATINO Y
GRECOLATINO
364
ANOVA – 3 y 4 factores
 El diseño de Cuadrado latino utiliza dos factores de
bloqueo adicionales al de Tratamiento

 EL diseño de Cuadrado Grecolatino utiliza tres
factores adicionales al del Tratamiento

 El cálculo de suma de cuadrados para renglones y
para columnas es similar al de ANOVA de un factor
principal y otro de bloqueo
365
Cuadrado Latino
Años exp. Turno
Empleado Mañana Tarde Noche
1 B=15 A=18 C=11
2 C=12 B=20 A=9
3 A=17 C=19 B=10
A, B, C = Máquinas 1, 2 y 3
366
ANOVA – Cuadrado Latino:
Factor principal (A,B,C,D)
) 1 /(
1 1 .
) (
2
1
÷ =
÷ = ÷ =
÷ =
¿
=
b SCTr CMTr
b a SCTr gl
X X a SCTr
Tr
b
j
367
ANOVA – Cuadrado Latino: Cálculo
del error
) 1 )( 2 /(
) 1 )( 2 ( .
Re
÷ ÷ =
÷ ÷ =
÷ ÷ ÷ =
a a SCE CME
a a SCE gl
SCTr ng SC SCTcol SCT SCE
368
ANOVA – Cálculo del estadístico
Fc y Fexcel
SCE gl SCTr gl ALFA
FINV Fexcel
MCE
MCTr
Fc
. , . ,
=
=
369
ANOVA – Cuadrado Latino Reng / Col
SCE gl SCBl gl ALFA
FINV Fexcel
MCE
MCCols
Fcols
MCE
ng MC
Fcreng
. , . ,
Re
=
=
=
370
Tabla final ANOVA 2 Factores
FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO
Renglores SCRen a-1 CMRen CMRen/CME
Columnas SCCol b-1 CMCol CMCol/CME
Tratamiento SCTr a-1 CMTr CMTr/CME
Dentro de muestras (error) SCE (a-2)(a-1) CME
Variación total SCT n-1 CMT
371
Cuadrado latino en Minitab
 Se introducen las respuestas en una columna C1

 Se introducen los subíndices de los renglones en una
columna C2

 Se introducen los subíndices de las columnas en una
columna C3

 Se introducen las letras mayúsculas que indican el
nivel del factor (A, B, C, D, etc.) correspondientes a
cada respuesta en la columna C4


372
Cuadrado latino en Minitab
 Opción: stat> ANOVA – General linear model

 En Response indicar la col. De Respuesta,

 En Model indicar las columnas de los factores y

 En Random factors indicar los factores adicionales al
del efecto principal a probar (A, B, C, D). Se pueden
pedir interacciones entre factores x – y con Cx*Cy

 Pedir gráfica de residuales Normal y vs fits y orden

373
Cuadrado Greco Latino
Experiencia de los operadores
Lotes MP 1 2 3 4 5
1 Aa=-1 Bc=-5 Ce=-6 Db=-1 Ed=-1
2 Bb=-8 Cd=-1 Da=5 Ec=2 Ae=11
3 Cc=-7 De=13 Eb=1 Ad=2 Ba=-4
4 Dd=1 Ea=6 Ac=1 Be=-2 Cb=-3
5 Ee=-3 Ab=5 Bd=-5 Ca=4 Dc=6
a, b, c y d son 5 diferentes tipos de montaje A, B, C, D y E son las 5 formulaciones a probar
374
Cuadrado Greco latino en Minitab
 Se introducen las respuestas en una columna C1
 Se introducen los subíndices de los renglones en una
columna C2

 Se introducen los subíndices de las columnas en una
columna C3
 Introducir los subíndices del factor adicional de letras
griegas con letras latinas minúsculas (a,b,c,d,e) en C4

 Se introducen las letras mayúsculas que indican el nivel
del factor (A, B, C, D, etc.) correspondientes a cada
respuesta en la columna C5


375
Cuadrado Greco latino en Minitab
 Opción: ANOVA – General linear model

 En Response indicar la col. De Respuesta,

 En Model indicar las columnas de los factores y

 En Random factors indicar los factores adicionales al del efecto
principal a probar (A, B, C, D). También se pueden indicar
interacciones entre factores x-y con Cx * Cy

 Pedir gráfica de residuales Normal y vs fits y orden

376
ANOVA – Cuadrado Grecolatino
) 1 /(
1 .
) (
2
1
÷ =
÷ =
÷ =
¿
=
b SCG CMG
b SCG gl
X X a SCG
m
b
m
377
ANOVA de 2 factores – Suma de
cuadrados, gl. y Cuadrado medio
para el error
) 1 )( 3 /(
) 1 )( 3 ( .
Re
÷ ÷ =
÷ ÷ =
÷ ÷ ÷ ÷ =
a a SCE CME
a a SCE gl
SCCol n SC SCG SCTr SCT SCE
378
ANOVA – Cálculo del estadístico
Fc y Fexcel
SCE gl SCTr gl ALFA
FINV Fexcel
MCE
MCG
Fc
. , . ,
=
=
379
ANOVA – Cuadrado Grecolatino
SCE gl SCBl gl ALFA
FINV Fexcel
MCE
MCTr
Fc
. , . ,
=
=
380
Tabla final ANOVA 2 Factores
FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO
Renglores SCRen a-1 CMRen CMRen/CME
Columnas SCCol b-1 CMCol CMCol/CME
Letras griegas SCG a-1 CMG CMG/CME
Tratamiento SCTr a-1 CMTr CMTr/CME
Dentro de muestras (error) SCE (a-3)(a-1) CME
Variación total SCT n-1 CMT
381
ANOVA para diseño factorial AxB
 En un experimento factorial involucrando el factor A con (a)
niveles y un factor B con (b) niveles, la suma de cuadrados se
puede dividir en:
SST = SS(A) + SS(B) + SS(AB) + SSE

382
VI.B.8 Tablas de contingencia
Prueba Chi
2 (
_
2)

383
¿Para qué se utiliza?

1. Para probar si una serie de datos
observada, concuerda con el modelo (serie
esperada) de la información.

2. Para probar las diferencias entre las
proporciones de varios grupos (tabla de
contingencia).

_
2
Ho: No hay diferencia
Ha: Hay diferencia
Para todos los casos,
384
H
o
: La moneda es buena

H
a
: La moneda “está cargada”
Se lanza una moneda al aire 100 veces y que
obtenemos 63 águilas y 37 soles.

¿La proporción de águilas y soles sucede por
casualidad? O, se concluye que la moneda está
“cargada”?
Ejemplo 1: Chi Cuadrada(_
2
)
385
_
2
c=
E
j = 1
g
Estadístico Chi Cuadrada


Observada Esperada
Aguilas 63 50 3.38
Soles 37 50 3.38
_
2
= 3.38 + 3.38
_
2
= 6.76
(f
o
- f
e
)
2
f
e ( f
o
) ( f
e
)
Ejemplo 1: Chi Cuadrada(_
2
)
f
e
(f
o
- f
e
)
2
386
Función de Distribución Acumulada Chi
2
con 1 grado de
libertad (d.f)
H
o
: La moneda es buena.
H
a
: La moneda está “cargada”.

Para un 95% de confianza antes de concluir que la moneda “está
cargada”, se requiere que X
2
c
> X
2
Crítica
o que el valor de p sea s
0.05.

Como p s 0.05, se puede concluir -con un 95% de confianza -
que la moneda “está cargada”.

_2
c
P(_2
c
> x)
6.7600 p = 1 - 0.9907 = 0.0093

De tablas X
2
Crítica,

(0.05, 1)
= 3.8414
Ejemplo 1: Chi cuadrada
387
1. Posicionarse en una celda vacía

2. Accesar el menú de funciones con Fx

3. Seleccionar STATISTICAL o ESTADÍSTICAS, CHIINV.

4. Dar valores de probabilidad (0.05) y grados de libertad,
normalmente (n - 1) para un parámetro o (# de renglones -1)
* (# de columnas - 1) para el caso de tablas de proporciones.


Cálculo en Excel del estadístico Chi cuadrada
388
Tabla de Valores Críticos Seleccionados de Chi
2
o
df . 250 . 100 . 050 . 025 . 010 . 005 . 001
1 1. 323 2. 706 3. 841 5. 024 6. 635 7. 879 10. 828
2 2. 773 4. 605 5. 991 7. 378 9. 210 10. 597 13. 816
3 4. 108 6. 251 7. 815 9. 348 11. 345 12. 838 16. 266
4 5. 385 7. 779 9. 488 11. 143 13. 277 14. 860 18. 467
5 6. 626 9. 236 11. 070 12. 832 15. 086 16. 750 20. 515
6 7. 841 10. 645 12. 592 14. 449 16. 812 18. 548 22. 458
7 9. 037 12. 017 14. 067 16. 013 18. 475 20. 278 24. 322
8 10. 219 13. 362 15. 507 17. 535 20. 090 21. 955 26. 125
9 11. 389 14. 684 16. 919 19. 023 21. 666 23. 589 27. 877
10 12. 549 15. 987 18. 307 20. 483 23. 209 25. 188 29. 588
11 13. 701 17. 275 19. 675 21. 920 24. 725 26. 757 31. 264
12 14. 845 18. 549 21. 026 23. 337 26. 217 28. 300 32. 909
13 15. 984 19. 812 22. 362 24. 736 27. 688 29. 819 34. 528
14 17. 117 21. 064 23. 685 26. 119 29. 141 31. 319 36. 123
15 18. 245 22. 307 24. 996 27. 488 30. 578 32. 801 37. 697
16 19. 369 23. 542 26. 296 28. 845 32. 000 34. 267 39. 252
17 20. 489 24. 769 27. 587 30. 191 33. 409 35. 718 40. 790
18 21. 605 25. 989 28. 869 31. 526 34. 805 37. 156 43. 312
19 22. 718 27. 204 30. 144 32. 852 36. 191 38. 582 43. 820
20 23. 828 28. 412 31. 410 34. 170 37. 566 39. 997 45. 315
21 24. 935 29. 615 32. 671 35. 479 38. 932 41. 401 46. 797
22 26. 039 30. 813 33. 924 36. 781 40. 289 42. 796 48. 268
23 27. 141 32. 007 35. 172 38. 076 41. 638 44. 181 49. 728
24 28. 241 33. 196 36. 415 39. 364 42. 980 45. 558 51. 179
25 29. 339 34. 382 37. 652 40. 646 44. 314 46. 928 52. 620
26 30. 434 35. 563 38. 885 41. 923 45. 642 48. 290 54. 052
27 31. 528 36. 741 40. 113 43. 194 46. 963 49. 645 55. 476
28 32. 620 37. 916 41. 337 44. 461 48. 278 50. 993 56. 892
29 33. 711 39. 087 42. 557 45. 722 49. 588 52. 336 58. 302
30 34. 800 40. 256 43. 773 46. 979 50. 892 53. 672 59. 703
40 45. 616 51. 805 55. 758 59. 342 63. 691 66. 766 73. 402
50 56. 334 63. 167 67. 505 71. 420 76. 154 79. 490 86. 661
60 66. 981 74. 397 79. 082 83. 298 88. 379 91. 952 99. 607
70 77. 577 85. 527 90. 531 95. 023 100.425 104.215 112.317
80 88. 130 96. 578 101.879 106.629 112.329 116.321 124.839
90 98. 650 107.565 113.145 118.136 124.116 128.299 137.208
100 109.141 118.498 124.342 129.561 135.807 140.169 149.449
389
Tabla de contingencia
 Una tabla de clasificación de dos vías (filas y columnas) que
contiene frecuencias originales, se puede analizar para
determinar si las dos variables (clasificaciones) son
independientes o tienen una asociación significativa.

 La prueba Chi Cuadrada probará si hay dependencia entre las
dos clasificaciones.

 Además se puede calcular el coeficiente de contingencia
(correlación) que en todo caso muestra la fuerza de la
dependencia
390
Tabla de contingencia
 Para esta prueba se usa la prueba Chi Cuadrada donde:





 Entre mayor sea su valor, mayor será la diferencia de la
discrepancia entre frecuencias observadas y teóricas. Esta
prueba es similar a la de bondad de ajuste.


391
Tabla de contingencia
 Ejemplo: Cada una de las 15 celdas hace una contribución al
estadístico Chi Cuadrado (una celda)







 Asumiendo Alfa = 0.1 y Gl= (reng – 1)*(Col – 1) = 4*2 = 8 Chi-
Cuadrado de alfa = 20.09
 Como Chi Cuadrada calculada >> Chi C. Alfa, se rechaza Ho de
igualdad de resultados entre negocios



392
Los valores observados (f
o
) son los siguientes:
Ho: No existen diferencias en los índices de defectos de las dos máquinas.
Ha: Existen diferencias en los índices de defectos de las dos máquinas.
Total 751 28

El índice de defectos totales es 28 / 779 = 3.6%

máquina 1 f
o
= 517 f
o
= 17 Total = 534
Partes buenas
máquina 2 f
o
= 234 f
o
= 11 Total = 245
779

Partes defectuosas

Ejemplo 2: Chi
2
Para comparación de dos
grupos; ¿son las mismas proporciones?)
393
Cálculo de los valores esperados

Basados en este índice, los valores esperados (f
e
) serían:
máquina 1 f
o
= 751*534/779 f
o
= 28*534/779 Total = 534
Partes buenas
máquina 2 f
o
= 751*245/779 f
o
= 28*245/779 Total = 245
779

Partes defectuosas
máquina 1 530.53 3.47
Partes
buenas
máquina 2 233.47 1.53
Partes defectuosas
Ejemplo 2: Chi
2
Para comparación de dos
grupos; ¿son las mismas proporciones?)
394
Nota: Chi cuadrada no podrá aplicarse en los casos donde los conteos seas menores a 5 en > 20%
de celdas.
Si cualquiera de los conteos esperados en las celdas es menor a uno, no deberá usarse Chi
2
.

Si algunas celdas tienen un conteo menor a los esperados, ya sea combinando u omitiendo
renglones y/o columnas, las categorías pueden ser de utilidad.
Prueba de chi cuadrada:


Los conteos esperados están debajo de los conteos observados
Partes buenas Partes Defectuosas Total
1 532 2 534
530.53 3.47

2 232 3 235
233.47 1.53
Total 764 5 769

Chi
2
= 0.004 + 0.624 + 0.009 + 1.418 = 2.056
DF= 1; valor de p = 0.152

2 celdas con conteos esperados menores a 5.0
395
Tabla de Chi
2

Tabla de valores críticos seleccionados para Chi
2

o DF .250 .100 .050 .025 .010 .005 .001
1 1.323 2.706 3.841 5.024 6.635 7.879 10.828
2 2.773 4.605 5.991 7.378 9.210 10.597 13.816
3 4.108 6.251 7.815 9.348 11.345 12.838 16.266
4 5.385 7.779 9.488 11.143 13.277 14.860 18.467
5 6.626 9.236 11.070 12.832 15.086 16.750 20.515
6 7.841 10.645 12.592 14.449 16.812 18.548 22.458
7 9.037 12.017 14.067 16.013 18.475 20.278 24.322
8 10.219 13.362 15.507 17.535 20.090 21.955 26.125
9 11.389 14.684 16.919 19.023 21.666 23.589 27.877
10 12.549 15.987 18.307 20.483 23.209 25.188 29.588
11 13.701 17.275 19.675 21.920 24.725 26.757 31.264
12 14.845 18.549 21.026 23.337 26.217 28.300 32.909
13 15.984 19.812 22.362 24.736 27.688 29.819 34.528
14 17.117 21.064 23.685 26.119 29.141 31.319 36.123
15 18.245 22.307 24.996 27.488 30.578 32.801 37.697
16 19.369 23.542 26.296 28.845 32.000 34.267 39.252
17 20.489 24.769 27.587 30.191 33.409 35.718 40.790
18 21.605 25.989 28.869 31.526 34.805 37.156 43.312
19 22.718 27.204 30.144 32.852 36.191 38.582 43.820
20 23.828 28.412 31.410 34.170 37.566 39.997 45.315
.
396
Problema: Fugas
Beneficios Potenciales: $10,000 de ahorro en retrabajos, y en la
reducción de tiempo de ciclo.

Variación en familias a probar
Operador a operador
H
o
: No existe diferencia en los índices de defecto de los diferentes
operadores
H
a
: Existe diferencia en los índices de defecto de los diferentes
operadores

Máquina a máquina
H
o
: No existe diferencia en los índices de defecto de las diferentes
máquinas
H
a
: Existe diferencia en los índices de defecto de las diferentes
máquinas

Tamaño de la muestra:
5000 + total de oportunidades (172 piezas)
397
Los conteos esperados están colocados debajo de los conteos observados
Con fugas Sin fugas Total
1 30 610 640
32.11 607.89

2 235 4217 4452
223.38 4228.62

3 3 253 256
12.84 243.16

4 18 334 352
17.66 334.34

Total 286 5414 5700

Chi
2
= 0.139 + 0.007 + 0.604 + 0.032 + 7.546 + 0.399 + 0.006 +
0.000 = 8.734
DF= (4-1)(2-1) = 3; valor P = 0.033
Prueba de chi
2
(máquina a máquina)
398
Los conteos esperados están colocados debajo de los conteos observados.
Con gotera Sin gotera Total
1 6 122 128
6.61 121.39

2 1 127 128
6.61 121.39

3 200 3836 4036
208.55 3827.45

4 54 202 256
13.23 242.77

5 5 699 704
36.38 667.62

6 12 116 128
6.61 121.39
Total 278 5102 5380

Chi
2
= 0.057 + 0.003 + 4.765 + 0.260 + 0.351 + 0.019 +125.666 + 6.847 + 27.065 + 1.475
+ 4.386 + 0.239 = 171.132
DF= 5; valor P = 0.000
Prueba de chi
2
(operador a operador)
399
¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?
(en este caso, operador a operador y máquina a máquina)
Se utiliza un procedimiento denominado “Coeficiente de Contingencia” como clave
para determinar qué grupo de variación debe investigarse primero.
Coeficiente de
Contingencia

x 100
Chi

Cuadrada
N
Chi
2
N CC

Máquina 8.734 5700 0.15

Operador 171.132 5380 3.18
Controlador Mayor

SI el tamaño de la muestra (N), es similar para los grupos. Al dividir entre N,
probablemente, llevará a la misma ruta que hubiera alcanzado con sólo ver la
estadística Chi
2
.

Sin embargo, si N tiene una variación considerable, dependiendo del grupo de
variación que se investiga, el coeficiente de contingencia puede ser una herramienta
valiosa para determinar la prioridad sobre qué grupo debe investigarse primero.
400
Con gotera Sin gotera Total
1 6 122 128
6.61 121.39

2 1 127 128
6.61 121.39

3 200 3836 4036
208.55 3827.45

4 54 202 256
13.23 242.77

5 5 699 704
36.38 667.62

6 12 116 128
6.61 121.39
Mucho peor que
lo esperado
Mucho mejor que
lo esperado
Ahora que la información nos
ha llevado a investigar a los
grupos de operador a
operador. ¿Qué debemos
hacer ahora?
Encontremos cuál de los
operadores estaban fuera del
estándar.
¿Era alguno de ellos
notablemente peor (o mejor)
que el resto?
(Estos mismos operadores fueron quienes
tuvieron los números más grandes de chi
2
)
¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?
(en este caso, operador a operador y máquina a máquina)
401
Operador a operador: = 0.000
Rechace
H
o
y acepte H
a

(Existe una diferencia significativa entre los operadores)

Los operadores 4 y 5 están fuera del estándar:
El operador 4 es notablemente peor que el resto,
El operador 5 es notablemente mejor que los demás

¿Cuál es el próximo paso? Hable con todos los operadores para averiguar qué diferencias
pueden existen en sus técnicas.

El operador 4 no tenía experiencia en este tipo de trabajo y apenas se estaba acostumbrado a
soldar este producto en particular.

El operador 5 encontró un modo de mejor de hacer el ensamble, con lo cual consiguió mejorar
el trabajo de soldadura, aunque esto mostraba un grado de dificultad ergonómica. Se añadió
un colocador para ensamblar la parte en forma segura. (Esto también redujo el tiempo que
requerían los operadores para “acostumbrarse” a trabajar en esta forma)
402
Ejercicios

1. Se quiere evaluar la habilidad de tres inspectores de rayos
X en un aeropuerto para detectar artículos clave. Como
prueba se pusieron radios de transistores en 90 maletas,
cada inspector fue expuesto a 30 maletas conteniendo radios
mezcladas entre otras que nos los contenían. Los resultados
se resumen a continuación:
Inspectores
1 2 3

Radios detectados 27 25 22
Radios no detectados 3 5 8

¿Con un 95% de confianza, existe una diferencia entre los
inspectores?

Ho: p1 = p2 = p3; Ha: al menos una es diferente
Grados de libertad = (columnas - 1) ( filas -1)
403
Ejercicios

1. Se quiere evaluar si hay preferencia por manejar en un
carril de una autopista dependiendo de la hora del día. Los
datos se resumen a continuación:

Hora del día
Carril 1:00 3:00 5:00
Izquierdo 44 37 18
Central 28 50 72
Derecho 8 13 30

¿Con un 95% de confianza, existe una diferencia entre las
preferencias de los automovilistas dependiendo de la hora?

Ho: P1 = P2 = P3; Ha: al menos una es diferente
Grados de libertad = (columnas - 1) ( filas -1)
404
Coeficiente de Contingencia
 Coeficiente de contingencia es el grado de relación o
dependencia de las clasificaciones en la tabla de contingencias
es:





 Donde N es la frecuencia total y X es el estadístico Chi
Cuadrado calculado
2
2
2
N X
X
C
+
=
405
Coeficiente de Contingencia
 Para los datos del ejemplo anterior se tiene:






 El valor máximo de C se obtiene de:






38 . 0
393 22 . 66
22 . 66
2
2
2
2
2
2
=
+
=
+
=
N X
X
C
866 . 0
8
2 8 2
=
÷
=
÷
=
k
k
C Max
406
Correlación de atributos
 Para tablas de orden k * k, el coeficiente de correlación, r, es :






 Donde 0<= r <= 1






) 1 (
2
÷
=
k N
X
r
407
VI.B.9 Pruebas de Hipótesis
no paramétricas
408
Pruebas no paramétricas
 Las pruebas paramétricas asumen una distribución para la
población, tal como la Normal

 Las pruebas no paramétricas no asumen una distribución
específica de la población

 Bajo los mismos tamaños de muestra la Potencia o probabilidad
de rechazar Ho cuando es falsa es mayor en las pruebas
paramétricas que en las no paramétricas

 Una ventaja de las pruebas no paramétricas es que los
resultados de la prueba son más robustos contra violación de
los supuestos

409
Prueba de Hipótesis
Variable
Atributo
Tablas de
Contingencia de
Correlación
No Normal
Normal
Varianza
Medianas
Variancia
Medias

Prueba-F
Homogeneidad
de la Variación
de Levene
Homogeneidad
de la Variación
de Bartlett
Correlación
Prueba de signos
Wilcoxon
Mann-
Whitney
Kurskal-
Wallis
Prueba de Mood
Friedman
Pruebas de t
ANOVA
Correlación
Regresión
Muestra-1
Muestra-2
Una vía
Dos vías
Residuos
distribuidos
normalmente
410

Pruebas de Varianzas
Homogeneidad de la varianza de
Levene : Compara dos o más
varianzas de muestras de la misma
población.


Pruebas de Variancias

X
2
: Compara la variancia de una
muestra con una variancia de un
universo conocido.

Prueba F : Compara dos varianzas
de muestras.

Homogeneidad de la variancia de
Bartlett: Compara dos o más
varianzas muestras de la misma
población.


Datos Normales Datos No Normales
Resumen de pruebas de Hipótesis
411
Pruebas de la Mediana

Prueba de signos o Prueba Wilcoxon : Prueba
si la mediana de la muestra es igual a un valor
conocido o a un valor a alcanzar.
Prueba Mann-Whitney : Prueba si dos medianas
de muestras son iguales.
Prueba Kruskal-Wallis: Prueba si más de dos
medianas de muestras son iguales. Asume que
todas las distribuciones tienen la misma forma.
Prueba de la mediana de Mood : Otra prueba
para más de dos medianas. Prueba más firme
para los valores atípicos contenidos en la
información.
Prueba Friedman : Prueba si las medianas de las
muestras, clasificadas bajo dos categorías, son
iguales.
Correlación : Prueba la relación lineal entre dos
variables.
Pruebas de los Promedios

Prueba t de 1 muestra : Prueba si el promedio
de la muestra es igual a un promedio
conocido o meta conocida.
Prueba t de 2 muestras : Prueba si los dos
promedios de las muestras son iguales.
ANOVA de un factor: Prueba si más de dos
promedios de las muestras son iguales.
ANOVA de dos factores : Prueba si los
promedios de las muestras clasificadas
bajo dos categorías, son iguales.

Correlación : Prueba la relación lineal entre
dos variables.

Regresión : Define la relación lineal entre una
variable dependiente y una independiente.
(Aquí la "normalidad" se aplica al valor
residual de la regresión)

Datos Normales Datos No Normales
Resumen de pruebas de Hipótesis
412
Revise y asegúrese de que los datos no siguen una distribución normal.

• Desarrollar una Prueba de normalidad (para verificar realmente lo
anormal. Para la prueba de Bartlet el valor de p debe ser < 0.05)

• Desarrollar una Prueba de Corridas (para verificar que no existen
sucesos no aleatorios que puedan haber distorsionado la información)

• Revisar la información para detectar errores (tipográficos, etc.).
Investiguar los valores atípicos.

• Una muestra pequeña (n < 30) proveniente de un universo normal, se
mostrará algunas veces como anormal.

Intentar transformar los datos. Las transformaciones comunes incluyen:
- Raíz cuadrada de todos los datos
- Logaritmo de todos los datos
- Cuadrado de todos los datos

• Si la información es todavía anormal, entonces usar las herramientas no
paramétricas.
Acciones a tomar con datos No Normales
413
 Promedio : Es la media aritmética de la información. Es la suma de todos
los datos, dividida entre el número de datos de referencia.

 Mediana: Valor del punto medio de los datos, cuando se ordenan en forma
ascendente (en caso de datos pares, obtener promedio).

 Moda : Valor que se repite con más frecuencia sobre el conjunto de datos.
Ejemplo:
Se cuestionó a veinte personas sobre cuánto tiempo les tomaba estar
listas para ir a trabajar, en las mañanas. Sus respuestas (en minutos) se
muestran más adelante. ¿Cuáles son el promedio y la mediana para esta
muestra?

30, 37, 25, 35, 42, 35, 35, 47, 45, 60
39, 45, 30, 38, 35, 40, 44, 55, 47, 43


7B8. Definiciones
414
Un dibujo dice más que mil palabras
El promedio puede estar influenciado considerablemente por los
valores atípicos porque, cuando se calcula un promedio, se incluyen los
valores reales de estos valores.

La mediana, por otra parte, asigna la misma importancia a todas las
observaciones, independientemente de los valores reales de los
valores atípicos, ya que es la que sencuentra en la posición media de
los valores ordenados.

Promedio = 40.35 Mediana = 39.5


-------+---------+---------+---------+---------+---------+------ C1
Promedio
Mediana
28.0 35.0 42.0 49.0 56.0 63.0
415

Pruebas Alternativas comúnmente usadas
Pruebas para datos No normales

• Prueba de Corridas : Calcula la
probabilidad de que un X número de
puntos de referencia, esté por encima o
por debajo del promedio aleatoriamente.

• Prueba de signos, de 1 muestra :
Prueba la probabilidad de que la
mediana de la muestra, sea igual al valor
hipotético.

• Prueba Mann-Whitney : Comprueba el
rango de dos muestras, por la diferencia
entre dos medianas del universo.

• Prueba de la Mediana de Mood :
Prueba para más de dos medianas del
universo. Más robusta para los valores
atípicos o para los errores en la
información.



Analogía con datos normales

• Prueba de Corridas (la misma
prueba para ambos tipos de
información)


• Prueba t de una muestra




• Prueba t de 2 muestras



• ANOVA de un factor

Considere los siguientes datos (que se muestran aquí en orden cronológico):
325, 210, 400, 72, 150, 145, 110, 507, 56, 120, 99, 144, 110, 110,
320, 290, 101, 0, 80, 500, 201, 50, 140, 80, 220, 180, 240, 309, 80

Es importante tener los datos registrados en orden cronológico.

Una representación gráfica de los datos se asemeja a esto:
0
100
200
300
400
500
600
Promedio
Primera
"corrida"
Segunda ”racha"
Número total de Rachas: 12
Número total de puntos > al promedio: 11
Número total de puntos < al promedio: 18
Racha: Un punto o una serie consecutiva de puntos que caen
en un lado del promedio.


Prueba de Rachas
Prueba de Rachas
Promedio K = 184.4483

Número de rachas observado = 12

Número de rachas esperado = 14.6552
=> No se rechaza Ho
11 observaciones por encima de K; 18 por
debajo
La prueba es significativa en p= 0.2860
No se puede rechazar Ho con valor alfa = 0.05
Este es el valor p
de las Prueba de
Corridas
Prueba de Rachas
H
o
: Los datos son aleatorios
H
a
:Los datos NO so aleatorios
Ya que p > 0.05, no podemos rechazar la hipótesis nula.
Los datos son aceptados, siendo aleatorios.
Promedio
418
Cálculos de la Prueba de Rachas
El estadístico Z cuando n > 20 se calcula como:

Z = (G - MediaG) / DesvStG

Con MediaG = 1 + (2n1*n2) / (n1 + n2)
DesvStG = Raiz [ (2n1*n2) (2n1*n2 - n1 -n2) / (n1 + n2)^2* (n1+n2 -1)

Del ejemplo anterior G = 12; n1 = 11 n2 = 18

MediaG = 14.655 DesStG = 2.4843

Z1 = (12 - 14.655) / 2.4843 = -1.0687
P(Z1) = 0.1430 y para dos colas se tiene

P(Z1) + P(Z2) = 0.2860 > Alfa crítico de 0.05, no rechazándose Ho

Si las n1 y n2 son menores a 21, entonces se consulta la tabla de
valores críticos para el número de Rachas G
419
Corrida con Minitab
 Stat > Nonparametrics > Runs Test
Variable C1, Above and below the mean
P > 0.05
No rechazar
Ho
Runs Test: C1
Runs test for C1
Runs above and below K = 184.448
The observed number of runs = 12
The expected number of runs = 14.6552
11 observations above K, 18 below
P-value = 0.285
420
Prueba de Signos de la Mediana
H
o
: La mediana de la muestra es igual a la mediana de la hipótesis
H
a
: Las medianas son diferentes
Ejemplo (usando los datos del ejemplo anterior):

Ho: Valor de la mediana = 115.0
Ha: Valor de la mediana diferente de 115.0

N DEBAJO IGUAL ENCIMA VALOR P MEDIANA
29 12 0 17 0.4576 144.0
Ya que p >0.05, no se puede rechazar la hipótesis nula.
No se puede probar que la mediana real y la mediana hipotética son
diferentes.

En las páginas siguientes se muestra el detalle del cálculo.
421
Cálculos de la Prueba de Signos de la Mediana
Ejemplo: Con los datos del ejemplo anterior y ordenándo de menor a
mayor se tiene: n = 29, Mediana de Ho = 115

No. Valor Signo No. Valor Signo No. Valor Signo
1 0 - 11 110 - 21 220 +
2 50 - 12 110 - 22 240 +
3 56 - 13 120 + 23 290 +
4 72 - 14 140 + 24 309 +
5 80 - 15 144 + 25 320 +
6 80 - 16 145 + 26 325 +
7 80 - 17 150 + 27 400 +
8 99 - 18 180 + 28 500 +
9 101 - 19 201 + 29 507 +
10 110 - 20 210 +

Con la mediana en 144. Si el valor contra el cual se desea
probar es 115, entonces hay 12 valores por debajo de el (-) y 17
valores por arriba (+).

422
Cálculos de la Prueba de Signos de la Mediana

El estadístico X es el el número de veces que ocurre el signo menos
frecuente, en este caso el 12 (-).

Cómo n > 25, se calcula el estadístico Z para la prueba de signos con:

Z = [ (Y + 0.5) - (0.5*n) ]/ 0.5 \ n

En este caso Z1 = - 0.74278 y P(Z1) = 0.2288 para la cola izquierda
en forma similar P(Z2) 0-2288 para la cola derecha, por lo que la
probabilidad total es 0.4576 >> 0.05 del criterio de rechazo.

Si n hubiera sido < 25 entonces se hubiera consultado la tabla de
valores críticos para la prueba de signo.


423
Prueba de Signos de la Mediana
Bueno, veamos una gráfica de la información
100 200 300 400 0 500
¿Es esto correcto?¿144 podría ser igual a 115?
115 144
Después de todo, tal vez
esto SEA lo correcto.
424
Corrida en Minitab
 Stat > Nonparametrics > 1-Sample sign Variable C1
Confidence interval 95% Test Median 115 Alternative Not equal








Como P > 0.05 no se rechaza Ho y la mediana es 115
Sign Test for Median: Signos
Sign test of median = 115.0 versus not = 115.0

N Below Equal Above P Median
Signos 29 12 0 17 0.4583 144.0
425
Prueba de Signos de la Mediana
Para observaciones pareadas
Calificaciones de amas de casa a dos limpiadores de ventanas:

Ho: p = 0.5 no hay preferencia de A sobre B
Ha: p<>0.5
Ama Limpiador
B
Casa A
1 10 7
2 7 5
3 8 7
4 5 2
5 7 6
6 9 6
¿Hay evidencia que indique
cierta preferencia de las amas
de casa por lo limpiadores?
426
Prueba de Signos de la Mediana
Producto
B
Familia A
1 - +
2 - +
3 + -
4 - +
5 0 0
6 - +
7 - +
8 + -
9 - +
10 - +
11 - +
¿Hay evidencia que indique
cierta preferencia por un
Producto A o B?
Media = 0.5*n
Desv. Estand.= 0.5*raiz(n)

Zc = (Y – media) / Desv. Estánd.
Rechazar Ho si Zc ><Zalfa/2
427
Prueba de Signos de la Mediana
Como Zc < Zexcel no se rechaza Ho o
Como p value = 0.067 > 0.025
No hay evidencia suficiente de que los
Consumidores prefieran al producto B
Media = 0.5*11 = 5.5
Desv. Estand.= 0.5*raiz(n) = 1.67

Para Zc = (8 – 5.5) / 1.67 = 1.497

Zexcel = 1.96 para alfa/2 = 0.025

428
Prueba rango con signo de Wilconox
 Es la alternativa no paramétrica de la prueba paramétrica de muestras
pareadas
 Ejemplo: HO: Las poblaciones son idénticas Ha: Caso contrario
Trabaja
dor
Método
1
Método
2
Diferen
cias
Abs(difere
n.) Rango
Rango
c/signo
1 10.2 9.5 0.7 0.7 8 8
2 9.6 9.8 -0.2 0.2 2 -2
3 9.2 8.8 0.4 0.4 3.5 3.5
4 10.6 10.1 0.5 0.5 5.5 5.5
5 9.9 10.3 -0.4 0.4 3.5 -3.5
6 10.2 9.3 0.9 0.9 10 10
7 10.6 10.5 0.1 0.1 1 1
8 10 10 0 0 Eliminar
9 11.2 10.6 0.6 0.6 7 7
10 10.7 10.2 0.5 0.5 5.5 5.5
11 10.6 9.8 0.8 0.8 9 9
T = 44
429
Prueba rango con signo de Wilconox
Distribución muestral T para poblaciones idénticas
Se aproxima a la distribución normal para n >= 10




En este caso n = pares eliminando las que son iguales con dif. = 0 para el
trabajador 8.

o = raiz(10 x 11 x 21/6) = 19.62
Z = (T – µ)/o = 44/19.62 = 2.24

Z alfa/2 = Z0.025 = 1.96

Como Zc = 2.24 > Z0.025 se rechaza Ho, los métodos son diferentes



0 =
T
µ
6
) 1 2 )( 1 ( + +
=
n n n
T
o
430
Prueba en Minitab para prueba de
mediana con Wilconox
 File> Open worksheet > Exh_Stat
 Stat > Nonparametrics > 1-Sample Wilconox
Variables C1 Test Median 77
Altenative Not equal
Achievement
77
88
85
74
75
62
80
70
83
Wilcoxon Signed Rank Test: Achievement
Test of median = 77.00 versus median not = 77.00
for Wilcoxon Estimated
for Wilcoxon Estimated
N Test Statistic P Median
Achievement 9 8 19.5 0.889 77.50

Ho: Mediana = 77 Ha: Mediana <> 77
Como P de 0.889 >> alfa de 0.05 no se rechaza Ho
431
Prueba de Mann-Whitney
Se llevó a cabo un estudio que analiza la frecuencia del pulso en dos
grupos de personas de edades diferentes, después de diez minutos de
ejercicios aeróbicos.

Los datos resultantes se muestran a continuación.



Edad 40-44
C1
140
135
150
140
144
154
160
144
136
148

Edad 16-20
C2
130
166
128
126
140
136
132
128
124

¿Tuvieron diferencias
significativas las frecuencias de
pulso de ambos grupos?
432
Prueba de Mann-Whitney
 Ordenando los datos y asignándoles el (rango) de su posición relativa se tiene (promediando
posiciones para el caso de que sean iguales):
Edad 40-44
C1
(7) 135
(8.5) 136
(11) 140
(11) 140
(13.5) 144
(13.5) 144
(15) 148
(16) 150
(17) 154
(18) 160

n1 = 10
Ta = 130.5


Edad 16-20
C2
(1) 124
(2) 126
(3.5) 128
(3.5) 128
(5) 130
(6) 132
(8.5) 136
(11)140
(15)166


n2 = 9
Tb = 55.5

433
Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
Ha: Las distribuciones de frecuencias relativas poblacionales no son idénticas
Ho: q1 = q2 Ha: q1 = q2 q1, q2 = Medianas de las poblaciones
Ordenando los datos y asignándoles su posición relativa se tiene:
Ua = n1*n2 + (n1) * (n1 + 1) /2 - Ta
Ub = n1*n2 + (n2) * (n2 + 1) /2 - Tb
Ua + Ub = n1 * n2

Ua = 90 + 55 - 130.5 = 14.5 P(Ua) = 0.006 Ub = 90 + 45 - 55.5 = 79.5
El menor de los dos es Ua.
Para alfa = 0.05 el valor de Uo = 25
Como Ua < 25 se rechaza la Hipótesis Ho de que las medianas son iguales.


Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente
existe una diferencia significativa entre los dos grupos de edad.
434
Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
Ha: Las distribuciones de frecuencias relativas poblacionales no son idénticas

Ua = 14.5 Ub = 79.5
Utilizando el estadístico Z y la distribución normal se tiene:
45 12.24
Z = [ (U - (n1* n2 / 2 ) / Raiz (n1 * n2 * (n1 + n2 + 1) / 12)
Con Ua y Ub se tiene:
Za = (14.5 - 45) / 12.24 = - 2.49 P(Z) = 0.0064 similar a la anterior
Zb = (79.5 -45) / 12.24 = 2.81 P(total) = 2 * 0.0064 = 0.0128 menor o = 0.05
El valor crítico de Z para alfa 0.025 por ser prueba de dos colas, es 1.96.
Como Za > Zcrítico se rechaza la Hipótesis Ho de que las medianas son iguales.


Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente
existe una diferencia significativa entre los dos grupos de edad.
Prueba de Mann-Whitney
4
0
-
4
4

a
ñ
o
s

d
e

e
d
a
d

16-20 años de edad
Diferencias entre los encabezados de
los renglones y las columnas
De esta manera, se calcula la mediana de todas estas diferencias, denominada
"punto estimado". Este punto estimado es una aproximación de la diferencia entre
las medianas de los dos grupos (ETA1 y ETA2).

Una vez ajustados los "enlaces" (eventos de un mismo valor en ambos grupos de
información), Minitab usa este punto estimado para calcular el valor p.
130 166 128 126 140 136 132 128 124
140 10 -26 12 14 0 4 8 12 16
135 5 -31 7 9 -5 -1 3 7 11
150 20 -16 22 24 10 14 18 22 26
140 10 -26 12 14 0 4 8 12 16
144 14 -22 16 18 4 8 12 16 20
154 24 -12 26 28 14 18 22 26 30
160 30 -6 32 34 20 24 28 32 36
144 14 -22 16 18 4 8 12 16 20
136 6 -30 8 10 -4 0 4 8 12
148 18 -18 20 22 8 12 16 20 24
436
Corrida en Minitab
 Stat > Nonparametrics > Mann Whitney
First Sample C1 Second Sample C2 Conf. Level 95%
Alternative Not equal
Mann-Whitney Test and CI: C1, C2
N Median P>0.05
C1 10 144.00 Se rechaza Ho
C2 9 130.00
Point estimate for ETA1-ETA2 is 12.00
95.5 Percent CI for ETA1-ETA2 is (4.01,20.00)
W = 130.5
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0143
The test is significant at 0.0140 (adjusted for ties)
437
Prueba de Kruskal Wallis
Ordenando los datos de ventas y asignándoles el (rango) de su posición relativa se tiene
(promediando posiciones para el caso de que sean iguales):
Zona 1
(15.5) 147
(17.5) 17.5
(9) 128
(19) 162
(12) 135
(10) 132
(22) 181
(13) 138



n1 = 8
Ta = 118


Zona 2
(17.5) 160
(14) 140
(21) 173
(4) 113
(1) 85
(7) 120
(25) 285
(5) 117
(11) 133
(6) 119

n2 = 10
Tb = 111.5

Zona 3
(24) 215
(8) 127
(2) 98
(15.5) 127
(23) 184
(3) 109
(20) 169




n3 = 7
Tc = 95.5


N = n1 + n2 + n3 = 25
438
Prueba de Kruskal Wallis
Ho: Las poblaciones A, B y C son iguales
Ha: Las poblaciones no son iguales
Ho: q1 = q2 = q3 Ha: q1 = q2 = q3 ; q1, q2, q3 = Medianas de las poblaciones

Calculando el valor del estadístico H se tiene:
H = [ 12 /( N* ( N + 1)) ] * [ Ta
2
/ n1 + Tb
2
/ n2 + Tc
2
/ n3 ] - 3 * ( N +1 )
H = 0.01846 * (1740.5 + 1243.225 + 1302.893 ) - 78 = 1.138

Se compara con el estadístico _
2
para o = 0.05 y G.l. = k - 1 = 3-1 = 1 (k muestras)
_
2
crítico = 5.991 (válido siempre que las muestras tengan al menos 5 elementos)

Como H < _
2
crítico, no se rechaza la Hipótesis Ho: Afirmando que no hay
diferencia entre las poblaciones

439
Corrida en Minitab
 Stat > Nonparametrics > Kruskal Wallis
Response C1 Factor C2 OK
Kruskal-Wallis Test: Datos versus Factor
Kruskal-Wallis Test on Datos
Factor N Median Ave Rank Z
Zona 1 7 138.0 14.7 0.98
Zona 2 10 126.5 11.1 -0.82
Zona 3 7 127.0 12.3 -0.10
Overall 24 12.5 P > 0.05
H = 1.08 DF = 2 P = 0.581 No se rechaza Ho
H = 1.09 DF = 2 P = 0.581 (adjusted for ties)
440
Prueba de Medianas de Mood
 Realiza prueba de hipótesis de igualdad de medias en un diseño de una
vía. La prueba es robusta contra Outliers y errores en datos y es
adecuada para análisis preliminares

 Determina si K grupos independientes han sido extraidas de la misma
población con medianas iguales o poblaciones con formas similares

 Con base en la gran mediana, anotar un signo positivo si la
observación excede la mediana o un signo menos si es menor. Los
valores que coincidan se reparten en los grupos

 Hacer una tabla de contingencia K x 2 con las frecuencias de signos
más y menos en cada grupo K
441
Prueba de Medianas de Mood
 Se determina el estadístico Chi Cuadrada con:





Probar Ho: Todas las medianas son iguales
Ha: Al menos una mediana es diferente

Se compara Chi Cuadrada calculada con Chi Cuadrada de alfa para
0.05 y (reng – 1)*(Col – 1) grados de libertad

¿
÷
=
E
E O
2
2
) (
_
442
Corrida con Minitab
Se les da a 179 participantes una conferencia con
dibujos para ilustrar el tema. Después se les da la
prueba OTIS que mide la habilidad intelectual. Los
participantes se clasificaron por nivel educativo 0-No
prof., 1-Prof., 2-Prepa

Ho: h1 = h2 = h3 Ha: no todas las medianas son
iguales
 File > Open Worksheet > Cartoon.mtw
 Stat > Nonparametrics > Mood’s Median Test
Response Otis Factor ED Ok
443
Corrida con Minitab
Mood Median Test: Otis versus ED
Mood median test for Otis P>0.05
Chi-Square = 49.08 DF = 2 P = 0.0005 Se rechaza Ho
Individual 95.0% CIs
ED N<= N> Median Q3-Q1 ----+---------+---------+---------
+--
0 47 9 97.5 17.3 (-----*-----)
1 29 24 106.0 21.5 (------*------)
2 15 55 116.5 16.3 (----*----)
----+---------+---------+---------+--
96.0 104.0 112.0 120.0
Overall median = 107.0
444
Diseños factoriales aleatorias
bloqueados de Friedman
Esta prueba es una alternativa al ANOVA de dos vías, es
una generalización de las pruebas pareadas con
signo. La aditividad es requerida para para estimar
los efectos de los tratamientos

Ho: Los tratamientos no tienen un efecto significativo
Ha: Algunos tratamientos tienen efecto significativo


445
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados de salida:
 Se muestra el estadístico de prueba con distribución
Chi Cuadrada aproximada con gl = Tratamientos – 1.

 Si hay observaciones parecidas en uno o más
bloques, se usa el rango promedio y se muestra el
estadístico corregido

 La mediana estimada es la gran mediana más el
efecto del tratamiento
446
Diseños factoriales aleatorias
bloqueados de Friedman
Ejemplo:
 Se evalúa el efecto del tratamiento de una droga en
la actividad enzimática con tres niveles, probado en
cuatro animales

 Open the worksheet EXH_STAT.MTW.
 Stat > Nonparametrics > Friedman.
Response, seleccionar EnzymeActivity.
En Treatment, seleccionar Therapy.
En Blocks, seleccionar Litter. Click OK.
447
Diseños factoriales aleatorias
bloqueados de Friedman
Datos:
EnzymeActivity Therapy Litter
0.15 1 1
0.26 1 2
0.23 1 3
0.99 1 4
0.55 2 1
0.26 2 2
-0.22 2 3
0.99 2 4
0.55 3 1
0.66 3 2
0.77 3 3
0.99 3 4
448
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:
Friedman Test: EnzymeActivity versus Therapy
blocked by Litter
S = 2.38 DF = 2 P = 0.305 No rechazar Ho
S = 3.80 DF = 2 P = 0.150 (adjusted for ties)
Sum
of
Therapy N Est Median Ranks
1 4 0.2450 6.5
2 4 0.3117 7.0
3 4 0.5783 10.5
Grand median = 0.3783
449
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:
 El estadístico de prueba S tiene un valor P de 0.305 sin ajustar
para observaciones en cero y 0.150 para el valor ajustado.

 Por tanto no hay evidencia suficiente para rechazar Ho

 Las medianas estimadas asociadas con los tratamientos son la
gran mediana más los efectos estimados de los tratamientos.

 El estadístico de prueba se determina con base a los rangos en
cada bloque y totales
450
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:
451
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:
452
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:
453
Prueba de igualdad de
varianzas de Levene
 Se usa para probar la hipótesis nula de que las varianzas de k
múltiples poblacionales son iguales

 Las igualdad de varianzas en las muestras se denomina
homogeneidad de varianzas

 La prueba de Levene es menos sensible que la prueba de
Bartlett o la prueba F cuando se apartan de la normalidad

 La prueba de Bartlett tiene un mejor desempeño para la
distribución normal o aproximadamente normal
454
Prueba de igualdad de
varianzas de Levene
Para dos muestras el procedimiento es como sigue:

 Determinar la media

 Calcular la desviación de cada observación respecto a la
media

 Z es el cuadrado de las desviaciones respecto a la media

 Aplicar la prueba t a las dos medias de los datos
455
Prueba de igualdad
de Varianzas-Minitab
Se estudian tamaños de papa
inyectando con bacterias y
sujetas a diferentes
temperaturas. Antes del
ANOVA se verifica la
igualdad de varianzas

 Stat > ANOVA > Test for
equal variances
Response Rot
Factors Temp Oxigen
Confidence level 95%

Rot Temp Oxygen
13 10 2
11 10 2
3 10 2
10 10 6
4 10 6
7 10 6
15 10 10
2 10 10
7 10 10
26 16 2
19 16 2
24 16 2
15 16 6
22 16 6
18 16 6
20 16 10
24 16 10
8 16 10
456
Resultados
457
Resultados
Test for Equal Variances: Rot versus Temp, Oxygen
95% Bonferroni confidence intervals for standard deviations
Temp Oxygen N Lower StDev Upper
10 2 3 2.26029 5.29150 81.890
10 6 3 1.28146 3.00000 46.427
10 10 3 2.80104 6.55744 101.481
16 2 3 1.54013 3.60555 55.799
16 6 3 1.50012 3.51188 54.349
16 10 3 3.55677 8.32666 128.862
Bartlett's Test (normal distribution)
Test statistic = 2.71, p-value = 0.744 P>0.05 no rechazar Ho
Levene's Test (any continuous distribution)
Test statistic = 0.37, p-value = 0.858
458
Prueba de la concordancia del
Coeficiente de Kendall
 El coeficiente expresa el grado de asociación entre las
calificaciones múltiples realizadas por un evaluador

Ho: Las variables son independientes
Ha: Las variables están asociadas

 Kendall usa la información relacionada con las calificaciones
relativas y es sensible a la seriedad de mala clasificación

Por ejemplo para K = jueces N = Muestras = 10

Rango medio = 220 / 22 S = 1066 Gl = n-1 = 9
Chi Cuadrada crítica = X
2
0.01,9 = 21.67
459
Prueba de la concordancia del
Coeficiente de Kendall
 El Estadístico Chi Cuadrada calculado es:





 Como Chi Cuadrada de alfa es menor que la calculada, los
cuatro jueces están asociados significativamente. Constituyen
un panel uniforme. No quiere decir que estén en lo correcto,
solo que responden de manera uniforme a los estímulos
460
El coeficiente de correlación de
rangos de Spearman (r
s
)
 El coeficiente de correlación es una medida de la asociación que
requiere que ambas variables sean medidas en al menos una
escala ordinal de manera que las muestras u observaciones a
ser analizadas pueden ser clasificadas en rangos en dos series
ordenadas

Ho: Las variables son independientes
Ha: Las variables están asociadas

 Para el ejemplo anterior si N = 10, el coeficiente es:
N N
d
r
s
÷
÷ =
¿
3
2
6
1
97 . 0 03 . 0 1
990
) 5 . 5 ( 6
1 = ÷ = ÷ =
s
r
461
Coeficiente de correlación de
rangos para monotonía de
preferencias
Una persona interesada en adquirir un TV asigna
rangos a modelos de cada uno de 8 fabricantes

Preferencia

Precio
(rango)
Fab.
1 7 449.50 (1)
2 4 525.00 (5)
3 2 479.95 (3)
4 6 499.95 (4)
5 1 580.00 (8)
6 3 549.95 (7)
7 8 469.95 (2)
8 5 532.50 (6)


Di cuadrada
Rango
Di
6 36
-1 1
-1 1
2 4
-7 49
-4 16
6 36
-1 1
462
Coeficiente de correlación de
rangos para monotonía de
preferencias
Ho: No existe asociación entre los rangos
Ha: Existe asociación entre los rangos o es positiva o negativa

El coeficiente de correlación de rangos de Spearman es:

Rs = 1 – 6*suma(di cuadrada) / (n(n cuadrada – 1))

En este caso: Rs = 1 – 6(144)/(8*(64-1) = -0.714

R0 se determina de la tabla de Valores críticos del coeficiente de
correlación del coeficiente de correlación de rangos de Spearman

Rt = 0.686

Por tanto si hay asociación significativa en las preferencias


463
Tabla de constantes
n Alfa=0.05 Alfa = 0.025
5 0.900 -
6 0.829 0.886
7 0.714 0.786
8 0.643 0.738
9 0.600 0.683
10 0.564 0.648
11 0.523 0.623
12 0.497 0.591
13 0.475 0.566
14 0.457 0.545
15 0.441 0.525
16 0.425 0.507
17 0.412 0.490
18 0.388 0.476
19 0.377 0.462
20 0.368 0.450
21 0.359 0.438
22 0.351 0.428
23 0.343 0.418
24 0.336 0.409
25 0.329 0.400
26 0.329 0.392
27 0.323 0.385
28 0.317 0.377
29 0.311 0.370
30 0.305 0.364
464
Corrida con Minitab
Para la corrida en Minitab primero se
deben determinar los rangos en
forma manual para las variables X
y Y.
 Stat > Basic statistics > Correlation
Variables Preferencia Precio
Fabric
ante
Prefe-
rencia Precio
Preci
o
1 7 1 449
2 4 5 525
3 2 3 479
4 6 4 499
5 1 8 580
6 3 7 549
7 8 2 469
8 5 6 532
Correlations: Preferencia, Precio
Pearson correlation of
Preferencia and Precio = -0.714
P-Value = 0.047
465
Ejemplo con Minitab
Se estudia la relación entre colágeno y
Proline en pacientes con cirrosis
 Stat > Basic statistics > Correlation
Variables Colágeno Proline
Paciente Colágeno Proline
1 7.1 2.8
2 7.1 2.9
3 7.2 2.8
4 8.3 2.6
5 9.4 3.5
6 10.5 4.6
7 11.4 5
Correlations: Colageno, Proline
Pearson correlation of Colageno
and Proline = 0.935
P-Value = 0.002
466
Resumen de pruebas
no paramétricas
 Prueba de signos de 1 muestra: Prueba la igualdad de la
mediana a un valor y determina el intervalo de confianza

 Prueba de Wilconox de 1 muestra: Prueba la igualdad de la
mediana a un valor con rangos con signo y determina el
intervalo de confianza

 Comparación de dos medianas poblacionales de Mann Whitney:
Prueba la igualdad de las medianas y determina el intervalo de
confianza


467
Resumen de pruebas
no paramétricas

 Comparación de igualdad de medianas poblacionales de Kruskal
Wallis: Prueba la igualdad de las medianas en un diseño de una
vía y determina el intervalo de confianza


 Comparación de medianas poblacionales de Mood: Prueba la
igualdad de medianas con un diseño de una vía



468
469
470
VI.C Análisis del Modo y
Efecto de Falla (FMEA)
471
¿ Qué es el FMEA?
El Análisis de del Modo y Efectos de Falla es un grupo sistematizado de
actividades para:

 Reconocer y evaluar fallas potenciales y sus efectos.

 Identificar acciones que reduzcan o eliminen las
probabilidades de falla.

 Documentar los procesos con los hallazgos del análisis.

 Existe el estándar MIL-STD-1629, Procedure for Performing a Failure
Mode, Effects and Criticality Analysis
472
Propósitos del FMEA
 Mejorar la calidad, confiabilidad y seguridad de los
productos y procesos evaluados

 Reducir el tiempo y costo de re-desarrollo del producto

 Documenta y da seguimiento a acciones tomadas para
reducir el riesgo

 Soporta el desarrollo de planes de control robustos
473
Propósitos del FMEA
 Soporta el desarrollo de planes de verificación del
desarrollo de diseño robusto

 Apoya a priorizar y enfocarse en eliminar/reducir
problemas de proceso y producto y/o previene la
ocurrencia de problemas

 Mejora la satisfacción del cliente/consumidor
474
Tipos del FMEA
 AMEF de concepto (CFMEA)
 A nivel de sistema, subsistema y componente

 AMEF de diseño (DFMEA)

 AMEF de Proceso (PFMEA)

 AMEF de maquinaria (como aplicación del DFMEA)
475
Tipos de FMEAs
 FMEA de Diseño (AMEFD), su propósito es analizar como
afectan al sistema los modos de falla y minimizar los
efectos de falla en el sistema. Se usan antes de la
liberación de productos o servicios, para corregir las
deficiencias de diseño.

 FMEA de Proceso (AMEFP), su propósito es analizar como
afectan al proceso los modos de falla y minimizar los
efectos de falla en el proceso. Se usan durante la
planeación de calidad y como apoyo durante la producción
o prestación del servicio.
476
PFMEA o AMEF de Proceso
Fecha límite:
Concepto Prototipo Pre-producción /Producción
FMEAD
FMEAP
FMEAD FMEAP
Característica de Diseño Paso de Proceso
Falla Forma en que el Forma en que el proceso falla
producto o servicio falla al producir el requerimiento
que se pretende
Controles Técnicas de Diseño de Controles de Proceso
Verificación/Validación

477
Flujo del FMEA y su rol
en evitar el Modo de Falla
 DFMEA
 Es un análisis detallado de los modos de falla
potenciales relacionados con las funciones primarias y
de interfases del sistema.

 Es el documento primario para demostrar que se han
evitado errores e identifica los controles y acciones
para reducir los riesgos asociados
478
Beneficios de los tipos de FMEA
FMEA de Diseño
Soporta el proceso de diseño al reducir el riesgo de fallas
(incluyendo las salidas no intencionadas) por:

 Soporta la evaluación objetiva de diseño, incluyendo
requerimientos funcionales y alternativas de diseño

 Evaluar los diseños iniciales sobre requerimientos de
manufactura, ensamble, servicio y reciclado

 Incrementar la probabilidad de que los modos de falla
potencial y sus efectos en el sistema y operación del
producto se han considerado en el procesos de
diseño/desarrollo
479
Beneficios de los tipos de FMEA
FMEA de Diseño
 Proporcionar información adicional como apoyo en la
planeación exhaustiva de programas de diseño
eficiente, desarrollo y validación

 Desarrollo de una lista priorizada de modos de falla
potenciales de acuerdo a su efecto en el “cliente”
estableciendo un sistema de prioridades para mejoras
al diseño, desarrollo, validación, prueba y análisis

 Proporcionar un formato de problemas pendientes para
recomendar y dar seguimiento de acciones que
reduzcan el riesgo
480
Beneficios de los tipos de FMEA
FMEA de Proceso
Los beneficios de un FMEA de proceso incluyen:
 Identifica las funciones y requerimientos del proceso

 Identifica modos de falla potenciales relacionados con el
producto y proceso

 Evalúa los efectos de las fallas potenciales con el cliente

 Identifica las causas potenciales en el proceso de
manufactura

 Identifica las variables de proceso en las cuales hay que
enfocarse para reducir las fallas muy lejanas
481
Beneficios de los tipos de FMEA
FMEA de Proceso
Los beneficios de un FMEA de proceso incluyen:

 Identificar las variables del proceso centrandose en la
ocurrencia

 Reducción o detección de las condiciones de falla

 Identificar variables del proceso a las cuales enfocar el
control

 Desarrollar una lista ordenada clasificada de modos de falla
estandarizados para establecer un sistema de prioridades
482
Beneficios de los tipos de FMEA
FMEA de Proceso
 Sistema del prioridad del riesgo para consideraciones de
acciones preventivas y correctivas

 Documentar los resultados del proceso de manufactura o
proceso de ensamble

 Documenta los resultados del proceso de manufactura
o ensamble

 Identifica deficiencias del proceso para orientar a
establecer controles para reducir la ocurrencia de
productos no conformes o en métodos para mejorar su
detección


483
Beneficios de los tipos de FMEA
FMEA de Proceso
 Identifica características críticas y/o significativas
confirmadas

 Apoya en el desarrollo de Planes de Control a través de
todo el proceso de manufactura

 Identifica aspectos de preocupación en relación con la
seguridad del operador

 Retroalimenta información sobre cambios de diseño
requeridos y factibilidad de manufactura a las áreas de
diseño
484
Beneficios de los tipos de FMEA
FMEA de Proceso
 Se enfoca a modos de falla potenciales del producto
causados por deficiencias de manufactura o ensamble

 Confirma la necesidad de controles especiales en
manufactura y confirma las “Características Especiales”
designadas en el DFMEA

 Identifica modos de falla del proceso que pudieran
violar las reglamentaciones del gobierno o
comprometer la seguridad del personal, identificando
otras “Características especiales” – de Seguridad del
operador (OS) y con alto impacto (HI)

485
Salidas del FMEA de Proceso
 Una lista de modos potenciales de falla

 Una lista de Caracteríticas críticas y/o significativas

 Una lista de características relacionadas con la
seguridad del operador y con alto impacto

 Una lista de controles especiales recomendados para
las Características Especiales designadas y
consideradas en el Plan de control
486
Salidas del FMEA de Proceso
 Una lista de procesos o acciones de proceso para
reducir la Severidad, eliminar las causas de los modos
de falla del producto o reducir su tasa de ocurrencia, y
mejorar la tasa de Detección de defectos si no se
puede mejorar la capacidad del proceso

 Cambios recomendados a las hojas de proceso y
dibujos de ensamble
487
Modos de fallas vs
Mecanismos de falla


 El modo de falla es el síntoma real de la falla (altos
costos del servicio; tiempo de entrega excedido).

 Mecanismos de falla son las razones simples o
diversas que causas el modo de falla (métodos no
claros; cansancio; formatos ilegibles) o cualquier otra
razón que cause el modo de falla


488
Definiciones

Modo de Falla

- La forma en que un producto o proceso puede fallar para cumplir
con las especificaciones o requerimientos.

- Normalmente se asocia con un Defecto, falla o error.

Diseño Proceso
Alcance insuficiente Omisiones
Recursos inadecuados Monto equivocado
Servicio no adecuado Tiempo de respuesta excesivo

489
Definiciones

Efecto
- El impacto en el Cliente cuando el Modo de Falla no se previene
ni corrige.

- El cliente o el siguiente proceso puede ser afectado.

Ejemplos: Diseño Proceso
Serv. incompleto Servicio deficiente
Operación errática Claridad insuficiente
Causa
- Una deficiencia que genera el Modo de Falla.
- Las causas son fuentes de Variabilidad asociada con variables de
Entrada Claves

Ejemplos: Diseño Proceso
Material incorrecto Error en servicio
Demasiado esfuerzo No cumple requerimientos

490
Preparación del AMEF
 Se recomienda que sea un equipo
multidisciplinario

 El responsable del sistema, producto o proceso
dirige el equipo, así como representantes de las
áreas involucradas y otros expertos en la materia
que sea conveniente.

491
 Al diseñar los sistemas, productos y procesos nuevos.
 Al cambiar los diseños o procesos existentes o que serán
usados en aplicaciones o ambientes nuevos.

 Después de completar la Solución de Problemas (con el fin de
evitar la incidencia del problema).

 El AMEF de diseño, después de definir las funciones del
producto, antes de que el diseño sea aprobado y entregado
para su manufactura o servicio.

 El AMEF de proceso, cuando los documentos preliminares del
producto y sus especificaciones están disponibles.
¿Cuando iniciar un FMEA?
492
FMEA de Diseño - DFMEA
493
AMEF de Diseño


 El DFMEA es una técnica analítica utilizada por el
equipo de diseño para asegurar que los modos de
falla potenciales y sus causas/mecanismos asociados,
se han considerado y atendido
494
AMEF de Diseño
 El proceso inicia con un listado de lo que se espera
del diseño (intención) y que no hará el diseño

 Las necesidades y expectativas de los clientes de
determinan de fuentes tales como el QFD,
requerimientos de diseño del producto, y/o
requerimientos de manufactura/ensamble/servicio.

 Entre mejor se definan las características deseadas,
será más fácil identificar Modos de de falla
potenciales para toma de acciones correctivas /
preventivas.
495
Equipo de trabajo
 El equipo se divide en dos secciones:

 El equipo central (“core”) que participa en todas las
fases del FMEA y el equipo de soporte que apoya
conforme es requerido

 El apoyo de la alta dirección es crucial para el éxito
496
Alcance del DMEA
 El alcance se establece en el Diagrama de límites
(Boundary Diagram) por medio de consenso con el
equipo de:

 ¿Qué se va incluir? ¿Qué se va a excluir?

 Establecer los límites adecuados antes de hacer el
DFMEA evitará entrar en áreas que no se están
revisando o creando, para asegurar que el equipo
adecuado realice el análisis
497
Alcance del DMEA
 Para determinar la amplitud del alcance, se deben hacer las
decisiones siguientes:

 Determinar la estabilidad del diseño o desarrollo del proceso, a
lo mejor primero se deben aclarar y resolver asuntos pendientes
antes del DMFEA, ¿está finalizado o es un punto de control?

 ¿Cuántos atributos o características están todavía bajo discusión
o la necesidad debe determinarse?

 ¿Qué tan avanzado va el diseño o proceso para su terminación?
Tendrá cambios


498
Entradas al DFMEA
Herramientas de robustez
 Su propósito es reducir la probabilidad de campañas
de calidad, mejorar la imagen, reducir reclamaciones
de calidad e incrementar la satisfacción del cliente

 Se generan del diagrama P que identifica los cinco
factores de ruido, para ser atendidos a tiempo
haciendo al diseño insensible al ruido

499
Modelo DFMEA – Paso 1
Funciones
 Identificar todas las funciones en el alcance
 Identificar como cada una de las funciones puede fallar (Modos
de falla)

 Identificar un grupo de efectos asociados para cada modo de
falla
 Identificar el rango de severidad para cada uno de los grupos
de efectos que prioriza los modos de falla

 Si es posible recomendar acciones para eliminar los modos de
falla sin atender las “causas”
 Completar pasos 2 y 3
500
Modelo DFMEA – Paso 1
Funciones
 La función da respuesta a ¿Qué se supone que hace este
artículo?

 Las funciones son intenciones del diseño o especs. de ing. y:

 Se escriben en forma de verbo/nombre/caract. medible

 La característica Medible o SDS: Puede ser
verificada/validada; incluye parámetros adicionales o
parámetros de diseño como especificaciones de servicio,
condiciones especiales, peso, tamaño, localización y
accesibilidad o requerimientos de estándares (v. gr. EMVSS)
501
Modelo DFMEA – Paso 1
Funciones
 Las funciones representan las expectativas, necesidades y
requerimientos tanto explícitos como no explícitos de los
clientes y sistemas

 Las funciones no pueden “fallar” si no son medibles o
especificadas

Ejemplos:
 Almacenar fluido, X litros sin fugas
 Controlar el flujo, X centímetros cúbicos por segundo
 Abrir con X fuerza
 Mantener la calidad del fluido durante X años bajo
condiciones de operación
502
Modelo DFMEA – Paso 1
Modos de falla potenciales
 Son las formas en las cuales un componente, subsistema o
sistema pueden potencialmente no cumplir o proporcionar la
función intencionada, pueden ser también las causas

 El Modo de falla en un sistema mayor puede ser el efecto de un
componente de menor nivel

 Listar cada uno de los modos de falla potenciales asociados con
el artículo en particular y con su función (revisar el historial de
garantías y fallas o hacer tormenta de ideas

 También se deben considerar modos de falla potenciales que
pudieran ocurrir sólo bajo ciertas condiciones (vg. Calor, frío,
humedad, polvo, etc)
503
Modelo DFMEA – Paso 1
Tipos de Modos de falla potenciales
 No funciona
 Funciona parcialmente / sobre función / degradación
con el tiempo

 Función intermitente
 A veces causado por los factores ambientales

 Función no intencionada
 Los limpiadores operan sin haber actuado el switch
 El coche va hacia atrás aún con la palanca en Drive


504
Modelo DFMEA – Paso 1
Preguntas para Modos Potenciales de falla
 ¿De que manera puede fallar este artículo para
realizar su función intencionada?

 ¿Qué puede salir mal (go wrong), a pesar de que el
artículo se fabrica de acuerdo al dibujo?

 ¿Cuándo se prueba la función, como se debería
reconocer su modo de falla?

 ¿Dónde y cómo operará el diseño?
505
Modelo DFMEA – Paso 1
Preguntas para Modos Potenciales de falla
 ¿Bajo que condiciones ambientales operará?
 ¿El artículo será usado en ensambles de más alto nivel?
 ¿Cómo interactúa/interfase con otros niveles del diseño?

 No introducir modos de fallas triviales que no pueden o no
ocurrirán

 Asumiendo la función:
 Almacenar fluido, X litros, 0 fugas, durante 10 años

 Sus modos de falla son:
 Almacenar < X, presenta fugas
506
Modelo DFMEA – Paso 1
Efectos Potenciales de falla
 Se definen como los efectos del modo de falla en la función
percibida por el cliente. Qué puede notar o experimentar ya sea
interno o final

 Establecer claramente si la función podría impactar a la
seguridad, o no cumplimiento de reglamentaciones

 Los efectos se establecen en términos de sisemas específicos,
subsistemas o componentes conforme sean analizados

 La intención es analizar los efectos de falla al nivel de experiecia
y conocimiento del equipo.
507
Modelo DFMEA – Paso 1
Efectos Potenciales de falla
 Describir las consecuencias de cada uno de los modos de falla
identificados en:
 Partes o componentes
 Ensambles del siguiente nivel
 Sistemas
 Clientes
 Reglamentaciones

 NOTA. Todos los estados de error del diagrama P deben ser
incluidos en la columna de Modos de falla o efectos del DMFEA
508
Modelo DFMEA – Paso 1
Ejemplos de Efectos Potenciales de falla
 Ruidos

 Operación errática – no operable

 Apariencia pobre – olores desagradables

 Operación inestable

 Operación intermitente

 Fugas

 Ruido de radiofrecuencia (EMC)
509
Modelo DFMEA – Paso 1
Severidad
 Es la evaluación asociada con el efecto más serio de la columna
anterior. Habrá sólo una severidad para cada modo de falla

 Para reducir la severidad es necesario hacer un cambio de
diseño

 La severidad se estima de la tabla siguiente
510
Rangos de Severidad (AMEFD)
Efecto Rango Criterio .
No 1 Sin efecto
Muy poco 2 Cliente no molesto. Poco efecto en el desempeño del componente o
servicio.
Poco 3 Cliente algo molesto. Poco efecto en el desempeño del comp. o
servicio.
Menor 4 El cliente se siente un poco fastidiado. Efecto menor en el desempeño
del componente o servicio.
Moderado 5 El cliente se siente algo insatisfecho. Efecto moderado en el
desempeño del componente o servicio.

Significativo 6 El cliente se siente algo inconforme. El desempeño del comp. o
servicio se ve afectado, pero es operable y está a salvo. Falla parcial,
pero operable.
Mayor 7 El cliente está insatisfecho. El desempeño del servicio se ve
seriamente afectado, pero es funcional y está a salvo. Sistema afectado.
Extremo 8 Cliente muy insatisfecho. Servicio inadecuado, pero a salvo. Sistema
inoperable.
Serio 9 Efecto de peligro potencial. Capaz de descontinuar el uso sin perder
tiempo, dependiendo de la falla. Se cumple con el reglamento del
gobierno en materia de riesgo.
Peligro 10 Efecto peligroso. Seguridad relacionada - falla repentina.
Incumplimiento con reglamento del gobierno.
511
Modelo DFMEA – Paso 1
Clasificación
 Cuando un modo de falla tiene un rango de severidad de 9 o
10, existe una característica crítica, se identifica como “YC” y se
inicia un FMEA de proceso

 Estas características del producto afectan su función segura y/o
cumplimiento de reglamentaciones gubernamentales y pueden
requerir condiciones especiales de manufactura, ensamble,
abastecimiento, embarque, monitoreo y/o acciones de
inspección o controles
512
Modelo DFMEA – Paso 1
Acciones recomendadas
 Eliminar el Modo de falla

 Mitigar el efecto

 Es necesario un énfasis especial en acciones posibles cuando la
severidad es 9 o 10. Para valores menores también se pueden
considerar acciones

 Para eliminar el modo de falla considerar la acción:
 Cambiar el diseño (vg. Geometría, material) si está
relaionado a una característica del producto

513
Modelo DFMEA – Paso 2
Identificar:
 Las Causas asociadas (primer nivel y raíz)

 Su tasa de ocurrencia estimada

 La designación de la característica adecuada (si
existe) a ser indicada en la columna de clasificación

 Acciones recomendadas para Severidad y Criticalidad
alta (S x O)
514
Model DFMEA – Paso 2
Causa potencial o mecanismo de falla
 La causa potencial de falla se define como un
indicador de debilidad del diseño cuya consecuencia
es el modo de falla

 Listar como sea posible, cada causa de falla y/o
mecanismo de falla para cada uno de los modos de
falla. El detalle de la descripción permitirá enfocar los
esfuerzos para atacar la causa pertinente

515
Model DFMEA – Paso 2
Causa potencial o mecanismo de falla
Se puede emplear un diagrama de Ishikawa o un Árbol de falla
(FTA), preguntarse:
 ¿Qué circunstancia pudo causar que fallara el artículo para su
fúnción?
 ¿Cómo podría fallar el artículo para cumplir con las
especificaciones?
 ¿Cómo pueden ser incompatibles artículos que interactúan?
 ¿Qué información desarrollada en los diagramas P y Matriz de
Interfase pueden identificar causas potenciales?
 ¿Qué puede causar que el artículo no de la función
intencionada?
 ¿Qué información en el Diagrama de límites pudo haberse
pasado que pueda causar este modo de falla?
 ¿En que puede contribuir el historial de 8Ds y FMEAs a las
causas potenciales?
516
Model DFMEA – Paso 2
Causa potencial o mecanismo de falla
Supuesto 1: El artículo se fabricó de acuerdo a especificaciones,
ejemplos de causas de falla:
 La especificación de Porosidad del material es muy alta
 La dureza del material especificada es muy baja

 El lubricante especificado es muy viscoso
 Torque especificado demasiado bajo

 Supuesto de confiabilidad inadecuada
 Degradación de parámetro del Componente

 Calor excesivo
517
Model DFMEA – Paso 2
Causa potencial o mecanismo de falla
Supuesto 2: El artículo puede incluir una deficiencia que causa
variabilidad introducida en el proceso de ensamble o
manufactura:

 Especificar un diseño simétrico que permita que la parte se
pueda instalar desde atrás o de arriba a abajo

 Torque incorrecto debido a que el hoyo está diseñado fuera de
posición

 Cinturón equivocado debido a que el diseño es similar a otro
que es estándar también en uso

518
Modelo DFMEA – Paso 2
Causa potencial o mecanismo de falla
Precauciones:
 El DFMA no confía en los controles del proceso para subsanar
debilidades del diseño, pero toma en cuenta sus limitaciones

 El objetivo es identificar las deficiencias del diseño que peuden
causar variación inaceptable en el proceso de manufactura o
ensamble a través de un equipo multidisciplinario

 Las causas de variación que no sean el resultado de directo de
deficiencias de diseño pueden identificarse en el DFMEA y ser
atendidas en el FMEA de Proceso

 Otro objetivo es identificar las características que mejoren la
robustez del diseño que pueda compensar variaciones en
proceso
519
Modelo DFMEA – Paso 2
Ocurrencia
 Ocurrencia es la probabilidad de que una causa/mecanismo
(listado en la columna previa) ocurra durante la vida del diseño

 El rango de ocurrencia tiene un significado relativo más que sea
absoluto

 La prevención o control de las Causas / Mecanismos del modo
de falla se realiza a través de cambios de diseño o cambios de
diseño del proceso para reducir la ocurrencia
520
Modelo DFMEA – Paso 2
Estimación de la Ocurrencia
 ¿Cuál es el historial de servicio y campo experimentado con
artículos similares?
 ¿El artículo es similar al utilizado en niveles anteriores de
subsistemas?

 ¿El componente es radicalmente diferente de los anteriores?
 ¿Ha cambiado la aplicación del componente?

 ¿Se han instalado controles preventivos en el proceso?
 ¿Cuáles son los cambios en el ambiente?

 ¿Se ha realizado un análisis análítico de la predicción de
confiabilidad para estimar la tasa de ocurrencia?

Rangos de Ocurrencia (AMEFD)
Ocurrencia Criterios
Remota Falla improbable. No existen fallas
asociadas con este producto o con
un producto / Servicio casi idéntico
Muy Poca Sólo fallas aisladas asociadas con
este producto / Servicio
casi idéntico
Poca Fallas aisladas asociadas con
productos / Servicios similares
Moderada Este producto / Servicio ha
tenido fallas ocasionales
Alta Este producto / Servicio ha
fallado a menudo
Muy alta La falla es casi inevitable
Probabilidad de Falla
Rango
1 <1 en 1,500,000 Zlt > 5

2 1 en 150,000 Zlt > 4.5

3 1 en 30,000
Zlt > 4

4 1 en 4,500 Zlt > 3.5
5 1 en 800 Zlt > 3
6 1 en 150 Zlt > 2.5
7 1 en 50 Zlt > 2
8 1 en 15 Zlt > 1.5
9 1 en 6 Zlt > 1
10 >1 en 3 Zlt < 1
Nota: El criterio se basa en la probabilidad de ocurrencia de la
causa/mecanismo. Se puede basar en el desempeño de un diseño similar en
una aplicación similar.
522
Clasificación
 Cuando el Modo de falla/causa tien una severidad de
5 a 8 y una ocurrencia de 4 o mayor, entonces se
tiene una caracterítica significativa crítica potencial
que se identifica con “YS” y se inicia el FMEA de
proceso

 Estas características del producto afectan la función
del producto y/o son importantes para la satisfacción
del cliente y pueden requerir condiciones especiales
de manufactura, ensamble, embarque, monitoreo y/o
inspección

523
Modelo DFMEA
Paso 3
Si las causas no se pueden eliminar en paso 1 o 2, Identificar
 Controles actuales de prevención usados para establecer la
ocurrencia
 Controles actuales de detección (vg. Pruebas) usadas para
establecer la Detección
 Determinar la efectividad de los controles de Detección en
escala de 1 a 10
 El RPN inicial (Risk Priority Number).
 Acciones Recomendadas (Prevenciónn and Detección).
 Cuando ya se hayan implementado las acciones recomenddas,
se revisa el formato DFMEA en relación a la Severidad,
Ocurrencia, Detección y RPN
524
Modelo DFMEA – Paso 3
Controles de diseño actuales
 Listar las actividades terminadas para prevención,
vaidación/verificación del diseño (DV), u otras actividades que
aseguran la adecuación del diseño para el modo de falla y/o
causa / mecanismo bajo consideración

 Controles actuales (vg. Diseños falla/seguro como válvulas de
alivio, revisiones de factibilidad, CAE, Confianilidad y robustez
analítica) son los que han sido o estan usándose con los mismos
diseños o similares.

 El equipo siempre debe enfocarse a mejorar los controles de
diseño, por ejemplo la creación de nuevos sistemas de prueba
en el laboratorio, o la creación de muevos algoritmos de
modelado, etc.

525
Modelo DFMEA – Paso 3
Controles de diseño actuales
 Hay dos tipos de controles de diseño: Prevención y
detección

 De prevención:
 Previenen la ocurrencia de la causa/mecanismo o Modo
de falla/efecto reduciendo la tasa de Ocurrencia
 De detección:
 Detectan la causa/mecanismo o Modo de falla/efecto
ya sea por métodos analíticos o físicos antes que el
artículo se libere para Poducción
 Si solo se usa una columna indicarlos con P o D
526
Modelo DFMEA – Paso 3
Controles de diseño actuales
Identificación de controles de diseño
 Si una causa potencial no fue analizada, el producto
con deficiencia de diseño pasará a Producción. Una
forma de detectarlo es con su Modo de falla
resultante. Se debe tomar acción correctiva

Identificar controles de diseño como sigue:
1. Identificar y listar los métodos que puedan ser
utilizados para detectar el modo de falla, como:
1. FMEA anteriores, Planes de DV anteriores, Lista de
verificáción de robustez, Acciones de 8Ds

527
Modelo DFMEA – Paso 3
Controles de diseño actuales
2. Listar todos los controles de diseño históricos que
puedan ser suados para causas de primer nivel
listadas. Revisar reportes históricos de pruebas

3. Identificar otros métodos posibles preguntando:
¿De que manera puede la causa de este modo de falla ser
reconocida?

¿Cómo puedo descubrir que esta causa ha ocurrido?

¿De que manera este modo de falla puede ser reconocido?
¿Cómo puedo descubrir que este modo de falla ha ocurrido?
528
Modelo DFMEA – Paso 3
Detección
 Cuando se estima una tasa de Detección, considerar solo los
controles que serán usados para detectar los Modos de Falla o
sus Causas. Los controles intencionados para prevenir o reducir
la Ocurrencia de una Causa o Modo de falla son considerados al
estimar la tasa de Ocurrencia

 Si los controles de prevención no detectan deben ser calificadas
con 10

 Solo se deben considerar los métodos que son usados antes de
la liberación a Producción para estimar la tasa de Detección
 Los programas de verificación de diseño deben basarse en la
efectividad de los controles de diseño

529
Modelo DFMEA – Paso 3
Detección
Para evaluar la efectividad de cada control de diseño considerar las
siguientes categorías (de mayor a menor):

 Métodos de análisis de diseño
 Modelado y simulación probada (vg. Análisis de elementos
finitos)
 Estudios de tolerancias (vg. Tolerancias deométricas
dimensionales)
 Estudios de compatibilidad de materiales (vg. Expansión
térmica, corrosión)
 Revisión de diseño subjetiva
 Métodos de desarrollo de pruebas:
 Diseño de experimentos/ experimentos de peor caso (vg.
Ruido)

530
Modelo DFMEA – Paso 3
Detección
 Métodos de desarrollo de pruebas (cont…):
 Pruebas en muestras de pre-producción o prototipo
 Maquetas usando partes similares
 Pruebas de durabilidad (verificación de diseño)
 Número de muestras a ser probadas
 Muestra significativa estadísticamente
 Cantidad pequeña, no significativa estadísticamente
 Oportunidad de la aplicación de control de diseño
 Desde la etapa de diseño del concepto (vg. Decisión
del tema)
 Al tener prototipos de ingeneiría
 Justo antes de liberarse a Producción
Rangos de Detección (AMEFD)
• Rango de Probabilidad de Detección basado en la
efectividad del Sistema de Control Actual; basado en el
cumplimiento oportuno con el Plazo Fijado

1 Detectado antes del prototipo o prueba piloto
2 - 3 Detectado antes de entregar el diseño
4 - 5 Detectado antes del lanzamiento del servicio
6 - 7 Detectado antes de la prestación del servicio
8 Detectado antes de prestar el servicio
9 Detectado en campo, pero antes de que ocurra la falla o error
10 No detectable hasta que ocurra la falla o error en campo
532
DFMEA – Cálculo del riesgo
 El número de prioridad del rieso (RPN) es el producto de
Severidad (S), Ocurrencia (O) y Detección (D)

 RPN = (S) x (O) x (D) con valores entre 1 y 1000

 Puede usarse como en un Pareto para priorizar riesgos
potenciales con efectos que tengan las tasas más altas de
severidad

 Atender los aspectos con Severidad 9 o 10 y después los efectos
con Severidad alta; los de criticalidad alta (S x O) y al final los
que tienen RPNs más altos

533
DFMEA – Acciones recomendadas
Considerar acciones como las siguientes:
 Revisión del diseño de la Geometría y/o tolerancias
 Revisión de especificación de materiales
 Diseños de experimentos (con múltiples causas interactuando) u
otras técnicas de solución de problemas
 Revisión de planes de prueba
 Sistemas redundantes – dispositivos de aviso – estados de falla
(ON y OFF)

El objetivo primario de las acciones recomendadas es reducir
riesgos e incrementar la satisfacción del cliente al mejorar el
diseño.
Para reducir la severidad es necesario un cambio de diseño
534
DFMEA – Acciones tomadas
 Se identifica la organización y persona responsable para las
acciones recomendadas y la fecha de terminación

 Dar seguimiento:
 Desarrollar una lista de características especiales parasu
consideración en el DFMEA
 Dar seguimiento a todas las acciones recomendadas y
actualizar las acciones del DFMEA

 Después de que se implementa una acción, anotar una
descripción breve y la fecha de efectividad
535
DFMEA – Nivel de riesgo RPN
 Después de haber implementado las acciones
preventivas/correctivas, registrar la nueva Severidad,
Ocurrencia y Detección

 Calcular el nuevo RPN

 Si no se tomaron acciones en algunos aspectos, dejarlos en
blanco
536
DFMEA – Lista de verificación de
robustez
 Es una salida del proceso integrado de robustez:
 Resume los atributos de robustez clave y controles de
diseño

 Enlaza el DFMEA y los 5 factores de ruido del diseño al
Plan de verificación de diseño (DVP); vg., esta lista es
una entrada al DVP

 Debe ser un documento clave a revisar como parte del
proceso de revisión de diseño
537
FMEA de Proceso - PFMEA
538
PFMEA
 Equipo
 Se inicia por el Ing. responsable de la actividad, en
conjunto con un equipo de personas expertas además
de incluir personas de apoyo

 Alcance
 Define que es incluido y que es excluido

539
Entradas al PFMEA
 Diagrama de flujo del proceso
 El equipo debe desarrollar el flujo del proceso,
preguntando ¿Qué se supone que hace el proceso?;
¿Cuál es su propósito?; ¿Cuál es su función?

 El Diagrama P es una entrada opcional al PFMEA


540
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de FMEA ______(rev.) ______
Función
del Producto/
Paso del
proceso
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
o Mecanismos
de falla
O
c
c
u
r
Controles de
Diseño o
Proceso
Actuales
D
e
t
e
c
R
P
N
Acción
Sugerida
Responsable
y fecha límite
de Terminación
Acción
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
541
Modelo del PFMEA – Paso 1
 Identificar todos los requerimientos funcionales dentro del
alcance

 Identificar los modos de falla correspondientes

 Identificar un conjunto de efectos asociados para cada modo de
falla

 Identificar la calificación de severidad para cada conjunto de
efectos que de prioridad el modo de falla

 De ser posible, tomar acciones para eliminar modos de falla sin
atender las “causas”
542
Modelo de PFMEA – Paso 1
 Requerimientos de la función del proceso
 Contiene características de ambos el producto y el
proceso

 Ejemplos
 Operación No. 20: Hacer perforación de tamaño X de
cierta profundidad
 Operación No. 22: Realizar el subensamble X al
ensamble Y

Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Función
de
Componente/Paso
de proceso
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
de los Mecanismos
de falla
O
c
c
u
r
Controles del
Diseño /
Proceso
Actual
D
e
t
e
c
R
P
N
Acción
Sugerida
Responsable
y fecha límite
de Terminación
Acción
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Factura correcta
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Relacione las
funciones del
diseño del
componente
Pasos del proceso
Del diagrama de flujo
544
Modelo de PFMEA – Paso 1
 Modos de falla potenciales
 No funciona
 Funcionamiento parcial / Sobre función / Degradación en el
tiempo
 Funcionamiento intermitente
 Función no intencionada
 Los modos de falla se pueden categorizar como sigue:
 Manufactura: Dimensional fuera de tolerancia
 Ensamble: Falta de componentes
 Recibo de materiales: Aceptar partes no conformes
 Inspección/Prueba: Aceptar partes equivocadas

Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Función
del
componente/
Paso del
proceso
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
D
i
v
Causa(s)
Potencial(es)
de los Mecanismos
de falla
O
c
c
u
r
Controles de
Diseño /
Proceso
Actuales
D
e
t
e
c
R
P
N
Acción
Sugerida
Responsable
y fecha límite
de Terminación
Acción
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Factura
correcta
Datos incorrectos
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Identificar modos
de falla Tipo 1
inherentes al
diseño
546
Modelo de PFMEA – Paso 1
 Efectos de las fallas potenciales (consecuencias en)
 Seguridad del operador
 Siguiente usuario
 Usuarios siguientes
 Máquinas / equipos
 Operación del producto final
 Cliente último
 Cumplimiento de reglamentaciones gubernamentales

547
Modelo de PFMEA - Paso 1
 Efectos de las fallas potenciales (en usuario final)
 Ruido
 Operación errática
 Inoperable
 Inestable
 Apariencia mala
 Fugas
 Excesivo esfuerzo
 Retrabajos / reparaciones
 Insatisfacción del cliente
548
Modelo de PFMEA –Paso 1
 Efectos de las fallas potenciales (en siguiente
operación)
 No se puede sujetar
 No se puede tapar
 No se puede montar
 Pone en riesgo al operador
 No se ajusta
 No conecta
 Daña al equipo
 Causa excesivo desgaste de herramentales
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Función
del componente
/ Paso del
proceso
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
D
i
v
Causa(s)
Potencial(es)
oMecanismos
de falla
O
c
c
u
r
Controles de
Diseño /
Proceso
Actuales
D
e
t
e
c
R
P
N
Acción
Sugerida
Responsable
y fecha límite
de Terminación
Acción
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Factura correcta Datos incorrectosLOCAL:
Rehacer
la factura
MAXIMO PROXIMO
Contabilidad
equivocada
CON CLIENTE
Molestia
Insatisfacción

Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño
Describir los efectos de
modo de falla en:
LOCAL
El mayor subsecuente
Y Usuario final
CTQs del QFD o
Matriz de Causa Efecto
Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura
/ ensamble. El cliente final debe ser siempre considerado primero. Si ocurren ambos, use la mayor de las dos severidades
Efecto

Efecto en el cliente

Efecto en Manufactura /Ensamble

Calif.

Peligroso
sin aviso

Calificación de severidad muy alta cuando un modo potencial de
falla afecta la operación segura del producto y/o involucra un no
cumplimiento con alguna regulación gubernamental, sin aviso

Puede exponer al peligro al operador (máquina o ensamble)
sin aviso

10

Peligroso
con aviso

Calificación de severidad muy alta cuando un modo potencial de
falla afecta la operación segura del producto y/o involucra un no
cumplimiento con alguna regulación gubernamental, con aviso

Puede exponer al peligro al operador (máquina o ensamble)
sin aviso

9

Muy alto

El producto / item es inoperable ( pérdida de la función
primaria)

El 100% del producto puede tener que ser desechado op
reparado con un tiempo o costo infinitamente mayor

8

Alto

El producto / item es operable pero con un reducido nivel de
desempeño. Cliente muy insatisfecho

El producto tiene que ser seleccionado y un parte
desechada o reparada en un tiempo y costo muy alto

7

Modera
do

Producto / item operable, pero un item de confort/conveniencia
es inoperable. Cliente insatisfecho

Una parte del producto puede tener que ser desechado sin
selección o reparado con un tiempo y costo alto

6

Bajo

Producto / item operable, pero un item de confort/conveniencia
son operables a niveles de desempeño bajos

El 100% del producto puede tener que ser retrabajado o
reparado fuera de línea pero no necesariamente va al àrea
de retrabajo .

5

Muy bajo

No se cumple con el ajuste, acabado o presenta ruidos y
rechinidos. Defecto notado por el 75% de los clientes

El producto puede tener que ser seleccionado, sin desecho,
y una parte retrabajada

4

Menor

No se cumple con el ajuste, acabado o presenta ruidos y
rechinidos. Defecto notado por el 50% de los clientes

El producto puede tener que ser retrabajada, sin desecho,
en línea, pero fuera de la estación

3

Muy
menor

No se cumple con el ajuste, acabado o presenta ruidos, y
rechinidos. Defecto notado por clientes muy críticos (menos del
25%)

El producto puede tener que ser retrabajado, sin desecho
en la línea, en la estación

2

Ninguno

Sin efecto perceptible

Ligero inconveniente para la operación u operador, o sin
efecto

1

CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA AMEFP
Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura
/ ensamble. El cliente final debe ser siempre considerado primero. Si ocurren ambos, use la mayor de las dos severidades
Efecto

Efecto en el cliente

Efecto en Manufactura /Ensamble

Calif.

Peligroso
sin aviso

Calificación de severidad muy alta cuando un modo potencial de
falla afecta la operación segura del producto y/o involucra un no
cumplimiento con alguna regulación gubernamental, sin aviso

Puede exponer al peligro al operador (máquina o ensamble)
sin aviso

10

Peligroso
con aviso

Calificación de severidad muy alta cuando un modo potencial de
falla afecta la operación segura del producto y/o involucra un no
cumplimiento con alguna regulación gubernamental, con aviso

Puede exponer al peligro al operador (máquina o ensamble)
sin aviso

9

Muy alto

El producto / item es inoperable ( pérdida de la función
primaria)

El 100% del producto puede tener que ser desechado op
reparado con un tiempo o costo infinitamente mayor

8

Alto

El producto / item es operable pero con un reducido nivel de
desempeño. Cliente muy insatisfecho

El producto tiene que ser seleccionado y un parte
desechada o reparada en un tiempo y costo muy alto

7

Modera
do

Producto / item operable, pero un item de confort/conveniencia
es inoperable. Cliente insatisfecho

Una parte del producto puede tener que ser desechado sin
selección o reparado con un tiempo y costo alto

6

Bajo

Producto / item operable, pero un item de confort/conveniencia
son operables a niveles de desempeño bajos

El 100% del producto puede tener que ser retrabajado o
reparado fuera de línea pero no necesariamente va al àrea
de retrabajo .

5

Muy bajo

No se cumple con el ajuste, acabado o presenta ruidos y
rechinidos. Defecto notado por el 75% de los clientes

El producto puede tener que ser seleccionado, sin desecho,
y una parte retrabajada

4

Menor

No se cumple con el ajuste, acabado o presenta ruidos y
rechinidos. Defecto notado por el 50% de los clientes

El producto puede tener que ser retrabajada, sin desecho,
en línea, pero fuera de la estación

3

Muy
menor

No se cumple con el ajuste, acabado o presenta ruidos, y
rechinidos. Defecto notado por clientes muy críticos (menos del
25%)

El producto puede tener que ser retrabajado, sin desecho
en la línea, en la estación

2

Ninguno

Sin efecto perceptible

Ligero inconveniente para la operación u operador, o sin
efecto

1

CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA PFMEA
552
Modelo de PFMEA – Paso 2
 Paso 2 identificar:
 Las causas asociadas (primer nivel y raíz)

 Su tasa de ocurrencia

 La designación apropiada de la característica indicada
en ola columna de clasificación

 Acciones recomendadas para alta severidad y
criticalidad (S x O) así como la Seguridad del operador
(OS) y errores de proceso de alto impacto (HI)
553
Modelo de PFMEA – Paso 2
Causa/Mecanismo potencial de falla
 Describe la forma de cómo puede ocurrir la falla,
descrito en términos de algo que puede ser corregido o
controlado
 Se debe dar priorioridad a rangos de prioridad de 9 o
10
Ejemplos, especificar claramente:
 Torque inadecuado (bajo o alto)
 Soldadura iandecuada (corriente, tiempo, presión)
 Lubricación inadecuada
554
Efecto(s) Potencial(es) de falla
Evaluar 3 (tres) niveles de Efectos del Modo de Falla
• Efectos Locales
– Efectos en el Área Local
– Impactos Inmediatos

• Efectos Mayores Subsecuentes
– Entre Efectos Locales y Usuario Final

• Efectos Finales
– Efecto en el Usuario Final del producto o Servicio
555
Modelo de PFMEA – Paso 2
 Suposición 1: Los materiales para la operación son
correctos
 Ajuste de herramentales a la profundidad equivocada
 Desgaste de herramentales
 Temperatura del horno muy alta
 Tiempo de curado muy corto
 Presión de aire muy baja
 Velocidad del transportador no es constante
 Jets de lavadora desconectados
556
Modelo de PFMEA – Paso 2
 Suposición 2: Los materiales para la operación tienen
variación
 Material demasiado duro / suave / quebradizo
 La Dimensión no cumple especificaciones
 El acabado superficial de la operación 10 no cumple
especificaciones
 El localizador de perforación fuera de posición correcta
557
Modelo de PFMEA – Paso 2
 Ocurrencia:
 Es la probabilidad de que una causa/mecanismo ocurra
 Se puede reducir o controlar solo a través de un
cambio de diseño
 Si la ocurrencia de la causa no puede ser estimada,
entonces estimar la tasa de falla posible
CRITERIO DE EVALUACIÓN DE OCURRENCIA SUGERIDO PARA AMEFP
100 por mil piezas
Probabilidad

Indices Posibles de
falla

ppk

Calif.

Muy alta: Fallas
persistentes

< 0.55

10

50 por mil piezas

> 0.55

9

Alta: Fallas frecuentes

20 por mil piezas

> 0.78

8

10 por mil piezas

> 0.86

7

Moderada: Fallas
ocasionales
5 por mil piezas

> 0.94

6

2 por mil piezas

> 1.00

5

1 por mil piezas

> 1.10

4

Baja : Relativamente pocas
fallas

0.5 por mil piezas

> 1.20

3

0.1 por mil piezas

> 1.30

2

Remota: La falla es
improbable

< 0.01 por mil piezas

> 1.67

1

559
Modelo de PFMEA – Paso 2

 Clasificación de características especiales si:
 Afectan la función del producto final, cumplimiento con
reglamentaciones gubernamentales, seguridad de los
operadores, o la satisfacción del cliente, y

 Requieren controles especiales de manufactura,
ensamble, proveedores, embarques, monitoreo y/o
inspección o seguridad



Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Función
del componente
/ Paso del
proceso
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
o Mecanismos
de falla
O
c
c
u
r
Controles de
Diseño /
Proceso
Actuales
D
e
t
e
c
R
P
N
Acción
Sugerida
Responsable
y fecha límite
de Terminación
Acción
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
La abertura del
engrane propor La abertura no LOCAL:
ciona una aber- es suficiente Daño a sensor
tura de aire entre de velocidad y
diente y diente engrane
MAXIMO PROXIMO
Falla en eje 7

CON CLIENTE
Equipo
parado

Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Usar tabla para
determinar severidad o
gravedad
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Función
del
Componente /
Paso del
proceso
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
o Mecanismos
de falla
O
c
c
u
r
Controles de
Diseño/
Proceso
Actuales
D
e
t
e
c
R
P
N
Acción
Sugerida
Responsable
y fecha límite
de Terminación
Acción
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Factura correcta Datos LOCAL:
equivocadso Rehacer la
factura
MAXIMO PROXIMO
Contabilidad 7 3
erronea
CON CLIENTE
Molestia
Insatisfacción

Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Rango de
probabilidades en que
la causa identificada
ocurra
562
Modelo de PFMEA – Paso 3

 En el paso 3 identificar:
 Controles actuales de prevención del proceso (con
acciones de diseño o proceso) usados para establecer
la ocurrencia
 Controles actuales de detección (vg. Inspección)
usados para establecer la tasa de detección
 Efectividad de los controles de detección del proceso
en una escala de 1 a 10
 El factor de riesgo RPN inicial
 Acciones recomendadas (Prevención y Detección)
563
Identificar Causa(s) Potencial(es) de la Falla
• Causas relacionadas con el diseño - Características del
servicio o Pasos del proceso
– Diseño de formatos
– Asignación de recursos
– Equipos planeados

• Causas que no pueden ser Entradas de Diseño,
tales como:
– Ambiente, Clima, Fenómenos naturales

• Mecanismos de Falla
– Rendimiento, tiempo de entrega, información completa
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Función
de
Artículo
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
de los Mecanismos
de falla
O
c
c
u
r
Controles de
Diseño/Proces
o Actuales
D
e
t
e
c
R
P
N
Acción
Sugerida
Responsable
y fecha límite
de Terminación
Acción
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Factura correcta Datos incorrectosLOCAL:
Rehacer la
factura
MAXIMO PROXIMO
Contabilidad 7
erronea
CON CLIENTE
Molestia
Insatisfacción

Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño
Identificar causas
de diseño, y
mecanismos de
falla que pueden
ser señalados para
los modos de falla
identificada.
Causas potenciales
De Diagrama de Ishikawa
Diagrama de árbol o
Diagrama de relaciones
565
Modelo de PFMEA – Paso 3

 Controles de proceso actuales:
 Son una descripción de los controles ya sea para
prevenir o para detectar la ocurrencia de los
Modos/causas de falla

 Consideraciones
 Incrementar la probabilidad de detección es costosa y
no efectiva
 A veces se requiere un cambio en el diseño para
apoyar la detección
 El incremento del control de calidad o frecuencia de
inspección sólo debe utilizarse como medida temporal
 Se debe hacer énfasis en la prevención de los defectos
566
Identificar Controles de Diseño o de
Proceso Actuales
• Verificación/ Validación de actividades de Diseño o
control de proceso usadas para evitar la causa,
detectar falla anticipadamente, y/o reducir impacto:

Cálculos, Análisis, Prototipo de Prueba, Pruebas piloto
Poka Yokes, planes de control, listas de verificación

• Primera Línea de Defensa - Evitar o eliminar causas de falla o error

• Segunda Línea de Defensa - Identificar o detectar fallas o errores
Anticipadamente

• Tercera Línea de Defensa - Reducir impactos/consecuencias de falla o
errores
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Función
del
Componente /
Paso del
proceso
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
o Mecanismos
de falla
O
c
c
u
r
Controles de
Diseño /
Proceso
Actuales
D
e
t
e
c
R
P
N
Acción
Sugerida
Responsable
y fecha límite
de Terminación
Acción
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Factura correcta Datos correctos LOCAL:
Rehacer la
factura
MAXIMO PROXIMO
Contabilidad 7 3
erronea
CON CLIENTE
Molestia
Insatisfacción

Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño
¿Cuál es el método de
control actual que usa
ingeniería para evitar el
modo de falla?
568
Modelo de PFMEA – Paso 3

Seleccionar un rango en la tabla de detección
Si se usa inspección automática al 100% considerar:
 La condición del gages
 La calibración del gage
 La variación del sistema de medición del gage
 Probabilidad de falla del gage
 Probabilidad de que el sistema del gage sea punteado
Si se usa inspección visual al 100% considerar:
 Es efectiva entre un 80 a 100% dependiendo del proc.
 El número de personas que pueden observar el modo
de falla potencialmente
 La naturaleza del modo de falla - ¿es claro o confuso?

CRITERIO DE EVALUACIÓN DE DETECCION SUGERIDO PARA AMEFP
Detecciòn

Criterio

Tipos de
Inspección

Métodos de seguridad de Rangos de
Detección

Calif





A

B

C




Casi
imposible

Certeza absoluta de no detección





X

No se puede detectar o no es verificada

10

Muy
remota

Los controles probablemente no
detectarán





X

El control es logrado solamente con
verificaciones indirectas o al azar

9

Remota

Los controles tienen poca
oportunidad de detección





X

El control es logrado solamente con
inspección visual

8

Muy baja

Los controles tienen poca
oportunidad de detección





X

El control es logrado solamente con
doble inspección visual

7

Baja

Los controles pueden detectar



X

X

El control es logrado con métodos gráficos con
el CEP

6

Moderada

Los controles pueden detectar



X



El control se basa en mediciones por variables después de que las
partes dejan la estación, o en dispositivos Pasa NO pasa realizado en
el 100% de las partes después de que las partes han dejado la
estación

5

Moderada
mente
Alta

Los controles tienen una buena
oportunidad para detectar

X

X



Detección de error en operaciones subsiguientes, o medición
realizada en el ajuste y verificación de primera pieza ( solo para
causas de ajuste)

4

Alta

Los controles tienen una buena
oportunidad para detectar

X

X



Detección del error en la estación o detección del error en
operaciones subsiguientes por filtros multiples de aceptación:
suministro, instalación, verificación. No puede aceptar parte
discrepante

3

Muy Alta

Controles casi seguros para
detectar

X

X



Detección del error en la estación (medición automática
con dispositivo de paro automático). No puede pasar la
parte discrepante

2

Muy Alta

Controles seguros para detectar

X





No se pueden hacer partes discrepantes porque el item ha
pasado a prueba de errores dado el diseño del
proceso/producto

1

Tipos de inspección: A) A prueba de error B) Medición automatizada C) Inspección visual/manual


Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Función
del
Componente /
Paso del
proceso
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
o Mecanismos
de falla
O
c
c
u
r
Controles de
Diseño /
Proceso
Actuales
D
e
t
e
c
R
P
N
Acción
Sugerida
Responsable
y fecha límite
de Terminación
Acción
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N

Factura correcta Datos incorrectosLOCAL:
Rehacer la
factura

MAXIMO PROXIMO
Contabilidad 7 3 5
erronea
CON CLIENTE
Molestia
Insatisfacción

Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
¿Cuál es la probabilidad
de detectar la causa de
falla?
571
Modelo de PFMEA – Paso 3

 Número de prioridad de riesgo
 Se calcula como RPN = (S) x (O) x (D)

 Acciones recomendadas
 Se deben dirigir primero a las de valores altos de
Severidad (9 o 10) o RPNs, después continuar con las
demás
 Las acciones se deben orientar a prevenir los defectos
a través de la eliminación o reducción de las causas o
modos de falla
572
Producto de Severidad, Ocurrencia, y Detección

RPN / Gravedad usada para identificar principales CTQs

Severidad mayor o igual a 8
RPN mayor a 150
Calcular RPN (Número de Prioridad de
Riesgo)
573
Planear Acciones

Requeridas para todos los CTQs

 Listar todas las acciones sugeridas, qué persona
es la responsable y fecha de terminación.
 Describir la acción adoptada y sus resultados.
 Recalcular número de prioridad de riesgo .
Reducir el riesgo general del diseño
574
Modelo de PFMEA – Paso 3

 Acciones tomadas
 Identificar al responsable de las acciones
recomendadas y la fecha estimada de terminación
 Después de terminar una acción, dar una descripción
breve de la acción real y fecha de efectividad

 Responsabilidad y fechas de terminación
 Desarrollar una lista de características especiales
proporcionándola al diseñador para modificar el DFMEA
 Dar seguimiento a las acciones recomendadas y
actualizar las últimas columnas del FMEA
575
Modelo de PFMEA – Paso 3

 RPN resultante
 Después de implementadas las acciones
recomendadas, estimar de nuevo los rangos de
Severidad, Ocurrencia y Detección y calcular el nuevo
RPN. Si no se tomaron acciones dejarlo en blanco.

 Salidas del PFMEA
 Hay una relación directa del PFMEA a el Plan de
Control del proceso
Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Función
de
Artículo
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
de los Mecanismos
de falla
O
c
c
u
r
Controles de
Diseño Actual
D
e
t
e
c
R
P
N
Acción
Sugerida
Responsable
y fecha límite
de Terminación
Acción
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Factura Datos LOCAL:
incorrecta incorrectos Rehacer
la factura
MAXIMO PROXIMO
Contabilidad 7 3 5 105
erronea
CON CLIENTE
Molestia
Insatisfacción

Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Riesgo = Severidad x
Ocurrencia x Detección
Causas probables a
atacar primero
Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Función
del componente
/ Paso del
proceso
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
o Mecanismos
de falla
O
c
c
u
r
Controles de
Diseño /
Prcoeso
Actuales
D
e
t
e
c
R
P
N
Acción
Sugerida
Responsable
y fecha límite
de Terminación
Acción
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Factura correcta Datos LOCAL:
erroneos Rehacer la
factura

MAXIMO PROXIMO
Contabilidad 7 3 5 105
erronea
CON CLIENTE
Molestia
Insatisfacción

Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Usar RPN para identificar
acciones futuras. Una vez que
se lleva a cabo la acción,
recalcular el RPN.
578
Herramientas para el FMEA
579
Herramientas
 Diagramas de límites
 Diagramas de flujo de proceso
 Matriz de características
 Tormenta de ideas
 Árboles de funciones
 Lista de efectos: FMEA de diseño
 Lista de efectos: FMEA de proceso
 Diagrama de Ishikawa
 Tecnica de preguntas
580
Herramientas
 Análisis de árbol de fallas (FTA)
 Análisis del modo de falla (FMA)
 Diseño de experimentos (DOE)
 Proceso de solución de problemas de 8Ds
 Planes de Control
 Planeación dinámica de control (DCP)
 Despliegue de la función de calidad (QFD)
 Análisis de valor/ Ingeniería del valor (VA/VE)
 REDPEPR
 FMEA Express
 FMEA del software

581
Diagrama de límites
 Diagramas de límites de funciones
 Salida del análisis de funciones para la fase de
concepto CFMEA, ilustran funciones en vez de partes

 Diagramas de límites Hardware/funcional
 Dividen al sistema en elementos más pequeños desde
un punto de vista funcional. Muestran relaciones
físicas, se usan en los DFMEAs.
582
Nombres de verbos útiles
583
Tormenta de ideas
 Seleccionar el problema a tratar.
 Pedir a todos los miembros del equipo generen ideas para la solución
del problema, las cuales se anotan en el pizarrón sin importar que tan
buenas o malas sean estas.
 Ninguna idea es evaluada o criticada antes de considerar todos los
pensamientos concernientes al problema.
 Aliente todo tipo de ideas, ya que al hacerlo pueden surgir cosas muy
interesantes, que motivan a los participantes a generar más ideas.
 Apruebe la naturalidad y el buen humor con informalidad, en este
punto el objetivo es tener mayor cantidad de ideas
 Se les otorga a los participantes la facultad de modificar o mejorar las
sugerencias de otros.
 Una vez que se tengan un gran número de ideas el facilitador procede
a agrupar y seleccionar las mejores ideas por medio del consenso del
grupo
 Las mejores ideas son discutidas y analizadas con el fin del proponer
una solución.
584
Herramientas para el FMEA
 Árbol de funciones
 Ayuda a que los requerimientos del cliente no
expresados explícitamente sobre el producto o proceso
se cumplan

 Es conveniente describir las funciones de un producto
o proceso por un verbo – pronombre medible, por
ejemplo:
 Calentar el interior a XºC
 Enfriar a los ocupantes a XºC
 Eliminar la niebla del parabrisas en X segundos

585
Técnica de preguntas
 Hacer una oración con el modo de falla, causa y efecto y ver si
la oración tiene sentido. Un modo de falla es debido a una
causa, el modo de falla podría resultar en efectos, por ejemplo:
 MODO DE FALLA: No ajustan los faros delanteros
 P: ¿Qué podría ocasionar esta falla?
 R: La luz desalineada -> Efecto
 P: ¿A que se puede deber esta falla?
 R: Cuerda grande en tornillo de ajuste -> Causa
El “No ajuste de faros delanteros” se debe a “Cuerda
grande en tornillo de ajuste”. El “desajuste de los
faros” ocasiona “haces de luz desalineados”

586
Técnica de preguntas
Paso 1
Modo de falla
Paso 2
¿Qué efecto tiene?
Paso 3
¿Qué lo causa?
587
Análisis de árbol de fallas (FTA)
 Es una técnica analítica deductiva que usa un árbol para
mostrar las relaciones causa efecto entre un evento indeseable
(falla) y las diversas causas que contribuyen. Se usan símbolos
lógicos para interconectar las ramas

 Después de hacer el FTA e identificadas las causas raíz, se
pueden determinar las acciones preventivas o los controles
necesarios

 Otra aplicación es determinar las probabilidades de las causas
que contribuyen a la falla y propagarlas hacia adelante
588
Análisis del Modo de Falla (FMA)
 Es un enfoque sistemático disciplinado para
cuantificar el modo de falla, tasa de falla, y causa raíz
de fallas o tasas de reparación conocidas (el FMEA
para las desconocidas)

 Se basa en información histórica de garantías, datos
de campo, datos de servicios, y/o datos de procesos

 Se usa para identificar la operación, modos de falla,
tasas de falla y parámetros críticos de diseño de
hardware o procesos. También permite identificar
acciones correctivas para causas raíz actuales

589
Diseño de experimentos (DOE)
 Es un método para definir los arreglos en cuales se puedas
realizar experimentos, donde se cambian de manera controlada
las variables independientes de acuerdo a un plan definido y se
determinan los efectos

 Para pruebas de confiabilidad el DOE usa un enfoque estadístico
para diseñar pruebas para identificar los factores primarios que
causas eventos indeseables

 Se usan para identificar causas raíz de modos de falla, cuando
varios factores pueden estar contribuyendo o cuando estos
factores están interrelacionados y se desean conocer los efectos
de sus interacciones
590
Método de 8 disciplinas (8Ds)
 Es un método de solución de problemas orientado a
equipos de trabajo, las disciplinas o pasos son:
 Preparar el proceso
 Establecer el equipo
 Describir el problema
 Desarrollar las acciones de contención o contingentes
 Diagnosticar el problema (definir y verificar causa raíz)
 Seleccionar y verificar acciones correctivas
permanentes (PCAs) para causas raíz y puntos de
escape
 Implementar y validar PCAs
 Reconocer contribuciones del equipo y los miembros
591
Planes de control
 Es una descripción escrita del sistema para controlar
el proceso de producción

 Lista todos los parámetros del proceso y
características de las partes características de las
partes que requiere acciones específicas de calidad

 El plan de control contiene todaslas características
críticas y significativas
 Hay planes de control a nivel de manufactura de:
Prototipos, producción piloto (capacidad de procesos)
y de producción
592
Planeación dinámica de control (DCP)
Es un procesos que liga las herramientas de calidad
para construir planes de control robustos a través de
un equipo

1. Lanzamiento – definir los requerimientos de recursos

2. Estructura del equipo central y de soporte

3. Bitácora de preguntas
593
Planeación dinámica de control (DCP)
4. Información de soporte (ES, DFMEAs, DVP&R, PFMEA, etc.)

5. Diagrama de flujo y carácterísticas de enlace

6. Pre lanzamiento o controles preliminares

7. PFMEA

8. Plan de control

9. Desarrollar ilustraciones e instrucciones

10. Implementar y mantener



594
Despliegue de la función de calidad
(QFD)
 El QFD es un método estructurado en el cual los
requerimientos del cliente son traducidos en requerimientos
técnicos para cada una de las etapas del desarrollo del
producto y producción

 El QFD es entrada al FMEA de diseño o al FMEA de concepto.
Los datos se anotan en el FMEA como medidas en la columna
de función

 La necesidad de obtener datos de QFD pueden ser también
una salida del FMEA de concepto

595
Análisis del valor / Ingeniería del
valor (VA/VE)
 Son metodologías usadas comúnmente para despliegue del
valor. La Ingeniería del valor se realiza antes de comprometer
el herramental. El análisis del valor (VA) se realiza después del
herramentado. Ambas técnicas usan la fórmula:

Valor = Función (primaria o secundaria) / Costo

 Los datos de VA/VE pueden ser entradas al FMEA de diseño o
de proceso en columna de Función como funciones primaria y
secundaria. También pueden ser causas, controles o acciones
recomendadas

 La metodología VA debe ser incluida en la revisión de FMEAs
actuales como apoyo para evaluar riesgos y beneficios cuando
se analizan varias propuestas
596
REDPEPR (Robust Engineering
Design Product Enhacement Process)
Es una herramienta que proporciona a los equipos de
Diseño:
 Un proceso paso a paso para aplicar el RED
 Las herramientas necesarias para completar el diagrama P,
listas de verificación de confiabilidad y robustez (RRCL) y la
matriz de demostración de confiabilidad y robustez (RRDM)
 Preguntas y tips para guiar al equipo en el proceso
 Capacidad para generar reportes en Excel
 Un proceso para mejorar la comunicación con el equipo de
ingeneiría
El Web site donde se encuentra el software es
www.redpepr.ford.com
597
Aplicaciones del FMEA
Express
Ambiental
De máquinas
598
FMEA Express
Es un proceso que aplica técnicas de FMEA
simultaneamente tanto a los aspectos de diseño
como a los de manufactura de un proyecto:

Consiste de cuatro fases:
 Preparación: Se forma un equipo directivo para definir el
alcance del proyecto, equipo de trabajo multidisciplinario,
colección de información y documentos de modos de falla
conocidos, causas, efectos y controles
599
FMEA Express
 Desarrollo del FMEA: El equipo de trabajo multidisciplianrio
completa el FMEA utilizando formatos y definiciones estándar

 Posterior a la tarea: El facilitador y el equipo directivo
generan un reporte final y un plan de seguimiento. El líder del
equipo de FMEA es responsable de monitorear el avance

 Auditoría de calidad: Después de una verificación de
calidad, se proporciona un certificado de cumplimiento

Software para el FMEA: www.quality.ford.com/cpar/fmea/
600
E-FMEA ambiental
601
E-FMEA ambiental
602
Matriz de requerimientos ambientales
con criterios múltiples
 Para cada alternativa de diseño resumir la siguiente
información
 Uso de substancias prohibidas o de uso restringido
 Tipo y cantidad de residuos (refleja el nivel de materiales
utilizados)
 Consumo de energía por componente
 Consumo de agua por componente
 Otros objetivos ambientales
603
E-FMEA
Ejemplos de acciones recomendadas (hacer una
revisión previa de efectos secundarios en la vida del
producto):
 Sistemas de conexión alternos
 Reciclar

 Rutas alternas de disposición de residuos
 Uso de materiales naturales

 Revisar rutas de transporte
 Reducir trayectorias de proceso
 Optimizar el consumo de agua y energía
604
E-FMEA
Salidas del FMEA ambiental:
 Recomendaciones de materiales

 Recomendaciones de diseño (vg. Tipo de enlace)

 Recomendaciones de proceso (vg. Potencial de
ahorro de energía)

 Recomendación para rutas de disposición
605
MFMEA – FMEA de maquinaria
606
FMEA de maquinaria
 Su propósito es que a través de un equipo se asegure que los
modos de falla y sus causas/mecanismos asociados se hayan
atendido

 Soporta el proceso de diseño en:
 Apoyar en la evaluación objetiva de las funciones del equipo,
requerimientos de diseño y alternativas de diseño

 Incrementar la probabilidad de que los modos de falla y sus
efectos en la maquinaria se han considerado en el proceso
de diseño y desarrollo
607
FMEA de maquinaria

 Proporcionar información adicional como apoyo a la
planeación de todos los programas de diseño, prueba y
desarrollo

 Desarrollar una lista de modos de falla potenciales en
base a su efecto con el cliente, estableciendo
prioridades para mejoras al diseño y desarrollo

 Proporcionar documentación para referencia futura
para el análisis de problemas de campo, evaluando
cambios de diseño y desarrollo de maquinaria.
608
FMEA de maquinaria
 Ejemplos de descripción de funciones
 Proceso de partes – 120 tareas / hora

 Cabezal del índice – MTBF > 200 Hrs

 Control del flujo hidráulico – 8p cl/seg.

 Sistema de posición – Ángulo de rotación de 30º

 Hacer un barreno – Rendimiento a la primera 99.9%
609
FMEA de maquinaria
 Efectos potenciales como consecuencias de falla de subsistemas
en relación a seguridad y “Las 7 grandes pérdidas”
 Falla – pérdidas resultado de una pérdida funcional o
reducción de la función sobre una parte del equipo
requiriendo intervención de mantenimiento

 Preparación y ajustes – pérdidas que son resultado de
procedimientos de preparación tal como herramentado,
cambio de modelo o cambio de molde. Los ajustes incluyen
el tiempo muerto usado para ajustar el equipo para evitar
defectos y bajo rendimiento, requiriendo intervención del
operador o ajustador

610
FMEA de maquinaria
 Tiempo de espera y paros menores – pérdidas
resultado de interrupciones menores al flujo del
proceso (como atoramiento de microswitch)
requiriendo intervención del operador. El tiempo de
espera sólo se puede resolver revisando el sistema /
línea completa

 Capacidad reducida – pérdidas que resultan de la
diferencia entre el ciclo de tiempo ideal del equipo y su
tiempo de ciclo real. El tiempo de ciclo ideal se
determina por: a) velocidad original; b) condiciones
óptimas y c) tiempo máximo de ciclo logrado con
maquinaria similar

611
FMEA de maquinaria
 Pérdidas en el arranque – pérdidas que ocurren
durante los primeros pasos del proceso productivo
después de paros largos (fines de semana, días de
azueto, o entre turnos), resultando en rendimiento
reducido o incremento de desperdicio y rechazos

 Partes defectivas – pérdidas que resultan de la
generación de defectos que producen retrabajo,
reaparaciones, y/o partes no útiles

 Herramentales – pérdidas que resultan de fallas en
el herramental, rotura, deterioración o desgaste (vg.
Herramientas de corte, tips de soldadura, etc.)
612
FMEA de maquinaria
Criterios de Severidad
613
FMEA de maquinaria
 Causas potenciales, se asume que la maquinaria se
fabricó, instaló, usó, y se dispuso de acuerdo a sus
especificaciones, preguntarse para identificar causas
potenciales lo siguiente:
 ¿Cuáles son las circunstancias que pueden orientar al
componente, subsistema y sistema a no cumplir sus
requerimientos funcionales / de desempeño?

 ¿A qué grado pueden los componentes, subsistemas y
sistemas que interactúan ser compatibles?

 ¿Qué especificaciones garantizan compatibilidad?


614
FMEA de maquinaria
Criterios de Ocurrencia
615
FMEA de maquinaria
Criterios de Detección
616
Herramientas de la
Fase de Análisis
Identificación de causas potenciales
Cartas Multivari y Análisis de Regresión
Intervalos de confianza y Pruebas de Hipótesis
617
Identificación de causas
potenciales
Tormenta de ideas
Diagrama de Ishikawa
Diagrama de Relaciones
Diagrama de Árbol
Verificación de causas raíz
618
Tormenta de ideas
 Técnica para generar ideas creativas cuando la mejor
solución no es obvia.

 Reunir a un equipo de trabajo (4 a 10 miembros) en
un lugar adecuado

 El problema a analizar debe estar siempre visible

 Generar y registrar en el diagrama de Ishikawa un
gran número de ideas, sin juzgarlas, ni criticarlas

 Motivar a que todos participen con la misma
oportunidad
619
Tormenta de ideas
 Permite obtener ideas de los participantes
620
Diagrama de Ishikawa
 Anotar el problema en el cuadro de la derecha

 Anotar en rotafolio las ideas sobre las posibles causas
asignándolas a las ramas correspondientes a:
 Medio ambiente
 Mediciones
 Materia Prima
 Maquinaria
 Personal y
 Métodos
o
 Las diferentes etapas del proceso de manufactura o
servicio

Diagrama de Ishikawa
Medio
ambiente Métodos Personal
¿Qué
produce
bajas ventas
de
Tortillinas
Tía Rosa?
Clima
húmedo
Calidad del
producto
Tipo de
exhibidor
Falta de
motivación
Ausentismo
Rotación de
personal
Maquinaría Materiales
Clientes con
ventas bajas
Malos
itinerarios
Descompostura
del camión
repartidor
Distancia de
la agencia al
changarro
Medición
Seguimiento
semanal
Conocimiento
de los
mínimos por
ruta
Frecuencia
de visitas
Elaboración
de pedidos
Posición de
exhibidores
Falta de
supervi
ción
622
Programación
deficiente
Capacidad
instalada
desconocida
Marketing no
tiene en cuenta
cap de p.
Mala prog. De
ordenes de compra
Compras
aprovecha
ofertas

Falta de com..... Entre
las dif. áreas de
la empresa
Duplicidad
de funciones
Las un. Reciben
ordenes de dos
deptos diferentes
Altos
inventarios
No hay control
de inv..... En proc.
Demasiados deptos
de inv..... Y desarrollo
Falta de prog. De
la op. En base a
los pedidos
No hay com..... Entre
las UN y la oper.
Falta de
coordinación al fincar
pedidos entre
marketing y la op.
Falta de control de
inventarios en
compras
Influencia de la
situación econ del
país
No hay com..... Entre compras
con la op. general
No hay coordinación
entre la operación y las unidades
del negocio
Falta de coordinación
entre el enlace de compras
de cada unidad con compras
corporativo

Influencia directa de
marketing sobre
compras
Compra de material
para el desarrollo de
nuevos productos por
parte inv..... Y desarrollo’’’
No hay flujo
efectivo de mat.
Por falta de
programación
de acuerdo
a pedidos
Perdida de mercado
debido a la
competencia
Constantes
cancelaciones
de pedidos
de marketing
No hay coordinación
entre marketing
operaciones
Falta de comunicación
entre las unidades
del negocio
Diagrama de relaciones
Dancer
Taco generador
del motor
Poleas guías
Presión del
dancer
Mal guiado
Sensor de velocidad
de línea
Sensor
circunferencial
Bandas de
transmisión
Empaques de arrastre
Presión de aire de trabajo
Drive principal
Voltaje del motor
Ejes principales
Poleas de transmisión
¿Que nos puede provocar Variación de Velocidad
Durante el ciclo de cambio en la sección del Embobinadores?
Causas a validar
13/0
2/4
0/4
1/2
5/1
1/4
1/4
2/1
1/1
0/3
5/2
4/1
1/5
1/5
Entradas Causa
Salidas Efecto
Interrelationship Diagraph
Allows a team to identify & classify the cause and effect relationships that exist among variables
Business Planning Process
Communica-
tion issues
within the
group
External
factors impact
implemen-
tation
Means not
clearly
defined
Plan not
integrated
Fast new
product
introductions
stretch
resources
Lack of
time and
resources
No strong
commitment
to the group
Driver
Driver
Planning
approach not
standardized Outcome
Capacity
may not
meet needs
In = 1 Out = 3
In = 3 Out = 2
In = 2 Out = 4
In = 1 Out = 2
In = 2 Out = 0
In = 0 Out = 5
In = 5 Out = 1
In = 0 Out = 2
In = 5 Out = 0
What Data Needs to be Collected to understand
the sources of variation in a key measure ?
625
Diagrama de árbol o sistemático
Meta Medio
Meta
Meta
Medio
Medio
Meta u
objetivo
Medios
o planes
Medios
o planes
Medios


Medios
Medios
Primer
nivel
Segundo
nivel
Tercer
nivel
Cuarto
nivel
Implantar el
Sistema
SMED
Producto DJ
2702
¿Objetivo?
Preparación
para el SMED
Fase 1: Separación
de la preparación
interna de la externa
Fase 2: Conversión
de preparación
interna en externa
Fase 3: Refinamiento
de todos los aspectos
de la preparación.
Filmar la preparación
Analizar el video
Describir las tareas
Separar las tareas
Elaborar lista de chequeo
Realizar chequeo de
funciones
Analizar el transporte de
herramientas y materiales
Analizar las funciones y
propósito de c/operación
Convertir tareas de prepa-
ración interna a externas
Realización de operaciones
en paralelo.
Uso de sujeciones
funcionales.
Eliminación de ajustes
5- 12 - Mar-04
10 y 17 –Mar-04
17- Mar-04
17- Mar-04
2- Mar-04
24- Mar-04
24- Mar-04
12 - Abr- 04
15 –Abr - 04
5 –May -04
19– May -04
12- May -04
¿Qué?
¿Cómo? ¿Cuándo?
Elaboramos un
Diagrama de Arbol
para poder
analizar nuestro
problema siguiendo
el sistema SMED.
Diagrama de Arbol- Aplicación Sistema SMED
19
627
Verificación de posibles causas
 Para cada causa probable , el equipo deberá
por medio del diagrama 5Ws – 1H:
 Llevar a cabo una tormenta de ideas para
verificar la causa.
 Seleccionar la manera que:
 represente la causa de forma efectiva, y
 sea fácil y rápida de aplicar.

628
Calendario de las actividades
¿qué? ¿por qué? ¿cómo? ¿cuándo
?
¿dónde
?
¿quién?
1
Tacogenerador
de motor
embobinador
1.1 Por variación de
voltaje durante el
ciclo de cambio
1.1.1 Tomar dimensiones de ensamble entre
coples.
1.1.2 Verificar estado actual y
especificaciones de escobillas.
1.1.3 tomar valores de voltaje de salida
durante el ciclo de cambio.
Abril ’04 1804
Embob.
J. R.
2 Sensor
circular y de
velocidad de
linea.
2.1 Por que nos
genera una varión en
la señal de referencia
hacia el control de
velocidad del motor
embobinador
2.1.1 Tomar dimensiones de la distancia
entre poleas y sensores.
2.1.2 Tomar valores de voltaje de salida de
los sensores.
2.1.3 Verificar estado de rodamientos de
poleas.
Abril ’04 1804
Embob.
U. P.
3 Ejes
principales de
transmisión.
3.1 Por vibración
excesiva durante el
ciclo de cambio
3.1.1 Tomar lecturas de vibración en
alojamientos de rodamientos
3.1.2 Comparar valores de vibraciones con
lecturas anteriores.
3.1.3 Analizar valor lecturas de vibración
tomadas.
Abril’04 1804
Embob.
F. F.
4 Poleas de
transmisión de
ejes
embobinadores
.
4.1 Puede generar
vibración excesiva
durante el ciclo de
cambio.
4.1.1 Verificar alineación, entre poleas de
ejes principales y polea de transmisión del
motor.
4.1.2 Tomar dimensiones de poleas(dientes
de transmisión).
4.1.3 Tomar dimensiones de bandas (dientes
de transmisión)
4.1.4 Verificar valor de tensión de bandas.
Abril’04 1804
Embob.
J. R.
U. P.
Causa
Raíz
Resultados
Causas
# de
Causa
SI ES CAUSA RAIZ

SI ES CAUSA RAIZ
NO ES CAUSA RAIZ
NO ES CAUSA RAIZ

SI ES CAUSA RAIZ

SI ES CAUSA RAIZ
NO ES CAUSA RAIZ
Ensamble de ojillos, bloques y
contrapesos no adecuados en
aspas.
Amortiguadores dañados.
Desgaste de bujes en los
carretes.
Fabricación y reemplazo de
ejes y poleas no adecuados en
ensamble de aspas.
Desalineamiento de poleas y
bandas de transmisión de
aspas.
Método de Balanceo no
adecuado.
Desalineación de pinolas en
cuna.
1

2
3
4

5

6
7
Resumen de la validación de las causas
X


X




X

X

630
VI.D Métodos de análisis
adicionales
631
Métodos adicionales de análisis
1. Análisis de brecha

2. Análisis de causa raíz

3. Análisis del Muda
632
VI.D.1 Análisis de brecha
633
 El análisis de brecha (Gap Analysis) es una
herramienta de evaluación para comparar el
desempeño actual de la organización, a un
desempeño potencial deseado.

 Identifica la diferencia de lo que es y lo que debería
ser
634
Análisis de brecha
 Se pueden redirigir los esfuerzos a objetivos como:
 Permanecer en el negocio
 Mantener o incrementar la participación del mercado
 Mejorar el clima laboral
 Igualar o exceder a Benchmarks
 Igualar o exceder a la competencia
 Reducir tiempos de ciclo
 Lograr certificaciones
 Mejorar la productividad
 Mejorar los niveles de calidad
635
Análisis de brecha
 Se requieren tres categorías de información
 ¿Dónde estamos?
 ¿Dónde queremos ir?
 ¿Cómo vamos a medir los resultados?

636
Planeación de escenarios
 Al elaborar planes estratégicos, los directivos pueden
confiarse o ser orgullosos de aceptar cambios. Por lo
que se sugiere considerar escenarios del mejor y del
peor caso, para evitar errores en la toma de
decisiones

 Los escenarios permiten imaginar el desempeño
futuro de la organización ante riesgos, para tomar las
mejores decisiones y atender estos eventos. Aunque
algunos elementos sean desconocidos
637
Planeación de escenarios
 El proceso de planeación es como sigue:
 Seleccionar al personal que pueda dar muchas
perspectivas
 Desarrollar una lista de cambios percibidos, sociales,
técnicos y económicos
 Agrupar estas percepciones en patrones relacionados
 Desarrollar una lista de las mejores percepciones
(prioridades)

638
Planeación de escenarios
 El proceso de planeación es como sigue:
 Desarrollar un escenario grueso del futuro basado en
estas prioridades
 Determinar como afectan los escenarios a la
organización
 Determinar los cursos de acción potenciales a tomar
 Monitorear, evaluar, y revisar los escenarios
639
Planeación de escenarios
 Por lo común se perciben de 6 – 10 amenazas u
oportunidades en 2 o 3 escenarios desarrollados.
Evitar las siguientes trampas:

 No utilizar un facilitador experimentado

 Considerar escenarios como pronósticos

 Hacer escenarios simplistas

 Limitar el impacto global de los escenarios
640
Planeación de escenarios
 Evitar las siguientes trampas…..:
 No incluir a un equipo directivo en el proceso

 Tratar los escenarios solo como actividad informativa

 Limitar el estímulo imaginativo en el diseño del
escenario

 No desarrollar escenarios para área de impacto clave
del negocio
641
Planeación Hoshin
 Es una herramienta de ejecución, usada para
organizar y desplegar planes estratégicos

 Hoshin traduce la visión de la empresa en resultados
medibles dramáticos y rupturas estratégicas

 Hoshin se enfoca a identificar los pocos logros vitales
de ruptura
642
Planeación Hoshin
 Tiene seis objetivos:
 Alinear las metas organizacionales

 Enfocarse en las pocas brechas vitales estratégicas

 Trabajar con otros para cerrar las brechas

 Especificar los métodos para lograr los objetivos

 Hacer visible el enlace entre planes locales

 Mejora continua del proceso de planeación
643
Otras técnicas de análisis clave
 Benchmarking

 Análisis FODA

 Análisis PEST

 Las cinco fuerzas competitivas de Porter
644
Evaluación organizacional
 Análisis funcional con datos de colección:
 Entrevistas cara a cara
 Selección de muestra apropiada
 Entradas de grupo de enfoque
 Observaciones de visitas a la planta
 Datos colectados de fuentes de la industria

 Se divide a la organización en áreas funcionales clave
 Liderazgo, prácticas de negocio, análisis financiero,
mercadotecnia, gestión de la calidad, diseño y
desarrollo, manufactura, salud y seguridad, etc…
645
Evaluación organizacional
 Se deben analizar los resultados y presentarlos a la
dirección, quien debe promover e implementar
planes de acción claros

 Normalmente el consultor colecta y resume la
información en categorías principales para su revisión
por la dirección. Quienes deben generar e
implementar las soluciones y guiar al éxito
646
Métricas organizacionales
 Se establecen metas de desempeño organizacional y
sus métricas en las áreas de:
 Utilidades
 Tiempos de ciclo
 Recursos
 Respuestas del mercado

 Por cada meta organizacional mayor deben
desarrollarse métricas, con unidades y métodos de
medición.
647
Métricas organizacionales
Para los anteriores, las métricas pueden ser:
 Utilidades a corto y largo plazo
 Valor de acciones, inversión de capital, costos
personales, comparaciones competitivas, ROI, ventas$

 Tiempos de ciclo
 Tiempos de ciclo actuales
 Benchmarks internos
 Benchmarks externos
 Reducción en tiempos de ciclo
648
Métricas organizacionales
 Recursos
 No. De proyectos de mejora, ROI de proyectos, estudios de
capacidad de procesos, reducciones de variabilidad, costos
de calidad con relación a una base, porcentaje de defectos
con relación a alguna base

 Respuestas del mercado
 Encuestas con clientes
 Análisis de devoluciones
 Desarrollo de nuevos productos
 Retención de clientes
 Pérdidas con clientes
 Tasas de cortesías e instalaciones
649
Métricas organizacionales
Las métricas permiten medir los avances en relación a
las metas organizacionales

 De acuerdo a Juran se debe tomar en cuenta lo
siguiente:
 Las métricas deben tener un significado estándar
 Deben apoyar el proceso de toma de decisiones
 Deben proporcionar información valiosa
 Debe ser fácil de instalar
 Si son valiosas, deben usarse en todo
 Las métricas se basan en la retroalimentación con
base en clientes, proveedores, o internas
650
VI.D.2 Análisis de causa raíz
651
Análisis de causa raíz
 Un equipo tiene la responsabilidad de determinar la
causa raíz de una deficiencia y corregirla. Pueden
tomar varios pasos:

 Situación (presa con fuga)
 Acción inmediata (desahogarla)
 Acción intermedia (reparar la presa)
 Acción en la causa raíz (identificar que causó la fuga
para evitar su recurrencia y reconstruir la presa)
652
Análisis de causa raíz
Se pueden utilizar las siguientes herramientas:
 Herramientas subjetivas:
 Preguntar por qué cinco veces, tormenta de ideas,

 análisis de flujo de proceso, PHVA, grupo nominal,

 observación de operación, diagrama de causa efecto,

 técnicas de consenso, seis sombreros de pensamiento,

 equipos de trabajo, FMEA, FTA

653
Análisis de causa raíz
Se pueden utilizar las siguientes herramientas:
 Herramientas analíticas:
 Colección y análisis de datos

 Análisis de Pareto, análisis de regresión, hoja de
verificación

 Análisis de matriz de datos
 Análisis de capacidad de procesos, división de variación

 Subgrupos de datos, experimentos simples, DOE
 Pruebas analíticas, cartas de control

654
Análisis de causa raíz
Ante una acción correctiva permanente, la dirección
debe determinar si:

 El análisis de causa raíz ha identificado el impacto
completo del problema

 La acción correctiva es efectiva para eliminar o
prevenir la recurrencia

 La acción correctiva es realista y sostenible
655
Los 5 Por qués
 Se hace la pregunta ¿Por qué? Cinco veces
 ¿Por qué? Nos faltaron partes por máquina dañada
 ¿Por qué? La máquina no ha tenido mantenimiento en
los últimos 3 meses
 ¿Por qué? El departamento de mantenimiento se ha
reducido a 6 personas de 8
 ¿Por qué? Se pasó del presupuesto, les quitaron el
tiempo extra y dos personas
 ¿Por qué? La empresa no ha tenido los resultados
esperados y el director ha hecho recortes para salvar la
situación, teme por su puesto
656
5Ws y 1H
 El método de las 5Ws y 1H se resume al preguntar
¿quién?, ¿qué?, ¿cuándo?, ¿dónde?, ¿por qué? Y
¿cómo?.

 Pueden usarse las ramas del diagrama de causa
efecto
657
Diagrama de causa efecto
 Rompe el problema en partes más pequeñas
 Muestra muchas causas potenciales gráficamente
 Muestra como interactúan las causas
 Sigue las reglas de la tormenta de ideas
 Las sesiones tienen tres partes:
 Tormenta de ideas
 Dar prioridades (identificar las tres causas principales)
 Desarrollo de un plan de acción
658
Diagrama de Pareto
 Sirve para identificar problemas u oportunidades
prioritarias o mayores

 De acuerdo a Juran permite identificar “los pocos
vitales” de los “muchos triviales”

 El principio de Pareto sugiere que unas cuantas
categorías de problemas (20% aprox.) presentan la
mayor oportunidad para la mejora (80% aprox.)
659
Método de las 8 disciplinas - Ford
 El método de Ford para el análisis de causa raíz es:
D1. Establecer el equipo
D2. Describir el problema
D3. Desarrollar una acción de contención
D4. Identificar la causa raíz
D5. Desarrollar alternativas de solución
D6. Implementar una acción correctiva permanente
D7. Prevenir la recurrencia
D8. Reconocer al equipo y las contribuciones individuales
660
Análisis de árbol de falla - FTA
 FTA es un método sistemático deductivo, para definir
un evento singular específico e indeseable, y
determinar todas las posibles razones (fallas) que
pueden hacer que ocurra el evento

 Se utiliza el las primeras fases del diseño como
herramienta para impulsar modificaciones iniciales de
diseño.
661
Análisis de árbol de falla - FTA
 Otras áreas de su aplicación son:
 Análisis funcional de sistemas complejos
 Evaluación de requerimientos de seguridad,
 confiabilidad,
 defectos de diseño,
 riesgos de peligro,
 acciones correctivas,
 simplificación de mantenimiento y detección de falla,
 eliminación lógica de causas de falla
662
Análisis de árbol de falla - FTA
 Se prefiere el FTA en vez del FMEA cuando:
 La seguridad el personal es importante
 Se pueden identificar un número pequeño de eventos
superiores
 Hay alto potencial de falla
 El problema es cuantificar la evaluación del riesgo
 La funcionalidad del producto es altamente compleja
 El producto no es reaprables
663
Análisis de árbol de falla - FTA
 Se prefiere el FMEA en vez del FTA cuando:
 Los eventos superiores no se pueden definir
explícitamente
 Son factibles múltiples perfiles potencialmente exitosos
 La identificación de todos los modos de falla es
importante
 La funcionalidad del producto tiene poca intervención
externa
664
Análisis de árbol de falla - FTA
 Símbolos de compuertas lógicas para determinar la
confiabilidad del sistema. Hay símbolos de eventos y
símbolos de compuertas

 Símbolos de eventos

Evento superior, falla a nivel sistema o evento
indeseable

Evento básico, evento falla de más bajo nivel
a estudiar

Evento de falla, evento de falla de bajo nivel. Puede recibir
entradas o proporcionar salidas a una compuerta lógica
665
Análisis de árbol de falla - FTA
 Símbolos de compuertas lógicas

“AND”. El evento de salida ocurre solo
Si ocurren todos los eventos de entrada
Simultaneamente

“OR”. El evento de salida ocurre si
Ocurre alguno de los eventos de
La entrada
666
Análisis de árbol de falla - FTA
 Ejemplo: se asume que falla el sistema superior

667
Análisis de árbol de falla - FTA
 La probabilidad de falla del sistema es 5.02%. Se
indica que el teclado es prioritario (0.20), después la
CPU (0.015) y el monitor (0.015)
668
VI.D.3 Análisis del Muda
669
Análisis de Muda
 Las actividades que no agregan valor se clasifican
como Muda, de acuerdo a Imai son:
 Sobreproducción
 Inventarios
 Reparaciones / rechazos
 Movimientos
 Transportes
 Re – Procesos
 Esperas
670
Sobreproducción
 Se produce más en cierto momento, por:
 Producir más de lo necesario por el siguiente proceso
 Producir antes de lo requerido por el siguiente proceso
 Producir más rápido de lo requerido por el siguiente
proceso
 Sus consecuencias son:
 Espacio extra en las instalaciones del cliente
 Materias primas adicionales en uso
 Utilización de energéticos y transportes adicionales
 Costos de programación adicionales
671
Inventario en exceso
 Las partes, materias primas, inventario en proceso,
refacciones y productos terminados forman el
inventario, el inventario es Muda ya que requiere:
 Espacio en piso, Transporte, Montacargas
 Sistemas de transportadores
 Interés sobre el costo de los materiales

 Puede verse afectado por:
 El polvo, deterioro, obsolescencia
 Humedad (oxidación), daño durante el manejo


672
Inventario en exceso
 Las partes, materias primas, inventario en proceso,
refacciones y productos terminados forman el
inventario, el inventario es Muda ya que requiere:
 Espacio en piso, Transporte, Montacargas
 Sistemas de transportadores
 Interés sobre el costo de los materiales

 Puede verse afectado por:
 El polvo, deterioro, obsolescencia
 Humedad (oxidación), daño durante el manejo


673
Reparaciones / defectos
 Las reparaciones o el retrabajo de partes defectivas
significa un segundo intento de producirlas bien. Se
rompe el Takt Time

 Puede haber desperdicio de materiales o productos
no recuperable

 Si hay defectos, no puede implementarse el flujo de
una pieza
 Los cambios de diseño también son Muda

674
Movimientos
 Los movimientos adicionales del personal son Muda.
Caminar mucho, cargar pesado, agacharse, estirarse
mucho, repetir movimientos, etc.

 El lugar de trabajo debe diseñarse ergonómicamente,
analizando cada estación de trabajo

 La ergonomía puede causar daños y producción
perdida
675
Movimientos
 Algunas reglas de la ergonomía incluyen:
 Enfatizar la seguridad todas las veces
 Adecuar el empelado a la tarea
 Cambiar el lugar de trabajo para que se adecue al
empleado
 Mantener posiciones neutrales del cuerpo
 Rediseñar las herramientas para reducir esfuerzo y
daños
 Variar las tareas con rotación de puestos
 Hacer que la máquina sirva al ser humano

676
Reprocesos
 Consiste de pasos adicionales en el proceso de
manufactura, por ejemplo:
 Remoción de rebabas
 Maquinado de partes mal moldeadas
 Agregar procesos de manejo adicionales
 Realizar procesos de inspección
 Repetir cambios al producto innecesarios
 Mantener copias adicionales de información
677
Transportes
 Todo transporte es Muda excepto la entrega al
cliente. Incluye:
 Uso de montacargas
 Uso de transportadores
 Uso de movedores de pallets y camiones

 Puede ser causado por:
 Deficiente distribución de planta o de celdas
 Tiempos de espera largos, áreas grandes de
almacenaje, o problemas de programación
678
Esperas
 Ocurre cuando un operador está listo para realizar su
operación, pero permanece ocioso, por falla de
máquina, falta de partes, paros de línea, etc. El Muda
de espera puede ser por:
 Operadores ociosos
 Fallas de maquinaria
 Tiempos de ajuste y preparación largos
 Tareas no programadas a tiempo
 Flujo de materiales en lotes
 Juntas largas e innecesarias
679
Mudas adicionales
 Otros mudas adicionales a los 7 desperdicios son:
 Recursos mal utilizados
 Recursos poco utilizados
 Actividades de conteo
 Búsqueda de herramientas o partes
 Sistemas múltiples
 Manos múltiples
 Aprobaciones innecesarias
 Fallas de máquinas
 Envío de producto defectivo al cliente o mal servicio
680
Salidas de la Fase de Análisis
 Causas raíz validadas

 Guía de oportunidades de mejora

681
Preguntas ejemplo
1. En un sentido amplio, cuantas de las siguientes causas de
variación en estudios multi vari pueden incluir elementos de
proceso relacionados con el tiempo:
I. Posicional
II. Cilíndrica
III. Temporal
a. I y II c. II y III
b. I y III d. I, II y III

2. En un estudio de análisis de regresión con dos variables, ¿que
representa el término Beta 1?:
a. La pendiente de la línea
b. La interacción de la medición
c. La intersección en el eje X
d. La intersección en el eje Y
3. Se hace un estudio entre la velocidad de coches y su consumo
de gasolina. El coeficiente de correlación es de 0.35. Después se
encontró que el velocímetro está equivocado y debió haber
marcado 5 km. De más. Se recalcula el coeficiente de
correlación, que debe dar:
a. 0.30 b. 0.35 c. 0.40 d. -0.35
682
Preguntas ejemplo
4. La siguiente ecuación es:
a. La covarianza de X y Y
b. El coeficiente de correlación de X y Y
c. El coeficiente de determinación de X y Y
d. La varianza del producto de X y Y

5. Según la figura, ¿Cuál de las afirmaciones siguientes es falsa?



I. El coeficiente de correlación es negativo
II. El coeficiente de determinación es positivo
III. El coeficiente de determinación es menor que el coeficiente de
correlación
a. Sólo I c. Sólo III
b. Sólo II d. II y III
683
Preguntas ejemplo
6. Un problema de correlación:
a. Se resuelve estimado el valor de la variable
dependiente para varios valores de la variable
independiente
b. Considera la variación conjunta de las dos
mediciones, ninguna de las cuales es restringida por
el experimentador
c. Es un caso donde la distribución relevante debe ser
geométrica
d. Se resuelve al asumir que las variables son normales
e independientemente distribuidas con media cero y
varianza “s”
684
Preguntas ejemplo
7. Una muestra aleatoria de tamaño n se toma de una gran población con
desviación estándar de 1.0”. El tamaño de muestra se determina de
manera que haya un 0.05 de probabilidad de riesgo de exceder 0.1” de
error de tolerancia al usar la media de la muestra para estimar la Mu.
¿Cuál de los siguientes valores es el más cercano al tamaño de muestra
requerido?

a. 365 b. 40 c. 200 d. 100

8. La diferencia entre poner alfa de 0.05 y alfa igual a 0.01 en una prueba
de hipótesis es:
a. Con alfa de 0.05 se tiene mayor tendencia a cometer un error tipo I
b. Con alfa de 0.05 se tiene más posibilidad de riesgo de cometer un error
tipo II
c. Con alfa de 0.05 es una prueba más “conservadora” de la hipótesis nula
Ho
d. Con alfa de 0.05 se tiene menos posibilidad de cometer un error tipo I

9. Si un tamaño de muestra de 16 tiene un promedio de 12 y una
desviación estándar de 3, estimar el intervalo de confianza para un
nivel de confianza del 95% para la población (asumir una distribución
normal)

Preguntas ejemplo
10. En una muestra aleatoria de 900 vehículos, 80% tienen frenos
ABS. ¿Cuál es el intervalo del 95% para el porcentaje de
vehículos con frenos ABS?
a. 0.778 – 0.821 c. 0.639 – 0.964
b. 0.771 – 0.829 d. 0.774 – 0.826

11. Determinar si los siguientes dos tipos de misiles tienen
diferencias significativas en sus varianzas a un nivel del 5%:
Misil A: 61 lecturas Varianza = 1.347 km2.
Misil B: 31 lecturas Varianza = 2.237 km2.
a. Hay diferencia significativa ya que Fcalc < Ftablas
b. No hay diferencia significativa por que Fcalc < Ftablas
c. Hay diferencia significativa por que Fcalc > Ftablas
d. No hay diferencia significativa pro que Facla > Ftablas

12. El valor crítico para t, cuando se hace una prueba t de dos
colas, con muestras de 13 y alfa de 0.05 es:
a. 1.782 c. 2.064
b. 2.179 d. 1.711
Preguntas ejemplo
13. Tres personas en entrenamiento se les proporciona el mismo lote de
50 piezas y se les pide que las clasifiquen como buenas o defectuosas,
con los resultados siguientes:
Persona





Para determinar si hay o no hay diferencia en la habilidad de las tres
personas para clasificar adecuadamente las partes, ¿cuál de los
siguiente es (son) verdadero?
I. El valor calculado de Chi cuadrada es de 6.9
II. Para un nivel de significancia de 0.05, el valor crítico de Chi cuadrada
es de 5.99
III. Como el valor calaculado de Chi cuadrada en mayor a 5.99, se rechaza
la hipótesis nula
a. Sólo I c. Sólo II
b. I y II d. I, II y III

14. Un análisis de varianza de dos vías tiene r niveles para una variable y c
niveles para la otra, con dos obseraciones por celda. Los grados de
libertad para la interacción son:
a. 2 (r ) (c ) b. (r-1) (c-1) c. rc – 1 d. 2 (r -1) (c – 1)
A B C Total
Defectivos 17 30 25 72
Buenos 33 20 25 78
Total 50 50 50 150

Preguntas ejemplo
15. Los supuestos básicos del análisis de varianza oncluyen:
I. Las observaciones vienen de poblaciones normales
II. Las observaciones vienen de poblaciones con vaianzas iguales
III. Las observaciones vienen de poblaciones con medias iguales
a. I y II c. II y III
b. I y III d. I, II y III


16. El valor teórico esperado para una celda en la tabla de
contingencia se calcula como:
Preguntas ejemplo
17. ¿Cuál de las siguientes afirmaciones son verdaderas en relación a
las pruebas no paramétricas?
I. Tienen mayor eficiencia que sus equivalentes pruebas paramétricas
II. Pueden ser aplicadas a estudios de correlación
III. Requieren supuestos acerca de la forma oi naturaleza de las
poblaciones involucradas
IV. Requieren cálculos que son más difíciles que sus equivalentes
pruebas paramétricas
a. Sólo II c. II y IV
b. I y III d. I, II y III

Fase de Análisis

Propósitos:
  

Establecer hipótesis sobre las posibles Causas Raíz Refinar, rechazar, o confirmar la Causa Raíz Seleccionar las Causas Raíz más importantes:

Las pocas Xs vitales

Salidas:

Causas raíz validadas Factores de variabilidad identificados

2

QFD

FASE DE ANÁLISIS

Diagrama Causa Efecto

Diagrama de relaciones Diagrama de Ishikawa Diagrama de Árbol

Definición Y=X1 + X2+. .Xn CTQs = Ys Operatividad Medición Y, X1, X2, Xn X's Causas potenciales

Análisis del Modo y Efecto de Falla (AMEF)

Pruebas de hipótesis Diagrama de Flujo del proceso

Llenar columnas del FMEA Hasta sol. Propuesta y comprobar causas con Pruebas de Hipótesis
X's vitales Si Causas raíz validadas

No

¿Causa Raíz?

3

VI. Análisis
A. Medición y modelaje de relación entre variables B: Pruebas de hipótesis C. Análisis del modo y efecto de falla (AMEF) D. Métodos adicionales de análisis
4

A. Medición y modelaje de relación entre variables

5

A. Medición y modelaje de relación entre variables
1. Coeficiente de correlación 2. Regresión

3. Herramientas Multivariadas
4. Estudios Multivari 5. Análisis de datos por atributos

6

VI.A.1 Coeficiente de correlación

7

Correlación

Definiciones

Establece si existe una relación entre las variables y responde a la pregunta, ”¿Qué tan evidente es esta relación?"
Regresión Describe con más detalle la relación entre las variables.

Construye modelos de predicción a partir de información experimental u otra fuente disponible.
Regresión lineal simple Regresión lineal múltiple Regresión no lineal cuadrática o cúbica

8

Correlación
Propósito: Estudiar la posible relación entre dos variables.

Accidentes laborales

• • • • • • • • • • • • • • • • • • • • • • •

• • •

• •

Correlación positiva, posible

Numero de órdenes urgentes

El 1er. paso es realizar una gráfica de la información. 9

Coeficiente de correlación (r )

Mide la fuerza de la relación lineal entre las variables X y Y en una muestra. El coeficiente de correlación muestral de Pearson rx,y con valores entre -1 y +1 es:

10

Correlación de la información (R ) de las X y las Y
Correlación Positiva Evidente 25
20 15 10 5 0 0 5 10 X 15 20 25 Y
Y

Correlación Negativa Evidente
25 20 15 10 5 0 0 5 10 X 15 20 25

Sin Correlación
25 20 15

R=1
Y

R=-1

25 20 15 Y 10 5 0 0

Correlación Positiva

10 5 0 0 5 10 X 15 20 25 25 20 15 Y 10 5

Correlación Negativa

R=0

5

10 X

15

20

25

0
0 5 10 X 15 20 25

R=>1

R=>-1

11

Coeficiente de correlación

El coeficiente de correlación r asume el mismo signo de la pendiente de la recta 1 siendo cero cuando 1 =0

Un valor positivo de r implica que la pendiente de la línea es ascendente hacia la derecha Un valor negativo de r implica que la pendiente de la línea es descendente hacia la derecha Si r=0 no hay correlación lineal, aunque puede haber correlación curvilínea 12

Coeficiente de correlación
Reglas empíricas
Coeficiente de correlación Relación

0.8 < r < 1.0 0.3 < r < 0.8 -0.3 < r < 0.3 -0.8 < r < -0.3 -1.0 < r < -0.8

Fuerte, positiva Débil, positiva No existe Débil, negativa Fuerte, negativa

13

59 0.68 0.96 0.48 0.56 0.58 0.40 0.60 0.80 0.63 0.64 0.66 n 95% de confianza 0.81 0.92 0.83 0.50 0.46 0.99 0.00 0.71 0.37 0.44 0.63 14 .61 0.00 0.76 0.95 0.Correlaciones (Pearson) Tabla de Correlación mínima n 95% de confianza 1.61 0.42 0.53 0.88 0.51 0.36 99% de confianza 0.50 0.39 0. el coeficiente (r) debe ser al menos .73 0. con una muestra de 10.46 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 Para un 95% de confianza.75 0.71 0.52 0.87 0.48 0.67 0.58 0.47 0.53 99% de confianza 1.54 0.

• La correlación puede usarse con un “predictor” o más para una respuesta dada. • La correlación es una prueba fácil y rápida para eliminar factores que no influyen en la predicción. para una respuesta dada. 15 .Correlación • La correlación puede usarse para información de atributos. variables normales y variables no normales.

Coeficiente de Correlación Para determinar que tanto se acercan los datos predichos por el modelo a los datos observados aplicando el coeficiente de correlación de Pearson (ver tabla anterior para identificar la significancia) S(yeyo) r= S(yeye) S(yoyo) S(yeye) = Syei 2- (Syei)2 n (Syoi)2 n r = Coeficiente de correlación yo = Respuesta observada ye = Respuesta esperada S(yoyo) = Syoi 2- (Syei)(Syoi) S(yeyo) = Syei yoi n 16 .

términos en el modelo (Incluyendo la constante) (n-1) Criterios en función a la R2(Adj) > 90% = Correlación Fuerte 80% .60% = Correlación débil < 40% = No existe correlación 17 .90% = Buena correlación 60% .Coeficiente de Correlación ajustado Otra forma para no consultar la tabla de coeficiente de correlación de Pearson es la r ajustada R2(Adj) = 1 – (1 – r2) (n-p) Donde : R2(Adj) = Coeficiente de correlación ajustado r = Coeficiente de correlación de Pearson n = Número de datos p = Núm.80% = Correlación media 40% .

Coeficiente de Determinación (R2)  El coeficiente de determinación es la proporción de la variación total explicada por la regresión. R2 se encuentra en el rango de valores de 0 a 1. 18 .

por ejemplo peso de un coche y peso de las personas que transporta. como si lavo mi coche. 19 . llueve. o que no la relación no tenga sentido.Correlación vs causación  Tener cuidado de no tener variables colineales.

2 Regresión 20 .VI.A.

Análisis de Regresión El análisis de regresión es un método estandarizado para localizar la correlación entre dos grupos de datos. y. quizá más importante. crear un modelo de predicción. Puede ser usado para analizar las relaciones entre: • Una sola “X” predictora y una sola “Y” • Múltiples predictores “X” y una sola “Y” • Varios predictores “X” entre sí 21 .

  Los errores no están correlacionados. y   0  1 X    El término de error  tiene media cero.Supuestos de la regresión lineal Los principales supuestos que se hacen en el análisis de regresión lineal son los siguientes:  La relación entre las variables Y y X es lineal. El término de error  tiene varianza constante 2. Los errores están normalmente distribuidos. o al menos bien aproximada por una línea recta.  22 .

Modelo de regresión lineal  Se aume que para cualquier valor de X el valor observado de Y varia en forma aleatoria y tiene una distribución de probabilidad normal  El modelo general es: Y = Valor medio de Yi para Xi + error aleatorio y   0  1 X   23 .

La suma residual de los cuadrados es llamada con frecuencia la suma de los cuadrados de los errores (SSE) acerca de la línea de regresión ei • • • • • • • • • • • • • • • yi • • • • • • • • • y = b0 + b1x • • • • • a y b son Estimados de 0 y 1 SSE = Sei2 = S(yi . El modelo se define de tal manera que la suma de los cuadrados de los residuales es un mínimo. Un residuo es la diferencia entre un punto de referencia en particular (xi. yi) y el modelo de predicción ( y = a + bx ).yi2 xi .Regresión Lineal Simple La línea de regresión se calcula por el método de mínimos cuadrados.

18 0.Gráfica de la Línea de Ajuste Recta de regresión Y=-.858+5738.19 Altura del muelle 0.89X R2 = .600.895 600 Retención 500 Regresión 95% Intervalo de confianza 400 0.20 95% Intervalo de predicción .

Interpretación de los Resultados La ecuación de regresión (Y = -600. En general. 95% de los puntos individuales (provenientes de la población sobre la que se basa la línea de regresión). R2 (coef. se encontrarán dentro de la banda [Líneas azules] 26 .89X) describe la relación entre la variable predictora X y la respuesta de predicción Y.858 + 5738. de determinación) es el porcentaje de variación explicado por la ecuación de regresión respecto a la variación total en el modelo El intervalo de confianza es una banda con un 95% de confianza de encontrar la Y media estimada para cada valor de X [Líneas rojas] El intervalo de predicción es el grado de certidumbre de la difusión de la Y estimada para puntos individuales X.

Ho: El modelo no es significativo en la predicción de la respuesta. Ha: El factor es significativo en la predicción de la respuesta. Ha: El modelo es significativo en la predicción de la respuesta. ajustado por el número de términos en el modelo y por el número de puntos de información.Interpretación de los Resultados • Los valores “p” de la constante (intersección en Y) y las variables de predicción. se leen igual que en la prueba de hipótesis. . • R2 (ajustada) es el porcentaje de variación explicado por la regresión. • El valor “p” para la regresión se usa para ver si el modelo completo de regresión es significativo. Ho: El factor no es significativo en la predicción de la respuesta. • s es el “error estándar de la predicción” = desviación estándar del error con respecto a la línea de regresión.

28 .Errores residuales  Los errores se denominan frecuentemente residuales. Podemos observar en la gráfica de regresión los errores indicados por segmentos verticales.

. Checar el efecto del tiempo si su orden es conocido en los datos. A veces es preferible trabajar con residuos estandarizados o estudentizados: e di  ei ... n pueden ser graficados para:   ^   Checar normalidad. Checar la constancia de la varianza y la posible necesidad de transformar los datos en Y.. 29 . 1  1.2..Errores residuales Los residuos ei  Yi  Y i ... Checar la curvatura de más alto orden que ajusta en las X’s... i  1... n MS E ri  i   1 (X  X ) MSE 1    i  S XX  n 2     .3.2...

2 .Errores residuales  Análisis de los errores o residuales ¿Residuales individuales tendencias. sin tendencias? 30 .0 L=-43 6 .0 0 =0 0 -10 -20 -2 -1 0 1 2 Marcador Normal -3 S . o separados? Tabla de Residuales 50 40 30 20 10 0 -10 -20 -30 -40 -50 0 5 10 Número de Observación 3 L . Ajustes 4 50 50 0 Ajuste 550 Buscar las inconsistencias Buscar las inconsistencias mayores mayores ¿Aleatorio alrededor de cero.2 Frecuencia Residual Histograma ¿curva de campana? Ignórese para grupos pequeños de información (<30) Histograma de Residuales 3 2 1 0 -25 -20 -15 -10 -5 0 5 10 15 20 10 0 -10 -20 Residuales vs.0S =43 6 ¿Qué tan normales son los residuales? Gráfica Normal de Residuales 20 10 Diagnóstico del Modelo de Residuales Residual 0 Residual X .

el de determinación y la recta.Ejemplo Considere el problema de predecir las ventas mensuales en función del costo de publicidad.7 0.1 Ventas 101 92 110 120 90 82 93 75 91 105 31 .0 0.8 1.6 0.3 0.9 1.0 1.8 1. Calcular el coeficiente de correlación.2 0. MES 1 2 3 4 5 6 7 8 9 10 Publicidad 1.

Suma Y.64 1.4 32 .8 1.6 110.49 0.5 924.69 0.0 1.1 101 92 110 120 90 82 93 75 91 105 959 1.0 0.81 1.0 81.36 0.2 73.Cálculo manual Calcular columnas para Suma X.2 0.6 0.21 9. Xi2.64 1.00 0.00 1.44 0.0 45.569 SUMA 9. XiYi y Yi2 Xi Yi MES Publicidad Ventas Xi2 XiYi Yi2 1 2 3 4 5 6 7 8 9 10 1.9 115.8 1.0 65.0 156 63.9 1.7 0.6 93.28 121.8 10201 8464 12100 14400 8100 6724 8649 5625 8281 11025 93.3 0.

Método de mínimos cuadrados Donde: Yest = Valor predicho de para un valor particular de x.(ordenada al origen) b1= Estimador puntual de (pendiente) Para el cálculo de b0 y b1 se utilizamos las siguientes fórmulas: SS x ( x  x  n 2 2 b1  SS xy SS x SS y ( y  y  n 2 2 b0  y  b1 x SS xy   xy  ( x ( y  n 33 . b0 = Estimador puntual de .

Análisis de varianza en la regresión Tabla de Análisis de Varianza Fuente Regresión df 1 SS SSR  b1 S XY MS = SS/df MS REG . Fc MSreg/s2 SSE  SSYY  b1 S XY Residual n-2 S2 __________________________________________________________. SYY Total corregido n-1 La desviación estándar S corresponde a la raíz cuadrada del valor de MSE o cuadrado medio residual. SS E SYY  b1 S XY 2 S   n2 n2 Los residuos son: SYY    Yi  n  Yi 2   i 1  n i 1 n 2 S XY   X iYi  i 1 n  X Y i 1 i i 1 n n i n ^ ei  Yi  Y i ^ Yi  Y i  Yi  Y  (Y i  Y )  (Y ^ __ ^ __ i  Y ) 2   (Y i  Y ) 2   (Yi  Y i ) 2 __ ^ __ 34 .

Intervalos de confianza para Beta 0 y Beta 1 __ 2  1 X se(b0 )  MSE    n S XX        X i2  S    __   n ( X i  X ) 2      1/ 2   1   X i2  S b0  t (n  2. S 2 __ ( X i  X )2 35 .1  1  ). para determinar si el parámetro 1 es significativo que es el caso de Fcalc. n-2) grados de libertad y área en 100(1-)%. > Ftablas.1   ).1 t ( n  2.1   ) __  2  n ( X i  X ) 2     1/ 2 se(b1 )  MSE S  S XX S XX b1  t ( n  2. S 2 b1  __ ( X i  X )2  Análisis de varianza en la regresión Las conclusiones son como sigue: El estadístico F se calcula como F = MSEREG / S2 y se compara con la F de tablas con (1.

n 2 Intervalos de confianza para la Y estimada promedio Y0  t a / 2.1 t ( n  2.n  2  2  ( n  2) MSE  12 / 2.1   ).n 2 __   1 ( X 0  X )2  1   ˆ MSE  Y0  Y0  t / 2.n 2   n S XX   __   1 ( X 0  X )2  1   MSE   n S XX   36 .n 2 ^ __  2   1 (X0  X )  MSE   S XX n    Intervalo de predicción para un valor particular de Y estimado ˆ Y0  t / 2. S 2 b1  __ ( X i  X )2  Análisis de varianza en la regresión El intervalo de confianza para la desviación estándar es: ( n  2) MSE 2   / 2 .

S 2 b1  __ ( X i  X )2  Análisis de varianza en la regresión Prueba de Hipótesis para Beta 1: Ho: 1 = 0 contra H1:1  0 t0  b1 MSE S XX Si t0  t / 2.1   ).1 t ( n  2.n2 el coeficiente Beta 1 es significativo 37 .

S 2 b1  __ ( X i  X )2  Análisis de varianza en la regresión Coeficiente de correlación r: r S XY S XX S YY Coeficiente de determinación: r2 R2 mide la proporción de la variación total respecto a la media que es explicada por la regresión.1   ). ( SS.media ) (Y  Y ) 2  (Yi  Y ) 2  __ ^ __  1 SSE SYY 38 .de.1 t ( n  2. Se expresa en porcentaje.regresión.la.corregido.b0 ) R2   ( SSTotal. por. para.la.

1 t ( n  2. S 2 b1  __ ( X i  X )2  Análisis de varianza en la regresión Prueba de hipótesis para el Coeficiente de correlación r: H0:  = 0 contra H1:   0 t0  r n2 1 r2 Si t0  t / 2.n2 se rechaza la hipótesis Ho.1   ). indicando que existe una correlación significativa 39 .

Y *A  * * * * * * * * * Sin A y B *B X 40 . Mientras que todos los puntos tienen igual peso en la determinación de la recta. No pueden ser válidas para extrapolación fuera de este rango. 1.Riesgos de la regresión  Los modelos de regresión son válidos como ecuaciones de interpolación sobre el rango de las variables utilizadas en el modelo. su pendiente está más influenciada por los valores extremos de X.

Por ejemplo el número de enfermos mentales vs.Riesgos de la regresión  Los outliers u observaciones aberrantes pueden distorsionar seriamente el ajuste de mínimos cuadrados. Y *A * * ** * ** * ** * * * ** * * * * * * X  Si se encuentra que dos variables están relacionadas fuertemente. número de licencias recibidas. no implica que la relación sea casual. 41 . se debe investigar la relación causa – efecto entre ellas.

(52.b1*Xmedia = 95. = 46.4)^2/10 = 0.34 Ymedia = 959 / 10 = 95.4)(959) / 10 = 23.28 ..49 + 52.94) = 46.9 Xmedia = 9.) Cálculo de la recta de regresión lineal: Sxx = 9.(9.444 Sxy = 924.34 / 0.57* X 42 .444 = 52.5676)(0.9 .49 Yest.8 .(9.Cálculo manual (cont.4 / 10 = 0.57 b0 = Ymedia .94 b1 = Sxy / Sxx = 23.

Ejemplo (cont.9 .84 El intervalo de confianza donde caerán el 95% de los puntos es el rango de 1.96S = 13.) Cálculo de S2 estimador de  S2 = SSE / (n .2) = Syy .567)(23.(959)^2 / 10 = 1600. 43 .569 .97 / 8 = 46.(Sxy)^2/Sxx Syy = 93.75 S = 6.41 o sea a  13.41 de la línea.9 SSE = Syy .(52.b1*Sxy = 1600..34) = 373.2) = 373.97 S2 = SSE / (n .

) Inferencias respecto a la pendiente de la línea b1: Se usa el estadístico t = b1 / (S / Sxx) El término del denominador es el error estándar de la pendiente.025 con (n-2) = 8 grados de libertad es 2. 44 .57 / (6.444) = 5.306. para alfa/2 = 0.84 / 0. Para probar la hipótesis nula Ho: 1 = 0 En este caso tc = 52.. Como tc > tcrítico se rechaza la hipótesis de que b1 = 0 existiendo la regresión.12 El valor crítico tcrit.Ejemplo (cont.

57  23. Por tanto una unidad de incremento en publicidad.67.Ejemplo (cont. hará que el volumen de ventas se encuentre entre $28.84 /  0.306 * 6. 45 . Usando la fórmula b1  t0.444 = 52..) Estableciendo un 95% de confianza para la pendiente de la recta b1.2.57  2.9 a $76.025 (S / Sxx) se tiene: 52.

la pendiente de la recta apunta hacia arriba y a la derecha.9 = 0. El coeficiente de determinación r^2 = 1 .774 46 .SSE ) / Syy = 0.34 / 0.444*1600.Ejemplo (cont.) Cálculo del coeficiente de Correlación: ________ r = Sxy / (SxxSyy) ____________ r = 23..88 Como r es positivo.SSE/Syy r^2 = ( Syy .

OUTPUT RANGE (para los resultados) y obtener los resultados Column 1 Column 2 Column 1 1 0. DATA ANALYSIS o ANALISIS DE DATOS. CORRELATION o CORRELACIÓN 3.875442 47 . Dar INPUT RANGE (rango de datos). Llamar a TOOLS o HERRAMIENTAS.875442 Column 2 0. Teclear los datos para Xi y Yi 2.Análisis de Regresión 1.875442 1 El coeficiente de correlación r = 0.

Cálculo con Excel) 4. NOTAS: a) La gráfica de probabilidad normal debe mostrar puntos fácilmente aproximables por una línea recta. indicando normalidad. Dar INPUT RANGE Y (rango de datos Yi). DATA ANALYSIS o ANALISIS DE DATOS. B) La gráfica de residuos estandarizados se deben distribuir en 48 forma aleatoria alrededor de la línea media igual a cero. OUTPUT RANGE (para los resultados). CONFIDENCE INTERVAL 95%. RESIDUAL PLOTS o GRAFICAS DE RESIDUALES y obtener una tabla de resultados como los que se muestran en las páginas siguientes. Llamar a TOOLS o HERRAMIENTAS. INPUT RANGE X (rango de datos Xi). . REGRESION o REGRESIÓN 3.

22916 df 1 8 9 R Square 0.26086 5.927 1226.875442 Adjusted R Square0.05. ambos son significativos .737198 Observations 10 ANOVA SS MS F Significance F Regression 1226.973 46.24633 0.000904 La ecuación de la recta es Yest = 46.69262 69.000904 Residual 373.83715 X Variable1 52.702936 0.28035 28.56757 X Como los valores p para los coeficientes son menores a 0.48649 9.48649 + 52.56757 10.884566 4.123117 0.Resultados de Excel SUMMARY OUTPUT Regression Statistics Multiple R 0.9 Confidence 95% Coefficients Standard Error t Stat P-value Lower Upper Intercept 46.766398 Standard Error 6.001536 23.90597 76.74662 Total 1600.927 26.

Gráfica normal de Excel Normal Probability Plot 140 120 100 Y 80 60 40 20 0 0 20 40 60 80 100 Sample Percentile 50 .

5 X Variable 1 51 1 1.Gráfica de Residuos vs. X de Excel X Variable 1 Residual Plot Residuals 20 10 0 -10 0 0.5 .

8 Tiempo 200 2.4 2. la correlación y la determinación para la respuesta de un Taxi.2 0.2 1.0 1.Ejercicio Calcular la recta de predicción con sus bandas de confianza. los datos se muestran a continuación: Distancia 0.6 400 160 120 360 280 560 320 52 .0 0.6 1.

1 32.2 32.7 29.3 29.0 20.Relaciones no Lineales ¿Qué pasa si existe una relación causal.8 Concentración x 10. no lineal? ¿Cómo describiría El siguiente es un conjunto de datos esta relación? experimentales codificados.0 15.8 31.1 27.0 30.3 28.0 25.2 27. 1985) 53 .8 31.4 30. Walpole & Myers. sobre resistencia a la compresión de una aleación especial: Resistencia a la Compresión y 25.0 (ref.6 29.7 30.7 31.8 32.

9371 19.34584 3.0397 63.Modelo Cuadrático Y = 19.2.84E-03 10.9038 5.3005 6.04E-02X**2 R2 = 0.614 Análisis de Variancia FUENTE Regresión Error Total FUENTE DF Lineal 1 Cuadrática 1 DF 2 12 14 SS MS F p 38.54490 3.4133 Seq SS F p 28.0333 10.00857X .4762 2.0333 + 1.93E-02 54 .Resultados del Análisis de Regresión .4686 9.31E-03 24.

8189 1.0189 0.24 -0.9 6.5000 2.8000 1.3253 2.8660 0.10 -1.5 9.2530 1.6530 1.0473 0.0 5.0609 0.0611 0.8664 2.1 8.38 0.1196 1.0880 1.0606 -0.40 0.0907 0.79 1.5424 2.3218 0.9508 0.0698 0.9990 2.07 1.0737 0.1772 0.1551 -0.0223 -0.0703 0.7 9.9154 0.8 7.0776 0.0840 -0.5906 1.1940 1.0694 0.0804 0.2454 0.1790 2.90 0.4451 2.3030 2.2 2.2360 2.1726 0.2820 -0.5010 2.8 7.08 0.6622 1.1410 -0.0875 0.2400 -0.0490 0.0574 0.0239 2.0530 0.5778 0.8302 1.2 6.9300 1.0 9.9 8.29 0.0753 0.6 7.16 1.3084 0.0 6.1660 1.4 3.0629 0.5295 1.0806 0.31 1.0744 0.0519 0.4 4.8220 1.5580 2.47 -1.27 -2.3064 -0.5987 St Resid 1.0559 -0.38 -0.68 -0.2806 0.3366 1.1062 -0.4338 0.5 Y 1.3100 1.1120 1.7370 2.3860 2.1 10.40 -0.0834 0.62 -0.4 2.2678 0.1398 -0.6 5.75 0.2075 0.0500 0.Regresión cuadrática Obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 X 5.6260 0.0555 0.0570 0.1440 0.33 0.63 -1.7217 SE Fit 0.0472 0.4700 2.0476 0.2442 0.5620 1.1 4.1230 Fit 1.1370 2.0845 Residual 0.72R 55 .0962 1.7820 2.2940 0.61 0.2402 1.0675 0.7 10.1380 0.0 2.04 -0.0474 0.6 3.0828 0.2 4.06 0.5820 1.0 3.27 -1.

Regresión cuadrática Analysis of Variance Source DF SS Regression 1 8.000 56 .9296 0.9296 Residual Error 23 1.26 P 0.2816 Total 24 10.0557 F 160.2112 MS 8.

Regresión cuadrática Los residuos No son normales Se deben transformar Las variables 57 .

para mostrar mejor la relación entre ambas. para que con la variable transformada se obtenga una línea más recta. Algunas transformaciones comunes incluyen: x’ = 1/x x’ = Raíz cuadrada de (x) Funciones trigonométricas: x’ = Seno de x x’ = log x .Otros Patrones No Lineales A veces es posible transformar una o ambas variables. La meta es identificar la relación matemática entre las variables.

Transformación Forma lineal Y   0 X 1 Y   0 e 1 X Y '  log Y .Trasformación de funciones Funciones Figura 3.d e.h linealizables Función y su forma lineal correspondiente.b c.f g. X '  log X Y '  log Y X '  log X Y '  log  0  1 X ' Y '  ln  0  1 X Y '   0  1 X ' Y '   0  1 X ' Y   0  1 log X Y X  0 X  1 Y ' 1 1 .13 a. X ' Y X  Ejemplo: sea Y   0 e 1 X  se transforma como ln Y  ln  0  1 X  ln  Y '   0 ' 1 X   ' 59 .

0404 0.5820 1.97886 -6.0494 0.294 0.0271 Residual -0.34 -33.200 0.35 60 .0188 0.5000 2.01 1.0895 -0.000 0.000 R-Sq = 98. utilizando Minitab The regression equation is Y = 2.1177 0.4105 2.0570 0.93 1/X Predictor Constant 1/X S = 0.2360 2.0276 0.98 .8231 0.9345 SE Coef 0.8220 1.2064 T 66.0% Y 1.55 1.0274 0.6.100 0.3860 R-Sq(adj) = 97.04490 0.09417 Obs 1 2 3 4 5 6 1/X 0.05 -0.11 -0.59 P 0.103 Coef 2.167 0.Transformación de variables del ejemplo de regresión cuadrática  Transformando la variable X’ = 1/X se tiene.0199 0.370 0.0011 0.31 1.9% Fit 1.5920 1.9393 0.2640 SE Fit 0.0100 -0.1220 St Resid -0.2854 2.

Transformación de variables del ejemplo de regresión cuadrática  Transformando la variable X’ = 1/X se tiene. utilizando Minitab 61 .

Transformación de variables del ejemplo de regresión cuadrática  Los residuos ahora ya se muestran normales 62 .

........... Y '  sin 1 Y  2    E (Y )2 .................. .......... '  Y Y  2    E (Y ).. . .... .. Y '  ln(Y )  2    E (Y )3 .. ...... ....... Y '  Y 1 / 2 63 .... ............. ......Transformación para homoestacidad de la varianza  Algunas transformaciones para estabilizar la varianza Transformación Relación de 2 a E(Y)  2    constante..... .......................................... ...Y '  Y Datos de Poisson Proporciones binomiales  2    E (Y )1  E (Y ).

395 0.312 3.15 0.607 -0.170 1.160 0.430 3.523 3.877 0.27 0.988 0.638 -2.412 0.595 5.640 4.45 -1.420 0.899 -1.00R 1.828 -0.243 0.730 0.43 -0.353 -1.495 5.861 1.293 0.78 0.57 -0.441 0.333 0.620 2.244 St Resid -0.500 0.57 0.790 0.42 -0.29 -0.770 1.850 5.390 0.884 6.38 2.700 3.024 1.440 0.880 0.221 2.097 6.58 Obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 64 .560 1.587 -0.381 0.Transformación para homoestacidad de la varianza  Ejemplo: Se hizo un estudio entre la demanda (Y) y la energía eléctrica utilizada (X) durante un cierto periodo de tiempo X 679 292 1012 493 582 1156 997 2189 1097 2078 1818 1700 747 2030 1643 414 354 1276 745 435 540 874 1543 1029 710 Y 0.293 0.280 0.388 0.107 0.294 0.500 5.210 3.840 5.488 0.242 -0.301 2.307 0.308 2.61 0.245 0.313 0.186 1.600 0.250 4.764 0.802 1.880 3.756 SE Fit 0.293 0.000 Fit 1.730 9.651 0.132 -2.750 6.465 0.25 -1.980 2.649 0.837 -1.340 6.343 Residual -0.18 0.351 0.10 -1.214 1.96 -1.02 0.384 0.560 0.31 -0.167 2.640 4.642 2.42 -1.355 0.560 5.98 0.53 0.441 0.55 1.329 4.333 0.433 0.579 0.230 -0.790 2.297 0.324 4.859 0.004 1.339 1.717 1.803 1.24 1.490 0.17 -0.366 -1.

462 R-Sq = 66.136 Total 24 146.4% R-Sq(adj) = 64.7038 0.6170 -1.136 2.0.0034645 0.14 0.000 S = 1.00346 X Predictor Coef SE Coef T P Constant -0.0005139 6.45 Residual Error 23 49.Transformación para homoestacidad de la varianza  Ejemplo: Se hizo un estudio entre la demanda (Y) y la energía eléctrica utilizada (X) durante un cierto periodo de tiempo The regression equation is Y = .266 X 0.231 P 0.704 + 0.000 65 .094 97.9% Analysis of Variance Source DF SS MS F Regression 1 97.74 0.094 45.

Transformación para homoestacidad de la varianza  Se observa que la varianza se incrementa conforme aumenta X 66 .

Transformación para homoestacidad de la varianza  Se observa que la varianza se incrementa conforme aumenta X 67 .

1065 Residual -0.0894 0.3108 2.4961 2.3711 0.56 1.21 1.1790 0.0571 1.31 0.15 1.9783 1.7483 0.0822 2.6432 1.Transformación para homoestacidad de la varianza  Obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Transformando a X por su raíz cuadrada se tiene: X 679 292 1012 493 582 1156 997 2189 1097 2078 1818 1700 747 2030 1643 414 354 1276 745 435 540 874 1543 1029 710 SQR-Y 0.5575 2.1347 0.1867 0.27 0.1280 0.4231 -0.60 -0.5635 -0.25 -1.2782 -0.0265 1.0000 Fit 1.9187 1.1195 0.2978 0.4166 2.8354 1.7988 St Resid -0.6595 1.2184 1.2805 -0.64 1.2012 SE Fit 0.44 -0.1445 0.1524 0.2407 -0.0922 0.1092 0.2603 -0.71 -0.1900 -0.2372 0.3697 2.55 -1.0105 0.0912 0.3597 0.9079 2.1207 0.2392 2.6788 0.0641 0.7071 0.7290 0.8971 0.8775 1.1184 0.64 -0.0697 1.88 -0.60 0.8888 0.1518 0.1694 0.7208 1.0911 0.0770 0.8028 2.0910 0.89 1.8888 1.1048 1.7483 1.0914 0.1037 0.1800 0.81 68 .1304 0.4116 -0.2490 2.4123 1.5989 2.1371 0.1035 0.7828 1.3614 0.1372 0.27 -1.6173 2.09 -0.7717 1.98 -0.1228 0.6068 2.5735 0.64 -0.4527 -0.03 0.81 0.3822 -0.3397 2.7120 0.5290 1.0955 0.0974 0.6633 0.1084 -0.2825 1.1749 3.1598 0.93 -0.7776 0.18 0.5115 0.2024 0.2484 0.8000 2.52 0.7632 -0.

4544 R-Sq = 64.000 S = 0.472 + 0.0001598 6.4717 0.46 0.1918 2.7% 69 .Transformación para homoestacidad de la varianza  Transformando a X por su raíz cuadrada se tiene: Regression Analysis: SQR-Y versus X The regression equation is SQR-Y = 0.3% R-Sq(adj) = 62.43 0.0010275 0.022 X 0.00103 X Predictor Coef SE Coef T P Constant 0.

Transformación para homoestacidad de la varianza  Transformando a X por su raíz cuadrada se tiene: 70 .

Regresión lineal múltiple 71 .

.. el proceso se llama análisis de regresión múltiple. incluye el uso de ecuaciones lineales..   k X uk   u Se asume que los errores u tienen las características siguientes:  Tienen media cero y varianza común 2.  Están distribuidos en forma normal...  Son estadísticamente independientes.Regresión múltiple  Cuando se usa más de una variable independiente para predecir los valores de una variable dependiente.. Yu   0  1 X u1   2 X u 2  . 72 .

.... j = 1.... 2.. donde la 1ª. 1 .... columna es 1’s. D es la matriz de Xij con i = 1... .. N.  es un vector de orden (k + 1) x 1.  k )   (Yu   0   1 X u1   2 X u 2  ... . k 73 .   uk ) 2 u 1 N El modelo de regresión múltiple en forma matricial es: Y = X  +  = [1 : D]  +  Y es un vector N x 1.  es un vector de orden N x 1. 2.. X es una matriz de orden N x (k + 1).Regresión múltiple Estimación de los parámetros del modelo  Se trata de minimizar los errores cuadráticos en: R(  0 .

Regresión múltiple Estimación de los parámetros del modelo: b = (X’X)-1 X’Y El vector de valores ajustados Y  Xb se puede expresar como: ˆ ˆ Y  Xb  X ( X ' X ) 1 X ' Y  Hy La varianza del modelo se estima como: ˆ SSE   (Yi  Y ) 2   ei2  e' e i 1 n SSE  (Y  Xb)' (Y  Xb)  Y ' Y  b' X ' Y  Y ' Xb  b' X ' Xb  Y ' Y  2b' X ' Y  b' X ' Xb SSE  Y 'Y  b' X 'Y s 2  MSE  SSE Np 74 .

si esta razón es menor de5 a 1.Tamaño de muestra  Tomar 5 observaciones para cada una de las variables independientes. se tiene el riesgo de “sobreajustar” el modelo Un mejor nivel deseable es tomar 15 a 20 observaciones por cada variable independiente  75 .

Ejemplo de regresión múltiple  Un embotellador está analizando las rutas de servicio de máquinas dispensadoras.   76 . La actividad de servicio incluye llenar la máquina con refrescos y un mantenimiento menor. está interesado en predecir la cantidad de tiempo requerida por el chofer para surtir las máquinas en el local (Y). Se tienen como variables el número de envases con que llena la máquina (X1) y la distancia que tiene que caminar (X2).

33 0.45 -1.88 -1.0 5.024 0.301 1.040 0.500 35.63 0.72 -0.500 19.155 16.444 0.21RX 0.040 0.330 21.867 1.661 1.17 Durbin-Watson 77 .551 7.33 11 21.793 -5.37 3.750 24.956 SE Fit Residual -5.0 7.0 an an Y-TENT 16.240 21.354 12.00 7 17.50 13 19.124 38.932 0.132 0.473 18.806 0.350 19.100 17.75 19.0 4.50 2 12.75 14 24.663 14.110 8.34 0.0 6.707 40.32 18.662 1.88 4 13.58 1.888 20.099 0.400 7.22 0.673 71.21 -0.0 6.830 10.788 -2.0 4.50 10 40.093 21. 1.10 20 17.58 -1.329 29.682 23.0 3.039 1.237 -0.328 0.050 4.24 9 21.914 15.0 4.0 9.830 79.028 1.50 -0.708 10.420 2.325 2.75 R X denotes denotes X1-CAS 7.0 17.0 3.50 19 35.514 56.90 21 52.68 1 11.893 0.0 7.0 30.795 1.0 26.449 1.44 -1.14 -0.000 29.27 0.0 16.608 -4.81 0.000 15.02 1.0 10.436 3.194 18.957 1.157 7.027 1.500 12.750 18.83 8 79.614 -3.963 -0.900 52.750 Fit 21.007 23.87 -0.680 11.03 3 14.146 -0.573 -0.593 1.012 1.912 0.11 6 08.0 10.000 13.0 7.000 17.924 St Resid -1.09 0.880 13.0 10.845 1.687 -4.663 0.671 -0.00 15 29.376 2.00 16 15.080 9.36 -0.0 8.358 24.0 3.14 1.750 19.320 18.068 0.952 0.403 10.X2-Dist Obs 16.11 0.0 9.823 2.030 14.0 6.19 0.593 12.07 22 23 24 25 observation observation statistic = with a large standardized residual whose X value gives it large influence.35 17 19.213 -0.500 40.675 0.444 -0.00 18 09.000 9.011 1.00 12 13.820 19.290 0.841 Ejemplo de regresión múltiple 14.75 5 18.83 10.0 2.

Ejemplo de regresión múltiple Solución matricial Matrix M5 = X' [ 1 1 1 1 7 3 3 4 560 220 340 255 1 6 462 1 9 448 1 10 776 1 4 80 1 6 200 1 6 150 1 7 132 1 7 330 1 3 36 1 2 110 1 17 770 1 7 210 1 10 140 1 30 1460 1 26 810 1 5 605 1 9 450 1 16 688 1 8 635 1 10 215 1 4 150 ] Matrix M6 = X'Y [ 25 219 10232 219 3055 133899 10232 133899 6725688 ] Matrix M7 = X'Y [ 560 7375 337072 ] 78 .

000 0.113215 -0.Ejemplo de regresión múltiple Solución matricial Matrix M8 = INV(X'X) 0.004449 0.6% 79 .014385 SE Coef 1.98 P 0.003613 T 2.61591 0.000048 0.001 R-Sq = 96.13 9.097 0.000084 -0.01438 The regression equation is Y-TENT = 2.6159 0.000084 -0.004449 -0.46 3.0144 X2-DIST Predictor Constant X1-CAS X2-DIST S = 3.62 X1-CAS + 0.044 0.0% R-Sq(adj) = 95.000001 Matrix M9 = INV(X'X) X'Y 2.341 1.34 + 1.1707 0.002744 -0.34123 1.259 Coef 2.000048 -0.

34123 Matrix M13 = b'X'Y = 18076.50 40.75 19.75 24.11 8.00 17.75 ] Matrix M11 = Y'Y = 18310.00 29.33 21.83 79.35 19.00 15.01438 ] S2  SS E 233 .32 18.00 13.83 10.00 9.90 52.24 21.75 18.03 14.61591 0.50 19.9 Matrix M14 = SSe = Y'Y .50 35.10 17.Ejemplo de regresión múltiple Solución matricial Cálculo de la estimación de la varianza: Data Display Matrix M10 = Y' [ 16.88 13.50 12.68 11.732 1.6 Matrix M12 = b' = [ 2.624 Np 25  3 80 .b'X'Y = 233.732   10 .

97001 81 .025. 22 se(b1 ) 1.Ejemplo de regresión múltiple Solución matricial  Intervalo de confianza para Beta 1 b1  t. 22 se(b1 )  1  b1  t.61591 (2.26181  1  1.17073) Por tanto el intervalo de confianza para el 95% es: 1.074)(0.00274378)  1  1.6239)(0.6191 (2.074) (10.025.

01438   La varianza de la Y0 estimada es (tomando M8=inv(X’X) : 1  ˆ Var(Y0 )  S 2 X ' 0 ( X ' X ) 1 X 0  10.22minutos   0.56794   275   82 . 1  X 0  8    275   2.Ejemplo de regresión múltiple Solución matricial  El embotellador desea construir un intervalo de confianza sobre el tiempo medio de entrega para un local requiriendo: X1 = 8 envases y cuya distancia es X2 = 275 pies.275M 88   10.6239(0.2751.62391.8.34123 ˆ Y0  X ' 0 b  1.61591  19.8.05346)  0.

56794  Que se reduce a: 17.56794  Y0  19.22  2.66  Y0  20.78 83 .074 0.Ejemplo de regresión múltiple Solución matricial  El intervalo de confianza sobre el tiempo medio de entrega para un local requiriendo es para 95% de nivel de confianza: 19.074 0.22  2.

6 Como la F calculada es mayor que la F de tablas.930 = 5784.4 F 261.6) 2 25 (559 .24 P 0.4083 F0    261.550.7260 MSR 2775.7 5784.44 Con el paquete Minitab se obtuvo lo siguiente: Source Regression Residual Error Total DF 2 22 24 SS 5550.Ejemplo de regresión múltiple Solución matricial  El análisis de varianza es: (559 . se concluye que existe el modelo con alguno de sus coeficientes diferente de cero 84 .8 233.310.24 MSE 10.6) 2 25 Analysis of Variance SST = 18.5 MS 2775.000 10. 2 .076.8166 SSE = SST – SSR = 233.05. 22  3.629 SSR = 18.5426 = 5.6239 F0.

Ejemplo de regresión múltiple Solución matricial  El comportamiento de los residuos es como sigue: 85 .

Es evidente por los valores diferentes de cero que no están en la diagonal principal de X’X. La varianza de los coeficientes de la regresión son inflados debido a la multicolinealidad. Que son correlaciones simples entre los regresores. de tal forma que si hay una dependencia lineal exacta hará que la matriz X’X sea singular.   86 .Multicolinealidad  La multicolinealidad implica una dependencia cercana entre regresores (columnas de la matriz X ). La presencia de dependencias cercanamente lineales impactan dramáticamente en la habilidad para estimar los coeficientes de regresión.

Para el componente j – ésimo se tiene:  VIF j   1 1 R2 j Si es mayor a 10 implica que se tienen serios problemas de multicolinealidad.Multicolinealidad  Una prueba fácil de probar si hay multicolinealidad entre dos variables es que su coeficiente de correlación sea mayor a 0. 87 .7 Los elementos de la diagonal principal de la matriz X’X se denominan Factores de inflación de varianza (VIFs) y se usan como un diagnóstico importante de multicolinealidad.

Se puede probar con la prueba de Levene de homogeneidad de varianzas 88    . pueden mostrar diferentes patrones indicando adecuación o no adecuación del modelo: Gráfica de residuos aleatorios cuya suma es cero (null plot) indica modelo adecuado Gráfica de residuos mostrando una no linealidad curvilínea indica necesidad de transformar las variables Si los residuos se van abriendo indica que la varianza muestra heteroestacidad y se requiere transformar las variables.Análisis de los residuos  Los residuos graficados vs la Y estimada.

Escalamiento de residuos  En algunos casos es difícil hacer comparaciones directas entre los coeficientes de la regresión debido a que la magnitud de bj refleja las unidades de medición del regresor Xj. se sugiere estandarizar o estudentizar los residuos 89 . Por ejemplo: ˆ Y  5  X 1  1000 X 2  Para facilitarla visualización de residuos ante grandes diferencias en los coeficientes.

los residuos tienen una media de 0 y desviación estándar de 1  Con más de 50 datos siguen a la distribución t.05) indica significancia estadística y son “outliers” 90 .Escalamiento de residuos  Residuos estandarizados  Se obtienen dividiendo cada residuo entre la desviación estándar de los residuos di   ei . de manera que si exceden a 1.96 (límite para alfa 0. MSE Después de la estandarización.

pero además se elimina la i-ésima observación en el cálculo de la desviación estándar usada para estandarizar la í-ésima observación Puede identificar observaciones que tienen una gran influencia pero que no son detectadas por los residuos estandarizados H = X (X’X)-1X’ es la matriz sombrero o “hat matriz”. MSE (1  hii ) 91 .Escalamiento de residuos  Residuos estudentizados  Son similares a los residuos donde se elimina una observación y se predice su valor.   ri  ei .

El residuo iésimo será:  ˆ e( i )  Yi  Y( i )  El residuo PRESS es la suma al cuadrado de los residuos individuales e indica una medida de la capacidad de predicción N PRESS 2 ˆ 2 PRESS   e(2i )   Yi  Y( i )  RPr edicción  1  i 1 SYY 92 . En cada modelo se omite una observación en la estimación del modelo de regresión y entonces se predice el valor de la observación omitida con el modelo estimado. Difiere en que se estiman n-1 modelos de regresión.Escalamiento de residuos  El estadístico PRESS (Prediction Error Sum of Squares) es una medida similar a la R2 en la regresión.

Gráficas parciales de regresión  Para mostrar el impacto de casos individuales es más efectiva la gráfica de regresión parcial. Una comparación visual de la gráfica de regresión parcial con y sin la observación muestra la influencia de la observación El coeficiente de correlación parcial es la correlación de la variable independiente Xi la variable dependiente Y cuando se han eliminado de ambos Xi y Y La correlación semiparcial refleja la correlación entre las variables independiente y dependiente removiendo el efecto Xi    93 . Un caso “outlier” impacta en la pendiente de la ecuación de regresión (y su coeficiente).

Representa los efectos combinados de todos las variables independientes para cada caso  94 .Matriz sombrero  Los puntos de influencia son observaciones substancialmente diferentes de las observaciones remanentes en una o más variables independientes Contiene valores (sombrero en su diagonal) para cada observación que representa influencia.

minimizando su residuo El rango de valores es de 0 a 1. p es el número de predictores y n es el tamaño de muestra. con media p/n. Valores límite se encuentran en 2p/n y 3p/n 95 .Matriz sombrero  Los valores en la diagonal de la matriz sombrero miden dos aspectos:  Para cada observación miden la distancia de la observación al centro de la media de todas las observaciones de las variables independientes   Valores altos en la diagonal indica que la observación tiene mucho peso para la predicción del valor de la variable dependiente.

Es otra forma de identificar “outliers” La significancia estadística de la distancia de Malahanobis se puede hacer a partir de tablas del texto:  Barnett. Nueva York. V.. Edition. Outliers in Statistical Data.Distancia de Mahalanobis  D2 es una medida comparable a los valores sombrero (hat values) que considera sólo la distancia de una observación del valor medio de las variables independientes. 2nd. 2984   96 . Wiley.

el límite es 1 o 4/(n-k-1)   97 .0 o ±2 para tamaños de muestra pequeños y ±√n para muestras medias y grandes La distancia de Cook (Di) captura el impacto de una observación:  La dimensión del cambio en los valores pronosticados cuando se omite la observación y la distancia de las otras observaciones. Se sugiere aplicar como límites ±1.Influencia en coeficientes individuales  El impacto de eliminar una observación simple en cada uno de los coeficientes de la regresión múltiple se muestra con la DFBETA y su versión estandarizada SDFBETA.

 El límite puede ser establecido en 1 ±3p/n.Influencia en coeficientes individuales  La medida COVRATIO estima el efecto de la observación en la eficiencia del proceso. El valor límite es 2*raíz((k+1)/(n-k-1))  . los valores mayores al límite hacen el proceso más eficiente y los menores más ineficiente La medida SDFFIT es el grado en que cambian los valores ajustados o pronosticados cuando el caso se elimina. en sus errores estándar de los coeficientes de la regresión. Considera a todos los coeficientes colectivamente.

Ejemplo de regresión múltiple Solución con Excel y Minitab 99 .

8 14.7 25.4 12.8 12.7 15.0 23.5 13.9 100 .Ejemplo de Regresión Múltiple Cat.3 18.0 14.7 18.8 17.0 20.3 44.6 20.1 25.0 16. 16 UCLA 17 Texas-Austin 18 Indiana 19 Cornell 20 Rochester 21 Ohio State 22 Emory 23 Purdue 24 Maryland 25 GMAT 711 670 662 650 680 660 660 670 646 653 660 645 646 640 675 630 651 630 630 637 630 611 626 603 640 Salario Inicial ($) 82000 80000 79000 78000 65000 70000 83000 70000 67500 70000 66000 65000 70583 67200 65000 60000 65000 60000 61500 64000 58500 61000 60000 63700 53000 % Aceptación 7.0 20.C.5 27.2 33.8 23.N. (US News) Stanford 1 Harvard 2 Penn (Wharton) 3 MIT (Sloan) 4 Chicago 5 Northwestern 6 Columbia 7 Dartmouth 8 Duke 9 Berkeley 10 Virginia 11 Michigan 12 NYU 13 Carnegie Mellon 14 Yale 15 U.9 28.4 36.5 19.9 30.

32 -185.659 -452.3326192 125.991730876 0.29 -1340.873 X Variable2 -59.40 41473.1 3.957 208729.45E+08 16409433.Interpretación de Resultados de Excel.17E-07 Intercept Coefficients Standard Error t Stat P-value Lower 95% U pper 95% 36233.76550478 Adjusted R Square 0.6138 -1.Regresión Multiple SUMMARY OUTPUT Regression Statistics Multiple R 0.76118 69.7291 .8749313 R Square 0.8104 -4.67 1.13 2.5 -513.47E+09 MS 22.007589 198.953271081 0.662094325 0.526337637 0.44875 -0.424 65.855918 Observations ANOVA Regression Residual Total 25 df 3 21 24 SS 1.732005463 Standard Error 4050.49917 122481.0001336 60.1418472 X Variable1 -926.12E+09 374977790.9488 X Variable3 -191.851355 F Significance F 8.

32 X Variable1 -910.93E+08 1.9674353 P-value Lower 95% Upper 95% Con sólo X1.951 114.20595 -7.04264 17079107 Intercept 79230.732691 df 1 23 24 SS 1.186411 -672.Resultados de Excel.93994 4. el Modelo se simplifica enormemente poca importancia práctica se pierde en R2 (ajustada) .88E-08 1.49801 2.Regresión sólo con sólo X1 SUMMARY OUTPUT Regression Statistics Multiple R 0.688 Observations 25 ANOVA Regression Residual Total 0.08E+09 63.08E+09 3.721069 Standard Error 4132.077 Coefficients Standard Error t Stat 46.88E-08 -1147.6201 MS F Significance F 4.47E+09 1703.855974 R Square Adjusted R Square 0.43405 82755.98E-24 75705.

000 0.50 -7. como el único agente de predicción (“predictor”) La ecuación de regresión es: y = 79230 . Estándar 1704 114.…poca importancia práctica se pierde en R2 (ajustada) .6 T 46.1 Desv.3% R2 (ajustada) = 72.1% Análisis de Variancia Fuente Regresión Error Total DF 1 23 24 SS 1076712008 392819470 1469531477 MS 1076712008 17079107 F 63.04 p 0.94 p 0.000 El Modelo se simplifica enormemente.910 x “Predictor” Constante x S = 4133 Coef 79230 -910.Reducción correr la regresión usando la categoría Vuelva a del Modelo US News.000 R2 = 73..

35 33.46 17.55 36.66 17.6 257.66 827.50 16.31 32.66 16.7 251.40 16.9 783.75 875.53 748.8 230.80 33.45 34.14 16.28 104 .45 35.52 33. East) HeatFlux Insolation East South North 271.13 860.0 238. South.15 34.46 40.45 36.Corrida en Minitab  Se introducen los datos en varias columnas C1 a C5 incluyendo la respuesta Y (heatflux) y las variables predictoras X’s (North.19 37.8 264.50 684.71 34.

east)   105 . Las gráficas se obtienen Stat > Regression > Regression > Fitted line Plots Para regresión múltiple Y (heatflux) y las columnas de los predictores (north.Corrida en Minitab    Utilzar el archivo de ejemplo Exh_regr.mtw Opción: Stat > Regression > Regression Para regresión lineal indicar la columna de respuesta Y (Score2) y X (Score1) En Regresión lienal en opciones se puede poner un valor Xo para predecir la respuesta e intervalos. south.

2.1274 Coef 1.000 Residual Error Total 2.5419 0.1136 8 F 156.000 0.000 R-Sq = 95.21767 SE Coef 0.7536) ( 95.0474 ( 95. 2.51 P 0.5419 7 MS 2.00 106 .Resultados de la regresión lineal The regression equation is Score2 = 1.0162 P 0.12 + 0.1177 0.6414 New Obs 1 Score1 7.56 0.7% R-Sq(adj) = 95.3197.6556 Predicted Values for New Observations New Obs 1 Fit SE Fit 0.5292.01740 T 10.0% CI 2.1093 0.1% Analysis of Variance Source Regression DF 1 SS 2.218 Score1 Predictor Constant Score1 S = 0.0% PI 2.23 12.9631) 2.

11771 + 0.5 R-Sq = 95.Resultados de la regresión lineal Regression Plot Score2 = 1.217670 Score1 S = 0.5 95% CI 95% PI 2 3 4 5 6 7 8 9 Score1 107 .5 Regression 1.7 % R-Sq(adj) = 95.1 % Score2 2.127419 3.

4% R-Sq(adj) = 85.869 0.000 0.132 5.9% Analysis of Variance Source Regression DF 3 SS 12833.17 -24.52 1.3185 2.75 P 0.000 0.9629 1.9 P 0.9 25 MS 4278.092 R-Sq = 87.214 T 5.1 28 DF 1 1 1 14681.000 Residual Error Total Source North South East 108 .9 Seq SS 10578.7 2028.09 1.92 5.3 F 57.000 0.598 Coef 389.87 73.1 North + 5.24.Resultados de la regresión Múltiple The regression equation is HeatFlux = 389 .0 1848.89 -12.32 South + 2.12 East Predictor Constant North South East S = 8.125 SE Coef 66.9 226.

Importancia estadística: (valores p) • La regresión puede usarse con un “predictor” X o más.Resumen de la Regresión • La regresión sólo puede utilizarse con información de variables continuas. • Importancia práctica: (R2). sin perder mucha importancia práctica 109 . • Los residuos deben distribuirse normalmente con media cero. para una respuesta dada • Reduzca el modelo de regresión cuando sea posible.

A.4 Herramientas multivariadas 110 .VI.

Herramientas multivariadas 1. Análisis discriminante 5. Análisis de componentes principales 3. MANOVA 111 . Introducción 2. Análisis factorial 4.

Introducción  En el análisis multivariado se incluyen dos o más variables dependientes Y1. MANOVA 112 . …. X2.. Y2. Entre las herramientas principales se encuentran:   Componentes principales. Xn  Normalmente se resuelven con herramientas computacionales tales como Minitab y SPSS. análisis discriminante. análisis de conglomerados. análisis canónico. análisis factorial. Consideradas simultáneamente para las variables independientes X1. etc.

Análisis de componentes principales  El análisis (PCA) y el análisis factorial (FA) se usan para encontrar patrones de correlación entre muchas variables posibles y subconjuntos de datos Busca reducirlas a un menor número de componentes o factores que representen la mayor parte de la varianza.   Normalmente se requieren al menos cinco observaciones por variable 113 .

Análisis de componentes principales  Pasos de análisis en Minitab      Se usa una matriz de correlación para determinar la relación entre componentes Las matrices definen cantidades como eigenvalores y eigenvectores Se suman los eigenvalores y se calculan las proporciones de cada componente Se identifican los PC1. … que explican la mayor parte de la varianza Se puede hacer un diagrama de Pareto como apoyo 114 . PC2.

9 X7 STARCH 0.8 10.3 43.3 12.9 7.7 3.2 3 X8 X9 NUTS FR-VEG 5.6 18.7 2.6 9.9 9 9.2 4.4 4.4 5.2 1.3 28 26.3 4.3 3.1 4 3.2 2 9.4 2 2.7 10.3 2.7 2.1 4.9 3.4 3.6 26.9 13.7 1.7 6.7 2 6.1 27 49.6 4.8 2.1 5.7 1.3 13.7 7.5 3.3 3.5 5.5 1.8 2.1 4.3 4.6 24.9 3.1 4 0.1 4.3 2.4 2.4 4.6 18.9 13.3 2.7 34.9 4.5 25.7 2.1 1.5 1.7 5.9 4.4 6.2 3.7 3 14.7 40.9 5.6 2.9 1.6 24.9 0.1 13.6 2.7 3.4 4.8 22.5 4.9 5.Ejemplo: Alimentos en Europa X1 País 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 RMEAT 10.3 4.8 13.4 2.9 6.3 2.2 3.1 41.5 18 10.5 3.6 4.6 8.9 3 12.8 11.5 8.6 4.8 3.4 X2 X3 EGGS 0.5 7.4 23.7 25.8 6.8 3.2 1 7 7.4 0.2 7.4 6.4 10.8 5.7 2.3 21.1 5 4.3 4.8 20.5 2.5 9.5 3.4 23 36.5 X5 FISH 0.8 5.6 29.7 3.9 24.6 5.9 17.4 5.9 5.8 5.7 2.6 3.1 3.7 19.6 1 1.1 17.1 4.1 33.9 19.3 28.2 X4 MILK 8.3 11.7 3.1 24 36.7 23.3 3 3.6 16.9 11.2 4 6.5 17.2 5.1 8.3 19.6 2.7 1.4 7.2 2.7 2.7 6.1 8.5 5.4 9.6 X6 CERL 42.2 6.1 5.8 3.2 19.6 5.7 1.8 9.9 9.4 10 5.6 12.1 4.7 23.8 6.2 1.4 2.8 4.8 9.7 10.7 4.3 6 11.2 2.4 14 9.5 9.4 9.1 9.6 2.2 1.5 25 11.7 1.6 56.6 55.5 5 115 .1 1.4 0.1 1.9 3.3 6.5 7.2 WMEAT 1.7 4.

X2. Seleccionar Correlation Matrix 5 Click Graphs y seleccionar Scree Plot. Score plot for first 2 components Loading plot for first 2 components 8 Click Storage e indicar las columnas donde se guarden los coeficientes y los valores Z (scores) Coef1 Coef 2 y Z1 Z2 9. X7. 3. X4. X1. X8. X9 En Number of factors to extract. Click OK en cada uno de los cuadros de diálogo 116 . X6.Corrida en Minitab 2 3 4 Stat > Multivariate > Principal components En Variables. X3.

de 1 -0.2 0.0 0. .4 117 .5 -0.6 -0..3 -0. FR-VEG WMEAT CERL 2 0.1 MILK RMEAT EGGS 1 Second Component 0.1 First Component 0.2 -0. FR-VEG 4 3 Eigenvalue Loading Plot of RMEAT.Ejemplo: Alimentos en Europa Scree Plot of RMEAT.4 -0..5 FR-VEG FISH STARCH NUTS 0 1 2 3 4 5 6 Component Number 7 8 9 Dos componentes exceden El eigenvalor de ref.3 0.7 -0.1 -0.1 0.2 0...2 -0.. .0 -0..3 -0.4 -0.

Ejemplo: Alimentos en Europa Se tiene la gráfica siguiente de países: Europa occidental 2 1 0 -1 12 24 6 14 8 20 22 3 2 21 5 23 15 16 13 10 11 18 4 Europa oriental Scatterplot of Z2 vs Z1 Balcanes 1 25 7 9 Z2 -2 -3 -4 -5 -3 -2 -1 0 Z1 1 2 3 4 17 19 Península ibérica 118 .

Las variables de salida están relacionadas linealmente con las variables de entrada. aunque se reiere un juicio subjetivo.Análisis factorial  Es una técnica de reducción de variables para identificar factores que expliquen la variación. Debe haber cuatro o más factores de entrada para cada variable independiente   119 . Las variables deben ser medibles y simétricas.

para identificar los factores principales para un estudio posterior Rotación de factores.Análisis factorial  Se especifican un cierto número de factores comunes El análisis factorial se hace en dos etapas:    Extracción de factores. para hacerlos más significativos 120 .

En Variables. eigenvalores. coeficientes. seleccionar Varimax. Click Graphs y seleccionar Loading plot for first 2 factors y Scree Plot. X4.Corrida con Minitab 2 3 4 En 6 7 Stat > Multivariate > Factor Analysis. X1. X9 En Number of factors to extract. X8. 4. etc. X3. X2. Method of Extraction. seleccionar Principal components En Type of Rotation. Seleccionar Storage e indicar columnas para ponderaciones. Click Results y seleccionar Sort loadings. Z’s. X7. X6. Click OK en cada uno de los cuadros de d 121 .

50 Second Factor Ejemplo 0.628 -0.9273 0.104 0.50 -0.100 0.00 -0.943 -0.168 7.683 -0.326 -0.197 -0.515 0.638 0..178 -0.7240 0.263 -0.25 0.219 0.75 1.245 2.867 0.858 122 .014 0.051 -0.50 0.5165 0.00 -0.010 0.020 0.919 -0.145 0.624 -0. FR-VEG CERL 0.937 0.2054 0.871 0..004 0.003 0.226 -0.664 0.395 0.910 2.00 Rotated Factor Loadings and Communalities Varimax Rotation Variable X1 RMEAT X2 WMEAT X3 EGGS X4 MILK X5 FISH X6 CERL X7 STARCH X8 NUTS X9 FR-VEG Variance % Var Factor1 Factor2 Factor3 Factor4 Communality 0.127 -0.214 1.231 1.25 -0.849 -0..610 0.862 0.515 -0.25 First Factor 0.088 0.050 0.549 -0.732 -0. .25 0.931 0.50 -0.75 NUTS FR-VEG FISH STARCH WMEAT MILK EGGS RMEAT -1.795 -0.0749 0.579 0.163 0.921 -0.026 0.Loading Plot of RMEAT.00 0.918 0.037 0.

Ejemplo: Scatterplot of Z2 vs Z1 2 Yugoslavia Portugal Rumania Bulgaria Rusia Albania España Noruega Finlandia Italia Grecia Hungría Polonia Checa Alemania orien 1 Z2 0 Suecia Dinamarca Bélgica Suiza Irlanda Holanda Autria Alemania Occ -1 Francia -2 -2 -1 Reino Unido 0 Z1 1 2 123 .

Análisis discriminante  Si se tiene una muestra con grupos conocidos. y las muestras exhiben independencia   124 . el análisis discriminante clasifica las observaciones o atributos en dos o más grupos Puede utilizarse como herramienta predictiva o descriptiva Las variables deben ser multivariadamente normales. con la misma varianza y covarianza poblacional entre variables dependientes.

9 23.8 0.8 16.5 6.6 1.7 1.7 1.0 8.6 5.3 0.4 1.8 4.7 2.8 23.2 8.4 11.2 0.5 16.8 6.9 Ser Fin 19.2 1.6 17.7 15.0 6.1 0.8 0.5 2.8 32.1 6.8 2.1 21.9 0.3 Tc 7.3 0.1 11.8 66.5 0.9 5.9 5.9 14.3 4.0 14.7 1.8 24.0 0.2 16.3 35.9 7.5 6.3 Sps 26.7 7.7 6.8 0.3 0.7 7.8 27.8 18.8 5.9 0.3 16.9 35.5 5.7 23.2 1.5 14.2 0.5 22.4 8.4 25.7 5.9 4.9 22.2 13.7 3.4 5.3 2.1 8.6 16.7 1.5 2.7 13.2 22.8 28.6 31.5 22.0 0.1 0.2 1.9 9.0 125 .7 11.9 41.9 5.8 10.4 1.4 25.2 1.9 0.1 Con 8.2 21.5 0.0 6.8 0.3 5.7 7.5 16.9 1.1 30.4 6.3 11.0 9.7 0.9 0.9 7.7 34.9 1.5 7.6 1.4 0.6 18.8 1.9 0.7 16.2 14.2 9.6 0.1 17.7 9.0 9.9 18.5 4.4 7.7 1.7 9.1 22.7 9.9 7.8 Ps 0.9 11.6 8.1 8.6 22.4 27.7 3.6 9.3 6.7 9.5 25.4 11.2 8.6 18.8 0.7 8.0 7.4 8.8 0.4 16.5 28.6 0.1 30.5 10.5 6.3 1.1 30.4 5.5 11.4 11.2 7.0 17.1 5.0 20.2 37.1 29.0 16.4 30.7 3.7 0.3 0.9 41.5 6.0 27.5 4.8 6.6 1.4 8.2 17.3 16.2 6.6 9.0 1.0 0. Hungría Polonia Rumania Rusia Yugoslavia Agr Min Man 3.6 0.6 6.9 0.5 2.8 6.3 8.1 0.2 6.5 2.4 0.3 24.9 27.1 5.1 19.6 6.7 5.1 2. Irlanda Italia Luxenburgo Holanda Inglaterra Austria Finlandia Grecia Noruega Portugal España Suecia Suiza Turquía Bulgaria Checa Alemania Ori.6 0.3 7.4 25.7 6.1 23.2 2.4 15.Ejemplo de actividades en países No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Grupo 1 1 1 1 1 1 1 1 1 1 1 2 1 2 2 1 1 2 3 3 3 3 3 3 3 3 Ciudad Bélgica Dinamarca Francia Alemania Occ.3 20.6 8.2 9.2 9.8 48.1 1.6 27.2 28.0 7.2 12.9 8.6 7.9 6.9 32.8 20.1 6.2 4.8 7.6 32.

126 . En Groups.Corrida con Minitab 2 3 Stat > Multivariate > Discriminant Analysis. Click OK. poner Freshwater Marine. poner SalmonOrigin. 4 En Predictors.

Corrida con Minitab Canonical Discri minant Functions 3 2 1 3 1 0 -1 2 GRUP O Group C en troids 3 -2 Function 2 -3 -4 -6 -4 -2 0 2 4 6 2 1 Function 1 127 .

Análisis de conglomerados 128 .

Se trata de dar sentido a grandes cantidades de datos de cuestionarios. etc. etc. hábitos de estudio.   129 . ecnuestas. padres.Análisis de conglomerados  Se usa para determinar agrupaciones o clasificaciones de un conjunto de datos Las personas se pueden agrupar por IQ.

Variables V1 A B C D E F G 3 4 4 2 6 7 6 V2 2 5 7 7 6 7 4 130 .Ejemplo  Suponer que un estudio de mercado trata de determinar segmentos de mercado en base a los patrones de lealtad de marcas (V1) y tiendas (V2). medidas del 0 al 10 en 7 personas (A-G).

16 Distance 2.Corrida en Minitab   Stat > Multivariate Análisis > Cluster Observations Distance Measured Euclidean Seleccionar Show Dendogram OK Dendrogram with Single Linkage and Euclidean Distance 3.11 1.00 1 2 3 4 Observations 5 6 7 131 .05 0.

Análisis de correlación canónico  Prueba la hipótesis de que los efectos pueden tener causas múltiples y de que las causas pueden tener efectos múltiples (Hotelling 1935) Es como una regresión múltiple para determinar la correlación entre dos conjuntos de combinaciones lieneales. cada conjunto puede tener varias variables relacionadas. La relación de un conjunto de variables dependientes a un conjunto de variables independientes forma combinaciones lineales   132 .

Los pares de combinaciones lineales se denominan variates canónicas con correlaciones canónicas (Rc con valor mayor a 0.3) Por ejemplo se quiere determinar si hay una correlación entre las características de un ingeniero industrial y las habilidades requeridas en la descripción de puesto del mismo ingeniero.Análisis de correlación canónico  Se usan los más altos valores de correlación para los conjuntos.  133 .

MANOVA (Análisis de varianza múltiple)  Es un modelo para analizar la relación entre una o más variables independientes y dos o más variables dependientes  Prueba si hay diferencias significativas en las medias de grupos de una combinanción de respuestas Y. con covarianza homogenea y observaciones independientes  134 . Los datos deben ser normales.

MANOVA (Análisis de varianza múltiple) 135 .

Diferencias de ANOVA y MANOVA 136 .

Ejemplo: Extrusión de película plástica  Se realiza un estudio para determinar las condiciones óptimas para extruir película plástica.   Se utiliza el MANOVA balanceado para probar la igualdad de las medias. 137 . gloss y opacity – cinco veces en cada combinación de dos factores – tasa de extrusión y cantidad de aditivo – cada grupo se pone en niveles bajos y altos. Se miden tres respuestas – Tear.

6 9.8 1.4 3 4.5 6.2 8.2 6.5 6.5 9.Ejemplo: Extrusión de película plástica Tear 6.7 6.1 10 9.1 6.1 3.3 6.9 2.2 7.9 Extrusión 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 Additive 1 1 1 1 1 2 2 2 2 2 1 1 1 1 1 2 2 2 2 2 138 .7 1.1 9.3 8.1 0.6 9.8 4.6 3.1 7 7.9 5.2 9.8 5.7 2 3.7 2.7 10.4 5.6 7.8 6.2 7.1 9.9 9.9 1.2 Opacity 4.5 7.4 9.5 6.2 6.4 8.8 9.2 5.3 8.9 9.9 6.5 9.8 7.4 6.4 8.9 7.6 Gloss 9.1 6.5 9.

6 139 . Click OK en cada cuadro de diálogo. Seleccionar Stat > ANOVA > Balanced MANOVA. En Model. seleccionar Matrices (hypothesis. partial correlations) y Eigen analysis. poner Extrusion | Additive.MTW. En Display of Results. error. poner Tear Gloss Opacity. En Responses.Ejemplo: Extrusión de película plástica 1 2 3 4 5 Abrir el archivo EXH_MVAR. Click Results.

0012 -0.855 Tear Tear Gloss Opacity 1.070 Statistic 0.505 1.552 64.505 0.7395 0.38186 Gloss -1.924 2 0.8555 -0.5163 0.739 Gloss 0.070 -0.0359 F 7.003 SSCP Matrix for Extrusion Opacity 0.5520 1 0.0302 3 0.1209 SSCP Matrix for Error Partial Correlations for the Error SSCP Matrix Eigenvector Tear Gloss Opacity 140 .740 -1.4205 Opacity -3.0604 0.020 -3.Ejemplo Criterion Wilks' Tear Tear Gloss Opacity 1.764 0.301 -0.4315 0.0200 2.3385 0.554 Num 3 Denom 14 P 0.6280 -0.6541 -0.

Las correlaciones parciales entre Tear y Gloss son pequeñas.Ejemplo: Extrusión de película plástica Las matrices SSCP evalúan la contribución a la variabilidad de manera similar a la suma de cuadrados en la ANOVA univariada. se pueden realizar análisis univariados de ANOVA para cada una de las respuestas. Como la estructura de las correlaciones es débil. 141 .

4 Estudios Multivari 142 .VI.A.

Estudios Multivari  La carta multivari permite analizar la variación dentro de la pieza. de pieza a pieza o de tiempo en tiempo Permite investigar la estabilidad de un proceso consiste de líneas verticales u otro esquema en función del tiempo. La longitud de la línea o del esquema representa el rango de valores encontrados en cada conjunto de muestras  143 .

E S P E S O R Número de subgrupo 144 . La variación de muestra a muestra como posición vertical de las líneas.Estudios Multivari  La variación dentro de las muestras (cinco puntos en cada línea).

Estudios Multivari  Ejemplo de parte metálica Centro más grueso 145 .

Estudios Multivari  Procedimiento de muestreo:  Seleccionar el proceso y la característica a investigar  Seleccionar tamaño de muestra y frecuencia de muestreo Registrar en una hoja la hora y valores para conjunto de partes  146 .

Estudios Multivari  Procedimiento de muestreo:   Realizar la carta Multivari Unir los valores observados con una línea Analizar la carta para variación dentro de la parte. de parte a parte y sobre el tiempo Puede ser necesario realizar estudios adicionales alrededor del área de máxima variación aparente Después de la acción de mejora comprobar con otro estudio Multivari    147 .

Cíclico: Variación entre unidades de un mismo proceso. variación entre grupos de unidades. etc. turno a turno.  . 148 variación de lote a lote. día a día. a un conjunto pequeño de causas que realmente influyen en la variabilidad.Cartas Multivari  Su propósito fundamental es reducir el gran número de causas posibles de variación. semana a semana. Sirven para identificar el patrón principal de variación de entre tres patrones principales:   Temporal: Variación de hora a hora.

operador a operador. Por ejemplo las diferentes cavidades de un molde Variaciones de máquina a máquina.Cartas Multivari  Posicional:  Variaciones dentro de una misma unidad (ejemplo: porosidad en un molde de metal) o a través de una sola unidad con múltiples partes (circuito impreso). ó planta a planta   149 . Variaciones por la localización dentro de un proceso que produce múltiples unidades al mismo tiempo.

A 1 2 3 4 5 27 28 29 30 31 55 56 57 58 59 VARIACIÓN POSICIONAL DENTRO DE LA UNIDAD 150 . repitiendo el proceso tres o más veces a cierto intervalo de tiempo. hasta que al menos el 80% de la variación en el proceso se ha capturado.Cartas Multivari  Ejemplo: Se toman 3 a 5 unidades consecutivas.

) B 1 2 3 4 5 27 28 29 30 31 55 56 57 58 59 VARIACIÓN CÍCLICA DE UNIDAD A UNIDAD 151 ..Cartas Multivari  Ejemplo: (cont..

Cartas Multivari  Ejemplo: (cont..) C 1 2 3 4 5 27 28 29 30 31 55 56 57 58 59 VARIACIÓN TEMPORAL DE TIEMPO A TIEMPO 152 ..

i.0025” (6  ) contra la permitida de 0.e. Cpk = 1.Cartas Multivari  Ejemplo: Un proceso produce flecha cilíndricas. 153 .0008”. Se sugirió un estudio Multi Vari previo.000 para tolerancia de  0.25.0002”.8 y una dispersión natural de 0. Sin embargo un estudio de capacidad muestra un Cp = 0.001”.   Se tiene pensado comprar un torno nuevo de US$70. con un diámetro especificado de 0.0250”  0.

También se muestra la variación temporal.Cartas Multivari  Se tomaron cuatro lecturas en cada flecha. se muestra mediante las líneas que concentran las cuatro lecturas de cada flecha.   154 . además de excentricidad en cada lado de la flecha. de una flecha a la siguiente. La variación cíclica. Estas muestran una disminución gradual desde el lado izquierdo al lado derecho de las flechas. dos a cada lado.

0.Cartas Multivari .2500” 0.2510” 8 AM 9 AM 10 AM 11 AM 12 AM 0.2490” Izquierda Máximo Derecha Mínimo 155 .

Cartas Multivari  Un análisis rápido revela que la mayor variación es temporal con un cambio mayor entre las 10 AM y las 11 AM. Se adicionó. A las 10 AM se para el equipo para el almuerzo y se arranca a las 11 AM. en forma drástica. con lecturas similares a las de las 8 AM. lo cual se notaba más cuando se paraba el equipo y se volvía a arrancar. reduciendo la variación en 50% aproximadamente. Conforme pasa el tiempo las lecturas tienden a decrecer más y más. hasta que se invierten a las 10 A.M.. Se investigó y se encontró que la temperatura tenía influencia en la variación.    156 . La variación en temperatura era causada por que la cantidad de refrigerante no era la adecuada.

  157 . Se instaló un nuevo rodamiento eliminándose otro 30% de la variabilidad.Cartas Multivari  También se encontró que el acabado cónico era causado por que la herramienta de corte estaba mal alineada. La excentricidad de las flechas se corrigió al cambiar un rodamiento excéntrico por desgaste en el torno. La tabla siguiente muestra un resumen de los resultados. contribuyendo a otra reducción del 10% de la variabilidad. Se ajustó.

Cartas Multivari Tipo de Variación Temporal Tiempo a tiempo % var. Total 50 Causas de Variación Bajo nivel de Refrigerante Acción Correctiva Adicionar refrigerante % de variación Reducida Casi 50 Dentro de la flecha 10 Ajuste no no paralelo Ajuste de la herramienta de corte Casi 10 Dentro de 30 Rodamiento Nuevo Casi 30 la flecha gastado rodamiento Flecha a flecha 5 -??? - - 158 .

0025” a 0.0004 = 5.002 / 0.0004” El nuevo Cp fue de 0.    159 . es conveniente realizar un estudio de variabilidad para identificar las fuentes de variación y tratar de eliminarlas. Se observa que antes de cambiar equipo o máquinas.0 Como beneficios se redujo a cero el desperdicio y no hubo necesidad de adquirir una nueva máquina.Cartas Multivari  Resultados:  La variación total en la siguiente corrida de producción se redujo de 0.

medición Máquina a máquina Turno a turno Tiempo a tiempo Operador a operador Programa Máquina Accesorios 160 ..150" +/.Cartas Multivari Ejemplo: Búsqueda de fuentes de variación con el diagrama sistemático. Diámetro de Flecha (0.002) Variación de proceso Pieza a pieza Lote a lote Dentro de la pieza Variación de sist.

Se Rechaza Ho: Oper1 = Oper2 = Oper3 • Para probar si existe diferencia significativa entre medias de operadores se hacen las siguientes comparaciones Ho: Oper1 = Oper2 Ho: Oper2 = Oper3 Ho: Oper1 = Oper3 Ha: Oper1 Oper2 Oper3 161 ..Cartas Multivari Ejemplo (cont.): • Al realizar la prueba de homogeneidad de varianza F. se encontró que había una diferencia significante entre los operadores.

5 0.5 0.Corrida en Minitab  Se introducen los datos en varias columnas C1 a C3 incluyendo la respuesta (strenght) y los factores (time y Metal) SinterTime 0.5 0.5 0.5 0.5 0.5 15 18 18 18 21 21 21 22 19 20 19 18 162 .5 MetalType 15 15 23 20 Strength 0.

mtw Opción: Stat > Quality Tools > Multivari charts   Indicar la columna de respuesta y las columnas de los factores En opciones se puede poner un título y conectar las líneas 163  .Corrida en Minitab  Utilizar el achivo de ejemplo Sinter.

MetalType SinterTime 0.5 17.5 19.5 1.0 22.5 15 18 21 MetalType 164 .5 21.5 Strength 20.5 18.Resultados Multi-Vari Chart for Strength by SinterTime .5 23.0 2.

5 Análisis de datos por atributos 165 .A.VI.

2. 4. 5) Regresión Logística Ordinal 166 . dependiendo de la naturaleza de la característica crítica para el cliente (CTS’s) como éste la expresa: CTS HERRAMIENTA Nominal (Verde. 3.Análisis de datos por atributos  Si los CTQ’s son variables continuas. Rojo. se usa la regresión. azul) Regresión Logística Nominal Atributo (Pasa/No pasa) Regresión Logística Binaria Ordinal (1.

pasa / no pasa. regresión logit y regresión probit   167 . Entre los modelos no lineales de regresión usados se tienen: regresión logística. bueno / malo. categorías o grupos dicotómicos Las decisiones incluyen: si / no. etc.Análisis de datos por atributos  El análisis de datos por atributos se organiza en valores. pobre/justo/bueno/superior/excelente.

Tiene solo una variable dependiente. Minitab incluye los modelos binario. usa determinaciones de probabilidad o tasa de probabilidad 168 . ordinal y nominal  Regresión logit  Es subconjunto del modelo log-lineal.Análisis de datos por atributos  Regresión logística  Relaciona variables independientes categóricas a una variable dependiente (Y).

Análisis de datos por atributos  Regresión probit  Es similar a la prueba de vida acelerada. la unidad se somete a esfuerzo con la respuesta pasa/falla. bueno o malo. Es una respuesta binaria en un tiempo de falla futuro 169 .

Regresión logística o binaria • En caso de información cualitativa es necesario traducir las preferencias del cliente expresadas como atributos a un intervalo de valores aceptables de variables (Especificaciones). 170 .

Regresión logística o binaria  Es similar a la regresión múltiple excepto que la respuesta es binaria (si/no. etc. bueno/malo. Yi = 0. 1  171 . con valores máximos de Cero y Uno.) Sus coeficientes se determinan por el método de máxima verosimilitud Su función tiene forma de “S”.

.: P(evento)  e B 0  B1 X 1  B2 X 2  .Regresión logística o binaria  La probabilidad de que el resultado esté en cierta categoría es:  El método de cálculo del coeficiente b es diferente que en la regresión lineal Los coeficientes se determinan con la relación sig.  Bn X n P(no evento)  172 ...

Regresión logística  Condiciones:       Hay solo dos resultados posibles Hay solo un resultado por evento Los resultados son independientes estadísticamente Todos los predictores relevantes están en el modelo Es mutuamente exclusivo y colectivamente exhaustivo Los tamaños de muestra son mayores que para la regresión múltiple  Los efectos positivos se obtienen con b1>1 y los negativos con b1 e 0 a 1 173 .

Regresión logística Relación con ajuste pobre Relación con buen ajuste 174 .

Procedimiento       Definir el atributo a “traducir” (“y”) Definir la variable apropiada para el atributo (“x”) Definir el modelo matemático a probar Determinar los defectos que está dispuesto a aceptar Recolecte información de “x” vs “y”. Analice la información mediante Regresión Logística Binaria 175 . Asigne 1 si falla y 0 si es aceptable.Regresión logística .

Procedimiento 176 .Regresión logística.

debe de ser grande (P >0.Procedimiento Coeficientes del modelo P-Value de Deviance   Observe el P-Value de “Deviance” en la Sesión.10) Obtenga los coeficientes del modelo (De la Sesión) 177 .Regresión logística .

. P(Falla) = b +b x +.Regresión logística . 1+e 0 1 1 Donde : b0.. .. b1... = Coeficientes del modelo • Identifique el(los) valor(es) de “x” que le generarán como máximo la cantidad de defectos que usted está dispuesto a aceptar [4] 178 ...Procedimiento • Construya el modelo de regresión probabilidad de falla estará dado por : 0 1 1 para la b e +b x +..

30 0.04 0. tiende a tener una tasa de pulso más alta que los sujetos que no fuman.193 y la tasa de posibilidades de 0.041 1.0122551 2.237 Para Fuma. Si los sujetos tienen el mismo peso.98717 Fuma Si -1. el coeficiente negativo de -1.10 0.552980 -2.03 1.67930 -1.Ejemplo de riesgo de paro cardiaco Logistic Regression Table Predictor Coef Constant -1.19297 0.0250226 0.90 Peso 0. las posibilidades de que los fumadores tengan un pulso bajo sea sólo del 30% de las posibilidades de que los no fumadores tengan un pulso bajo.16 0.05  Odds 95% CI SE Coef Z P Ratio Lower Upper 1.30. indica que quien fuma. 179 .00 1.031 0.18 0.

Regresión logística ordinal • Cuando la respuesta ó CTS es de tipo ordinal (Varias categorías de respuesta como “totalmente de acuerdo”. 180 . “de acuerdo”. “en desacuerdo” y “totalmente en desacuerdo”) y el Factor ó CTQ es de naturaleza continua. la herramienta a utilizar es la Regresión Logística Ordinal. para definir Especificaciones. entonces.

Regresión logística ordinal Procedimiento       Defina la variable de respuesta a “traducir” (“y” ó CTS) Defina el CTQ (“x”) ó variable a relacionar con el CTS Defina el modelo matemático a probar Determine los defectos que está dispuesto a aceptar en la categoría de interés Recolecte información de “x” vs “y” Analice la información mediante Regresión Logística Ordinal 181 .

Regresión logística ordinal Procedimiento  Stat > Regression > Ordinal Logistic Regression   Seleccione la respuesta (“y”) Seleccione los términos que estima tiene el modelo [3] Constantes y Coeficientes del modelo 182 .

Regresión logística ordinal Procedimiento  Observe el P-Value de “Deviance” en la Sesión.10) Obtenga las constantes y coeficientes del modelo (De la Sesión) Construya los modelos de regresión para la probabilidad acumulada por categoría   183 . debe de ser grande (P >0.

...Regresión logística ordinal Procedimiento P acumulada hasta categoría i eK +b x + b x . = Coeficientes del modelo Constantes y Coeficientes del modelo • Identifique el(los) valor(es) de “x” que le generarán como máximo la cantidad de defectos que usted está dispuesto a aceptar en la categoría de interés [4] 184 .. b2. . 1+e i 1 1 2 2 i 1 1 2 2 Donde : Ki = Constante de la categoría i b1.... = K +b x + b x ..

Regresión logística ordinal Procedimiento  Una vez que se tienen establecidos los CTQs con los que se medirá el desempeño del producto. CTQs Especificaciones LIE LSE Otra Clientes Usuarios Finales Producto (Específico) 185 . es necesario indicar las Especificaciones de los mismos Parámetros de Diseño (DPs) Expectativas (CTS’s) Matriz de Diseño Producto (General) Tipo Importan.

Análisis Logit  Usa razones para determinar que tanta posibilidad tiene una observación de pernecer a un grupo que a otro.8 de estar en el grupo A se puede expresar como una tasa de posibilidades de 4:1 ( que es p/(1-p)). cuyo logaritmo es el logit.   La probabilidad para un valor L está dado por la ecuación 186 . Una posibilidad de 0.

198 o 1.ejemplo 50 estudiantes tomaron un examen.11 que es la tasa de pasar a otro nivel 187 .198:1 Logit = ln(p/(1-p)) = ln(1.545) = 1.189) = 0.17 o 1.5% de pasar.1809 y despejando al Exp(b1) = exp(0.71:1 Un estudiante que estudia 80 horas tiene un 54.Análisis Logit .1082) = 1.545/(1-0.46 = 1. ¿Cuáles son las posibilidades de pasar? Posibilidades = P/(1-P) = 0. ¿cuáles son las posibilidades? Posibilidades = 0.54/0. donde solo 27 pasaron.

El modelo probit tiene un valor esperado de 0 y una varianza de 1. Un artículo sujeto a esfuerzo puede fallar o sobrevivir.814 con: bl = -1.Análisis Probit  Es similar a las pruebas de vida acelerada y análisis de sobrevivencia.1814 bp 188 . Requiere tamaños de muestra muy grandes para diferenciarse del modelo logit   Los coeficientes b del modelo logit difieren del probit en 1.

VI.B Pruebas de hipótesis 189 .

B Pruebas de hipótesis 1. 8. 7. 2. medias y prop.VI. Bondad de ajustes Análisis de varianza (ANOVA) Tablas de contingencia Pruebas no paramétricas 190 . Conceptos fundamentales Estimación puntual y por intervalo Pruebas para medias. 5. 6. 4. varianzas y proporciones Pruebas comparativas para varianzas. 3.

1 Conceptos fundamentales 191 .VI.B.

Análisis Estadístico En CADA prueba estadística. varianza) Estas estimaciones de los VERDADEROS parámetros son obtenidos usando una muestra de datos y calculando los ESTADÏSTICOS. se comparan algunos valores observados a algunos esperados u otro valor observado comparando estimaciones de parámetros (media.. La capacidad para detectar un diferencia entre lo que es observado y lo que es esperado depende del desarrollo de la muestra de datos Incrementando el tamaño de la muestra mejora la estimación y tu confianza en las conclusiones estadísticas. desviación estándar. 192 ..

. es su complemento  Puede ser por ejemplo  = 5 para prueba de dos colas   < 5 para prueba de cola izquierda   > 5 para prueba de cola derecha  Esta hipótesis se acepta cuando se rechaza Ho 193 . .Conceptos fundamentales  Hipótesis nula Ho  Es la hipótesis o afirmación a ser probada  Puede ser por ejemplo . = 5  Sólo puede ser rechazada o no rechazada  Hipótesis alterna Ha  Es la hipótesis que se acepta como verdadera cuando se rechaza Ho.

La hipótesis nula de cola derecha establecerá que el proceso A es <= Proceso B. la hipótesis nula de dos colas asumirá que los rendimientos no cambian Ho: Ya = Yb Se trata de probar si el promedio del proceso A es mayor que el promedio del proceso B.  194 .Conceptos fundamentales  Ejemplos:  Se está investigando si una semilla modificada proporciona una mayor rendimiento por hectárea. O sea Ho: A <= B.

normal=.05)  Se comete al rechazar la Ho cuando en realidad es verdadera. También se denomina riesgo del productor  Error tipo II (beta )  Se comete cuando no se rechaza la hipótesis nula siendo en realidad falsa.Conceptos fundamentales  Estadístico de prueba  Para probar la hipótesis nula se calcula un estadístico de prueba con la información de la muestra el cual se compara a un valor crítico apropiado. Es el riesgo del consumidor 195 . De esta forma se toma una decisión sobre rechazar o no rechazar la Ho  Error tipo I (alfa = nivel de significancia.

 Para un mismo tamaño de muestra n ambos varían inversamente  Incrementando el tamaño de muestra se pueden reducir ambos riesgos. sin embargo esto incrementa el riesgo .Conceptos fundamentales  Tipos de errores  Se asume que un valor pequeño para  es deseable. Ho en realidad es Verdadera p = 1- Decisión correcta p= Error tipo I Ho en realidad es falsa p= Error tipo II p=1- Decisión correcta Decisión realizada No hay evidencia para rechazar Ho Rechazar Ho 196 .

.Zexcel ) = alfa/2 P(Z>= + Zexcel ) = alfa/2 197 . . que un valor poblacional. = cte. Por ejemplo si Ho = 10 se tiene: P(Z<= .Conceptos fundamentales  Pruebas de dos colas  Si la Ho: . entonces el riesgo alfa se reparte en ambos extremos de la distribución.

entonces el riesgo alfa se coloca en la cola izquierda de la distribución. . Por ejemplo si Ho: >= 10 y Ha: < 10 se tiene una prueba de cola izquierda: P(Z <= . que un valor poblacional.Conceptos fundamentales  Pruebas de una cola  Si la Ho: . .Zexcel ) = alfa 198 .  >= Cte.

Por ejemplo si Ho: <= 10 y Ha:  > 10 se tiene una prueba de cola derecha: P(Z>= + Zexcel ) = alfa 199 . .Conceptos fundamentales  Pruebas de una cola  Si la Ho: . . <= Cte. que un valor poblacional. entonces el riesgo alfa se coloca en la cola derecha de la distribución.

 El tamaño de muestra (n) necesario para la prueba de hipótesis depende de:    El riesgo deseado tipo I alfa y tipo II Beta El valor mínimo a ser detectado entre las medias de la población (Mu – Mu0) La variación en la característica que se mide (S o sigma) 200 .Conceptos fundamentales  Tamaño de muestra requerido  Normalmente se determina el error alfa y beta deseado y después se calcula el tamaño de muestra necesario para obtener el intervalo de confianza.

Conceptos fundamentales  El Tamaño de muestra requerido en función del error máximo E o Delta P intervalo proporcional esperado se determina como sigue: Z 2 / 2 2 n E2 Z 2 / 2 ( p )(1  p ) n (p ) 2 Z 2 / 2  2 n  (X   )2 Z 2 / 2 (  )( 1   ) n  ( p   )2 201 .

ya ha ocurrido un cambio significativo al 95% de nivel de confianza 202 . si se desvía por más de 4 toneladas. si la desviación estándar (sigma) es de 20 toneladas? n = (1.Conceptos fundamentales  Ejemplo:  ¿Cuál es el tamaño de muestra mínimo que al 95% de nivel de confianza (Z=1.96^2)(20^2)/(4)^2 = 96 Obtener 96 valores de rendimiento por hora y determinar el promedio.96) confirma la significancia de una corrida en la media mayor a 4 toneladas/hora (E).

Efecto del tamaño de muestra 203 .

Efecto del tamaño de muestra 204 .

Efecto del tamaño de muestra 205 .

Efecto del tamaño de muestra 206 .

1 la potencia es del 90% Delta se puede normalizar dividiéndolo entre la desviación estándar  y se expresa en un cierto  número de  (1 .5  )  207 . 1.Potencia de la prueba  La potencia de una prueba estadística es su habilidad para detectar una diferencia crítica Potencia  1    Si Beta = 0.

Potencia de la prueba   La potencia de la prueba es la probabilidad de de rechazar correctamente la hipótesis nula siendo que en realidad es falsa. El análisis de potencia puede ayudar a contestar preguntas como:     ¿Cuántas muestras se deben tomar para el análisis? ¿Es suficiente el tamaño de muestra? ¿Qué tan grande es la diferencia que la prueba puede detectar? ¿Son realmente valiosos los resultados de la prueba? 208 .

Minitab requiere de dos de los siguientes parámetros:    Tamaños de muestra Diferencias .un corrimiento significativo de la media que se desea detectar Valores de potencia .La probabilidad deseada de rechazar Ho cuando es falsa 209 .Potencia de la prueba  Para estimar la potencia.

Considerando la potencia de prueba 210 .

VI.2 Significancia estadística vs práctica 211 .

Estimación de riesgos 212 .

Pruebas de Minitab  Permite hacer las siguientes pruebas:      Prueba Prueba Prueba Prueba Prueba z de una muestra t de una muestra t de dos muestras de 1 proporción de 2 proporciones    ANOVA Diseños factoriales de dos niveles Diseños de Packett Burman 213 .

Calculo manual 214 .

Calculo manual 215 .

3 Tamaño de muestra 216 .VI.

Calculo manual de tamaño de muestra 217 .

Calculo manual de tamaño de muestra – Pruebas de una cola 218 .

Calculo manual de tamaño de muestra – Pruebas de una cola 219 .

5 gramos por arriba de la media. EN PROMEDIO 0.16 0. Si la media se desplaza 2. la desviación estándar histórica es de 2.5 GRS.06 0.Ejemplo con prueba de una media t  Ejemplo: Se tiene una población normal con media de 365 y límites de especificación de 360 y 370.18 0.403: CORRIDA DE 2.02 0.5 LIE 370 Variable O riginal C orrida Y-Data 0.04 0.08 0.12 LIE 360 Ho: Meta 365 Ha: Corrida 367.00 355 360 365 C1 370 375 220 .10 0. el número de defectos sería inaceptable.14 0.

Ejemplo con prueba de una media t Stat > Power and Sample Size > 1 .Sample t Completar el diálogo como sigue: 221 .

537662 222 .5 si se usan 6 muestras O sea que hay una probabilidad del 46. 90% y 95%? Sample Difference Size Power 2.24% que no se rechaze Ho y se concluya que no hay diferencia significativa.5 6 0.05 Assumed standard deviation = 2.76% de Potencia para detectar una diferencia de 2. y para 85%. ¿cuántas muestras se requieren para tener un 80% de probabilidad de detectar el corrimiento.Ejemplo con prueba de una media t Los resultados se muestran a continuación: Power and Sample Size 1-Sample t Test Testing mean = null (versus not = null) Calculating power for mean = null + difference Alpha = 0.403 Se tiene un 53.

223 .905836 0.95 Difference 2.85 0.832695 0.5 2.5 Actual Power 0.Sample t Se cambia este parámetro Los resultados se muestran a continuación: Sample Size 10 11 12 15 Target Power 0.5 2.Ejemplo con prueba de una media t Stat > Power and Sample Size > 1 .873928 0.90 0.80 0.5 2.962487 Si la potencia es demasiado alta por decir 99% se pueden detectar diferencias que realmente no son significativas.

9.807037 1 23 0.8 0.912498 Se requieren tamaños de muestra de entre 17 y 23 224 .8 y 0.Ejemplo con prueba de 2 medias t Ejemplo: La potencia de una prueba depende de la diferencia que se quiera detectar respecto a la desviación estándar.Sample t Power and Sample Size 2-Sample t Test Testing mean 1 = mean 2 (versus not =) Calculating power for mean 1 = mean 2 + difference Alpha = 0. con valores deseados de Potencia de 0.05 Assumed standard deviation = 1 Sample Target Difference Size Power Actual Power 1 17 0. Stat > Power and Sample Size > 2 . para una sigma poner 1 en diferencia y desviación estándar.9 0.

Minitab requiere de dos de los siguientes parámetros: * Tamaños de muestra * La proporción .9 de niveles de Potencia: Proporción que se desea detectar con alta probabilidad (0.04 con el 0.90) Es la proporción de la Hipótesis nula 225 .8 y 0. 0.Ejemplo con prueba de 1 proporción Para estimar la potencia.una proporción que se desea detectar con alta probabilidad * Valores de potencia .La probabilidad deseada de rechazar Ho cuando es falsa Suponiendo que se desea detectar una proporción de 0.80.

la potencia de la prueba para detectar un corrimiento de 2% a 4% es del 86.04 Options: Greater Than Significance Level = 0.02) Alpha = 0.800388 0.900226 Si se desea saber la Potencia si se utiliza un tamaño de muestra de 500 se tiene: Stat > Power and Sample Size > 2 .05 Alternative Sample Proportion Size Power 0.8 0.04 580 0.02 (versus > 0.04 500 0.865861 Por tanto con un tamaño de muestra de 500.04 391 0.6% 226 .Ejemplo con prueba de 1 proporción Test for One Proportion Testing proportion = 0.Sample t Sample sizes = 500 Alternative values of p = 0.05 Test for One Proportion Testing proportion = 0.9 0.02 (versus > 0.05 Alternative Sample Target Proportion Size Power Actual Power 0.02) Alpha = 0.

Calcular la potencia de la prueba para los siguientes escenarios (usar pruebas de dos colas): a. d = 1. b=0.05. d = 0. 2-muestras t à a=0.05. 1-muestra t à a=0.05.01.05.0s. d = 1. n = 10.5s y 2. n = 25. 1-muestra t à a=0.2. 2-muestras t à a=0. 50. d = 1. d = 1.Ejercicios Calcular los tamaños de muestra necesarios para los siguientes escenarios (usar pruebas de dos colas): a.01.05. b=0.1 y 0. 75. 1-muestra Z à a=0. 35 b. 100 227 .05. b=0. n = 10.1. b=0.0s 2. 1-muestra t à a=0. 1-muestra Z à a=0. 20 c. d = 0.5s b.2.5s.0s d.5s c. n = 10. 25.0s. 1-muestra t à a=0. d = 0.5s.05.5s y 1.1 y 0. 25 d. d = 1.

P0 = 0. 2-proporciones à a=0. PA = 0.01.9 c.01. P0 = 0. n = 250.1 & 0.05. n = =400.6 b. 0.01. b=0.6. 1-proporción à a=0. P0 = 0. 2-proporciones à a=0.95 2.8. P0 = 0.6. 500 228 . P0 = 0. 350 d. b=0.5. n = 400.5.1 & 0.85. b=0.05. 350 b.1. P0 = 0.95. 1-proporción à a=0. n = 250. PA = 0.95.9.1. 1-proporción à a=0.2. 500 c.05. P0 = 0. 0.9. P0 = 0. 2-proporciones à a=0.Ejercicios Calcular el tamaño de muestra requerido para los siguientes escenarios (usar pruebas de dos colas): a. b=0.2. PA = 0.5.8. 2-proporción à a=0. PA = 0.05. Calcular la potencia de la prueba para los siguientes escenarios (usar pruebas de dos colas): a. PA = 0.8 d. PA = 0. 1-proporción à a=0.01. PA = 0.5.6. PA = 0.

229 .

230 .

4 Estimación puntual y por intervalo 231 .B.VI.

podrían ser consideradas como un punto estimado de la media y desviación estándar real de población o de los PARAMETROS. algún tipo de error?  “Un Intervalo de Confianza” 232 . qué otra cosa podríamos obtener como margen.Estimación puntual y por intervalo  Las medias o desviaciones estándar calculadas de una muestra se denominan ESTADÍSTICOS. ¿Qué pasa si no deseamos una estimación puntual como media basada en una muestra.

Intervalo de confianza Error de estimación P(Z<= .Zexcel ) = alfa/2 P(Z>= + Zexcel ) = alfa/2 Intervalo de confianza donde se encuentra el parámetro con un NC =1- 233 .

025 234 .Estimación puntual y por intervalo  ¿Cómo obtenemos un intervalo de confianza? Estimación puntual + error de estimación  ¿De dónde viene el error de estimación? Desv.96 = Z0. el intervalo de confianza al 95% donde se encuentra la media para una distribución normal es: 100 + (10) X 1.6) 1.96 => (80. estándar X multiplicador de nivel de confianza deseado Z/2 Por Ejemplo: Si la media de la muestra es 100 y la desviación estándar es 10. 119.4.

645 85 1. o  conocida usar la distribución Normal Para muestras de menor tamaño.5% mayor o menor. corresponde a una Z de 1.960 90 1. Si vamos a la tabla Z veremos que para un área de 0. C.960.Estimación puntual y por intervalo 95% de Nivel de Confianza significa que sólo tenemos un 5% de oportunidad de obtener un punto fuera de ese intervalo. o  desconocida usar la distribución t 235 .439 80 1. 99 Multiplicador Z/2 2. Esto es el 5% total.282 Para tamaños de muestra >30. I. o 2.576 95 1.025.

n 30  X  t  2  n . n 1   p  Z 2 p (1  p ) n 236 .Estimación puntual y por intervalo  para . con n-1 gl.n 30  X  Z  2  n  para . n 1  2  ( n  1) s 2 2 1  2 . ( n  1) s 2  2 2 .

Para n grande el IC es pequeño 237 .

Para n grande el IC es pequeño 238 .

182*S/√n = 28.2 y 26.9. 27. 29.7.02/2=(26. 29.08 con S = 1.02 Estimar el intervalo de confianza para un nivel de confianza del 95% (t = 3.182 con n-1=3 grados de libertad) Xmedia±3.182*1.08±3.Ejemplo  Dadas las siguientes resistencias a la tensión: 28.5 psi Estimar la media puntual X media = 28.70) 239 .46.

240 . Se rechaza la solución si el peso promedio de todo el lote no excede las 18 onzas. Una muestra de 16 soluciones tienen un peso promedio de 16.NC 2. las latas parecen estar llenas con 16 onzas?. ¿A un nivel de confianza del 95%. Determinar el intervalo de confianza al NC del 95% y al 99% donde se encuentra la media del proceso (poblacional). 100 latas de 16 onzas de salsa de tomate tienen una media de Xmedia = 15.2 onzas con una S = 0.43 Kgs..6 onzas con S = 3. ¿Cuál es la decisión a un 90% de nivel de confianza?. 4. ¿Cuál es el valor de Z?.58 Kgs.93 y 1.63. Un intervalo de confianza del 90% para estimar la ganancia promedio del peso de ratones de laboratorio oscila entre 0.Ejemplos para la media con Distribución normal Z Z 1. Alfa = 1 .73 onzas. con S = 217.96 onzas. El peso promedio de una muestra de 50 bultos de productos Xmedia = 652. 3.

Con una S = 9.7 libras y una desviación estándar de 1. Hallar el intervalo de confianza del 95% para estimar el peso promedio y la varianza de todos los paquetes.Ejemplos para la media y varianza con Distribución t t 5. Grados libertad=20 -1 =19 6. 20 cajas de producto pesaron 102 grs.87 grs. Los pesos de los paquetes se distribuyen normalmente.56.5 grs. ¿Cuál es la estimación del intervalo de confianza para la media y varianza a un nivel de confianza del 95 y del 98% del peso de productos del lote completo?.2 libras. Una muestra de 25 productos tienen un peso promedio de 23. 241 . ¿Cuál es el intervalo donde se encuentra la media y varianza del lote para un 90% de nivel de confianza?. 7. Con S = 8. Los pesos de 25 paquetes enviados a través de UPS tuvieron una media de 3.

521 reportaron problemas de robo por los empleados ¿Se puede concluir con un 99% de nivel de confianza que el 78% se encuentra en el intervalo de confianza. De 814 encuestados 562 contestaron en forma afirmativa. ? 242 . En una encuesta a 673 tiendas. ¿Cuál es el intervalo de confianza para un 90% de nivel de confianza? 9.Ejemplos para proporciones con Distribución Z Z 8.

90.Instrucciones con Minitab Intervalo de confianza para la media Stat > Basic Statistics > 1-Sample Z.Indicar la columna de los datos o Summarized Data En caso de requerirse dar el valor de Sigma = dato En Options: Indicar el Confidence level -. t Variable -. 95 o 99% OK 243 .

Instrucciones con Minitab Intervalo de confianza para proporción
Stat > Basic Statistics > 1-Proportion Seleccionar Summarized Data Number of trials = n tamaño de la muestra Number of events = D éxitos encontrados en la muestra En Options: Indicar el Confidence Interval -- 90, 95 o 99% Seleccionar Use test and interval based in normal distribution

244

VI.B.5 Pruebas de hipótesis para medias, varianzas y proporciones

245

Elementos de una Prueba de Hipótesis
Prueba Estadística- Procedimiento para decidir no rechazar Ho aceptando Ha o rechazar Ho. Hipótesis Nula (Ho) - Usualmente es una afirmación representando una situación “status quo”. Generalmente deseamos rechazar la hipótesis nula. Hipótesis Alterna (Ha) - Es lo que aceptamos si podemos rechazar la hipótesis nula. Ha es lo que queremos probar.

246

Elementos de una Prueba de Hipótesis
Estadístico de prueba: Calculado con datos de la muestra (Z, t, X2 or F). Región de Rechazo Indica los valores de la prueba estadística para que podamos rechazar la Hipótesis nula (Ho). Esta región esta basada en un riesgo  deseado, normalmente 0.05 o 5%.

247

Pasos en la Prueba de Hipótesis
1. Definir el Problema - Problema Práctico

2. Señalar los Objetivos - Problema Estadístico

3. Determinar tipo de datos - Atributo o Variable

4. Si son datos Variables - Prueba de Normalidad

248

Pasos en la Prueba de Hipótesis
5. Establecer las Hipótesis - Hipótesis Nula (Ho) - Siempre tiene el signo =, , 

Ho : , 2 , , ,  parametrode la hipotesis
- Hipótesis Alterna (Ha) – Tiene signos , > o <.

Ha :  , 2 , , ,  parametro de la hipotesis
El signo de la hipótesis alterna indica el tipo de prueba a usar

249

Elementos de una Prueba de Hipótesis
Pruebas de Hipótesis de dos colas: Ho: a = b Región de Ha: a  b Rechazo -Z Pruebas de Hipótesis de cola derecha: Ho: a  b Ha: a > b
0 Región de Rechazo

Z

Región de Rechazo 0

Pruebas de Hipótesis cola izquierda: Ho: a  b Región de Ha: a < b
Rechazo

Z

-Z

0

Z

250

Pasos en la Prueba de Hipótesis
6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%) o el nivel de confianza NC = 1 - alfa

7. Establecer el tamaño de la muestra, >= 10.

8.Desarrollar el Plan de Muestreo

9.Seleccionar Muestras y Obtener Datos

10. Decidir la prueba estadística apropiada y calcular el estadístico de prueba (Z, t, X2 or F) a partir de los datos.

251

Estadísticos para medias, varianzas y proporciones
X  ;Una.media; n  30;   conocida / n X  t ;Una.media; n  30;   desconocida S/ n S12 F  2 ; DF  n1  1, n2  1; prueba.dos. var ianzas S2 Z  t X1  X 2 ; dos.medias;  ' s  desconocidas. pero.  1 1 Sp /  n1 n2
2 2 ( n1  1) s1  ( n2  1) s2 ; DF  n1  n2  2 n1  n2  2

Sp  t

X1  X 2 s s  n1 n2
2 1 2 2

; dos.medias;  ' s  desconocidas.diferentes

DF  formula.especial

252

Estadísticos para medias, varianzas y proporciones

Para el caso de muestras pareadas se calculan las diferencias d individuales como sigue:
t X X
2

d ; Pares.de.medias; d i . para.cada. par Sd / n  ( n  1) S 2

2

; DF  ( n  1); prueba.una.v ar ianza

2

(O  E ) 2  ; DF  ( r  1)(c  1); bondad .ajuste E

253

Pasos en la Prueba de Hipótesis
11. Obtener el estadístico correspondiente de tablas o Excel.

12.Determinar la probabilidad de que el estadístico de prueba calculado ocurre al azar.

13.Comparar el estadístico calculado con el de tablas y ver si cae en la región de rechazo o ver si la probabilidad es menor a alfa, rechaze Ho y acepte Ha. En caso contrario no rechaze Ho.

14.Con los resultados interprete una conclusión estadística para la solución práctica.

254

Estadístico Prueba de Hipótesis Calculado con Datos de la muestra Pruebas de Hipótesis de dos colas:
Ho: a = b Ha: a  b
Región de Rechazo 0 Región de Rechazo

-Z Pruebas de Hipótesis de cola derecha: Ho: a  b Ha: a > b

Z

Región de Rechazo 0

Pruebas de Hipótesis cola izquierda: Ho: a  b Región de Ha: a < b
Rechazo

Z

-Z

0

Z

255

Prueba de hipótesis para la varianza

Las varianzas de la población se ditribuyen de acuerdo a la distribución Chi Cuadrada. Por tanto las inferencias acerca de la varianza poblacional se basarán en este estadístico

La distribución Chi Cuadrada se utiliza en:
Caso I. Comparación de varianzas cuando la varianza de la población es conocida

Caso II. Comparando frecuencias observadas y esperadas de resultados de pruebas cuando no hay una varianza de la población definida (datos por atributos)

256

si la población sigue la distribución normal es:  Con el estadístico Chi Cuadrada con n-1 grados de libertad 257 .Prueba de hipótesis para la varianza  Las pruebas de hipótesis para comparar una varianza poblacional a un cierto valor constante 0.

99 Como La Chi calculada es menor a la Chi de Excel de 2. X^2c =(7)(8)^2/(15)^2 = 1. Si hay decremento en la resistencia 258 .17 se debe rechazar la hipótesis nula.Prueba de hipótesis para la varianza 2. En una muestra de 8 piezas se obtuvo una S = 8psi.17 Ejemplo: ¿El material muestra una variación (sigma) en la resistencia a la tensión menor o igual a 15 psi con 95% de confianza?.

Prueba de hipótesis para atributos Ejemplo: Un supervisor quiere evaluar la habilidad de 3 inspectores para detectar radios en el equipaje en un aeropuerto. ¿Hay diferencias significativas para un 95% de confianza? Valores observados O Radios detectados Radios no detectados Total de la muestra Inspector 1 27 3 30 Inspector 2 25 5 30 Inspector 3 22 8 30 Total por tratamiento 74 16 90 259 .

33 30 Inspector 3 24.67 5.67 5.33 30 Inspector 2 24.33 30 Total por tratamiento 74 16 90 260 . renglones -1) Las frecuencias esperadas son: (Total columna x Total renglón) Valores esperados E Radios detectados Radios no detectados Total de la muestra Inspector 1 24. de columnas -1)*(No.Prueba de hipótesis para atributos Ho: p1 = p2 = p3 Ha: p1  p2  p3 Grados de libertad = (No.67 5.

99. El estadístico Chi Cuadrada calculada es menor que Chi de alfa.99 El estadístico Chi Cuadrada de alfa = 0.05 para 4 grados de libertad es 5.Prueba de hipótesis para atributos El estadístico Chi Cuadrado en este caso es: 5. por lo que no se rechaza Ho y las habilidades son similares 261 .

) Establecer la región de rechazo Las regiones de rechazo para prueba de 2 colas: -Z y Z  s n Región de Rechazo 0 Zcalc= Región de Rechazo -Z Z Si el valor del estadístico de prueba cae en la región de rechazo rechazaremos Ho de otra manera no podemos rechazar Ho.) Ha:  3.Ejemplo de Prueba de hipótesis para la media Para una muestra grande (n>30)probar la hipótesis de una media u 1. 262 .) Calcular el estadístico de prueba 4.) Ho:  2.

( -0.05 Paso 1. Cálculo del estadístico de prueba Zc 151 = > Zc = 1. Estándar s 812 (Alfa = 0.100? Probarlo a un 5% de nivel de significancia Datos Minoristas n 64 media mu = 2100 Precio prom.025 ) 263 .INV.48768473 X   HIPOTESIS.025 ) = 1.NULA Zc  s n 101. Establecimiento de hipótesis Ho: uC = 2100 Se inicia con el planteamiento de la hipótesis nula Ha: uC <> 2100 Por tanto se trata de una prueba de dos colas Paso 2.95996398 DIST. X 2251 Desv.NORM.Prueba de hipótesis de una población para muestras grandes con Z ¿Parecería ser correcta la afirmación de que se mantiene el precio promedio de las computadoras en $2.STAND.5 Error estándar Como el valor de Zc es positivo se comparará contra de Zexcel (1-alfa/2) positivo Paso 3. Determinar la Ze de Excel o de tablas para el valor de probabilidad (Alfa / 2): Ze ( 0.

y por tanto no hay suficiente evidencia para RECHAZAR Ho Se concluye que el precio promedio no es diferente de $2.025. El Intervalo de confianza para la media poblacional al nivel de confianza 1-Alfa (1-Alfa = 0.95996398 2251 Intervalo de confianza  198. también nos da el criterio para NO RECHAZAR la Ho Paso 5.  X  Z s 2 n Error estándar Z alfa/2 101.estimar.Paso 4.487684729 Zexcel ( 1.064 <=  <= ### ) 264 .959963985 -0.068 correspondiente a la Z calculada Zc es mayor que el valor de Alfa / 2 = 0. 2052.95 Porciento) IC. no cae en el área de rechazo.025 ) Como Zc es menor que Zexcel.Zexcel ) = alfa/2 P(Z>= + Zexcel ) = alfa/2 Zexcel ( #¡REF! ) -1.100 O Como el valor P = 0.5 1.936344 El intervalo de confianza incluye a la media de la hipótesis por tanto no se rechaza la Ho. Comparando los valores Zc calculado contra Zexcel se tiene P(Z<= . para.95996398 Zc = 1.

995 Paso 1.2603153 Error estándar Gl=14.005 (1-Alfa/2 = 0.02 .01 te ( 0. Estándar s 977 (Alfa = 0. 14 ) X   HIPOTESIS .alfa) positivo Paso 3. Establecimiento de hipótesis Ho: uC <= 5775 Ha: uV > 5775 Se Paso 2.Prueba de hipótesis de una población para muestras pequeñas con t Se piensa que las ventas promedio de $5. Determinar la te de Excel o de tablas para Alfa 0.99 2. NULA tc  s n 252.775 se han incrementado gracias a la campaña publicitaria Probar esta afirmación a un nivel de significancia alfa de 1% Se inicia con el planteamiento de la hipótesis Alterna Datos Semanas n 15 media mu = 5775 Ventas prom X 6012 Desv.01 (1-Alfa = 0. gl.99 (Alfa/2 = 0.93950568 NOTA:En excel poner 2alfa para obtener t de alfa Como el valor de tc es positivo se comparará contra de t excel (1. Cálculo del estadístico de prueba tc trata de una prueba de cola derecha 237 = > tc = 0.62449406 DIST. 265 .INV( 0.T.

62449406 tc = 0.02 gl.06 ) 266 .Paso 4.05 no se rechaza Ho (1-Alfa = 99 Porciento) s Error estándar 252.62449406 Como el intervalo de confianza Intervalo de confianza 6012 IC .368 mayor a Paso 5. 14) Valor p para tc es igual a P(tc) = 0.estimar .368130427 rechazo.260315 2 n Z alfa/2 2. para. El Intervalo de confianza para la media poblacional al nivel Se concluye que la publicidad no ha tenido efecto en las ventas Alfa = 0.94 <=  <=  662. Comparando los valores tc calculado contra t excel se tiene P(t >= + t excel ) = alfa texcel ( 2.0557002 6674. no cae en el área de y por tanto no hay suficiente evidencia para rechazar Ho O Como el valor de P para Zc es 0.  X  t contiene a la media Hipótesis no se rechaza Ho 5349. p > Alfa Como tc es menor que texcel.939505684 0.

( 267 .NORM.025 (1-Alfa/2 = 0.5 Se trata de una prueba de dos colas Paso 2.1 0.41421356 Error estándar Como el valor de Zc es positivo se comparará contra de Zexcel (alfa/2) positivo Paso 3.Prueba de hipótesis para una proporción con Z El gerente de mercado considera que el 50% de sus clientes gasta menos de $10 en cada visita a la tienda. Determinar la Ze de Excel o de tablas para Ze ( (1-Alfa/2 = 1.STAND.5 Ha :  c  0.975 0.6 menos de$10 (Alfa = 0.INV.975 Paso 1. NULA  HIP.95996398 (1-Alfa/2 = 0. Cálculo del estadístico de prueba Zc Zc  p   HIPOTESIS.05 (1-Alfa = 0.975 ) DIST.07071068 = > Zc = 1.95 (Alfa/2 = 0.5 30 gastaron p 0. ¿Estás de acuerdo con esta afirmación a un nivel de significancia del 5%? Se inicia con el planteamiento de la hipótesis nula Datos Clientes n 50 Proporción media = 0. NULA (1   HIP. Establecimiento de hipótesis Ho :  c  0. NULA ) n 0.

  p  Z  2 p (1  p ) n Error estándar 0.41421356 Zexcel ( 1. para. no se rechaza Ho ( 0.Paso 4.07071068 Z alfa/2 1.Zexcel ) = alfa/2 P(Z>= Zexcel ) = alfa/2 Zexcel ( 0.079 mayor a Alfa/2 no se rechaza Ho Paso 5.95996398 Zc = 1.1 Como la media de p = 0.estimar .07926984 p > Alfa /2 Porciento) IC .7 ) 268 .95996398 0. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 95 Valor p para Zc es igual a P(-Zc) = 0.025 ) -1. no cae en el área de rechazo.41421356 0.6 Intervalo de confianza  0.6 se encuentra dentro del intervalo.5 <=   0. y por tanto no hay suficiente evidencia para rechazar Ho y se concluye que el porcentaje que compra menos de $10 no difiere del 50% de clientes O Como el valor P de Zc es 0. Comparando los valores Zc calculado contra Zexcel se tiene P(Z <= .975 ) Como Zc es menor que Zexcel.

Not equal.Indicar la columna de los datos o Summarized Data En caso de requerirse dar el valor de Sigma = dato Proporcionar la Media de la hipótesis Test Mean En Options: Indicar el Confidence Interval -. 95 o 99% Indicar el signo de la hipótesis alterna: Less Than.90.Instrucciones con Minitab para la prueba de hipótesis de una media Stat > Basic Statistics > 1-Sample Z. t Variable -. Greater than OK 269 .

95 o 99% Indicar la Test Proportion Proporción de la hipótesis Indicar el signo de la hipótesis alterna: Less Than. Greater than Seleccionar Use test and interval based in normal distribution OK 270 . Not equal.Instrucciones con Minitab para la prueba de hipótesis de una proporción Stat > Basic Statistics > 1-Proportion Seleccionar Summarized Data Number of trials = n tamaño de la muestra Number of events = D éxitos encontrados en la muestra En Options: Indicar el Confidence Interval -.90.

medias. y proporciones 271 .Pruebas de hipótesis para comparación de varianzas.

5 84.3 82.1 83.7 85.Prueba de Hipótesis  Supongamos que tenemos muestras de dos reactores que producen el mismo artículo.7 83. Se desea ver si hay diferencia significativa en el rendimiento de “Reactor a Reactor”.3 79.2 91.7 Rendimiento A B 10 84.4 Reactor B 84.6 89.5 272 .24 10 85.9 86.5 88.1 Estadísticas Descriptivas Variable Reactor N Media Desv.90 3.Std 84.65 84.1 81.7 83. Reactor A 89.7 81.3 79.7 86.54 2.8 87.

 Ho: Hipótesis Estadística: No existe diferencia entre los Reactores  Ha: Hipótesis Alterna: Las medias de los Reactores son diferentes. se trata de rechazar Ho. su diferencia se da por casualidad en una variación de día a día. Ho:  a   b Ha:  a  b Se busca demostrar que los valores observados al parecer no corresponden al mismo proceso.Prueba de Hipótesis Pregunta Práctica: Existe diferencia entre los reactores? Pregunta estadística ¿La media del Reactor B (85. 273 .54) es significativamente diferente de la media del Reactor A (84.24)? O.

A esto se le llama Hipótesis Alterna (Ha) Debemos demostrar que los valores que observamos al parecer no corresponden al mismo proceso. que la Ho debe estar equivocada 274 .Prueba de Hipótesis   Hipótesis Estadística: No existe diferencia entre los Reactores Esto se llama Hipótesis Nula (Ho)  Hipótesis Alterna: Cuando las medias de Reactores son diferentes.

0 82.5 ¿Representan los reactores dos procesos diferentes? ¿Representan los reactores un proceso básico? 275 .5 85.¿Qué representa esto? Reactor A Reactor B B A B B B B BB AA AAAA A BB A B 80.5 90.0 87.0 92.

la razón de sus varianzas crea una distribución muestral F. Las hipótesis son las siguientes:  El estadístico F se muestra a continuación donde S1 se acostumbra tomar como la mayor 276 .Prueba F de dos varianzas  Si se toman dos muestras de dos poblaciones normales con varianzas iguales.

6) = 4. s2 = 300 psi.15 Fcalculada = (900^2)/(300^2) = 9 >> Falfa.Prueba F de dos varianzas  Sea S1 = 900 psi. se rechaza Ho. n1 = 9.05. n2 = 7. A un 95% de nivel de confianza se puede concluir que hay menor variación? Ho: Varianza 1 <= Varianza 2 H1: Varianza 1 > Varianza 2 Grados de libertad para Var1 = 8 y para var 2 = 6 Falfa = F(0. 8. Hay evidencia suficiente para indicar que la variación ya se ha reducido 277 .

975) = 2. Determinar la Fe de Excel o de tablas para Fe (0.Alfa/2) Paso 3. Estan. A un nivel de siginificancia del 5% ¿Qué se puede concluir? Método 1 15 5.04 No. De CDs Desv.4 29.16) 278 . Varianza n1 s1 s12 n2 X2 s22 Alfa/2 0.16 Método 2 17 4. 14.8 23.Prueba de hipótesis de dos pob.1 = 14 16 Tomamos a s12 como el mayor para comparar Fc contra Fexcel (1.81701784 Alfa/2 0.266 Grados de libertad Numerador = n1 .INV (0.1 = Denominador = n2 .F.025.025 Paso 1. Establecimiento de hipótesis 2 Ho :  1  2 Ha :  1 2 2 2  2 Por tanto se trata de una prueba de dos colas Paso 2.025 DIST. Cálculo del estadístico de prueba Fc Fc  s s 2 1 2 2 1. comparando varianzas con F Se quiere comprobar si las varianzas de dos diferentes métodos de ensamble de CDs son diferentes en prod .

025) = Fc = 1.32259599 Como Fc es menor que Fexcel.025) se tiene f(F) P(F>= + 2. p > Alfa / 2 y por tanto no hay suficiente evidencia para rechazar Ho Se concluye que la varianza de los dos métodos de ensamble no difieren significativamente 279 .266 2.81 ) = alfa/2 Fe(0. Comparando los valores Fc calculado contra Fexcel (0. no cae en el área de rechazo.Paso 4.81701784 Valor p para Fc es igual a P(Fc) = 0.

90) = 1.1 Ze (0.10 Vacas vacaciones 50 112 32.28155157 DIST. se inicia planeando la Ha Zc  X1  X 2 2 3 s1 s2  n1 n2 6.NORM.Prueba de hipótesis de dos pob. Cálculo del estadístico de prueba Zc Como el planteamiento es que las vacas de vacaciones ganan más peso.110613717 = > Zc = 1.03099301 Tomamos a X1 como el mayor para comparar Zc contra Ze positiva Paso 3.7 Vacas Peso promedio Desv.7 28. Alfa = 0. Comparando dos medias con Z Investigar si el ambiente libre de tensiones mejoran el engorde y la calidad de la carne de vacas Las varianzas poblacionales son desconocidas Determinar el intervalo de confianza al 90% donde se encuentra la media. Estándar n1 X1 s1 n2 X2 s2 Paso 1.3 6. Establecimiento de hipótesis Ho :  VV   VN Ha :  VV   VN Paso 2.STAND.3 Vacas normales 50 105. Determinar la Ze de Excel o de tablas para una alfa de 0.INV (0.90) 280 .

3511 ) 281 .es decir ( 6. y por tanto no hay suficiente evidencia para rechazar Ho Se concluye que no hay diferencia entre vacas de vacaciones y normales Paso adicional. con sigmas desconocidas es:  X 1 X 2  2 s12 s 2  n1 n2 = Error estándar Z (alfa/2) = 6.90) se tiene P(Z>= + 1. El Intervalo de confianza del 90% sobre la diferencia de medias poblacionales.90 Ze (0.11061372 1.28) = 0.149402368 p > Alfa Como Zc es menor que Zexcel.75107 < = u < = 16. no cae en el área de rechazo.05106514 -3.Paso 4.3 + - 10.03099301 Valor p para Zc es igual a P(-Zc) = 0.64485363 ( X 1  X 2 )  Z  / 2 s X 1 X 2 = Intervalo de confianza La diferencia es del orden de cero. Comparando los valores Zc calculado contra Zexcel (0.28 Zc = 1.90)= 1.

Prueba de dos medias muestras pequeñas Sigmas desconocidas e iguales Sigmas desconocidas y desiguales 282 .

Establecimiento de hipótesis Ho :  T 1   T 2 Ha :  T 1   T 2 Por tanto se trata de una prueba de dos colas Paso 2. Cálculo del estadístico de prueba tc 2 2 s1 (n1  1)  s 2 (n 2  1) s  n1  n 2  2 2 p 19564.78743581 DIST.01 que corresponde a alfa/2 = 0.75684444 10.01) = 2. Estandar s1 34.57 tc  X1  X 2 s2 p n1  s3 p n2 0.01) Tienda 1 Tienda 2 Semanas n1 12 n2 15 Ventas promedio X1 125. Determinar la te de Excel o de tablas para una alfa de 0.5 s2 21. Comparando dos medias con t Investigar si hay diferencia en los promedios de las ventas diarias de dos tiendas 2 2 Las varianzas de las dos poblaciones son iguales pero desconocidas  1   2 Determinar el intervalo de confianza al 99% donde se encuentra la media (alfa = 0. 25) Asi es para dos colas 283 .Prueba de hipótesis de dos pob.2 = > tc = Sp2 = 782.8344589 Tomamos a X1 como el mayor para comparar tc contra te positiva Si se toma a X1 como la media menor se debe comparar Zc contra -Ze Paso 3.5 Paso 1.25 25 8.005 Se tienen n1 + n2 .2 Desv.T.01.2 grados de libertad o sean 25 te (0.INV (0.4 X2 117.

787*10.83) n1 n2 Se observa una diferencia positiva sin embargo el cero está incluido ( -21.38) 284 .787 ) = alfa/2 te(0.787 ) = alfa/2 P(t>=2.2. Comparando los valores tc calculado contra texcel (0. y por tanto no hay suficiente evidencia para rechazar Ho Se concluye que no hay diferencia sig.787 Valor p para tc es igual a P(tc) = 0. El Intervalo de confianza del 99% sobre la diferencia de medias poblacionales.Paso 4.01) se tiene P(t<=-2. con sigmas desconocidas es: s2 p n1  s2 p n2 s2 p  s2 p = Error estándar 10.7568 te(0.98 <= u <= 38.8344589 ( X 1  X 2 )  t / 2 = Intervalo de confianza (8.787 tc = 0. no cae en el área de rechazo.01.46025521 p > Alfa / 2 Como tc es menor que texcel.25) = -2.2 + . 25) = 2. En las ventas de las dos tiendas Paso adicional.01.

05. Estándar de difs. Establecimiento de Hipótesis Grados de libertad = No. Pares de muestras n = Diferencia media = Desv. Se calcula el estadístico tc: tc  Paso 3.T.6 0.05 24 = Se determina el valor crítico del estadístico t de Excel o tablas para t excel = 2. Comparando datos pareados con t Ho : 1   2 Las muestras pareadas de tamaño 25 reportaron una diferencia media de 45. de pares .06389855 DISTR.2 y una desviación estándar de las diferencias de 21.6. Paso 1. d sd n No. 24) Alfa / 2 0.2 21.462963 25 45.INV(0. = Alfa gl = 10.025 Excel divide entre 2 colas 285 . Pruebe la igualdad de medias a un nivel del 5%.Prueba de hipótesis de dos pob.1 Ha : 1   2 Paso 2.

para.2 0.063 Valor p para tc es igual a P(t > tc) = 0 p < Alfa / 2 Como tc es mayor que t excel.063 0.063 ) = alfa/2 P(t>=2.063 ) = alfa/2 te(0. El intervalo de confianza para las diferencias en medias pareadas es t alfa/2 = Error estándar = Dif. y por tanto si hay suficiente evidencia para rechazar Ho y aceptar Ha se concluye que si hay diferencia significativa entre las medias Paso 5. d  d  t / 2 sd n 45.4176 <= dm < =46. Comparando el estadístico tcalculado contra t excel (0.462963 P(t<=-2.24) = -2.025.864 45. 24) = 2.Paso 4.063 te(0.2 +- Se observa diferencia positiva significativa entre diferencia de medias 43.864 I .9824 286 .025. si cae en el área de rechazo.C. Promedio = 2.025. 24) se tiene: tc = 10.

. Cálculo del estadístico de prueba Zc Por tanto se trata de una prueba de cola derecha Zc  p1  p2 p1 (1  p1 ) p2 (1  p2 )  n1 n2 0.9 Ze (0... Probar la hipótesis a un 10% de nivel de significancia o error de equivocarse en rechazar Ho.150 0...04417119 = > Zc = 3.. Establecimiento de hipótesis 0.. Paso 2... Determinar la Ze de Excel o de tablas para 1-Alfa 0. Comparando dos proporciones con Z Investigar si tiene razon el analista sobre si los bonos convertibles se sobrevaloraron más que los bonos de ingresos...393046759 Tomamos a p1 como el mayor para comparar Zc contra Ze positiva (1.9) 287 ....1 0.9) = 1.INV (0.... forma.498 Fracción de las muestras Paso 1. Convertibles Ingresos Bonos n1 312 n2 205 Alfa Sobrevalorad X1 202 X2 102 1-Alfa 7... Ha :  1   2 ..STAND.8 p1 0..28155157 DIST..Ho :  1   2 Ha :  1   2  0....9 Ho :  1   2  0. ..647 p2 0.otra.Prueba de hipótesis de dos pob.Alfa) Paso 3.NORM....

223 288 .28 ) = Alfa Ze(0.644853627 0.044171193 1.39304676 P(Z>= + 1. si cae en el área de rechazo.281551566 Valor p para Zc es igual a P(-Zc) = 0. Comparando los valores Zc calculado contra Zexcel (0. entre los bonos es significativa Paso adicional. El Intervalo de confianza del 98% sobre la diferencia de medias poblacionales.077 <= PI <= 0.00034946 p < Alfa Como Zc es mayo que Zexcel.Paso 4.07265515 Se observa difererencia positiva entre proporciones el cero no está incluido en el intervalo ( 0.9) = 1. con sigmas desconocidas es: s p1 p 2  p1 (1  p1 ) p 2 (1  p 2 )  n1 n2 ( p1  p 2 )  Z  / 2 s p1 p 2 = Error estándar Zexcel (para alfa/2) = Intervalo de confianza ( 0.9) se tiene Zc = 3. y por tanto hay suficiente evidencia para rechazar Ho y aceptar Ha Se concluye que la diferencia en conv.150  0.

Robustez  Los procedimientos estadísticos se basan en supuestos acerca de su comportamiento teórico. 289 . Cuando los estadísticos obtenidos no son afectados por desviaciones moderadas de su expectativa teórica. se dice que son robustos.

Resumen 290 .

Indicar la columna de datos de la muestra 2 En Options: Indicar el Confidence Interval -.Instrucciones con Minitab para la comparación de dos varianzas Stat > Basic Statistics > 2-variances Seleccionar samples in different columns o Summarized data First-.Indicar la columna de datos de la muestra 1 Second. 95 o 99% OK 291 .90.

90. Greater than En graphs seleccionar las graficas Boxplot e Individual value plot OK 292 . Not equal.Indicar la columna de datos de la muestra 2 Seleccionar o no seleccionar Assume equal variances de acuerdo a los resultados de la prueba de igualdad de varianzas En Options: Indicar el Confidence Interval -. 95 o 99% Indicar la diferencia a probar Test Difference (normalmente 0) Indicar el signo de la hipótesis alterna: Less Than.Indicar la columna de datos de la muestra 1 Second.Instrucciones con Minitab para la comparación de dos medias Stat > Basic Statistics > 2-Sample t Seleccionar samples in different columns o Summarized data First-.

Indicar la columna de datos de la muestra 2 En Options: Indicar el Confidence Interval -. Greater than En graphs seleccionar las graficas Boxplot e Individual value plot OK 293 .90. Not equal. 95 o 99% Indicar la diferencia a probar Test Mean (normalmente 0) Indicar el signo de la hipótesis alterna: Less Than.Instrucciones con Minitab para la comparación de dos medias pareadas Stat > Basic Statistics > Paired t Seleccionar samples in columns o Summarized data First sample Indicar la columna de datos de la muestra 1 Second sample .

95 o 99% Indicar la Test Difference Normalmente 0 Indicar el signo de la hipótesis alterna: Less Than. Muestra y D1 éxitos encontrados Second: No. Muestra y D2 éxitos encontrados En Options: Indicar el Confidence Interval -. Greater than Seleccionar Use pooled estimate of p for test OK 294 .Instrucciones con Minitab para la prueba de hipótesis de dos proporciones Stat > Basic Statistics > 2-Proportions Seleccionar Summarized Data Trials: Events: First: No.90. de elementos de la 1ª. de elementos de la 2ª. Not equal.

7 Pruebas de bondad de ajuste 295 .VI.B.

puede concluirse que sí exite la forma de distribución planteada como hipótesis Por ejemplo: Ho: La distribución poblacional es uniforme Ha: La distribución poblacional no es uniforme Se usa el estadístico Chi-Cuadrado (Oi  Ei) 2   Ei i 1 K 2 Oi = Frecuencia de los eventos observados en los datos muestrales Ei = Frecuencia de los eventos esperados si la hipótesis nula es correcta Para que la prueba sea confiable Ei >= 5.Bondad de ajuste PRUEBAS DE BONDAD DE AJUSTE Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma de distribución particular planteada como hipótesis Si el ajuste es razonablemente cercano. K = Número de categorías o clases 296 . De otra forma se combinan las categorias para cumplir con este requisito.

17 es menor al de excel de 7. Si la demanda es uniforme se esperaría que se vendieran 12 botes / mes.76020818 El estadístico Chi cuadrado calculado de 1.INV 297 .Bondad de ajuste Ejemplo: Se venden n = 48 botes en 4 meses.1 grados de libetad = 3 Chi cuadrado de excel = 7.CHI.17 el valor P corresp.CHI Entonces el estadístico Chi Cuadrado de la muestra es = 1. La cantidad real que se vendió fue: Ventas (Oi) Ventas (Ei) Tipo de bote observadas esperadas A 15 12 B 11 12 C 10 12 D 12 12 DISTR.815 por tanto se acepta la hipótesis nula PRUEBA.815 0.= El Chi Cuadrado de excel se determina con alfa = 0.05 y K .

Multiplicar el tamaño de muestra con la prob. anotar la frecuencia observada fi y calcular la media de ocurrencias  3.Prueba de Bondad de ajuste para la distribución de Poisson 1. Si hay menos de 5 combinar las categorías 4. De Poisson Ha: Caso contrario 2. Calcular la frecuencia esperada de ocurrencias ei. Rechazar Ho si significancia 2  2    2 ( f i  ei ) 2  ei i 1 n o si p < alfa. de Poisson para cada valor de la variable aleatoria. Tomar una muestra aleatoria. Con gl=k-p-1 y alfa nivel de 298 . Plantear la hipótesis nula y alterna Ho: La población tiene una distribución de prob. Calcular el estadístico de prueba 5.

7776 17.1044 0.1404 0.4640 18.0653 0.0318 22.0067 0. de clientes que llega en intervalos de 5 min.Ejemplo: Distribución de Poisson =5 Ho: No.0704 299 .1462 0.1755 10.3584 4.0337 128*f(x) cantidad esperada 0.4640 5 6 7 8 9 10 o más 22 22 16 12 6 0.0842 0.9712 22.6464 4.3662 8.0363 0.3136 2 3 4 10 12 18 0. tiene una distribución de Poisson Ha: No se sigue una distribución de Poisson Clientes 0 1 Frec.8576 4. observada 2 8 f(x) de Poisson 0.7136 13.1755 0.

1755 0.3584 8.7168 0o1 2 3 4 5 6 7 8 9 o más 0.0653 0.0842 0.0337 0.1755 0.4640 18.1 y X=9.0318 300 .3662 8.1044 0.7776 17. 10 o más para que la frecuencia observada sea mayor a 5 y se pueda aplicar la distribución Chi Cuadrada se tiene Clientes Frec.4640 22.1712 10.0363+0.9712 22.1462 0. Observada (fi) 10 10 12 18 22 22 16 12 6 f(x) de Poisson 128*f(x) frecuencia esperada (ei) 5.7136 13.1404 0.0067+0.Ejemplo: Distribución de Poisson =5 Combinando X=0.

14 > 0. El valor de Chi Cuadrada calculado es de 10.05 con 2 gl.05 por tanto no se rechaza Ho y se concluye que los datos siguen una distribución de Poisson 301 .9766 y el valor Chi Cuadrada de alfa 0. Es de 14.07 no se rechaza Ho En este caso p = 0.Estadístico y conclusión Con los datos anteriores se calcula el estadístico Chi cuadrada que se compara con Chi Cuadrada de alfa para k-p-1 grados de libertad (K – categorías: 9. p – parámetros a estimar: 1 media). ( f i  ei ) 2   ei i 1 n 2 2 2 Ho se rechaza si     o si p es mayor que alfa.

en cada intervalo 302 . Definir K intervalos de valores de forma que la frecuencia esperada sea 5 cuando menos para cada uno (intervalos de igual probabilidad). Anotar la frecuencia observada de los valores de datos fi.Prueba de Bondad de ajuste para la distribución Normal 1. Tomar una muestra aleatoria. calcular la media  y la desviación estándar 3. Normal Ha: Caso contrario 2. Plantear la hipótesis nula y alterna Ho: La población tiene una distribución de prob.

5. Calcular el número de ocurrencias esperado ei. Rechazar Ho si     o si p < alfa. Calcular el estadístico de prueba  2 ( f i  ei ) 2  ei i 1 n 2 2 6. Con gl=k-p-1 y alfa nivel de significancia 303 . para cada intervalo de valores. Multiplicar el tamaño de muestra por la probabilidad de que una variable aleatoria esté en el intervalo.Prueba de Bondad de ajuste para la distribución Normal 4.

41 Calificaciones 71 60 55 82 85 65 77 66 86 63 79 80 62 54 61 70 56 76 56 90 64 65 70 62 68 61 69 74 54 73 76 53 61 76 65 93 73 54 58 64 79 65 61 79 56 84 63 80 56 71 304 .42. S = 10.Prueba de Bondad de ajuste para la distribución Normal  Ejemplo: datos de calificaciones: Media = 68.

84 y X = 59.68 y así sucesivamente 305 . Z = -0.41 Ha: Caso contrario Para una muestra de 50 con una frecuencia mínima esperada de 5 se tiene el 10% al menos por cada celda La primera celda correspondiente al 10% está en Z = -1.28 con X = (Media .10 Para el área del 20%.Z*S) = 55.Prueba de Bondad de ajuste para la distribución Normal Ho: la población tiene una distribución normal con media 68.42 y S=10.

83 a 77.42 68.82 a 68.10 55.83 73.74 81.68 59.74 o más Frecuencia observada (fi) 5 5 9 6 2 5 2 5 5 6 50 Frecuencia esperada (ei) 5 5 5 5 5 5 5 5 5 5 50 Se registran las frecuencias de los datos tomados de las calificaciones 306 .02 a 73.01 a 65.16 77.Prueba de Bondad de ajuste para la distribución Normal Intervalo Menos de 55.82 65.42 a 71.68 a 63.16 a 81.02 71.01 63.10 a 59.

Prueba de Bondad de ajuste para la distribución Normal  Se determina el estadístico Chi Cuadrado = 7. Gl = 7.2 ( f i  ei ) 2   ei i 1 n 2  El Valor de Chi Cuadrado de alfa = 0. Chi Cuadrado es 12. K = 10 categorías. p = 2 parámetros.017 2  2    no se puede rechazar la hipótesis nula de Como normalidad de las calificaciones  307 .10 para k – p – 1 grados de libertad.

en cada categoría multiplicando la probabilidad de la categoría por el tamaño de muestra 308 .Prueba de Bondad de ajuste para la distribución Multinomial 1. Suponiendo que Ho es cierta. Enunciar la hipótesis nula y alternativa Ho: La población sigue una distribución de probabilidad multinomial con probabilidades especificadas para cada una de las K categorías Ha: Caso contrario 2. determinar la frecuencia esperada ei. Tomar una muestra aleatoria y anotar las frecuencias observadas fi para cada categoría 3.

Regla de rechazo: Si 2  2   no se puede rechazar la hipótesis nula Rechazar si el valor p es menor a alfa Con alfa nivel de significancia y los grados de libertad son k-1 309 .Prueba de Bondad de ajuste para la distribución Multinomial 4. Se determina el estadístico Chi Cuadrado de prueba ( f i  ei ) 2   ei i 1 n 2 5.

98 para B y 54 para C. De acuerdo a las probabilidades esperadas. 50% para la empresa B y 20% para la empresa C.5=100. B=200*0. La empresa C hace una prueba con un nuevo producto para estimar su impacto en las preferencias del mercado.3=60. en los 200 clientes las preferencias esperadas son: A=200*0.Prueba de Bondad de ajuste para la distribución Multinomial Ejemplo: El año pasado la participación de mercado para la empresa A fue del 30%. Se tomó una muestra de 200 clientes resultando preferencias de compra de: 48 para A.2=40 310 . C=200*0.

5 0.Prueba de Bondad de ajuste para la distribución Multinomial Datos para calcular el estadístico de prueba Chi Cuadrado Categoría Proporción hipotética 0.2 Frecuencia observada 48 98 54 Frecuencia esperada 60 100 40 Empresa A Empresa B Empresa C 311 .3 0.

Prueba de Bondad de ajuste para la distribución Multinomial Chi Cuadrado calculado = 7. Como 7. El valor p correspondiente es de 0.025 es menor a alfa de 0.99 o el valor p de 0.05 con k – 1 = 2 grados de libertad = 2 es de 5.05 se rechaza la hipótesis nula Ho y se concluye que el nuevo producto modificará las preferencias del mercado actuales La participación de la empresa C aumenta con el nuevo producto 312 .34 es mayor a 5.99.025.34 Chi cuadrado de alfa = 0.

Prueba de Bondad de ajuste en Minitab La columna C1 – Observadas contiene las frecuencias observadas y la C2 – esperadas las frecuencias esperadas Calc > Calculator > Store result in variable ChiCuadrada Teclear en el cuadro de expresión sum((ObservadasEsperadas)**2/Esperadas) Calc > Probability distributions > Chi Square Seleccionar Cummulative probability Degrees of freedom 2 Input column ChiCuadrada. Optional Storage CumProb OK Calc > Calculator > Store results in variable p En el cuadro Expression teclear 1-CumProb OK 313 .

34 CumProb 0.974524 p 0.0254765 314 .Prueba de Bondad de ajuste en Minitab  Ejemplo: investigación de mercado Observadas Esperadas ChiCuadrada 48 98 54 60 100 40 7.

2) = 5. El valor P es =distr.99 4.05 se rechaza la Ho 315 .inv(0. Calcular el estadístico Chi Cuadrada con =(A2-B2)^2/B2 y Suma Chi cuadrada = 7.34 2. Como p es menor a alfa de 0.chi.34.chi(7.05. El estadístico Chi Cuadrada de alfa es: =prueba.Prueba de Bondad de ajuste en Excel  Ejemplo: investigación de mercado 1. 2) 3.

VI.B.6 ANOVA para un factor principal y una o más variables de bloqueo 316 .

Introducción  Cuando es necesario comparar 2 o más medias poblacionales al mismo tiempo. para lo cual se usa ANOVA. El método ANOVA tiene los siguientes supuestos:  La varianza es la misma para todos los tratamientos del factor en todos sus niveles  Las mediciones indiviudales dentro de cada tratamiento se distribuyen normalmente  El término de error tiene un efecto distribuido normalmente e independiente  317 .

Contenido  ANOVA de un factor o dirección ANOVA de un factor y una variable de bloqueo   ANOVA de un factor y dos variables de bloqueo – CUADRADO LATINO ANOVA de un factor y tres variables de bloqueo – CUADRADO GRECOLATINO  318 .

ANOVA de un factor o dirección 319 .

Introducción  Con el ANOVA las variaciones en la respuesta se dividen en componentes que reflejan los efectos de una o más variables independientes La variabilidad se representa como la suma de cuadrados total que es la suma de cuadrados de las desviaciones de mediciones individuales respecto a la gran media. se divide en:  Suma de cuadrados de las medias de los tratamientos  Suma de cuadrados del residuo o error experimental  320 .

ANOVA – Prueba de hipótesis para probar la igualdad de medias de varias poblaciones para un factor
Se trata de probar si el efecto de un factor o Tratamiento en la respuesta de un proceso o sistema es Significativo, al realizar experimentos variando Los niveles de ese factor (Temp. 1, Temp. 2, Temp.3, etc.)

Ho : 1  2  3  ......... a Ha : A lg unas. ' s.son.diferentes
321

ANOVA - Condiciones

Todas las poblaciones son normales Todas las poblaciones tiene la misma varianza

Los errores son independientes con distribución normal de media cero La varianza se mantiene constante para todos los niveles del factor
322

ANOVA – Ejemplo de datos
Niveles del Factor Peso % de algodón y Resistencia de tela

Peso porc. de algodón 15 20 25 30 35

Respuesta Resistencia de la tela 7 7 15 12 17 12 14 18 18 19 25 22 7 10 11

11 18 19 19 15

9 18 19 23 11
323

ANOVA – Suma de cuadrados total
Xij
Gran media Xij

SCT 

  ( Xij  X )
i 1 j 1

a

b

2

324

ANOVA – Suma de cuadrados de renglones (a)-tratamientos
Media Trat. 1

Media Trat. a

a renglones Gran media

Media trat. 2

SCTr   b( X i  X )
i 1

a

2

325

ANOVA – Suma de cuadrados del error
X1j

X2j

X3j

Media X1.
Media X2. Muestra 1 Muestra 2
a

Media X3. Muestra 3

SCE  
i 1

(X
j 1

b

ij

 X i)

2

326

ANOVA – Suma de cuadrados del error
X1j

X2j

X3j

Media X1.
Media X2. Muestra 1 Muestra 2

Media X3. Muestra 3

SCE  SCT  SCTr

327

ANOVA – Grados de libertad: Totales, Tratamientos, Error

gl.SCT  n  1 gl.SCTr  a  1 gl.SCE  (n  1)  (a  1)  n  a
328

ANOVA – Cuadrados medios: Total, Tratamiento y Error

MCT  SCT /(n  1) MCTr  SCTr /(a  1) MCE  SCE /(n  a)
329

ANOVA – Cálculo del estadístico Fc y Fexcel

MCTr Fc  MCE Fexcel  FINV ALFA, gl .SCTr , gl .SCE

330

Tabla final de ANOVA
TABLA DE ANOVA FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO CUADRADOS LIBERTAD MEDIO SCTR SCE SCT a-1 n-a n-1 CMTR CME CMT VALOR F

Entre muestras (tratam.) Dentro de muestras (error) Variación total

CMTR/CME

Regla: Rechazar Ho si la Fc de la muestra es mayor que la F de Excel para una cierta alfa o si el valor p correspondiente a la Fc es menor al valor de alfa especificado

331

ANOVA – Toma de decisión
Distribución F
Fexcel

Alfa

Zona de no rechazo de Ho O de no aceptar Ha
Fc

Zona de rechazo De Ho o aceptar Ha 332

ANOVA – Toma de decisión
Si Fc es mayor que Fexcel se rechaza Ho Aceptando Ha donde las medias son diferentes O si el valor de p correspondiente a Fc es menor de Alfa se rechaza Ho

333

n  a CME b Para diseños balanceado (mismo número de columnas en los tratamientos) el valor de q se determina por medio de la tabla en el libro de texto 334 . a .ANOVA – Identificar las medias diferentes por Prueba de Tukey T T  q .

Cada una de las diferencias Di se comparan con el valor de T. si lo exceden entonces la diferencia es Significativa de otra forma se considera que las medias Son iguales 335 .ANOVA – Identificar las medias diferentes por Prueba de Tukey T Se calcula la diferencia Di entre cada par de Medias Xi’s: D1 = X1 – X2 D2 = X1 – X3 D3 = X2 – X3 etc.

De columnas). Significativas si lo exceden 336 .1.ANOVA – Identificar las medias diferentes por Prueba de Diferencia Mínima Significativa DMS 2(CME ) F . se calcula un factor DMS contra el que se comparan las diferencias Xi – Xi’.n a DMS  b Para diseños balanceados (los tratamientos tienen igual no.

Prueba DMS para Diseños no balanceados 1 1 DMS j .a1. De columnas).na  b j bk    Para diseños no balanceados (los tratamientos tienen diferente no. se calcula un factor DMS Para cada una de las diferencias Xi – Xi’ 337 .k     (CME) F .

338 .Ejemplo:  Considerar un experimento de un factor (máquina) con tres niveles (máquinas A. Los datos se muestran a continuación y debe verificarse si existe diferencia significativa a un alfa = 0.05 Datos Máquinas Su ma Prom. C). B.

Ejemplo: La tabla completa de ANOVA es la siguientes: Fuentes De variación Máquinas Cuadrado medio Como el valor calculado de F(33. se rechaza la Hipótesis nula Ho 339 .2) excede el valor crítico de F.

Ejemplo:    Con Minitab: Stat>ANOVA>One way unstacked Responses (in separate columns) A B C Interpretar los resultados A 5 7 6 7 B 2 0 1 -2 C 1 0 -2 -3 6 2 0 340 .

60 2. C Source Factor Error Total DF 2 12 14 SS 137.20 24. B.600 -0.14% MS 68.000 Rechazo Ho S = 1.0 7.673 1.643 (----*-----) (-----*----) ---------+---------+---------+---------+ 0.19 P 0.69% R-Sq(adj) = 82.837 ---------+---------+---------+---------+ (-----*----) B C 5 5 0.00 R-Sq = 84.0 2.5 Pooled StDev = 1.800 1.200 StDev 0.438 Individual 95% CIs For Mean Based on Pooled StDev Level A N 5 Mean 6.5 5.438 341 .07 F 33.80 162.Ejemplo: One-way ANOVA: A.

06 7.03 14.19 7.42 1 1 1 1 10.94 14.Corrida en Minitab   Se introducen las respuestas en una columna C1 Se introducen los subíndices de los renglones en una columna C2 Durability Carpet 18.95 12.62 11.66 2 2 2 2 342 .

Corrida en Minitab   Opción: stat>ANOVA – One Way (usar archivo Exh_aov) En Response indicar la col. De Respuesta (Durability) En factors indicar la columna de subíndices (carpet) En comparisons (Tukey) Pedir gráfica de Box Plot of data y residuales Normal Plot y vs fits y orden Si los datos estan en columnas pedir ANOVA – One Way (unstacked) 343     .

3 Individual 95% CIs For Mean Based on Pooled StDev Level 1 2 3 4 4 4 N 4 Mean StDev ---------+---------+---------+------(-------*-------) (-------*--------) (--------*-------) (-------*-------) 14.0117 Critical value = 4.Results for: Exh_aov.6 12 37.808 3.0 20.101 Resultados 111.2 172.0 15.506 5.691 17.0 15 283.786 10.0500 Individual error rate = 0.005 ---------+---------+---------+------Pooled StDev = 3.20 344 .0 Tukey's pairwise comparisons Family error rate = 0.157 3.735 12.483 4 9.566 1.MTW One-way ANOVA: Durability versus Carpet Analysis of Variance for Durabili Source Carpet DF 3 Error Total SS MS F P 0.6 2.60 14.

ANOVA de dos vías un factor principal y una variable de bloqueo 345 .

B j  Ef . Ai  Ef .ANOVA de 2 vías  Este es un procedimiento extensión de los patrones del ANOVA de una vía con tres fuentes de variación: Tratamiento del factor A (columnas). Tratamiento del factor B (renglones) y Error experimental. X ijk   Ef . AxBij   kij 346 .

2.1. Temp.ANOVA – Prueba de hipótesis para probar la igualdad de medias de varias poblaciones con dos vías Se trata de probar si el efecto de un factor o Tratamiento en la respuesta de un proceso o sistema es Significativo.) POR RENGLON Y Considerando los niveles de otro factor que se piensa Que tiene influencia en la prueba – FACTOR DE BLOQUEO POR COLUMNA 347 . al realizar experimentos variando Los niveles de ese factor (Temp. etc.

diferentes Para el factor de bloqueo – en columnas Ho :  '1   '2   '3  .son....ANOVA – 2 vías Para el tratamiento – en renglones Ho : 1   2  3  ...........dif erentes 348 . ' s.  a  Ha : A lg unas.son.  'a  Ha : A lg unas.. ' s...

Ejemplo Maquinas Maq 1 Maq 2 Maq 3 Experiencia en años de los operadores 1 2 3 4 5 27 31 42 38 45 21 33 39 41 46 25 35 39 37 45 349 .ANOVA 2 vías .

SCBl   350 .ANOVA – Dos vías o direcciones  La SCT y SCTr (renlgones) se determina de la misma forma que para la ANOVA de una dirección o factor En forma adicional se determina la suma de cuadrados del factor de bloqueo (columnas) de forma similar a la de los renglones La SCE = SCT – SCTr .

SCBl  b  1 CMBl  SCBl /(b  1) 351 .ANOVA de 2 vías SCBl   a ( X j  X ) j 1 b 2 gl.

SCE  (n  a)(n  b) CME  SCBl /(n  a)(n  b) 352 .ANOVA de 2 vías SCE  SCT  SCTr  SCBl gl.

ANOVA –Estadístico Fc y Fexcel MCTr Fc  MCE Fexcel  FINV ALFA. gl . gl .SCE 353 .SCTr .

ANOVA – Estadístico Fb MCBl Fc  MCE Fexcel  FINV ALFA.SCBl . gl . gl .SCE 354 .

) Entre Bloques (Factor Bl) Dentro de muestras (error) Variación total CMTR/CME CMBL/CME Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa 355 .Tabla final ANOVA 2 vías FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO CUADRADOS LIBERTAD MEDIO SCTR SCBl SCE SCT a-1 b-1 (a-1)(b-1) n-1 CMTR CMBL CME CMT VALOR F Entre muestras (tratam.

ANOVA – 2 vías: Toma de decisión Distribución F Fexcel Alfa Zona de no rechazo de Ho O de no aceptar Ha Fc Tr o Bl Zona de rechazo De Ho o aceptar Ha 356 .

ANOVA – 2 vías: Toma de decisión Si Fc (Tr o Bl) es mayor que Fexcel se rechaza Ho Aceptando Ha donde las medias son diferentes O si el valor de p correspondiente a Fc (Tr o Bl) es menor de Alfa se rechaza Ho 357 .

ˆ eij  yij  yij ˆ s yi .  MSE b Y estimada Error o residuo Error estándar Factor de comparación Rk  r0..Cálculo de los residuales yij  yi . j  y. gl .  y.05. k . MSE * s yi . Si la diferencia de medias excede a Rk es significativa 358 .

Adecuación del modelo  Los residuales deben seguir una recta en la gráfica normal Deben mostrar patrones aleatorios en las gráficas de los residuos contra el orden de las Yij. contra los valores estimados y contra los valores reales Yij  359 .

Corrida en Minitab  Se introducen las respuestas en una columna C3 y los subíndices de renglones en columna C4 y de columnas en C5 Plantas 34 43 57 40 85 68 Suplemento 1 1 1 1 2 2 Lago Rose Rose Dennison Dennison Rose Rose 67 53 41 24 42 2 2 3 3 3 Dennison Dennison Rose Rose Dennison 52 3 Dennison 360 .

De Respuesta (Plantas) En Row factor y Column Factor indicar las columnas de subíndices de renglones y columnas (suplemento y lago) y Display Means para ambos casos Pedir gráfica residuales Normal Plot y vs fits y orden 361    .Corrida en Minitab  Opción: stat>ANOVA – Two Way (usar archivo Exh_aov) En Response indicar la col.

Lake Analysis of Variance for Zooplank Source Suppleme Lake Interaction Error Total DF 2 1 2 SS 1919 21 MS 959 21 F 9.0 60.25 0.71 104 3123 Individual 95% CI Suppleme 1 2 3 Mean --+---------+---------+---------+--------43.3 39.8 49.0 54.0 75.0 60.Two-way ANOVA: Zooplankton versus Supplement.21 2.0 362 .015 0.0 48.8 (-------*-------) (--------*-------) (--------*-------) P 0.0 45.5 68.0 Individual 95% CI Lake Dennison Rose Mean 51.145 Resultados 561 6 11 281 622 --+---------+---------+---------+--------30.2 ------+---------+---------+---------+----(----------------*----------------) (----------------*----------------) ------+---------+---------+---------+----42.666 0.

ANOVA de un factor y dos o tres variables de bloqueo CUADRADO LATINO Y GRECOLATINO 363 .

ANOVA – 3 y 4 factores  El diseño de Cuadrado latino utiliza dos factores de bloqueo adicionales al de Tratamiento EL diseño de Cuadrado Grecolatino utiliza tres factores adicionales al del Tratamiento El cálculo de suma de cuadrados para renglones y para columnas es similar al de ANOVA de un factor principal y otro de bloqueo   364 .

2 y 3 .Cuadrado Latino Años exp. B. Empleado 1 2 Mañana B=15 C=12 Turno Tarde A=18 B=20 C=19 Noche C=11 A=9 B=10 365 3 A=17 A. C = Máquinas 1.

D) SCTr   a ( X Tr  X ) j 1 b 2 gl.B.C.ANOVA – Cuadrado Latino: Factor principal (A.SCTr  a  1  b  1 CMTr  SCTr /(b  1) 366 .

SCE  (a  2)(a  1) CME  SCE /(a  2)(a  1) 367 .ANOVA – Cuadrado Latino: Cálculo del error SCE  SCT  SCTcol  SC Re ng  SCTr gl.

SCTr .ANOVA – Cálculo del estadístico Fc y Fexcel MCTr Fc  MCE Fexcel  FINV ALFA.SCE 368 . gl . gl .

gl .SCBl .ANOVA – Cuadrado Latino Reng / Col MC Re ng Fcreng  MCE MCCols Fcols  MCE Fexcel  FINVALFA. gl .SCE 369 .

Tabla final ANOVA 2 Factores FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO CUADRADOS LIBERTAD MEDIO SCRen SCCol SCTr SCE SCT a-1 b-1 a-1 (a-2)(a-1) n-1 CMRen CMCol CMTr CME CMT VALOR F Renglores Columnas Tratamiento Dentro de muestras (error) Variación total CMRen/CME CMCol/CME CMTr/CME 370 .

) correspondientes a cada respuesta en la columna C4 371    . D. etc.Cuadrado latino en Minitab  Se introducen las respuestas en una columna C1 Se introducen los subíndices de los renglones en una columna C2 Se introducen los subíndices de las columnas en una columna C3 Se introducen las letras mayúsculas que indican el nivel del factor (A. B. C.

D). De Respuesta.Cuadrado latino en Minitab  Opción: stat> ANOVA – General linear model En Response indicar la col. En Model indicar las columnas de los factores y En Random factors indicar los factores adicionales al del efecto principal a probar (A. C. B. Se pueden pedir interacciones entre factores x – y con Cx*Cy Pedir gráfica de residuales Normal y vs fits y orden 372     .

D y E son las 5 formulaciones a probar 373 . B. c y d son 5 diferentes tipos de montaje A. b.Cuadrado Greco Latino Experiencia de los operadores Lotes MP 1 2 3 4 5 1 Aa=-1 Bb=-8 Cc=-7 Dd=1 Ee=-3 2 Bc=-5 Cd=-1 De=13 Ea=6 Ab=5 3 Ce=-6 Da=5 Eb=1 Ac=1 Bd=-5 4 Db=-1 Ec=2 Ad=2 Be=-2 Ca=4 5 Ed=-1 Ae=11 Ba=-4 Cb=-3 Dc=6 a. C.

b. C. D.d.c.) correspondientes a cada respuesta en la columna C5 374    .Cuadrado Greco latino en Minitab   Se introducen las respuestas en una columna C1 Se introducen los subíndices de los renglones en una columna C2 Se introducen los subíndices de las columnas en una columna C3 Introducir los subíndices del factor adicional de letras griegas con letras latinas minúsculas (a. etc. B.e) en C4 Se introducen las letras mayúsculas que indican el nivel del factor (A.

También se pueden indicar interacciones entre factores x-y con Cx * Cy Pedir gráfica de residuales Normal y vs fits y orden     375 . B. D). C. En Model indicar las columnas de los factores y En Random factors indicar los factores adicionales al del efecto principal a probar (A. De Respuesta.Cuadrado Greco latino en Minitab  Opción: ANOVA – General linear model En Response indicar la col.

ANOVA – Cuadrado Grecolatino

SCG   a( X m  X )
m 1

b

2

gl.SCG  b  1 CMG  SCG /(b  1)
376

ANOVA de 2 factores – Suma de cuadrados, gl. y Cuadrado medio para el error
SCE  SCT  SCTr  SCG  SC Re n  SCCol gl.SCE  (a  3)(a  1) CME  SCE /(a  3)(a  1)

377

ANOVA – Cálculo del estadístico Fc y Fexcel

MCG Fc  MCE Fexcel  FINV ALFA, gl .SCTr , gl .SCE

378

ANOVA – Cuadrado Grecolatino

MCTr Fc  MCE Fexcel  FINV ALFA, gl .SCBl , gl .SCE

379

Tabla final ANOVA 2 Factores
FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO CUADRADOS LIBERTAD MEDIO SCRen SCCol SCG SCTr SCE SCT a-1 b-1 a-1 a-1 (a-3)(a-1) n-1 CMRen CMCol CMG CMTr CME CMT VALOR F

Renglores Columnas Letras griegas Tratamiento Dentro de muestras (error) Variación total

CMRen/CME

CMCol/CME CMG/CME CMTr/CME

380

ANOVA para diseño factorial AxB

En un experimento factorial involucrando el factor A con (a) niveles y un factor B con (b) niveles, la suma de cuadrados se puede dividir en:

SST = SS(A) + SS(B) + SS(AB) + SSE

381

VI.B.8 Tablas de contingencia

Prueba

2 (2) Chi

382

¿Para qué se utiliza? 1. Para probar si una serie de datos observada, concuerda con el modelo (serie esperada) de la información. 2. Para probar las diferencias entre las proporciones de varios grupos (tabla de contingencia).
Para todos los casos,

Ho: No hay diferencia
Ha: Hay diferencia

2 

383

Ejemplo 1: Chi Cuadrada(
Se lanza una moneda al aire 100 veces y que obtenemos 63 águilas y 37 soles.

2

)

¿La proporción de águilas y soles sucede por casualidad? O, se concluye que la moneda está “cargada”?

Ho: La moneda es buena Ha: La moneda “está cargada”
384

Ejemplo 1: Chi Cuadrada(
Observada
( fo )

2

)

Esperada
( fe )

(fo - fe)2 fe
3.38
3.38

Aguilas
Soles

63
37

50
50

 2 = 3.38 + 3.38  2 = 6.76

Estadístico Chi Cuadrada  2 c=
j=1

S

g

(fo - fe)2 fe

385

Ejemplo 1: Chi cuadrada
Función de Distribución Acumulada Chi2 con 1 grado de libertad (d.f) 2c P(2c > x) 6.7600 p = 1 - 0.9907 = 0.0093 De tablas X2Crítica, (0.05, 1) = 3.8414 Ho: La moneda es buena. Ha: La moneda está “cargada”. Para un 95% de confianza antes de concluir que la moneda “está cargada”, se requiere que X2c > X2Crítica o que el valor de p sea  0.05. Como p  0.05, se puede concluir -con un 95% de confianza que la moneda “está cargada”.

386

Cálculo en Excel del estadístico Chi cuadrada
1. Posicionarse en una celda vacía
2. Accesar el menú de funciones con Fx 3. Seleccionar STATISTICAL o ESTADÍSTICAS, CHIINV. 4. Dar valores de probabilidad (0.05) y grados de libertad, normalmente (n - 1) para un parámetro o (# de renglones -1) * (# de columnas - 1) para el caso de tablas de proporciones.

387

Tabla de Valores Críticos Seleccionados de Chi2
df 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 . 250 1. 323 2. 773 4. 108 5. 385 6. 626 7. 841 9. 037 10. 219 11. 389 12. 549 13. 701 14. 845 15. 984 17. 117 18. 245 19. 369 20. 489 21. 605 22. 718 23. 828 24. 935 26. 039 27. 141 28. 241 29. 339 30. 434 31. 528 32. 620 33. 711 34. 800 45. 616 56. 334 66. 981 77. 577 88. 130 98. 650 109 .14 1 . 100 2. 706 4. 605 6. 251 7. 779 9. 236 10. 645 12. 017 13. 362 14. 684 15. 987 17. 275 18. 549 19. 812 21. 064 22. 307 23. 542 24. 769 25. 989 27. 204 28. 412 29. 615 30. 813 32. 007 33. 196 34. 382 35. 563 36. 741 37. 916 39. 087 40. 256 51. 805 63. 167 74. 397 85. 527 96. 578 107 .56 5 118 .49 8 . 050 3. 841 5. 991 7. 815 9. 488 11. 070 12. 592 14. 067 15. 507 16. 919 18. 307 19. 675 21. 026 22. 362 23. 685 24. 996 26. 296 27. 587 28. 869 30. 144 31. 410 32. 671 33. 924 35. 172 36. 415 37. 652 38. 885 40. 113 41. 337 42. 557 43. 773 55. 758 67. 505 79. 082 90. 531 101 .87 9 113 .14 5 124 .34 2 . 025 5. 024 7. 378 9. 348 11. 143 12. 832 14. 449 16. 013 17. 535 19. 023 20. 483 21. 920 23. 337 24. 736 26. 119 27. 488 28. 845 30. 191 31. 526 32. 852 34. 170 35. 479 36. 781 38. 076 39. 364 40. 646 41. 923 43. 194 44. 461 45. 722 46. 979 59. 342 71. 420 83. 298 95. 023 106 .62 9 118 .13 6 129 .56 1 . 010 6. 635 9. 210 11. 345 13. 277 15. 086 16. 812 18. 475 20. 090 21. 666 23. 209 24. 725 26. 217 27. 688 29. 141 30. 578 32. 000 33. 409 34. 805 36. 191 37. 566 38. 932 40. 289 41. 638 42. 980 44. 314 45. 642 46. 963 48. 278 49. 588 50. 892 63. 691 76. 154 88. 379 100 .42 5 112 .32 9 124 .11 6 135 .80 7 . 005 7. 879 10. 597 12. 838 14. 860 16. 750 18. 548 20. 278 21. 955 23. 589 25. 188 26. 757 28. 300 29. 819 31. 319 32. 801 34. 267 35. 718 37. 156 38. 582 39. 997 41. 401 42. 796 44. 181 45. 558 46. 928 48. 290 49. 645 50. 993 52. 336 53. 672 66. 766 79. 490 91. 952 104 .21 5 116 .32 1 128 .29 9 140 .16 9 . 001 10. 828 13. 816 16. 266 18. 467 20. 515 22. 458 24. 322 26. 125 27. 877 29. 588 31. 264 32. 909 34. 528 36. 123 37. 697 39. 252 40. 790 43. 312 43. 820 45. 315 46. 797 48. 268 49. 728 51. 179 52. 620 54. 052 55. 476 56. 892 58. 302 59. 703 73. 402 86. 661 99. 607 112 .31 7 124 .83 9 137 .20 8 149 .44 9

388

Además se puede calcular el coeficiente de contingencia (correlación) que en todo caso muestra la fuerza de la dependencia   389 . La prueba Chi Cuadrada probará si hay dependencia entre las dos clasificaciones. se puede analizar para determinar si las dos variables (clasificaciones) son independientes o tienen una asociación significativa.Tabla de contingencia  Una tabla de clasificación de dos vías (filas y columnas) que contiene frecuencias originales.

Esta prueba es similar a la de bondad de ajuste.Tabla de contingencia  Para esta prueba se usa la prueba Chi Cuadrada donde:  Entre mayor sea su valor. mayor será la diferencia de la discrepancia entre frecuencias observadas y teóricas. 390 .

Tabla de contingencia  Ejemplo: Cada una de las 15 celdas hace una contribución al estadístico Chi Cuadrado (una celda)   Asumiendo Alfa = 0.09 Como Chi Cuadrada calculada >> Chi C. se rechaza Ho de igualdad de resultados entre negocios 391 .1 y Gl= (reng – 1)*(Col – 1) = 4*2 = 8 ChiCuadrado de alfa = 20. Alfa.

¿son las mismas proporciones?) Ho: No existen diferencias en los índices de defectos de las dos máquinas.6% 392 . Ha: Existen diferencias en los índices de defectos de las dos máquinas.Ejemplo 2: Chi2 Para comparación de dos grupos. Los valores observados (fo) son los siguientes: Partes buenas Partes defectuosas fo = 17 fo = 11 28 máquina 1 máquina 2 Total fo = 517 fo = 234 751 Total = 534 Total = 245 779 El índice de defectos totales es 28 / 779 = 3.

¿son las mismas proporciones?) Cálculo de los valores esperados Partes buenas máquina 1 máquina 2 fo = 751*534/779 fo = 751*245/779 Partes defectuosas fo = 28*534/779 fo = 28*245/779 Total = 534 Total = 245 779 Basados en este índice.53 máquina 1 máquina 2 393 . los valores esperados (fe) serían: Partes buenas 530.47 1.Ejemplo 2: Chi2 Para comparación de dos grupos.53 233.47 Partes defectuosas 3.

418 = 2.056 DF= 1.47 2 Total 232 233. no deberá usarse Chi2. Si cualquiera de los conteos esperados en las celdas es menor a uno.53 5 235 769 Chi2 = 0.624 + 0. las categorías pueden ser de utilidad. 394 .004 + 0.Prueba de chi cuadrada: Los conteos esperados están debajo de los conteos observados Partes buenas Partes Defectuosas Total 1 532 2 534 530.009 + 1. Si algunas celdas tienen un conteo menor a los esperados.152 2 celdas con conteos esperados menores a 5.0 Nota: Chi cuadrada no podrá aplicarse en los casos donde los conteos seas menores a 5 en  20% de celdas. ya sea combinando u omitiendo renglones y/o columnas.53 3. valor de p = 0.47 764 3 1.

819 31.535 19.119 27.790 43.989 27.987 17.587 28.841 9.143 12.757 28.991 7.909 34.566 .816 16.597 12.037 10.267 35.362 23.488 28.955 23.010 6.315 .666 23.023 20.191 37.841 5.278 21.025 .750 18.526 32.589 25.832 14.542 24.013 17.017 13.449 16.877 29.997  .879 10.412 .773 4.348 11.592 14.362 14.467 20.718 23.005 7.475 20.378 9.170 395 .697 39.605 22.805 36.852 34.919 18.409 34.000 33.307 19.245 19.718 37.845 30.067 15.070 12.488 11.588 31.026 22.701 14.684 15.626 7.024 7.515 22.820 45. 5.090 21.188 26.725 26.319 32.996 26.307 23.117 18.489 21.688 29.507 16.812 18.217 27.736 26.528 36.838 14.769 25.322 26.277 15.869 30.123 37.264 32.251 7.645 12.582 39.801 34.685 24.236 10.266 18.845 15.828 13.779 9.050 3.548 20.549 13.345 13.385 6.191 31.064 22.141 30.815 9.296 27.984 17.675 21.210 11.389 12.323 2.578 32.250 1.086 16.458 24.549 19.156 38.Tabla de Chi2 Tabla de valores críticos seleccionados para Chi2 DF 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 .204 28.920 23.252 40.275 18.828 .635 9.369 20.100 2.144 31.001 10.108 5.312 43.219 11.860 16.605 6.125 27.812 21.209 24.483 21.706 4.337 24.300 29.410 .

000 de ahorro en retrabajos.Problema: Fugas Beneficios Potenciales: $10. y en la reducción de tiempo de ciclo. Variación en familias a probar Operador a operador Ho: No existe diferencia en los índices de defecto de los diferentes operadores Ha: Existe diferencia en los índices de defecto de los diferentes operadores Máquina a máquina Ho: No existe diferencia en los índices de defecto de las diferentes máquinas Ha: Existe diferencia en los índices de defecto de las diferentes máquinas Tamaño de la muestra: 5000 + total de oportunidades (172 piezas) 396 .

34 5414 4452 3 256 4 352 Total 5700 Chi2 = 0. valor P = 0.Prueba de chi2 (máquina a máquina) Los conteos esperados están colocados debajo de los conteos observados Con fugas Sin fugas Total 1 30 610 640 32.84 18 17.604 + 0.000 = 8.734 DF= (4-1)(2-1) = 3.38 3 12.62 253 243.032 + 7.007 + 0.66 286 4217 4228.399 + 0.139 + 0.006 + 0.11 607.89 2 235 223.546 + 0.16 334 334.033 397 .

351 + 0.Prueba de chi2 (operador a operador) Los conteos esperados están colocados debajo de los conteos observados.39 3836 3827.065 + 1.260 + 0.847 + 27. valor P = 0.003 + 4.55 54 13.62 116 121.000 398 .61 278 127 121. Con gotera Sin gotera Total 1 6 122 128 6.765 + 0.057 + 0.45 202 242.77 699 667.475 + 4.61 121.39 5102 128 3 4036 4 256 5 704 6 128 Total 5380 Chi2 = 0.38 12 6.019 +125.61 200 208.386 + 0.666 + 6.239 = 171.23 5 36.132 DF= 5.39 2 1 6.

dependiendo del grupo de variación que se investiga. es similar para los grupos. probablemente. 399 .734 N 5700 Chi Cuadrada N CC 0. el coeficiente de contingencia puede ser una herramienta valiosa para determinar la prioridad sobre qué grupo debe investigarse primero. llevará a la misma ruta que hubiera alcanzado con sólo ver la estadística Chi2.15 x 100 Operador 171. Sin embargo.132 5380 3. Al dividir entre N.18 Controlador Mayor SI el tamaño de la muestra (N). operador a operador y máquina a máquina) Se utiliza un procedimiento denominado “Coeficiente de Contingencia” como clave para determinar qué grupo de variación debe investigarse primero. si N tiene una variación considerable.¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos? (en este caso. Coeficiente de Contingencia Chi2 Máquina 8.

61 699 667.77 256 5 5 36.61 121.23 202 242.62 116 121.39 704 6 128 (Estos mismos operadores fueron quienes tuvieron los números más grandes de chi2) 400 .39 hacer ahora? Encontremos cuál de los 2 1 127 128 operadores estaban fuera del 6. operador a operador y máquina a máquina) Ahora que la información nos ha llevado a investigar a los Con gotera Sin gotera Total grupos de operador a 1 6 122 128 operador.¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos? (en este caso. ¿Era alguno de ellos 3 200 3836 4036 notablemente peor (o mejor) 208. ¿Qué debemos 6.55 3827.38 12 6.39 estándar.61 121.45 que el resto? Mucho peor que lo esperado Mucho mejor que lo esperado 4 54 13.

Se añadió un colocador para ensamblar la parte en forma segura. El operador 5 encontró un modo de mejor de hacer el ensamble.Operador a operador: = 0. El operador 4 no tenía experiencia en este tipo de trabajo y apenas se estaba acostumbrado a soldar este producto en particular. (Esto también redujo el tiempo que requerían los operadores para “acostumbrarse” a trabajar en esta forma) 401 . con lo cual consiguió mejorar el trabajo de soldadura. aunque esto mostraba un grado de dificultad ergonómica.000 Rechace Ho y acepte Ha (Existe una diferencia significativa entre los operadores) Los operadores 4 y 5 están fuera del estándar: El operador 4 es notablemente peor que el resto. El operador 5 es notablemente mejor que los demás ¿Cuál es el próximo paso? Hable con todos los operadores para averiguar qué diferencias pueden existen en sus técnicas.

Ejercicios 1. Ha: al menos una es diferente Grados de libertad = (columnas . cada inspector fue expuesto a 30 maletas conteniendo radios mezcladas entre otras que nos los contenían. Se quiere evaluar la habilidad de tres inspectores de rayos X en un aeropuerto para detectar artículos clave.1) ( filas -1) 402 . existe una diferencia entre los inspectores? Ho: p1 = p2 = p3. Los resultados se resumen a continuación: Inspectores 1 2 3 Radios detectados Radios no detectados 27 3 25 5 22 8 ¿Con un 95% de confianza. Como prueba se pusieron radios de transistores en 90 maletas.

Los datos se resumen a continuación: Hora del día 1:00 3:00 44 37 28 50 8 13 Carril Izquierdo Central Derecho 5:00 18 72 30 ¿Con un 95% de confianza.Ejercicios 1. Ha: al menos una es diferente Grados de libertad = (columnas . Se quiere evaluar si hay preferencia por manejar en un carril de una autopista dependiendo de la hora del día.1) ( filas -1) 403 . existe una diferencia entre las preferencias de los automovilistas dependiendo de la hora? Ho: P1 = P2 = P3.

Coeficiente de Contingencia  Coeficiente de contingencia es el grado de relación o dependencia de las clasificaciones en la tabla de contingencias es: C2 X2 X2 N  Donde N es la frecuencia total y X es el estadístico Chi Cuadrado calculado 404 .

866 k 8 405 .22  393  El valor máximo de C se obtiene de: Max C  k 2 82   0.22 2 2  0.Coeficiente de Contingencia  Para los datos del ejemplo anterior se tiene: C2 X2 66.38 2 2 X N 66.

es : r  X N (k  1) 2 Donde 0<= r <= 1 406 .Correlación de atributos  Para tablas de orden k * k. r. el coeficiente de correlación.

B.VI.9 Pruebas de Hipótesis no paramétricas 407 .

tal como la Normal Las pruebas no paramétricas no asumen una distribución específica de la población Bajo los mismos tamaños de muestra la Potencia o probabilidad de rechazar Ho cuando es falsa es mayor en las pruebas paramétricas que en las no paramétricas Una ventaja de las pruebas no paramétricas es que los resultados de la prueba son más robustos contra violación de los supuestos    408 .Pruebas no paramétricas  Las pruebas paramétricas asumen una distribución para la población.

Prueba de Hipótesis Variable No Normal Varianza Homogeneidad de la Variación de Levene Atributo Tablas de Contingencia de Medianas Correlación Prueba de signos Wilcoxon MannWhitney KurskalWallis Prueba de Mood Friedman Correlación Normal Variancia Prueba-F Homogeneidad de la Variación de Bartlett Medias Pruebas de t Muestra-1 Muestra-2 ANOVA Una vía Dos vías Residuos distribuidos normalmente Correlación Regresión 409 .

Homogeneidad de la variancia de Bartlett: Compara dos o más varianzas muestras de la misma población. varianzas de muestras de la misma población.Resumen de pruebas de Hipótesis Datos Normales Datos No Normales Pruebas de Variancias Pruebas de Varianzas X2 : Compara la variancia de una Homogeneidad de la varianza de muestra con una variancia de un Levene : Compara dos o más universo conocido. Prueba F : Compara dos varianzas de muestras. 410 .

Prueba Kruskal-Wallis: Prueba si más de dos medianas de muestras son iguales. Regresión : Define la relación lineal entre una variable dependiente y una independiente. Prueba Mann-Whitney : Prueba si dos medianas de muestras son iguales.Resumen de pruebas de Hipótesis Datos Normales Pruebas de los Promedios Prueba t de 1 muestra : Prueba si el promedio de la muestra es igual a un promedio conocido o meta conocida. Prueba de la mediana de Mood : Otra prueba para más de dos medianas. 411 . ANOVA de dos factores : Prueba si los promedios de las muestras clasificadas bajo dos categorías. Prueba Friedman : Prueba si las medianas de las muestras. Correlación : Prueba la relación lineal entre dos variables. Prueba t de 2 muestras : Prueba si los dos promedios de las muestras son iguales. son iguales. Correlación : Prueba la relación lineal entre dos variables. clasificadas bajo dos categorías. ANOVA de un factor: Prueba si más de dos promedios de las muestras son iguales. Asume que todas las distribuciones tienen la misma forma. Prueba más firme para los valores atípicos contenidos en la información. (Aquí la "normalidad" se aplica al valor residual de la regresión) Datos No Normales Pruebas de la Mediana Prueba de signos o Prueba Wilcoxon : Prueba si la mediana de la muestra es igual a un valor conocido o a un valor a alcanzar. son iguales.

Cuadrado de todos los datos • Si la información es todavía anormal. Para la prueba de Bartlet el valor de p debe ser < 0. • Desarrollar una Prueba de normalidad (para verificar realmente lo anormal.Raíz cuadrada de todos los datos .Acciones a tomar con datos No Normales Revise y asegúrese de que los datos no siguen una distribución normal. Intentar transformar los datos. se mostrará algunas veces como anormal. Las transformaciones comunes incluyen: . Investiguar los valores atípicos. 412 . entonces usar las herramientas no paramétricas. etc.Logaritmo de todos los datos . • Una muestra pequeña (n < 30) proveniente de un universo normal.05) • Desarrollar una Prueba de Corridas (para verificar que no existen sucesos no aleatorios que puedan haber distorsionado la información) • Revisar la información para detectar errores (tipográficos.).

60 39. Mediana: Valor del punto medio de los datos. 37.7B8. 40. 38. Moda : Valor que se repite con más frecuencia sobre el conjunto de datos. 42. 25. Sus respuestas (en minutos) se muestran más adelante. 47. 35. cuando se ordenan en forma ascendente (en caso de datos pares. 47. en las mañanas. 45. dividida entre el número de datos de referencia. Ejemplo: Se cuestionó a veinte personas sobre cuánto tiempo les tomaba estar listas para ir a trabajar. 55. 45. ¿Cuáles son el promedio y la mediana para esta muestra? 30. 43   413 . Definiciones  Promedio : Es la media aritmética de la información. 35. Es la suma de todos los datos. 35. 35. obtener promedio). 30. 44.

0 42.0 Promedio = 40.Un dibujo dice más que mil palabras Mediana Promedio 28. 414 . asigna la misma importancia a todas las observaciones.0 C1 56.0 -------+---------+---------+---------+---------+---------+------ 49. La mediana. por otra parte. ya que es la que sencuentra en la posición media de los valores ordenados. cuando se calcula un promedio.5 El promedio puede estar influenciado considerablemente por los valores atípicos porque.0 63. se incluyen los valores reales de estos valores. independientemente de los valores reales de los valores atípicos.35 Mediana = 39.0 35.

sea igual al valor hipotético. Analogía con datos normales • Prueba de Corridas (la misma prueba para ambos tipos de información) • • Prueba de signos.Pruebas Alternativas comúnmente usadas Pruebas para datos No normales • Prueba de Corridas : Calcula la probabilidad de que un X número de puntos de referencia. Prueba Mann-Whitney : Comprueba el rango de dos muestras. Más robusta para los valores atípicos o para los errores en la información. por la diferencia entre dos medianas del universo. de 1 muestra : Prueba la probabilidad de que la mediana de la muestra. • Prueba t de una muestra • Prueba t de 2 muestras • • ANOVA de un factor 415 . esté por encima o por debajo del promedio aleatoriamente. Prueba de la Mediana de Mood : Prueba para más de dos medianas del universo.

201. 80. Número total de Rachas: 12 Número total de puntos > al promedio: 11 Número total de puntos < al promedio: 18 . 140. 240. 145.Prueba de Rachas Considere los siguientes datos (que se muestran aquí en orden cronológico): 325. 80. 320. 290. 80 Es importante tener los datos registrados en orden cronológico. 144. 101. Una representación gráfica de los datos se asemeja a esto: 600 500 Promedio Primera "corrida" 400 300 200 100 0 Segunda ”racha" Racha: Un punto o una serie consecutiva de puntos que caen en un lado del promedio. 150. 500. 56. 0. 50. 220. 110. 309. 72. 110. 99. 120. 507. 210. 400. 110. 180.

05 Promedio Este es el valor p de las Prueba de Corridas Ya que p > 0.2860 No se puede rechazar Ho con valor alfa = 0. no podemos rechazar la hipótesis nula.Prueba de Rachas Ho: Los datos son aleatorios Ha:Los datos NO so aleatorios Prueba de Rachas Promedio K = 184. . Los datos son aceptados.4483 Número de rachas observado = 12 Número de rachas esperado = 14. 18 por debajo La prueba es significativa en p= 0.6552 => No se rechaza Ho 11 observaciones por encima de K.05. siendo aleatorios.

1430 y para dos colas se tiene P(Z1) + P(Z2) = 0.655) / 2.MediaG) / DesvStG Con MediaG = 1 + (2n1*n2) / (n1 + n2) DesvStG = Raiz [ (2n1*n2) (2n1*n2 . entonces se consulta la tabla de valores críticos para el número de Rachas G 418 .n1 -n2) / (n1 + n2)^2* (n1+n2 -1) Del ejemplo anterior G = 12. n1 = 11 n2 = 18 MediaG = 14.Cálculos de la Prueba de Rachas El estadístico Z cuando n > 20 se calcula como: Z = (G .14.05.655 DesStG = 2.2860 > Alfa crítico de 0.4843 Z1 = (12 . no rechazándose Ho Si las n1 y n2 son menores a 21.4843 = -1.0687 P(Z1) = 0.

05 No rechazar Ho 419 .285 P > 0.448 The observed number of runs = 12 The expected number of runs = 14. 18 below P-value = 0.Corrida con Minitab  Stat > Nonparametrics > Runs Test Variable C1.6552 11 observations above K. Above and below the mean Runs Test: C1 Runs test for C1 Runs above and below K = 184.

No se puede probar que la mediana real y la mediana hipotética son diferentes.Prueba de Signos de la Mediana Ho : La mediana de la muestra es igual a la mediana de la hipótesis Ha : Las medianas son diferentes Ejemplo (usando los datos del ejemplo anterior): Ho: Valor de la mediana = 115. En las páginas siguientes se muestra el detalle del cálculo.05. no se puede rechazar la hipótesis nula. 420 .0 Ha: Valor de la mediana diferente de 115.0 N DEBAJO IGUAL ENCIMA VALOR P MEDIANA 29 12 0 17 0.4576 144.0 Ya que p >0.

21 22 23 24 25 26 27 28 29 Valor 220 240 290 309 320 325 400 500 507 Signo + + + + + + + + + Con la mediana en 144. Si el valor contra el cual se desea probar es 115. 421 . 1 2 3 4 5 6 7 8 9 10 Valor 0 50 56 72 80 80 80 99 101 110 Signo No. entonces hay 12 valores por debajo de el (-) y 17 valores por arriba (+).Cálculos de la Prueba de Signos de la Mediana Ejemplo: Con los datos del ejemplo anterior y ordenándo de menor a mayor se tiene: n = 29. 11 12 13 14 15 16 17 18 19 20 Valor 110 110 120 140 144 145 150 180 201 210 Signo + + + + + + + + No. Mediana de Ho = 115 No.

Cálculos de la Prueba de Signos de la Mediana El estadístico X es el el número de veces que ocurre el signo menos frecuente.2288 para la cola izquierda en forma similar P(Z2) 0-2288 para la cola derecha. en este caso el 12 (-). se calcula el estadístico Z para la prueba de signos con: Z = [ (Y + 0.05 del criterio de rechazo.5*n) ]/ 0.4576 >> 0.74278 y P(Z1) = 0. 422 . Si n hubiera sido < 25 entonces se hubiera consultado la tabla de valores críticos para la prueba de signo. por lo que la probabilidad total es 0.5  n En este caso Z1 = .0. Cómo n  25.5) .(0.

veamos una gráfica de la información 0 100 200 300 400 500 115 144 Después de todo. 423 .Prueba de Signos de la Mediana ¿Es esto correcto?¿144 podría ser igual a 115? Bueno. tal vez esto SEA lo correcto.

0 Como P > 0.Corrida en Minitab  Stat > Nonparametrics > 1-Sample sign Variable C1 Confidence interval 95% Test Median 115 Alternative Not equal Sign Test for Median: Signos Sign test of median = 115.0 N Below Equal Above P Median Signos 29 12 0 17 0.05 no se rechaza Ho y la mediana es 115 424 .0 versus not = 115.4583 144.

Prueba de Signos de la Mediana Para observaciones pareadas Calificaciones de amas de casa a dos limpiadores de ventanas: Ho: p = 0.5 Ama Casa Limpiador A B 1 2 3 4 5 10 7 8 5 7 7 5 7 2 6 ¿Hay evidencia que indique cierta preferencia de las amas de casa por lo limpiadores? 6 9 6 425 .5 no hay preferencia de A sobre B Ha: p<>0.

= 0.5*raiz(n) Zc = (Y – media) / Desv.5*n Desv. Estánd. Estand. Rechazar Ho si Zc ><Zalfa/2 ¿Hay evidencia que indique cierta preferencia por un Producto A o B? 4 5 6 7 0 - + 0 + + 8 9 10 11 + - + + + 426 .Prueba de Signos de la Mediana Producto Familia 1 2 3 A + B + + - Media = 0.

5) / 1.67 = 1.5 Desv.067 > 0.= 0. Estand.67 Para Zc = (8 – 5.5*raiz(n) = 1.Prueba de Signos de la Mediana Media = 0.025 No hay evidencia suficiente de que los Consumidores prefieran al producto B 427 .5*11 = 5.497 Zexcel = 1.025 Como Zc < Zexcel no se rechaza Ho o Como p value = 0.96 para alfa/2 = 0.

9 0.6 0.8 10.2 10.2 0.5 9.9 0.5 -3.5 5.6 0.5 9 T =428 44 Rango c/signo 8 -2 3.7 -0.4 0.3 9.5 -0.8 Abs(difere n.5 10 1 Eliminar 7 5.2 9.5 9 7 5.5 5.6 9.5 0.2 10.4 0.6 Método 2 9.4 0.5 10 1 Trabaja dor 1 2 3 4 5 6 7 8 9 10 11 .8 Diferen cias 0.9 10.7 0.7 10.1 0 0.5 3.5 0.2 9.1 10.3 10.) 0.8 8.Prueba rango con signo de Wilconox   Es la alternativa no paramétrica de la prueba paramétrica de muestras pareadas Ejemplo: HO: Las poblaciones son idénticas Ha: Caso contrario Método 1 10.2 0.6 10.6 10 11.1 0 0.2 10.8 Rango 8 2 3.4 0.6 9.5 0.5 10 10.

24 > Z0.Prueba rango con signo de Wilconox Distribución muestral T para poblaciones idénticas Se aproxima a la distribución normal para n >= 10 T 0 T  n(n  1)( 2n  1) 6 En este caso n = pares eliminando las que son iguales con dif.24 Z alfa/2 = Z0.96 Como Zc = 2. = 0 para el trabajador 8.025 = 1.025 se rechaza Ho.62 = 2.  = raiz(10 x 11 x 21/6) = 19.62 Z = (T – )/ = 44/19. los métodos son diferentes 429 .

889 >> alfa de 0.5 0.00 for Wilcoxon Estimated for Wilcoxon Estimated N Test Statistic P Median Achievement 9 8 19.889 77.05 no se rechaza Ho 85 74 75 62 80 70 83 430 .00 versus median not = 77.50 Ho: Mediana = 77 Ha: Mediana <> 77 Como P de 0.Prueba en Minitab para prueba de mediana con Wilconox   File> Open worksheet > Exh_Stat Stat > Nonparametrics > 1-Sample Wilconox Variables C1 Test Median 77 Altenative Not equal Achievement 77 88 Wilcoxon Signed Rank Test: Achievement Test of median = 77.

Prueba de Mann-Whitney Se llevó a cabo un estudio que analiza la frecuencia del pulso en dos grupos de personas de edades diferentes. Los datos resultantes se muestran a continuación. ¿Tuvieron diferencias significativas las frecuencias de pulso de ambos grupos? Edad 40-44 C1 140 135 150 140 144 154 160 144 136 148 Edad 16-20 C2 130 166 128 126 140 136 132 128 124 431 . después de diez minutos de ejercicios aeróbicos.

5) 144 (15) 148 (16) 150 (17) 154 (18) 160 n1 = 10 Ta = 130.5) 128 (5) 130 (6) 132 (8.5 432 .Prueba de Mann-Whitney  Ordenando los datos y asignándoles el (rango) de su posición relativa se tiene (promediando posiciones para el caso de que sean iguales): Edad 40-44 C1 (7) 135 (8.5 Edad 16-20 C2 (1) 124 (2) 126 (3.5) 136 (11)140 (15)166 n2 = 9 Tb = 55.5) 136 (11) 140 (11) 140 (13.5) 144 (13.5) 128 (3.

05.130.5 P(Ua) = 0.006 Ub = 90 + 45 .05 el valor de Uo = 25 Como Ua < 25 se rechaza la Hipótesis Ho de que las medianas son iguales.Prueba de Mann-Whitney Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales Ha: Las distribuciones de frecuencias relativas poblacionales no son idénticas Ho: 1 = 2 Ha: 1  2 1. Dado que p < 0. rechazamos la hipótesis nula. Para alfa = 0.Ta Ub = n1*n2 + (n2) * (n2 + 1) /2 .5 El menor de los dos es Ua.55.5 = 79. 433 . 2 = Medianas de las poblaciones Ordenando los datos y asignándoles su posición relativa se tiene: Ua = n1*n2 + (n1) * (n1 + 1) /2 .Tb Ua + Ub = n1 * n2 Ua = 90 + 55 .5 = 14. Estadísticamente existe una diferencia significativa entre los dos grupos de edad.

5 .5 Ub = 79.05.(n1* n2 / 2 ) / Raiz (n1 * n2 * (n1 + n2 + 1) / 12) Con Ua y Ub se tiene: Za = (14. rechazamos la hipótesis nula.05 El valor crítico de Z para alfa 0.0064 similar a la anterior Zb = (79.49 P(Z) = 0.025 por ser prueba de dos colas. Estadísticamente existe una diferencia significativa entre los dos grupos de edad.5 Utilizando el estadístico Z y la distribución normal se tiene: 45 12. es 1. 434 .5 -45) / 12.96.24 = . Como Za > Zcrítico se rechaza la Hipótesis Ho de que las medianas son iguales.45) / 12.Prueba de Mann-Whitney Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales Ha: Las distribuciones de frecuencias relativas poblacionales no son idénticas Ua = 14. Dado que p < 0.0128 menor  = 0.24 = 2.2.24 Z = [ (U .81 P(total) = 2 * 0.0064 = 0.

. denominada "punto estimado". Minitab usa este punto estimado para calcular el valor p.Prueba de Mann-Whitney 16-20 años de edad 140 135 150 140 144 154 160 144 136 148 130 10 5 20 10 14 24 30 14 6 18 166 -26 -31 -16 -26 -22 -12 -6 -22 -30 -18 128 12 7 22 12 16 26 32 16 8 20 126 14 9 24 14 18 28 34 18 10 22 140 0 -5 10 0 4 14 20 4 -4 8 136 4 -1 14 4 8 18 24 8 0 12 132 8 3 18 8 12 22 28 12 4 16 128 12 7 22 12 16 26 32 16 8 20 124 16 11 26 16 20 30 36 20 12 24 40-44 años de edad Diferencias entre los encabezados de los renglones y las columnas De esta manera. se calcula la mediana de todas estas diferencias. Este punto estimado es una aproximación de la diferencia entre las medianas de los dos grupos (ETA1 y ETA2). Una vez ajustados los "enlaces" (eventos de un mismo valor en ambos grupos de información).

0140 (adjusted for ties) 436 .Corrida en Minitab  Stat > Nonparametrics > Mann Whitney First Sample C1 Second Sample C2 Conf.20.5 Percent CI for ETA1-ETA2 is (4.00 Se rechaza Ho C2 9 130.5 Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0. Level 95% Alternative Not equal Mann-Whitney Test and CI: C1.00) W = 130.05 C1 10 144.00 95.00 Point estimate for ETA1-ETA2 is 12.0143 The test is significant at 0. C2 N Median P>0.01.

5 N = n1 + n2 + n3 = 25 437 .5 Zona 3 (24) 215 (8) 127 (2) 98 (15.5) 160 (14) 140 (21) 173 (4) 113 (1) 85 (7) 120 (25) 285 (5) 117 (11) 133 (6) 119 n2 = 10 Tb = 111.5) 127 (23) 184 (3) 109 (20) 169 n1 = 8 Ta = 118 n3 = 7 Tc = 95.5) 147 (17.5 (9) 128 (19) 162 (12) 135 (10) 132 (22) 181 (13) 138 Zona 2 (17.5) 17.Prueba de Kruskal Wallis Ordenando los datos de ventas y asignándoles el (rango) de su posición relativa se tiene (promediando posiciones para el caso de que sean iguales): Zona 1 (15.

l. = k .991 (válido siempre que las muestras tengan al menos 5 elementos) Como H < 2 crítico.Prueba de Kruskal Wallis Ho: Las poblaciones A.01846 * (1740. 1.05 y G. B y C son iguales Ha: Las poblaciones no son iguales Ho: 1 = 2 = 3 Ha: 1  2  3 .3 * ( N +1 ) H = 0. no se rechaza la Hipótesis Ho: Afirmando que no hay diferencia entre las poblaciones 438 . 3 = Medianas de las poblaciones Calculando el valor del estadístico H se tiene: H = [ 12 /( N* ( N + 1)) ] * [ Ta2 / n1 + Tb2 / n2 + Tc2 / n3 ] . 2.78 = 1.1 = 3-1 = 1 (k muestras) 2 crítico = 5.138 Se compara con el estadístico 2 para  = 0.225 + 1302.5 + 1243.893 ) .

7 0.10 Overall 24 12.98 Zona 2 10 126.3 -0.08 DF = 2 P = 0.09 DF = 2 P = 0.1 -0.05 H = 1.5 P > 0.581 (adjusted for ties) 439 .82 Zona 3 7 127.0 14.Corrida en Minitab  Stat > Nonparametrics > Kruskal Wallis Response C1 Factor C2 OK Kruskal-Wallis Test: Datos versus Factor Kruskal-Wallis Test on Datos Factor N Median Ave Rank Z Zona 1 7 138.581 No se rechaza Ho H = 1.0 12.5 11.

Prueba de Medianas de Mood  Realiza prueba de hipótesis de igualdad de medias en un diseño de una vía. anotar un signo positivo si la observación excede la mediana o un signo menos si es menor. La prueba es robusta contra Outliers y errores en datos y es adecuada para análisis preliminares Determina si K grupos independientes han sido extraidas de la misma población con medianas iguales o poblaciones con formas similares Con base en la gran mediana. Los valores que coincidan se reparten en los grupos Hacer una tabla de contingencia K x 2 con las frecuencias de signos más y menos en cada grupo K    440 .

Prueba de Medianas de Mood  Se determina el estadístico Chi Cuadrada con: (O  E )   E 2 2 Probar Ho: Todas las medianas son iguales Ha: Al menos una mediana es diferente Se compara Chi Cuadrada calculada con Chi Cuadrada de alfa para 0.05 y (reng – 1)*(Col – 1) grados de libertad 441 .

2-Prepa Ho: h1 = h2 = h3 iguales   Ha: no todas las medianas son File > Open Worksheet > Cartoon..Corrida con Minitab Se les da a 179 participantes una conferencia con dibujos para ilustrar el tema. Los participantes se clasificaron por nivel educativo 0-No prof..mtw Stat > Nonparametrics > Mood’s Median Test Response Otis Factor ED Ok 442 . Después se les da la prueba OTIS que mide la habilidad intelectual. 1-Prof.

0 443 .0 21.5 15 55 116.3 (-----*-----) (------*------) (----*----) 104.05 P = 0.0% CIs ED N<= N> Median Q3-Q1 ----+---------+---------+--------+-- 0 1 2 47 9 97.5 17.0005 Se rechaza Ho Individual 95.0 120.0 112.0 ----+---------+---------+---------+-Overall median = 107.Corrida con Minitab Mood Median Test: Otis versus ED Mood median test for Otis Chi-Square = 49.08 DF = 2 P>0.3 96.5 16.0 29 24 106.

La aditividad es requerida para para estimar los efectos de los tratamientos Ho: Los tratamientos no tienen un efecto significativo Ha: Algunos tratamientos tienen efecto significativo 444 .Diseños factoriales aleatorias bloqueados de Friedman Esta prueba es una alternativa al ANOVA de dos vías. es una generalización de las pruebas pareadas con signo.

 Si hay observaciones parecidas en uno o más bloques.Diseños factoriales aleatorias bloqueados de Friedman Resultados de salida:  Se muestra el estadístico de prueba con distribución Chi Cuadrada aproximada con gl = Tratamientos – 1. se usa el rango promedio y se muestra el estadístico corregido La mediana estimada es la gran mediana más el efecto del tratamiento 445  .

Response. Click OK. seleccionar Therapy. Stat > Nonparametrics > Friedman. En Blocks.Diseños factoriales aleatorias bloqueados de Friedman Ejemplo:  Se evalúa el efecto del tratamiento de una droga en la actividad enzimática con tres niveles. 446 .MTW. seleccionar Litter. seleccionar EnzymeActivity. En Treatment. probado en cuatro animales   Open the worksheet EXH_STAT.

Diseños factoriales aleatorias bloqueados de Friedman
Datos:
EnzymeActivity 0.15 Therapy 1 Litter 1

0.26
0.23 0.99

1
1 1

2
3 4

0.55
0.26 -0.22

2
2 2

1
2 3

0.99
0.55 0.66

2
3 3

4
1 2

0.77
0.99

3
3

3
4

447

Diseños factoriales aleatorias bloqueados de Friedman
Resultados:
Friedman Test: EnzymeActivity versus Therapy blocked by Litter
S = 2.38 DF = 2 P = 0.305 No rechazar Ho S = 3.80 DF = 2 P = 0.150 (adjusted for ties)

Sum
of Therapy N Est Median Ranks 1 2 3 4 4 4 0.2450 0.3117 6.5 7.0

0.5783 10.5

Grand median = 0.3783

448

Diseños factoriales aleatorias bloqueados de Friedman
Resultados:  El estadístico de prueba S tiene un valor P de 0.305 sin ajustar para observaciones en cero y 0.150 para el valor ajustado.

Por tanto no hay evidencia suficiente para rechazar Ho

Las medianas estimadas asociadas con los tratamientos son la gran mediana más los efectos estimados de los tratamientos.
El estadístico de prueba se determina con base a los rangos en cada bloque y totales

449

Diseños factoriales aleatorias bloqueados de Friedman
Resultados:

450

Diseños factoriales aleatorias bloqueados de Friedman
Resultados:

451

Diseños factoriales aleatorias bloqueados de Friedman
Resultados:

452

Prueba de igualdad de varianzas de Levene

Se usa para probar la hipótesis nula de que las varianzas de k múltiples poblacionales son iguales Las igualdad de varianzas en las muestras se denomina homogeneidad de varianzas La prueba de Levene es menos sensible que la prueba de Bartlett o la prueba F cuando se apartan de la normalidad La prueba de Bartlett tiene un mejor desempeño para la distribución normal o aproximadamente normal

453

Prueba de igualdad de varianzas de Levene
Para dos muestras el procedimiento es como sigue:

Determinar la media Calcular la desviación de cada observación respecto a la media Z es el cuadrado de las desviaciones respecto a la media Aplicar la prueba t a las dos medias de los datos

454

Rot

Temp 10 10 10

Oxygen 2 2 2

Prueba de igualdad de Varianzas-Minitab
Se estudian tamaños de papa inyectando con bacterias y sujetas a diferentes temperaturas. Antes del ANOVA se verifica la igualdad de varianzas

13 11 3

10
4 7 15 2 7 26

10
10 10 10 10 10 16

6
6 6 10 10 10 2

19

16
16 16 16 16 16 16

2
2 6 6 6 10 10

Stat > ANOVA > Test for equal variances Response Rot Factors Temp Oxigen Confidence level 95%

24 15 22 18 20 24

8

16

455

10

Resultados

456

Resultados
Test for Equal Variances: Rot versus Temp, Oxygen 95% Bonferroni confidence intervals for standard deviations

Temp Oxygen N
10 10 10 16 16 16

Lower

StDev

Upper

2 3 2.26029 5.29150 81.890 6 3 1.28146 3.00000 46.427 10 3 2.80104 6.55744 101.481 2 3 1.54013 3.60555 55.799 6 3 1.50012 3.51188 54.349 10 3 3.55677 8.32666 128.862

Bartlett's Test (normal distribution)
Test statistic = 2.71, p-value = 0.744 P>0.05 no rechazar Ho Levene's Test (any continuous distribution) Test statistic = 0.37, p-value = 0.858

457

Prueba de la concordancia del Coeficiente de Kendall

El coeficiente expresa el grado de asociación entre las calificaciones múltiples realizadas por un evaluador

Ho: Las variables son independientes Ha: Las variables están asociadas

Kendall usa la información relacionada con las calificaciones relativas y es sensible a la seriedad de mala clasificación

Por ejemplo para K = jueces N = Muestras = 10 Rango medio = 220 / 22 S = 1066 Gl = n-1 = 9 Chi Cuadrada crítica = X2 0.01,9 = 21.67

458

Prueba de la concordancia del Coeficiente de Kendall

El Estadístico Chi Cuadrada calculado es:

Como Chi Cuadrada de alfa es menor que la calculada, los cuatro jueces están asociados significativamente. Constituyen un panel uniforme. No quiere decir que estén en lo correcto, solo que responden de manera uniforme a los estímulos

459

el coeficiente es: 6(5.El coeficiente de correlación de rangos de Spearman (rs)  El coeficiente de correlación es una medida de la asociación que requiere que ambas variables sean medidas en al menos una escala ordinal de manera que las muestras u observaciones a ser analizadas pueden ser clasificadas en rangos en dos series ordenadas 2 Ho: Las variables son independientes Ha: Las variables están asociadas rs  1  6 d 3 N N  Para el ejemplo anterior si N = 10.5) rs  1   1  0.97 990 460 .03  0.

1 2 3 4 Preferencia 7 4 2 6 Precio (rango) 449.95 (4) Rango Di 6 -1 -1 2 Di cuadrada 36 1 1 4 5 6 7 8 1 3 8 5 580.50 (1) 525.95 (7) 469.Coeficiente de correlación de rangos para monotonía de preferencias Una persona interesada en adquirir un TV asigna rangos a modelos de cada uno de 8 fabricantes Fab.95 (2) 532.00 (8) 549.50 (6) -7 -4 49 16 6 -1 36 1 461 .95 (3) 499.00 (5) 479.

Coeficiente de correlación de rangos para monotonía de preferencias Ho: No existe asociación entre los rangos Ha: Existe asociación entre los rangos o es positiva o negativa El coeficiente de correlación de rangos de Spearman es: Rs = 1 – 6*suma(di cuadrada) / (n(n cuadrada – 1)) En este caso: Rs = 1 – 6(144)/(8*(64-1) = -0.686 Por tanto si hay asociación significativa en las preferencias 462 .714 R0 se determina de la tabla de Valores críticos del coeficiente de correlación del coeficiente de correlación de rangos de Spearman Rt = 0.

476 0.377 0.305 Alfa = 0.418 0.336 0.428 0.388 0.311 0.462 0.368 0.450 0.738 0.714 0.323 0.385 0.392 0.025 0.497 0.400 0.425 0.900 0.409 0.507 0.683 0.490 0.370 0.438 0.343 0.364 463 .829 0.600 0.412 0.523 0.317 0.786 0.329 0.05 0.Tabla de constantes n 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Alfa=0.525 0.643 0.329 0.351 0.475 0.886 0.564 0.623 0.566 0.591 0.648 0.377 0.545 0.359 0.457 0.441 0.

714 5 6 7 8 1 3 8 5 8 7 2 6 580 549 469 P-Value = 0.Corrida con Minitab Para la corrida en Minitab primero se deben determinar los rangos en forma manual para las variables X y Y. Precio Pearson correlation of Preferencia and Precio = -0.  Stat > Basic statistics > Correlation Variables Preferencia Precio Fabric Prefeante rencia Precio Preci o 1 2 3 4 7 4 2 6 1 5 3 4 449 525 479 499 Correlations: Preferencia.047 464 532 .

4 Proline 2.8 2.3 9.8 2.9 2.1 7.935 P-Value = 0.6 5 Correlations: Colageno.1 7.5 11.002 3 4 5 6 7 465 . Proline Pearson correlation of Colageno and Proline = 0.2 8.4 10.6 3.Ejemplo con Minitab Se estudia la relación entre colágeno y Proline en pacientes con cirrosis  Stat > Basic statistics > Correlation Variables Colágeno Proline Paciente 1 2 Colágeno 7.5 4.

Resumen de pruebas no paramétricas  Prueba de signos de 1 muestra: Prueba la igualdad de la mediana a un valor y determina el intervalo de confianza Prueba de Wilconox de 1 muestra: Prueba la igualdad de la mediana a un valor con rangos con signo y determina el intervalo de confianza Comparación de dos medianas poblacionales de Mann Whitney: Prueba la igualdad de las medianas y determina el intervalo de confianza   466 .

Resumen de pruebas no paramétricas  Comparación de igualdad de medianas poblacionales de Kruskal Wallis: Prueba la igualdad de las medianas en un diseño de una vía y determina el intervalo de confianza  Comparación de medianas poblacionales de Mood: Prueba la igualdad de medianas con un diseño de una vía 467 .

468 .

469 .

VI.C Análisis del Modo y Efecto de Falla (FMEA) 470 .

¿ Qué es el FMEA? El Análisis de del Modo y Efectos de Falla es un grupo sistematizado de actividades para:  Reconocer y evaluar fallas potenciales y sus efectos. Effects and Criticality Analysis 471 . Identificar acciones que reduzcan o eliminen las probabilidades de falla.   Documentar los procesos con los hallazgos del análisis. Procedure for Performing a Failure  Mode. Existe el estándar MIL-STD-1629.

Propósitos del FMEA  Mejorar la calidad. confiabilidad y seguridad de los productos y procesos evaluados Reducir el tiempo y costo de re-desarrollo del producto Documenta y da seguimiento a acciones tomadas para reducir el riesgo    Soporta el desarrollo de planes de control robustos 472 .

Propósitos del FMEA  Soporta el desarrollo de planes de verificación del desarrollo de diseño robusto Apoya a priorizar y enfocarse en eliminar/reducir problemas de proceso y producto y/o previene la ocurrencia de problemas Mejora la satisfacción del cliente/consumidor   473 .

subsistema y componente  AMEF de diseño (DFMEA) AMEF de Proceso (PFMEA) AMEF de maquinaria (como aplicación del DFMEA)   474 .Tipos del FMEA  AMEF de concepto (CFMEA)  A nivel de sistema.

 475 . Se usan antes de la liberación de productos o servicios. su propósito es analizar como afectan al sistema los modos de falla y minimizar los efectos de falla en el sistema. FMEA de Proceso (AMEFP). su propósito es analizar como afectan al proceso los modos de falla y minimizar los efectos de falla en el proceso. Se usan durante la planeación de calidad y como apoyo durante la producción o prestación del servicio. para corregir las deficiencias de diseño.Tipos de FMEAs  FMEA de Diseño (AMEFD).

PFMEA o AMEF de Proceso Fecha límite: Concepto Prototipo Pre-producción /Producción FMEAD FMEAP FMEAD Falla Característica de Diseño Forma en que el producto o servicio falla FMEAP Paso de Proceso Forma en que el proceso falla al producir el requerimiento que se pretende Controles de Proceso Controles Técnicas de Diseño de Verificación/Validación 476 .

Flujo del FMEA y su rol en evitar el Modo de Falla  DFMEA  Es un análisis detallado de los modos de falla potenciales relacionados con las funciones primarias y de interfases del sistema.  Es el documento primario para demostrar que se han evitado errores e identifica los controles y acciones para reducir los riesgos asociados 477 .

Beneficios de los tipos de FMEA FMEA de Diseño Soporta el proceso de diseño al reducir el riesgo de fallas (incluyendo las salidas no intencionadas) por:  Soporta la evaluación objetiva de diseño. servicio y reciclado   Incrementar la probabilidad de que los modos de falla potencial y sus efectos en el sistema y operación del producto se han considerado en el procesos de diseño/desarrollo 478 . incluyendo requerimientos funcionales y alternativas de diseño Evaluar los diseños iniciales sobre requerimientos de manufactura. ensamble.

desarrollo y validación Desarrollo de una lista priorizada de modos de falla potenciales de acuerdo a su efecto en el “cliente” estableciendo un sistema de prioridades para mejoras al diseño. prueba y análisis   Proporcionar un formato de problemas pendientes para recomendar y dar seguimiento de acciones que reduzcan el riesgo 479 . validación.Beneficios de los tipos de FMEA FMEA de Diseño  Proporcionar información adicional como apoyo en la planeación exhaustiva de programas de diseño eficiente. desarrollo.

Beneficios de los tipos de FMEA FMEA de Proceso Los beneficios de un FMEA de proceso incluyen:  Identifica las funciones y requerimientos del proceso  Identifica modos de falla potenciales relacionados con el producto y proceso Evalúa los efectos de las fallas potenciales con el cliente Identifica las causas potenciales en el proceso de manufactura Identifica las variables de proceso en las cuales hay que enfocarse para reducir las fallas muy lejanas    480 .

Beneficios de los tipos de FMEA FMEA de Proceso Los beneficios de un FMEA de proceso incluyen:  Identificar las variables del proceso centrandose en la ocurrencia  Reducción o detección de las condiciones de falla Identificar variables del proceso a las cuales enfocar el control Desarrollar una lista ordenada clasificada de modos de falla estandarizados para establecer un sistema de prioridades   481 .

Beneficios de los tipos de FMEA FMEA de Proceso  Sistema del prioridad del riesgo para consideraciones de acciones preventivas y correctivas Documentar los resultados del proceso de manufactura o proceso de ensamble   Documenta los resultados del proceso de manufactura o ensamble Identifica deficiencias del proceso para orientar a establecer controles para reducir la ocurrencia de productos no conformes o en métodos para mejorar su detección  482 .

Beneficios de los tipos de FMEA FMEA de Proceso  Identifica características críticas y/o significativas confirmadas Apoya en el desarrollo de Planes de Control a través de todo el proceso de manufactura Identifica aspectos de preocupación en relación con la seguridad del operador Retroalimenta información sobre cambios de diseño requeridos y factibilidad de manufactura a las áreas de diseño    483 .

Beneficios de los tipos de FMEA FMEA de Proceso  Se enfoca a modos de falla potenciales del producto causados por deficiencias de manufactura o ensamble Confirma la necesidad de controles especiales en manufactura y confirma las “Características Especiales” designadas en el DFMEA Identifica modos de falla del proceso que pudieran violar las reglamentaciones del gobierno o comprometer la seguridad del personal. identificando otras “Características especiales” – de Seguridad del operador (OS) y con alto impacto (HI)   484 .

Salidas del FMEA de Proceso  Una lista de modos potenciales de falla Una lista de Caracteríticas críticas y/o significativas Una lista de características relacionadas con la seguridad del operador y con alto impacto Una lista de controles especiales recomendados para las Características Especiales designadas y consideradas en el Plan de control    485 .

y mejorar la tasa de Detección de defectos si no se puede mejorar la capacidad del proceso Cambios recomendados a las hojas de proceso y dibujos de ensamble  486 .Salidas del FMEA de Proceso  Una lista de procesos o acciones de proceso para reducir la Severidad. eliminar las causas de los modos de falla del producto o reducir su tasa de ocurrencia.

formatos ilegibles) o cualquier otra razón que cause el modo de falla  487 . Mecanismos de falla son las razones simples o diversas que causas el modo de falla (métodos no claros. cansancio.Modos de fallas vs Mecanismos de falla  El modo de falla es el síntoma real de la falla (altos costos del servicio. tiempo de entrega excedido).

Definiciones Modo de Falla .La forma en que un producto o proceso puede fallar para cumplir con las especificaciones o requerimientos. falla o error. .Normalmente se asocia con un Defecto. Diseño Alcance insuficiente Recursos inadecuados Servicio no adecuado Proceso Omisiones Monto equivocado Tiempo de respuesta excesivo 488 .

.El impacto en el Cliente cuando el Modo de Falla no se previene ni corrige. . incompleto Servicio deficiente Operación errática Claridad insuficiente Causa .El cliente o el siguiente proceso puede ser afectado. Ejemplos: Diseño Proceso Serv.Una deficiencia que genera el Modo de Falla.Las causas son fuentes de Variabilidad asociada con variables de Entrada Claves Ejemplos: Diseño Material incorrecto Demasiado esfuerzo Proceso Error en servicio No cumple requerimientos 489 .Definiciones Efecto .

así como representantes de las áreas involucradas y otros expertos en la materia que sea conveniente. producto o proceso dirige el equipo.  490 .Preparación del AMEF  Se recomienda que sea un equipo multidisciplinario El responsable del sistema.

Después de completar la Solución de Problemas (con el fin de evitar la incidencia del problema).    491 . El AMEF de diseño. El AMEF de proceso. antes de que el diseño sea aprobado y entregado para su manufactura o servicio.¿Cuando iniciar un FMEA?   Al diseñar los sistemas. Al cambiar los diseños o procesos existentes o que serán usados en aplicaciones o ambientes nuevos. después de definir las funciones del producto. productos y procesos nuevos. cuando los documentos preliminares del producto y sus especificaciones están disponibles.

DFMEA 492 .FMEA de Diseño .

se han considerado y atendido  493 .AMEF de Diseño El DFMEA es una técnica analítica utilizada por el equipo de diseño para asegurar que los modos de falla potenciales y sus causas/mecanismos asociados.

y/o requerimientos de manufactura/ensamble/servicio.AMEF de Diseño  El proceso inicia con un listado de lo que se espera del diseño (intención) y que no hará el diseño Las necesidades y expectativas de los clientes de determinan de fuentes tales como el QFD. requerimientos de diseño del producto. 494   . Entre mejor se definan las características deseadas. será más fácil identificar Modos de de falla potenciales para toma de acciones correctivas / preventivas.

Equipo de trabajo  El equipo se divide en dos secciones: El equipo central (“core”) que participa en todas las fases del FMEA y el equipo de soporte que apoya conforme es requerido El apoyo de la alta dirección es crucial para el éxito   495 .

para asegurar que el equipo adecuado realice el análisis   496 .Alcance del DMEA  El alcance se establece en el Diagrama de límites (Boundary Diagram) por medio de consenso con el equipo de: ¿Qué se va incluir? ¿Qué se va a excluir? Establecer los límites adecuados antes de hacer el DFMEA evitará entrar en áreas que no se están revisando o creando.

¿está finalizado o es un punto de control? ¿Cuántos atributos o características están todavía bajo discusión o la necesidad debe determinarse? ¿Qué tan avanzado va el diseño o proceso para su terminación? Tendrá cambios    497 .Alcance del DMEA  Para determinar la amplitud del alcance. a lo mejor primero se deben aclarar y resolver asuntos pendientes antes del DMFEA. se deben hacer las decisiones siguientes: Determinar la estabilidad del diseño o desarrollo del proceso.

mejorar la imagen.Entradas al DFMEA Herramientas de robustez  Su propósito es reducir la probabilidad de campañas de calidad. para ser atendidos a tiempo haciendo al diseño insensible al ruido  498 . reducir reclamaciones de calidad e incrementar la satisfacción del cliente Se generan del diagrama P que identifica los cinco factores de ruido.

Modelo DFMEA – Paso 1 Funciones   Identificar todas las funciones en el alcance Identificar como cada una de las funciones puede fallar (Modos de falla) Identificar un grupo de efectos asociados para cada modo de falla Identificar el rango de severidad para cada uno de los grupos de efectos que prioriza los modos de falla Si es posible recomendar acciones para eliminar los modos de falla sin atender las “causas” Completar pasos 2 y 3     499 .

condiciones especiales. de ing. y:   Se escriben en forma de verbo/nombre/caract. incluye parámetros adicionales o parámetros de diseño como especificaciones de servicio. EMVSS)  500 . gr. localización y accesibilidad o requerimientos de estándares (v. medible La característica Medible o SDS: Puede ser verificada/validada. peso.Modelo DFMEA – Paso 1 Funciones  La función da respuesta a ¿Qué se supone que hace este artículo? Las funciones son intenciones del diseño o especs. tamaño.

necesidades y requerimientos tanto explícitos como no explícitos de los clientes y sistemas Las funciones no pueden “fallar” si no son medibles o especificadas  Ejemplos:  Almacenar fluido. X centímetros cúbicos por segundo  Abrir con X fuerza  Mantener la calidad del fluido durante X años bajo condiciones de operación 501 . X litros sin fugas  Controlar el flujo.Modelo DFMEA – Paso 1 Funciones  Las funciones representan las expectativas.

frío. polvo. Calor. etc)    502 .Modelo DFMEA – Paso 1 Modos de falla potenciales  Son las formas en las cuales un componente. pueden ser también las causas El Modo de falla en un sistema mayor puede ser el efecto de un componente de menor nivel Listar cada uno de los modos de falla potenciales asociados con el artículo en particular y con su función (revisar el historial de garantías y fallas o hacer tormenta de ideas También se deben considerar modos de falla potenciales que pudieran ocurrir sólo bajo ciertas condiciones (vg. humedad. subsistema o sistema pueden potencialmente no cumplir o proporcionar la función intencionada.

Modelo DFMEA – Paso 1 Tipos de Modos de falla potenciales   No funciona Funciona parcialmente / sobre función / degradación con el tiempo Función intermitente   A veces causado por los factores ambientales  Función no intencionada   Los limpiadores operan sin haber actuado el switch El coche va hacia atrás aún con la palanca en Drive 503 .

Preguntas para Modos Potenciales de falla  Modelo DFMEA – Paso 1 ¿De que manera puede fallar este artículo para realizar su función intencionada? ¿Qué puede salir mal (go wrong). como se debería reconocer su modo de falla? ¿Dónde y cómo operará el diseño?    504 . a pesar de que el artículo se fabrica de acuerdo al dibujo? ¿Cuándo se prueba la función.

presenta fugas 505 .Preguntas para Modos Potenciales de falla    Modelo DFMEA – Paso 1 ¿Bajo que condiciones ambientales operará? ¿El artículo será usado en ensambles de más alto nivel? ¿Cómo interactúa/interfase con otros niveles del diseño? No introducir modos de fallas triviales que no pueden o no ocurrirán Asumiendo la función:  Almacenar fluido. durante 10 años    Sus modos de falla son:  Almacenar < X. 0 fugas. X litros.

subsistemas o componentes conforme sean analizados La intención es analizar los efectos de falla al nivel de experiecia y conocimiento del equipo. o no cumplimiento de reglamentaciones Los efectos se establecen en términos de sisemas específicos. Qué puede notar o experimentar ya sea interno o final Establecer claramente si la función podría impactar a la seguridad.    506 .Modelo DFMEA – Paso 1 Efectos Potenciales de falla  Se definen como los efectos del modo de falla en la función percibida por el cliente.

Modelo DFMEA – Paso 1 Efectos Potenciales de falla  Describir las consecuencias de cada uno de los modos de falla identificados en:  Partes o componentes  Ensambles del siguiente nivel  Sistemas  Clientes  Reglamentaciones NOTA. Todos los estados de error del diagrama P deben ser incluidos en la columna de Modos de falla o efectos del DMFEA  507 .

Modelo DFMEA – Paso 1 Ejemplos de Efectos Potenciales de falla  Ruidos Operación errática – no operable Apariencia pobre – olores desagradables Operación inestable Operación intermitente Fugas Ruido de radiofrecuencia (EMC)       508 .

Habrá sólo una severidad para cada modo de falla Para reducir la severidad es necesario hacer un cambio de diseño La severidad se estima de la tabla siguiente   509 .Modelo DFMEA – Paso 1 Severidad  Es la evaluación asociada con el efecto más serio de la columna anterior.

Efecto de peligro potencial. Efecto menor en el desempeño del componente o servicio. El cliente se siente algo inconforme. Poco efecto en el desempeño del comp. Cliente algo molesto. Sistema afectado. Capaz de descontinuar el uso sin perder tiempo. Efecto moderado en el desempeño del componente o servicio. Efecto peligroso. Mayor seriamente Extremo Serio Peligro 10 510 . Criterio .falla repentina. Seguridad relacionada . Sistema inoperable. o servicio se ve afectado. pero es funcional y está a salvo. Cliente muy insatisfecho. El desempeño del servicio se ve afectado. Incumplimiento con reglamento del gobierno. 7 8 9 El cliente está insatisfecho. pero es operable y está a salvo. Falla parcial. Poco efecto en el desempeño del componente o servicio. o servicio. El desempeño del comp.Rangos de Severidad (AMEFD) Efecto No Muy poco Poco Menor Moderado Significativo Rango 1 2 3 4 5 6 Sin efecto Cliente no molesto. Servicio inadecuado. Se cumple con el reglamento del gobierno en materia de riesgo. dependiendo de la falla. pero a salvo. El cliente se siente un poco fastidiado. El cliente se siente algo insatisfecho. pero operable.

monitoreo y/o acciones de inspección o controles  511 . ensamble. embarque.Modelo DFMEA – Paso 1 Clasificación  Cuando un modo de falla tiene un rango de severidad de 9 o 10. se identifica como “YC” y se inicia un FMEA de proceso Estas características del producto afectan su función segura y/o cumplimiento de reglamentaciones gubernamentales y pueden requerir condiciones especiales de manufactura. existe una característica crítica. abastecimiento.

Geometría. Para valores menores también se pueden considerar acciones Para eliminar el modo de falla considerar la acción:  Cambiar el diseño (vg. material) si está relaionado a una característica del producto    512 .Modelo DFMEA – Paso 1 Acciones recomendadas  Eliminar el Modo de falla Mitigar el efecto Es necesario un énfasis especial en acciones posibles cuando la severidad es 9 o 10.

Modelo DFMEA – Paso 2 Identificar:  Las Causas asociadas (primer nivel y raíz)  Su tasa de ocurrencia estimada La designación de la característica adecuada (si existe) a ser indicada en la columna de clasificación   Acciones recomendadas para Severidad y Criticalidad alta (S x O) 513 .

cada causa de falla y/o mecanismo de falla para cada uno de los modos de falla.Model DFMEA – Paso 2 Causa potencial o mecanismo de falla  La causa potencial de falla se define como un indicador de debilidad del diseño cuya consecuencia es el modo de falla Listar como sea posible. El detalle de la descripción permitirá enfocar los esfuerzos para atacar la causa pertinente  514 .

Model DFMEA – Paso 2 Causa potencial o mecanismo de falla Se puede emplear un diagrama de Ishikawa o un Árbol de falla (FTA). preguntarse:  ¿Qué circunstancia pudo causar que fallara el artículo para su fúnción?  ¿Cómo podría fallar el artículo para cumplir con las especificaciones?  ¿Cómo pueden ser incompatibles artículos que interactúan?  ¿Qué información desarrollada en los diagramas P y Matriz de Interfase pueden identificar causas potenciales?  ¿Qué puede causar que el artículo no de la función intencionada?  ¿Qué información en el Diagrama de límites pudo haberse pasado que pueda causar este modo de falla?  ¿En que puede contribuir el historial de 8Ds y FMEAs a las causas potenciales? 515 .

ejemplos de causas de falla:  La especificación de Porosidad del material es muy alta  La dureza del material especificada es muy baja   El lubricante especificado es muy viscoso Torque especificado demasiado bajo Supuesto de confiabilidad inadecuada Degradación de parámetro del Componente Calor excesivo    516 .Model DFMEA – Paso 2 Causa potencial o mecanismo de falla Supuesto 1: El artículo se fabricó de acuerdo a especificaciones.

Model DFMEA – Paso 2 Causa potencial o mecanismo de falla Supuesto 2: El artículo puede incluir una deficiencia que causa variabilidad introducida en el proceso de ensamble o manufactura:  Especificar un diseño simétrico que permita que la parte se pueda instalar desde atrás o de arriba a abajo Torque incorrecto debido a que el hoyo está diseñado fuera de posición Cinturón equivocado debido a que el diseño es similar a otro que es estándar también en uso   517 .

pero toma en cuenta sus limitaciones  El objetivo es identificar las deficiencias del diseño que peuden causar variación inaceptable en el proceso de manufactura o ensamble a través de un equipo multidisciplinario Las causas de variación que no sean el resultado de directo de deficiencias de diseño pueden identificarse en el DFMEA y ser atendidas en el FMEA de Proceso Otro objetivo es identificar las características que mejoren la robustez del diseño que pueda compensar variaciones en proceso 518   .Modelo DFMEA – Paso 2 Causa potencial o mecanismo de falla Precauciones:  El DFMA no confía en los controles del proceso para subsanar debilidades del diseño.

Modelo DFMEA – Paso 2 Ocurrencia  Ocurrencia es la probabilidad de que una causa/mecanismo (listado en la columna previa) ocurra durante la vida del diseño El rango de ocurrencia tiene un significado relativo más que sea absoluto La prevención o control de las Causas / Mecanismos del modo de falla se realiza a través de cambios de diseño o cambios de diseño del proceso para reducir la ocurrencia   519 .

Modelo DFMEA – Paso 2 Estimación de la Ocurrencia   ¿Cuál es el historial de servicio y campo experimentado con artículos similares? ¿El artículo es similar al utilizado en niveles anteriores de subsistemas? ¿El componente es radicalmente diferente de los anteriores? ¿Ha cambiado la aplicación del componente? ¿Se han instalado controles preventivos en el proceso? ¿Cuáles son los cambios en el ambiente? ¿Se ha realizado un análisis análítico de la predicción de confiabilidad para estimar la tasa de ocurrencia?      520 .

5 Falla improbable.500. .5 Zlt > 1 Zlt < 1 Nota: El criterio se basa en la probabilidad de ocurrencia de la causa/mecanismo. Se puede basar en el desempeño de un diseño similar en una aplicación similar.000 Zlt > 4 4 5 6 7 8 9 10 1 en 4.000 1 en 150.Rangos de Ocurrencia (AMEFD) Ocurrencia Remota Criterios Rango Probabilidad de Falla 1 2 <1 en 1.5 Zlt > 2 Zlt > 1.5 Zlt > 3 Zlt > 2.000 Zlt > 5 Zlt > 4.500 1 en 800 1 en 150 1 en 50 1 en 15 1 en 6 >1 en 3 Zlt > 3. No existen fallas asociadas con este producto o con un producto / Servicio casi idéntico Sólo fallas aisladas asociadas con este producto / Servicio casi idéntico Fallas aisladas asociadas con productos / Servicios similares Este producto / Servicio ha tenido fallas ocasionales Este producto / Servicio ha fallado a menudo La falla es casi inevitable Muy Poca Poca Moderada Alta Muy alta 3 1 en 30.

entonces se tiene una caracterítica significativa crítica potencial que se identifica con “YS” y se inicia el FMEA de proceso Estas características del producto afectan la función del producto y/o son importantes para la satisfacción del cliente y pueden requerir condiciones especiales de manufactura.Clasificación  Cuando el Modo de falla/causa tien una severidad de 5 a 8 y una ocurrencia de 4 o mayor. monitoreo y/o inspección  522 . embarque. ensamble.

Detección y RPN 523 .  Cuando ya se hayan implementado las acciones recomenddas. se revisa el formato DFMEA en relación a la Severidad. Identificar  Controles actuales de prevención usados para establecer la ocurrencia  Controles actuales de detección (vg.  Acciones Recomendadas (Prevenciónn and Detección).Modelo DFMEA Paso 3 Si las causas no se pueden eliminar en paso 1 o 2. Ocurrencia. Pruebas) usadas para establecer la Detección  Determinar la efectividad de los controles de Detección en escala de 1 a 10  El RPN inicial (Risk Priority Number).

u otras actividades que aseguran la adecuación del diseño para el modo de falla y/o causa / mecanismo bajo consideración Controles actuales (vg. o la creación de muevos algoritmos de modelado. CAE. revisiones de factibilidad. etc.   524 . Diseños falla/seguro como válvulas de alivio. El equipo siempre debe enfocarse a mejorar los controles de diseño. Confianilidad y robustez analítica) son los que han sido o estan usándose con los mismos diseños o similares.Modelo DFMEA – Paso 3 Controles de diseño actuales  Listar las actividades terminadas para prevención. vaidación/verificación del diseño (DV). por ejemplo la creación de nuevos sistemas de prueba en el laboratorio.

Modelo DFMEA – Paso 3 Controles de diseño actuales  Hay dos tipos de controles de diseño: Prevención y detección De prevención:   Previenen la ocurrencia de la causa/mecanismo o Modo de falla/efecto reduciendo la tasa de Ocurrencia Detectan la causa/mecanismo o Modo de falla/efecto ya sea por métodos analíticos o físicos antes que el artículo se libere para Poducción  De detección:   Si solo se usa una columna indicarlos con P o D 525 .

Se debe tomar acción correctiva Identificar controles de diseño como sigue: 1. Identificar y listar los métodos que puedan ser utilizados para detectar el modo de falla. Acciones de 8Ds 526 . FMEA anteriores. como: 1. Una forma de detectarlo es con su Modo de falla resultante. Planes de DV anteriores. el producto con deficiencia de diseño pasará a Producción. Lista de verificáción de robustez.Modelo DFMEA – Paso 3 Controles de diseño actuales Identificación de controles de diseño  Si una causa potencial no fue analizada.

Listar todos los controles de diseño históricos que puedan ser suados para causas de primer nivel listadas. Identificar otros métodos posibles preguntando: ¿De que manera puede la causa de este modo de falla ser reconocida? ¿Cómo puedo descubrir que esta causa ha ocurrido? ¿De que manera este modo de falla puede ser reconocido? ¿Cómo puedo descubrir que este modo de falla ha ocurrido? 527 .Modelo DFMEA – Paso 3 Controles de diseño actuales 2. Revisar reportes históricos de pruebas 3.

Los controles intencionados para prevenir o reducir la Ocurrencia de una Causa o Modo de falla son considerados al estimar la tasa de Ocurrencia Si los controles de prevención no detectan deben ser calificadas con 10    Solo se deben considerar los métodos que son usados antes de la liberación a Producción para estimar la tasa de Detección Los programas de verificación de diseño deben basarse en la efectividad de los controles de diseño 528 . considerar solo los controles que serán usados para detectar los Modos de Falla o sus Causas.Modelo DFMEA – Paso 3 Detección  Cuando se estima una tasa de Detección.

Expansión térmica. corrosión)  Revisión de diseño subjetiva Métodos de desarrollo de pruebas:  Diseño de experimentos/ experimentos de peor caso (vg. Análisis de elementos finitos)  Estudios de tolerancias (vg.Modelo DFMEA – Paso 3 Detección Para evaluar la efectividad de cada control de diseño considerar las siguientes categorías (de mayor a menor):   Métodos de análisis de diseño  Modelado y simulación probada (vg. Tolerancias deométricas dimensionales)  Estudios de compatibilidad de materiales (vg. Ruido) 529 .

Decisión del tema) Al tener prototipos de ingeneiría Justo antes de liberarse a Producción 530 . no significativa estadísticamente    Oportunidad de la aplicación de control de diseño    Desde la etapa de diseño del concepto (vg.Modelo DFMEA – Paso 3 Detección  Métodos de desarrollo de pruebas (cont…): Pruebas en muestras de pre-producción o prototipo  Maquetas usando partes similares  Pruebas de durabilidad (verificación de diseño) Número de muestras a ser probadas  Muestra significativa estadísticamente  Cantidad pequeña.

pero antes de que ocurra la falla o error No detectable hasta que ocurra la falla o error en campo .Rangos de Detección (AMEFD) • Rango de Probabilidad de Detección basado en la efectividad del Sistema de Control Actual. basado en el cumplimiento oportuno con el Plazo Fijado 1 2-3 4-5 6-7 8 9 10 Detectado antes del prototipo o prueba piloto Detectado antes de entregar el diseño Detectado antes del lanzamiento del servicio Detectado antes de la prestación del servicio Detectado antes de prestar el servicio Detectado en campo.

Ocurrencia (O) y Detección (D)  RPN = (S) x (O) x (D) con valores entre 1 y 1000 Puede usarse como en un Pareto para priorizar riesgos potenciales con efectos que tengan las tasas más altas de severidad Atender los aspectos con Severidad 9 o 10 y después los efectos con Severidad alta.DFMEA – Cálculo del riesgo  El número de prioridad del rieso (RPN) es el producto de Severidad (S). los de criticalidad alta (S x O) y al final los que tienen RPNs más altos   532 .

Para reducir la severidad es necesario un cambio de diseño 533 .DFMEA – Acciones recomendadas Considerar acciones como las siguientes:  Revisión del diseño de la Geometría y/o tolerancias  Revisión de especificación de materiales  Diseños de experimentos (con múltiples causas interactuando) u otras técnicas de solución de problemas  Revisión de planes de prueba  Sistemas redundantes – dispositivos de aviso – estados de falla (ON y OFF) El objetivo primario de las acciones recomendadas es reducir riesgos e incrementar la satisfacción del cliente al mejorar el diseño.

DFMEA – Acciones tomadas  Se identifica la organización y persona responsable para las acciones recomendadas y la fecha de terminación Dar seguimiento:  Desarrollar una lista de características especiales parasu consideración en el DFMEA  Dar seguimiento a todas las acciones recomendadas y actualizar las acciones del DFMEA Después de que se implementa una acción. anotar una descripción breve y la fecha de efectividad   534 .

registrar la nueva Severidad. Ocurrencia y Detección Calcular el nuevo RPN Si no se tomaron acciones en algunos aspectos.DFMEA – Nivel de riesgo RPN  Después de haber implementado las acciones preventivas/correctivas. dejarlos en blanco   535 .

esta lista es una entrada al DVP Debe ser un documento clave a revisar como parte del proceso de revisión de diseño   536 ..DFMEA – Lista de verificación de robustez  Es una salida del proceso integrado de robustez:  Resume los atributos de robustez clave y controles de diseño Enlaza el DFMEA y los 5 factores de ruido del diseño al Plan de verificación de diseño (DVP). vg.

FMEA de Proceso .PFMEA 537 .

responsable de la actividad.PFMEA  Equipo  Se inicia por el Ing. en conjunto con un equipo de personas expertas además de incluir personas de apoyo  Alcance  Define que es incluido y que es excluido 538 .

Entradas al PFMEA  Diagrama de flujo del proceso  El equipo debe desarrollar el flujo del proceso. preguntando ¿Qué se supone que hace el proceso?. ¿Cuál es su propósito?. ¿Cuál es su función?  El Diagrama P es una entrada opcional al PFMEA 539 .

) de FMEA ______(rev.ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso Componente ______________________ Ensamble ________________ Equipo de Trabajo ___________ Responsable del Diseño ____________ AMEF Número _________________ Preparó _______________ Pagina _______de _______ FECHA (orig. Causa(s) Potencial(es) o Mecanismos de falla O c c u r Controles de Diseño o Proceso Actuales D e R Acción t P Sugerida e N c Responsable y fecha límite de Terminación Acción Adoptada S O D R e c e P v c t N 540 .) ______ Resultados de Acción Función del Producto/ Paso del proceso Efecto (s) Modos de Falla Potencial (es) Potenciales de falla S e v .

tomar acciones para eliminar modos de falla sin atender las “causas”     541 .Modelo del PFMEA – Paso 1  Identificar todos los requerimientos funcionales dentro del alcance Identificar los modos de falla correspondientes Identificar un conjunto de efectos asociados para cada modo de falla Identificar la calificación de severidad para cada conjunto de efectos que de prioridad el modo de falla De ser posible.

20: Hacer perforación de tamaño X de cierta profundidad Operación No. 22: Realizar el subensamble X al ensamble Y 542 .Modelo de PFMEA – Paso 1  Requerimientos de la función del proceso  Contiene características de ambos el producto y el proceso  Ejemplos   Operación No.

) de AMEF ______(rev.) ______ Resultados de Acción S Función Efecto (s) e de Modos de Falla Potencial (es) v Componente/Paso Potenciales de falla .ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso Componente ______________________ Ensamble ________________ Equipo de Trabajo ___________ Responsable del Diseño ____________ AMEF Número _________________ Preparó _______________ Pagina _______de _______ FECHA (orig. de proceso Factura correcta O D Causa(s) Controles del c e R Potencial(es) Diseño / Acción c t P de los Mecanismos Proceso Sugerida u e N de falla Actual r c Responsable y fecha límite de Terminación Acción Adoptada S O D R e c e P v c t N Relacione las funciones del diseño del componente Pasos del proceso Del diagrama de flujo .

Modelo de PFMEA – Paso 1   Modos de falla potenciales  No funciona  Funcionamiento parcial / Sobre función / Degradación en el tiempo  Funcionamiento intermitente  Función no intencionada Los modos de falla se pueden categorizar como sigue:  Manufactura: Dimensional fuera de tolerancia  Ensamble: Falta de componentes  Recibo de materiales: Aceptar partes no conformes  Inspección/Prueba: Aceptar partes equivocadas 544 .

) de AMEF ______(rev.ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso Componente ______________________ Ensamble ________________ Equipo de Trabajo ___________ Responsable del Diseño ____________ AMEF Número _________________ Preparó _______________ Pagina _______de _______ FECHA (orig.) ______ Resultados de Acción Función del componente/ Paso del proceso Factura correcta O Causa(s) Controles de Efecto (s) D c Modos de Falla Potencial(es) Diseño / Potencial (es) i c Potenciales de los Mecanismos Proceso de falla v u de falla Actuales r D e R Acción t P Sugerida e N c Responsable y fecha límite de Terminación Acción Adoptada S O D R e c e P v c t N Datos incorrectos Identificar modos de falla Tipo 1 inherentes al diseño .

Modelo de PFMEA – Paso 1  Efectos de las fallas potenciales (consecuencias en)        Seguridad del operador Siguiente usuario Usuarios siguientes Máquinas / equipos Operación del producto final Cliente último Cumplimiento de reglamentaciones gubernamentales 546 .

Modelo de PFMEA .Paso 1  Efectos de las fallas potenciales (en usuario final)          Ruido Operación errática Inoperable Inestable Apariencia mala Fugas Excesivo esfuerzo Retrabajos / reparaciones Insatisfacción del cliente 547 .

Modelo de PFMEA –Paso 1  Efectos de las fallas potenciales (en siguiente operación)         No se puede sujetar No se puede tapar No se puede montar Pone en riesgo al operador No se ajusta No conecta Daña al equipo Causa excesivo desgaste de herramentales 548 .

) ______ Resultados de Acción Función Efecto (s) del componente Modos de Falla Potencial (es) / Paso del Potenciales de falla proceso Factura correcta Datos incorrectos LOCAL: Rehacer la factura D i v Causa(s) Potencial(es) oMecanismos de falla O c c u r Controles de Diseño / Proceso Actuales D e R Acción t P Sugerida e N c Responsable y fecha límite de Terminación Acción Adoptada S O D R e c e P v c t N MAXIMO PROXIMO Contabilidad equivocada CON CLIENTE Molestia Insatisfacción Describir los efectos de modo de falla en: LOCAL El mayor subsecuente Y Usuario final CTQs del QFD o Matriz de Causa Efecto .) de AMEF ______(rev.ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño Componente ______________________ Ensamble ________________ Equipo de Trabajo ___________ Responsable del Diseño ____________ AMEF Número _________________ Preparó _______________ Pagina _______de _______ FECHA (orig.

en la estación Ligero inconveniente para la operación u operador. acabado o presenta ruidos. pero un item de confort/conveniencia son operables a niveles de desempeño bajos No se cumple con el ajuste. sin aviso Calificación de severidad muy alta cuando un modo potencial de falla afecta la operación segura del producto y/o involucra un no cumplimiento con alguna regulación gubernamental. pero un item de confort/conveniencia es inoperable.CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA AMEFP Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura / ensamble. sin desecho. use la mayor de las dos severidades Efecto Peligroso sin aviso Peligroso con aviso Muy alto Efecto en el cliente Calificación de severidad muy alta cuando un modo potencial de falla afecta la operación segura del producto y/o involucra un no cumplimiento con alguna regulación gubernamental. Defecto notado por el 75% de los clientes No se cumple con el ajuste. acabado o presenta ruidos y rechinidos. y una parte retrabajada El producto puede tener que ser retrabajada. con aviso El producto / item es inoperable ( pérdida de la función primaria) Efecto en Manufactura /Ensamble Puede exponer al peligro al operador (máquina o ensamble) sin aviso Puede exponer al peligro al operador (máquina o ensamble) sin aviso El 100% del producto puede tener que ser desechado op reparado con un tiempo o costo infinitamente mayor Calif. 10 9 8 Alto El producto / item es operable pero con un reducido nivel de desempeño. sin desecho en la línea. en línea. Defecto notado por el 50% de los clientes No se cumple con el ajuste. o sin efecto 7 6 5 4 3 2 1 Modera do Bajo Muy bajo Menor Muy menor Ninguno . acabado o presenta ruidos y rechinidos. El producto puede tener que ser seleccionado. sin desecho. Defecto notado por clientes muy críticos (menos del 25%) Sin efecto perceptible El producto tiene que ser seleccionado y un parte desechada o reparada en un tiempo y costo muy alto Una parte del producto puede tener que ser desechado sin selección o reparado con un tiempo y costo alto El 100% del producto puede tener que ser retrabajado o reparado fuera de línea pero no necesariamente va al àrea de retrabajo . El cliente final debe ser siempre considerado primero. pero fuera de la estación El producto puede tener que ser retrabajado. Si ocurren ambos. Cliente muy insatisfecho Producto / item operable. Cliente insatisfecho Producto / item operable. y rechinidos.

con aviso El producto / item es inoperable ( pérdida de la función primaria) Efecto en Manufactura /Ensamble Puede exponer al peligro al operador (máquina o ensamble) sin aviso Puede exponer al peligro al operador (máquina o ensamble) sin aviso El 100% del producto puede tener que ser desechado op reparado con un tiempo o costo infinitamente mayor Calif. en la estación Ligero inconveniente para la operación u operador. sin desecho. pero fuera de la estación El producto puede tener que ser retrabajado. Cliente muy insatisfecho Producto / item operable. o sin efecto 7 6 5 4 3 2 1 Modera do Bajo Muy bajo Menor Muy menor Ninguno . El cliente final debe ser siempre considerado primero. Si ocurren ambos. Defecto notado por clientes muy críticos (menos del 25%) Sin efecto perceptible El producto tiene que ser seleccionado y un parte desechada o reparada en un tiempo y costo muy alto Una parte del producto puede tener que ser desechado sin selección o reparado con un tiempo y costo alto El 100% del producto puede tener que ser retrabajado o reparado fuera de línea pero no necesariamente va al àrea de retrabajo . El producto puede tener que ser seleccionado. sin desecho. pero un item de confort/conveniencia son operables a niveles de desempeño bajos No se cumple con el ajuste. Defecto notado por el 50% de los clientes No se cumple con el ajuste. y una parte retrabajada El producto puede tener que ser retrabajada. en línea. acabado o presenta ruidos y rechinidos. acabado o presenta ruidos. acabado o presenta ruidos y rechinidos. y rechinidos. 10 9 8 Alto El producto / item es operable pero con un reducido nivel de desempeño. sin desecho en la línea.CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA PFMEA Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura / ensamble. sin aviso Calificación de severidad muy alta cuando un modo potencial de falla afecta la operación segura del producto y/o involucra un no cumplimiento con alguna regulación gubernamental. Cliente insatisfecho Producto / item operable. Defecto notado por el 75% de los clientes No se cumple con el ajuste. pero un item de confort/conveniencia es inoperable. use la mayor de las dos severidades Efecto Peligroso sin aviso Peligroso con aviso Muy alto Efecto en el cliente Calificación de severidad muy alta cuando un modo potencial de falla afecta la operación segura del producto y/o involucra un no cumplimiento con alguna regulación gubernamental.

Modelo de PFMEA – Paso 2  Paso 2 identificar:  Las causas asociadas (primer nivel y raíz) Su tasa de ocurrencia   La designación apropiada de la característica indicada en ola columna de clasificación Acciones recomendadas para alta severidad y criticalidad (S x O) así como la Seguridad del operador (OS) y errores de proceso de alto impacto (HI)  552 .

especificar claramente:    553 . presión) Lubricación inadecuada Ejemplos.Modelo de PFMEA – Paso 2 Causa/Mecanismo potencial de falla   Describe la forma de cómo puede ocurrir la falla. tiempo. descrito en términos de algo que puede ser corregido o controlado Se debe dar priorioridad a rangos de prioridad de 9 o 10 Torque inadecuado (bajo o alto) Soldadura iandecuada (corriente.

Efecto(s) Potencial(es) de falla Evaluar 3 (tres) niveles de Efectos del Modo de Falla • Efectos Locales – Efectos en el Área Local – Impactos Inmediatos • Efectos Mayores Subsecuentes – Entre Efectos Locales y Usuario Final • Efectos Finales – Efecto en el Usuario Final del producto o Servicio 554 .

Modelo de PFMEA – Paso 2  Suposición 1: Los materiales para la operación son correctos        Ajuste de herramentales a la profundidad equivocada Desgaste de herramentales Temperatura del horno muy alta Tiempo de curado muy corto Presión de aire muy baja Velocidad del transportador no es constante Jets de lavadora desconectados 555 .

Modelo de PFMEA – Paso 2  Suposición 2: Los materiales para la operación tienen variación     Material demasiado duro / suave / quebradizo La Dimensión no cumple especificaciones El acabado superficial de la operación 10 no cumple especificaciones El localizador de perforación fuera de posición correcta 556 .

Modelo de PFMEA – Paso 2  Ocurrencia:    Es la probabilidad de que una causa/mecanismo ocurra Se puede reducir o controlar solo a través de un cambio de diseño Si la ocurrencia de la causa no puede ser estimada. entonces estimar la tasa de falla posible 557 .

67 4 3 2 1 .CRITERIO DE EVALUACIÓN DE OCURRENCIA SUGERIDO PARA AMEFP Probabilidad Muy alta: Fallas persistentes Indices Posibles de falla 100 por mil piezas ppk < 0.94 > 1.30 > 1.10 > 1.86 > 0.78 > 0.5 por mil piezas 0.55 Calif.20 > 1.1 por mil piezas Remota: La falla es improbable < 0.01 por mil piezas > 1.00 9 8 7 6 5 1 por mil piezas Baja : Relativamente pocas fallas 0. 10 50 por mil piezas Alta: Fallas frecuentes 20 por mil piezas 10 por mil piezas Moderada: Fallas ocasionales 5 por mil piezas 2 por mil piezas > 0.55 > 0.

cumplimiento con reglamentaciones gubernamentales. o la satisfacción del cliente. y Requieren controles especiales de manufactura. proveedores. seguridad de los operadores. monitoreo y/o inspección o seguridad  559 .Modelo de PFMEA – Paso 2  Clasificación de características especiales si:  Afectan la función del producto final. ensamble. embarques.

Causa(s) Potencial(es) o Mecanismos de falla O c c u r Controles de Diseño / Proceso Actuales D e R Acción t P Sugerida e N c Responsable y fecha límite de Terminación Acción Adoptada S O D R e c e P v c t N Usar tabla para determinar severidad o gravedad CON CLIENTE Equipo parado .) de AMEF ______(rev.ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso Componente ______________________ Ensamble ________________ Equipo de Trabajo ___________ Responsable del Diseño ____________ AMEF Número _________________ Preparó _______________ Pagina _______de _______ FECHA (orig.es suficiente tura de aire entre diente y diente LOCAL: Daño a sensor de velocidad y engrane MAXIMO PROXIMO Falla en eje 7 S e v .) ______ Resultados de Acción Función Efecto (s) del componente Modos de Falla Potencial (es) / Paso del Potenciales de falla proceso La abertura del engrane propor La abertura no ciona una aber.

ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso Componente ______________________ Ensamble ________________ Equipo de Trabajo ___________ Responsable del Diseño ____________ AMEF Número _________________ Preparó _______________ Pagina _______de _______ FECHA (orig.) ______ Resultados de Acción Función S Efecto (s) del e Modos de Falla Potencial (es) Componente / v Potenciales de falla Paso del . proceso Factura correcta Datos equivocadso LOCAL: Rehacer la factura Causa(s) Potencial(es) o Mecanismos de falla O Controles de c Diseño/ c Proceso u Actuales r D e R Acción t P Sugerida e N c Responsable y fecha límite de Terminación Acción Adoptada S O D R e c e P v c t N MAXIMO PROXIMO Contabilidad erronea CON CLIENTE Molestia Insatisfacción 7 3 Rango de probabilidades en que la causa identificada ocurra .) de AMEF ______(rev.

Inspección) usados para establecer la tasa de detección Efectividad de los controles de detección del proceso en una escala de 1 a 10 El factor de riesgo RPN inicial Acciones recomendadas (Prevención y Detección) 562 .Modelo de PFMEA – Paso 3  En el paso 3 identificar:      Controles actuales de prevención del proceso (con acciones de diseño o proceso) usados para establecer la ocurrencia Controles actuales de detección (vg.

tales como: – Ambiente.Identificar Causa(s) Potencial(es) de la Falla • Causas relacionadas con el diseño . Fenómenos naturales • Mecanismos de Falla – Rendimiento. tiempo de entrega.Características del servicio o Pasos del proceso – Diseño de formatos – Asignación de recursos – Equipos planeados • Causas que no pueden ser Entradas de Diseño. información completa 563 . Clima.

ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño Componente ______________________ Ensamble ________________ Equipo de Trabajo ___________ Responsable del Diseño ____________ AMEF Número _________________ Preparó _______________ Pagina _______de _______ FECHA (orig. Causas potenciales De Diagrama de Ishikawa Diagrama de árbol o Diagrama de relaciones .) de AMEF ______(rev. y mecanismos de falla que pueden ser señalados para los modos de falla identificada. O Causa(s) Controles de c Potencial(es) Diseño/Proces c de los Mecanismos o Actuales u de falla r D e R Acción t P Sugerida e N c Responsable y fecha límite de Terminación Acción Adoptada S O D R e c e P v c t N Factura correcta Datos incorrectos LOCAL: Rehacer la factura MAXIMO PROXIMO Contabilidad 7 erronea CON CLIENTE Molestia Insatisfacción Identificar causas de diseño.) ______ Resultados de Acción Función de Artículo Efecto (s) Modos de Falla Potencial (es) Potenciales de falla S e v .

Modelo de PFMEA – Paso 3  Controles de proceso actuales:  Son una descripción de los controles ya sea para prevenir o para detectar la ocurrencia de los Modos/causas de falla  Consideraciones     Incrementar la probabilidad de detección es costosa y no efectiva A veces se requiere un cambio en el diseño para apoyar la detección El incremento del control de calidad o frecuencia de inspección sólo debe utilizarse como medida temporal Se debe hacer énfasis en la prevención de los defectos 565 .

Pruebas piloto Poka Yokes. Análisis.Identificar o detectar fallas o errores Anticipadamente Tercera Línea de Defensa .Identificar Controles de Diseño o de Proceso Actuales • Verificación/ Validación de actividades de Diseño o control de proceso usadas para evitar la causa. planes de control. detectar falla anticipadamente.Evitar o eliminar causas de falla o error Segunda Línea de Defensa . listas de verificación • • Primera Línea de Defensa . y/o reducir impacto: Cálculos. Prototipo de Prueba.Reducir impactos/consecuencias de falla o errores • 566 .

proceso Factura correcta Datos correctos LOCAL: Rehacer la factura Causa(s) Potencial(es) o Mecanismos de falla O Controles de c Diseño / c Proceso u Actuales r D e R Acción t P Sugerida e N c Responsable y fecha límite de Terminación Acción Adoptada S O D R e c e P v c t N MAXIMO PROXIMO Contabilidad erronea CON CLIENTE Molestia Insatisfacción 7 3 ¿Cuál es el método de control actual que usa ingeniería para evitar el modo de falla? .ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño Componente ______________________ Ensamble ________________ Equipo de Trabajo ___________ Responsable del Diseño ____________ AMEF Número _________________ Preparó _______________ Pagina _______de _______ FECHA (orig.) de AMEF ______(rev.) ______ Resultados de Acción Función S Efecto (s) del e Modos de Falla Potencial (es) Componente / v Potenciales de falla Paso del .

Modelo de PFMEA – Paso 3 Seleccionar un rango en la tabla de detección Si se usa inspección automática al 100% considerar:      La condición del gages La calibración del gage La variación del sistema de medición del gage Probabilidad de falla del gage Probabilidad de que el sistema del gage sea punteado Es efectiva entre un 80 a 100% dependiendo del proc. El número de personas que pueden observar el modo de falla potencialmente La naturaleza del modo de falla .¿es claro o confuso? Si se usa inspección visual al 100% considerar:    568 .

CRITERIO DE EVALUACIÓN DE DETECCION SUGERIDO PARA AMEFP Detecciòn Criterio A Casi imposible Muy remota Remota Muy baja Baja Moderada Certeza absoluta de no detección Los controles probablemente no detectarán Los controles tienen poca oportunidad de detección Los controles tienen poca oportunidad de detección Los controles pueden detectar Los controles pueden detectar X X Tipos de Inspección B C X X X X X Métodos de seguridad de Rangos de Detección No se puede detectar o no es verificada El control es logrado solamente con verificaciones indirectas o al azar El control es logrado solamente con inspección visual El control es logrado solamente con doble inspección visual El control es logrado con métodos gráficos con el CEP El control se basa en mediciones por variables después de que las partes dejan la estación. No puede aceptar parte discrepante Calif 10 9 8 7 6 5 4 3 2 1 Moderada mente Alta Alta Los controles tienen una buena oportunidad para detectar Los controles tienen una buena oportunidad para detectar Controles casi seguros para detectar Controles seguros para detectar X X X X Muy Alta Muy Alta X X X Detección del error en la estación (medición automática con dispositivo de paro automático). verificación. o medición realizada en el ajuste y verificación de primera pieza ( solo para causas de ajuste) Detección del error en la estación o detección del error en operaciones subsiguientes por filtros multiples de aceptación: suministro. o en dispositivos Pasa NO pasa realizado en el 100% de las partes después de que las partes han dejado la estación Detección de error en operaciones subsiguientes. No puede pasar la parte discrepante No se pueden hacer partes discrepantes porque el item ha pasado a prueba de errores dado el diseño del proceso/producto Tipos de inspección: A) A prueba de error B) Medición automatizada C) Inspección visual/manual . instalación.

) ______ Resultados de Acción Función Efecto (s) del Modos de Falla Potencial (es) Componente / Potenciales de falla Paso del proceso Factura correcta Datos incorrectos LOCAL: Rehacer la factura S e v .ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso Componente ______________________ Ensamble ________________ Equipo de Trabajo ___________ Responsable del Diseño ____________ AMEF Número _________________ Preparó _______________ Pagina _______de _______ FECHA (orig. Causa(s) Potencial(es) o Mecanismos de falla O c c u r Controles de Diseño / Proceso Actuales D e R Acción t P Sugerida e N c Responsable y fecha límite de Terminación Acción Adoptada S O D R e c e P v c t N MAXIMO PROXIMO Contabilidad erronea CON CLIENTE Molestia Insatisfacción 7 3 5 ¿Cuál es la probabilidad de detectar la causa de falla? .) de AMEF ______(rev.

Modelo de PFMEA – Paso 3  Número de prioridad de riesgo  Se calcula como RPN = (S) x (O) x (D)  Acciones recomendadas   Se deben dirigir primero a las de valores altos de Severidad (9 o 10) o RPNs. después continuar con las demás Las acciones se deben orientar a prevenir los defectos a través de la eliminación o reducción de las causas o modos de falla 571 .

Ocurrencia.Calcular RPN (Número de Prioridad de Riesgo) Producto de Severidad. y Detección RPN / Gravedad usada para identificar principales CTQs Severidad mayor o igual a 8 RPN mayor a 150 572 .

Planear Acciones Requeridas para todos los CTQs    Listar todas las acciones sugeridas. Recalcular número de prioridad de riesgo . Describir la acción adoptada y sus resultados. Reducir el riesgo general del diseño 573 . qué persona es la responsable y fecha de terminación.

dar una descripción breve de la acción real y fecha de efectividad  Responsabilidad y fechas de terminación   Desarrollar una lista de características especiales proporcionándola al diseñador para modificar el DFMEA Dar seguimiento a las acciones recomendadas y actualizar las últimas columnas del FMEA 574 .Modelo de PFMEA – Paso 3  Acciones tomadas   Identificar al responsable de las acciones recomendadas y la fecha estimada de terminación Después de terminar una acción.

estimar de nuevo los rangos de Severidad.Modelo de PFMEA – Paso 3  RPN resultante  Después de implementadas las acciones recomendadas.  Salidas del PFMEA  Hay una relación directa del PFMEA a el Plan de Control del proceso 575 . Si no se tomaron acciones dejarlo en blanco. Ocurrencia y Detección y calcular el nuevo RPN.

ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso Componente ______________________ Ensamble ________________ Equipo de Trabajo ___________ Responsable del Diseño ____________ AMEF Número _________________ Preparó _______________ Pagina _______de _______ FECHA (orig.) de AMEF ______(rev.) ______ Resultados de Acción Función de Artículo Efecto (s) Modos de Falla Potencial (es) Potenciales de falla S e v . O Causa(s) c Potencial(es) Controles de c de los Mecanismos Diseño Actual u de falla r D e t e c R P N Acción Sugerida Responsable y fecha límite de Terminación Acción Adoptada S O D R e c e P v c t N Factura incorrecta Datos incorrectos LOCAL: Rehacer la factura MAXIMO PROXIMO Contabilidad erronea CON CLIENTE Molestia Insatisfacción Riesgo = Severidad x Ocurrencia x Detección 7 3 5 105 Causas probables a atacar primero .

) de AMEF ______(rev. Una vez que se lleva a cabo la acción.ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso Componente ______________________ Ensamble ________________ Equipo de Trabajo ___________ Responsable del Diseño ____________ AMEF Número _________________ Preparó _______________ Pagina _______de _______ FECHA (orig.) ______ Resultados de Acción S Función Efecto (s) e del componente Modos de Falla Potencial (es) v / Paso del Potenciales de falla . proceso Factura correcta Datos erroneos LOCAL: Rehacer la factura Causa(s) Potencial(es) o Mecanismos de falla O Controles de c Diseño / c Prcoeso u Actuales r D e t e c R P N Acción Sugerida Responsable y fecha límite de Terminación Acción Adoptada S O D R e c e P v c t N MAXIMO PROXIMO Contabilidad erronea CON CLIENTE Molestia Insatisfacción 7 3 5 105 Usar RPN para identificar acciones futuras. recalcular el RPN. .

Herramientas para el FMEA 578 .

Herramientas          Diagramas de límites Diagramas de flujo de proceso Matriz de características Tormenta de ideas Árboles de funciones Lista de efectos: FMEA de diseño Lista de efectos: FMEA de proceso Diagrama de Ishikawa Tecnica de preguntas 579 .

Herramientas            Análisis de árbol de fallas (FTA) Análisis del modo de falla (FMA) Diseño de experimentos (DOE) Proceso de solución de problemas de 8Ds Planes de Control Planeación dinámica de control (DCP) Despliegue de la función de calidad (QFD) Análisis de valor/ Ingeniería del valor (VA/VE) REDPEPR FMEA Express FMEA del software 580 .

Muestran relaciones físicas. se usan en los DFMEAs.Diagrama de límites  Diagramas de límites de funciones  Salida del análisis de funciones para la fase de concepto CFMEA. 581 . ilustran funciones en vez de partes  Diagramas de límites Hardware/funcional  Dividen al sistema en elementos más pequeños desde un punto de vista funcional.

Nombres de verbos útiles 582 .

ya que al hacerlo pueden surgir cosas muy interesantes. Una vez que se tengan un gran número de ideas el facilitador procede a agrupar y seleccionar las mejores ideas por medio del consenso del grupo Las mejores ideas son discutidas y analizadas con el fin del proponer una solución. Pedir a todos los miembros del equipo generen ideas para la solución del problema. Aliente todo tipo de ideas. las cuales se anotan en el pizarrón sin importar que tan buenas o malas sean estas.Tormenta de ideas         Seleccionar el problema a tratar. que motivan a los participantes a generar más ideas. en este punto el objetivo es tener mayor cantidad de ideas Se les otorga a los participantes la facultad de modificar o mejorar las sugerencias de otros. Apruebe la naturalidad y el buen humor con informalidad. 583 . Ninguna idea es evaluada o criticada antes de considerar todos los pensamientos concernientes al problema.

por ejemplo:     Calentar el interior a XºC Enfriar a los ocupantes a XºC Eliminar la niebla del parabrisas en X segundos 584 .Herramientas para el FMEA  Árbol de funciones  Ayuda a que los requerimientos del cliente no expresados explícitamente sobre el producto o proceso se cumplan Es conveniente describir las funciones de un producto o proceso por un verbo – pronombre medible.

Técnica de preguntas  Hacer una oración con el modo de falla. Un modo de falla es debido a una causa. el modo de falla podría resultar en efectos. El “desajuste de los faros” ocasiona “haces de luz desalineados”  585 . por ejemplo: MODO DE FALLA: No ajustan los faros delanteros  P: ¿Qué podría ocasionar esta falla?  R: La luz desalineada -> Efecto  P: ¿A que se puede deber esta falla?  R: Cuerda grande en tornillo de ajuste -> Causa El “No ajuste de faros delanteros” se debe a “Cuerda grande en tornillo de ajuste”. causa y efecto y ver si la oración tiene sentido.

Técnica de preguntas Paso 3 ¿Qué lo causa? Paso 1 Modo de falla Paso 2 ¿Qué efecto tiene? 586 .

Se usan símbolos lógicos para interconectar las ramas Después de hacer el FTA e identificadas las causas raíz.Análisis de árbol de fallas (FTA)  Es una técnica analítica deductiva que usa un árbol para mostrar las relaciones causa efecto entre un evento indeseable (falla) y las diversas causas que contribuyen. se pueden determinar las acciones preventivas o los controles necesarios Otra aplicación es determinar las probabilidades de las causas que contribuyen a la falla y propagarlas hacia adelante   587 .

También permite identificar acciones correctivas para causas raíz actuales 588  . datos de servicios. tasas de falla y parámetros críticos de diseño de hardware o procesos.Análisis del Modo de Falla (FMA)  Es un enfoque sistemático disciplinado para cuantificar el modo de falla. tasa de falla. modos de falla. datos de campo. y/o datos de procesos Se usa para identificar la operación. y causa raíz de fallas o tasas de reparación conocidas (el FMEA para las desconocidas)  Se basa en información histórica de garantías.

cuando varios factores pueden estar contribuyendo o cuando estos factores están interrelacionados y se desean conocer los efectos de sus interacciones   589 .Diseño de experimentos (DOE)  Es un método para definir los arreglos en cuales se puedas realizar experimentos. donde se cambian de manera controlada las variables independientes de acuerdo a un plan definido y se determinan los efectos Para pruebas de confiabilidad el DOE usa un enfoque estadístico para diseñar pruebas para identificar los factores primarios que causas eventos indeseables Se usan para identificar causas raíz de modos de falla.

las disciplinas o pasos son:         Preparar el proceso Establecer el equipo Describir el problema Desarrollar las acciones de contención o contingentes Diagnosticar el problema (definir y verificar causa raíz) Seleccionar y verificar acciones correctivas permanentes (PCAs) para causas raíz y puntos de escape Implementar y validar PCAs Reconocer contribuciones del equipo y los miembros 590 .Método de 8 disciplinas (8Ds)  Es un método de solución de problemas orientado a equipos de trabajo.

producción piloto (capacidad de procesos) y de producción 591    .Planes de control  Es una descripción escrita del sistema para controlar el proceso de producción Lista todos los parámetros del proceso y características de las partes características de las partes que requiere acciones específicas de calidad El plan de control contiene todaslas características críticas y significativas Hay planes de control a nivel de manufactura de: Prototipos.

Lanzamiento – definir los requerimientos de recursos 2.Planeación dinámica de control (DCP) Es un procesos que liga las herramientas de calidad para construir planes de control robustos a través de un equipo 1. Bitácora de preguntas 592 . Estructura del equipo central y de soporte 3.

etc. Pre lanzamiento o controles preliminares 7. Diagrama de flujo y carácterísticas de enlace 6. Desarrollar ilustraciones e instrucciones 10. PFMEA. Implementar y mantener 593 .) 5. PFMEA 8. DFMEAs.Planeación dinámica de control (DCP) 4. Plan de control 9. Información de soporte (ES. DVP&R.

Despliegue de la función de calidad (QFD)  El QFD es un método estructurado en el cual los requerimientos del cliente son traducidos en requerimientos técnicos para cada una de las etapas del desarrollo del producto y producción El QFD es entrada al FMEA de diseño o al FMEA de concepto. Los datos se anotan en el FMEA como medidas en la columna de función La necesidad de obtener datos de QFD pueden ser también una salida del FMEA de concepto   594 .

La Ingeniería del valor se realiza antes de comprometer el herramental.Análisis del valor / Ingeniería del valor (VA/VE)  Son metodologías usadas comúnmente para despliegue del valor. controles o acciones recomendadas La metodología VA debe ser incluida en la revisión de FMEAs actuales como apoyo para evaluar riesgos y beneficios cuando se analizan varias propuestas 595  . Ambas técnicas usan la fórmula: Valor = Función (primaria o secundaria) / Costo  Los datos de VA/VE pueden ser entradas al FMEA de diseño o de proceso en columna de Función como funciones primaria y secundaria. El análisis del valor (VA) se realiza después del herramentado. También pueden ser causas.

com  596 .redpepr. listas de verificación de confiabilidad y robustez (RRCL) y la matriz de demostración de confiabilidad y robustez (RRDM)  Preguntas y tips para guiar al equipo en el proceso  Capacidad para generar reportes en Excel  Un proceso para mejorar la comunicación con el equipo de ingeneiría El Web site donde se encuentra el software es www.ford.REDPEPR (Robust Engineering Design Product Enhacement Process) Es una herramienta que proporciona a los equipos de Diseño: Un proceso paso a paso para aplicar el RED  Las herramientas necesarias para completar el diagrama P.

Aplicaciones del FMEA Express Ambiental De máquinas 597 .

colección de información y documentos de modos de falla conocidos. equipo de trabajo multidisciplinario. efectos y controles 598 .FMEA Express Es un proceso que aplica técnicas de FMEA simultaneamente tanto a los aspectos de diseño como a los de manufactura de un proyecto: Consiste de cuatro fases:  Preparación: Se forma un equipo directivo para definir el alcance del proyecto. causas.

quality.FMEA Express  Desarrollo del FMEA: El equipo de trabajo multidisciplianrio completa el FMEA utilizando formatos y definiciones estándar  Posterior a la tarea: El facilitador y el equipo directivo generan un reporte final y un plan de seguimiento. El líder del equipo de FMEA es responsable de monitorear el avance  Auditoría de calidad: Después de una verificación de calidad.com/cpar/fmea/ 599 . se proporciona un certificado de cumplimiento Software para el FMEA: www.ford.

E-FMEA ambiental 600 .

E-FMEA ambiental 601 .

Matriz de requerimientos ambientales con criterios múltiples  Para cada alternativa de diseño resumir la siguiente información Uso de substancias prohibidas o de uso restringido Tipo y cantidad de residuos (refleja el nivel de materiales utilizados) Consumo de energía por componente Consumo de agua por componente Otros objetivos ambientales      602 .

E-FMEA Ejemplos de acciones recomendadas (hacer una revisión previa de efectos secundarios en la vida del producto):   Sistemas de conexión alternos Reciclar Rutas alternas de disposición de residuos Uso de materiales naturales Revisar rutas de transporte Reducir trayectorias de proceso Optimizar el consumo de agua y energía      603 .

E-FMEA Salidas del FMEA ambiental:  Recomendaciones de materiales  Recomendaciones de diseño (vg. Potencial de ahorro de energía) Recomendación para rutas de disposición   604 . Tipo de enlace) Recomendaciones de proceso (vg.

MFMEA – FMEA de maquinaria 605 .

FMEA de maquinaria  Su propósito es que a través de un equipo se asegure que los modos de falla y sus causas/mecanismos asociados se hayan atendido Soporta el proceso de diseño en:  Apoyar en la evaluación objetiva de las funciones del equipo. requerimientos de diseño y alternativas de diseño   Incrementar la probabilidad de que los modos de falla y sus efectos en la maquinaria se han considerado en el proceso de diseño y desarrollo 606 .

  607 .FMEA de maquinaria  Proporcionar información adicional como apoyo a la planeación de todos los programas de diseño. prueba y desarrollo Desarrollar una lista de modos de falla potenciales en base a su efecto con el cliente. estableciendo prioridades para mejoras al diseño y desarrollo Proporcionar documentación para referencia futura para el análisis de problemas de campo. evaluando cambios de diseño y desarrollo de maquinaria.

Sistema de posición – Ángulo de rotación de 30º Hacer un barreno – Rendimiento a la primera 99.FMEA de maquinaria  Ejemplos de descripción de funciones  Proceso de partes – 120 tareas / hora Cabezal del índice – MTBF > 200 Hrs Control del flujo hidráulico – 8p cl/seg.9%     608 .

requiriendo intervención del operador o ajustador 609 . Los ajustes incluyen el tiempo muerto usado para ajustar el equipo para evitar defectos y bajo rendimiento.FMEA de maquinaria  Efectos potenciales como consecuencias de falla de subsistemas en relación a seguridad y “Las 7 grandes pérdidas”  Falla – pérdidas resultado de una pérdida funcional o reducción de la función sobre una parte del equipo requiriendo intervención de mantenimiento  Preparación y ajustes – pérdidas que son resultado de procedimientos de preparación tal como herramentado. cambio de modelo o cambio de molde.

b) condiciones óptimas y c) tiempo máximo de ciclo logrado con maquinaria similar  610 . El tiempo de ciclo ideal se determina por: a) velocidad original.FMEA de maquinaria  Tiempo de espera y paros menores – pérdidas resultado de interrupciones menores al flujo del proceso (como atoramiento de microswitch) requiriendo intervención del operador. El tiempo de espera sólo se puede resolver revisando el sistema / línea completa Capacidad reducida – pérdidas que resultan de la diferencia entre el ciclo de tiempo ideal del equipo y su tiempo de ciclo real.

rotura. etc. tips de soldadura. o entre turnos).) 611 . y/o partes no útiles   Herramentales – pérdidas que resultan de fallas en el herramental. resultando en rendimiento reducido o incremento de desperdicio y rechazos Partes defectivas – pérdidas que resultan de la generación de defectos que producen retrabajo.FMEA de maquinaria  Pérdidas en el arranque – pérdidas que ocurren durante los primeros pasos del proceso productivo después de paros largos (fines de semana. reaparaciones. deterioración o desgaste (vg. Herramientas de corte. días de azueto.

FMEA de maquinaria Criterios de Severidad 612 .

instaló. y se dispuso de acuerdo a sus especificaciones. subsistema y sistema a no cumplir sus requerimientos funcionales / de desempeño? ¿A qué grado pueden los componentes. se asume que la maquinaria se fabricó. preguntarse para identificar causas potenciales lo siguiente:  ¿Cuáles son las circunstancias que pueden orientar al componente. usó.FMEA de maquinaria  Causas potenciales. subsistemas y sistemas que interactúan ser compatibles? ¿Qué especificaciones garantizan compatibilidad?   613 .

FMEA de maquinaria Criterios de Ocurrencia 614 .

FMEA de maquinaria Criterios de Detección 615 .

Herramientas de la Fase de Análisis Identificación de causas potenciales Cartas Multivari y Análisis de Regresión Intervalos de confianza y Pruebas de Hipótesis 616 .

Identificación de causas potenciales Tormenta de ideas Diagrama de Ishikawa Diagrama de Relaciones Diagrama de Árbol Verificación de causas raíz 617 .

Tormenta de ideas  Técnica para generar ideas creativas cuando la mejor solución no es obvia. Reunir a un equipo de trabajo (4 a 10 miembros) en un lugar adecuado El problema a analizar debe estar siempre visible    Generar y registrar en el diagrama de Ishikawa un gran número de ideas. ni criticarlas Motivar a que todos participen con la misma oportunidad  618 . sin juzgarlas.

Tormenta de ideas  Permite obtener ideas de los participantes 619 .

Diagrama de Ishikawa  Anotar el problema en el cuadro de la derecha  Anotar en rotafolio las ideas sobre las posibles causas asignándolas a las ramas correspondientes a:  Medio ambiente  Mediciones  Materia Prima  Maquinaria  Personal y  Métodos o  Las diferentes etapas del proceso de manufactura o servicio 620 .

Diagrama de Ishikawa Medio ambiente Clima húmedo Distancia de la agencia al changarro Frecuencia de visitas Métodos Personal Falta de supervi Falta de ción motivación Rotación de personal Ausentismo Posición de exhibidores Elaboración de pedidos Clientes con ventas bajas Malos itinerarios Descompostura del camión repartidor Seguimiento semanal Conocimiento de los mínimos por ruta ¿Qué produce bajas ventas Calidad del de Tortillinas producto Tía Rosa? Tipo de exhibidor Maquinaría Medición Materiales .

Mala prog.. Entre las dif.. Y desarrollo’’’ Constantes cancelaciones de pedidos de marketing No hay control de inv. En proc. De ordenes de compra No hay com. Entre compras con la op. Falta de prog... Y desarrollo Falta de coordinación entre el enlace de compras de cada unidad con compras corporativo Compras aprovecha ofertas Falta de com. Reciben ordenes de dos deptos diferentes No hay coordinación entre la operación y las unidades del negocio Falta de control de inventarios en compras Altos inventarios Duplicidad de funciones Demasiados deptos de inv.. áreas de la empresa Marketing no tiene en cuenta cap de p. En base a los pedidos Programación deficiente Capacidad instalada desconocida Falta de coordinación al fincar pedidos entre marketing y la op.....Diagrama de relaciones No hay flujo efectivo de mat. Por falta de programación de acuerdo a pedidos Influencia de la situación econ del país Perdida de mercado debido a la competencia Compra de material para el desarrollo de nuevos productos por parte inv... No hay com....... De la op.. Entre las UN y la oper.... No hay coordinación entre marketing operaciones Las un.... general Influencia directa de marketing sobre compras Falta de comunicación entre las unidades del negocio 622 .

¿Que nos puede provocar Variación de Velocidad Durante el ciclo de cambio en la sección del Embobinadores? 13/0 Dancer 2/1 Taco generador del motor Poleas guías Bandas de transmisión 2/4 0/4 1/2 5/1 1/4 1/4 1/1 Empaques de arrastre Causas a validar 0/3 Presión de aire de trabajo Presión del dancer 5/2 Drive principal Mal guiado Sensor de velocidad de línea Sensor circunferencial 4/1 Voltaje del motor 1/5 principales Ejes 1/5 Poleas de transmisión Entradas Salidas Causa Efecto .

What Data Needs to be Collected to understand the sources of variation in a key measure ? Interrelationship Diagraph Allows a team to identify & classify the cause and effect relationships that exist among variables Business Planning Process Means not clearly defined In = 3 Out = 2 Driver Plan not integrated In = 2 Out = 4 Communication issues within the group In = 1 Out = 3 Fast new product introductions stretch resources In = 1 Out = 2 No strong commitment to the group In = 2 Out = 0 Capacity may not meet needs Planning approach not standardized In = 0 Out = 5 In = 5 Out = 1 Outcome External factors impact implementation In = 0 Out = 2 Driver Lack of time and resources In = 5 Out = 0 .

Diagrama de árbol o sistemático Meta Medio Meta Segundo nivel Medio Meta Primer nivel Medio Tercer nivel Medios Cuarto nivel Medios Medios Medios o planes Meta u objetivo Medios o planes 625 .

Eliminación de ajustes 5 –May -04 19– May -04 12.Diagrama de Arbol.Mar-04 24.04 15 –Abr . Fase 2: Conversión de preparación interna en externa Analizar las funciones y propósito de c/operación Convertir tareas de preparación interna a externas Realización de operaciones en paralelo.Mar-04 ¿Objetivo? Implantar el Sistema SMED Producto DJ 2702 Separar las tareas Fase 1: Separación de la preparación interna de la externa Elaborar lista de chequeo Realizar chequeo de funciones Analizar el transporte de herramientas y materiales 24.Mar-04 17.04 ¿Qué? Elaboramos un Diagrama de Arbol para poder analizar nuestro problema siguiendo el sistema SMED.May -04 19 Fase 3: Refinamiento de todos los aspectos de la preparación.Mar-04 2. Uso de sujeciones funcionales.Mar-04 10 y 17 –Mar-04 17.Mar-04 12 .Abr.12 . .Aplicación Sistema SMED ¿Cómo? Preparación para el SMED Filmar la preparación Analizar el video Describir las tareas ¿Cuándo? 5.

Verificación de posibles causas  Para cada causa probable . el equipo deberá por medio del diagrama 5Ws – 1H:  Llevar a cabo una tormenta de ideas para verificar la causa. 627 . Seleccionar la manera que:   represente la causa de forma efectiva. y  sea fácil y rápida de aplicar.

¿quién? J. U.1.1.1. R. Abril’04 1804 Embob. 3 Ejes principales de transmisión. F. 3. 2 Sensor circular y de velocidad de linea. 628 .2 Comparar valores de vibraciones con lecturas anteriores. 4 Poleas de transmisión de ejes embobinadores .1 Tomar dimensiones de ensamble entre coples. 4.1.1. F.1. 2. R. 2.1.1. 1. 2. 4. 4.1 Tomar dimensiones de la distancia entre poleas y sensores. 1.2 Tomar valores de voltaje de salida de los sensores. P.1 Puede generar vibración excesiva durante el ciclo de cambio.1.1 Por vibración excesiva durante el ciclo de cambio Abril ’04 1804 Embob. P.3 Verificar estado de rodamientos de poleas.Calendario de las actividades ¿qué? 1 Tacogenerador de motor embobinador ¿por qué? 1.1.2 Verificar estado actual y especificaciones de escobillas.1. entre poleas de ejes principales y polea de transmisión del motor. ¿cuándo ? Abril ’04 ¿dónde ? 1804 Embob.1 Tomar lecturas de vibración en alojamientos de rodamientos 3.1 Por que nos genera una varión en la señal de referencia hacia el control de velocidad del motor embobinador 3.1 Verificar alineación.1.1.3 Analizar valor lecturas de vibración tomadas. U. 2. J. 3. Abril’04 1804 Embob.4 Verificar valor de tensión de bandas.3 tomar valores de voltaje de salida durante el ciclo de cambio.2 Tomar dimensiones de poleas(dientes de transmisión).3 Tomar dimensiones de bandas (dientes de transmisión) 4. 4.1 Por variación de voltaje durante el ciclo de cambio ¿cómo? 1.

Desalineación de pinolas en cuna. Amortiguadores dañados. Resultados SI ES CAUSA RAIZ Causa Raíz X SI ES CAUSA RAIZ NO ES CAUSA RAIZ NO ES CAUSA RAIZ X 5 6 SI ES CAUSA RAIZ X X SI ES CAUSA RAIZ 7 NO ES CAUSA RAIZ . Método de Balanceo no adecuado. Desgaste de bujes en los carretes. Fabricación y reemplazo de ejes y poleas no adecuados en ensamble de aspas. bloques y contrapesos no adecuados en aspas.Resumen de la validación de las causas # de Causa 1 2 3 4 Causas Ensamble de ojillos. Desalineamiento de poleas y bandas de transmisión de aspas.

VI.D Métodos de análisis adicionales 630 .

Métodos adicionales de análisis 1. Análisis del Muda 631 . Análisis de brecha 2. Análisis de causa raíz 3.

VI.D.1 Análisis de brecha 632 .

a un desempeño potencial deseado. El análisis de brecha (Gap Analysis) es una herramienta de evaluación para comparar el desempeño actual de la organización. Identifica la diferencia de lo que es y lo que debería ser  633 .

Análisis de brecha  Se pueden redirigir los esfuerzos a objetivos como:          Permanecer en el negocio Mantener o incrementar la participación del mercado Mejorar el clima laboral Igualar o exceder a Benchmarks Igualar o exceder a la competencia Reducir tiempos de ciclo Lograr certificaciones Mejorar la productividad Mejorar los niveles de calidad 634 .

Análisis de brecha  Se requieren tres categorías de información    ¿Dónde estamos? ¿Dónde queremos ir? ¿Cómo vamos a medir los resultados? 635 .

Por lo que se sugiere considerar escenarios del mejor y del peor caso. para tomar las mejores decisiones y atender estos eventos. los directivos pueden confiarse o ser orgullosos de aceptar cambios. Aunque algunos elementos sean desconocidos  636 . para evitar errores en la toma de decisiones Los escenarios permiten imaginar el desempeño futuro de la organización ante riesgos.Planeación de escenarios  Al elaborar planes estratégicos.

técnicos y económicos Agrupar estas percepciones en patrones relacionados Desarrollar una lista de las mejores percepciones (prioridades) 637 .Planeación de escenarios  El proceso de planeación es como sigue:     Seleccionar al personal que pueda dar muchas perspectivas Desarrollar una lista de cambios percibidos. sociales.

y revisar los escenarios 638 .Planeación de escenarios  El proceso de planeación es como sigue:     Desarrollar un escenario grueso del futuro basado en estas prioridades Determinar como afectan los escenarios a la organización Determinar los cursos de acción potenciales a tomar Monitorear. evaluar.

Planeación de escenarios  Por lo común se perciben de 6 – 10 amenazas u oportunidades en 2 o 3 escenarios desarrollados. Evitar las siguientes trampas:  No utilizar un facilitador experimentado Considerar escenarios como pronósticos Hacer escenarios simplistas Limitar el impacto global de los escenarios    639 .

Planeación de escenarios  Evitar las siguientes trampas…..:  No incluir a un equipo directivo en el proceso Tratar los escenarios solo como actividad informativa Limitar el estímulo imaginativo en el diseño del escenario    No desarrollar escenarios para área de impacto clave del negocio 640 .

usada para organizar y desplegar planes estratégicos Hoshin traduce la visión de la empresa en resultados medibles dramáticos y rupturas estratégicas Hoshin se enfoca a identificar los pocos logros vitales de ruptura   641 .Planeación Hoshin  Es una herramienta de ejecución.

Planeación Hoshin  Tiene seis objetivos:  Alinear las metas organizacionales Enfocarse en las pocas brechas vitales estratégicas   Trabajar con otros para cerrar las brechas Especificar los métodos para lograr los objetivos Hacer visible el enlace entre planes locales Mejora continua del proceso de planeación    642 .

Otras técnicas de análisis clave  Benchmarking Análisis FODA   Análisis PEST Las cinco fuerzas competitivas de Porter  643 .

gestión de la calidad. manufactura. mercadotecnia. salud y seguridad. etc… 644 .Evaluación organizacional  Análisis funcional con datos de colección:      Entrevistas cara a cara Selección de muestra apropiada Entradas de grupo de enfoque Observaciones de visitas a la planta Datos colectados de fuentes de la industria  Se divide a la organización en áreas funcionales clave  Liderazgo. diseño y desarrollo. prácticas de negocio. análisis financiero.

Evaluación organizacional  Se deben analizar los resultados y presentarlos a la dirección. Quienes deben generar e implementar las soluciones y guiar al éxito  645 . quien debe promover e implementar planes de acción claros Normalmente el consultor colecta y resume la información en categorías principales para su revisión por la dirección.

646 .Métricas organizacionales  Se establecen metas de desempeño organizacional y sus métricas en las áreas de:     Utilidades Tiempos de ciclo Recursos Respuestas del mercado  Por cada meta organizacional mayor deben desarrollarse métricas. con unidades y métodos de medición.

costos personales. ventas$  Tiempos de ciclo     Tiempos de ciclo actuales Benchmarks internos Benchmarks externos Reducción en tiempos de ciclo 647 . las métricas pueden ser:  Utilidades a corto y largo plazo  Valor de acciones. comparaciones competitivas. inversión de capital.Métricas organizacionales Para los anteriores. ROI.

porcentaje de defectos con relación a alguna base Respuestas del mercado  Encuestas con clientes  Análisis de devoluciones  Desarrollo de nuevos productos  Retención de clientes  Pérdidas con clientes  Tasas de cortesías e instalaciones  648 . estudios de capacidad de procesos. De proyectos de mejora. reducciones de variabilidad. ROI de proyectos. costos de calidad con relación a una base.Métricas organizacionales  Recursos  No.

deben usarse en todo  Las métricas se basan en la retroalimentación con base en clientes. o internas 649 .Métricas organizacionales Las métricas permiten medir los avances en relación a las metas organizacionales  De acuerdo a Juran se debe tomar en cuenta lo siguiente:      Las métricas deben tener un significado estándar Deben apoyar el proceso de toma de decisiones Deben proporcionar información valiosa Debe ser fácil de instalar Si son valiosas. proveedores.

2 Análisis de causa raíz 650 .VI.D.

Pueden tomar varios pasos:     Situación (presa con fuga) Acción inmediata (desahogarla) Acción intermedia (reparar la presa) Acción en la causa raíz (identificar que causó la fuga para evitar su recurrencia y reconstruir la presa) 651 .Análisis de causa raíz  Un equipo tiene la responsabilidad de determinar la causa raíz de una deficiencia y corregirla.

seis sombreros de pensamiento.Análisis de causa raíz Se pueden utilizar las siguientes herramientas:  Herramientas subjetivas:  Preguntar por qué cinco veces. FMEA. observación de operación. grupo nominal. PHVA.  análisis de flujo de proceso. equipos de trabajo.     técnicas de consenso. diagrama de causa efecto. tormenta de ideas. FTA 652 .

experimentos simples. división de variación Subgrupos de datos. hoja de verificación Análisis de matriz de datos Análisis de capacidad de procesos. análisis de regresión. DOE Pruebas analíticas.Análisis de causa raíz Se pueden utilizar las siguientes herramientas:  Herramientas analíticas:  Colección y análisis de datos Análisis de Pareto. cartas de control      653 .

Análisis de causa raíz Ante una acción correctiva permanente. la dirección debe determinar si:  El análisis de causa raíz ha identificado el impacto completo del problema La acción correctiva es efectiva para eliminar o prevenir la recurrencia La acción correctiva es realista y sostenible   654 .

Los 5 Por qués  Se hace la pregunta ¿Por qué? Cinco veces      ¿Por qué? Nos faltaron partes por máquina dañada ¿Por qué? La máquina no ha tenido mantenimiento en los últimos 3 meses ¿Por qué? El departamento de mantenimiento se ha reducido a 6 personas de 8 ¿Por qué? Se pasó del presupuesto. les quitaron el tiempo extra y dos personas ¿Por qué? La empresa no ha tenido los resultados esperados y el director ha hecho recortes para salvar la situación. teme por su puesto 655 .

¿por qué? Y ¿cómo?.5Ws y 1H  El método de las 5Ws y 1H se resume al preguntar ¿quién?. ¿cuándo?. ¿qué?. ¿dónde?. Pueden usarse las ramas del diagrama de causa efecto  656 .

Diagrama de causa efecto      Rompe el problema en partes más pequeñas Muestra muchas causas potenciales gráficamente Muestra como interactúan las causas Sigue las reglas de la tormenta de ideas Las sesiones tienen tres partes:    Tormenta de ideas Dar prioridades (identificar las tres causas principales) Desarrollo de un plan de acción 657 .

) presentan la mayor oportunidad para la mejora (80% aprox.)   658 .Diagrama de Pareto  Sirve para identificar problemas u oportunidades prioritarias o mayores De acuerdo a Juran permite identificar “los pocos vitales” de los “muchos triviales” El principio de Pareto sugiere que unas cuantas categorías de problemas (20% aprox.

D8. Establecer el equipo Describir el problema Desarrollar una acción de contención Identificar la causa raíz Desarrollar alternativas de solución Implementar una acción correctiva permanente Prevenir la recurrencia Reconocer al equipo y las contribuciones individuales 659 . D4.Ford  El método de Ford para el análisis de causa raíz es: D1.Método de las 8 disciplinas . D7. D5. D3. D2. D6.

Análisis de árbol de falla .FTA  FTA es un método sistemático deductivo.  660 . y determinar todas las posibles razones (fallas) que pueden hacer que ocurra el evento Se utiliza el las primeras fases del diseño como herramienta para impulsar modificaciones iniciales de diseño. para definir un evento singular específico e indeseable.

eliminación lógica de causas de falla 661 . acciones correctivas. riesgos de peligro. defectos de diseño.FTA  Otras áreas de su aplicación son:         Análisis funcional de sistemas complejos Evaluación de requerimientos de seguridad. simplificación de mantenimiento y detección de falla.Análisis de árbol de falla . confiabilidad.

Análisis de árbol de falla .FTA  Se prefiere el FTA en vez del FMEA cuando:       La seguridad el personal es importante Se pueden identificar un número pequeño de eventos superiores Hay alto potencial de falla El problema es cuantificar la evaluación del riesgo La funcionalidad del producto es altamente compleja El producto no es reaprables 662 .

Análisis de árbol de falla .FTA  Se prefiere el FMEA en vez del FTA cuando:     Los eventos superiores no se pueden definir explícitamente Son factibles múltiples perfiles potencialmente exitosos La identificación de todos los modos de falla es importante La funcionalidad del producto tiene poca intervención externa 663 .

Análisis de árbol de falla . evento de falla de bajo nivel. falla a nivel sistema o evento indeseable Evento básico.FTA  Símbolos de compuertas lógicas para determinar la confiabilidad del sistema. evento falla de más bajo nivel a estudiar Evento de falla. Hay símbolos de eventos y símbolos de compuertas Símbolos de eventos  Evento superior. Puede recibir entradas o proporcionar salidas a una compuerta lógica 664 .

FTA  Símbolos de compuertas lógicas “AND”.Análisis de árbol de falla . El evento de salida ocurre si Ocurre alguno de los eventos de La entrada 665 . El evento de salida ocurre solo Si ocurren todos los eventos de entrada Simultaneamente “OR”.

Análisis de árbol de falla .FTA  Ejemplo: se asume que falla el sistema superior 666 .

FTA  La probabilidad de falla del sistema es 5.02%.20). después la CPU (0.Análisis de árbol de falla .015) y el monitor (0. Se indica que el teclado es prioritario (0.015) 667 .

3 Análisis del Muda 668 .D.VI.

Análisis de Muda  Las actividades que no agregan valor se clasifican como Muda. de acuerdo a Imai son:        Sobreproducción Inventarios Reparaciones / rechazos Movimientos Transportes Re – Procesos Esperas 669 .

Sobreproducción  Se produce más en cierto momento. por:    Producir más de lo necesario por el siguiente proceso Producir antes de lo requerido por el siguiente proceso Producir más rápido de lo requerido por el siguiente proceso Espacio extra en las instalaciones del cliente Materias primas adicionales en uso Utilización de energéticos y transportes adicionales Costos de programación adicionales  Sus consecuencias son:     670 .

refacciones y productos terminados forman el inventario.Inventario en exceso  Las partes. inventario en proceso. el inventario es Muda ya que requiere:    Espacio en piso. Transporte. deterioro. Montacargas Sistemas de transportadores Interés sobre el costo de los materiales  Puede verse afectado por:   El polvo. obsolescencia Humedad (oxidación). materias primas. daño durante el manejo 671 .

Transporte. refacciones y productos terminados forman el inventario. Montacargas Sistemas de transportadores Interés sobre el costo de los materiales  Puede verse afectado por:   El polvo. deterioro. obsolescencia Humedad (oxidación). daño durante el manejo 672 . inventario en proceso. materias primas. el inventario es Muda ya que requiere:    Espacio en piso.Inventario en exceso  Las partes.

no puede implementarse el flujo de una pieza Los cambios de diseño también son Muda    673 . Se rompe el Takt Time Puede haber desperdicio de materiales o productos no recuperable Si hay defectos.Reparaciones / defectos  Las reparaciones o el retrabajo de partes defectivas significa un segundo intento de producirlas bien.

cargar pesado. etc.Movimientos  Los movimientos adicionales del personal son Muda. Caminar mucho. agacharse. analizando cada estación de trabajo La ergonomía puede causar daños y producción perdida   674 . El lugar de trabajo debe diseñarse ergonómicamente. estirarse mucho. repetir movimientos.

Movimientos  Algunas reglas de la ergonomía incluyen:        Enfatizar la seguridad todas las veces Adecuar el empelado a la tarea Cambiar el lugar de trabajo para que se adecue al empleado Mantener posiciones neutrales del cuerpo Rediseñar las herramientas para reducir esfuerzo y daños Variar las tareas con rotación de puestos Hacer que la máquina sirva al ser humano 675 .

por ejemplo:       Remoción de rebabas Maquinado de partes mal moldeadas Agregar procesos de manejo adicionales Realizar procesos de inspección Repetir cambios al producto innecesarios Mantener copias adicionales de información 676 .Reprocesos  Consiste de pasos adicionales en el proceso de manufactura.

Transportes  Todo transporte es Muda excepto la entrega al cliente. áreas grandes de almacenaje. Incluye:    Uso de montacargas Uso de transportadores Uso de movedores de pallets y camiones  Puede ser causado por:   Deficiente distribución de planta o de celdas Tiempos de espera largos. o problemas de programación 677 .

falta de partes. por falla de máquina. pero permanece ocioso. paros de línea. etc. El Muda de espera puede ser por:       Operadores ociosos Fallas de maquinaria Tiempos de ajuste y preparación largos Tareas no programadas a tiempo Flujo de materiales en lotes Juntas largas e innecesarias 678 .Esperas  Ocurre cuando un operador está listo para realizar su operación.

Mudas adicionales  Otros mudas adicionales a los 7 desperdicios son:          Recursos mal utilizados Recursos poco utilizados Actividades de conteo Búsqueda de herramientas o partes Sistemas múltiples Manos múltiples Aprobaciones innecesarias Fallas de máquinas Envío de producto defectivo al cliente o mal servicio 679 .

Salidas de la Fase de Análisis  Causas raíz validadas Guía de oportunidades de mejora  680 .

que debe dar: a. cuantas de las siguientes causas de variación en estudios multi vari pueden incluir elementos de proceso relacionados con el tiempo: I. II y III 2. II y III b. Se hace un estudio entre la velocidad de coches y su consumo de gasolina. 0. 0. Posicional II. La interacción de la medición c. La intersección en el eje Y 3. 0. I y II c.35.40 d. Cilíndrica III. El coeficiente de correlación es de 0. Después se encontró que el velocímetro está equivocado y debió haber marcado 5 km. -0. I. ¿que representa el término Beta 1?: a. I y III d.35 c. De más. En un sentido amplio. La intersección en el eje X d. La pendiente de la línea b. En un estudio de análisis de regresión con dos variables. Se recalcula el coeficiente de correlación.30 b. Temporal a.Preguntas ejemplo 1.35 681 .

El coeficiente de determinación es menor que el coeficiente de correlación a. Sólo III b. El coeficiente de correlación de X y Y c. Según la figura. La siguiente ecuación es: a. El coeficiente de determinación de X y Y d. ¿Cuál de las afirmaciones siguientes es falsa? I. La covarianza de X y Y b. Sólo II d. La varianza del producto de X y Y 5. El coeficiente de determinación es positivo III. Sólo I c.Preguntas ejemplo 4. El coeficiente de correlación es negativo II. II y III 682 .

Es un caso donde la distribución relevante debe ser geométrica d.Preguntas ejemplo 6. Un problema de correlación: a. ninguna de las cuales es restringida por el experimentador c. Considera la variación conjunta de las dos mediciones. Se resuelve al asumir que las variables son normales e independientemente distribuidas con media cero y varianza “s” 683 . Se resuelve estimado el valor de la variable dependiente para varios valores de la variable independiente b.

05 se tiene más posibilidad de riesgo de cometer un error tipo II c. Con alfa de 0. 100 8.05 se tiene menos posibilidad de cometer un error tipo I 9.05 se tiene mayor tendencia a cometer un error tipo I b.0”. estimar el intervalo de confianza para un nivel de confianza del 95% para la población (asumir una distribución normal) 684 . El tamaño de muestra se determina de manera que haya un 0.1” de error de tolerancia al usar la media de la muestra para estimar la Mu. Con alfa de 0.05 es una prueba más “conservadora” de la hipótesis nula Ho d. 365 b. ¿Cuál de los siguientes valores es el más cercano al tamaño de muestra requerido? a. La diferencia entre poner alfa de 0. 40 c.01 en una prueba de hipótesis es: a. Una muestra aleatoria de tamaño n se toma de una gran población con desviación estándar de 1.05 y alfa igual a 0. 200 d.Preguntas ejemplo 7. Si un tamaño de muestra de 16 tiene un promedio de 12 y una desviación estándar de 3. Con alfa de 0. Con alfa de 0.05 de probabilidad de riesgo de exceder 0.

No hay diferencia significativa por que Fcalc < Ftablas c. Hay diferencia significativa por que Fcalc > Ftablas d. 1.829 d.064 b. 0. En una muestra aleatoria de 900 vehículos.964 b.771 – 0.639 – 0. Determinar si los siguientes dos tipos de misiles tienen diferencias significativas en sus varianzas a un nivel del 5%: Misil A: 61 lecturas Varianza = 1.237 km2. No hay diferencia significativa pro que Facla > Ftablas 12.782 c. 0.179 d.347 km2. con muestras de 13 y alfa de 0. 2.821 c.826 11. 2. 80% tienen frenos ABS. Misil B: 31 lecturas Varianza = 2. cuando se hace una prueba t de dos colas.711 .05 es: a. 0.Preguntas ejemplo 10. 1. ¿Cuál es el intervalo del 95% para el porcentaje de vehículos con frenos ABS? a.774 – 0.778 – 0. a. 0. El valor crítico para t. Hay diferencia significativa ya que Fcalc < Ftablas b.

I y II d.05.99. II y III 14. Un análisis de varianza de dos vías tiene r niveles para una variable y c niveles para la otra. 2 (r -1) (c – 1) . I. el valor crítico de Chi cuadrada es de 5.9 II.Preguntas ejemplo 13. con dos obseraciones por celda.99 III. rc – 1 d. Sólo I c. Como el valor calaculado de Chi cuadrada en mayor a 5. 2 (r ) (c ) b. Tres personas en entrenamiento se les proporciona el mismo lote de 50 piezas y se les pide que las clasifiquen como buenas o defectuosas. (r-1) (c-1) c. con los resultados siguientes: Persona Defectivos Buenos Total A 17 33 50 B 30 20 50 C 25 25 50 Total 72 78 150 Para determinar si hay o no hay diferencia en la habilidad de las tres personas para clasificar adecuadamente las partes. El valor calculado de Chi cuadrada es de 6. Sólo II b. se rechaza la hipótesis nula a. Los grados de libertad para la interacción son: a. Para un nivel de significancia de 0. ¿cuál de los siguiente es (son) verdadero? I.

II y III b. Las observaciones vienen de poblaciones con vaianzas iguales III.Preguntas ejemplo 15. Las observaciones vienen de poblaciones con medias iguales a. I y III d. Las observaciones vienen de poblaciones normales II. I y II c. Los supuestos básicos del análisis de varianza oncluyen: I. II y III 16. I. El valor teórico esperado para una celda en la tabla de contingencia se calcula como: .

I y III d. Requieren cálculos que son más difíciles que sus equivalentes pruebas paramétricas a. Tienen mayor eficiencia que sus equivalentes pruebas paramétricas II. Requieren supuestos acerca de la forma oi naturaleza de las poblaciones involucradas IV. II y III .Preguntas ejemplo 17. II y IV b. Sólo II c. I. Pueden ser aplicadas a estudios de correlación III. ¿Cuál de las siguientes afirmaciones son verdaderas en relación a las pruebas no paramétricas? I.