You are on page 1of 17

1

2.8 Herramientas Estadsticas de Confiabilidad


2.8.1 Anlisis de Pareto
A finales del siglo XIX, Wilfredo Pareto (1842-1923), ingeniero italiano, construy histogramas
sobre la base de la distribucin de la riqueza en Italia, concluyendo que el 80% de la riqueza del
pas se encontraba en manos del 20% de la poblacin total. Posterior a sus estudios, se pudo
constatar que esta tendencia de distribucin era representativa de una diversidad de datos
poblacionales. La regla de 80/20, as como algunas variaciones como el anlisis ABC (que utiliza
la regla 80/15/5) o el listado de los top ten, son hoy en da una prctica comn en muchos
campos de estudio.
Un ejemplo de esto es su aplicacin en la ingeniera de mantenimiento, donde el anlisis Pareto
es comnmente utilizado para identificar aquellos cdigos de falla ms crticos para las
operaciones, ya sea en trminos del costo de mantencin o de la confiabilidad y disponibilidad
de los equipos.
A continuacin se comentan una serie de caractersticas que ayudan a comprender la naturaleza
de la herramienta.
Priorizacin: Identifica los elementos que ms peso o importancia tienen dentro de un grupo.
Unificacin de Criterios: Enfoca y dirige el esfuerzo de los componentes del grupo de trabajo
hacia un objetivo prioritario comn.
Carcter objetivo: Su utilizacin fuerza al grupo de trabajo a tomar decisiones basadas en
datos y hechos objetivos y no en ideas subjetivas.
2.8.1.1 Tablas y Diagramas de Pareto
2
Las Tablas y Diagramas de Pareto son herramientas de representacin utilizadas para visualizar
el Anlisis de Pareto.
El Diagrama de Pareto es la representacin grfica de la Tabla de Pareto correspondiente.
Las caractersticas fundamentales de las Tablas y los Diagramas de Pareto son:
Simplicidad: Tanto la Tabla como el Diagrama de Pareto no requieren ni clculos complejos ni
tcnicas sofisticadas de representacin grfica.
Impacto visual: El Diagrama de Pareto comunica de forma clara, evidente y de un "vistazo", el
resultado del anlisis de comparacin y priorizacin.
Figura 2.10:
Tabla y Diagrama de Pareto. [4]
2.8.2 Grficos de Dispersin Logartmica
La metodologa de Grficos de Dispersin Logartmica es una metodologa alternativa para la
priorizacin en los planes de mantenimiento.
3
Se sabe que el tiempo total fuera de servicio (TFS) para un determinado cdigo de falla (que se
denomina por la letra i), es producto de dos factores: uno de ellos es el nmero de fallas
imprevistas asociadas a ese cdigo (ni) y el otro es el tiempo medio asociado al diagnstico y
reparacin (MTTRi).
Ecuacin 9 [2]
La figura 2.11 muestra una representacin grfica del nmero de fallas imprevistas y del Tiempo
Medio Para Reparar (MTTR), para distintos cdigos de fallas (1,2,3,,17):
0
20
40
60
80
100
0 20 40 60
Nmero de Fallas
M
T
T
R
CURVAS DE TFS
CONSTANTES: Familia de
Hiperbolas
1
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
Figura 2.11: Grfico de Dispersin x-y del MTTR vs. Nmero de Fallas. [4]
Un aspecto que representa una desventaja del grfico de dispersin es que las curvas de TFS
constante son hiprbolas, que en general son muy difciles de trazar. Para evitar lo anterior, se
propone como solucin la aplicacin del logaritmo de la ecuacin, con lo que se obtiene lo
siguiente:
Ecuacin 10 [2]
Si se construye un grfico de dispersin x-y con los ejes ajustados a escala logartmica, como se
aprecia en la figura 2.12, las isoclinas de TFS constante tendrn ahora la forma de rectas con
pendiente negativa.
i i i
MTTR n TFS
( ) ( ) ( )
i i i
MTTR n TFS log log log +
4
Figura 2.12: Grfico de Dispersin Logartmica del MTTR vs. Nmero de Fallas. [4]
Esto facilita de gran manera el proceso de trazado de las curvas de TFS constante. Adems,
permite determinar cul de los factores, MTTRi o ni, es el dominante en el tiempo de detencin.
Si se considera que aquellas fallas que tienen un tiempo medio de reparacin muy largo son del
tipo agudas, mientras que aquellas fallas que presentan un alto nivel de ocurrencia son del tipo
crnicas, mediante la determinacin de valores lmites para el MTTR y n, el grfico de dispersin
logartmica puede ser dividido en cuatro cuadrantes, como se aprecia en la figura 2.13:

1,0
10,0
100,0
1 10 100
Nmero de Fallas
T
M
F
S
17 16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Agudas y
Crnicas
Agudas
28.9
Crnicas
15.9
Bajo Control
Figura 2.13: Grfico de
Dispersin Logartmica Mostrando Valores Lmites.[4]
1,0
10,0
100,0
1 10 100
Nmero de Fallas
M
T
T
R
Rectas de TFS constante
5
Los cuadrantes superiores representan la zona de fallas agudas, mientras que los cuadrantes
del lado derecho representan una zona de fallas crnicas. El cuadrante superior derecho
representa una zona de fallas agudas y crnicas simultneamente.
Los valores lmites, denominados umbrales, pueden ser valores absolutos asignados por poltica
interna de la empresa o bien pueden obtenerse empricamente, sobre la base de valores
relativos de los datos de reparacin.
Una manera de definir los umbrales es a travs de valores promedios. Se puede definir el tiempo
total fuera de servicio consumido por fallas imprevistas como:
Ecuacin11 [2]
Donde di es el tiempo total fuera de servicio debido al i-simo cdigo de falla. El nmero total de
fallas imprevistas es:
Ecuacin 12 [2]
Sea Q el nmero de distintos cdigos de falla utilizados para categorizar los datos de reparacin.
El umbral lmite para fallas crnicas puede ser definido entonces como:

Ecuacin 13 [2]
El umbral lmite para fallas agudas puede ser determinado como:
N
D
Lim
TMPR

Ecuacin 14 [2]
La clasificacin de los tipos de falla en los grficos de dispersin logartmica provee una sencilla
manera de identificar problemas de confiabilidad, disponibilidad y mantenibilidad. Es comn
utilizar al tiempo medio entre fallas (TMEF) como un ndice de la confiabilidad. Por otro lado, la
disponibilidad, confiabilidad y mantenibilidad de los equipos se encuentran relacionados a travs
de la siguiente aproximacin:

i
i
d D

i
i
n N
Q
N
Lim
n

6
MTTR TMEF
TMEF
idad Disponibil
+

Ecuacin 15 [2]
Esta relacin muestra que la disponibilidad de los equipos que puede ser mejorada
incrementando el TMEF, disminuyendo el MTTR, o mediante una combinacin de ambas
acciones.
Las fallas crnicas son aquellas que ms contribuyen al nmero de fallas observadas (N). Estas
son entonces las fallas que ms afectan la confiabilidad del procesos que se analizar (figura
2.14). Encontrar soluciones a la causa raz de estas fallas sera la manera ms eficiente de
incrementar el TMEF del equipo o proceso y por lo tanto podra esperarse que se viera mejorada
la disponibilidad del proceso. Si fuese posible eliminar estas fallas, el TMPR resultante del resto
de los cdigos de falla se vera incrementado. Luego, de acuerdo a la ecuacin de
disponibilidad, el efecto de incrementar el TMEF se vera opacado por el incremento del TMPR,
lo que producira un efecto reducido en trminos de mejorar la disponibilidad.
1,0
10,0
100,0
1 10 100
Nmero de Fallas
T
M
F
S
17 16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Agudas y Crnicas
Agudas
28.9
Crnicas
15.9
Confiabilidad
M
T
T
R
1,0
10,0
100,0
1 10 100
Nmero de Fallas
T
M
F
S
17 16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Agudas y Crnicas
Agudas
28.9
Agudas Agudas
28.9
Crnicas
15.9
Crnicas Crnicas
15.9
Confiabilidad
M
T
T
R
Figura 2.14:
Problemas de confiabilidad de equipos. [4]
Similarmente, la figura 2.15 muestra aquellas fallas que ms afectan la disponibilidad del
proceso o equipo. En este caso el umbral queda establecido por un lmite en el tiempo fuera de
servicio, que se representa a travs de una de sus isoclinas. Al igual que los umbrales antes
establecidos, este valor puede ser absoluto o relativo a los datos. En este caso se ha escogido el
lmite que pasa por la interseccin de los umbrales de frecuencia de falla y del TMPR, que
corresponde a:
7
Q D Lim
TFS
/
Ecuacin 16 [2].
Encontrando solucin a la causa raz de las fallas situadas por sobre este lmite incrementar la
disponibilidad del proceso.
1,0
10,0
100,0
1 10 100
Nmero de Fallas
T
M
F
S
17 16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Agudas y Crnicas
Agudas
28.9
Crnicas
15.9
M
T
T
R
D
i
s
p
o
n
i
b
i
l
i
d
a
d
1,0
10,0
100,0
1 10 100
Nmero de Fallas
T
M
F
S
17 16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Agudas y Crnicas
Agudas
28.9
Agudas Agudas
28.9
Crnicas
15.9
Crnicas Crnicas
15.9
M
T
T
R
D
i
s
p
o
n
i
b
i
l
i
d
a
d
Figura 2.15:
Problemas de disponibilidad de equipo. [4]
La figura 2.16 representa las fallas agudas del proceso que ms afectan la mantenibilidad,
mientras que la figura 2.17 muestra el efecto combinado de los lmites de confiabilidad,
disponibilidad y mantenibilidad. Aqu se puede ver que si bien, eliminar los cdigos de falla 15,
16 y 17 puede reducir el TMEF, la disponibilidad del proceso no se ver mayormente afectada,
pues estos cdigos de falla no ocurren de manera frecuente.
1,0
10,0
100,0
1 10 100
Nmero de Fallas
T
M
F
S
17 16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Agudas y Crnicas
Agudas
28.9
Crnicas
15.9
Mantenibilidad
M
T
T
R
1,0
10,0
100,0
1 10 100
Nmero de Fallas
T
M
F
S
17 16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Agudas y Crnicas
Agudas Agudas
28.9
Crnicas
15.9
Crnicas Crnicas
15.9
Mantenibilidad
M
T
T
R
Figura 2.16:
Problemas de mantenibilidad de equipos. [4]
8

1,0
10,0
100,0
1 10 100
Nmero de Fallas
T
M
F
S
17 16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Agudas y Crnicas
Agudas
28.9
Crnicas
15.9
M
T
T
R
1,0
10,0
100,0
1 10 100
Nmero de Fallas
T
M
F
S
17 16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Agudas y Crnicas
Agudas
28.9
Agudas Agudas
28.9
Crnicas
15.9
Crnicas Crnicas
15.9
M
T
T
R
Figura
2.17: Problemas de confiabilidad, disponibilidad y mantenibilidad de equipos. [4]
Existe otra buena razn para identificar las fallas agudas aparte del criterio de tiempo fuera de
servicio, y es que la reparacin de estas fallas son generalmente ms caras. Es ms, no slo el
costo directo de reparacin es mayor sino que tambin el Costo de Oportunidad por Prdida de
Produccin por falla.
De esta manera, al separar los problemas de tipo crnico de los de tipo agudo, el departamento
de mantenimiento de una compaa minera puede contestar ms fcilmente qu tipos de falla se
deben priorizar para mejorar ptimamente el negocio minero.
En algunas industrias, las consecuencias econmicas (costo de oportunidad, extensin de
costos fijos, costo de niveles de inventario subptimos y costo de sobredimensionamiento) de
una detencin imprevista pueden ser relativamente ms importantes que los costos directos de
reparacin y mantenimiento. En la industria minera, por ejemplo, para ciclos de alto precio del
metal, el costo de oportunidad por prdida de produccin puede ser ms significativo que los
costos de reparacin. En este caso es deseable priorizar la produccin, es decir la confiabilidad
y disponibilidad del equipo, por sobre la mantenibilidad (asociada a los costos).
Sin embargo, cuando el precio del cobre cae, el costo de produccin pasa a ser un factor de
mayor importancia en cuanto a los mrgenes de venta alcanzables por la empresa. En este
escenario, los esfuerzos de mantenimiento deben dirigirse tanto a controlar y reducir los costos
de mantenimiento y reparacin como a asegurar una buena confiabilidad y disponibilidad.
2.8.2.1 Evolucin de Falla
9
Este mtodo permite graficar la evolucin de un cdigo de falla en particular, para ms de un
perodo de tiempo (ver ejemplo en figura 2.18), lo que es muy til para identificar cdigos de falla
que presentaran prioridad en los planes de mantenimiento programado, adems permite evaluar
la gestin del departamento de mantenimiento.
Figura 2.18: Grfico de Evolucin de Fallas. [4]
Para realizar esta priorizacin se deben realizar los siguientes pasos:
Tomar los ltimos dos perodos de tiempo de los cdigos de falla de algn equipo o proceso.
Obtener el nmero de fallas, el MTTR y el TFS total, para cada cdigo de categora y para cada
perodo.
Establecer si la diferencia entre el nmero de fallas, MTTR y TFS total, sube o baja.
Dependiendo de estos factores se le asigna una clase a la falla, tal como se muestra en la
figura 2.19:
10
Figura 2.19: Tabla
de designacin de clase. [4]
Los cdigos de fallas del ltimo periodo estudiado se grafican utilizando el mismo sistema de los
grficos de dispersin con la nica diferencia que las fallas crnicas se dividen en 2 grupos (A y
B), como se indica en la figura 2.20.
En A se encuentran las fallas que tienen TFS directo superior al mltiplo de n y MTTR
establecidos como umbrales.
En B se encuentran las fallas que individualmente tienen tiempos pequeos de reparacin, pero
que podran tener costos ocultos importantes.
Figura 2.20: Clasificacin de fallas. [4]
11
Entonces la prioridad del cdigo de falla va a depender de la clase y el cuadrante del ltimo
periodo en que se encuentre ste (ver figura 2.21). Las prioridades se clasifican en: alta
(otorgndole a la falla el valor 1), media (concedindole a la falla valor 2) y baja (adjudicndole a
la falla el valor 3)
Figura 2.21: Tabla de Prioridades. [4]
Esta prioridad es de gran importancia para la planificacin a corto plazo del mantenimiento
programado.
2.8.3 Distribucin de Weibull
La distribucin de Weibull es una de las herramientas ms utilizadas en estimaciones de
supervivencia, en este caso es usada en relacin a las fallas aparecidas en determinado
sistema. Tiene la ventaja de ser muy flexible y adaptable a una variedad de observaciones
experimentales, su funcin general es
( )

) / ) ((
1
) (

]
]
]



t
e
t
t f Ecuacin 17 [2]

Dnde,
, 0 ) ( t f
Ecuacin 18 [2]
, t
Ecuacin 19 [2]
12
, 0 >
Ecuacin 20 [2]
, 0 >
Ecuacin 21 [2]
, < <
Ecuacin 22 [2]
y,
= parmetro de escala,
= parmetro de forma (o pendiente),
= parmetro de ubicacin.
En la prctica varia entre el intervalo 1/3 a 5. El parmetro de escala se relaciona con lo
puntiagudo de la curva es decir conforme cambia la curva es ms plana o ms puntiaguda.
El parmetro de localizacin es el valor ms pequeo de X, con frecuencia se supone que
este es 0, lo que simplifica la ecuacin, pero debe ser calculado experimentalmente.
En la prctica > 0 es la duracin de la vida a la cual el 63,2% de la poblacin fallara.
Si se integra f(t) se obtiene la funcin de distribucin acumulada de fallas que corresponde a:

) / ) ((
1 ) (


t
e t F Ecuacin 23 [2]
Ahora se vera como es posible linealizar la distribucin acumula de fallas.
Primero se debe asumir que = 0 es equivalente al origen del tiempo para la ley es el mismo
que el de las observaciones (por lo tanto se tiene una distribucin de Weibull de 2 parmetros):

) / (
) ( 1
t
e t F

Ecuacin 24 [2]

) / (
1
) ( 1
t
e
t F


Ecuacin 25 [2]

) / (
) ( 1
1
t
e
t F

Ecuacin 26 [2]

Aplicando logaritmo natural, la ecuacin 26 queda de la forma:


ln ln
) ( 1
1
ln ln
]
]
]

]
]
]

t
t F
Ecuacin 27 [2]
13
Esta ecuacin queda de la forma de una recta y = mx c
con ]
]
]

]
]
]

) ( 1
1
ln ln
t F
y
, Ecuacin 28 [2]
m
, Ecuacin 29 [2]
ln c
. Ecuacin 30 [2]
Por lo tanto los parmetros de la funcin se pueden calcular mediante una regresin lineal.
De la funcin de distribucin acumulada de fallas se obtiene:
Funcin de Confiabilidad
) ( 1 ) ( t F t R
Ecuacin 31 [2]
Reemplazando la ecuacin 23 en la 31 se obtiene

) / (
) (
t
e t R

Ecuacin 32
Distribucin de Falla (t)
) ( 1
) (
) (
t F
t f
t


Ecuacin 33 [2]
Reemplazando la ecuacin 17 y la ecuacin 23 en la ecuacin 33 se obtiene
1
) (

,
`

.
|

t
t Ecuacin 34
2.8.4 Test de comprobacin de Kolmogorov-Smirnov (K-S)
En esta prueba tambin se est interesado en el grado de concordancia entre la distribucin de
frecuencia muestral y la distribucin de frecuencia terica, bajo la hiptesis nula de que la
distribucin de la muestra es f0(x,q) e interesa probar que no existe diferencia significativa. La
prueba trabaja con la funcin de distribucin (distribucin de frecuencia acumulativa). Esta
prueba pertenece al campo de la Estadstica No Paramtrica.
14
Sea F0(x) la funcin de distribucin terica para la variable aleatoria X, y representa la
probabilidad de que la variable aleatoria X tome un valor menor o igual a x (tambin se interpreta
como la proporcin esperada de observaciones que tengan un valor menor o igual a x).
Es decir:
Sea Sn (x) la funcin de distribucin emprica, calculada con base en los valores observados de
la muestra n observaciones. Sn (x) representa la proporcin de valores observados que son
menores o iguales a x, y est definida como:
Sn (x) = P (X x/ dados los resultados muestrales) = m/n, Ecuacin 35 [2]
donde m es el nmero de valores observados que son menores o iguales a x.
En la prueba de Smirnov-Kolmogorov se est interesado en la mayor desviacin entre la funcin
de distribucin terica y la emprica, es decir entre F0 (x) y Sn(x), para todo el rango de valores de
x. Bajo la hiptesis nula se espera que estas desviaciones sean pequeas y estn dentro de los
lmites de errores aleatorios. Por lo tanto, en la prueba K-S se calcula la mayor desviacin
existente entre F0 (x) y Sn(x), denotada por Dmax(x) y est dada por:
Dmax(x) = Max | F0 (x) - Sn (x) | Ecuacin 35 [2]
La distribucin de Dmax(x) es conocida y depende del nmero de observaciones n. Se acepta la
hiptesis nula de que no existe diferencia significativa entre las distribuciones tericas y
empricas si el valor de Dmax(x) es menor o igual que el valor crtico Dmaxp( ,n). (Ver tabla para
valores crticos).
Vale decir:
Dmax(x) < Dmaxp( ,n) Ecuacin 36 [2]
Tabla 2.3: Valores Crticos de Distribucin de Kolmogorov-Smirnov para distintos niveles de
significancia. [2]
15
Esta prueba se puede realizar para valores agrupados en intervalos de clase y tambin para
valores sin agrupar.
El procedimiento general para realizar esta prueba para valores agrupados en intervalos de
clase es el siguiente:
1) Especificar la distribucin nula es f0(x,q), y estimar sus parmetros si es necesario.
2) Organizar la muestra en una distribucin de frecuencia, en intervalos de clase.
16
3) Con base en la distribucin observada de frecuencia, se calcula la distribucin acumulativa
Sn(Xi) = mi/n, siendo Xi el lmite superior del intervalo de clase, y mi el nmero de valores de la
muestra menores o iguales que Xi. Sn(Xi) corresponde simplemente a la frecuencia relativa
acumulada hasta el intervalo i.
4) Se calcula la funcin de distribucin terica F0 (Xi).

5) Para cada intervalo de clase se calcula la diferencia entre F0 (Xi ) y Sn (Xi), y se busca la
mxima Dmax = Max | F0 (Xi) - Sn (Xi) |, i = 1, 2, , k.
6) Se busca en la tabla el valor crtico Dmaxp( ,n) con el nivel de significancia . Si el valor
observado Dmax es menor o igual que el valor crtico, entonces se acepta la hiptesis nula de que
no existen diferencias significativas entre la distribucin terica y la distribucin dada por los
resultados muestrales, es decir, que los valores generados siguen la distribucin que se haba
supuesto.
Cuando la muestra es pequea y/o los valores no se van a organizar en intervalos de clase el
procedimiento es similar, slo que el paso 2 se cambia por ordenar los valores de la muestra
en forma ascendente, de menor a mayor, y en los pasos 3 y 4 se calculan las funciones de
distribucin terica y emprica para cada valor de la muestra.
Por ejemplo: Suponer que se generan por medio de una funcin terica R(i) cinco nmeros y
que se desea ejecutar el test de K-S para un nivel de significancia = 0,05.
Orden cronolgico:
R(1) R(2) R(3) R(4) R(5)
0,03 0,58 0,87 0,32 0,95
Solucin:
mi = 1, 2, 3, 4, 5.
n = 5
Orden numrico creciente:
F0(x1) F0(x2) F0(x3) F0(x4) F0(x5)
0,03 0,32 0,58 0,87 0,95
17
Ejemplo del clculo de la distribucin acumulativa Sn(Xi) = mi/n
Sn(X1) = 1/5 = 0,2
Ejemplo del Clculo de la desviacin entre F0(X1) y Sn(X1)
D = | 0,03 0,2 | = 0,17
En la tabla 2.4 se aprecia la evaluacin completa del ejemplo:
Tabla 2.4: Ejemplo de evaluacin del test de Kolmogorov Smirnov.
D. Terica
F0(Xi)
0,03 0,32 0,58 0,87 0,95
D. Acumulativa
Sn(Xi) = mi/n
0,2 0,4 0,6 0,8 1
Dmax = Max | F0 (Xi) - Sn (Xi)| 0,17 0,08 0,02 0,07 0,05
Se observa en la tabla que la mxima desviacin entre la distribucin terica y la distribucin
acumulativa es 0,17.
El valor crtico que se obtiene de la tabla 2.5 para un nivel de significancia = 0,05 y n = 5 es
Dmaxp(0,05;5) = 0,842. Por lo tanto se cumple la condicin
Dmax(x) < Dmaxp( ,n)
0,17 < 0,842
Con lo que se aprueba la hiptesis nula de que no existen diferencias significativas entre la
distribucin terica y la distribucin dada por los resultados muestrales.