You are on page 1of 17

STATGRAPHICS – Rev.

4/25/2007

Análisis de Weibull

Resumen
El procedimiento del Análisis de Weibull está diseñado para ajustar una distribución de Weibull
a un conjunto de n observaciones. Es comúnmente usado para analizar datos representando
tiempos de vida o tiempos hasta que se presente error. Los datos pueden incluir censura en los
cuales algunas veces los errores no son conocidos exactamente debido al desplazamiento de
algunos objetos de la prueba. La distribución se grafica y los percentiles estimados son
mostrados.
Si se desea, se pueden especificar los datos para más de un grupo. En tales casos, una estimación
aparte de la distribución para cada grupo será derivada.

StatFolio de Muestra: Weibull analysis.sgp

Datos de Muestra:
El archivo absorbers.sf3 contiene los datos de una prueba de vida sobre de n = 38
amortiguadores de choques, reportada por Meeker y Escobar (1998). Una parte de los datos se
muestra abajo:

Distance Censores
(Distancia) (Censurado)
6700 0
6950 1
7820 1
8790 1
9120 0
9660 1
9820 1
11310 1
11690 1
11850 1
11880 1
12140 1
… …
28100 1

La columna Distance representa el número de kilómetros de uso de cada amortiguador cuando


fue inspeccionado. La columna Censored contiene un 0 para cada amortiguador que había
fallado en el momento de la inspección y un 1 para cada amortiguador que no falló. Todos los
datos contienen información acerca del momento hasta se presentó una falla en los
amortiguadores. Para aquellos que habían fallado, la observación es un momento de error
verdadero. Para aquellos que no habían fallado, la observación es un error censurado a la derecha
hasta el momento en cual el error conocido va a ser mayor que el valor indicado.

© 2006 por StatPoint, Inc. Análisis de Weibull - 1


STATGRAPHICS – Rev. 4/25/2007

Captura de Datos
El cuadro de diálogo de captura de datos requiere información acerca de los momentos de los
errores y su estado:

• Datos: columna numérica con los n momentos observados n veces.

• Censurados: columna numérica de 0´s y 1´s . Un 0 indica que la observación no está


censurada y por lo tanto representa un momento verdadero hasta el momento en que se
presenta el error. Un 1 indica que la observación está censurada a la derecha con el momento
en que se presenta el error conocido solamente si es mayor a lo indicado.

• Selección: selección del subconjunto.

© 2006 por StatPoint, Inc. Análisis de Weibull - 2


STATGRAPHICS – Rev. 4/25/2007

Resumen del Análisis


El Resumen del Análisis muestra una tabla que exhibe la distribución de Weibull ajustada:

Análisis Weibull - Distance


Datos/Variable: Distance
Censura: Censored
Método de Estimación: máxima verosimilitud

Tamaño de muestra = 38
Número de fallas = 11
Forma estimada = 3.16047
Escala estimada = 27718.7
Umbral especificado = 0.0

La distribución de Weibull de 3 parámetros tiene una función de densidad de probabilidad


definida por:

α
f ( x) = α
(x − θ )α −1 exp[− (x − θ ) / β ]α (1)
β

Tiene 3 parámetros:

1. Parámetro Forma α > 0


2. Parámetro Escala β > 0
3. Parámetro Inicio θ

El rango de valores para la variable aleatoria X ≥ θ. La media y la varianza de la distribución de


Weibull son:

β ⎛1⎞
E( X ) = θ + Γ⎜ ⎟ (2)
α ⎝α ⎠

β2
V(X) = α [ 2Γ ( ) ( )]
2
α
1
− Γ
α
1 2
α (3)

Frecuentemente el parámetro inicio θ se fija en 0, lo que resulta en la distribución de Weibull de


2 parámetros.

La tabla del Resumen del Análisis muestra:

• Tamaño de muestra – el número total de observaciones n.

• Número de fallas – el número de observaciones que corresponden a los momentos de


error no censurados.

• Forma y Escala Estimadas – las estimaciones de los parámetros de la forma y escala, α̂


y β̂ .

© 2006 por StatPoint, Inc. Análisis de Weibull - 3


STATGRAPHICS – Rev. 4/25/2007

• Umbral especificado - el valor del parámetro inicio. Dependiendo de las


especificaciones en el cuadro de diálogo Opciones de Análisis, éste parámetro puede ser
estimado de los datos o especificado por el usuario.

• Método de estimación – el método usado para estimar los parámetros. El método


predeterminado es de máxima verosimilitud el cual es el mismo método usado por los
procedimientos de Ajuste de Distribución, sin embargo otros métodos pueden ser
requeridos en el cuadro de diálogo Opciones de Análisis.

Opciones de Análisis
El cuadro de diálogo Opciones de Análisis controla cómo los parámetros de la distribución de
Weibull son estimados:

• Umbral Inferior: Especifica un valor para el parámetro inicio θ, o solicita que sea estimado
de los datos. Si se estima θ, el usuario debe seleccionar el método de máxima verosimilitud.

• Método de Estimación: el método usado para estimar los parámetros. Están disponibles tres
opciones:

1. Regresión por Rangos – Ajusta una línea a los datos en la Gráfica de Weibull al regresar
n valores ln(Xi-θ) contra los posiciones graficadas especificadas en el cuadro de diálogo.

2. Máxima Verosimilitud - Estima los parámetros maximizando la función de verosimilitud.

© 2006 por StatPoint, Inc. Análisis de Weibull - 4


STATGRAPHICS – Rev. 4/25/2007

3. Weibayes - Estima el parámetro de la escala suponiendo que los parámetros de inicio y


forma son conocidos e igual a los valores indicados en el cuadro de diálogo.

• Posición en Gráfica – define las posiciones de graficación verticales en la gráfica de


Weibull. Esto también afecta los parámetros estimados si el método Regresión del Rango ha
sido seleccionado. El método predeterminado es Kaplan-Meier Modificado. Ver la sección
Cálculos para las definiciones de las diferentes opciones.

Gráfica de Weibull
La Gráfica de Weibull muestra cómo los momentos de error no censurados graficados sobre una
escala logarítmica en el eje horizontal X. Las posiciones de graficación del eje vertical se definen
en las Opciones de Análisis.

Gráfica Weibull

99.9
99
90 Est.: MLE
Forma: 3.16047
porcentaje acumulado

70
50 Escala: 27718.7
30 Umbral: 0.0
20
10 Fallas: 11
5 Tamaño de muestra: 38

1
0.5

0.1
1000 10000 100000
Distance

Si los datos provienen de una distribución de Weibull, los puntos deben caer aproximadamente a
lo largo de una línea recta sobre esta gráfica la cual corresponde a la distribución de Weibull
ajustada.

© 2006 por StatPoint, Inc. Análisis de Weibull - 5


STATGRAPHICS – Rev. 4/25/2007
Cuadro de Opciones

• Intervalos de Confianza - añade intervalos de confianza al radio de verosimilitud para Xp, el


p-ésimo percentil de la distribución de Weibull.

• Percentil - calcula y muestra el seleccionado percentil.

• Histograma de Valores Censurados – añade un histograma de los valores de datos


censurados.

Ejemplo: Gráfica mostrando Bandas de Confianza, 90vo Percentil, y el Histograma Censurado

Gráfica Weibull

99.9
99
90.0 Est.: MLE
90
Forma: 3.16047
porcentaje acumulado

70
50 Escala: 27718.7
30 Umbral: 0.0
20
10 Fallas: 11
5 Tamaño de muestra: 38

1
0.5

36089.5 [29146.8,56446.6]
0.1
1000 10000 100000
Distance

© 2006 por StatPoint, Inc. Análisis de Weibull - 6


STATGRAPHICS – Rev. 4/25/2007
vo
El 90 percentil de Distancia es estimado para ser aproximadamente 36,090 km. Los límites de
confianza del 95% se extienden sobre un rango de 29,147 km a 56,447 km, correspondientes a
las bandas alrededor de la línea ajustada.

Histograma de Frecuencias
El Histograma de Frecuencias muestra la distribución de las observaciones junto con la función
de densidad estimada.

Distribución Weibull Ajustada

20
No Censurados
16 Censurados
porcentaje

12

0
1000 10000 100000
Distance

La presencia de muchos valores censurados causa que la curva se incline sobre la derecha del
histograma observado.

Opciones del Cuadro de Diálogo

• Número de clases: el número de intervalos dentro de los cuales los datos serán divididos.
Los intervalos son adyacentes el uno al otro y de igual amplitrud (antes de que el logaritmo
sea calculado). El número de intervalos dentro de los cuales los datos se agrupan de manera
predeterminada es colocado por la regla especificada en la tabulación EDA del cuadro de
diálogo Preferencias en el menú Edición.
© 2006 por StatPoint, Inc. Análisis de Weibull - 7
STATGRAPHICS – Rev. 4/25/2007

• Límite Inferior: límite inferior del primer intervalo.

• Límite Superior: límite superior del último intervalo.

• Mantener: mantiene el número seleccionado de intervalos y límites aún si la fuente de los


datos cambia. De manera predeterminada, el número de clases y los límites son recalculados
en cuanto los datos cambian. Esto es necesario para que todas las observaciones sean
mostradas aún si algún dato actualizado cae más allá de los límites originales.

• Número de Grupo: si más de un grupo de datos ha sido ajustado, el número del grupo será
mostrado.

• Escala Log para el Eje X: Si el eje horizontal debería ser mostrado usando escala
logarítmica.

Prueba de Bondad de Ajuste


El cuadro Prueba de Bondad de Ajuste realiza hasta 7 diferentes pruebas para determinar si o no
los datos podrían razonablemente provenir de una distribución de Weibull. Para todas las pruebas
las hipótesis de interés son:

• Hipótesis Nula: los datos son muestras independientes de la distribución de Weibull


estimada.

• Hipótesis Alternativa: los datos no son muestras independientes de la distribución de


Weibull estimada.

Las pruebas que se van a realizar son seleccionadas usando Opciones de Cuadro.

Pruebas de Bondad-de-Ajuste para Distance


D de Kolmogorov-Smirnov Modificada
Weibull
D 0.0901357
Forma Modificada 0.568059
Valor-P >=0.10

Pequeños P-Values (menores que 0.05 si se opera en un nivel de significancia de 5%) conducen
a rechazar la distribución de Weibull. En el ejemplo actual, el P-Value es grande lo que sugiere
que la distribución de Weibull es un modelo razonable para los datos.

Las pruebas de Bondad de Ajuste son descritas con detalle para datos no censurados en la
documentación para Ajustes de Distribución (Datos no Censurados) y para datos censurados en
Ajuste de la Distribución (Datos Censurados).

© 2006 por StatPoint, Inc. Análisis de Weibull - 8


STATGRAPHICS – Rev. 4/25/2007
Opciones del Cuadro de Diálogo

• Incluir – selecciona las pruebas a ser incluidas. Las pruebas disponibles dependen del tipo de
censura.

• Calcula la distribución para P-Values específicos – si se verifica los P-Values estarán


basados en las tablas o fórmulas específicamente desarrolladas para la distribución de
Weibull. De otro modo, los P-values estarán basados en una tabla general o fórmula que se
aplica para todas las distribuciones. El acercamiento general es más conservador (no
rechazará una distribución tan fácilmente) pero puede ser preferido cuando se comparan P-
Values entre diferentes distribuciones.

• Censura – selecciona el tipo de datos censurados. Los tipos se definidos como:

Aleatorio – indica que los valores de los datos han sido aleatoriamente censurados. El
censuramiento aleatorio ocurre cuando los valores son censurados por varias razones y no
caen en el mecanismo del Tipo I o II.

Tipo I – indica que los datos son “momento-censurados”, por ejemplo cuando se han
removido datos de la prueba en un momento predeterminado. Si este tipo de
censuramiento es seleccionado todos los valores censurados deben ser iguales o un
mensaje de error será generado.

Tipo II – indica que la prueba fue parada después de que un predeterminado número de
errores ha ocurrido. Si se selecciona este tipo de censuramiento, todos los valores
censurados deben ser iguales o un mensaje de error será generado.

© 2006 por StatPoint, Inc. Análisis de Weibull - 9


STATGRAPHICS – Rev. 4/25/2007

Función de Densidad
Esta grafica muestra la función de densidad de probabilidad estimada f(x):

Distribución Weibull
(X 0.00001)
5

4
densidad

0
1000 10000 100000
Distance

La función de densidad puede ser usada para determinar la probabilidad de que el momento de
error de un suceso se encuentre dentro de un intervalo especificado.

Opciones del Cuadro de Diálogo

• Escala Log para el Eje X: si es seleccionado una escala log será usada para el eje horizontal.

© 2006 por StatPoint, Inc. Análisis de Weibull - 10


STATGRAPHICS – Rev. 4/25/2007
CDF
La Función de Distribución Acumulada (CDF) muestra la probabilidad estimada de que un dato
que ha fallado en el tiempo t:

Distribución Weibull

1
probabilidad acumulada

0.8

0.6

0.4

0.2

0
1000 10000 100000
Distance

Se incrementa de 0.0 en θ a 1.0 en valores grandes de X.

Función de Supervivencia
La Función de Supervivencia grafica la probabilidad estimada de que un suceso sobrevivirá o
durará hasta el tiempo t:

Distribución Weibull

1
probabilidad de supervivencia

0.8

0.6

0.4

0.2

0
1000 10000 100000
Distance

Decrece de 1.0 en θ a 0.0 en valores grandes de X.

© 2006 por StatPoint, Inc. Análisis de Weibull - 11


STATGRAPHICS – Rev. 4/25/2007

Función de Supervivencia Log


La Función de Supervivencia Log es el logaritmo natural de la función de supervivencia:

Distribución Weibull

3
prob. de log supervivencia

-7

-17

-27

-37
1000 10000 100000
Distance

Función de Riesgo
La Función de Riesgo es una estimación de la tasa instantánea de error:

Distribución Weibull
(X 0.0001)
15

12

9
riesgo

0
1000 10000 100000
Distance

Las unidades de la función de riesgo son la fracción de errores por unidad de tiempo. Si el
parámetro de forma estimado β̂ < 1, la función de riesgo será monotéticamente decreciente. Si
β̂ > 1, la función de riesgo será monotéticamente creciente. Si β̂ = 1, la función de riesgo será
constante.

© 2006 por StatPoint, Inc. Análisis de Weibull - 12


STATGRAPHICS – Rev. 4/25/2007

Áreas de las Colas


Este cuadro muestra el valor de la distribución acumulada hasta para 5 valores de X.
Areas de las Colas para Distance
X Área Cola Inferior (<) Área Cola Superior (>)
10000.0 0.0390841 0.960916
20000.0 0.299858 0.700142
30000.0 0.723066 0.276934
40000.0 0.958716 0.0412835
50000.0 0.998423 0.00157716

The table displays:

• Área de la Cola Inferior – la probabilidad de que la variable aleatoria sea menor que o
igual a X.

• Área de la Cola Superior – la probabilidad de que la variable aleatoria sea mayor que X.

Por ejemplo, la probabilidad de ser menor que o igual a X = 30,000 es aproximadamente 72.3%.

Opciones del Cuadro de Diálogo

• Valores Críticos: valores de X en los cuales la probabilidad acumulada será calculada.

© 2006 por StatPoint, Inc. Análisis de Weibull - 13


STATGRAPHICS – Rev. 4/25/2007

Valores Críticos
Este cuadro calcula el valor de la variable aleatoria X debajo del cual yace una probabilidad
especificada.

Valores Críticos para Distance


X Área Cola Inferior (<) Área Cola Superior (>)
6466.15 0.01 0.99
13600.0 0.1 0.9
24683.6 0.5 0.5
36089.5 0.9 0.1
44939.6 0.99 0.01

La tabla muestra el valor de X tal que la probabilidad de ser menor que o igual a X es igual al
área deseada de la cola. La tabla de arriba muestra que el c.d.f. de la distribución de Weibull
ajustada es igual a 50% en X = 24,683.6.

Opciones de Cuadro

• Áreas de Colas: valores del c.d.f. en los cuales se determinan los percentiles de las
distribuciones ajustadas.

© 2006 por StatPoint, Inc. Análisis de Weibull - 14


STATGRAPHICS – Rev. 4/25/2007
Cálculos

Estimación Usando el Método de Regresión del Rango


Regresar ln(Xi-θ) versus las posiciones graficadas especificadas en Opciones de Análisis. Los
parámetros de forma y escala son estimados a partir del intercepto y la pendiente de la línea
ajustada de acuerdo con:

1
αˆ = (4)
slope
β̂ = exp(intercept) (5)

Estimación Usando Método de Máxima Verosimilitud


Las estimaciones son obtenidas por maximización numérica de la función de verosimilitud.

n
L = ∏ l( X i ) (6)
i =1

donde

⎧ f (Xi ) uncensored
l( X i ) = ⎨ si Xi es (7)
⎩1 − F ( X i ) right − censored

Estimación Usando Método de Weibayes


Si no hay errores, el parámetro de escala es estimado por

1/ α
⎧ n ⎫
⎪⎪ ∑ ( X i − θ )
α
⎪⎪
βˆ = ⎨ i =1 ⎬ (8)
⎪ − ln(0.05) ⎪
⎪⎩ ⎪⎭

El cual es una banda de confianza inferior del 95% para β. De otra manera:

1/α
⎡ n ⎤
⎢∑(X i −θ )
α

βˆ = ⎢ i =1 ⎥ (9)
⎢ d ⎥
⎢⎣ ⎥⎦

donde d es el número de momentos de error no censurados.

Posiciones de Graficación: Rangos de Medias


Los datos se ordenan del más pequeño al más grande y se asignan a un rango ajustado ji = ji-1 +
Δ, donde Δ = 1 inicialmente y es modificado en cada momento censurado de acuerdo con:
© 2006 por StatPoint, Inc. Análisis de Weibull - 15
STATGRAPHICS – Rev. 4/25/2007

(n+1) – rango ajustado del error previo


Δ = ----------------------------------------------------------------- (10)
1 + número de observaciones más allá del dato censurado

Las posiciones de graficación están dadas por:

j i − 0.3
Fi = (11)
n + 0.4

Posiciones de Graficación: Rangos esperados


Los datos se ordenan primero en orden inverso, por ejemplo, r1 = n, …, rn = 1. Las estimaciones
se calculan de la forma

⎡ r ⎤
Ri = ⎢ i ⎥ Ri −1 (12)
⎣ ri + 1⎦

donde R0=1, y las posiciones de graficación son Fi = (1-Ri).

Posiciones de Graficación: Kaplan-Meier


Similar a los rangos esperados, excepto en
⎡ r − 1⎤
Ri = ⎢ i ⎥ Ri −1 (13)
⎣ ri ⎦

Posiciones de Graficación: Kaplan-Meier Modificado


Usando las estimaciones Kaplan-Meier

Ri + Ri −1
Ri'i = (14)
2

donde R0=1, y las posiciones de graficación son Fi = 1 − Ri'i .

Límites de Confianza
Los límites de confianza son estimados sobre una base puntual al determinar todos los valores X
= Q + θ para los cuales
~
Λ = −2 log L(α~, β ) + 2 log L(αˆ , βˆ ) ≤ χ 12− p ,1 (15)

~
donde α̂ y β̂ son los estimadores de máxima verosimilitud, mientras que α~ y β satisfacen las
ecuaciones
~
⎛ (X i − θ ) ⎞ ⎛ (X − θ )⎞
β
n
r
~ − r ln(Q ) + ∑ ln ( X − θ ) + ln(1 − p ) ∑ ⎜⎜ ⎟⎟ ln⎜⎜ i ⎟⎟ = 0 (16)
β
i
i∈S i =1 ⎝ Q ⎠ ⎝ Q ⎠
© 2006 por StatPoint, Inc. Análisis de Weibull - 16
STATGRAPHICS – Rev. 4/25/2007

Q
α~ = (17)
[− ln(1 − p)]1 / β
~

y S es el conjunto de momentos de error d.

© 2006 por StatPoint, Inc. Análisis de Weibull - 17