You are on page 1of 17

可靠度期末資料分析報告

-以 NASA 資料為案例

學生:顏廷諭、郭遠川、洪睿豪、林彥妏

指導教授:許湘伶
目錄

一、研究目的…………………………………………………………3

二、資料蒐集與介紹………………………………………………..3

2-1 資料來源………………………………………………………….…….4

2-2 資料介紹…………………………………………………………….…4

三、估計失效函數(採無母數的估計方法)……………………..6

四、繪製機率圖………………………………………………………9

五、結論……………………………………………………………….16

六、工作分配………………………………………………………...17
一、研究目的

本次研究報告的研究目的是藉由上課所學關於可靠度的相關專業知識分析

NASA 中其中一筆自選的資料,整體的分析流程會先從介紹資料來源、資料說明、

資料清洗、資料分析、研究成果等幾個面向。本次我們主要想探討的問題是,我

們所分析的資料可能來自於哪一個分佈所產生,因此我們先透過無母數的估計方

式,建立經驗 CDF,再根據經驗 CDF 的結果判別該資料可能是來自那些分佈,

最後在根據第六章所學的知識繪製出可能分佈下的機率圖,並且估計回歸模型進

行判別。而最後的成果為,我們認為我們所分析 NASA 的兩筆資料都源自

lognormal 分佈,並且在配適迴歸線時兩筆資料的 R-square 皆大於百分之 95

(此部分未呈現在之後的敘述中),由此可猜想資料來自 lognormal 分佈的可能性

極高。接下來將依照各個章節逐一介紹。

二、資料蒐集與介紹

本次分析的資料是 100 台飛機渦輪的運作數據,由於飛機渦輪故障的資料難以

取得,因為飛機渦輪在正常使用下故障可能導致墜機,導致飛行人員有生命危險,

同時實驗的成本太大,因此本資料是根據 Paper 所提到的 C-MAPSS 系統所模

擬出的飛機渦輪資料,資料內容有渦輪上感知器所取得的資訊以及渦輪從正常運

作到失效時的時間(單位:週期),我們只取失效時間當作我們的分析資料.
2-1 資料來源

網址: https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/

NASA: Turbofan Engine Degradation Simulation Data Set

圖(一) 上述網址中的第六筆資料(本次研究所使用的資料)

Paper: Damage Propagation Modeling

2-2 資料介紹

本次的研究中一共使用兩筆資料,分別為 FD001 與 FD002,其差異為在不同

的條件下所進行失效實驗的模擬結果。以下為兩筆資料以及各筆資料的內容:

第一行為機器編號

第二行為運作時間

第三行至第五行為當時條件

第六行至最後一行為感知器所測的資料
1 1 0.0023 3.00E-04 100 518.67 643.02 1585.29 1398.21 14.62 21.61 553.9 2388.04 9050.17
1 2 -0.0027 -3.00E-04 100 518.67 641.71 1588.45 1395.42 14.62 21.61 554.85 2388.01 9054.42
1 3 3.00E-04 1.00E-04 100 518.67 642.46 1586.94 1401.34 14.62 21.61 554.11 2388.05 9056.96
1 4 0.0042 0 100 518.67 642.44 1584.12 1406.42 14.62 21.61 554.07 2388.03 9045.29
1 5 0.0014 0 100 518.67 642.51 1587.19 1401.92 14.62 21.61 554.16 2388.01 9044.55
1 6 0.0012 3.00E-04 100 518.67 642.11 1579.12 1395.13 14.62 21.61 554.22 2388 9050.96
1 7 0 2.00E-04 100 518.67 642.11 1583.34 1404.84 14.62 21.61 553.89 2388.05 9051.39
1 8 6.00E-04 0 100 518.67 642.54 1580.89 1400.89 14.62 21.61 553.59 2388.05 9052.86
1 9 -0.0036 0 100 518.67 641.88 1593.29 1412.28 14.62 21.61 554.49 2388.06 9048.55
1 10 -0.0025 -1.00E-04 100 518.67 642.07 1585.25 1398.64 14.62 21.61 554.28 2388.04 9051.95
1 11 7.00E-04 -4.00E-04 100 518.67 642.04 1581.03 1403.83 14.62 21.61 554.69 2388.04 9051.67
1 12 0.0026 3.00E-04 100 518.67 642.54 1587.43 1397.82 14.62 21.61 554.35 2388.02 9050.02
1 13 -0.0056 3.00E-04 100 518.67 641.94 1589.09 1403.94 14.62 21.61 554.04 2388.02 9045.67
1 14 0.0017 -4.00E-04 100 518.67 642.23 1583.16 1402.88 14.62 21.61 554.66 2388.03 9045.3
1 15 -3.00E-04 -3.00E-04 100 518.67 642.5 1584.81 1398.79 14.62 21.61 554.15 2388 9052.59
1 16 -0.0018 3.00E-04 100 518.67 642.32 1584.51 1407.76 14.62 21.61 553.82 2388.1 9041.94
1 17 0.0014 2.00E-04 100 518.67 642.19 1582.7 1404.12 14.62 21.61 554.42 2388.06 9045.85
1 18 0.0035 1.00E-04 100 518.67 642.59 1586.53 1403.69 14.62 21.61 553.5 2388.04 9048.12

圖(二) Train_FD001 原始資料(只擷取部分)

1 1 9.9987 0.2502 100 489.05 605.03 1497.17 1304.99 10.52 15.49 394.54 2318.96 8763.8
1 2 20.0026 0.7 100 491.19 607.82 1481.2 1246.11 9.35 13.66 334.36 2323.95 8713.21
1 3 35.0045 0.84 100 449.44 556 1359.08 1128.36 5.48 8 193.55 2222.67 8340.2
1 4 42.0066 0.841 100 445 550.17 1349.69 1127.89 3.91 5.71 138.74 2211.58 8313.85
1 5 24.9985 0.6213 60 462.54 536.72 1253.18 1050.69 7.05 9.03 175.75 1915.1 7997.13
1 6 25.0006 0.6206 60 462.54 536.62 1258.9 1047.35 7.05 9.02 175.16 1915.14 8007.49
1 7 42.0017 0.84 100 445 549.47 1351.28 1124.43 3.91 5.72 138.68 2211.62 8309.66
1 8 41.9994 0.8404 100 445 549.49 1349.2 1126.95 3.91 5.71 138.75 2211.67 8303.29
1 9 35.0005 0.8408 100 449.44 555.64 1357.76 1133.32 5.48 8 194.57 2222.74 8337.78
1 10 20.0001 0.7 100 491.19 607.33 1483.66 1261.66 9.35 13.66 334.17 2323.89 8706.03
1 11 10.0034 0.25 100 489.05 604.97 1501.43 1308.06 10.52 15.49 394.14 2318.92 8760.65
1 12 42.0004 0.8401 100 445 549.22 1351.25 1128.23 3.91 5.72 139 2211.66 8308.93
1 13 25.0065 0.6202 60 462.54 536.81 1266.49 1050.65 7.05 9.02 175.86 1915.16 8001.4
1 14 41.9993 0.8418 100 445 549.86 1348.21 1124.43 3.91 5.72 139.44 2211.61 8298.62
1 15 0.0028 0 100 518.67 642.68 1588.08 1405.52 14.62 21.61 553.31 2388.15 9036.08
1 16 25.0039 0.6201 60 462.54 536.85 1255.39 1045.72 7.05 9.02 175.56 1915.16 8006.38
1 17 25.0046 0.62 60 462.54 536.43 1263.53 1052.85 7.05 9.03 175.3 1915.18 7994.84
1 18 20.0066 0.7 100 491.19 607.55 1484.77 1254.02 9.35 13.65 335.24 2323.95 8712.86

圖(三) Train_FD002 原始資料(只擷取部分)

然而,本次的報告我們只使用各機器的失效時間當作分析對象,因此我們又將

資料整理成以下:

M achine Failure
1 192
2 287
3 179
4 189
5 269
6 188
7 259
8 150
9 201
10 222
圖(四) Train_FD001 整理後的資料(只擷取部分)

M achine Failure
1 149
2 269
3 206
4 235
5 154
6 175
7 174
8 151
9 199
10 184

圖(五) Train_FD002 整理後的資料(只擷取部分)

圖(四)與圖(五)中第一欄為機台編號,第二欄為該機台的失效時間,單位為週期,

即為一個循環的意思。因此本次的分析報告中,NASA 的部份我們一共分析兩筆

資料,每筆資料中各有 100 個樣本。

三、估計失效函數(採無母數的估計方法)

因為本次研究中的兩筆資料皆為完整的資料(complete data),沒有任何的資料

在任一個時間區間突然遺漏(censored data),因此,根據可靠度課程中第二個

章節所學的分析方法,我們採用以下公式來估計每一個時間區間的失效機率:

∑𝑖𝑗=1 𝑑𝑗
𝐹̂ (𝑡𝑖 ) = (1)
𝑛

其中 𝑑𝑗 為在區間 (𝑡𝑗−1 , 𝑡𝑗 ] 中失效的個數,而 𝑛 為樣本數,𝐹̂ (𝑡𝑖 ) 為在區間

(𝑡0 , 𝑡𝑖 ]失效的機率估計,接著我們在透過課本第 50 頁中,第(3.2)建構估計的信

賴 區 間 (Pointwise Binomial-Based Confidence Interval) , 以 下 分 別 呈 現


FD001 跟 FD002 資料的失效機率估計與信賴區間,其中信賴區間是以 95%的

信心水準來建構:

圖(六) Train_FD001 資料失效機率的估計與信賴區間(只擷取部分資料)

圖(七) Train_FD001 資料失效機率的估計與信賴區間之圖示

由圖(七)可以明顯看出,在 FD001 資料中,渦輪引擎的失效時間是從 128(週期)


開始,並且到了第 199(週期)時,已達到百分之 50 的失效率,且由圖(七)可以看

出大部分的失效事件集中在 128-200(週期),而 200-300(週期)的失效事件間發

生的時間間格較長,表示渦輪在前期很容易失效,到後期失效發生的頻率逐漸趨

緩,因此我們可以推測,倘若該失效模式服從一個分佈,則該分佈絕對不是指數

分佈,因為指數分佈的 hazard function 為一個常數,然而該案例中的 hazard

function 可推敲為前期較高,到後期逐漸趨緩,因此可能是 𝛽 參數小於 1 的

Weibull distribution. 或者是 𝜎 參數大於等於 0.5 的 Lognormal distribution.

接下來呈現 FD002 資料的估計結果與建構在信心水準 95%下信賴區間的上下

界:

圖(八) Train_FD002 資料失效機率的估計與信賴區間(只擷取部分資料)


圖(九) Train_FD002 資料失效機率的估計與信賴區間之圖示

由圖(九)可以看出 FD002 和 FD001 的失效模式可能很類似,因為兩筆不同的資

料皆是在 128-200(週期)左右大幅度的發生失效,並且在 200(週期)中的某一刻

失效發生的頻率開始下降,因此我們接下來將使用第六章所學習的方法繪製

Weibull 以及 Lognormal 分佈的機率圖,並且從圖形判別兩組不同條件下的資

料是否來自該兩種分佈中的其中一種。

四、繪製機率圖

在上個小節中,我們猜測資料可能是服從 Weibull distribution 或是 Lognormal

distribution,因此我們繪製此二分佈的機率圖,並去估計母體參數。透過估計

出的母體參數去估計𝐹̂ (𝑡𝑖 ),並給出 95%的信賴區間。

根據課本 p.129,plotting positions 可以根據下列公式計算出:

𝑖−0.5
𝑝𝑖 = (2)
𝑛
圖(十) Train_FD001 的 Weibull distribution 機率圖

圖十為 Train_FD001 的 Weibull distribution 機率圖,其中 x 軸代表的是

log(time),也就是失效時間取 log;y 軸代表的是 Standard quantile,計算公式

為log(−log(1 − pi ))。紅色線代表的是log(−log(1 − pi ))對log(time)做線性迴歸

配適出的直線,並根據 Weibull distribution quantile 的公式可以推算出此迴歸

線的斜率即為估計出的 Weibull distribution 的尺度參數β = 5.6173,並估算出

位置參數η = 223.2912。

𝜇 1
log(t p ) = μ + log(− log(1 − p)) ⇒ log(− log(1 − p)) = − + log(t p )
𝜎 𝜎
1
且 η = exp(μ) , β = σ
圖(十一) Train_FD001 的 Lognormal distribution 機率圖

圖十一為 Train_FD001 的 Lognormal distribution 機率圖,其中 x 軸代表的是

log(time),也就是失效時間取 log;y 軸代表的是 Standard quantile,計算公式

為Φnor
−1 −1
(pi )。紅色線代表的是Φnor (pi )對log(time)做線性迴歸配適出的直線,並

根 據 Lognormal distribution quantile 的 公 式 可 以 推 算 出 Lognormal

distribution 的尺度參數σ = 0.2155,並估算出位置參數μ = 5.3062。

−1 −1 (p)
𝜇 1
log(t p ) = μ + Φnor (p)σ ⇒ Φnor = − + log(t p )
𝜎 𝜎

由圖十及圖十一來看,我們認為此資料較為類似於 Lognormal distribution,因

為資料點與迴歸線的差距較小,在圖十中,我們可以看到頭尾其實並不是那麼契

合迴歸線。
接著根據估計出來的母體參數去估計各個分佈下的𝐹̂ (𝑡𝑖 ),並根據以下公式給定

95%的信賴區間:

[𝐹̂ (𝑡𝑖 ), 𝐹̂ (𝑡𝑖 )] = 𝐹̂ (𝑡𝑖 ) ± 𝑧1−𝛼 𝑠𝑒


̂𝐹̂(𝑡𝑖 ) (3)
2

𝐹̂ (𝑡𝑖 )[1−𝐹̂ (𝑡𝑖 )]


其中 𝑠𝑒
̂𝐹̂(𝑡𝑖 ) = √ 𝑛

圖(十二) Train_FD001 的 Weibull distribution 機率圖與其 95%信賴區間

圖十二為𝐹̂ (𝑡𝑖 )的 95%信賴區間,此時𝐹̂ (𝑡𝑖 )是透過 Weibull distribution 的分佈

函數去估算,參數為先前估出的(𝜂, 𝛽) = (223.2912, 5.6173)。


圖(十三) Train_FD001 的 Lognormal distribution 機率圖與其 95%信賴區間

圖十二為𝐹̂ (𝑡𝑖 )的 95%信賴區間,此時𝐹̂ (𝑡𝑖 )是透過 Lognormal distribution 的分

佈函數去估算,參數為先前估出的(𝜇, 𝜎) = (5.3062, 0.2155)。

再來呈現的是 FD002 資料中的圖以及估計出的參數及信賴區間。


圖(十四) Train_FD002 的 Weibull distribution 機率圖

圖(十五) Train_ FD002 的 Lognormal distribution 機率圖


圖十四和圖十五分別為 Train_FD002 的 Weibull distribution 和 Lognormal

distribution 機率圖,並推算出 Weibull distribution 的尺度參數β = 5.5746,

並 估 算出位置參數η = 223.9147 ;Lognormal distribution 的尺度參數σ =

0.2166,並估算出位置參數μ = 5.3079。

根據式子(3)以及分佈函數,一樣可以估計出𝐹̂ (𝑡𝑖 )的 95%信賴區間,如圖十六、

圖十七所示:

圖(十六) Train_FD002 的 Weibull distribution 機率圖與其 95%信賴區間


圖(十七) Train_FD002 的 Lognormal distribution 機率圖與其 95%信賴區間

五、結論

由以上的分析步驟,我們可以推敲兩筆資料確實都來自 lognormal 分佈,分別

為:FD001 的資料來自 lognormal(μ = 5.3062, σ = 0.2155)、FD002 的資料來自

lognormal(μ = 5.3079, σ = 0.2166),其中兩筆資料的參數給定都很接近,然而

倘若要深入探討,FD001 的資料比 FD002 更接近 lognormal,有可能 FD002

的資料生成不是 lognormal,再者,參數估計的結果和我們在上一章推論的結果

不同,表示在藉由圖形來判別參數上依然有進步的空間。以上是我們 NASA 的

資料處理。
六、工作分配

1 讀 paper、找 data、data 整理 :遠川、睿豪

2 無母數分析 : 廷諭、睿豪

3 機率密度圖 : 彥妏

4 整理成此份檔案 : 廷諭、彥妏

5 將檔案跟 code 整理並上傳雲端 : 彥妏

You might also like