2
日常生活能力(
activities of daily living
)
動作能力之檢查(
motor examination
)
治療之併發症(
complications of therapy
)
每一個部份再細分為不同的測量指標。最後再依據評分結 果對患者做病症之分級(
0% ~ 100%
,共十個等級),藉以判斷患者的生活能力。
IV.
實驗設計
實驗的設計主要分為兩個階段:
單一演算法之不同參數設定的比較
以及
各演算法之間之實驗數據的比較
。 在單一演算法的實驗中,每個演算法有不同的參數,例如決策樹是否修剪(
pruned
),或是類神經網路需要幾層隱 藏層(
hidden layer
)。實驗的目的為調整不同的參數以求 最高的分類準確度(
precision
)。由於我們並沒有額外的 測試資料,我們將資料集的
70%
作為訓練資料,
30%
作為 測試資料,並將
random seed
當作實驗的參數之一(
random seed
為隨機選取
70%
訓練資料之用)。除此之 外,為求公平起見,我們需要在相同的環境下進行實驗(例如同一台電腦),如此一來,在執行時間的比較上才 會有意義。我們將目標分類
total_UPDRS
分成十等份,也 就是將數值資料轉換成名詞性的資料以方便比較(符合
UPDRS
原本的定義)。第二階段則以第一階段之實驗結 果作為比較的依據,探討各演算法之間的差異。
V.
實驗
1.
Decision tree
演算法概念及描述
利用建立樹狀的結構來達成分類的目的。通常我們 藉由計算資料屬性的熵(
entropy
)以及資訊量(
information gain
)來決定決策樹的節點。分類的結果會出現在葉節點(
leave node
)上。從根(
root
)到葉節點所經過的路徑可視為是一條規則(
rule
)。在這邊我們選擇
J48
,也就是
C4.5
演算法。
J48
有簡單、快速、準確率高等優點。相較於
ID3
演算法,
J48
可以處理數值資料,而且參數設定較少,所以我們選擇
J48
作為決策樹這個類型 演算法的代表。
參數設定
Pruned/unpruned
Reduced Error Pruning
(
REP
)
Confidence Factor
(
CF
)
Random Seed
(
RS
)
實驗數據與結果
我們先調整參數,使的決策樹未修剪。其分類的準 確高,速度也快,不過樹的結構相對就比較大。之後我們 進行修剪,發現準確度微幅上升,可見得未修剪時可能有
overfitting
的產生。然而當我們使用
reduced error pruning
時,準確度卻大幅下滑,從樹的大小來看,推測是修剪過 度的關係。我們在修剪的狀況下,調整
confidencefactor
,其準確度並未改變,可能的原因為節點之
confidence factor
皆小於
0.1
,所以調高
confidence factor
並無影響。最後我們調整
random seed
為
2
時,有最高的準 確度。
2.
Neural network
演算法概念及描述
TABLE
IA
TTRIBUTE
I
NFORMATION
Attributes Descriptionsubject#
受測者的代號
age
受測者年齡
sex
受測者性別。
0
代表男性,
1
代表女性。
test_time
使用電子監控設備的時間。整數部分代表天數(例:
5.6431
)。
motor_UPDRS
受測者利用線性內差法所得之帕金森症症狀衡 量表分數(運動部分)
total_UPDRS
受測者利用線性內差法所得之帕金森症症狀衡 量表分數(總分)
Jitter
(
%
)
, Jitter
(
Abs
)
,Jitter:RAP,Jitter:PPQ5,Jitter:DDP
對基頻(
fundamental frequency
)變異的測量
Shimmer,Shimmer
(
dB
)
,Shimmer:APQ3,Shimmer:APQ5,Shimmer:APQ11,Shimmer:DDA
對振幅變異的測量
NHR, HNR
兩種對雜訊干擾的判斷
RPDE
非線性動態複雜度分析
DFA
碎形信號指數
PPE
非線性的基頻變異測量
TABLE
IID
ECISION
T
REE
(
J48
)
Correctly(%)
Precision(avg.)
Leaves
Size
Time(s)
Unpruned 93.8138 0.938 254 507 0.9Pruned 93.9841 0.94 242 483 0.86REP 90.4654 0.905
199 397 0.54
CF = 0.1 93.9841 0.94 232 463 1.03CF = 0.5 93.9841 0.94 242 483 0.99RS = 2
95.9705 0.961
242 483 1.02RS = 3 95.63 0.956 242 483 0.97CF = 0.75 95.9137 0.96 250 499 3.83
預設值
: CF = 0.25, unpruned = false, REP = false, RS = 1Fig. 2.
在
RS = 2
、
CF = 0.25
、
unpruned = false
、
REP = false
的參數設定 下,決策樹共
17
層(
level
),根節點為
age
屬性。
Add a Comment