You are on page 1of 5

Data Mining HW#3

1. (a)

Y Xun X_normal_1
0 20 0
0 22 0.125
0 24 0.25
0 26 0.375
0 28 0.5
0 28.6 0.5375
0 27 0.4375
1 27.4 0.4625
1 28 0.5
1 28.4 0.525
1 29 0.5625
1 30 0.625
1 32 0.75
1 34 0.875
1 36 1
(b)

Confusion matrix_1 Predicted Class


P_cut Val 0.4 1 0
1 8 0
Actual Class
0 3 4
Accuracy 0.8
Sensitivity 1
Specificity 0.571428571

Confusion matrix_1 Predicted Class


P_cut Val 0.5 1 0
1 7 1
Actual Class
0 2 5
Accuracy 0.8
Sensitivity 0.875
Specificity 0.714285714

Confusion matrix_1 Predicted Class


P_cut Val 0.6 1 0
1 4 4
Actual Class
0 0 7
Accuracy 0.733333333
Sensitivity 0.5
Specificity 1
(c)

no. Y X_normal_1 Cum_Y_predict Cum_Y_average


1 1 1 1 0.533333333
2 1 0.875 2 1.066666667
3 1 0.75 3 1.6
4 1 0.625 4 2.133333333
5 1 0.5625 5 2.666666667
6 0 0.5375 5 3.2
7 1 0.525 6 3.733333333
8 0 0.5 6 4.266666667
9 1 0.5 7 4.8
10 1 0.4625 8 5.333333333
11 0 0.4375 8 5.866666667
12 0 0.375 8 6.4
13 0 0.25 8 6.933333333
14 0 0.125 8 7.466666667
15 0 0 8 8

# cases 가 5 일 때,

Cumulative Y when sorted using predicted values(파란선): 5

Cumulative Y using average(빨강선): 2.666666667

이 예측모델이 임의로 선택하는 모델보다 #case 가 5 일 때 1.3333 정도가 더 나은 기대값을


가진 것을 알 수 있다.
(d)

Y Xun X_normal_1 X_normal_2


0 20 0 0.14644661
0 22 0.125 0.19381378
0 24 0.25 0.25
0 26 0.375 0.3232233
0 28 0.5 0.5
0 28.6 0.5375 0.59682458
0 27 0.4375 0.375
1 27.4 0.4625 0.40317542
1 28 0.5 0.5
1 28.4 0.525 0.57905694
1 29 0.5625 0.625
1 30 0.625 0.6767767
1 32 0.75 0.75
1 34 0.875 0.80618622
1 36 1 0.85355339

Confusion matrix_2 Predicted Class


P_cut Val 0.4 1 0
1 8 0
Actual Class
0 2 5
Accuracy 0.866666667
Sensitivity 1
Specificity 0.714285714

Confusion matrix_2 Predicted Class


P_cut Val 0.5 1 0
1 7 1
Actual Class
0 2 5
Accuracy 0.8
Sensitivity 0.875
Specificity 0.714285714

Confusion matrix_2 Predicted Class


P_cut Val 0.6 1 0
1 5 3
Actual Class
0 0 7
Accuracy 0.8
Sensitivity 0.625
Specificity 1
두 번째 룰이 Accuracy, Sensitivity, Specificity 이 모두 더 높게 나왔다. 두 번째 룰이 더
나은 룰이다.

You might also like