Professional Documents
Culture Documents
14 TB
Praktikum 5
NIM : 31S14010
Nama : Herti N Hutapea
1. Membangun model :
Class label : “status”
Model Decision Tree
Gain( A)
GainRatio ( A )=
SplitInfo( A)
(1)
Dimana,
(2)
Berdasarkan persamaan 2, diperoleh nilai gain untuk
setiap atribut yang disajikan pada Tabel 3 dibawah
ini :
Tabel 3. Nilai SplitInfo
SplitInfo Nilai
Departemen 1,93626002
t 8
2,29989639
Age 1
2,36852252
Salary 8
2,91397707
Count 3
Menggunakan perhitungan manual mencari nilai gain akar pada Gambar 5, diperoleh nilai
Gain(A) yang disajikan pada Tabel 4.
Tabel 5. Nilai Gain(A)
Gain(A) Nilai
Departemen 0,01631316
t 6
0,63039384
Age 8
0,63039384
Salary 8
0,63039384
Count 8
Berdasarkan Tabel 5 dan dengan menggunakan persamaan 1 untuk memperoleh nilai Gain
ratio, maka diperoleh nilai Gain ratio yang disajikan pada Tabel 6.
Nilai Gain ratio paling tinggi diperoleh atribut “ages”. Dari kelas ”ages” temukan kembali
nilai entropy , gain, dan gain ratio. Berdasarkan Gambar 4, yaitu result entropy dengan
metode manual, maka untuk atribut “ages”, entropy yang memiliki nilai yaitu “31...35”
sebesar 1, selainnya bernilai 0. Maka, gunakan “31...35” untuk mencari kembali Gain
rationya. Hasil Gain ratio dapat dilihat pada tabel dibawah ini:
Tabel 7 menunjukkan label class pada “ages”, terdapat dua senior dan dua junior untuk
“31...35”. Sehingga temukan kembali entropy untuk kelas “department”,”salary”, dan
“count”. Rumus untuk entropy terdapat pada Persamaan 3.
(3)
Menggunakan Persamaan 3, diperoleh nilai entropy akar pada Tabel 8.
Tabel 8. Nilai entropy
Atribut Entropy
Departmen
t
Sales 1
Systems 0
Marketing 0
Salary
46K...50K 0
31K...35K 0
66K...70K 0
41K...45K 0
Count 30 0
40 0
5 0
4 0
(4)
Dari Tabel 9, masih terdapat dua nilai gain yang sama, yaitu “salary”, dan “count”. Pilih
“salary” sebagai gain tertinggi. Tinjau nilai perhitungan entropy pada atribut “salary”,
kemudian diperoleh “46K...50K” yang memiliki dua senior dan dua junior. Namun pada
Tabel 7, diperoleh “46K...50K” merupakan “senior”. Dengan demikian diperoleh decision
tree yang disajikan pada Gambar 6.
Tabel “department” :
Tabel “age”:
Tabel “count” :
Berdasarkan Tabel 11 diplot gambar grafik seperti yang ada pada Gambar 13.
0.35
0.3
0.25
0.2
Densitas
0.15
0.1
0.05
0
30 40 20 5
Department
Gambar 13. Grafik klasifikasi NaiveBayes dengan metode manual untuk kelas Department
Tabel 11. Nilai NaiveBayes dengan metode manual untuk kelas Ages
Densitas
Age
Senior Junior
31...35 0,4 0,33
26...30 0 0,5
21...25 0 0,16
41...45 0,2 0
36...40 0,2 0
46...50 0,2 0
Berdasarkan Tabel 12 diplot gambar grafik seperti yang ada pada Gambar 14.
0.35
0.3
0.25
0.2
Densitas
0.15
0.1
0.05
0
30 40 20 5 3 10
Ages
Gambar 14. Grafik klasifikasi NaiveBayes dengan metode manual untuk kelas Ages
Tabel 12. Nilai NaiveBayes dengan metode manual untuk kelas Salary
Densitas
Salary
Senior Junior
46K...50K 0,4 0,33
26K...30K 0 0,33
31K...35K 0 0,16
66K...70K 0,4 0
41K...45K 0,2 0,16
36K...40K 0,2 0
Berdasarkan Tabel 13 diplot gambar grafik seperti yang ada pada Gambar 15.
0.35
0.3
0.25
0.2
Densitas
0.15
0.1
0.05
0
30 40 20 5 3 10
Salary
Gambar 15. Grafik klasifikasi NaiveBayes dengan metode manual untuk kelas Salary
Tabel 13 Nilai NaiveBayes dengan metode manual untuk kelas Count
Densitas
Count
Senior Junior
30 0,2 0
40 0 0,33
20 0 0,16
5 0,2 0
3 0,2 0,16
10 0,2 0
4 0,2 0,16
6 0,2 0
Berdasarkan Tabel 14 diplot gambar grafik seperti yang ada pada Gambar 16.
0.35
0.3
0.25
0.2
Densitas
0.15
0.1
0.05
0
30 40 20 5 3 10 4 6
Count
Gambar 16. Grafik klasifikasi NaiveBayes dengan metode manual untuk kelas Count
Kesimpulan:
Berdasarkan metode RapidMiner dan perhitungan manual, diperoleh klasifikasi
menggunakan metode Naive Bayes memiliki bentuk grafik yang sama.