Aplikasi Rapidminer Dalam Pengelompokkan Kasus Penyakit Aids Berdasarkan Provinsi Dengan Data Mining K-Means Clustering

ISSN : 2620-6048
Aplikasi RapidMiner dalam Pengelompokkan Kasus Penyakit

AIDS berdasarkan Provinsi dengan Data Mining K-means
Clustering
Riyani Wulan Sari1, Dedy Hartama2, Indra Gunawan3 dan Agus Perdana Windarto4
1,2,3,4
Sistem Informasi STIKOM Tunas Bangsa Pematangsiantar
riyaniwulansari24@gmail.com, dedyhartama@amiktunasbangsa.ac.id,
Indragunawan@stikomtb.ac.id, agusperdanawindarto@amiktunasbangsa.ac.id
Abstract
Acquired Immunodeficiency Syndrome or Acquired Immune Deficiency Syndrome (AIDS

abbreviated) is a set of symptoms and infections that arise due to the destruction of the human
immune system due to HIV viral infection. This study discusses about WEKA Application in
Grouping Cases of AIDS Disease by Province with K-means Clustering Data Mining. The rise of
AIDS cases in Indonesia has become a case that never escapes government attention. Attention to
the ever increasing rate of death makes people worry about the spread of the AIDS virus. Sources
of data and research are collected from the information document Number of Villages Who Have
Health Facilities produced by the Social Security Administering Board. The data used in this study
is data from 2008-2011 which consists of 34 provinces. Assessment criteria used are 2 ie 1). the
average number of AIDS cases and 2). the average number of AIDS cases deaths were managed
using 3 clusters ie high cluster level (C1), medium cluster level (C2) and low cluster level (C3). So
that the cluster C1 obtained for Cases of AIDS Disease by Province as many as 4 provinces of
Papua, DKI Jakarta, West Java and East Java, 9 provinces for cluster C2 and for cluster C3 as
much as 20. This can be input to the government, the province of concern in the number of cases
of AIDS.
Keywords: Maining Data, AIDS Disease, Clustering, K-means
Abstrak
Acquired Immunodeficiency Syndrome atau Acquired Immune Deficiency Syndrome (disingkat
AIDS) adalah sekumpulan gejala dan infeksi yang timbul karena rusaknya sistem kekebalan tubuh
manusia akibat infeksi virus HIV. Penelitian ini membahas tentang Aplikasi WEKA dalam
Pengelompokkan Kasus Penyakit AIDS berdasarkan Provinsi dengan Data Mining K-means
Clastering. Kenaikan kasus AIDS di Indonesia menjadi kasus yang tidak pernah lepas dari
perhatian pemerintah. Perhatian dengan tingkat kematian yang terus meningkat membuat orang
kuatir dengan penyebaran virus AIDS ini. Sumber Data dan penelitian ini dikumpulkan dari
dokumen keterangan Jumlah Desa/Kelurahan Yang Memiliki Sarana Kesehatan yang dihasilkan
oleh Badan Penyelenggara Jaminan Sosial. Data yang digunakan dalam penelitian ini yaitu data
dari tahun 2008-2011 yang terdiri dari 34 provinsi. Kriteria penilaian yang digunakan sebanyak 2
yakni 1). rata-rata jumlah kasus penyakit AIDS dan 2) rata-rata jumlah meninggal kasus penyakit
AIDS yang dikelola menggunakan 3 cluster yaitu tingkat cluster tinggi (C1), tingkat cluster sedang
(C2) dan tingkat cluster rendah (C3). Sehingga diperoleh penilaian cluster C1 untuk Kasus
Penyakit AIDS berdasarkan Provinsi sebanyak 4 provinsi yaitu Papua, DKI Jakarta, Jawa Barat
dan Jawa Timur, 9 provinsi untuk cluster C2 dan untuk cluster C3 sebanyak 20. Hal ini dapat
menjadi masukan kepada pemerintah, provinsi yang menjadi perhatian dalam jumlah kasus
penyakit AIDS.
Kata Kunci: Data Maining, Penyakit AIDS, Clustering, K-means
Regional Development Industry & Health Science, Technology and Art of Life 59
ISSN : 2620-6048
1. Pendahuluan
Acquired Immunodeficiency Syndrome atau Acquired Immune Deficiency Syndrome
(disingkat AIDS) adalah sekumpulan gejala dan infeksi yang timbul karena rusaknya
sistem kekebalan tubuh manusia akibat infeksi virus HIV. Berdasarkan pusat data dan
informasi kementrian kesehatan RI, diseluruh dunia pada tahun 2013 ada 35 juta orang
hidup dengan HIV yang meliputi 16 juta perempuan dan 3,2 juta anak berusia <15 tahun.
Jumlah infeksi baru HIV pada tahun 2013 sebesar 2,1 juta yang terdiri dari 1,9 juta
dewasa dan 240.000 anak berusia <15 tahun. Jumlah kematian akibat AIDS sebanyak 1,5
juta yang terdiri dari 1,3 juta dewasa dan 190.000 anak berusia <15 tahun. Di indonesia
HIV AIDS pertama kali ditemukan di provinsi Bali pada tahun 1987. Hingga saat ini
AIDS sudah menyebar di 386 kabupaten/kota di seluruh provinsi di indonesia. Berikut ini
jumlah kasus AIDS yang dilaporkan tahun 1987 sampai dengan september 2014.
Gambar 1. Jumlah Kasus AIDS Yang Dilaporkan Tahun 1987 - September 2014
Sumber : Ditjen PP & PL, Kemenkes RI, 2014
Gambar 1. Memperlihatkan adanya kecenderungan peningkatan jumlah kasus HIV dari

tahun ke tahun sejak pertama kali dilaporkan (tahun 1987). Sebaliknya jumlah kasus
AIDS menunjukkan kecenderungan meningkat secara lambat bahkan tahun 2012 jumlah
kasus AIDS mulai turun. Jumlah kumulatif penderita HIV dari tahun 1987 – september
2014 sebanyak 150.296 orang.
Berdasarkan permasalahan diatas, ada beberapa teknik penyelesaian yang dapat
dilakukan yakni analisa klaster. Analisis klaster merupakan suatu teknik multivariate
dengan tujuan utama mengelompokkan objek-objek berdasarkan karakteristik yang
dimiliki. Sekarang ini analisis klaster telah banyak diaplikasikan dalam berbagai bidang
yang ditulis dalam berbagai penelitian dan jurnal [1]. Dalam metode clustering konsep
utama yang ditekankan adalah pencarian pusat cluster secara iteratif, dimana pusat
cluster ditentukan berdasarkan jarak minimum setiap data pada pusat cluster. Data yang
digunakan dalam penelitian ini berdasarkan dokumen-dokumen yang dihasilkan oleh
Badan Pusat Statistik. Dalam hal ini peneliti mengangkat topik mengelompokkan jumlah
kasus penderita AIDS menurut provinsi dimana proses metode yang dilakukan adalah
clustering. Variable yang digunakan untuk melakukan proses clustering adalah 1). Rata-
rata jumlah penderita kasus AIDS dan 2). Rata-rata jumlah kematian penderita AIDS.
Hasil dari cluster dapat dijadikan masukan bagi pemerintah agar provinsi yang masuk
kedalam cluster tinggi (C1) mendapat perhatian lebih. Proses cluster dibagi kedalam 3
(tiga) cluster yakni C1: Penderita kasus AIDS tinggi, C2: Penderita kasus AIDS sedang
dan C3: Penderita kasus AIDS rendah.
ISSN : 2620-6048
2. Landasan Teori
A. Data Maining
Data mining juga merupakan metode yang digunakan dalam pengolahan data berskala
besar oleh karena itu data mining memiliki peranan yang sangat penting dalam beberapa
bidang kehidupan diantaranya yaitu bidang industri, bidang keuangan, cuaca, ilmu dan
teknologi. Data mining juga bisa diartikan sebagai rangkaian kegiatan untuk menemukan
pola yang menarik dari data dalam jumlah besar, kemudian data – data tersebut dapat
disimpan dalam database, data warehouse atau penyimpanan informasi. Ada beberapa
ilmu yang mendukung teknik data mining diantaranya adalah data analisis, signal
processing, neural network dan pengenalan pola [1].
B. Clustering
Analisis Pengelompokan/Clustering merupakan proses membagi data dalam suatu
himpunan ke dalam beberapa kelompok yang kesamaan datanya dalam suatu kelompok
lebih besar daripada kesamaan data tersebut dengan data dalam kelompok lain. Potensi
clustering adalah dapat digunakan untuk mengetahui struktur dalam data yang dapat
dipakai lebih lanjut dalam berbagai aplikasi secara luas seperti klasifikasi, pengolahan
gambar, dan pengenalan pola [2].
C. K-means
K-means merupakan suatu algoritma yang digunakan dalam pengelompokkan secara
pertisi yang memisahkan data ke dalam kelompok yang berbeda – berda. Algoritma ini
mampu meminimalkan jarak antara data ke clusternya. Pada dasarnya penggunaan
algoritma ini dalam proses clustering tergantung pada data yang didapatkan dan konklusi
yang ingin dicapai di akhir proses[3]. Sehingga dalam penggunaan algoritma kmeans
terdapat aturan sebagai berikut [4] :
a. Berapa jumlah clusteryang perlu dimasukkan
b. Hanya memiliki atribut bertipe numeric
Pada dasarnya algoritma K-means hanya mengambil sebagian dari banyaknya
komponen yang didapatkan untuk kemudian dijadikan pusat clusterawal, pada penentuan
pusat clusterini dipilih secara acak dari populasi data. Kemudian algoritma K-means akan
menguji masing – masing dari setiap komponen dalam populasi data tersebut dan
menandai komponen tersebut ke dalam salah satu pusat cluster yang telah didefinisikan
sebelumnya tergantung dari jarak minimum antar komponen dengan tiap – tiap pusat
cluster. Selanjutnya posisi pusat clusterakan dihitung kembeli samapi semua komponen
data digolongkan ke dalam tiap – tiap cluster dan terakhir akan terbentuk cluster baru[5].
3. Metodologi Penelitian
A. Metode Pengumpulan Data
Dalam kegiatan pengumpulan data untuk penelitian ini digunakan metode
pengumpulan studi pustaka yang mana pada metode ini kegiatan dilakukan adalah
mempelajari, mencari dan mengumpulkan data yang berhubungan dengan penelitian ini.
Data yang digunakan dalam pengelompokkan kasus penyakit AIDS ini diperoleh dari
dokumen keterangan jumlah kasus penyakit AIDS berdasarkan provinsi oleh Badan Pusat
Statistik pada tahun 2018 – 2011.
B. Metode Analisis Data

Analisis data merupakan proses mencari dan menyusun secara sistematis data yang
telah diperoleh dari wawancara, dokumentasi, dokumen pribadi, observasi, catatan
lapangan, gambar foto dan sebagainya, dengan cara mengorganisasikan data tersebut ke
dalam kategori, menjabarkan ke dalam unit - unit, melakukan sintesa, menyusun ke dalam
ISSN : 2620-6048
pola, memilih mana yang penting dan mana yang akan dipelajari dan kemudian membuat
kesimpulan agar dapat dipahami diri sendiri dan orang lain. Dalam penulisan penelitian
ini menggunakan analisis data yang bersifat kualitatif, penelitian kualitatif adalah analisis
yang dilakukan dengan mengelompokkan data untuk mencari suatu pola dari hal yang
dipelajari dan membandingkan konsep-konsep yang ada dalam sumber.
C. Studi Literatur
Kegiatan ilmiah yang dilakukan untuk menemukan jawaban satu permasalahan, dan
tujuan akhirnya memberikan kontribusi teoritis atau praktis pada pengembangan bidang
ilmu yang bersangkutan. Studi literatur yang digunakan disini meliputi pengolahan data
kasus penyakit AIDS.
4. Hasil dan Pembahasan

Dalam melakukan clustering, data yang diperoleh akan dihitung terlebih dahulu
berdasarkan jumlah Kasus Penyakit AIDS berdasarkan Provinsi. Hasil rata-rata
berdasarkan 2 kriteria penilaian yakni 1). Rata-rata jumlah kasus penderita AIDS
berdasarkan provinsi dan 2). Rata-rata jumlah kasus meninggal penderita AIDS seperti
yang ditunjukkan pada table berikut:
Tabel 1. Data Jumlah Kasus Penyakit AIDS berdasarkan Provinsi

Jumlah Kasus Meninggal
Provinsi
2008 2009 2010 2011 2008 2009 2010 2011
Aceh 22 36 53 63 8 9 12 14
Sumatera Utara 670 485 507 509 135 93 94 94
Sumatera Barat 184 293 410 428 61 75 99 104
Riau 364 371 477 477 116 117 132 132
Jambi 106 165 268 291 30 50 62 66
Sumatera Selatan 124 219 219 219 29 38 38 38
Bengkulu 33 85 131 137 10 18 29 30
Lampung 143 144 144 144 42 42 42 42
Kepulauan Bangka Belitung 67 117 120 120 4 18 18 18
Kepulauan Riau 271 333 374 390 114 130 143 148
DKI Jakarta 2 727 2 811 3 995 3 997 440 425 576 577
Jawa Barat 2 603 3 233 3 728 3 809 503 588 665 678
Jawa Tengah 409 669 944 1 336 171 238 289 370
DI Yogyakarta 129 247 505 673 46 70 108 134
Jawa Timur 2 525 3 133 3 771 3 775 575 680 779 779
Banten 71 275 401 403 12 51 67 68
Bali 869 1 506 1 747 1 747 145 275 311 311
Nusa Tenggara Barat 114 107 142 206 47 56 69 110
Nusa Tenggara Timur 110 138 242 385 23 25 36 50
Kalimantan Barat 730 730 1 125 1 125 110 103 138 138
Kalimantan Tengah 7 15 57 69 2 2 4 4
Kalimantan Selatan 22 27 27 28 5 5 5 5
Kalimantan Timur 11 11 11 12 10 10 10 10
Sulawesi Utara 117 173 173 557 44 62 62 125
Sulawesi Tengah 8 12 12 12 4 6 6 6
Sulawesi Selatan 143 143 591 995 62 62 62 167
Sulawesi Tenggara 9 20 22 26 1 4 5 5
Gorontalo 3 3 3 3 1 1 1 1
Sulawesi Barat - - 0 - - 0
Maluku 186 192 192 195 68 70 70 70
ISSN : 2620-6048
Jumlah Kasus Meninggal

Provinsi
2008 2009 2010 2011 2008 2009 2010 2011
Maluku Utara 7 10 17 17 7 8 8 8
Papua Barat 58 58 58 397 19 19 19 152
Papua 2 294 2 681 3 665 3 938 353 358 580 602
Sumber: Badan Pusat Statistik
Data tersebut kemudian diakumulasikan dan diambil nilai rata-rata dari setiap kriteria
seperti yang ditunjukkan pada tabel 2 berikut :
Tabel 2. Data Rata-Rata Jumlah Kasus Penyakit AIDS berdasarkan Provinsi

Jumlah Kasus rata- Meninggal rata-
Provinsi
2008 2009 2010 2011 rata 2008 2009 2010 2011 rata
Aceh 22 36 53 63 43,5 8 9 12 14 10,75
Sumatera Utara 670 485 507 509 542,75 135 93 94 94 104
Sumatera Barat 184 293 410 428 328,75 61 75 99 104 84,75
Riau 364 371 477 477 422,25 116 117 132 132 124,25
Jambi 106 165 268 291 207,5 30 50 62 66 52
Sumatera
Selatan 124 219 219 219 195,25 29 38 38 38 35,75
Bengkulu 33 85 131 137 96,5 10 18 29 30 21,75
Lampung 143 144 144 144 143,75 42 42 42 42 42
Kep. Bangka 67 117 120 120 106 4 18 18 18 14,5
Kep.Riau 271 333 374 390 342 114 130 143 148 133,75
DKI Jakarta 2727 2811 3995 3997 3383 440 425 576 577 504,5
Jawa Barat 2 603 3233 3 728 3 809 3233 503 588 665 678 608,5
Jawa Tengah 409 669 944 1 336 674 171 238 289 370 267
DI Yogyakarta 129 247 505 673 388,5 46 70 108 134 89,5
Jawa Timur 2 525 3 133 3771 3 775 3771 575 680 779 779 703,25
Banten 71 275 401 403 287,5 12 51 67 68 49,5
Bali 869 1 506 1 747 1 747 869 145 275 311 311 260,5
NTB 114 107 142 206 142,25 47 56 69 110 70,5
NTT 110 138 242 385 218,75 23 25 36 50 33,5
Kalbar 730 730 1 125 1 125 730 110 103 138 138 122,25
Kalteng 7 15 57 69 37 2 2 4 4 3
Kalsel 22 27 27 28 26 5 5 5 5 5
Kaltim 11 11 11 12 11,25 10 10 10 10 10
Sulawesi Utara 117 173 173 557 255 44 62 62 125 73,25
Sul.Tengah 8 12 12 12 11 4 6 6 6 5,5
Sulsel 143 143 591 995 468 62 62 62 167 88,25
Sulteng 9 20 22 26 19,25 1 4 5 5 3,75
Gorontalo 3 3 3 3 3 1 1 1 1 1
Sulawesi Barat - - 0 0 - - 0 0
Maluku 186 192 192 195 191,25 68 70 70 70 69,5
Maluku Utara 7 10 17 17 12,75 7 8 8 8 7,75
Papua Barat 58 58 58 397 142,75 19 19 19 152 52,25
Papua 2 294 2 681 3665 3 938 3665 353 358 580 602 473,25
15 18 26 3 4 5
Indonesia
136 442 24131 483 24131 197 3708 539 056 3708
Sumber: Badan Pusat Statistik
Setelah diakumulasikan dan dicari nilai rata-rata maka akan didapatkan nilai dari
setiap variable. Kemudian data tersebut akan masuk ke tahapan clustering dengan
menerapkan algoritma K-means untuk mengcluster data menjadi tiga cluster.
ISSN : 2620-6048
A. Centroid Data
Dalam penerapan algoritma K-means dihasilkan nilai titik tengah atau centroid dari
data yang didapat dengan ketentuan bahwa clusterisasi yang diinginkan adalah 3,
Penentuan cluster dibagi atas tiga bagian yakni cluster tinggi (C1), cluster sedang (C2)
dan cluster tingkat rendah (C3). maka nilai titik tengah atau centroid juga terdapat 3 titik.
Penentuan titik cluster ini dilakukan dengan mengambil nilai terbesar (maksimum) untuk
cluster tinggi (C1), nilai rata-rata (average) untuk cluster sedang (C2) dan nilai terkecil
(minimum) untuk cluster rendah (C3). Nilai titik tersebut dapat diketahui pada tabel
berikut:
Tabel 3. Centroid Data Awal (Iterasi 1)
Centroid
Max (C1) 3771 703,25
Average (C2) 635,3636 125
Min (C3) 0 0
B. Clustering Data
Dengan menggunakan centroid tersebut maka dapat dicluster data yang telah didapat
menjadi 3 cluster. Proses cluster dengan mengambil jarak terdekat dari setiap data yang
diolah. Dari data jumlah desa/kelurahan yang memiliki sarana kesehatan menurut
provinsi didapatkan pengelompokan pada iterasi 1 untuk 3 cluster tersebut. Cluster
penderita Kasus AIDS tinggi (C1) yakni DKI Jakarta, Jawa Barat, Jawa Timur dan Papua.
Cluster penderita Kasus AIDS sedang (C2) yakni 9 Provinsi dan cluster penderita Kasus
AIDS rendah (C3) yakni 20 provinsi lainnya. Proses pencarian jarak terpendek,
pengelompokan data pada iterasi 1 dan Clustering atas dapat digambarkan pada tabel dan
gambar berikut:
Tabel 4. Perhitungan Jarak Pusat Cluster Iterasi 1
Iterasi 1
Provinsi X Y Jarak
C1 C2 C3 Terpendek
Aceh 43,50 10,75 3791,28 602,79 44,81 44,81
Sumatera Utara 542,75 104,00 3283,40 94,96 552,62 94,96
Sumatera Barat 328,75 84,75 3497,37 309,24 339,50 309,24
Riau 422,25 124,25 3398,44 213,11 440,15 213,11
Jambi 207,50 52,00 3622,52 434,05 213,92 213,92
Sumatera Selatan 195,25 35,75 3637,52 449,07 198,50 198,50
Bengkulu 96,50 21,75 3737,16 548,67 98,92 98,92
Lampung 143,75 42,00 3687,03 498,57 149,76 149,76
Kep. Bangka 106,00 14,50 3729,16 540,77 106,99 106,99
Kepulauan Riau 342,00 133,75 3475,97 293,49 367,22 293,49
DKI Jakarta 3382,50 504,50 436,39 2773,23 3419,92 436,39
Jawa Barat 3233,00 608,50 546,28 2642,25 3289,77 546,28
Jawa Tengah 674,00 267,00 3127,57 147,16 724,96 147,16
DI Yogyakarta 388,50 89,50 3437,73 249,40 398,68 249,40
Jawa Timur 3771,00 703,25 0,00 3188,51 3836,01 0,00
Banten 287,50 49,50 3544,31 355,96 291,73 291,73
Bali 869,00 260,50 2935,58 270,09 907,21 270,09
NTB 142,25 70,50 3683,50 496,12 158,76 158,76
NTT 218,75 33,50 3614,84 426,54 221,30 221,30
Kalimantan Barat 730,00 122,25 3096,00 94,68 740,17 94,68
ISSN : 2620-6048
Iterasi 1
Provinsi X Y Jarak
C1 C2 C3 Terpendek
Kalimantan Tengah 37,00 3,00 3799,09 610,67 37,12 37,12
Kalimantan Selatan 26,00 5,00 3809,54 621,07 26,48 26,48
Kalimantan Timur 11,25 10,00 3823,13 634,62 15,05 15,05
Sulawesi Utara 255,00 73,25 3572,00 383,87 265,31 265,31
Sulawesi Tengah 11,00 5,50 3824,19 635,70 12,30 12,30
Sulawesi Selatan 468,00 88,25 3359,77 171,35 476,25 171,35
Sulawesi Tenggara 19,25 3,75 3816,40 627,93 19,61 19,61
Gorontalo 3,00 1,00 3832,88 644,41 3,16 3,16
Sulawesi Barat 0,00 0,00 3836,01 647,54 0,00 0,00
Maluku 191,25 69,50 3635,42 447,57 203,49 203,49
Maluku Utara 12,75 7,75 3822,06 633,56 14,92 14,92
Papua Barat 142,75 52,25 3686,19 497,96 152,01 152,01
Papua 3665,00 473,25 253,25 3049,59 3695,43 253,25
Tabel 5. Hasil Pengelompokan Iterasi 1

Provinsi C1 C2 C3
Aceh 1
Sumatera Utara 1
Sumatera Barat 1
Riau 1
Jambi 1
Sumatera Selatan 1
Bengkulu 1
Lampung 1
Kep. Bangka 1
Kepulauan Riau 1
DKI Jakarta 1
Jawa Barat 1
Jawa Tengah 1
DI Yogyakarta 1
Jawa Timur 1
Banten 1
Bali 1
Nusa Tenggara Barat 1
Nusa Tenggara Timur 1
Kalimantan Barat 1
Kalimantan Tengah 1
Kalimantan Selatan 1
Kalimantan Timur 1
Sulawesi Utara 1
Sulawesi Tengah 1
Sulawesi Selatan 1
Sulawesi Tenggara 1
Gorontalo 1
Sulawesi Barat 1
Maluku 1
ISSN : 2620-6048
Provinsi C1 C2 C3
Maluku Utara 1
Papua Barat 1
Papua 1
Jumlah 4 9 20
Proses K-means akan terus beriterasi sampai pengelompokan data sama dengan
pengelompokan data iterasi sebelumnya. Dengan kata lain, proses akan terus melakukan
iterasi sampai data pada iterasi terakhir sama dengan iterasi sebelumnya. Pada iterasi 1
diperoleh cluster data jumlah kasus penyakit AIDS berdasarkan Provinsi. Proses iterasi
tersebut berhenti pada iterasi berikutnya, pada iterasi berikutnya akan dilakukan proses
mencari nilai titik tengah atau centroid. Setelah mendapatkan nilai titik tengah atau
centroid, proses sama dilakukan dengan mencari jarak terdekat. Proses pencarian jarak
terpendek, pengelompokan data pada iterasi terakhir dan Clustering data dapat
digambarkan pada tabel berikut:
Tabel 6. Centroid Data Iterasi 2
Centroid
Cluster C1 3512,88 572,38
Cluster C2 529,47 141,58
Cluster C3 107,51 28,06
Tabel 7. Perhitungan Jarak Pusat Cluster Iterasi 2

Provinsi X Y Iterasi 2 Jarak
C1 C2 C3 Terpendek
Aceh 43,50 10,75 3514,54 503,28 66,31 66,31
Sumatera Utara 542,75 104,00 3006,83 39,86 441,81 39,86
Sumatera Barat 328,75 84,75 3221,25 208,61 228,38 208,61
Riau 422,25 124,25 3122,94 108,61 329,11 108,61
Jambi 207,50 52,00 3346,09 334,20 102,81 102,81
Sumatera Selatan 195,25 35,75 3360,74 350,58 88,07 88,07
Bengkulu 96,50 21,75 3460,46 449,25 12,69 12,69
Lampung 143,75 42,00 3410,62 398,37 38,83 38,83
Kep. Bangka 106,00 14,50 3452,25 442,13 13,65 13,65
Kepulauan Riau 342,00 133,75 3201,07 187,64 257,20 187,64
DKI Jakarta 3382,50 504,50 146,99 2876,02 3309,46 146,99
Jawa Barat 3233,00 608,50 282,20 2743,55 3178,93 282,20
Jawa Tengah 674,00 267,00 2855,25 191,36 614,82 191,36
DI Yogyakarta 388,50 89,50 3161,47 150,29 287,63 150,29
Jawa Timur 3771,00 703,25 289,41 3289,83 3725,19 289,41
Banten 287,50 49,50 3267,48 258,90 181,26 181,26
Bali 869,00 260,50 2662,21 359,75 796,17 359,75
Nusa Tenggara Barat 142,25 70,50 3407,78 393,69 54,84 54,84
Nusa Tenggara Timur 218,75 33,50 3337,91 328,98 111,37 111,37
Kalimantan Barat 730,00 122,25 2819,04 201,46 629,57 201,46
Kalimantan Tengah 37,00 3,00 3522,20 511,60 74,83 74,83
Kalimantan Selatan 26,00 5,00 3532,73 521,67 84,71 84,71
Kalimantan Timur 11,25 10,00 3546,50 534,67 97,94 97,94
Sulawesi Utara 255,00 73,25 3295,89 282,85 154,25 154,25
Sulawesi Tengah 11,00 5,50 3547,46 536,03 99,11 99,11
ISSN : 2620-6048
Provinsi X Y Iterasi 2 Jarak

Sulawesi Selatan 468,00 88,25 3083,12 81,38 365,48 Terpendek
81,38
Sulawesi Tenggara 19,25 3,75 3539,60 528,51 91,55 91,55
Gorontalo 3,00 1,00 3556,08 544,92 107,96 107,96
Sulawesi Barat 0,00 0,00 3559,20 548,08 111,11 111,11
Maluku 191,25 69,50 3359,48 345,82 93,43 93,43
Maluku Utara 12,75 7,75 3545,37 533,77 96,92 96,92
Papua Barat 142,75 52,25 3410,03 396,91 42,74 42,74
Papua 3665,00 473,25 181,57 3153,02 3585,23 181,57
Tabel 8. Hasil Pengelompokan Iterasi 2

Provinsi C1 C2 C3
Aceh 1
Sumatera Utara 1
Sumatera Barat 1
Riau 1
Jambi 1
Sumatera Selatan 1
Bengkulu 1
Lampung 1
Kep. Bangka 1
Kepulauan Riau 1
DKI Jakarta 1
Jawa Barat 1
Jawa Tengah 1
DI Yogyakarta 1
Jawa Timur 1
Banten 1
Bali 1
Nusa Tenggara Barat 1
Nusa Tenggara Timur 1
Kalimantan Barat 1
Kalimantan Tengah 1
Kalimantan Selatan 1
Kalimantan Timur 1
Sulawesi Utara 1
Sulawesi Tengah 1
Sulawesi Selatan 1
Sulawesi Tenggara 1
Gorontalo 1
Sulawesi Barat 1
Maluku 1
Maluku Utara 1
Papua Barat 1
Papua 1
Jumlah 4 9 20
C. Analisa Data
Pada iterasi 2, pengelompokan data yang dilakukan terhadap 3 cluster dengan iterasi 1
didapatkan hasil yang sama. Dari 34 data jumlah kasus penderita AIDS berdasarkan
provinsi dapat dikertahui, 4 provinsi cluster tingkat tinggi untuk penderita kasus AIDS
yakni Papua, DKI Jakarta, Jawa Barat dan Jawa Timur, 9 provinsi cluster tingkat sedang
dan 20 provinsi lainnya termasuk cluster tingkat rendah.
ISSN : 2620-6048
D. Implementasi Tool RapidMiner

Dalam pengelompokan/clustering, peneliti menggunakan K-means untuk
mengelompokan data berdasarkan pada atribut. K-Means adalah teknik yang cukup
sederhana dan cepat dalam pekerjaan pengelompokkan data (clustering). Prinsip utama
dari teknik ini adalah menyusun k buah prototipe/pusat massa (centroid)/rata-rata (mean)
dari sekumpulan data berdimensi n. Aplikasi Rapidminer akan membantu proses
pengelompokan/clustering
Gambar 2. Penggunaan Algoritma K-Means dengan nilai K = 3
Gambar 3. Hasil Pengelompokan dengan K=3
Gambar 4. Grafik Rapidminer dengan K=3
ISSN : 2620-6048
Berdasarkan gambar 3, diperoleh hasil yang sama dalam pengelompokan cluster

dimana cluster C1 terdiri 4 provinsi yakni: DKI Jakarta, Jawa Barat, Jawa Timur dan
Papua
5. Kesimpulan
Untuk melakukan penilaian terhadap kasus penderita AIDS menurut provinsi dapat
menerapkan metode clustering K-means. Data diolah untuk memperolah nilai dari kasus
penderita AIDS. Data tersebut diolah menggunakan Ms. Excel untuk ditentukan nilai
centroid dalam 3 cluster yaitu cluster tinggi (C1), cluster sedang (C2) dan cluster rendah
(C3). Sehingga diperoleh penilaian berdasarkan pengelompokan kasus penderita AIDS
berdasarkan provinsi dengan 4 provinsi dalam cluster C1: Papua, DKI Jakarta, Jawa
Barat dan Jawa Timur, 9 provinsi cluster C2, dan 20 provinsi lainnya cluster C3. Hasil
yang didapat dari penelitian dapat menjadi masukan kepada pemerintah, khususnya
provinsi yang menjadi cluster tertinggi dalam kasus penderita AIDS untuk mendapatkan
tindakan lanjut.
Referensi
[1] A. P. Windarto, “Implementation of Data Mining on Rice Imports by Major
Country of Origin Using Algorithm Using K-means Clustering Method,” Int. J.
Artif. Intell. Res., vol. 1, no. 2, pp. 26–33, 2017.
[2] M. G. Sadewo, A. P. Windarto, and D. Hartama, “Penerapan Data mining Pada

Populasi Daging Ayam Ras Pedaging Di Indonesia Berdasarkan Provinsi
Menggunakan K-Means,” InfoTekJar (Jurnal Nas. Inform. dan Teknol. Jaringan),
vol. 2, no. 1, pp. 60–67, 2017.
[3] Luthfi, Kusrini dan Emha Taufiq. 2009. Algoritma Data Mining. Yogyakarta:
Andi.
[4] V. Handayani, A. dan A. P. kurniati, “Analisa Clustering Menggunakan Algoritma

K-Modes,” Telkom University, pp. 1-8, 2010.
[5] N. Atthina dan L. Iswari, “Klasterisasi Data Kesehatan Penduduk untuk

Menentukan Rentang Derajat kesehatan Daerah dengan Metode K-means,”
Seminar Nasional Aplikasi Teknologi Informasi (SNATI), Vol. %1 dari %2ISSN
1907 - 5022, pp. B52 - B59, 2014.

Aplikasi Rapidminer Dalam Pengelompokkan Kasus Penyakit Aids Berdasarkan Provinsi Dengan Data Mining K-Means Clustering

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Aplikasi Rapidminer Dalam Pengelompokkan Kasus Penyakit Aids Berdasarkan Provinsi Dengan Data Mining K-Means Clustering

Uploaded by

Copyright:

Available Formats

ISSN : 2620-6048

Aplikasi RapidMiner dalam Pengelompokkan Kasus Penyakit

Acquired Immunodeficiency Syndrome or Acquired Immune Deficiency Syndrome (AIDS

Gambar 1. Memperlihatkan adanya kecenderungan peningkatan jumlah kasus HIV dari

B. Metode Analisis Data

4. Hasil dan Pembahasan

Tabel 1. Data Jumlah Kasus Penyakit AIDS berdasarkan Provinsi

Jumlah Kasus Meninggal

Tabel 2. Data Rata-Rata Jumlah Kasus Penyakit AIDS berdasarkan Provinsi

Tabel 5. Hasil Pengelompokan Iterasi 1

Tabel 7. Perhitungan Jarak Pusat Cluster Iterasi 2

Provinsi X Y Iterasi 2 Jarak

Tabel 8. Hasil Pengelompokan Iterasi 2

D. Implementasi Tool RapidMiner

Gambar 2. Penggunaan Algoritma K-Means dengan nilai K = 3

Gambar 3. Hasil Pengelompokan dengan K=3

Gambar 4. Grafik Rapidminer dengan K=3

Berdasarkan gambar 3, diperoleh hasil yang sama dalam pengelompokan cluster

[2] M. G. Sadewo, A. P. Windarto, and D. Hartama, “Penerapan Data mining Pada

[4] V. Handayani, A. dan A. P. kurniati, “Analisa Clustering Menggunakan Algoritma

[5] N. Atthina dan L. Iswari, “Klasterisasi Data Kesehatan Penduduk untuk

You might also like