Professional Documents
Culture Documents
1,2,3,4
Sistem Informasi STIKOM Tunas Bangsa Pematangsiantar
riyaniwulansari24@gmail.com, dedyhartama@amiktunasbangsa.ac.id,
Indragunawan@stikomtb.ac.id, agusperdanawindarto@amiktunasbangsa.ac.id
Abstract
Abstrak
Acquired Immunodeficiency Syndrome atau Acquired Immune Deficiency Syndrome (disingkat
AIDS) adalah sekumpulan gejala dan infeksi yang timbul karena rusaknya sistem kekebalan tubuh
manusia akibat infeksi virus HIV. Penelitian ini membahas tentang Aplikasi WEKA dalam
Pengelompokkan Kasus Penyakit AIDS berdasarkan Provinsi dengan Data Mining K-means
Clastering. Kenaikan kasus AIDS di Indonesia menjadi kasus yang tidak pernah lepas dari
perhatian pemerintah. Perhatian dengan tingkat kematian yang terus meningkat membuat orang
kuatir dengan penyebaran virus AIDS ini. Sumber Data dan penelitian ini dikumpulkan dari
dokumen keterangan Jumlah Desa/Kelurahan Yang Memiliki Sarana Kesehatan yang dihasilkan
oleh Badan Penyelenggara Jaminan Sosial. Data yang digunakan dalam penelitian ini yaitu data
dari tahun 2008-2011 yang terdiri dari 34 provinsi. Kriteria penilaian yang digunakan sebanyak 2
yakni 1). rata-rata jumlah kasus penyakit AIDS dan 2) rata-rata jumlah meninggal kasus penyakit
AIDS yang dikelola menggunakan 3 cluster yaitu tingkat cluster tinggi (C1), tingkat cluster sedang
(C2) dan tingkat cluster rendah (C3). Sehingga diperoleh penilaian cluster C1 untuk Kasus
Penyakit AIDS berdasarkan Provinsi sebanyak 4 provinsi yaitu Papua, DKI Jakarta, Jawa Barat
dan Jawa Timur, 9 provinsi untuk cluster C2 dan untuk cluster C3 sebanyak 20. Hal ini dapat
menjadi masukan kepada pemerintah, provinsi yang menjadi perhatian dalam jumlah kasus
penyakit AIDS.
Kata Kunci: Data Maining, Penyakit AIDS, Clustering, K-means
Regional Development Industry & Health Science, Technology and Art of Life 59
ISSN : 2620-6048
1. Pendahuluan
Acquired Immunodeficiency Syndrome atau Acquired Immune Deficiency Syndrome
(disingkat AIDS) adalah sekumpulan gejala dan infeksi yang timbul karena rusaknya
sistem kekebalan tubuh manusia akibat infeksi virus HIV. Berdasarkan pusat data dan
informasi kementrian kesehatan RI, diseluruh dunia pada tahun 2013 ada 35 juta orang
hidup dengan HIV yang meliputi 16 juta perempuan dan 3,2 juta anak berusia <15 tahun.
Jumlah infeksi baru HIV pada tahun 2013 sebesar 2,1 juta yang terdiri dari 1,9 juta
dewasa dan 240.000 anak berusia <15 tahun. Jumlah kematian akibat AIDS sebanyak 1,5
juta yang terdiri dari 1,3 juta dewasa dan 190.000 anak berusia <15 tahun. Di indonesia
HIV AIDS pertama kali ditemukan di provinsi Bali pada tahun 1987. Hingga saat ini
AIDS sudah menyebar di 386 kabupaten/kota di seluruh provinsi di indonesia. Berikut ini
jumlah kasus AIDS yang dilaporkan tahun 1987 sampai dengan september 2014.
Gambar 1. Jumlah Kasus AIDS Yang Dilaporkan Tahun 1987 - September 2014
Sumber : Ditjen PP & PL, Kemenkes RI, 2014
Regional Development Industry & Health Science, Technology and Art of Life 60
ISSN : 2620-6048
2. Landasan Teori
A. Data Maining
Data mining juga merupakan metode yang digunakan dalam pengolahan data berskala
besar oleh karena itu data mining memiliki peranan yang sangat penting dalam beberapa
bidang kehidupan diantaranya yaitu bidang industri, bidang keuangan, cuaca, ilmu dan
teknologi. Data mining juga bisa diartikan sebagai rangkaian kegiatan untuk menemukan
pola yang menarik dari data dalam jumlah besar, kemudian data – data tersebut dapat
disimpan dalam database, data warehouse atau penyimpanan informasi. Ada beberapa
ilmu yang mendukung teknik data mining diantaranya adalah data analisis, signal
processing, neural network dan pengenalan pola [1].
B. Clustering
Analisis Pengelompokan/Clustering merupakan proses membagi data dalam suatu
himpunan ke dalam beberapa kelompok yang kesamaan datanya dalam suatu kelompok
lebih besar daripada kesamaan data tersebut dengan data dalam kelompok lain. Potensi
clustering adalah dapat digunakan untuk mengetahui struktur dalam data yang dapat
dipakai lebih lanjut dalam berbagai aplikasi secara luas seperti klasifikasi, pengolahan
gambar, dan pengenalan pola [2].
C. K-means
K-means merupakan suatu algoritma yang digunakan dalam pengelompokkan secara
pertisi yang memisahkan data ke dalam kelompok yang berbeda – berda. Algoritma ini
mampu meminimalkan jarak antara data ke clusternya. Pada dasarnya penggunaan
algoritma ini dalam proses clustering tergantung pada data yang didapatkan dan konklusi
yang ingin dicapai di akhir proses[3]. Sehingga dalam penggunaan algoritma kmeans
terdapat aturan sebagai berikut [4] :
a. Berapa jumlah clusteryang perlu dimasukkan
b. Hanya memiliki atribut bertipe numeric
Pada dasarnya algoritma K-means hanya mengambil sebagian dari banyaknya
komponen yang didapatkan untuk kemudian dijadikan pusat clusterawal, pada penentuan
pusat clusterini dipilih secara acak dari populasi data. Kemudian algoritma K-means akan
menguji masing – masing dari setiap komponen dalam populasi data tersebut dan
menandai komponen tersebut ke dalam salah satu pusat cluster yang telah didefinisikan
sebelumnya tergantung dari jarak minimum antar komponen dengan tiap – tiap pusat
cluster. Selanjutnya posisi pusat clusterakan dihitung kembeli samapi semua komponen
data digolongkan ke dalam tiap – tiap cluster dan terakhir akan terbentuk cluster baru[5].
3. Metodologi Penelitian
A. Metode Pengumpulan Data
Dalam kegiatan pengumpulan data untuk penelitian ini digunakan metode
pengumpulan studi pustaka yang mana pada metode ini kegiatan dilakukan adalah
mempelajari, mencari dan mengumpulkan data yang berhubungan dengan penelitian ini.
Data yang digunakan dalam pengelompokkan kasus penyakit AIDS ini diperoleh dari
dokumen keterangan jumlah kasus penyakit AIDS berdasarkan provinsi oleh Badan Pusat
Statistik pada tahun 2018 – 2011.
Regional Development Industry & Health Science, Technology and Art of Life 61
ISSN : 2620-6048
pola, memilih mana yang penting dan mana yang akan dipelajari dan kemudian membuat
kesimpulan agar dapat dipahami diri sendiri dan orang lain. Dalam penulisan penelitian
ini menggunakan analisis data yang bersifat kualitatif, penelitian kualitatif adalah analisis
yang dilakukan dengan mengelompokkan data untuk mencari suatu pola dari hal yang
dipelajari dan membandingkan konsep-konsep yang ada dalam sumber.
C. Studi Literatur
Kegiatan ilmiah yang dilakukan untuk menemukan jawaban satu permasalahan, dan
tujuan akhirnya memberikan kontribusi teoritis atau praktis pada pengembangan bidang
ilmu yang bersangkutan. Studi literatur yang digunakan disini meliputi pengolahan data
kasus penyakit AIDS.
Regional Development Industry & Health Science, Technology and Art of Life 62
ISSN : 2620-6048
Data tersebut kemudian diakumulasikan dan diambil nilai rata-rata dari setiap kriteria
seperti yang ditunjukkan pada tabel 2 berikut :
Setelah diakumulasikan dan dicari nilai rata-rata maka akan didapatkan nilai dari
setiap variable. Kemudian data tersebut akan masuk ke tahapan clustering dengan
menerapkan algoritma K-means untuk mengcluster data menjadi tiga cluster.
Regional Development Industry & Health Science, Technology and Art of Life 63
ISSN : 2620-6048
A. Centroid Data
Dalam penerapan algoritma K-means dihasilkan nilai titik tengah atau centroid dari
data yang didapat dengan ketentuan bahwa clusterisasi yang diinginkan adalah 3,
Penentuan cluster dibagi atas tiga bagian yakni cluster tinggi (C1), cluster sedang (C2)
dan cluster tingkat rendah (C3). maka nilai titik tengah atau centroid juga terdapat 3 titik.
Penentuan titik cluster ini dilakukan dengan mengambil nilai terbesar (maksimum) untuk
cluster tinggi (C1), nilai rata-rata (average) untuk cluster sedang (C2) dan nilai terkecil
(minimum) untuk cluster rendah (C3). Nilai titik tersebut dapat diketahui pada tabel
berikut:
Tabel 3. Centroid Data Awal (Iterasi 1)
Centroid
Max (C1) 3771 703,25
Average (C2) 635,3636 125
Min (C3) 0 0
B. Clustering Data
Dengan menggunakan centroid tersebut maka dapat dicluster data yang telah didapat
menjadi 3 cluster. Proses cluster dengan mengambil jarak terdekat dari setiap data yang
diolah. Dari data jumlah desa/kelurahan yang memiliki sarana kesehatan menurut
provinsi didapatkan pengelompokan pada iterasi 1 untuk 3 cluster tersebut. Cluster
penderita Kasus AIDS tinggi (C1) yakni DKI Jakarta, Jawa Barat, Jawa Timur dan Papua.
Cluster penderita Kasus AIDS sedang (C2) yakni 9 Provinsi dan cluster penderita Kasus
AIDS rendah (C3) yakni 20 provinsi lainnya. Proses pencarian jarak terpendek,
pengelompokan data pada iterasi 1 dan Clustering atas dapat digambarkan pada tabel dan
gambar berikut:
Tabel 4. Perhitungan Jarak Pusat Cluster Iterasi 1
Iterasi 1
Provinsi X Y Jarak
C1 C2 C3 Terpendek
Aceh 43,50 10,75 3791,28 602,79 44,81 44,81
Sumatera Utara 542,75 104,00 3283,40 94,96 552,62 94,96
Sumatera Barat 328,75 84,75 3497,37 309,24 339,50 309,24
Riau 422,25 124,25 3398,44 213,11 440,15 213,11
Jambi 207,50 52,00 3622,52 434,05 213,92 213,92
Sumatera Selatan 195,25 35,75 3637,52 449,07 198,50 198,50
Bengkulu 96,50 21,75 3737,16 548,67 98,92 98,92
Lampung 143,75 42,00 3687,03 498,57 149,76 149,76
Kep. Bangka 106,00 14,50 3729,16 540,77 106,99 106,99
Kepulauan Riau 342,00 133,75 3475,97 293,49 367,22 293,49
DKI Jakarta 3382,50 504,50 436,39 2773,23 3419,92 436,39
Jawa Barat 3233,00 608,50 546,28 2642,25 3289,77 546,28
Jawa Tengah 674,00 267,00 3127,57 147,16 724,96 147,16
DI Yogyakarta 388,50 89,50 3437,73 249,40 398,68 249,40
Jawa Timur 3771,00 703,25 0,00 3188,51 3836,01 0,00
Banten 287,50 49,50 3544,31 355,96 291,73 291,73
Bali 869,00 260,50 2935,58 270,09 907,21 270,09
NTB 142,25 70,50 3683,50 496,12 158,76 158,76
NTT 218,75 33,50 3614,84 426,54 221,30 221,30
Kalimantan Barat 730,00 122,25 3096,00 94,68 740,17 94,68
Regional Development Industry & Health Science, Technology and Art of Life 64
ISSN : 2620-6048
Iterasi 1
Provinsi X Y Jarak
C1 C2 C3 Terpendek
Kalimantan Tengah 37,00 3,00 3799,09 610,67 37,12 37,12
Kalimantan Selatan 26,00 5,00 3809,54 621,07 26,48 26,48
Kalimantan Timur 11,25 10,00 3823,13 634,62 15,05 15,05
Sulawesi Utara 255,00 73,25 3572,00 383,87 265,31 265,31
Sulawesi Tengah 11,00 5,50 3824,19 635,70 12,30 12,30
Sulawesi Selatan 468,00 88,25 3359,77 171,35 476,25 171,35
Sulawesi Tenggara 19,25 3,75 3816,40 627,93 19,61 19,61
Gorontalo 3,00 1,00 3832,88 644,41 3,16 3,16
Sulawesi Barat 0,00 0,00 3836,01 647,54 0,00 0,00
Maluku 191,25 69,50 3635,42 447,57 203,49 203,49
Maluku Utara 12,75 7,75 3822,06 633,56 14,92 14,92
Papua Barat 142,75 52,25 3686,19 497,96 152,01 152,01
Papua 3665,00 473,25 253,25 3049,59 3695,43 253,25
Regional Development Industry & Health Science, Technology and Art of Life 65
ISSN : 2620-6048
Provinsi C1 C2 C3
Maluku Utara 1
Papua Barat 1
Papua 1
Jumlah 4 9 20
Proses K-means akan terus beriterasi sampai pengelompokan data sama dengan
pengelompokan data iterasi sebelumnya. Dengan kata lain, proses akan terus melakukan
iterasi sampai data pada iterasi terakhir sama dengan iterasi sebelumnya. Pada iterasi 1
diperoleh cluster data jumlah kasus penyakit AIDS berdasarkan Provinsi. Proses iterasi
tersebut berhenti pada iterasi berikutnya, pada iterasi berikutnya akan dilakukan proses
mencari nilai titik tengah atau centroid. Setelah mendapatkan nilai titik tengah atau
centroid, proses sama dilakukan dengan mencari jarak terdekat. Proses pencarian jarak
terpendek, pengelompokan data pada iterasi terakhir dan Clustering data dapat
digambarkan pada tabel berikut:
Tabel 6. Centroid Data Iterasi 2
Centroid
Cluster C1 3512,88 572,38
Cluster C2 529,47 141,58
Cluster C3 107,51 28,06
Regional Development Industry & Health Science, Technology and Art of Life 66
ISSN : 2620-6048
C. Analisa Data
Pada iterasi 2, pengelompokan data yang dilakukan terhadap 3 cluster dengan iterasi 1
didapatkan hasil yang sama. Dari 34 data jumlah kasus penderita AIDS berdasarkan
provinsi dapat dikertahui, 4 provinsi cluster tingkat tinggi untuk penderita kasus AIDS
yakni Papua, DKI Jakarta, Jawa Barat dan Jawa Timur, 9 provinsi cluster tingkat sedang
dan 20 provinsi lainnya termasuk cluster tingkat rendah.
Regional Development Industry & Health Science, Technology and Art of Life 67
ISSN : 2620-6048
Regional Development Industry & Health Science, Technology and Art of Life 68
ISSN : 2620-6048
5. Kesimpulan
Untuk melakukan penilaian terhadap kasus penderita AIDS menurut provinsi dapat
menerapkan metode clustering K-means. Data diolah untuk memperolah nilai dari kasus
penderita AIDS. Data tersebut diolah menggunakan Ms. Excel untuk ditentukan nilai
centroid dalam 3 cluster yaitu cluster tinggi (C1), cluster sedang (C2) dan cluster rendah
(C3). Sehingga diperoleh penilaian berdasarkan pengelompokan kasus penderita AIDS
berdasarkan provinsi dengan 4 provinsi dalam cluster C1: Papua, DKI Jakarta, Jawa
Barat dan Jawa Timur, 9 provinsi cluster C2, dan 20 provinsi lainnya cluster C3. Hasil
yang didapat dari penelitian dapat menjadi masukan kepada pemerintah, khususnya
provinsi yang menjadi cluster tertinggi dalam kasus penderita AIDS untuk mendapatkan
tindakan lanjut.
Referensi
[1] A. P. Windarto, “Implementation of Data Mining on Rice Imports by Major
Country of Origin Using Algorithm Using K-means Clustering Method,” Int. J.
Artif. Intell. Res., vol. 1, no. 2, pp. 26–33, 2017.
[3] Luthfi, Kusrini dan Emha Taufiq. 2009. Algoritma Data Mining. Yogyakarta:
Andi.
Regional Development Industry & Health Science, Technology and Art of Life 69