You are on page 1of 8

Jurnal Ilmiah Wahana Pendidikan

https://jurnal.peneliti.net/index.php/JIWP
Vol. 7, No. 4, Agustus 2021
Clustering Tingkat Kedisiplinan Warga Bekasi Dalam Menjalankan Protokol Kesehatan
di Masa Pandemi Covid-19 dengan Algoritme K-Means

Andri Dwi Noviandi1, Tesa Nur Padillah2, Yuyun Umaidah3


1,2,3
Program Studi Teknik Informatika, Fakultas Ilmu Komputer Universitas Singaperbangsa
Karawang Jl. H.S Ronggowaluyo Teluk Jambe Timur Kabupaten Karawang. 41361.
Email: andri.dwi17056@student.unsika.ac.id

Info Artikel Abstract:


Sejarah Artikel: Health protocols during the Covid-19 pandemic are very necessary
Diterima: 30 Juli 2021 because health protocols can speed up breaking the chain of
Direvisi: 19 Agustus 2021 spreading the Covid-19 virus. Violations that are often found in the
Dipublikasikan: Agustus 2021 Bekasi city environment are related to health protocols, namely
e-ISSN: 2089-5364
maintaining distance, wearing masks and washing hands, or using
p-ISSN: 2622-8327
DOI: hand sanitizer. There are still many who do not comply with the rules
of the health protocol. The purpose of knowing the cluster level of
discipline towards health protocols into five clusters spread by the
number of respondents in various sub-districts in the city of Bekasi
with the categories of discipline, somewhat disciplined, rarely
disciplined, less disciplined, and undisciplined. Data mining is the
process of extracting data to obtain new information. The technique
used in this research is simple random sampling. This study using the
CRIPS-DM methodology. This study calculates the k-means
algorithm by obtaining a value of k = 2. The results of the test using
the RapidMiner Studio 9.3 tools obtained two clusters or 2 categories
of discipline levels against health protocols, namely cluster 0 with a
percentage of 55.08% which is categorized as the most disciplined
level, and cluster 1 with a percentage of 44.92% which is categorized
as the least disciplined level. The results of clustering are evaluated
by using the Silhouette Coefficient with the best cluster, k = 2 with a
value of 0.926989, which is the best cluster.

Keywords: Data mining, Clustering, K-means Algortime, Silhouette


Coefficient

PENDAHULUAN

681
Penyebaran Covid-19 di Indonesia mematuhi protokol kesehatan di masa
sudah semakin bertambah banyak di pandemi saat ini. Penulisan ini tentu
masing–masing daerah. Corona adalah melihat penelitian sebelumnya yang
kumpulan virus yang bisa menginfeksi menggunakan metode dan algoritme yang
sistem pernapasan. Pada banyak kasus, sama yaitu metode Clustering dan
virus ini hanya menyebabkan infeksi menggunakan Algoritme K-means.
pernapasan ringan, seperti flu. Namun, Mengapa menggunakan Metode Clustering
virus ini juga bisa menyebabkan infeksi dan Algoritme K-means? Menurut (Asroni,
pernapasan berat, seperti infeksi paru-paru 2018) clustering adalah untuk
(pneumonia), Middle-East Respiratory meminimalkan fungsi objektif yang di set
Syndrome (MERS), severe acute dalam suatu kelompok dan
respiratory syndrome (SARS). Virus ini memaksimalkan variasi antar kelompok.
dapat menyerang bayi, anak-anak, orang Berdasarkan permasalahan diatas K-
dewasa, lansia, dan ibu hamil. Wabah means adalah salah satu bentuk
virus Covid-19 membuat masyarakat pengelompokan yang paling sederhana.
merasa ketakutan dan panik. Begitu juga Prosedurnya sederhana dan mudah untuk
ada beberapa masyarakat yang tidak mengklasifikasikan data yang diberikan
peduli/percaya mengenai wabah virus melalui sejumlah cluster dan juga
corona ini. Pandemi ini membuat algoritme ini dapat membuat kelompok
masyarakat kita mengisolasikan diri, ataupun data set yang besar bisa menjadi
menjaga jarak, mengenakan masker, dan mudah dengan algoritme tersebut.
kerja dari rumah (KEMENKES, 2020).
Menurut Kementerian Kesehatan METODOLOGI PENELITIAN
Indonesia melakukan protokol kesehatan di Objek Penelitian
masa pandemic Covid-19 sangat perlu Objek penelitian yang akan diteliti
dilakukan, karena protokol kesehatan bisa mengenai analisis tingkat kedisiplinan
mempercepat memutus mata rantai warga Bekasi dengan menggunakan teknik
penyebaran virus Covid-19 jika dilakukan clustering dan algoritme K-means dalam
dengan sadar, taat dan benar. Disiplin menjalankan protokol kesehatan di masa
dalam menerapkan protokol kesehatan pandemi Covid-19. Data diperoleh dari
menjadi kunci pengendalian penularan kuesioner google form. Metodologi Data
Covid-19. Dari sisi masyarakat, hal ini mining Life Cycle (DMLC) yaitu Cross
membutuhkan kepatuhan untuk tertib Industry Standard Process for Data mining
dalam bermasker, mencuci tangan, dan (CRISP-DM) atau bisa disebut juga dengan
menjaga jarak. Di sisi lain, masyarakat tentang siklus hidup pengembangan data
juga butuh teladan agar konsisten mining.
menjadikan perilaku hidup sehat tersebut
sebagai sebuah identitas baru. Pelanggaran Metodologi Penelitian
yang banyak dijumpai di lingkungan Dalam penelitian ini metodologi
sekitar terkait protokol kesehatan yaitu Data mining Life Cycle (DMLC) yang
menjaga jarak, memakai masker dan digunakan adalah Cross Industry Standard
mencuci tangan atau menggunakan Process for Data mining (CRISP-DM).
handsanitizer. Masih banyak yang tidak Metodologi CRISP-DM merupakan standar
mematuhi aturan dari protokol kesehatan dalam melakukan penelitian dengan
tersebut. bertemakan data mining dan knowledge
Penelitian ini dimaksudkan untuk discovery, karena metodologi ini banyak
mengetahui tingkat kedisiplinan digunakan dalam bisnis dan
masyarakat di Kota Bekasi dalam pengembangan data mining itu sendiri.

682
CRISP-DM ini memiliki tahapan – tahapan untuk menentukan apakah meningkat atau
sebagai berikut: menurun.
1. Business Understanding
2. Data Understanding Fase Pemahaman Data (Data
3. Data Preparation Understanding)
4. Modelling Pada penelitian ini sumber data
5. Evaluation yang akan digunakan data primer yaitu
6. Deployment data dari survei kuesioner, yang dimana
peneliti sudah memberikan kuesioner
Fase Pemahaman Bisnis (Business google form via social media yang sudah
Understanding) dilakukan sejak bulan februari 2021
Tujuan dari penelitian ini yaitu sampai april 2021 tersebut yang telah
melakukan pengelompokkan berdasarkan diisi oleh beberapa masyarakat kota
karakteristik protokol kesehatan dan Bekasi yang bertujuan memudahkan
seberapa patuh dan disiplin masyarakat dalam mengolah dataset yang telah diisi
kota Bekasi dalam hal mengikuti arahan oleh masyarakat.
pemerintah dengan mematuhi aturan
protokol kesehatan, kemudian pembagian Fase Data Preparation
cluster dengan menggunakan metode K- Tahap ini merupakan tahap dimana
means. data yang sudah ada dari kuesioner
Tahap awal peneliti menggunakan survei tersebut dilakukan prepocessing untuk
kuesioner untuk masyarakat sekitar kota membuat data mentah menjadi data yang
Bekasi dengan mengirimkan sebuah link memiliki kualitas dan arti. Peneliti
dan mengirim link tersebut ke sosial media melakukan beberapa proses untuk dataset
Whatsapp dan lainnya. Survei dilakukan yang sudah didapatkan sebelumnya yang
dari periode bulan Februari 2021 hingga sudah diisi oleh masyarakat kota Bekasi
April 2021. Teknik sampling dalam dalam waktu beberapa bulan yaitu dari
penelitian ini yaitu Simple Random bulan februari sampai april 2021. Dalam
Sampling yang digunakan untuk fase ini yang harus dilakukan terhadap data
mendapatkan data set dari suatu responden tersebut antara lain:
dengan cara memilih secara acak dari 1. Data Cleaning antara lain mengisi
jumlah penduduk yaitu 2.543.676 dari nilai yang hilang, mengidentifikasi
berbagai kecamatan yang ada di kota adanya outlier, menangani noise pada
Bekasi dan dari responden yang secara data, mengoreksi data yang tidak
acak itu akan mewakilkan wilayahnya konsisten, dan menyelesaikan masalah
untuk dijadikan data set yang akan redudansi data yang disebabkan
digunakan dalam penelitian ini. Penelitian integrasi data.
ini dilakukan untuk membantu 2. Data Transformation yaitu melakukan
memberikan masukan kepada masyarakat normalisasi dan mengumpulkan data
kota Bekasi dalam hal kedisiplinan agar menjadi sama.
terhadap protokol kesehatan dan dapat 3. Data Selection, memilih atribut -
mengetahui apakah tingkat kedisiplinan atribut tertentu yang akan digunakan
tersebut ada peningkatan atau tidak. untuk melakukan proses data mining.
caranya dengan dilakukannya
pengelompokan tingkat kedisiplinan warga Fase Pemodelan (Modelling)
Bekasi dengan cluster lalu dilakukan Tahapan ini merupakan tahapan
perhitungan dengan algoritme yang dipilih implementasi dari data yang telah melalui
tahapan preprocessing dan sudah di-import

683
dilakukan pemodelan menggunakan apakah kualitas dan efektifitas model yang
algoritme K-means. Peneliti melakukan sudah dirancang sesuai dengan tuhuan dan
proses clustering untuk mengetahui apakah masalah dalam penelitian ini. Tahap
tingkat kedisiplinan tersebut ada evaluasi ini menggunakan silhouette
peningkatan atau tidak. dataset yang coefficient yakni pengukuran keakuratan
dipakai untuk pemodelan ini atribut yang hasil yang dicapai oleh model yang sudah
digunakan setelah dilakukannya proses digunakan dan mengetahui perhitungan
tahapan preprocessing yaitu atribut yang sudah dilakukan menggunakan
pemakaian masker, menjaga jarak, algoritme K-means.
penggunaan hand sanitizer dan mencuci
tangan yang sudah dilakukan peneliti di Fase Penyebaran (Deployment)
lakukan di kota Bekasi dari bulan februari Setelah peneliti melakukan
sampai april 2021. Dilihat pada Gambar 1 evaluasi, tahap selanjutnya adalah tahap
siklus di fase modeling. penyebaran yaitu hasil penelitian ini dapat
digunakan untuk masyarakat Bekasi dari
hasil clustering dengan menggunakan
algoritme k-means dan keakuratan cluster
dengan silhouette coefficient terhadap
dataset dari kuesioner yang sudah
didapatkan dari bulan februari sampai april
2021. Lalu, dalam mencari informasi
mengenai seberapa persentase patuh dan
disiplin masyarakat dalam menerapkan
protokol kesehatan di sekitar dengan
menggunakan tools ArcGIS 10.8 untuk
pemetaan daerah berdasarkan wilayah
kecamatan, dan juga untuk dijadikan
sebagai laporan dan artikel jurnal.

HASIL DAN PEMBAHASAN


Pada penelitian ini hasil yang
didapatkan pada dataset yang sudah di
analisis dari total survey kuesioner yang
didapatkan berjumlah 423. Tabel 1
merupakan deskripsi dataset
Atribut Tipe data keterangan
Gambar 1 Siklus Modelling Umur numerik Umur responden
Jenis Kelamin nominal Jenis kelamin responden
Pekerjaan nominal Pekerjaan responden
Fase Evaluasi (Evaluation) Memakai nominal Jumlah kedisiplinan
Sebelum peneliti disebarkan masker prokes
mengenai hasil penelitian kepada Mencuci nominal Jumlah kedisiplinan
masyarakat kota Bekasi, hasil yang tangan prokes
didapatkan dari perhitungan algoritme Menjaga jarak nominal Jumlah kedisiplinan
prokes
k-means terhadap dataset yang sudah
Hand sanitizer nominal Jumlah kedisiplinan
didapatkan dari kuesioner dari bulan prokes
februari sampai april 2021 perlu Tabel 1. Deskripsi Data
diadakannya tahap evaluasi. Tahap
evaluasi ini dilakukan untuk menilai

684
Lalu, atribut yang akan digunakan dalam Cluster Anggota
proses data mining yang sudah 0 233
ditransformasi yang sebelumnya tipe data 1 190
nominal menjadi tipe data numerik. Atribut Valid 423
yang dipilih adalah atribut memakai Missing 0
masker, mencuci tangan, menjaga jarak
dan hand sanitizer. Tabel 2 dibawah ini Hasil pengelompokkan pada K=2 pada
adalah dataset Final yang akan digunakan. Tabel 4 dan nilai rata – rata setiap
Tabel 2. Dataset Final cluster/final centroid.
Atribut Tipe data keterangan Tabel 4. Final Centroid
Memakai Numerik Jumlah Atribut Cluster 0 Cluster 1
masker kedisiplinan
Pemakaian 1.030 1.394
prokes
Masker
Mencuci Numerik Jumlah
Mencuci Tangan 1.270 1.915
tangan kedisiplinan
prokes Menjaga Jarak 1.613 2.531
Menjaga jarak Numerik Jumlah
kedisiplinan Hand Sanitizer 1.300 1.936
prokes
Hand sanitizer Numerik Jumlah
kedisiplinan Proses selanjutnya adalah perhitungan
prokes
kualitas cluster dengan menggunakan
metode Silhouette Coefficient pada Tabel
Penelitian ini dilakukan menggunakan
5.
algoritme k-means dan Davies Bouldin
Tabel 5. Hasil Uji SC Jumlah Cluster
Index untuk menentukan jumlah cluster
Menggunakan K-Means
yang optimal. Tools yang digunakan pada Data Uji Nilai K Silouette
penelitian ini menggunakan RapidMiner
Coefficient
Studio 9.3 untuk proses data mining. Hasil
423 2 0,926989
yang didapatkan dalam pengujian jumlah 3 0,512302
nilai K yang optimal dari K=2 sampai 4 0,474802
K=6, didapatkan jumlah K=2 adalah yang 5 0,039175
optimal dalam Gambar 2. 6 0,121302
Gambar 2. Visual Hasil Clustering Nilai SC 0,926989 (K=2)

Berdasarkan perhitungan pada


kualitas55,08
cluster
% pada dataset tingkat
kedisiplinan warga 44,92 % dalam
Bekasi
menjalankan protokol kesehatan dengan uji
423 data, pengujian kualitas cluster yang di
uji yaitu nilai k=2 sampai k=6. Kualitas
cluster paling baik diperoleh pada cluster 2
dengan nilai Silhouette Coefficient sebesar
Gambar 2 menunjukkan bahwa cluster 0 0,926989.
presentase sebesar 55,08 % dan cluster 1 Untuk pemetaan daerah dari hasil
presentase sebesar 44,92 %. Proses k- clustering sebelumnya menggunakan tools
means clustering dapat mengetahui jumlah ArcGIS, hasilnya bisa dilihat pada
anggota tiap cluster. Tabel 3 menunjukkan Gambar 3.
jumlah anggota setiap cluster.
Tabel 3. Jumlah Anggota Setiap Cluster

685
Selatan,
Gambar 3. Pemetaan Hasil Clustering Tambun
Utara,
dengan software ArcGIS 10.8 Tarumajaya,
Setu,
Sukawangi

Wilayah kecamatan yang masuk ke


dalam cluster 0 adalah Cibitung, Babelan,
Tambelang, Cikarang Pusat,
Cabangbungin, Cikarang Timur,
Kedungwaringin, Muaragembong,
Cibarusah, Karangbahagja, dan Pebayuran.
Selanjutnya wilayah kecamatan
yang masuk ke dalam cluster 1 adalah
Cikarang Selatan, Tambun Selatan,
Tambun Utara, Tarumajaya, Setu dan
Sukawangi.

KESIMPULAN
1. Dari hasil clustering perhitungan
Cluster tingkat kedisiplinan k=2 terdapat lima titik cluster yang
terhadap protokol kesehatan pada masa tersebar pada setiap wilayah Bekasi
pandemik saat ini terbagi menjadi 2 cluster dengan kategori disiplin dan tidak
dan beberapa cluster tersebut terdapat disiplin dengan melihat dari warna
beberapa wilayah per kecamatan yang ada cluster dari mulai Hijau dengan
di kota Bekasi. presentase sebesar 55,08 % yang
paling disiplin dalam menjalankan
Tabel 6. Hasil Cluster Dataset protokol kesehatan dan warna
Clust Kecamata Present Krite War merah dengan presentase sebesar
er n ase ria na 44,92 % adalah warna yang paling
Cibitung, tidak disiplin dalam menjalankan
Babelan, protokol kesehatan.
Tambelang,
Cikarang 2. Hasil Silhouette Coefficient dengan
Pusat, metode K-Means adalah sebesar
Cabangbung 0,926989 menunjukan bahwa
in, Cikarang kualitas cluster yang baik (strong
Cluste Timur, Disipli
r0 Kedungwari
55,08 %
n
Hijau structure) karena mendekati angka
ngin, 1
Muaragemb 3. Pemetaan wilayah tersebut
ong, digunakan untuk
Cibarusah, menginformasikan hasil yang sudah
Karangbaha
gia,
didapat ini dilakukan dengan
Pebayuran mengirim ke berbagai sosial media,
Cluste 44,92 % Tidak Mera terutama ke whatsapp seperti
r1 Cikarang disipli h kuesioner dataset yang dibuat
Selatan, n sebagai jalan untuk menuju disiplin
Tambun

686
dalam menjalankan protokol Indonesia Berdasarkan Analisis
kesehatan yang lebih baik lagi. Klaster. Journal of Industrial
Engineering and Management
DAFTAR PUSTAKA Systems, Vol. 13, No. 2, 74-86.
Abadi, S., The, K, S, M., Mohd. Nasir, Hafeez, A., Ahmad, S., Siddqui, S, A.,
B., Huda, M., L. Ivanova, N., Sari, Ahmad, M., Mishra, S. (2020). A
T, I., Maseleno, A. Satria, F., Review of COVID-19 (Coronavirus
Muslihudin, M. (2018) Application Disease-2019) Diagnosis,
Model of K-means Clustering: Treatments and Prevention.
Insights into Promotion Strategy of Eurasian Journal of Medicine and
Vocational High School. Oncology, 4(2), hal. 116–125.
International Journal of J.Han., M. Kamber., J. Pei. (2012). “Data
Engineering and Technology, Mining Concecpts and Techniques
7(27), hal. 182–187. Third Edition”. San Fransisco:
Asroni, H. Fitri, E.Prasetyo. (Mei 2018). Morgan Kauffman Publisher.
Penerapan Metode Clustering Larose, D.T. (2005). Discovering
dengan Algoritma K-means pada knowledge in data: an introduction
Pengelompokkan Data Calon to data mining. John Willey &
Mahasiswa Baru di Universitas Sons, Inc.
Muhammadiyah Yogyakarta (Studi Liyas, J. N., & Primadi, R. (2017).
Kasus: Fakultas Kedokteran dan Pengaruh disiplin kerja terhadap
Ilmu Kesehatan, dan Fakultas Ilmu kinerja karyawan pada bank
Sosial dan Ilmu Politik). perkreditan rakyat. Al-Masraf:
SEMESTA TEKNIKA, Vol. 21. Jurnal Lembaga Keuangan dan
No. 1, 60-64. Perbankan, 2(1), 17-26.
Arieska, P. K., & Herdiani, N. (2018). Menteri Kesehatan Republik Indonesia.
Pemilihan Teknik Sampling (2020). Keputusan Menteri
Berdasarkan Perhitungan Efisiensi Kesehatan Republik Indonesia
Relatif. Jurnal Statistika Universitas Nomor
Muhammadiyah Semarang, 6(2). HK.01.07/MENKES/382/2020
166-171. Tentang Protokol Kesehatan Bagi
Darmi, Yulia., & Setiawan, A. (2016). Masyarakat di Tempat dan
Penerapan Metode Clustering K- Fasilitias Umum Dalam Rangka
means Dalam Pengelompokan Pencegahan dan Pengendalian
Penjualan Produk. Jurnal Media Corona Virus Disease 2019
Infotama. 2(12). 148-157. (COVID 19), Jakarta: Departemen
Fadillah, A. P. (2015). Penerapan Metode Kesehatan.
CRISP-DM untuk Prediksi Muliono, R., & Sembiring, Z. (2019).
Kelulusan Studi Mahasiswa Data mining Clustering
Menempuh Mata Kuliah (Studi Menggunakan Algoritma K-means
Kasus Universitas XYZ). JuTISI Untuk Klasterisasi Tingkat
(Jurnal Teknik Informatika dan Tridarma Pengajaran Dosen. CESS
Sistem Informasi), 1(3). (Journal of Computer Engineering,
G.D.Rembulan, T.Wijaya, D.Palullungan, System and Science), 4(2), 272-
K.N.Alfina, dan M.Qurthuby. 279.
(2020). Kebijakan Pemerintah Pramesti, D. F., Furqon, M. T. dan Dewi,
Mengenai Coronavirus Disease C. (2017) “Implementasi Metode
(COVID-19) Di Setiap Provinsi Di KMedoids Clustering Untuk

687
Pengelompokan Data,” Jurnal
Pengembangan Teknologi
Informasi dan Ilmu Komputer, 1(9),
hal. 723–732.
Shafique, U., & Qaiser, A. (2014). A
Comparative Study of Data mining
Process Models (KDD, CRISP-DM
and SEMMA). International
Journal of Innovation and Scientific
Research. 12(1). 217-222
Siska, S. T. (2016). Analisa Dan
Penerapan Data mining Untuk
Menentukan Kubikasi Air Terjual
Berdasarkan Pengelompokan
Pelanggan Menggunakan
Algoritma K-means
Clustering. Jurnal Teknologi
Informasi dan Pendidikan, 9(1), 86-
93.
Sindi, S., Ningse, W. R. O., Sihombing, I.
A., Zer, F. I. R., & Hartama, D.
(2020). Analisis algoritma k-
medoids clustering dalam
pengelompokan penyebaran covid-
19 di indonesia. JurTI (Jurnal
Teknologi Informasi), 4(1), 166-
173.
Shen, K., Yang, Y., Wang, T., Zhao, D.,
Jiang, Y., Jin, R., ... & Gao, L.
(2020). Diagnosis, treatment, and
prevention of 2019 novel
coronavirus infection in children:
experts’ consensus
statement. World journal of
pediatrics, 16(3), 223-231.

688

You might also like