Professional Documents
Culture Documents
Jurnal Teknologi Industri Pertanian 32 (3): 239-247, Desember 2022 Terakreditasi Peringkat 2
DOI: https://doi.org/10.24961/j.tek.ind.pert.2022.32.3.239 SK Dirjen Pendidikan Tinggi, Riset, dan Teknologi No. 158/E/KPT/2021
ISSN: 0216-3160 EISSN: 2252-3901 Tersedia online http://journal.ipb.ac.id/index.php/jurnaltin
1)Prodi Teknik Industri Universitas Bina Sarana Informatika, Jl. Kramat Raya No.98, Senen, Jakarta
2)Magister Teknik Industri Universitas Trisakti, Jl. Kyai Tapa No.1, Grogol, Jakarta
2)Jurusan Teknik Industri Universitas Trisakti, Jl. Kyai Tapa No.1, Grogol, Jakarta
*Email: rinaf@trisakti.ac.id
Makalah: Diterima 28 Juni 2022; Diperbaiki 19 September 2022; Disetujui 10 Oktober 2022
ABSTRACT
Livestock is the main sector in the effort to fulfill food needs for people in Indonesia and has the potential
to maintain the availability of animal food. Guidance and socialization to provide information and knowledge in
the field of food production from animals, especially in areas with low levels of chicken meat production need to
be done. The research objectives were the use of the K-Means and K-Medoids algorithms for grouping chicken
meat production areas in the province of West Java and the use of the Davies Bouldin Index (DBI) value in
choosing the best algorithm. The application of K-Means and K-Medoids was carried out through the data mining
process phase, namely data collection, data preprocessing, data mining implementation, evaluation of the number
of clusters, determination of the best algorithm, and clustering results. The K-Means algorithm with 5 clusters can
optimally classify potential areas for chicken meat production in West Java province with a DBI value of 0.273.
The results of clustering can be used in business processes related to information on the amount of chicken meat
production in the West Java region as a reference in the pattern of guidance to increase animal food production,
develop chicken farming potential, and develop animal feed distribution potential.
Keywords: clustering, chicken meat k-means, data mining, k-medoids
ABSTRAK
Peternakan merupakan sektor utama dalam upaya pemenuhan keperluan pangan untuk masyarakat di
Indonesia dan memiliki potensi untuk menjaga ketersediaan pangan hewani. Pembinaan dan sosialisasi dalam
rangka memberikan informasi dan pengetahuan dalam bidang produksi pangan dari hewan terutama pada wilayah-
wilayah dengan tingkat produksi daging ayam yang masih rendah perlu dilakukan. Tujuan penelitian yaitu
penggunaan algoritma K-Means dan K-Medoids untuk pengelompokan wilayah produksi daging ayam di wilayah
provinsi Jawa Barat serta penggunaan nilai Davies Bouldin Index (DBI) dalam memilih algoritma terbaik.
Penerapan K-Means dan K-Medoids dilakukan melalui fase proses data mining, yaitu pengumpulan data, data
preprocessing, implemetasi data mining, evaluasi jumlah cluster, penentuan algoritma terbaik dan hasil clustering.
Algoritma K-Means dengan 5 cluster mampu mengelompokan wilayah potensial produksi daging ayam di provinsi
Jawa Barat secara optimal dengan nilai DBI sebesar 0,273. Hasil clustering dapat dimanfaatkan dalam proses
bisnis terkait informasi jumlah produksi daging ayam di wilayah Jawa Barat sebagai acuan dalam pola pembinaan
untuk meningkatkan produksi pangan hewani, pengembangan potensi budidaya ayam, dan pengembangan potensi
distribusi pakan ternak
Kata kunci: data mining, daging ayam klastering, k-means, k-medoids
Jurnal Korespondensi
*Penulis Teknologi Industri Pertanian 32 (3): 239-247 239
Implementasi K-Means dan K-Medoids dalam Pengelompokan …………
2021 mencapai 3.426.042 ton (Badan Pusat Statistik, sebelumnya, yaitu penggunaan sistem clustering
2022). untuk memudahkan proses identifikasi bahan menu
Pembinaan dan sosialisasi produksi pangan makanan halal (Sucipto et al., 2021). Penelitian
hewani dilakukan untuk meningkatkan hasil mengolah data pandemi Covid-19 melalui proses
produksi, memperluas area pemasaran, mencukupi teknik data mining menggunakan K-Means clustering
kebutuhan lapangan kerja, meningkatkan penghasilan dengan bantuan tiga perangkat lunak yaitu KNIME,
pelaku usaha daging, serta mengembangkan daya Weka dan Microsoft Excel untuk mengelompokan
dukung wilayah secara terpadu dengan subsektor lain. wilayah berdasarkan jumlah terjangkit dan meninggal
Pengelompokan wilayah berdasarkan jenis ayam dan (Indraputra dan Fitriana, 2020); Penelitian
jumlah produksi perlu dilakukan sebagai dasar Manajemen Pengelolaan Pelanggan Dan Mutu Untuk
pengambilan keputusan untuk untuk menetapkan Agroindustri Susu dengan menerapkan data mining
tindakan yang tepat dalam rangka pembinaan pelaku dan OLAP Cube (Fitriana et al., 2012).; Penelitian
usaha produksi daging ayam. Tujuan penelitian yang mengenai analisa transaksi dari sebuah toko kopi
dilakukan yaitu penggunaan algoritma K-Means dan dengan model association rule untuk mendefinisikan
K-Medoids untuk pengelompokan wilayah produksi pola transaksi pembelian dalam 6 bulan terakhir.
daging ayam di wilayah provinsi Jawa Barat serta (Febriani et al., 2021); Pengelompokan data wilayah
memilih algoritma terbaik berdasarkan nilai Davies yang terinfeksi Covid-19 dengan pengelompokan
Bouldin Index (DBI). terbaik dilakukan menggunakan algoritma K-
Data mining adalah proses menemukan Medoids sebanyak 3 cluster menggunakan perangkat
informasi yang bermanfaat pada repositori data yang lunak Rapid Miner (Sindi et al., 2020); Penerapan
besar secara otomatis (Tan et al., 2019). Penggunaan algoritma K-Means untuk proses pengelompokan
data mining dalam menjelajahi banyak data bertujuan provinsi berdasar pada data kependudukan di
untuk memperoleh pola-pola baru yang bermanfaat Indonesia (Ahmar et al., 2018); Penerapan algoritma
serta menyediakan kemampuan untuk memprediksi K-Means pada business intelligence system dalam
hasil pengamatan di masa depan, seperti jumlah yang mengelompokan cacat produk pada saat proses
akan dibelanjakan pelanggan di toko. Clustering produksi roti (Fitriana et al., 2017); Penerapan sistem
dikenal sebagai teknik segmentasi yang membantu intelijensia bisnis yang dipadukan dengan metode K-
membagi kumpulan data besar. Teknik ini Means pada bagian pemasaran di pabrik roti (Fitriana
mengelompokan data masa lalu. Clustering juga et al., 2018); Segmentasi pelanggan dilakukan
merupakan bagian dari teknik kecerdasan buatan menggunakan algoritma clustering untuk
(Maheshwari, 2015). Tujuan clustering adalah untuk menganalisis perilaku pelanggan dan
menentukan pengelompokan intrinsik dalam satu set mengelompokkannya (Aryuni et al., 2018; Maryani et
data yang tidak berlabel tergantung pada beberapa al., 2018; Shihab et al., 2019; Syakur et al., 2017);
ukuran kesamaan, misalnya jarak Euclidean (Shukur Pemanfaatan clustering untuk mengelompokkan
dan Alrashid, 2014). Metode clustering yang berbagai jenis pekerjaan yang diminati oleh pencari
digunakan dalam penelitian adalah K-Means dan K- kerja menggunakan K-Means clustering (Shamrat et
Medoids karena kedua metode tersebut termasuk al., 2020); Perbandingan validasi algoritma K-
partitioning-based clustering yang membagi dataset Medoids dengan K-Means dengan menggunakan
besar menjadi angka K (ditentukan oleh pengguna) Silhoutte Coefficient Index dalam mengelompokkan
grup dengan menggunakan jarak sebagai ukuran wilayah cacat pada anak (Marlina et al., 2018);
kesamaan, dimana setiap kelompok mewakili sebuah Perbandingan atara algoritma K-Medoids dan
cluster (Djouzi dan Beghdad-Bey, 2019). algoritma K-Means untuk pengelompokan menu
K-Means clustering adalah algoritma masakan bahan-bahan dari ikan dengan pemilihan
pengelompokan yang sering digunakan. Diawali algoritma terbaik berdasarkan nilai Davies Bouldin
dengan menentukan suatu titik K sebagai pusat awal Index (Suarna et al., 2021); Analisis komparatif K-
(centroid). Selanjutnya semua titik diarahkan ke Means dengan K-Medoids dari kedua algoritma
centroid terdekat berdasarkan tingkat kedekatan. dalam kelompok data yang berbeda untuk
Setelah terbentuk cluster, dilakukan pembaruan menjelaskan kekuatan dan kelemahan keduanya
centroid pada setiap cluster. Selanjutnya algoritma (Arbin et al., 2015); Evaluasi kinerja algoritma K-
mengulangi dua langkah ini secara iteratif sampai Means dasar dilakukan dengan menggunakan
tidak ada perubahan centroid (Aggarwal dan Reddy, berbagai distance metrics (Thakare dan Bagal, 2015);
2014). K-Medoids adalah algoritma clustering yang Peningkatan hasil clustering berdasarkan Davies
bertujuan untuk meminimalkan kriteria kesalahan Bouldin Index dalam menentukan centroid awal pada
absolut daripada Sum of Squared Errors (SSE). Mirip algoritma K-Means (Sitompul et al., 2019).
dengan algoritma pengelompokan K-means,
algoritma K-Medoids berjalan secara iteratif sampai METODE PENELITIAN
setiap objek representatif sebenarnya adalah medoid
dari cluster (Aggarwal dan Reddy, 2014). Penerapan K-Means dan K-Medoids dilakukan
Penggunaan algoritma clustering sudah melalui tahapan proses data mining, yaitu:
pernah dilakukan pada penelitian-penelitian
Gambar 2. Sampel dataset produksi daging ayam buras (Dinas Ketahanan Pangan dan Peternakan, 2022)
Gambar 3. Sampel dataset produksi daging ayam buras di kabupaten Bogor (Dinas Ketahanan Pangan dan
Peternakan, 2022)
Dari perbandingan nilai DBI dapat dilihat Tujuan dari K-Means Clustering adalah untuk
bahwa nilai DBI terkecil terdapat pada cluster 5 menemukan sebuah centroid untuk setiap cluster,
menggunakan algoritma K-Means yaitu 0,273, hal ini semua objek data kemudian diarahkan ke centroid
menunjukkan kinerja algoritma clustering terbaik terdekat, yang kemudian membentuk sebuah cluster.
yang dipilih. Jumlah elemen setiap kelompok hasil Centroid adalah rata-rata dari semua objek data dalam
proses clustering dengan 5 cluster menggunakan sebuah cluster atau objek data yang paling
algoritma K-Means dapat dilihat pada Tabel 3. representatif (Umargono et al., 2020). Nilai centroid
Visualisasi data jumlah elemen dan ikhtisar dari setiap cluster yang terbentuk hasil proses data
setiap kelompok hasil proses clustering dapat dilihat dapat dilihat pada Tabel 4.
pada Gambar 7. Rata-rata cluster distance dihitung untuk
menilai kinerja algoritma K-Means yang digunakan.
Hasil rata-rata cluster distance dapat dilihat pada
Gambar 8.
Berdasarkan hasil proses data mining hewani, pengembangan potensi budidaya ayam, dan
menunjukan bahwa elemen pada kelompok yang pengembangan potensi distribusi pakan ternak.
terbentuk sudah terpisah pada masing-masing
kelompok, dengan demikian tidak terdapat elemen
kelompok yang masuk dalam dua kelompok. Suatu KESIMPULAN DAN SARAN
cluster dapat dinyatakan konvergen jika tidak terjadi
perpindahan atau perubahan elemen dari satu cluster Kesimpulan
ke cluster yang lain. Hal ini membuktikan bahwa Algoritma K-Means dengan 5 cluster mampu
elemen hasil clustering bisa mewakili setiap cluster. mengelompokan wilayah potensial produksi daging
Nilai pusat cluster menunjukan hasil analisis ayam di provinsi Jawa Barat dengan optimal.
pengelompokan menggunakan algoritma K-Means Pengukuran Davies Bouldin Index (DBI) dilakukan
yaitu: untuk memilih algoritma paling baik antara
- Cluster 0 berisi produksi ayam buras yang sangat penggunaan K-Means dan K-Medoids. Nilai DBI
rendah, produksi ayam pedaging yang sangat yang diperoleh menunjukan bahwa jumlah k optimal
rendah dan produksi ayam petelur yang sangat adalah 5 cluster dengan hasil DBI pada algoritma K-
rendah. Means = 0,273 dan DBI pada algoritma K-Medoids =
- Cluster 1 berisi produksi ayam buras yang sangat 0,598. Hasil proses clustering menunjukan wilayah
tinggi, produksi ayam pedaging yang sedang dan produksi daging ayam di provinsi Jawa Barat tersebar
produksi ayam petelur yang sedang. di 5 cluster. Adapun jumlah wilayah kabupaten/kota
- Cluster 2 berisi produksi ayam buras yang tinggi, pada setiap cluster yaitu 12 wilayah termasuk di
produksi ayam pedaging yang sangat tinggi dan cluster 0; 6 wilayah termasuk di cluster 1; 1 wilayah
produksi ayam petelur yang sangat tinggi. termasuk di cluster 2; 7 wilayah termasuk di cluster 3
- Cluster 3 berisi produksi ayam buras yang rendah, dan 1 wilayah termasuk di cluster 4.
produksi ayam pedaging yang rendah dan
produksi ayam petelur yang rendah. Saran
- Cluster 4 berisi produksi ayam buras yang sedang, Penelitian tentang penerapan data mining
produksi ayam pedaging yang tinggi dan produksi produksi daging ayam dapat dilanjutkan dengan
ayam petelur yang tinggi. menerapkan beragam teknik clustering untuk
Hasil pengelompokan wilayah produksi pengelompokan berbagai jenis produksi di berbagai
daging ayam bisa dilihat pada Tabel 5. wilayah atau penggunaan beragam teknik data mining
yang dipadukan sistem data warehouse dan
Cluster wilayah produksi daging ayam menunjukan intelijensia bisnis.
pengelompokan wilayah produksi daging ayam di
provinsi Jawa Barat menjadi 5 cluster. Cluster 0 DAFTAR PUSTAKA
merupakan cluster yang memiliki anggota kelompok
paling banyak dibandingkan dengan cluster yang lain. Aggarwal CC dan Reddy CK. 2014. Data Clustering
Hasil clustering dapat dimanfaatkan dalam proses Algorithms and Applications. CRC Press.
bisnis terkait informasi jumlah produksi daging ayam Ahmar AS, Napitupulu D, Rahim R, Hidayat R,
di wilayah Jawa Barat sebagai acuan dalam pola Sonatha Y, Azmi M. 2018. Using K-Means
pembinaan untuk meningkatkan produksi pangan Clustering to Cluster Provinces in Indonesia.
Journal of Physics: Conference Series,
1028(1). 204–219
Arbin N, Suhaimi NS, Mokhtar NZ, Othman Z. 2015. Indraputra RA dan Fitriana R. 2020. K-Means
Comparative Analysis between K-Means and Clustering Data COVID-19. Jurnal Teknik
K-Medoids for Statistical Clustering. 2015 Industri, 10(3), 275–282.
Third International Conference on Artificial https://doi.org/10.25105/jti.v10i3.8428
Intelligence, Modelling and Simulation, 117– Jassim MA dan Abdulwahid SN. 2021. Data Mining
121. https://doi.org/10.1109/AIMS.2015.82 preparation : Process , Techniques and Major
Aryuni M, Madyatmadja ED, dan Miranda E. 2018. Issues in Data Analysis. IOP Conf. Series:
Customer Segmentation in XYZ Bank using K- Materials Science and Engineering, 1090(1).
Means and K-Medoids Clustering. 2018 https://doi.org/10.1088/1757-
International Conference on Information 899X/1090/1/012053
Management and Technology (ICIMTech), Joshi AP dan Patel BV. 2020. Data Preprocessing :
September, 1–9. the Techniques for Preparing Clean and Quality
https://doi.org/10.1109/ICIMTech.2018.85280 Data for Data Analytics Process. Oriental
86 Journal of Computer Science and Technology,
Badan Pusat Statistik. 2022. Produksi Daging Ayam 13(2), 0–3.
Ras Pedaging menurut Provinsi (Ton), 2019- https://doi.org/10.13005/ojcst13.0203.03
2021. Maheshwari A. 2015. Data Analytics Made
https://www.bps.go.id/indicator/24/488/1/prod Accessible.
uksi-daging-ayam-ras-pedaging-menurut- Marlina D, Putri NF, Fernando A, Ramadhan A.
provinsi.html 2018. Implementasi Algoritma K-Medoids dan
Chikohora TT. 2014. A Study of the Factors K-Means untuk Pengelompokkan Wilayah
Considered when Choosing an Appropriate Sebaran Cacat pada Anak. CoreIT, 4(2), 64–71.
Data Mining Algorithm. International Journal https://doi.org/10.24014/coreit.v4i2.4498
of Soft Computing and Engineering, 4(3), 42– Maryani I, Riana D, Astuti RD, Ishaq A, Pratama EA.
45. 2018. Customer Segmentation based on RFM
Dinas Ketahanan Pangan dan Peternakan. 2022. model and Clustering Techniques With K-
Produksi Daging Ayam Berdasarkan Means Algorithm. 2018 Third International
Kabupaten/Kota di Jawa Barat. Conference on Informatics and Computing
https://opendata.jabarprov.go.id/id/hasil- (ICIC), 1–6.
pencarian?q=produksi daging https://doi.org/10.1109/IAC.2018.8780570
ayam&suggestion=on Nurhayati, Marimin, Djatna T, Permana, IG. 2016.
Djouzi K dan Beghdad-Bey K. 2019. A Review of Kinerja Rantai Pasok Dan Nilai Tambah
Clustering Algorithms for Big Data. Dengan Internalisasi Aspek Lingkungan Pada
Proceedings - ICNAS 2019: 4th International Agroindustri Ayam Ras Pedaging. Jurnal
Conference on Networking and Advanced Teknologi Industri Pertanian, 26(3), 311–320.
Systems, 1–6. Shamrat FMJM, Tasnim Z, Mahmud I, Jahan MN,
https://doi.org/10.1109/ICNAS.2019.8807822 Nobel NI. 2020. Application Of K-Means
Fitriana R, Saragih J, dan Luthfiana N. 2017. Model Clustering Algorithm To Determine The
business intelligence system design of quality Density Of Demand Of Different Kinds Of
products by using data mining in R Bakery Jobs. INTERNATIONAL JOURNAL OF
Company. IOP Conference Series: Materials SCIENTIFIC & TECHNOLOGY RESEARCH,
Science and Engineering, 277(1). 9(02), 2550–2557.
Fitriana R, Saragih J, dan Hasyati BA. 2018. Shihab SH, Afroge S, dan Mishu SZ. 2019. RFM
Perancangan Model Sistem Intelijensia Bisnis Based Market Segmentation Approach Using
Untuk Menganalisis Pemasaran Produk Roti di Advanced K-means and Agglomerative
Pabrik Roti Menggunakan Metode Data Mining Clustering: A Comparative Study. 2019
dan Cube. Jurnal Teknologi Industri Pertanian, International Conference on Electrical,
28(1), 113–126. Computer and Communication Engineering
Ghany KKA, Aziz AMA, Soliman THA, Sewisy (ECCE), 1–4.
AAEM. 2022. A hybrid modified step Whale https://doi.org/10.1109/ECACE.2019.8679376
Optimization Algorithm with Tabu Search for Shukur BK dan Alrashid SZN. 2014. Evaluation of
data clustering. Journal of King Saud Clustering Image Using Steady State Genetic
University - Computer and Information and Hybrid K-Harmonic Clustering
Sciences, 34(3), 832–839. Algorithms. IJCCCE, 14(1), 10–20.
https://doi.org/10.1016/j.jksuci.2020.01.015 Sindi S, Ningse WRO, Sihombing IA, RHZer FI,
Hidayat M K, Fitriana R.2022. Penerapan Sistem Hartama D. 2020. Analisis Algoritma K-
Intelijensia Bisnis Dan K-Means Clustering Medoids Clustering Dalam Pengelompokan
Untuk Memantau Produksi Tanaman Obat. Penyebaran Covid-19 Di Indonesia. Jurnal
Jurnal Teknologi Industri Pertanian, 32(2), Teknologi Informasi, 4(1), 166–173.