Draft Seminar Rizka Aulia

SEMINAR SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
Nama : Rizka Aulia

NRP : G651180201
Program Studi : Ilmu Komputer
Judul Penelitian : Pengelompokan Makanan Tradisional Indonesia
menggunakan Two-step Method for Clustering Mixed
Categorical and Numeric Data (TMCM) dan K-
Prototype
Pembimbing : 1. Dr. Eng. Annisa, S.Kom, M.Kom
2. Prof. Dr. Eng. Taufik Djatna, S.T.P., M.Si
Kelompok : Ilmu Keteknikan dan Teknologi Informasi
Hari / Tanggal :
Waktu :
Tempat : Seminar Daring Pascasarjana
1
PENGELOMPOKAN MAKANAN TRADISIONAL INDONESIA

MENGGUNAKAN TWO-STEP METHOD FOR CLUSTERING
MIXED CATEGORICAL AND NUMERIC DATA (TMCM) DAN K-
PROTOTYPE1
(Clustering of traditional Indonesian food using a Two-step Method for Clustering
Mixed Categorical and Numerical data (TMCM) and K-prototype)
Rizka Aulia2, Annisa3, Taufik Djatna4
Abstract
Traditional food is food and drink that develops in an area that is processed using
local ingredients that have been passed down from generation to generation so that it
has a distinctive taste. When tourists visit a tourist area, they will indirectly look for the
typical food of the area. Traditional Indonesian food has similarities, namely the use of
spices in almost every dish. The use of spices is due to the fact that spices grow in
almost all parts of Indonesia. Each region in Indonesia has its own special food or
traditional food. So, it is necessary to classify traditional foods to determine the
characteristics of Indonesian food. The clustering method is a method that groups the
same attributes or objects into one group or group. Clustering methods usually focus
only on numeric data or only on categorical data. However, in this study the data used
are numerical data and categorical data (mixed). This study compares two clustering
methods for mixed data, namely the two-step method for clustering mixed categorical
and numerical data (TMCM) and the K-prototype method. The results of the calculation
showed that the entropy value of the K prototype method was 2.1983 while the entropy
value of the TMCM method was 2.1955. The difference is very subtle. On the basis of
the comparison of entropy results, the clustering method with TMCM has the smallest
entropy value. Thus, it can be concluded that the TMCM method provides optimal
results in clustering the data. The number of clusters generated using the TMCM
method is 5 clusters. The number of members of cluster 1 is 3 members, cluster 2 is 12
members, cluster 3 is 13 members, cluster 4 is 12 members, cluster 5 is 14 members.
Keywords: cluster, mixed data, traditional food, k-prototype, TMCM
PENDAHULUAN
Wisata kuliner memiliki peranan penting dalam pariwisata. Dibuktikan dengan
data dari Kementerian Wisata dan Ekonomi Kreatif (Kemenparekraf) tahun 2020,
kuliner merupakan sub sektor penyumbang terbesar Produk Domestik Bruto (PDB)
sebesar 44.40% pertahun dari PDB ekonomi kreatif (Kemenparekraf 2022). Wisata
kuliner selalu berkaitan erat dengan makanan dan minuman tradisional suatu daerah.
Makanan tradisional merupakan makanan dan minuman yang berkembang di suatu
daerah yang diolah menggunakan bahan – bahan lokal yang dilakukan secara turun
temurun sehingga mempunyai cita rasa yang khas (Fadiaz 1998).
1
Bagian Tesis, disampaikan pada seminar Pascasarjana IPB
2
Mahasiswa Program Studi Ilmu Komputer, Sekolah Pascasarjana IPB
3
Ketua Komisi Pembimbing, Staf Pengajar Departemen Ilmu Komputer, FMIPA IPB
4
Anggota Komisi Pembimbing, Staf Pengajar Departemen Teknologi Industri Pertanian, FATETA IPB
2
Ketika wisatawan mengunjungi suatu daerah wisata, maka secara tidak langsung
wisatawan akan mencari makanan khas daerah tersebut Perbedaan budaya dapat dilihat
dari bahan dasar yang digunakan dalam makanan, proses pengolahan makanan, cita rasa
makanan, kebiasaan dalam cara penyajian, serta alat dan bahan yang digunakan
(Hegarty dan Barry O’Mahony 2001). Bahan dasar suatu makanan dipengaruhi oleh
letak atau lokasi darimana makanan itu berasal. Walaupun lokasi mempengaruhi bahan
utama makanan suatu daerah, hampir semua makanan tradisional Indonesia
menggunakan rempah- rempah. Penggunan rempah – rempah sebagai bumbu utama
menyebabkan kemiripan bumbu dan bahan (resep) dalam masakan Indonesia. Serta
banyaknya suku dan luasnya wilayah Indonesia menyebabkan banyaknya makanan khas
yang terdapat Indonesia. banyaknya makanan tradisional dan kemiripan bumbu
masakan yang digunakan menyebab sulitnya mengetahui karakteristik makanan
tradisional disuatu wilayah Indonesia. untuk mengetahui karakteristik tersebut
dibutuhkan suatu pengelompokan untuk mengetahui kemiripan atau karakteristik yang
sama antar makanan. metode yang dapat digunakan yaitu dengan menggunakan metode
analisis pengelompokan (clustering).
Metode pengelompokan (clustering) merupakan metode yang mengelompokan
atribut atau objek yang sama kedalam satu kelompok atau grup. Clustering bertujuan
untuk menghimpun data yang memiliki kesamaan dalam satu grub dan data yang
memiliki perbedaan dihimpun dalam grub yang lainnya (Gan et al. 2007). Terdapat dua
metode clustering yaitu hierarchical clustering dan partition clustering. Hierarchical
clustering merupakan metode pengelompokan dengan membentuk struktur pohon.
Sedangkan, partition clustering merupakan teknik cluster yang membagi titik data
menjadi k-partition, dimana setiap partisi mewakili sebuah cluster (Kaur et al. 2015).
Penelitian da Silva Torres et al. (2006) dan Phanich et al. (2010) menggunakan
metode clustering berdasarkan data makanan. Pada penelitian da Silva Torres et al.
(2006), mengumpullkan data makanan yang dijual di restoran dan menerapkan
algoritme Hierarchical Clustering Agglomerative (HAC) untuk mengelompokan
makanan berdasarkan nilai gizinya. Sedangkan, pada penelitian Phanich et al. (2010)
nilai gizi pada makanan Thailand digunakan untuk mengelompokan makanan yang baik
bagi penderita diabetes. Algoritme K-means diterapkan pada pengelompokan tersebut.
Data makanan tidak hanya kadungan gizi yang dapat diolah dalam
pengelompokan makanan. Tetapi, cara pembuatan makanan atau resep makanan dapat
digunakan untuk menggali informasi makanan tersebut. Nadamoto et al. (2016)
menggunakan data resep dari situs resep online untuk mengelompokan resep yang
serupa atau mirip berdasarkan bahan baku utama dan bumbu utama. Sedangkan, pada
penelitian Sharma et al. (2020) menggunakan data resep makanan dengan melakukan
pengelompokan agar mengetahui ciri khas bahan makanan yang biasa digunakan pada
setiap negara. Penelitian – penelitian tersebut hanya mempertimbangkan data numerik
pada proses pengelompokan. Padahal pada penerapananya data tidak hanya bersifat
numerik tetapi juga kategorik.
Pengelompokan data resep makanan tradisional Indonesia telah dilakukan oleh
Indriani dan Budiman (2017). Pada penelitian tersebut melakukan pengelompokan
untuk mengetahui jenis makanan yang paling banyak di upload oleh pengguna pada
situs sharing recipe. Pengelompokannya berdasarkan bahan makanan dan hanya
berfokus pada data kategorik. Sedangkan, menurut Wijaya (2019) bahan makanan atau
resep masakan tradisonal Indonesia memiliki kemiripan karena bumbu utamanya yaitu
rempah-rempah. Serta, yang membedakannya adalah komposisi penggunaan dari
3
rempah tersebut. Sehingga, pada penelitian ini data yang digunakan tidak hanya bahan
makanan tetapi menambahkan atribut tingkatan rasa. Atribut tingkatan rasa
ditambahkan untuk mengetahui cita rasa khas serta karakteristik makanan tersebut. Pada
penelitian ini juga akan menggunakan atribut numerik dan kategorik campuran untuk
pengelompokan makanan tradisional Indonesia.
Metode pengelompokan untuk data campuran yang paling banyak digunakan
yaitu K-prototype. K-prototype merupakan metode yang dikembangkan dari kedua
metode pendahulunya yaitu metode K-means yang digunakan untuk data numerik dan
metode K-modes yang digunakan untuk data kategorik. Kedua metode tersebut
digabungkan untuk memproses data campuran. Penerapan metode K-prototype lebih
sederhana dan lebih baik dibandingkan metode clustering lainnya yang berbasis hierarki
(Huang 1998). Adapun metode lain yang dapat digunakan untuk memproses data
campuran yaitu Two-Step Method for Clustering Mixed Categorical and Numeric Data
(TMCM).
TMCM merupakan sebuah metode pengelompokan dua langkah yang digunakan
untuk data numerik dan kategoris campuran dengan memperhatikan ada hubungan
antara item kategoris. Shih et al. (2010) melakukannya Pengelompokan data dari Survei
Prevalensi Kontrasepsi Nasional Indonesia tahun 1987 menggunakan K-prototype, Two
Step Cluster, dan TMCM. Rosdiana (2014) melakukan penelitian yang hampir sama
yaitu membandingkan hasil pengelompokan tanaman obat dengan metode Two Step
Cluster dan TMCM. Nurul Istiqomah (2015) melakukan penelitian penggerombolan
kabupaten/kota berdasarkan faktor stunting pada bayi dengan metode TMCM. Ketiga
studi menyimpulkan bahwa hasil pengelompokan menggunakan TMCM lebih baik dari
pada metode yang lain dipelajari. Keuntungan TMCM dibandingkan metode lain adalah
transformasi. Variabel kategori dilakukan berdasarkan teori co-occurrence.
Penelitian ini menerapkan metode TMCM dan K-prototype untuk
mengelompokan makanan daerah Indonesia berdasarkan faktor bahan makanan serta
tingkatan rasa untuk mengetahui karakteristik dan kemiripana makanan serta metode
terbaik dalam mengelompokkan data makanan tradisional Indonesia yang memiliki
skala pengukuran numerik dan kategoris.
METODE PENELITIAN
Data Penelitian
Data penelitian diperoleh dari penyebaran kuisioner makanan yang dilakukan di
21 kota yang kelompokan menjadi 17 provinsi di Indonesia. Hasil dari penyebaran
kusioner yaitu mendapatkan data makanan tradisional sebanyak 54 jenis makanan. Data
makanan berupa data resep makanan yang berupa bumbu dan bahan makanan, serta
tingkatan rasa seperti, rasa pedas, gurih, asin, asam. Pada penelitian ini data makanan
berupa data numerik dan dan data kategorik. Data numerik dihasilkan dari data bahan
dan bumbu yang berupa data teks akan diubah ke bentuk numerik.Serta data kategorik
yang dihasilkan dari data tingkatan rasa. Atribut yang digunakan pada penelitian ini
ditunjukkan pada Tabel 1.
Tabel 1 Atribut yang digunakan pada penelitian

Atribu Nama Atribut Jenis Keterangan
t Data
X1 Bahan dan Teks Data teks akan diubah menjadi data numerik
4
bumbu
X2 Level pedas Kategorik Tingkatan rasa dengan kategorik nilai 1
sampai 5
X3 Level gurih Kategorik Tingkatan rasa dengan kategorik nilai 1
sampai 5
X4 Level manis Kategorik Tingkatan rasa dengan kategorik nilai 1
sampai 5
X5 Level asin Kategorik Tingkatan rasa dengan kategorik nilai 1
sampai 5
X6 Level asam Kategorik Tingkatan rasa dengan kategorik nilai 1
sampai 5
Tahapan Penelitian
Penelitian ini melakukan perbandingan algoritme untuk proses clustering
makanan tradisional Indonesia. Algorime yang digunakan yaitu Two-step Method for
Clustering Mixed Categorical and Numeric Data (TMCM) dan algoritme k-prototype.
Adapun tahapan penelitian ditunjukkan pada Gambar 1.
Mulai
Praproses Data
Perbandingan Algoritme
TMCM K-prototype
Analisis Hasil
Selesai
Gambar 1 Tahapan penelitian
Praproses data
Tahapan pertama pada penelitian ini yaitu melakukan praproses data. Data yang
diperoleh yaitu daftar nama makanan dari berbagai kota yang telah ditentukan.
Selanjutnya data makanan per kota dipetakan kembali menjadi data per provinsi. Data
yang telah dipetakan selanjutnya, akan di praproses menggunakan tokenisasi dengan
memisahakan data teks menjadi kata. Teknik tokenisasi telah dilakukan maka proses
selanjutnya mengubah huruf kapital menjadi huruf kecil, menghapus kata penghubung,
dan menghapus tanda baca. Karena data resep makanan rentan dengan istilah yang
memiliki makna yang sama. Seperti tepung tapioca memiliki arti yang sama dengan
sagu dan tepung kanji.
5
Algoritme Two-step Method for Clustering Mixed Categorical and Numeric Data
(TMCM)
Algoritme TMCM merupakan algoritme yang dirancang untuk menangani
pengelompokan pada data numerik dan kategorik (campuran). Algoritme ini memiliki
kelebihan yaitu mengonversi atribut kategori menjadi nilai numerik berdasarkan sifat
co-occurrence. Nilai numerik diberikan untuk atribut kategorikal berdasarkan hubungan
antar objek (Shih et al. 2010). Data kusioner yang ditelah dipraproses akan diolah
menggunakan algoritme TMCM. Algoritme TMCM memiliki tiga tahapan utama yaitu
praproses data, mengubah nilai atribut kategorik menjadi nilai numerik, dan tahapan
terakhir yaitu clustering (Shih et al. 2010).
Algoritme K-prototype
Pada penelitian ini, didalam dataset terdapat atribut bumbu dan bahan berbentuk
teks dan tingkatan (level) rasa dengan data kategori. Atribut bumbu dan bahan ini akan
diproses menggunakan jarak Levenshtein dan jarak cosine. Serta akan dibandingkan
hasil pengklusteran kedua jarak tersebut. Langkah tahapan K-prototype pada penelitian
ini:
1. Ubah variable teks pada atribut bumbu dan bahan dalam bentuk jarak. Akan
dibandingkan dengan jarak Levenshtein dan jarak cosine.
2. Tentukan target pada atribut bahan dan bumbu yang akan dijadikan
pembanding. Pemilihan dilakukan secara acak.
3. Mengubah tipe variable sesuai karakteristiknya.
4. Mencari jumlah cluster terbaik pada kedua jarak dengan menggunakan
pendekatan Elbow.
5. Membandingkan pendekatan antara jarak Levenshtein dan jarak cosine yang
menghasilkan penggerombolan terbaik.
Ketika perbandingan jarak terbaik telah diketahui, maka dataset dengan data teks
telah ditransformasi ke nilai numerik akan digunakan pada pemrosesan algoritme
TMCM.
Evaluasi Hasil Cluster

Evaluasi entropi digunakan untuk mengetahui kualitas pengklasteran. Semakin
kecil nilai entropi maka hasil cluster lebih baik dan sebaiknya, semakin besar nilai
entropi kualitas cluster semakin buruk (Shih et al. 2010). Persamaan (1) menunjukan
evaluasi entropi (Shih et al. 2010):
(( ) )
m
nj l (1)
Entropi=−∑ ∗∑ P ij∗log ( Pij )
j=l n i =l
dimana:
m = jumlah dari cluster;
l = jumlah dari kelas;
nj = jumlah titik data didalam cluster;
n = jumlah semua titik data;
Pij = kemungkinan anggota cluster j masuk ke kelas i.
6
HASIL DAN PEMBAHASAN

1. Analisis Data Makanan Tradisional Indonesia
Penelitian ini menggunakan data makanan tradisional Indonesia. Data
dikelompokan berdasarkan provinsi. Tetapi tidak semua provinsi diwakili pada
penelitian ini. Dari 34 provinsi di Indonesia hanya 17 provinsi yang terdapat pada data
penelitian, atau dapat diartikan hanya 50% provinsi yang terwakilkan. Gambar 2
menunjukan penyebaran provinsi yang digunakan pada penelitian dengan keterangan
warna hijau merupakan provinsi yang terdapat didalam dataset.
Gambar 2 Penyebaran provinsi data penelitian
2. Clustering menggunakan Metode K-Prototype

Tahapan pemprosesan metode k-prototype pada penelitian ini yaitu, mengubah
variable bahan dan bumbu dalam bentuk jarak. Dalam proses ini akan dibandingkan dua
jarak umum yang digunakan pada pengolahan teks yaitu jarak Levenshtein dan jarak
Cosine. Hasil perhitungan jarak kemudian akan diintegrasikan ke dalam dataframe
untuk diolah penggerombolannya dengan terlebih dahulu menyesuaikan tipe variable
berdasarkan karakteristiknya. Penentuan jumlah cluster (k) pada penelitian ini dimulai
dari k=2 hingga k=8. Untuk menentukan cluster optimal menggunakan pendekatan
Elbow plot.
Langkah selanjutnya adalah melakukan proses clustering dengan menggunakan
nilai k=5 berdasarkan hasil perhitungan jarak masing-masing. Tabel 2 menunjukan
potongan hasil clustering.
Tabel 2 Hasil Clustering
Clustering
Jarak Jarak
Provinsi Nama Makanan
Levenshtei Cosin
n e
Nasi sop banjar 5 4
Kalimatan Tengah Soto banjar 1 4
Sate ayam banjar 3 4
Ikan kuah kuning 4 1
Maluku Utara Sayur garo 2 1
Kuah suro 5 1
Sumatera Selatan Pempek 2 3
7
Model 2 3
Mie celor 1 3
Lenggang 2 3
Berdasarkan hasil clustering yang ditunjukkan pada Tabel 2, metode clustering

dengan menggunakan jarak Cosine dapat memberikan hasil lebih optimal
dibandingakan dengan jarak Levenshtein, karena hasil penggerombolan jenis makanan
pada satu provinsi memiliki cluster yang sama. Dapat dilihat pada wilayah Kalimantan
Tengah, Maluku Utara dan Sumatera Selatan.
Tabel 3 Pesebaran anggota cluster dengan metode K-prototype

Cluste Banyak anggota Persentase (%)
r
1 9 17.67
2 12 22.22
3 4 7.41
4 12 22.22
5 17 31.38
Jumlah 54 100
Penyebaran untuk setiap anggota cluster dengan metode K-prototype pada

banyaknya cluster sebanyak 5 cluster mendapatkan distribusi yang cukup merata
dengan kata lain tidak terdapat cluster yang jumlah anggotanya terlalu sedikit atau
terlalu banyak. Cluster 5 merupakan cluster yang memiliki anggota terbanyak sebesar
17 anggota ditunjukan pada Tabel 3. Selanjutnya yaitu cluster 2 dan cluster 4 memiliki
banyak anggotanya sama sebanyak 12 anggota, dan cluster 3 memiliki anggota yang
paling sedikit.
3. Two-step Method for Clustering Mixed Categorical and Numeric Data

(TMCM)
Data masukan telah terbentuk maka, tahapan selanjutnya yaitu penerapan metode
K-means. Pada proses clustering untuk menentukan jumlah cluster (k) optimal
menggunakan pendekatan Elbow plot. Dari hasil Elbow plot, estimasi jumlah k optimal
sebanyak 2 atau 4 gerombol. Walaupun demikian, agar dapat deperbandingkan dengan
metode K-prototype diputuskan untuk memilih k=5 sebagai banyaknya cluster.
Tabel 4 Sebaran anggota clustering metode TMCM

Cluster(k) Jumlah anggota Pesentase (%)
k=1 3 5.56
k=2 12 22.22
k=3 13 24.07
k=4 12 22.22
k=5 14 25.93
Total 54 100.00
8
Penyebaran untuk setiap anggota cluster dengan metode TMCM pada banyaknya
cluster sebanyak 5 cluster, cluster 5 merupakan cluster dengan anggota terbanyak yaitu
sebanyak 14 anggota sedangkan, cluster 1 merupakan cluster dengan anggota paling
sedikit yaitu hanya memiliki tiga anggota.
4. Karakteristik Hasil Clustering menggunakan Metode TMCM dan K-
Prototype
Karakteristik makanan tradisional Indonesia dengan membandingkan dua metode
yaitu TMCM dan K-prototype. Kedua metode tersebut menghasilkan masing-masing
lima cluster. Dari lima cluster tersebut terdapat dua cluster yang memiliki kemiripan
karakteristik. Kemiripan pertama yaitu cluster 1 pada metode TMCM dengan cluster 3
pada metode K-prototype memiliki karakteristik sangat tidak pedas, sangat gurih, sangat
tidak manis, asin netral dan sangat tidak asam. Kemiripan kedua terjadi pada cluster 4
untuk metode TMCM dan cluster 5 pada metode K-prototype dengan karakteristik
pedas netral, gurih, manis netral, asin netral, dan tidak asam.
Data makanan tradisional yang berjumlah 54 jenis makanan yang mewakili 17
provinsi yang ada di Indonesia, dapat kita lihat karakteristik berdasarkan hasil cluster
makanan tersebut. Pada hasil proses clustering dengan metode TMCM terdapat empat
provinsi yang semua jenis makanannya tersebut terdapat pada satu cluster yaitu provinsi
NAD, DKI Jakarta, Jawa Barat, dan Jawa Timur. Sedangkan, sisa provinsi yang lainnya
makanannya terletak dibeberapa cluster. Kemudian pada metode K-prototype terdapat
tujuh provinsi yang semua jenis makanannya terletak pada satu cluster yaitu, NAD, DKI
Jakarta, Kalimantan Tengah, Maluku Utara, Riau, Sulawesi Selatan dan Sumatera
Selatan. Penjelasan ini merujuk pada Tabel 5.
Tabel 5 Hasil clustering menggunakan metode TMCM dan K-prototype dipetakan

perprovinsi
Cluster K-
Cluster TMCM
Provinsi protoype
1 2 3 4 5 1 2 3 4 5
Nanggroe Aceh Darussalam (NAD) X X
Bali X X X X
Daerah Istimewa Yogyakarta X X X
(DIY)
DKI Jakarta X X
Jawa Barat X X X X
Jawa Tengah X X X X
Jawa Timur X X
Kalimantan Tengah X X X
Kalimantan Timur X X X X
Lampung X X X X
Maluku X X X X
Maluku Utara X X X
Riau X X X
Sulawesi Selatan X X X
Sulawesi Utara X X X X X X
Sumatera Barat X X X X
9
Sumatera Selatan X X X
Total 1 6 7 8 9 4 8 1 7 7
5. Perbandingan Clustering dengan menggunakan Metode TMCM dan K-

Prototype
Perbandingan clustering menggunakan metode TMCM dan K-protorype
dilakukan dengan cara membuat dataset gabungan hasil pemrosesan algoritme. Untuk
membandingkan penggerombolan mana yang memberikan hasil optimal, dilakukan
pendekatan dengan mencari nilai entropy pada masing-masing hasil. Penggerombolan
yang memberikan nilai entropy terkecil dianggap lebih optimal dalam menghasilkan
gerombol. Sebagai dasar perbandingan entropy adalah apakah makanan yang
digerombolkan mengelompok berdasarkan kedekatan daerah.
Hasil perhitungan diperoleh nilai entropy metode K Prototype sebesar 2.1983
sedangkan nilai entropy metode TMCM sebesar 2.1955. Perbedaannya sangat tipis.
Berdasarkan perbandingan hasil entropy, metode penggerombolan dengan TMCM
memiliki nilai entropy terkecil. Dengan demikian dapat disimpulkan metode TMCM
lebih memberikan hasil optimal dalam melakukan penggerombolan pada data.
6. Visualisasi Cluster Makanan Tradisional Indonesia dengan TMCM
Gambar 3 Visualisasi Cluster Makanan Tradisional Indonesia dengan TMCM
Dapat dilihat dari Gambar 3 penyebaran jenis makanan pada setiap provinsi yang
diwakili pada dataset. Semakin pekat warna wilayah provinsi menunjukan bahwa jenis
makanan yang diwakili pada data tersebut berkumpul pada satu wilayah.
SIMPULAN DAN SARAN

Simpulan
Penelitian ini membandingkan dua metode clustering untuk data campuran yaitu
Two-Step Method for Clustering Mixed Categorical and Numeric Data (TMCM) dan
metode K-prototype. Hasil perhitungan diperoleh nilai entropy metode K Prototype
sebesar 2.1983 sedangkan nilai entropy metode TMCM sebesar 2.1955. Perbedaannya
sangat tipis. Berdasarkan perbandingan hasil entropy, metode penggerombolan dengan
10
TMCM memiliki nilai entropy terkecil. Dengan demikian dapat disimpulkan metode
TMCM lebih memberikan hasil optimal dalam melakukan penggerombolan pada data.
Jumlah cluster yang hasilkan menggunkana metode TMCM yaitu sebanyak 5 cluster.
Jumlah anggota cluster 1 sebanyak 3 anggota, cluster 2 sebanyak 12 anggota, cluster 3
sebanyak 13 anggota, cluster 4 sebanyak 12 anggota, cluster 5 sebanyak 14 anggota.
Saran
Pada penelitian selanjutnya, untuk membandingkan karakteristik jenis makanan
Indonesia data yang digunakan ditambahkan lagi dan lebih difokuskan. Ketika ingin
membandingakan kategori makanannya ditentukan, apakah kategori makanan utama,
makanan ringan atau minuman. Serta, perwakilan makanan untuk setiap provinsi
disamaratan, agar hasil perbandingannya lebih optimal.
DAFTAR PUSTAKA
Fardiaz, D. 1998. Peluang, Kendala, dan Strategi Pengembangan Makanan Tradisional,

dalam Kumpulan Ringkasan Makalah Seminar Nasional Makanan. Lembaga
Penelitian Institus Pertanian Bogor-Pusat Antar Universitas dan Gizi IPB, Bogor.
Gan G, Ma C, Jianhong W. 2007. Data Clustering Theory, Algorithms, and
Applications. Virginia (US).
Hegarty JA, Barry O’Mahony G. 2001. Gastronomy: A phenomenon of cultural
expressionism and an aesthetic for living. Int J Hosp Manag. 20(1):3–13.
doi:10.1016/S0278-4319(00)00028-1.
Huang Z. 1998. Extensions to the k-Means Algorithm for Clustering Large Data Sets
with Categorical Values. Data Mining and Knowledge Discovery 2, 283-304. Data
Min Knowl Discov. 2(3):283–304.
Indriani F, Budiman I. 2017. K-Modes Clustering untuk Mengetahui Jenis Masakan
Daerah yang Populer pada Website Resep Online (Studi Kasus: Masakan Banjar di
cookpad.com). J Teknol Inf dan Ilmu Komput. 4(4):290–296.
doi:10.25126/jtiik.201744548.
Kaur S, Chaudhary S, Bishnoi N. 2015. A Survey : Clustering Algorithms in Data
Mining. Int J Comput Appl. 3(7):12–14.
Kemenparekraf. 2020. https://www.kemenpar.go.id.
Nadamoto A, Hanai S, Nanba H. 2016. Clustering for Similar Recipes in User-
Generated Recipe Sites Based on Main Ingredients and Main Seasoning. NBiS
2016 - 19th Int Conf Network-Based Inf Syst., siap terbit.
Cao F, Liang J, Li D, Bai L, Dang C. 2012. Knowledge-Based Systems A dissimilarity
measure for the k -Modes clustering algorithm. Knowledge-Based Syst.
Devika R, Revathy S, Sai Surriya Priyanka U, Subramaniya Swamy V. 2018. Survey on
clustering techniques in Twitter data. Proc 2nd Int Conf Comput Methodol
Commun ICCMC 2018. 5(2):1073–1077. doi:10.1109/ICCMC.2018.8487969.
Duke JA, Godwin MJB, DuCellier J, Duke PAK. 2002. CRC Handbook of Medicinal
Herbs. Volume ke-5.
Gan G, Ma C, Jianhong W. 2007. Data Clustering Theory, Algorithms, and
11
Applications. Virginia (US).

Hakim L. 2015. Rempah & Herba Kebun-Pekarangan Rumah Masyarakat. Diandra
Creative.
Hegarty JA, Barry O’Mahony G. 2001. Gastronomy: A phenomenon of cultural
expressionism and an aesthetic for living. Int J Hosp Manag. 20(1):3–13.
doi:10.1016/S0278-4319(00)00028-1.
Von Holzen H, Arsana L. 2006. Authentic Recipes from Indonesia. Singapura: Periplus
Editions.
Huang Z. 1998. Extensions to the k-Means Algorithm for Clustering Large Data Sets
with Categorical Values. Data Mining and Knowledge Discovery 2, 283-304. Data
Min Knowl Discov. 2(3):283–304.
Indriani F, Budiman I. 2017. K-Modes Clustering untuk Mengetahui Jenis Masakan
Daerah yang Populer pada Website Resep Online (Studi Kasus: Masakan Banjar di
cookpad.com). J Teknol Inf dan Ilmu Komputer.
Irani J, Pise N, Phatak M. 2016. Clustering Techniques and the Similarity Measures
used in Clustering: A Survey. Int J Comput Appl. 134(7):9–14.
doi:10.5120/ijca2016907841.
Kadhim AI, Cheah YN, Ahamed NH. 2015. Text Document Preprocessing and
Dimension Reduction Techniques for Text Document Clustering. Proc - 2014 4th
Int Conf Artif Intell with Appl Eng Technol ICAIET 2014., siap terbit.
Kaur S, Chaudhary S, Bishnoi N. 2015. A Survey : Clustering Algorithms in Data
Mining. Int J Comput Appl. 3(7):12–14.
Kemenparekraf. 2020. https://www.kemenpar.go.id.
Lipoeto NI, Agus Z, Oenzil F, Masrul M, Wattanapenpaiboon N, Wahlqvist ML. 2001.
Contemporary minangkabau food culture in West Sumatra, Indonesia. Asia Pac J
Clin Nutr. 10(1):10–16. doi:10.1046/j.1440-6047.2001.00201.x.
Nadamoto A, Hanai S, Nanba H. 2016. Clustering for Similar Recipes in User-
Generated Recipe Sites Based on Main Ingredients and Main Seasoning. NBiS
2016 - 19th Int Conf Network-Based Inf Syst., siap terbit.
Palupi S, Fitri A. 2019. Pendoman Pengembangan Wisata Kuliner. Deputi Bid Pengemb
Ind dan Kelembagaan Kementeri Pariwisata., siap terbit.
https://www.kemenpar.go.id.
Phanich M, Pholkul P, Phimoltares S. 2010. Food recommendation system using
clustering analysis for diabetic patients. 2010 Int Conf Inf Sci Appl ICISA 2010.,
siap terbit.
Sharma T, Upadhyay U, Kalra J, Arora S, Ahmad S, Aggarwal B, Bagler G. 2020.
Hierarchical clustering of world cuisines. Proc - 2020 IEEE 36th Int Conf Data
Eng Work ICDEW 2020.
Shih MY, Jheng JW, Lai LF. 2010. A two-step method for clustering mixed categroical
and numeric data. Tamkang J Sci Eng. 13(1):11–19.
da Silva Torres EAF, Garbelotti ML, Moita Neto JM. 2006. The application of
hierarchical clusters analysis to the study of the composition of foods. Food Chem.
12
99(3):622–629. doi:10.1016/j.foodchem.2005.08.032.
Wijaya S. 2019. Indonesian food culture mapping: A starter contribution to promote
Indonesian culinary tourism. J Ethn Foods. 6(1):1–10.

Draft Seminar Rizka Aulia

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Draft Seminar Rizka Aulia

Uploaded by

Copyright:

Available Formats

SEMINAR SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

Nama : Rizka Aulia

PENGELOMPOKAN MAKANAN TRADISIONAL INDONESIA

Rizka Aulia2, Annisa3, Taufik Djatna4

Keywords: cluster, mixed data, traditional food, k-prototype, TMCM

Tabel 1 Atribut yang digunakan pada penelitian

Gambar 1 Tahapan penelitian

Evaluasi Hasil Cluster

HASIL DAN PEMBAHASAN

Gambar 2 Penyebaran provinsi data penelitian

2. Clustering menggunakan Metode K-Prototype

Berdasarkan hasil clustering yang ditunjukkan pada Tabel 2, metode clustering

Tabel 3 Pesebaran anggota cluster dengan metode K-prototype

Penyebaran untuk setiap anggota cluster dengan metode K-prototype pada

3. Two-step Method for Clustering Mixed Categorical and Numeric Data

Tabel 4 Sebaran anggota clustering metode TMCM

Tabel 5 Hasil clustering menggunakan metode TMCM dan K-prototype dipetakan

5. Perbandingan Clustering dengan menggunakan Metode TMCM dan K-

6. Visualisasi Cluster Makanan Tradisional Indonesia dengan TMCM

Gambar 3 Visualisasi Cluster Makanan Tradisional Indonesia dengan TMCM

SIMPULAN DAN SARAN

Fardiaz, D. 1998. Peluang, Kendala, dan Strategi Pengembangan Makanan Tradisional,

Applications. Virginia (US).

You might also like