Professional Documents
Culture Documents
Abstract
Traditional food is food and drink that develops in an area that is processed using
local ingredients that have been passed down from generation to generation so that it
has a distinctive taste. When tourists visit a tourist area, they will indirectly look for the
typical food of the area. Traditional Indonesian food has similarities, namely the use of
spices in almost every dish. The use of spices is due to the fact that spices grow in
almost all parts of Indonesia. Each region in Indonesia has its own special food or
traditional food. So, it is necessary to classify traditional foods to determine the
characteristics of Indonesian food. The clustering method is a method that groups the
same attributes or objects into one group or group. Clustering methods usually focus
only on numeric data or only on categorical data. However, in this study the data used
are numerical data and categorical data (mixed). This study compares two clustering
methods for mixed data, namely the two-step method for clustering mixed categorical
and numerical data (TMCM) and the K-prototype method. The results of the calculation
showed that the entropy value of the K prototype method was 2.1983 while the entropy
value of the TMCM method was 2.1955. The difference is very subtle. On the basis of
the comparison of entropy results, the clustering method with TMCM has the smallest
entropy value. Thus, it can be concluded that the TMCM method provides optimal
results in clustering the data. The number of clusters generated using the TMCM
method is 5 clusters. The number of members of cluster 1 is 3 members, cluster 2 is 12
members, cluster 3 is 13 members, cluster 4 is 12 members, cluster 5 is 14 members.
PENDAHULUAN
Wisata kuliner memiliki peranan penting dalam pariwisata. Dibuktikan dengan
data dari Kementerian Wisata dan Ekonomi Kreatif (Kemenparekraf) tahun 2020,
kuliner merupakan sub sektor penyumbang terbesar Produk Domestik Bruto (PDB)
sebesar 44.40% pertahun dari PDB ekonomi kreatif (Kemenparekraf 2022). Wisata
kuliner selalu berkaitan erat dengan makanan dan minuman tradisional suatu daerah.
Makanan tradisional merupakan makanan dan minuman yang berkembang di suatu
daerah yang diolah menggunakan bahan – bahan lokal yang dilakukan secara turun
temurun sehingga mempunyai cita rasa yang khas (Fadiaz 1998).
1
Bagian Tesis, disampaikan pada seminar Pascasarjana IPB
2
Mahasiswa Program Studi Ilmu Komputer, Sekolah Pascasarjana IPB
3
Ketua Komisi Pembimbing, Staf Pengajar Departemen Ilmu Komputer, FMIPA IPB
4
Anggota Komisi Pembimbing, Staf Pengajar Departemen Teknologi Industri Pertanian, FATETA IPB
2
Ketika wisatawan mengunjungi suatu daerah wisata, maka secara tidak langsung
wisatawan akan mencari makanan khas daerah tersebut Perbedaan budaya dapat dilihat
dari bahan dasar yang digunakan dalam makanan, proses pengolahan makanan, cita rasa
makanan, kebiasaan dalam cara penyajian, serta alat dan bahan yang digunakan
(Hegarty dan Barry O’Mahony 2001). Bahan dasar suatu makanan dipengaruhi oleh
letak atau lokasi darimana makanan itu berasal. Walaupun lokasi mempengaruhi bahan
utama makanan suatu daerah, hampir semua makanan tradisional Indonesia
menggunakan rempah- rempah. Penggunan rempah – rempah sebagai bumbu utama
menyebabkan kemiripan bumbu dan bahan (resep) dalam masakan Indonesia. Serta
banyaknya suku dan luasnya wilayah Indonesia menyebabkan banyaknya makanan khas
yang terdapat Indonesia. banyaknya makanan tradisional dan kemiripan bumbu
masakan yang digunakan menyebab sulitnya mengetahui karakteristik makanan
tradisional disuatu wilayah Indonesia. untuk mengetahui karakteristik tersebut
dibutuhkan suatu pengelompokan untuk mengetahui kemiripan atau karakteristik yang
sama antar makanan. metode yang dapat digunakan yaitu dengan menggunakan metode
analisis pengelompokan (clustering).
Metode pengelompokan (clustering) merupakan metode yang mengelompokan
atribut atau objek yang sama kedalam satu kelompok atau grup. Clustering bertujuan
untuk menghimpun data yang memiliki kesamaan dalam satu grub dan data yang
memiliki perbedaan dihimpun dalam grub yang lainnya (Gan et al. 2007). Terdapat dua
metode clustering yaitu hierarchical clustering dan partition clustering. Hierarchical
clustering merupakan metode pengelompokan dengan membentuk struktur pohon.
Sedangkan, partition clustering merupakan teknik cluster yang membagi titik data
menjadi k-partition, dimana setiap partisi mewakili sebuah cluster (Kaur et al. 2015).
Penelitian da Silva Torres et al. (2006) dan Phanich et al. (2010) menggunakan
metode clustering berdasarkan data makanan. Pada penelitian da Silva Torres et al.
(2006), mengumpullkan data makanan yang dijual di restoran dan menerapkan
algoritme Hierarchical Clustering Agglomerative (HAC) untuk mengelompokan
makanan berdasarkan nilai gizinya. Sedangkan, pada penelitian Phanich et al. (2010)
nilai gizi pada makanan Thailand digunakan untuk mengelompokan makanan yang baik
bagi penderita diabetes. Algoritme K-means diterapkan pada pengelompokan tersebut.
Data makanan tidak hanya kadungan gizi yang dapat diolah dalam
pengelompokan makanan. Tetapi, cara pembuatan makanan atau resep makanan dapat
digunakan untuk menggali informasi makanan tersebut. Nadamoto et al. (2016)
menggunakan data resep dari situs resep online untuk mengelompokan resep yang
serupa atau mirip berdasarkan bahan baku utama dan bumbu utama. Sedangkan, pada
penelitian Sharma et al. (2020) menggunakan data resep makanan dengan melakukan
pengelompokan agar mengetahui ciri khas bahan makanan yang biasa digunakan pada
setiap negara. Penelitian – penelitian tersebut hanya mempertimbangkan data numerik
pada proses pengelompokan. Padahal pada penerapananya data tidak hanya bersifat
numerik tetapi juga kategorik.
Pengelompokan data resep makanan tradisional Indonesia telah dilakukan oleh
Indriani dan Budiman (2017). Pada penelitian tersebut melakukan pengelompokan
untuk mengetahui jenis makanan yang paling banyak di upload oleh pengguna pada
situs sharing recipe. Pengelompokannya berdasarkan bahan makanan dan hanya
berfokus pada data kategorik. Sedangkan, menurut Wijaya (2019) bahan makanan atau
resep masakan tradisonal Indonesia memiliki kemiripan karena bumbu utamanya yaitu
rempah-rempah. Serta, yang membedakannya adalah komposisi penggunaan dari
3
rempah tersebut. Sehingga, pada penelitian ini data yang digunakan tidak hanya bahan
makanan tetapi menambahkan atribut tingkatan rasa. Atribut tingkatan rasa
ditambahkan untuk mengetahui cita rasa khas serta karakteristik makanan tersebut. Pada
penelitian ini juga akan menggunakan atribut numerik dan kategorik campuran untuk
pengelompokan makanan tradisional Indonesia.
Metode pengelompokan untuk data campuran yang paling banyak digunakan
yaitu K-prototype. K-prototype merupakan metode yang dikembangkan dari kedua
metode pendahulunya yaitu metode K-means yang digunakan untuk data numerik dan
metode K-modes yang digunakan untuk data kategorik. Kedua metode tersebut
digabungkan untuk memproses data campuran. Penerapan metode K-prototype lebih
sederhana dan lebih baik dibandingkan metode clustering lainnya yang berbasis hierarki
(Huang 1998). Adapun metode lain yang dapat digunakan untuk memproses data
campuran yaitu Two-Step Method for Clustering Mixed Categorical and Numeric Data
(TMCM).
TMCM merupakan sebuah metode pengelompokan dua langkah yang digunakan
untuk data numerik dan kategoris campuran dengan memperhatikan ada hubungan
antara item kategoris. Shih et al. (2010) melakukannya Pengelompokan data dari Survei
Prevalensi Kontrasepsi Nasional Indonesia tahun 1987 menggunakan K-prototype, Two
Step Cluster, dan TMCM. Rosdiana (2014) melakukan penelitian yang hampir sama
yaitu membandingkan hasil pengelompokan tanaman obat dengan metode Two Step
Cluster dan TMCM. Nurul Istiqomah (2015) melakukan penelitian penggerombolan
kabupaten/kota berdasarkan faktor stunting pada bayi dengan metode TMCM. Ketiga
studi menyimpulkan bahwa hasil pengelompokan menggunakan TMCM lebih baik dari
pada metode yang lain dipelajari. Keuntungan TMCM dibandingkan metode lain adalah
transformasi. Variabel kategori dilakukan berdasarkan teori co-occurrence.
Penelitian ini menerapkan metode TMCM dan K-prototype untuk
mengelompokan makanan daerah Indonesia berdasarkan faktor bahan makanan serta
tingkatan rasa untuk mengetahui karakteristik dan kemiripana makanan serta metode
terbaik dalam mengelompokkan data makanan tradisional Indonesia yang memiliki
skala pengukuran numerik dan kategoris.
METODE PENELITIAN
Data Penelitian
Data penelitian diperoleh dari penyebaran kuisioner makanan yang dilakukan di
21 kota yang kelompokan menjadi 17 provinsi di Indonesia. Hasil dari penyebaran
kusioner yaitu mendapatkan data makanan tradisional sebanyak 54 jenis makanan. Data
makanan berupa data resep makanan yang berupa bumbu dan bahan makanan, serta
tingkatan rasa seperti, rasa pedas, gurih, asin, asam. Pada penelitian ini data makanan
berupa data numerik dan dan data kategorik. Data numerik dihasilkan dari data bahan
dan bumbu yang berupa data teks akan diubah ke bentuk numerik.Serta data kategorik
yang dihasilkan dari data tingkatan rasa. Atribut yang digunakan pada penelitian ini
ditunjukkan pada Tabel 1.
bumbu
X2 Level pedas Kategorik Tingkatan rasa dengan kategorik nilai 1
sampai 5
X3 Level gurih Kategorik Tingkatan rasa dengan kategorik nilai 1
sampai 5
X4 Level manis Kategorik Tingkatan rasa dengan kategorik nilai 1
sampai 5
X5 Level asin Kategorik Tingkatan rasa dengan kategorik nilai 1
sampai 5
X6 Level asam Kategorik Tingkatan rasa dengan kategorik nilai 1
sampai 5
Tahapan Penelitian
Penelitian ini melakukan perbandingan algoritme untuk proses clustering
makanan tradisional Indonesia. Algorime yang digunakan yaitu Two-step Method for
Clustering Mixed Categorical and Numeric Data (TMCM) dan algoritme k-prototype.
Adapun tahapan penelitian ditunjukkan pada Gambar 1.
Mulai
Praproses Data
Perbandingan Algoritme
TMCM K-prototype
Analisis Hasil
Selesai
Praproses data
Tahapan pertama pada penelitian ini yaitu melakukan praproses data. Data yang
diperoleh yaitu daftar nama makanan dari berbagai kota yang telah ditentukan.
Selanjutnya data makanan per kota dipetakan kembali menjadi data per provinsi. Data
yang telah dipetakan selanjutnya, akan di praproses menggunakan tokenisasi dengan
memisahakan data teks menjadi kata. Teknik tokenisasi telah dilakukan maka proses
selanjutnya mengubah huruf kapital menjadi huruf kecil, menghapus kata penghubung,
dan menghapus tanda baca. Karena data resep makanan rentan dengan istilah yang
memiliki makna yang sama. Seperti tepung tapioca memiliki arti yang sama dengan
sagu dan tepung kanji.
5
Algoritme Two-step Method for Clustering Mixed Categorical and Numeric Data
(TMCM)
Algoritme TMCM merupakan algoritme yang dirancang untuk menangani
pengelompokan pada data numerik dan kategorik (campuran). Algoritme ini memiliki
kelebihan yaitu mengonversi atribut kategori menjadi nilai numerik berdasarkan sifat
co-occurrence. Nilai numerik diberikan untuk atribut kategorikal berdasarkan hubungan
antar objek (Shih et al. 2010). Data kusioner yang ditelah dipraproses akan diolah
menggunakan algoritme TMCM. Algoritme TMCM memiliki tiga tahapan utama yaitu
praproses data, mengubah nilai atribut kategorik menjadi nilai numerik, dan tahapan
terakhir yaitu clustering (Shih et al. 2010).
Algoritme K-prototype
Pada penelitian ini, didalam dataset terdapat atribut bumbu dan bahan berbentuk
teks dan tingkatan (level) rasa dengan data kategori. Atribut bumbu dan bahan ini akan
diproses menggunakan jarak Levenshtein dan jarak cosine. Serta akan dibandingkan
hasil pengklusteran kedua jarak tersebut. Langkah tahapan K-prototype pada penelitian
ini:
1. Ubah variable teks pada atribut bumbu dan bahan dalam bentuk jarak. Akan
dibandingkan dengan jarak Levenshtein dan jarak cosine.
2. Tentukan target pada atribut bahan dan bumbu yang akan dijadikan
pembanding. Pemilihan dilakukan secara acak.
3. Mengubah tipe variable sesuai karakteristiknya.
4. Mencari jumlah cluster terbaik pada kedua jarak dengan menggunakan
pendekatan Elbow.
5. Membandingkan pendekatan antara jarak Levenshtein dan jarak cosine yang
menghasilkan penggerombolan terbaik.
Ketika perbandingan jarak terbaik telah diketahui, maka dataset dengan data teks
telah ditransformasi ke nilai numerik akan digunakan pada pemrosesan algoritme
TMCM.
(( ) )
m
nj l (1)
Entropi=−∑ ∗∑ P ij∗log ( Pij )
j=l n i =l
dimana:
m = jumlah dari cluster;
l = jumlah dari kelas;
nj = jumlah titik data didalam cluster;
n = jumlah semua titik data;
Pij = kemungkinan anggota cluster j masuk ke kelas i.
6
Model 2 3
Mie celor 1 3
Lenggang 2 3
Penyebaran untuk setiap anggota cluster dengan metode TMCM pada banyaknya
cluster sebanyak 5 cluster, cluster 5 merupakan cluster dengan anggota terbanyak yaitu
sebanyak 14 anggota sedangkan, cluster 1 merupakan cluster dengan anggota paling
sedikit yaitu hanya memiliki tiga anggota.
4. Karakteristik Hasil Clustering menggunakan Metode TMCM dan K-
Prototype
Karakteristik makanan tradisional Indonesia dengan membandingkan dua metode
yaitu TMCM dan K-prototype. Kedua metode tersebut menghasilkan masing-masing
lima cluster. Dari lima cluster tersebut terdapat dua cluster yang memiliki kemiripan
karakteristik. Kemiripan pertama yaitu cluster 1 pada metode TMCM dengan cluster 3
pada metode K-prototype memiliki karakteristik sangat tidak pedas, sangat gurih, sangat
tidak manis, asin netral dan sangat tidak asam. Kemiripan kedua terjadi pada cluster 4
untuk metode TMCM dan cluster 5 pada metode K-prototype dengan karakteristik
pedas netral, gurih, manis netral, asin netral, dan tidak asam.
Data makanan tradisional yang berjumlah 54 jenis makanan yang mewakili 17
provinsi yang ada di Indonesia, dapat kita lihat karakteristik berdasarkan hasil cluster
makanan tersebut. Pada hasil proses clustering dengan metode TMCM terdapat empat
provinsi yang semua jenis makanannya tersebut terdapat pada satu cluster yaitu provinsi
NAD, DKI Jakarta, Jawa Barat, dan Jawa Timur. Sedangkan, sisa provinsi yang lainnya
makanannya terletak dibeberapa cluster. Kemudian pada metode K-prototype terdapat
tujuh provinsi yang semua jenis makanannya terletak pada satu cluster yaitu, NAD, DKI
Jakarta, Kalimantan Tengah, Maluku Utara, Riau, Sulawesi Selatan dan Sumatera
Selatan. Penjelasan ini merujuk pada Tabel 5.
Sumatera Selatan X X X
Total 1 6 7 8 9 4 8 1 7 7
Dapat dilihat dari Gambar 3 penyebaran jenis makanan pada setiap provinsi yang
diwakili pada dataset. Semakin pekat warna wilayah provinsi menunjukan bahwa jenis
makanan yang diwakili pada data tersebut berkumpul pada satu wilayah.
TMCM memiliki nilai entropy terkecil. Dengan demikian dapat disimpulkan metode
TMCM lebih memberikan hasil optimal dalam melakukan penggerombolan pada data.
Jumlah cluster yang hasilkan menggunkana metode TMCM yaitu sebanyak 5 cluster.
Jumlah anggota cluster 1 sebanyak 3 anggota, cluster 2 sebanyak 12 anggota, cluster 3
sebanyak 13 anggota, cluster 4 sebanyak 12 anggota, cluster 5 sebanyak 14 anggota.
Saran
Pada penelitian selanjutnya, untuk membandingkan karakteristik jenis makanan
Indonesia data yang digunakan ditambahkan lagi dan lebih difokuskan. Ketika ingin
membandingakan kategori makanannya ditentukan, apakah kategori makanan utama,
makanan ringan atau minuman. Serta, perwakilan makanan untuk setiap provinsi
disamaratan, agar hasil perbandingannya lebih optimal.
DAFTAR PUSTAKA
99(3):622–629. doi:10.1016/j.foodchem.2005.08.032.
Wijaya S. 2019. Indonesian food culture mapping: A starter contribution to promote
Indonesian culinary tourism. J Ethn Foods. 6(1):1–10.