You are on page 1of 4

Penerapan Metode Association Rule Menggunakan Algoritma Apriori untuk

Analisa Pola Data Hasil Tangkapan Ikan

Eko Wahyu Tyas D

Mahasiswa Program Studi Ilmu Komputer


Universitas Brawijaya Malang

wahyoutyas@gmail.com

Abstraksi

Dalam pembangunan perikanan laut, penguasaan teknologi perlu ditingkatkan. Selain itu, juga perlu diimbangi dengan
sistem informasi dan data yang akurat bagi kepentingan nelayan maupun instansi terkait untuk pengambilan
kebijakan. Misalnya informasi mengenai daerah penangkapan ikan dan potensi sumberdaya ikan di suatu perairan
tertentu sehingga informasi-informasi ini dapat mengarahkan nelayan melakukan penangkapan. Untuk mengatasi
masalah dalam pemasaran produk perikanan, diperlukan analisa terhadap pola data hasil tangkapan ikan di setiap
daerah penangkapan ikan, sehingga dapat diketahui pada bulan tertentu ikan apa yang banyak dihasilkan oleh nelayan di
masing-masing daerah penangkapan ikan. Dengan demikian, kita dapat menentukan daerah mana yang akan dijadikan
sebagai tujuan distribusi dan pemasaran ikan yang dihasilkan. Dalam penelitian ini digunakan metode association rule
(aturan asosiatif) yang merupakan salah satu teknik utama dalam data mining dan merupakan bentuk yang paling umum
dipakai dalam menemukan pattern atau pola dari suatu kumpulan data. Sedangkan algoritma yang digunakan adalah
algoritma Apriori. Dalam penelitian ini dilakukan pengujian pada data tangkapan ikan dengan atribut nama daerah, jenis
ikan, jumlah ikan, dan waktu penangkapan.

Kata Kunci : Data Mining, Association Rule, Algoritma Apriori

1. PENDAHULUAN asosiatif) berusaha menemukan aturan-aturan tertentu


yang mengasosiasikan data yang satu dengan data yang
Dalam pembangunan perikanan laut, penguasaan lain. Untuk mencari association rule dari suatu kumpulan
teknologi perlu ditingkatkan. Selain itu, juga perlu data, pertama-tama kita harus mencari lebih dulu yang
diimbangi dengan sistem informasi dan data yang akurat disebut "frequent itemset" (sekumpulan item yang sering
bagi kepentingan nelayan maupun instansi terkait untuk muncul bersamaan) [4]. Setelah semua pola frequent
pengambilan kebijakan. Misalnya informasi mengenai itemset ditemukan, barulah dicari aturan asosiatif yang
daerah penangkapan ikan dan potensi sumberdaya ikan di memenuhi syarat yang telah ditentukan.
suatu perairan tertentu sehingga informasi-informasi ini
dapat mengarahkan nelayan melakukan penangkapan [1]. Salah satu algoritma yang dapat digunakan untuk
menemukan association rule adalah algoritma Apriori.
Untuk mengatasi masalah dalam pemasaran produk Ciri dari algoritma Apriori adalah jika suatu itemset
perikanan ini, diperlukan analisa terhadap pola data hasil termasuk dalam large itemset, maka semua himpunan
tangkapan ikan di setiap daerah penangkapan ikan, bagian (subset) dari itemset tersebut juga termasuk large
sehingga dapat diketahui pada bulan tertentu ikan apa itemset [5].
yang banyak dihasilkan oleh nelayan di masing-masing
daerah penangkapan ikan. Dengan demikian, kita dapat Dalam penelitian ini akan dilakukan pengujian apakah
menentukan daerah mana yang akan dijadikan sebagai metode Association Rule dapat digunakan untuk
tujuan distribusi dan pemasaran ikan yang dihasilkan. menyelesaikan permasalahan pada data hasil tangkapan
ikan. Dalam penelitian ini digunakan data daerah dan
Pencarian pola atau hubungan asosiatif dari data yang nama ikan dari data statistik perikanan Dinas Kelautan
berskala besar sangat erat kaitannya dengan data mining. dan Perikanan propinsi Jawa Timur. Sedangkan data
Data mining adalah serangkaian proses untuk menggali jumlah ikan adalah data yang digenerate secara random
nilai tambah dari suatu kumpulan data berupa yang digunakan untuk uji coba. Hasil dari penelitian ini
pengetahuan yang selama ini tidak diketahui secara diharapkan dapat memberikan informasi mengenai daerah
manual [2]. penangkapan ikan dan potensi sumberdaya ikan di suatu
perairan tertentu dan membantu para nelayan dalam
Association rule (aturan asosiatif) adalah salah satu teknik menentukan daerah yang akan dijadikan sebagai tujuan
utama dalam data mining dan merupakan bentuk yang pendistribusian hasil tangkapan ikannya.
paling umum dipakai dalam menemukan pattern atau pola
dari suatu kumpulan data [3]. Association rule (aturan
2. PEMBAHASAN digunakan dalam proses. Nilai minimum support dan
minimum confidence yang dimasukkan adalah antara 0 –
Lingkungan Perangkat keras 100%. Dari hasil percobaan yang penulis lakukan, nilai
minimum support dari data yang digunakan dalam
Perangkat keras yang digunakan pada penelitian ini adalah pengujian adalah kurang dari 50%. Sedangkan nilai
sebuah PC(Personal Computer) dengan spesifikasi : minimum confidencenya lebih besar dari 50%.
Processor Intel® Celeron® 1.8 GHz, 512 MB RAM, 160
GB HDD, Monitor 15”, Keyboard, dan Mouse. Support dari suatu association rule
Perangkat keras ini akan difungsikan sebagai database adalah proporsi dari transaksi dalam database yang
server sekaligus tempat perangkat lunak untuk penelitian mengandung A dan B [6], yaitu :
dijalankan.
support = P( A ∩ B)
Lingkungan Perangkat lunak = jumlah transaksi yang mengandung A dan B
Perangkat lunak yang digunakan pada penelitian ini ialah : jumlah total transaksi
1. Sistem operasi Microsoft Windows XP Professional Confidence dari association rule adalah ukuran ketepatan
Edition Service Pack 2 sebagai server database suatu rule, yaitu persentase transaksi dalam database yang
sekaligus tempat aplikasi dijalankan. mengandung A dan mengandung B [6].
2. Borland Delphi 7.0 sebagai software development confidence = jumlah transaksi yang mengandung A dan B
dalam mengembangkan aplikasi untuk menghasilkan jumlah transaksi yang mengandung A
data random transaksi.
3. Xampp versi 1.5.3a yang meliputi PHP versi 5.1.4, Setelah memilih dataset dan menentukan nilai minimum
MySql versi 5.0.21 dan Apache versi 2.2.2 sebagai support dan minimum confidence yang akan digunakan
software development dalam mengembangkan dalam proses, baru dilakukan proses perhitungan
aplikasi untuk analisa pola data hasil tangkapan ikan association rule. Setelah proses perhitungan selesai,
sistem akan menampilkan rule yang dihasilkan dan nilai
Proses Pembuatan Data Penangkapan confidencenya. Rule ini menunjukkan pola hasil
tangkapan ikan di suatu daerah pada kwartal tertentu. Pola
Data penangkapan yang digunakan dalam uji coba dibuat yang dimaksud adalah jenis ikan yang sering muncul dan
secara random. Data ini digunakan sebagai data simulasi mempunyai jumlah yang besar.
untuk pengujian. Selanjutnya uji coba terhadap sistem
dapat dilakukan dengan data faktual yang berasal dari Langkah-langkah Proses Penghitungan Association
daerah mana saja asal datanya sesuai dengan format data Rule
dalam sistem ini. Dalam pembuatan data random harus Proses perhitungan association rule terdiri dari beberapa
dibuat aturan dan batasan-batasan tertentu agar hasilnya tahap.
mendekati data yang sebenarnya. Dalam sistem ini hanya • Sistem men-scan database untuk mendapatkan
dibatasi untuk range waktu dan jumlahnya saja, tidak ada kandidat 1-itemset (himpunan item yang terdiri dari 1
batasan yang lebih spesifik. Untuk hasil yang lebih akurat, item) dan menghitung nilai supportnya. Misalnya T
perlu dilakukan pengumpulan data lapang langsung dari adalah himpunan semua jenis ikan dalam database.
tempat penangkapan ikan. Support dari suatu itemset (S) merupakan prosentase
dari transaksi dalam T yang mengandung S.
Proses Perhitungan Association Rule Kemudian nilai support tersebut dibandingkan
Pada proses perhitungan association rule pengguna dengan minimum support yang telah ditentukan, jika
menentukan dataset atau parameter yang akan digunakan nilainya lebih besar atau sama dengan minimum
dalam proses. Dalam sistem ini terdapat 3 pilihan dataset, support maka itemset tersebut termasuk dalam large
yaitu dataset berdasarkan daerah, kwartal, dan gabungan itemset.
daerah dan kwartal. Basket analysis dalam sistem ini • Itemset yang tidak termasuk dalam large itemset tidak
adalah penangkapan ikan pada daerah dan kwartal diikutkan dalam iterasi selanjutnya (di prune).
tertentu, maka perhitungan association rule juga • Pada iterasi kedua sistem akan menggunakan hasil
dilakukan berdasarkan daerah dan kwartal tertentu. Jika large itemset pada iterasi pertama (L1) untuk
dataset yang dipilih adalah dataset berdasarkan daerah, membentuk kandidat itemset kedua (L2). Pada iterasi
maka akan dicari pola data pada daerah yang dipilih oleh selanjutnya sistem akan menggunakan hasil large
pengguna pada semua kwartal pada semua tahun. Jika itemset pada iterasi sebelumnya (Lk-1) untuk
dataset yang dipilih berdasarkan kwartal, maka akan dicari membentuk kandidat itemset berikutnya (Lk). Sistem
pola data pada kwartal dan tahun tertentu pada semua akan menggabungkan (join) Lk-1 dengan Lk-1 untuk
daerah. Sedangkan jika yang dipilih adalah dataset mendapatkan Lk, seperti pada iterasi sebelumnya
berdasarkan daerah dan kwartal, maka akan dicari pola sistem akan menghapus (prune) kombinasi itemset
data pada daerah dan kwartal yang telah ditentukan oleh yang tidak termasuk dalam large itemset.
pengguna. • Setelah dilakukan operasi join, maka pasangan
itemset baru dari hasil proses join tersebut juga
Setelah memilih dataset, pengguna menentukan nilai dihitung supportnya.
minimum support dan minimum confidence yang akan

e-Indonesia Initiative 2008 (eII2008) 2


Konferensi dan Temu Nasional Teknologi Informasi dan Komunikasi untuk Indonesia
21-23 Mei 2008, Jakarta
• Proses pembentukan kandidat yang terdiri dari proses mengetahui hubungan keterkaitan antara data yang ada
join dan prune akan terus dilakukan hingga himpunan dalam database. Berikut ini adalah tampilan dari
kandidat itemsetnya null, atau sudah tidak ada lagi antarmuka untuk proses pencarian association rule.
kandidat yang akan dibentuk.
• Setelah itu, dari hasil frequent itemset tersebut
dibentuk association rule yang memenuhi nilai
support dan confidence yang telah ditentukan.
• Pada pembentukan association rule, nilai yang sama
seperti "kerapu, kakap" = ="kakap, kerapu", dianggap
sebagai satu nilai.
• Association rule yang terbentuk harus memenuhi nilai
minimum yang telah ditentukan.
• Untuk setiap large itemset L, kita cari himpunan
bagian L yang tidak kosong. Untuk setiap himpunan
bagian tersebut, dihasilkan rule dengan bentuk a
⇒ (L - a) jika support (L) dan support (a) lebih besar
dari minimum support.

Antarmuka untuk Membuat Data Random Gambar 2. Antarmuka untuk Perhitungan Association
Data jumlah ikan pada setiap waktu penangkapan yang Rule
digunakan dalam penelitian ini adalah data simulasi yang
berupa data random. Berikut ini adalah tampilan user Pada gambar 2 terlihat bahwa terdapat tiga pilihan dataset
interface untuk menggenerate data random tersebut. yang akan digunakan dalam proses perhitungan
association rule, yaitu dataset berdasarkan daerah,
kwartal, dan gabungan daerah dan kwartal. Jika dipilih
dataset berdasarkan daerah maka akan ditampilkan pilihan
nama daerah, jika dipilih dataset berdasarkan kwartal
1 maka akan ditampilkan pilihan kwartal ke berapa yang
akan diproses. Begitu juga jika dipilih dataset berdasarkan
daerah dan kwartal, maka akan ditampilkan pilihan nama
2 daerah dan kwartal.

3 Hasil Uji Coba


Berikut ini adalah tabel hasil pengujian pada daerah
4
Lamongan. Untuk hasil pengujian yang lain tidak
ditampilkan disini.
Gambar 1. Antarmuka untuk Membuat Data Random
Tabel 1. Hasil Pengujian pada Daerah Lamongan
Pada antarmuka untuk pembuatan data penangkapan ini No
Min. Min.
Rule yang Terbentuk
Conf.
terdapat beberapa tombol dan pilihan menu. Supp Conf Rule
bawal-hitam=>bawal-putih 100.00%
1 Untuk menentukan range kwartal, pengguna bawal-putih=>bawal-hitam 60.00%
menentukan angka pada kolom kwartal start dan teri=>tongkol 60.00%
tongkol=>teri 60.00%
kwartal finish, secara otomatis pada kolom jumlah kerapu=>lencam 60.00%
data akan ditampilkan banyaknya data yang akan 1 20% 50% kerapu=>tetengkek 60.00%
dihasilkan. Kwartal adalah satuan untuk waktu tetengkek=>kerapu 75.00%
tongkol=>lencam 60.00%
penangkapan, dalam 1 tahun terdapat 4 kwartal. alu-alu=>lencam 75.00%
2 Setelah itu, jika pengguna menekan tombol generate, alu-alu=>japuh 75.00%
proses pembuatan data akan dimulai. japuh=>alu-alu 100.00%
bawal-hitam=>bawal-putih,selar,belanak 66.67%
3 Tombol delete all berfungsi untuk menghapus semua selar=>bawal-hitam,bawal-putih,belanak 100.00%
data yang ada dalam database. Jika tombol ini belanak=>bawal-hitam,bawal-putih,selar 66.67%
ditekan sistem akan memberikan konfirmasi apakah bawal-hitam,bawal-putih=>selar,belanak 66.67%
bawal-hitam,selar=>bawal-putih,belanak 100.00%
pengguna benar-benar ingin menghapus data. bawal-hitam,belanak=>bawal-putih,selar 100.00%
4 Tombol exit berfungsi untuk keluar atau menutup 2 10% 50% bawal-putih,selar=>bawal-hitam,belanak 100.00%
bawal-putih,belanak=>bawal-hitam,selar 100.00%
aplikasi. selar,belanak=>bawal-hitam,bawal-putih 100.00%
bawal-hitam,bawal-putih,selar=>belanak 100.00%
Antarmuka untuk Mencari Association Rule bawal-hitam,bawal-putih,belanak=>selar 100.00%
bawal-hitam,selar,belanak=>bawal-putih 100.00%
Setelah data transaksi selesai dibuat, maka langkah bawal-putih,selar,belanak=>bawal-hitam 100.00%
selanjutnya adalah mencari association rule untuk
e-Indonesia Initiative 2008 (eII2008) 3
Konferensi dan Temu Nasional Teknologi Informasi dan Komunikasi untuk Indonesia
21-23 Mei 2008, Jakarta
Support dari suatu itemset merupakan prosentase dari polanya dengan menggunakan metode ini. Dengan
seluruh data yang terdapat dalam database yang menggunakan parameter uji coba yang berbeda-beda
mengandung itemset tersebut. Nilai support 20%, artinya (yaitu daerah, kwartal dan gabungan daerah dan
prosentase kemunculan suatu itemset adalah 20% dari kwartal), maka akan dihasilkan rule atau pola yang
seluruh data yang terdapat dalam database. Sedangkan berbeda-beda pula.
nilai minimum support 20% artinya prosentase 3. Dari data hasil pengujian yang telah diperoleh, dapat
kemunculan itemset yang membentuk rule adalah kurang diketahui ikan apa saja yang sering muncul di suatu
dari atau sama dengan 20%. Berdasarkan hasil pengujian daerah pada kwartal tertentu. Dengan demikian
pada tabel 4.2 diketahui bahwa dengan menggunakan nilai informasi ini dapat memudahkan para nelayan dan
minimum support yang berbeda dihasilkan rule yang pedagang ikan dalam mendistribusikan hasil
berbeda pula. tangkapannya. Sehingga permasalahan dalam
distribusi tangkapan ikan dapat teratasi.
Confidence merupakan tingkat kepercayaan atau tingkat
kebenaran dari rule yang terbentuk. Rule yang dicari
adalah yang mempunyai kemungkinan benar yang besar, 4. Daftar Pustaka
yaitu rule yang membuat prediksi yang benar (atau sangat
sering benar). Rule “bawal-hitam=>bawal-putih” (dibaca [1]. Pujiati, Sri. 2001. Pembangunan Perikanan Laut di
jika ada bawal hitam maka ada bawal putih) dengan nilai Indonesia. Makalah Falsafah Sains. IPB November
minimum support 20% memiliki nilai confidence 100%, 2001. Bogor.
artinya prosentase kemunculan dari bawal hitam dan [2]. Pramudiono, Iko. 2006. Apa Itu Data Mining?,
bawal putih adalah 20% dari seluruh data dalam database. http://datamining.japati.net/, diakses 1 Maret 2007.
Sedangkan tingkat kebenaran atau kemungkinan bahwa [3]. Kantardzic, Mehmed. 2003. Data Mining: Concepts,
prediksi rule ini benar adalah 100%. Semakin tinggi nilai Models, Methods, and Algorithms. John Wiley &
support dan confidence, maka semakin tinggi tingkat Sons. New Jersey.
keakuratan dari rule atau pola yang dihasilkan. [4]. Prasetyo, Bowo. 2006. Analisis Perilaku Pengunjung
Menggunakan Data Mining.
Rule “bawal-hitam=>bawal-putih” memiliki nilai http://www.beritaiptek.com/zberita-beritaiptek-2006-
confidence yang berbeda dengan “bawal-putih=>bawal- 01-05-Analisis-Perilaku-Pengunjung-Menggunakan-
hitam”, artinya jika ada bawal hitam maka ada bawal Data-Mining.shtml, diakses 26 April 2007.
putih, akan tetapi belum tentu jika ada bawal putih maka
akan ada juga bawal hitam. Hal ini dikarenakan nilai
[5]. Agrawal, Rakesh, Ramakrishnan Srikant. 1994. Fast
Algorithms For Mining Association Rules. In Proc.
confidence tergantung dari nilai support atau kemunculan
1994 International Conference Very Large Data
suatu itemset. Support dari bawal hitam berbeda dengan
Bases (VLDB).
support bawal putih, berbeda pula dengan support bawal
hitam dan bawal putih yang muncul secara bersamaan [6]. Larose, Daniel T. 2005. Discovering Knowledge in
atau biasanya dinyatakan dengan support(bawal hitam, Data. An Introduction to Data Mining. John Wiley &
bawal putih). Sons. New Jersey.

Dari data hasil pengujian yang telah diperoleh, dapat


diketahui ikan apa saja yang sering muncul di suatu
daerah pada kwartal tertentu. Dengan demikian informasi
ini dapat memudahkan para nelayan dan pedagang ikan
dalam mendistribusikan hasil tangkapannya. Sehingga
permasalahan dalam distribusi tangkapan ikan dapat
teratasi.

3. PENUTUP
Berdasarkan penjelasan dan uraian sebelumnya dapat
penulis simpulkan bahwa:
1. Metode Association Rule dengan menggunakan
algoritma Apriori dapat digunakan untuk
menyelesaikan permasalahan data tangkapan ikan.
Setiap daerah memiliki pola dan kecenderungan yang
berbeda-beda. Hal ini ditunjukkan oleh perbedaan
rule yang dihasilkan dalam proses pengujian dengan
nilai minimum support dan minimum confidence yang
telah ditentukan.
2. Data tangkapan ikan dapat dimodelkan sesuai dengan
model dari algoritma yang digunakan pada metode
association rule, sehingga data tersebut dapat dicari

e-Indonesia Initiative 2008 (eII2008) 4


Konferensi dan Temu Nasional Teknologi Informasi dan Komunikasi untuk Indonesia
21-23 Mei 2008, Jakarta

You might also like