You are on page 1of 31

APLIKASI DATA MINING UNTUK PEMODELAN PEMBELIAN BARANG DENGAN MENGGUNAKAN ALGORITMA APRIORI

Almon Junior Simanjuntak
almon.jhuntaq@gmail.com

Jurusan Teknik Informatika, FTI, UPN “Veteran” Jatim, Surabaya ABSTRAK

Kreativitas pengusaha ritel dalam menentukan strategi pemasaran akan mempengaruhi kemampuan bersaing mereka dengan pengusaha ritel yang lain. Pelayanan yang sesuai dengan perilaku belanja konsumen merupakan hal yang perlu diperhatikan pengusaha demi meningkatkan level kepuasan pelanggan dan laba perusahaan. Metode yang bisa dipergunakan dalam mempelajari perilaku konsumen adalah Market Basket Analysis. Metode ini menghasilkan aturan asosiatif yang diproses dengan menggunakan algoritma apriori. Pada pengerjaan tugas akhir ini, peneliti menggunakan algoritma apriori untuk mengolah data penjualan. Hasil yang didapat dari pengolahan data penjualan tersebut adalah berupa kombinasi item (itemset) dengan nilai asosiasi berupa nilai support, nilai confidence, dan nilai gabungan. Pada tahap pengujian aplikasi dengan tiga sampel barang, hasil rule itemset dengan nilai asosiasi tertinggi (strong rule) didapat dalam pengujian untuk item susu Frisian Flag dengan batasan nilai minimum support dan minimum confidence sebesar 30%, yaitu rule item susu Frisian Flag dengan item Gulaku Gula Premium 250g dengan nilai minimum support sebesar 91,67% dan minimum confidence sebesar 52,38%. Strong rule yang dihasilkan dapat menjadi bahan rekomendasi bagi pengusaha ritel dalam menentukan penyusunan tata letak barang, dan dalam menentukan stok produk apa saja yang perlu diperbanyak demi meningkatkan keuntungan.

Kata Kunci : Bisnis Ritel, Data Mining, Association Rule, Market Basket Analysis, Algoritma Apriori.

1. Pendahuluan Kemajuan Teknologi Informasi yang pesat menghadirkan tingkat kompetensi yang semakin ketat dalam berbagai aspek kehidupan manusia. Misalnya dalam persaingan pasar, yakni pasar tradisional yang mulai terpinggirkan dengan hadirnya pasar modern. Perkembangan pasar modern yang semakin maju dapat kita lihat dari banyaknya pusat perbelanjaan, distributor, grosir, hypermarket, supermarket, dan minimarket yang dibangun untuk melayani kebutuhan konsumen. Maraknya gedunggedung perbelanjaan modern seperti itu tidak lepas dari peralihan pola pikir konsumen yang pada mulanya berorientasi pada harga yang murah, kini sudah memperhatikan aspek keamanan, kebersihan, kenyamanan, keramahan dalam pelayanan, kelengkapan jenis dan penempatan rak barang. Terlepas dari jenis pasar yang digeluti, para pelaku pasar pun saling berlomba untuk memberikan pelayanan yang terbaik, ditinjau dari aspek-aspek vital yang menjadi bahan penilaian konsumen. Dalam penelitian ini, penulis mengangkat permasalahan dalam pelayanan yang sering terjadi dalam bisnis ritel (retail), yakni pemilik minimarket atau toko ritel yang masih cenderung menempatkan posisi rak tanpa memperhatikan hubungan antar barang, sehingga menyulitkan konsumen dalam pencarian barang yang diinginkannya (Triyono, 2006). Di samping perlunya pengetahuan akan penempatan barang yang sesuai dengan selera konsumen, pengusaha ritel juga harus memperhatikan strategi pemasaran untuk menarik minat konsumen dan meningkatkan hasil penjualan, misalnya berupa penawaran diskon untuk jenis barang tertentu jika dibeli secara bersamaan. Karena itu, pemilik toko memerlukan suatu sistem yang dapat menghasilkan informasi prediktif tentang kebiasaan dan keinginan konsumen pada umumnya. Sistem tersebut dapat dibentuk dengan mencatat data penjualan dan diproses dengan menggunakan metode pada data mining. Berlatar belakang pada permasalahan tersebut, penulis mengembangkan sebuah gagasan untuk membuat suatu sistem yang berguna dalam pemodelan pembelian barang, dengan menggunakan teknik association rules pada data mining. Association Rules sering juga disebut dengan Market Basket Analysis karena

kegunaannya dalam pembuatan model perilaku pembelian barang oleh konsumen, dan dalam menganalisis perilaku konsumen. Algoritma yang dipergunakan sebagai metode dalam pengerjaan Tugas Akhir ini adalah Algoritma Apriori. Sistem ini nantinya diharapkan dapat membantu para pemilik minimarket atau usaha ritel untuk meningkatkan pelayanan dan mencapai hasil penjualan yang memuaskan. Adapun tujuan penelitian ini adalah merancang dan membuat suatu sistem pemodelan pembelian barang oleh konsumen yang mengolah data penjualan menjadi informasi prediktif berupa nilai asosiasi antar barang. Manfaat yang ingin diperoleh dalam pengerjaan tugas akhir ini adalah agar peneliti dapat membuat suatu sistem yang bermanfaat dalam bidang analisis pemasaran barang dengan menggunakan algoritma Apriori. Secara umum, penulis berharap agar sistem yang dihasilkan dalam penelitian ini dapat dimanfaatkan oleh para pemilik minimarket atau toko ritel untuk menentukan penyusunan letak barang secara rapi menurut kombinasi barang yang paling sering dibeli dan saling berhubungan, dengan tujuan meningkatkan pelayanan yang memudahkan konsumen dalam pencarian barang yang diinginkan,

meningkatkan hasil penjualan barang dengan strategi pemasaran yang tepat serta menarik minat konsumen.

2. Tinjauan Pustaka 2.1 Konsep Bisnis Ritel Kata “ritel” berasal dari kata kerja dalam bahasa perancis : retailer yang berarti “to cut of (bahasa inggris)” atau memotong. Bisnis ritel adalah aktivitas bisnis yang menjual jasa dan barang-barang ke konsumen untuk kegunaan pribadi, keluarga, atau konsumsi rumah tangga. Bisnis ritel atau eceran merupakan tahap terakhir dalam suatu rantai saluran distribusi, dimana para pengusaha dan masyarakat terlibat dalam perpindahan fisik dan kepemilikan jasa serta barang dari produsen ke konsumen. Pedagang ritel seringkali berperan sebagai pihak penghubung antara pabrik, tengkulak, dan konsumen. Konsep ritel adalah dengan memborong berbagai jenis barang dalam jumlah yang banyak dan menjualnya dalam jumlah yang kecil. Kita

dapat mendefenisikan bisnis ritel sebagai suatu industri yang luas, cepat, dan menyediakan suatu keanekaragaman dalam karakter dan ukuran bisnis yang jarang ditemui di sektor industri yang lain. Adapun jenis bisnis ritel secara umum meliputi gerai tradisional seperti warung dan toko tradisional dan gerai modern seperti minimarket dan supermarket. Perbedaan antara gerai tradisional dan gerai modern terletak pada tata ruang gerai, teknologi informasi, dan pelayanan. Gambar 2.1 berikut merupakan mata rantai dari alur distribusi barang dari produsen sampai kepada konsumen.
PRODUSEN PRODUSEN DISTRIBUTOR DISTRIBUTOR PENGUSAHA PENGUSAHA RITEL RITEL SUB SUB DISTRIBUTOR DISTRIBUTOR

KONSUMEN KONSUMEN

Gambar 2.1. Rantai perdagangan ritel

Dari rantai perdagangan pada gambar 2.1, dapat disimpulkan bahwa bisnis ritel berperan sebagai perantara perdagangan yang memiliki ketergantungan pasokan barang dan jasa kepada produsen/ pemasok.

Customer Customer Orientation Orientation

Coordinated Coordinated Effort Effort

Value Value Driven Driven Goal Goal Orientation Orientation

Retailin g Concept

Retailing Retailing Strategy Strategy

Gambar 2.2. Penerapan Konsep Ritel (Evans & Berman, 2004) Pada gambar 2.2, terdapat 4 prinsip dalam konsep bisnis ritel yang perlu diperhatikan dan diterapkan oleh para pedagang ritel (Joel R Evans, Barry Berman, 2004)”. Prinsip tersebut dijabarkan sebagai berikut :

a. Customer Orientation (berorientasi kepada konsumen), pedagang ritel menentukan atribut dan kebutuhan konsumen dan berusaha untuk memuaskan kebutuhan tersebut sampai pada titik terpenuh. b. Coordinated Effort (Usaha yang terkoordinir), pedagang ritel

mengintegrasikan semua aktivitas dan rencana demi memaksimalkan efisiensi. c. Value-Driven (Harga yang terkendali), pedagang ritel menawarkan harga yang baik kepada konsumen, apakah itu berupa promosi paket penjualan yang murah ataupun diskon harga barang. d. Goal Orientation (berorientasi pada target), pedagang ritel menetapkan target dan kemudian membentuk strategi untuk mencapainya. 2.2 Data Mining Seiring dengan perkembangan teknologi, kemampuan manusia dalam mengumpulkan dan mengolah data juga mengalami kemajuan. Data mining dapat diartikan sebagai suatu proses ekstraksi informasi yang berguna dan potensial dari sekumpulan data yang secara implisit terdapat dalam suatu database. Informasi yang ditemukan ini selanjutnya dapat diterapkan untuk aplikasi manajemen, melakukan query processing, pengambilan keputusan, dan lain-lain. Dewasa ini, data mining sering dipergunakan oleh berbagai jenis perusahaan untuk mendapatkan informasi yang berharga dari gudang data mereka. Hal ini dikarenakan data mining dapat menghasilkan gambaran nyata tentang tren dan sifatsifat perilaku bisnis yang sangat berguna untuk mengambil keputusan penting, berupa strategi dan kebijakan yang berdampak positif bagi pertumbuhan suatu perusahaan. Data mining mengekplorasi basis data untuk menentukan pola-pola yang tersembunyi, mencari informasi sebagai dasar untuk memprediksi perilaku para pengusaha dan konsumen secara umum. Data mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data (Daniel T. Larose, 2005).

Gambar 2.3 merupakan gambaran proses evolusi dari basis data mulai dari tahap pembuatannya pada tahun 1960 sampai dengan saat ini.

Pengumpulan Pengumpulan data data dan dan pembuatan pembuatan basis basis data data (1960’an) (1960’an) pemrosesan pemrosesan file file primitif primitif
Sistem Sistem manajemen manajemen database database (1970’an) (1970’an) -sistem -sistem jaringan jaringan dan dan dan dan basis basis data data yang yang berhubungan berhubungan -peralatan -peralatan pemodelan pemodelan data data -- teknik teknik pengindeksan pengindeksan dan dan pengelompokan pengelompokan data data -- bahasa bahasa dan dan pemrosesan pemrosesan kueri kueri -- hubungan hubungan antar-muka antar-muka dengan dengan pengguna pengguna -- metode metode optimalisasi optimalisasi -- On-Line On-Line Transaction Transaction Processing Processing (OLTP) (OLTP)

Sistem Sistem basis basis data data lanjutan lanjutan (pertengahan (pertengahan 1980 1980 -- sekarang) sekarang) Model Model data data lanjutan lanjutan Aplikasi Aplikasi terorientasi terorientasi

Pergudangan Pergudangan data data (data (data warehousing) warehousing) dan dan data data mining mining (Akhir (Akhir 1980’an 1980’an -- sekarang) sekarang) Teknologi Teknologi data data warehouse warehouse dan dan OLAP OLAP Data Data mining mining dan dan penemuan penemuan pengetahuan pengetahuan

Generasi Generasi baru baru dalam dalam sistem sistem informasi informasi (2000 (2000 -- ….) ….)

Gambar 2.3. Evolusi teknologi basis data (Jiawei Han & Micheline Kamber, 2000)

Data mining dapat dipandang sebagai sebuah hasil evolusi alami dari teknologi informasi (gambar 2.3). Sebuah alur evolusi dapat disaksikan pada perkembangan kemampuan industri database dalam hal pengumpulan data (data collection) dan pembuatan basis data (database creation), manajemen data (data management), serta analisis dan pemahaman data (data analysis and understanding). Pada saat ini, data dapat disimpan ke dalam beberapa jenis basis data. Salah satu arsitektur basis data yang muncul adalah gudang data (Data Warehouse), yaitu sebuah tempat penyimpanan dari suatu sumber data heterogen, yang terorganisir di bawah sebuah skema gabungan pada lokasi tunggal dengan tujuan mempermudah manajemen dalam pengambilan keputusan (Jiawei Han & Micheline Kamber, 2000).

Gambar 2.4. Knowledge Discovery in Databases atau Data mining sebagai sebuah proses dalam penemuan pengetahuan (Jiawei Han & Micheline Kamber, 2000)

Menurut Jiawei Han dan Micheline Kamber (Data Mining : Concept and Techniques, 2000), data mining dalam perannya sebagai proses penemuan pengetahuan memiliki langkah terurut (Gambar 2.4) sebagai berikut : a. Data Cleaning (untuk menghilangkan data yang kabur atau noise dan tidak relevan) b. Data Integration (dimana sumber data yang banyak dapat digabungkan) c. Data Selection (dimana data yang relevan terhadap proses analisis dikembalikan dari basis data) d. Data Transformation (dimana data diubah atau diperkuat ke dalam format yang sesuai untuk penggalian data dengan membuat ringkasan atau pengumpulan data) e. Data Mining (sebuah proses yang penting dimana metode pintar diterapkan dengan tujuan untuk menyaring pola data) f. Pattern Evaluation (untuk mengenali pola menarik yang menyajikan pengetahuan berdasarkan beberapa tolak ukur ketertarikan) g. Knowledge Presentation (dimana visualisasi dan teknik penyajian pengetahuan dipergunakan untuk menghasilkan pengetahuan tergali bagi user).

Perkembangan teknologi informasi yang pesat menimbulkan dampak yang cukup besar dalam hal pengumpulan dan akumulasi data. Tanpa manajemen data yang baik, akan tercipta suatu kondisi yang sering disebut sebagai “ rich of data but poor of information” (Jiawei Han dan Micheline Kamber, 2000), yaitu kondisi dimana data yang terkumpul dalam suatu basis data hanya dibiarkan begitu saja dan tidak dipergunakan dengan baik untuk menciptakan suatu aplikasi yang bermanfaat dalam memperoleh informasi yang berharga. Gambar 2.5 berikut merupakan gambaran dimana terjadi kondisi “rich of data but poor of information”.

Gambar 2.5. Kondisi “rich of data but poor of information” (Jiawei Han & Micheline Kamber, 2000)

Data mining adalah suatu proses untuk menguraikan penemuan pengetahuan di dalam database untuk melihat keterkaitan penjualan antar item, dengan menggunakan statistik, matematika, dan kecerdasan buatan yang terkait dengan basis data yang besar. Data mining merupakan konsep utama dalam kecerdasan bisnis (business intelligent) serta pemrosesan analisis secara online (online analytical processing). Data mining memiliki banyak model algoritma yang dapat diterapkan dalam proses bisnis, sebagai metode efektif untuk mencapai nilai positif dalam peningkatan kinerja proses dan keuntungan. Arsitektur dari suatu sistem basis data tertentu memiliki komponen utama sebagai berikut (Jiawei Han & Micheline Kamber, 2000) :

a. Basis data (database), gudang data (data warehouse), atau tempat

penyimpanan

informasi

(information

repository).

Komponen

ini

memungkinkan adanya penggabungan dan pembersihan pada data.
b. Basis data, atau server gudang data. Komponen ini bertanggung jawab

dalam pengambilan data yang relevan, berdasarkan permintaan user.
c. Basis pengetahuan (knowledge base), merupakan daerah pengetahuan

yang dipergunakan sebagai panduan dalam pencarian.
d. Mesin data mining (data mining engine), merupakan hal yang penting

dalam sistem data mining dan biasanya terdiri atas sejumlah modul fungsional yakni dalam karakterisasi (characterization), analisis asosiasi (association analysis), klasifikasi (classification), analisis penyimpangan dan evolusi (evolution and deviation analysis).
e. Modul evaluasi pola (pattern evaluation module). Komponen ini secara

khusus mengerjakan ukuran ketertarikan (interestingness measures) dan berhubungan dengan modul data mining agar memusatkan pencarian ke arah pola yang menarik. Modul evaluasi pola dapat digabungkan dengan modul penggalian (mining), tergantung pada implementasi metode data mining yang digunakan. Grafis hubungan antar muka (graphical user interface). Modul ini

memperbolehkan user untuk berinteraksi langsung dengan sistem data mining, menyediakan informasi pengarah dalam pencarian, dan melakukan penjelajahan data. 2.2.1 Pengelompokan Data Mining Data mining dapat dikelompokkan ke dalam beberapa kategori berdasarkan tugas dan fungsinya, yaitu : Deskripsi (Description), Estimasi (Estimation), Prediksi (Prediction), Klasifikasi (Classification), Klasterisasi (Clustering), dan Asosiasi (Association) (Daniel T. Larose, 2006). Klasifikasi adalah proses dalam menemukan sejumlah model atau fungsi yang menguraikan dan mengelompokkan kelas-kelas data atau konsep, dengan tujuan agar mampu menggunakan model tersebut untuk meramalkan kelas dari objek, dimana label kelas tidak dikenali. Model yang diperoleh dapat diwakilkan dalam beberapa

bentuk, seperti aturan klasifikasi (classification rules : if - then), pohon keputusan (decision tree), rumus matematika (mathematical formulae), atau jaringan syaraf tiruan (neural networks). Klasifikasi dapat digunakan untuk menemukan label kelas dari data objek. Bagaimanapun, dalam sejumlah aplikasi, ada sebuah kemungkinan dimana seseorang lebih memilih untuk meramalkan nilai data yang hilang daripada mencari label kelas. Biasanya pada kasus ini, nilai yang diramalkan adalah data berupa angka secara terperinci disebut dengan prediksi (prediction). Berbeda dengan klasifikasi dan prediksi, yang menganalisis label kelas pada data, klasterisasi menganalisis objek data tanpa berhubungan dengan suatu label kelas yang dikenal. Objek-objek dikelompokkan berdasarkan prinsip dalam

memaksimalkan persamaan dalam kelas (intraclass) dan meminimalkan persamaan antar kelas (interclass). Karena itu, klaster dari objek dibentuk agar sebuah objek di dalam sebuah klaster memiliki persamaan yang tinggi dengan objek lainnya, tetapi akan sangat berbeda jika dibandingkan dengan objek dalam klaster lainnya. Setiap kluster yang terbentuk dapat juga kita defenisikan sebagai kelas dari objek-objek. Analisis asosiasi adalah salah satu teknik data mining untuk menemukan aturan asosiatif (associative rules) antara suatu kombinasi item dalam suatu basis data relasional. Karena kegunaannya secara luas dapat dipergunakan untuk kepentingan bisnis dan menganalisa data transaksi, analisis asosiasi sering juga disebut dengan Market Basket Analysis (Michael J.A Berry & Gordon S. Linoff, 2004). 2.2.2 Association Rules Association rules (aturan asosiasi) merupakan salah satu dari pengetahuan yang paling penting dalam data mining yang dapat diartikan sebagai hubungan dan ketergantungan antara sejumlah item (itemsets) dengan menentukan nilai support dan confidence pada basis data. Aturan asosiasi ingin memberikan informasi tersebut dalam bentuk hubungan “if-then” atau “jika-maka”. Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support (nilai penunjang) yaitu prosentase kombinasi item tersebut dalam database, dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam

aturan assosiatif. Dalam bidang ekonomi, aturan asosiatif telah dipergunakan secara luas dalam mengukur pola konsumsi pelanggan berdasarkan data keranjang belanja (Market basket data), sehingga sering disebut juga dengan analisa keranjang belanja (Market basket analysis). Penggalian aturan asosiatif (associative rules mining) berfungsi untuk menemukan aturan asosiasi yang paling penting dari basis data berukuran besar. Ada beberapa model aturan asosiasi (association rule) yang sering dipergunakan selama ini, yakni (Jiawei Han & Micheline Kamber, 2000) : a. Single level association rule, contoh : komputer  software antivirus b. Multilevel association rule, contoh : IBM komputer  Canon Printer c. Interdimensional association rule, contoh : Age(x, 19,…,25) , Occupation (x, student)  buys (x, laptop) d. Hybrid-dimensional association rule, contoh : Age (x, 19,..,25), Buys (x, laptop)  buys (x, canon printer) Perbedaan antara interdimensional association rule dan hybrid-dimensional association rule terdapat pada pengulangan predikat pada sebuah rule, dimana interdimensional tidak memperbolehkan sementara hybrid-dimensional

memperbolehkan adanya pengulangan predikat.

Rumus untuk mencari nilai support dan confidence pada suatu item adalah sebagai berikut : a. Support Support (AB) = jumlah transaksi mengandung A dan B *100 jumlah total transaksi b. Confidence Confidence (AB) = jumlah transaksi mengandung A dan B *100 jumlah total A dalam transaksi

Gabungan (Combination) = Support * Confidence 2.2.3 Algoritma Apriori Di antara jenis-jenis algoritma yang ada dalam penggalian aturan asosiasi (association rules mining), algoritma apriori merupakan algoritma pendahulu yang pertama kali ditawarkan oleh Rakesh Agrawal pada tahun 1993. Ide utama pada algoritma apriori adalah dengan membaca database secara berulang. Langkah pada algoritma apriori adalah : pertama - mencari frequent itemset dari basis data transaksi, kedua – menghilangkan itemset dengan frekuensi yang rendah berdasarkan level minimum support yang telah ditentukan sebelumnya, dan terakhir - membuat aturan asosiasi (association rule) dari itemset yang memenuhi ketentuan nilai minimum confidence dalam basis data (Agrawal dan Srikant, 1994). Algoritma apriori merupakan suatu bentuk algoritma dalam data mining yang akan memberikan informasi tentang hubungan antar item dalam database yang dapat dimanfaatkan secara luas dalam proses bisnis khususnya dalam proses penjualan. Knowledge algoritma apriori terletak pada frequent itemset yang telah diketahui sebelumnya, untuk memproses informasi selanjutnya (Erwin, 2009). Terdapat dua proses utama pada algoritma apriori (Jiawei Han & Micheline Kamber, 2000), yaitu sebagai berikut :
a. Join (penggabungan)

Dalam proses ini, setiap item dikombinasikan dengan item yang lainnya sampai tidak terbentuk kombinasi lagi
b. Prune (pemangkasan)

Pada proses ini, hasil kombinasi item akan dipangkas dengan menggunakan minimum support yang telah ditentukan oleh pengguna. Algoritma apriori bekerja dengan cara menghasilkan kandidat baru dari kitemset pada frequent itemset sebelumnya dan menghitung nilai support k-itemset tersebut. Itemset yang memiliki nilai support di bawah dari minsup akan dihapus. Langkah selanjutnya adalah menghitung minconf mengikuti rumus sesuai yang telah ditentukan. Support tidak perlu dilihat lagi, karena generate frequent itemset didapatkan dari melihat minsup-nya. Bila rule yang didapatkan memenuhi batasan

yang ditentukan dan batasan itu tinggi, maka rule tersebut tergolong strong rules. Proses penghitungan dalam algoritma berhenti ketika tidak ada lagi frequent itemset baru yang dihasilkan. Sebagai contoh dapat kita lihat pada gambar 2.6 berikut.

Gambar 2.6. Ilustrasi algoritma apriori (Muhammad Ikhsan, dkk, 2007)

Dalam gambar 2.6 tersebut, database D merupakan kumpulan dari data transaksi. Dari database D yang telah diolah, diperoleh hasil support pada C1, yakni transaksi untuk item 1 sebanyak 2 kali, item 2 sebanyak 3 kali, item 3 sebanyak 3 kali, item 4 sebanyak 1 kali, item 5 sebanyak 3 kali. Data C1 kemudian dipangkas dengan menggunakan nilai minimal support yang ditentukan oleh user, yakni : minsup ≥ 2. Hasil pemangkasan tersebut dapat dilihat di tabel L1, dimana item 4 tidak dimasukkan lagi karena tidak memenuhi nilai minimum support. Langkah selanjutnya adalah membuat model (generate) data itemset yang mungkin muncul, yaitu (1,2), (1,3), (1,5), (2,3), (2,5), (3,5). Data tersebut dicantumkan pada tabel C2, kemudian frekuensi kemunculannya diolah dari tabel database D. Item (1,2) memiliki support sebanyak 1, item (1,3) sebanyak 2, item (1,5) sebanyak 1, item (2,3) sebanyak 2, item (2,5) sebanyak 3, item (3,5) sebanyak 2. Data tersebut kemudian dipangkas lagi dengan menggunakan nilai minum support, dan diperoleh hasil pada tabel L2 : (1,3), (2,3), (2,5), (3,5). Karena support item 1 (tabel L2) hanya sebanyak 1, yang tergolong strong rules adalah item 2, 3, dan 5, dimana itemset (2,3,5) muncul dengan support sebanyak 2 kali. Gambar 2.7 merupakan Flowchart algoritma Apriori.

Gambar 2.7 Flowchart Algoritma Apriori

Kombinasi itemset yang ingin diterapkan dalam aplikasi tugas akhir ini dibatasi sampai 5 jumlah barang terasosiasi. Gambaran alur tahapan proses dalam menghasilkan kombinasi itemset pada aplikasi dijelaskan satu persatu dalam gambar flowchart sebagai berikut.
a. Kombinasi dua barang : jumlah barang yang muncul terkombinasi secara

bersamaan adalah sebanyak dua barang.

Gambar 2.8 Flowchart kombinasi dua barang

b. Kombinasi tiga barang : jumlah barang yang muncul terkombinasi secara

bersamaan adalah sebanyak tiga barang.

Gambar 2.9 Flowchart kombinasi tiga barang

c. Kombinasi empat barang : jumlah barang yang muncul terkombinasi

secara bersamaan adalah sebanyak empat barang.

Gambar 2.10 Flowchart kombinasi empat barang

d. Kombinasi lima barang : jumlah barang yang muncul terkombinasi secara

bersamaan adalah sebanyak lima barang.

Gambar 2.11 Flowchart kombinasi lima barang Adapun pseudocode algoritma apriori dapat kita pahami dari gambar 2.12.

Gambar 2.12. Pseudocode Algoritma Apriori (Nugroho Wandi, dkk, 2012)

3. Metodologi Penelitian 3.1 Desain Penelitian Desain penelitian adalah tahapan atau gambaran yang akan dilakukan peneliti dalam melakukan penelitian. Dalam pengerjaan tugas akhir ini, adapun tahapantahapan desain penelitian yang dilakukan oleh peneliti adalah sebagai berikut: a. Mengumpulkan data yang diperlukan berupa textbook, paper dan karya ilmiah yang membahas algoritma dalam data mining untuk keperluan bisnis. b. Setelah dikumpulkan data yang diperlukan, ditentukan data yang akan dipakai pada penelitian ini yaitu berupa textbook, paper dan karya ilmiah yang membahas algoritma apriori. c. Mempersiapkan alat dan bahan penelitian. d. Setelah alat dan bahan penelitian disiapkan, langkah selanjutnya membangun perangkat lunak dengan metodologi Framework for the Aplication of Systems Thinking (FAST). Hasil dari pembangunan perangkat lunak adalah berupa tampilan itemset yang frequent, lengkap dengan nilai minimum support dan minimum confidence yang memenuhi ketentuan user. 3.2 Desain Tabel Adapun tabel dalam pembuatan aplikasi pemodelan pembelian barang dengan algoritma apriori adalah sebagai berikut : a. Tabel Barang Berfungsi untuk menyimpan data barang. Tabel 3.1 Tabel Barang No Nama Field Tipe dan Panjang Field Varchar (20) Varchar (50) Big Integer Varchar (20) Keterangan

1. 2. 3. 4.

KodeBrg NamaBrg HargaBrg KodeKat

Primary Key

b. Tabel Detail Jual, merupakan tabel penyimpanan detail penjualan. Tabel 3.2 Tabel detail jual No Nama Field Tipe dan Panjang Field Integer Varchar (20) Integer Keterangan

1. 2. 3.

No_Detail Kode_Barang No_Jual

Primary Key

c. Tabel Penjualan, berfungsi untuk menyimpan data penjualan. Tabel 3.3 Tabel Penjualan No Nama Field Tipe dan Panjang Field Integer Date Time Big Integer Keterangan

1. 2. 3.

NoJual TglJual BiayaJual

Primary Key

d. Tabel Proses, berfungsi sebagai tabel penyimpanan proses. Tabel 3.4 Tabel Proses No Nama Field Tipe dan Panjang Field Integer Integer Varchar (50) Integer Keterangan

1. 2. 3. 4.

No_Urut NoJual KodeBrg Nilai

Primary Key

e. Tabel Hasil, berfungsi sebagai tabel dalam penyimpanan data hasil. Tabel 3.5 Tabel Hasil No Nama Field Tipe dan Panjang Field Integer Double Precision Double Precision Double Precision Varchar (50) Keterangan

1. 2. 3. 4. 5.

No_Id Support Confidence Support x Confidence Keterangan

Primary Key

3.3 Desain Fisik Adapun desain fisik yang dijelaskan di bab ini adalah desain model tampilan (user interface). Model tampilan atau antar muka program berfungsi sebagai media interaksi antara pemakai dengan aplikasi. Terdapat beberapa rancangan tampilan pada aplikasi tugas akhir ini, yakni sebagai berikut : a. Desain tampilan Login

User Name
Password

: : Login

Gambar 3.1Rancangan Tampilan Login Tampilan login berfungsi untuk menjamin keamanan aplikasi, dimana user pada sistem ini harus melakukan login terlebih dahulu. b. Desain Tampilan Master Data Barang

Kode Barang Nama Barang

: :

Harga Barang : Kode Kategori :

Gambar 3.2 Rancangan Master Data Barang Tampilan master data barang berfungsi sebagai media bagi user untuk menginputkan data barang. c. Desain tampilan Proses algoritma Apriori.

Masukkan batas minimal support

:

Masukkan batas minimal confidence : Masukkan nama barang :
Searching

Gambar 3.3 Rancangan Tampilan Proses Algoritma Apriori.

Tampilan proses berfungsi sebagai media bagi user untuk menginputkan batasan nilai dalam asosiasi antar barang yang diinginkan, yaitu nilai minimum support dan minimum confidence. d. Desain tampilan Laporan Barang Terjual

Cetak

Grafik

Laporan Barang Terjual Tgl Awal : Tgl Akhir : OK Gambar 3.4 Rancangan Tampilan Laporan Barang Terjual Tampilan laporan barang terjual berfungsi sebagai media bagi user untuk mengetahui laporan barang terjual, yang mana hasil laporan dapat ditampilkan dalam data maupun grafik. Pada tampilan ini, user akan memasukkan nilai yang diinginkan, berupa tanggal awal dan tanggal akhir.

4. Hasil dan Pembahasan 4.1 Proses Penelitian Langkah-langkah yang dilakukan dalam pengerjaan tugas akhir “Aplikasi Pemodelan Pembelian Barang dengan Algoritma Apriori” ini adalah sebagai berikut : Membuat database barang beserta data penjualannya. Membuat script PHP untuk pemodelan barang dengan algoritma apriori. Membuat script PHP untuk menampilkan hasil apriori. Pengujian aplikasi.

4.2 Pembahasan Dalam pengujian aplikasi pemodelan pembelian dengan algoritma apriori ini, peneliti menggunakan tiga item sebagai sampel yaitu Teh Celup cap Bendera, Top Coffee dan Susu Frisian Flag dengan batasan nilai minimum support dan minimum confidence yang beragam. Adapun hasil yang ditemukan dalam pengujian aplikasi

adalah berupa kombinasi itemset dengan nilai yang memenuhi batasan nilai minimum dan minimum support seperti keinginan user. Pada pengujian dengan sampel Teh celup bendera, peneliti memasukkan batasan nilai minimum support sebesar 15% dan minimum confidence sebesar 10%. Dari pengolahan apriori dengan nilai tersebut, hasil yang diperoleh adalah kombinasi itemset sebanyak 97 rules yang ditampilkan dengan waktu proses selama 8 detik. Untuk kombinasi itemset dengan 5 item berurut, terdapat 24 rules dengan nilai minimum support paling tinggi sebesar 16,67% dan minimum confidence sebesar 20%. Untuk mempersempit hasil pengolahan, peneliti menguji kembali sampel item Teh Celup cap Bendera dengan menaikkan batasan nilai minimum support dan minimum confidence masing-masing sebesar 30%, dimana hanya terdapat 7 rules yang memenuhi nilai asosiasi, dan diperlukan 6 detik untuk menampilkan 7 rules tersebut. Berikut dapat kita lihat hasil rules yang dimaksud : <Rule>Jika : Teh Celup Cap Bendera 50g maka Top Coffee 10</Rule> <Support>33.3333333333%</Support> <Confidence>40%</Confidence> <Gabungan>13.3333333333%</Gabungan> <Rule>Jika : Teh Celup Cap Bendera 50g maka Gulaku Gula Premium 250g</Rule> <Support>75%</Support> <Confidence>90%</Confidence> <Gabungan>67.5%</Gabungan> <Rule>Jika : Teh Celup Cap Bendera 50g maka Frisian Flag Vanilla 250ml</Rule> <Support>66.6666666667%</Support> <Confidence>80%</Confidence> <Gabungan>53.3333333333%</Gabungan> <Rule>Jika : Teh Celup Cap Bendera 50g maka Top Coffee 10 maka Gulaku Gula Premium 250g</Rule> <Support>33.3333333333%</Support> <Confidence>40%</Confidence> <Gabungan>13.3333333333%</Gabungan>

<Rule>Jika : Teh Celup Cap Bendera 50g maka Gulaku Gula Premium 250g maka Top Coffee 10</Rule> <Support>33.3333333333%</Support> <Confidence>40%</Confidence> <Gabungan>13.3333333333%</Gabungan> <Rule>Jika : Teh Celup Cap Bendera 50g maka Gulaku Gula Premium 250g maka Frisian Flag Vanilla 250ml</Rule> <Support>66.6666666667%</Support> <Confidence>80%</Confidence> <Gabungan>53.3333333333%</Gabungan> <Rule>Jika : Teh Celup Cap Bendera 50g maka Frisian Flag Vanilla 250ml maka Gulaku Gula Premium 250g</Rule> <Support>66.6666666667%</Support> <Confidence>80%</Confidence> <Gabungan>53.3333333333%</Gabungan> Pada pengujian dengan sampel Top Coffee, adapun nilai yang ditetapkan peneliti adalah sebesar 20% masing-masing untuk nilai batas minimum support dan minimum confidence. Jumlah rules yang ditemukan pada pengujian aplikasi dengan sampel top coffee tersebut lebih sedikit dari pengujian sampel teh celup cap bendera, yakni hanya terdapat sebanyak 15 rules yang ditampilkan dalam waktu eksekusi proses selama 6 detik. Sebanyak 6 rules di antaranya adalah kombinasi 4 item dengan nilai minimum support paling besar 25% dan minimum confidence sebesar 37,5%, 6 rules lainnya adalah kombinasi 3 item dengan nilai paling besar 41,66% untuk minimum support dan 62,5% untuk nilai minimum confidence, dan kemudian 3 rules merupakan kombinasi 2 item dengan nilai minimum support tertinggi sebesar 50% dan minimum confidence sebesar 75%. Adapun rules yang dihasilkan adalah sebagai berikut : <Rule>Jika : Top Coffee 10 maka Gulaku Gula Premium 250g</Rule> <Support>50%</Support> <Confidence>75%</Confidence> <Gabungan>37.5%</Gabungan>

<Rule>Jika : Top Coffee 10 maka Frisian Flag Vanilla 250ml</Rule> <Support>41.6666666667%</Support> <Confidence>62.5%</Confidence> <Gabungan>26.0416666667%</Gabungan> <Rule>Jika : Top Coffee 10 maka Teh Celup Cap Bendera 50g</Rule> <Support>33.3333333333%</Support> <Confidence>50%</Confidence> <Gabungan>16.6666666667%</Gabungan> <Rule>Jika : Top Coffee 10 maka Gulaku Gula Premium 250g maka Frisian Flag Vanilla 250ml</Rule> <Support>41.6666666667%</Support> <Confidence>62.5%</Confidence> <Gabungan>26.0416666667%</Gabungan> <Rule>Jika : Top Coffee 10 maka Gulaku Gula Premium 250g maka Teh Celup Cap Bendera 50g</Rule> <Support>33.3333333333%</Support> <Confidence>50%</Confidence> <Gabungan>16.6666666667%</Gabungan> <Rule>Jika : Top Coffee 10 maka Frisian Flag Vanilla 250ml maka Gulaku Gula Premium 250g</Rule> <Support>41.6666666667%</Support> <Confidence>62.5%</Confidence> <Gabungan>26.0416666667%</Gabungan> <Rule>Jika : Top Coffee 10 maka Teh Celup Cap Bendera 50g maka Gulaku Gula Premium 250g</Rule> <Support>33.3333333333%</Support> <Confidence>50%</Confidence> <Gabungan>16.6666666667%</Gabungan> Pada pengujian dengan sampel susu Frisian Flag, untuk batasan nilai minimum support dan minimum confidence yang ditetapkan oleh peneliti adalah masing-masing sebesar 20%. Hasil itemset yang memenuhi nilai batasan support dan confidence sesuai dengan ketentuan peneliti adalah sebanyak 7 rules, dimana 3 rules

merupakan hasil kombinasi 2 item, dan 4 rules lainnya merupakan hasil kombinasi 3 item. Rules “Jika Susu Frisian Flag maka Gulaku Premium 250g” memiliki nilai asosiasi yang paling tinggi, yaitu sebesar 91,67% nilai support dan 52,38% nilai confidence. Rules yang dihasilkan dalam pengujian aplikasi untuk item susu Frisian flag dengan batasan nilai minimum support dan nilai minimum confidence sebesar 20% dapat kita lihat pada gambar 4.1 dan file dengan format xml sebagai berikut. Format xml : <Rule>Jika : Frisian Flag Vanilla 250ml maka Gulaku Gula Premium 250g</Rule> <Support>91.6666666667%</Support> <Confidence>52.380952381%</Confidence> <Gabungan>48.0158730159%</Gabungan> <Rule>Jika : Frisian Flag Vanilla 250ml maka Teh Celup Cap Bendera 50g</Rule> <Support>66.6666666667%</Support> <Confidence>38.0952380952%</Confidence> <Gabungan>25.3968253968%</Gabungan> <Rule>Jika : Frisian Flag Vanilla 250ml maka Gulaku Gula Premium 250g maka Teh Celup Cap Bendera 50g</Rule> <Support>66.6666666667%</Support> <Confidence>38.0952380952%</Confidence> <Gabungan>25.3968253968%</Gabungan> <Rule>Jika : Frisian Flag Vanilla 250ml maka Teh Celup Cap Bendera 50g maka Gulaku Gula Premium 250g</Rule> <Support>66.6666666667%</Support> <Confidence>38.0952380952%</Confidence> <Gabungan>25.3968253968%</Gabungan

Gambar 4.1 Tampilan tabel detil hasil asosiasi item susu Frisian flag

Pada aplikasi pemodelan pembelian barang ini diterapkan rumus untuk mencari nilai support, confidence, dan gabungan sebagai berikut : Support (%) = Jumlah transaksi yang mengandung nilai A dan B *100 Jumlah total transaksi

Confidence (%) = Jumlah transaksi yang mengandung nilai A dan B *100 Jumlah total barang A yang terjual Gabungan (%) = (Support * Confidence)/100 Untuk memperjelas hasil nilai support, confidence, dan gabungan yang dihasilkan dalam proses apriori pada aplikasi, penulis menerapkan rumus yang sudah diterangkan sebelumnya ke dalam contoh perhitungan manual dalam proses apriori dengan batas nilai minsup dan minconf sebesar 30% untuk item susu Frisian Flag (Gambar 4.1). Susu Frisian Flag dengan Gulaku Gula Premium  Support (%) = (11/12) * 100 = (0,9166667) * 100 = 91,67 %  Confidence (%) = (11/21) * 100 = (0,5238) * 100 = 52,38 %  Gabungan (%) = (91,67 * 52,38) / 100 = 48,015 % Susu Frisian Flag dengan Teh Celup Cap Bendera  Support (%) = (8/12) * 100 = (0,66667) * 100 = 66,67 %  Confidence (%) = (8/21) * 100 = (0,38095) * 100 = 38,095 %  Gabungan (%) = (66,67 * 38,095) / 100 = 25,396 % Susu Frisian Flag dan Gulaku Gula Premium dengan Teh Celup Cap Bendera  Support (%) = (8/12) * 100 = (0,66667) * 100 = 66,67 %  Confidence (%) = (8/21) * 100 = (0,38095) * 100 = 38,095 %

 Gabungan (%) = (66,67 * 38,095) / 100 = 25,396 % Susu Frisian Flag dan Teh Celup Cap Bendera dengan Gulaku Gula Premium  Support (%) = (8/12) * 100 = (0,66667) * 100 = 66,67 %  Confidence (%) = (8/21) * 100 = (0,38095) * 100 = 38,095 %  Gabungan (%) = (66,67 * 38,095) / 100 = 25,396 %

Dari pengujian yang sudah dilakukan pada 3 sampel item dengan nilai batasan support dan confidence tersebut, peneliti menemukan bahwa banyak tidaknya data penjualan sangat berpengaruh pada jumlah hasil data yang ditampilkan pada aplikasi. Dengan jumlah data yang semakin besar maka alokasi memori yang dibutuhkan untuk menjalankan proses algoritma apriori pada aplikasi juga semakin besar. Hal ini dikarenakan pada proses apriori, sistem harus melakukan pemindaian ulang database pada setiap iterasinya. Semakin banyak jumlah kombinasi item, maka semakin rendah nilai support dan nilai confidence yang dimiliki itemset. Nilai asosiasi yang dihasilkan nantinya juga bergantung pada banyaknya jumlah data penjualan yang dimasukkan pada database. Persebaran data item pada database penjualan menjadi hal yang perlu diperhatikan dalam penggunaan aplikasi pemodelan penjualan dengan algoritma apriori ini. Untuk mendapatkan hasil frequent itemset yang lebih banyak dan memiliki nilai asosiasi yang tinggi, diperlukan data barang dan data transaksi yang lebih lengkap dan riil. Hasil yang paling penting dari pengerjaan tugas akhir ini adalah bahwa algoritma apriori dapat dipergunakan untuk mendapatkan nilai asosiasi antar barang, dan data penjualan dapat menjadi gambaran umum kebiasaan belanja konsumen, sehingga pengusaha dapat menentukan stok barang apa saja yang perlu diperbanyak

dan dalam menentukan tata letak barang yang berdekatan sesuai dengan jenis maupun kelompok barang yang paling sering dibeli oleh konsumen secara bersamaan. Aplikasi data mining untuk pemodelan pembelian barang dengan menggunakan algoritma apriori ini dapat menghasilkan kombinasi itemset sampai sebanyak 5 buah item dengan nilai asosiasi yang sangat bergantung pada jumlah data barang terjual pada setiap transaksi.

5. Kesimpulan Berdasarkan hasil pengerjaan tugas akhir ini, peneliti menarik beberapa kesimpulan sebagai berikut : a. Algoritma apriori dapat menghasilkan sejumlah komposisi itemset dengan nilai asosiasi yang tinggi berdasarkan banyaknya jumlah data penjualan. b. Semakin banyak data penjualan yang dimasukkan, maka semakin tinggi dan bervariasi juga nilai support, confidence, dan gabungan yang dapat dihasilkan. c. Algoritma apriori dapat dipergunakan dalam kepentingan bisnis (market basket analysis) secara luas, dimana pengusaha dapat mengetahui kombinasi barang belanja yang sering dibeli konsumen secara bersamaan, berdasarkan pengolahan data penjualan.

Daftar Pustaka 1. Agrawal, Rakesh & Srikant, Ramakrishnan, 1994. “Fast Algorithms for Mining Association Rules”. Research Report. IBM Almaden Research Center, San Jose, California, June 1994. 2. Berry, Michael J.A & Linoff, Gordon S. 2004. Data Mining Techniques For Marketing, Sales, Customer Relationship Management Second Editon . Wiley Publishing, Inc. United States of America. 3. Engel, James F., Roger D. Blackwell, & Paul W. Miniard, 1994. Perilaku konsumen. Binarupa Aksara. Jakarta. 4. Erwin, 2009. “Analisis Market Basket Dengan Algoritma Apriori dan FP Growth”. Jurnal Generik Vol. 4 No.2, Juli 2009. (Online) Tersedia : http://eprints.unsri.ac.id/83/1/6-erwin.pdf 5. Han, Jiawei, & Kamber, Micheline, 2000. Data Mining : Concept and Techniques. Morgan Kaufmann Publisher. 6. Ikhsan,Muhammad,dkk, 2007. “Penerapan Association Rule dengan Algoritma Apriori pada Proses Pengelompokan Barang di Perusahaan Retail”. Jurnal. (Online) , Tersedia : http://s3.amazonaws.com/academia.edu.documents/7280024/Penerapan %20Associaton%20Rule%20dengan%20Algoritma%20Apriori.pdf 7. Joel R. Evans and Barry Berman, 2004. Retail Management : A Strategic Approach. Pearson Education International. New Jersey. 8. Larose, Daniel T. 2005. Discovering Knowledge in Data: An Introduction to Data Mining. John Willey & Sons, Inc. New Jersey. 9. Larose, Daniel T, 2006. Data Mining Methods and Models. John Willey & Sons, Inc. New Jersey. 10. Peter, J.Paul & Olson, Jerry C., 1999. Consumer Behavior and Marketing Strategy. McGraw-Hill Companies. Boston. 11. Triyono, Sigit, 2006. Sukses Terpadu Bisnis Ritel. PT Elex Media Komputindo. Jakarta. 12. Wandi, Nugroho dkk, 2012. “Pengembangan Sistem Rekomendasi Penelusuran Buku dengan Penggalian Association Rule menggunakan Algoritma Apriori (Studi Kasus Badan Perpustakaan dan Kearsipan Provinsi Jawa Timur)”. Jurnal Teknik ITS Vol 1, September 2012.