You are on page 1of 12

Jurnal Informatika dan Bisnis

PENERAPAN DATA MINING UNTUK PREDIKSI NILAI TUKAR PETANI TANAMAN


PANGAN DI INDONESIA DENGAN METODE LINEAR REGRESSION
DAN SUPPORT VECTOR MACHINE

Kennardi 1) dan Akhmad Budi 2)


1)
Alumni Program Studi Sistem Informasi
2)
Staff Pengajar Program Studi Teknik Informatika
Institut Bisnis dan Informatika Kwik Kian Gie
Jl. Yos Sudarso Kav.87 Sunter Jakarta Utara 14350
http://www.kwikkiangie.ac.id
akhmad.budi@kwikkiangie.ac.id

ABSTRACT

Development of technology and information systems use data mining as a method of data
processing is growing, due to the large amount of data available and growing every day, especially
agricultural data. One of the benefits that can be obtained by applying information technology,
among others, is to conduct the analysis and prediction of large amounts of data. The exchange value
of food crop farmers (NTPP) is a factor of economic welfare measurement in Indonesia, but quite
difficult to predict because there has not been a proper measurement prediction method for predicting
the data (NTPP) in the future. This research will be carried out to measure the accuracy of data
prediction results using the Linear Regression and Support Vector Machine, with the aim of obtaining
the results of the level of accuracy offered by the two methods.

Key Words: Prediction, Farmers Exchange Rate, Food Crop Farmers Exchange Rate, Data Mining,
Linear Regression, Support Vector Machine, Rapidminer.

1. PENDAHULUAN menyelesaikan berbagai masalah yang


dihadapi. Sehingga sistem pengolahan data
Perkembangan teknologi informasi di era dituntut untuk terus beradaptasi dan mampu
globalisasi telah menjadi hal yang tidak dapat menyelesaikan masalah secara cepat dan
dipisahkan seiring dengan berkembangnya efektif. Salah satu manfaat yang bisa didapat
kehidupan manusia. Semakin bertambahnya dengan menerapkan teknologi informasi antara
jumlah dan kebutuhan pengolahan data di lain adalah melakukan analisis dan prediksi
dunia mengakibatkan perkembangan teknologi data dalam jumlah yang besar. Maka pada
pengolahan data juga semakin pesat karena kesempatan ini penulis melakukan penelitian
permintaan jumlah data yang akan diolah dengan mengukur keakuratan prediksi data
semakin bertambah. Kejadian yang terjadi dengan sampel nilai tukar petani tanaman
setiap waktu dalam kehidupan manusia dapat pangan (NTPP) per provinsi di Indonesia.
diterjemahkan sebagai sebuah fakta, dimana
fakta tersebut kemudian diubah menjadi Menurut wikipedia, Indonesia tercatat
sebuah data yang kemudian diproses menjadi sebagai negara kepulauan terbesar di dunia
sebuah informasi yang memiliki bentuk atau dengan luas wilayah sebesar 1.904.569 km2
pola yang mampu digunakan oleh sebuah dan memliki jumlah penduduk terbesar ke-4 di
sistem. Sehingga untuk pengolahan data dalam dunia yaitu sebanyak 259.966.894 jiwa.
jumlah yang besar dibutuhkan sistem atau Karena hal tersebut maka tidak dapat
metode yang dapat menghasilkan informasi dipungkiri lagi bahwa data dan informasi yang
yang akurat secara efektif dan efisien. dapat diperoleh dari negara Indonesia
sangatlah besar jumlahnya jika dihitung dari
Dalam perkembangannya di berbagai berbagai faktor dan bidang yang saling
bidang, teknologi informasi dibuat agar dapat berkembang di dalamnya. Salah satu bidang
mempermudah dan mempercepat kinerja yang memiliki data dengan jumlah yang besar
manusia dalam kehidupan sehari-hari dalam di Indonesia adalah bidang pertanian.

12
Jurnal Informatika dan Bisnis

daerah tersebut perlu ditingkatkan agar


Sektor pertanian merupakan salah satu distribusi secara nasional dapat tercapai secara
sektor yang sangat berkembang di Indonesia. efektif dan tidak terjadi penyimpangan jumlah
Perkembangan ini dilandaskan karena tanaman pangan. Penghitungan NTPP secara
Indonesia merupakan negara dengan iklim umum dilakukan dengan cara membandingkan
tropis yang sangat mendukung kegiatan IT (indeks diterima) dan IB (indeks dibayar).
bercocok tanam. Karena hal tersebut maka
kebutuhan untuk memproses data pertanian di Tentu saja dalam pengelolaan data
Indonesia dilakukan secara berkala untuk pertanian dan penghitungan NTPP ada
menemukan data indeks nilai tukar petani beberapa kesulitan yang muncul, yaitu antara
(NTP). lain adalah kesulitan memprediksi nilai NTPP
menggunakan metode konvensional karena
Data indeks nilai tukar pertanian di data IT dan IB diperoleh berdasarkan survey
Indonesia dikumpulkan dan dihitung melalui dan pendataan langsung yang memakan
Badan Pusat Statisik (BPS) yaitu lembaga banyak waktu, sehingga penghitungan prediksi
pemerintah non kementerian yang bertanggung yang dilakukan harus menunggu sampai
jawab langsung kepada presiden untuk pendataan nasional selesai dilakukan. Serta hal
mengumpulkan data tentang berbagai bidang tersebut menyebabkan tidak diketahuinya data
di Indonesia untuk kebutuan pemerintah dan testing dalam periode tertentu yang paling
publik. Data yang dikumpulkan dari BPS akurat untuk memprediksi hasil NTPP di masa
tersebut dapat diakses melalui situs resmi BPS depan.
yaitu http//bps.go.id atau melalui portal data
publik indonesia yaitu http//data.go.id. Data Masalah lain yang timbul adalah karena
indeks NTP yang dikumpulkan oleh BPS belum adanya metode prediksi yang digunakan
memiliki keakuratan yang tinggi karena untuk memprediksi nilai NTPP selain
dikumpulkan berdasarkan data tiap provinsi menunggu hasil survey dan pencatatan metode
yang dilakukan dengan melakukan observasi konvensional yang biasa digunakan BPS.
langsung ke lapangan dan menggunakan
tenaga ahli statistik dalam pengumpulan dan Oleh karena itu dalam penelitan karya
penghitungannya akhir ini penulis melakukan penelitian dengan
cara memprediksi jumlah nilai NTPP dengan
Nilai tukar petani (NTP) merupakan salah menggunakan metode Linear Regression dan
satu indikator yang sangat penting karena Support Vector Machine untuk mengukur
mengukur seberapa besar tingkat metode yang paling akurat untuk digunakan
kesejahteraaan seorang petani akan hasil sebagai dasar metode prediksi NTPP di masa
tanaman yang dikelolanya. Dengan depan jika dibutuhkan. Hal ini juga dilandasi
tersedianya banyak jenis tanaman dalam karena belum adanya penelitian pengukuran
kegiatan pertanian di Indonesia maka akurasi prediksi NTPP untuk membandingkan
penelitian penulis kali ini berfokus pada indeks hasil prediksi metode Linear Regression dan
nilai tukar tanaman pangan (NTPP) per Support Vector Machine.
provinsi di Indonesia. Indonesia sebagai
negara dengan jumlah penduduk yang besar 2. LANDASAN TEORI
memiliki kebutuhan pangan yang sangat besar
pula sehingga kebutuhan dan kualitas tanaman 2.1 Sistem Informasi
pangan perlu diperhatikan agar pengelolaan
dan distribusinya dapat terjangkau dan tertata Sistem informasi dapat merupakan
dengan baik. kombinasi teratur apa pun dari orang-
orang, hardware, software, jaringan
Pengelolaan sumber daya pertanian komunikasi, dan sumber daya data yang
terutama tanaman pangan sangat bergantung mengumpulkan , mengubah, dan
dengan nilai tukar petani tanaman pangan menyebarkan, informasi, dalam sebuah
(NTPP) yang menunjukkan indeks organisasi [10]. Pendapat lain mengatakan
kesejahteraan petani, sehingga jika angka bahwa sistem informasi adalah
NTPP menunjukkan angka yang rendah maka seperangkat unsur yang saling terkait atau
peningkatan kualitas tanaman pangan di komponen yang mengumpulkan (input),

13
Jurnal Informatika dan Bisnis

memanipulasi (proses), menyimpan, dan 2. Mining Frequent Patterns


menyebarkan (output) data dan informasi Associations, and Correlations
dan memberikan reaksi (mekanisme (Penggalian pola yang sering muncul :
umpan balik) korektif untuk memenuhi asosiasi dan korelasi) : Meneliti pola
tujuan [9]. yang sering terjadi di data. Fungsi
terdiri dari :
2.2 Data a. Associations (Asosiasi) : Pola
dimana suatu variabel memiliki
Data adalah sebuah fakta mentah [9] confidence (tingkat keyakinan)
atau aliran fakta mentah yang mewakili dengan variabel lain dan support
peristiwa yang terjadi dalam organisasi (tingkat pendukung) dimana
atau lingkungan fisik sebelum diatur dan variabel memiliki pola yang sama.
disusun menjadi bentuk yang dapat b. Correlations (Korelasi) : Tingkat
dipahami dan digunakan [8]. hubungan yang dimiliki oleh suatu
variabel dengan variabel lain.
2.3 Database
3. Classifications and Regression for
Database merupakan koleksi Predictive Analysis (Klasifikasi dan
terorganisir dari fakta-fakta dan informasi, regresi untuk analisis prediksi) :
biasanya terdiri dari dua atau lebih terkait a. Classification (Klasifikasi) : adalah
file data [9]. proses menemukan model (atau
fungsi) yang menggambarkan dan
2.4 Data Mining membedakan kelas data atau
konsep.
Menurut [6] data mining adalah b. Regression (Regresi) : adalah
adalah proses menemukan pola yang proses untuk mengestimasi
menarik dan pengetahuan dari sejumlah hubungan antara variabel.
besar data atau data mining adalah istilah 4. Cluster analysis (Analisis klaster)
yang mengacu pada penggunaan algoritma : pengelompokan analisis objek
dan komputer untuk menemukan novel data tanpa konsultasi label kelas.
dan pola menarik dalam data [11].
Sedangkan menurut [8] ada beberapa
2.5 Jenis-jenis Data Mining macam informasi yang dapat kita
dapatkan dengan melakukan pengolahan
Menurut [6] ada beberapa jenis data dalam data mining yaitu antara lain :
fungsionalitas database yang dapat yang 1. Association/Asosiasi : Association
dapat dilakukan dalam pengolahan data adalah kejadian terkait dengan
antara lain adalah : peristiwa tunggal. Misalnya, sebuah
1. Class/Concept Description: Chara- studi dari pola pembelian supermarket
cterization and Discrimina- mungkin mengungkapkan bahwa,
tion(Deskripsi kelas/konsep : ketika chip jagung dibeli, minuman
karakterisasi dan diskriminasi) : cola dibeli sebanyak 65 persen dari
Entri data yang dapat dikaitkan dengan waktu ke waktu tetapi ketika ada
kelas atau konsep. Fungsi ini terdiri promosi, cola dibeli sebanyak 85
dari : persen dari waktu ke waktu . Informasi
a. Data Characterization (Karak- ini membantu manajer membuat
terisasi Data) : adalah ringkasan keputusan yang lebih baik karena
dari karakteristik umum atau fitur mereka telah belajar profitabilitas
dari kelas target data. promosi.
b. Data Discrimination (Diskriminasi 2. Sequences/Pengurutan : Sequences
Data) : adalah perbandingan fitur adalah peristiwa terkait dari waktu ke
umum dari objek data kelas sasaran waktu. Kita mungkin menemukan,
terhadap fitur umum objek dari satu misalnya, bahwa jika seseorang
atau beberapa kelas yang kontras. membeli rumah, maka kulkas baru
akan dibeli dalam waktu dua minggu

14
Jurnal Informatika dan Bisnis

sebanyak 65 persen dari waktu ke Understanding (Pemahaman bis-


waktu dan oven akan dibeli dalam nis/organisasi) : Tahap pemahaman
waktu satu bulan dari pembelian sistem yang berjalan dan kebutuhan
rumah sebanyak 45 persen dari waktu apa yang dibutuhkan dalam
ke waktu . menyelesaikan masalah yang timbul
3. Classfication/klasifikasi : didalamnya.
Classification mengakui pola yang 2. Data Understanding (Pemahaman
menggambarkan kelompok yang data) : Tahap pemahaman dan
dimiliki oleh sebuah item dengan pengumpulan data yang dibutuhkan
memeriksa item yang ada yang telah untuk sebelum dilakukan persiapan
diklasifikasikan dengan menyimpul- untuk analisa. Pada tahap ini data yang
kan seperangkat aturan. Misalnya, dikumpulkan harus merupakan data
bisnis seperti kartu kredit atau telepon yang tepat digunakan untuk proses
perusahaan khawatir tentang hilangnya penelitian dan mewakili masalah yang
pelanggan tetap. Klasifikasi membantu akan dipecahkan serta sesuai dengan
menemukan karakteristik pelanggan kebutuhan dan kepentingan.
yang cenderung untuk pergi dan dapat 3. Data Preparation (Persiapan data) :
memberikan model untuk membantu Tahap persiapan dan seleksi data yang
manajer memprediksi siapa orang telah dikumpulkan dan diubah menjadi
pelanggan sehingga manajer dapat bentuk yang dapat diolah dalam model
merancang kampanye khusus untuk yang ditentukan selanjutnya.
mempertahankan pelanggan tersebut. 4. Modeling (Pemodelan) : Proses analisa
4. Clustering/segmentasi : Clustering dan pemodelan data yang telah
bekerja dalam cara yang mirip dengan disiapkan dimana dalam ini dilakukan
klasifikasi ketika ada kelompok yang penerapan atau penghitungan ber-
belum ditentukan. Sebuah alat data dasarkan algoritma atau metode yang
mining dapat menemukan kelompok ditentukan untuk mendapatkan hasil
yang berbeda dalam data, seperti yang diinginkan sesuai dengan ke-
menemukan kelompok afinitas untuk butuhan pengguna dan melakukan
kartu bank atau partisi database ke representasi pemecahan masalah.
dalam kelompok pelanggan 5. Evaluation (Evaluasi) : Melakukan
berdasarkan demografi dan jenis analisa dan evaluasi dari hasil model
investasi pribadi yang telah dibuat apakah sudah sesuai
5. Forecasting/Prediction/prediksi : standar dan telah memecahkan
Forecasting menggunakan prediksi masalah atau memenuhi kebutuhan
dengan cara yang berbeda. Mengguna- dari pengguna.
kan serangkaian nilai-nilai yang ada 6. Deployment (Penerapan) : Tahap
untuk meramalkan nilai-nilai lainnya penerapan hasil dari model yang telah
yang akan terjadi. Misalnya, peramal- dievaluasi dan dianalisa untuk
an mungkin menemukan pola dalam kemudian dijadikan bentuk yang dapat
data untuk membantu manajer diolah kembali.
memperkirakan nilai masa depan dari
variabel kontinu, seperti angka
penjualan.

2.6 Tahap-tahap Data Mining

Tahapan dalam data mining terbagi


dalam beberapa langkah yang disebut
CRISP-DM (CRoss-Industry Standard Gambar 1. Tahapan data mining
Process for Data Mining) [1] yaitu antara (CRISP-DM)
lain adalah :
Dalam penerapannya data mining
1. Business adalah sebuah siklus yang terbagi dalam 6
Understanding/Organizational tahap yang disebut CRISP-DM (CRoss-

15
Jurnal Informatika dan Bisnis

Industry Standard Process for Data Mining) b. Plan Monitoring and


[5] yaitu : Maintenance (Pemantauan dan
pemeliharaan rencana).
1. Business Understanding (Pemahaman c. Produce Final Report
bisnis) : (Menghasilkan laporan akhir).
a. Determining Business Objectives d. Review Project (Tinjauan ulang
(Menentukan tujuan bisnis). proyek).
b. Assess Situation (Menilai situasi).
c. Determining Data Mining Goals 2.7 Linear Regression
(Menentukan tujuan penambangan
data). Menurut [3].Linear Regression adalah
d. Produce Project Plan (Membuat menemukan persamaan garis yang
rencana proyek). berhubungan antara satu variabel dengan
yang lain. Data mining menggunakan
2. Data Understanding (Pemahaman persamaan ini bertujuan untuk
data) : memprediksi nilai satu variabel
a. Collect Initial Data (Mengumpul- berdasarkan nilai lain.
kan data utama).
b. Describe Data (Mendeskripsikan 2.8 Support Vector Machine
data).
c. Explore Data (Menjelajah data). Support Vector Machine (SVM)
d. Verfiy Data Quality (Verifikasi adalah metode klasifikasi berdasarkan
kualitas data). diskriminan marjin linear maksimum,
yaitu, tujuannya adalah untuk menemukan
3. Data Preparation (Persiapan data) : hyperplane optimal yang memaksimalkan
a. Select Data (Memilih data). celah atau marjin antara kelas [7].
b. Clean Data (Pembersihan data).
c. Construct Data (Membang- 3. METODOLOGI PENELITIAN
un/membentuk data).
d. Intergrate Data (Menggabungkan 3.1 Teknik Pengumpulan Data
data).
e. Format Data (Memformat data). Dalam penelitian ini data yang
digunakan adalah data sekunder dari nilai
4. Modeling (Pemodelan) : tukar petani tanaman pangan yang diambil
a. Select Model Techniques dari http://data.go.id/ berdasarkan survey
(Memilih teknik pemodelan data). dan pendataan yang dilakukan oleh Badan
b. Generate Test Design Pusat Statistik (BPS).
(Menghasilkan uji desain).
c. Build Model (Membangun Dalam pengumpulan data penulis
model). menggunakan metode kuantitatif yaitu
d. Assess Model (Evaluasi/penilaian penelitian ilmiah yang sistematis terhadap
model). bagian-bagian dan fenomena serta
hubungan-hubungannya. Tujuan penelitian
5. Evaluation (Evaluasi) : kuantitatif adalah mengembangkan dan
a. Evaluate Results (Evaluasi hasil). menggunakan model-model matematis,
b. Review Process (Tinjauan ulang teori-teori dan/atau hipotesis yang berkait-
proses). an dengan fenomena alam. Proses
c. Determine Next Steps (Penentuan pengukuran adalah bagian yang sentral
langkah selanjutnya). dalam penelitian kuantitatif karena hal ini
memberikan hubungan yang fundamental
6. Deployment (Penerapan) antara pengamatan empiris dan ekspresi
a. Deployment Plan (Penerapan matematis dari hubungan-hubungan
rencana). kuantitatif.
3.2 Teknik Analisis Data

16
Jurnal Informatika dan Bisnis

Teknik analisis data yang diguna-kan


penulis dalam penelitian ini adalah teknik
yang didasarkan pada metode CRISP-DM
(CRoss-Industry Standard Process for E = Data Aktual – Data Prediksi
Data Mining). n = Jumlah Data

Mean Absolute Error (MAE) :

E = Data Aktual – Data Prediksi


n = Jumlah Data

Mean Percentage Error (MPE) :

Gambar 2. Data mining cycle


(CRISP-DM) E = Data Aktual – Data Prediksi
n = Jumlah Data
3.3 Teknik Pengukuran A = Data Aktual

Pengukuran Akurasi Metode Prediksi : Mean Absolute Percentage Error


(MAPE) :
Pengukuran kelayakan metode
prediksi penulis menggunakan rumus Root
Mean Squared Error untuk menentukan
tingkat kesalahan prediksi data
berdasarkan pengaruh dari tiap variabel :
E = Data Aktual – Data Prediksi
n = Jumlah Data
A = Data Aktual

= Data Prediksi 3.4 Teknik Perancangan GUI


= Data Aktual
Perancangan dan pengembangan GUI
= Jumlah Data
akan dilakukan dengan terlebih dahulu
Pengukuran Penyimpangan Prediksi : melakukan analisa data dari tahun 2008-
2013 yang diperoleh sebagai data training
Untuk mengukur penyimpangan data dan data tahun 2014 sebagai data testing
prediksi penulis melakukan pencarian rata- untuk dilakukan proses prediksi dalam
rata kesalahan (Mean Error), rata-rata RapidMiner. Sehingga diperoleh data
kesalahan absolut (Mean Absolute Error), prediksi dan aktual hasil menggunakan
rata-rata persentase kesalahan (Mean metode Linear Regression dan Support
Percentage Error), dan rata-rata persetase Vector Machine.
kesalahan absolut (Mean Absolute
Percentage Error) . Kemudian penulis akan meng-
implementasikan hasil prediksi dan analisa
Mean Error (ME) : tersebut kedalam Microsoft Access 2013
untuk kemudian melakukan perancangan
GUI sederhana yang didalamnya terdapat
proses penghitungan penyimpangan ke-

17
Jurnal Informatika dan Bisnis

akuratan prediksi dan menghasilkan gunakan aplikasi Rapidminer 5.3 sebagai


laporan komparasi data prediksi dan aktual aplikasi pengolahan dan prediksi data yang
secara sistematis dan siap diberikan pada dibutuhkan. Proses tersebut terdiri dari :
pembaca untuk diteliti dan dipelajari lebih
lanjut sesuai dengan metode yang 1. Pengujian Data Prediksi :
dilakukan oleh penulis. a. Import Dataset (Memasukkan
Dataset)
4. HASIL DAN PEMBAHASAN b. Process Building (Pembangunan
Alur Proses):
4.1 Rancangan Sistem
2. Pengujian Data Prediksi :
Penulis melakukan perancangan 3. Pengujian Error Margin
sistem informasi berupa GUI (Graphic (Penyimpangan Prediksi)
User Interface). Rancangan ini
diperuntukkan untuk para pembaca dan 4.3 Rancangan Basis Data
pengguna aplikasi untuk memudahkan
proses pengujian keakuratan prediksi Setelah data dan pengukuran hasil
NTPP (Nilai Tukar Tanaman Pangan) prediksi didapat tahap selanjutnya adalah
menggunakan Data Mining dengan menerapkan data dan hasil analisa tersebut
metode Linear Regression dan Support ke dalam GUI (Graphical User Interface)
Vector Machine dan menghitung seberapa untuk memudahkan pembaca melihat hasil
besar error margin dari hasil pengujian penelitian yang telah dilakukan.
tersebut. Perancangan GUI dilakukan Perancangan GUI yang dilakukan
dengan menggunakan aplikasi Microsoft menggunakan aplikasi Microsoft Access
Access 2013. 2013 untuk menghasilkan tampilan GUI
yang simpel dan mudah dilihat oleh
4.2 Rancangan Basis Data pembaca. Dalam penerapan sistem GUI
penulis melakukan beberapa langkah yaitu
Sebelum implementasi GUI dilakukan, :
akan dilakukan proses prediksi data untuk
memperoleh data prediksi dengan meng- 1. Input Data Prediksi
gunakan algoritma Linear Regression dan 2. Proses Implementasi GUI
Support Vector Machine. Penulis meng- 3. Spesifikasi Sistem

Tabel 1
Perbandingan root_mean_squared_error

Metode Prediksi
Dataset Linear Regression SVM
2008-2012 root_mean_squared_error root_mean_squared_error
(5 Tahun) 0.667 +/- 0.057 (mikro: 0.670 +/- 0.000) 0.676 +/- 0.063 (mikro: 0.679 +/- 0.000)
2009-2012 root_mean_squared_error root_mean_squared_error
(4 Tahun) 0.603 +/- 0.051 (mikro: 0.605 +/- 0.000) 0.616 +/- 0.052 (mikro: 0.618 +/- 0.000)
2010-2012 root_mean_squared_error root_mean_squared_error
(3 Tahun) 0.562 +/- 0.046 (mikro: 0.564 +/- 0.000) 0.590 +/- 0.064 (mikro: 0.594 +/- 0.000)
2011-2012 root_mean_squared_error root_mean_squared_error
(2 Tahun) 0.507 +/- 0.071 (mikro: 0.512 +/- 0.000) 0.524 +/- 0.106 (mikro: 0.535 +/- 0.000)
2012 root_mean_squared_error root_mean_squared_error
(1 Tahun) 0.485 +/- 0.062 (mikro: 0.489 +/- 0.000) 0.508 +/- 0.078 (mikro: 0.514 +/- 0.000)

18
Jurnal Informatika dan Bisnis

Tabel 2
Perbandingan Tingkat Akurasi

Metode Prediksi
Dataset
Linear Regression SVM
2008-2012 ME: -0.012900 ME : -0.134426
(5 Tahun) MAE : 1.318584 MAE : 1.211442
MPE : 0.185549 % MPE : 0.040930 %
MAPE : 1.356569 % MAPE : 1.233014 %
2009-2012 ME : 0.008110 ME : -0.113280
(4 Tahun) MAE : 1.198826 MAE : 1.087869
MPE : 0.187115 % MPE : 0.041696 %
MAPE : 1.235498 % MAPE : 1.107403 %
2010-2012 ME : 0.085838 ME : 0.013348
(3 Tahun) MAE : 1.074489 MAE : 0.95016
MPE : 0.245976 % MPE : 0.149942 %
MAPE : 1.115297 % MAPE : 0.979364 %
2011-2012 ME : 0.033387 ME : 0.047569
(2 Tahun) MAE : 0.911892 MAE : 0.794807
MPE : 0.163237 % MPE : 0.154469 %
MAPE : 0.943717 % MAPE : 0.828507 %
2012 ME : 0.037694 ME : 0.077018
(1 Tahun) MAE : 0.756582 MAE : 0.677481
MPE : 0.136503 % MPE : 0.156788 %
MAPE : 0.789332 % MAPE : 0.719025 %

19
Jurnal Informatika dan Bisnis

Gambar 3. Form Menu Utama

Gambar 4. Form Sub Menu

20
Jurnal Informatika dan Bisnis

Gambar 5. Form Sub Menu 2

Gambar 6. Report Data Prediksi

Gambar 7 Form data penghitungan prediksi

21
Jurnal Informatika dan Bisnis

4.4 Implikasi Penelitian 4. Dalam penelitan yang dilakukan hasil


dari pengukuran prediksi akurasi,
Penelitian ini memberikan implikasi diperoleh fakta bahwa metode Support
bagi institusi yaitu dalam penelitian ini Vector Machine memiliki nilai error
adalah BPS (Badan Pusat Statistik), antara margin yang lebih kecil dibanding
lain : Linear Regresssion sehingga tingkat
akurasi metode tersebut lebih cocok
1. Menyediakan hasil penelitian analisa untuk digunakan.
dan prediksi NTPP selain
menggunakan metode konvensional. 6. REKOMENDASI
2. Menerapkan metode prediksi NTPP
menggunakan metode Linear Dalam pembuatan penelitian karya
Regression dan Support Vector akhir ini penulis sekiranya memberi saran
Machine. lanjutan untuk para pembaca untuk
3. Menyediakan hasil laporan dipertimbangkan antara lain :
perbandingan antara data prediksi dan
data aktual untuk dijadikan 1. Hasil data prediksi yang diperoleh
pertimbangan dalam pengolahan data oleh penulis dari penelitian ini
NTPP di masa depan. dilakukan berdasarkan prediksi dari
data dengan record yang besar untuk
5. SIMPULAN memprediksi record yang kecil, maka
disarankan untuk menggunakan teknik
Berdasarkan penelitian mengukur sebaliknya untuk mendapatkan hasil
keakuratan prediksi NTPP menggunakan referensi yang lebih tepat sebagai
metode Linear Regression dan Support pembanding penelitan selanjutnya.
Vector Machine penulis menyimpulkan hal-
hal berikut : 2. Penghitungan prediksi menggunakan
Support Vector Machine masih sangat
1. Hasil penelitian memberikan sulit jika dilakukan secara manual,
kemudahan dalam memprediksi data karena bentuk algoritma yang rumit
karena proses prediksi dilakukan dengan dibandingkan dengan Linear Regres-
menggunakan metode Linear sion. Jika ada penelitian selanjutnya
Regression dan Support Vector Machine yang menggunakan algoritma yang
berdasarkan data IT, IB, dan NTPP sama disarankan untuk mencantumkan
tahun lalu, sehingga waktu yang penghitungan secara manual sebagai
dibutuhkan untuk memproses data referensi hasil prediksi yang lebih
prediksi relatif lebih singkat. akurat.

2. Diperolehnya data testing yang paling 3. Rancangan GUI yang dibuat oleh
akurat untuk memprediksi nilai NTPP penulis sengaja dibuat secara simpel
berdasarkan penelitan yang dilakukan agar mudah dimengerti dan tidak
selama 5 periode yaitu data prediksi memakan waktu karena implementasi
dengan data tahun 2012 sebagai algoritma dilakukan dengan segera,
predictor untuk metode Linear maka bila dirasa kurang memuaskan
Regression dan Support Vector Machine dapat dikembangkan atau ditambah-
. kan sesuai keinginan pengembang
3. Penggunaan metode Linear Regression selanjutnya agar tampilan GUI dapat
dan Support Vector Machine untuk lebih diperbaiki.
memprediksi nilai NTPP yang terbukti
akurat dalam menentukan nilai NTPP, 4. Sebagaimana sebuah penelitan,
Sehingga kedua metode tersebut layak metode dan hasil yang diperoleh dari
dipertimbangkan sebagai metode penelitian ini tidaklah menjadi sebuah
prediksi selain menggunakan metode hal yang ”baku”, karena itu hasil
konvensional. penelitan ini dapat saja diperbaharui di
masa depan oleh peneliti selanjutnya

22
Jurnal Informatika dan Bisnis

agar dapat menemukan metode dan [7] J. Zaki, Mohammed dan Wagner
hasil yang lebih efektif. Meira JR (2014), Data Mining and
Analysis Fundamentals Concepts and
Algorithms, New York : Cambridge
7. DAFTAR PUSTAKA University Press.

[1] A.North, Matthew (2012), Data [8] Laudon, Kenneth C. dan Jane P.
Mining for the Masses, Edisi ke-1, Laudon, (2012), Management
Georgia : Global Text Project. Information Systems:Managing the
Digital Firm, Edisi ke-12, New Jersey
[2] Apriyanti Ira (2003), Skripsi : Analisis : Pearson Prentice Hall.
Nilai Tukar Petani Di Sumatra
Utara,Universitas Sumatra Utara, [9] M.Stair, Ralph dan George W.
Medan. Reynolds (2012), Fundamentals of
Information Systems, Edisi ke-6,
[3] Brown, Meta S. (2014), Data Mining Boston : Cengage Learning.
For Dummies, New Jersey : John
Wiley & Sons, Inc.
[10]O.Brien, James A. (2010),
[4] Carneiro da Rocha, Bruno (2010), Management Information System,Edisi
Identifying Bank Frauds Using ke-15, New York: Mc Graw Hill
CRISP-DM and Decision Trees, Irwin.
International journal of computer
science & information Technology [11]Stanton, Jeffrey dan Robert W. De
(IJCSIT) Vol.2, No.5. Graaf , Version 3 : An Introduction to
Data Science, New York : Creative
[5] Erskine, Joseph R. (2010), Tesis : Commons.
Developing Cyberspace Data
Understanding : Using CRISP-DM for [12]Suhendar Asep (2013), Skripsi :
Host-based IDS Feature Mining, Analisis Faktor-faktor yang
USAF, Ohio. Memengaruhi Nilai Tukar Petani
Tanaman Pangan di Kawasan Barat
[6] Han, Jiawei et al (2012), Data Mining Indonesia (Periode Tahun 2008-2010),
Concepts and Techniques, Edisi ke- Bogor Agricultural University, Bogor.
3,Waltham, Elsevier Inc.

23

You might also like