You are on page 1of 4

Laporan Praktikum Data Mining dan Data Warehouse – Pertemuan 4

Andra Dwi Ramadhan


20SA2049
SI20C

Domain Praktikum
Support Vector Machine (SVM) merupakan salah satu metode dalam supervised learning yang
biasanya digunakan untuk klasifikasi (seperti Support Vector Classification) dan (Support Vector
Regression). Dalam pemodelan klasifikasi, regres SVM memiliki konsep yang lebih matang dan
lebih jelas secar matematis dibandingkan dengan teknik-teknik klasifikas lainnya. SVM juga dapat
mengatasi masalah klasifikasi dan regresi dengan linear maupun non linear.

Business Understanding
Menjelaskan proses klarifikasi masalah. Bagian laporan ini mencakup:

1. Problem Statements (pernyataan masalah)


- Berapa banyak kendaraan yang terjual.
- Klasifikasi apa saja yang ada di kendaran

2. Goals (tujuan)
Untuk menjawab pertanyaan pada “problem statements” di atas, berikut tujuan dari
dibuatnya proyek ini:
- Mengetahui berapa kendaraan yang tejual
- Apa saja yg ada di kendaraan

3. Solutions Statements
Untuk pra-pemrosesan data dapat dilakukan beberapa teknik, antara lain:

- Mengumpulkan data
- Melakukan “pembagian” dataset menjadi dua bagian dengan persentase 80% untuk
data latih dan 20% untuk data uji
Data Understanding

Data yang digunakan pada project ini :

Data Preparation

Berikut adalah tahapan pra-pemrosesan data seperti yang telah dijelaskan pada “solution
statements”:

- Mengumpulkan data mengumpulkan data adalah salah satu solusi untuk mengatasi
“missing value”.
- Melakukan “pembagian” dataset menjadi dua bagian dengan persentase 80% untuk
data latih dan 20% untuk data uji.
Pada proses pengujian model, maka perlu dilakukan pembagian dataset menjadi dua atau
tiga bagian. Pada proyek ini dilakukan dua bagian saja yakni pada data latih dan data uji.
Data latih terbagi dengan rasio 80% dari data asli, dimana dilakukan sepenuhnya untuk
melatih model, sedangkan data uji terbagi dengan rasio 20% dari data asli merupakan
data yang belum pernah dilihat oleh model dan diharapkan model dapat memiliki
performa yang sama baiknya pada data uji seperti pada data latih. Karena pada data set
tersebut bersifat “univariate”, cara membagi data tersebut dengan membuat batasan
data yang dijangkau.

Modeling and Result


Setelah melakukan pra-pemrosesan data yang baik pada tahap modeling akan dilakukan dua
hal, yakni tahap pembuatan model “baseline” dan pembuatan model yang dikembangkan.

- Model “Baseline”
Pada tahap ini saya membagi data menggunakan modul Partitioning dimana data di bagi
dengan rasio 80% dan 20%. Data 20% dari data asli di uji model menggunakan SVM leaner
dan diharapkan model dapat memiliki performa yang sama baiknya pada data uji seperti
pada data latih.
- Model yang dikembangkan
Kemudian setelah data dibagi di Partitioning, dan di uji oleh SVM leaner agar dapat bekerja
lebih optimal lagi maka digunakan sebuah fungsi untuk mencari prediksi dengan
menambahkan SVM predictor untuk melihat prediksi. Hasilnya dapat kita lihat pada
gambar berikut ini:
Evalution
Pada proyek ini bisa kita simpulkan pada gambar tersebut hasil dari prediksi
menggunakan algoritma SVM yaitu 69,075%.

You might also like