You are on page 1of 18

Perbandingan

Penggunaan Jenis Algoritma Datamining


Regresi vs ➢ Time Series
➢ Klasifikasi
Perbedaan
• In time series, forecasting seems to mean to estimate a future values given past
values of a time series. In regression, prediction seems to mean to estimate a value
whether it is future, current or past with respect to the given data.
• Time-series forecast is Extrapolation. Regression is Intrapolation. Time-series
refers to an ordered series of data. Time-series models usually forecast what comes
next in the series - much like our childhood puzzles where we extrapolate and fill
patterns.
• Classification is used when the output variable is a category such as “red” or “blue”,
“spam” or “not spam”. It is used to draw a conclusion from observed values.
Differently from, regression which is used when the output variable is a real or
continuous value like “age”, “salary”, etc
• Classification is the task of predicting a discrete class label. Regression is the task of
predicting a continuous quantity
• etc

Page 2
Persamaan
• Regresi, Time series dan Klasifikasi sama-sama membutuhkan atribut
class/target/output pada dataset nya, atau dengan isitilah lain disebut
algoritma pembelajaran terbimbing (supervised Learning).

• Supervised learning is a machine learning approach that's defined by its use


of labeled datasets. These datasets are designed to train or “supervise”
algorithms into classifying data or predicting outcomes accurately. Using
labeled inputs and outputs, the model can measure its accuracy and learn
over time.

Page 3
Regresi vs ➢ Time Series
➢ Klasifikasi

Page 4
Ingat Tentang Supervised Learning (Review)

Page 5
Regresi vs Time Series

Page 6
Apa perbedaan Penggunaan Algoritma :
Regresi dan Time Series
pada Data Mining ?

• Perbedaan dari sisi struktur dataset yang dibutuhkan.


• Perbedaan dari segi tujuan/fungsi.

Page 7
Regresi vs Klasifikasi

Page 8
Apa perbedaan Penggunaan Algoritma :
Regresi dan Klasifikasi
pada Data Mining ?

• Perbedaan dari sisi struktur dataset yang dibutuhkan.


• Perbedaan dari segi tujuan/fungsi.

Page 9
Apa itu Dataset ?

Page 10
Review Tentang Dataset
• A data set is a collection of related, discrete items of related data that may be
accessed individually or in combination or managed as a whole entity. A data
set is organized into some type of data structure.
• Dataset ada yang Terstruktur (Structured Dataset) dan ada yang Tidak
Terstruktur (Unstructured Dataset)
• Data yang terstruktur berbentuk tabular (tabel) dalam format : csv, json atau
xml. Paling umum dalam format csv.
• Dataset tersebut umumnya dijadikan 1 file dan berasal dari satu kasus
sehingga memungkinkan terjadinya redundansi.

Page 11
Beberapa Istilah pada Dataset

• Feature
• Target
• Row

Page 12
Type data pada Dataset

Page 13
Contoh Dataset (1)

Page 14
Contoh Dataset (2)

Page 15
Darimana Dataset berasal ?
• Dari database sumber kasus (private)
• Dari sumber dataset public (Kaggle, UCI, …)

Dataset tidak boleh dikarang-karang sendiri.


Kenapa ?

Page 16
Berapa banyak features dan rows dataset yang baik ?

• Feature = Atribut = kolom


• Rows = record = baris

Dataset yang digunakan harus mewakili (dapat merepresentasikan) populasi yang


akan dianalisa (digeneralisir polanya)

Page 17
TUGAS
• Buat uraian syarat type atribut dataset untuk masing-masing algoritma :
1. Regresi
2. Time Series
3. Klasifikasi

Tulis kembali persamaan dan perbedaannya !

• Cari (buat contoh) masing-masing 3 dataset yang sesuai untuk digunakan oleh
ketiga algoritma di atas !

• Mencari yang termasuk jenis algoritma Regresi, Time Series dan Klasifikasi, masing-
masing paling sedikit 10 !

Page 18

You might also like