Professional Documents
Culture Documents
Analisis Teknik Klasifikasi Data Menggunakan Algoritma Bagging (Ensemble Learning) Untuk Peramalan Cuaca
Analisis Teknik Klasifikasi Data Menggunakan Algoritma Bagging (Ensemble Learning) Untuk Peramalan Cuaca
ABSTRAK
Sejarah Artikel
Diterima : Rabu, 05 Januari 2022
Prakiraan atau ramalan cuaca adalah pengunaan ilmu dan teknologi untuk memperkiraan
keadaan atmosfer Bumi pada masa datang untuk suatu tempat tertentu. Tujuan dari Disetujui : -
penelitian ini adalah untuk mencari pemodelan dan percobaan prediksi untuk cuaca
berdasarkan dataset yang sudah ada. Dalam paper ini, kami mempelajari klasifikasi cuaca
menggunakan beberapa algoritma klasifikasi seperti Tree, Logistic, Multilayer Perceptron, Kata kunci:
Naive Bayes dan Bagging. Adapun tahapan untuk penelitian kali ini yaitu, 1) preprocessing Data mining, klasifikasi, WEKA,
dataset, 2) pembuatan model klasifikasi, dan 3) pembuatan website heroku untuk hasil
Python, prediksi, peramalan
klasifikasi. Dari beberapa algoritma tersebut, algoritma Bagging dipilih untuk menggunakan
algoritma klasifikasi Bagging karena menunjukan hasil akurasi tertinggi dibanding algoritma cuaca.
lainnya.
ABSTRACT Keywords:
Forecasting or weather forecasting is the use of science and technology to estimate the future data mining, classification, WEKA,
state of the Earth's atmosphere for a particular place. The purpose of this research is to search
for modeling and prediction experiments for weather based on existing datasets. In this paper,
Python, prediction, forecasting.
we study weathers classification using several classification algorithms such as Tree, Logistics,
Multilayer Perceptron, Naive Bayes, and Bagging. The stages for this research are 1)
preprocessing the dataset, 2) creating a classification model, and 3) creating a Heroku website
for classification results. Of these several algorithms, the Bagging algorithm was chosen to use
the Bagging algorithm classification because it shows the highest accuracy results compared
to other algorithms.
Pendahuluan
Prediksi cuaca telah menjadi masalah yang menantang di departemen meteorologi selama
bertahun-tahun. Bahkan setelah kemajuan teknologi dan ilmu pengetahuan, keakuratan prediksi cuaca
tidak pernah cukup. Bahkan pada tanggal saat ini domain ini tetap sebagai topik penelitian di mana para
ilmuwan dan matematikawan bekerja untuk memproses dan menghasilkan model atau algoritma yang
secara akurat akan memprediksi cuaca. Ada peningkatan besar pada sensor yang bertanggung jawab untuk
merekam data dari lingkungan dan membatalkan kebisingan yang ada di dalamnya bersama dengan model
baru ini telah diusulkan yang menyertakan atribut berbeda yang terkait dengan cuaca untuk membuat
prediksi yang akurat. (Sheikh, F., Karthick, et al. 2016).
Data mining adalah proses untuk menemukan pengetahuan yang menarik, seperti asosiasi, pola,
anomali, perubahan, dan struktur signifikan dari sejumlah besar data yang disimpan dalam database atau
tempat penyimpanan informasi lainnya. Dalam prosedur data mining, data sebelumnya dijelaskan dan
aturan masa depan dihitung dengan analisis data. Data mining adalah bidang multi-disiplin yang merupakan
kombinasi dari machine learning, statistik, teknologi database, dan kecerdasan buatan. Teknik ini
mencakup beberapa fase: Pemahaman bisnis, pemahaman data, persiapan data, pemodelan, evaluasi, dan
deployment. Data mining telah terbukti sangat bermanfaat di bidang analisis medis karena meningkatkan
akurasi diagnostik, mengurangi biaya perawatan pasien, dan menghemat sumber daya manusia. Ada
berbagai teknik data mining seperti Association, Classification, Clustering, Neural Network, dan Regression.
(Kaur, Gaganjot, Ami Chabra. 2014).
Korespondensi: Muhammad Aditya Hasta Pratama, mdhstama@upi.edu, Ilmu Komputer, UPI, Bandung, Indonesia
Korespondensi: Muhammad Azar Nuzy, azarnuzy@upi.edu, Ilmu Komputer, UPI, Bandung, Indonesia
Korespondensi: Sekar Madu Kusumawardani, sekarmadu@upi.edu, Ilmu Komputer, UPI, Bandung, Indonesia
Copyright © 2022. Muhammad Aditya Hasta Pratama, Muhammad Azar Nuzy, Sekar Madu Kusumawardani. All Right Reserved
Muhammad Aditya Hasta Pratama 1, Muhammad Azar Nuzy 2, Sekar Madu Kusumawardani 3. Analisis Teknik Klasifikasi Data Menggunakan
Algoritma Bagging (Ensemble Learning) Untuk Peramalan Cuaca
2. Precip Type
Atribut ini bertipe data string. Presipitasi (precipitation) atau dalam bahasa Indonesia diartikan
sebagai pengendapan merupakan peristiwa jatuhnya titik-titik air dari atmosfer ke permukaan bumi,
baik dalam bentuk cair atau kristal salju. Bentuk presipitasi dapat pula meliputi hujan, salju serta hujan
es. Dalam atribut Precip Type ini terdapat 2 jenis nilai unik, yaitu rain dan snow.
3. Temperature
Atribut ini bertipe data float. Suhu atau Temperatur adalah besaran fisika yang menyatakan
panas dan dingin. Atribut ini menyatakan data temperatur udara pada saat tersebut.
2
Paper Tugas Besar Kelompok 5 Mata Kuliah Data Mining dan Warehouse 3KOM-C1
4. Apparent Temperature
Atribut ini bertipe data float. Suhu semu adalah suhu yang setara yang dirasakan oleh manusia,
yang disebabkan oleh efek gabungan dari suhu udara, kelembaban relatif, dan kecepatan angin.
Ukuran ini paling sering diterapkan pada suhu luar ruangan yang dirasakan.
5. Humidity
Atribut ini bertipe data float. Humidity atau kelembaban dapat didefinisikan sebagai jumlah
kandungan uap air yang ada di udara.
6. Wind Speed
Atribut ini bertipe data float. Wind Speed (Kecepatan Angin) adalah besaran atmosfer
mendasar yang disebabkan oleh pergerakan udara dari tekanan tinggi ke rendah,biasanya karena
perubahan suhu.
3
Muhammad Aditya Hasta Pratama 1, Muhammad Azar Nuzy 2, Sekar Madu Kusumawardani 3. Analisis Teknik Klasifikasi Data Menggunakan
Algoritma Bagging (Ensemble Learning) Untuk Peramalan Cuaca
7. Wind Bearing
Atribut ini bertipe data float. Wind Bearing mengacu pada arah dimana angin tersebut bergerak.
Algoritma Klasifikasi
Bagian ini merupakan penjelasan tentang algoritma-algoritma apa saja yang akan dipakai dalam
menentukan algoritma terbaik dalam penelitian ini dilihat dari tingkat akurasinya yang paling tinggi. Berikut
ini adalah macam-macam algoritmanya.
1. Tree
a. J48
Decision Tree adalah salah satu cara yang paling banyak dipakai untuk melakukan data
mining. Di dalam algoritma Decision Tree ini terdapat beberapa algoritma seperti ID3, C4.5 dan J48.
Dalam penelitian ini, jenis algoritma decision tree yang akan digunakan adalah J48. J48 merupakan
salah satu jenis classifier pada metode klasifikasi dalam data mining dan bagian dari C45 decision
tree yang sederhana (Jayasingh, S. K. et al. 2016).
b. REPTree
REPTree adalah metode untuk menghasilkan sebuah decision tree dari dataset yang ada.
REPTree ini dianggap sebagai pengembangan dari C45 dengan meningkatkan fase pruning atau
pemangkasan menggunakan Reduced Error Pruning (REP). Metode ini menggunakan pruning atau
pemangkasan dataset yang terpisah. Untuk setiap subtree diperiksa apakah dapat digantikan oleh
single node, tanpa menurunkan kinerja dari klasifikasi pada pruning set. Dengan demikian, metode
pruning yang digunakan sederhana, tetapi sering dianggap terlalu agresif dikarenakan adanya
penghapusan pada subtree yang sebenarnya penghapusan tersebut relevan. Oleh karena itu,
metode REPTree memberikan tingkat keterjelasan yang tinggi (Knowledge Centre Data & Society.
2019).
2. Multilayer Perceptron
Penerapan neural network yang berhasil melakukan analisis data adalah Multi Layer Perceptron
(MLP). Model ini adalah model jaringan saraf non linier yang dapat digunakan untuk memperkirakan
tingkat akurasi yang tinggi. MLP ini berisi input layer, hidden layers, dan output layer (Jayasingh, S. K.
et al. 2016).
5
Muhammad Aditya Hasta Pratama 1, Muhammad Azar Nuzy 2, Sekar Madu Kusumawardani 3. Analisis Teknik Klasifikasi Data Menggunakan
Algoritma Bagging (Ensemble Learning) Untuk Peramalan Cuaca
3. Function
a. Logistic
Model klasifikasi logistik adalah model klasifikasi biner, di mana probabilitas bersyarat dari
salah satu yang berada pada dua kemungkinan yaitu realisasi variabel output diasumsikan sama
dengan kombinasi linier dari variabel input dan ditransformasikan oleh fungsi logistik (Taboga,
Marco. 2021).
b. Simple Logistic
Simple Logistic Regression adalah uji statistik yang digunakan untuk memprediksi variabel
biner tunggal dengan menggunakan satu variabel lainnya. Simple Logistic Regression ini juga
digunakan untuk menentukan hubungan numerik antara dua variabel. Variabel yang akan diprediksi
haruslah biner dan data harus dapat memenuhi asumsi seperti linearitas, tidak ada outliers, dan
independence (StatTest. 2021).
4. NaiveBayes
Pengklasifikasi Naive Bayes adalah pengklasifikasi probabilistik berdasarkan teoema Bayes yang
mengasumsikan bahwa setiap fitur memberikan kontribusi yang independen dan setara ke kelas
target. Klasifikasi Naive Bayes mengasumsikan bahwa setiap fitur adalah independen dan tidak
berinteraksi satu sama lain, sehingga setiap fitur berkontribusi pada kemungkinan sampel untuk
menjadi bagian dari kelas tertentu. Klasifikasi Naive Bayes ini mudah untuk diimplementasikan dan
secara komputasi berjalan dengan cepat dan berkinerja dengan baik pada kumpulan data besar yang
memiliki dimensi yang tinggi. (ScienceDirect. 2020).
5. Bagging
Pengklasifikasi Bagging adalah meta-estimator ansambel yang cocok dengan pengklasifikasi
dasar masing-masing pada subset acak dari dataset asli dan kemudian menggabungkan prediksi
individu mereka (baik dengan memilih atau dengan rata-rata) untuk membentuk prediksi akhir. Meta-
estimator seperti itu biasanya dapat digunakan sebagai cara untuk mengurangi varians dari estimator
black box (misalnya, decision tree), dengan memasukkan pengacakan ke dalam prosedur konstruksinya
dan kemudian membuat ansambel darinya. (Scikit Learn. 2018)
Bagging sering juga disebut sebagai metode bootstarp aggregating. Dikutip dari Wikipedia,
bootstrap aggregating merupakan penggabungan algoritma pembelajaran mesin (machine learning)
yang dirancang untuk meningkatkan stabilitas dan akurasi dari algoritma machine learning yang
digunakan dalam klasifikasi statistik dan regresi. Bagging juga mengurangi varians dan membantu
untuk menghindari terjadinya overfitting. Meskipun biasanya diterapkan untuk metode decision tree,
bagging dapat digunakan dengan semua jenis metode. Bagging merupakan kasus khusus dari
pendekatan model averaging. (Wikipedia. 2020)
formulasi dari sekumpulan data sampling. Walaupun kekuatan Weka terletak pada algoritma yang
makin lengkap dan canggih, kesuksesan data mining tetap terletak pada faktor pengetahuan manusia
implementasinya. Tugas pengumpulan data yang berkualitas tinggi dan pengetahuan pemodelan dan
penggunaan algoritma yang tepat diperlukan untuk menjamin keakuratan formulasi yang diharapkan.
Setiap aplikasi dibuat untuk menyederhanakan suatu proses yang harus dibuat oleh user, dalam hal ini
ada beberapa fungsi utama dari aplikasi WEKA antara lain :
a) Comprehensive set of data pre-processing tools, learning algorithms and evaluation methods
b) Graphical user interfaces (incl. Data visualization)
c) Environment for comparing learning algorithms (Juniwaly. 2018).
Parameter kesalahan dalam WEKA yang berbeda untuk menganalisis prediksi yang digunakan
adalah sebagai berikut :
a) RMSE - Root-mean-square deviation (RMSD) atau root-mean-square error (RMSE) adalah ukuran
yang sering digunakan dari perbedaan antara nilai (sampel dan nilai populasi) diprediksi oleh
model atau estimator dan nilai yang benar-benar diamati.
b) MAE - Mean absolute error (MAE) adalah besaran yang digunakan untuk mengukur seberapa dekat
peramalan atau prediksi dengan hasil akhirnya.
c) RAE - Kesalahan relatif adalah kesalahan mutlak dibagi dengan besarnya nilai eksak. Kesalahan
persen adalah kesalahan relatif yang dinyatakan dalam per 100.
d) RRSE - Kesalahan kuadrat relatif Root dihitung sebagai kesalahan absolut Rata-rata dibagi dengan
kesalahan pengklasifikasi ZeroR (pengklasifikasi, yang mengabaikan semua prediktor dan hanya
memilih yang paling sering nilai) (Jayasingh, S. K. et al. 2016).
2. Python
Python adalah bahasa pemrograman interpretatif yang dapat digunakan di berbagai platform
dengan filosofi perancangan yang berfokus pada tingkat keterbacaan kode dan merupakan salah satu
bahasa populer yang berkaitan dengan Data Science, Machine Learning, dan Internet of Things (IoT).
Keunggulan Python yang bersifat interpretatif juga banyak digunakan untuk prototyping, scripting
dalam pengelolaan infrastruktur, hingga pembuatan website berskala besar. (Dicoding Indonesia..
2020)
Sistem klasifikasi pada penelitian ini dibuat sepenuhnya menggunakan bahasa pemrograman
Python. Selain karena Python yang merupakan bahasa populer dan mudah digunakan, library yang
dibutuhkan dalam proses membangun sistem klasifikasi ini juga sangat lengkap, mulai dari library untuk
penyeleksian data, pembersihan data, hingga analisis data dan pembuatan model untuk klasifikasi.
Disamping mudahnya penggalian data menggunakan Python, bahasa ini juga dapat diintegrasikan
dengan aplikasi web sehingga dapat langsung dihubungkan dengan template bertipe HTML untuk
dijalankan pada web browser.
Seperti yang telah disebutkan sebelumnya bahwa bahasa pemrograman Python memiliki
banyak library yang sangat mendukung dalam pembuatan model klasifikasi, berikut adalah beberapa
library yang akan digunakan dalam perancangan sistem peramalan cuaca pada penelitian ini.
a. Pandas
Pandas adalah library perangkat lunak yang ditulis untuk bahasa pemrograman Python
untuk manipulasi dan analisis data. Secara khusus, ia menawarkan struktur data dan operasi untuk
memanipulasi tabel numerik dan deret waktu (time series). Pandas menyediakan struktur data
yang cepat, fleksibel, dan ekspresif yang dirancang untuk membuat bekerja dengan data
7
Muhammad Aditya Hasta Pratama 1, Muhammad Azar Nuzy 2, Sekar Madu Kusumawardani 3. Analisis Teknik Klasifikasi Data Menggunakan
Algoritma Bagging (Ensemble Learning) Untuk Peramalan Cuaca
"relasional" atau "berlabel" menjadi mudah dan intuitif. Ini bertujuan untuk menjadi blok
bangunan tingkat tinggi yang mendasar untuk melakukan analisis data dunia nyata yang praktis
dengan Python. Selain itu, ia memiliki tujuan yang lebih luas untuk menjadi alat analisis/manipulasi
data open source yang paling kuat dan fleksibel yang tersedia dalam bahasa apa pun. Pandas
merupakan perangkat lunak gratis yang dirilis di bawah lisensi BSD tiga klausa. (Pandas
Documentation. 2020)
Pada penelitian ini, library Pandas membantu dalam pembuatan dataframe yang diesktrak
dari dataset yang merupakan file dalam bentuk CSV (Comma Separated Values).
b. Scikit Learn
Scikit-learn atau sklearn adalah modul untuk bahasa pemograman python yang dibangun
diatas library NumPy, SciPy, dan matplotlib, fungsinya dapat membantu melakukan processing
data ataupun melakukan training data untuk kebutuhan machine-learning. Ada banyak fitur yang
dapat digunakan dengan sklearn ini, seperti classification, regression, clustering, dimensionality
reduction, model selection, dan preprocessing data. Scikit learn adalah library yang sederhana dan
efektif untuk digunakan dalam analisis data, dapat diakses oleh setiap orang, bersifat reusable,
open source, dan berlisensi BSD. (Scikit Learn Documentation. 2019)
Pada penelitian ini, library Scikit Learn digunakan dalam praproses data, pembuatan
model, prediksi dan klasifikasi data, serta analisis tingkat akurasi. Beberapa fungsi dan algoritma
yang diambil dari library ini sudah dijelaskan pada bagian jenis-jenis algoritma dan akan diperjelas
kembali pada bagian pembahasan.
Penerapan Algoritma
Dari percobaan penerapan algoritma yang telah dilakukan dengan membagi 70% dataset untuk
training dan 30% dataset untuk data testing, dapat dilihat rangkuman akurasi setiap algoritma pada tabel
berikut :
a) Detail penerapan algoritma menggunakan WEKA
Untuk menganalisis perbandingan performa setiap algoritma yang telah disebutkan sebelumnya,
digunakan aplikasi WEKA. Berikut adalah hasil penerapan algoritma untuk pembuatan model dari data pada
weather dataset menggunakan WEKA.
Tabel 1.
Penerapan algoritma klasifikasi dalam WEKA
Keterangan :
• Correctly classified instances
Correctly classified instances adalah tingkat akurasi hasil prediksi yang benar.
• Incorrectly classified instances
Incorrectly classified instances adalah tingkat akurasi hasil prediksi yang salah.
• Kappa Statistic
Kappa Statistic adalah ukuran yang menyatakan konsistensi pengukuran yang dilakukan dua
orang penilai (Rater) atau konsistensi antar dua metode pengukuran atau dapat juga mengukur
konsistensi antar dua alat pengukuran.
• Mean Absolute Error
MAE mengukur besarnya rata-rata kesalahan dalam serangkaian prediksi, tanpa
mempertimbangkan arahnya. Ini adalah rata-rata di atas sampel uji dari perbedaan absolut antara
prediksi dan observasi aktual di mana semua perbedaan individu memiliki bobot yang sama.
• Root Mean Squared Error
RMSE adalah aturan penilaian kuadrat yang juga mengukur besarnya rata-rata kesalahan. Ini
adalah akar kuadrat dari rata-rata perbedaan kuadrat antara prediksi dan observasi aktual.
• Relative Absolute Error
Relative Absolute Error (RAE) adalah cara untuk mengukur kinerja model prediktif. Ini
terutama digunakan dalam pembelajaran mesin, penambangan data, dan manajemen operasi. RAE
tidak menjadi bingung dengan kesalahan relatif, yang merupakan ukuran umum presisi atau akurasi
untuk instrumen seperti jam, penggaris, atau timbangan.Kesalahan Absolut Relatif dinyatakan
sebagai rasio, membandingkan kesalahan rata-rata (sisa) dengan kesalahan yang dihasilkan oleh
9
Muhammad Aditya Hasta Pratama 1, Muhammad Azar Nuzy 2, Sekar Madu Kusumawardani 3. Analisis Teknik Klasifikasi Data Menggunakan
Algoritma Bagging (Ensemble Learning) Untuk Peramalan Cuaca
model yang sepele atau naif. Model yang masuk akal (yang menghasilkan hasil yang lebih baik
daripada model trivial) akan menghasilkan rasio kurang dari satu.
• Root Relative Squared Error
Root relative squared error (RRSE) relatif terhadap apa yang akan terjadi jika prediktor
sederhana telah digunakan. Lebih khusus lagi, prediktor sederhana ini hanyalah rata-rata dari nilai
sebenarnya. Jadi, kesalahan kuadrat relatif mengambil kesalahan kuadrat total dan
menormalkannya dengan membaginya dengan kesalahan kuadrat total dari prediktor sederhana.
Dengan mengambil akar kuadrat dari kesalahan kuadrat relatif, seseorang mengurangi kesalahan
ke dimensi yang sama dengan kuantitas yang diprediksi.
• Total Number of Instances
Total Number of Instances adalah banyaknya data yang di testing oleh model.
1. J48 51.6463 %
2. REPTree 52.6552%
3. MLP 51.5223 %
5. Logistic 49.5999%
Dari tabel di atas dapat dilihat bahwa algoritma yang memiliki tingkat akurasi tertinggi adalah
algoritma Bagging Classifier. Sehingga algoritma tersebut dipilih untuk pembuatan sistem klasifikasi time
series kali ini.
Pra-proses Data
Tahap pre-processing atau pra-proses data merupakan proses untuk mempersiapkan data mentah
sebelum dilakukan proses lain. Pada umumnya, praproses data dilakukan dengan cara mengeliminasi data
yang tidak sesuai atau mengubah data menjadi bentuk yang lebih mudah diproses oleh sistem. Dalam
pembuatan sistem klasifikasi kali ini, ada beberapa pra-proses yang dilakukan, yaitu :
10
Paper Tugas Besar Kelompok 5 Mata Kuliah Data Mining dan Warehouse 3KOM-C1
a) Feature Selection
Dataset Weather memiliki 12 buah features atau atribut yang tidak semuanya memiliki peran
dalam pembuatan model untuk klasifikasi. Oleh karena itu, di pilih beberapa atribut/features saja yang
mewakili atribut target.
c) Menghapus record data yang memiliki double value (memiliki substring ‘dan’ pada atribut target/hasil)
Pada atribut target, yaitu ‘Summary’ terdapat label yang memiliki 2 nilai, misalnya Partly Cloudy
and Overcast. Hal ini membuat variasi dari target sangat banyak (24 nilai unik) yang mana berdampak
pada kecilnya tingkat akurasi model. Berikut adalah perbandingan testing accuracy model sebelum
dan sesudah penghapusan double value target.
Berikut adalah syntax yang digunakan untuk melakukan penghapusan record yang
mengandung double value pada atribut targetnya (Summary).
11
Muhammad Aditya Hasta Pratama 1, Muhammad Azar Nuzy 2, Sekar Madu Kusumawardani 3. Analisis Teknik Klasifikasi Data Menggunakan
Algoritma Bagging (Ensemble Learning) Untuk Peramalan Cuaca
Gambar 19. Source code untuk membuat training dan testing datasets klasifikasi
12
Paper Tugas Besar Kelompok 5 Mata Kuliah Data Mining dan Warehouse 3KOM-C1
Gambar 21. Sintaks dan hasil tes akurasi algoritma pada Python
13
Muhammad Aditya Hasta Pratama 1, Muhammad Azar Nuzy 2, Sekar Madu Kusumawardani 3. Analisis Teknik Klasifikasi Data Menggunakan
Algoritma Bagging (Ensemble Learning) Untuk Peramalan Cuaca
14
Paper Tugas Besar Kelompok 5 Mata Kuliah Data Mining dan Warehouse 3KOM-C1
Gambar 27a, 27b, 27c. Penggunaan library Flask dalam pembuatan web aplikasi
Seperti pada gambar-gambar di atas, library Flask digunakan untuk mengarahkan laman web
(routing) ke laman yang lain dimana pada setiap laman akan diterapkan method yang berbeda-beda.
Library Flask juga digunakan untuk memanggil template (rendering template).
Method yang digunakan dalam sistem ini ada 2, yaitu method index yang akan menampilkan
halaman utama (halaman default) untuk menginputkan data dari user, dan method prediction yang
akan menampilkan halaman setelah dilakukan pemrosesan input data.
Method index() akan mengembalikan template yang berisikan nilai-nilai awal (?) untuk bagian
hasil prediksi.
15
Muhammad Aditya Hasta Pratama 1, Muhammad Azar Nuzy 2, Sekar Madu Kusumawardani 3. Analisis Teknik Klasifikasi Data Menggunakan
Algoritma Bagging (Ensemble Learning) Untuk Peramalan Cuaca
Method prediction akan menangkap input dari user untuk selanjutnya diproses
menggunakan model klasifikasi yang telah dibuat. Hasil pemrosesannya akan dikembalikan lagi
sebagai template yang telah di render untuk menggantikan seluruh nilai yang sebelumnya masih
berupa tanda tanya (?).
2) Pembuatan Tampilan
Pembuatan tampilan melibatkan HTML dan CSS dengan sintaks yang cukup banyak. Sedikit
penjelasan mengenai tampilan yang dibuat adalah bahwa setiap input dari template akan ditangkap
oleh sistem berdasarkan atribut name yang terdapat dalam form input pada berkas html.
Selanjutnya, setiap output yang diberikan oleh sistem (file python) akan ditangkap oleh
template yang memiliki tanda kurung kurawal ({…}) dimana di dalam kurung kurawal tersebut
berisikan nama variabel yang sama dengan variabel yang dikirim oleh sistem.
g) Hasil Deploy Web Aplikasi
Agar sistem klasifikasi dapat digunakan oleh user dari perangkat masing-masing, dibuat
sebuah web aplikasi yang sistemnya juga dibangun menggunakan bahasa Python. Web aplikasi ini
sudah di deploy pada cloud platform Heroku yang mana platform ini sudah mendukung bahasa
Python dan library-library nya. Web aplikasi ini dapat diakses pada web browser dengan mengunjungi
link berikut, https://forecasting-weahter-app.herokuapp.com/
16
Paper Tugas Besar Kelompok 5 Mata Kuliah Data Mining dan Warehouse 3KOM-C1
Kesimpulan
Dari analisis 4 (empat) parameter error yang berbeda pada WEKA di antara 8 model algoritma
klasifikasi untuk datasets prakiraan cuaca di Leeds, Inggris, dapat disimpulkan bahwa algoritma Bagging
berkinerja lebih baik dibanding model algoritma-algoritma klasifikasi lainnya.
Jadi, untuk diwaktu yang akan datang, model algoritma Bagging ini dapat digunakan untuk
meramalkan cuaca lebih baik sehingga masyarakat sekitar Leeds, Inggris ini bisa berguna untuk masyarakat
yang di bidang pertanian, keputusan untuk pendakian gunung, memancing di laut, dan banyak hal lainnya
yang dimana kegiatan tersebut sangat tergantung dengan cuaca di sekitarnya. Semakin baik prediksinya,
semakin aman masyarakat di sekitar Leeds, Inggris.
17
Muhammad Aditya Hasta Pratama 1, Muhammad Azar Nuzy 2, Sekar Madu Kusumawardani 3. Analisis Teknik Klasifikasi Data Menggunakan
Algoritma Bagging (Ensemble Learning) Untuk Peramalan Cuaca
Referensi
Dicoding Indonesia. (2020). Memulai Pemrograman Dengan Python. Tersedia :
https://www.dicoding.com/academies/86. Diakses pada [29 Desember 2021].
Jayasingh, S. K., Mantri, J. K., & Gahan, P. (2016). Comparison between J48 Decision Tree, SVM and MLP in
Weather Forecasting. International Journal of Computer Science and Engineering, 3(11), 42-47.
Kapoor, P., Rani, R., & JMIT, R. (2015). Efficient decision tree algorithm using J48 and reduced error pruning. Int.
J. Eng. Res. Gen. Sci, 3(3), 1613-1621.
Kaur, Gaganjot, Ami Chabra. (2014). Improved J48 Classification Algorithm for the Prediction Dataset.
International Journal of Computer Application. DOI: 10.5120/17314-7433.
Mathuria, M. (2013). Decision tree analysis on j48 algorithm for data mining. International Journal of Advanced
Research in Computer Science and Software Engineering, 3(6).
Ramesh, D., Pasha, S. N., & Roopa, G. (2017). A comparative analysis of classification algorithms on weather dataset
using data mining tool. Oriental Journal of Computer Science and Technology, 10(4), 1-5.
Saravana, N., & Gayathri, D. V. (2018). Performance and classification evaluation of J48 algorithm and Kendall’s
based J48 algorithm (KNJ48). Int. J. Comput. Trends Technol.(IJCTT)--Volume, 59.
Sheikh, F., Karthick, S., Malathi, D., Sudarsan, J. S., & Arun, C. (2016). Analysis of data mining techniques for
weather prediction. Indian Journal of Science and Technology, 9(38), 1-9.
Tripto, N. I., Kabir, M., Bayzid, M. S., & Rahman, A. (2020). Evaluation of classification and forecasting methods
on time series gene expression data. Plos one, 15(11), e0241686.
18