You are on page 1of 19

PROPOSAL FINAL PROJECT

PENGELOMPOKKAN PRESTASI SISWA MENGGUNAKAN


ALGORITMA K-MEANS

Disusun Oleh :

1. Awwalur Rohma Cahya N (20121100)


2. Zunaidah Affandi (2012110010)
3. Alis Mujianto (20121100)

MATA KULIAH KECERDASAN BUATAN


TEKNIK INFORMATIKA
UNIVERSITAS QOMARUDDIN
2022
KATA PENGANTAR
Puji dan syukur kami panjatkan kehadirat Tuhan Yang Maha Esa. Karena
atas berkat rahmatNya kami dapat menyelesaikan Proposal Final Project mata
kuliah Kecerdasan Buatan.

Adapun isi dari Proposal Final Project ini adalah kumpulan dari Paper
refrensi penelitian penggunaan algoritma fuzzy/k-means. Proposal Final Project
ini merupakan Tugas Ujian Akhir Semester Mata kuliah Kecerdasan Buatan.

Kami juga tidak lupa mengucapkan banyak terimaksih kepada Dosen


pengajar mata kuliah Kecerdasan Buatan yang telah membimbing dan mengajari
kami dalam melaksanakan Tugas dan dalam menyusun Proposal Final Project ini.
Serta semua pihak yang membantu kami dalam hal penyusunan laporan ini.

Prpopsal Final Project ini masih sangat jauh dari kesempurnaan oleh karena
itu kritik serta saran yang membangun masih kami harapkan untuk
penyempurnaan Proposal Final Projet/Tugas akhir ini.

Atas perhatian dari semua pihak yang membantu penyusunan ini kami
ucapkan terimakasih. Semoga Proposal Final Project ini bermanfaat dan dapat
dipergunakan seperlunya.

Gresik, 13 Desember 2022


DAFTAR ISI
DAFTAR ISI........................................................................................................
BAB 1 PENDAHULUAN…………………………………….………………
1.1 Latar Belakang…….…………………..…………………...
…………
BAB 2 DASAR TEORI……………………………………………….………
2.1 Landasan Teori…………………………………………….………….
2.1.1 Data Mining……………………………………………………
2.1.2 Clustering………………………………………………………
2.1.3 K-Means……………………………………………………….
2.1.4 Fuzzy K-Means…………………………………………………
2.2 Kerangka Teori…………………………………………….………….
BAB 3 DESAIN SISTEM………………………………………….…………
3.1 Flowchart………………………………………………..…………….
BAB 4 DATASET………….…………………………………………………
4.1 Dataset dan Sample……………………………….………………….
BAB 5 IMPLEMENTASI………….…………………………...……………
5.1 Source Code………………………………………….……………….
BAB 6 HASIL UJI COBA………….……………………..…………………
6.1 Analisa Hasil Uji Coba……………………………………………….
BAB 7 KESIMPULAN …………………...…………………………………
DAFTAR PUSTAKA
BAB 1

PENDAHULUAN

1.1 Latar Belakang

Peranan Teknologi Informasi terhadap aktivitas manusia sangat besar


khususnya terhadap sekolah. Salah satunya adalah dalam melakukan
pengelompokan prestasi siswa. Prestasi siswa itu sendiri dapat dilihat dari
pengelompokan ruangan kelas menurut kemampuan yang dimiliki setiap
individu.

Prestasi siswa merupakan tolak ukur pengetahuan yang diperoleh dari


pendidikan formal yang dijalani melalui nilai tes, dan penguasaan terhadap
mata pelajaran yang ditentukan melalui nilai atau angka yang diberikan
guru. Prestasi siswa penting untuk diteliti mengingat prestasi siswa dapat
digunakan sebagai berikut, Mengetahui sejauh mana siswa menguasai
materi pembelajaran yang telah disampaikan guru, Mengetahui kemampuan,
motivasi, bakat, minat, dan sikap siswa terhadap program pembelajaran,
Seleksi untuk menyaring dan menentukan siswa yang sesuai dengan jenis
pendidikan tertentu, Menentukan kenaikan kelas dan Menempatkan siswa
sesuai dengan potensi yang dimilikinya.

Maka dari itu kita membuat aplikasi pengelompokkan prestasi siswa


menggunakan Algoritma K-Means, dimana aplikasi ini dapat menentukan
tingkatan dari setiap siswa, apakah siswa tersebut pintar, sedang atau cukup
yang nantinya akan mempermudah bagi guru untuk mengelompokkan siswa
baru untuk masuk ke kelas mana, pintar, sedang atau cukup. Di aplikasi ini
kita sudah menguji 20 data siswa MI atau data 1 kelas menggunakan nilai
pengetahuan dan keterampilan dari 20 data siswa tersebut, untuk
menentukan tingkatan siswa mana yang pintar, sedang dan cukup.

dan tentunya aplikasi ini dapat menjawab, dari 20 data siswa tersebut
berapakah anak yang pintar, sedang dan cukup, anak pintar dengan kluster 1
sebanyak 3 anak, kemudian untuk anak sedang dengan kluster 2 sebanyak
13 anak dan sisa 4 anak yang masuk ke kluster cukup.
BAB 2
DASAR TEORI
2.1 Landasan Teori
2.1.1 Data Mining
Dalam data mining terdapat metode-metode yang dapat digunakan
seperti klasifikasi, clustering, regresi, seleksi variabel, dan analisis.
Data Mining adalah bidang yang sepenuhnya menggunakan apa yang
dihasilkan oleh data warehouse, bersama dengan bidang yang
menangani masalah pelaporan dan manajemen data. Suatu pola yang
digunakan untuk menemukan hubungan antar item sehingga
membentuk pola pengetahuan yang baru dalam data yang besar dan
dapat diselesaikan menggunakan teknik tertentu. Istilah pengenalan
pola juga tepat digunakan karena pengetahuan yang akan diekstraksi
memang berupa pola-pola yang mungkin juga masih perlu diekstraksi
dari dalam bongkahan data yang dihadapi.
2.1.2 Clustering
Clustering adalah proses pengelompokan benda serupa ke dalam
kelompok yang berbeda, atau lebih tepatnya partisi dari sebuah data
set kedalam subset, sehingga data dalam setiap subset memiliki arti
yang bermanfaat. Dimana sebuah cluster terdiri dari kumpulan benda-
benda yang mirip antara satu dengan yang lainnya dan berbeda dengan
benda yang terdapat pada cluster lainnya. Algoritma clustering terdiri
dari dua bagian yaitu secara hirarkis dan secara partitional. Algoritma
hirarkis menemukan cluster secara berurutan dimana cluster
ditetapkan sebelumnya, sedangkan algoritma partitional menentukan
semua kelompok pada waktu tertentu.
Clustering juga bisa dikatakan suatu proses dimana mengelompokan
dan membagi pola data menjadi beberapa jumlah data set sehingga
akan membentuk pola yang serupa dan dikelompokan pada cluster
yang sama dan memisahkan diri dengan membentuk pola yang
berbeda ke cluster yang berbeda.
2.1.3 K-Means
Algoritma K-Means merupakan metode analisis kelompok yang
mengarah pada pemartisian N objek pengamatan ke dalam kelompok
(cluster) dimana setiap objek pengamatan dimiliki oleh sebuah
kelompok dengan mean (rata-rata) terdekat. Algoritma K-Means
merupakan algoritma yang sederhana untuk diimplementrasikan,
memiliki kinerja yang relatif cepat, mudah beradaptasi, dan umum
digunakan. Algoritma K-Means data diklasifikasikan berdasarkan
kedekatannya dengan centroid. Data dikelompokan dengan
memaksimalkan data yang sama dalam satu klaster dan
meminimalkan data yang sama antar klaster . Dasar algoritma K-
Means adalah sebagai berikut:
1. Tentukan nilai k sebagai jumlah klaster yang ingin dibentuk.
2. Inisialisasi k sebagai centroid yang dapat dibangkitkan secara
random.
3. Hitung jarak setiap data ke masing-masing centroid menggunakan
persamaan Euclidean Distance yaitu sebagai berikut:
d (P,Q) = || x – y || = √Σ(𝑥𝑗(𝑃)−𝑥𝑗(𝑄))2𝑝𝑗=1
4. Kelompokkan setiap data berdasarkan jarak terdekat antara data
dengan centroidnya.
5. Tentukan posisi centroid baru (k).
6. Kembali ke langkah 3 jika posisi centroid baru dengan centroid
lama tidak sama.
 Keuntungan Algoritma K-Means
Algoritma K-Means juga memiliki keuntungan yaitu :
1. Dalam implementasi menyelesaikan masalah, algoritma K-Means
sangat simple serta fleksibel. Artinya perhitungan komputasinya tidak
terlalu rumit dan algoritma ini dapat diimplementasikan pada segala
bidang.
2. Algoritma K-Means sangat mudah untuk dipahami, terutama dalam
implementasi data yang sangat besar serta dapat mengurangi
kompleksitas data yang dimiliki.
 Kelemahan Algoritma K-Means
Kelemahan yang dimiliki oleh algoritma K-Means yaitu :
1. Di Algoritma K-Means user memerlukan angka yang tepat dalam
menentukan jumlah cluster sebanyak k karena terkadang pusat cluster
awal dapat berubah sehingga kejadian ini bisa mengakibatkan
pengelompokan data menjadi tidak stabil.
2. Algoritma K-Means tidak bisa maksimal dalam menentukan atau
menginisialkan nilai centroid awalnya, karena pada pengelompokan
data dengan algoritma K-Means sangat bergantung pada nilai
centroidnya.
3. Output dari K-Means tergantung pada nilai – nilai pusat yang
dipilih pada clustering. Sehingga pada algoritma ini nilai awal titik
pusat cluster menjadi dasar dalam penentuan cluster. Pemilihan
centroid cluster awal secara acak akan memberikan pengaruh terhadap
kinerja cluster tersebut
2.1.4 Fuzzy K-Means
Algoritma Fuzzy C-Means diusulkan pertama kali oleh Dunn pada
tahun 1973 dan kemudian diperbaharui oleh Bezdek pada tahun 1981.
Algoritma ini merupakan salah satu teknik soft clustering yang paling
popular dengan menggunakan pendekatan data point dimana titik
pusat cluster akan selalu diperbaharui sesuai dengan nilai keanggotaan
dari data yang ada dan selain itu algoritma fuzzy c-means juga
merupakan algoritma yang bekerja dengan menggunakan model fuzzy
sehingga memungkinkan semua data dari semua anggota kelompok
terbentuk dengan derajat keanggotaan yang berbeda antara 0 dan 1.
Metode Fuzzy C-Means pada dasarnya memiliki tujuan
meminimalisasikan fungsi serta mendapatkan pusat cluster yang
nantinya akan digunakan untuk mengetahui data yang masuk ke dalam
sebuah cluster.
 Keuntungan Algoritma Fuzzy C-Means
Algoritma Fuzzy C-Means memiliki keuntungan yaitu
1.Dalam implementasi menyelesaikan masalah algoritma Fuzzy
CMeans dapat memahami karakteristik data yang kabur atau data
yang tidak terdefinisikan.
2.Memiliki kemampuan dalam mengelompokan data yang besar
3.Lebih kokoh terhadap data outlier/data dengan karakter yang
berbeda atau value yang berbeda dalam satu atau beberapa variabel
4. Penentuan titik cluster yang optimal.
5. Dapat melakukan clustering lebih dari satu variabel secara sekaligus
 Kelemahan Algoritma Fuzzy C-Means
Kelemahan yang dimiliki oleh algoritma Fuzzy C-Means yaitu :
1. Pada algoritma Fuzzy C-Means user memerlukan lebih banyak
waktu untuk proses perhitungan komputasinya dalam menentukan
cluster pada setiap anggota di suatu dataset.
2. Masih terpengaruh terhadap cara pembagian data yang sering
dipergunakan pada data yang sama dan sangat sensitif terhadap
kondisi awal seperti jumlah cluster dan titik pusat cluster pada
pengelompokan data
BAB 3
DESAIN SISTEM
3.1 Flowchart
- Memproses/mengnput dataset yang akan dikluster
- Menentukan jumlah kluster, jika sudah lanjut
- Menentukan titik pada cluster
- Kemudian menghitung jarak data terhadap pusat
- Kemudian pengelompokan data sesuai minimum jarak ke pusat cluster
- Jika di pusat kluster tidak menerima maka akan diulangi lagi, namun
jika yam aka akan muncul hasil cluster, kemudian selesai.

mulai

Data processing

Tentukan jumlah
cluster
tidak ya
Pusat
cluster
berubah
Tentukan titik pada Hasil
cluster cluster

Hitung jarak data


seles
terhadap pusat
ai
cluster

Pengelompokkan data
sesuai minimum jarak ke
pusat cluster
BAB 4

DATASET

4.1 Dataset dan Sample


Dataset ini kita ambil dari satu kelas MI, yang berjumlah 20 siswa,
kemudian kita ambil nilai Pengetahuan dan keterampilan dari 20 siswa
tersebut untuk kita hitung klusternya.

NIS Nama JK PENGETAHUAN KETERAMPILAN


180001 AGUS AHMAD ALVESINA SUMADYA AL BIRUNI L 83 78
180002 AIS VETO ACYUTA L 72 66
180003 AMANDA SYAKIRA P 81 77
180004 ANGGRAINI NAVISHA PUTRI P 76 84
180005 BILQIS QALBI NADHIFA P 80 83
180006 DAVA MAULANA NASWA HADY L 87 82
180007 DWI ARDILLA PUTRI RAHAYU P 90 92
180008 HANI AFRIZATUS SABIRA P 94 95
180009 M BAZLI TSANY MAULANA EFENDI L 77 80
180010 MOHAMMAD BAHRIL ADAM L 85 81
180011 MUHAMMAD FAREL FABIANSYAH L 84 75
180012 NAYLA AISYATUL KHUSNAH P 80 76
180013 NELA NURO ASZAHRA P 84 87
180014 RARA NAKHWAH SHOFIDANELLA P 96 96
180015 RAYMOND FAVIAN ARFI PUTRA L 81 79
180016 AHMAD MASRUR ZIDDAN AN NAJIH L 82 78
180017 ARI IRWANSYAH L 84 75
180018 CANDRA ARSIL RAMADHANI PUTRA L 86 80
180019 ILAIYA HADLIROTUL QUDSIYAH P 88 96
180020 MUHAMMAD AISY SYIFAUL FUADI L 92 97
BAB 5

IMPLEMENTASI

5.1 Source Code

1. Source code Mengimpor library


- Panda untuk membaca dan menulis spreadsheet
- Numpy untuk melakukan perhitungan yang efisien
- Matplotib untuk visualisasi data

2. Source code Mengimpor Dataset


- Data yang digunakan yakni dataset sampel data siswa MI pada aplikasi
pengelompokan prestasi siswa. Dibawah ini adalah script untuk
menginput data (baris 1) dan membaca data (baris 2)

3. Source code Menghilangkan kolom/menentukan kolom yang diperlukan

4. Source code Melihat info data siswa

5. Source code Memvisualkan pesebaran data

6. Source code Menentukan variabel yang akan diklusterkan


7. Source code Mengubah variabel data frame menjadi array

8. Source code Menstandarkan ukuran variabel

9. Source code Menentukan dan mengkonfigurasi fungsi kmeans

10. Source code Menentukan kluster dari data

11. Source code Menampilkan pusat cluster

12. Source code Menampilkan hasil cluster

13. Source code Menambah kolom “kluster” dalam data frame dataset_siswa

14. Source code Menetapkan cluster

15. Source code Memvisualkan hasil cluster


BAB 6

HASIL UJI COBA

6.1 Analisa hasil Uji Coba

1. Hasil uji coba Mengimpor dataset sebanyak 20 siswa MI satu kelas


2. Hasil uji coba Penentuan kolom yang akan dimunculkan

3. Hasil uji coba melihat info dari data siswa yang sudah kita impor datanya,
bahwa data colom pengetahuan isi 20, keterampilan juga 20 berarti itu
sesuai dengan yang kita tampilkan nanti.
4. Hasil uji coba Grafik nilai siswa yaitu nilai pengetahuan dan keterampilan
dari 20 siswa atau divisualisasikan penyebaran data/nilai siswa.

5. Hasil uji coba menentukan variabel yang akan diklusterkan, jadi muncul 5
variabel yang akan diklusterkan

6. Hasil uji coba mengubah variabel data frame menjadi array, jadi 20 nilai
siswa tadi kita ubah menjadi array yang nantinya akan di standarkan lagi
ukurannya atau dikecilkan lagi
7. Hasil uji coba menstandarkan ukuran variabel, yaitu memperkecil 20 nilai
siswa tadi untuk diklusterkan atau menghitung jarak

8. Hasil uji coba menentukan dan mengkonfigurasi fungsi kmeans, bahwa


ada 3 cluster yang untuk menentukan hasil akhir nanti.

9. Hasil uji coba Menampilkan 3 variabel pusat cluster

10. Hasil uji coba Menampilkan hasil cluster yang sudah muncul hasilnya
sesuai 20 data siswa tadi.

11. Hasil uji coba menampilkan hasil kluster sesuai 20 data siswa yang telah
kita inputkan, bahwa ada 3 anak di kluster 1 yaitu pintar, 13 anak dikluster
2 yaitu sedang, dan sisa 4 anak di kluster cukup.
12. Hasil uji coba Grafik hasil akhir menampilkan hasil kluster dari 20 data
siswa MI tadi
BAB 7

KESIMPULAN

7.1 Kesimpulan

Aplikasi pengelompokkan data siswa ini dengan menggunakan Algoritma K-


Means, kita lakukan dengan cara menentukan jumlah data, menentukan titik pada
cluster dan menghitung jarak pada cluster kemudian kita kelompokkan cluster
tersebut. Sebelum itu kita menentukan nilai data apa yang akan kita ambil untuk
aplikasi ini, di aplikasi ini kita mengambil nilai pengetahuan dan keterampilan
siswa, dengan dataset 20 siswa MI yang akan kita gunakan untuk diaplikasi
algoritma k-means ini.

Aplikasi ini sangat memudahkan kita untuk mengetahui cluster dari 20 data
siswa MI tersebut, dari data 20 siswa tersebut kita mengetahui mana kluster yang
pertama dan kedua, jadi dari aplikasi ini kita dapat mengetahui sejauh mana
pengetahuan dan keterampilan siswa-siswa ini, apakah pintar, sedang atau cukup.
DAFTAR PUSTAKA

https://deepublishstore.com/kerangka-teori/.(Diakses pada tgl 12 Desember 2022


08.47 WIB)

http://repository.uin-suska.ac.id/3542/4/BAB%20III.pdf. (Diakses pada tgl 12


Desember 2022 pukul 09.38 WIB)

https://www.gramedia.com/?
utm_source=InvolveAsia&session_id=b3f77f70d50c43ef9e2f243396cd51b9.
(Diakses pada tgl 12 Desember 2022 pukul 09.54 WIB)

https://www.google.com/search?
q=contoh+kerangka+teori&source=lnms&tbm=isch&sa=X&ved=2ahUKEwjGjf
mIwfX7AhXATmwGHeYdDvQQ_AUoAXoECAEQAw#imgrc=JWrfZT5VjrVL
7M. (Diakses pada tgl 13 Desember 2022 pukul 09.31 WIB)

https://www.google.com/search?
q=contoh+flowchart+penelitian+pengelompokan+data+siswa+prestasi&tbm=isch
&ved=2ahUKEwjAquecwvX7AhUiguYKHf-aDF8Q2-
cCegQIABAA&oq=contoh+flowchart+penelitian+pengelompokan+data+siswa+p
restasi&gs_lcp=CgNpbWcQAzoFCAAQgAQ6BggAEAgQHlDGgQFYk6oBYKu
sAWgAcAB4AoABsQOIAasekgEKMjcuNC4zLjAuMZgBAKABAaoBC2d3cy1
3aXotaW1nwAEB&sclient=img&ei=Vt-
XY8CnD6KEmgf_tbL4BQ&bih=568&biw=1366#imgrc=PhW51LWx9z7ETM.
(Diakses pada tgl 13 Desember 2022 09.34)

You might also like