Professional Documents
Culture Documents
Jbptppolban GDL Muhammadta 9715 1 Kelengka 1
Jbptppolban GDL Muhammadta 9715 1 Kelengka 1
TUGAS AKHIR
Laporan ini disusun untuk memenuhi salah satu syarat menyelesaikan pendidikan
Diploma Empat Program Studi Teknik Informatika di
Jurusan Teknik Komputer dan Informatika
Oleh:
NIM: 141524021
Tempat, Tanggal Lahir : Bandung, 23 April 1996
SD Lulus Tahun : 2008 dari SDN Gegerkalong KPAD Bandung
SLTP Lulus Tahun : 2011 dari SMPN 5 Bandung
SLTA Lulus Tahun : 2014 dari SMAN 1 Bandung
Prestasi yang pernah dicapai:
• Finalis Hackathon UMN 2016
ABSTRAK
Pada dataset yang berjumlah masif, deep neural network dengan struktur hidden
layer yang kompleks seperti convolutional neural network (CNN) memiliki akurasi
yang lebih tinggi dari neural network yang hanya memiliki satu hidden layer.
Namun di sisi lain, struktur yang kompleks berdampak pada meningkatnya runtime
inferensi
dan storage yang dibutuhkan oleh model tersebut.
Beberapa penelitian telah dilakukan untuk mengurangi runtime dan storage yang
dibutuhkan model deep neural network. Salah satunya adalah penelitian terkait
penerapan metode knowledge distillation. Metode ini dapat mengurangi runtime
training
dan inferensi dari model dengan arsitektur CNN dua dimensi (2D CNN),
dengan trade-off berupa reduksi akurasi yang tidak signifikan. Metode ini belum
dicobakan
terhadap arsitektur CNN dengan dimensi yang berbeda, seperti 1D CNN
dan 3D CNN. Sehingga, penelitian ini mengoservasi performa metode knowledge
distillation ketika diterapkan pada arsitektur 1D CNN dan 3D CNN.
i
ABSTRACT
In a large dataset, deep neural network with complex hidden layer structure, such
as convolutional neural network (CNN), has been proven to be able to beat the
accuracy
of neural network with only one hidden layer. On the other hand, the rise
in accuracy is also followed by the rise in runtime and storage needed by the model.
There are studies done about reducing both runtime and storage required by deep
neural network, such as application of knowledge distillation method. This method
proves to be able to reduce training and inference runtime needed by two-
dimensional CNN (2D CNN), with reduction of accuracy as a trade-off. However,
this method has not been tried on CNN architecture with different dimension, such
as 1D CNN and 3D CNN. Hence, this research tries to observe the performance of
knowledge
distillation method applied to 1D CNN and 3D CNN architecture.
The result shows that distilled 1D CNN model can shorten both training and
inference runtime, with 17,44% reduction in accuracy compared to the original
model. Distilled 3D CNN model can shorten the inference runtime yet with slower
training runtime in some cases, with 5,83% reduction in accuracy compared to the
original model.
ii
KATA PENGANTAR
Puji syukur penulis panjatkan kepada Allah subhanahu wa ta’ala karena atas izin-
Nya penulis dapat menyelesaikan laporan tugas akhir ini yang berjudul Penerapan
Knowledge
distillation terhadap Arsitektur Convolutional Neural network 1D CNN
dan 3D CNN. Tiada daya dan upaya yang dapat diperoleh penulis dalam menyusun
laporan ini kecuali atas kehendak-Nya.
Tak lupa pula penulis ucapkan terima kasih kepada berbagai pihak yang telah
membantu dalam perjalanan penyelesaian tugas akhir ini. Ucapan terima kasih
khususnya penulis tujukan kepada:
1. bapak Dadi Rosadi dan ibu Praswidhianingsih selaku orang tua penulis yang
tiada hentinya memberikan dukungan moril dan materiil, serta adik penulis,
Luqman Fakhrizal Karim yang tidak bosannya menemani penulis di kala penat;
2. kedua pembimbing, bapak Iwan Awaludin, S.T., M.T. yang selalu siap
menemani penulis berdiskusi, serta ibu Dra. Tati Susilawati, M.T. yang
senantiasa memberikan kemudahan dalam penyelesaian laporan;
3. kedua penguji, ibu Dr. Dra. Nurjannah Syakrani, M.T. yang dengan sabar
memberikan arahan untuk membuat laporan ini menjadi lebih baik, serta bapak
Yudi Widhiyasana, S.Si., M.T. yang memberikan penulis ide terkait
pengembangan topik yang penulis ambil ini ke depannya;
4. PT Kazee Digital Indonesia yang telah memberikan wadah bagi penulis untuk
mengembangkan skill di dunia industri yang relevan untuk menyelesaikan
penelitian ini;
5. bapak Urip Teguh Setijohatmo, BSCS., M.Kom. selaku wali kelas D-IV Teknik
Informatika 2014 dan koordinator tugas akhir, serta ibu Ani Rahmani, S.Si.,
M.T., serta bapak Suprihanto, BSEE., M.Sc. sebagai koordinator mata kuliah
tugas akhir;
6. ibu Santi Sundari, S.Si., M.T. sebagai ketua program studi D-IV Teknik
Informatika dan bapak Drs. Eddy Bambang Soewono, M.Kom. sebagai ketua
Jurusan Teknik Komputer dan Informatika;
7. Eva Danti Rahmanita yang sepenuh hati mendukung penulis dalam mencapai
tujuan, mendorong penulis untuk terus melangkah maju;
iii
8. seluruh pihak yang telah memberikan kepercayaan kepada penulis untuk
membantu penyelesaian skripsi atau tesis mereka, sehingga penulis dapat
memperoleh kesempatan lebih untuk memperdalam pemahaman teoretis
maupun teknis terkait berbagai konsep yang relevan dengan penelitian ini.
Penulis
berharap laporan ini dapat menjadi satu kontribusi dalam pengembangan
ilmu pengetahuan yang manfaatnya dapat dirasakan oleh banyak orang, baik secara
langsung maupun tidak langsung. Kritik dan saran untuk pengembangan penelitian
ini ke depannya akan dengan senang hati penulis terima, karena bagi penulis sendiri,
penelitian yang bermanfaat adalah penelitian yang bisa dikembangkan lagi lebih
lanjut.
Bandung, Juli 2018
iv
DAFTAR ISI
Abstrak ..................................................................................................................... i
Abstract ................................................................................................................... ii
Kata Pengantar ....................................................................................................... iii
Daftar Isi.................................................................................................................. v
Daftar Gambar ...................................................................................................... viii
Daftar Tabel ............................................................................................................ x
BAB I Pendahuluan ................................................................................................ 1
I.1 Latar Belakang ......................................................................................... 1
I.2 Rumusan Masalah .................................................................................... 4
I.3 Hipotesis................................................................................................... 5
v
III.3 Objek Penelitian ..................................................................................... 29
III.4 Data Penelitian ....................................................................................... 29
III.5 Rancangan dan Metode Penelitian ......................................................... 30
III.5.1 Studi Pustaka ........................................................................... 30
III.5.2 Analisis Problem Domain ....................................................... 31
III.5.3 Preprocessing Data untuk Eksperimen ................................... 31
III.5.4 Pengembangan Alat Eksperimen ............................................ 32
III.5.5 Eksperimen.............................................................................. 32
III.5.6 Evaluasi Hasil Eksperimen ..................................................... 38
BAB IV Analisis dan Pengembagan Alat Eksperimen ......................................... 39
vi
VI.2 Saran ....................................................................................................... 72
Daftar Pustaka ....................................................................................................... 73
vii
DAFTAR GAMBAR
Gambar I.1 Pertumbuhan data di era informasi [1]................................................. 1
Gambar I.2 VGG Network, salah satu arsitektur deep neural network ................... 2
Gambar
II.1 Neural network yang merupakan analogi dari sebuah neuron [11] .... 8
Gambar
II.2 Deep neural network serta kalkulasi di dalamnya [12] ..................... 9
Gambar II.3 Visualisasi hasil ekstraksi fitur oleh deep neural network [13] ....... 11
Gambar II.4 Contoh arsitektur convolutional neural network (CNN) [14] .......... 12
Gambar II.5 Contoh kalkulasi dalam proses konvolusi ........................................ 12
Gambar II.6 Koneksi input ke feature map pada convolution layer ..................... 13
Gambar
II.7 Koneksi input ke feature map pada convolution layer (lanjutan) .... 14
viii
Gambar IV.7 Contoh CAD model yang telah mengalami vokselisasi.................. 50
Gambar IV.8 Sampel data ModelNet10 yang telah mengalami vokselisasi [21] . 51
Gambar IV.9 Arsitektur 3D CNN seperti yang menjadi initial state pada penelitian
[10] ................................................................................................ 52
Gambar
V.1 Perbandingan rata-rata runtime training di setiap komposisi hidden
layer pada 1D CNN dengan jumlah data 100% ............................ 58
Gambar V.2 Perbandingan rata-rata runtime inferensi di setiap komposisi hidden
layer pada 1D CNN dengan jumlah data 100% ............................ 58
Gambar
V.3 Perbandingan akurasi student model pada 1D CNN dengan jumlah
ix
DAFTAR TABEL
Tabel II.1 Penelitian terkait arsitektur 1D CNN ................................................... 20
Tabel II.2 Penelitian terkait arsitektur 3D CNN ................................................... 22
II.3 Penelitian terkait metode knowledge distillation ................................. 25
Tabel
Tabel
III.1 Spesifikasi komputer yang digunakan ................................................ 35
Tabel III.2 Parameter dan tujuan dari setiap skenario dalam eksperimen ............ 36
Tabel III.3 Nilai dari variabel bebas yang diteliti ................................................. 37
Tabel IV.1 Contoh data yang terdapat dalam dataset movie review ..................... 40
IV.2 Imbuhan Bahasa Inggris yang dipisah dari kata yang diikutinya ....... 40
Tabel
Tabel
IV.3 Hasil pemisahan imbuhan dari kata yang diikutinya .......................... 41
Tabel IV.4 Sampel kamus kata dan yang diperoleh berdasarkan dataset movie
review ............................................................................................... 43
Tabel IV.5 Representasi matriks dari dokumen terpanjang pada dataset movie
review ............................................................................................... 44
Tabel IV.6. Hasil pengamatan performa arsitektur 1D CNN................................ 47
Tabel IV.7 Hasil pengamatan performa arsitektur 3D CNN................................. 52
Tabel V.1 Spesifikasi dataset yang digunakan pada arsitektur 1D CNN dan 3D
CNN ................................................................................................. 56
Tabel V.2 Hasil teacher model pada 1D CNN dengan jumlah data 100% ........... 57
Tabel V.3 Hasil student model pada 1D CNN dengan jumlah data 100% ........... 57
Tabel V.4 Hasil teacher model pada 1D CNN dengan jumlah data 50% ............. 60
Tabel V.5 Hasil student model pada 1D CNN dengan jumlah data 50% ............. 60
Tabel V.6 Hasil teacher model pada 3D CNN dengan jumlah data 100% ........... 64
Tabel V.7 Hasil student model pada 3D CNN dengan jumlah data 100% ........... 64
Tabel V.8 Hasil teacher model pada 3D CNN dengan jumlah data 50% ............. 67
Tabel V.9 Hasil student model pada 3D CNN dengan jumlah data 50% ............. 67
x
DAFTAR PUSTAKA
[1] A. Fronda, “The New Economy,” World News Media, 8 Januari 2015. [Online].
Available: https://www.theneweconomy.com/strategy/big-data-is-not-without-
its-problems. [Diakses 30 April 2018].
[7] P. Luo, Z. Zhu, Z. Liu, X. Wang dan X. Tang, “MobileID: Face Model
Compression by Distilling Knowledge from Neurons,” dalam 30th AAAI
Conference on Artificial Intelligence, 2016.
[12] J. McCafrey, “Deep Neural Networks: A Getting Started Tutorial,” Visual Studio
Magazine, 13 6 2014. [Online]. Available:
https://visualstudiomagazine.com/articles/2014/06/01/deep-neural-
networks.aspx. [Diakses 20 7 2018].
[13] R. Socher dan C. Manning, Deep Learning for NLP (without Magic), Atlanta,
2013.
73
[14] P. Sermanet dan Y. LeCun, “Traffic sign recognition with multi-scale
Convolutional Networks,” dalam International Joint Conference on Neural
Networks, San Jose, 2011.
[15] Google, “Machine Learning Glossary,” 12 7 2018. [Online]. Available:
https://developers.google.com/machine-learning/glossary/. [Diakses 22 7 2018].
[19] Z. Wu, S. Song, A. Khosla, F. Yu, L. Zhang, X. Tang dan J. Xiao, “3D
ShapeNets: A Deep Representation for Volumetric Shape Modeling,” dalam
Proceedings of 28th IEEE Conference on Computer Vision and Pattern
Recognition (CVPR2015), 2015.
74