Seminar Nasional Teknologi Informasi 2005
2
sesedikit mungkin namun memiliki nilai informasi yangtinggi. Hal ini sangat berguna dalam keadaan di manatersedia data contoh yang jumlahnya sangat banyak,sedangkan sebagian data tersebut mungkin bersifatredundan, sehingga membuat proses training menjadi tidak efisien [6].
2.2 Supervised Learning dengan Multi-LayerPerceptron
Salah satu metode yang banyak digunakan untuk klasifikasi pola adalah dengan menggunakan jaringansyaraf tiruan. Jaringan syaraf tiruan adalah suatu sistempemrosesan informasi yang cara kerjanya memilikikesamaan tertentu dengan jaringan syaraf biologis [5].Multi-Layer Perceptron adalah jaringan syaraf tiruan
feed-forward
yang terdiri dari sejumlah neuron yangdihubungkan oleh bobot-bobot penghubung. Neuron-neuron tersebut disusun dalam lapisan-lapisan yang terdiridari satu lapisan input (
input layer
), satu atau lebih lapisantersembunyi (
hidden layer
), dan satu lapisan output(
output layer
). Lapisan input menerima sinyal dari luar,kemudian melewatkannya ke lapisan tersembunyi pertama,yang akan diteruskan sehingga akhirnya mencapai lapisanoutput.Setiap neuron
i
di dalam jaringan adalah sebuah unitpemrosesan sederhana yang menghitung nilai aktivasinyayaitu
s
i
terhadap input eksitasi yang juga disebut net input
net
i
.
∑
∈
−=
)(
i pred jiij ji
wsnet
θ
(1)dimana
pred(i)
melambangkan himpunan predesesor dariunit
i
,
w
ij
melambangkan bobot koneksi dari unit
j
ke unit
i
, dan
θ
i
adalah nilai bias dari unit
i
.Tujuan dari pembelajaran
supervised learning
adalahuntuk menentukan nilai bobot-bobot koneksi di dalam jaringan sehingga jaringan dapat melakukan pemetaan(
mapping
) dari input ke output sesuai dengan yangdiinginkan. Pemetaan ini ditentukan melalui satu set polacontoh atau data pelatihan (
training data set
).Setiap pasangan pola
p
terdiri dari vektor input
x
p
danvektor target
t
p
. Setelah selesai pelatihan, jika diberikanmasukan
x
p
seharusnya jaringan menghasilkan nilai output
t
p
. Besarnya perbedaan antara nilai vektor target denganoutput aktual diukur dengan nilai error yang disebut jugadengan
cost function
:
∑∑
∈
−=
P pn pn pn
st E
2
)(21(2)di mana
n
adalah banyaknya unit pada
output layer
.Tujuan dari training ini pada dasarnya sama denganmencari suatu nilai minimum global dari
E
.Salah satu algoritma pelatihan jaringan syaraf tiruanyang banyak dimanfaatkan dalam bidang pengenalan polaadalah backpropagation. Algoritma ini umumnyadigunakan pada jaringan syaraf tiruan yang berjenis multi-layer feed-forward, yang tersusun dari beberapa lapisandan sinyal dialirkan secara searah dari input menujuoutput. Secara matematis, ide dasar dari algoritmabackpropagation ini sesungguhnya adalah penerapan dariaturan rantai (
chain rule
) untuk menghitung pengaruhmasing-masing bobot terhadap fungsi error [9].Algoritma Quickprop merupakan pengembangan darialgoritma backpropagation yang diusulkan oleh Fahlman[4]. Pada algoritma Quickprop dilakukan pendekatandengan asumsi bahwa kurva fungsi error terhadap masing-masing bobot penghubung berbentuk parabola yangterbuka ke atas, dan gradien dari kurva error untuk suatubobot tidak terpengaruh oleh bobot-bobot yang lain.Dengan demikian perhitungan perubahan bobot hanyamenggunakan informasi lokal pada masing-masing bobot.Eksperimen dengan masalah XOR dan encoder/decoderoleh Fahlman [4], dan eksperimen dari Schiffmann [10]menunjukkan bahwa algoritma Quickprop dapatmeningkatkan kecepatan training.
3. Cara Penelitian
Dalam penelitian ini digunakan data yang terdiri darisatu set citra untuk pelatihan (
training data set
) dan satuset citra untuk pengujian (
testing data set
). Untuk datapelatihan digunakan citra wajah berukuran 20x20 pixelsebanyak 3000 buah. Sedangkan untuk citra non-wajahdiperoleh dari file-file citra yang tidak terdapat wajahmanusia di dalamnya.Sistem ini menggunakan jaringan syaraf tiruan (JST)dengan arsitektur yang diadaptasi dari penelitian Rowley[8], namun lebih disederhanakan. Lapisan input terdiri dari400 unit input, yang menerima masukan dari nilaigrayscale pixel 20x20 dari subcitra yang akan dideteksi.Lapisan output terdiri dari sebuah unit dengan nilaikeluaran berkisar antara –1 dan 1. Pada training data setdidefinisikan nilai 1 untuk data wajah dan –1 untuk datanon-wajah.Lapisan tersembunyi (
hidden layer
) terdiri dari total25+16=41 unit. Bagian pertama terhubung dengan lapisaninput yang membentuk 25 area berukuran 4x4 pixel.Bagian kedua terhubung dengan lapisan input yangmembentuk 16 area berukuran 5x5 pixel. Secarakeseluruhan jaringan ini memiliki 883 bobot penghubung,sudah termasuk bias. Jaringan ini lebih sederhanadibandingkan dengan sistem [8] yang jumlah bobotpenghubungnya mencapai 4357.
3.1 Pelatihan dengan Metode Active Learning
Pelatihan dilakukan secara bertahap denganmenggunakan metode
active learning
seperti yang