You are on page 1of 17

I. PENDAHULUAN 1.

Latar Belakang

Sistem pengenalan wajah banyak dimanfaatkan pada biometrics yang digunakan untuk identifikasi personal pada penggunaan mesin absensi, akses kontrol dan lain-lain. Secara umum sistem pengenalan image tidak menggunakan bitmap pixel secara langsung melainkan ia bekerja pada domain feature. Image direpresentasikan kedalam bentuk feature yang lebih kompak yang kemudian digunakan untuk pengenalan, dengan demikian dapat menghemat komputasi. Berbagai metode ekstrasi feature telah dimanfaatkan seperti metode moment, feature filter Gabor, Wavelet, dan lain-lain. Dalam paper ini akan digunakan 2 metode ekstrasi feature secara statistik yang secara luas telah lama digunakan yaitu PCA (Principal Components Analysis) dan LDA (Linear Discriminant Analysis) .

Metode PCA dikenal juga dengan nama Karhunen-Loeve transformation (KLT), yang telah dikenal sejak 30 tahun dalam dunia pengenalan pola. PCA memberikan transformasi ortogonal yang disebut dengan ‘eigenimage’ yang mana sebuah image direpresentasikan kedalam bentuk proyeksi linier searah dengan eigenimage yang bersesuaian dengan nilai eigen terbesar dari matrix covariance (atau scatter matrix). Secara praktis matrix covariance ini dibangun dari sekumpulan image training yang diambil dari berbagai obyek/kelas. PCA memberlakukan properti statistik yang sama bagi seluruh image training dari berbagai obyek/klas. Tidak demikian halnya pada LDA, ia memberlakukan properti statistik yang terpisah untuk tiap-tiap obyek. Tujuan dari LDA adalah mencari proyeksi liniear (yang biasa disebut dengan ‘fisherimage’), untuk memaksimumkan matrix covariance antar obyek (between-class covariance matrix) sementara itu juga meminimumkan matrix covariance didalam obyek itu sendiri (within-class covariance matrix). Bila tersedia image training yang cukup representatif dalam jumlah maupun variasi bentuk untuk tiap-tiap obyek maka metode ekstraksi LDA akan menunjukan performa yang lebih baik dari pada PCA seperti yang ditunjukan pada hasil-hasil percobaan dalam paper ini.

1

Maka akan didapatkan image greyscale. Dalam proses training digunakan gabungan 2 metode. sedangkan LDA digunakan sebagai classifier. dan dibandingkan dengan image yang menjadi training pada database. yaitu PCA dan LDA. 2. Bila masing-masing 8 bit itu memiliki nilai yang sama. Warna RGB terdiri dari 24 bit. Ketiga warna ini di campur bersama maka akan diperoleh warna putih atau warna hitam tergantung nilai RGB dari pixel-pixel tersebut. System warna RGB merupakan system warna standard yang dipakai. Green dan Blue. PCA digunakan untuk mereduksi dimensi dari image-image yang diproses. hijau dan biru. TUJUAN Untuk membuat software yang dapat mengidentifikasi wajah seseorang berdasarkan eigen face yang dimiliki suatu image. 3. Untuk metode pengenalannya. RUANG LINGKUP PEMBAHASAN Dalam makalah ini beberapa hal terkait yang akan di batasi dalam pembahasan antara lain : 1. Dalam makalah ini. di gunakan image-image greyscal. System warna RGB adalah kombinasi aditif dari ketiga warna utama merah.masing-masing 8 bit untuk Red.2. yaitu membagi image-image tersebut dalam kelas-kelas yaitu berbeda. 2 . digunakan metode PCA (Prinsipal Component Analysis) + LDA (Linear Discriminant Analysis). dengan tujuan untuk mempertinggi tingkat pengenalan program ini.

Dengan ekspresi lain dapat dituliskan n sebagai ℜ . Berikutnya sebuah image x (berdimensi n) dapat diekstraksi kedalam feature baru y (berdimensi m < n) dengan memproyeksikan x searah dengan Φ sebagai berikut: m y = Φm x (3) 3 . x2 . X c } . Image training yang digunakan sebanyak K sampel dinyatakan dengan {x1 . Dengan dekomposisi eigen... Pemilihan eigenvector ini menghasilkan matrix transformasi atau matrix proyeksi Φ .. xK } yang diambil dari sebanyak c obyek/kelas yang dinyatakan dengan { X 1 .. yang mana terdiri dari m kolom eigenvector terpilih m yang biasa disebut juga dengan ‘eigenimage’.II. Total matrix scatter S T (atau matrix covariance) didefinisikan sebagai berikut: S T = ∑ ( x k − µ )( x k − µ ) T k =1 K (1) dimana µ adalah rata-rata sampel image yang diperoleh dengan merata-rata training image {x1 . ALGORITMA PRINCIPAL COMPONENTS ANALYSIS (PCA) 1. adalah ruang image dengan dimensi n. dan Λ adalah is a diagonal matrix dari nilai eigen... matrix covariance ini dapat didekomposisi menjadi: T ST = Φ Λ Φ (2) dimana Φ adalah matrix eigenvector. X 2 . Principal Components Analysis (PCA) Sebuah image 2D dengan dimensi b baris dan k kolom dapat direpresentasikan kedalam bentuk image 1D dengan dimensi n (n=b*k). Kemudian dipilih sejumlah m kolom eigenvector dari matrix Φ yang berasosiasi dengan sejumlah m nilai eigen terbesar. xK } ....... x2 .

dengan demikian PCA akan menyertakan variasi iluminasi didalam eigenimage-nya. S T = S W + S B . 2.n Dengan kata lain metode PCA memproyeksikan ruang asal ℜ kedalam ruang baru m yang berdimensi lebih rendah ℜ . sedangkan S W sebisa mungkin diminimalkan agar anggota didalam kelas lebih terkumpul penyebarannya yang pada akhirnya dapat meningkatkan keberhasilan pengenalan. Sesungguhnya yang diinginkan adalah hanya maksimalisasi S B saja. Disini terlihat reduksi feature yang signifikan dari n buah menjadi m buah yang tentunya akan sangat meringankan komputasi dalam proses pengenalan berikutnya. kekurangan utama yang terlihat disini adalah bahwa dalam proses PCA ke dua matrix scatter ini termaksimalkan bersamasama. Total matrix scatter S T diatas sesungguhnya adalah jumlahan dari matrix scatter dalam kelas (within-class scatter matrix) S W dan matrix scatter antar kelas (between-class scatter matrix) S B yaitu. Bila ini terjadi. Dengan metode LDA. dan matrix scatter antar kelas S B didefinisikan masing-masing sebagai berikut: SW = ∑ c c i =1 xk ∈X i ∑( x k − µ i )(x k − µ i ) T (4) S B = ∑ N i ( µ i − µ )(µ i − µ ) T i =1 (5) 4 . Linear Discrimination Analysis (LDA) Matrix scatter dalam kelas S W . Dengan demikian. yang mana sebanyak mungkin kandungan informasi asal tetap dipertahankan untuk tidak terlalu banyak hilang setelah dibawa ke dimensi feature yang lebih kecil. dan konsekuensinya PCA menjadi tidak handal terhadap variasi iluminasi yang terjadi pada obyek. Misalkan pada variasi perubahan iluminasi maupun skala dari image yang terjadi pada obyek yang sama. dapat menyebabkan matrix scatter dalam kelas menjadi besar yang cukup menyulitkan dalam proses pengenalan. S W akan diminimisasi sehingga ekstrasi feature yang dihasilkan menjadi lebih handal terhadap variasi yang terjadi didalam kelas.

dan Λ adalah matrix diagonal nilai eigen.dimana N i adalah jumlah sampel pada kelas X i . Kembali dilakukan pemilihan sebanyak l kolom eigenvector dari Ψ yang berasosiasi dengan nilai-nilai eigen terbesar. Image input yang hendak dicari identitasnya ditransformasikan kedalam bentuk feature yang selanjutnya dengan classifier nearest neigbor akan dikenali identitasnya. Seperti diutarakan sebelumnya bahwa sangat diharapkan agar matrix scatter dalam kelas SW bisa diminimalisasi sementara matrix scatter antar kelas SB dimaksimalkan. Dengan kata lain akan dicari matrix proyeksi Ψ agar ratio persamaan (6) l menjadi maksimal. 5 . det( Ψl S B ΨlT ) det( Ψl S W ΨlT ) (6) Kriteria ini menghasilkan solusi dengan persamaan sebagai berikut : S B Ψ = SW Ψ Λ (7) dimana Ψ adalah matrix eigenvector. dan µi adalah image rata-rata dari kelas X i . Dengan kata lain akan dicari eigenvector dan eigenvalue dari matrix C yang merupakan kombinasi within & beetwin scatter matrix seperti pada persamaan 8. yang mana disini digunakan feature reduction menggunakan PCA yang dilanjutkan dengan LDA. DESKRIPSI SISTEM Blok diagram sistem pengenalan wajah dapat dilihat pada gambar 1. Pemilihan l kolom eigenvector ini menghasilkan matrix proyeksi digunakan untuk ekstraksi feature seperti halnya pada PCA. Ψ yang selanjutnya l 3. Sebagian image digunakan sebagai training dataset untuk ditransformasi kedalam bentuk feature yang disimpan dalam database.

Ringkasan dari seluruh algoritma PCA + LDA adalah sebagai berikut : Masukkan data pixel semua image training ke matriks u Cari matriks C Cari eigen value () dan Eigen vector (V) dari matriks C Cari matriks feature PCA Transpose matriks f. Blok Diagram Sistem Pengenalan Wajah. lalu cari Cari eigen value () dan Eigen vector (V) dari matriks C Cari matriks feature LDA Gambar 2. Ringkasan Ekstraksi Feature PCA + LDA 6 .Raw image PCA + LDA Feature Reduction Image Feature Classifier -Database- Identity Feature PCA + LDA Feature Reduction Training Set Gambar 1. dan anggap sebagai input bagi LDA Cari Sb dan Sw.

Mencari image rata-rata Image Rata-Rata adalah rata-rata dari semua pixel image-image training. dimana m adalah jumlah image training. u= 1 m ∑u1.000 pixels. Dengan dekomposisi eigen berlaku : 7 . . .    u 10000 . u10000 . u10000 . didapatkan matriks rata-rata total PCA dengan dimensi 10. .1  u  2. 2 u1. . m   .  . yaitu:  u 1. 2 . . .1.m   . Matriks yang merepresentasikan image-image tersebut berdimensi 10. . adalah :  u1. 2 u 2.1    (11) 3.000 x m.1    . m  u 2. . 2. u10000 .   . Mencari covariance matriks PCA Matriks covariance PCA dapat dicari dengan rumus sebagai berikut : C = uT × u (12) Matriks covariance dengan dimensi m x m.k m k =1 (10) Dari matriks di atas.  u =  . .1  (9) u1.1 u = .   .000 x 1. Masukkan data pixel image training ke dalam matriks u Misalkan terdapat m image training dengan masing-masing berdimensi 100 x 100 pixels = 10.

kanan. Eigen faces ini dapat dijadikan pembanding saat merecognize suatu image. 4. belakang. Dua belas Eigen faces Pertama. Proyeksi raw input image ke ruang eigen dapat dihitung menggunakan rumus berikut: f = ∑(I m i= 1 i −u ) T ×V (14) m =jumlah image training Ii = Image input u = Image rata-rata total V = matriks eigen vector 8 . Selanjutnya feature f disimpan dalam database untuk kemudian digunakan pada proses pengenalan. beserta dengan image rata-rata digunakan untuk mentransformasikan raw image ke dalam ruang feature f. Eigen faces yang didapatkan ini dapat dilihat dalam ilustrasi di bawah ini : Gambar 3. Mencari feature PCA Eigen vector hasil proses pada langkah 3. Dalam eigen faces di atas dapat dilihat bahwa dapat dibedakan antara wajah yang menghadap ke depan.C ×V = λ ×V (13) Hitungi eigen value ( λ ) dan eigen vector (V) dari matriks C menggunakan metode Jacobi. Eigen value dan eigen vector yang bersesuaian diurutkan secara descending .

Mencari feature LDA Feature LDA dicari dengan rumusan yang sama dengan feature PCA sebagai berikut: m f LDA = ∑ I i − u LDA i =1 ( ) T × V LDA (15) 4.5. PERANCANGAN SISTEM 9 . Disini dipilih harga n dalam kisaran 10 s/d 70 dan kemudian diamati keberhasilannya. III. Dengan 2 informasi matrix scatter ini maka dihitung covariance matrix C (persamaan 8) lantas dicari eigen value dan eigen vector dari matrix C tersebut. Selanjutnya feature hasil PCA digunakan sebagai input pada proses LDA LDA memisahkan tiap image ke dalam class yang berbeda. 6. b ) = ∑ (b i =1 n i − ai ) 2 (16) Variabel de adalah jarak antara feature a dan b dalam ruang dengan feature n dimensi. d e ( a. Pada contoh database. PENGENALAN DENGAN NEAREST NEIGHBOR Metode recognition yang digunakan disini adalah nearest neighbour. Class adalah kumpulan image yang dimiliki oleh seseorang yang sama. Distance dicari dengan menggunakan rumus. ada 12 orang masing-masing memiliki 10 image training. Matrix scatter dalam kelas S W . Selanjutnya eigen vector ini digunakan untuk transformasi feature PCA kedalam bentuk feature LDA. Sedangkan pada LDA kita akan memiliki 12 class. dan matrix scatter antar kelas S B dihitung dengan persamaan 4 dan 5 diatas. masing-masing terdiri dari 10 buah image training. Pada perhitungan PCA akan didapat 1 buah kumpulan image terdiri dari 120 image training (jika semua image dijadikan training). Metode ini menghitung distance minimum antara feature image test dan masing-masing feature image training. dalam ini n adalah jumlah feature yang diambil.

Beberapa test yang telah dilakukan menunjukkan hasil recognition rate seperti bisa dilihat pada table berikut ini : Tabel 1. PERANCANGAN SISTEM DATABASE Sistem dibangun menggunakan platform PC dengan penulisan program komputer menggunakan Delphi. 3 image test 7 image training. Sistem juga diuji menggunakan Yale faces database yang terdiri dari 14 orang dengan masing-masing 9 image. 14 orang 6 image training. Sistem diuji menggunakan berbagai image database yang diambil menggunakan kamera digital yang terdiri dari 12 orang dengan masing-masing 10 image. Tampilan program yang dibuat adalah seperti gambar 4. 2 image test @ 9 image multi expression Recognition Rate PCA Only PCA + LDA 48 % 48 % 68 % 68 % 73 % 78 % 58 % 69 % 95 % 90 % 96 % 100 % 10 . 4 image test 7 image training. 3 image test Multipose 8 image training. Jumlah feature hasil reduksi dicoba dalam range 10 sampai 70 buah. Size image adalah 100x100 pixel. 2 image test Image training bervariasi Yale Faces.1. Recognition Rate Database 12 orang @ 10 image 6 image training. Metode pengenalan pola menggunakan nearest neighbor sederhana dan dihasilkan recogntion rate antara 80-90% dengan berbagai variasi penambahan noise dan oklusi. yang secara umum terdiri dari 2 modul yaitu modul training dan modul testing. Modul training menghasilkan parameter eigenvector dan image rata-rata baik untuk PCA maupun LDA.

dalam hal ini menggunakan filter add noise dan ripple distortion. bahkan dengan jumlah feature yang lebih sedikitpun. Screen Shot Tampilan Program. IV. Pengujian dengan menggunakan tambahan noise tidak banyak berpengaruh pada recognition rate di atas. Secara umum kombinasi PCA+LDA memberikan hasil yang lebih baik. Gambar 5. PENGUJIAN SISTEM 11 .0.Gambar 4. Noise dibuat dengan bantuan Adobe Photoshop 7. Penambahan Noise pada Test Image.

Jumlah image training secara keseluruhan 2. dalam hal ini nama orang yang bersangkutan contoh-contoh dari image yang terlihat pada gambar 4.1 Gambar 6 Contoh Image Training 1. Jumlah feature yang diambil untuk di hitung Class yan dimaksud disini adalah kumpulan image-image training yang dimiliki oleh satu orang yang sama. Jumlah image training yang terdapat dalam satu class 3.Tinggi rendahnya recognition percentage dari metode PCA dan LDA tergantung pada beberapa variabel sebagai berikut : 1. Tiap class dipisahkan oleh identitas ornag tersebut. 12 ORANG DENGAN MASING-MASING 8 IMAGE TRAINING DAN 2 IMAGE TEST 12 .

Dapat dilihat pada gambar 4.3 13 . Hasil terbaik didapat pada jumlah feature sebesar 60 feature. Grafik hasil tes selengkapnya dapat dilihat pada gambar 4. yaitu sebesar 70 %.Dalam tes ini diambil sample dari 12 orang yang berbeda. didapat 1 buah image rata-rata dan 96 buah image eigen faces. Setelah diproses dengan metode PCA.2 Gambar 7 Image Rata-Rata dan 12 Egen Face Pertma dari 12 Orang dengan 8 Image Training Dari pengujian yang dilakukan. masing-maing memiliki 8 buah image training dan 2 buag image test. didapat hasil recognition percentage maksimum oleh metode PCA + LDA. Metode PCA menghasilkan recognition percentage maksimum sebesar 73 % saja.

Gambar 8 Grafik Recognition Percentage dari 12 orang dengan 8 Image Training dan 2 Image Test PCA Recognition Image Test LDA Recognition Gambar 9 Contoh Hasil Recognition 12 orang dengan 7 image training dan 3 image test LISTING PROGRAM 14 .

procedure TFromIsiGambar. for i : = 0 to 9999 do begin dcolor1 : = round(MatRataRata[i.dcolor2. begin for y : = 0 to 9999 do begin tempcol : = 0. KESIMPULAN 15 . dcolor1.Canvas.Assign(ImageTemporary2. var I. end.0]) or dcolor3.0])} sh1 8.j. imageTemporary2. for z : = 0 to JumlahImage-1 do begin tempcol : = tempcol + MatRataRataTemp[y. tempcol : extended.z: integer. MatRataRata[y. dcolor2 : = dcolor1 sh1 8.0] : = (tempcol / JumlahImage).Bixels [ i civ 100. dcolor3 : = dcolor1 or dcolor2.z].picture). end. ciipboard.CariRata2Image(JumlahImage : integer). end.y. end. i mod 100] : = round (MatRataRata [i.dcolor3 : tcolor.

DAFTAR PUSTAKA 16 . Bahkan dengan jumlah feature yang sedikit PCA+LDA memberikan hasil yang lebih baik bila dibangdingkan dengan penggunaan PCA saja. jumlah feature yang optimal berada di antara 30 – 60 untuk database dengan 12 orang.Dari hasil percobaan ternyata secara umum bila variasi image training cukup tinggi (misalnya: iluminasi dan ekspresi) maka penggunaan PCA+LDA akan memberikan kontribusi yang tinggi. dan antara 50 – 70 untuk Yale Faces Database. dengan recognition rate maksimum 78 %. masing-masing 7 image training. dengan recognition rate maksimum 100 %. Pengambilan jumlah feature yang dihitung harus dipertimbangkan. Jumlah feature yang benar-benar optimal bisa didapatkan dengan melakukan eksperimen berulang-ulang. Dari eksperimen yang telah dilakukan. Metode pengenalan pola perlu dikembangkan lebih lanjut misalnya menggunakan neural networks atau metode-metode statistik lainnya seperti support vector machine misalnya. Bila terlalu sedikit atau terlalu banyak akan menurunkan recognition percentage. masing-masing 8 image training.

Second Edition. Belhumeur. and D. Vol. Numerical Recipes In C. PAMI. 1991. 17 .. Vol. 1995. pp. J. 5. [6] Nayar. 1996.N. Pentland. no. et. "Eigenfaces for recognition. 1997. vol. Etemad and R. Cambridge : Cambridge University Press. 19. "Eigenfaces vs. William H. Chellappa. Kriegman. No. Wilson. al. 705--740. July 1997." Proceedings of the IEEE. IEEE Trans. The Art Of Scientific Computing. 71-86. 7. 83. Chellappa.[1] R. [5] Press.J. [4] P. Turk and A. Sirohey. [2] M. and Tomaso Poggio." Journal of Cognitive Neuroscience. 1995. pp. fisherfaces: Recognition using class specific linear projection". Hespanha." Journal of Optical Society of America A.. [3] K. "Human and machine recognition: A survey. 1724-1733. pp. Aug. 3. Early Visual Learning. and S. "Discriminant Analysis for Recognition of Human Face Images. Shree K. Oxford : Oxford University Press.P. C.