You are on page 1of 6
www forvel2 ” wil , FORE gi Teknik Elektro indones!* Forum Pendidikan Ting cr PROGRAM BOOK EDISI Il . KONFERENSI NASIONAL KE-7 Forum Pendidikan Tinggi Teknik Elektro Indones!# (FORTE!) 2013 oO PADANG, 26 - 28 SEPTEMBER 2013 JURUSAN TEKNIK ELEK TRO UNIVERSITAS ANDALAS * Evaluasi Kinerja Metode Histogram Ekualisasi untuk Binerisasi Citra Dokumen Sintetis Secara Objektif dan Subjektif Fitri Amial?, Afkar!, Sayed Muchallil!, Fardian', Khairul Munadi!? = "Jurusan Teknik Elektro, Universitas Syiah Kuala, Banda Acch “Program Studi Magister Teknik Elektro, Universitas Syiah Kuala, Banda Aceh Abstract—Indonesia memiliki banyak naskah kuno yang Kondisinya kurang terawat schingga akan terancam musnah bila tidak segera direstorasl. Beberapa badan pensimpan naskah kune felah melakukan restorasi seeara konvensional Namun, proses tersebut thdak dilti pengolahan lanjutan apapun. Naskah seperti ial belua bisa ddimanfaathan secara maksimal, misalnys tidak bisa dibaca isinya olch mesin pencari. Agar is uno dapat ddibace mesin pencari, diperlukan serangkalan pengolahan digial, salah satunya adalah binersasl Makalah ai mengevaluasi kinerjx dari metode bincrsash_berbasis histogram —ehualisasi_(metode HE) secara_objehif mengenaksn dan secara subjehtif menggunakan MOS, pada dokumen sinteis dengan karakter Arablk. Uatuk “Keperiean evaluasi ini, diperiaphan dokumen greundsrwch dan dokumen siatetis. Metode HE ibandingkan dengan metode Otsu yang berperan sebagai bench-merh. Hasil simelasi mesunjakhan bahwa (1) metede pengekarae ebjektif tidak selale sejalan dengan enguhuran subjekti, dan (2) metode HE potensal igenakas sebazat metode binersasi dokamen huso yong meeqandeng sete alarmist. Kepwords—naskah Kune, binerisas, histogram ekualisasl, PSNR. MOS 1. PEXDANULUAN Indonesia memiliki banyak dokumen (naskah) kuno yang berusia ratusan tabun. Dokumen kuno tersebut tidak ‘crnilai harganys karcna berist ilmy pengetahuan, budaya, ‘astra dan sejarah dari masa lala. Sayang selali, dokumen tersebut, yang disimpan oleh masyarakat atau museum, tidak mendapst perhatian yang sclayaknya. Secara unam, Kondisinys tidak terawat sehinggs akan terancam musnah bila tidak segera direstorasi. Beberapa badan penyimpan naskah uno telah melakukan restorasi secara onvensional dan/atau dipitalisast dengan cara memindai ats memotret naska kuno. Naman, proses terscbut tidak diikuti pengolaban Ianjutan apapun. Naskab seperti ini belumn bisa dimanfaatkan secara maksimal, misalnya tidak bisa dibaca isinya oleh mesin pencari, Selain itu, naskah hhasil digitalisasi biasanya membawa serta terkandung pada dokumen kuno seperti variasi iluminast pada latar belakangnya, corctan, tinta melobor serta penurunan kualitas kertas dan kejelasan tinta karena pengaruh usin ‘Untuk dapst memanfaatkan isi _naskah Kuno, diperlukan serangkaian pengolahan, yaitu (1) peningkatan kualitas citra dokumen, (2) binerisasi dan (3) pembacaan naskah oleh Optical Character Recognition (OCR). Keluaran OCR adalah dokumen yang dapat Cretan mesin pencari. Tahap peningkatan kualitas citra bertyjuan ‘untuk meminimalisasi noise. Binerisasi adalah proses segmentasi teks (tulisan) dari latar _belakangnya. Binerisasi memegang peranan yang penting, karena ia ‘mempengaruhi tingkat keberhasilan pembacaan OCR [1]. ‘Sampai saat ini banyak sekali teknik evaluasi kinerja metode binerisasi yang telah diajukan oleh para peneliti. ‘Setidaknya ada empat cara yang umum digunakan, yaitu: (1) menggunakan manusia sebagai evaluator, (2) menggunakan mesin OCR dan hasilnya dicvaluasi berdasarkan ketepatan setiap hurufkata, (3) dengan terlebih dabulu dokumen ground-truth, untuk anti dibandingkan dengan dokumen hasil binerisasi pada tingkat piksel, dan (4) menggunakan kombinasi dari ketepatan pembacaan OCK dan evalt smanusia (2) ‘Salah satu metode binerisasi dokumen kuno adalah bincrisasi berbasis ckualisasi histogram [3]. Pada metode ini, nilai ambang yang merupakan pemisah antara icks dan latar belakang ditentukan dengan mengambil nilai terendah pada lembah pertama yang ada pada histogram ‘yang telah dickualisasi. Untuk dokumen kuno yang ‘mengandung noise alamiah berupa ‘or’, metode binerisasi ini terbukti lebih bagus —_kinerjanya dibandingkan dengan metode Otsu. Sclanjutnya, pada [4] diteliti tentang kinerja metode binerisasi_ menggunakan histogram ckualisasi untuk dokumen dengan karakter huruf latin, Makalah [4] melaporkan bahwa metode histogram ekualisasi lebih sesuai untuk binevisasi dokumen dengan noise alamiah. Makalah ini mengevaluasi kinerja dari metode bincrisasi berbasis histogram ckualisasi secara objektif mengunakan PSNR dan secara subjektif menggunakan MOS, pada dokumen dengan karakter Arabik. Untuk Aeperluan evaluasi ini, dibangkitkan dokumen grownd- truth dan dokumensntetis..Dokurnen ground-iruth diperlukan Khususnya untuk evaluasi kualitas secara objektif; Metode berbasis ckualisasi histogram dibandingkan dengan metode Otsu [5] yang berfungsi sebagai hench-mark. Hasil simulasi menunjukkan bahwa metode pengukuran objektif tidak selalu sejalan dengan pengukuran subjeki. Selain itu, hasil —evaluasi menunjukkan bahwa metode binerisasi berbasis histogram chualisasi potensial digunakan sebagai metode bincrisasi dokumnen kuno yang mengandung noise alamiah Page 151 of 179 Repo esiegs, Saas taa Pe SsedsSp SPOTS} alg) | ares: | NAb Sh Sty Seats SU Seuss! Cea ny Dp STe Rese oe EWES nageakbotee Peet Sy Sa OM Se ee ON RRR SES EHS Sah EA TL Cet (fo. Dokiumen dengan rulisn tanpa noise (dokumen are (dokumen ground= SEBS os (©) Dokamen ‘Gambar 1, Dokumen 370% 1, MeTooe Penetitian ini dilaksanakan dengan simolasi Komputer, Sedangkan bahan yan ipakai sebagai sree aroundtrath scalsk dokumen natat uno Jang. bebas noise. Parameter pengukie Kinerja_ secara Mekif adalah peak signal 10 nolse rae’ PSNR) dan sosara subjektif digunakan mea opinion sore (MOS). ‘A. Pembangkitan Dokimen Ground-irh dan Dokumen Simetis Petimen groundruth adalah cia dole yang tees moje, Citra i ennuiandigabunekan dengan cita Forum Pendidikan Tinggt Teknik Elektro Ini http://fortei2013.com st alplies Wy sas ‘rita gabungan eta) dab) (@) Lata belakang Lr Seah ee die Dy at ests Wo lidToge are toys are Sa oS SSRs and-rth, tar elakang yang engandung noise dan zabungan Keany® Iotarbelakang yong mengandung noise shite tervontuk etra dokumen sintts. itt dokumen S40 njadi masukan metode binersasl Pate ground-rath, 6 belakang dan etre eda, ni yang akan Gambar 1 dapat dilhat citra dokurmen poise yang difungsikan sebagai late okumen sintetis yang merupakan gabungan 1B. Parameter Pengukur Kinet} ja mevode bineisasi_berbans histogram busiest dinkuc scare objet tan subjetil aura scaa objet menus Pk sigual 10 idonesia (FORTE!) 2013 Page 152 of 179 we ratio (PSNR) dan secara subjektif- menggunkan ‘mean opinion score (MOS). PSNR dihasilkan dengan menghitung perubahan piksel antara.citrn ground-eruth dengan citra asl binerisasi sesuai dengan persaman (1), Jika ailai PSNR. tinggi, maka citra hasil binerisasi dianggap memilki ‘kualitas yang baik, dan sebaliknya. Dalam prakicknya, asumsi ini tidak selala sejalan dengan persepsi mata ‘manusia. Pada persamaan (1), konstanta dengan nilal 255 ‘menunjukkan banyaknya tingkat nilai keabuan pada sistem bit. Selanjutnya, MSE dirumuskan sesuai dengan ersamaan (2). Pada persamaan (2), (lj) adalah nilai pikse! pada citra ground-trwth, dan g()) adalah rial piksel pada citra hasl binerisasi. Pada citra yang identi, hilai MSE akan sama dengan nol, menghasilkan silai PSNR yang tak hingga PSNR = 201093 a dengan se = Beunzeost eh MOS didasarkan pada pendapat dari responden. Pada MOS, penilaian yang diberikan responden memiliki skala antara angka 1 hingga $. Angka 1 menyatakan kualitas yang paling buruk, angka 2 menyatakan kualitas kurang, ‘angka 3 menyatakan cukup, angka 4 menyatakan kualits baik dan angha 5 sempurna C. Alur Simutasi Untuk mendapatkan hasil bincrisasi dari metode berbasis histogram ekualisas, diikutialursimulasi seperti ditunjukkan pada Gambar 2. Simulasi dibagi menjadi dua bagian, simulasi menggunakaan nilai ambang global dan. fokal. Citra masukan adalah citra sintetis yang ditunjukkan pada Gambar I(¢). Sebagai_pembanding. digunakanmetode Otsu yang juga diterapkan secara global dan lokal. Sehinggs, secara keseluruhan terdapat 4 Kelompok simolasi, Untuk perhitungan nilai ambang seearalokal, citra dibagi menjadi menjadi 16 bagian. HL Hasic asl binerisasi ditunjukkan pada Gambar 3. Gambar 4 (a) adalah hasil binerisasi dengan metode histogram “kualisasi (HE) yang diterapkan secara global. Sementara Gambar.3(b). (€) dan (4) berturut-turut adalah asi metode HE yang diterapkan secara fokal, metode Otsu Yang diterapkan sccara global dan metode Otsu yang Ziteropkan secara Jokal. Selanjutnya pada Tabel | dan I ddicantuenkan hasilperhitungan PSNR. dan MOS untuk compat kelompok simulasi yang dilaksanakan, Data ‘yang tertera pada Tabel If adalah nilairatarata MOS dari 50 responden. aia rasan seta ror scle Je ae. Tue agra ea ue =F euasau tatogam —1— teresa ras arg cna beet cada Noga cans sein Be een ola wba] ean sting ee | “ira bret an ap te bung otra bine (Gaba? Aa Sis IV. DsKust Pada proses binerisasi, citra dokumen masukan ‘mengalami satu diantara dua perlakuan, yaitu dengan atau taspa pembagian (dling). Pengeumaan tiling bertojuan taluk mengantisipasi menurunaya kinerja binerisasi pada latar belakang yang tidak homogen, seperti naskah yang, smengandung noise pads beberapa bagian saja, noise pada satu bogian lebih tebal dibandingkan pada lokasi Iain dan Kecerahan yang tidak seragam pada scluruh bagian raskah, Latar_belakang yang tidak homogen ini menyebsblan diperlakanaya penentuan nilai ambang yang. betbeda-beda untuk setiap bagian, Untuk itulah proses tiling diperlukan. Dengan tiling dissumsikan nilsi ‘ambang yang dipilh untuk suatu rile adalah nilai ambang ‘yang paling optimum, yang menghaslkan citra dokumen hasi binerisasi yang paling baik. Asumst in terbukti dari nilai PSNR untuk metode Otsu yang diterapkan secara fokal, yang tertcra pada Tabel I kolom keempat, yaitu sebesar 43,8 dB, Sebaliknya asumsi trsebut tidak berlaku ‘untuk metode HE, seperti yang terlihat pada Tabel I nilai PSNR histogram chualisasi adalah yang terendah dari semua metode, yaitu scbesar 274 dB. Selanjutnya, secara umum metode Otsu menghasilkan nilai MOS yang lebil tinggi, seperti tertihat pada Tabel I Hal ini berlaku baik untuk perhitungan secara global atau lokal. Namun, hal ini tidak sejalan dengan nilai PSNR. yang teriera pada Tabel 1. Pada Tabel 1 dapat dilibat Forum Pendidikan Tinggl Teknik Elektro Indonesia (FORTE!) 2013 hittp:/ /fortei2013.com Page 153 of 179 Giese NY Soe A oy Soles SOMIELS RD Sle Ser eses SUC ha ae atone eee a eee SG Js ae PES CG eae OMSL 1 Re ae Bb Ee See STINE So hs Teste ety Seah Be Sea re, Sol Ub poe ER NE ae ieee, Cais BAe Sere SESE Se Sp pee Cree SES SAL Se gslee Sea A Poe a Gy haa we ke Tsou et Tae, Sp ee PN A rey AS HORS Joa EAL ES (©) si Wt caaia aba f a geet eye ey ea Se A ee saves cS By eas Uae Tie Goran Aaa etone SEPA iets eae ees Sasa eee BEOMS uD OG rh NES BS pn crt DESI Sst da es, ek So)! PSU Bootes su Canes EF net EA ese Saha es (Hast Ou globat ‘(b). Hasil histogram ekwalisasi fokal | eal sls) Lane SSE oe poesess Pe ON Se PUPS RAS jSah Sea (Has Owutoal Gambar3. Hast binersasi dari empat proses yang digunakan TABELE NILAT PSNR, TE Gaal Sasa HELsal 06s Om Aa ‘Ou Lal ora TAMELIL NAL MOS TEC a HE Lal Os. Gita ar ‘Os Las ay bbahwa nilai PSNR Otsu yang diterapkan secara global Jebih kecil dari pada metode HE yang diterapkan secara Global, Dari dua Kkeadaan ini, setidaknya dapat diambil dua kesimpulan. Pertams, nilai PSNR tidak seal sejalan dengan MOS, Kedua, secara umum, metode Otsu lebih Ssesuai untuk membinerisasi dokumen sitets. Hal ini joga ‘menjadi temuan dai F. Fauzi di (4), F, Fazi menemakan bahwa metode Otsu sesuai digunakan untuk dokumen sinletis, sementara metode HE cenderung lebih sesuai ‘untuk membinerisasi dokumen dengan noise alamish. Dengan kata lain, apabila ada Keperluan untuk ‘membincrisasi dokumen kuno, metode histogram ckualisasi dapat digunakan, Pada masa yang akan datang, jumfah dokumen yang,

You might also like