Professional Documents
Culture Documents
14.1 Pendahuluan
Dalam beberapa tahun terakhir, data multimedia digital disimpan dalam bentuk image, video dan audio. Banyak penelitian yang telah dilakukan agar penyimpanan (storage) dan permintaan (retrieval) informasi multimedia lebih efisien dan efektif. Situasi yang sama terjadi kira-kira tiga puluh tahun yang lalu ketika banyak data alphanumerik disimpan dalam form-form komputer. Hal ini menuju kepada pengembangan sistem manajemen basisdata (database management systems), yang mana sekarang ini merupakan aplikasi komputer yang paling populer dan paling banyak digunakan oleh hampir setiap organisasi, perusahaan dan individual. Tetapi yang menjadi masalah adalah dimana sistem manajemen basisdata tidak dapat menangani data multimedia secara efektif karena perbedaan karakteristik antara data alphanumerik dan multimedia. Dengan demikian teknik-teknik permintaan (retrieval) dan pengindeksan (indexing) multimedia tentu diperlukan. Gambar 14.1 memberikan suatu ikhtisar arsitektur sistem multimedia dengan pendukung basisdata. Basisdata ditempelkan ke dalam domain sistem multimedia, ditempatkan antara domain aplikasi dan domain device (teknologi komputer, pemampatan, penyimpanan dan jaringan). Basisdata diintegrasikan ke dalam domain sistem melalui sistem operasi dan komponen-komponen komunikasi. Dengan arsitektur ini, aplikasi yang tersebut di atas dapat ditempatkan pada tingkatan abstraksi yang sama dengan DBMS dan sistem secara umum.
370
371
frame per detik, tergantung pada sistem video yang digunakan). Hal yang sama, ketika diputar ulang suatu rangkaian audio atau musik, hanya satu laju pemutaran ulang yang biasa dilakukan. Pemutaran ulang (play bak) pada tingkat/laju yang lebih lambat ataupun lebih cepat akan mengubah arti maupun kualitas dari audio. Karena hal tersebut maka media harus dimainkan ulang secara berkesinambungan pada laju/tingkat yang tetap, yang sering disebut dengan media berlanjut (continuous media). Hal ini juga sering disebut dengan media isochronous karena keterhubungan yang tetap antara tiap unit media dan waktu. Multimedia mengacu kepada kumpulan dari beberapa media yang digunakan secara bersama. Secara sederhana bahwa paling sedikit terdapat satu jenis media yang bukan data alphanumerik (sebagai contoh, paling sedikit satu jenis media seperti image, audio atau video). Banyak istilah yang sering digunakan untuk menyatakan multimedia, seperti informasi multimedia, data multimedia, sistem multimedia, komunikasi multimedia, aplikasi multimedia, perancangan multimedia dan banyak lagi. Data multimedia mengacu kepada representasi dari beberapa jenis media yang dapat dibaca oleh komputer. Informasi multimedia mengacu kepada penyampaian informasi oleh beberapa jenis media. Tetapi kadang-kadang informasi multimedia dan data multimedia sering digunakan secara bergantian.
372
umum pencarian informasi dapat mengacu kepada pencarian jenis informasi yang lainnya.
Bentuk,
Representasi
Isi,
Dan
Pada sistem pencarian informasi multimedia, salah satu hal yang paling penting adalah ekstraksi bentuk atau representasi isi (bentuk atau isi utama dalam suatu item multimedia). Ekstraksi bentuk mungkin dilakukan secara otomatis maupun semi otomatis. Dalam beberapa literatur pencarian berbasis isi, ekstraksi bentuk sering juga disebut pengindeksan (indexing).
373
Data
Multimedia
Dan
Kita sekarang dihadapkan dengan suatu ledakan dari informasi multimedia. Sebagai contoh, sejumlah image dan video yang besar sekarang sedang diciptakan dan disimpan di internet. Banyak lukisan dan image diubah kedalam bentuk digital agar lebih mudah dalam pemrosesan, distribusi dan pemeliharaan. Image dari berita-berita televisi dan suratkabar juga diubah kedalam bentuk digital untuk memudahkan penyimpanan dan pemeliharaan. Sejumlah besar dari image medik juga dikirimkan dari satu tempat ke tempat lainnya dengan cara mengubahnya kedalam data digital dan mengirimkannya melalui satelit. Kecenderungan ini akan berlanjut dengan kemajuan teknologi penyimpanan dan digital yang terjadi sekarang ini. Dalam database multimedia tidak hanya terjadi peningkatan jumlah data yang akan disimpan, tetapi juga jenis data dan karakteristiknya yang sungguh berbeda dari data alpanumerik. Karakteristik dari data multimedia seperti terlihat dibawah ini :
374
Data multimedia khususnya audio dan video merupakan data yang sangat intensif. Sebagai contoh, rangkaian video 10 menit dengan kwalitas yang baik membutuhkan kira-kira 1.5 GB media penyimpanan tanpa kompresi. Audio dan video memiliki suatu dimensi sementara (temporal) dan mereka harus dimainkan pada laju yang tetap untuk mencapai efek yang diinginkan. Audio digital, image dan video ditampilkan dalam suatu rangkaian nilai dan struktur semantik yang kurang jelas bagi komputer secara otomatis untuk mengenali isinya. Banyak aplikasi-aplikasi multimedia membutuhkan penampilan yang bersamaan dengan jenis media yang banyak dalam menentukan cara pengkoordinatan berdasarkan ruang dan keadaan. Arti dari data multimedia kadang-kadang bersifat fuzzy dan subjektif. Sebagai contoh, banyak orang mungkin mengintepretasikan image yang sama dengan cara yang berbeda. Data multimedia kaya akan informasi. Banyak parameter yang diperlukan untuk menyajikan isinya dengan baik.
375
Nim
Nama
Alamat
Pernyataan di atas membentuk suatu tabel kosong seperti yang ditunjukkan dalam Tabel 14.1. Bila ingin menyisipkan rekord pelajar
376
kedalam tabel, Anda dapat menggunakan perintah SQL seperti di bawah ini : Insert into PELAJAR values(1295046,Jeconia, Jl. C. Simanjuntak, Gg. Bolodewo No. 644 Terban Yogyakarta); Statement di atas akan menyisipkan satu baris rekord kedalam tabel PELAJAR seperti yang ditunjukkan dalam Tabel 14.2. Banyak rekord pelajar dapat disisipkan kedalam tabel dengan menggunakan pernyataan yang sama.
Tabel 14.2 Tabel PELAJAR Setelah Satu Rekord Disisipkan
No 1295046
Nama Jeconia
Informasi dalam tabel dicari dengan menggunakan perintah SQL select. Sebagai contoh, jika diinginkan mencari nama dari pelajar dengan nomor pelajar 1295046, dapat digunakan pernyataan pencarian berikut ini : Select nama From PELAJAR Where No=1295046 Atribut-atribut dalam sitem manajemen basisdata relasional mempunyai jenis yang tetap dan lebar yang tetap. Seperti contoh di atas, atribut No adalah jenis integer dengan panjang tetap 32 bit. Dengan demikian sistem manajemen basisdata relasional cocok digunakan untuk menangani data numerik dan string alphanumeri yang pendek.
377
Untuk mendukung field-field variabel yang besar dalam sistem manajemen basisdata relasional, suatu konsep yang disebut object binari yang besar (binary large objects/BLOB) telah diperkenalkan. Suatu BLOB merupakan string bit yang besar dengan panjang yang bervariasi. Sebagai contoh, jika diinginkan untuk menyimpan image pelajar pada contoh rekord pelajar di atas, maka dapat dilakukan dengan menggunakan pernyataan SQL seperti di bawah ini: Create table PELAJAR ( No Integer, Nama char(20) Alamat char(100) Image BLOB); BLOB biasanya hanyalah untaian bit string dan pengoperasian seperti perbandingan tidak dapat dilakukan terhadapnya. Dengan demikian, sistem manajemen basisdata relasional tidak mengenal isi atau arti dari BLOB. Semuanya hanya dikenal sebagai suatu blok data. Jenis lain dari sistem manajemen basisdata adalah sistem manajemen basisdata berbasis objek (object-oriented database management systems/ OODBMS). OODBMS menggabungkan kemampuan basisdata (seperti penyimpanan dan pencarian) dan bentuk berorientasi objek (enkapsulasi, warisan dan pengenal objek). Suatu pendekatan umum adalah menggabungkan bentuk berorientasi objek dengan basisdata relasional. Sistem gabungan disebut sebagai suatu sistem basisdata berelasi objek. Dalam sistem tersebut, objek-objek dengan tepat didefenisikan dalam arti berorientasi objek. Dengan demikian, masing-masing objek berisikan properti atau atribut dan metoda atau fungsi yang digunakan untuk memanipulasi properti-properti. Sebagai contoh, kita dapat mendefenisikan suatu klas type yang disebut IMAGE seperti di bawah ini : Crete type CITRA (
378
Private Ukuran integer, Resolusi inetger, Isi float[], Public .. ) Selanjutnya mendeklarasikan image sebagai tipe dari CITRA yang dapat digunakan dalam tabel seperti berikut ini: Create tabel PELAJAR( No integer, Nama char(20), Alamat char(100), Image IMAGE); Perbedaan utama antara BLOB dan objek adalah objek didefenisikan sebagaimana mestinya, termasuk propertinya dan mengijinkan operasi pada properti-propertinya, sedangkan BLOB tidak.
379
audio, image dan video. Teknik-teknik pencarian informasi yang biasa dapat digunakan untuk pencarian informasi multimedia. Bagaimanapun juga, penggunaan dari pencarian informasi untuk menangani data multimedia mempunyai keterbatasanketerbatasan seperti berikut ini: Keterangan yang diberikan pada umumnya menggunakan proses manual dan membutuhkan waktu yang lebih; Keterangan pada umumnya tidak lengkap dan lebih bersifat subjektif; Teknik-teknik pencarian informasi tidak dapat menangani query dalam bentuk-bentuk selain daripada teks (seperti audio dan image); Beberapa bentuk-bentuk multimedia seperti susunan (teksure) image dan bentuk objek sulit diketahui, jika tidak memungkinkan, pengimageannya menggunakan teks.
380
14.13 Kemampuan Dan Aplikasi-Aplikasi Umum Dari Sistem Pencarian Informasi Multimedia
Sistem pencarian informasi multimedia diharapkan dapat tangguh dan fleksibel. Kemampuannya dapat diimagekan dengan jenis-jenis query yang dapat didukungnya. Jenis-jenis query yang diharapkan tersebut adalah:
381
14.13.1 Query Berdasarkan Metadata Metadata mengacu kepada atribut-atribut formal dari item-item basisdata seperti nama pengarah dan tanggal pembuatan. Suatu contoh query dalam suatu aplikasi video dapat berupa tampilkan video yang diciptakan oleh JAMES pada tahun 1997. Jenis query seperti ini dapat dilakukan dengan kemampuan sistem manajemen basis data. 14.13.2 Query Berdasarkan Keterangan Keterangan mengacu kepada image dari isi item-item basisdata. Query-query dalam kunci-kunci atau bentuk teks yang bebas dan pencarian didasarkan pada kesamaan antara query dan keterangan. Suatu contoh query dapat seperti tampilkan bagian video yang penciptanya mengendarai sepeda. Jenis query seperti ini menganggap bahwa item-item diberi keterangan dengan tepat dan dapat dilakukan dengan teknik-teknik pencarian informasi. 14.13.3 Query Didasarkan Pada Pola Dan Bentuk Pola data mengacu kepada statistik informasi tentang data multimedia, seperti kebisingan, distribusi warna, dan image susunan. Suatu contoh query misalkan tampilkan frame video dengan distribusi warna biru paling banyak. Untuk menjawab jenis query seperti ini, statistik informasi tentang item-item basisdata sebelumnya telah dikumpulkan dan disimpan. 14.13.4 Query Dengan Contoh Query-query dalam bentuk objek multimedia seperti image, sketsa, dan potongan-potongan audio. Sebagai contoh tampilkan suatu movie yang adegannya sama dengan . Jenis query seperti ini dapat menjadi kompleks dengan mengikutkan ruang dan keterhubungan antara objek-objek. 14.13.5 Query Dengan Spesifik Aplikasi Terdapat banyak jenis-jenis query dengan spesifik aplikasi. Sebagai contoh, query dapat didasarkan atas spesifikasi yang khusus dan
382
perincian informasi seperti ukuran dari suatu objek dan proses penyimpanan dari suatu data.
383
secara khusus. Karena operasi-operasi pencarian teks bergantung langsung pada representasi isi yang digunakan untuk menjelaskan rekord-rekord yang disimpan, suatu usaha yang besar yang harus dilakukan untuk menganalisa isi dari dokumen-dokumen yang disimpan yang membawa pada pembentukan kata kunci-kata kunci dan indeks. Proses pencarian dokumen dasar diperagakan pada gambar dibawah ini. Seperti yang ditunjukkan pada sisi kanan dari image, dokumen-dokumen diproses tidak secara langsung untuk mendapatkan representasi-representasi dokumen. Representasirepresentasi ini disimpan secara bersama dengan dokumen itu sendiri. Selama pencarian (sebelah kiri dari image), pengguna melakukan query yang diproses (secara langsung) untuk mendapatkan representasi querynya. Kemudian representasi query dibandingkan dengan representasi dokumen. Dokumen yang dipertimbangkan berhubungan dengan sistem yang dicari dan ditampilkan kepada pengguna, dimana pengguna mengevaluasi dokumen yang diberikan dan memutuskan yang cocok baginya. Sistem pencarian informasi yang baik seharusnya mengijinkan pengguna untuk melakukan umpan balik kepada sistem. Sistem menggunakan informasi ini untuk memodifikasi query, representasi query dan/atau representasi dokumen. Pencarian lainnya didasarkan pada query yang dimodifikasi dan representasi dokumen. Jika perlu, proses pencarian umpan balik diulangi beberapa kali. Tetapi pada umumnya tidak semua sistem pencarian informasi mendukung proses umpan balik bagi pengguna.
384
14.14.2 Pengindeksan Dan Pencarian Audio Manusia memiliki kemampuan yang mengagumkan untuk membedaan jenis-jenis audio yang berbeda. Misalkan diberikan suatu potongan audio, langsung dapat kita katakan jenis dari audio tersebut (misalkan, apakah audio manusia, musik, atau bising), kecepatan (cepat atau lambat), suasana (bahagia, sedih, rileks), dan menentukan kemiripannya dengan potongan audio lainnya. Bagaimanapun juga, komputer melihat suatu potongan audio sebagai suatu rangkaian dari nilai. Pada saat sekarang ini, metode yang paling umum untuk mengakses potongan-potongan audio didasarkan pada judul atau nama filenya. Karena ketidaklengkapan dan bersifat subjektifnya nama file dan keterangannya, mungkin sulit untuk menemukan potongan-potongan audio yang memuaskan. Disamping itu, teknik
385
pencarian ini tidak dapat mendukung query seperti cari potongan audio yang mirip dengan yang sedang dimainkan seseorang. Untuk menyelesaikan masalah di atas, teknik-teknik pencarian audio berdasarkan isi diperlukan. Pencarian audio berdasarkan isi yang paling sederhana menggunakan perbandingan sampel dengan sampel dengan query dan potongan-potongan audio yang disimpan. Pendekatan ini tidak dapat berjalan dengan baik karena signal audio sangat berbeda dan potongan-potongan audio yang berbeda mungkin direpresentasikan dengan tingkat sampel yang berbeda dan mungkin menggunakan jumlah bit yang berbeda untuk tiap sampel. Karena hal tersebut, pencarian audio berdasarkan isi umumnya didasarkan pada sekumpulan dari bentuk-bentuk audio yang diambil, seperti rata-rata amplitudo dan distribusi frekwensi. Pendekatan umum pada pencarian dan pengindeksan audio berdasarkan isi adalah : Audio diklasifikasikan kedalam beberapa jenis audio yang umum seperti audio, musik dan bising. Jenis-jenis audio yang berbeda diproses dan diindeks dengan cara yang berbeda. Sebagai contoh, jika audio adalah audio, pengenal audio diterapkan dan audio diindeks berdasarkan pada kata-kata yang dikenali. Melakukan query potongan-potongan audio dengan cara klasifikasi berdasarkan kemiripan, diproses dan diindeks. Potongan-potongan audio dicari berdasarkan atas kemiripan antara index query dan index audio yang terdapat dalam basisdata. Tindakan klasifikasi audio adalah penting karena beberapa alasan. Pertama, jenis-jenis audio yang berbeda memerlukan teknik-teknik pencarian dan pengindeksan yang berbeda. Kedua, jenis-jenis audio yang berbeda memiliki pengarunh yang berbeda pada aplikasiaplikasi yang berbeda. Ketiga, salah satu jenis-jenis audio yang paling penting adalah audio dan sekarang terdapat banyak sistem pengenalan audio yang sangat sukses. Keempat, jenis audio atau klas informasinya sendiri sangat berguna untuk beberapa aplikasi. Kelima,
386
ruang pencarian setelah klasifikasi dikurangi pada klas audio yang khusus selama proses pencarian. Signal audio direpresentasikan dalam domain waktu (representasi amplitudo waktu) atau domain frekwensi (representasi besarnya frekwensi). Ciri-ciri yang berbeda diturunkan atau diambil dari kedua representasi tersebut. 14.14.3 Bentuk Diturunkan Dari Domain Waktu Domain waktu atau representasi amplitudo waktu adalah teknik representasi signal dasar yang paling banyak, dimana suatu signal direpresentasikan sebagai amplitudo yang bermacam-macam sejalan dengan waktu. Nilai signal dapat positif atau negatif tergantung pada tekanan audio di atas atau di bawah tekanan udara equilibrium ketika diam. Dengan hal ini dianggap bahwa 16 bit digunakan untuk merepresentasikan tiap-tiap sampel audio. Dengan demikian jangkauannya antara 32767 (215-1) s/d -32767. Dari hal ini akan dapat ditentukan energi rata, tingkat melewati nol, dan rasio keheningan. Energi rata Energi rata-rata menyatakan kekerasan dari signal audio. Terdapat banyak cara untuk menghitungnya. Satu contoh perhitungan sederhana adalah :
E = n=0
x ( n)
N
N 1
dimana E adalah energi rata dari potongan audio, N adalah total jumlah sampel dalam potongan audio, dan x(n) adalah nilai sampel dari n sampel. Tingkat melewati nol Tingkat melewati nol menyatakan frekwensi dari tanpa signal amplitudo berubah. Tingkat melewati nol dihitung berdasarkan :
387
ZC =
2N
dimana sgnx(n) adalah tanda dari x(n) dan bernilai 1 jika x(n) positif dan -1 jika x(n) bernilai negatif. Rasio Keheningan Rasio keheningan menyatakan perbandingan dari potongan radio yang hening. Keheningan didefenisikan sebagai suatu periode dalam nilai amplitudo absolut dari sejumlah nomor tertentu dari sampel yang dibawah nilai ambang (threshold). Sampel dianggap tenang atau diam ketika amplitudonya dibawah ambang amplitudo. Rasio keheningan dihitung sebagai rasio antara jumlah periode diam dan panjang total dari potongan audio. 14.14.4 Bentuk Diturunkan Dari Doman Frekwensi Representasi domain waktu tidak menampilkan komponenkomponen frekwensi dan distribusi frekwensi dari suatu signal audio. Representasi domain frekwensi diturunkan dari representai doman waktu sesuai dengan transformasi Fourier. Transformasi Fourier diimagekan sebagai setiap signal dapat didekomposisi kedalam komponen-komponen frekwensinya. Dalam domain frekwensi, signal direpresentasikan sebagai amplitude dengan bermacam-macam frekwensi, menyatakan jumlah energi pada frekwensi yang berbeda. Bandwidth Bandwidth menyatakan jangkauan frekwensi dari suatu bunyi. Musik umumnya mempunyai bandwidth yang lebih tinggi dibandingkan dengan signal audio. Cara yang paling sederhana untuk menghitung bandwidth adalah dengan mengambil perbedaan frekwensi antara frekwensi yang tertinggi dengan frekwensi yang terendah dari komponen-komponen spektrum yang bukan nol. Dalam beberapa kasus bukan nol didefenisikan sebagai paling sedikit 3 dB di atas tingkat keheningan.
388
Distribusi Energi Dari spektrum signal sangat mudah melihat distribusi signal melewati komponen-komponen frekwensi. Sebagai contoh, kita dapat melihat jika signal mempunyai komponen-komponen frekwensi tinggi yang signifikan. Informasi ini sangat berguna untuk klasifikasi audio karena musik umumnya memiliki komponen frekwensi yang lebih dari audio. Karena itu sangat penting untuk menghitung tinggi dan rendahnya energi band frekwensi. Sebagai contoh bahwa frekwensifrekwensi dari signal audio jarang melewati 7 kHz. Dengan demikian kita dapat membagi keseluruh panjang spektrum sepanjang garis 7 kHz. Komponen frekwensi di bawah 7 kHz adalah band yang rendah dan sebaliknya adalah band yang tinggi. Total energi untuk masingmasing band dihitung sebagai jumlah dari kekuatan dari masingmasing sampel di dalam band. Harmonicity Bentuk domain frekwensi kedua dari bunyi adalah harmonicity. Dalam bunyi harmonicity komponen spektral paling banyak adalah yang terendah, dan yang paling penting frekwensi yang terkeras. Frewkensi yang terendah disebut frekwensi fundamental. Musik biasanya lebih harmonis daripada bunyi-bunyi yang lainnya. Apakah suatu bunyi harmonis ditentukan dengan pengecekan apakah komponen frekwensi dominan adalah perkalian dari frekwensi fundamental.
389
Dengan demikian citra dapat diindeks dan dicari menggunakan model basisdata relasional yang didasarkan pada atribut-atribut tersebut. Kekurangan utama dari pendekatan ini adalah atribut-atribut ini mungkin tidak dapat menjelaskan isi daripada citra dengan lengkap, dan jenis query yang dapat dilakukan hanyalah berdasarkan dari atribut-atribut dari citra tersebut. Pendekatan kedua berdasarkan pada subsistem pengenalan objek atau pengambilan bentuk yang terintegrasi. Subsistem ini mengotomisasi pengambilan citra dan pengenalan objek. Tetapi pendekatan secara otomatis untuk pengenalan objek membutuhkan perhitungan yang luas, sulit. Pendekatan ketiga menggunakan teks bebas untuk menjelaskan citra dan menggunakan teknik-teknik pencarian informasi untuk melakukan pencarian citra. Teks dapat menjelaskan isi abstraksi dari suatu citra. Tetapi karena ada struktur untuk menjelaskan hal ini, maka keterangan citra dapat ditambahkan secara bertahap. Hal ini tentu akan tetap menimbulkan kekurangan, tetapi hal ini dapat diatasi dengan melakukan umpan balik yang dilakukan sistem kepada pengguna dengan cara sistem memiliki pengetahuan untuk melakukannya. Pendekatan keempat menggunakan bentuk citra level rendah seperti warna dan bentuk untuk melakukan pengindeksan dan pencarian citra. Keuntungan dari pendekatan ini adalah proses pencarian dan pengindeksan dilakukan secara otomatis dan hal ini mudah diimplementasikan. Hal ini telah terbukti bahwa pendekatan ini menghasilkan kinerja pencarian yang cukup baik. 14.15.1 Pencarian Citra Berdasarkan Teks Pada pencarian citra berbasis teks, citra diimagekan dengan teks yang bebas atau tidak terkontrol. Query-query ada dalam bentuk kuncikunci atau teks bebas dengan atau tanpa operator boolean. Pencarian menggunakan teknik-teknik pencarian informasi biasa yang didasarkan pada kemiripan antara query dan teks diskpripsi dari citra.
390
Pada umumnya terdapat dua perbedaan yang signifikan antara pencarian citra berbasis text dengan pencarian dokumen teks biasa. Pertama, Dalam sistem pencarian citra berbasis teks, deskripsi teks harus dimasukkan (mungkin judul dari citra). Pemberian keterangan umumnya dilakukan secara manual karena pemahaman atas citra dengan baik tidak mungkin. Karena itu pemberian keterangan adalah hal yang sangat penting dalam teknik pencarian citra berbasis teks. Kedua, deskripsi teks mungkin tidak lengkah atau lebih bersifat subjektif. Dengan demikian penggunaan basis pengetahuan dan umpan balik merupakan hal yang sangat penting dalam pencarian citra berbasis teks. Umpan balik sangat efektif sehingga pengguna dapat menentukan apakah citra yang diinginkan telah cocok berdasarkan query yang dilakukannya. Dan juga, karena deskripsi teks yang tidak lengkap, pengguna dapat menggunakan umpan balik untuk memodifikasi deskripsi untuk membuat deskripsi tersebut lebih lengkap dan akurat. 14.15.2 Teknik Pencarian Citra Berdasarkan Warna Dasar Ide dari teknik pencarian citra berdasarkan warna dasar adalah untuk mencari suatu image dari basisdata citra yang mungkin sama dengan query citra yang dilakukan oleh pengguna. Tiap-tiap citra yang terdapat di dalam basisdata citra direpresentasikan menggunakan warna-warna yang telah dipilih sebelumnya. Warna yang paling banyak digunakan adalah merah, hijau dan biru (RGB). Masing-masing warna dibentuk kedalam m interval. Dengan demikian jumlah total kombinasi warna yang berlainan dari n penyimpanan adalah m3. sebagai contoh, jika masing-masing warna ditentukan kedalam 16 interval, maka akan didapat 4,096 tempat penyimpanan. Histogram warna H(M) adalah vektor (h1,h2,,hj,,hn) dimana hj menyatakan jumlah pixel dalam citra M yang dimasukkan kedalam penyimpanan j. Histogram ini merupakan vektor bentuk yang disimpan sebagai indeks dari citra.
391
Selama pencarian citra, histogram adalah query citra atau diperkirakan sesuai dengan query pengguna. Perbedaan antara histogram dari query citra dan citra yang terdapat di dalam basis data diukur. Citra dengan jarak histogramnya lebih kecil dari batas yang telah ditentukan sebelumnya diambil dari basisdata dan ditampilkan kepada pengguna. Atau dapat dikatakan citra k pertama dengan jarak yang lebih kecil ditampilkan. Banyak ukuran jarak histogram yang telah dilakukan. Pengukuran jarak yang paling sederhana antara citra I dan H adalah :
d ( I , H ) = | il hl |
l =1
dimana il dan hl adalah angka pixel dalam citra I dan H. Pengukuran jarak lainnya yang umum digunakan adalah dengan menggunakan jarak Euclidean. Adapun cara kerja dari teknik pencarian citra berbasis warna dapat dijelaskan sebagai berikut. Misalkan dimiliki tiga buah image dengan ukuran 8 x 8 pixel dan masing-masing pixel adalah salah satu warna dari C1..C8. Citra pertama memiliki 8 pixel yang masingmasing terdiri atas 8 warna. Citra kedua memiliki 7 pixel yang masingmasing warnanya C1..C4, dan 9 pixel yang masing-masing warnanya C5..C8. Citra ketiga memiliki 2 piksel yang warnanya adalah C1 dan C2, dan 10 pixel yang warnanya adalah C3..C8. Selanjutnya akan didapat tiga histogram seperti di bawah ini : H1=(8,8,8,8,8,8,8,8) H2=(7,7,7,7,9,9,9,9) H3=(2,2,10,10,10,10,10,10) maka jarak antara ketiga image di atas adalah : d(H1,H2)=1+1+1+1+1+1+1+1=8 d(H1,H3)=6+6+2+2+2+2+2+2=24
392
d(H2,H3)=5+5+3+3+3+1+1+1+1=23 Dengan demikian citra 1 dan citra 2 paling mirip dan citra 1 dan citra 3 paling berbeda berdasarkan perhitungan rumus di atas.
393
didasarkan pada audio kata yang diucapkan dengan menggunakan teknik-teknik pencarian informasi. Metode berbasiskan isi. Terdapat dua pendekatan umum pada pencarian dan pengindeksan video berbasiskan isi. Pendekatan pertama, video sebagai kumpulan dari citra-citra dan frame-frame yang berdiri sendiri, dan menggunakan metode-metode pencarian dan pengindeksan citra untuk melakukan pencarian informasi. Masalah yang dapat timbul dengan pendekatan ini adalah pengabaian keterhubungan sementara antara frame-frame video, dan dibutuhkan untuk memproses citra yang banyak. Pendekatan kedua membagi rangkaian video kedalam kelompok-kelompok frame yang mirip, dan pencarian dan pengindeksan didasarkan pada representasi dari kelompok-kelompok frame tersebut. 14.16.1 Pencarian Dan Pengindeksan Berdasarkan Metadata Metadata untuk video telah tersedia bagi beberapa format-format video yang standar. Pencarian dan pengindeksan video dapat didasarkan atas metadata ini dengan menggunakan sistem manajamen basis data biasa. Sebagai contoh, informasi spesifik dari sistem MPEG-2 mendefinisikan empat tabel yang berisikan informasiinformasi yang penting untuk demultiplex dan menampilkan program melalui suatu pengiriman aliran. Informasi yang lainnya seperti hak cipta dan bahasa dapat diperoleh dari tabel peta program. Digital video broadcasting (DVD), standar Eropa untuk transmisi layanan digital, sekarang telah dipakai oleh nengara-negara lainnya. DVD menggunakan MPEG-2 untuk kompresi dan transmisi video. Untuk memberikan identifikasi layanan dan kejadian-kejadian bagi pengguna, metadata tambahan disediakan oleh standard DVD dalam tabel informasi pelayanan (DVD-SI). DVD-SI diorganisasikan kedalam enam tabel. Yang paling berguna untuk pengindeksan video adalah tabel deskripsi layanan dan tabel informasi kejadian, yang berisikan item-item seperti: judul, jenis video dan pengarang.
394
14.16.2 Pencarian Dan Pengindeksan Berdasarkan Atas Catatan Video dapat diindeks dan dicari berdasarkan atas catatan dengan menggunakan teknik-teknik pencarian informasi. Catatan adalah penting karena catatan dapat memberikan isi yang paling jelas dari suatu video. Catatan dapat diperoleh melalui tiga cara seperti dibawah ini : Pertama, video dapat secara manual diterjemahkan dan diberi catatan. Hal ini akan menghabiskan waktu yang banyak, tetapi hal ini secara luas masih digunakan karena pemahaman secara otomatis akan isi video tidak mungkin dilakukan pada suatu video. Terdapat dua aspek yang dapat dilakukan pada kasus ini. Pertama dengan menyediakan kerangka kerja yang baik dalam pemasukan data secara manual. Kedua adalah membentuk batasan pengetahuan dari tiap jenis video agar dapat pemberian catatan dapat dilakukan dengan semi otomatis. Kedua, banyak video memiliki naskah dan bagian judul yang berhubungan yang dapat langsung digunakan untuk pencarian dan pengindeksan video. Ketiga, Jika sub judul tidak tersedia, pengenalan audio dapat digunakan pada track audio untuk mendapatkan kata yang diucapkan, yang kemudian dapat digunakan untuk pencarian dan pengindeksan. Pendekatan ini tantangannya masih banyak karena audio dan bukan audio umumnya bercampur dalam track audio, dan disana juga terdapat musik latar belakang atau kebisingan dalam signal audio, yang menuju kepada tingkat pengenalan yang rendah.
395
Tampilan Metadata
396
Tampilan Histogram Tampilan histogram di form terdiri atas dua jenis, yaitu : teks dan grafik.
397
Histogram juga dimungkinkan untuk disimpan ke suatu file teks dengan ekstensi .fhd (file histogram data). Berikut adalah contoh tampilan file histogram data (fhd).
$00 = 3568 $01 = 1075 $02 = 876 $03 = 1116 $04 = 1008 $05 = 737 $06 = 1004 $07 = 1028 $08 = 919 $09 = 908 $0A = 888 $0B = 836 $0C = 1146 $0D = 1046 $0E = 1018 $0F = 1012 $10 = 832 $11 = 1044 $12 = 1012 $13 = 978 $14 = 964 $15 = 1058 $16 = 991 $17 = 818 $18 = 1213 $19 = 1153 $1A = 1166 $C4 = 1161 $C5 = 1156 $C6 = 1364 $C7 = 1585 $C8 = 1262 $C9 = 1155 $CA = 1326 $CB = 1218 $CC = 1174 $CD = 916 $CE = 1045 $30 = 1059 $31 = 1211 $32 = 1089 $33 = 1113 $34 = 888 $35 = 1129 $36 = 1115 $37 = 1066 $38 = 1138 $39 = 1130 $3A = 1120 $3B = 1158 $3C = 969 $3D = 1055 $3E = 1060 $3F = 1241 $59 = 1178 $5A = 1104 $5B = 1172 $5C = 1244 $5D = 1055 $5E = 1080 $5F = 1051 $60 = 1015 $61 = 1034 $62 = 1175 $63 = 1376 $64 = 1144 $65 = 1250 $66 = 1179 $67 = 1051 $68 = 883 $69 = 1108 $6A = 1026 $6B = 1330 $6C = 1199 $6D = 1308 $6E = 1353 $6F = 1137 $70 = 1052 $71 = 1403 $72 = 1341 $73 = 1179 $90 = 1136 91 = 1278 $92 = 1273 $93 = 1087 $94 = 1002 $95 = 1253 $96 = 1330 $97 = 1072 $98 = 1041 $99 = 1048 $9A = 973 $9B = 960 $9C = 1130 $9D = 1013 $9E = 1011 $9F = 1044 $A0 = 803 $A1 = 919 $A2 = 751 $A3 = 969 $A4 = 1008 $A5 = 1111 $A6 = 1009 $A7 = 1087 $A8 = 874 $A9 = 1039 $AA = 961
398
$1B = 1207 $1C = 1137 $1D = 1236 $1E = 1125 $1F = 1222 $20 = 1069 $21 = 906 $22 = 961 $23 = 1356 $24 = 1348 $25 = 1013 $26 = 879 $27 = 1149 $28 = 876 $29 = 1014 $2A = 1111 $2B = 1041 $2C = 1193 $2D = 1132 $2E = 1051 $2F = 909 $C0 = 904 $C1 = 892 $C2 = 991 $C3 = 1246
$40 = 846 $41 = 1041 $42 = 905 $43 = 943 $44 = 858 $45 = 875 $46 = 1214 $47 = 1070 $48 = 1135 $49 = 1217 $4A = 1033 $4B = 1073 $4C = 964 $4D = 962 $4E = 1162 $4F = 1042 $50 = 871 $51 = 1004 $52 = 1046 $53 = 994 $54 = 928 $55 = 1166 $56 = 1245 $57 = 1200 $58 = 1188
$74 = 953 $75 = 1215 $76 = 1252 $77 = 1103 $78 = 1013 $79 = 1035 $7A = 1006 $7B = 1142 $7C = 1030 $7D = 1112 $7E = 1158 $7F = 994 $80 = 946 $81 = 931 $82 = 950 $83 = 921 $84 = 790 $85 = 970 $86 = 1178 $87 = 969 $88 = 1071 $89 = 1048 $8A = 995 $8B = 984 $8C = 1259
$8D = 1264 $8E = 1372 $8F = 1252 $AB = 1326 $AC = 1216 $AD = 1238 $AE = 1287 $AF = 1182 $B0 = 1035 $B1 = 1385 $B2 = 1215 $B3 = 1126 $B4 = 1108 $B5 = 1206 $B6 = 1475 $B7 = 1384 $B8 = 1366 $B9 = 1341 $BA = 932 $BB = 1258 $BC = 1080 $BD = 990 $BE = 1023
14.18 Kesimpulan
Kemajuan teknologi digital telah memungkinkan bagi para penggunanya untuk menyimpan dokumen-dokumen kedalam media
399
penyimpanan digital (disket, harddisk, flash disk). Media penyimpanan digital hadir dengan berbagai kelebihan maupun kekurangannya. Adapun kelebihannya seperti: mudah dibawa (portable), ukuran fisik yang kecil, kemampuan menyimpan yang besar (dapat dibayangkan satu disket 31/2=1,44MB mampun menyimpan sebanyak 1.440.000 karakter). Kekurangannya adalah media penyimpanan yang digital masih dirasakan cukup mahal, perawatan yang sulit dan kurang handal dalam menghadapi gangguan manusia maupun alam, seperti: benturan, kena debu, banjir, dan sebagainya. Teknik pencarian dengan histogram membagi citra kedalam kelompok-kelompok warna. Banyaknya kelompok warna tergantung dari kehandalan pengelompokan yang diinginkan. Misalkan, bila kelompok warna yang sebanyak 256 dirasakan telah dapat menampung seluruh warna yang biasa dipakai atau bila diinginkan tingkat ketelitian yang lebih tinggi bisa saja dipakai kelompok warna sebanyak 512. Tetapi hal ini tentu saja harus dibayar dengan banyaknya waktu yang dibutuhkan untuk melakukan pemrosesan. Banyak teknik yang bisa dilakukan untuk melakukan penyimpanan histogram ke dalam basisdata. Salah satunya adalah dengan menyediakan field sebanyak kelompok warna yang telah ditetapkan sebelumnya, atau dengan menyimpan nilai tiap histogram kedalam teks. Penyimpanan kedalam teks dilakuan karena total besarnya histogram mungkin tidak dapat ditampung oleh tipe data yang disediakan oleh SMBD yang bersangkutan. ***