Professional Documents
Culture Documents
Tipe-tipe Query
Keyword-based querying
Single-word query Context Query Phrase (kalimat) Proximity (Kedekatan Kata) Boolean Query Natural Languages
Contoh Kasus
Kata Kunci = NEW YORK TIMES Bagaimana melihat kata kunci ini ?
NEW YORK TIMES or NEW YORK TIMES or NEW YORK TIMES
Natural Language
Query berdasarkan beberapa kata dan melihat contexnya. Query dan Document dipandang sebagai sebuah vector
Pattern Matching
Pola sintak dari bagian text baik yang sederhana (kata) sampai yang complex (regular expression) Type Pattern
words prefixes comput -> computer, computation, computing suffixes. ters -> computers, testers, printers sub-strings. tal -> coastal, talk, metallic ranges allowing erros regular expressions extended patterns
Firdaus Solihin (unijoyo) 2008
Structural Queries
Melakukan query berdasarkan strukturnya bukan dari content (isi) Penggabungan query isi dan struktur dapat memberikan nilai tambah hasil pencarian Macam Structure
form-like fixed structures hypertext structures hierarchical structures
Firdaus Solihin (unijoyo) 2008
Fixed Structures
Diterapkan pada document yang memiliki struktur tetap seperti fields pada form Contoh EMAIL (sender, reciever, subject, date, body) User dapat melakukan search berdasarkan fields tertentu.
Hypertext Structures
Hypertext adalah graph yang terhubung satu dengan lainnya dimana masing-masing node ditandai dengan text untuk mengacu pada posisi (link) tertentu Contoh
Pencarian berdasarkan hyperlink Pencarian document yang mengacu pada link tertentu
Hierarchical Structures
Gabungan antara Fixed Structures dengan Hypertext Structures Contoh
PAT expressions Structure ditandai dengan text sebagai tags (e.g. HTML). Overlapped lists membangun hirarki dengan membagi text dalam bagian / potongan kecil. Lists of references Mengambil bagian ekspresi dalam text. Proximal nodes menentukan text sebagai struktur hirarki yang tetap. Tree matching Document dan query dibentuk dalam strukture tree.
Firdaus Solihin (unijoyo) 2008